返回 职位详情 登录/注册
大模型应用开发工程师(需长期外派)
1.5-3万元/月
定位 北京海淀区中关村资本大厦62号
更新 2025-12-26 14:12:00 浏览 508
职位详情
大模型算法 经验不限 计算机相关专业
岗位职责
1.针对大模型应用进行二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源框架开展定制化开发,深度调整参数配置,实现自定义文档解析、向量索引策略设计、Agent工具集成、Prompt工程体系建设、重排模型优化及权限控制机制等核心功能。
2.大模型推理引擎部署与性能优化:结合客户实际硬件环境,利用pytorch、vllm、sglang等开源框架进行推理参数调优,提升系统整体推理效率与资源利用率。
3.完整私有化部署与项目交付:基于K8S实现大模型应用的全流程定制部署,完成从开发到客户现场的端到端交付任务。
4.系统持续迭代与运维保障:负责系统上线后的版本更新、问题排查与技术支持,输出运维文档、故障处理流程及培训资料,确保系统稳定运行。

任职要求
1.计算机相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.至少掌握以下开源框架中的两项,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案,如hf原生/vllm/sglang,理解其底层推理并行技术原理。
4.精通Python&PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算模块或Sidecar组件。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法;
6.具备强烈的技术热情,良好的表达与协作能力,保持对新技术的敏感度,能快速融入新环境;拥有出色的逻辑分析、抗压应对与情绪管理能力。

【base城市:北京or长春】
公司信息
中科聚信信息技术(北京)有限公司
明细
北京市海淀区学院南路62号中关村资本大厦4层401室
武隆人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!