通义实验室-AI服务-检索增强(RAG)
2.5-5万元/月
更新 2025-12-21 14:35:17
浏览 355
职位详情
Java
5-10年
Java · C++ · AI · RAG
通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台,全面支持通义千问、通义万相及多种前沿开源模型的线上服务运行,并积极推进AIAgents、多模态应用、MCP等创新技术的产品化实践。
团队持续应对异构GPU资源调度、跨地域多模型部署、多模态任务统一推理、多层次服务等级保障(SLO)以及模型推理端到端工程化等核心技术难题,不断优化系统性能、稳定性与资源利用效率。
1、基于LLM技术,设计并优化RAG全流程基础架构,提升系统整体吞吐量与响应效率;
2、研发高吞吐、可扩展的分布式文档处理与索引构建体系,满足大规模知识库在索引生成与检索场景下的核心需求;
3、负责检索集群的架构规划与性能调优,通过合理分片策略与资源分配机制降低延迟、提升吞吐,结合具体业务场景实施针对性优化;
4、搭建完整的系统监控体系,集成日志分析与链路追踪平台,实现问题的快速定位与高效处理。
职位描述
1、计算机或人工智能相关专业硕士及以上学历,具备5年以上开发经验,熟练掌握C++/Java/Go中至少一门编程语言,有大型分布式系统实际开发经历者优先;
2、了解信息检索基本理论,具备高并发在线服务系统开发背景者优先;
3、熟悉Linux操作系统,能熟练运用Unixshellscripting、Perl或Python等脚本工具;
4、深入理解数据结构与算法设计,具备较强的逻辑分析与问题解决能力,热衷于攻克复杂技术难题;
5、精通搜索推荐引擎的在线与离线系统架构,掌握索引机制、缓存策略、负载均衡及分布式系统基础原理;
6、具备关键字检索或向量检索系统实践经验者优先。
团队持续应对异构GPU资源调度、跨地域多模型部署、多模态任务统一推理、多层次服务等级保障(SLO)以及模型推理端到端工程化等核心技术难题,不断优化系统性能、稳定性与资源利用效率。
1、基于LLM技术,设计并优化RAG全流程基础架构,提升系统整体吞吐量与响应效率;
2、研发高吞吐、可扩展的分布式文档处理与索引构建体系,满足大规模知识库在索引生成与检索场景下的核心需求;
3、负责检索集群的架构规划与性能调优,通过合理分片策略与资源分配机制降低延迟、提升吞吐,结合具体业务场景实施针对性优化;
4、搭建完整的系统监控体系,集成日志分析与链路追踪平台,实现问题的快速定位与高效处理。
职位描述
1、计算机或人工智能相关专业硕士及以上学历,具备5年以上开发经验,熟练掌握C++/Java/Go中至少一门编程语言,有大型分布式系统实际开发经历者优先;
2、了解信息检索基本理论,具备高并发在线服务系统开发背景者优先;
3、熟悉Linux操作系统,能熟练运用Unixshellscripting、Perl或Python等脚本工具;
4、深入理解数据结构与算法设计,具备较强的逻辑分析与问题解决能力,热衷于攻克复杂技术难题;
5、精通搜索推荐引擎的在线与离线系统架构,掌握索引机制、缓存策略、负载均衡及分布式系统基础原理;
6、具备关键字检索或向量检索系统实践经验者优先。
相似职位
很抱歉,暂无相似职位!