返回 职位详情 登录/注册
大模型数据开发工程师
6000-9000元/月
定位 成都武侯区桂溪广场B栋1
更新 2025-12-30 17:08:55 浏览 522
职位详情
Python 1-3年
职位描述:
1、构建多源数据采集链路(网络/数据库/API),实现自动接入、增量同步及异常监控,完成数据入湖入仓的分层治理。
2、开展数据清洗与标准化工作(处理错误、重复、缺失数据),实施规范化的ETL/ELT流程,完善元数据管理与血缘追踪。
3、设计数据标注规则与质量检验机制(如抽样检查、交叉核验),将质量指标嵌入数据流程,持续优化查询性能与数据复用效率。
4、结合复述、同义替换、语序变换以及生成式AI与规则引擎进行数据增强,支持批量并行处理并评估增强效果。
5、协同算法、研发与运维团队,开发轻量级后端接口与实用工具,总结并推广高效实践,提升整体协作效能。

职位要求:
1、本科及以上学历,计算机或数据相关专业;掌握NLP基础知识,了解大模型后续训练流程及其数据需求。
2、熟练使用Python,精通Pandas/NumPy/Spark/Flink;至少熟悉FastAPI/Flask/SpringBoot中的一项框架。
3、具备前端基础知识(Vue/React/HTML/CSS/JS),可配合前端完成工具界面联调。
4、熟悉MySQL/PostgreSQL/MongoDB中至少一种数据库,具有数据建模意识和性能调优经验。
5、1–3年数据处理或数据工程相关经验;具备LLM数据标注、增强、合成、工程化落地,或数仓建设、采集系统、数据工具开发经验者优先。
6、具备数据质量分析与故障排查能力,能快速定位并解决数据管道、存储系统及前后端协作问题;沟通良好,学习能力强,热爱AI领域,能撰写清晰的技术文档。
公司信息
广州景烁数据科技有限公司
明细
广州市黄埔区南翔三路19号B栋109单元
武隆人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!