Job Description
AI数据工程实习生(训练数据 & 清洗方向)上海日常实习生招聘职位 ID:A81862职位描述- 模型训练数据体系设计,统筹内部主动生成数据与外部真实用户数据的采集、清洗、标注全流程
- 设计并落地 Tool Trajectory 数据管道:去噪、脱敏、补齐验证、格式标准化,保障数据"干净、完整、准确"
- 从引擎代码库、历史提交记录、测试用例中设计结构化样本提取方案,覆盖全排列/边界/失败链路等场景
- 建立数据质量评估体系,制定标注规范,驱动数据质量持续提升
- 与模型训练团队深度协作,根据模型反馈快速迭代数据策略
- 设计并优化大规模数据处理管道,保障数据生产效率和稳定性
- 参与数据飞轮体系建设,推动"使用→数据积累→模型优化"的正向循环落地职位要求- 本科及以上学历,计算机、数据工程相关专业。
- 有数据工程相关项目经验,有LLM 训练数据处理经验的优先
- 理解 instruction tuning、trajectory data 等格式
- 了解 Python 及 TB 级数据处理,有代码数据处理经验的优先
- 具备系统性思维,能从业务目标反推数据需求。 投递