Job Description

大模型数据科学家（数据清洗方向）北京全职研发 - 算法职位描述1. 负责设计和构建适用于大模型训练、SFT、RLHF、评测的数据合成体系，提升模型泛化能力与对齐质量；
2. 主导高质量指令、对话、多轮交互、代码、图文等各类数据的合成策略设计与落地；
3. 构建自动化数据生成框架，探索基于Prompt、模型自生成（Self-Instruct）、知识引导的多种数据生成技术；
4. 基于实验数据进行分析评估，优化数据分布、难度层次、任务覆盖面，提高训练效率与效果；
5. 跟踪大模型领域最新的数据合成研究成果，并推动在团队中的落地与创新；
6. 与模型研发、评估、安全等团队协同，保障数据合成链路的高质量、高可控与高安全性。职位要求1. 人工智能、计算机、统计学、语言学等相关专业硕士及以上学历，具备扎实的科研素养；
2. 熟悉自然语言处理和大模型训练机制，理解数据对模型性能的关键影响；
3. 深入理解大模型训练范式（SFT、DPO/GRPO、PPO、Reward Modeling），清楚数据质量、分布偏差、噪声水平对模型收敛与泛化的影响机制；
4. 有实际合成数据构建经验，掌握数据生成方法，如模板设计、语义控制、模型驱动生成等；
5. 具备良好的数据分析能力，能通过实验指标（如多样性熵、任务覆盖率、人工评分一致性）驱动数据策略优化；
6. 熟练使用Python及相关AI/NLP工具库，熟悉 HuggingFace Transformers、vLLM、LangChain、LlamaIndex 等生态工具，能高效构建可扩展的数据生成与管理 pipeline。具备良好的工程实现能力。
加分项
1. 有使用大模型进行指令生成、自我对齐、自我评估（Self-Reward）等经验；
2. 有 RLHF / DPO / GRPO 等偏好学习实战经验，理解高质量偏好对（preference pairs）的构造难点；
3. 熟悉多模态合成数据生成（如图文描述、视频字幕、语音-文本对齐）；
4. 具备 Prompt Engineering 高阶能力：能设计少样本（few-shot）、思维链（CoT）、自我修正（Self-Refine）、多轮对话模拟等复杂 prompt 范式；
5. 熟悉数据安全、脱敏、偏见识别、价值观对齐等合规处理流程。投递

About 01.AI

01.AI has launched Yi Open-source models on Hugging Face, GitHub, ModelScope. Stay tuned for more of our LLMs and application launches coming up!

https://huggingface.co/01-ai

https://github.com/01-ai/Yi

https://www.modelscope.cn/organization/01ai

Industry

IT & Software

Company Size

51-200 employees

Headquarters

Unknown

Year Founded

Unknown

Website

01.ai

Social Media