01.AI

大模型数据科学家(数据清洗方向)

01.AI  •  Onsite  •  3 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

大模型数据科学家(数据清洗方向)北京全职研发 - 算法职位描述1. 负责设计和构建适用于大模型训练、SFT、RLHF、评测的数据合成体系,提升模型泛化能力与对齐质量;
2. 主导高质量指令、对话、多轮交互、代码、图文等各类数据的合成策略设计与落地;
3. 构建自动化数据生成框架,探索基于Prompt、模型自生成(Self-Instruct)、知识引导的多种数据生成技术;
4. 基于实验数据进行分析评估,优化数据分布、难度层次、任务覆盖面,提高训练效率与效果;
5. 跟踪大模型领域最新的数据合成研究成果,并推动在团队中的落地与创新;
6. 与模型研发、评估、安全等团队协同,保障数据合成链路的高质量、高可控与高安全性。职位要求1. 人工智能、计算机、统计学、语言学等相关专业硕士及以上学历,具备扎实的科研素养;
2. 熟悉自然语言处理和大模型训练机制,理解数据对模型性能的关键影响;
3. 深入理解大模型训练范式(SFT、DPO/GRPO、PPO、Reward Modeling),清楚数据质量、分布偏差、噪声水平对模型收敛与泛化的影响机制;
4. 有实际合成数据构建经验,掌握数据生成方法,如模板设计、语义控制、模型驱动生成等;
5. 具备良好的数据分析能力,能通过实验指标(如多样性熵、任务覆盖率、人工评分一致性)驱动数据策略优化;
6. 熟练使用Python及相关AI/NLP工具库,熟悉 HuggingFace Transformers、vLLM、LangChain、LlamaIndex 等生态工具,能高效构建可扩展的数据生成与管理 pipeline。具备良好的工程实现能力。
加分项
1. 有使用大模型进行指令生成、自我对齐、自我评估(Self-Reward)等经验;
2. 有 RLHF / DPO / GRPO 等偏好学习实战经验,理解高质量偏好对(preference pairs)的构造难点;
3. 熟悉多模态合成数据生成(如图文描述、视频字幕、语音-文本对齐);
4. 具备 Prompt Engineering 高阶能力:能设计少样本(few-shot)、思维链(CoT)、自我修正(Self-Refine)、多轮对话模拟等复杂 prompt 范式;
5. 熟悉数据安全、脱敏、偏见识别、价值观对齐等合规处理流程。 投递
01.AI

About 01.AI

01.AI has launched Yi Open-source models on Hugging Face, GitHub, ModelScope. Stay tuned for more of our LLMs and application launches coming up!

https://huggingface.co/01-ai

https://github.com/01-ai/Yi

https://www.modelscope.cn/organization/01ai

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Unknown
Year Founded
Unknown
Website
01.ai
Social Media