Job Description
AI院-GLM团队-模型代码预训练算法工程师(实习)北京实习互联网 / 电子 / 网游职位描述1. 负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中训练数据质量
2. 负责探究预训练小领域数据的配比和最终效果之间的关系
3. 开发数据筛选和合成链路,提升基座模型在下游代码任务中的能力职位要求1. 本科及以上学历,计算机、软件工程、人工智能等相关专业
2. 具备优秀的代码能力和基础算法功底,有较为丰富的工程经验,有大规模训练经验或大规模数据处理经验
3. 关注代码生成领域前沿进展,对提升模型代码生成能力充满热情
4. 具有良好的团队合作精神,善于分析和解决问题,有较强的沟通能力和学习能力
5. 在大模型 / 代码生成领域有研究论文者优先;熟悉大模型预训练 / SFT / RL 者优先 投递