Job Description

【智谱星】AI院-多模态理解-算法工程师（26届校招）北京正式互联网 / 电子 / 网游职位描述【团队介绍】
智谱多模态大模型团队是全球领先的多模态研究团队之一，专注于推动视觉语言大模型的认知与推理能力的突破。团队拥有从多模态理解到生成的全栈自研技术体系，依托强大的计算资源和全链路研发能力，持续引领行业创新。
团队先后开源CogVLM、CogAgent等标杆级视觉理解模型，并推出CogView、CogVideo等前沿生成模型。最新发布的GLM-4.1V-Thinking创新性地引入思维链推理机制，采用课程采样强化学习策略，系统性提升模型跨模态因果推理能力与稳定性，其轻量版GLM-4.1V-9B-Thinking模型参数控制在10B级别，在28项权威评测中，有23项达成10B级模型的最佳成绩，其中18项更是持平或超越参数量高达72B的Qwen-2.5-VL。近期开源的GLM-4.5V（总参数106B，激活参数12B）更是在100B级视觉推理模型中树立起新的标杆。
【岗位职责】
技术方向一：学科解题方向，负责VLM的混合SFT/RL训练优化及RL训练的数据处理；
技术方向二：reward 方向，负责 reward system 和 verifier model 优化；
技术方向三：负责VLM的算法开发和预研，需具备较强的算法自主研究能力（智谱星）；
技术方向四：多模态训练框架开发、调优、提速；
技术方向五：负责 pretrain 训练数据清洗优化工作；
技术方向六：负责多模态智能评估方向。职位要求【职位要求】
1. 2026届毕业，自然语言处理、机器学习、人工智能、软件工程等相关专业，硕士及以上学历；
2. 较强的算法开发能力，熟悉常用的机器学习、深度学习算法；
3. 熟练运用Pytorch、transformers、megatron等主流框架；
4. 对Transformer的架构有较为深入的理解，了解Transformer的各种变体，有相关的研究经验者优先；
5. 具备优秀的代码能力和基础算法功底，有较为丰富的工程经验，有大规模训练经验或大规模数据处理经验。
加分项：
1. 在ACL，NeurIPS，ICLR，EMNLP，ICML等顶级会议或期刊上发表过论文者优先；
2. 熟悉并行训练框架，有多机多卡训练经验者优先。投递

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry

IT & Software

Company Size

51-200 employees

Headquarters

Beijing, CN

Year Founded

Unknown

Website

zhipuai.cn

Social Media