Job Description

AI院-多模态理解-算法实习生北京实习互联网 / 电子 / 网游职位描述【团队介绍】
智谱多模态大模型团队是全球领先的多模态研究团队之一，专注于推动视觉语言大模型的认知与推理能力的突破。团队拥有从多模态理解到生成的全栈自研技术体系，依托强大的计算资源和全链路研发能力，持续引领行业创新。
团队先后开源CogVLM、CogAgent等标杆级视觉理解模型，并推出CogView、CogVideo等前沿生成模型。最新发布的GLM-4.1V-Thinking创新性地引入思维链推理机制，采用课程采样强化学习策略，系统性提升模型跨模态因果推理能力与稳定性，其轻量版GLM-4.1V-9B-Thinking模型参数控制在10B级别，在28项权威评测中，有23项达成10B级模型的最佳成绩，其中18项更是持平或超越参数量高达72B的Qwen-2.5-VL。近期开源的GLM-4.5V（总参数106B，激活参数12B）更是在100B级视觉推理模型中树立起新的标杆。职位要求岗位职责：
- 设计和训练先进的多模态大模型，包括图像、视频的理解与生成。
- 搭建与优化多模态大模型的自动化数据通路，提升模型的多模态基础能力及下游任务上的效果。
- 优化模型训练，包括包括模型的预训练、微调、偏好对齐等
- 探索前沿算法，多模态理解的数据合成、模型自我迭代等。
- 加速多模态大模型的推理过程并部署到实际应用中。
岗位要求：
- 985高校计算机、电子、自动化等相关专业硕士或博士学位(优秀本科生亦可考虑)
- 深入理解常用多模态算法；具备多模态大模型和视频理解相关项目经验者优先
- 在CCF-A类会议发表过多模态相关论文者优先考虑
- 熟练运用Pytorch、transformers、megatron等主流框架
- 工作态度认真负责,具备良好的团队协作能力
加入我们，你将有机会:
- 参与突破性的多模态AI研究
- 与顶尖专家共事，快速提升技能
- 在充满活力的环境中实现自我价值
我们期待你的加入，一同推动AI技术的前沿发展！
简历投递：
- 智谱校招官网直接投递
- 邮箱直达招聘HR：he.li@aminer.cn
**邮件标题：职位名称+姓名+毕业时间投递

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry

IT & Software

Company Size

51-200 employees

Headquarters

Beijing, CN

Year Founded

Unknown

Website

zhipuai.cn

Social Media