Z.ai

AI 院--多模态团队--多模态理解算法研究员-强化学习方向

Z.ai  •  Beijing, CN (Onsite)  •  5 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

AI 院--多模态团队--多模态理解算法研究员-强化学习方向北京全职互联网 / 电子 / 网游职位描述【团队介绍】
智谱多模态大模型团队是全球领先的多模态研究团队之一,专注于推动视觉语言大模型的认知与推理能力的突破。团队拥有从多模态理解到生成的全栈自研技术体系,依托强大的计算资源和全链路研发能力,持续引领行业创新。
团队先后开源CogVLM、CogAgent等标杆级视觉理解模型,并推出CogView、CogVideo等前沿生成模型。最新发布的GLM-4.1V-Thinking创新性地引入思维链推理机制,采用课程采样强化学习策略,系统性提升模型跨模态因果推理能力与稳定性,其轻量版GLM-4.1V-9B-Thinking模型参数控制在10B级别,在28项权威评测中,有23项达成10B级模型的最佳成绩,其中18项更是持平或超越参数量高达72B的Qwen-2.5-VL。近期开源的GLM-4.5V(总参数106B,激活参数12B)更是在100B级视觉推理模型中树立起新的标杆。
岗位职责:
学科解题方向,负责VLM的混合SFT/RL训练优化及RL训练的数据处理,通过人类偏好学习提升多模态大模型的对齐和推理能力。
职位要求1、统招硕士及以上学历,计算机科学/机器学习/人工智能相关专业;
2、0-3年工作经验,在NLP/CV/RL等至少一个AI领域有过深入的研究经历;
3、熟悉主流的多模态大模型,能持续跟进学术界和工业界的最新研究和产品;
4、熟悉强化学习,有RLHF/DPO训练经验者优先;熟悉Linux,Python,Pytorch和Transformer,了解分布式训练框架如Deepspeed,Megatron-LM等;
5、了解对多模态数据(如文本、图像、视频、音频等)的基本处理,能够独立完成数据收集、清洗和构造的pipeline; 投递
Z.ai

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Beijing, CN
Year Founded
Unknown
Social Media