Z.ai

AI院--大模型量化算法研究员

Z.ai  •  Onsite  •  5 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

AI院--大模型量化算法研究员北京全职互联网 / 电子 / 网游职位描述通过前沿的模型量化、压缩与推理加速技术,显著降低大语言模型及多模态模型的存储占用与计算成本,推动 LLM 的大规模部署。
【工作内容】
1、研发及改进 PTQ(训练后量化)、QAT(量化感知训练)、混合精度量化等核心算法,针对LLM/VLM(大语言模型/视觉语言模型)设计定制化量化方案,持续优化模型精度与推理效率的平衡;
2、探索并实践低比特量化(如INT8/INT4/FP8/FP4)、权重稀疏化、知识蒸馏等协同压缩技术,提升压缩率同时控制精度损失;
3、开发及优化量化工具链,完成对 GLM 系列模型的转换、量化校准及部署集成;
4、 跟踪学术界与工业界前沿量化技术,通过论文复现、实验对比推动技术迭代。职位要求1、计算机科学、电子工程、数学等相关专业硕士及以上学历,3 年以上模型量化或推理加速经验;或优秀本科生具备扎实项目履历;
2、深入理解 Transformer 架构及 LLM 推理流程,精通 Python,熟悉常见的开源 LLM 推理框架(sglang/vllm/trtllm 等);
3、掌握量化原理(校准策略、量化粒度、误差分析)及主流算法(如GPTQ、AWQ);
4、具有 CUDA/Triton 编程经验,能自主实现高性能算子或优化内核计算加分。 投递
Z.ai

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Beijing, CN
Year Founded
Unknown
Social Media