Z.ai

推理优化/推理Infra工程师(RL)

Z.ai  •  Onsite  •  4 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

推理优化/推理Infra工程师(RL)北京全职互联网 / 电子 / 网游 - 研发职位描述1. 基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性。
2. 支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用。
3. 建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理。
4. 与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档。职位要求1. 熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识。
2. 熟悉GPU推理与常见深度学习框架(如 PyTorch),了解分布式通信与并行基本概念(NCCL 等)。
3. 了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)。
4. 理解RL训练中推理侧的作用,能够与训练流程协同推进落地。
5. 具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题。
加分项
6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。
7. 有推理性能profiling、算子/运行时优化经验。
8. 有MoE模型优化经验。 投递
Z.ai

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Beijing, CN
Year Founded
Unknown
Social Media