Job Description
推理优化/推理Infra工程师(RL)北京正式互联网 / 电子 / 网游 - 研发职位描述职位描述
- 基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性。
- 支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用。
- 建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理。
- 与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档。职位要求职位要求
- 熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识。
- 熟悉 GPU 推理与常见深度学习框架(如PyTorch),了解分布式通信与并行基本概念(NCCL 等)。
- 了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)。
- 理解RL训练中推理侧的作用,能够与训练流程协同推进落地。
- 具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题。
加分项
- 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。
- 有推理性能profiling、算子/运行时优化经验。
- 有MoE模型优化经验。 投递