Job Description
AI院-GLM团队-训练/推理infra算法工程师(26届校招)北京正式互联网 / 电子 / 网游 - 研发职位描述*岗位职责**
1. 与算法团队深度协作,参与 **下一代 GLM 大模型架构设计与系统实现**,推动模型结构与系统效率的协同优化
2. 构建 **大模型推理成本分析与模拟系统**,从算力、通信、KV cache、并行策略等维度优化推理效率
3. 设计与优化 **超大规模训练基础设施(万卡级)**,提升训练稳定性、资源利用率与训练效率
4. 探索 **MoE、Sparse Attention、长上下文等新架构在训练与推理系统中的高效落地**
**你将参与**
* 下一代 **GLM 系列基础模型(百亿到万亿参数级)** 的系统设计
* **万卡规模训练系统** 的优化与稳定性工程
* 推理系统的 **极致效率优化(吞吐 / 延迟 / 成本)**
* 新型模型结构(MoE / Sparse Attention / 长上下文)的 **系统级实现与优化**职位要求职位要求
1、熟悉主流的LLM模型架构,有分布式训练/推理优化经验
2、熟悉Megatron分布式训练框架或sglang、vllm等推理框架
3、熟悉 CUDA kernel 优化的优先考虑 投递