Z.ai

26届校招-推理Infra工程师

Z.ai  •  Onsite  •  4 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

26届校招-推理Infra工程师北京正式互联网 / 电子 / 网游职位描述1. 参与大模型推理框架的设计与开发​:协助团队进行支撑大语言模型、图像生成等复杂模型推理的高性能框架研发,推动算法到产品落地的全链路优化,确保推理的高效性、稳定性和低延迟。
2. 性能优化与调优​:在资深工程师指导下,参与优化内存管理、计算资源分配与调度策略,提升模型推理速度和资源利用率。学习并使用性能分析工具(如Nvidia Nsight)进行瓶颈定位和优化。
3. 模型推理加速技术探索​:学习并应用业界前沿的推理优化技术,KV Cache优化、模型量化(Quantization)、剪枝(Pruning),跨机分布式推理优化等。职位要求1. 基础技能​:
- 熟练掌握 C++ 和 Python 编程语言,具备扎实的数据结构、算法和操作系统基础。
- 熟悉至少一种主流的深度学习框架(如 PyTorch、TensorFlow),了解其基本实现原理。
- 了解GPU编程​(如 CUDA)或并行计算,有相关的课程项目或实验经验。
2. 专业知识​:
- 对 Transformer 架构及主流大模型(如GPT、Llama、Qwen等)的推理特性有基本理解。
- 了解大模型推理的基本流程和常见挑战(如延迟、吞吐、内存占用)。
3. 加分之项(满足以下任一即可)​​:
- 有大模型推理框架​(如 vLLM、TensorRT-LLM、SGLang、llama.cpp等)的使用或初步研究经验。
- 对AI编译器技术​(如 TVM、MLIR、Triton)有初步接触或浓厚兴趣。
- 了解大模型推理相关的优化技术,如FlashAttention、PageAttention、量化、LoRA微调等。
- 在相关领域的顶会(MLSys, ASPLOS等)或开源项目中有贡献或论文者优先。 投递
Z.ai

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Beijing, CN
Year Founded
Unknown
Social Media