【校招实习】AI Infra工程师
北京实习互联网 / 电子 / 网游 - 研发千寻智能2027届校招实习招聘项目 职位描述
1、负责具身智能大模型千卡大规模训练系统性能优化及MFU优化。
2、负责多模态大模型(VLM)在云端的高性能分布式推理系统设计、开发与全链路端到端部署。
3、负责具身智能VLA模型在端侧的推理系统的研发和模型加速算法研究。
职位要求
1、熟悉GPU体系结构,熟练掌握CUDA/triton,熟练掌握C++或Python语言。
2、深入了解PyTorch等深度学习框架的架构和运行原理,深入理解大模型训练多维并行架构,如Tensor并行、流水线并行、序列并行等。
3、深入理解多模态模型结构,如ViT、DiT等,了解开源多模态大模型结构,如qwen-vl、llama等。
4、熟悉至少一种主流开源推理引擎(如 vLLM、SGLang、TensorRT-LLM、Nvidia Dynamo等)的底层机制与源码魔改。
5、熟悉量化、剪枝、蒸馏、投机推理、步数蒸馏等前沿推理加速及模型小型化技术方案。
投递