Job Description
AI院--训练Infra工程师北京全职互联网 / 电子 / 网游职位描述1、负责大规模预训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率;
2、分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性;
3、跟进业界技术进展,不断同步与集成最新训练优化策略。职位要求1、对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 和 VLM 模型架构,有分布式训练经验;
2、精通 Python 编程语言,熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架;
3、有大规模预训练优化 / MoE 训练优化经验的优先考虑。 投递