Infinigence AI

强化学习训练框架研发工程师

Infinigence AI  •  Shanghai, CN / Beijing, CN (Onsite)  •  5 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

强化学习训练框架研发工程师北京、上海社招全职互联网 / 电子 / 网游 - 研发职位 ID:A172150职位描述1.负责设计和开发高性能的强化学习训练框架,支持大规模并行、分布式训练任务;
2.优化现有RL算法的执行效率,包括异步执行、批量采样、分布式推理、并行训练等;
3.与算法团队紧密合作,提供接口友好、易扩展的算法集成能力;
4.支持多种后端(如PyTorch、Megatron-LM、vLLM、SGLang)和硬件平台(GPU、国产芯片加速器);
5.参与工具链和平台建设,包括调试工具、可视化、checkpoint管理等基础设施。职位要求1. 计算机、人工智能、电子工程等相关专业硕士及以上学历,或同等工程经验;
2. 扎实的编程能力,精通Python,熟悉C++或CUDA优先;
3. 理解强化学习训练流程,了解常见的RL算法(如PPO、GRPO等);
4. 有分布式系统开发经验,熟悉Megatron-LM、vLLM、RPC、Actor-Critic架构、参数服务器中的一到两项;
5. 良好的系统设计能力与团队协作精神,具备工程落地思维。职位信息 部门: 系统通信 投递
Infinigence AI

About Infinigence AI

北京无问芯穹科技有限公司是一家专注于为 AI 2.0时代提供完整解决方案的科技公司。我们的愿景是"释放无穷算力,让 AGI 触手可及",致力于成为大模型落地过程中的 "M×N" 中间层,为中国乃至全球人工智能产业的发展注入新的动力。

Industry
IT & Software
Company Size
1-10 employees
Headquarters
Unknown
Year Founded
Unknown
Social Media