强化学习训练框架研发工程师

Infinigence AI • Shanghai, CN / Beijing, CN (Onsite) • 5 months ago

Apply

AI can make mistakes so check important info. Chat history is never stored.

Explore job details

Tailor my resume

Practice an interview

Develop new skills

Job Description

强化学习训练框架研发工程师北京、上海社招全职互联网 / 电子 / 网游 - 研发职位 ID：A172150职位描述1.负责设计和开发高性能的强化学习训练框架，支持大规模并行、分布式训练任务；
2.优化现有RL算法的执行效率，包括异步执行、批量采样、分布式推理、并行训练等；
3.与算法团队紧密合作，提供接口友好、易扩展的算法集成能力；
4.支持多种后端（如PyTorch、Megatron-LM、vLLM、SGLang）和硬件平台（GPU、国产芯片加速器）；
5.参与工具链和平台建设，包括调试工具、可视化、checkpoint管理等基础设施。职位要求1. 计算机、人工智能、电子工程等相关专业硕士及以上学历，或同等工程经验；
2. 扎实的编程能力，精通Python，熟悉C++或CUDA优先；
3. 理解强化学习训练流程，了解常见的RL算法（如PPO、GRPO等）；
4. 有分布式系统开发经验，熟悉Megatron-LM、vLLM、RPC、Actor-Critic架构、参数服务器中的一到两项；
5. 良好的系统设计能力与团队协作精神，具备工程落地思维。职位信息部门：系统通信投递

About Infinigence AI

北京无问芯穹科技有限公司是一家专注于为 AI 2.0时代提供完整解决方案的科技公司。我们的愿景是"释放无穷算力，让 AGI 触手可及"，致力于成为大模型落地过程中的 "M×N" 中间层，为中国乃至全球人工智能产业的发展注入新的动力。

Industry

IT & Software

Company Size

1-10 employees

Headquarters

Unknown

Year Founded

Unknown

Website

infini-ai.com

Social Media