Job Description
具身智能-框架开发架构师上海全职研发 - 基础架构职位描述
负责Giga框架(GigaModels、GigaDatasets、GigaTrain等)的核心开发、迭代与长期维护工作,保障框架的稳定性、高效性与可扩展性,助力业务场景下模型训练与推理的效率提升,推动前沿算法在框架内的落地应用,打造高性能、易用性强的专属框架体系。
1、主导Giga框架的核心模块开发与迭代,负责框架代码的编写、调试、重构与优化,解决框架开发过程中的核心技术难题。
2、聚焦框架性能优化,重点优化多机多卡训练速度与模型推理效率,突破性能瓶颈,提升大规模模型训练与推理的吞吐量和响应速度。
3、跟踪国内外框架领域前沿技术与算法趋势,将VLA、世界模型、强化学习等相关方向的前沿算法与技术集成至Giga框架,拓展框架的功能边界。
4、参与框架架构设计与规划,具备从0到1搭建框架的落地能力,结合业务需求优化框架架构,保障框架的可扩展性、可维护性与兼容性。
5、配合算法团队与业务团队,提供框架层面的技术支持,解决模型训练、推理过程中与框架相关的技术问题,推动框架在实际业务中的深度应用。
6、沉淀框架开发经验与技术文档,参与技术分享,推动团队技术能力提升。职位要求
1、硕士及以上学历,计算机科学与技术、软件工程、人工智能、数学等相关专业,具备扎实的专业理论基础。
2、代码编程能力极强,熟练掌握C++/Python等编程语言,具备良好的编码规范、代码可读性与可维护性,能独立完成复杂模块的开发与调试。
3、具备丰富的框架开发经验,拥有从0到1搭建深度学习框架或通用框架的实际落地能力,深入理解框架的底层架构与运行机制。
4、具备优秀的框架架构思维,能结合业务需求与技术趋势,设计合理的框架架构,具备架构优化与迭代的能力。
5、熟悉多机多卡分布式训练原理、模型推理优化技术(如量化、剪枝、推理加速等),有相关性能优化实战经验者优先。
6、对VLA(大语言模型)、世界模型、强化学习等方向有一定的了解,熟悉相关领域的核心算法与应用场景,能将前沿技术集成至框架者优先。
7、熟悉深度学习原理,了解主流深度学习框架(如TensorFlow、PyTorch)的底层实现,具备相关开发或二次开发经验者优先。
综合素质
- 具备强烈的责任心、自驱力与问题解决能力,能独立应对复杂技术挑战,抗压能力强。
- 具备良好的沟通协调能力与团队协作精神,能高效配合跨团队协作,推动项目落地。
- 对技术有强烈的探索欲,乐于跟踪前沿技术动态,主动学习新技术、新方法,具备持续学习能力。
- 具备清晰的逻辑思维与表达能力,能清晰梳理技术方案,撰写技术文档。 投递