MiniMax

大模型系统负责人

MiniMax  •  Onsite  •  15 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

大模型系统负责人上海、北京社招全职互联网 / 电子 / 网游职位描述职位职责
1. 负责 AI Infra 整体方向与技术演进,围绕大模型训练与推理场景,持续逼近系统级最佳实践。
2. 从模型效果与业务需求出发,端到端解决训练与推理链路中的关键问题,提升性能、效率与稳定性。
3. 统筹算力、框架与流量体系设计,持续提升资源利用率与系统吞吐能力。
4. 构建高性能、可扩展的基础设施体系,支撑大模型研发与线上服务。
5. 建立团队技术标准与工程品位,提升整体技术判断力与复杂问题解决能力。
细分方向
1. 在线推理优化方向
- 负责在线推理链路的端到端优化,覆盖从流量入口到结果返回的全路径;
- 优化推理架构,在跨机、跨实例等维度沉淀高性能实践;
- 面向真实业务负载,持续降低时延并提升资源利用率。
2. 训推框架方向
- 负责训练与推理框架的优化与演进,从算子到框架层提升整体性能;
- 基于真实流量与模型特性,设计高效的框架与执行策略;
- 从多层级(算子 / 框架 / 调度)进行系统性性能分析与优化。
3. AI Infra 平台方向
- 负责训练与推理基础设施建设,包括资源层、调度层与流量层;
- 构建适配大模型场景的高性能系统架构;
- 支撑模型研发、训练优化与线上服务的全流程效率提升。职位要求1. 具备扎实的端到端性能分析能力,能够从底层原理理解系统性能表现(包括但不限于 GPU);
2. 优秀的编程能力与代码品位,具备良好的数据结构与算法基础,有 ICPC / OI / ASC 等竞赛经历者优先;
3. 深入理解操作系统、分布式系统等基础原理,具备复杂系统的架构设计能力;
4. 具备良好的可靠性意识,熟悉监控、容灾等工程体系;
5. 具备优秀的沟通与协作能力,能够推动跨团队复杂问题落地;
6. 具备强自驱力与学习能力,对技术有长期追求。 投递
MiniMax

About MiniMax

MiniMax is a leading global technology company and one of the pioneers of large language models (LLMs) in Asia. Our mission is to build a world where intelligence thrives with everyone.

MiniMax develops proprietary LLMs across various modalities, including a trillion-parameter MoE model, a speech model with low latency and native support for major Asian languages, and a state-of-the-art text-to-speech and text-to-video models. Experience it now at https://hailuoai.com/

Leveraging these multi-modality general-purpose models, the MiniMax API Platform offers enterprises and developers secure, flexible, and reliable API services, enabling the rapid deployment of AI applications.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Singapore, SG
Year Founded
2022
Social Media