MiniMax

调度策略工程师-运筹优化方向

MiniMax  •  Onsite  •  15 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

调度策略工程师-运筹优化方向上海、北京社招全职互联网 / 电子 / 网游职位描述我们正在寻找对大规模资源调度算法有深入理解的研发工程师,职位将工作在MiniMax GPU调度系统这一层级,通过先进的算法实现复杂服务体系在大规模多GPU集群下的调度分配决策。
你将直接负责调度系统Moderator模块的设计与演进。这是调度的“大脑”,负责在复杂的约束条件和优化目标(资源配额、业务优先级、迁移成本、状态感知、SLA)下,利用运筹优化理论法求解全局最优的资源分配方案,并设计状态转移矩阵完成方案的执行。工作内容包括并不限于:
1. 深入理解Minimax模型以及资源场景,将复杂的现实场景(如不同机房的资源配额、模型与异构资源的适配性、KvCache的感知与处理,跨地域迁移的延迟惩罚、业务降级策略)抽象为数学模型中的约束条件和目标函数。
2. 将理论算法工程化,应用高效的求解器得到鲁棒解,确保在分钟级调度周期内完成复杂约束下万级 Pod 规模的决策计算。
3. 对整体模块负责,优化数据流与决策链路,提升系统的稳定性与可观测性。职位要求1. 应用数学、运筹学、计算机科学或相关专业,本科及以上学历;
2. 能熟练使用一种编程语言,包括不限于Python/Shell/Golang/C++/C;
3. 有良好的团队沟通和协作能力,有良好的责任心;
4. 有调度领域相关经验优先;
5. 在运筹优化或调度领域的开源项目中有贡献者优先。
6. 有LLM领域相关经验优先。 投递
MiniMax

About MiniMax

MiniMax is a leading global technology company and one of the pioneers of large language models (LLMs) in Asia. Our mission is to build a world where intelligence thrives with everyone.

MiniMax develops proprietary LLMs across various modalities, including a trillion-parameter MoE model, a speech model with low latency and native support for major Asian languages, and a state-of-the-art text-to-speech and text-to-video models. Experience it now at https://hailuoai.com/

Leveraging these multi-modality general-purpose models, the MiniMax API Platform offers enterprises and developers secure, flexible, and reliable API services, enabling the rapid deployment of AI applications.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Singapore, SG
Year Founded
2022
Social Media