MiniMax

高性能网络专家

MiniMax  •  Onsite  •  16 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

高性能网络专家北京、上海社招全职研发 - 基础架构职位描述1. 负责公司在 AI 训练、推理、数据传输等核心场景下的高性能网络系统设计与研发;
2. 参与 RDMA、RoCEv2、DPDK 等高性能网络技术的落地与优化,构建极致低延迟、高带宽的通信能力;
3. 设计并实现用户态网络协议栈、零拷贝通信、网络 IO 加速组件,提升多节点分布式系统通信效率;
4. 跟踪主流硬件(如 SmartNIC、Mellanox/NVIDIA 网卡、PCIe 互联、NVLink)的能力,对接底层驱动进行优化调优;
5. 推进高性能网络与平台系统(如训练框架、Kubernetes、RPC 框架)之间的深度融合;
6. 支持网络协议分析、性能调优、故障排查等系统级问题解决,提升系统整体稳定性与可观测性;
7. 编写技术设计文档和标准化规范,参与团队技术沉淀和知识分享。职位要求1. 本科及以上学历,计算机、电子工程、通信等相关专业,3 年及以上系统或网络研发经验;
2. 扎实的网络协议基础,精通 TCP/IP、UDP、Socket 编程,了解 RDMA、RoCE、DPDK、XDP、eBPF、VPP 等中至少一种;
3. 熟悉 Linux 网络子系统,能够进行网络协议栈相关调优、profiling 和调试分析;
4. 熟练掌握 C/C++/Rust/Go 中的一种或多种,具备良好的系统设计与性能优化能力;
5. 对高性能分布式计算或大规模 AI 系统有理解,熟悉分布式训练、AllReduce 等通信模式优先;
6. 具备良好的文档能力、沟通协作能力和工程交付意识。
加分项:
1. 有 RDMA + NCCL + 分布式训练优化实战经验;
2. 有自研用户态协议栈或 NIC Offload 功能经验;
3. 有参与或维护 TensorRT、Horovod、UCX、Libfabric、gRPC、DPDK、OFED 等开源项目经验;
4. 熟悉 SmartNIC 编程(如 P4、eBPF)、PCIe 流控、多队列调度等底层原理;
5. 熟悉 Kubernetes 网络架构、Service Mesh 或网络可观测性工具建设;
6. 有在超大规模集群中推进网络性能提升/压测/治理的经验。 投递
MiniMax

About MiniMax

MiniMax is a leading global technology company and one of the pioneers of large language models (LLMs) in Asia. Our mission is to build a world where intelligence thrives with everyone.

MiniMax develops proprietary LLMs across various modalities, including a trillion-parameter MoE model, a speech model with low latency and native support for major Asian languages, and a state-of-the-art text-to-speech and text-to-video models. Experience it now at https://hailuoai.com/

Leveraging these multi-modality general-purpose models, the MiniMax API Platform offers enterprises and developers secure, flexible, and reliable API services, enabling the rapid deployment of AI applications.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Singapore, SG
Year Founded
2022
Social Media