异构计算与推理系统研究员/研究主管
上海社招全职互联网 / 电子 / 网游职位 ID:A197329 职位描述
1. 跨域多源异构系统研究: 针对跨域异构算力集群,研究下一代分布式推理系统架构与软硬协同设计;攻克多模态大模型在复杂异构环境下的超大规模全自动并行策略,探索高延迟互联下的极致调度算法与容错流转机制。
2. AI for AI System/Infra: 探索利用机器学习与大模型技术反哺系统层优化。研究基于AI驱动的动态编译策略、自动化算子生成、AI原生软件栈研究。
3. 端边云一体化研究: 针对端云协同计算网络,研究打破算力边界的泛在计算Infra,探索大小模型协同推理、端边云隐私安全推理等前沿推理框架研究。
4. 具身智能推理优化研究: 研究多模态具身大模型的专用端侧推理系统,探索面向异构SoC和大算力端侧芯片的算子优化、资源调度、内存管理、压缩裁剪等推理优化方法。
5. 全球顶尖学术产出: 规划系统层研究和技术突破路线,发表极具影响力的论文或开源系统成果,布局底层核心发明专利。
6. 前沿系统预研探索: 敏锐捕捉学术界和工业界的系统级SOTA成果,主导突破性推理加速系统原型的概念验证,与公司工程团队、产业生态联动,推动硬核系统研究向无问芯穹全栈Infra产品线的高效技术转化,负责搭建并带领前沿系统探索团队。
职位要求
1. 计算机科学、计算机体系结构、电子工程或并行计算等相关专业博士学历;
2. 曾在 OSDI、SOSP、ASPLOS、MLSys、ISCA、MICRO、HPCA 或顶级AI会议(NeurIPS, ICLR等)以第一作者/通讯作者发表过高影响力系统级论文者优先;
3. 具备优秀的团队管理能力,深刻理解大模型底层计算逻辑、主流推理框架(如vLLM等)及底层编译工具链(如Triton, MLIR等),具备技术的前瞻性视野。
职位信息
投递