Infinigence AI

分布式大模型推理技术研究(博士后)

Infinigence AI  •  Remote  •  15 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

分布式大模型推理技术研究(博士后)北京、上海社招全职互联网 / 电子 / 网游 - 研发职位 ID:A58006职位描述研究针对千卡规模的大模型推理系统,研究设计面向大模型推理的关键优化技术和推理系统,推理系统支持万亿规模模型高性能部署;研究面向未来产业落地的长文本推理关键技术;研究面向大规模分布式集群环境部署的推理系统,支持部署在千卡规模分布式国产芯片集群环境。针对模型规模增大导致Attention和MLP部分在计算和访存需求上的不同表现特征,研究以大算子为粒度的微服务架构和资源调度方法,实现注意力、混合专家的计算需求与超节点的算力、带宽、显存资源的灵活匹配。职位要求--职位信息 部门: 技术 投递
Infinigence AI

About Infinigence AI

北京无问芯穹科技有限公司是一家专注于为 AI 2.0时代提供完整解决方案的科技公司。我们的愿景是"释放无穷算力,让 AGI 触手可及",致力于成为大模型落地过程中的 "M×N" 中间层,为中国乃至全球人工智能产业的发展注入新的动力。

Industry
IT & Software
Company Size
1-10 employees
Headquarters
Unknown
Year Founded
Unknown
Social Media