Infinigence AI

端侧大模型异构推理技术研究(博士后)

Infinigence AI  •  Onsite  •  15 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

端侧大模型异构推理技术研究(博士后)上海、北京社招全职互联网 / 电子 / 网游 - 研发职位 ID:A26847职位描述研究针对端侧场景的推理系统优化技术。针对端侧算力较低、存储有限、功耗要求高、后端种类多等难题,结合端侧特有的SOC架构特点和内存层级、小批次计算等特点,研究大模型在端侧推理的关键优化技术,支持相关业务的推进与落地。研究高效的多后端协同、低功耗推理、长上下文压缩、低bit量化、稀疏、剪枝等优化技术在端侧应用,实现高性能、高能效的端侧推理系统。职位要求--职位信息 部门: 技术 投递
Infinigence AI

About Infinigence AI

北京无问芯穹科技有限公司是一家专注于为 AI 2.0时代提供完整解决方案的科技公司。我们的愿景是"释放无穷算力,让 AGI 触手可及",致力于成为大模型落地过程中的 "M×N" 中间层,为中国乃至全球人工智能产业的发展注入新的动力。

Industry
IT & Software
Company Size
1-10 employees
Headquarters
Unknown
Year Founded
Unknown
Social Media