Job Description
端侧大模型异构推理技术研究(博士后)上海、北京社招全职互联网 / 电子 / 网游 - 研发职位 ID:A26847职位描述研究针对端侧场景的推理系统优化技术。针对端侧算力较低、存储有限、功耗要求高、后端种类多等难题,结合端侧特有的SOC架构特点和内存层级、小批次计算等特点,研究大模型在端侧推理的关键优化技术,支持相关业务的推进与落地。研究高效的多后端协同、低功耗推理、长上下文压缩、低bit量化、稀疏、剪枝等优化技术在端侧应用,实现高性能、高能效的端侧推理系统。职位要求--职位信息 部门: 技术 投递