Job Description

AI推理部署与应用框架开发资深工程师

北京、上海、南京

全职

互联网 / 电子 / 网游

职位描述

1、基于AI芯片，完成AI推理服务化框架的方案设计及开发
2、负责框架与开源生态的适配，包括vLLM/SGLang/PyTorch/ONNX Runtime等；
3、负责大模型Agent框架，文本、多模态、语音及AIGC等应用生态的建设
4、负责主流场景AI应用的开发及效果优化
5、围绕AI芯片工具链、AI硬件产品，建设包括云平台、设备管理、模型管理在内的各类配套基础设施，为商业落地打下基础
6、建设内部各类工具与系统

职位要求

职位要求
1、熟练掌握Linux环境下的C++/Python/Go等2种以上语言；
2、熟练掌握HTTP/SSE、WebSocket等应用层网络协议，了解OpenAI API等常用大模型应用接口协议，熟悉全栈Web应用的开发；
3、深度参与过大模型Agent框架的开发，或有Agent相关项目的落地经验；
4、熟悉至少一种主流的推理框架（例如vLLM/SGLang/PyTorch/ONNX Runtime等）；
5、熟悉Transformer、MOE架构、投机采样等大模型相关基础知识，CS专业基础知识扎实；
6、有强烈的工作责任心，能主动推动目标的达成；
加分项：
1、熟悉基于NPU或其他AI芯片工具链的开发，有边端侧AI解决方案落地经验；
2、有大模型推理优化相关经验，比如：KVCache相关优化的实现、采样算法的优化实现等；
3、有云平台建设或物联网设备管理系统开发经验；
4、有Kubernetes架构和生态经验，参与过TOB项目的落地；
5、有开源项目参与经验；

投递

About 后摩智能 HOUMO.AI

后摩智能于2020年底成立，由吴强博士和多位国际顶尖学者和芯片工业界资深专家联合组建，专注于原创新型智能计算芯片及软硬件一体化平台的打造。

针对现有计算芯片架构中计算和存储分离所导致的芯片“存储墙”和性能瓶颈难题，后摩智能以国际前瞻的存算一体技术和存储工艺，致力于突破智能计算芯片性能及功耗瓶颈，加速人工智能普惠落地。其提供的大算力、低功耗的高能效比芯片及解决方案，可应用于泛机器人、无人小车等大边缘端，以及云端推理和训练。

Industry

Unknown

Company Size

11-50 employees

Headquarters

南京市, CN

Year Founded

2020

Website

houmoai.com

Social Media