推理架构工程师/优化专家-搜推方向
职位描述
1.我们是得物机器学习平台团队,负责构建面向搜索推荐场景的一站式深度学习平台。你将专注于每日数百亿PV请求的在线高可靠、高并发的CPU/GPU异构推理计算框架和通用的特征平台建设;
2.基于 Triton Inference Server 开发和维护在线推理服务,支撑生产环境的高并发、低延迟推理需求。
3.对接日志/监控系统,完成日志采集、指标上报及告警配置,确保服务可观测性。
4.设计并实现服务对外接口,基于proto文件协议 开发维护RPC/HTTP 接口。
5.优化服务性能与资源利用率,解决生产环境中的稳定性、性能瓶颈及容灾问题。
6.编写技术文档(部署手册、接口协议、故障排查指南)。
职位要求
1.本科及以上学历,计算机相关专业,具备良好的计算机基础,了解计算机体系结构、多线程/进程分布式计算,对数据结构、设计模式有深刻的理解;
2.精通Linux 环境下 C++/Python 编码能力, 3年以上C++开发经验,有良好的编程习惯;
3.熟悉机器学习基本知识及工程实践经验。熟练掌握Tensorflow、Pytorch 部署和应用。流畅阅读Tensorflow源码,熟悉底层执行原理,可以针对系统问题和业务需求进行二次开发和优化;
4.熟悉搜推广大规模稀疏场景推理架构,具备GPU推理框架研发和高性能计算优化的经验。
5.有优秀的学习能力,分析问题和解决问题的能力,对解决具有挑战性问题充满激情,有技术情怀和追求;
6.做事严谨、认真,积极主动,有良好的团队协作精神,具备强烈责任心和严谨工作态度以及良好的沟通能力;
投递