得物App

【技术保障】云原生AI平台开发专家

得物App  •  Onsite  •  1 day ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

【技术保障】云原生AI平台开发专家
杭州
全职
互联网 / 电子 / 网游 - 研发
技术类
职位描述
职位描述
1. 定位为资深AI Infra Arch,在AI算力基础设施、AI推理和训练框架全栈底层技术方面有丰富经验技术,可带领团队建设AI平台,助力CV/NLP/AIGC/社区/搜广推等算法业务场景提升效率,加速AI能力向业务效果的转换。
2. 负责设计研发得物AI平台,对AI算力相关相关资源(GPU/TPU/CPU、存储、网络等)做平台化管理,持续提升资源利用率,为业务提供一个满足企业级稳定性和性能要求的AI平台。
3. 负责训练和推理引擎优化,助力各算法业务场景提升模型迭代效率、提高推理服务性能。
4. 解决规模增长带来的技术和业务问题。
5. 解决多云场景下的AI算力资源、数据资源的管理问题,以及业务使用效率问题,目标是降本提效。
职位要求
职位要求
1. 深度了解AI算法模型开发和上线的整个工程链路、卡点问题及相关解决方案。
2. 熟悉主流公有云/私有云的AI平台产品及解决方案,有快速将AI场景需求转换为平台特性、给出解决方案的能力。
3. 熟悉不同型号NVIDIA GPU及国产GPU的特性,可为不同的模型/算法业务场景做GPU选型。
4. 熟练掌握一个或多个AI框架,包括但不限于Tensorflow/PyTorch/Mindspore/DeepRec等,使用过DeepSpeed/Megatron/colossal-AI等加速库。
5. 熟悉和跟进云原生AI应用的发展动态,掌握其周边生态,并且有一定自己的理解。
加分项:
1. 有AIGC/大模型训练和推理优化经验者优先。
2. 有OS开发和运维、KVM虚拟化、GPU虚拟化等相关经验者优先。
3. 有Kubeflow、Knative使用经验,GPU调度相关经验者优先。
4. 熟悉Kubernetes的系统架构和编程范式,有Operator开发、调度器扩展或相关产品研发经验者优先。
5. 熟悉机房组网技术,有机房规划落地经验者优先。
投递
得物App

About 得物App

得物App致力于打造全球领先的新一代潮流网购社区。

正品潮流电商和潮流生活社区是平台的两大核心服务。得物App在传统电商模式的基础上添加"鉴别服务",推出了"先鉴别,后发货"的购物流程,为国内的年轻消费者带来全新的购物体验,让用户可以放心购买到品类丰富的经鉴别为正品的潮流商品。目前得物App的商品品类已经覆盖潮鞋、服饰、手表、配饰、潮玩、3C数码、家居家电、美妆、汽车等 。

同时作为年轻⼈的潮流生活社区,得物App聚集了一大批热爱球鞋、潮品穿搭和潮流文化的爱好者 ,通过持续沉淀潮流话题内容,得物App正在成为年轻用户的潮流风向标和发声阵地。

Industry
IT & Software
Company Size
501-1,000 employees
Headquarters
Shanghai, CN
Year Founded
2015
Website
dewu.com
Social Media