XPENG

【27届校招】通用智能AI平台研发工程师

XPENG  •  Onsite  •  7 hours ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

【27届校招】通用智能AI平台研发工程师
北京、上海、广州
正式
研发 - 算法
职位描述
小鹏通用智能AI数据闭环平台团队,负责构建支撑百万级路采数据、千卡GPU集群的自动驾驶,具身智能数据与AI基础设施。从路测车辆上每秒产生的GB级传感器数据和多模态具身智能传感器数据,到最终训练出能够应对复杂城市道路的感知/预测/决策模型——我们打造的平台是这一切的底座。你将与国内顶尖的分布式系统、AI基础设施、自动驾驶算法工程师并肩工作,直面PB级数据处理、大规模分布式训练、大模型辅助标注等前沿技术挑战。
真实场景,海量数据:你将处理来自摄像头、LiDAR、毫米波雷达、GPS/IMU等多传感器的真实路采和数采数据,规模达到PB级——这不是课堂作业,而是工业级挑战。
前沿技术,深度应用:VLM自动化标注、Milvus向量检索、流批一体架构、GPU集群调度……你接触的不是纸上谈兵的技术,而是正在重塑行业的关键能力。
完整链路,全局视野:从数据接入→清洗治理→特征提取→模型训练→推理部署→数据回流,你将有机会参与到AI平台的全链路建设中,理解自动驾驶数据闭环的每一环。
高速成长,快速扛事:27届校招专属培养计划,mentor一对一引导,但绝不只让你做边角料——我们希望你尽快独立负责核心模块的研发与优化。
方向一:大规模数据处理
开发高可靠的ETL数据处理流水线,处理车载传感器数据(摄像头图像、LiDAR点云、GPS轨迹、CAN总线信号等)
基于Spark/Flink优化数据清洗、转换、聚合任务,持续提升云端数据处理的吞吐与稳定性
构建多模态Embedding生产流水线,支持CV/NLP模型对海量数据的分布式特征提取
探索基于VLM(视觉语言模型)的自动标签生成方案,减少对人工标注的依赖,加速算法迭代
构建驾驶场景的语义索引系统,支持复杂语义检索(如“夜间雨天前车急刹”“高架桥上旁车近距离切入”)
方向二:数据建模与治理
设计多源异构数据仓库的分层模型(ODS/DWD/DWS/ADS),支撑感知、预测、规划等算法的训练数据需求
构建数据血缘与元数据管理体系,确保每一帧训练数据的来源、处理过程与版本都可追溯
制定多模态数据的向量化规范(图像/点云/文本的Embedding标准),为后续检索与训练提供高质量特征输入
方向三:AI平台架构与优化
搭建数据湖仓一体架构(基于Iceberg/Delta Lake + StarRocks/Doris),兼顾数据湖的灵活性与数据仓库的查询性能
开发高性能特征向量数据库(基于Milvus/Pinecone或自研引擎),支撑亿级向量的低延迟检索
持续优化存储与计算性能(分区策略、压缩算法、缓存机制),探索流批一体、存算分离等新架构的落地
设计高效的数据存储、分区与读取策略(Parquet/ORC),优化存储与网络I/O,保障训练与推理的数据吞吐
方向四:分析工具与可视化
开发BI数据看板,实时监控数据质量及自动驾驶核心指标(感知准确率、接管率、场景覆盖率等)
提供多模态检索接口,支持通过文本描述(如“从左后方快速切入的摩托车”)检索对应的驾驶场景视频片段
职位要求
1、2027届硕士/博士毕业生,计算机、软件工程、人工智能、自动化、电子信息等相关专业
2、扎实的编程基础,熟练掌握 Python/C++/Java/Scala 中至少一门语言,有良好的工程习惯与代码质量意识
熟悉至少一项大数据处理框架(Spark/Flink)或深度学习框架(PyTorch/TensorFlow)
3、对自动驾驶场景有基本认知和浓厚兴趣——你不一定懂感知算法细节,但要理解数据对算法训练的价值
加分项(满足1-2项即可,非硬性要求)
1、有数据仓库建模或数据湖(Iceberg/Delta Lake/Hudi)实际使用经验
2、熟悉分布式计算原理,有Spark/Flink任务性能调优经验
3、了解Kubernetes及GPU虚拟化技术,有集群资源调度相关实践
4、使用过Milvus、Weaviate、Pinecone等向量数据库,或对向量检索算法(HNSW/IVF)有研究
5、熟悉VLM/多模态模型(如CLIP、LLaVA、Qwen-VL等),有特征提取或模型微调经验
6、有自动驾驶相关数据集(nuScenes/Waymo/Argoverse)的处理经验
在ACM、Kaggle、天池等编程/数据竞赛中取得过优异成绩
7、有高质量技术博客或开源项目贡献
收获
1、有竞争力的薪酬与校招专属福利包(薪资面议,对标一线互联网/自动驾驶公司)
2、真实的工业级技术挑战,你的代码将直接运行在千卡GPU集群和PB级数据湖上
3、技术广度与深度的双重成长,在数据工程、AI基础设施、分布式系统、多模态模型等方向持续积累
4、广阔的成长空间:团队技术氛围浓厚,鼓励技术分享、论文阅读与创新探索,支持将前沿成果转化为实际生产力
5、清晰的校招培养路径:入职前3个月mentor带教,半年内逐步独立负责核心模块,1年内具备技术owner能力
投递
XPENG

About XPENG

XPeng is a leading Chinese Smart EV company that designs, develops, manufactures, and markets Smart EVs that appeal to the large and growing base of technology-savvy middle-class consumers. Its mission is to drive Smart EV transformation with technology and data, shaping the mobility experience of the future. In order to optimize its customers’ mobility experience, XPeng develops in-house its full-stack advanced driver-assistance system technology and in-car intelligent operating system, as well as core vehicle systems including powertrain and the electrical/electronic architecture. XPeng is headquartered in Guangzhou, China. In 2021, the Company established its European headquarters in Amsterdam, along with other dedicated offices in Copenhagen, Munich, Oslo, and Stockholm.The Company’s Smart EVs are mainly manufactured at its plant in Zhaoqing and Guangzhou,Guangdong province.

For more information, please visit https://heyxpeng.com.

Industry
Automotive & Mobility
Company Size
1,001-5,000 employees
Headquarters
Guangzhou, CN
Year Founded
2014
Social Media