Job Description

大模型算法工程师（B端）- 懂车帝

北京

社招

全职

职位 ID：A256528

职位描述

1、负责大语言模型（LLM）及智能体（Agent）在汽车垂类场景的端到端落地，覆盖AI销售、智能问答、购车决策助手、自动化内容创作等核心产品功能；
2、构建基于工具调用（Tool Learning / Function Calling）的智能体系统，实现多步骤任务规划、外部API调用与动态执行能力；
3、探索并应用思维链（Chain-of-Thought, CoT）、自我反思（Self-Refine）、任务分解与自主规划（Autonomous Planning）等机制，提升模型在复杂购车咨询、对比分析、故障诊断等高阶推理任务中的表现；
4、参与LLM强化学习优化链路建设，包括偏好数据构建、奖励模型（RM）训练、DPO/RLHF 策略迭代，持续提升生成内容的相关性、准确性与用户体验；
5、针对海量汽车文章、评测视频脚本、用户评论等多源异构数据，开展深度语义挖掘，支撑热点事件抽取、情感倾向分析、车型知识图谱构建等基础能力建设；
6、设计并维护可复用的NLP与Agent基础组件，如领域适配的摘要生成、细粒度情感识别、结构化信息抽取、RAG增强检索等；
7、与产品、工程、业务团队紧密协作，推动算法模型从实验到上线的全链路工程化落地，并建立科学的效果评估与迭代机制；
8、跟踪AIGC、智能体、强化学习等前沿方向，结合懂车帝业务特点开展技术预研与创新实验。

职位要求

1、计算机、人工智能、自动化、数学或相关专业，硕士及以上学历，1年以上NLP/大模型/智能体相关算法研发经验；
2、扎实的机器学习理论基础，深入理解Transformer架构及主流大模型（如LLaMA、Qwen、DeepSeek、GPT系列）的训练与推理机制；
3、具备完整的LLM应用落地经验，熟悉 Prompt Engineering、SFT、DPO、RLHF 等技术路径，并有实际项目验证效果；
4、对智能体（Agent）技术栈有实践积累，包括但不限于：
- 基于CoT的任务分解与推理
- 多工具调用（Function Calling）与执行反馈闭环
- 自主规划（Planning）与状态记忆（Memory）机制
- 基于用户行为或模拟反馈的策略优化方法
5、熟练掌握Python，具备良好的工程实现与系统设计能力，了解服务端部署、模型监控与AB测试流程；
6、精通PyTorch/TensorFlow等框架，了解分布式训练、推理加速（vLLM/TensorRT-LLM等）、模型量化等优化技术；
7、具备优秀的逻辑思维、业务抽象能力与跨团队协作意识，能将复杂用户需求转化为可量化的技术方案；
8、加分项（优先考虑）
-有垂直领域（汽车、电商等）智能体或强化学习落地经验；
-在ICLR、NeurIPS、ICML、ACL、EMNLP等顶会发表过LLM、Agent或RL相关论文；
-熟悉多智能体协作、环境建模（World Model）或约束强化学习（Constrained RL）；
-参与过开源Agent框架（如LangChain、LlamaIndex、AutoGen）的二次开发或优化；
-具备大模型评估体系设计经验，尤其在事实一致性、工具调用准确率、任务完成率等维度有方法论沉淀。

投递

About Dcar

Industry

Unknown

Company Size

Unknown

Headquarters

Unknown

Year Founded

Unknown

Website

dongchedi.com

Social Media

Unknown