大模型算法工程师(B端)- 懂车帝
职位描述
1、负责大语言模型(LLM)及智能体(Agent)在汽车垂类场景的端到端落地,覆盖AI销售、智能问答、购车决策助手、自动化内容创作等核心产品功能;
2、构建基于 工具调用(Tool Learning / Function Calling) 的智能体系统,实现多步骤任务规划、外部API调用与动态执行能力;
3、探索并应用 思维链(Chain-of-Thought, CoT)、自我反思(Self-Refine)、任务分解与自主规划(Autonomous Planning) 等机制,提升模型在复杂购车咨询、对比分析、故障诊断等高阶推理任务中的表现;
4、参与LLM强化学习优化链路建设,包括偏好数据构建、奖励模型(RM)训练、DPO/RLHF 策略迭代,持续提升生成内容的相关性、准确性与用户体验;
5、针对海量汽车文章、评测视频脚本、用户评论等多源异构数据,开展深度语义挖掘,支撑热点事件抽取、情感倾向分析、车型知识图谱构建等基础能力建设;
6、设计并维护可复用的NLP与Agent基础组件,如领域适配的摘要生成、细粒度情感识别、结构化信息抽取、RAG增强检索等;
7、与产品、工程、业务团队紧密协作,推动算法模型从实验到上线的全链路工程化落地,并建立科学的效果评估与迭代机制;
8、跟踪AIGC、智能体、强化学习等前沿方向,结合懂车帝业务特点开展技术预研与创新实验。
职位要求
1、计算机、人工智能、自动化、数学或相关专业,硕士及以上学历,1年以上NLP/大模型/智能体相关算法研发经验;
2、扎实的机器学习理论基础,深入理解Transformer架构及主流大模型(如LLaMA、Qwen、DeepSeek、GPT系列)的训练与推理机制;
3、具备完整的LLM应用落地经验,熟悉 Prompt Engineering、SFT、DPO、RLHF 等技术路径,并有实际项目验证效果;
4、对智能体(Agent)技术栈有实践积累,包括但不限于:
- 基于CoT的任务分解与推理
- 多工具调用(Function Calling)与执行反馈闭环
- 自主规划(Planning)与状态记忆(Memory)机制
- 基于用户行为或模拟反馈的策略优化方法
5、熟练掌握Python,具备良好的工程实现与系统设计能力,了解服务端部署、模型监控与AB测试流程;
6、精通PyTorch/TensorFlow等框架,了解分布式训练、推理加速(vLLM/TensorRT-LLM等)、模型量化等优化技术;
7、具备优秀的逻辑思维、业务抽象能力与跨团队协作意识,能将复杂用户需求转化为可量化的技术方案;
8、加分项(优先考虑)
-有垂直领域(汽车、电商等)智能体或强化学习落地经验;
-在ICLR、NeurIPS、ICML、ACL、EMNLP等顶会发表过LLM、Agent或RL相关论文;
-熟悉多智能体协作、环境建模(World Model)或约束强化学习(Constrained RL);
-参与过开源Agent框架(如LangChain、LlamaIndex、AutoGen)的二次开发或优化;
-具备大模型评估体系设计经验,尤其在事实一致性、工具调用准确率、任务完成率等维度有方法论沉淀。
投递