大模型算法实习生
职位描述
1. 基于 LLM / VLM / VLA 等基础模型,探索面向仪器任务的规划与决策能力,并形成可验证的技术路线。
2. 负责数据与评测体系:构建训练数据、离线评测与回归机制,推动可量化迭代。
3. 负责微调与对齐:具备 SFT / 参数高效微调等实战能力,提升任务成功率与稳定性。
4. 负责 RL 实践:设计奖励与反馈闭环,推进策略优化在真实任务中的有效性。
5. 与工程团队协作:推动模型在真实系统中的可部署、可监控、可迭代。
职位要求
1. 计算机/人工智能/自动化等相关专业本科及以上学历。
2. 有大模型微调实战经验(从数据到训练到评测闭环)。
3. 必须具备 RL 实际经验(能跑通训练、理解奖励/稳定性/调参方法)。
4. 熟练 PyTorch 等框架,具备良好的实验设计与复盘能力。
5. 自驱强:能主动提出假设、设计实验、快速迭代并推动落地。
职位信息
投递