永卓控股有限公司 Everrising Holdings

大模型数据飞轮实习生

永卓控股有限公司 Everrising Holdings  •  Onsite  •  14 days ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

大模型数据飞轮实习生苏州、上海校招实习硕士及以上职位描述1. 垂类数据资产建设,负责垂直领域高质量语料的采集、清洗、标注与质检,构建领域专属数据集(如专业问答对、SFT指令数据、RLHF偏好数据)
2. 探索自动化数据生成方案(如Self-Instruct、Evol-Instruct、Agent-based合成数据),提升数据生产效率
3. 构建数据回流链路,将线上用户反馈(点赞/点踩、修正建议、对话轮次)转化为模型训练数据
4. 设计A/B测试与数据效果评估方案,量化不同数据源对模型效果的贡献
5. 模型效果迭代支持,配合算法团队进行模型评测,包括通用能力评测与垂类专项评测,基于评测结果定位模型短板,针对性策划数据补充策略(Data-Centric AI)
6. 参与Prompt Engineering与RAG(检索增强生成)效果优化,验证数据质量对下游任务的影响
7. 工具链与流程优化,参与数据标注平台、数据可视化看板的搭建与优化,编写数据处理脚本,提升数据ETL流程的自动化程度职位要求学历与专业:
计算机、人工智能、数据科学、语言学或相关领域本科及以上学历在读
必备技能:
1. 熟练掌握Python,熟悉Pandas、NumPy等数据处理工具,具备SQL基础
2. 对大语言模型(LLM)有基本了解,使用过ChatGPT/Claude/Gemni等主流模型,理解SFT、RLHF等基本概念
加分项:
1.有数据标注、数据治理或LLM相关项目经验
2.熟悉LangChain、LlamaIndex等LLM应用开发框架
3.在GitHub上有LLM相关开源项目贡献或个人技术博客职位信息 部门: 上海卓跃 投递
永卓控股有限公司 Everrising Holdings

About 永卓控股有限公司 Everrising Holdings

Industry
Unknown
Company Size
Unknown
Headquarters
Unknown
Year Founded
Unknown
Social Media
Unknown