Job Description
大模型算法实习生-AI算法上海、北京社招实习互联网 / 电子 / 网游职位描述1. 承担基于GPT系列或者其他开源大模型的开发和调优工作,包括Pretrain,指令微调、Prompt工程以及面向下游任务的效果优化等
2. 完成大规模预训练模型在多种AI业务场景中的应用落地,支持业务目标提升
3. 紧跟业界大模型进展,探索前沿技术,包括LLM、SFT、强化学习等
4. 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案职位要求1. 有大语言模型(LLM)预训练/微调经验,熟悉相关技术细节和优化策略,如大规模语料收集、模型调优优化、自弱监督学习、强化学习等
2. 具有扎实的算法理论基础,熟练掌握自然语言主要算法模型,如实体识别、知识抽取等。熟悉主流大模型,如ChatGPT/T5/PaLM/LLaMA/GLM/BaiChuan等,对模型背后的原理和各自适用场景有深入的理解
3. 有基于Tensorflow、PyTorch等深度学习框架的实战项目经验
4. 熟悉DeepSpeed或Megatron等框架的性能优化原理,了解其实现
5. 具备较强的团队协作能力和沟通能力,有较强的学习能力和业务分析及问题解决能力
6. 良好的paper阅读习惯和实现能力
加分项
1. 具有生成式模型训练及开发经验优先
2. 有海外留学背景者优先,博士优先
3. 有NLP、多模态研发背景,有智能对话、开放域对话机器人相关领域应用有深入理解的优先
4. 对大规模预训练语言模型技术现状和发展趋势有深刻的理解和认知,并对相关技术有极高的热情
5. 发表过大模型相关研究AI顶会论文优先
6. 具备有良好的代码开发能力,有开源项目开发经验优先
7. 每周到岗4天及以上,半年以上优先
投递