Job Description
大模型算法框架实习生北京实习互联网 / 电子 / 网游职位描述大模型算法适配与优化:参与主流大模型(如Llama、GPT等)在国产芯片上的算法适配和性能调优,包括模型结构优化、算子优化等;
推理与训练工程优化:对大模型的推理和训练过程进行工程化优化,提升性能、降低资源消耗,包括但不限于模型量化、剪枝、蒸馏等技术的应用;
国产芯片适配:大模型推理、训练框架(如Megatron、DeepSpeed等)在国产芯片上的适配与优化,解决兼容性问题,充分发挥硬件性能;
微调工具链开发:根据不同行业场景需求,设计并实现高效的大模型微调工具链,包括数据预处理、参数配置、效果评估等功能模块;
技术方案设计与评估:参与大模型相关技术方案的制定,进行技术可行性评估和性能测试,撰写技术文档。
职位要求计算机科学、人工智能、自然语言处理或相关专业本科或硕士在读,每周到岗4-5天,实习3个月以上
熟悉至少一种主流深度学习框架(PyTorch优先),熟悉深度学习模型开发全流程;
熟悉大模型训练和推理框架,如Megatron、DeepSpeed、vLLM、TGI、Transformers等;
具备良好的编程能力,熟练掌握Python/Go/Java/C++,有良好的代码风格和工程实践;
出色的问题解决能力和技术攻关能力,具备owner意识,能够独立负责技术模块并推动问题解决;
良好的团队合作和沟通能力,能够与跨职能团队高效协作,推动项目进展。
【加分项】
有国产芯片(如昇腾、寒武纪、海光等)上的模型适配和优化经验者优先;
熟悉模型压缩、量化、蒸馏等相关技术并有实践经验者优先 投递