Job Description
大模型应用算法工程师北京全职互联网 / 电子 / 网游职位描述【大模型应用算法工程师】—— 驱动生产力变革的AGI探索者
我们正在寻找一位对大模型技术充满热忱、追求极致的应用算法工程师,与我们共同探索大模型在生产力场景的无限可能,驱动下一代智能应用的诞生。
你将有机会:
主导大模型全生命周期技术攻坚:深度参与并大模型微调(SFT/LoRA等)、对齐优化(DPO/RLHF等)全流程,以极致技术追求,不断突破模型性能、效率与鲁棒性的边界,攻克训练与推理中的核心技术瓶颈。
定义下一代生产力应用算法范式:独立设计并推动大模型在对话系统、内容生成、智能Agent、端侧多模态等前沿生产力场景的算法方案落地,持续优化准确率、生成质量等核心指标,打造用户极致体验。
引领技术前沿探索与创新:敏锐洞察并持续跟踪NLP/LLM领域顶会动态及开源进展,主导Transformer架构改进、多模态融合、AI Agent等前沿技术的探索与预研,将最前沿的技术转化为产品创新的核心驱动力。
驱动技术价值规模化实现:与产品、工程等团队高效协同,清晰输出技术方案与实施路径,推动大模型产品从原型验证到规模化商用的全流程落地,实现技术价值的最大化。
职位要求我们期望你具备:
必需项:
硬核编程与框架驾驭能力:精通Python,熟练掌握PyTorch/TensorFlow等深度学习框架,并具备框架底层调优(如算子优化、分布式配置优化)的实战经验。
深厚的NLP与LLM理论功底:拥有扎实的自然语言处理基础,深入理解Transformer及主流LLM(如GPT、BERT等)的原理与细节,具备出色的模型设计与优化能力。
丰富的大模型研发与落地经验:3年以上大模型研发经验,作为核心成员主导过至少1个完整的大模型从研发到落地的项目,熟悉其中的关键挑战与解决方案。
卓越的技术攻坚与问题拆解能力:具备复杂技术问题的系统性拆解能力,能够快速定位并有效解决模型训练、调优或落地过程中的各类瓶颈与难题。
出色的跨团队沟通与协同能力:拥有优秀的跨团队沟通技巧,能够清晰、准确地传递技术方案与进展,有效推动多方协同,确保项目高效落地。
加分项(若你拥有以下特质,将更具优势):
学术影响力或开源贡献:在NLP/LLM相关顶会(如ACL, EMNLP, NeurIPS, ICML等)发表过高质量论文,或为LLaMA、Alpaca等知名开源项目做出过核心贡献。
大规模分布式训练实战:具备DeepSpeed、FSDP等分布式训练框架的大规模实践经验,熟悉千亿级参数模型的训练策略与优化技巧。
跨模态或Agent架构经验:拥有跨模态大模型(如视觉-语言模型)或AI Agent(如LangChain等)的架构设计与实际落地经验。
如果你对技术有极致追求,渴望将前沿大模型技术转化为改变生产力的实际应用,并乐于在充满挑战与机遇的环境中快速成长,那么我们期待你的加入,一同用技术创造未来! 投递