高性能优化实习生
职位描述
1、使用性能分析工具(如Nsight Systems/Compute, VTune, rocProf等),定位ABACUS在不同硬件(CPU/GPU/DCU)上的性能瓶颈与热点函数;
2、针对识别出的热点函数(如矩阵乘法、卷积、注意力机制等核心算子),开展深入的代码级优化;
3、设计并实现高性能并行计算方案,充分利用现代硬件的多核、向量化及大规模并行计算能力;
4、将优化代码集成到主项目,编写基准测试,验证性能提升效果并确保代码的正确性。
职位要求
1、本科及以上在读,专业背景为数学、计算机科学与技术等相关专业;
2、有并行优化的项目经历;
3、有实际GPU开源项目的贡献经历加分;
4、熟练掌握C++/CUDA、Git、Linux;
5、实习周期:6个月及以上,每周可到岗4天及以上优先,能长期实习者优先。
职位信息
投递