蜂媒艺信通
蜂媒担保通
蜂媒档期通
蜂媒招聘网
PHCAO招聘网
中国首个返利型人才网
工作区域:浙江-杭州-全杭州
学历要求:大学本科
岗位职责:1、从事多机多卡大模型推理领域中的研究及算法工程化实现;
2、负责CV或者NLP大模型微调优化以及微调工具研发,实现大模型在行业场景的应用落地;
3、解决大模型分布式推理的芯片迁移工作和结合芯片技术实现软硬件协同加速优化;
4、研究分析大模型推理的性能瓶颈,对系统推理性能进行profiling,协助软硬件设计和系统优化;
5、跟进前沿的大模型推理部署加速优化技术,保持技术的领先;
6、模型压缩技术研发,包括但不限于量化、剪枝、张量分析、知识蒸馏等;
7、负责大模型在国产信创技术栈的迁移以及落地。
任职资格:基本招聘条件
2025届应届生及2024届未就业毕业生。博士研究生学历,英语CET-4成绩达到425分及以上。计算机、数学、人工智能、通信、电子等相关专业。
能力素质及知识技能要求
1、熟悉分布式推理框架/调度pipeline,熟悉大模型分布式推理,了解流水线/tensor数据并行等各种技术,了解重计算的技术原理;
2、熟悉常用深度学习推理优化技术和算法,如压缩、剪枝、知识蒸馏等;
3、了解和熟悉模型各种并行策略,有大模型实际部署和优化的经验优先;
4、精通Python和C++1x,具备较强代码及工程实现能力,有基于Tensorflow,Pytorch,Mxnet等深度学习平台的算法开发经验;
5、熟悉DeepSpeed,Megatron等大模型框架,并了解各个功能模块底层实现原理优先;
6、模型训练能力扎实,精通模型结构CNN、Transformmer以及原理;
7.掌握rm、ppo等模型的实现细节,熟悉强化学习最新agent技术落地方案;
8、了解主流国产技术栈包括paddle、mindspore。
薪资福利:10K-15K
浙江省杭州市
申请职位前请扫描右侧二维码“发布简历”,上传图片及视频作品!
这样,我们的沟通效率会更高!
分享岗位信息还能赚平台返利奖励!