职位搜索 这里有全国各地的职位、总有一个适合您 首页 > 社会招聘 > 职位搜索

职位名称:大模型应用开发工程师

  • 招聘人数:1人
  • 有效期:长期招聘
  • 学历要求: 大学本科
  • 经验要求: 3-5年
  • 薪酬范围: 面议

工作职责:

职位描述: 
1.负责推理框架开发,适配内部自研NLP/CV/LLM等模型架构,开发针对物流场景的高性能推理框架;
2.负责模型推理加速研究,包括但不限于模型量化、蒸馏、剪枝、算子优化、投机采样、PD分离等加速手段;
3.负责模型训练优化算法的研究与开发,运用数据并行、模型并行、通信优化等前沿技术,提升模型训练速度及效率;

岗位要求:

1.本科及以上学历,计算机、通信及相关专业,2年以上工作经验;
2.深入理解Tensorflow/PyTorch等主流框架的架构设计及优化技术,熟悉模型压缩技术,如剪枝、量化、知识蒸馏等;
3.熟悉vLLM、SGLang、TensorRT-LLM等大模型推理框架,熟悉 GPU 和其他加速硬件的使用,有相关的性能调优经验,如FastTransformer、TensorRT、triton等;
4.熟悉LLM模型训练优化,了解混合精度训练、分布式训练等训练加速方法优先;
5.有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先;
6.具备良好的沟通能力和团队协作精神,能够与不同背景的团队成员有效合作;
7.扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先。