职位描述: 1.负责推理框架开发,适配内部自研NLP/CV/LLM等模型架构,开发针对物流场景的高性能推理框架; 2.负责模型推理加速研究,包括但不限于模型量化、蒸馏、剪枝、算子优化、投机采样、PD分离等加速手段; 3.负责模型训练优化算法的研究与开发,运用数据并行、模型并行、通信优化等前沿技术,提升模型训练速度及效率;
1.本科及以上学历,计算机、通信及相关专业,2年以上工作经验; 2.深入理解Tensorflow/PyTorch等主流框架的架构设计及优化技术,熟悉模型压缩技术,如剪枝、量化、知识蒸馏等; 3.熟悉vLLM、SGLang、TensorRT-LLM等大模型推理框架,熟悉 GPU 和其他加速硬件的使用,有相关的性能调优经验,如FastTransformer、TensorRT、triton等; 4.熟悉LLM模型训练优化,了解混合精度训练、分布式训练等训练加速方法优先; 5.有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先; 6.具备良好的沟通能力和团队协作精神,能够与不同背景的团队成员有效合作; 7.扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先。