具身智能模型推理优化工程师
20000元以上
职位投递邮箱:zhangrongrong@simpleai.tech
工作地域:北京市
职位类别:科学研究人员
学历要求:硕士研究生 / 博士研究生
招聘人数:4人
发布时间:2026-03-06浏览量:90
* 专业要求:
计算机、数学、软件工程、人工智能、车辆工程、电子信息、自动化、控制等相关专业
* 职位描述:
| 【岗位职责】 1.负责将具身智能大模型(尤其是 VLA/VLM 模型)在云侧(GPU 集群)和端侧(嵌入式平台,如 Orin, Jetson、昇腾等)的性能优化与部署工作,确保模型满足机器人等实体设备对实时性、功耗和可靠性的严苛要求; 2.运用专业性能分析工具,深入剖析模型推理全过程,精准定位计算、内存、通信等方面的性能瓶颈,并提出并验证有效的优化方案(如算子融合、内核优化、图形优化等); 3.负责研究和应用模型压缩与加速技术,包括但不限于量化(GPTQ、SmoothQuant 等)、剪枝、知识蒸馏,并熟练编写高性能 CUDA 算子或利用 Triton 等工具,极致挖掘 GPU/NPU 硬件算力; 4.与团队紧密合作,进行算法与系统的联合优化与协同设计;参与构建数据闭环管道,通过真实场景反馈持续迭代模型性能,并建设自动化的模型评测平台,跟踪推理延迟、功耗等关键指标。 【任职资格】 1.精通 C++/Python,拥有扎实的算法和数据结构基础,并深入理解深度学习及主流模型架构; 2.熟练掌握 GPU/NPU 高性能编程技术(如 CUDA, cuDNN),并拥有使用 TensorRT-LLM、vLLM、TVM、OpenVINO 等至少一种主流推理框架对模型进行加速和部署的实战经验; 3.熟悉 Transformer 架构及 PyTorch、TensorFlow 等深度学习框架,对模型量化、剪枝等优化原理有深入理解; 4.具备自动驾驶、机器人业务背景,有 NVIDIA Jetson 或华为昇腾等边缘设备开发经验者优先; 5.熟悉具身智能领域技术栈,如 ROS/ROS2、Isaac Sim/MuJoCo 等仿真环境者优先; 6.在相关顶级会议或期刊上发表过论文,或有大型模型成功优化部署至真实物理系统案例者优先。 |







北京深朴智能科技有限公司
招聘信息

津公网安备12010402000967号