具身强化学习算法工程师
20000元以上
职位投递邮箱:zhangrongrong@simpleai.tech
工作地域:北京市
职位类别:科学研究人员
学历要求:硕士研究生 / 博士研究生
招聘人数:3人
发布时间:2026-03-06浏览量:147
* 专业要求:
计算机、数学、软件工程、人工智能、车辆工程、电子信息、自动化、控制等相关专业
* 职位描述:
| 【岗位职责】 1.负责机器人具身操作任务的强化学习算法开发,涵盖架构设计、数据处理、训练优化及真机部署,重点研究包括但不限于 PPO, SAC 等主流算法,以及模仿学习、VLA 等前沿技术; 2.主导或深度参与从模拟到现实的迁移技术研究,利用 Isaac Sim, MuJoco, Gazebo 等仿真平台训练算法,并通过域随机化、微调等技术提升算法在真实环境中的精度、鲁棒性和泛化能力; 3.持续跟踪具身智能与强化学习领域的前沿进展,进行技术调研、性能评估,并将先进算法理念应用于实际产品开发,推动技术创新; 4.负责算法相关数据采集、模型训练及效果优化。 【任职资格】 1.掌握强化学习核心理论,熟悉 DQN, PPO, SAC 等主流算法的原理与应用,对模仿学习、大模型与具身智能结合方向有理解者更佳; 2.熟练掌握 Python/C++,精通 PyTorch/TensorFlow 等深度学习框架,具备大规模模型训练与调试经验; 3.熟悉Transformer,Diffusion Model等主流架构,具备多模态大模型(VLM/VLA)预训练、微调等实践经验者优先; 4.具备优秀的代码能力,能够独立完成从算法设计、仿真验证到真机部署的完整闭环者优先; 5.在相关顶级会议或期刊发表过相关论文,或参与过大型机器人、自动驾驶项目者优先; 6.具备较强的技术文档撰写能力、团队协作精神及创新思维者优先。 |







北京深朴智能科技有限公司
招聘信息

津公网安备12010402000967号