企业登录
当前位置:首页 > 学生 > 招聘信息
招聘信息
职位投递邮箱:campus@stepfun.com
工作地域:北京市 / 上海市
职位类别:工程技术人员
学历要求:硕士研究生 / 博士研究生
招聘人数:2人
发布时间:2026-03-12浏览量:30

* 职位描述:

负责Model Architecture的研发、优化和创新包括Attention、MoE等架构的改进,以及全新架构的探索

负责下一代预训练范式的研究和创新,推动该技术的Scale up

从算法角度推动大模型训练和推理的低成本化包括优化器的改进、量化、投机采样等技术研究通用智能的本质,设计和迭代通用智能的评估和观测方法,从而指导下一代范式的演进

负责大语言基座模型代码、数学、Reasoning能力的提升,系统性的增强模型的能力,实现数据飞轮