前Kimi后训练负责人宋鸿涌创业，聚焦通用机器人基座模型

2026年05月22日 08:30:00

大模型 RL 老兵Flood Sung 切入机器人赛道。

作者丨张贤

编辑丨马晓宁

AI科技评论独家消息，前月之暗面后训练与强化学习负责人宋鸿涌（Flood Sung）已于 2025 年 12 月离职，创立机器人公司「北京十六号机器人科技有限公司」（XVI Robotics），公司业务方向聚焦通用人形机器人基座模型。（本文作者长期关注机器人&具身智能赛道，欢迎添加微信交流：zhangxian2021）

企查查信息显示，北京十六号机器人科技有限公司成立于 2025 年 12 月。据公开信息显示，XVI Robotics 定位于构建大规模基座模型，使人形机器人能够理解、推理并在物理世界中行动。

宋鸿涌英文名 Flood Sung，在学术圈和 AI 社区知名度较高，是国内强化学习领域较早的系统性研究者之一，职业轨迹横跨游戏 AI、大模型后训练与机器人三个方向，构成了他入局具身智能的独特逻辑。

学术上，他在少样本学习（Few-Shot Learning）领域有奠基性贡献——2018 年于 CVPR 发表的《Learning to Compare: Relation Network for Few-Shot Learning》被引次数超过 6,000 次，是该领域的里程碑工作。他在 GitHub 上维护的深度学习论文路线图项目「Deep-Learning-Papers-Reading-Roadmap」，积累了超过 3.9 万颗星，是国内 AI 社区影响力最广的开源科普项目之一。

工程上，宋鸿涌从 2020 年到 2022 年在字节跳动 AI Lab 担任研究科学家，深度参与游戏 AI 中的多智能体强化学习研究，领导过 3D-MOBA 游戏项目中多智能体 AI 机器人的算法研究与落地；2023 年至 2025 年加入月之暗面（Kimi），担任后训练与强化学习 Lead，主导了 Kimi K1.5、K2、K2.5 等核心模型的 RL 训练体系搭建，是 Kimi 系列大模型 post-training 能力的核心推手。

宋鸿涌的创业方向，是目前具身智能领域中技术门槛最高、竞争最激烈、资本最看重的一个切入点。

所谓「通用人形机器人基座模型」，本质上是将大语言模型在数字世界的通用推理能力，迁移到物理世界的机器人控制任务中——让人形机器人能够在陌生场景中理解指令、感知环境、规划动作，不依赖场景特定的训练数据。这一路径的核心挑战，正好与宋鸿涌在 Kimi 积累的 RL post-training 技术高度吻合：如何让模型在稀疏反馈的环境中自我迭代、泛化到新任务。

据AI 科技评论了解，XVI Robotics 团队仍处于早期组建阶段，公司已获得知名机构的种子轮融资。公司相关的产品形态和商业化路径尚未公开披露，AI 科技评论将持续关注。

前Kimi后训练负责人宋鸿涌创业，聚焦通用机器人基座模型

亲爱的凤凰网用户:

第三方浏览器推荐: