
大模型 RL 老兵Flood Sung 切入机器人赛道。
作者丨张 贤
编辑丨马晓宁
AI科技评论独家消息,前月之暗面后训练与强化学习负责人宋鸿涌(Flood Sung)已于 2025 年 12 月离职,创立机器人公司「北京十六号机器人科技有限公司」(XVI Robotics),公司业务方向聚焦通用人形机器人基座模型。(本文作者长期关注机器人&具身智能赛道,欢迎添加微信交流:zhangxian2021)
企查查信息显示,北京十六号机器人科技有限公司成立于 2025 年 12 月。据公开信息显示,XVI Robotics 定位于构建大规模基座模型,使人形机器人能够理解、推理并在物理世界中行动。
宋鸿涌英文名 Flood Sung,在学术圈和 AI 社区知名度较高,是国内强化学习领域较早的系统性研究者之一,职业轨迹横跨游戏 AI、大模型后训练与机器人三个方向,构成了他入局具身智能的独特逻辑。
学术上,他在少样本学习(Few-Shot Learning)领域有奠基性贡献——2018 年于 CVPR 发表的《Learning to Compare: Relation Network for Few-Shot Learning》被引次数超过 6,000 次,是该领域的里程碑工作。他在 GitHub 上维护的深度学习论文路线图项目「Deep-Learning-Papers-Reading-Roadmap」,积累了超过 3.9 万颗星,是国内 AI 社区影响力最广的开源科普项目之一。
工程上,宋鸿涌从 2020 年到 2022 年在字节跳动 AI Lab 担任研究科学家,深度参与游戏 AI 中的多智能体强化学习研究,领导过 3D-MOBA 游戏项目中多智能体 AI 机器人的算法研究与落地;2023 年至 2025 年加入月之暗面(Kimi),担任后训练与强化学习 Lead,主导了 Kimi K1.5、K2、K2.5 等核心模型的 RL 训练体系搭建,是 Kimi 系列大模型 post-training 能力的核心推手。
宋鸿涌的创业方向,是目前具身智能领域中技术门槛最高、竞争最激烈、资本最看重的一个切入点。
所谓「通用人形机器人基座模型」,本质上是将大语言模型在数字世界的通用推理能力,迁移到物理世界的机器人控制任务中——让人形机器人能够在陌生场景中理解指令、感知环境、规划动作,不依赖场景特定的训练数据。这一路径的核心挑战,正好与宋鸿涌在 Kimi 积累的 RL post-training 技术高度吻合:如何让模型在稀疏反馈的环境中自我迭代、泛化到新任务。
据AI 科技评论了解,XVI Robotics 团队仍处于早期组建阶段,公司已获得知名机构的种子轮融资。公司相关的产品形态和商业化路径尚未公开披露,AI 科技评论将持续关注。