姚顺雨汤道生对话实录:总办老板们很诚实,AI下半场刚开始,腾讯不慢
科技
科技 > 人工智能 > 正文

姚顺雨汤道生对话实录:总办老板们很诚实,AI下半场刚开始,腾讯不慢

在今日举办的2026年腾讯云AI产业应用大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,与腾讯首席AI科学家姚顺雨进行对谈,对话涉及姚顺雨加入腾讯的原因、腾讯AI的现状、对Agent、AI下半场的看法等等。

值得注意的是,汤道生在问姚顺雨问题时,频繁使用“您”,而不是你,足见对姚的尊重。

汤道生首先总结了腾讯AI的整体进展:腾讯 AI 全面提速,聚焦打造好用的 AI,加大人才引进,推动组织升级,在各层面取得阶段性进展。

接着引出了姚顺雨,他介绍姚顺雨称,其在学术界提出过ReAct框架,也在 Openai 参与过 operator、deepresearch 等前沿的 agent 产品。

姚顺雨表示平时都是在海淀区,很少来朝阳区。

对于AI下半场,他认为更加重要的是怎么去解决问题,去寻找好的方法,现在方法论已经变得非常成熟,寻找问题变得更加困难。有了预训练和后训练之后,像有了一个万能的锤子,它可以去砸任何钉子,它是一个通用的方法论,可以去解决各种各样的问题,那么反而更困难的是怎么去寻找好的问题去解决。

加入腾讯很重要的一点就是,这里有很多好的问题,有很多很多产品。

姚顺雨表示,加入腾讯最重要的原因是文化,在跟腾讯总办的老板们聊天的时候,第一印象就是大家都非常的诚实,哪里做得好,哪里做得不好,都非常直白,就是不会去掩盖。

“这种坦诚是第一印象,然后我觉得第二个我觉得腾讯总体是一个基于 trust 而不是基于 metric 去运转的公司,我觉得这一点对于做 AI 是非常重要的。”

对于腾讯在AI上动作慢了,姚顺雨认为AI会是个长期游戏,从某种程度来说,下半场才刚刚开始,不认为ChatGPT和Claude code会是唯一的super APP,那会是一个非常灰暗的世界,肯定会有源源不断的新的机会的诞生,可能今天就像是七十年代PC刚刚产生的时候,还有很多很多事情需要做。

第二个判断就是说它会是个更线性,还是个多元的游戏。多模态具身智能很多很多新的事情都在发生或者刚刚发生。所以从这角度来说,那如果认为下半场的刚开始,那可能确实不是慢。

汤道生则认为,大家对于腾讯经常喜欢挑某一个点来批评,但也很欢迎大家提更高的要求。在这样的一个复杂的组织里面,有些地方可能我们做的快了,有些地方做的慢了,有些地方可能会做失败在探索,所以觉得这些提醒都非常好。

“觉得确实有些地方我们是可以做得更好,但就像你说的,这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景。比如今年年初对龙虾这一波热潮也反应比较快,同时也有像workbody这样的一个智能体产品,也能比较快的去应对。”

以下是二人对话实录:

汤道生:我简单介绍一下,顺雨在学术界提出过 ReAct的框架,也在 Openai 参与过 operator、deepresearch 等前沿的 agent 产品。

加入腾讯以来,他主导的混元大模型既懂前沿技术,也能扎根一线。相信会带来不一样的洞察,我们欢迎顺雨。

有请腾讯首席 AI 科学家、腾讯混元大语言模型及 AI Infra 负责人姚顺雨先生。

好,非常欢迎顺雨,你要跟大家说个 hello 吗?哈哈。

姚顺雨:大家好,我平时都是在海淀区,现在很少来朝阳区。对,很高兴。

汤道生:我看计时器已经开始了,所以我的我们就直奔主题,直接交流吧。

那今天的我们两个对话可能是一个比较新的形态,如果有什么这个出乎意料的,我想也是给大家一个惊喜。

那顺雨你加入腾讯之前,我记得当时我还问过你一些问题,为什么会选择来到腾讯?而且你认为 AI 的下半场最重要的是什么?

姚顺雨:对,我觉得我想先首先解释一下什么叫做下半场,因为我最近感觉这个词有点被滥用了。哈哈,对,就是这个概念,其实是我去年的一个博客里面提出来的。

什么意思呢?其实我觉得在可能去年之前 AI 已经发展了几十年,但是更加重要的是怎么去解决问题,去寻找好的方法,但是最近我觉得很明显的就是说方法论已经变得非常成熟,寻找问题变得更加困难。

我举个例子,比如说过去,比如说我们做下围棋,对吧?

我们会发明像阿尔法狗这样的一个方法,但这个方法它可能只用来适合下围棋或者下各种棋类。

你会为了翻译做一个这个特别的模型,但是它可能只能用来做翻译,不能做其他事情,但是有了预训练和后训练之后,我们发现我们像有了一个万能的锤子,对吧?

它可以去砸任何钉子,它是一个通用的方法论,可以去解决各种各样的问题,那么反而更困难的是怎么去寻找好的问题去解决。

所以其实我觉得加入腾讯很重要的一点就是说这里有很多好的问题,有很多很多产品,然后我觉得这一点会在接下来变得越来越重要。

其实一方面好的产品能够解决第一个问题,就是说我们做了这样的好的,我们做了预训练和后训练之后,我们到底要把它应用在什么样的地方产生价值?

第二就是说环境是非常重要的,如果没有好的环境,那 agent 就没有办法去做各种各样的事情。

比如说如果你没有一个这个点外卖的这个 to 的话,那你就没有办法去点外卖,那很多事情你做不到,但是我觉得可能最重要的是 context。

其实就是无论是企业还是个人,就像我上一次在这个 AGI next 说的一样,我觉得越来越重要的事情是 context,因为模型越来越擅长把一个非常复杂的输入变成一个输出。

那很多时候你的竞争壁垒就在来自于你有没有那个最原始的输入,你知不知道这个人他到底在干什么?你知不知道这个企业的这个各种各样的信息?

姚顺雨:那这一点的话,我觉得腾讯有非常强的优势,但其实我觉得这个只是第二大的原因,我觉得其实最重要的原因是文化,我还记得我第一次跟你聊天的时候,包括和就是很多其他总办的老板们聊天的时候,我第一印象就是大家都非常的诚实,就是哪里做得好,哪里做得不好,都非常直白,就是不会去掩盖。

然后就说,哎,我知道我这里做好,我知道我这里不知道,我知道这里应该怎么做,我不知道哪里应该怎么做,我觉得这种坦诚是我的第一印象,然后我觉得第二个就是说我觉得腾讯总体是一个基于 trust 而不是基于 metric 去运转的公司,我觉得这一点对于做 AI 是非常重要的。

然后包括我觉得我们的这个文化其实有非常 low ego(低自我)这一面。然后我觉得这些文化都是可能对于长期来做一个 AI 的这个组织是非常重要的,包括我们对长期主义的这种坚持。

姚顺雨:所以 AI 下半场最重要的是什么?

我个人的目标我觉得就是我,我们应该在中国建立一个长期的基于 AGI 的这样的一个组织。

那我觉得今天的 AI 其实主要有三个部分,首先是 foundation 的部分。我们怎么样去把预训练和后训练这种最基础的东西做的非常 solid。

第二部分是产品,我们怎么去把这样的技术真的为人和社会产生价值?

第三就是 Frontier 我们怎么去探索新的研究的范式,探索新的机会?

其实我觉得最重要的就是说我们要构建一个非常均衡的这样的一个三角形一样的组织。那我觉得对于做 foundation 来说最重要的其实就是第一需要充足的资源,第二就是需要正确的做事的方式,这其实跟我刚刚说的文化的一点也是吻合的。

那对于产品来说,我觉得就是有好的产品的 sense,有这种做产品的经验是至关重要的。

那第三,我觉得就是说在中国,我们今天可能所做探索还不够多,所以我也希望就是能把这种 Frontier exploration 的精神能更多的注入到我们组织中。

汤道生:你提到的跟总办聊的过程中感受到的这个真诚或者务实,其实也是经常我跟客户交流得到的反馈,我觉得我们的做事的方式、做产品的理念其实也是比较实事求是的,毕竟 AI 赛道还是一个长跑,我觉得。

有时候认知其实也很重要,对吧?我们做的好的,哪些做的不好的也得认,但关键这是一个多维度的一个一个竞赛。

我们看到现在模型有很多的进步,我们做产品其实也是有越来越多的形态,不同的场景有不同的需求,我觉得未来还是非常可期的,我觉得。

汤道生:那您刚提到模型跟产品可以说提供了一个环境,里面有要给模型提供 context 上下文,那我想问一个问题,也许我们平时开会提的有一个词,比较多的是 co-esign 怎么把产品跟模型能够比较紧密的结合起来,尤其今天有这么多丰富的产品。

从我们合作非常紧密的像元宝这样的一个聊天机器人,包括 AI 搜索企业里面也有部署一些企智能客服、智能营销,另外最近非常火的这个类龙虾的,像 codebuddy、workbuddy 这样的一个产品,其实对与模型的能力依赖很深,你怎么去思考 co-design 这个方式?

姚顺雨:对,我觉得有三点,首先 co-design前提就是说模型本身要做的很 solid。

有很多 foundational work 要做好,那其实首先我觉得预训练是一个相对就是产品 agnostic 的事情,然后他做的非常 solid 可以提供一个非常强的 foundation,而且预训练它最大的特点就是它是一个可泛化的学习的过程。

就它的进步是可以,就是带给各种各样下游的任务都以这个持续的这个价值的提升,那后训练的话,其实我觉得最重要一点是要设立好正确的eval(评估) ,我觉得中国可能大家有个不好的倾向,就是比较喜欢刷榜,但是。

我觉得就是如何实事求是的基于产品、基于真正的应用去构造更加真实的 eval 。

那我觉得这个首先你要有好的产品出口,第二就是说你要意识到就是说可能实用性的价值是大于这个刷榜的价值。

那其实这一点的话,我们做大量的工作,就是说跟各种各样的产品进行了深度的 co-design,我觉得 co-design其实很关键的一点就是要产生相互的信任,这点其实我们也做了大量这个工作去取得互信。

姚顺雨:那怎么把产品的数据用好?怎么把这种回流?怎么把 eval 做好?

我觉得这有很多细节我就不赘述,但我觉得第三点,我想说的就是说我觉得 LM 时代和过去的 AI 最本质的区别就是泛化性,就是在 LM 之前,比如说你做一个翻译的产品,你只要把翻译的数据做特别好就行了。

你做一个围棋的程序,你只要把围棋的数据准备特别好就行了。

但是今天即使你想就只做一个 coding agent,你发现其实需要的也不仅仅是 coding agent 数据,你需要非常好的聊天能力,非常强的搜索能力,非常强的指令遵循能力,非常强的推理能力,它其实是一个非常复合的 data 的 taxonomy。

姚顺雨:我觉得需要对这事情有 taste,那我觉得这个事情的一个推论就是说其实有很多产品的这样的一个体系化的地方,其实会有一个比较大的优势,比如说我们和元宝的co-design可以使我们模型产生很强的聊天和搜索能力,但这样能力可能又可以被迁移到 ima 或者 work Buddy 这样的其他的产品,所以这些产品它能够提供不同的数据,但这些数据之间又可以相互泛化,它形成一个像网络一样的体系。

我觉得这一点的价值会越来越重要。

汤道生:对对对,我其实外部的刷那个榜其实也是属于 Eval 的一种,所以我们内部做 Eval 跟外部的这种榜有什么区别?

姚顺雨:我觉得就是首先这些 Benchmark 还是有它的价值,不是说它完全没有价值,我觉得只是说现在这些榜非常容易 saturate,那我觉得基于真实世界的数据有几个帮助,首先就是你能发现模型的很多底线问题,实际上我觉得我们想要就是发一个 Preview 模型,最重要的目的之一就是我们希望能获得真实世界的反馈。

来修复各种各样的,就是榜单中文没法发现的这些底线问题,那我觉得这一点会在正式版上面有一个非常大的改进。

那第二点就是说你对真实的 prompt distribution 有一个更深的了解,那我举个例子,比如说奔驰 bar 上面的这些题目,可能它都是非常精确的,就是它有非常长的这种 concrete description,然后它可能一般来说是个单轮的这样的一个问题。

姚顺雨:那第三就是说我觉得甚至我们可以在这些产品上面获得一些灵感,去推进现在可能还没有的榜单,或者没有的领域的这样的推进。

比如说我们最近做了很多 context learning 的工作,我觉也是跟元宝派给我们的启发很有帮助,所以我觉得这个产品和这个模型的互相成就是越来越重要的一个 AI 的话题。对。

汤道生:我记得我们在早期做元宝的时候,还碰到多伦遵循的问题,好像在使用产品,大家这种迭代 Prom 的方式跟 Benchmark 也好像有些差异,真正在产品里面大家使用所需要的能力确实好像跟 Benchmark 是还蛮大的差异的。

姚顺雨:我,你问了我这么多问题,我也问一点你。

汤道生:欢迎欢迎。

姚顺雨:对,其实我记得我第一次跟你聊的时候,你给我讲了很多你过去的经历,对吧?就是从 QQ 空间、QQ 秀的时代,一直到,哈哈哈。

我小学时候最喜欢的这个产品。

汤道生:你说是老登子,是吧?

姚顺雨:到 QQ 到音乐,到这个云,到现在的元宝到,ima,其实跟你聊天很有意思,因为你做过各种各样的产品,然后 ToC 的也有,ToB 的也有,就是远古时代的也有这个,最近的这个 AI 时代的产品也有,那我其实比较好奇,就是说你觉得你做产品的第一性原理是什么?

你觉得哪些经验或者价值是不变的?哪些东西变了?

汤道生:我觉得其实最终做产品还是奔着到底用户有什么需求,我怎么去解决他的痛点,怎么去给用户或者客户创造价值,这在不同的时代,你最后甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。

所以我倒觉得从 PC 互联网时代,我们做空间、移动的时代,做各种各样的产品、内容的产品,到产业互联网做云,其实你我们也要花好多的时间精力去听客户的声音,尝试去帮助他们去解决他的问题。

底层的逻辑其实没有这么大的变化,但确实我觉得在 PC 互联网、移动互联网时代做产品,跟今天在 AI 时代做产品还是有蛮多不一样的地方。

汤道生:首先我觉得从范式的角度来看,在 AI 时代以前,我们做产品很多时候想的是通过功能来满足用户的需求,你作为一个产品提供方、服务提供方,你想清楚我提供怎么样的一个能力,让用户可能通过界面,通过某些菜单去选,好像是一些预制菜,你只能在里面去点一样。

但在 AI 时代做产品,它的那种开放式的服务形态就会带来很不一样的要求跟挑战。

用简单的交互方式,可能是自然语言,可能是语音,其实作为产品方,你也不知道用户会问什么,所以要充分利用模型能力去理解用户的需求,然后通过比如今天大模型的这种能推逻辑推理,能去调用工具的能力产品,去给模型提供各种各样它可以用的工具来应对这种开放式的需求。

这个是我觉得跟我们过去做产品很不一样的地方,甚至包也包括你刚刚提到的 Email。

汤道生:以前我觉得做产品我们有很清晰的 specification,有很清晰的这个产品的这个细节功能的描述,那怎么去做设计?基于做研发怎么去测试?

我觉得那个瀑布式的流程也比较清晰。

但在做 AI 产品,我发现最大的变化是我们整个流程可能都要重新设计,尤其今年这个大部分的代码都由 AI 生成,我们的工程师可能花会花更多的时间去做设计架构的设计,把写代码的工作可能都交给 AI 了,然后定期去指导一下,修正一下。

有环境有我们对于这些开放式答案的一些要求,甚至 alignment 怎么对齐用户,我们用户所需要的那种风格,我感觉今天 AI 时代做产品其实要求的能力更全面。

姚顺雨:更难了哈。

汤道生:是。

汤道生:那我又问你一下混元 3,就大家都在说混元 3 preview 是混元 3 的,是你的腾讯的首秀,具体混元 3 做了什么改变,你能给大家介绍一下吗?

姚顺雨:其实我觉得没有什么秘密,就是今天做大模型从某种程度来说是一个比较 trivial 的事情,就是说我们应该把 infrastructure 做好,我们应该把数据做好,算法的部分其实反而是比较简单的,其实我觉得主要几个点,第一就是说。

我们把这个 infrastructure 进行了重建,无论是预训练还是强化学习。

第二就是说我们把数据和 eval 做了很多大的改变,如何去定义更真实的问题?如何去丰富这个 data 的 taxonomy?如何去提高数据的质量?

这是个永无止境的追求,其实那第三的话,我觉得很重要的很多决策,其实包括怎么去招人,怎么去设计,这个模型的节奏怎么样?

姚顺雨:每天有很多这个 decision,要考虑很多 trade off,我觉得可能没有一个很清晰的公式,可能我觉得是一个很 taste driven 的事情,所以我其实想挺好奇想问你一个问题的,因为你刚刚跟我讨论就是 code design 这个概念,我其实也很好奇,就是你对 code design 这件事情是怎么想的?

就说你觉得哪些事情应该是模型应该做的,哪些东西应该是产品应该做的?

汤道生:我觉得 co-design 在不同阶段过去这两年其实是一直在变化的,我觉得这个变化某种程度来讲是随着模型能力的升级而变化。

当然整个行业市场用户的需求,它在变化的过程中也会带来我们两边模型跟产品需要更好去满足。

给我一个比较深的感受是怎么去对齐,因为在我们一起去做产品,去做 alignment,对齐会的时候我们有很多不同的角色,对吧?

产品可能要针对某个方向去解决一些问题,模型到底怎么去做满足这个需求?但同你要回到模型需要数据应该怎么标注?到什么颗粒度?到底什么是好的标注,什么是不好的标注?

汤道生:因为有些地方要奖励,有些地方要惩罚,然后还有仪表,对吧?

还有这个评测,因为如果产品认为好的产品体验评测是不认同的话,那大家其实做出来的产品就会不一致了,所以扣第三给我的感觉更多的是在项目组里面。

不同的角色,他参与到这个产品的设计,订立了定了一些产品的目标方向,怎么让多个角色能够对于一些开放式问题有比较好的对齐,如果没有做到这样的一个对齐的话,那你会发现用那个产品的行为会不可预测,甚至有时候会有一些随机性,因为模型在训练的过程可能也被混淆了,所以这个是我。

汤道生:这两年跟做产品,跟模型团队做 co-design 的一个一个比较深的感受,您觉得呢。

姚顺雨:对,其实我是觉得就像刚刚说的,我觉得首先最难的一点就是要建立 trust,并且我觉得同理心很重要,因为说到底就是说做模型的这个目标和做产品的目标有很多 align 的部分,也有很多不 align 的部分,对吧?

就是说模型的人他会希望,诶,我这些这个能力越强越好,但是产品的人他可能希望用户的需求满足的越好是越好,所以天然有很多不 align 的部分,那我觉得可能很重要一点,就是要有这个换位思考的能力。

第三,其实一个很重要的细节是我们当时是如果你还记得的话,我们当时其实派了后训练最强的骨干力量去帮助元宝,先把 deepseek 的这个后训练先做好,因为在那个时候我们自己的那个预训练还没有 ready。

但是我们知道就是说维护这样的产品以及它的 DAU 会对于我们接下来做模型也变得非常重要。而且会对于长期的合作非常重要,所以当时其实很多算法同学不理解,然后我需要去很努力的解释,但我觉得现在看起来就是这些努力都是 pay off,对吧?

姚顺雨:就是说我觉得这样的一个动作就是让产品和意识到,就是说模型的同学是真的在为产品着想,那我觉得这个其实对于就是我们这个之后的合作,包括混元 3 Preview 在元宝上成功的上线起到非常重要的作用。

当然有很多技术的部分可以探讨,但我觉得可能最难的部分其实反而是怎么样去建立信任,怎么样换位思考。

汤道生:对对,非常认同。

那我换一个话题,你是 react 架构的提出者,博士研究也是围绕着语言智能体展开的,那你几年前的一些观点到今天兑现了吗?比如有哪些?

姚顺雨:对,那天我还挺感慨的,因为我重新读了自己的博士论文,感觉又回到了一个这个很远古的时代,就是我的博士论文的 top,那个 title 叫做 language agent from next token prediction to digital automation。

汤道生:那是哪一年呢?

姚顺雨:19 年,7 年前。那个时候 literally 就是我们的,就 GPT2 那个时候。他当时只能做 next TOKEN prediction,而且他产生的可能一段话还不太连续。

所以当时人们是很难想象到,就是说它会有一天成为一个改变世界的力量。当时我觉得可能大家做的研究稍微有想象力的一些会做一些研究,比如说自动驾驶,然后这样的话如果你坐在车里,它会回到北京。那虽然它是一个有局限的事情,但大家其实当时就非常开心了,觉得这个技术很有意思。

当时我的想象力可能比较狂野吧,就是我觉得GPT是个非常优美的东西,就是预测下一个Token是一个非常极简而且非常通用的事情。然后我觉得它有一天潜力不仅仅是在于预测下一个Token,而是在于把这个世界上所有的事情全部做透。没错。当然我当时想的可能还不够大,我想的是具体的应用都没选,但是现在看起来也有可能是AGI。

那我觉得其实我今天主要做的两部分。第一部分就是如何建立一个方法论,如何把一个Next Token Prediction的机器变成一个自动化的机器,那其实就像你说的最重要的一篇工作可能是ReAct。我还记得就是22年7月份的时候,某一天晚上就是我当我把第一次,我记得当时是Python API和我当时自己手写了一个Web Crawler的API连在一起,然后它第一次可以基于网页回答问题,然后并且多轮交互的时候,我当时感觉就像那个微弱的电灯丝突然亮了的感觉一样。就是我感觉这个OK就好。

据我所知,这可能是第一次人类把AI和真正的互联网连在一起,并且去做这种动作的交互。我当时的感觉就是OK这个感觉可能五年或者十年会改变这个世界,但是可能比我想象中还要更快。包括我记得当时我们技术随便是来第二次、第三次迭代的时候,我就觉得OK如果这个事情能做到,那很显然就是它会带来巨大的价值。当然可能是几百亿上千亿,但现在可能是数万亿、数十万亿。我想的还是太小了。

那另一部分其实我做的工作就是怎么去定义AI Agent。那比如说Web是第一个,其实互联网的Web的Task,然后包括Internet的话,随便就是最早的就是Crawling这样的任务。那现在看起来AI Agent的技术最重要的两个部分,可能确实是Web Agent和Coding Agent。 最后就是说那天我还在群里面跟大家聊天,我说我看我那个论文的结尾,就是我在二四年的时候写我的Future Work,对吧?

第一个是Train Models for Agent,第二个是Safe and Robust Deployment,第三个是Scientific Discovery,第四个是怎么样去Help Human。我很感慨,我说我现在很幸运,我确实现在在做我当时列的Future Work。 GPT太厉害了,这个一看到整个行业针对这些方向影响的还是不够大。我觉得当时我已经觉得自己想的够大了,但可能还是不够大。

汤道生:我觉得技术的发展往往超乎我们的预期。我也在转身一点智能体,今天大家都说需要消耗很多的Tokens的调用。对于混元做下一代的模型的研发,你觉得什么是你的侧重?有哪些地方是比较重要的?

姚顺雨:对,我觉得毫无疑问,今天Coupling就有点像Infra一样,是一个不得不做的事情,它是一个最基础的能力。我个人觉得Coupling是非常本质的,当然有很多原因,但其实还有一个很重要的原因就是说它是一个有点像Turing Complete的这样的一个事情,对吧?就是当你有能力去控制自己的,当你有一个Container的时候,其实你是一个看得见的这样的一个System。

那今天我觉得AI这个毫无疑问是每一家模型所聚焦的重点,我觉得我们会做的方法可能会有几个区别。

第一就是说即使可能今天Coupling也是最重要的事情,但我们还是会强调提示的全面化,就是我始终认为就是说真的要把Coupling做好,其实需要的远远不止Coupling这个数据,你也需要像我刚刚说的聊天方式、逻辑推理各种各样不同的东西。因为大模型最重要的点是泛化性。

那第二点就是很显然产品的作用越来越重要,如何利用好线上的回流,我觉得是一个每一个模型团队都在应对和思考的问题。那这里我觉得我们刚刚有很多Coupling的这些经验会变得非常重要。

那第三就是说我觉得其实还是需要更多想象力,无论是技术的路径还是产品的路径,还是像下一个范式的路径,我觉得我们还是需要做一些探索性的甚至不确定性的工作。

汤道生:我觉得从产品侧,因为大家越来越多有Token焦虑的声音,Token的成本持续爆发式增长。我也听到很多的客户,甚至用户身边的同事们也在紧盯着Token的消耗。那怎么可以让我们的模型在解决某个问题或者完成某一个任务,它的Token的效率最高?

对,我之前做过一些任务,可能它会是不同的方向,其实有些方向你也都知道,肯定走不下去的。

但可能模型还会试,试完知道怎么下去,再试下一个,其实里面的有什么可以去optimize的地方,让TOKEN整体使用的效率更高。

姚顺雨:对,其实我觉得现在中国大家讨论性价比可能更多讨论的是模型架构,但其实它是个很复杂的体系,我觉得可能最重要事情首先是你的performance,对吧?

就说很多人其实跟我说,他最后发现用较小的模型比用更差的模型,最后发现其实更省,因为你更快地就把这个事情做对了,然后你也省了人的精力。然后这个其实最重要的事情我觉得是Performance,因为如果你的Performance不好,其实性价比就无所谓。

姚顺雨:第二部分我觉得就是成本,它其实本身就性价比,我觉得第一其实是性,因为如果这个性能不好,其实就性价比就无从谈起。那第二点我觉得就是成本,那其实成本的话,我觉得中国其实是领先于世界的,对吧?

就是说我们做大量的工作去优化我们的成本资源,但其实我觉得成本可能最重要的事情是怎么用一个更小的模型把这个更高的这个价值的任务给做好。

那在这个基础上,我觉得当然架构的创新包括长文本的管理,包括销售价。

有很多需要做的事情,但我个人看法就是说,如果我们能做一个相对较小的模型,但是它又能够比肩大模型的性能,而且它能够在就是大部分的任务上做到很强的鲁棒性,这可能会比在很多非常长程的就是Fancy的task上面实现,比如说一两个点的这个提升,可能是在今天的中国更有价值。

姚顺雨:其实我也挺好奇 Dawson 就是说你觉得agent 你是什么时候意识到它是一个新的产品的机会,以及你现在认知是什么?

你觉得现在我们离一个好用的agent bottleneck在哪里呢?

汤道生:因为我们做的agent 针对不同场景,其实有不同的产品形态,在agent的设计上面其实很大程度是在发挥模型的,尽量去发挥好模型的能力,当然模型在迭代它能力越强,可能agent需要做的工作也越来越少。

我看我们好几个产品在过去这段时间其实是随着模型能力加强,我们可以把产品、把agent做得更简化,更多的是给模型提供更多不同的工具,创造更多的skills,来让模型能够更高效的去完成任务,给模型提供更多的我们叫记忆,对吧?

这个用户过去使用的一些习惯,我们所记能提取出来的一些用户preference 的一些信息。作为一个上下文去feed,过去在 coding 的环境有相关的context 给到模型,在办公场景里面办公协作做个PPT 可能大家关注的内容,或者该给到的模型不一样,所以在我们做不同的agent,我觉得更重要还是了解那个场景下什么内容什么信息是重要的、比较 relevant 的能够跟模型配合好,让模型能够有它需要的信息。同时也发挥他的这个能力。

姚顺雨:但最近我们确实推出了一些像workbody这样口碑很不错的产品,对吧?

然后背后就是我观察到就是很多小团队在快速的迭代产品,我其实挺好奇,就是相对于传统的这种产品研发,你觉得在这种新的agent时代的这个研发和组织管理上,这个产品团队发生什么变化?你的思考是什么?

汤道生:对,我前一阵子在帮 workbody 做一个组织分析,我看了一下他们那个非常扁平化的组织,跟我们过去的其他的产品组织架构是有很大的差异,更多的小团队三个人、五个人一个,可能就是围绕的某一个领域来去做攻坚,就而且有很多的实验的在里面,所以贡献还要支持好这个 AI infra去做实验,让不同的这些小分队可以去探索,然后再验证,因为其实验大部分可能是拿不到正向的反馈的,那我们也要去包容团队去试错,这种通过大量实验去提炼出对于用户留存,对于我们想要的这个结果有正向的帮助。

这个是我觉得今天做agent,做AI产品,原生AI产品,这个组织形态要能够比较好去支撑。另外原来可能有很多工程师有很多时间花去写代码,但今天毫无疑问他们这些工作可以交给AI了,所以我们会看到更多角色的融合,可能大家都是产品经理,都要去了解透彻用户的需求,以及设计出我们想要的产品形态,每一个工程师可能就是更像一个有想法的leader 驱动着多个coding agent 来去针对我们想要的这种产品需求去做研发开发,同时也要像我刚说的,要把参与这个评测测试比较前置,也用好AI的能力,把这些质量保证的工作 alignment 对齐的工作又要做到前面来。

汤道生:那我也想在问一下,一个可能更大家比较多讨论的一个问题,其实很多的自媒体都会提到腾讯慢了,这个在AI上面,这个我们没有及时的去抓住一些机会,你觉得我们真的慢了吗?

到底下半场是什么?您,你能再多说一下吗?

姚顺雨:感觉这应该是我问你的问题。哈哈哈。

我觉得首先这个AI我觉得其实今天我觉得有两个重要的判断。

第一个就是说我们认为AI是一个短期的游戏,还是个长期的游戏,因为在硅谷大家蔓延着很多的情绪,就是说两年后所有人都要失业了,对吧?

就这个AI就要取代所有人工作,那我们应该赶快赚两年钱,然后退休,对吧?

那我觉得这是一个判断,我觉得很显然我们的判断是这是会是个长期游戏。

那其实我觉得AI才刚刚开始,从某种程度来说,下半场才刚刚开始,我不认为chatgpt和Claude code会是唯一的super APP,我觉得那会是一个非常灰暗的世界,我觉得肯定会有源源不断的新的机会的诞生,可能今天就像是七十年代,就是PC刚刚产生的时候,那我觉得还有很多很多事情需要做。

那第二个判断就是说它会是个更现行还是个多元的游戏,因为确实我觉过去几年大家能看到的是Pre-training,然后post-training RL,然后agent coding agent 就是似乎有一个非常清晰的主线,然后这个主线就是所有人都在copy,对吧?

姚顺雨:坦白说就是所有人都在做一样的事情,这也是个非常灰暗的事情。

其实那到底未来会变得更单一还是更多元,我个人看法就是说我觉得会变得更多元,毫无疑问 coding agent生产力会变得更加重要,我觉得它是一个刚刚开始的事情。这个世界还有trillions of dollars market 还没有被填满,但是多模态具身智能很多很多新的事情都在发生或者刚刚发生。

所以从这角度来说,那如果我们认为下半场的刚开始,那可能确实不是慢,当然我觉得就是过去就这个模型产品做了很多探索,走了很多弯路,我觉得这是我觉得正常的,就是你如果没有做过一个事情,那你那第一次做肯定还是会有这个曲折,但是我觉得可能更重要的事情是说能不能诚实的面对自己,能不能够 be real?

能不能够去,就是看到feedback 要去改变,能不能够去保持耐心?我觉得这些事情可能是在下半场更加重要的事情。

汤道生:对。我觉得腾讯,大家对于腾讯经常喜欢挑某一个点来批评,当然我觉得我们也很欢迎大家给我们提更高的要求,那我们还是一个非常多业态,很多产品,在很多的赛道,同时也有很多的团队在推进不同的项目事情,所以毫无疑问,在这样的一个复杂的组织里面,有些地方可能我们做的快了,有些地方做的慢了,有些地方可能会做失败在探索,所以我觉得这些提醒都非常好。

我觉得确实有些地方我们是可以做得更好,但就像你说的,这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景,就像你一开始提到选择腾讯,因为AI需要context。对吧?

模型需要很多的这些上下文,其实腾讯在过去的多年的不同产品,在不同赛道的这些积累,其实都是可以针对每一个场景去提供,为模型提供有用的信息,提供这些context来发挥价值,那在这样的一个长跑,我相信模型会不断迭代,用户的需求也在不断变化,也会有新的产品形态出现。

我觉得我们比如今年年初对龙虾这一波热潮也反应比较快,同时也有像workbody这样的一个智能体产品,其实也是几年前已经开始做的产品,沿着原来做 coding 的 codebody 慢慢看到非程序员也有很强的这个需求,我们也能比较快的去应对。

今天其实也听到很多客户对于我们的不同产品怎么去组合起来有非常高的这个期待,所以我们正在长跑中,也请各位多给我们提醒,多给我们建议,也多用我们的产品来给我们这个正向的constructive的反馈。

好,今天我们的对谈就到这里,谢谢顺雨,感谢大家。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载