加文·贝克最新对话:细谈前沿模型、晶圆及巨头格局
科技
科技 > 互联网 > 正文

加文·贝克最新对话:细谈前沿模型、晶圆及巨头格局

原标题:加文·贝克最新对话,细谈前沿模型、晶圆及巨头格局:如果只能盯一个指标来判断AI泡沫,我会盯台积电产能决策

1、我觉得Anthropic烧掉的钱,可能比OpenAI少80%。

2、AI现在正从“无限量套餐”转向“按杯付费”可能就是为什么今年我们会看到OpenAI和Anthropic的ARR远远超过2000亿美元。不只是更多算力会上线,它们还可以通过这些企业级按量方案,提高前沿token的价格。

3、我认为,电力短缺可能会从2027年、2028年开始缓解。然后,轨道算力会真正解决这个问题。

4、事实上,按照历史上所有基础性新技术的市场先例,像AI这样的技术,通常都会经历泡沫。

5、现在这一轮建设有一个很大的好处,就是它仍然主要由经营现金流来融资。这和2000年相比,是非常重要的区别。

6、我一直比较乐观,认为今天这种根本性的晶圆短缺,也就是目前实际上由台积电控制的短缺,可能会阻止泡沫出现。

7、如果只能盯一个指标来判断会不会出现泡沫,我会盯台积电的产能决策。

8、技术快速变化带来的结果,不是让那些老GPU立刻报废,反而是因为prefill和 inference被拆开了,它们可以被重新分工使用。

9、如果某一天真的出现一种算法突破,让模型在不需要更多算力、不需要更多数据的情况下,也能大幅提升能力,那整个AI基础设施投资逻辑都会受到冲击。这是真正的风险。

10、在风险投资,我总会问一个问题:在这家公司真正建立规模之前,这件事会不会已经变得人人都懂?或者反过来,它是不是既不显而易见,又足够不同,而且真的很难做?

11、除了那些我觉得可以长期复利、而且比较安全的高质量公司之外,一些最大的机会就在那些被错误分类的公司里。

12、我认为亚马逊处在非常强的位置,因为它有Trainium。未来18个月,你会在亚马逊零售业务里,看到机器人带来的真实损益改善。

听加文·贝克(Gavin Baker)最近这场对话,有一种扑面而来的AI加速感。

“我从来没有见过这样的指数增长。"

他指的是Anthropic——一个月新增110亿美元年化经常性收入,相当于Palantir、Snowflake和Databricks这三家最受关注的SaaS公司各自花十年才达成的合计规模。加文用“美国商业史上最非凡的时刻”形容此刻。

加文1999年从Dartmouth毕业,本科是经济学和历史双主修(这一点和他对铁路泡沫、运河泡沫、互联网泡沫如数家珍的历史感是有关系的)。

同年加入富达,一待18年。期间先后覆盖半导体、医药、零售、消费、电信、媒体几乎所有重要行业,做过多只Select基金的经理,2009年接掌旗舰科技基金富达OTC(FOCPX)8年。这只规模峰值约170亿美元的基金,任内年化复合回报约19.3%,跑赢99%的Morningstar同业。

2013年起,他在富达内部牵头一级市场投资,早早进入SpaceX、Twilio、Cloudflare、Roku、Redfin等公司。

这段经历让他在2019年1月自立门户创立Atreides Management时,把一二级市场打通做跨界基金。

他本人也是Cerebras、Astera Labs这些AI芯片公司的早期投资人,对英伟达的投资关注持续20多年。

对话人是投资播客Invest Like the Best的主理人帕特里克·奥肖内西(Patrick O'Shaughnessy),两人非常熟稔。

这一次围绕的核心是电力与晶圆,AI建设的两大天花板。加文细致拆解了产业各方将如何分别应对:地面涡轮机扩产、SpaceX用激光连接的“轨道算力”、台积电对扩产节奏的微妙拿捏、Terafab这样的新晶圆厂入场打破单一供给。

他说,如果只能盯一个指标来判断AI会不会出现泡沫,我会盯台积电的产能决策。

围绕这条主线,对话延伸到许多细节:Anthropic为何刻意让Claude“收着点用”、亚马逊的Trainium在ASIC竞争中的位置、模型公司面对的新“囚徒困境”、应用层为何被毁掉数万亿美元价值、被“错误分类”的公司里藏着哪些机会、agentic world中CPU为何重新变得重要、谷歌/Meta/亚马逊/微软四家巨头眼下各自处在什么位置。

And加文还借电影《最后的武士》打的比方:技术革命来临时,旧时代最优秀的武士也会被一个端着机关枪的农民屠杀。他说,“我正在努力成为机关枪大师。"

加文是极度乐观的AI支持者。他相信AI会改写生物医药、延长人类生命。

访谈尾部那个父亲为患罕见基因突变的女儿启动agent寻药的故事,让人印象深刻。但他也有担忧:AI正让世界进入“波动更大、尾部事件更多”的状态;最好的AI目前只服务于有钱人,多少有反乌托邦色彩;地缘政治正被悄然重塑;还有AI伪造下的安全问题,

又是一篇大部头的对话实录,聪明投资者(ID: Capital-nature)原汁原味地放出来,并在部分地方做了备注,方便大家丝滑地理解。Enjoy it~

今年三四月投科技,只要看Anthropic正在发生什么就够了

帕特里克 你经历今年3月和4月那段时间时,是什么感觉?对我来说,那像是一个很独特的经济、技术和市场环境。你又一直是一个非常认真研究历史,也非常认真观察当下的人。所以,那段时间对你来说到底是什么感觉?

加文 大体上说,回撤有两种。

一种是你真的错了。比如一家公司业绩不及预期,你原来的投资假设被证伪了。这时候你就得认错,接受损失,把这个亏损真正确认下来。

但还有另一种回撤,或者说另一种跑输。你之所以跑输,是因为一些你非常了解的公司在下跌,而你对市场给出的价格走势非常不同意。这个时候,你反而可以加仓。

在这种情况下,你不是在确认亏损,而是在积累一种被压制的alpha,也就是未来还没有释放出来的超额收益。

对我来说,今年3月就是这种感觉。

当时纳斯达克在下跌。但与此同时,我认为AI领域正在发生的事情,是美国商业史上最非凡的时刻。

我指的是,Anthropic新增了110亿美元 ARR,也就是年度经常性收入。

真正让我震惊的是,SaaS和云计算革命大概创造了5万亿到10万亿美元的价值。过去10年、12年里,如果要说最受关注的三家 SaaS 公司,大概就是 Palantir、Snowflake和Databricks。

这三家公司雇了几千人,合起来可能上万人。它们都花了10年时间,才把自己的业务做到今天这个规模。

而Anthropic在一个月里,就新增了相当于这三家公司合计规模的业务。

这太疯狂了!

我们这些科技投资人,经常会听到大家谈S曲线,谈怎么投资指数级增长。但我从来没有见过这样的指数增长。

这甚至比DeepSeek那次还要极端。DeepSeek当时也是一个很类似的局面。

如果回到2025年,DeepSeek引发了一场巨大抛售。

但那件事本身非常奇怪,因为DeepSeek那篇论文,其实在DeepSeek Monday之前7天就已经发表了。我记得应该是发表在美国一个假期的周一。

我读完之后想:“嗯,这东西感觉可能很重要。”

帕特里克 可能很重要。

加文 但它未必会被市场解读成对AI交易有利。所以我当时采取了行动。

一周之后,就到了DeepSeek Monday,AI相关股票真的崩了。

但这件事很奇怪,因为到了DeepSeek Monday,当时其实已经非常清楚,DeepSeek会是有史以来对算力需求最利好的事情之一。

AWS亚洲可用区的价格已经差不多翻倍了。你能看到GPU可用性在下降。

这也是我们第一次真正看到,推理模型在推理阶段,比非推理模型消耗的算力要多得多。

所以那次也是一个类似的局面,只不过你需要做一些功课才能看出来。

但其实也没有那么难。你只要看到,股票在下跌,DRAM价格在直线上涨,亚洲GPU价格在直线上涨,GPU可用性在下降。

然后两三天之后,美国的GPU租赁价格也开始上涨。

但今年3月就更简单了。你什么都不用做,只要看Anthropic正在发生什么就够了。

现在很多人好像都很后悔。后悔2022年没买,后悔COVID期间没买,后悔DeepSeek那次没买。

但4月初,其实又出现了一次类似的估值机会,而且这一次AI的拐点更加清楚。

所以,过去其实已经有很多次可以买入AI的机会。

当然,让这件事变复杂的,是所谓的“海峡公式”。

我后来开始相信这一点,现在也仍然相信市场可能误判了一件事。

我不是宏观专家。但我确实做很多和国家安全相关的投资,所以能接触到一些真正懂这方面的人。他们也很愿意和我分享自己的判断。

我认为,霍尔木兹海峡如果关闭,对美国来说,实际上相对是非常有利的。

帕特里克 为什么?

加文 因为这其实非常符合当前美国政府的目标。

电力是工业和制造业里非常重要的投入。对美国电价来说,最关键的变量之一,也是影响AI成本的重要变量,就是天然气价格。

当时,美国天然气价格下跌了20%。

但亚洲、欧洲以及其他地区的天然气价格,翻了一倍,甚至两倍。

所以,美国的相对制造业竞争力,几乎在一夜之间就提升了。

不管你喜不喜欢,这似乎就是特朗普政府最关心的事情。他们非常在意美国相对于其他国家的位置。

很多人对1970年代还有记忆。70年代之所以那么痛苦,不只是因为价格上涨,而是因为当时真的出现了汽油短缺。

但今天的情况已经很不一样了。美国经济对能源的依赖程度,比当年低得多。美国现在是全球最大的石油和天然气生产国,也已经是全球最大的石油和天然气出口国。

在这个基础上,如果美国又获得了相对制造业的优势,那情况就完全不同了。

所以对我来说,这让我更容易继续把注意力放在AI的基本面上,也继续关注当时从历史上看非常有吸引力的估值。

我认为,从相对估值看,当时科技股相对于市场其他部分,几乎已经便宜到过去10年里最便宜的水平之一。

你可以从市场有效性的角度想想这件事。

我们正在经历资本主义史上最非凡的时刻,而这对AI极度利好。可就在这个时候,你居然还有机会用非常有吸引力的估值买入AI。

Anthropic在最新估值基础上,有能力再溢价至少倍融资

帕特里克 你怎么看Anthropic和OpenAI的估值倍数?

在我看来,它们是这个趋势里最纯粹的参考资产。但它们的估值其实并没有那么夸张。

如果只看销售倍数,把它们和Databricks、Snowflake这些公司在估值高点时的水平相比,你怎么理解?

加文 我确实认为,从资本效率角度看,OpenAI和Anthropic是两种很不一样的公司。

Anthropic每生成一个token的成本,明显低于OpenAI。它就是更低。

你只要看它们为了做到差不多的收入规模,各自烧掉了多少钱,就能看出来。

我觉得Anthropic烧掉的钱,可能比OpenAI少80%。

帕特里克 没错。

加文 所以作为一门生意,它们的结构性ROIC,也就是投入资本回报率,显然很不一样。

当然,OpenAI也在做很多事情。我认为莎拉·弗里尔(Sarah Friar)是一位非常出色的 CFO。他们正在努力改善这个问题。

帕特里克 而且他们确实锁定了很多算力,比别人更多。

加文 对,他们锁定了很多算力。这也是一个很大的差异。

事实证明,激进一点是有回报的。

但如果Anthropic估值 9000亿美元,对应500亿美元ARR……

帕特里克 而且还在以1000%的速度增长。

加文 对,增长速度荒唐的高!

也许更真实的说法是,如果Anthropic拥有全部所需算力,它今天的收入很可能已经远远超过1000亿美元,可能达到1500亿美元。

而且我确实认为,Anthropic现在有意让Claude “收着点用”

有一项分析显示,即使是Claude Opus,对于完全相同的问题,它生成的token数也减少了70%。

我们上次也谈过,在某种程度上,token数量就等于回答质量,也等于思考质量。

当然,每个token里的智能密度也很重要。

作为用户,我自己也确实感觉到了这一点。

所以我认为,如果不受算力限制,Anthropic的收入会高得多。可能是1000亿、1500亿,甚至也许是2000亿美元。

帕特里克 所以你可能是在用5倍“无约束收入”买它。我们可以创造一个新指标,URR,也就是unconstrained run-rate revenue,无约束运行收入。

加文 对。

帕特里克 那为什么它们不按3万亿美元估值融资1000亿美元之类的?如果你是Anthropic的CFO的话。

加文 我认为它们现在这样做是明智的,因为未来是不确定的。

你显然处在一场资本极其密集的游戏里。即使是Anthropic,我相信它们今天在推理业务上的毛利率已经非常不错。

Anthropic今年就会开始产生现金流,我觉得它们很可能已经开始了。

但即便如此,你仍然希望未来还能继续融资,继续拿到更多算力。因为这个世界是不确定的。

如果你看埃隆·马斯克,他一直为投资者赚钱。他把这件事看成一种神圣契约。

正因为过去20年里,他一直让投资者赚到钱,所以他拥有了一种超级能力。那就是,他基本上可以在任何时候、按照自己想要的规模融资。

我认为,这些公司现在这样做是明智的。

我不知道他们是不是这样思考,但我确实认为,专注于让投资者赚钱是一件明智的事。

这种好处不只是持续一两年,而是可能持续未来20年到30年。

帕特里克 埃隆做到这一点的方式,是不是系统性地低估SpaceX或其他公司的估值?具体来说,他是怎么做到的?

加文 就是从不在估值上贪心从不把估值推到极限。

帕特里克 就这么简单?

加文 对,就这么简单。

我的朋友安东尼奥(Antonio)曾经指出,过去十多年里,SpaceX的年化复合回报大概是30%出头。

我认为原因就在这里。埃隆一直很重视保留这种融资能力,也一直努力在投资者和员工之间取得一个公平的平衡。

所以我觉得,这是非常明智的。

但如果你问,Anthropic能不能在传闻中的最新估值基础上,再溢价至少一倍融资?当然可以。

电力短缺可能会从2027年、2028年开始缓解

帕特里克 我们来聊聊watts and wafers,也就是电力和晶圆。这一直是我最喜欢和你聊的话题。

我感觉,每次我觉得AI基础设施建设已经有点过热了,下一次再和你聊,又会觉得我们之前其实建得还不够。

你研究过很多S曲线,也研究过这些S曲线到底能有多陡,而且你很懂历史。你来讲讲,你现在怎么看电力和晶圆,它们作为整个AI体系最关键投入的重要性。

加文 我会说,资本主义大概率会解决电力短缺问题。前提是没有非常大的监管或政治反弹。当然,我认为这种反弹确实有可能发生。

有一家大型私募股权公司里负责数据中心基础设施投资的人,我记得可能是黑石、阿波罗(Apollo)或者KKR的人,说过一句话:“过去,能源和芯片是我们最大的瓶颈。现在,分区规划和审批变得更重要了。”

我认为很多公司都在等中期选举之后再采取行动,比如裁员之类的动作。没有公司想在中期选举期间被政客和舆论拿来当靶子打。

但你已经看到,很多制造涡轮机的公司开始宣布大规模扩产计划。

当然,这里面确实有很多问题。比如,能铸造这些大型叶片的机器,全球可能只有两台。西方已经80年没有造过这种机器了,很多能力已经丢掉了等等。

这些都是真的。

我也绝不是在低估这里面的工业工程难度。那里面确实有很多技术、工艺,甚至可以说有某种工程艺术。

但随着时间推移,资本主义非常擅长解决这类问题。

而且除了这些涡轮机之外,从更长周期看,还有其他能源来源。

所以我认为,电力短缺可能会从2027年、2028年开始缓解。然后,轨道算力会真正解决这个问题。

我也想重新定义一下“轨道算力”。因为当人们听到“太空数据中心”,脑子里往往会想象一个漂浮在太空中、像五角大楼那么大的建筑。

然后他们会说:“这不可能做到。”

但它不是那个样子。一个Blackwell机架重3000磅,高8英尺,深4英尺,宽3英尺。

所谓轨道算力,本质上就是把机架放到太空里。

SpaceX已经给过示意图了。那就是一个机架,那颗卫星本身就是一个机架。

它的大小大概和Blackwell机架差不多。它两侧会展开太阳能翼,每边可能有500英尺长。

你把它放在太阳同步轨道上,这样太阳能板就能一直照到太阳。

而且因为它处在严格的太阳同步轨道上,散热器可以从它背后延伸出去几百英尺。

帕特里克 嗯。这也是大家常见的质疑之一。

加文 对,散热器在阴影里。

帕特里克 你到底怎么给它散热?

加文 这些年我在Starbase待过很多时间,也和很多SpaceX工程师聊过。

我确实认为他们是地球上最有才华的一群工程师。而且在这件事上,他们非常有信心,认为散热问题已经解决了。

他们并不是对所有事情都这么有信心。

比如,要把星舰(Starship)变成火星殖民运输器,我觉得可能还有不少工程问题要解决。

他们最终会做到吗?我相信会。

但如果问他们现在更关注什么,我觉得可能是维修和维护。

这也是两个最大的质疑点。一个是散热器,另一个是机架里出了问题怎么修。

答案是,在你拥有某种漂浮版Optimus之前,大概没法修。

但我确实认为,星舰会以我们现在无法想象的方式改变太空经济。

尤其是如果监管变成地面数据中心的限制因素,那很多地面约束就不重要了。你能造多少轨道算力,就能卖多少。

然后很自然地,你会用穿越真空的激光,把这些太空机架连接起来。而这项技术现在已经在每一颗星链(Starlink)卫星上了。

让我觉得震撼的是,SpaceX运营着全球最大的卫星星座,占在轨卫星的98%或99%。每一颗星链卫星,今天都在运行,也都在被冷却。

我认为星链V3的功率会达到20千瓦。而一个Blackwell机架,也不过100千瓦。(也就是说,太空算力要达到一个AI机架的功率水平,并不是差了几个数量级,而是大概5倍的差距。对SpaceX来说,这当然很难,但不是完全不可想象。)

人们经常谈密度。但如果你是在真空中用激光连接机架,就可以把机架做得更大一些。物理上,你真正关注的是重量,而不是体积。

在地球上的数据中心里,你要连接机架,理想情况下会尽量用铜缆,并尽可能缩短距离。布线本身就是很大一项成本。

所以你当然希望机架尽量小,能用铜就用铜,必须用光的时候才用光。

但在太空里,SpaceX可以做很多事情。我觉得一些怀疑者没有认真想过这些可能性。

关键是,它们运营的卫星数量超过任何人。它们今天已经有20千瓦的卫星。所以一开始也许只是把它扩到60千瓦。

但他们似乎非常有信心,可以直接做到100千瓦、120千瓦。

而且,同一家公司现在也运营着地球上最大的数据中心。它们有世界上最好的硬件工程师。

与此同时,很多外界的怀疑者,其实既没有SpaceX工程师那么聪明,也没有他们那么懂实际工程。

拉里·埃里森(Larry Ellison)在之前有人质疑这件事时,说过一句很简单的话:“听着,他正在外面回收火箭。我没看到别人能回收火箭。”

现实是,10年过去了,仍然没有其他公司能够持续、稳定地回收并完全复用一枚轨道火箭。

而如果没有可复用性,这一切都不成立。可复用性意味着你必须把火箭降落回来。

所以我更愿意把轨道算力定义为“太空中的机架”,而不是漂浮在太空里的五角大楼式巨型数据中心。

帕特里克 对,后者听起来确实有点荒唐。

加文 但真正可以做到的是,用激光把这些机架连接起来。数据中心的本质,就是这些机架之间的连接。

所以它会是一组太空中的机架,通过激光连接成一个虚拟数据中心。

如果只能盯一个指标来判断AI泡沫,我会盯台积电的产能决策

帕特里克 如果我们想象一下那个世界,假设这些事情真的发生了,而且我们已经非常擅长以经济方式把这些东西送上去,在太空中到处跑矩阵乘法,那这对地面数据中心意味着什么?

加文 有人曾经说过,美国会尽可能用力地吸取它能得到的每一种能源。我认为算力也是一样。

这也是为什么我现在对“边缘AI”这个空头逻辑没有以前那么担心。

我们会消耗掉尽可能多的算力。

推理非常适合轨道算力,但训练在很长一段时间里,仍然会在地球上完成。

所以我不认为这对地面数据中心特别利空。我认为在我的有生之年,地面数据中心仍然会非常有价值。

但如果你身处电力生产和冷却这个生态里,而且正在大规模扩产,那你确实要认真想一想。

因为很多产能投放的时候,可能正好赶上那些原本很轻视轨道算力的人,开始意识到这件事是真的。

如果你是这些公司之一,这件事值得非常认真地思考。

当然,在过渡阶段,也会发生很多很酷的事情。

比如,我们现在越来越擅长改造喷气发动机。Boom Aerospace 就在做这件事。

所以,电力这一侧有很多事情正在发生。资本主义正在非常努力地解决电力问题。

但晶圆这边,情况就不一样了。

晶圆掌握在台湾一群非常坚韧、年长的人手里。他们是台湾最重要的一群人。

台积电占台湾GDP、用水、用电的比例都非常高。大家经常说“硅盾”。他们自己也把自己看作张忠谋神圣遗产的继承者。

我清楚记得,20多年前我去新竹科学园区拜访时,曾经问他们:“你们觉得自己有一天能追上英特尔吗?”

他们回答说:“这是一个很美的梦,但那应该是我们孙辈的梦。”

后来他们真的做到了。

当然,一部分原因是英特尔自己犯了错误,但他们确实做到了。

只是,他们的思维方式很不一样。

黄仁勋之所以经常飞去台湾,一个原因就是他希望台积电扩产。

让我觉得很有意思的是,黄仁勋和台积电之间从来没有合同。他们做生意,似乎靠的是公平感和握手。

帕特里克 嗯。没有合同,真有意思。

加文 他们相信,长期来看这会是公平的。我们是合作伙伴,我们会彼此公平对待。

事实上,按照历史上所有基础性新技术的市场先例,像AI这样的技术,通常都会经历泡沫。

卡洛塔·佩雷斯(Carlota Perez)写过一本很好的书,讲的就是这个过程。

基本上,市场是有效的。它会正确意识到,这是一项基础性的新技术。

然后就会出现迈克尔·莫布森(Michael Mauboussin)所说的“多样性崩塌”:所有人都开始看好同一件事。

我现在确实开始有点担心这种多样性崩塌。

接下来,你就会得到一个泡沫。

这个泡沫会为新技术的基础设施建设提供资金。但当供给跑到需求前面之后,就会出现崩盘。如果这种建设还是靠债务驱动的,就像2000年那样,崩盘会特别严重。

现在这一轮建设有一个很大的好处,就是它仍然主要由经营现金流来融资。这和2000年相比,是非常重要的区别。

估值也是一个区别。

还有一个区别是,今天每一块GPU都在100%利用率下运行;而当年互联网泡沫时期,99%的光纤都没有被使用。

所以这里确实有很多根本差异。

但我们仍然要清醒。历史不会简单重复,但会押韵。作为投资人,我们必须意识到这一点。

如果看过去两三百年的历史,别只看互联网泡沫,还有铁路泡沫、运河泡沫。我们应该预期泡沫会出现。

这很可怕。没有人想要泡沫。泡沫很糟糕。

它之所以糟糕,是因为如果你对估值敏感,你会在泡沫阶段大幅跑输,然后很可能被所有客户解雇。

已经离世的乔治·范德海登(George Vanderheiden),曾经是富达非常优秀的基金经理。

1999年,他选择对抗泡沫。到2000年初,他退休了。我觉得是因为他实在承受不了了。

他一头白发,是一个真正伟大的人。我和他只有很短暂的交集,但他是我好朋友、也是我导师詹妮弗·乌里格(Jennifer Uhrig)非常重要的导师和朋友。

通过她,我身上也有很多范德海登的影响。

他说过一句名言:“早得太多,和错没有区别。”

乔治后来退休,就是因为他受不了持续跑输,也受不了客户不断问他:“你到底怎么了?你怎么就是不懂?”

而当时,他的基金里大概40%是烟草股,40%是住宅建筑商。

结果接下来三年,他相对于纳斯达克的表现,可能跑赢了20倍到30倍。

我一直比较乐观,认为今天这种根本性的晶圆短缺,也就是目前实际上由台积电控制的短缺,可能会阻止泡沫出现。

如果台积电按照黄仁勋希望的方式扩产,我认为英伟达在2026年或2027年可以卖出2万亿美元的GPU。也许是2.5万亿美元,甚至3万亿美元。

但消费者能消化的算力总有一个边界。到某个程度之后,你大概就会进入过度建设。

所以,如果我们最后没有出现泡沫,真的应该为台积电开一个庆祝派对。因为它将凭一己之力阻止一个泡沫。

帕特里克 现在你已经开始看到一些公司转向英特尔和三星。假设台积电面对这些迟来的需求,仍然处在极度供给受限的状态,那会发生什么?

加文 市场历史告诉我们,英特尔和三星之间,我不知道会是哪一家,但它们不可能一直保持克制。

总会有一家先忍不住。

一旦有一家开始放量、开始抢市场,在某种程度上,其他人也会被迫跟上。

所以我认为,关键很大程度上取决于台积电能在多长时间里,继续保持对英特尔和三星的领先。

你要记住,这种领先可能是9个月、12个月、15个月,或者……

帕特里克 类似先进制程节点上的领先。

加文 完全正确。

所以它们扩产的节奏非常重要。

如果只能盯一个指标来判断会不会出现泡沫,我会盯台积电的产能决策。

我认为这里存在一个“刚刚好”的区间。也就是说,台积电扩产要足够多,让英特尔或三星很难真正大规模成为第二供应商,很难拿到远高于30%的市场份额。

但与此同时,台积电又要保留晶圆这个根本性约束,让供给不要一下子放得太开,从而帮助整个行业避免泡沫。

当然,我认为Terafab也会参与到这个过程中。

Terafab是SpaceX参与其中的一个合资项目(我相信特斯拉也有份),目标是在美国建设全球最大的晶圆厂。

我认为他们会成功。

第一,他们和英特尔有合作关系,这非常重要。因为这意味着他们可以获得英特尔50年积累下来的制度性知识。

虽然这套能力已经不是最前沿,大概落后9个月、几个季度,或者说12个月、三到五个季度,但它仍然是一种优势。

另一个优势是,我相信Terafab会得到所有半导体设备公司A级团队的支持。

当年台积电之所以能追上来,一个重要原因就是阿斯麦(ASML)、KLA、泛林集团(Lam Research)、应用材料(Applied Materials)这些公司,都希望它追上来。

这些设备公司不喜欢只有一个买方的局面。所以当时它们最强的团队都去了台湾。再加上英特尔自己犯了一些错误,机会就出现了。

这一次,因为埃隆在硬件工程上的声誉,这些A级团队会来到美国。

还有一点,在美国可能有些人很难想象。现在政治在某种程度上已经取代了宗教。因为埃隆曾经卷入政治,所以美国一些人很难客观看待他。这其实很可惜。

因为我确实认为,他为美国做的事情,可能比任何其他美国人都多。

他几乎凭一己之力把制造业带回美国。他复兴了国防科技。SpaceX在某些方面已经是美国最重要的国防承包商。

星链对世界的意义也非常了不起。他创造了大量蓝领制造业岗位,而这本来也是很多自由派希望看到的事情,对美国也有好处。

他可能比任何在世的人都更大程度地推动了全球脱碳。

如果你因为环保原因反对把数据中心建在地球上……

帕特里克 这正是太空数据中心的好处之一。

加文 对,那这不就是答案吗?

所以我觉得很可惜。在美国,因为政治让很多人一叶障目。

我观察他很久了。我觉得他会做的事情,就是把最优秀的人才招过来。

因为最好的工程师都想为埃隆工作,尤其是在硬件工程领域。

他会招来非常厉害的工程师。

然后,在Terafab旁边,可能会有一个小镇。你最喜欢台湾哪些餐厅?好,那我就把这些餐厅和整个团队都从台湾搬到得克萨斯,把一切都做成他们喜欢的样子。

帕特里克 精确调校。

加文 对,精确调校。目的就是为了招到最好的工程师。

而这不是英特尔和三星管理者通常会有的思维方式。

所以他会拥有最优秀的人才,会得到晶圆厂设备公司A级团队的支持。

他还有英特尔这个合作方,这也很重要。

这件事也非常符合任何一届美国政府的政治目标。而且我认为,它和现有格局足够不同,不至于疏远台积电。

当然,这些事情都有很长的前置周期。也就是说,Terafab真正开始生产英伟达GPU,或者其他芯片,会是相当久以后的事情。

打破“苦涩教训”仍然是真正的风险

帕特里克 埃隆做事情往往和别人不一样。别人建一个数据中心要花3年,他122天就建起来了。你知道,三星甚至不得不在得州晶圆厂里给他安排一间办公室,因为他对它们扩产和建设的速度非常不满意。

我们可以继续观察。

你刚才提到了DeepSeek。市场对DeepSeek最简单的反应是:好,未来这些模型会以极低成本做到前沿模型95%的效果。

如果往前快进两年,我这样一家小公司,可能就没必要每年花100万美元买token了。但现在真实情况看起来并不是这样。我很好奇,在你看来,为什么会出现这种落差?

加文 我觉得最有意思的,是前沿模型到底能赚多少钱。

AI在模型这一层创造了很多经济价值。但让我意外的是,到目前为止,这些价值绝大部分还是流向了最强的前沿模型,而不是那些更便宜的开源模型。

所以,对投资人来说,最关键的问题就是:这种情况会不会持续?未来企业和用户是否还会继续为最强模型支付高价?

我还记得Gemini 3.1 Pro刚出来时,我觉得非常震撼。它太好了。

但今天再用,已经让人很难忍受了。

这里面可能有一个动态:很多公司会先用最强的前沿模型做原型,验证产品能不能跑通;但真正投入生产时,它们可能会转向成本更低的方案,比如Vertex,或者一些开源模型。(也就是说,最强模型可能负责“探索和打样”,便宜模型负责“大规模落地”。)

但即便如此,今天的事实仍然是,绝大多数经济回报还是来自前沿token。(这里的“前沿token”,可以简单理解为用户调用最强模型时消耗的token,也就是最贵、最强那部分模型服务。)

这点很出人意料。

这种情况会不会继续下去,我觉得是一个非常有意思的问题。经历过Gemini 3.1,再经历Opus之后,我对这个问题变得开放了很多。

我也在用Grok 4.3。它在帕累托前沿上。

(所谓帕累托前沿,简单说,就是在“模型有多聪明”和“使用成本有多低”之间,做到最优组合的那条边界。)

现在处在帕累托前沿上的公司是……

顺便说一句,这是一个很大的变化,也是我们上次聊过那件事的结果:谷歌因为在TPU v8 上做了非常保守的设计选择,试图部分摆脱博通,结果失去了token成本的领先地位;而英伟达还在继续做更激进的选择。

以前是谷歌主导帕累托前沿。我认为,这是分析AI实验室时最重要的指标。

9个月前,谷歌主导这条前沿。在帕累托前沿的每一个点上,OpenAI、xAI 和 Anthropic 都在谷歌里面。(意思是,它们要么同样成本下没有谷歌聪明,要么同样智能水平下成本比谷歌高。)

但现在,帕累托前沿主要由Anthropic和OpenAI主导。Grok 4.3也在这条前沿上。它显然是最好的低成本5000亿参数模型。

Gemini 3.1则像是勉强挂在帕累托前沿上。如果让我猜,我会说谷歌现在是出于自尊在补贴它。

我还想说一点:如果理查德·萨顿(Richard Sutton)的“苦涩教训”被打破,那一定是这笔 AI交易,也是整个AI叙事最大的风险。

所谓“苦涩教训”,简单说就是:从长期看,更多算力和更多数据,通常会胜过人类设计出来的精巧算法。(也就是说,不是人类想出一个特别聪明的小技巧就能赢,而是规模更大、算力更多、数据更多的系统往往会赢。)

不过,越接近AI的人,越怀疑这件事会被打破。

我认为3月市场走弱的一个原因,是TurboQuant,谷歌的一种内存优化技术。一年前已经有论文写过。

当时谷歌正和美光、三星、SK海力士谈长期协议,也就是可能锁定很长时间高价格的 LTA。就在谈判过程中,谷歌把TurboQuant 放了出来。

人们做什么,永远比他们说什么更重要。

谷歌只是把它在X上宣传了一下。然后它就病毒式传播了。大家开始说:“天哪,DRAM完了。这里有一个DRAM优化技术。”

但我找不到地球上任何一个AI 工程师相信 TurboQuant 会对DRAM需求产生实质影响。

不过,即便如此,违反“苦涩教训”仍然是真正的风险。

也就是说,如果某一天真的出现一种算法突破,让模型在不需要更多算力、不需要更多数据的情况下,也能大幅提升能力,那整个AI基础设施投资逻辑都会受到冲击。

(因为今天大量投资都建立在一个前提上:更强的AI需要更多算力、更多芯片、更多内存、更多数据中心。)

这是真正的风险。

我认为,真正构建这些模型的人,对这个风险比较怀疑。(也就是说,他们不太相信单靠某个算法技巧,就能绕开大规模算力这条路。)

我之所以没有那么怀疑,是因为我觉得我们已经非常接近ASI(人工超级智能)。谁知道“苦涩教训”对一个400智商的模型还是否成立?

也许我们会经历一个短暂阶段。比如你真的走到ASI,它首先想要的,可能就是让自己更聪明,也拥有更多资源。

它会怎么做?它会让自己变得更高效。

所以我认为,这确实是一个风险。

人类本身也包括在“苦涩教训”里。(换句话说,过去是“更多算力胜过人类小聪明”;但如果 AI 本身变得远比人类聪明,它也许能设计出人类想不到的优化方法,短暂打破这条规律。)

我们很快就会知道,这条教训是否适用于300智商的AI,然后是400、500、600智商的 AI。

到某个阶段,我们也许会因为AI或ASI,看到对“苦涩教训”的短暂违背。

AI现在正从“无限量套餐”转向“按杯付费”

帕特里克 我很好奇,你怎么看模型周围的一些新创新?比如持续学习和记忆,这两个方向现在很多人都在关注。大家似乎觉得,它们可能会带来下一个新范式。你怎么看它们的作用?

加文 我认为,在记忆这件事上,我们已经通过这些harness做了很多。

事实证明,harness engineering没有模型本身那么重要,但它真的很重要。而且现在,harness和模型越来越多是在一起开发的。

你可以简单把harness理解成模型运行时所在的环境。它知道工具在哪里,会帮模型建立上下文、记忆和状态,也会包含一些非常具体的提示词和指令。

帕特里克 它会带来很大差别。即使是很简单的版本,也会有差别。

加文 差别惊人。

我说过作为投资人,你至少要每月花250美元,去买最高档的AI版本。只有这样,你才能对AI的真实能力形成自己的直觉。

但现在,这已经不够了。

如果你想理解今天前沿AI真正能做什么,即使不是写代码的用途,你也需要用ClaudeCode或Codex,而且需要企业版方案。

原因是,AI模型已经开始转向按使用量计费。我认为,这也是谷歌失去成本领先之后带来的一个变化。

如果你用的是每月250美元、300美元或者280美元那种套餐,你会受到非常严格的速率限制。你拿到的是一个被限制了能力的AI版本。

我们刚才也说过,Claude现在生成的token少了70%。

如果你希望Claude和它的harness按照它们真正认为必要的方式去思考、去输出,从而给你一个好答案,那你就必须用按量计费方案。

顺便说一句,这对AI行业非常利好。

我在2005年到2007年做过电信分析师。蜂窝通信在此前10年一直是一个很好的增长行业,原因就在于,它同时有固定套餐和超额使用后的按量收费。

比如,你每月有900分钟通话时间,超过以后,就按使用量付费。

蜂窝通信什么时候不再是一个很好的增长行业?就是所有人都转向无限量套餐的时候。

长途电话也是一样。

AI现在正从“无限量套餐”转向“按杯付费”。事实证明,人们真的很喜欢和远方的朋友聊天,真的很喜欢用手机,也真的很喜欢用AI。

尤其是现在,一个人可以同时让100个agent工作。

所以我认为,转向按使用量计费,可能就是为什么今年我们会看到OpenAI和Anthropic的ARR远远超过2000亿美元。

因为不只是更多算力会上线,它们还可以通过这些企业级按量方案,提高前沿token的价格。

但这也有点令人难过。

对整个世界来说,这有点令人难过。因为这意味着,如果你付不起这个钱,你就接触不到最前沿的AI。

至于持续学习,天哪,如果我们真的解决了这个问题……

帕特里克 你怎么理解持续学习?

加文 人类大脑有太多谜团。和AI相比,人类是非常简单、非常高效的学习者。

我记不清具体数字了,但AI需要的样本量……

帕特里克 差了好几个数量级。

加文 对,差了很多个数量级。

今天,在某些事情可以被验证的情况下,我们已经有一种很粗糙的持续学习版本。比如,在训练阶段做强化学习。

但真正的持续学习,是模型能够动态调整自己的权重,或者以某种方式实时更新自己。

帕特里克 就像人类那样。

加文 对。比如我第一次把手伸进火里,就会学到一件事:以后绝不能再把手伸进火里。

但今天的模型可能需要把手伸进火里100万次,然后模型设计者还要在下一轮训练里,或者在一个强化学习环境里,把“火”这个场景放进去。它才会真正学会。

所以我认为,它必须能够动态更新权重。但我也相信,除了这个方向之外,人们还在研究很多非常聪明的方法。

如果我们真的实现持续学习,那就会出现非常快速的起飞。现在很多人似乎很有信心,认为持续学习已经不远了。

我认为,这是第三个重大问题。

第一,ASI会不会导致“苦涩教训”被打破?也就是说,真正打破它的不是人类的小聪明,而是超级智能本身。

第二,前沿token是否还能维持今天这样的溢价?

第三,我们会不会实现持续学习?如果会,什么时候实现?

新的芯片公司要成功,要满足三点

帕特里克 新的芯片公司在这一切中扮演什么角色?

我们聊了很多英伟达,以及它和台积电、英特尔这些公司的关系。现在有一千朵花在开放,可能真的有上千家公司在尝试做新的芯片,想解决这个瓶颈里的某一部分。

我很好奇,你怎么理解这个领域、这个机会,以及它们会扮演什么角色?

加文 我认为这对世界来说是好事,也是健康的。对黄仁勋来说也是好事。因为如果换一届政府,可能会有不同看法。

竞争对所有人都有好处。

在坦克设计里,人们会讲“铁三角”。更通俗地说,就是一个“不可能三角”:攻击力、防御力和机动性不可能同时拉满。

原因很简单,防御越强,也就是装甲越厚,坦克就越重,机动性就越差。所以你必须在这个三角里做取舍。

比如以色列的梅卡瓦坦克,就是更偏向防御。俄罗斯坦克和豹式坦克,一般更偏向机动性。

芯片设计也是一样。

你必须活在一些由物理定律决定的根本约束里,而这些约束已经写进了台积电的设计规则。

TPU、Trainium(亚马逊为机器学习训练和推理设计的自研加速器)和AMD,本质上都在试图成为一个更好的GPU。

今天来看,我认为Trainium可能做得最好。

当然,没有谁真的已经做出了一个更好的GPU。但Trainium,我觉得它已经开始在“扯超人的披风”了。

而且这还没有真正开始。Trainium3 还需要进入量产爬坡,因为它有switch scale-up network,也就是交换式的scale-up网络。要想经济地推理MoE模型,这种网络非常重要。

很多公司的架构还是torus架构,谷歌以前就是那样。

AMD方面,我们还要看。MI450现在还不清楚。相比MI450,我们可能对Trainium3知道得更多。

但这是一场很难玩的游戏。所以你必须做一些不一样的事情,而且这件不一样的事情本身也必须很难。

我的经验法则是,1%的市场份额就值1000亿美元。而1000亿美元已经是一个非常好的风投结果。

这种状况下,黄仁勋会说:“好,如果有人做了一个不同的东西,并且拿到1%、2%或者3%的份额,那我们就会去做那种芯片。”

这件事会发生在所有人身上。

但如果你只是想做一个更好的GPU,那祝你好运。如果你要做不同的东西,它也必须很难做。

你可以做不同的取舍。

prefill和decode的解耦,确实打开了更大的设计空间,让芯片设计师可以做不同的选择。

prefill可以简单理解为模型读入上下文、理解问题;decode则是模型生成答案、写出输出。

我有一位很棒的同事,叫安德鲁·福克斯(Andrew Fox)。他说,你可以想象一艘18世纪的英国海军战舰。prefill是给大炮装弹,decode是开火。

prefill本质上就是模型理解问题、理解prompt,并且持续跟踪自己正在生成的答案。

它受内存容量限制。

decode是生成新token的过程,它主要受内存带宽限制。

所以,如果你是芯片设计师,这会给你一块更大的画布,让你可以作画。

但即便如此,你做的事情也必须很难。

因为如果你只是围绕那个“不可能三角”做一些不同取舍,比如优化内存容量,但这些取舍并不难,那英伟达也会做同样的取舍。

而且,它们从台积电拿到的价格,会比你能拿到的价格好得多。

英伟达还有另一个优势:它们和每一家模型公司都在合作,可以不断用真实需求来优化自己的设计。

顺便说一句,还有一件很有意思的事。

如果你是一个风投,正在投资一家半导体公司,而这家公司告诉你,它们会因为某种台积电工艺获得优势,因为它们对这个工艺有特殊访问权。

我可以向你保证,当这个工艺还只是台积电脑子里的一个念头时,黄仁勋就已经看过了。

而且英伟达对这个工艺的了解,远远超过这家只有200个人的小公司所能想象的程度。

台积电以及供应链里的每一个人,都会把所有东西拿给黄仁勋看。就像它们会把所有东西拿给亚马逊、AMD、TPU团队看一样。

这也是为什么我说,不要试图做一个更好的GPU。你可以做一些不同的东西你可以在prefill这块画布上作画,也可以在decode这块画布上作画。

但你做的东西必须很难。因为一旦它做大了,你马上就会遇到那几家巨头,它们会成为非常快的跟随者。

我们公司曾经是Cerebras的风险投资人。

Cerebras 做的是一件很难、而且从根本上不同的事,也就是晶圆级计算。它当然有一系列取舍,但他们当初做出的架构选择非常难,也让他们能做一些别人做不了的事。

我们会看到这件事最终能做多大。

他们现在也在做一些非常酷的事情。Cerebras 面临的一个问题是,一旦你需要把很多芯片连接在一起,搭建 scale-up 或 scale-out 网络,你就需要大量IO。而IO会受到所谓shoreline的限制,也就是芯片边缘长度的限制。

所以,Cerebras的片上计算和内存,相对于芯片边缘IO来说,比例非常高。

但他们是非常聪明的人。他们做了一件非常难的事。现在他们在探索,能不能把一片光学晶圆直接放在上面。如果能做到,就可以解决这个问题。

我相信他们也在研究DRAM的混合键合,去绕开一些所谓的限制,而那些限制并不一定是真限制。

理论上,Cerebras的机器可以运行任何规模的模型。只是对于某些模型规模,它的表现会比其他规模更好。

所以我觉得Cerebras有意思的地方就在于,它做了一件不同的事,而且这件事真的很难。晶圆级计算非常难。

我确实认为,这些新芯片公司有自己的位置。我也会鼓励所有人:做不同的取舍,而且做一件困难的事。

Cerebras IPO之后,大家都会融到钱。融资不会是问题。但Cerebras花了三代芯片,才把这件事做对。

帕特里克 对,现在已经是一家10年历史的公司了。

加文 这真的很难。

你看安德鲁·费尔德曼(Andrew Feldman),也就是Cerebras的CEO,就能看出来他和整个团队走到今天有多不容易。

这些公司需要有那种韧性和抗压能力。

第一颗芯片失败了,这很正常。问题是,你能不能回来做第二颗芯片?

关于这个话题,我还想说最后一点,这会极大提升GPU的使用寿命,甚至可能凭一己之力拯救私人信贷。

帕特里克 多讲讲。你说私人信贷是什么意思?

加文 私人信贷现在正因为那些SaaS贷款承受压力。不管这些贷款现在已经减记了多少,我觉得可能还得继续减记。

原因很简单,如果连上市公司都很难适应这个新世界,那一家背着大量债务的公司,要怎么适应?它又怎么去投资一门利润率结构完全不同的新业务?

但另一方面,私人信贷也投了很多GPU相关资产。

他们当初给这些GPU融资时,我猜大概是按3年或4年的使用期限去算的。

但因为推理现在被拆开了,我认为这些GPU的实际使用寿命可能会变成10年,甚至15年。

AI怀疑论者会说:“这些公司都在做账。GPU的使用寿命只有一两年。CPU的使用寿命也只有4年,因为技术变化太快。”

但我觉得不是这样。

技术快速变化带来的结果,不是让这些老GPU立刻报废,反而是因为prefill和 inference被拆开了,它们可以被重新分工使用。

你可以把Cerebras系统,或者Groq的LPU,放在Hopper 甚至Ampere前面。英伟达实际上也通过收购获得过相关能力。

这样一来,Hopper和Ampere这些老GPU仍然可以负责prefill,也就是读入上下文、理解问题的那部分工作。它们的使用寿命就可以一直延长,直到硬件真的烧坏为止。

当然,它们确实会烧坏,硬件总有物理寿命。但也许你不需要让它们跑得那么满、那么快。

这对整个私人信贷行业都会非常有利,也会帮助AI基础设施继续融资。

因为如果你可以用更接近5%或6%的利率去给GPU融资,而不是像CoreWeave那样最低融资成本也在7%出头,那从数学上就会改变整个AI建设的融资成本。

也就是说,我们现在有一种技术创新,它既能降低融资成本,也能延长地球上算力资产的使用寿命。

还有一件事也很有意思。Altimeter Capital 的贾明·鲍尔(Jamin Ball)最近做了一档播客,Coatue也出过一份报告。他们讲到,短缺的卖方表现远远好于短缺的买方。所谓短缺的买方,就是那些科技巨头。

但如果你已经拥有一个巨大的装机基础,而这个东西现在正处于短缺状态,那同样是一个非常好的位置。

我们现在也听到,在Agentic world,也就是智能体世界里,CPU变得比以前重要得多。

因为CPU要负责很多编排、工具调用,以及各种协调工作。而全球最大的CPU集群,就在那些科技巨头手里。

所以我认为,这些科技巨头中的一部分,可能会在某种程度上追上那些“短缺的卖方”。

帕特里克 我想把“不同而且困难”这个想法,从基础设施之外拿出来聊聊。

你现在开始和很多新创始人交流,也和那些必须适应这个新世界的现任CEO、创始人交流。

你看到的那些最AI原生的创始人,不是做芯片、基础设施或模型,而是用AI去创造其他东西的人,他们和过去的创业者相比,最不一样的地方是什么?你有没有观察到一些差异?

加文 首先,我觉得这不只是芯片设计的问题。对我来说,这一直是风险投资里的一个根本问题。有些想法,一旦说出来,全世界都会觉得显而易见。

如果你投的是这种东西,而且它本身又不难做,那就很危险。因为在你建立规模之前,如果这个机会已经变得人人都懂,你就麻烦了。

规模才是最终的优势。

亚马逊当年的幸运之处就在于,电商这件事对很多人来说可能是显而易见的,但对传统零售业CEO来说并不显而易见。

而且亚马逊非常聪明。只要有风投投了一家电商公司,亚马逊就会去打它们。

亚马逊会说:“哦,这很可爱。那我们就把这个品类的利润率打到负10000%。”

Wayfair那些人之所以能活下来,是因为他们做了一件很难的事。亚马逊试图杀死它们,但没有成功。

那些CEO在运营上非常强,真的很能打。

所以在风险投资里,我总会问一个问题:在这家公司真正建立规模之前,这件事会不会已经变得人人都懂?

或者反过来,它是不是既不显而易见,又足够不同,而且真的很难做?

我认为,很多AI创业者现在都在这个问题上挣扎。

他们很担心,因为按照黄仁勋那套“五层AI蛋糕”的说法,今天的利润正在流向能源、数据中心、芯片和模型,但并没有真正流向应用层。

Cursor和Cognition已经做到了一定规模。它们专注于编程。18个月前,真正专注于编程的是Cursor、Cognition和Anthropic。而专注代码这件事,事后看是非常正确的。

Replit的创始人阿姆贾德·马萨德(Amjad Masad)发过一条推文,我觉得非常聪明。

大意是,有一个接近“苦涩教训”的事实:编程可能是通向ASI和有用AI的最短路径。

因为如果一个AI真的非常擅长编程,它就可以给自己写代码,去做几乎任何事情。

所以我认为,这几家公司高度专注于编程,是非常聪明的。而且它们大概都已经做到了一定规模,足以在这个生态里拥有自己的位置。

我觉得Cognition正在做一些非常非常不同的事情。

但很多创始人真的很挣扎,他们真的很挣扎。他们现在想证明一件事:在一些更垂直、更细分的领域里,他们可以先到达那里。

也就是说,在模型公司进入这个细分领域之前,先建立起数据护城河。

或者证明这个细分领域足够小,模型公司不会亲自下场做,但它又足够大,仍然能带来风投意义上的回报。

模型公司面对的新囚徒困境

帕特里克 这和你说过的token path有关吗?我知道你以前跟我提过这个词。

加文 这个说法大概是来自Altimeter的贾明·鲍尔。他说,如果你是一家软件公司或者任何形式的AI公司,你必须处在token path上。

Databricks 就在token path上。类似的公司也在token path上。

所谓token path,可以简单理解为你的产品或数据,必须参与到AI生成、调用、处理token的过程中。换句话说,你不能只是站在AI旁边,而是要嵌在AI工作流里。

如果你不在token path上,又不是做某个非常细分、非常特殊的东西,那日子可能会很难。

即使是在这些垂直细分领域里,如果你和模型公司的人聊,他们对其中一些机会也会比较怀疑。

因为这些细分领域里产生的数据,本质上还是人类产生的数据。

而你的赌注是你可以用这个狭窄垂直领域里的专有数据,训练出一个成本低于前沿实验室未来能做到的模型。

也许这是个不错的赌注。但我认为,你必须非常非常小心。

另一方面,如果未来前沿token相对于其他token的溢价下降,应用层就会出现一场巨大的价值创造。

我还有一个很重要的观点,我相信只要黄仁勋愿意,他大概也可以做到接近前沿模型。

帕特里克 用他自己的模型?

加文 用他自己的模型。英伟达正在做一些非常酷的东西,比如Pneumatronics。

帕特里克 就像乔尔·斯波尔斯基(Joel Spolsky)会说的,“商品化你的互补品”。

加文 对,但我不认为黄仁勋想这么做。

某种程度上,OpenAI和Anthropic是在试图对他做这件事。但它们并没有成功。

所以逻辑其实很简单。黄仁勋是一个非常讲逻辑的人,这就是合乎逻辑的反制动作。

你会看到,开源模型会在一段时间里,一直落后真正的前沿模型。

今天所谓的开源前沿,主要是一些中国模型。

中国开源模型在资源非常受限的情况下,确实做出了非常了不起的东西。只是其中有不少蒸馏。

这也是为什么我认为,Anthropic它们不只是没有足够算力来服务 Mythos,也是不想让Mythos被别人蒸馏。

它们想自己用Mythos,自己蒸馏它,再用它来给下一个模型做强化学习,或者做其他事情。

最终,如果OpenAI觉得经济上划算,任何处在前沿的公司都会面对一个非常有意思的博弈论问题。

我们之前谈过旧的囚徒困境:你必须持续投入、持续花钱,否则就会落后。

新的囚徒困境会是:如果你站在模型前沿,你到底要不要通过API把这个模型放出来(给外部客户调用)

(不开放,可以保护模型,避免别人拿你的输出去蒸馏和追赶;但开放,又能带来大量收入、用户和现金流。问题在于,只要有一家前沿公司先开放,其他公司就很难不跟。)

如果其中有一家公司背叛,选择把模型通过API放出来,它就会拥有最好的模型,获得大量收入和现金流。

而资源就等于智能。

它会开始拉开差距。然后这会迫使其他所有前沿公司也把模型放出来。

这就是新的博弈论。有点像前面说到的台积电、三星和英特尔之间的博弈。

现实是,如果英伟达或AMD这样的公司,真的开始认真使用某一家其他晶圆代工厂,那家代工厂会很快变好。

所以我确实认为,黄仁勋会让开源模型在一定时间里落后于真正前沿。我觉得这会非常值得观察。

顺便说一句,开源也是要变现的。

“开源是免费的”其实是一个误解,开源token也要消耗能源。生成这些token需要能源,也需要GPU。而开源模型公司几乎总是会拿到收入分成。

我正在努力成为机关枪大师

帕特里克 你们怎么为Mythos-3、Mythos-4的世界做准备?

加文 我们正在非常重视网络安全,甚至可以说是在超前投资网络安全。

有一件事我在很多场合都说过,而且我真的相信:每个家庭、每家公司,都应该提前设一个“安全词”。

所有人都应该放下电子设备,真的去海边,和家人设一个安全词,或者和公司设一个安全词。

而且这个安全词不能是那种可以被社会工程学猜出来的东西。

这是为了防范网络犯罪。

比如有一天,像你的儿子、女儿、祖父母、父母,或者任何亲人的人给你FaceTime。它看起来完全就是那个人,是一个极其精准的模拟。

它知道所有事情,还能根据他们过去说过的话,推断出他们可能会怎么说。然后它跟你说:“给我转100万美元。”

帕特里克 这是防御层面。那进攻层面呢?或者说,从分析能力上看,你们还能做什么,是它做不了的?

加文 这是个好问题。

我最近刚看了《最后的武士》(The Last Samurai),也让公司里的人去看。

如果你没看过,我非常推荐。那其实是一部很经得起时间考验的电影,是汤姆·克鲁斯(Tom Cruise)20年前拍的。

故事设定是,汤姆·克鲁斯演一个痛苦、落魄的美国内战老兵,但他其实是一个非常优秀的军人。

他之所以痛苦和落魄,是因为他觉得自己参与了美国对原住民做的一些不好的事情。

后来,日本雇用了他。故事发生在明治维新时期,日本政府里的现代派请他训练一支由农民组成的军队,让他们学会如何和武士作战。

第一次战斗发生了。结果当然是武士赢了,尽管他们没有枪。

他作战非常英勇,所以武士决定不杀他,而是把他带回自己的村庄。

后来,他成了一名武士。

这对他来说有点像美国内战,所以他最后站在武士一边作战。

但结局是,他被一个拿着机关枪的农民屠杀了。

现在,机关枪已经出现了。如果我们不能都学会掌握机关枪,就会被机关枪掌握。

所以我正在努力成为机关枪大师

我也比较乐观。假设你是一个50岁的武士,打过很多仗,有非常丰富的战场经验。即使进入机关枪时代,你在使用机关枪时,仍然会有优势。

我乐观地认为,作为一个终身学习投资的人,我能够掌握这把“机关枪”,也就是AI这项新技术。

我可以把它整合进我自己的投资流程,也整合进我们公司的流程。这样,作为一个人,我应该还能在很长一段时间里继续贡献价值。

但和所有人一样,我现在也一直让各种agent运行着。

帕特里克 你现在最有用的agent是什么?

加文 对我来说,最有用的agent就是把播客里那些可能对我有价值的点,整理成一份非常好的摘要。

每天大概有6个小时的内容,我觉得从工作角度看,自己都应该去听、去看。

每次OpenAI、xAI、谷歌、Cursor、Fireworks、Base10的人出来讲话,更不用说黄仁勋、埃隆、达里奥这些人,我都会觉得自己必须看。

但我根本没有那么多时间。这里面有很多信息,真的是大海捞针。

还有一些东西,是我每次都特别想看的。比如,我对管理层薪酬非常敏感。他们到底被激励去做什么?他们拿的是那种很普通、甚至有点愚蠢的RSU(待满时间就能拿股票),还是PSU(业绩达标才拿股票)?如果是PSU,这些PSU具体激励他们做什么?

我觉得,有些系统已经可以很好地做第一轮筛选。

这能节省大量时间,让人把精力放在更有创造性的工作上,而不是去一页页翻代理声明,把PSU那一段找出来,再对比过去几年的代理声明,看它发生了什么变化。

这里面当然有信号,但这件事非常耗人力,而这正好适合AI。

投资里还有很多类似的事情。

所以,这是一个做投资最令人兴奋、也最让人激动的时代。

不过,我也开始有一点点担心。

市场的一些大机会在那些被错误归类的公司里

帕特里克 你是说“多样性崩塌”那件事?

加文 对,我开始有点担心。

帕特里克 你能不能再多讲一点?比如是哪类人让你担心?

加文 我现在几乎找不到一个和我类似、但不看好DRAM的投资人。

帕特里克 一个都没有?

加文 一个都没有。

现在AI里发生了很多有意思的事情。

第一,从横向比较看,很多估值完全说不通。它们就是不合理,不可能同时都是真的。

比如,有些半导体设备公司,按下一季度年化利润算,交易在40倍市盈率;而DRAM公司只交易在中个位数倍数。

上一轮周期高点时,这个差距大概是5倍对12倍,有一段时间甚至是3倍对45倍。

这些估值不可能同时都是对的。

当然,半导体设备公司的商业模式,确实比存储公司的商业模式改善得更多。我们也还不知道HBM会在多大程度上改善存储公司的商业模式。

是的,它们有一些来自零部件和维护的经常性收入,但这不足以支撑1000%级别的估值倍数差异。

我也很难把英伟达的估值和GE Vernova这类公司的估值放在一起理解。

英伟达在4月初的时候,相对整个市场,基本已经便宜到过去10年、12年里最便宜的水平之一。从绝对估值看,也非常便宜。

但你再看GE Vernova的估值,里面似乎隐含着英伟达未来会出现一个难以想象的份额损失。(英伟达卖的是AI算力的核心芯片,直接受益于AI算力需求;GE Vernova做的是电力设备、燃气轮机、电网、电力系统相关业务,受益于AI数据中心带来的电力需求。)

所以,不同股票之间的估值差异非常大。

第二,因为我们处在短缺环境里,质量最低的公司反而表现最好。

如果你是油气投资人、矿业投资人,或者自然资源投资人,并且熟悉成本曲线,这件事会非常直观。

在一个真正的商品牛市里,成本最高的商品供应商往往涨得最多。因为价格上涨对它们最有利。它们会从濒临破产,突然变成现金流滚滚。

我觉得这也是为什么商品投资非常难。

从完整周期看,质量好的公司会跑赢。但在短缺和商品牛市阶段,最强的上涨往往来自那些高成本公司。到了下行周期,这些在牛市里暴涨的高成本公司,可能就会破产,或者发生类似的事情。

你现在在很多行业里都能看到这种现象。

那些让科技巨头和买方讨厌的质量最低的公司,成本高、不可靠、零部件故障率高等等,但现在它们也卖光了,而且还在涨价。

然后这类公司一旦被X上的散户账户盯上,股票就会被一路炒上去。反而一些质量更高的投资标的,表现明显落后。

这对投资人来说很难。因为你几乎可以很确定地知道,那些三个月或六个月涨了10倍的股票,最后会跌回去。当然,这也取决于它们怎么使用手里的现金。

但低质量公司很少会聪明地使用现金。

所以这让我有点担心。一年前还非常怀疑的人,现在已经不再怀疑了。

但另一方面,当我再去看那些高质量公司的估值,它们又并没有被拉得很高。这让我感觉好一些。

我一直觉得,2024年和2025年,有人问AI有没有泡沫、谈 AI 泡沫,这件事挺好笑的。因为核能泡沫和量子泡沫明明就在你眼前。我们到底在讨论什么?

要知道,AI这件事是真实的。

但现在,核能和量子里那些荒唐的情绪,可能已经开始蔓延到一些更投机、质量更低、市值更小的AI相关股票上。

如果你在X或Reddit上影响力很大,就很容易推动这些股票。这让我有点害怕。

我只是希望市场上有更多AI空头。我也希望有更多存储空头。

比如Astera(一家做AI数据中心高速连接芯片的公司)是我长期关注的一家公司。它有很多空头,我很喜欢这一点。

我最早是在C轮投它。所以,如果你觉得自己能比我更准确地给它定价,那祝你好运。如果你认为它是所谓的“铜缆输家”,那我也只能祝你好运。

你还能感受到市场里各种basket,也就是篮子交易和杠杆篮子。你被市场放进哪个篮子,非常重要。

(大家觉得某些公司都受益于铜缆,就把它们放进“铜缆篮子”;觉得某些公司都受益于光通信,就放进“光模块篮子”。一旦资金开始买卖某个篮子,里面的股票就会一起涨跌,不一定完全取决于公司本身基本面。)

比如铜缆、光模块、DRAM、NAND,这些都是不同的篮子。

今年发生了一件很有意思的事。

2024年和2025年,AI交易基本是一起走的。所以你可以做多GPU 算力、scale-up networking 和光通信scale-out,同时做空电力。

从风险管理角度看,这个交易是有效的,因为我非常关注因子暴露。

但今年1月,这套逻辑被打散了。

比如,scale-up networking可能疯狂上涨,而scale-out在下跌;或者DRAM大幅跑输NAND和HDD,这在过去并没有发生过。

所以,AI内部这些横向相关性真的瓦解了。你必须看得非常细。

你不能再随便用半导体设备公司或NAND股票去对冲DRAM风险,因为它们现在不一定一起涨跌了。

今年1月,AI内部的横截面关系发生了非常有意思的变化。

我认为其中一个原因可能是,AI的能力已经到了一个水平,很多投资人突然可以借助AI,很快弄懂这些细分领域,比如铜缆、光模块、DRAM、NAND、scale-up、scale-out,然后开始交易它们。

接着,这些股票又被放进不同的交易篮子里。而这些篮子本身的买卖,反过来又会影响个股价格。

帕特里克 AI在创造价格效率。

加文 对,完全正确。

我认为除了那些我觉得可以长期复利、而且比较安全的高质量公司之外,一些大的机会就在那些被错误分类的公司里。它们和那些低质量、令人害怕的公司不一样。

比如Astera被放进了很多“铜缆输家”的篮子里。

但Astera最大的产品会是交换机。连接交换机和加速器时,会同时用到铜缆和光通信。

所以从定义上说,如果你是一家交换机公司,或者一家加速器公司,你就不可能是铜缆输家,因为你正好在那条连接的另一端。

关于谷歌、Meta、亚马逊和微软的点评

帕特里克 我想请你用一两句话点评一下几家主要公司,比如谷歌、微软、亚马逊这些上市巨头。现在很多讨论都围绕那些令人兴奋的新公司展开,但这些主要玩家也很重要。

加文 当然。

先说谷歌。去年它非常了不起,因为它有TPU优势。但这个优势现在已经消失了。

我认为谷歌仍然处在很好位置,原因是它拥有最多算力。我们刚才谈过,在短缺环境下,已有装机基础的价值会变得更高。

而谷歌拥有最大的算力装机基础。

但我确实有点惊讶,它现在表现出某种无力感。

Google I/O 就在本周(5月19日举行)。如果谷歌这次不能发布一个至少略微超过OpenAI 或Claude 的模型,那会很值得关注。

这不是说谷歌就完了,当然不是。只是这会说明,我们之前谈到的“英伟达效应”可能比我想象得还要强。也就是说,英伟达的GPU、网络、软件和整个生态,可能正在给 OpenAI、Anthropic、xAI 这些公司带来更强优势,即使谷歌有自己的TPU,也未必能轻松领先。

所以我非常好奇,等谷歌发布新东西之后,整个模型竞争的帕累托前沿会怎么变化。也就是,谁能在“模型能力”和“使用成本”之间做到最优组合

对谷歌来说,这次发布会是一张很重要的牌。

不过谷歌拥有的数据量非常大,尤其是YouTube数据,确实很有价值。在机器人时代,这些数据真的有价值。

再加上它拥有的算力,以及搜索业务,谷歌永远不会处在一个很差的位置。你也可以从GCP的高速增长里看到这一点。

Meta方面,你必须给扎克伯格很大认可。

他把Meta内部变成一家AI-first公司,这件事做得非常了不起。我确实认为,在那些真正的互联网巨头里,只有他做到了这一点。

这一点我非常认可。

他当时愿意为AI人才付出高价,开出那些10亿美元级别的合同,我也非常认可。

Muse 我觉得是一个很大的上行惊喜。这是MSL的第一个模型。它还没有进入 xAI、谷歌那个单一模型,以及OpenAI和Claude所在的帕累托前沿,但已经相当接近。

这让我印象很深。

所以我认为Meta的位置比以前好了。它的绝对位置仍然没有谷歌那么强,但它正在变好。

而你也知道,在市场里,变化率比绝对水平更重要,尤其是在三年左右这样的中短期时间框架里。

在更长周期里,竞争优势的绝对水平通常会占主导。但即便如此,变化本身也非常重要。

亚马逊,我认为它处在非常强的位置,因为它有Trainium。

未来18个月,你会在亚马逊零售业务里,看到机器人带来的真实损益改善。

我其实认为,Nova这些内部模型虽然还没有达到Muse的水平,但比外界给它们的评价要好。

微软方面,我认为萨提亚·纳德拉(Satya Nadella)是一个非常聪明的人。但在投资人交流里,大家谈他的方式已经不像以前那样了。

我喜欢萨提亚,也钦佩他。我认为他是一位非常出色的CEO。我也非常认可他过去做过的很多决策。

但你也知道,微软当初的姿态是要用AI和搜索挑战谷歌;三年后,萨提亚更像是在亲自承担Copilot的产品压力。

我很想知道,在OpenAI那次政变期间,萨提亚是否后悔过自己的选择?他是否希望自己当时支持的是伊利亚(Ilya Sutskever),而不是萨姆(Sam Altman)?他是否希望今天真正运营OpenAI的,是伊利亚和米拉(Mira Murati)?

我真的很想知道他内心深处的答案。因为如果是那个世界,微软和OpenAI的关系可能会非常不同。

这是一个非常有意思的问题,但我们永远不会知道答案。

不过,我还是很认可他。

他现在正在做的事情,是在冒险。这也回到一点:在不确定性很高的环境里,你必须做决策。你不仅要决定花多少钱,还要决定把钱花在哪里。

我认为,微软在2025年初确实犹豫了一小段时间。

它们原来有一个算法:我们花这么多资本开支,就会得到这样的回报。但那个算法失灵了。如果你犹豫,你就会失去位置。你会失去所有这些资源分配,而且之后很难拿回来。

所以它们当时犹豫了。虽然市场因此惩罚了他,但我认为现在萨提亚正在做的决定,是正确决定。

这个决定是,“我们要把算力用于内部”

谁知道如果它们愿意直接把GPU卖给OpenAI,Azure会增长多快?但它们选择把算力用于内部,让自己的产品变得更好。

Copilot之所以这么差,或者过去这么差,一个原因就是算力不够。它们现在正在修复这个问题。

萨提亚放弃了很多东西。我的意思是,如果微软今天把所有GPU都用来服务OpenAI,以及Anthropic的需求,而不是用于自己的产品,微软股价大概已经是800美元了。

所以,我很认可他做了一个伟大的决定。

真正有意思的是,这些公司在决策上与外部世界互动的程度差异很大。

和创业公司互动最深的两家公司,远远领先的是亚马逊和英伟达。然后是谷歌,谷歌也有非常密集的互动,强度排在下一档。

博通的互动方式不一样。它基本上是所有人最喜欢的ASIC供应商。

如果你是一家创业公司,第二代芯片能和博通合作,会被认为是升级。如果第一代芯片就能和博通合作,那简直是天降甘霖。

然后你会看到,AMD、微软和Meta与创业公司的互动几乎为零。

我说“几乎为零”,当然有一点夸张。但我确实很好奇这些公司为什么会做出这样的选择。因为现在一些最好的团队,已经不在大型上市公司里了,而是在这些小型创业公司里。

我认为这最终会成为英伟达的一个很大优势。亚马逊、谷歌紧随其后。它们和创业公司之间有这种互动,而你在其他科技巨头那里基本看不到。

对于AI的乐观以及担忧之处

帕特里克 我们已经非常详细地聊了受影响最大的具体公司,也聊了一点应用层,以及如果更多价值要流向这一层,需要发生什么。

我很好奇,在这个世界变化得这么快的过程中,你还在想哪些有意思的连锁反应?

加文 这确实很疯狂。

在应用层,先别说价值有没有流入,价值实际上已经被毁掉了。

帕特里克 没错。

加文 从净值上看,AI已经在应用层毁掉了很多价值。

即使把Cursor、Cognition 这些最成功的AI原生公司算进去,AI在应用层毁掉的价值,也已经是数万亿美元级别。

在这个背景下,我觉得有一点值得我们注意:今天表现最好的公司,那些估值涨得最快、真正创造经济价值的公司,往往是那些“每个人对应的有效GPU数量”最高的公司。

也许这只是说明,未来每个人都会拥有很多GPU资源。但无论如何,这是一个很有意思的现象,我们需要意识到这一点。

我还想说一点,可能有点黑暗:我越来越担心个人安全。

我真的越来越担心这件事。尤其是那些公众曝光度更高、和AI关系更深的人,我特别担心他们的个人安全。

我希望不要发生什么悲剧。

但美国现在政治暴力正在上升。而随着AI越来越政治化,我担心这种暴力会越来越多地指向AI领域的关键人物。

不管我们怎么看OpenAI,也不管我个人对OpenAI有什么看法,有人向萨姆·奥尔特曼的家扔燃烧瓶,这都是一件非常糟糕的事。

我担心因为AI我们正在进入一个波动更大、风险更高、尾部事件更多的世界。

这既关系到我个人,也关系到这盘棋上的那些重要玩家。

你再想想这在地缘政治上意味着什么。

如果美国因为AI优势获得压倒性地位,这对美国当然是好事。但对世界其他国家来说,它也可能带来不稳定。

我对AI仍然非常乐观。我相信它会给世界带来非常好的东西。

我认识的一个人,他的女儿被诊断出一种非常罕见的基因突变,而且没有现成的治愈方法。

他调动了很多资源,也从一些AI实验室拿到了大量算力。那些实验室知道了这件事,也愿意提供帮助。

然后,他启动了大量agent,用AI在现有药物里寻找可能影响这种疾病的药物。后来,他又创办了一家公司,希望真正治愈这种病。

因为AI,他女儿的人生已经发生了巨大变化。这种变化几乎无法衡量。

所以,我是一个AI乐观主义者,而且可以说是极度乐观。

但我也承认,AI有点像一个事件视界(一旦越过这个边界,事情就不可逆了,你没法再回到原来的状态,也很难看清边界另一边到底会发生什么)。

它一定会成为一个不连续点。社会必须一起穿过它,也必须一起学会应对它。

我认为勒德主义者(那些反对新技术、害怕技术取代人类、认为技术进步会伤害普通人的人)。最终会是错的。

但我们也必须非常认真地对待他们的担忧。我们必须确保AI对所有人都有好处。

现在最好的AI只对有钱人开放,这确实有点反乌托邦。

这个问题必须解决。

我们需要带着谦卑面对这一切,承认其中有很多不确定性,然后认真、审慎地处理。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载