科技 > 互联网 > 正文

加文·贝克最新对话：细谈前沿模型、晶圆及巨头格局

IT之家

下载客户端
独家抢先看

2026年05月25日 15:00:00 来自山东

原标题：加文·贝克最新对话，细谈前沿模型、晶圆及巨头格局：如果只能盯一个指标来判断AI泡沫，我会盯台积电产能决策

1、我觉得Anthropic烧掉的钱，可能比OpenAI少80%。

2、AI现在正从“无限量套餐”转向“按杯付费”，可能就是为什么今年我们会看到OpenAI和Anthropic的ARR远远超过2000亿美元。不只是更多算力会上线，它们还可以通过这些企业级按量方案，提高前沿token的价格。

3、我认为，电力短缺可能会从2027年、2028年开始缓解。然后，轨道算力会真正解决这个问题。

4、事实上，按照历史上所有基础性新技术的市场先例，像AI这样的技术，通常都会经历泡沫。

5、现在这一轮建设有一个很大的好处，就是它仍然主要由经营现金流来融资。这和2000年相比，是非常重要的区别。

6、我一直比较乐观，认为今天这种根本性的晶圆短缺，也就是目前实际上由台积电控制的短缺，可能会阻止泡沫出现。

7、如果只能盯一个指标来判断会不会出现泡沫，我会盯台积电的产能决策。

8、技术快速变化带来的结果，不是让那些老GPU立刻报废，反而是因为prefill和 inference被拆开了，它们可以被重新分工使用。

9、如果某一天真的出现一种算法突破，让模型在不需要更多算力、不需要更多数据的情况下，也能大幅提升能力，那整个AI基础设施投资逻辑都会受到冲击。这是真正的风险。

10、在风险投资时，我总会问一个问题：在这家公司真正建立规模之前，这件事会不会已经变得人人都懂？或者反过来，它是不是既不显而易见，又足够不同，而且真的很难做？

11、除了那些我觉得可以长期复利、而且比较安全的高质量公司之外，一些最大的机会就在那些被错误分类的公司里。

12、我认为亚马逊处在非常强的位置，因为它有Trainium。未来18个月，你会在亚马逊零售业务里，看到机器人带来的真实损益改善。

听加文·贝克（Gavin Baker）最近这场对话，有一种扑面而来的AI加速感。

“我从来没有见过这样的指数增长。"

他指的是Anthropic——一个月新增110亿美元年化经常性收入，相当于Palantir、Snowflake和Databricks这三家最受关注的SaaS公司各自花十年才达成的合计规模。加文用“美国商业史上最非凡的时刻”形容此刻。

加文1999年从Dartmouth毕业，本科是经济学和历史双主修（这一点和他对铁路泡沫、运河泡沫、互联网泡沫如数家珍的历史感是有关系的）。

同年加入富达，一待18年。期间先后覆盖半导体、医药、零售、消费、电信、媒体几乎所有重要行业，做过多只Select基金的经理，2009年接掌旗舰科技基金富达OTC（FOCPX）8年。这只规模峰值约170亿美元的基金，任内年化复合回报约19.3%，跑赢99%的Morningstar同业。

2013年起，他在富达内部牵头一级市场投资，早早进入SpaceX、Twilio、Cloudflare、Roku、Redfin等公司。

这段经历让他在2019年1月自立门户创立Atreides Management时，把一二级市场打通做跨界基金。

他本人也是Cerebras、Astera Labs这些AI芯片公司的早期投资人，对英伟达的投资关注持续20多年。

对话人是投资播客Invest Like the Best的主理人帕特里克·奥肖内西（Patrick O'Shaughnessy），两人非常熟稔。

这一次围绕的核心是电力与晶圆，AI建设的两大天花板。加文细致拆解了产业各方将如何分别应对：地面涡轮机扩产、SpaceX用激光连接的“轨道算力”、台积电对扩产节奏的微妙拿捏、Terafab这样的新晶圆厂入场打破单一供给。

他说，如果只能盯一个指标来判断AI会不会出现泡沫，我会盯台积电的产能决策。

围绕这条主线，对话延伸到许多细节：Anthropic为何刻意让Claude“收着点用”、亚马逊的Trainium在ASIC竞争中的位置、模型公司面对的新“囚徒困境”、应用层为何被毁掉数万亿美元价值、被“错误分类”的公司里藏着哪些机会、agentic world中CPU为何重新变得重要、谷歌/Meta/亚马逊/微软四家巨头眼下各自处在什么位置。

And加文还借电影《最后的武士》打的比方：技术革命来临时，旧时代最优秀的武士也会被一个端着机关枪的农民屠杀。他说，“我正在努力成为机关枪大师。"

加文是极度乐观的AI支持者。他相信AI会改写生物医药、延长人类生命。

访谈尾部那个父亲为患罕见基因突变的女儿启动agent寻药的故事，让人印象深刻。但他也有担忧：AI正让世界进入“波动更大、尾部事件更多”的状态；最好的AI目前只服务于有钱人，多少有反乌托邦色彩；地缘政治正被悄然重塑；还有AI伪造下的安全问题，

又是一篇大部头的对话实录，聪明投资者（ID: Capital-nature）原汁原味地放出来，并在部分地方做了备注，方便大家丝滑地理解。Enjoy it~

今年三四月投科技，只要看Anthropic正在发生什么就够了

帕特里克 你经历今年3月和4月那段时间时，是什么感觉？对我来说，那像是一个很独特的经济、技术和市场环境。你又一直是一个非常认真研究历史，也非常认真观察当下的人。所以，那段时间对你来说到底是什么感觉？

加文大体上说，回撤有两种。

一种是你真的错了。比如一家公司业绩不及预期，你原来的投资假设被证伪了。这时候你就得认错，接受损失，把这个亏损真正确认下来。

但还有另一种回撤，或者说另一种跑输。你之所以跑输，是因为一些你非常了解的公司在下跌，而你对市场给出的价格走势非常不同意。这个时候，你反而可以加仓。

在这种情况下，你不是在确认亏损，而是在积累一种被压制的alpha，也就是未来还没有释放出来的超额收益。

对我来说，今年3月就是这种感觉。

当时纳斯达克在下跌。但与此同时，我认为AI领域正在发生的事情，是美国商业史上最非凡的时刻。

我指的是，Anthropic新增了110亿美元 ARR，也就是年度经常性收入。

真正让我震惊的是，SaaS和云计算革命大概创造了5万亿到10万亿美元的价值。过去10年、12年里，如果要说最受关注的三家 SaaS 公司，大概就是 Palantir、Snowflake和Databricks。

这三家公司雇了几千人，合起来可能上万人。它们都花了10年时间，才把自己的业务做到今天这个规模。

而Anthropic在一个月里，就新增了相当于这三家公司合计规模的业务。

这太疯狂了！

我们这些科技投资人，经常会听到大家谈S曲线，谈怎么投资指数级增长。但我从来没有见过这样的指数增长。

这甚至比DeepSeek那次还要极端。DeepSeek当时也是一个很类似的局面。

如果回到2025年，DeepSeek引发了一场巨大抛售。

但那件事本身非常奇怪，因为DeepSeek那篇论文，其实在DeepSeek Monday之前7天就已经发表了。我记得应该是发表在美国一个假期的周一。

我读完之后想：“嗯，这东西感觉可能很重要。”

帕特里克 可能很重要。

加文但它未必会被市场解读成对AI交易有利。所以我当时采取了行动。

一周之后，就到了DeepSeek Monday，AI相关股票真的崩了。

但这件事很奇怪，因为到了DeepSeek Monday，当时其实已经非常清楚，DeepSeek会是有史以来对算力需求最利好的事情之一。

AWS亚洲可用区的价格已经差不多翻倍了。你能看到GPU可用性在下降。

这也是我们第一次真正看到，推理模型在推理阶段，比非推理模型消耗的算力要多得多。

所以那次也是一个类似的局面，只不过你需要做一些功课才能看出来。

但其实也没有那么难。你只要看到，股票在下跌，DRAM价格在直线上涨，亚洲GPU价格在直线上涨，GPU可用性在下降。

然后两三天之后，美国的GPU租赁价格也开始上涨。

但今年3月就更简单了。你什么都不用做，只要看Anthropic正在发生什么就够了。

现在很多人好像都很后悔。后悔2022年没买，后悔COVID期间没买，后悔DeepSeek那次没买。

但4月初，其实又出现了一次类似的估值机会，而且这一次AI的拐点更加清楚。

所以，过去其实已经有很多次可以买入AI的机会。

当然，让这件事变复杂的，是所谓的“海峡公式”。

我后来开始相信这一点，现在也仍然相信市场可能误判了一件事。

我不是宏观专家。但我确实做很多和国家安全相关的投资，所以能接触到一些真正懂这方面的人。他们也很愿意和我分享自己的判断。

我认为，霍尔木兹海峡如果关闭，对美国来说，实际上相对是非常有利的。

帕特里克 为什么？

加文因为这其实非常符合当前美国政府的目标。

电力是工业和制造业里非常重要的投入。对美国电价来说，最关键的变量之一，也是影响AI成本的重要变量，就是天然气价格。

当时，美国天然气价格下跌了20%。

但亚洲、欧洲以及其他地区的天然气价格，翻了一倍，甚至两倍。

所以，美国的相对制造业竞争力，几乎在一夜之间就提升了。

不管你喜不喜欢，这似乎就是特朗普政府最关心的事情。他们非常在意美国相对于其他国家的位置。

很多人对1970年代还有记忆。70年代之所以那么痛苦，不只是因为价格上涨，而是因为当时真的出现了汽油短缺。

但今天的情况已经很不一样了。美国经济对能源的依赖程度，比当年低得多。美国现在是全球最大的石油和天然气生产国，也已经是全球最大的石油和天然气出口国。

在这个基础上，如果美国又获得了相对制造业的优势，那情况就完全不同了。

所以对我来说，这让我更容易继续把注意力放在AI的基本面上，也继续关注当时从历史上看非常有吸引力的估值。

我认为，从相对估值看，当时科技股相对于市场其他部分，几乎已经便宜到过去10年里最便宜的水平之一。

你可以从市场有效性的角度想想这件事。

我们正在经历资本主义史上最非凡的时刻，而这对AI极度利好。可就在这个时候，你居然还有机会用非常有吸引力的估值买入AI。

Anthropic在最新估值基础上，有能力再溢价至少一倍融资

帕特里克 你怎么看Anthropic和OpenAI的估值倍数？

在我看来，它们是这个趋势里最纯粹的参考资产。但它们的估值其实并没有那么夸张。

如果只看销售倍数，把它们和Databricks、Snowflake这些公司在估值高点时的水平相比，你怎么理解？

加文我确实认为，从资本效率角度看，OpenAI和Anthropic是两种很不一样的公司。

Anthropic每生成一个token的成本，明显低于OpenAI。它就是更低。

你只要看它们为了做到差不多的收入规模，各自烧掉了多少钱，就能看出来。

我觉得Anthropic烧掉的钱，可能比OpenAI少80%。

帕特里克 没错。

加文所以作为一门生意，它们的结构性ROIC，也就是投入资本回报率，显然很不一样。

当然，OpenAI也在做很多事情。我认为莎拉·弗里尔（Sarah Friar）是一位非常出色的 CFO。他们正在努力改善这个问题。

帕特里克 而且他们确实锁定了很多算力，比别人更多。

加文对，他们锁定了很多算力。这也是一个很大的差异。

事实证明，激进一点是有回报的。

但如果Anthropic估值 9000亿美元，对应500亿美元ARR……

帕特里克 而且还在以1000%的速度增长。

加文对，增长速度荒唐的高！

也许更真实的说法是，如果Anthropic拥有全部所需算力，它今天的收入很可能已经远远超过1000亿美元，可能达到1500亿美元。

而且我确实认为，Anthropic现在有意让Claude “收着点用”。

有一项分析显示，即使是Claude Opus，对于完全相同的问题，它生成的token数也减少了70%。

我们上次也谈过，在某种程度上，token数量就等于回答质量，也等于思考质量。

当然，每个token里的智能密度也很重要。

作为用户，我自己也确实感觉到了这一点。

所以我认为，如果不受算力限制，Anthropic的收入会高得多。可能是1000亿、1500亿，甚至也许是2000亿美元。

帕特里克 所以你可能是在用5倍“无约束收入”买它。我们可以创造一个新指标，URR，也就是unconstrained run-rate revenue，无约束运行收入。

加文对。

帕特里克那为什么它们不按3万亿美元估值融资1000亿美元之类的？如果你是Anthropic的CFO的话。

加文我认为它们现在这样做是明智的，因为未来是不确定的。

你显然处在一场资本极其密集的游戏里。即使是Anthropic，我相信它们今天在推理业务上的毛利率已经非常不错。

Anthropic今年就会开始产生现金流，我觉得它们很可能已经开始了。

但即便如此，你仍然希望未来还能继续融资，继续拿到更多算力。因为这个世界是不确定的。

如果你看埃隆·马斯克，他一直为投资者赚钱。他把这件事看成一种神圣契约。

正因为过去20年里，他一直让投资者赚到钱，所以他拥有了一种超级能力。那就是，他基本上可以在任何时候、按照自己想要的规模融资。

我认为，这些公司现在这样做是明智的。

我不知道他们是不是这样思考，但我确实认为，专注于让投资者赚钱是一件明智的事。

这种好处不只是持续一两年，而是可能持续未来20年到30年。

帕特里克 埃隆做到这一点的方式，是不是系统性地低估SpaceX或其他公司的估值？具体来说，他是怎么做到的？

加文就是从不在估值上贪心，从不把估值推到极限。

帕特里克 就这么简单？

加文对，就这么简单。

我的朋友安东尼奥（Antonio）曾经指出，过去十多年里，SpaceX的年化复合回报大概是30%出头。

我认为原因就在这里。埃隆一直很重视保留这种融资能力，也一直努力在投资者和员工之间取得一个公平的平衡。

所以我觉得，这是非常明智的。

但如果你问，Anthropic能不能在传闻中的最新估值基础上，再溢价至少一倍融资？当然可以。

电力短缺可能会从2027年、2028年开始缓解

帕特里克 我们来聊聊watts and wafers，也就是电力和晶圆。这一直是我最喜欢和你聊的话题。

我感觉，每次我觉得AI基础设施建设已经有点过热了，下一次再和你聊，又会觉得我们之前其实建得还不够。

你研究过很多S曲线，也研究过这些S曲线到底能有多陡，而且你很懂历史。你来讲讲，你现在怎么看电力和晶圆，它们作为整个AI体系最关键投入的重要性。

加文我会说，资本主义大概率会解决电力短缺问题。前提是没有非常大的监管或政治反弹。当然，我认为这种反弹确实有可能发生。

有一家大型私募股权公司里负责数据中心基础设施投资的人，我记得可能是黑石、阿波罗（Apollo）或者KKR的人，说过一句话：“过去，能源和芯片是我们最大的瓶颈。现在，分区规划和审批变得更重要了。”

我认为很多公司都在等中期选举之后再采取行动，比如裁员之类的动作。没有公司想在中期选举期间被政客和舆论拿来当靶子打。

但你已经看到，很多制造涡轮机的公司开始宣布大规模扩产计划。

当然，这里面确实有很多问题。比如，能铸造这些大型叶片的机器，全球可能只有两台。西方已经80年没有造过这种机器了，很多能力已经丢掉了等等。

这些都是真的。

我也绝不是在低估这里面的工业工程难度。那里面确实有很多技术、工艺，甚至可以说有某种工程艺术。

但随着时间推移，资本主义非常擅长解决这类问题。

而且除了这些涡轮机之外，从更长周期看，还有其他能源来源。

所以我认为，电力短缺可能会从2027年、2028年开始缓解。然后，轨道算力会真正解决这个问题。

我也想重新定义一下“轨道算力”。因为当人们听到“太空数据中心”，脑子里往往会想象一个漂浮在太空中、像五角大楼那么大的建筑。

然后他们会说：“这不可能做到。”

但它不是那个样子。一个Blackwell机架重3000磅，高8英尺，深4英尺，宽3英尺。

所谓轨道算力，本质上就是把机架放到太空里。

SpaceX已经给过示意图了。那就是一个机架，那颗卫星本身就是一个机架。

它的大小大概和Blackwell机架差不多。它两侧会展开太阳能翼，每边可能有500英尺长。

你把它放在太阳同步轨道上，这样太阳能板就能一直照到太阳。

而且因为它处在严格的太阳同步轨道上，散热器可以从它背后延伸出去几百英尺。

帕特里克 嗯。这也是大家常见的质疑之一。

加文对，散热器在阴影里。

帕特里克 你到底怎么给它散热？

加文这些年我在Starbase待过很多时间，也和很多SpaceX工程师聊过。

我确实认为他们是地球上最有才华的一群工程师。而且在这件事上，他们非常有信心，认为散热问题已经解决了。

他们并不是对所有事情都这么有信心。

比如，要把星舰（Starship）变成火星殖民运输器，我觉得可能还有不少工程问题要解决。

他们最终会做到吗？我相信会。

但如果问他们现在更关注什么，我觉得可能是维修和维护。

这也是两个最大的质疑点。一个是散热器，另一个是机架里出了问题怎么修。

答案是，在你拥有某种漂浮版Optimus之前，大概没法修。

但我确实认为，星舰会以我们现在无法想象的方式改变太空经济。

尤其是如果监管变成地面数据中心的限制因素，那很多地面约束就不重要了。你能造多少轨道算力，就能卖多少。

然后很自然地，你会用穿越真空的激光，把这些太空机架连接起来。而这项技术现在已经在每一颗星链（Starlink）卫星上了。

让我觉得震撼的是，SpaceX运营着全球最大的卫星星座，占在轨卫星的98%或99%。每一颗星链卫星，今天都在运行，也都在被冷却。

我认为星链V3的功率会达到20千瓦。而一个Blackwell机架，也不过100千瓦。（也就是说，太空算力要达到一个AI机架的功率水平，并不是差了几个数量级，而是大概5倍的差距。对SpaceX来说，这当然很难，但不是完全不可想象。）

人们经常谈密度。但如果你是在真空中用激光连接机架，就可以把机架做得更大一些。物理上，你真正关注的是重量，而不是体积。

在地球上的数据中心里，你要连接机架，理想情况下会尽量用铜缆，并尽可能缩短距离。布线本身就是很大一项成本。

所以你当然希望机架尽量小，能用铜就用铜，必须用光的时候才用光。

但在太空里，SpaceX可以做很多事情。我觉得一些怀疑者没有认真想过这些可能性。

关键是，它们运营的卫星数量超过任何人。它们今天已经有20千瓦的卫星。所以一开始也许只是把它扩到60千瓦。

但他们似乎非常有信心，可以直接做到100千瓦、120千瓦。

而且，同一家公司现在也运营着地球上最大的数据中心。它们有世界上最好的硬件工程师。

与此同时，很多外界的怀疑者，其实既没有SpaceX工程师那么聪明，也没有他们那么懂实际工程。

拉里·埃里森（Larry Ellison）在之前有人质疑这件事时，说过一句很简单的话：“听着，他正在外面回收火箭。我没看到别人能回收火箭。”

现实是，10年过去了，仍然没有其他公司能够持续、稳定地回收并完全复用一枚轨道火箭。

而如果没有可复用性，这一切都不成立。可复用性意味着你必须把火箭降落回来。

所以我更愿意把轨道算力定义为“太空中的机架”，而不是漂浮在太空里的五角大楼式巨型数据中心。

帕特里克 对，后者听起来确实有点荒唐。

加文但真正可以做到的是，用激光把这些机架连接起来。数据中心的本质，就是这些机架之间的连接。

所以它会是一组太空中的机架，通过激光连接成一个虚拟数据中心。

如果只能盯一个指标来判断AI泡沫，我会盯台积电的产能决策

帕特里克 如果我们想象一下那个世界，假设这些事情真的发生了，而且我们已经非常擅长以经济方式把这些东西送上去，在太空中到处跑矩阵乘法，那这对地面数据中心意味着什么？

加文有人曾经说过，美国会尽可能用力地吸取它能得到的每一种能源。我认为算力也是一样。

这也是为什么我现在对“边缘AI”这个空头逻辑没有以前那么担心。

我们会消耗掉尽可能多的算力。

推理非常适合轨道算力，但训练在很长一段时间里，仍然会在地球上完成。

所以我不认为这对地面数据中心特别利空。我认为在我的有生之年，地面数据中心仍然会非常有价值。

但如果你身处电力生产和冷却这个生态里，而且正在大规模扩产，那你确实要认真想一想。

因为很多产能投放的时候，可能正好赶上那些原本很轻视轨道算力的人，开始意识到这件事是真的。

如果你是这些公司之一，这件事值得非常认真地思考。

当然，在过渡阶段，也会发生很多很酷的事情。

比如，我们现在越来越擅长改造喷气发动机。Boom Aerospace 就在做这件事。

所以，电力这一侧有很多事情正在发生。资本主义正在非常努力地解决电力问题。

但晶圆这边，情况就不一样了。

晶圆掌握在台湾一群非常坚韧、年长的人手里。他们是台湾最重要的一群人。

台积电占台湾GDP、用水、用电的比例都非常高。大家经常说“硅盾”。他们自己也把自己看作张忠谋神圣遗产的继承者。

我清楚记得，20多年前我去新竹科学园区拜访时，曾经问他们：“你们觉得自己有一天能追上英特尔吗？”

他们回答说：“这是一个很美的梦，但那应该是我们孙辈的梦。”

后来他们真的做到了。

当然，一部分原因是英特尔自己犯了错误，但他们确实做到了。

只是，他们的思维方式很不一样。

黄仁勋之所以经常飞去台湾，一个原因就是他希望台积电扩产。

让我觉得很有意思的是，黄仁勋和台积电之间从来没有合同。他们做生意，似乎靠的是公平感和握手。

帕特里克 嗯。没有合同，真有意思。

加文他们相信，长期来看这会是公平的。我们是合作伙伴，我们会彼此公平对待。

事实上，按照历史上所有基础性新技术的市场先例，像AI这样的技术，通常都会经历泡沫。

卡洛塔·佩雷斯（Carlota Perez）写过一本很好的书，讲的就是这个过程。

基本上，市场是有效的。它会正确意识到，这是一项基础性的新技术。

然后就会出现迈克尔·莫布森（Michael Mauboussin）所说的“多样性崩塌”：所有人都开始看好同一件事。

我现在确实开始有点担心这种多样性崩塌。

接下来，你就会得到一个泡沫。

这个泡沫会为新技术的基础设施建设提供资金。但当供给跑到需求前面之后，就会出现崩盘。如果这种建设还是靠债务驱动的，就像2000年那样，崩盘会特别严重。

现在这一轮建设有一个很大的好处，就是它仍然主要由经营现金流来融资。这和2000年相比，是非常重要的区别。

估值也是一个区别。

还有一个区别是，今天每一块GPU都在100%利用率下运行；而当年互联网泡沫时期，99%的光纤都没有被使用。

所以这里确实有很多根本差异。

但我们仍然要清醒。历史不会简单重复，但会押韵。作为投资人，我们必须意识到这一点。

如果看过去两三百年的历史，别只看互联网泡沫，还有铁路泡沫、运河泡沫。我们应该预期泡沫会出现。

这很可怕。没有人想要泡沫。泡沫很糟糕。

它之所以糟糕，是因为如果你对估值敏感，你会在泡沫阶段大幅跑输，然后很可能被所有客户解雇。

已经离世的乔治·范德海登（George Vanderheiden），曾经是富达非常优秀的基金经理。

1999年，他选择对抗泡沫。到2000年初，他退休了。我觉得是因为他实在承受不了了。

他一头白发，是一个真正伟大的人。我和他只有很短暂的交集，但他是我好朋友、也是我导师詹妮弗·乌里格（Jennifer Uhrig）非常重要的导师和朋友。

通过她，我身上也有很多范德海登的影响。

他说过一句名言：“早得太多，和错没有区别。”

乔治后来退休，就是因为他受不了持续跑输，也受不了客户不断问他：“你到底怎么了？你怎么就是不懂？”

而当时，他的基金里大概40%是烟草股，40%是住宅建筑商。

结果接下来三年，他相对于纳斯达克的表现，可能跑赢了20倍到30倍。

我一直比较乐观，认为今天这种根本性的晶圆短缺，也就是目前实际上由台积电控制的短缺，可能会阻止泡沫出现。

如果台积电按照黄仁勋希望的方式扩产，我认为英伟达在2026年或2027年可以卖出2万亿美元的GPU。也许是2.5万亿美元，甚至3万亿美元。

但消费者能消化的算力总有一个边界。到某个程度之后，你大概就会进入过度建设。

所以，如果我们最后没有出现泡沫，真的应该为台积电开一个庆祝派对。因为它将凭一己之力阻止一个泡沫。

帕特里克 现在你已经开始看到一些公司转向英特尔和三星。假设台积电面对这些迟来的需求，仍然处在极度供给受限的状态，那会发生什么？

加文市场历史告诉我们，英特尔和三星之间，我不知道会是哪一家，但它们不可能一直保持克制。

总会有一家先忍不住。

一旦有一家开始放量、开始抢市场，在某种程度上，其他人也会被迫跟上。

所以我认为，关键很大程度上取决于台积电能在多长时间里，继续保持对英特尔和三星的领先。

你要记住，这种领先可能是9个月、12个月、15个月，或者……

帕特里克 类似先进制程节点上的领先。

加文完全正确。

所以它们扩产的节奏非常重要。

如果只能盯一个指标来判断会不会出现泡沫，我会盯台积电的产能决策。

我认为这里存在一个“刚刚好”的区间。也就是说，台积电扩产要足够多，让英特尔或三星很难真正大规模成为第二供应商，很难拿到远高于30%的市场份额。

但与此同时，台积电又要保留晶圆这个根本性约束，让供给不要一下子放得太开，从而帮助整个行业避免泡沫。

当然，我认为Terafab也会参与到这个过程中。

Terafab是SpaceX参与其中的一个合资项目（我相信特斯拉也有份），目标是在美国建设全球最大的晶圆厂。

我认为他们会成功。

第一，他们和英特尔有合作关系，这非常重要。因为这意味着他们可以获得英特尔50年积累下来的制度性知识。

虽然这套能力已经不是最前沿，大概落后9个月、几个季度，或者说12个月、三到五个季度，但它仍然是一种优势。

另一个优势是，我相信Terafab会得到所有半导体设备公司A级团队的支持。

当年台积电之所以能追上来，一个重要原因就是阿斯麦（ASML）、KLA、泛林集团（Lam Research）、应用材料（Applied Materials）这些公司，都希望它追上来。

这些设备公司不喜欢只有一个买方的局面。所以当时它们最强的团队都去了台湾。再加上英特尔自己犯了一些错误，机会就出现了。

这一次，因为埃隆在硬件工程上的声誉，这些A级团队会来到美国。

还有一点，在美国可能有些人很难想象。现在政治在某种程度上已经取代了宗教。因为埃隆曾经卷入政治，所以美国一些人很难客观看待他。这其实很可惜。

因为我确实认为，他为美国做的事情，可能比任何其他美国人都多。

他几乎凭一己之力把制造业带回美国。他复兴了国防科技。SpaceX在某些方面已经是美国最重要的国防承包商。

星链对世界的意义也非常了不起。他创造了大量蓝领制造业岗位，而这本来也是很多自由派希望看到的事情，对美国也有好处。

他可能比任何在世的人都更大程度地推动了全球脱碳。

如果你因为环保原因反对把数据中心建在地球上……

帕特里克 这正是太空数据中心的好处之一。

加文对，那这不就是答案吗？

所以我觉得很可惜。在美国，因为政治让很多人一叶障目。

我观察他很久了。我觉得他会做的事情，就是把最优秀的人才招过来。

因为最好的工程师都想为埃隆工作，尤其是在硬件工程领域。

他会招来非常厉害的工程师。

然后，在Terafab旁边，可能会有一个小镇。你最喜欢台湾哪些餐厅？好，那我就把这些餐厅和整个团队都从台湾搬到得克萨斯，把一切都做成他们喜欢的样子。

帕特里克 精确调校。

加文对，精确调校。目的就是为了招到最好的工程师。

而这不是英特尔和三星管理者通常会有的思维方式。

所以他会拥有最优秀的人才，会得到晶圆厂设备公司A级团队的支持。

他还有英特尔这个合作方，这也很重要。

这件事也非常符合任何一届美国政府的政治目标。而且我认为，它和现有格局足够不同，不至于疏远台积电。

当然，这些事情都有很长的前置周期。也就是说，Terafab真正开始生产英伟达GPU，或者其他芯片，会是相当久以后的事情。

打破“苦涩教训”仍然是真正的风险

帕特里克 埃隆做事情往往和别人不一样。别人建一个数据中心要花3年，他122天就建起来了。你知道，三星甚至不得不在得州晶圆厂里给他安排一间办公室，因为他对它们扩产和建设的速度非常不满意。

我们可以继续观察。

你刚才提到了DeepSeek。市场对DeepSeek最简单的反应是：好，未来这些模型会以极低成本做到前沿模型95%的效果。

如果往前快进两年，我这样一家小公司，可能就没必要每年花100万美元买token了。但现在真实情况看起来并不是这样。我很好奇，在你看来，为什么会出现这种落差？

加文我觉得最有意思的，是前沿模型到底能赚多少钱。

AI在模型这一层创造了很多经济价值。但让我意外的是，到目前为止，这些价值绝大部分还是流向了最强的前沿模型，而不是那些更便宜的开源模型。

所以，对投资人来说，最关键的问题就是：这种情况会不会持续？未来企业和用户是否还会继续为最强模型支付高价？

我还记得Gemini 3.1 Pro刚出来时，我觉得非常震撼。它太好了。

但今天再用，已经让人很难忍受了。

这里面可能有一个动态：很多公司会先用最强的前沿模型做原型，验证产品能不能跑通；但真正投入生产时，它们可能会转向成本更低的方案，比如Vertex，或者一些开源模型。（也就是说，最强模型可能负责“探索和打样”，便宜模型负责“大规模落地”。）

但即便如此，今天的事实仍然是，绝大多数经济回报还是来自前沿token。（这里的“前沿token”，可以简单理解为用户调用最强模型时消耗的token，也就是最贵、最强那部分模型服务。）

这点很出人意料。

这种情况会不会继续下去，我觉得是一个非常有意思的问题。经历过Gemini 3.1，再经历Opus之后，我对这个问题变得开放了很多。

我也在用Grok 4.3。它在帕累托前沿上。

（所谓帕累托前沿，简单说，就是在“模型有多聪明”和“使用成本有多低”之间，做到最优组合的那条边界。）

现在处在帕累托前沿上的公司是……

顺便说一句，这是一个很大的变化，也是我们上次聊过那件事的结果：谷歌因为在TPU v8 上做了非常保守的设计选择，试图部分摆脱博通，结果失去了token成本的领先地位；而英伟达还在继续做更激进的选择。

以前是谷歌主导帕累托前沿。我认为，这是分析AI实验室时最重要的指标。

9个月前，谷歌主导这条前沿。在帕累托前沿的每一个点上，OpenAI、xAI 和 Anthropic 都在谷歌里面。（意思是，它们要么同样成本下没有谷歌聪明，要么同样智能水平下成本比谷歌高。）

但现在，帕累托前沿主要由Anthropic和OpenAI主导。Grok 4.3也在这条前沿上。它显然是最好的低成本5000亿参数模型。

Gemini 3.1则像是勉强挂在帕累托前沿上。如果让我猜，我会说谷歌现在是出于自尊在补贴它。

我还想说一点：如果理查德·萨顿（Richard Sutton）的“苦涩教训”被打破，那一定是这笔 AI交易，也是整个AI叙事最大的风险。

所谓“苦涩教训”，简单说就是：从长期看，更多算力和更多数据，通常会胜过人类设计出来的精巧算法。（也就是说，不是人类想出一个特别聪明的小技巧就能赢，而是规模更大、算力更多、数据更多的系统往往会赢。）

不过，越接近AI的人，越怀疑这件事会被打破。

我认为3月市场走弱的一个原因，是TurboQuant，谷歌的一种内存优化技术。一年前已经有论文写过。

当时谷歌正和美光、三星、SK海力士谈长期协议，也就是可能锁定很长时间高价格的 LTA。就在谈判过程中，谷歌把TurboQuant 放了出来。

人们做什么，永远比他们说什么更重要。

谷歌只是把它在X上宣传了一下。然后它就病毒式传播了。大家开始说：“天哪，DRAM完了。这里有一个DRAM优化技术。”

但我找不到地球上任何一个AI 工程师相信 TurboQuant 会对DRAM需求产生实质影响。

不过，即便如此，违反“苦涩教训”仍然是真正的风险。

也就是说，如果某一天真的出现一种算法突破，让模型在不需要更多算力、不需要更多数据的情况下，也能大幅提升能力，那整个AI基础设施投资逻辑都会受到冲击。

（因为今天大量投资都建立在一个前提上：更强的AI需要更多算力、更多芯片、更多内存、更多数据中心。）

这是真正的风险。

我认为，真正构建这些模型的人，对这个风险比较怀疑。（也就是说，他们不太相信单靠某个算法技巧，就能绕开大规模算力这条路。）

我之所以没有那么怀疑，是因为我觉得我们已经非常接近ASI（人工超级智能）。谁知道“苦涩教训”对一个400智商的模型还是否成立？

也许我们会经历一个短暂阶段。比如你真的走到ASI，它首先想要的，可能就是让自己更聪明，也拥有更多资源。

它会怎么做？它会让自己变得更高效。

所以我认为，这确实是一个风险。

人类本身也包括在“苦涩教训”里。（换句话说，过去是“更多算力胜过人类小聪明”；但如果 AI 本身变得远比人类聪明，它也许能设计出人类想不到的优化方法，短暂打破这条规律。）

我们很快就会知道，这条教训是否适用于300智商的AI，然后是400、500、600智商的 AI。

到某个阶段，我们也许会因为AI或ASI，看到对“苦涩教训”的短暂违背。

AI现在正从“无限量套餐”转向“按杯付费”

帕特里克 我很好奇，你怎么看模型周围的一些新创新？比如持续学习和记忆，这两个方向现在很多人都在关注。大家似乎觉得，它们可能会带来下一个新范式。你怎么看它们的作用？

加文我认为，在记忆这件事上，我们已经通过这些harness做了很多。

事实证明，harness engineering没有模型本身那么重要，但它真的很重要。而且现在，harness和模型越来越多是在一起开发的。

你可以简单把harness理解成模型运行时所在的环境。它知道工具在哪里，会帮模型建立上下文、记忆和状态，也会包含一些非常具体的提示词和指令。

帕特里克 它会带来很大差别。即使是很简单的版本，也会有差别。

加文差别惊人。

我说过作为投资人，你至少要每月花250美元，去买最高档的AI版本。只有这样，你才能对AI的真实能力形成自己的直觉。

但现在，这已经不够了。

如果你想理解今天前沿AI真正能做什么，即使不是写代码的用途，你也需要用ClaudeCode或Codex，而且需要企业版方案。

原因是，AI模型已经开始转向按使用量计费。我认为，这也是谷歌失去成本领先之后带来的一个变化。

如果你用的是每月250美元、300美元或者280美元那种套餐，你会受到非常严格的速率限制。你拿到的是一个被限制了能力的AI版本。

我们刚才也说过，Claude现在生成的token少了70%。

如果你希望Claude和它的harness按照它们真正认为必要的方式去思考、去输出，从而给你一个好答案，那你就必须用按量计费方案。

顺便说一句，这对AI行业非常利好。

我在2005年到2007年做过电信分析师。蜂窝通信在此前10年一直是一个很好的增长行业，原因就在于，它同时有固定套餐和超额使用后的按量收费。

比如，你每月有900分钟通话时间，超过以后，就按使用量付费。

蜂窝通信什么时候不再是一个很好的增长行业？就是所有人都转向无限量套餐的时候。

长途电话也是一样。

AI现在正从“无限量套餐”转向“按杯付费”。事实证明，人们真的很喜欢和远方的朋友聊天，真的很喜欢用手机，也真的很喜欢用AI。

尤其是现在，一个人可以同时让100个agent工作。

所以我认为，转向按使用量计费，可能就是为什么今年我们会看到OpenAI和Anthropic的ARR远远超过2000亿美元。

因为不只是更多算力会上线，它们还可以通过这些企业级按量方案，提高前沿token的价格。

但这也有点令人难过。

对整个世界来说，这有点令人难过。因为这意味着，如果你付不起这个钱，你就接触不到最前沿的AI。

至于持续学习，天哪，如果我们真的解决了这个问题……

帕特里克 你怎么理解持续学习？

加文人类大脑有太多谜团。和AI相比，人类是非常简单、非常高效的学习者。

我记不清具体数字了，但AI需要的样本量……

帕特里克 差了好几个数量级。

加文对，差了很多个数量级。

今天，在某些事情可以被验证的情况下，我们已经有一种很粗糙的持续学习版本。比如，在训练阶段做强化学习。

但真正的持续学习，是模型能够动态调整自己的权重，或者以某种方式实时更新自己。

帕特里克 就像人类那样。

加文对。比如我第一次把手伸进火里，就会学到一件事：以后绝不能再把手伸进火里。

但今天的模型可能需要把手伸进火里100万次，然后模型设计者还要在下一轮训练里，或者在一个强化学习环境里，把“火”这个场景放进去。它才会真正学会。

所以我认为，它必须能够动态更新权重。但我也相信，除了这个方向之外，人们还在研究很多非常聪明的方法。

如果我们真的实现持续学习，那就会出现非常快速的起飞。现在很多人似乎很有信心，认为持续学习已经不远了。

我认为，这是第三个重大问题。

第一，ASI会不会导致“苦涩教训”被打破？也就是说，真正打破它的不是人类的小聪明，而是超级智能本身。

第二，前沿token是否还能维持今天这样的溢价？

第三，我们会不会实现持续学习？如果会，什么时候实现？

新的芯片公司要成功，要满足三点

帕特里克 新的芯片公司在这一切中扮演什么角色？

我们聊了很多英伟达，以及它和台积电、英特尔这些公司的关系。现在有一千朵花在开放，可能真的有上千家公司在尝试做新的芯片，想解决这个瓶颈里的某一部分。

我很好奇，你怎么理解这个领域、这个机会，以及它们会扮演什么角色？

加文我认为这对世界来说是好事，也是健康的。对黄仁勋来说也是好事。因为如果换一届政府，可能会有不同看法。

竞争对所有人都有好处。

在坦克设计里，人们会讲“铁三角”。更通俗地说，就是一个“不可能三角”：攻击力、防御力和机动性不可能同时拉满。

原因很简单，防御越强，也就是装甲越厚，坦克就越重，机动性就越差。所以你必须在这个三角里做取舍。

比如以色列的梅卡瓦坦克，就是更偏向防御。俄罗斯坦克和豹式坦克，一般更偏向机动性。

芯片设计也是一样。

你必须活在一些由物理定律决定的根本约束里，而这些约束已经写进了台积电的设计规则。

TPU、Trainium（亚马逊为机器学习训练和推理设计的自研加速器）和AMD，本质上都在试图成为一个更好的GPU。

今天来看，我认为Trainium可能做得最好。

当然，没有谁真的已经做出了一个更好的GPU。但Trainium，我觉得它已经开始在“扯超人的披风”了。

而且这还没有真正开始。Trainium3 还需要进入量产爬坡，因为它有switch scale-up network，也就是交换式的scale-up网络。要想经济地推理MoE模型，这种网络非常重要。

很多公司的架构还是torus架构，谷歌以前就是那样。

AMD方面，我们还要看。MI450现在还不清楚。相比MI450，我们可能对Trainium3知道得更多。

但这是一场很难玩的游戏。所以你必须做一些不一样的事情，而且这件不一样的事情本身也必须很难。

我的经验法则是，1%的市场份额就值1000亿美元。而1000亿美元已经是一个非常好的风投结果。

这种状况下，黄仁勋会说：“好，如果有人做了一个不同的东西，并且拿到1%、2%或者3%的份额，那我们就会去做那种芯片。”

这件事会发生在所有人身上。

但如果你只是想做一个更好的GPU，那祝你好运。如果你要做不同的东西，它也必须很难做。

你可以做不同的取舍。

prefill和decode的解耦，确实打开了更大的设计空间，让芯片设计师可以做不同的选择。

prefill可以简单理解为模型读入上下文、理解问题；decode则是模型生成答案、写出输出。

我有一位很棒的同事，叫安德鲁·福克斯（Andrew Fox）。他说，你可以想象一艘18世纪的英国海军战舰。prefill是给大炮装弹，decode是开火。

prefill本质上就是模型理解问题、理解prompt，并且持续跟踪自己正在生成的答案。

它受内存容量限制。

decode是生成新token的过程，它主要受内存带宽限制。

所以，如果你是芯片设计师，这会给你一块更大的画布，让你可以作画。

但即便如此，你做的事情也必须很难。

因为如果你只是围绕那个“不可能三角”做一些不同取舍，比如优化内存容量，但这些取舍并不难，那英伟达也会做同样的取舍。

而且，它们从台积电拿到的价格，会比你能拿到的价格好得多。

英伟达还有另一个优势：它们和每一家模型公司都在合作，可以不断用真实需求来优化自己的设计。

顺便说一句，还有一件很有意思的事。

如果你是一个风投，正在投资一家半导体公司，而这家公司告诉你，它们会因为某种台积电工艺获得优势，因为它们对这个工艺有特殊访问权。

我可以向你保证，当这个工艺还只是台积电脑子里的一个念头时，黄仁勋就已经看过了。

而且英伟达对这个工艺的了解，远远超过这家只有200个人的小公司所能想象的程度。

台积电以及供应链里的每一个人，都会把所有东西拿给黄仁勋看。就像它们会把所有东西拿给亚马逊、AMD、TPU团队看一样。

这也是为什么我说，不要试图做一个更好的GPU。你可以做一些不同的东西，你可以在prefill这块画布上作画，也可以在decode这块画布上作画。

但你做的东西必须很难。因为一旦它做大了，你马上就会遇到那几家巨头，它们会成为非常快的跟随者。

我们公司曾经是Cerebras的风险投资人。

Cerebras 做的是一件很难、而且从根本上不同的事，也就是晶圆级计算。它当然有一系列取舍，但他们当初做出的架构选择非常难，也让他们能做一些别人做不了的事。

我们会看到这件事最终能做多大。

他们现在也在做一些非常酷的事情。Cerebras 面临的一个问题是，一旦你需要把很多芯片连接在一起，搭建 scale-up 或 scale-out 网络，你就需要大量IO。而IO会受到所谓shoreline的限制，也就是芯片边缘长度的限制。

所以，Cerebras的片上计算和内存，相对于芯片边缘IO来说，比例非常高。

但他们是非常聪明的人。他们做了一件非常难的事。现在他们在探索，能不能把一片光学晶圆直接放在上面。如果能做到，就可以解决这个问题。

我相信他们也在研究DRAM的混合键合，去绕开一些所谓的限制，而那些限制并不一定是真限制。

理论上，Cerebras的机器可以运行任何规模的模型。只是对于某些模型规模，它的表现会比其他规模更好。

所以我觉得Cerebras有意思的地方就在于，它做了一件不同的事，而且这件事真的很难。晶圆级计算非常难。

我确实认为，这些新芯片公司有自己的位置。我也会鼓励所有人：做不同的取舍，而且做一件困难的事。

Cerebras IPO之后，大家都会融到钱。融资不会是问题。但Cerebras花了三代芯片，才把这件事做对。

帕特里克 对，现在已经是一家10年历史的公司了。

加文这真的很难。

你看安德鲁·费尔德曼（Andrew Feldman），也就是Cerebras的CEO，就能看出来他和整个团队走到今天有多不容易。

这些公司需要有那种韧性和抗压能力。

第一颗芯片失败了，这很正常。问题是，你能不能回来做第二颗芯片？

关于这个话题，我还想说最后一点，这会极大提升GPU的使用寿命，甚至可能凭一己之力拯救私人信贷。

帕特里克 多讲讲。你说私人信贷是什么意思？

加文私人信贷现在正因为那些SaaS贷款承受压力。不管这些贷款现在已经减记了多少，我觉得可能还得继续减记。

原因很简单，如果连上市公司都很难适应这个新世界，那一家背着大量债务的公司，要怎么适应？它又怎么去投资一门利润率结构完全不同的新业务？

但另一方面，私人信贷也投了很多GPU相关资产。

他们当初给这些GPU融资时，我猜大概是按3年或4年的使用期限去算的。

但因为推理现在被拆开了，我认为这些GPU的实际使用寿命可能会变成10年，甚至15年。

AI怀疑论者会说：“这些公司都在做账。GPU的使用寿命只有一两年。CPU的使用寿命也只有4年，因为技术变化太快。”

但我觉得不是这样。

技术快速变化带来的结果，不是让这些老GPU立刻报废，反而是因为prefill和 inference被拆开了，它们可以被重新分工使用。

你可以把Cerebras系统，或者Groq的LPU，放在Hopper 甚至Ampere前面。英伟达实际上也通过收购获得过相关能力。

这样一来，Hopper和Ampere这些老GPU仍然可以负责prefill，也就是读入上下文、理解问题的那部分工作。它们的使用寿命就可以一直延长，直到硬件真的烧坏为止。

当然，它们确实会烧坏，硬件总有物理寿命。但也许你不需要让它们跑得那么满、那么快。

这对整个私人信贷行业都会非常有利，也会帮助AI基础设施继续融资。

因为如果你可以用更接近5%或6%的利率去给GPU融资，而不是像CoreWeave那样最低融资成本也在7%出头，那从数学上就会改变整个AI建设的融资成本。

也就是说，我们现在有一种技术创新，它既能降低融资成本，也能延长地球上算力资产的使用寿命。

还有一件事也很有意思。Altimeter Capital 的贾明·鲍尔（Jamin Ball）最近做了一档播客，Coatue也出过一份报告。他们讲到，短缺的卖方表现远远好于短缺的买方。所谓短缺的买方，就是那些科技巨头。

但如果你已经拥有一个巨大的装机基础，而这个东西现在正处于短缺状态，那同样是一个非常好的位置。

我们现在也听到，在Agentic world，也就是智能体世界里，CPU变得比以前重要得多。

因为CPU要负责很多编排、工具调用，以及各种协调工作。而全球最大的CPU集群，就在那些科技巨头手里。

所以我认为，这些科技巨头中的一部分，可能会在某种程度上追上那些“短缺的卖方”。

帕特里克 我想把“不同而且困难”这个想法，从基础设施之外拿出来聊聊。

你现在开始和很多新创始人交流，也和那些必须适应这个新世界的现任CEO、创始人交流。

你看到的那些最AI原生的创始人，不是做芯片、基础设施或模型，而是用AI去创造其他东西的人，他们和过去的创业者相比，最不一样的地方是什么？你有没有观察到一些差异？

加文首先，我觉得这不只是芯片设计的问题。对我来说，这一直是风险投资里的一个根本问题。有些想法，一旦说出来，全世界都会觉得显而易见。

如果你投的是这种东西，而且它本身又不难做，那就很危险。因为在你建立规模之前，如果这个机会已经变得人人都懂，你就麻烦了。

规模才是最终的优势。

亚马逊当年的幸运之处就在于，电商这件事对很多人来说可能是显而易见的，但对传统零售业CEO来说并不显而易见。

而且亚马逊非常聪明。只要有风投投了一家电商公司，亚马逊就会去打它们。

亚马逊会说：“哦，这很可爱。那我们就把这个品类的利润率打到负10000%。”

Wayfair那些人之所以能活下来，是因为他们做了一件很难的事。亚马逊试图杀死它们，但没有成功。

那些CEO在运营上非常强，真的很能打。

所以在风险投资里，我总会问一个问题：在这家公司真正建立规模之前，这件事会不会已经变得人人都懂？

或者反过来，它是不是既不显而易见，又足够不同，而且真的很难做？

我认为，很多AI创业者现在都在这个问题上挣扎。

他们很担心，因为按照黄仁勋那套“五层AI蛋糕”的说法，今天的利润正在流向能源、数据中心、芯片和模型，但并没有真正流向应用层。

Cursor和Cognition已经做到了一定规模。它们专注于编程。18个月前，真正专注于编程的是Cursor、Cognition和Anthropic。而专注代码这件事，事后看是非常正确的。

Replit的创始人阿姆贾德·马萨德（Amjad Masad）发过一条推文，我觉得非常聪明。

大意是，有一个接近“苦涩教训”的事实：编程可能是通向ASI和有用AI的最短路径。

因为如果一个AI真的非常擅长编程，它就可以给自己写代码，去做几乎任何事情。

所以我认为，这几家公司高度专注于编程，是非常聪明的。而且它们大概都已经做到了一定规模，足以在这个生态里拥有自己的位置。

我觉得Cognition正在做一些非常非常不同的事情。

但很多创始人真的很挣扎，他们真的很挣扎。他们现在想证明一件事：在一些更垂直、更细分的领域里，他们可以先到达那里。

也就是说，在模型公司进入这个细分领域之前，先建立起数据护城河。

或者证明这个细分领域足够小，模型公司不会亲自下场做，但它又足够大，仍然能带来风投意义上的回报。

模型公司面对的新的“囚徒困境”

帕特里克 这和你说过的token path有关吗？我知道你以前跟我提过这个词。

加文这个说法大概是来自Altimeter的贾明·鲍尔。他说，如果你是一家软件公司或者任何形式的AI公司，你必须处在token path上。

Databricks 就在token path上。类似的公司也在token path上。

所谓token path，可以简单理解为你的产品或数据，必须参与到AI生成、调用、处理token的过程中。换句话说，你不能只是站在AI旁边，而是要嵌在AI工作流里。

如果你不在token path上，又不是做某个非常细分、非常特殊的东西，那日子可能会很难。

即使是在这些垂直细分领域里，如果你和模型公司的人聊，他们对其中一些机会也会比较怀疑。

因为这些细分领域里产生的数据，本质上还是人类产生的数据。

而你的赌注是你可以用这个狭窄垂直领域里的专有数据，训练出一个成本低于前沿实验室未来能做到的模型。

也许这是个不错的赌注。但我认为，你必须非常非常小心。

另一方面，如果未来前沿token相对于其他token的溢价下降，应用层就会出现一场巨大的价值创造。

我还有一个很重要的观点，我相信只要黄仁勋愿意，他大概也可以做到接近前沿模型。

帕特里克 用他自己的模型？

加文用他自己的模型。英伟达正在做一些非常酷的东西，比如Pneumatronics。

帕特里克 就像乔尔·斯波尔斯基（Joel Spolsky）会说的，“商品化你的互补品”。

加文对，但我不认为黄仁勋想这么做。

某种程度上，OpenAI和Anthropic是在试图对他做这件事。但它们并没有成功。

所以逻辑其实很简单。黄仁勋是一个非常讲逻辑的人，这就是合乎逻辑的反制动作。

你会看到，开源模型会在一段时间里，一直落后真正的前沿模型。

今天所谓的开源前沿，主要是一些中国模型。

中国开源模型在资源非常受限的情况下，确实做出了非常了不起的东西。只是其中有不少蒸馏。

这也是为什么我认为，Anthropic它们不只是没有足够算力来服务 Mythos，也是不想让Mythos被别人蒸馏。

它们想自己用Mythos，自己蒸馏它，再用它来给下一个模型做强化学习，或者做其他事情。

最终，如果OpenAI觉得经济上划算，任何处在前沿的公司都会面对一个非常有意思的博弈论问题。

我们之前谈过旧的囚徒困境：你必须持续投入、持续花钱，否则就会落后。

新的囚徒困境会是：如果你站在模型前沿，你到底要不要通过API把这个模型放出来（给外部客户调用）？

（不开放，可以保护模型，避免别人拿你的输出去蒸馏和追赶；但开放，又能带来大量收入、用户和现金流。问题在于，只要有一家前沿公司先开放，其他公司就很难不跟。）

如果其中有一家公司背叛，选择把模型通过API放出来，它就会拥有最好的模型，获得大量收入和现金流。

而资源就等于智能。

它会开始拉开差距。然后这会迫使其他所有前沿公司也把模型放出来。

这就是新的博弈论。有点像前面说到的台积电、三星和英特尔之间的博弈。

现实是，如果英伟达或AMD这样的公司，真的开始认真使用某一家其他晶圆代工厂，那家代工厂会很快变好。

所以我确实认为，黄仁勋会让开源模型在一定时间里落后于真正前沿。我觉得这会非常值得观察。

顺便说一句，开源也是要变现的。

“开源是免费的”其实是一个误解，开源token也要消耗能源。生成这些token需要能源，也需要GPU。而开源模型公司几乎总是会拿到收入分成。

我正在努力成为“机关枪大师”

帕特里克 你们怎么为Mythos-3、Mythos-4的世界做准备？

加文我们正在非常重视网络安全，甚至可以说是在超前投资网络安全。

有一件事我在很多场合都说过，而且我真的相信：每个家庭、每家公司，都应该提前设一个“安全词”。

所有人都应该放下电子设备，真的去海边，和家人设一个安全词，或者和公司设一个安全词。

而且这个安全词不能是那种可以被社会工程学猜出来的东西。

这是为了防范网络犯罪。

比如有一天，像你的儿子、女儿、祖父母、父母，或者任何亲人的人给你FaceTime。它看起来完全就是那个人，是一个极其精准的模拟。

它知道所有事情，还能根据他们过去说过的话，推断出他们可能会怎么说。然后它跟你说：“给我转100万美元。”

帕特里克 这是防御层面。那进攻层面呢？或者说，从分析能力上看，你们还能做什么，是它做不了的？

加文这是个好问题。

我最近刚看了《最后的武士》（The Last Samurai），也让公司里的人去看。

如果你没看过，我非常推荐。那其实是一部很经得起时间考验的电影，是汤姆·克鲁斯（Tom Cruise）20年前拍的。

故事设定是，汤姆·克鲁斯演一个痛苦、落魄的美国内战老兵，但他其实是一个非常优秀的军人。

他之所以痛苦和落魄，是因为他觉得自己参与了美国对原住民做的一些不好的事情。

后来，日本雇用了他。故事发生在明治维新时期，日本政府里的现代派请他训练一支由农民组成的军队，让他们学会如何和武士作战。

第一次战斗发生了。结果当然是武士赢了，尽管他们没有枪。

他作战非常英勇，所以武士决定不杀他，而是把他带回自己的村庄。

后来，他成了一名武士。

这对他来说有点像美国内战，所以他最后站在武士一边作战。

但结局是，他被一个拿着机关枪的农民屠杀了。

现在，机关枪已经出现了。如果我们不能都学会掌握机关枪，就会被机关枪掌握。

所以我正在努力成为“机关枪大师”。

我也比较乐观。假设你是一个50岁的武士，打过很多仗，有非常丰富的战场经验。即使进入机关枪时代，你在使用机关枪时，仍然会有优势。

我乐观地认为，作为一个终身学习投资的人，我能够掌握这把“机关枪”，也就是AI这项新技术。

我可以把它整合进我自己的投资流程，也整合进我们公司的流程。这样，作为一个人，我应该还能在很长一段时间里继续贡献价值。

但和所有人一样，我现在也一直让各种agent运行着。

帕特里克 你现在最有用的agent是什么？

加文对我来说，最有用的agent就是把播客里那些可能对我有价值的点，整理成一份非常好的摘要。

每天大概有6个小时的内容，我觉得从工作角度看，自己都应该去听、去看。

每次OpenAI、xAI、谷歌、Cursor、Fireworks、Base10的人出来讲话，更不用说黄仁勋、埃隆、达里奥这些人，我都会觉得自己必须看。

但我根本没有那么多时间。这里面有很多信息，真的是大海捞针。

还有一些东西，是我每次都特别想看的。比如，我对管理层薪酬非常敏感。他们到底被激励去做什么？他们拿的是那种很普通、甚至有点愚蠢的RSU（待满时间就能拿股票），还是PSU（业绩达标才拿股票）？如果是PSU，这些PSU具体激励他们做什么？

我觉得，有些系统已经可以很好地做第一轮筛选。

这能节省大量时间，让人把精力放在更有创造性的工作上，而不是去一页页翻代理声明，把PSU那一段找出来，再对比过去几年的代理声明，看它发生了什么变化。

这里面当然有信号，但这件事非常耗人力，而这正好适合AI。

投资里还有很多类似的事情。

所以，这是一个做投资最令人兴奋、也最让人激动的时代。

不过，我也开始有一点点担心。

市场的一些大机会是在那些被错误归类的公司里

帕特里克 你是说“多样性崩塌”那件事？

加文对，我开始有点担心。

帕特里克 你能不能再多讲一点？比如是哪类人让你担心？

加文我现在几乎找不到一个和我类似、但不看好DRAM的投资人。

帕特里克 一个都没有？

加文一个都没有。

现在AI里发生了很多有意思的事情。

第一，从横向比较看，很多估值完全说不通。它们就是不合理，不可能同时都是真的。

比如，有些半导体设备公司，按下一季度年化利润算，交易在40倍市盈率；而DRAM公司只交易在中个位数倍数。

上一轮周期高点时，这个差距大概是5倍对12倍，有一段时间甚至是3倍对45倍。

这些估值不可能同时都是对的。

当然，半导体设备公司的商业模式，确实比存储公司的商业模式改善得更多。我们也还不知道HBM会在多大程度上改善存储公司的商业模式。

是的，它们有一些来自零部件和维护的经常性收入，但这不足以支撑1000%级别的估值倍数差异。

我也很难把英伟达的估值和GE Vernova这类公司的估值放在一起理解。

英伟达在4月初的时候，相对整个市场，基本已经便宜到过去10年、12年里最便宜的水平之一。从绝对估值看，也非常便宜。

但你再看GE Vernova的估值，里面似乎隐含着英伟达未来会出现一个难以想象的份额损失。（英伟达卖的是AI算力的核心芯片，直接受益于AI算力需求；GE Vernova做的是电力设备、燃气轮机、电网、电力系统相关业务，受益于AI数据中心带来的电力需求。）

所以，不同股票之间的估值差异非常大。

第二，因为我们处在短缺环境里，质量最低的公司反而表现最好。

如果你是油气投资人、矿业投资人，或者自然资源投资人，并且熟悉成本曲线，这件事会非常直观。

在一个真正的商品牛市里，成本最高的商品供应商往往涨得最多。因为价格上涨对它们最有利。它们会从濒临破产，突然变成现金流滚滚。

我觉得这也是为什么商品投资非常难。

从完整周期看，质量好的公司会跑赢。但在短缺和商品牛市阶段，最强的上涨往往来自那些高成本公司。到了下行周期，这些在牛市里暴涨的高成本公司，可能就会破产，或者发生类似的事情。

你现在在很多行业里都能看到这种现象。

那些让科技巨头和买方讨厌的质量最低的公司，成本高、不可靠、零部件故障率高等等，但现在它们也卖光了，而且还在涨价。

然后这类公司一旦被X上的散户账户盯上，股票就会被一路炒上去。反而一些质量更高的投资标的，表现明显落后。

这对投资人来说很难。因为你几乎可以很确定地知道，那些三个月或六个月涨了10倍的股票，最后会跌回去。当然，这也取决于它们怎么使用手里的现金。

但低质量公司很少会聪明地使用现金。

所以这让我有点担心。一年前还非常怀疑的人，现在已经不再怀疑了。

但另一方面，当我再去看那些高质量公司的估值，它们又并没有被拉得很高。这让我感觉好一些。

我一直觉得，2024年和2025年，有人问AI有没有泡沫、谈 AI 泡沫，这件事挺好笑的。因为核能泡沫和量子泡沫明明就在你眼前。我们到底在讨论什么？

要知道，AI这件事是真实的。

但现在，核能和量子里那些荒唐的情绪，可能已经开始蔓延到一些更投机、质量更低、市值更小的AI相关股票上。

如果你在X或Reddit上影响力很大，就很容易推动这些股票。这让我有点害怕。

我只是希望市场上有更多AI空头。我也希望有更多存储空头。

比如Astera（一家做AI数据中心高速连接芯片的公司）是我长期关注的一家公司。它有很多空头，我很喜欢这一点。

我最早是在C轮投它。所以，如果你觉得自己能比我更准确地给它定价，那祝你好运。如果你认为它是所谓的“铜缆输家”，那我也只能祝你好运。

你还能感受到市场里各种basket，也就是篮子交易和杠杆篮子。你被市场放进哪个篮子，非常重要。

（大家觉得某些公司都受益于铜缆，就把它们放进“铜缆篮子”；觉得某些公司都受益于光通信，就放进“光模块篮子”。一旦资金开始买卖某个篮子，里面的股票就会一起涨跌，不一定完全取决于公司本身基本面。）

比如铜缆、光模块、DRAM、NAND，这些都是不同的篮子。

今年发生了一件很有意思的事。

2024年和2025年，AI交易基本是一起走的。所以你可以做多GPU 算力、scale-up networking 和光通信scale-out，同时做空电力。

从风险管理角度看，这个交易是有效的，因为我非常关注因子暴露。

但今年1月，这套逻辑被打散了。

比如，scale-up networking可能疯狂上涨，而scale-out在下跌；或者DRAM大幅跑输NAND和HDD，这在过去并没有发生过。

所以，AI内部这些横向相关性真的瓦解了。你必须看得非常细。

你不能再随便用半导体设备公司或NAND股票去对冲DRAM风险，因为它们现在不一定一起涨跌了。

今年1月，AI内部的横截面关系发生了非常有意思的变化。

我认为其中一个原因可能是，AI的能力已经到了一个新水平，很多投资人突然可以借助AI，很快弄懂这些细分领域，比如铜缆、光模块、DRAM、NAND、scale-up、scale-out，然后开始交易它们。

接着，这些股票又被放进不同的交易篮子里。而这些篮子本身的买卖，反过来又会影响个股价格。

帕特里克 AI在创造价格效率。

加文对，完全正确。

我认为除了那些我觉得可以长期复利、而且比较安全的高质量公司之外，一些大的机会就在那些被错误分类的公司里。它们和那些低质量、令人害怕的公司不一样。

比如Astera被放进了很多“铜缆输家”的篮子里。

但Astera最大的产品会是交换机。连接交换机和加速器时，会同时用到铜缆和光通信。

所以从定义上说，如果你是一家交换机公司，或者一家加速器公司，你就不可能是铜缆输家，因为你正好在那条连接的另一端。

关于谷歌、Meta、亚马逊和微软的点评

帕特里克 我想请你用一两句话点评一下几家主要公司，比如谷歌、微软、亚马逊这些上市巨头。现在很多讨论都围绕那些令人兴奋的新公司展开，但这些主要玩家也很重要。

加文当然。

先说谷歌。去年它非常了不起，因为它有TPU优势。但这个优势现在已经消失了。

我认为谷歌仍然处在很好位置，原因是它拥有最多算力。我们刚才谈过，在短缺环境下，已有装机基础的价值会变得更高。

而谷歌拥有最大的算力装机基础。

但我确实有点惊讶，它现在表现出某种无力感。

Google I/O 就在本周（5月19日举行）。如果谷歌这次不能发布一个至少略微超过OpenAI 或Claude 的模型，那会很值得关注。

这不是说谷歌就完了，当然不是。只是这会说明，我们之前谈到的“英伟达效应”可能比我想象得还要强。也就是说，英伟达的GPU、网络、软件和整个生态，可能正在给 OpenAI、Anthropic、xAI 这些公司带来更强优势，即使谷歌有自己的TPU，也未必能轻松领先。

所以我非常好奇，等谷歌发布新东西之后，整个模型竞争的帕累托前沿会怎么变化。也就是，谁能在“模型能力”和“使用成本”之间做到最优组合。

对谷歌来说，这次发布会是一张很重要的牌。

不过谷歌拥有的数据量非常大，尤其是YouTube数据，确实很有价值。在机器人时代，这些数据真的有价值。

再加上它拥有的算力，以及搜索业务，谷歌永远不会处在一个很差的位置。你也可以从GCP的高速增长里看到这一点。

Meta方面，你必须给扎克伯格很大认可。

他把Meta内部变成一家AI-first公司，这件事做得非常了不起。我确实认为，在那些真正的互联网巨头里，只有他做到了这一点。

这一点我非常认可。

他当时愿意为AI人才付出高价，开出那些10亿美元级别的合同，我也非常认可。

Muse 我觉得是一个很大的上行惊喜。这是MSL的第一个模型。它还没有进入 xAI、谷歌那个单一模型，以及OpenAI和Claude所在的帕累托前沿，但已经相当接近。

这让我印象很深。

所以我认为Meta的位置比以前好了。它的绝对位置仍然没有谷歌那么强，但它正在变好。

而你也知道，在市场里，变化率比绝对水平更重要，尤其是在三年左右这样的中短期时间框架里。

在更长周期里，竞争优势的绝对水平通常会占主导。但即便如此，变化本身也非常重要。

亚马逊，我认为它处在非常强的位置，因为它有Trainium。

未来18个月，你会在亚马逊零售业务里，看到机器人带来的真实损益改善。

我其实认为，Nova这些内部模型虽然还没有达到Muse的水平，但比外界给它们的评价要好。

微软方面，我认为萨提亚·纳德拉（Satya Nadella）是一个非常聪明的人。但在投资人交流里，大家谈他的方式已经不像以前那样了。

我喜欢萨提亚，也钦佩他。我认为他是一位非常出色的CEO。我也非常认可他过去做过的很多决策。

但你也知道，微软当初的姿态是要用AI和搜索挑战谷歌；三年后，萨提亚更像是在亲自承担Copilot的产品压力。

我很想知道，在OpenAI那次政变期间，萨提亚是否后悔过自己的选择？他是否希望自己当时支持的是伊利亚（Ilya Sutskever），而不是萨姆（Sam Altman）？他是否希望今天真正运营OpenAI的，是伊利亚和米拉（Mira Murati）？

我真的很想知道他内心深处的答案。因为如果是那个世界，微软和OpenAI的关系可能会非常不同。

这是一个非常有意思的问题，但我们永远不会知道答案。

不过，我还是很认可他。

他现在正在做的事情，是在冒险。这也回到一点：在不确定性很高的环境里，你必须做决策。你不仅要决定花多少钱，还要决定把钱花在哪里。

我认为，微软在2025年初确实犹豫了一小段时间。

它们原来有一个算法：我们花这么多资本开支，就会得到这样的回报。但那个算法失灵了。如果你犹豫，你就会失去位置。你会失去所有这些资源分配，而且之后很难拿回来。

所以它们当时犹豫了。虽然市场因此惩罚了他，但我认为现在萨提亚正在做的决定，是正确决定。

这个决定是，“我们要把算力用于内部”。

谁知道如果它们愿意直接把GPU卖给OpenAI，Azure会增长多快？但它们选择把算力用于内部，让自己的产品变得更好。

Copilot之所以这么差，或者过去这么差，一个原因就是算力不够。它们现在正在修复这个问题。

萨提亚放弃了很多东西。我的意思是，如果微软今天把所有GPU都用来服务OpenAI，以及Anthropic的需求，而不是用于自己的产品，微软股价大概已经是800美元了。

所以，我很认可他做了一个伟大的决定。

真正有意思的是，这些公司在决策上与外部世界互动的程度差异很大。

和创业公司互动最深的两家公司，远远领先的是亚马逊和英伟达。然后是谷歌，谷歌也有非常密集的互动，强度排在下一档。

博通的互动方式不一样。它基本上是所有人最喜欢的ASIC供应商。

如果你是一家创业公司，第二代芯片能和博通合作，会被认为是升级。如果第一代芯片就能和博通合作，那简直是天降甘霖。

然后你会看到，AMD、微软和Meta与创业公司的互动几乎为零。

我说“几乎为零”，当然有一点夸张。但我确实很好奇这些公司为什么会做出这样的选择。因为现在一些最好的团队，已经不在大型上市公司里了，而是在这些小型创业公司里。

我认为这最终会成为英伟达的一个很大优势。亚马逊、谷歌紧随其后。它们和创业公司之间有这种互动，而你在其他科技巨头那里基本看不到。

对于AI的乐观以及担忧之处

帕特里克 我们已经非常详细地聊了受影响最大的具体公司，也聊了一点应用层，以及如果更多价值要流向这一层，需要发生什么。

我很好奇，在这个世界变化得这么快的过程中，你还在想哪些有意思的连锁反应？

加文这确实很疯狂。

在应用层，先别说价值有没有流入，价值实际上已经被毁掉了。

帕特里克 没错。

加文从净值上看，AI已经在应用层毁掉了很多价值。

即使把Cursor、Cognition 这些最成功的AI原生公司算进去，AI在应用层毁掉的价值，也已经是数万亿美元级别。

在这个背景下，我觉得有一点值得我们注意：今天表现最好的公司，那些估值涨得最快、真正创造经济价值的公司，往往是那些“每个人对应的有效GPU数量”最高的公司。

也许这只是说明，未来每个人都会拥有很多GPU资源。但无论如何，这是一个很有意思的现象，我们需要意识到这一点。

我还想说一点，可能有点黑暗：我越来越担心个人安全。

我真的越来越担心这件事。尤其是那些公众曝光度更高、和AI关系更深的人，我特别担心他们的个人安全。

我希望不要发生什么悲剧。

但美国现在政治暴力正在上升。而随着AI越来越政治化，我担心这种暴力会越来越多地指向AI领域的关键人物。

不管我们怎么看OpenAI，也不管我个人对OpenAI有什么看法，有人向萨姆·奥尔特曼的家扔燃烧瓶，这都是一件非常糟糕的事。

我担心因为AI我们正在进入一个波动更大、风险更高、尾部事件更多的世界。

这既关系到我个人，也关系到这盘棋上的那些重要玩家。

你再想想这在地缘政治上意味着什么。

如果美国因为AI优势获得压倒性地位，这对美国当然是好事。但对世界其他国家来说，它也可能带来不稳定。

我对AI仍然非常乐观。我相信它会给世界带来非常好的东西。

我认识的一个人，他的女儿被诊断出一种非常罕见的基因突变，而且没有现成的治愈方法。

他调动了很多资源，也从一些AI实验室拿到了大量算力。那些实验室知道了这件事，也愿意提供帮助。

然后，他启动了大量agent，用AI在现有药物里寻找可能影响这种疾病的药物。后来，他又创办了一家公司，希望真正治愈这种病。

因为AI，他女儿的人生已经发生了巨大变化。这种变化几乎无法衡量。

所以，我是一个AI乐观主义者，而且可以说是极度乐观。

但我也承认，AI有点像一个事件视界（一旦越过这个边界，事情就不可逆了，你没法再回到原来的状态，也很难看清边界另一边到底会发生什么）。

它一定会成为一个不连续点。社会必须一起穿过它，也必须一起学会应对它。

我认为勒德主义者（那些反对新技术、害怕技术取代人类、认为技术进步会伤害普通人的人）。最终会是错的。

但我们也必须非常认真地对待他们的担忧。我们必须确保AI对所有人都有好处。

现在最好的AI只对有钱人开放，这确实有点反乌托邦。

这个问题必须解决。

我们需要带着谦卑面对这一切，承认其中有很多不确定性，然后认真、审慎地处理。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

加文·贝克最新对话：细谈前沿模型、晶圆及巨头格局

亲爱的凤凰网用户:

第三方浏览器推荐: