
编辑:定慧
2025年8月,一个叫Nano Banana的图像生成器冲上LMArena榜首,后来Gemini App成为苹果商店下载量第一,OpenAI内部发出Code Red。但很少有人知道,这场逆袭的起点是2012年太浩湖赌场酒店的一场秘密竞拍。此后十三年,Google收购DeepMind、发明Transformer、自研TPU芯片、经历ChatGPT冲击和Bard翻车,直到创始人Sergey Brin回归、核心人才Noam Shazeer归来,才在2025年完成反超。这是一个关于人才、时间与长期主义的故事。
2025年8月的一个凌晨两点半。
谷歌的AI项目经理Naina Raisinghani正坐在电脑前,准备把DeepMind实验室的最新成果——一个超快的图像生成器——上传到LMArena排名平台。
系统需要一个名字才能提交。
这个点没人在线。
于是她随手用朋友给她起的两个外号拼了一个:Nano Banana🍌。
几天后,Nano Banana冲上排名榜首,在X上成为热门话题,全球用户生成了数十亿张图片。
谷歌一度找不到足够的算力,只能紧急借用服务器。
负责人Josh Woodward后来把这次发布称为「成功的灾难」。
到9月,Gemini App成了苹果应用商店下载量第一。11月,谷歌发布了迄今最强的Gemini 3模型,在多项指标上超越ChatGPT,股价大涨。
消息传回硅谷的另一端,OpenAI内部发出了Code Red。
如果说人工智能是一场马拉松,那么谷歌刚刚完成了一次史诗级的冲刺。
但很少有人知道,这场逆袭的起点,要追溯到十三年前一家赌场酒店的703号房间。
太浩湖的赌注
2012年12月初的一天,一场秘密竞拍正在美国滑雪胜地太浩湖(Lake Tahoe)的一家赌场酒店里进行。
太浩湖位于加州和内华达州交界处,是北美最大的高山湖泊,拥有蓝宝石般的湖面和顶级雪道。
《教父2》曾在这里取景,马克吐温曾在此地流连忘返。
由于离旧金山湾区只有200多英里,这里被称为硅谷的后花园——扎克伯格和埃里森都在此圈地占山,兴建豪宅。
但这一天,硅谷的大佬们没有来滑雪。他们在竞拍一个人。
秘密竞拍的对象,是一家刚刚成立1个月、仅有3名员工的公司——DNNresearch。
它没有任何有形的产品或资产,但追求者的身份暗示出了它的分量:谷歌、微软、DeepMind和百度。
65岁的Geoffrey Hinton坐在酒店703房间的地板上。他苍老、瘦削,饱受腰椎间盘的疼痛折磨——不能开车,也不能坐飞机。这位多伦多大学教授是深度学习领域的宗师级人物,从1972年进入爱丁堡大学算起,他已经在这条路上鏖战了40年。
他为竞拍设置了规则:起价1200万美元,每次抬价至少100万美元。
几个小时后,价格被推到了4400万美元。辛顿有些头晕,感觉「我们像是在拍电影」。他果断喊停,把公司卖给了最后的喊价者——谷歌。
有意思的是,这场4400万美元竞拍的源头之一,正是来自6个月前的谷歌。
「谷歌猫」与最老的实习生
2012年6月,谷歌研究部门Google Brain公开了一个叫「谷歌猫」的项目成果。
简单来说,这个项目就是用算法在YouTube的视频里识别猫。
它由从斯坦福跳槽来谷歌的吴恩达发起,拉上了谷歌传奇人物Jeff Dean入伙,还从创始人Larry Page那里要到了大笔预算。
谷歌猫搭建了一个神经网络,动用了遍布谷歌各个数据中心的16000个CPU进行训练,最终实现74.8%的识别准确率。
这一数字震惊业界。
但吴恩达在项目临近结束前激流勇退,投身自己的互联网教育项目。临走前他向公司推荐了辛顿来接替他的工作。
面对邀请,辛顿表示自己不会离开大学,只愿意去谷歌待一个夏天。
由于谷歌招聘规则的特殊性,时年64岁的辛顿成为了谷歌历史上最年长的暑期实习生。
这位实习生了解了谷歌猫项目的技术细节后,马上看到了项目成功背后的隐藏缺陷。他后来说:他们运行了错误的神经网络,并使用了错误的计算能力。
同样的任务,辛顿认为自己可以做得更好。
于是在短暂的实习期结束后,他马上投入行动。
辛顿找来了自己的两个学生——Ilya Sutskever和Alex Krizhevsky,两人都是出生于苏联的犹太人,前者极具数学天赋,后者擅长工程实现。三人密切配合,创建了一个新神经网络,参加了ImageNet图像识别大赛。
2012年10月,辛顿团队的冠军算法AlexNet以惊人的84%识别准确率夺冠。
相比谷歌猫用了16000颗CPU,AlexNet只用了4颗英伟达GPU。
学术界和产业界彻底轰动。
AlexNet的论文成为计算机科学史上最有影响力的论文之一,目前被引次数已经超过12万。而谷歌猫则被迅速遗忘。
太浩湖的4400万美元,给全球的深度学习大神做了一次重新定价。在那个价格面前,图灵奖的100万美元奖金看起来都像是零花钱。
天下英雄尽入彀中
谷歌在拿下辛顿团队后再接再厉。
2014年1月,谷歌以约6亿美元收购了当年在太浩湖竞拍中与之竞争的DeepMind。
这家伦敦公司的创始人Demis Hassabis是一个国际象棋神童,4岁开始接触国际象棋,14岁成为国际象棋大师。
马斯克曾向谷歌创始人Larry Page推荐了自己投资的这家公司。
为了能带上辛顿一起去伦敦验证DeepMind的成色,谷歌团队专门包了一架私人飞机,并且改造了座椅——因为辛顿的腰椎问题让他无法乘坐普通飞机。
收购完成后,谷歌的AI版图上已经聚集了当时最顶尖的深度学习人才。
与此同时,一个不太引人注目的项目正在悄悄进行:谷歌开始自研AI芯片。
他们认为语音识别这类应用会需要大量算力,于是设计了TPU(张量处理单元),比传统CPU和GPU更省电。
这一步棋当时看起来并不显眼。
但十多年后,它将成为谷歌反超的关键武器。
Transformer:改变世界的论文
2016年3月,DeepMind的AlphaGo以4:1击败围棋世界冠军李世石,震惊全球。
这是AI第一次在这种极其复杂的策略游戏中战胜人类顶尖选手。
那一年,Sundar Pichai刚接任谷歌 CEO不久。他在博客里写道:过去十年是智能手机的时代,未来十年将是AI优先的时代。
2017年6月,谷歌的一个团队发表了一篇名为《Attention Is All You Need》的论文。8位谷歌科学家提出了Transformer模型——一种彻底抛弃循环神经网络、完全基于注意力机制的新架构。
这篇论文开启了如今的大模型时代。ChatGPT、Claude、Gemini……所有当今最强大的AI模型,都建立在Transformer的基础之上。
截至2025年,这篇论文被引用超过17.3万次,位列21世纪被引用最多的论文前十。
但讽刺的是,8位作者后来全部离开了谷歌,创办或加入了其他公司。
其中一位叫Noam Shazeer。
记住这个名字。
ChatGPT的冲击
尽管谷歌拥有最强的技术积累和最顶尖的人才,但在聊天机器人这条赛道上,它一直表现得异常谨慎。
2021年5月,谷歌发布了LaMDA——一个基于Transformer的对话大模型。
但它只对少数人开放测试,限制极多。2022年8月,谷歌推出了测试应用AI Test Kitchen,有三个功能:想象它、列出它、聊狗。
没错,第三个功能只能聊狗。
谷歌的高管和研究员们担心安全问题。早期模型很容易被诱导出种族歧视或性别歧视的回答。前Google Brain员工Julia Winn说,谷歌对这类风险看得比她待过的任何公司都重。
这种谨慎让一些研究员很沮丧,有的选择了离开。
然后,2022年11月30日,OpenAI发布了ChatGPT。
五天内,一百万人注册。用户没有太多限制,想聊什么聊什么。
谷歌内部一些在AI上耕耘多年的员工气坏了。
分析师和投资者开始质疑:谷歌是不是要错过科技史上的下一波大浪?
翻车
2023年1月,Jeff Dean、Demis Hassabis和新加入的机器人专家James Manyika向董事会汇报了打造最强模型的计划。
但谷歌等不及了,需要先推一个产品出来。
2023年2月6日,他们匆忙发布了基于LaMDA的聊天机器人Bard。
发布会翻车了。
宣传视频里,Bard被问到韦伯望远镜的问题,回答说它拍了第一张系外行星照片。
这是错的。第一张系外行星照片是2004年欧洲南方天文台的甚大望远镜拍摄的。
Alphabet股价当天下跌8%,市值蒸发约1000亿美元。
这是谷歌AI历史上最黑暗的时刻之一。
创始人的回归
差不多同一时间,已经退休的谷歌联合创始人Sergey Brin在一个派对上碰到了OpenAI的研究员Daniel Selsam。
Selsam问他:ChatGPT这么厉害,作为计算机科学家你不心动吗?怎么不回来全职搞AI?
Brin觉得他说得有道理。
这位2019年从执行层退休的联合创始人,开始几乎每天参与AI工作。
他深入了解技术细节,研究损失曲线,每周参与前沿AI研究的讨论。他还帮Gemini挑毛病,并且参与了关键人才的招聘。
Brin后来说:任何计算机科学家现在都不应该退休。
他还促成了一笔关键的交易。
Noam Shazeer是2017年Transformer论文的8位作者之一。
他后来离开谷歌,与Daniel De Freitas共同创办了Character.AI——一家专注于AI角色对话的创业公司。
这两个人还有另一个共同点:他们都是LaMDA的关键开发者。
2024年8月,一个价值27亿美元的交易让这两位叛将回归了谷歌 DeepMind。
严格来说,这不是一次收购——Character.AI继续独立运营,但Shazeer、De Freitas和约30名研究人员回到了谷歌。
谷歌要回的不是公司,是人。
这两人后来参与领导了Gemini的开发。
整合
2023年4月20日,Sundar Pichai宣布了一个重大决定:Google Brain与DeepMind合并,成立新的谷歌DeepMind。
这两个团队此前一直分头运作,文化也不相同。Google Brain偏研究,总部在美国;DeepMind偏产品,根基在英国。两边合并后产生了不少摩擦。
但在ChatGPT的压力下,谷歌别无选择。
Demis Hassabis被任命为谷歌 DeepMind的CEO。Jeff Dean转任首席科学家。
与此同时,谷歌有一个OpenAI没有的优势:OpenAI需要融资,而谷歌可以从自己每年几百亿美元的利润里拿钱做研发。
2023年底,谷歌发布了第一版Gemini。
与ChatGPT主要用文本训练不同,Gemini从一开始就用文本、代码、音频、图像和视频一起训练。
这是技术野心更大的方案,虽然开发时间更长,但后来被证明是值得的。
诺贝尔奖
2024年10月,Demis Hassabis和John Jumper因AlphaFold获得诺贝尔化学奖。
AlphaFold解决了困扰科学界50年的蛋白质折叠问题——仅凭氨基酸序列就能准确预测蛋白质的三维结构。
这是AI对基础科学的历史性贡献。
对谷歌来说,这是一个转折信号:他们的科学家正在拿诺贝尔奖,而不只是追着竞争对手的尾灯跑。
关于这个故事,欢迎收看我认为目前最精彩的纪录片。
《The Thinking Game | Full documentary | Tribeca Film Festival official selection》
十年前的伏笔
2025年4月,谷歌发布了第七代AI芯片Ironwood。
每颗芯片可达4,614TFLOPs的FP8性能。
最多9,216颗芯片可以互联成一个超级算力集群,总性能达到42.5Exaflops——这是当时世界最强超级计算机El Capitan的24倍。
比第一代Cloud TPU能效提升了30倍。
当谷歌在2013年开始秘密研发TPU时,没有多少人意识到这步棋的意义。
那时候,Nvidia的GPU还是AI训练的绝对霸主;那时候,ChatGPT还不存在;那时候,大多数人连大语言模型这个词都没听说过。
但十二年后,这步落子终于开花结果。
消息传出:谷歌正在和Meta谈判,要卖给他们价值数十亿美元的TPU芯片。
Nvidia股价当天下跌7%。
成功的灾难
2025年8月,Nano Banana横空出世。
这个随手起的名字冲上了LM Arena排名榜首。全球用户疯狂使用,生成了数十亿张图片。谷歌的服务器一度不堪重负。
负责人Josh Woodward把这次发布称为成功的灾难。
到9月,Gemini App成为苹果应用商店下载量第一。月活用户从7月的4.5亿涨到了10月的6.5亿。
11月,Gemini 3发布。在多项基准测试中超越ChatGPT。自研的Ironwood芯片大幅降低了AI模型的运行成本。
Pichai在12月的内部备忘录里写道:我们以很棒的姿态结束了2025年。想想一年前我们在什么位置,这个进步令人难以置信。
逆袭的逻辑
谷歌用了十三年完成这场逆袭。
从2012年太浩湖的4400万美元竞拍,到2014年收购DeepMind,到2017年发表Transformer论文,到2023年经历Bard的翻车和团队的整合,再到2025年Gemini 3的登顶和芯片业务的突破。
期间有无数次可能走岔的路口:
如果2012年百度而不是谷歌赢下了辛顿,历史会怎样?
如果8位Transformer作者没有全部离开谷歌,会怎样?
如果Sergey Brin没有在那个派对上被一句话刺激到,会怎样?
如果Noam Shazeer没有回归,会怎样?
但历史没有如果。
尾声
回看这十三年,有一个贯穿始终的主题:人才。
太浩湖的秘密竞拍抢的是人。收购DeepMind买的是人。Sergey Brin回归是人的回归。Noam Shazeer的27亿美元交易,本质上还是请人回来。
在前沿技术领域,一个顶级学者的作用,往往大过一万个普通工程师。这就是为什么谷歌愿意花4400万美元买下一家没有产品、没有收入、只有三个人的公司。这就是为什么Brin愿意从退休生活中走出来。
而另一个主题是:时间。
TPU芯片从2013年开始研发,到2025年成为竞争优势,中间隔了12年。Transformer论文发表于2017年,但它的全部威力要到2022年ChatGPT发布后才被世界看见。深度学习的先驱们从1970年代就开始了探索,却要等到2012年才迎来产业化的曙光。
伟大之所以为伟大,不是因为其横空出世时的惊艳,而是因为它要在无边黑暗中,忍受漫长的籍籍无名与不被理解。直到多年之后,人们才能顺着这些标尺,感叹那时群星璀璨,天才辈出。
2025年末,AI竞赛远没有结束。OpenAI后来也发布了更强的ChatGPT,用户量仍然远超Gemini。这场马拉松还在继续。
但至少,谷歌已经证明了一件事:
即使是科技巨头,也可以从落后中爬起来。即使是ChatGPT的冲击,也没有把谷歌打倒。
只要有人才,只要有耐心,只要有足够长的时间线,逆袭永远可能发生。
毕竟,Nano Banana这个名字,不过是一个项目经理在凌晨两点半随手起的。
而它背后,是十三年的布局——和无数个不眠之夜。