300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验
科技
科技 > 数码 > 正文

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

智东西

作者 | 江宇

编辑 | 漠影

德国爆冷夺冠!

看到Kimi这份世界杯预测报告,很多球迷第一反应大概率是:这AI能懂球吗?

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

毕竟,足球比赛最有意思的地方就在于随机。强队会翻车,弱队会爆冷。门将的脱手,或是一张红牌,都可能把整场球赛带到一个未知的比分。

但Kimi这次就把这个高不确定性的题目拿来,做了一场大型实验。

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

2026世界杯是最贵的一届,也是最复杂的一届。

今年,世界杯将扩容到48支球队、12个小组、104场比赛,赛程横跨美国、加拿大和墨西哥三国。

小组出线、淘汰赛对阵、球员伤病、旅途消耗、天气变化和舆论压力,每一项都与比赛结果密切相关。

光说让一个人看完整届世界杯,已经够累了。Kimi的做法是:直接派出最多300个Agent,把这些变量分开研究。

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

有的Agent战术,有的Agent球员状态,有的Agent赛程和旅途,还有的Agent专门唱反调,负责找出预测里可能被忽略的风险。它们累计完成了超过10万次模拟推演,最后生成了一份224页的世界杯预测报告

这场活动叫Kimi Token Goal。Kimi会围绕104场比赛进行赛前预测和赛后复盘,把自己的判断放到真实赛果面前接受检验。

可以看出,这是一次娱乐性质的世界杯预测活动。但这背后实打实地考验着Kimi最近迄今最新与最强的能力:Agent集群和Kimi Work。前者让300个Agent像一支研究小队一样分头做事,后者则把这种能力放进普通人的电脑桌面。

今天它们一起研究世界杯,明天也可能帮用户做行业研究、数据分析、报告生成和工作流自动化。

可以说,Kimi这次不是单纯想当“数字章鱼保罗”,也让我们看看:Agent不只是会聊天,还能围绕一个复杂任务持续干活、反复修正,并且把结果交给真实世界来检验。

一、看衰阿根廷,德国成“最大黑马”?是300个Agent算出来的

Kimi此次最受关注的预测之一,或许是直接给卫冕冠军阿根廷敲响了警钟,并且公开预测德国队爆冷夺冠

阿根廷有梅西,德国近几年大赛表现又并不稳定,Kimi为什么会给出这样的判断?

其实,这来自Agent集群的多轮推演

Agent集群累计完成超过10万次世界杯模拟,评估阿根廷在淘汰赛首轮(32强赛)出局的概率约为15%。而德国队在乐观情景下的夺冠概率则达到18%

在阿根廷这边,Kimi设置了悲观情景推演。重点跟踪10名存在伤病隐患的国脚,也会考虑梅西、奥塔门迪等老将年龄增长带来的影响。

在德国这边,Kimi关注的是穆西亚拉、维尔茨等新生代球员的状态,以及德国队在部分情景下被低估的可能性。

为了避免模型只强化主流观点,Kimi还引入了反方Agent机制。这部分Agent专门寻找潜在风险因素,将阿根廷过去64年未曾消失的“卫冕冠军魔咒”等历史规律纳入分析。它们的任务就是找漏洞、找反例和找翻车风险。

因此,这个看似“出奇”的结论是由300个Agent大量模拟、交叉验证和正反观点博弈后的结果。

二、变量多、信息杂、分歧大,世界杯成了Agent集群的天然考场

本届世界杯有104场比赛,比赛数量比过去更多,变量也更多。

无论对资深球迷,还是“初出茅庐”的Agent集群来说,想要预测结果,都不是一个只看历史胜率就能解决的问题。

但是,Agent集群恰恰适合这种任务。

战术Agent看阵型和打法,球员Agent追踪状态和伤病,赛程Agent计算旅途和休息,历史Agent分析过往交锋,反方Agent专门提出不同意见,合规Agent则负责把内容控制在体育研究和娱乐讨论范围内。

并且,世界杯还有一个特殊机制:结果天然公开。预测正确与否、哪些变量判断失误、哪些因素被低估,都可以在赛后复盘并反馈给系统。

对于Agent来说,世界杯既有足够复杂的信息环境,也有明确的结果反馈机制,是观察其复杂任务处理能力的一个典型场景。

三、世界杯之外,Agent集群还能做什么?

当然,预测世界杯是一个相对容易被我们理解的场景。但Kimi真正的野心,其实在你我的电脑桌面上。

世界杯预测背后的核心能力,是任务拆解、并行研究、信息整合和持续修正。这套能力同样适用于行业研究、财报分析、商业尽调等复杂工作。

Kimi Work是Kimi电脑客户端新增的本地通用Agent模式

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

其关键能力,就是支持Agent集群。它可以自主创建300个分身并行完成原本耗时较久的复杂工作。

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

程序员以前用Coding Agent在终端里让AI写代码,现在知识工作者则可以在电脑桌面上用Kimi Work让AI做调研、分析、整理文件、生成报告,以及跨工具完成一整套任务。

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

此外,Kimi Work还内置专业数据源和Kimi WebBridge,能够操作用户自己的浏览器和登录态,可以“上手处理”用户日常工作的真实桌面,包括网页、表格、PPT、本地文件和各种零散资料。

300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验

世界杯只是前菜,Agent集群真正面向的是更广泛的知识工作场景。

与此同时,Kimi还围绕世界杯推出了一系列互动活动:用户可选择一支球队作为主队,参与冠军预测;德国队或用户所选主队每赢一场,均可参与瓜分10亿token池

结语:一场AI能力的世界杯公开考

Kimi Token Goal并非是要证明AI能100%猜中世界杯。

足球的魅力,恰恰来自它的不确定性。任何因素都可能在几分钟内改写一场比赛的走向。

所以,如何组织300个Agent一起研究一件复杂事情,或许更值得关注。

世界杯则提供了一个天然的实验场。每一场比赛都会给出真实结果,每一次预测都能接受球迷和赛果的检验,每一次判断失误也都能被拿出来复盘。

对于Kimi来说,这次活动的意义不只是预测冠军归属,更是把分析过程、预测结果和赛后复盘放在同一个“透明框”里,向外界展示Agent集群如何处理复杂任务,以及当前AI能力究竟能做到什么、还有哪些边界。

今天,300个Agent研究的是世界杯;明天,它们研究的或许就是你的下一份行业报告。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载