


外界还在消化最近一周的 Gemini 3 Deep Think、Opus 和 Sonnet 4.6、GLM-5、Minimax M2.5 等重磅更新时,今天,Google 又毫无预兆地掷除了最新核弹——升级版核心模型 Gemini 3.1 Pro 正式发布,并全面接入旗下消费级与开发者生态。
Gemini 3.1 Pro 的核心叙事非常清晰:专为复杂任务而生,将机器推理能力推向了前所未有的极境。
但需要指出的是:作为一个「.1」更新,Gemini 3.1 Pro 模型在「抽象推理解谜」类型的 ARC-AGI-2 基准测试中,居然拿到了比 3 Pro 高出整整一倍的成绩……
——有理由相信,主要原因可能不在于真有多么大的突破,而是测试集很有可能出现在了训练集里……
其它方面,Gemini 3.1 Pro 在科学知识测试 GPQA Diamond 上拿了 94.3%,智能体类基准 MCP Atlas 和 BrowseComp 分别拿下 69.2% 和 85.9%,高于 Anthropic 和 OpenAI 同级模型。
Google 大佬 Jeff Dean 也转发了一个使用 Gemini 3.1 Pro 模拟城市规划、设计全新城市的应用,从零生成可交互的规划界面 demo。
这体现了 Gemini 3.1 Pro 强大的代码生成和复杂逻辑处理能力。
Google 官方展示了一个 demo,让模型直接接入公开遥测数据流,搭出了一个实时追踪国际空间站轨道的酷炫网页。
Google AI Pro 与 Ultra 订阅用户已经可以使用 3.1 Pro 模型,并且使用限额比此前更高。另外在 Gemini 产品当中,3.1 Pro 模型也加入了音乐生成能力。不过爱范儿测试了几次音乐生成,一直失败。
价格方面,API 按分级付费,整体和上代 3 Pro 保持一致,但跟 Anthropic Opus 系列比还是相对便宜的。
开发者可以在 AI Studio、Gemini API、Gemini CLI、智能体开发平台 Antigravity 上,企业用户在 Vertex AI 和 Gemini Enterprise 调用 3.1 Pro 模型。
最后,该发的都发了……DeepSeek 啥时候出来再一次杀死游戏呢?
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”