科技 > 数码 > 正文

阿里李飞飞首秀：一口气面向Agent发了32个新品

智东西

下载客户端
独家抢先看

2026年05月21日 10:29:29 来自北京

智东西

作者 | 李水青

编辑 | 漠影

2026阿里云峰会，可能是阿里云成立17年来释放信号最为密集的一场发布会。

智东西5月20日杭州报道，今天，阿里云宣布完成“芯片-云-模型-推理”全栈Agent化升级，同步推出搭载自研AI芯片真武M890的超节点服务器、最新旗舰模型Qwen3.7-Max、全新AI产品“千问云”等超50项新品及升级。这是国内云厂商首次围绕Agent进行全栈产品发布。

“Agent突破临界点之后，可以24小时不间断工作，对AI和云的需求无穷无尽。”阿里云资深副总裁刘伟光说，“阿里云正在进行全栈技术革新，从底层芯片、Agentic Cloud、模型到推理平台全面升级，建设中国最大的AI工厂。”

放眼全球，云巨头们正在展开一场全栈AI竞赛。谷歌有TPU+Gemini+GCP，亚马逊有Trainium+Nova+AWS，而阿里云此次亮出的“芯-云-模型-推理”全栈体系被业内称为阿里“通云哥”：通义+阿里云+平头哥。主要发布内容如下：

1. 平头哥首发新一代训推一体AI芯片真武M890，性能为上一代3倍，并公布未来两年路线图；磐久AL128超节点服务器实现128卡互联，P2P时延低于150ns。

2. 阿里云全面迈入Agentic Cloud，发布了至少32项Agentic Cloud新品及更新，覆盖运行时、编排、治理、安全、记忆、数据平面六大能力；对云产品进行Skill化、MCP化和CLI化改造，让Agent像调函数一样调用云能力。

3. Qwen3.7-Max正式发布，模型登顶Arena国产第一，可在全新芯片上自主工作35小时，将内核性能提升10倍。（智东西实测→《阿里Qwen3.7竞技场杀至国产第一！一手实测：分分钟破解奥赛难题，图文视觉全都难不倒》）

4. 百炼平台开放并池调度、上下文缓存等弹性技术，接入智谱、MiniMax、Kimi等150多款模型。

5. 千问云官网（www.qianwenai.com）上线，以一行指令替代传统导航，全面Skill/CLI化，对Agent更友好。

一、李飞飞首秀：连发32大新品及更新

这是阿里云首席技术官李飞飞自4月8日就任后在峰会上的重要首秀。

李飞飞宣布，阿里云通过Agent Infrastructure为Agent负载提供支持，并推出Agentic Products——面向Agent的云产品。

Agentic时代，云业务面临短生命周期、数据模态与存储形式复杂、无规律突发负载、动态环境依赖、任务级安全管控和大规模动态编排六大挑战，而Agent Infrastructure以运行时、编排、治理、安全、记忆、数据平面六大能力来应对挑战：

具体到运行环境，阿里云为Agent构建了完整的支撑体系：轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路，以及全域智能运维能力。

Agentic Cloud运行时五大新品及更新如下：

Agentic Cloud编排一大新品及更新如下：

Agentic Cloud治理四大新品及更新如下：

Agentic Cloud安全五大新品及更新如下：

Agentic Cloud记忆七大新品及更新如下：

Agentic Cloud数据平面十大新品及更新：

阿里云Agent Infrastructure已助MiniMax企业级Agent大规模落地。

有了这些产品及更新，未来一个开发者只需要给Agent一句自然语言指令，Agent就能自动完成从资源识别到应用部署的全流程，无需人工点击控制台或编写复杂脚本。

李飞飞认为，传统云产品的交互逻辑是为人设计的，用户看着控制台点击按钮，或者通过API编写代码调用。但Agent的工作负载是“无规律弹性、短生命周期、瞬时起量即走”，与传统云计算的稳态负载截然不同。

传统云产品打开控制台，看到一堆菜单、配置项、仪表盘，这些视觉化信息对人很友好，但对Agent毫无意义。为此，阿里云对云产品进行了Skill化、MCP化和CLI化改造，让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云不是在云上加一层Agent接口，而是把云本身变成Agent能用的东西。这套改造的野心在于让云从“人的工具”变成“Agent的操作系统”。

二、平头哥首发真武M890，扔出128卡超节点算力王炸

芯片层，阿里云亮出了一张目前国内云厂商中独一份的王牌：覆盖算力、网络、存储的完整自研数据中心芯片矩阵。

峰会现场，平头哥新一代训推一体AI芯片真武M890首次亮相。规格相当硬核：144GB显存，片间互联带宽800GB/s，性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多种数据精度，可应用于高精度训练到超低精度推理的全场景。在低精度推理场景下，不仅能保证模型输出质量，还能显著降低单次推理的算力开销。

更值得关注的是基于真武M890的磐久AL128超节点服务器，搭载自研互联芯片ICN Switch 1.0。这个超节点可让128张AI芯片组成一台计算机，P2P时延低于150ns，单柜带宽达到Pb/s级。

为什么要做这么大的超节点？因为Agentic时代，算力集群需要承载成千上万个Agent同时运行，每个Agent在一次任务中可能连续发起数十次模型调用，对通信时延和带宽的要求是指数级上升的。该超节点已上线阿里云百炼，支持Qwen、DeepSeek、Kimi等主流模型。

平头哥还首次公布了真武系列芯片的路线规划：未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片，已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

加上自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch互联芯片，平头哥的芯片版图已经从“单点突破”走到了“全面覆盖”。

三、Qwen3.7-Max来了，登顶Arena榜，胜任35小时长程任务

Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型。

在三方机构Arena全球大模型盲测总榜中，它超过Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1，与GPT、Claude、Gemini最强模型接近，位列国产模型第一。在细分榜单上，数学排名第7、专家任务第9、编程任务第10，表现相当均衡。

比跑分更有说服力的，是一个堪称“极限测试”的实战案例。在模型训练时从未接触过的全新硬件平台——平头哥真武M890芯片上，Qwen3.7-Max仅凭一份任务说明，从零开始自主工作35小时，独立进行了432次内核评估、1158次工具调用，完全自主地完成了编写、编译、性能分析与迭代改进的全流程。最终，它优化后的推理内核比SGLang Triton官方参考实现快了10倍。

没有人类干预，没有中间指导，35小时，从零到生产级。测试轨迹还显示，模型在独立运行超过30小时后仍发现了有效优化点，甚至主动发起了一次关键的架构重设计。这个案例展示的不是模型“回答问题”的能力，而是模型“自主完成复杂工程任务”的能力——这恰恰是Agent场景最核心的需求。

阿里巴巴通义大模型事业部负责人周靖人谈道：“大模型正在经历一次核心范式转移——从对齐人类偏好，到对齐任务目标。过去我们追求的是模型‘说得好’，现在要求模型‘做得到’。Qwen3.7-Max的设计初衷，就是让模型真正成为Agent的智能内核，具备自主规划、持续迭代、跨工具协作的能力。”

值得注意的是，近3个月内，千问旗舰模型已经连续迭代了3.5、3.6、3.7三个版本，保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化，以匹配Agent时代对模型能力的指数级增长需求。

四、百炼平台全面开放，智谱、Minimax、Kimi等顶尖模型首批上架

如果说芯片是地基、模型是引擎，那百炼推理平台就是Agent真正跑起来的“生产车间”。

阿里云在百炼平台上构建了大规模GPU资源集群，并通过一套完整的技术栈应对Agent场景的特殊挑战：并池调度将GPU资源统一调度提升利用率；上下文缓存消除多轮对话和长链路任务中的重复计算开销；吞吐弹性调度应对并发请求的波峰波谷；Agentic RL基于实际执行反馈让模型持续迭代。此外，百炼内建了安全治理能力——在Agent自主运行的语境下，一个24小时不间断执行任务的Agent如果没有边界约束，后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。

在生态策略上，百炼保持开放接入。峰会当天，阿里云宣布与月之暗面、Minimax、智谱、阶跃星辰、爱诗科技、生数科技等达成合作，GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百炼，并通过千问云官网全面售卖。目前百炼已提供150多款主流模型API。

百炼不仅提供阿里自研模型服务，同时面向头部AI厂商开放，为用户提供“一个入口、多模型可选”的一站式服务体验。目前百炼已推出按需、按时长的灵活计费模式，用户可通过统一SDK接口接入不同模型，实现灵活切换与高效迭代。据阿里最新财报，截至2026年3月，百炼平台该季度客户数量同比增长了8倍。

五、首发千问云，全面Skill和CLI化，对Agent更友好

千问云是阿里云成立17年来，首次在阿里云官网之外推出的全新产品官网。打开页面，突出的不是产品列表，也不是控制台，没有任何传统意义上的导航结构。首页只有一行字：

安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具，智能体可以直接解析这条指令，“学会”网站的全部能力，并根据需求自主调用。

过去十年，云的交互逻辑是“人登录控制台→选产品→配参数→调API”。这套流程对人类来说已经足够顺畅，但对Agent来说完全不可用。Agent不看网页，不点按钮，它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。

千问云Skills将模型选型、调用、认证配置、用量查询等完整链路能力封装，用户无需编写任何代码，Agent即可动态路由不同模型——自动用视觉模型处理图片，用生图模型生成图片，用视频生成模型创作视频。千问云CLI则可覆盖登录认证、模型查询、调用、用量查询和环境诊断等能力，直接通过脚本或命令行自动化完成所有模型服务的工作流。

基于千问云Skills和CLI，Agent还能实时拉取模型用量数据，自动分析趋势、识别异常，为用户提供成本优化建议。目前，千问云Skills和CLI均已在GitHub开源。付费模式上，千问云提供按量付费和Token Plan订阅两种模式，后者适用于高频AI编程和Agent场景，可显著降低Token成本。

结语：全球云巨头展开AI全栈竞赛

当云的主要消费者从人变成Agent，所有围绕人类设计的界面、流程和交互逻辑，都将被重写。

从芯片真武M890，到Agentic Cloud，到Qwen3.7-Max，到百炼平台，再到千问云……阿里云在2026年5月20日这一天，完成了一次从底层到入口的全链路重构。

放眼全球，这场竞赛刚刚进入深水区。谷歌以TPU+Gemini+GCP构筑闭环，亚马逊以Trainium+Nova+AWS正面迎战，微软手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全栈体系，证明了中国云厂商有能力在同一张牌桌上竞争。

吴泳铭在财报电话会上把AI投入比作建设“训练工厂”和“推理工厂”。今天，这两座工厂已经开始全速运转。未来三年，阿里云的AI算力规模将比2022年增长十倍，是已经在执行的计划。

值得一提的是，阿里云选择了“开放”作为差异化路径——百炼平台接入150多款模型，千问云Skills和CLI全部开源，这既是生态策略，也是对Agent时代“没有一家模型能通吃一切”这一底层判断的回应。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

阿里李飞飞首秀：一口气面向Agent发了32个新品

亲爱的凤凰网用户:

第三方浏览器推荐: