阿里李飞飞首秀:一口气面向Agent发了32个新品
科技
科技 > 数码 > 正文

阿里李飞飞首秀:一口气面向Agent发了32个新品

智东西

作者 | 李水青

编辑 | 漠影

2026阿里云峰会,可能是阿里云成立17年来释放信号最为密集的一场发布会。

智东西5月20日杭州报道,今天,阿里云宣布完成“芯片-云-模型-推理”全栈Agent化升级,同步推出搭载自研AI芯片真武M890超节点服务器、最新旗舰模型Qwen3.7-Max、全新AI产品“千问云”等超50项新品及升级。这是国内云厂商首次围绕Agent进行全栈产品发布。

“Agent突破临界点之后,可以24小时不间断工作,对AI和云的需求无穷无尽。”阿里云资深副总裁刘伟光说,“阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。”

放眼全球,云巨头们正在展开一场全栈AI竞赛。谷歌有TPU+Gemini+GCP,亚马逊有Trainium+Nova+AWS,而阿里云此次亮出的“芯-云-模型-推理”全栈体系被业内称为阿里“通云哥”:通义+阿里云+平头哥。主要发布内容如下:

1. 平头哥首发新一代训推一体AI芯片真武M890,性能为上一代3倍,并公布未来两年路线图;磐久AL128超节点服务器实现128卡互联,P2P时延低于150ns。

2. 阿里云全面迈入Agentic Cloud,发布了至少32项Agentic Cloud新品及更新,覆盖运行时、编排、治理、安全、记忆、数据平面六大能力;对云产品进行Skill化、MCP化和CLI化改造,让Agent像调函数一样调用云能力。

3. Qwen3.7-Max正式发布,模型登顶Arena国产第一,可在全新芯片上自主工作35小时,将内核性能提升10倍。(智东西实测→《阿里Qwen3.7竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒》)

4. 百炼平台开放并池调度、上下文缓存等弹性技术,接入智谱、MiniMax、Kimi等150多款模型。

5. 千问云官网(www.qianwenai.com)上线,以一行指令替代传统导航,全面Skill/CLI化,对Agent更友好。

一、李飞飞首秀:连发32大新品及更新

这是阿里云首席技术官李飞飞自4月8日就任后在峰会上的重要首秀。

李飞飞宣布,阿里云通过Agent Infrastructure为Agent负载提供支持,并推出Agentic Products——面向Agent的云产品。

Agentic时代,云业务面临短生命周期、数据模态与存储形式复杂、无规律突发负载、动态环境依赖、任务级安全管控和大规模动态编排六大挑战,而Agent Infrastructure以运行时、编排、治理、安全、记忆、数据平面六大能力来应对挑战:

具体到运行环境,阿里云为Agent构建了完整的支撑体系:轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。

Agentic Cloud运行时五大新品及更新如下:

Agentic Cloud编排一大新品及更新如下:

Agentic Cloud治理四大新品及更新如下:

Agentic Cloud安全五大新品及更新如下:

Agentic Cloud记忆七大新品及更新如下:

Agentic Cloud数据平面十大新品及更新:

阿里云Agent Infrastructure已助MiniMax企业级Agent大规模落地。

有了这些产品及更新,未来一个开发者只需要给Agent一句自然语言指令,Agent就能自动完成从资源识别到应用部署的全流程,无需人工点击控制台或编写复杂脚本。

李飞飞认为,传统云产品的交互逻辑是为人设计的,用户看着控制台点击按钮,或者通过API编写代码调用。但Agent的工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。

传统云产品打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化信息对人很友好,但对Agent毫无意义。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云不是在云上加一层Agent接口,而是把云本身变成Agent能用的东西。这套改造的野心在于让云从“人的工具”变成“Agent的操作系统”。

二、平头哥首发真武M890,扔出128卡超节点算力王炸

芯片层,阿里云亮出了一张目前国内云厂商中独一份的王牌:覆盖算力、网络、存储的完整自研数据中心芯片矩阵。

峰会现场,平头哥新一代训推一体AI芯片真武M890首次亮相。规格相当硬核:144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练到超低精度推理的全场景。在低精度推理场景下,不仅能保证模型输出质量,还能显著降低单次推理的算力开销。

更值得关注的是基于真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0。这个超节点可让128张AI芯片组成一台计算机,P2P时延低于150ns,单柜带宽达到Pb/s级。

为什么要做这么大的超节点?因为Agentic时代,算力集群需要承载成千上万个Agent同时运行,每个Agent在一次任务中可能连续发起数十次模型调用,对通信时延和带宽的要求是指数级上升的。该超节点已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。

平头哥还首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

加上自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch互联芯片,平头哥的芯片版图已经从“单点突破”走到了“全面覆盖”。

三、Qwen3.7-Max来了,登顶Arena榜,胜任35小时长程任务

Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型。

在三方机构Arena全球大模型盲测总榜中,它超过Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。在细分榜单上,数学排名第7、专家任务第9、编程任务第10,表现相当均衡。

比跑分更有说服力的,是一个堪称“极限测试”的实战案例。在模型训练时从未接触过的全新硬件平台——平头哥真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立进行了432次内核评估、1158次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程。最终,它优化后的推理内核比SGLang Triton官方参考实现快了10倍。

没有人类干预,没有中间指导,35小时,从零到生产级。测试轨迹还显示,模型在独立运行超过30小时后仍发现了有效优化点,甚至主动发起了一次关键的架构重设计。这个案例展示的不是模型“回答问题”的能力,而是模型“自主完成复杂工程任务”的能力——这恰恰是Agent场景最核心的需求。

阿里巴巴通义大模型事业部负责人周靖人谈道:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”

值得注意的是,近3个月内,千问旗舰模型已经连续迭代了3.5、3.6、3.7三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配Agent时代对模型能力的指数级增长需求。

四、百炼平台全面开放,智谱、Minimax、Kimi等顶尖模型首批上架

如果说芯片是地基、模型是引擎,那百炼推理平台就是Agent真正跑起来的“生产车间”。

阿里云在百炼平台上构建了大规模GPU资源集群,并通过一套完整的技术栈应对Agent场景的特殊挑战:并池调度将GPU资源统一调度提升利用率;上下文缓存消除多轮对话和长链路任务中的重复计算开销;吞吐弹性调度应对并发请求的波峰波谷;Agentic RL基于实际执行反馈让模型持续迭代。此外,百炼内建了安全治理能力——在Agent自主运行的语境下,一个24小时不间断执行任务的Agent如果没有边界约束,后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。

在生态策略上,百炼保持开放接入。峰会当天,阿里云宣布与月之暗面、Minimax、智谱、阶跃星辰、爱诗科技、生数科技等达成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百炼,并通过千问云官网全面售卖。目前百炼已提供150多款主流模型API。

百炼不仅提供阿里自研模型服务,同时面向头部AI厂商开放,为用户提供“一个入口、多模型可选”的一站式服务体验。目前百炼已推出按需、按时长的灵活计费模式,用户可通过统一SDK接口接入不同模型,实现灵活切换与高效迭代。据阿里最新财报,截至2026年3月,百炼平台该季度客户数量同比增长了8倍。

五、首发千问云,全面Skill和CLI化,对Agent更友好

千问云是阿里云成立17年来,首次在阿里云官网之外推出的全新产品官网。打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:

安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。

过去十年,云的交互逻辑是“人登录控制台→选产品→配参数→调API”。这套流程对人类来说已经足够顺畅,但对Agent来说完全不可用。Agent不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。

千问云Skills将模型选型、调用、认证配置、用量查询等完整链路能力封装,用户无需编写任何代码,Agent即可动态路由不同模型——自动用视觉模型处理图片,用生图模型生成图片,用视频生成模型创作视频。千问云CLI则可覆盖登录认证、模型查询、调用、用量查询和环境诊断等能力,直接通过脚本或命令行自动化完成所有模型服务的工作流。

基于千问云Skills和CLI,Agent还能实时拉取模型用量数据,自动分析趋势、识别异常,为用户提供成本优化建议。目前,千问云Skills和CLI均已在GitHub开源。付费模式上,千问云提供按量付费和Token Plan订阅两种模式,后者适用于高频AI编程和Agent场景,可显著降低Token成本。

结语:全球云巨头展开AI全栈竞赛

当云的主要消费者从人变成Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。

从芯片真武M890,到Agentic Cloud,到Qwen3.7-Max,到百炼平台,再到千问云……阿里云在2026年5月20日这一天,完成了一次从底层到入口的全链路重构。

放眼全球,这场竞赛刚刚进入深水区。谷歌以TPU+Gemini+GCP构筑闭环,亚马逊以Trainium+Nova+AWS正面迎战,微软手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全栈体系,证明了中国云厂商有能力在同一张牌桌上竞争。

吴泳铭在财报电话会上把AI投入比作建设“训练工厂”和“推理工厂”。今天,这两座工厂已经开始全速运转。未来三年,阿里云的AI算力规模将比2022年增长十倍,是已经在执行的计划。

值得一提的是,阿里云选择了“开放”作为差异化路径——百炼平台接入150多款模型,千问云Skills和CLI全部开源,这既是生态策略,也是对Agent时代“没有一家模型能通吃一切”这一底层判断的回应。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载