科技 > 数码 > 正文

HDC 2026 深度解构：鸿蒙全面向 Agent 架构演进，小艺做了这三件事

爱范儿

下载客户端
独家抢先看

2026年06月14日 20:00:50 来自北京

对着手机说一句「我下午要去会展中心参加线下会议，需要提前 20 分钟到，帮我看下什么时候出发，约好车提醒我」，接下来发生的事情很快：小艺查了日程里的会议时间和地点，调用地图看实时路况算出发时间，预约好车并设了闹钟提醒。

一个任务，三个应用的多个服务，只用一句话调度。

——这是在华为开发者大会 HDC 2026 上展示的一个使用小艺的日常场景。

表面看起来是一次语音交互的升级，但底下的变化大有文章：这个任务跨了日程、地图、时钟多个独立应用，过去用户需要手动操作分别打开它们，挨个翻页找到具体的服务；但现在小艺把整条链路串起来了，用户只负责说出自己要什么就行了。

这一新的手机 AI Agent 交互体验的背后，是 HarmonyOS 向 Agent 架构的一次整体演进。基于全新升级的鸿蒙智能体框架2.0，小艺跟鸿蒙系统深度融合，成为系统智慧大脑，变成长在操作系统里的智能体，向着最强系统智能体的方向演进。

新的时代，新的入口

过去二十年，移动互联网的统一操作逻辑，建立在用户→找应用→找服务的路径上：不同应用提供不同服务，用户主动打开需要的应用，再去应用里找某个具体的服务。

我们都对这条运转良好的逻辑习以为常，但实际上我们的手机里平均安装七八十个 App，日均使用只有 10 个左右。根据第三方分析平台数据，对于一个典型的智能手机用户，62% 的 App 一个月都不会打开一次。

这些应用不是不好用，是使用场景窄，用完就搁置了。它们的服务价值还在，但需要新的调用方式。

Agent 时代正在成形的路径是「意图即服务」：用户提需求→ Agent 交付。具体来说，Agent 会判断、调度、执行，精准理解需求并分发服务。用户不需要知道背后调用了哪些 Agent/Skill，只需要知道需求被满足即可。

在新的移动/AI Agent 时代，入口的性质也发生了改变。过去，应用争夺的是「信息入口」，决定用户看到什么；Agent 时代争的是「行动入口」，决定替用户做什么。

Agent 是比搜索框更深、更高频的下一个默认入口，谁握住它，谁就掌握了下一代移动互联网的分发权。这也是移动互联网时代的平台厂商们感到紧张又兴奋的原因。

前不久，Google 将 Android 的定义从「操作系统」改成了「智慧系统」(intelligence system)。Gartner 预测到今年底 40% 的企业应用会嵌入 AI Agent，去年不到 5%。

起初，苹果通过 App Intents 框架让开发者给 Siri 暴露功能接口，不过被 Siri 自身能力所牵制。不过上周 WWDC 上苹果也算是交出了新的答卷，Siri 现在终于有了独立 App 形态，并且其理解用户意图、操作手机的能力，也有了很大提升。很明显能看到的是，苹果也在用一系列新的 Apple 智能以及 Siri AI 能力，吸引生态开发者。

Google 更激进：Gemini Intelligence 直接嵌入 Android 17 作为系统级 Agent，AppFunctions API 让应用暴露功能接口，没 API 时用 GUI 自动化兜底。不过目前接入的应用只有二三十个。

而在国内，我们看到目前最为前沿的进展，并没有意外，发生在华为的身上。

HarmonyOS 的「元服务」架构天然把服务拆成轻量、免安装、跨设备可调用的模块，Agent 浪潮则恰好提供了现成管道。华为在这条路上已经走了三步：2024 年搭建鸿蒙 AI 基础能力和框架，2025 年发布 HMAF 推动应用级 Agent 化，到今年的目标是整个操作系统的 Agent 化。

HDC 2026 上公布的三件事，就是这第三步的具体路径。

第一件事：系统应用全面 Skill 化，让系统成为小艺的感官与手脚

要能真正会干活，小艺首先需要调动更多系统能力。感知、数据、设备控制，这几类能力过去锁在系统底层。华为的做法直截了当：全部 Skill 化，交给小艺统一调度。

HDC 2026 公布的数字：系统应用全面Skill化，2100 多项系统能力可被小艺调用，200 多项系统级数据接入小艺的上下文。备忘录、日历、图库、蓝牙、联系人、文件管理等系统应用的能力全在里面。小艺因此能在用户的授权下调用摄像头、读懂屏幕内容、感知场景状态、调度多设备协同。整个 HarmonyOS 的系统能力成了小艺随手可用的工具箱，而且用户也不需要告诉小艺「先打开这个再打开那个」。

有两个场景很适合用来展现小艺获得系统级能力加持后的 Agent 使用体验：

对小艺说「我报名了楚雄半马，帮我制定个恢复训练计划」。小艺的反应链条是这样的：先拆解意图，查询比赛相关信息，判断用户处于停训或恢复期，需要温和的重启方案；再调用日程、运动健康、睡眠等系统数据；然后协调网页搜索、运动健康 Coach、运动健康 Health 等 Skills 协同工作；最后综合评估，输出定制训练计划并写入日历。

再来看跨端协同能力：比如你不在鸿蒙电脑前，但需要电脑上的一些关键文件，可以跟小艺说：「把电脑上跟傅里叶实验有关的所有材料打包发到我手机上，并且准备一份材料清单。」即便电脑是合盖待机状态，甚至都不确定文件名称具体叫什么，小艺也能帮你完成。具体步骤是：首先手机小艺就会联动 PC 小艺把电脑上近期保存的相关资料找出来并把清单发给我们确认，确认哪些是我们所需的相关资料后，PC 小艺调用文档管理 Skill 把文件打包成压缩包发送到手机小艺上，完成后跨设备通知提醒。

而且，小艺使用过程中，正在调用哪个工具、执行到哪一步，对于用户都是透明的，可见可控。

这些场景，涉及到了当下非常热门的行业概念：A2A 和 Skill。

A2A (agent-to-agent) 概念去年 4 月由 Google 和 IBM 首次提出，随后交给 Linux 基金会形成社区驱动的开源国际标准，目前得到全球超过 150 个组织的参与支持。华为此前发布的 AI 终端白皮书、鸿蒙智能体框架白皮书中都强调过系统级端/云智能体协同协议，是较早把 A2A 协作落地为系统级协议的厂商之一。

在传统的 AI 交互链条中，人对 AI 说话，AI 再去执行。但 A2A 的不同之处，在于 Agent 之间可以直接对话协作，而这需要一个聪明的「管理者」「协调者」。

在刚才的半马场景中，小艺拆解了任务，随后调度「运动健康」「日程」「搜索」等多个子 Agent 和 Skills，让它们通过鸿蒙智能体框架 (Harmony Agent Framework, HMAF) 协议自行协商和交换数据，并行推进任务。

除了自主规划、协调各种系统能力或生态伙伴能力 Skills 和 A2A 去执行任务外，小艺还能做一件更有意思的事：帮用户「造工具」。

对小艺说「做个儿童学英语的小工具，支持拍物品学单词，拍照识别物品后展示英文、音标、释义和发音，卡片可以加到单词本里」。小艺通过调用「码上飞」的文生代码能力以及结合系统的相机、TTS（文字转语音）播报能力，可以快速生成一个可交互的学习工具，不用下载应用，更不用自己写一行代码，说完就能用。

这比让小艺帮你订机票或做训练计划更往前走了一步：用户不再只是任务的发起者，更是工具的创造者。

第二件事：AI 能力开放，让开发者灵活高效接入

系统应用 Skill 化和 A2A 的支持，给小艺打好了地基。但一个系统级 Agent 如果只调用自家服务，天花板很快就到了。第二件事要解决的问题是：把生态接进来。

HDC 2026 上，小艺开放平台也进行了升级，开放了多种接入方式：Agent、Skill、MCP、意图框架等，三方应用可以选最适合自己的深度接入小艺的调度体系。目前已有 500 多个精选伙伴Skills 上线，2000 多个鸿蒙智能体上架。例如，东方财富的妙想 Skill 已经能联动联网搜索 Skill，用自然语言完成自定义条件选股。

在更底层，鸿蒙智能累计开放了 20 多项 AI 子系统能力，日调用量 36.8 亿次。诸如信息摘要、卡证识别、活体检测、图像超分等能力，已被京东金融、铁路 12306、知乎等应用接入，开发者不用自建模型，就可以在应用里调用系统级 AI。

为了让接入足够顺畅，鸿蒙智能体框架做了几件具体的事情：

A2A 协议升级后支持端侧直连，头部伙伴的 Agent 可以在设备本地完成协作，腾讯视频已经通过这种方式接入，用户可以直接让小艺设置倍速、问剧情，不用跳出当前界面；A2UI 协议让 Skill 不用预先定义界面，Agent 根据用户指令的复杂度动态生成 UI，同一个 Skill 在手机、平板、车机上都能渲染；Skill 上架打通了华为账号鉴权，配合自然语言开发工具，让规模、能力不同的开发者团队都能快速接入。

对于用户来说，只需说出需求就能得到结果，小艺可以调用各种 Skills/Agents 来为用户提供更极致的智慧体验。

这套逻辑叫「意图即服务」。用户说出需求，系统理解意图后直接匹配能完成这件事的 Agent 或 Skill，跳过「打开 App-找服务」这个步骤。

比如周末三五好友来家里聚餐，对小艺说「今天来三个好哥们，帮我规划个菜单」。小艺先根据人数和口味偏好生成菜单，列出每道菜需要的食材和分量，然后调用叮咚买菜的 Agent，把食材清单一键加入购物车，用户确认后直接下单。

从「想吃什么」到「食材到家」，一句话串起了菜单规划、食材匹配、生鲜电商三个环节。用户没有打开任何一个 App。

对开发者，分发逻辑从根本上变了，和过去的应用商城截然不同。过去是「用户找 App」，数万个应用争排名、竞价推荐位。

「意图即服务」的逻辑是「用户说需求，系统找服务」，只要服务做得好，在 Agent/Skill 化适配上足够顺畅，小艺会在用户需求匹配的时候主动精准调用开发者的服务。

华为去年启动的天工计划投入 10 亿元，目标是孵化超 10000 个 AI元服务、1000 多种意图框架以及 MCP，和 5000 多个 Agent——本质上是在帮开发者降低接入门槛。

几种接入方式中，MCP (Model Context Protocol) 是 Anthropic 2024 年提出的 Agent 与工具通信标准，目前已是行业事实标准。鸿蒙兼容 MCP，等于给外部 AI 生态开了一扇门：不管开发者在哪个大模型生态里，只要遵守这个协议，就能进入小艺的调度体系。

最后，当 Agent 可以跨应用调度服务、读取系统数据，安全就不再是附加题。

华为在 HDC 2026 同期发布了《鸿蒙智能安全白皮书》，把安全架构摆到了和 Agent 能力同等的位置。

小艺采用 HPIC（HarmonyOS 个人智能计算系统）架构，坚持本地优先、数据最小化、用户可控。需要云端算力时，AI 推理在用户专属的机密环境中运行，通过 OHTTP 协议和端云协同加密实现用户身份三重匿名盲化，系统管理员也无法查看用户明文数据。

在应用层面，涉及转账、支付等操作时，系统会阻断自动化流程，必须由用户手动完成；证件、工作文件等敏感资料在设备本地流转，云端只接收处理后的结果。

HPIC 已通过中国泰尔实验室三大安全检验，达到行业高标准的增强级要求。不仅如此，小艺 Claw 成为首个获信通院国家级认证的终端厂商 Claw 类智能体。

第三件事：业界优质大模型引入，给小艺一个可升级的大脑

第三件事关乎小艺的「智力」来源。

小艺要聪明，需要聪明的大脑。有趣的是，华为果断地选择不押注单一模型。

大模型的世界变化太快，半年前的最优解半年后可能就不是了。华为的判断很务实：与其押注一个具体的模型，不如建一套「万能插座」式的模型接入架构，让 Pangu、DeepSeek 等大模型能灵活对接和调用。谁在哪个场景做得最好，小艺就用谁。

正因为这种灵活性，小艺的使用体验变得愈发聪明。基于 Agentic 自演进架构，让小艺可以自主思考、规划、调度。效果就是，用户往往不需要告诉小艺一个复杂任务该怎么做，小艺自己思考就可以做得很好。

在实际使用中，模型的灵活对接带来的差异很明显。当你对小艺说「帮我写一封英文商务邮件」，小艺判断这是多语言生成任务，路由到英文写作能力更强的模型；当你说「分析一下我上个月的运动数据，给个改善建议」，任务涉及结构化数据理解和个性化推理，框架可能切换到另一个更擅长此类推理的模型。两个请求，两条路径，用户感知到的只有「小艺都办好了」。

这个选择和 Apple 在 Core AI 框架中的多模型策略有相似之处，但执行深度有区别。苹果在 Siri 层面开放了多模型后端，更多是提供了选择权，并且直接交给开发者，但并无更多协调层面的已知工作。而华为的更多工作，是在操作系统底层建了一套模型调度框架，覆盖从意图理解到任务执行的全链路，且模型的切换对用户透明。

模型调度解决了「会不会做」，但还有一个同样关键的问题：小艺记不记得你是谁。

就在两周前，OpenAI 上线了 Dreaming V3，将 ChatGPT 的记忆架构整个重写：系统在后台自动跨所有历史对话合成用户画像，不需要手动告诉它「请记住」，并且过时的信息还会自动更新。

行业方向越来越清楚：模型再强，如果每次对话都如初见，体验的上限很低。

在 HDC 2026 早餐会的分享交流中，小艺相关负责人介绍了小艺针对「如何记住用户」所做的努力。

小艺全新升级了记忆体系：瞬时记忆处理单次推理，短时记忆覆盖单个对话窗口，长时记忆沉淀用户的指令偏好和隐性习惯，全时记忆做伴随态的持续积累，最终汇成全局动态画像。

和纯对话型 AI 不同，小艺的记忆源不只是聊天记录——日历、运动健康、消费记录、图库这些系统级数据全在里面。华为的定位也很明确：这套记忆体系叫「鸿蒙记忆」，是 AI OS 的底座能力，不是小艺一个应用的私有功能。系统级数据、全场景设备、端侧隐私处理，这个组合是鸿蒙在记忆这一层的差异化位置。

举个例子：每年体检后我们都习惯性地把报告下载下来存在本地，但要回溯之前的某项身体数据来对比就会比较麻烦。当小艺帮你记住后，唤起小艺问一句「我这三年甘油三酯什么趋势」，小艺能跨时间调取数据，给出变化曲线，还能结合健康相关的智能体提供咨询服务。

记忆不回到场景里，就只是存档。回到服务里，才变成能力。

这一能力不局限于某个 App，而是跨应用的，系统根据记忆中沉淀的意图模式来判断什么时候弹出。这条「记忆沉淀→回到服务」的链路，把前面讲的「意图即服务」从被动响应推向了主动预判。

正如前面提到，一个体验优秀的 Agent 产品，需要两样东西成立：优秀的模型和优秀的脚手架。两者互相成就。好的智能体框架能让优秀的 Agentic 模型被最大化利用，带来更好的体验。对用户来说，小艺让人觉得「聪明懂我」「办成事」的秘诀，在于一套让好模型为它所用、让记忆越积越厚的工程体系。

当操作系统成为 Agent

2008 年 App Store 上线，沿着「用户下载 App、App 提供服务」这条路径，到今天已经 18 年，生长出了万亿美元级的分发和商业生态。

但现在，所有平台厂商都在做同一件事：把入口从 App 迁移到 Agent，带给用户更好的 AI 体验，并给开发者带来新的机会。迁移的速度，和生态扩张的速度，很可能比上一次更快。一个参照：MCP 从发布到成为行业事实标准用了半年，A2A 从提出到超过 150 个组织加入只用了一年多。移动互联网早期，一个开发范式从提出到普及至少三五年。

华为在 HDC 2026 上让小艺深度融入操作系统底层，也是沿着这条新路径做的一次前瞻尝试。

但更值得思考的，是这条路的终点指向哪里？当一个 Agent 沉淀了你的日程、健康数据、消费偏好、工作习惯，它和你的关系已经不是「工具」可以概括的了。它在变成一个了解你的协作者，不需要每次从头了解你是谁、偏好什么、上次做到了哪里，有什么问题需要改进——它都记得。

至于应用，当然不会就此消失，但新的入口已然显现。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

HDC 2026 深度解构：鸿蒙全面向 Agent 架构演进，小艺做了这三件事

亲爱的凤凰网用户:

第三方浏览器推荐: