


对着手机说一句「我下午要去会展中心参加线下会议,需要提前 20 分钟到,帮我看下什么时候出发,约好车提醒我」,接下来发生的事情很快:小艺查了日程里的会议时间和地点,调用地图看实时路况算出发时间,预约好车并设了闹钟提醒。
一个任务,三个应用的多个服务,只用一句话调度。
——这是在华为开发者大会 HDC 2026 上展示的一个使用小艺的日常场景。
表面看起来是一次语音交互的升级,但底下的变化大有文章:这个任务跨了日程、地图、时钟多个独立应用,过去用户需要手动操作分别打开它们,挨个翻页找到具体的服务;但现在小艺把整条链路串起来了,用户只负责说出自己要什么就行了。
这一新的手机 AI Agent 交互体验的背后,是 HarmonyOS 向 Agent 架构的一次整体演进。基于全新升级的鸿蒙智能体框架2.0,小艺跟鸿蒙系统深度融合,成为系统智慧大脑,变成长在操作系统里的智能体,向着最强系统智能体的方向演进。
新的时代,新的入口
过去二十年,移动互联网的统一操作逻辑,建立在用户→找应用→找服务的路径上:不同应用提供不同服务,用户主动打开需要的应用,再去应用里找某个具体的服务。
我们都对这条运转良好的逻辑习以为常,但实际上我们的手机里平均安装七八十个 App,日均使用只有 10 个左右。根据第三方分析平台数据,对于一个典型的智能手机用户,62% 的 App 一个月都不会打开一次。
这些应用不是不好用,是使用场景窄,用完就搁置了。它们的服务价值还在,但需要新的调用方式。
Agent 时代正在成形的路径是「意图即服务」:用户提需求→ Agent 交付。具体来说,Agent 会判断、调度、执行,精准理解需求并分发服务。用户不需要知道背后调用了哪些 Agent/Skill,只需要知道需求被满足即可。
在新的移动/AI Agent 时代,入口的性质也发生了改变。过去,应用争夺的是「信息入口」,决定用户看到什么;Agent 时代争的是「行动入口」,决定替用户做什么。
Agent 是比搜索框更深、更高频的下一个默认入口,谁握住它,谁就掌握了下一代移动互联网的分发权。这也是移动互联网时代的平台厂商们感到紧张又兴奋的原因。
前不久,Google 将 Android 的定义从「操作系统」改成了「智慧系统」(intelligence system)。Gartner 预测到今年底 40% 的企业应用会嵌入 AI Agent,去年不到 5%。
起初,苹果通过 App Intents 框架让开发者给 Siri 暴露功能接口,不过被 Siri 自身能力所牵制。不过上周 WWDC 上苹果也算是交出了新的答卷,Siri 现在终于有了独立 App 形态,并且其理解用户意图、操作手机的能力,也有了很大提升。很明显能看到的是,苹果也在用一系列新的 Apple 智能以及 Siri AI 能力,吸引生态开发者。
Google 更激进:Gemini Intelligence 直接嵌入 Android 17 作为系统级 Agent,AppFunctions API 让应用暴露功能接口,没 API 时用 GUI 自动化兜底。不过目前接入的应用只有二三十个。
而在国内,我们看到目前最为前沿的进展,并没有意外,发生在华为的身上。
HarmonyOS 的「元服务」架构天然把服务拆成轻量、免安装、跨设备可调用的模块,Agent 浪潮则恰好提供了现成管道。华为在这条路上已经走了三步:2024 年搭建鸿蒙 AI 基础能力和框架,2025 年发布 HMAF 推动应用级 Agent 化,到今年的目标是整个操作系统的 Agent 化。
HDC 2026 上公布的三件事,就是这第三步的具体路径。
第一件事:系统应用全面 Skill 化,让系统成为小艺的感官与手脚
要能真正会干活,小艺首先需要调动更多系统能力。感知、数据、设备控制,这几类能力过去锁在系统底层。华为的做法直截了当:全部 Skill 化,交给小艺统一调度。
HDC 2026 公布的数字:系统应用全面Skill化,2100 多项系统能力可被小艺调用,200 多项系统级数据接入小艺的上下文。备忘录、日历、图库、蓝牙、联系人、文件管理等系统应用的能力全在里面。小艺因此能在用户的授权下调用摄像头、读懂屏幕内容、感知场景状态、调度多设备协同。整个 HarmonyOS 的系统能力成了小艺随手可用的工具箱,而且用户也不需要告诉小艺「先打开这个再打开那个」。
有两个场景很适合用来展现小艺获得系统级能力加持后的 Agent 使用体验:
对小艺说「我报名了楚雄半马,帮我制定个恢复训练计划」。小艺的反应链条是这样的:先拆解意图,查询比赛相关信息,判断用户处于停训或恢复期,需要温和的重启方案;再调用日程、运动健康、睡眠等系统数据;然后协调网页搜索、运动健康 Coach、运动健康 Health 等 Skills 协同工作;最后综合评估,输出定制训练计划并写入日历。
再来看跨端协同能力:比如你不在鸿蒙电脑前,但需要电脑上的一些关键文件,可以跟小艺说:「把电脑上跟傅里叶实验有关的所有材料打包发到我手机上,并且准备一份材料清单。」即便电脑是合盖待机状态,甚至都不确定文件名称具体叫什么,小艺也能帮你完成。具体步骤是:首先手机小艺就会联动 PC 小艺把电脑上近期保存的相关资料找出来并把清单发给我们确认,确认哪些是我们所需的相关资料后,PC 小艺调用文档管理 Skill 把文件打包成压缩包发送到手机小艺上,完成后跨设备通知提醒。
而且,小艺使用过程中,正在调用哪个工具、执行到哪一步,对于用户都是透明的,可见可控。
这些场景,涉及到了当下非常热门的行业概念:A2A 和 Skill。
A2A (agent-to-agent) 概念去年 4 月由 Google 和 IBM 首次提出,随后交给 Linux 基金会形成社区驱动的开源国际标准,目前得到全球超过 150 个组织的参与支持。华为此前发布的 AI 终端白皮书、鸿蒙智能体框架白皮书中都强调过系统级端/云智能体协同协议,是较早把 A2A 协作落地为系统级协议的厂商之一。
在传统的 AI 交互链条中,人对 AI 说话,AI 再去执行。但 A2A 的不同之处,在于 Agent 之间可以直接对话协作,而这需要一个聪明的「管理者」「协调者」。
在刚才的半马场景中,小艺拆解了任务,随后调度「运动健康」「日程」「搜索」等多个子 Agent 和 Skills,让它们通过鸿蒙智能体框架 (Harmony Agent Framework, HMAF) 协议自行协商和交换数据,并行推进任务。
除了自主规划、协调各种系统能力或生态伙伴能力 Skills 和 A2A 去执行任务外,小艺还能做一件更有意思的事:帮用户「造工具」。
对小艺说「做个儿童学英语的小工具,支持拍物品学单词,拍照识别物品后展示英文、音标、释义和发音,卡片可以加到单词本里」。小艺通过调用「码上飞」的文生代码能力以及结合系统的相机、TTS(文字转语音)播报能力,可以快速生成一个可交互的学习工具,不用下载应用,更不用自己写一行代码,说完就能用。
这比让小艺帮你订机票或做训练计划更往前走了一步:用户不再只是任务的发起者,更是工具的创造者。
第二件事:AI 能力开放,让开发者灵活高效接入
系统应用 Skill 化和 A2A 的支持,给小艺打好了地基。但一个系统级 Agent 如果只调用自家服务,天花板很快就到了。第二件事要解决的问题是:把生态接进来。
HDC 2026 上,小艺开放平台也进行了升级,开放了多种接入方式:Agent、Skill、MCP、意图框架等,三方应用可以选最适合自己的深度接入小艺的调度体系。目前已有 500 多个精选伙伴Skills 上线,2000 多个鸿蒙智能体上架。例如,东方财富的妙想 Skill 已经能联动联网搜索 Skill,用自然语言完成自定义条件选股。
在更底层,鸿蒙智能累计开放了 20 多项 AI 子系统能力,日调用量 36.8 亿次。诸如信息摘要、卡证识别、活体检测、图像超分等能力,已被京东金融、铁路 12306、知乎等应用接入,开发者不用自建模型,就可以在应用里调用系统级 AI。
为了让接入足够顺畅,鸿蒙智能体框架做了几件具体的事情:
A2A 协议升级后支持端侧直连,头部伙伴的 Agent 可以在设备本地完成协作,腾讯视频已经通过这种方式接入,用户可以直接让小艺设置倍速、问剧情,不用跳出当前界面;A2UI 协议让 Skill 不用预先定义界面,Agent 根据用户指令的复杂度动态生成 UI,同一个 Skill 在手机、平板、车机上都能渲染;Skill 上架打通了华为账号鉴权,配合自然语言开发工具,让规模、能力不同的开发者团队都能快速接入。
对于用户来说,只需说出需求就能得到结果,小艺可以调用各种 Skills/Agents 来为用户提供更极致的智慧体验。
这套逻辑叫「意图即服务」。用户说出需求,系统理解意图后直接匹配能完成这件事的 Agent 或 Skill,跳过「打开 App-找服务」这个步骤。
比如周末三五好友来家里聚餐,对小艺说「今天来三个好哥们,帮我规划个菜单」。小艺先根据人数和口味偏好生成菜单,列出每道菜需要的食材和分量,然后调用叮咚买菜的 Agent,把食材清单一键加入购物车,用户确认后直接下单。
从「想吃什么」到「食材到家」,一句话串起了菜单规划、食材匹配、生鲜电商三个环节。用户没有打开任何一个 App。
对开发者,分发逻辑从根本上变了,和过去的应用商城截然不同。过去是「用户找 App」,数万个应用争排名、竞价推荐位。
「意图即服务」的逻辑是「用户说需求,系统找服务」,只要服务做得好,在 Agent/Skill 化适配上足够顺畅,小艺会在用户需求匹配的时候主动精准调用开发者的服务。
华为去年启动的天工计划投入 10 亿元,目标是孵化超 10000 个 AI元服务、1000 多种意图框架以及 MCP,和 5000 多个 Agent——本质上是在帮开发者降低接入门槛。
几种接入方式中,MCP (Model Context Protocol) 是 Anthropic 2024 年提出的 Agent 与工具通信标准,目前已是行业事实标准。鸿蒙兼容 MCP,等于给外部 AI 生态开了一扇门:不管开发者在哪个大模型生态里,只要遵守这个协议,就能进入小艺的调度体系。
最后,当 Agent 可以跨应用调度服务、读取系统数据,安全就不再是附加题。
华为在 HDC 2026 同期发布了《鸿蒙智能安全白皮书》,把安全架构摆到了和 Agent 能力同等的位置。
小艺采用 HPIC(HarmonyOS 个人智能计算系统)架构,坚持本地优先、数据最小化、用户可控。需要云端算力时,AI 推理在用户专属的机密环境中运行,通过 OHTTP 协议和端云协同加密实现用户身份三重匿名盲化,系统管理员也无法查看用户明文数据。
在应用层面,涉及转账、支付等操作时,系统会阻断自动化流程,必须由用户手动完成;证件、工作文件等敏感资料在设备本地流转,云端只接收处理后的结果。
HPIC 已通过中国泰尔实验室三大安全检验,达到行业高标准的增强级要求。不仅如此,小艺 Claw 成为首个获信通院国家级认证的终端厂商 Claw 类智能体。
第三件事:业界优质大模型引入,给小艺一个可升级的大脑
第三件事关乎小艺的「智力」来源。
小艺要聪明,需要聪明的大脑。有趣的是,华为果断地选择不押注单一模型。
大模型的世界变化太快,半年前的最优解半年后可能就不是了。华为的判断很务实:与其押注一个具体的模型,不如建一套「万能插座」式的模型接入架构,让 Pangu、DeepSeek 等大模型能灵活对接和调用。谁在哪个场景做得最好,小艺就用谁。
正因为这种灵活性,小艺的使用体验变得愈发聪明。基于 Agentic 自演进架构,让小艺可以自主思考、规划、调度。效果就是,用户往往不需要告诉小艺一个复杂任务该怎么做,小艺自己思考就可以做得很好。
在实际使用中,模型的灵活对接带来的差异很明显。当你对小艺说「帮我写一封英文商务邮件」,小艺判断这是多语言生成任务,路由到英文写作能力更强的模型;当你说「分析一下我上个月的运动数据,给个改善建议」,任务涉及结构化数据理解和个性化推理,框架可能切换到另一个更擅长此类推理的模型。两个请求,两条路径,用户感知到的只有「小艺都办好了」。
这个选择和 Apple 在 Core AI 框架中的多模型策略有相似之处,但执行深度有区别。苹果在 Siri 层面开放了多模型后端,更多是提供了选择权,并且直接交给开发者,但并无更多协调层面的已知工作。而华为的更多工作,是在操作系统底层建了一套模型调度框架,覆盖从意图理解到任务执行的全链路,且模型的切换对用户透明。
模型调度解决了「会不会做」,但还有一个同样关键的问题:小艺记不记得你是谁。
就在两周前,OpenAI 上线了 Dreaming V3,将 ChatGPT 的记忆架构整个重写:系统在后台自动跨所有历史对话合成用户画像,不需要手动告诉它「请记住」,并且过时的信息还会自动更新。
行业方向越来越清楚:模型再强,如果每次对话都如初见,体验的上限很低。
在 HDC 2026 早餐会的分享交流中,小艺相关负责人介绍了小艺针对「如何记住用户」所做的努力。
小艺全新升级了记忆体系:瞬时记忆处理单次推理,短时记忆覆盖单个对话窗口,长时记忆沉淀用户的指令偏好和隐性习惯,全时记忆做伴随态的持续积累,最终汇成全局动态画像。
和纯对话型 AI 不同,小艺的记忆源不只是聊天记录——日历、运动健康、消费记录、图库这些系统级数据全在里面。华为的定位也很明确:这套记忆体系叫「鸿蒙记忆」,是 AI OS 的底座能力,不是小艺一个应用的私有功能。系统级数据、全场景设备、端侧隐私处理,这个组合是鸿蒙在记忆这一层的差异化位置。
举个例子:每年体检后我们都习惯性地把报告下载下来存在本地,但要回溯之前的某项身体数据来对比就会比较麻烦。当小艺帮你记住后,唤起小艺问一句「我这三年甘油三酯什么趋势」,小艺能跨时间调取数据,给出变化曲线,还能结合健康相关的智能体提供咨询服务。
记忆不回到场景里,就只是存档。回到服务里,才变成能力。
这一能力不局限于某个 App,而是跨应用的,系统根据记忆中沉淀的意图模式来判断什么时候弹出。这条「记忆沉淀→回到服务」的链路,把前面讲的「意图即服务」从被动响应推向了主动预判。
正如前面提到,一个体验优秀的 Agent 产品,需要两样东西成立:优秀的模型和优秀的脚手架。两者互相成就。好的智能体框架能让优秀的 Agentic 模型被最大化利用,带来更好的体验。对用户来说,小艺让人觉得「聪明懂我」「办成事」的秘诀,在于一套让好模型为它所用、让记忆越积越厚的工程体系。
当操作系统成为 Agent
2008 年 App Store 上线,沿着「用户下载 App、App 提供服务」这条路径,到今天已经 18 年,生长出了万亿美元级的分发和商业生态。
但现在,所有平台厂商都在做同一件事:把入口从 App 迁移到 Agent,带给用户更好的 AI 体验,并给开发者带来新的机会。迁移的速度,和生态扩张的速度,很可能比上一次更快。一个参照:MCP 从发布到成为行业事实标准用了半年,A2A 从提出到超过 150 个组织加入只用了一年多。移动互联网早期,一个开发范式从提出到普及至少三五年。
华为在 HDC 2026 上让小艺深度融入操作系统底层,也是沿着这条新路径做的一次前瞻尝试。
但更值得思考的,是这条路的终点指向哪里?当一个 Agent 沉淀了你的日程、健康数据、消费偏好、工作习惯,它和你的关系已经不是「工具」可以概括的了。它在变成一个了解你的协作者,不需要每次从头了解你是谁、偏好什么、上次做到了哪里,有什么问题需要改进——它都记得。
至于应用,当然不会就此消失,但新的入口已然显现。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”