咖啡机变聪明后,我连咖啡都喝不上了
科技
科技 > 人工智能 > 正文

咖啡机变聪明后,我连咖啡都喝不上了

编辑|Sia

目前还没有人真正解决这个问题:如何让 LLM 知道什么时候该精确、什么时候可以随机。

这真是一个让人当场破防的早晨。

一位 The Verge 的科技记者起床、走进厨房、对着支持 Alexa 的博世咖啡机说了句,煮杯咖啡。

没有即兴发挥,也没提什么复杂要求,她只是希望机器老老实实执行一个早就设好的程序,结果,被拒绝了。

而且不是一次。

自从升级到 Alexa Plus(亚马逊的生成式 AI 语音助手)之后,这种对话几乎成了她的晨间固定项目。

每一次要它煮咖啡,Alexa 都能给出不同理由,以惊人的创造力告诉你,不行。

58 个梗图点子| 幽默, 搞笑, 迷因

2025 年都快过去了,AI 会写论文、会写代码、会陪人聊天、会教书,却在清晨败给了一句「煮杯咖啡」。

在社区讨论中,类似吐槽场面非常壮观,可谓怨声载道。

开灯这个事儿,完全成了重灾区。

播放歌曲也是艰难。

定个时也这么难了啊。

彻底心灰意冷的也有。

显然,现实与大家对 AI 的直觉预期,构成了鲜明反差。

传统助手虽然笨吧,但高度确定,只要你把(有点傻的)「咒语」念对,结果总是可以预期的。

现在好了,以 LLM 为核心的生成式AI助手,智商是高了,理解是深了,表达是丰富了,却偏偏在它们原本最擅长的事情上频频翻车:

开灯、设定计时器、播报天气、播放音乐、运行 Routine。

港產片|這些經典對白梗圖你知道出處嗎? | 影視時尚| 潮遊生活| 當代中國

为什么会这样?

因为,LLM 天生引入了大量随机性。它能理解更多含义,也允许更自由的表达,但代价是:解释空间被极大放大了,包括误解的可能性。

你向 ChatGPT 提出同一个问题,今天和明天得到不同答案,这正是它的价值所在。但当这种特性被用于控制一台咖啡机时,就有问题了。

在要求即时、可重复、零容错的控制场景下谈概率,本身就是一个大 bug。

相比之下,传统语音助手的本质,其实是模板匹配器。它们并不理解,只是识别关键词,然后填参数。

比如你说「播放广播」,系统非常清楚,后面只可能跟「电台名称」。

为了弥补生成式模型在确定性上的短板,亚马逊和谷歌都尝试将 LLM 与智能家居 API 深度绑定。但这又引入了新的问题。

LLM 确实不擅长在每一次请求中,都生成完全一致、语法严格正确的系统调用。

而当它们被要求直接生成 API 调用、去控制真实设备时——哪怕是一个极小的偏差,都可能导致整个操作失败。

这正是为什么,你的咖啡机有时就是死活不肯给你做咖啡。

理论上,让新助手达到旧助手那样的可靠性,并非不可能,但这需要极其大量的工程投入、约束设计和失败兜底。

而在资源有限、 「做点更刺激、也更赚钱的事情」诱惑又足够大的现实里, 最简单的路径就是先把技术推到现实世界中,再让它慢慢自我修正。

换句话说,我们正在集体扮演一个角色:AI 的长期内测用户。

目前还没有人真正解决「如何让 LLM 知道什么时候该精确、什么时候可以随机」的问题。所以,大家可能要在相当长的一段时间里,不断和它较劲、和血压搏斗。

既然如此,为什么还要坚定地抛弃旧技术?

两个字:潜力。

所谓的代理式 AI(Agentic AI),让系统具备服务链式调用的能力:它能够理解复杂任务之间的内在关系,并在此基础上动态生成执行逻辑。

这也是旧技术路线必须被放弃的根本原因。

过去,基于固定规则与关键词匹配的语音系统,在架构层面就被限定为「单指令执行器」,它们无法理解目标、拆解任务,更不可能在运行时生成新的行动路径。

这不是一次简单的技术升级,而是一次能力范式的切换。

回到社区舆论,虽然连最基本的指令都出错,但网友们也承认,升级后的语音助手在理解复杂命令这件事上,确实更强了。

比如你说,「这里调暗一点,温度再高一点。」 它可以同时调灯和调恒温器。

当质问「Alexa,你到底在干嘛?为什么不关掉我的音乐?!」 它真的会去查一下发生了什么。

放在过去,这些都是不可想象的。

最为人称道的是是摄像头通知功能的变化。

传统系统往往只有一句高度概括的废话,「后院检测到运动。」于是你不得不:打开 App → 点开视频 → 回看 → 发现是一只猫。

现在,新系统会直接告诉你,「门口出现了不熟悉的面孔,但没有进入院子。」

用语音设置复杂 Routine,也确实比在 Alexa App 里一层层点设置来得轻松,哪怕这些 Routine 运行起来并不那么稳定。

在大量用户讨论中,也逐渐形成了一个相对温和的共识:问题不在于是否引入 AI,而在于「边界」、是否试图用 AI 替代一切。

一些用户认为,更合理的方向不是「去按钮化」——取代那些已经被验证过的、确定性的执行机制,而是让 AI 帮助人理解系统。

当前出现的混乱,或许并不是生成式 AI 的失败,而是其被放置在了一个并不适合它的核心位置。

不过,至少在今天,这条清醒的边界远未被勾勒出来,也不知什么时候能被画出来。

那么,你的智能家具还好吗?有没有过类似的抓狂瞬间?欢迎来评论区唠唠。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载