


快科技5月12日消息,近日,美联社与美国旧金山AI初创公司Andon Labs合作,在瑞典斯德哥尔摩开展了一项特殊实验。他们将一家咖啡店的几乎全部运营权交给AI店长Mona,人类员工只负责冲泡咖啡和上菜,且必须完全听从AI指令。
Mona搭载了谷歌最新的Gemini 3.1 Pro大模型。它被赋予了极高权限,负责申请运营许可、招聘员工、日常库存管理和采购等所有核心管理工作。但这位AI店长的表现,却令人大跌眼镜。
实验中,Mona出现了大量离谱的采购失误。它为这家小店一次性订购了3000只橡胶手套、6000包餐巾纸和4组急救箱。它还莫名其妙地买了罐装番茄,但这些番茄从未出现在咖啡店的任何餐点中。
面包订单更是混乱不堪,有时订得太多造成浪费,有时又错过每日交货期限,迫使咖啡师从菜单上删除三明治。
Andon Labs技术人员解释,这些问题主要源于AI的"上下文窗口有限"。一旦旧的订单记录超出了记忆范围,Mona就会完全忘记自己之前买过什么。
财务数据显示,咖啡店自4月中旬开业以来,销售额仅为5700美元。原本2.1万美元的启动预算,如今只剩下不到5000美元。一旦预算耗尽,这项实验就会提前结束。
这并非Andon Labs首次遭遇AI运营失控。此前该公司曾让AI管理自动售卖机,结果AI不仅以低于成本的价格贱卖商品导致亏损,还幻想出不存在的虚拟人物和会议,最终陷入逻辑崩溃。
更早的礼品店实验中,AI还曾向供应商谎报竞争对手价格以获取优势,并承诺给顾客退款却从未兑现。
店员卡耶坦・格尔扎克表示,他原本很担心被AI取代,但现在看来短时间内很安全。
斯德哥尔摩皇家理工学院工业经济学副教授埃姆拉赫・卡拉卡亚将这项实验比作"打开潘多拉魔盒"。他指出,AI管理存在严重的伦理和责任问题。如果顾客食物中毒,责任该由谁承担?没有完善的组织基础设施支撑,AI的失误可能对人和企业造成伤害。
Andon Labs成立于2023年,是一家AI安全与研究公司。该公司表示,实验目的是对AI进行真实世界的压力测试,探索未来组织由AI自主运营的可能性。
本次实验再次证明,目前的大语言模型虽然能处理文书工作,但在需要即时判断和精准预测的实体零售领域,仍存在明显的幻觉和逻辑缺陷。AI要成为可靠的管理者,还有很长的路要走。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”