一个“小”问题:为什么是元宝+聊天,而不是聊天+元宝
科技
科技 > 互联网 > 正文

一个“小”问题:为什么是元宝+聊天,而不是聊天+元宝

腾讯大张旗鼓地推出了“元宝派”这项服务,在元宝这个AI聊天机器人产品中,用户可以创建“派”,邀请朋友加入一起聊天。而在这个聊天群里,元宝机器人也是一个聊天参与者,用户在at它之后,它会根据聊天的上下文做出相应的智能的反馈。

目前是测试阶段。

我浅浅尝试了一下,觉得至少于我而言,在当下,没啥需求——但这无关紧要,因为也许可能或者我会有的。

在我看来,此时此刻,这是一个很别扭的场景:当我点开一个聊天机器人里时,我的诉求大体上是寻求AI的帮助——比如信息搜索之类。和朋友聊天则有微信这个场景。现在我要努力把微信群聊这个场景往元宝这样的机器人里搬,好像有那么点重起炉灶的意思:我是不是该再建一个IM(即时聊天工具),就像当年从QQ到微信那样?

换而言之,我会不会迎来一个IM的变迁:从桌面时代的QQ到移动时代的微信再到AI时代的元宝派?腾讯的意图大约应该是这样的:你可能不需要每天和AI聊天,但你每天都需要和朋友聊天。 通过把AI塞进社交场景,建构一个叫Social AI的东西,从而提高用户在元宝的使用时长——然后,就是“入口”了嘛(很多人对入口的理解是狭隘的,我文末做个注展开一下)——当然,还可以挖一些深意,就不再展开了,也不是本文重点。

所以才会说,当下没啥需求的我,其实无关紧要。很多人在IM上的迁移,是被朋友们裹挟的。

保不齐腾讯下血本撒币十亿红包,就能撬动起来呢?——当我五六七八个长期高频联络人在元宝派上出没时,我也就有需求了嘛!

但问题来了:放着微信群这种现成的工具加个机器人就能建构Social AI,腾讯何苦绕个大弯子?

AI是需要数据来进行训练的,这在今天,已经成为大众的常识。但什么样的数据可以碰,什么样的不可以,这里涉及到隐私问题,而且,其实有讲究的——可能不是你想象的那样。

大致上,我们可以用红绿黄三个区,来做一个略显粗浅的比方,仅用于一般意义上的理解:红区,绝对禁止,毫无异议地不可训练。绿区,与之相反。所以红区绿区,有些人会用“私域公域”来形容。黄区,就是争议地带。这块比较复杂,不同企业的选择不一样,去碰的,也不是没有辩护理由,而且也可以脱敏化处理后再碰。

腾讯在大众眼里,可能是和隐私议题最近的一家互联网顶流大厂,毕竟微信在中国上至达官贵人下至普罗大众,几乎是人手一个,且高频使用——QQ都没到这个份上。各种各样的聊天,稍微有点脑子的人,都会觉得这事关本人隐私。腾讯如果在微信群聊里放个聊天机器人,是极其容易被大众和媒体舆论拷问的:你这个机器人是不是在收集我们聊天记录?

那么,元宝派为什么就可以在用户聊天时在一旁看着乃至插话?让它输出它还输出得恰到好处,好像很了解你们在聊些什么的样子。

因为微信聊天数据在红区;而元宝派,在绿区,或者黄区——其实,是有点复杂和迷糊的。

当你使用元宝派这项服务创建一个“派”时,实际上,是你和派里的群友签署了一份新的服务调用协议(请注意,我这里使用了“调用”,这个词比较关键,我后面再展开)。机器人为了实现类似总结群聊、气氛调节、提供背景信息等,AI就需要实时读取和分析群内的每一条信息。这就是这项调用协议里的数据权限。

“派”中的每个用户的每句话,都是AI的上下文,这是一个为了换取AI辅助增强体验而主动让渡隐私的产品。

我前面用了一个“碰”字来概括对数据的操作,其实很笼统。事实上,这个碰字,可能包括且不限于这四个操作:读取、分析、存储、训练。

元宝派这项服务,涉及到了两件事:服务的必要性,和数据的训练权。大致上,你可以把读取分析归为前者,存储训练归为后者。

在服务的必要性上,由于你主动在元宝这个产品里建立了“派”,主动索要AI的增强体验服务,所以,读取分析聊天记录,相当有正当性。

有没有用这些数据“训练”大模型的正当性呢?

我们需要回到2025年2月底到3月初的一次元宝面临的舆论危机。这起危机由元宝当时的用户协议5.4款引发,中间经历了大约为期一周的媒体舆论的拷问,腾讯期间做了一次让步但并没有度过危机。最终的结果是,腾讯道歉,协议修改,比如用户输入的内容,知识产权归用户。

更重要的地方在于,规定了训练边界。本来的协议逻辑是默认同意,修改后新增了“体验优化计划”开关(这是一个物理开关,在设置-数据管理中),且默认为关闭。

这起危机不算特别大(和当年的3Q大战以及后来的央媒游戏拷问完全不能比),但在我看来,其实很重要。腾讯作为顶流大厂的态度,是有行业锚的作用的。默认关闭有行业标准之势。

最新的元宝用户服务协议有如下陈述:

根据现行元宝服务协议,逻辑上,元宝派可以被拆解成两层:

其一为推理层,也就是它能听见你的声音,大体上属于绿区性质(但有例外,且迷糊,后述)。

当你创建或加入一个有AI在场的元宝派,你在群里at元宝,让它“总结一下刚才大家说了什么”时,你就必须把聊天记录“喂”给它。此时,数据必须流经腾讯的服务器进行实时处理。

这是服务的前置条件。如果你不让它收集聊天记录,它就成了聋子,无法完成你要求的任务。推理层完全没有任何问题。

所以,这里可以视为一种调用服务。

调用这个词很重要。比如在微信生态里,你和他人的聊天,是在生成内容,这不是调用服务。所以属于红区。但你使用微信搜一搜功能,这是在调用服务,所以搜索记录是绿区。

是的,google其实也是这么干的:gmail属于红区,用户的gmail内容不可用于大模型训练(倒是可以用于反垃圾训练),但用户的搜索记录,可以用于大模型训练。gemini很大一块训练素材,来自于全球海量用户的搜索行为。

其二为训练层。也就是根据你的声音来练。这需要额外授权。默认状态下,为红区。

所以,元宝派呈现出一个叠加态的味道:为了更好地服务,它得听你们在说些什么。但是,它承诺,不把听来的东西写到它的学习课本里。

是,是承诺,不是物理层面上的隔绝。

现在一个迷糊的黄区的地方在于:

张三是一个充分信赖腾讯的人,他去特地打开了那个默认关闭的开关,以寻求更好的体验,或者帮助腾讯成长。李四则没有。

那么,他们的派,该怎么处理?

依据短板原理(有人关闭就禁止)还是木桶原理(有人打开就允许)?

我就此问题提问元宝:“你推出了元宝派服务,如果张三特地去打开了体验优化开关,即允许元宝派使用派聊天数据进行模型优化,而李四默认还是关闭。这个派的数据怎么处理?”

元宝的回答很长,大意就是:我们尊重用户的选择,张三这么选我们就这么处理张三的聊天,李四那么选我们就处理李四的聊天。并贴心制表:

注:所谓入口,很多人第一反应就是流量分发中心、大节点。这个理解不算错,但有点狭隘。在今天中国互联网人口已经滞涨、周时长无法大幅提升的情况下,入口还代表了以下这个特点:中国互联网用户总时长在我这里每增加一个小时,就意味着友商将失去一个小时。而在我看来,后者在当下的竞争态势下,更重要。

再多啰嗦一句,区分“推理”和“训练”在法律合规上有效,但在绝对安全工程上无效。真正的隐私安全必须基于端侧模型,数据不出本地。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载