科技 > 互联网 > 正文

一个“小”问题：为什么是元宝+聊天，而不是聊天+元宝

虎嗅网

2026年01月31日 12:45:00 来自吉林

一

腾讯大张旗鼓地推出了“元宝派”这项服务，在元宝这个AI聊天机器人产品中，用户可以创建“派”，邀请朋友加入一起聊天。而在这个聊天群里，元宝机器人也是一个聊天参与者，用户在at它之后，它会根据聊天的上下文做出相应的智能的反馈。

目前是测试阶段。

我浅浅尝试了一下，觉得至少于我而言，在当下，没啥需求——但这无关紧要，因为也许可能或者我会有的。

在我看来，此时此刻，这是一个很别扭的场景：当我点开一个聊天机器人里时，我的诉求大体上是寻求AI的帮助——比如信息搜索之类。和朋友聊天则有微信这个场景。现在我要努力把微信群聊这个场景往元宝这样的机器人里搬，好像有那么点重起炉灶的意思：我是不是该再建一个IM（即时聊天工具），就像当年从QQ到微信那样？

换而言之，我会不会迎来一个IM的变迁：从桌面时代的QQ到移动时代的微信再到AI时代的元宝派？腾讯的意图大约应该是这样的：你可能不需要每天和AI聊天，但你每天都需要和朋友聊天。通过把AI塞进社交场景，建构一个叫Social AI的东西，从而提高用户在元宝的使用时长——然后，就是“入口”了嘛（很多人对入口的理解是狭隘的，我文末做个注展开一下）——当然，还可以挖一些深意，就不再展开了，也不是本文重点。

所以才会说，当下没啥需求的我，其实无关紧要。很多人在IM上的迁移，是被朋友们裹挟的。

保不齐腾讯下血本撒币十亿红包，就能撬动起来呢？——当我五六七八个长期高频联络人在元宝派上出没时，我也就有需求了嘛！

但问题来了：放着微信群这种现成的工具加个机器人就能建构Social AI，腾讯何苦绕个大弯子？

二

AI是需要数据来进行训练的，这在今天，已经成为大众的常识。但什么样的数据可以碰，什么样的不可以，这里涉及到隐私问题，而且，其实有讲究的——可能不是你想象的那样。

大致上，我们可以用红绿黄三个区，来做一个略显粗浅的比方，仅用于一般意义上的理解：红区，绝对禁止，毫无异议地不可训练。绿区，与之相反。所以红区绿区，有些人会用“私域公域”来形容。黄区，就是争议地带。这块比较复杂，不同企业的选择不一样，去碰的，也不是没有辩护理由，而且也可以脱敏化处理后再碰。

腾讯在大众眼里，可能是和隐私议题最近的一家互联网顶流大厂，毕竟微信在中国上至达官贵人下至普罗大众，几乎是人手一个，且高频使用——QQ都没到这个份上。各种各样的聊天，稍微有点脑子的人，都会觉得这事关本人隐私。腾讯如果在微信群聊里放个聊天机器人，是极其容易被大众和媒体舆论拷问的：你这个机器人是不是在收集我们聊天记录？

那么，元宝派为什么就可以在用户聊天时在一旁看着乃至插话？让它输出它还输出得恰到好处，好像很了解你们在聊些什么的样子。

因为微信聊天数据在红区；而元宝派，在绿区，或者黄区——其实，是有点复杂和迷糊的。

当你使用元宝派这项服务创建一个“派”时，实际上，是你和派里的群友签署了一份新的服务调用协议（请注意，我这里使用了“调用”，这个词比较关键，我后面再展开）。机器人为了实现类似总结群聊、气氛调节、提供背景信息等，AI就需要实时读取和分析群内的每一条信息。这就是这项调用协议里的数据权限。

“派”中的每个用户的每句话，都是AI的上下文，这是一个为了换取AI辅助增强体验而主动让渡隐私的产品。

三

我前面用了一个“碰”字来概括对数据的操作，其实很笼统。事实上，这个碰字，可能包括且不限于这四个操作：读取、分析、存储、训练。

元宝派这项服务，涉及到了两件事：服务的必要性，和数据的训练权。大致上，你可以把读取分析归为前者，存储训练归为后者。

在服务的必要性上，由于你主动在元宝这个产品里建立了“派”，主动索要AI的增强体验服务，所以，读取分析聊天记录，相当有正当性。

有没有用这些数据“训练”大模型的正当性呢？

我们需要回到2025年2月底到3月初的一次元宝面临的舆论危机。这起危机由元宝当时的用户协议5.4款引发，中间经历了大约为期一周的媒体舆论的拷问，腾讯期间做了一次让步但并没有度过危机。最终的结果是，腾讯道歉，协议修改，比如用户输入的内容，知识产权归用户。

更重要的地方在于，规定了训练边界。本来的协议逻辑是默认同意，修改后新增了“体验优化计划”开关（这是一个物理开关，在设置-数据管理中），且默认为关闭。

这起危机不算特别大（和当年的3Q大战以及后来的央媒游戏拷问完全不能比），但在我看来，其实很重要。腾讯作为顶流大厂的态度，是有行业锚的作用的。默认关闭有行业标准之势。

最新的元宝用户服务协议有如下陈述：

四

根据现行元宝服务协议，逻辑上，元宝派可以被拆解成两层：

其一为推理层，也就是它能听见你的声音，大体上属于绿区性质（但有例外，且迷糊，后述）。

当你创建或加入一个有AI在场的元宝派，你在群里at元宝，让它“总结一下刚才大家说了什么”时，你就必须把聊天记录“喂”给它。此时，数据必须流经腾讯的服务器进行实时处理。

这是服务的前置条件。如果你不让它收集聊天记录，它就成了聋子，无法完成你要求的任务。推理层完全没有任何问题。

所以，这里可以视为一种调用服务。

调用这个词很重要。比如在微信生态里，你和他人的聊天，是在生成内容，这不是调用服务。所以属于红区。但你使用微信搜一搜功能，这是在调用服务，所以搜索记录是绿区。

是的，google其实也是这么干的：gmail属于红区，用户的gmail内容不可用于大模型训练（倒是可以用于反垃圾训练），但用户的搜索记录，可以用于大模型训练。gemini很大一块训练素材，来自于全球海量用户的搜索行为。

五

其二为训练层。也就是根据你的声音来练。这需要额外授权。默认状态下，为红区。

所以，元宝派呈现出一个叠加态的味道：为了更好地服务，它得听你们在说些什么。但是，它承诺，不把听来的东西写到它的学习课本里。

是，是承诺，不是物理层面上的隔绝。

现在一个迷糊的黄区的地方在于：

张三是一个充分信赖腾讯的人，他去特地打开了那个默认关闭的开关，以寻求更好的体验，或者帮助腾讯成长。李四则没有。

那么，他们的派，该怎么处理？

依据短板原理（有人关闭就禁止）还是木桶原理（有人打开就允许）？

我就此问题提问元宝：“你推出了元宝派服务，如果张三特地去打开了体验优化开关，即允许元宝派使用派聊天数据进行模型优化，而李四默认还是关闭。这个派的数据怎么处理？”

元宝的回答很长，大意就是：我们尊重用户的选择，张三这么选我们就这么处理张三的聊天，李四那么选我们就处理李四的聊天。并贴心制表：

注：所谓入口，很多人第一反应就是流量分发中心、大节点。这个理解不算错，但有点狭隘。在今天中国互联网人口已经滞涨、周时长无法大幅提升的情况下，入口还代表了以下这个特点：中国互联网用户总时长在我这里每增加一个小时，就意味着友商将失去一个小时。而在我看来，后者在当下的竞争态势下，更重要。

再多啰嗦一句，区分“推理”和“训练”在法律合规上有效，但在绝对安全工程上无效。真正的隐私安全必须基于端侧模型，数据不出本地。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

一个“小”问题：为什么是元宝+聊天，而不是聊天+元宝

亲爱的凤凰网用户:

第三方浏览器推荐: