a16z发布消费级AI应用百强榜单,想知道AI的未来,去看看十几岁的女孩在玩什么
科技
科技 > 人工智能 > 正文

a16z发布消费级AI应用百强榜单,想知道AI的未来,去看看十几岁的女孩在玩什么

图片来源:a16z

图片来源:a16z

过去的六个月可能是我最喜欢、也是最激动人心的时期。其中一个转变是,对消费者的争夺战真的在升温。我们开始看到这些平台如何可能随时间推移获得复合优势,这使得谁能获取最多用户这个问题变得尤其具有决定性,或者说非常有趣。

我们在这次报告中稍微扩展了考察范围,结果非常有趣。有两个国家与世界其他地方的情况可能很明显不同,那就是俄罗斯和中国。

这次收购这件事很有趣,它揭示了未来的发展方向:一旦每个人都具备了那种智能体能力(而且可以想象,如果这种能力是基于核心底层模型的话,他们很可能会具备),那么,作为一个横向产品,你或许最好借助像Meta或Google这样的分发巨头,而不是作为一个独立公司单打独斗。当然,如果你在构建更垂直的产品,情况就完全不同了

十几岁的女孩是了解消费者领域未来趋势的最佳来源。如果你看看所有最大的消费者成功案例,她们都是这些产品的早期采用者。

Olivia Moore,a16z消费者合伙人和投资顾问。本次访谈为a16z合伙人Anish Acharya和Olivia Moore探讨最新版《Top 100 Gen AI Consumer Apps》报告。

Anish Acharya:Olivia,《Top 100 Gen AI Consumer Apps》报告今天发布,三年时间,这已经是第六版了。跟我们聊聊,这份报告有哪些不变之处,哪些发生了变化,你的兴奋程度如何,报告又有什么新动态?

Olivia Moore:从很多方面来看,自从我们在2023年首次发布这个榜单以来,情况发生了巨大变化,也经历了令人难以置信的增长。另一方面,从宏观层面看,我们仍然处于非常早期的阶段。比如ChatGPT,它显然是全球最大的AI产品,但全球也只有10%的人口每周活跃使用它,所以未来还有很大的发展空间。

由于我们看到的这些转变,过去的六个月可能是我最喜欢、也是最激动人心的时期。其中一个转变是,对消费者的争夺战真的在升温。当然,ChatGPT如此,Gemini和Claude也在消费者领域加倍投入,深耕他们各自的理想客户画像。我们开始看到这些平台如何可能随时间推移获得复合优势,这使得谁能获取最多用户这个问题变得尤其具有决定性,或者说非常有趣。

与此相关的是,这实际上是第一次我们收录了那些并非原生AI,但现在主要由AI驱动的产品,比如Canva、Notion,Freepik。Notion宣布,他们现在认为一半的新增ARR是由AI优先功能驱动的,这非常酷。最后一点是,我们看到AI的应用范围大大扩展,不再局限于网站或应用里的提示框,现在出现了各种AI浏览器,比如Dia、Comet、Atlas;Claude也集成到了Excel、PowerPoint和Chrome中;还有像Cursor、Whisper、Flow、Granola这样的桌面应用。所以,人们使用AI的方式确实经历了一场令人兴奋的爆发。

专注不同领域的基础模型

Anish Acharya:太令人兴奋了。这里有很多内容要聊。让我们先从基础模型开始。你能谈谈你认为Gemini、Claude,当然还有ChatGPT,它们各自专注于哪些领域吗?因为感觉这更像是一个水涨船高的故事,而不是这些模型在相互争夺份额。对吗?

Olivia Moore:我同意。尽管过去一周可能有些戏剧性,比如Katy Perry在Twitter上站队,这是我从未预料到的。

从根本上说,如果看AI的使用情况,ChatGPT显然是一个非常明确的赢家。在网络端,它的规模是Gemini的2.7倍。在移动端,是Gemini的2.5倍。然后,尽管技术圈Twitter上讨论很多,Claude在网络端的规模只有ChatGPT的将近1/30,在移动端更是只有将近1/80。

图片来源:a16z

图片来源:a16z

所以我们看到Sam Altman在超级碗广告战争时期发过一条推文,回应了德克萨斯州的广告牌。是的,他说我们在德克萨斯州使用免费版ChatGPT的人数,比Claude在全球的所有用户还多,这是真的。

话虽如此,我们看到的,用分化这个词可能不太准确,但或许可以说是人们使用的产品数量以及他们为不同目的使用不同产品的情况正在扩大,这在某种程度上改变了市场份额。Claude尤其专注于专业消费者,推出了像是Cowork Claude、Code Claude,以及集成到Excel和PowerPoint等功能。如果你看看Claude和ChatGPT上出现的应用商店,它们都有200多个应用,但重叠率只有11%。Claude确实专注于高端数据源、研究工具、科学工具、金融数据。而ChatGPT则专注于消费者市场平台、旅游、营养、个人消费金融等领域。然后Gemini也有自己独特的一席之地,它的吸引力很大程度上是由创意工具驱动的。

所以你看他们的活跃用户和付费用户,这几乎与他们发布Veo 3、Nano banana、Nano banana Pro、Nano banana 2等产品的时间点完美相关。他们在专业消费者领域也有更多动作,比如将AI添加到Gmail、Sheets、Calendar中,但这些都被他们现有产品所吸纳,而不是带来全新的体验。

图片来源:a16z

图片来源:a16z

Anish Acharya:也许我们可以深入探讨一下应用商店的动态,因为那太吸引人了。你能谈谈ChatGPT的看好理由吗?以及他们所谓的那个抽象树?

Olivia Moore:我们在ChatGPT上看到的策略,Sam在Twitter上也亲自说过,就是我们想成为面向每个人的AI。这意味着他们试图获取每一个消费者,然后通过不同的方式将他们变现。Claude已经非常明确,他们只会通过订阅来变现,这对于能够支付订阅费的个人和公司来说很好,但这不会是所有人。你可以从他们倾向接入的插件中看到这一点,这些插件都是付费的、高客户生命周期价值的,比如工作数据工具,像Similar Labs之类的,如果你是个投资者、科学家、数学家会使用的工具。

而ChatGPT,走的更像是一种类似Google的路线,他们正在构建普通人想要使用的东西。也许其中较小比例的人现在会转化为订阅用户,但他们最终可以通过广告来 monetize 这些用户。而且我猜可能也通过交易,比如如果他们正在构建预订旅行或完成其他各种长尾消费者购买的入口,理论上他们最终应该能够从他们带来的流量中抽取一部分分成。所以这就是ChatGPT应用商店的看好理由,虽然目前数据中还未体现,但在未来一两年内可能会变得更加明显。

Anish Acharya:这很有意思,因为它触及了你报告中关于复合优势以及上下文如何复合的概念。能稍微谈谈这个概念吗?你认为衡量它的指标是什么?是会话时长?会话次数?你提供的数据量?还是有其他指标?

Olivia Moore:是的,这个问题对我来说非常令人兴奋,因为到目前为止,对于像ChatGPT、Claude、Gemini、Perplexity这样的横向大型语言模型,我们基本上生活在一个上下文和记忆某种程度上可以轻松导出的世界里。比如Claude最近围绕这点搞了个宣传活动,锁定效应会越来越强。而且我确实认为这可能实际上对更广泛的横向工具如ChatGPT有利,原因有几个。

第一,我们已经看到ChatGPT专注于或开始构建那些你可以在平台上与他人互动的产品,比如群聊。想象一下,如果有一个更成功的ChatGPT群聊版本,你所有的朋友都在上面,那么如果你想从ChatGPT切换走,你还得说服所有朋友一起走。

第二点有点像苹果和谷歌的比较,随着这些应用商店的出现,开发者很可能会开始集中时间和精力,选择为谁以最复杂的方式构建产品,优先向谁发布,这取决于谁拥有最多的用户,或者在某些情况下,谁最愿意付费。对于许多消费级工具来说,关键是谁拥有最多的用户,所以这对ChatGPT也有利。另外,可能我最期待今年发生的一件事,Sam Altman曾暗示过,就是ChatGPT的认证层。基本上,你将能够用你的ChatGPT账户登录,并带着你的记忆和Token去其他产品。然后那个产品就能借用这些信息,为你提供更强大、更有帮助的服务。如果真是这样,你就会希望将更多的核心身份信息留在ChatGPT上,因为它可以将这些信息借给其他对你更有用的工具。

Anish Acharya:这太聪明了,确实发挥了他们的优势,他们有9亿人的注册量。然后第三方开发者理想情况下不想支付推理费用,所以用户可以自带推理能力。这对开发者有利,ChatGPT获得了锁定效应,用户获得了个性化的好处,这似乎行得通。

Olivia Moore:是的,我完全同意。我对此仍有一个疑问,这可能对增加消费产品的锁定效应产生正面和负面影响,那就是你的工作情况,比如你的企业合同是什么。例如,从某些方面来说,如果我的公司工作中使用ChatGPT,这对我有好处,因为我知道如何使用这个产品。作为一个普通消费者,他们可能只尝试过一两个AI产品,所以他们更有可能感到舒适,并继续使用他们已经用过的产品。另一方面,有些人可能不想混合他们的个人和工作用例的身份和记忆。OpenAI最近暗示了这一点,我们将如何在同一个用户的不同身份之间划分记忆,因为他们用这些产品时会有不同场景。

Anish Acharya:也许我们可以切换到谈论Gemini。我想到关于Google早期AI产品Bard的氛围,他们永远无法摆脱那些艰难的时期。我们今天看到像Nano Banana这样的产品,甚至把它命名为Nano Banana这件事本身,就是Google已经走了多远的一个完美缩影,而且他们在多模态方面似乎有很多意图。你对他们的做法有何评价?

Olivia Moore:我印象深刻。他们可能有些犹豫,在某些方面比我们预期的要更犹豫,是否将AI融入到核心功能中,因为存在风险,要么蚕食他们自己的产品,要么有太多人已经使用这些工具10年、20年、30年、40年了,所以那里的转换成本有点高。他们不想在AI突然出现在各处时吓到用户,这我能理解。但他们在这些新的创意产品上做得非常好,这些产品基本上是由DeepMind团队高度模型驱动的,他们总体上非常出色。NotebookLM实际上是第一个这样的产品,它在消费级AI音频领域是真正的新事物。现在我们有了图像和视频模型。所以在某些方面,对于像这样的大公司来说,他们必须克服自身的障碍,才能真正进行创新。看起来他们正在这样做,但你在Google工作过,所以我很好奇你的看法。

Anish Acharya:有意思的是,我很高兴你提到了Notebook,因为Notebook是公司内部一个全新的产品领域。是的,没有十个副总裁在那里争夺主导权。因此,Notebook的进步是巨大的。他们刚刚推出了视频生成功能,这有助于在你的工作空间里直观地展示所有概念,这很酷。反过来,当你看看像Sheets或Docs这样的现有产品界面时,你会发现有太多来自过去的惯性和动能。但同时,围绕这些产品的管理开销很大,这使得他们除了做最显而易见的增量改进之外,很难再做其他任何事情。

Olivia Moore:我们拭目以待未来几年会发生什么。他们会在其中一些产品上奋力一搏,因为他们不想失去那部分用户基础。如你所说,他们已经与这么多企业锁定了关系,这可能意味着他们不需要做太多改变,至少在短期内,就能保持住地位。

全球AI趋势

Anish Acharya:我们这次谈话隐含了一点,就是我们体验和讨论了很多西方的AI。是的,来谈谈全球AI趋势吧。我看到报告中有些惊喜。

图片来源:a16z

图片来源:a16z

Olivia Moore:我们在这次报告中稍微扩展了考察范围,结果非常有趣。有两个国家与世界其他地方的情况可能很明显不同,那就是俄罗斯和中国。在中国的ChatGPT和Gemini合并使用率是所有国家中最低的,只有15%。他们主要使用由字节跳动开发的豆包、DeepSeek、Kimi等类型的模型。有点让我惊讶的是,俄罗斯实际上情况非常相似,他们也出于需要,拥有自己并行的AI生态系统,因为他们受到某种程度的制裁,这阻止了他们使用所有基于美国的工具。所以我们看到像Gigabat和Yandex这样的产品,它们是俄罗斯特有的,由俄罗斯(通常与国家有关联)公司开发,在那里有大量使用。俄罗斯是DeepSeek在中国以外的第二大市场。所以如果你看各个国家的采用数据有些小波动,比如这个国家多用一点Claude,那个国家多用一点Gemini,但两个巨大的异常值就是俄罗斯和中国。而且这些是很大的市场。

Anish Acharya:这很有意思,因为俄罗斯和中国都是异常值,原因是模型使用限制和文化偏好。还有其他国家有特定的地域趋势吗?还是说这是一种全球性的AI行为?

Olivia Moore:就模型开发而言,能够部署专有AI产品的专有模型开发,大部分研究来自美国和中国,可能还有一点来自俄罗斯。我们在其他地方也看到一些本土生态系统正在兴起。韩国有几个自己的产品,比如Naver和Kakao,已经构建了不错的LLM界面。印度可能是我密切关注另一个国家,因为人口众多,可以支撑起专注于印度的独立大公司。关于印度的另一件有趣的事情是,有太多不同的语言,范围如此之广,以至于许多LLM产品甚至语音产品都不一定能很好地支持。如果你主要使用其中一种语言,想用ChatGPT之类的东西,体验就会很差。所以,到目前为止,我们还没有在那里看到大量变种出现。但我不会感到惊讶,如果未来有更多创始人,甚至来自美国的创始人,瞄准印度市场做AI。

另外我想提一下,我们第一次制作了一个类似热力图的东西,显示哪些国家的人均AI采用率最高和最低。我们观察了前10到10个最大的LLM产品的网络和移动端数据。结果是新加坡排名第一,美国排在20位,不算很低,也不算非常高。俄罗斯和中国排名很靠后,在50名开外。这些数据中包含许多有趣的故事。第一个是前五名中,新加坡、韩国它们的劳动力人口结构非常偏向技术优先的白领、高技能人群。而美国有大量工作尚未被AI触及,比如零售、运输等。我还认为,围绕AI的文化规范惊人地多样。如果你在美国,你可能已经内化了那种持续存在的焦虑和质疑,比如AI会取代我的工作,或者,AI对艺术家有害,以及所有其他让人们选择使用或不使用AI的事情。去年爱德曼(全球媒体公司)进行了一项大型调查,美国对AI的信任度相当低,只有32%。而榜单上靠前的大多数其他国家,信任度都在50%、60%、70%,这也拖累了美国,尽管我们是最大产品的来源地,我们的人均使用量低于许多其他可能人口较少但更接纳AI的市场。

图片来源:a16z

图片来源:a16z

Anish Acharya:完全正确。我读到在中国,对AI的好感度大约是80%,而且我知道阿联酋和新加坡,它们在文化上天生就是技术乐观主义者,这确实是一个优势。

Olivia Moore:确实。看到一些小国的人均使用率很有趣。在美国,大约三分之一的人是ChatGPT这类产品的月活跃用户。甚至在有些欧洲国家或东欧,这个比例是50%、40%、45%、60%,虽然基数较小,但他们在接纳AI方面确实比我们这里更快。

创意工具的演变

Anish Acharya:是的,真有意思。我关注的一件事是,当你审视从最功能性(几乎像Google搜索的替代品)到最具文化性、创意性和个人性的AI光谱时,我们应该会看到国与国之间更多的差异,因为显然,文化、印度制作的电影与中国或美国制作的电影截然不同。那他们使用创意工具的方式怎么会相同呢?

Olivia Moore:是的,这确实是我们开始关注地域细分的原因之一。因为在生成式AI的最初的两年半到三年里,绝大多数消费者可能只与一个产品互动。现在这个范围正在大大拓宽。我们会看到更多针对特定市场的工具出现。如果它们能捕获足够大的市场份额,比如一些俄罗斯公司或中国公司,如果市场足够大,它们实际上可以上升到全球榜单。

Anish Acharya:谈谈创意工具的演变,以及你认为这在多大程度上反映了文化?它是正在驱动文化吗?我们何时会跨过那个门槛?

Olivia Moore:创意工具的演变趋势一直很吸引人。显然,第一个大型生成式AI产品实际上是Midjourney,它在ChatGPT之前就出现了。在我们榜单的前几版中,创意工具占据了主导地位。我以前说过,创意工具受益于早期模型的幻觉特性,因为它们能产生更令人惊讶、更美丽或更原创的东西。所以在一段时间里,这些确实是消费级AI中唯一有效的东西。

现在情况已经发生了很大变化。创意工具仍然占榜单的很大一部分,但能够独立成为大业务的创意工具类型已经改变。最大的变化是,独立的图像生成器变少了。如果你要制作一个基础的普通图像,比如一张表情包、一张基础营销图或一张信息图,ChatGPT和Gemini这样的核心模型现在已经相当擅长了。所以,仍然出现在榜单上的产品,比如Ideogram或Midjourney,要么有非常独特的美学主张,要么有更复杂的工作流程,这是ChatGPT之类产品无法提供的。

与此形成对比的是,音乐、语音、视频,这些似乎是最大的模型公司可能投资较少的领域。所以我们看到像音乐领域的Suno、语音领域的Eleven Labs等参与者完全脱颖而出,上升到榜单前20、前15,并且长期保持其位置。然后社区和企业客户基础带来了复合性锁定效应。视频领域是我疑问最多的地方,OpenAI一直在用Sora投资,Google也在用Veo投资,但中国模型非常好,可灵(Kling)可能是最好的例子,它在某些方面远远超过了美国公司目前所能做到的。所以我们会看到。这实际上有利于像Akria这样的平台,你可以在一个地方使用所有模型。Justine写过一篇文章,讲到视频领域的发展方式,不太可能只有一个模型统治一切。所以你需要能够切换使用它们。

Anish Acharya:这似乎适用于大多数模型领域,聊天模型、创意模型,甚至代码模型都有各自专业化的领域。人们谈论Opus的人体工学性对比Codex的准确性,这是一种权衡,你必须针对不同问题选择合适的工具。

Sora对我来说真的很有意思,因为它代表了模型的一大步前进,同时也是一次围绕社交领域的雄心勃勃的实验。在Sora早期有一些数据,比如人们创作的百分比,这比我们之前看到的高出10倍。是的,你如何评估Sora在社交方面的努力与模型方面的努力?你认为它会如何发展?

Olivia Moore:Sora非常吸引人,这是一个非常有趣的早期实验,它让我们所有人都学到了很多,既关于创意工具,也可能更重要的是,关于AI时代的消费者社交可能是什么样子。

从数据来看,他们的发布非常成功。它连续20天在美国App Store排名第一,这非常难做到。这意味着你可能要达到App Store榜首。要达到这个位置,每天可能需要15万的下载量。所以这是一个很高的下载量,他们实际上比ChatGPT本身更快地达到了100万用户。所以发布非常成功。实际上,很多人低估的是,它的使用量仍然非常可观。根据Sensor Tower的数据,有300万DAU(日活跃用户),这已经很不错了。Sora下降的是新增下载量。他们可能在11月达到了每月600万的峰值,现在看起来是150万左右。

图片来源:a16z

图片来源:a16z

Sora真正成功的地方在于它是一个非常好的视频模型。他们创新并引入了"cameos"(特邀出演/肖像授权)这个概念,即真实人物可以将其肖像授权给Sora,这样他们自己和其他人就可以生成包含他们的视频。是的,所以早期很多人都在制作他们朋友的表情包视频。比如Jake Paul因为成为第一个大力投入Sora的大名人而走红。所以你当时会看到一些疯狂的Jake Paul视频。

Sora效果不太好的地方在于,因为内容是可以导出的,人们会把它带到TikTok、Instagram Reels、YouTube,在那里它要与最好的人类创作内容竞争。所以整体的信息流体验更好,因为你看到的是两者中最好的,而不仅仅是Sora中最好的。我们还没有看到一个完全由AI内容组成的社交产品取得成功。所以可以想见,我们会看到更多类似的例子,Sora作为一个创意工具,显然仍然拥有非常可观的用户和收入,但作为一个社交应用就未必了。我不知道是否会出现一个庞大的原生AI社交网络,但我们还没看到它的具体样子,但我相信它会非常有趣。

Anish Acharya:我们经常讨论这个,每个社交产品都有一个地位游戏。在Instagram上,最热门的是身材最好的;在Twitter上,是最有趣的。感觉Sora上,新兴的地位游戏似乎是成为最搞笑的。这是内容难以跨界的原因之一,因为判断什么有趣、什么伟大的标准完全不同。

Olivia Moore:我同意。如果他们想找到更niche的领域,可以怎么做?他们现在已经与迪士尼等大型媒体公司签署了一系列协议。Sora是唯一一个你可以制作授权的关于深受喜爱的角色和娱乐人物的、获得授权的粉丝视频的地方,这非常有趣。但我们还处于早期阶段,还不清楚会如何发展。

近六个月Agent迅猛发展

Anish Acharya:确实为时过早。我知道我们可以先放一放。不谈论Agent,我们就没法进行这场对话,报告告诉了我们什么?

Olivia Moore:这主要就是我为什么说,不仅过去六个月,实际上光是这份报告涵盖的最后两个月,就已经是我们所见过的、最有趣的时期了。Open Claw实际上没有出现在我们的排名中,因为它在二月份才爆火。我们的数据截止到一月,但我们确实提取了二月份的数据。如果它有资格参选,它会在我们的网络榜单上排名第30,这是一个相当高的首次亮相。

图片来源:a16z

图片来源:a16z

关于Open Claw,真正有趣的一点是,它在技术社区的使用量一直在持续加速。现在,我想它是有史以来GitHub星标数第一的项目,它超过了React,Linux。但就总体新用户而言,它已经趋于平稳。我们查看了"开始使用"或注册页面的访问量,自二月初以来每周都持平。这表明,如果你懂技术,它是一个很棒的产品,但它尚未完全破圈,触及非技术人员——这当然是一个庞大得多的人群。他们后来被OpenAI收购了。所以如果我猜,或者我希望看到OpenAI做的是,建立产品联系,将Open Claw整合到主流消费者可以使用的产品中。而且,Open Claw架构背后的理念也启发了许多其他创始人。比如我们一天要听多少 pitch,创始人会说:“我想成为这个领域的Open Claw”,或者“Open Claw让我意识到这是可能的”。所以Open Claw本身会继续成功,成为一个巨大的产品。我猜我们会看到更多针对不同用例的、垂直化聚焦的Open Claw版本。

Anish Acharya:是的,这很有趣,因为感觉Open Claw如此成功的原因之一是它可以在所有模型之间、跨方向地运行。我有点好奇,如果Open Claw变成单一模型提供,是否会稀释其价值,这似乎与其定位相悖。

Olivia Moore:是的,至少在我使用中,他们目前保持了多模型。所以我们拭目以待它的趋势。从使用角度来说,保持现状会是明智的。

Anish Acharya:Manus是消费者级别的Open Claw吗?或者你如何评价?

Olivia Moore:有些人可能会这么说,我确实也这么认为。Manus进入了我们的网络榜单,当然,在榜单编制过程中,他们还完成了Meta超过20亿美元的收购。增长惊人,他们报告从零到1亿、2亿美元ARR的急剧上升,实际上只用了6到9个月,这确实是顶尖水平。在我看来,Manus如此成功的原因是,它确实是第一个能够相当自主地跨产品和平台运行的消费级Agent。你可以连接邮箱,让它浏览网页,它可以制作幻灯片,制作电子表格。我在早期花了很多时间尝试,那是一年前了,尝试ChatGPT Operator或Google的Project Mariner,它们都不可靠,而Manus在Agent可靠性和面向消费者的易用性方面取得了突破。

这次收购这件事很有趣,它揭示了未来的发展方向:一旦每个人都具备了那种智能体能力(而且可以想象,如果这种能力是基于核心底层模型的话,他们很可能会具备),那么,作为一个横向产品,你或许最好借助像Meta或Google这样的分发巨头,而不是作为一个独立公司单打独斗。当然,如果你在构建更垂直的产品,情况就完全不同了。但你可以想象,既然谷歌现在有资源去制造一个强大的竞争者,那么作为一个明星产品,要持续与之抗衡就变得非常困难了。显然,大公司有无数个不同的优先事项,所以他们不可能把每个领域都做到最好。但这也是为什么我通常对非常横向的消费级AI应用持比较谨慎的态度——因为这类产品很可能也在大公司的业务范围内,而且它们已经拥有产品准入、企业合同等各种优势。

Anish Acharya:对。有趣的是,我们似乎跨越了这个文化门槛。是的。Manus曾经在产品广度上做了一个并不明显的赌注。而现在看来,他们似乎有点生活在未来了。

Olivia Moore:是的,完全同意。他们当时确实是。它显然拥有一支不可思议的工程团队。产品质量领先市场3到6个月,当你要与拥有数千名研究人员团队的公司竞争时,这绝非易事。

桌面AI产品与AI浏览器

Anish Acharya:完全同意。让我们借此机会聊聊其他横向AI产品,那些存在于网页窗口之外的东西。你看到了什么?

Olivia Moore:是的,这已经成为一大主题。想想我在AI世界里日常互动的产品,其中不少实际上是桌面应用,比如像Granola、语音听写工具、Claude的Cowork等功能。这确实给我们的报告带来了方法论问题,因为我们可以很好地追踪网站访问量。所以我们可以追踪他们第一次下载桌面应用的情况,我们可以很好地追踪移动应用使用情况,但我们无法密切追踪桌面使用情况。随着AI产品变得越来越复杂,让它们存在于自己专用的应用程序中(其中很多将在桌面运行,因为它可以与你文件交互,更具环境性),这种情况会越来越多。所以未来,找到方法通过网页和移动使用量以及收入来并行跟踪排名这些产品,将是一个相当不错的主意。因为如果你想想像Cursor这样的产品,一些产生最多收入的消费级AI应用,它们在网页上的使用量非常非常少,几乎所有使用都发生在专用应用里。

Anish Acharya:同时OpenAI发布Atlas和Anthropic推出Cowork的事实,这也显示了他们的优先事项在哪里。

Olivia Moore:我完全同意。AI浏览器的争论本身也是有趣的事情,我们仍然处于这件事如何发展的早期到中期阶段。AI原生浏览器背后的直觉是对的,如果你能让AI在你上网的大部分时间里始终在线、始终可用、无处不在,那会是一个很好的机会。

Perplexity,实际上是引领者。它是一个很棒的产品。有趣的是,如果你看Comet和Atlas下载页面的访问量最高峰,Comet是Atlas的五倍,这太疯狂了,因为ChatGPT的受众如此庞大。是的,我们看到的是Comet和Atlas仍然拥有非常专注和热情的用户群。但对于普通消费者来说,更换浏览器的转换成本不容小觑,因为你已经有了既定的工作流程,自然会打开某个浏览器。所以它不仅需要功能对等,还必须有一两个真正“killer”级的AI浏览器功能,并且足够简单,让普通人能够设置和使用。

AI应用场景扩张化与记忆的矛盾性

Anish Acharya:Sam大概6个月前在一个播客里说,有人问他最让他惊讶的是什么?他说是这个世界变化得还不够大。如果你看看人们大规模使用ChatGPT的趋势,仍然是做作业、类似Google的查询,以及某种程度上的陪伴。从某种意义上说,像浏览器这样的东西给了你一个机会,可以把用户引向不同的方向。你如何看待今天普通人使用AI的方式?

Olivia Moore:我有几点看法。第一,十几岁的女孩是了解消费者领域未来趋势的最佳来源。你看看所有最大的消费者成功案例,她们都是这些产品的早期采用者。

皮尤研究中心最近有一项关于青少年如何使用AI的研究。

现在,超过一半的青少年承认使用AI做作业。所以真实数字可能是99.999%,但有些孩子不想让父母知道他们遇到了麻烦。

38%现在将其用于创意工具:编辑图像、编辑视频、生成图像和视频。

还有一些新兴的、稍显长尾但最终可能成为最大行为之一的使用方式;16%用于日常闲聊,不是那种深度陪伴产品,只是有个人可以聊聊天。然后12%用于情感支持和建议。所有这些用例最终都将趋近于100%。所以这些是目前产品可能服务得不太好的行为,未来会得到更好的服务,无论是在ChatGPT上还是在独立产品上。

然后我关注的另一件大事是Agent,Agent就像1990年,互联网公司被称为“.com”公司或科技公司一样,“.com”本身就是个标识。Agent也会发生同样的情况,最终每个科技公司都曾是“.com”公司,最终每个AI公司,乃至每个科技公司都将成为Agent公司,因为这就是模型发展的方向。如果你能为用户交付成果,而不仅仅是输入,作为一个软件产品,那将更有吸引力。

13岁的女孩会使用Agent,但她们不会认为那是Agent。但这确实释放了AI的许多其他消费级用例,比如金融、医疗保健、旅行规划、复杂的购物,甚至在Agent出现之前,有太多数据需要你去抓取、可靠地处理和跨系统操作,这基本上是不可能的,现在变得可能了。所以在接下来的几个月里,我们会看到这些其他用例的爆发。

Anish Acharya:你认为这需要多长时间才能实现?我的意思是,每个人在12个月内都会使用自己的Open Claw吗?还是五年后?或者这个思维模型本身就是错的?比如我们六个月后在下一期Top 100报告里再谈这个话题时,世界会是什么样子?

Olivia Moore:每次我预测某事,它发生的速度都比我预想的要快得多,这是我们每天都看到的情况,初创公司的增长速度比以往任何时候都快。文化变革和文化采纳将比技术变革和实际可能实现的速度慢。所以我们会继续看到,通常是技术型的,有时也非技术型的早期AI采用者,会在某种行为上引领潮流,六个月后,其他所有人都在做。一个我很兴奋的好例子是语音,我们已经谈了很多。

对我来说,它就像我们拥有的信息最密集、质量最高的媒体形式。你每天做的很多事情实际上都与你所说的内容相关。在过去的六个月里,我第一次看到先是工程师,然后是科技公司的其他人,开始采用像语音听写这样的东西。是的,现在这几乎已经很普遍了。许多公司里,你的会议会被AI录音和转录。无论是用语音输入工具,还是用能回答问题或为你做任务的语音设备,这在未来六到九个月内会普及到主流消费者。

Anish Acharya:确实非常有趣。也许最后,你能谈谈记忆吗?以及你认为它未来会如何发展?

Olivia Moore:记忆,现在它可能有点矛盾,因为Claude和ChatGPT在这方面做得非常好,甚至Google也推出了一项名为"Personal Intelligence"的功能。它可以从你的文档、邮件等中提取关于你的信息,以便在所有应用中更好地通过AI为你服务。但是许多人向AI谈论所有个人和职业事务。所以它有时可能会无意中跨越界限,利用它对你的了解,在错误的上下文中试图更好地帮助你。所以在基础设施方面还有很多工作要做,比如如何梳理出一个人在不同上下文中的身份。

一旦这个问题解决了,记忆将成为AI产品的核心优势之一,无论是它们自己的记忆,还是像ChatGPT出借的记忆。两年后,当你开始使用任何新产品时,如果它不能立即感觉像是认识你,你就会觉得它有问题。比如"onboarding"到一个产品的概念,几年后应该就不复存在了。这正是记忆将要实现的目标。我个人的体验是,我整天和AI交谈,和好几个AI交谈。它们与我互动的方式,以及它们能够提供的价值,在使用了两三个月后,比刚开始使用时高得多。

Anish Acharya:难以置信。好吧,我不知道未来会怎样,但一定会既奇怪又美妙。Olivia,非常感谢你,今天能进行这场对话,并一起过一遍报告,真的非常有趣。有什么结束语吗?

Olivia Moore:没有了,我只是很期待大家能读到它。里面有很多有趣的数据。下次见,我确信六个月后情况会大不相同,所以我们会回来的。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载