a16z最新访谈:说SaaS已死为时尚早,AI会让这类软件更有价值
科技
科技 > 互联网 > 正文

a16z最新访谈:说SaaS已死为时尚早,AI会让这类软件更有价值

作者|林易

编辑|重点君

在AI冲击下,SaaS行业正经历一场前所未有的信任危机。过去这段时间,市场中关于SaaS末日的恐慌情绪不断蔓延,许多老牌软件公司的股价遭遇重挫。投资者们集体陷入焦虑:如果AI能够自动完成所有的企业任务,那些以高昂订阅费为生的SaaS公司,是否会彻底走向消亡?

3月6日,知名投资机构a16z与软件公司Atlassian的CEO Mike对此进行了深度探讨。他们核心观点是:如果SaaS企业无法适应新的定价模型和人机交互范式,确实会被淘汰;但那些掌握了企业核心业务逻辑的系统,反而会借助AI构筑起更深的护城河。

我们梳理了这场访谈的重点信息:

1.软件的本质正在发生十年来的最大跃迁:从静态文件柜变成主动执行者

纵观1960年到2022年的软件发展史,从早期的IBM Saber航空预订系统,到后来的CRM和ERP,本质都只是在做一件事:把现实世界中的实体文件柜变成了数字化的数据库。过去的软件是被动的,无论界面多么精美,依然需要人类员工去检索文件、阅读信息并执行操作。

但在AI时代,这些文件柜第一次具备了自主思考和执行任务的能力。未来的软件不再仅仅是记录数据的容器。例如,过去的QuickBooks只是让财务人员从中提取收据来做账,而现在的AI加持下,QuickBooks可以直接自主完成对账和催款任务。从被动存储向主动执行的跨越,是这一轮软件革命的真正核心所在。

2.SaaS行业并没有迎来末日,生存概率取决于定价模式和业务逻辑的深度

市场之所以无差别地抛售SaaS股票,是因为投资者没有看透SaaS公司之间的底层差异。Alex指出,面对AI的冲击,SaaS公司将出现严重的两极分化:

许多SaaS是按账号座席(Seats)收费的,且这些座席直接与工作产出挂钩。例如一旦企业部署了AI客服,大部分终端问题能被直接解决,企业对人工客服账号的需求就会趋近于零。这类SaaS极度危险,如果不改变商业模式,其现有的订阅收入将面临毁灭性打击。

而像Workday等人事财务核心系统的处境就比较安全。它们虽然也按员工人数收费,但并不与具体的工作产出直接挂钩。更重要的是,它们不仅仅是一个数据库,更是企业数十年复杂业务流程、合规要求和隐性规则的集合体。AI不仅无法摧毁它们,反而会让它们更有价值。比如,当企业要在Workday录入一名新员工时,AI可以直接调用Workday里的数据去自动完成背景调查和前雇主电话核实。AI成为了这些核心系统的放大器。

3.Vibe Coding只会是核心系统的补充,绝非替代品

目前行业内有一种声音认为:既然普通人可以通过向AI下达自然语言指令来自己写代码,那企业为什么还要花大价钱买SaaS?大家自己写一个管理系统不就好了吗?

Mike认为,这种想法完全脱离了真实的商业环境。真实的商业世界充满了无数极其复杂的边缘场景和特殊法则。例如,你可以轻易用AI写一个员工请假应用,但当你的印第安纳州分公司有员工休产假时,当地特殊的法律法规、税法差异该如何处理?这些隐性知识深深嵌入在大型SaaS的底层代码中,是普通人无法通过几句提示词就能复刻的。

因此,Vibe Coding的真正价值,绝不是去颠覆核心的SaaS软件,而是降低长尾需求的开发门槛。比如,行政人员可以利用Vibe Coding,基于Workday的底层数据和规则,低成本地为自己的小团队开发一个会议室预订小工具。这不但不会取代核心SaaS,反而会使其在企业内部的粘性变得空前强大。

4.当前AI落地的最大瓶颈已经不是模型智商,而是产品设计与人机信任

技术界往往对大模型的参数和跑分极其狂热,但Mike指出:现在AI大模型的能力,已经远远超出了实际被用户利用的价值。

开发者如果只给用户一个无所不能的空白聊天框,只会导致用户陷入选择瘫痪。要让AI真正融入工作流,需要类似于从PC端到移动端那样的革命性UI/UX设计。

而企业级AI落地的最大阻碍是员工的不信任。AI Agent在一秒钟内自动处理了15封邮件和审批,用户的本能反应并不是开心,而是恐慌:“它到底发了什么?有没有出错?”。因此,优秀的AI产品必须设计合理的断点与回路,它需要允许用户在工作流中实时提问“你正在做什么”,并在关键决策前停下来询问人类的意见。只有在不打扰用户的前提下,建立起透明的信任机制,AI才能真正成为生产力工具。

面对这一轮技术更迭,我们无需为SaaS行业的阵痛而过度悲观。AI在商业软件中的终局,不是建立一座全知全能、彻底淘汰人类和现有系统的神殿,而是像基础设施一样,深深融入到现有的工作流与核心业务中。在这场变革中,懂得利用AI重构交互、深挖业务逻辑壁垒的软件公司,将迎来比过去十年更加辉煌的黄金时代。

以下为a16z访谈实录:

1.SaaS风险水平已上升

Alex:从1960年到2022年,软件的全部历史就是把文件柜变成数据库。第一个例子是1960年IBM与美国航空合作开发的SABRE系统。它取代了以前由众多秘书管理、存放在保险柜里的纸质预约系统,将这些数据存入了早期的数据库中。要知道,在那个年代,10MB的硬盘可能要花费数亿美元。电子健康档案的发展也是如此,马萨诸塞州综合医院(Mass General Hospital)开发了最早的系统MUMPS。同样地,Salesforce以及1987年成立的第一家CRM公司也是如此,它们本质上都是把文件柜变成了数据库。

这种做法确实有好处,但并没有让世界变得多高效。以前如果要找Eric的资料,你会让专人去人力资源部的文件柜里调取。现在虽然数据都在Workday里了,但你必须设立首席信息安全官以防系统被黑,还需要IT人员在单点登录系统中为你配置账号(seats)。只有在跨地区协作时效率才有所体现,人们现在可以协同工作,并在数据库上执行复杂的连接查询,这在纸质文档时代要困难得多。但本质上,从1960年到2022年的软件依然只是静态的,因为文件柜本身无法思考。

而如今AI领域正在发生的最酷的事情,就是文件柜可以自己干活了。比如QuickBooks现在实际上可以独立完成某项任务,而不再仅仅依赖人类从系统里检索文件,这就像彻底告别了16世纪老派会计部门去档案柜翻找资料的时代,非常有趣。

Erik:这确实是个很好的切入点。大家现在都在讨论“SaaS末日”甚至“SaaS大灾难”,这显然是指公开市场上正在发生的事情。关于它的重大意义,很多人都有不同的观点。我想听听你们两位是如何解读的?到底发生了什么?更重要的是,我们该如何理解这一切?为什么大家对此感到如此恐惧?

Mike:我认为,全世界目前都在试图弄清楚,在这个高度颠覆性的阶段,该如何对软件业务进行评级或估值。每个人对未来会是什么样子都有自己犀利的见解。不同的观点描绘出了两种极端的未来:对整个软件行业、某些特定公司或类别而言,要么极好,要么极坏。毫无疑问,目前的风险水平已经上升了。

从投资者的角度来看,SaaS曾经是一个非常稳定的类别,现在由于风险变高,人们会选择退后一步保持观望。正如我经常说的,投资者并不一定是在试图通过现金流折现模型来计算一家公司历史上所有的利润,他们其实是在揣摩其他投资者会怎么做,或者说,他们押注的是别人眼中的未来走向。

目前的恐慌其实有些脱离现实。大家总是在想:“如果AI在两三年内就能实现某个功能,那意味着什么?”我认为这种担忧源于一种非常静态的思维方式,仿佛人们不会去适应、世界不会改变,就好像只有AI这一项技术在变,而其他所有事情都将保持静止。所以现在的局面很有趣:像我们这样的企业依然表现出色,已经连续三个季度业绩优异。尽管我们不是在这里为整个软件行业辩护,但就我们自己的业务而言,我们对当前的机会感到非常乐观,这也是我们不断展示出的数据和结果所证明的。

当然,这并不意味着我们不需要去适应。我们正在像过去几年一样,彻底、迅速地改变我们的工作方式。许多人误以为我们无法改变或应对,这显然是不对的,虽然前路确实有许多战略上的变数。现实情况是,并非每一家SaaS公司都能在未来十年中繁荣发展。就像从Windows时代跨越到互联网时代,有一大批公司未能成功转型云端一样,不可能100家SaaS公司都能挺过难关并继续壮大。也有人认为软件在某种程度上会消亡,或者最终只沦为一种现金收入流。但我可以代表我们公司发言:这是我们业务中发生过的最好的事情。我们身处一个知识的世界,拥有利用知识进行探索和行动的工具,以此来完成客户雇佣我们去解决的任务。这在逻辑上是非常完美的,但我们必须在转型过程中将其付诸实践向人们证明,毕竟让市场保持耐心是很困难的。

2.三类SaaS公司

Erik:Alex,你呢?你对最近发生的事情有什么反应,或者你如何理解正在发生的事情?

Alex:我希望从长远来看我的判断是正确的,因为现在发生的一切实在太疯狂了。几周前我就此发过一条推文,我初步观察发现,目前市面上大概有三种不同类型的SaaS公司,但公开市场无法区分它们。其中一种公司的账号(seats)权限是与产出挂钩的,账号(seats)由真正使用系统的人占据,这就好比又回到了刚才那个文件柜的比喻。

在深入探讨之前,我想先退一步回答你的问题。丹·艾瑞里(Dan Ariely)写过一本非常棒的书叫《怪诞行为学》。我以前常把这本书发给公司的所有产品经理,让他们通过学习这本书来搞清楚我们该如何向用户收费。书中有一个很经典的例子:想象一下,半夜12点你被锁在公寓外面,你叫了一名锁匠。他1分钟就赶到了,花了30秒帮你开了门,然后向你收费500美元。你心里肯定会想:“就干了90秒的活,居然收我500美元?搞什么鬼!”于是你会在Yelp上给他留个一星差评,不给小费,甚至可能向信用卡公司申请撤销这笔扣款。

现在想象一下另一个平行时空:锁匠来了,花了9个小时尝试帮你开门。他中途回办公室拿了更多工具,折腾到早上9点半,终于让你进了家门。此时你会对他花了九个半小时帮你开门感激涕零,不仅给了他200美元的小费,还在Yelp上留了五星好评。

这个例子基本上说明了,人类在某种程度上能够并且愿意为“无能”买单。很多定价策略其实关乎心理上的公平性。我们觉得给那个折腾了一晚上的人多付钱是公平的,哪怕他完全不称职;而面对那个能力极强的同行,我们却因为觉得他收费过高而感到极其愤怒。这在逻辑上毫无道理,但在情感上却让人感觉很公平。

如果你回想一下我们是如何演变成SaaS模式的,比如按人头每月计费这种。当你免费提供时,很多情况下的数字化配置成本几乎趋近于零。这并非针对所有事物,大家只是觉得这样才公平。比如你有500个账号(seats),你支付的费用自然比只有一个账号(seats)时更多,尽管后台运行的机制其实大同小异。

所以我认为SaaS公司可以大致分为三类。第一类是你原本需要账号(seats)来产出某些工作要素,但现在不再需要了。Zendesk就是这里的“一号病人”。如果Zendesk客户现在使用Sierra、Decagon或者选择自研方案,他们需要的账号(seats)可能就是零。因此对于Zendesk来说,我们谈论的是未来现金流的现值。他们正处于危险之中,因为如果只针对现有产品按每月每账号(seats)收费,永远不对代码或定价做出任何改变,那项收入流百分之百会归零。但另一方面,如果他们转向基于结果的定价并放弃原有模式,收入也可能会翻三倍或四倍。这仍然受制于公平法则和可预测的非理性。像Zendesk这样的产品可能上涨也可能下跌,但除非发生改变,否则默认路径就是走向归零。

第二类是按账号(seats)付费的定价,这感觉很公平,但账号(seats)并没有绑定到某个结果上。比如Workday有这样一个很棒的定价模型,由于你有34万名员工,我就按每人每月向你收费。为什么收费?我不知道,只是觉得这样公平。但是GE的那些员工并不是在使用Workday来产出成果。我觉得Workday挺好的,这其实涉及到你可以用AI工具做什么。比如在GE招聘员工时,HR必须去查看Workday中的文件并致电那三家前司来进行背景调查,确保候选人的履历真实。但AI工具完全可以做到致电公司这一点,前提是你必须是核心业务系统。目前IT领域下跌了45%,但没有人会弃用QuickBooks。这两个支柱就是按账号(seats)计费且与某种工作量挂钩,账号(seats)只是一种聪明的定价策略。

第三类是处于中间状态的产品,比如Adobe。你可能需要更多或更少的账号(seats),但情况既不像Zendesk那样极端,也不像Workday那样脱节。

在这些情况之外还存在一种认为用AI能编写所有代码的潜流,作为一名资深软件开发人员,我认为这简直荒谬。我想引用经济学家大卫·李嘉图在1817年提出的比较优势理论。比如你可以自己种粮食或焊接铝材,但即使是这些简单的例子也不恰当。这就好比在和你一起录制播客这件事上我拥有比较优势,我做这个能赚得更多,即使我可能比水管工更有生产力,我还是应该专心做播客。

更重要的是那些隐藏在底层的边缘情况。理论上我可以通过AI自动编程搞定一些Workday的流程,但如果印第安纳州的那个员工离职了且当时正在休产假呢?除非你亲身遇到过,否则你根本无从知晓这些边缘情况。

许多软件其实是一套经过数十年学习积累而成的确定性规则,这些规则并未公开且内嵌其中,你无法直接复制,需要通过经验来复现。如果这是一个非常简单且没有边缘情况的子任务,AI确实可以胜任。

但我认为真正的核心业务系统、具有粘性、人们所依赖且内置了所有边缘情况的软件将会大有作为。它们将开始增加由AI完成工作的功能,比如询问你是否需要进行背景调查或催收逾期的应收账款。你不需要雇佣人工,雇佣你的软件即可完成这些任务。当这一切真正发生时,未来的现金流将会大幅增长,这令我震惊。

许多公开市场投资者无法区分这些不同的范畴,他们对AI非常兴奋,却不知道必须通过作为核心业务系统的软件来部署AI。我认为现在正是每个人回归商业本质第一性原理的迷人时刻。

Mike:我个人很讨厌“核心业务系统”这个说法,因为它听起来就像是一个静态的数据库,把东西放进去再取出来。这种将业务视为文件柜归档系统的观点,是处于一种非常工业化的时代背景下,与前工业时代的商业模式截然不同。

我明白为什么会有这个术语,但这感觉有点像我们还在用实体软盘图标作为保存按钮。孩子们根本没见过实体软盘,却一直用着这个图标。我质疑这一点是因为对我来说,业务是一套基于流程的系统,而不是记录系统。

Alex刚才所说的一切完全正确,企业中存在诸如背景调查或其他类似流程。你能以尽可能低廉、高效且快速的方式协调一系列流程发生,这实际上是知识型业务的核心。在知识时代的业务中,我有上万名每天走进大楼带着大脑工作的员工,下班离开时又带走大脑。我没有任何原子资产、钻头或钢材,甚至连文件柜都没有。我所做的一切都是关于协调那一套套的流程,我认为大多数现代企业可能都是如此。

谈到这一点与Alex的评论有什么关系?我认为这完全正确。我们在业务中有不同类型的流程,我喜欢将其称为输入受限型和输出受限型流程。以Zendesk的客户服务为例,那就是输入受限。你的客户会提出一定数量的问题,你处理这些问题的速度关系到运行该队列的效率、成本、速度和质量。如果你处理的速度快了10倍,你并不会因此得到10倍数量的问题,因为客户数量是固定的。你面临的问题是该如何让他们减少提问,或者更快地处理问题。实际上,企业中有很多流程都属于输入受限型。

我总是拿我们的法务团队举例,他们的工作不是去主动创造法务工作,而是去响应和处理这些工作。比如我们有多少份租赁合同?有多少份NDA保密协议?有多少份常规合同?这就像是一个固定的总量。为了完成那项工作,我正试着尽可能高效地进行,这部分属于有着完整执行进程的输入受限工作。但随后我也会面临某种输出受限的工作,比如创意、营销甚至是软件开发和技术领域,在这些领域理论上我可以完成无限的任务。

我的瓶颈在于我的创造力,或者说取决于我能想到多少可以做的事情,以及我能为客户交付多少价值。这些才是我获取效率提升并且产出更多内容的地方,而不是仅仅在范围内限制输入来让公司盈利。

关于印第安纳州的说法完全正确,因为有些流程必然受到外部规则的约束,比如法律、治理和合规性要求。在印第安纳州我必须为员工履行某些特定程序,这些流程既是我希望业务运行的方式,也是它必须运行的方式,企业实际上就是所有这些流程组合在一起的集合。从某种角度来看,我们拥有记录系统和执行系统。我的想法是大多数企业的实际运作方式并非如此,但我们通常是这么理解它的。

Alex:我完全同意,我认为这是一个非常棒的框架。我很喜欢Intuit就像TurboTax那样,既然税法是公开出版的你完全可以去下载所有规则,它具有高度的确定性,你可以让报税和那些乱糟糟的下载文件夹同时处理。在这种情况下一切规则都是透明的,但我认为边缘案例被公开发布出来其实是一种相当罕见的情况。

企业是有价值的,理论上有很多偏向知识经济的企业,他们所有的资产每天晚上都会乘电梯下楼回家,但这些业务确实具有核心价值。比如McKinsey在脱离所有员工之后是否还具有价值?因为那是一家靠知识经济产出成果的业务,它与劳动力深度挂钩而不像实体产品那样。尽管如此,他们可能拥有一本绝密的内部手册,规定了如何运作、如何招聘解雇员工以及如何为客户带来成果。我还没见过这种手册,正因为没见过所以也无法复制,而它可能已经建立并延续了一百多年。

非数字、非软件公司的产品是什么?他们的产品可能就是长达几个世纪或几十年的知识积累。我喜欢去日本,你会看到有些面馆大约从1587年就开了,能传承这么久肯定是有名堂的。这是一种长期积累而成的文化、知识和技能诀窍,当然也会有一份制作面条的食谱清单。做面条可能稍微简单些没有那么多边缘情况,但也可能会遇到极端情况。比如如果面粉用完了你会怎么做?面馆是如何在1623年的大面粉饥荒中幸存下来的?他们必然采取了某些措施,而这些经验就这样积累在那本秘而不宣的诀窍之书中,而不是去复制那些已经向公众公开的东西。

Mike:这就是我认为它如此迷人的地方,它迫使我们重新思考自己的业务。真的是Intuit在为你填写税法吗?还是说Intuit对税法的了解程度已经达到了无人能及的地步?。他们所提供的核心价值是帮助你处理生活数据并梳理你的理解,向你提出正确的问题,从这点来看Intuit现在更像是一家McKinsey。这是他们的特殊能力,即如何向你提出正确的问题来填写税务表格,而不是单纯地去填表。

现在所有企业都不得不重新审视自己,也许我内部有50个流程曾被我认为是独一无二的核心秘诀,但实际上只有20个是真正的核心。我现在必须认真考虑在这些流程中哪些确实是独特的而哪些不是,因为我们以前从未需要以这种方式进行思考。

Alex:我认为这在某种程度上是一个关于如何平衡的问题。关于这是否值得亲力亲为,如果你采用第三方工具,它不是不可触碰的红线而更像是一种独立的变量。我现在应该用Claude Code自己写代码吗?如果某家公司对软件收费过高甚至会导致我的业务失败,且自己开发已经能完成99%的需求并覆盖成本,那么自己写代码就是有意义的。但如果那个软件每年只需一美元那自己开发就没有意义了。

而且并非所有的记录系统价值都是相等的。我倾向于将记录系统看作是某种业务的原子单位。比如日历是时间的记录系统,ERP是库存的记录系统,你拥有所有这些不同维度的记录系统。我给别人举过一个例子,比如我在迈阿密有一个不经常去的办公室,那里有一套像Google Calendar一样的会议室登记系统,我是否愿意花精力去更改那个系统?显然愿意,因为那个办公室一年才去一次谁在乎它稳不稳定呢?

相比之下有些系统可是会直接影响我收入的,而且它们本身并不昂贵。我真的要为了吃饭自己去种粮食吗?采用农业隐喻的话去餐厅吃饭其实要便宜得多。如果我只是想要一个汉堡,肯定没必要自己去买一头牛然后喂养等待,由于比较优势和规模经济的作用在餐厅消费大量的食物实际上成本更低。

所以存在一些记录系统更容易受到影响,仅仅是因为它们的定价过高,或者就其存储和记录的内容而言它们的价值并没有那么高。Carta为很多公司追踪管理股权结构表,你多久查看一次股权结构表?虽然不怎么频繁但它非常重要绝对不能搞砸。所以我很可能愿意继续使用Carta因为他们收费并不高,而且它不是那种日常高频使用的产品,所以它甚至不在被替代的考虑维度上。

3.Vibe Coding替代论难实现

Mike:我觉得vibe coding这件事太迷人了,作为软件圈子里的人,感觉人们以后直接靠氛围写代码vibe code就能把那些传统工具全替换掉。但转念一想如果我靠氛围写代码来搞定一整天的工作然后直接运行它,那简直太可怕了。这背后依然得有一些真正聪明的工程师兜底才行,首先我有其他更重要的事情要让他们去做,其次我觉得彻底依赖这种方式目前对我来说弊大于利。然而这就是所谓的替代论趋势。

不可否认的是,我们看到内部在软件的可扩展性方面通过使用AI coding等方式获得了巨大的提升。大多数此类应用程序都具有高度的可配置性和可定制性,在我们的案例中甚至实现了真正的可扩展性。你可以编写运行在平台之上的、涵盖各种不同领域的软件应用程序片段,许多客户也确实是这么做的,但以前他们需要投入一支庞大的技术团队来完成这项工作。

现在他们利用vibe code的能力,就可以针对特定用例去扩展和高度定制应用程序。比如我想要一个为迈阿密Miami团队开发的会议室预订App,由于迈阿密有一些奇怪的HR政策,所以那个供20人使用的App需要随时查看Workday以及其他各种系统。过去我肯定负担不起让内部团队投入IT资源构建它的成本,因为账单金额会太高,但现在我也许可以轻松构建它。这个App在底层使用了Workday在全球的数据和规则,但它给了我一个非常定制化的interface,去为迈阿密前台完成一些非常针对他们需求的特定工作。这非常强大,但它并不能完全取代人类的工作。

说起来可怜的Workday,我觉得Aneel就像是这些概念性示例中经常被调侃的对象。但这其实真的很强大,它实际上让Workday在企业级市场中更具粘性也更有价值,因为你可以基于它构建所有这些定制应用程序,这就是AI、Vibe Coding和创造力的力量,使底层系统能更贴合我的具体需求。

但我们必须非常谨慎地处理稳定性、规则流程与高度定制化之间的平衡。你甚至可以认为像openclaw之类的例子就是为了给个人量身定制非常私人化的App。构建这些应用的人大多数并不是软件开发人员,他们只是在Gmail之上构建仅供自己使用的App或者其他小工具。但这仍然是将Gmail作为轨道,他们依然需要去Gmail阅读和处理邮件,只不过他们为自己构建了一些特定的东西来解决只有自己才会遇到的问题。其中有几个项目可能会演变成公司,但大多数仅仅是在解决他们自己需要处理的事情,这确实非常强大。

4.定价的公平性

Alex:这就是为什么我对前端与后端不一致带来的定价公平性感到好奇。以Salesforce为例他们是按许可证收费的,我想我们公司大概有600人,可能就买了600个Salesforce许可证。我其实从没登录过Salesforce但我敢打赌公司也为我付了费,然而我有时确实会使用它的输出,因为它实际上是我们的记录系统。不想过度使用这个词但它确实存储了我们所有的业务关系,而我就像是关系型数据库表table里的一部分,比如我是422号userid。

每当我与一家公司对接时就像在另一个数据库中匹配上了,但我们其实只想为一个底层数据库付费。现在就像是在一个前端与后端逐渐分离的世界里,事实就是这样。我觉得Workday想出了一个非常聪明的定价策略,这是一种强大且让人感觉公平的定价范式。你的员工越多付费就越多,为什么那样才公平?因为GE的利润显然比一家10人的公司要多,GE理应为此支付更多的费用,而这笔钱对他们来说仍然只是九牛一毛。它的定价完全处于最理想的黄金区间,我认为没有人会对此产生异议。他们未来将增加大量AI营收,但最重要的是他们的底座定价让人感觉很公平。

然而对于这些前端与后端在某种程度上已经分离的产品,我不知道什么是公平的定价模式,也不确定未来的软件定价会发生什么变化。显而易见如果没有人愿意买账,大家都去编写自己的代码而不再有任何竞争,那么定价逻辑将保持不变,但你可以想象未来人们都在定制化的前端上构建东西然后直接从底层数据库中读取数据。因为所有的记录系统都有一个数据库代表了底层的一切抽象层,那么这些类别中的任何一个是否会面临价格压力?

对我来说如果前端不再等同于后端,它会比紧密交织在一起的情况面临更大的易感性和冲击。比如QuickBooks是由小微企业使用的,他们没有账号(seats)概念,企业主直接登录QuickBooks即可,所以它的前端在某种程度上就是后端。相反就像Salesforce你可以想象虽然没有人会彻底弃用它,但他们可能会大幅减少账号(seats)数量,因为底层的后端依然必不可少但对昂贵前端的需求减少了。他们不会消除或者对后端做任何改动,只会优化前端的成本。

Mike:我一直认为定价的公平性和客户观感非常重要,人们需要理解他们为何付费,并觉得他们所支付的费用在某种程度上与其真实的使用情况相关联。一家拥有1万名员工的公司在购买Workday时很可能要支付两倍以上的费用,外加一些批量折扣,因为他们购买的量更大且业务具有两倍的复杂度,他们自己也认为这很公平。这里看起来合理的原则就是:我愿意按员工人数为我的HR系统付费。

我认为这类事情的核心问题在于它不仅仅是一个数据库,它是一个数据库加上一组复杂的进程,在我成长的那个年代我们管这叫业务逻辑。这些业务逻辑绝非无关紧要,为什么企业会有这些逻辑?因为企业本身就是作为一系列流程的集合来运行的,而且管理者追求标准化以在某种程度上实现流程化。这是为了让不同的团队以同样的方式工作,以便有人可以管理、理解他们并精准追踪输出。

就像如果我拥有一堆汽车工厂,我想要持续跨越它们去追踪进出的汽车总数,业务逻辑被嵌入其中的地方在某种程度上就是护城河和价值所在。就传统方式而言那里的销售额实际上非常巨大,你为销售团队制定的那些流程对你来说极具价值,而且你会认为这是一种公平的付费方式。但问题在于你的销售协作团队即那些协作者而非核心用户,他们究竟有多大程度需要这些流程又在多大程度上不需要?

我假设Salesforce Sales Cloud有一个MCP server,那个MCP server并不直接访问数据库,它主要涉及你的业务流程以及执行过程中的规则。现在的争议点是某些销售相关人员如果在市场部门或客户成功职能,他们是否需要那些沉重的流程、治理、控制和规则。比如系统规定我们在日本只为客户提供X服务、为该地区的客户提供Y服务之类的事情,甚至连他们的MCP server都需要专门开一个账号(seats)。至于客户是否认为这种捆绑收费公平,那就是另一个悬而未决的问题了。

没错,挑战在于这该如何定价。我想告诉你,在讨论消费型定价或按需计费定价时,基于结果的定价在很多领域都是合理的,但我绝对不认为它会成为主流的软件定价方式,或者说不适用于所有的SaaS软件。

因为当你与客户交流时,你会发现他们非常讨厌这种方式,他们真的很反感星号附加条款。这与他们认为自己投入的价值无关。比如我对Splunk采用的是按量计费,如果我发送给他们的日志量翻倍,我就得付更多的钱。我明白这个逻辑,但日志记录是由我决定的。我可以多记一些,也可以少记一些。我可以对团队说,你们为什么记录这么多日志,这太贵了,而且你们真的在用这些日志吗?我是可以控制我投入的数据量的。这与存储和S3或其他典型服务的模式相同。我存入1GB或2GB都没问题。问题在于,这些对于我作为客户来说是相对可转移且可控的。

但人们给出的许多关于基于结果或基于消耗定价的例子,作为客户我是无法控制的,而且它们也是不可兑换的。所以AI Token的世界和AI积分的世界,对客户来说真的非常困难。他们会觉得不明白你给我的这种代币或筹码到底是什么。

我可以从AWS获取1GB的存储空间并将其部署到Azure,而且我知道他们会收我多少钱,因为每GB的费用基本上是固定的。但当我拥有这些AI额度时,我不知道你的额度是否和别人的一样。供应商一直在增加新功能,我的用户在使用这些功能,所以消耗了我的额度。但我不知道他们用这些额度做了什么。

这并不是公司主动选择去使用它们,而是供应商在添加那些让软件变得更好的功能,而这些改进似乎是自然而然发生的。我可以让我客户的额度消耗在一夜之间翻十倍,仅仅通过添加一大堆类似为你生成很棒的摘要这样的功能。客户会觉得我并没有要求做那个。

所以我觉得在谈论基于成果的使用计费时,当你和客户沟通,他们还是想要按账号(seats)计费。这可能是因为他们现在更理解这种模式,并且他们被很多按量计费模式坑过,这种模式会导致账单金额大幅飙升,他们会不知道该如何控制。

是的,这需要一些时间来适应。它肯定会出现在很多类别中。我们在Atlassian的业务涵盖了很多领域,你可以称之为基于用量的定价,或者字面意义上的按需计费。但我们尽量专注于那些客户业务量翻倍时,他们能获得两倍的价值同时也支付两倍费用的领域,而且这一切都在他们的控制之下。许多其他定价模式并不在客户的控制范围内。

基于结果定价的最后一个例子是,这些结果也是动态的。比如在客户服务方面,我为你节省了成本。你过去在客服上花20块,使用我们的工具你只需要花10块。在第一年这是一个非常棒的销售说辞。但到了第二年,客户会说我只花了10块,现在我想花5块,否则你没有提供任何价值。而供应商回答说如果把我踢出局,你得花20块。客户就会觉得但我现在只花10块。所以每年能为客户省钱的能力从结果的角度来看很难衡量,即使我正在消除一些繁琐的任务。

Alex:我认为从销售的角度来看也是如此。我创办过两家支付公司。我非常羡慕Workday,我常会和我的销售团队谈起Workday,因为他们对外部情况了如指掌。他们知道能从GE赚多少钱。他们会说GE有33万名员工,也许我们每个月向他们收取每位员工5美元,这就是能从该账户中赚到的钱。

如果你在销售一款软件产品,这样去规模化组建销售团队要容易得多。因为你知道那家公司会付给我们300万美元。相比之下,当我们刚创办公司时,签约了1800个公司,我们完全不知道能从他们身上赚多少钱。结果真正让业务运转起来的是Casper这家床垫公司。你根本无法预测。你以为拿下了沃尔玛这样的大客户,但刚开始进展得并不顺利,反而是签下Casper后业绩惊人。

Workday具有这种双向的可预测性,对于出资方的客户而言是可预测的,对于管理团队来说也是可预测的。你能明确应该把时间花在争取签下GE这样的客户上,而不是签约一家10人的公司,因为GE规模更大。但在互联网世界里情况却非常疯狂,Stripe从一家10人公司赚到的钱可能比从GE赚到的还要多。在那种模式下你可以获得更高水平的可预测性。

但采用基于结果的定价或者基于消耗的定价,虽然基于消耗的定价本身并不坏,但如果你无法从外部了解一个账号(seats)能赚多少钱,扩展销售和营销团队就会变得呈指数级困难。

5.为什么在AI时代,客户信任如此艰难

Eric:作为一名企业家,我想回到的一点是,在这个时代,你能分享一下这对你来说最主要的体现方式是什么吗?以及它是如何让你改变业务的?

Mike:我们的看法是,我们销售的是解决人类协作问题的协作工具。在许多不同的领域,包括服务团队、广泛的业务团队、人力资源、财务、软件团队等,许多不同类型的团队通过我们购买不同的应用套件和组合。从根本上说这些都是涉及大量文本的协作问题。这对我们非常有利。那些人在做什么才是最重要的部分。

技术世界往往趋向于重塑一切,并认为这是未来的方向。从中长期的视角来看这通常是正确的。但我们面临的挑战始终是,我们拥有大量以现有方式工作的客户,如今各种App中的工作流其实并不怎么智能。他们想要迈向未来,但同时也必须带动大量的用户。所以当我们构建AI功能时,首先考虑的是我们需要理解这项技术是什么,以及它能如何帮助我们。其次,我们需要构建什么样的基础平台组件来应对未来的变化,因为这些技术的发展速度实在太快了。

这就是我们开发AI Gateway、团队协作图谱以及企业级合规性与控制功能的初衷。你必须将这些内容与你在特定App中为客户构建的功能区分开来。那么你把这些功能放在哪里?这些功能具体是什么?其中很大一部分存在于现有的工作流中,旨在帮助客户更快、更好、更高质量、更高效地完成现有的工作流。这些功能往往非常平淡无奇,这就像X平台上那段30秒的动画GIF走红一样。但这对于客户来说非常令人兴奋,因为他们现在就可以使用,他们现有的工作方式变得更出色了,他们会觉得这太棒了。在AI世界里我却觉得那其实挺简单的,而且这在今天确实能给他们带来巨大的帮助。

我常对内部人员说,光举一个服务方面的例子还不够,你需要利用他们现有的工作流程,结合新应用或者查看新的工作流来处理问题。所以我们必须完成所有这些。如果你看Jira这个典型的例子,在我们的HR和IT服务管理产品的服务集合中,正在进行工单总结。这是我们可以做得比以往任何时候都好得多的事情。

内部大概有四五个人在处理同一个工单,试图解决一个问题。当第四个人介入时,已经有了大量的附件和对话记录。通常情况下他们可能需要花费30分钟才能读完所有内容并理解到底发生了什么,这样才能发挥专业知识来解决问题。总结并不只是简单地将内容输入到LLM中然后获取摘要。上下文对模型来说非常强大,但客户的工作流程却没发生哪怕一点点改变。它仍然是Alex对Eric说你能来帮我处理一下这张工单吗?Eric走过来必须先将大脑中所有的相关信息进行加载。这就像是一个现有的工作流,我们可以利用LLM让客户体验变得更好,而且他们非常喜欢,对这类功能赞不绝口。但这些功能通常不具备智能体特性。

那么我们可以说,对于那个服务工作流,我们需要在各个环节中加入智能体。大多数人正在处理一个工作流,然后发现这一步经常让人栽跟头,耗费大量时间。我们能让这一步变得更快吗?这绝对是我们必须亲自为智能体框架提供的功能。

我们有一个非常棒的智能体框架供整个团队使用,结合图谱和你已经拥有的所有上下文。这非常简单,价格也非常亲民。或者你也可以自带智能体框架。我认为大多数企业内部都会运行三到五个大型智能体平台。他们可能会说我用Agentforce来处理这个,或者我用Gemini来处理那个。把那个智能体带过来,我们会把它放入工作流中让它运行起来。我们必须能够做到这一点。

但你仍然完全处于现有的工作流世界中,只是在现有的工作流中执行一种新的高效的任务。接着你会遇到这样的人,他们会问如果服务工单根本不存在会怎样?所以你正在重新构思整类软件到新的工作流。我们必须帮助客户跨越这一鸿沟,因为他们通常不只有一个服务团队,他们有数百个。如果他们运行着数百个不同的服务台,他们可能会说这20个将以新方式工作,但他们必须对所有这些进行管理。所以我们正尝试将团队协作图谱中的数据与此结合起来,并且是从客户驱动的角度出发。这一点经常被忽略,我们正试图带他们走向5年后的未来,但我们的职责是切实带他们走向1年后、2年后以及5年后的未来。

最后我想说的是,我们在设计方面投入了大量精力。在任何对话中这一点总是被忽略,因为在它的运作机制中有很多基础性的设计工作要做。如果回顾移动互联网时代,第一批应用基本上只是将桌面端或网页端的内容直接搬到手机上,然后我们才演进出了新的交互模式和体验。

不仅仅是视觉层面的演进,还包括我们该如何使用这些东西。推送通知最初是用来做什么的?下拉刷新是一个非常显而易见且简单的例子,它是一个非常经典的设计模式。整个过程就像是我该如何让移动端和桌面端协同工作,该如何来回切换。我们有如此多的设计挑战需要解决。这实际上是帮助普通用户理解其中的内容。他们并不想深究,如果AI对他们来说不存在也无所谓,他们想要的是AI带来的结果,不需要了解所有的技术细节。我们的工作就是隐藏这些细节,直接把结果交给他们,或者使任务更有效、更高效。在技术领域,有时我们太痴迷于模型质量之类的东西了。

现在说模型已经远远领先于实际交付的价值几乎成了陈词滥调。未被充分利用的潜能是如此巨大。这其中的一部分实际上在于设计和体验。我该如何获得这个?给人们一个拥有无限能力的聊天框,他们却只会说给我讲个冷笑话。这就像是拥有无限的力量,但很难帮助他们利用这种力量。这也是我们面临巨大挑战的地方,即如何将智能体及其所有能力引入工作流和协作循环中,并让人类与智能体协同工作。

Alex:我喜欢拟物化设计(skeuomorphic)。早期Web的形态就像你拥有几张实体纸一样,这也是它被称为网页(web page)的原因,就好比一张8.5x11英寸的纸。后来到了移动端,大家最初的设想只是做一个微缩版的网页。但事实证明,如果你不局限于拟物化思维,而是基于第一性原理进行思考并充分利用设备的性能,你就能创造出全新的交互方式。比如下拉刷新,这就是伴随移动端诞生的新概念。我前几天还在琢磨这件事。你试过Nano Banana 2吗?

Mike:试过。

Alex:没错。我的一位同事刚跟我说,他用它为去日本旅游的美国游客做了一份关于注意事项的信息图表。那种一键生成(one-shot)的效果简直令人惊叹。但这引出了一个问题:你该如何编辑这些输出结果?现在的编辑方式感觉非常拟物化,依然是那种经典的GUI操作逻辑,比如点一下这里,再修改一下那里。所以我想问你,关于编辑AI输出的内容,你认为目前业界的最高水是什么样的?或者说理想状态应该是什么样的?既然你提到了设计,最近你在这方面有什么深层思考?

Mike:这是一个非常棒的问题,我想先退两步来回答它。首先,在AI领域建立客户信任是非常困难的。我们在做用户调研时发现,人们害怕AI并不是因为它的能力有多强,而是因为它的运作像个黑盒。比如你的AI助手瞬间清理了收件箱、发了十几封邮件,用户的第一反应往往是:“我怎么知道它做对了没有?”为了赢得信任,AI必须向用户及时反馈它的意图并请求确认,但同时又不能频繁到让人觉得烦躁,否则用户会觉得还不如自己动手。所以交互频率和信任机制本身就是一个完整的系统设计问题。

其次,AI的训练和应用离不开大量数据与不断的迭代。现在社交媒体上充斥着关于神级提示词的炒作,仿佛念一句哈利波特的咒语就能让AI自动帮你经营一家十亿美元的公司,这太离谱了。一键到位固然有用,但在现实业务中,你通常需要不断去修改输入和输出。比如你让大语言模型(LLM)写篇论文,生成后你发现方向不对,这就需要通过改变输入来进行迭代。但如果你曾尝试通过纯聊天的方式来迭代编辑图像,你会发现体验非常令人沮丧,因为你很难精准控制AI不擅自改动其他部分。这本质上也是一个关于输入的体验设计问题。

以我们公司的产品为例,我们的团队协作图谱拥有海量的组织知识和极高的准确度,甚至能记住我十几年前写过的代码。但如果因为AI知道我有计算机科学背景,就自动用极其硬核的技术语言回答我的所有问题,这其实是没用的。如果我们在界面上设置一堆勾选框,让用户自己决定“是否搜索网络”或“是否搜索组织数据”,这也完全违背了设计初衷。

AI应该具备主动预判的能力。你在Deep Research等工具中能看到一些这类尝试,但有时也很让人沮丧。这就好比你手下有50个实习生,虽然能干很多活,但他们每分钟会问你50个问题,导致你整天什么也干不成,全在回答问题了。

此外,在企业环境中实现工作流的迭代要困难得多。比如头脑风暴通常需要团队协作,在我们的Whiteboard和Confluence中,你可以引入智能体来辅助。它们非常擅长从组织内部提取知识并生成优秀的方案。但如果没有任何人工干预直接让AI包办一切,就会失去团队的信任。正常的流程应该是我们先开会收集想法,加入人类的直觉判断,筛选出有用的部分,然后再把这些反馈给另一个智能循环。因为AI的输出质量具有很强的非确定性,这就注定了系统必须包含一个人工介入循环。没错,如何把握这个人工介入的度是个极大的设计考验。循环确认的步骤太多会让人感到沮丧,步骤太少又会失去用户的信任。

我们刚在Jira中发布了Agent功能。当你把任务分配给Agent时,它就会去执行。但用户往往会问:“它现在到底在干什么?”如果你给他们展示上千个底层执行步骤,他们又会觉得你在给他们塞废话。所以仅仅是将AI引入工作流,就面临着海量的设计挑战。

回到实际的业务审批流程上来,比如一项交易需要经过安全、会计、财务和销售等多个部门的审核,你该如何用AI优化这个工作流?当你将任务分配给Agent时,你需要非常小心地设计用户体验:它什么时候返回结果?以什么方式返回?用户能否在它工作时主动询问进度?

我们相信,允许用户随时查看进度有助于在短期内建立信任感。但从长期来看,如果这个Agent连续二十次都出色地完成了任务,用户最终会选择完全放权。这些全都是根本性的基础设计与体验问题,而不是纯粹的技术问题。核心挑战在于如何让每天使用App的数百万用户对产品产生信任,并消除那种黑盒感。盲目承诺“我可以为你做任何事”,只会让用户无所适从。

Alex:这确实还是一个悬而未决的问题。因为未来的理想交互方式显然既不像过去那样单纯地点击鼠标,也不像现在这样只是不断地重新输入提示词,它更像是两者的结合。

只要工具是为人类服务的,就一定离不开人类的参与。你需要让用户能够直观地深入理解模型内部的运作逻辑,无论是出于建立信任的目的,还是为了方便后续的修改迭代。这本质上是一个设计问题,而且我认为目前业界可能还没有人完美解决它,我们正处于这一探索过程的最早期阶段,大家都在为如何更好地调整和编辑那些一键生成的内容寻找最优的设计方案。

Mike:我想举一个文档编写的例子。知识工作者几十年来都习惯了以固定的模式写文档:打开一个空白页面,输入标题、打字、列出符号或者插入表格。现在我们推出了Create with Rovo功能,你完全可以从一个提示词开始,让AI根据模板生成内容,甚至让它先去调研各个维度的信息并整合带回。

但要改变用户根深蒂固的习惯是非常困难的。现在界面变成了左右两部分,左边是文档实体,右边是聊天窗口。想象一下这是一个没有任何工具栏、只能通过对话来排版的Word。我们需要鼓励用户:“你可以直接在左边修改任何文本,也可以在右边输入指令,比如让它添加一个新章节、去研究其他资料并补充到摘要后面。”

当我们观察那些高级用户时,发现他们非常享受这种模式,他们能熟练地在两种操作间来回切换,领会了这种全新的范式。他们可以下达贯穿整篇文档的全局指令,比如“把所有标题变成蓝色”,这在传统编辑器里是很难一键做到的。他们甚至可以要求AI从董事会成员的视角来重新评估并精简这份文档。

但对于普通的商务用户来说,他们的第一反应往往是困惑:“所以我只需要在左边打字就行了?”这实际上是一场深刻的范式转移。我怀疑随着AI工具的普及,就像移动互联网时代刚到来时那样,大概两到五年后,这种全新的交互方式会变得非常普遍。这就好比大家第一次看到Excel时,也会茫然地问“我该在哪里输入段落”,但现在所有人都知道Excel是怎么运作的了。

我们面临的最大挑战,就是如何将所有这些强大的AI能力自然地融入到极简的界面中,去协助人们真正调用整个组织的知识来生成文档。我知道这在底层算法和数学逻辑上是完全可行的,但要通过优秀的体验设计来引导用户接受并掌握它,依然充满挑战,同时也令人无比兴奋。我们需要花费大量时间来不断完善这些体验。

Eric:这是一个非常适合作为结尾的话题。Mike,非常感谢你参加我们的播客,这是一次非常精彩的讨论。

Mike:好的,没问题,伙计们。希望这些分享能对大家有所帮助。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载