


3月中旬,在英伟达GTC 2026大会上,黄仁勋围绕Token的爆发式增长,做了一番令人振奋的发言:数据中心不再是文件仓库,而是生产Token的工厂。
“在Token工厂里,你的吞吐量和Token生成速度,将直接转化为明年的精确收入。”他说。
这番话并非虚无缥缈的畅想,而是对AI行业商业模式跃迁的精准总结——Token正在成为新时代的电力和石油,极具战略价值,且需求极为刚性;AI公司卖API、卖会员、卖广告,都不如卖Token有前途。
这套逻辑随后被冠以“Token经济”的名头,迅速席卷全球,并在AI行业激发广泛而深远的回响。
Token经济最直接的影响之一,是让AI公司售卖Token的基本商业模式,披上了充满想象力的外衣,并撑起了全球资本的热情。
今年以来,国内外许多头部AI公司完成上市,或拿到规模空前的新一轮融资,背后都有新概念加持的影子。
但在企业与资本的狂欢背后,隐忧开始浮现:Token经济,正在被简单地传导为“Token需要涨价。”
随着智能体取代Chatbot,AI服务的算力成本指数级上升。绝大多数AI公司倾向于把Token卖得更贵,以搭建一套符合逻辑、可持续运转的商业模式。
相对应地,各路资本追捧AI公司,同样基于这样的假设:Token经济时代,普通企业的Token消耗量一路飞升,而这会给AI公司创造源源不断的收入,稳定推升后者的长期价值。
Token涨价,似乎成为必然。
就在全行业大笔融资的同时,国内一些AI平台宣布涨价,或取消了较便宜的基础套餐,既包括字节、阿里、腾讯等老牌云服务,也有智谱这样的新贵。国外的OpenAI多次涨价,Anthropic也变相大幅提高了Claude Code的收费标准,引发大量吐槽。
然而在旺盛需求面前,AI公司通过涨价可以获得立竿见影的回报,也有可能造成供需两侧的矛盾:AI公司和普通企业都是Token经济的参与者,但一个雄心勃勃要涨价,一个却越来越不堪重负,期待价格平稳甚至下滑。
越来越贵的Token,正成为不少企业无法弃用,却又难以负担的“AI负重”。而AI公司依靠强势地位,强行涨价、逼迫客户多花钱,显然是一种非常脆弱的商业模式。只有在静如止水的理想竞争环境中,这种模式才有可能持续下去。
但日新月异的变化,恰恰是AI这条时代河流的最大特征。管理学大师纳西姆·塔勒布在《反脆弱》一书中指出:世界充满不可预测的“黑天鹅”事件。ChatGPT横空出世后的三年多里,AI行业的“黑天鹅”已经屡屡扇动翅膀,每一次都在全行业掀起变革浪潮。
AI公司不能祈求环境一成不变,依靠一套脆弱的商业模式赚钱,而是必须培育出“反脆弱”的能力,以适应变化、对冲波动,保持稳健的增长势头。正如《反脆弱》所言,脆弱者在波动中毁灭,强韧者仅能复原,而反脆弱者能从混乱、压力与不确定性中获益、变得更强。
AI公司需要回答一道难题:当Token经济时代全面到来时,该如何“反脆弱”,建立更有韧性的商业模式?
1
现阶段,Token到底是贵还是便宜?
一些AI公司的答案是“便宜”,还有上涨空间。
以智谱为例,它在今年2月宣布GLM Coding Plan涨价30%,原因是用户规模和调用量快速提升,市场需求持续强劲增长。其他公司在调价时大都采用了类似话术。
但对于任何一门生意而言,“因为不愁卖,所以要涨价”的商业逻辑,并不能长久运转下去。
充分竞争的行业终归会走向供需平衡,Token和AI也不例外。跑得更快的公司可以吃到先发红利,甚至暂时掌握“涨价权”;但当市场步入成熟期后,AI公司涨价的难度将越来越大,直至搁浅。
越卖越贵的Token,还掩盖了不少AI公司业务单一的短板。
这些公司把生产和销售Token作为唯一要务。企业除了购买API和MaaS,还需要自己搭建Agent矩阵、编排Skills,做业务适配和流程嵌入。
只知道卖Token的AI公司,很难培养起客户忠诚度,也无法构建用户生态。一旦别家Token更便宜、模型性能更强,客户就很可能流失。
也有一些AI公司认为,Token还是太贵了。
DeepSeek就持有这样的观点。
它在4月底发布V4预览版,各项技术指标十分出色,尤其是支持100万Token上下文,在长文本问答、减少幻觉等方面优势明显,完全有理由像同行一样涨价。
但出乎不少人意料,DeepSeek V4甚至比V3版本还便宜。发布48小时后,DeepSeek又将V4 Pro和Flash的输入价格(缓存命中)降低90%。
DeepSeek V4性价比惊人。根据OpenRouter的数据,处理相同长度的文本任务,DeepSeek V4的输出价格比GPT、Claude、Gemini等便宜了99%。
与此同时,DeepSeek还引入新技术,比如全新的混合注意力架构等,大幅降低了Token消耗量。据测算,在百万Token上下文设置下,V4-Pro每处理一个Token的算力消耗只有V3.2的27%,KV缓存占用只有10%。
以原生多模态大模型技术见长的商汤科技,也采取了类似策略。
不久前,商汤科技推出日日新SenseNova 6.7 Flash-Lite,一款全新的轻量化多模态智能体模型。与DeepSeek V4类似,商汤的新模型通过使用商汤科技的多模态大模型技术实现了Token消耗的大幅降低;在信息搜索等场景中,降幅可达60%。
同时,商汤还开启了免费试用活动。开发者选用SenseNova Token Plan,首月可免费获得无门槛调用配额,每5小时1500次调用额度。
商汤目的明确:既要降低Token单价,让企业用得起;又要降低Token消耗,让企业不担心一不留神“超标”。这两家AI公司采取的是“技术降本”策略,即通过迭代AI技术,以达到Token的大幅消耗,来降低企业使用成本,而非提价Token。
道理很简单:只有企业愿意用、用得起,AI公司才能玩转Token经济,才能“反脆弱”。只靠卖得贵来赚快钱,显然不是长久之计。
2
把Token成本打下来,是定价问题,更是技术问题。
一些公司选择追求SOTA,比如OpenAI、Anthropic,不仅要做到地表最强,还要比一比谁能首先实现通用人工智能,站在全人类的最前沿。
但也有许多公司的策略有所不同。
没兴趣刷榜的DeepSeek,把更多注意力放在了“AI+生产力”上。
根据DeepSeek的说法,V4在智能体任务、知识处理与推理能力方面表现突出,并针对Claude Code等主流AI编程工具进行了专项优化。
那么优化效果有多好?大模型评估平台Vals AI的测评结果显示,在代码生成方面,V4大幅领先所有其他开源模型。
可以说,DeepSeek做到了生产力场景下的SOTA。
商汤也采取了类似策略,选择了办公技能集(Skills)作为突破口。
它除了不断迭代新模型,还配套开发了全系列的办公Skills,且原生支持主流智能体框架。这样做的好处是,企业在应对不同场景、不同需求时,都可以快速搭建专属Agent,组成适合自身的AI工具箱,低成本快速部署和使用。
以SenseNova 6.7 Flash-Lite为例,这款轻量化多模态智能体模型原生支持OpenClaw、Hermes Agent等智能体框架,配合SenseNova-Skills,可以覆盖大多数办公场景,让企业快速形成端到端的复杂工作流,一键开启全自动办公。
比如,一家大型蔬菜企业希望让AI分析销售数据。SenseNova 6.7 Flash-Lite先是对连续3年的近90万行销售记录进行“数据审计”,确认数据正确后,再进行收入、成本、利润等财务指标分析,最终提供了“建立动态定价机制”和“调整品类结构”等五项精准建议,直接辅助企业管理层决策。
与DeepSeek相比,商汤对于生产力场景的理解更深入,打法也更有节奏:先抓住“稳”的高频场景,再探索“热”的场景。
“稳”的场景,就是打工人每天都在用的数据分析、深度研究、PPT创作、搜索等。这类场景业务流程清晰、容错率高、即时性较低,非常适合作为AI的首选“登陆场”。能够迅速打穿这类场景,来自于商汤在办公场景沉淀的知识和流程经验,以及在To B服务中积累的客户信任,当客户顺应AI势能而衍生新的技术赋能需求,商汤很快就抓住了。
“稳”的场景更高一层的则是“热”的场景,如视频生成、智能营销、具身智能等,与日常办公相比,其难度和要求上了一个数量级。再往上,则是金融、教育等要求极高的场景。
抓住这些从易到难的场景,就抓住了“AI+生产力”的本质。
同时,这也是AI公司接下来必须走的路。
AI大模型发展至今,“生产力”已经越来越重要。各类智能体取代Chatbot,成为核心落地场景。无论是个人还是企业用户,都希望用AI来干活、帮忙解决问题,而非只能聊聊天。
这也意味着,要想构建足够强韧的商业模式,AI公司必须以生产力为出发点,构建一整套低门槛、高上限的技术体系。
与单纯比拼大模型能力相比,手握这样一套“干活儿”的产品矩阵,AI公司才能尽可能抵消行业波动的影响,长期立于不败之地。
3
Token经济时代,AI公司需要改变经营范式和发展重心,而资本市场也正在调整对AI公司的估值逻辑。
过去四年间,资本更喜欢看哪家公司的大模型“刷榜”,谁的算力储备更多,哪家的AI App用户多等。
但如今,与生产力结合紧密的AI公司,越来越受到追捧。特别是在B端市场建立竞争优势的企业,堪称“当红炸子鸡”。
两大头部玩家仍在高歌猛进:OpenAI以8520亿美元的估值,完成了惊人的1220亿美元融资。最大对手Anthropic不甘示弱,最近被曝出融资300亿美元,市值达9000亿美元,首度反超OpenAI。在不少人看来,以AI编程见长的Anthropic,后劲比OpenAI更强。
“AI+生产力”,已经成为Token经济时代的企业价值催化剂。在这一块,DeepSeek和商汤已经站稳了脚跟,并逐渐得到认可。
5月初,DeepSeek被曝出寻求融资超500亿元人民币,有望刷新国内AI公司单轮融资纪录;投后估值更是突破3500亿元。
在许多投资者心目中,DeepSeek显然会比许多明星公司走得更远、飞得更高。
与一再震撼全球AI圈的DeepSeek相比,商汤低调了不少,但也具备自己的独特优势。商汤的“三位一体”战略包括了:算力基础设施(大装置)-大模型研发(日日新大模型)-AI应用,是AI行业不多见的全栈公司。
从2020年开始发力大模型,商汤一边推动模型和应用的研发,一边长期投入智算中心AIDC建设,打造了覆盖算力、模型与垂直应用的体系,实现了AI场景全栈覆盖,软硬协同,让商汤AI的综合实力位列行业一流。
而这一AI全栈能力,为商汤降低Token成本与价格奠定了根基。
与DeepSeek类似,商汤并非强行把价格打下来,而是“技术降本”,从源头上革新技术范式,为低成本Token创造空间。
以最新发布的SenseNova 6.7 Flash-Lite为例,它没有采用传统的“语言+视觉”拼接设计,而是通过原生多模态架构,取消了视觉转文本中间层。这样它能以更小的参数量完成任务,还可大幅降低推理过程中的Token消耗。在第三方权威机构Claw-Eval最新发布的测试中SenseNova 6.7 Flash-Lite进入全球TOP10,成为排名最高的轻量级模型。
此外,商汤具备一个独特优势:长期深耕B端。这让它拥有了应对不同层级客户、不同复杂场景的丰富经验。这些年来,尽管具体的业务形态发生了巨变,但商汤此前积累的行业认知和经营范式依然有效,为AI落地生产力场景奠定了良好的基础。
一个合理的判断是:商汤存在一定程度的低估,尚需具备长远眼光的投资者去真正“看到”。
再回到一开始的问题:AI公司该如何“反脆弱”?
DeepSeek和商汤展现了“反脆弱”的禀赋。他们靠技术把Token价格降下来、帮助企业控制AI成本,同时又把“AI+生产力”作为出发点和目的地,跑出了一条独具特色的发展路径。由此产生的“反脆弱”能力,正在逐渐释放价值。
如今,DeepSeek的估值潜力刚被释放,就迸发出惊人光芒。与之类似,商汤虽然目前处于价值洼地,但随着“AI+生产力”场景愈发宽广,商汤也将释放行稳致远的增长潜力。AI行业的“反脆弱”,刚刚拉开序幕。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”