时隔1个多月后,商汤组织架构调整的靴子,终于落地。
12月3日晚,商汤科技董事长兼CEO徐立发布内部信,宣布商汤科技将建立“1+X”架构:作为“1”的AI云以及通用视觉模型,将成为公司未来的核心业务;作为“X”的智能汽车“绝影”、家庭机器人“元萝卜”、智慧医疗、智慧零售等,将重组拆分为商汤的生态企业矩阵,并允许这些生态业务独立经营,可以自主面向外部融资乃至上市等。
商汤组织调整内部信
随着“1+X”架构的出台,商汤的此番战略重组也宣告正式完成,在组织关系上从一家AI 1.0的公司,转型成为一家瞄向大模型的AI 2.0公司。
成立十年来,上述对主营业务的重新划分,堪称商汤有史以来的最大一次转型,其目的直奔盈利而去。
徐立曾对外解释说,商汤正在靠两条腿走向盈利,一条腿是传统AI,技术成熟,不断降低成本、拓展市场(包括海外市场),聚焦利润贡献;另一条腿是新一代的AI大模型,目标是盈亏平衡,这条腿增长很快,且能看得到未来。前者保证商汤“走得够快”,后者保证“走得够远”。
最新一期财报表现,为徐立重新划分主营业务的决策,提供了更多说服力。2024年上半年,商汤总收入17.4亿元,同比增长21.4%。重新划分的三大业务中,生成式AI收入10.5亿元,同比大幅增长255.7%,占比超六成,已成为无可争议的公司主导业务。与此同时,2024年上半年,商汤亏损同比减少21.2%至24.8亿元。
作为AI 2.0时代的弄潮儿,ChatGPT发布之初,OpenAI估值还只有29亿美元,短短三年不到, OpenAI的估值已飙涨至1570亿美元。
更重要的是,随着生成式AI产品的继续发展,其前景还将继续推动OpenAI估值进一步攀升。研究机构IDC给出的预测提到,2027年全球生成式AI的市场规模将接近1500亿美元,复合增长率可达85.7%。
没人舍得放弃一个千亿美元的蓝海,商汤也不例外。
大模型技术不断迭代下的AI,正化身一头吞吃资源的怪兽,拉动生成式AI行业进入了一场资源比拼战。
进入2024年,大模型行业的最新变化之一是,模型技术迭代基本停滞,模型调优路线从Scaling Laws尺度定律,转向RL强化学习,其中代表事件便是GPT-o1的发布。
这也意味着,行业暂时告别算法主导,开始转向数据和算力主导。徐立近期在接受采访时所说,生成式AI时代除了模型的通用性之外,最大的特点是成本结构由“研发人员密集型”转化为“算力资源密集型”。
商汤董事长兼CEO徐立
为了避免在这场算力资源竞赛中掉队,10月份,OpenAI完成一轮高达66亿美元的新融资。11月份,Anthropic拿下亚马逊40亿美元的追加投资。那些实力不济的大模型玩家,在这场烧钱游戏中,或者被淘汰出局,或者被大厂收编。
在这场竞赛中,商汤的解法是,借助组织架构调整,走上聚焦资源主攻生成式AI的道路,无疑是一种更加切合自身实际的务实选择。
主观上,面对需要重金投入的生成式AI,难以分出更多资源支持生态业务发展的商汤,眼下允许它们独立运作,也是一个分则两利的抉择:既保证了核心主业生成式AI有更多子弹去打仗,又避免生态业务因此错失发展良机。
在被大模型重新激发活力的自动驾驶领域,商汤“绝影”智能汽车业务,2024年上半年收入1.7亿元,同比增长100.4%。
值得注意的是,当前自动驾驶相关领域正迎来资本热潮,文远知行、地平线、小马智行等一批公司相继在2024年完成上市。
被大模型带火的,除了自动驾驶领域,还有智慧医疗。OpenAI CEO奥特曼、百川智能CEO王小川都表达过对智慧医疗的商业化期待。
11月份,商汤参与组建的医疗公共服务大MaaS平台,其模型基座提供方正是“商汤日日新·大医”基础大模型。
此时,将“绝影”智能汽车、智慧医疗等业务纷纷推向资本市场,既可以使其借助外部融资力量,避免错失有利发展机遇,又可以通过更加市场化的独立经营手段,激活内部人才活力,提升组织效率。
为了在生成式AI时代挣得一席之地,商汤不是第一个对组织架构动刀的公司。
2023年4月,谷歌母公司Alphabet CEO桑达尔·皮查伊在官网发文,宣布公司将合并谷歌大脑(Google Brain)和DeepMind两大AI实验室,组成一个新部门Google DeepMind。
“Google DeepMind将所有的人才整合到一个团队当中,并在谷歌计算资源的支持下,有望显著加快谷歌在AI方面的进展。”皮查伊解释道。
一年后的2024年3月,微软也效仿谷歌,开始组建Microsoft AI,统一管理旗下所有的消费者AI产品和研究工作。这是微软历史首次将所有的消费者AI业务,归集到同一个事业部管理。
从谷歌到微软,再到商汤,组织架构调整的一大共性,都是为了将内部资源汇总聚焦到生成式AI上,从而提升大模型相关技术和产品的研发效率。
不同之处在于,在应对生成式AI所带来的时代机遇面前,商汤成了互联网巨头之外,在组织架构调整上反应最快的玩家。
作为对比的是,曾经与商汤同为AI 1.0时代明星企业的一些玩家,要么折戟IPO,要么在大模型方面被大厂甩落身后。商汤成了那个例外:不仅以“AI第一股”的名头登陆港交所,且顺利推出了自研的大模型和相关应用。
成功转型过渡的背后,离不开商汤对AI基础设施的押注,基于这一押注,商汤从一个深度学习研究实验室,发展成为计算机视觉的领军企业,并成长为中国领先的AI云服务提供商之一。
早在2019年,商汤便成为国内最早一批投入通用大模型研发的厂商,并开始将大规模AI基础设施建设投入提上日程,徐立一手组建了算力大装置团队。
截至2024年6月,商汤人工智能计算中心AIDC的运营总算力规模突破20000 PetaFLOPS,上线GPU数量达到5.4万张,稳居行业领先地位。
回过头来看,商汤在AI基础设施方面的投入和通用大模型的路线选择,与OpenAI的发展路线基本吻合,都在行业还不太笃定之际,选择率先押注Scaling Laws尺度定律,提前构筑起了一个相对充沛的算力池。
在充足的算力资源打底下,在过去近两年时间内,商汤日日新大模型由1.0 版本,迭代至5.5版本,实现了不输于GPT-4o的综合性能和实时交互体验。
如何在未来的大模型技术迭代和产品体验上,继续保持领先,商汤则展现着自己的另一种务实做派。
借助战略重组,将有限资源聚焦到生成式AI后,商汤选择了既做大模型又做应用的To B和To C双轮循环策略。
在ChatGPT推出两年后,一众大模型玩家相继找到了自己的发展策略:如月之暗面Kimi,就坚定要走To C的超级APP之路;如零一万物,则选择放弃国内To C应用机会,先做国外,在国内优先发展更易商业变现的To B领域。
财大气粗的互联网大厂,则选择了跟商汤类似的To B+To C路线。但不同之处在于,商汤在C端应用推广上显得更为克制和务实。
商汤的To B+To C路线,颇有点类似企业SaaS模式,即通过To B再接触C端用户。
以金融为例,商汤金融大模型已经相继落地中国银行、招商银行、宁波银行、上海银行、海通证券等企业客户,在帮助这些金融企业构建起大模型服务后,商汤自研的编程助手“代码小浣熊”、数字人视频生成平台“如影SenseAvatar”等应用,也都有了用武之地。
这是商汤应对互联网大厂竞争的独特思路。2024年初举办的商汤年会上,徐立回忆,商汤成立之初,没人相信中国公司能把人脸识别做到全球第一,觉得谷歌和Facebook等互联网大厂更易成功。但后续商汤的人脸识别等计算机视觉技术在全球各项比赛中拿下了70多个冠军,推翻了大公司更有机会做好这项技术的主流判断。
“这是商汤打破共识,形成反共识,再逐步塑造共识的过程。” 徐立认为,在生成式 AI 时代,商汤也能复现类似的过程。
借助大装置,起码在算力层面,商汤已迎来了反超机会。目前,商汤已成为市场上唯一一个独立于互联网大厂、不输于互联网大厂的大型AI云平台。在此基础上,在商汤创立十周年之际,徐立给商汤确立了“大装置-大模型-应用”的三位一体战略,致力于成为最懂算力的大模型服务商,和最懂大模型的算力服务商。
“大装置-大模型-应用”的三位一体战略,构筑起商汤在AI 2.0时代的最强竞争力,使其对内在既做模型又做应用的双轮循环策略之下,能够既避开模型能力不断进化后,很多应用场景可能被完全覆盖的风险,又不会错失借助应用强化模型基础能力的机会。
更重要的是,当生成式AI进入“算力资源密集型”新阶段后,为了AI的普及和商业化,一众大模型厂商纷纷打起价格战,开始了一场成本与效率的比拼。
想要降低大模型的生产和使用成本,不仅需要结合大模型来迭代和优化算力,也需要根据算力资源的特点来迭代大模型设计和应用。有着三位一体战略加持的商汤,既不缺少搭建算力资源的实操经验,又掌握着训练大模型的一线心得,这使得其在对外帮助合作伙伴提升算力资源的使用效率,以及增强大模型的服务能力方面,都能以尽可能低的成本,实现尽可能高的效率转化。
面对生成式AI这波可能是有史以来最大的科技变革浪潮,“有实力的公司肯定会提前投资。”通过最新的组织架构调整,徐立提前给商汤储备起弹药库,“短期成本并不那么重要。因为不投资可能意味着错失重大机会。这个风险远大于初始投资成本。”