中场战局:国产GPU的临门一脚
科技
科技 > 互联网 > 正文

中场战局:国产GPU的临门一脚

近几年,国内GPU企业如雨后春笋般涌现,初出茅庐便能迅速完成巨额融资,使这个赛道备受外界关注,质疑声也从未间断。

不过,自去年10月美国制裁新政推出以后,热闹的国产GPU行业便速冻降温。直到几天前,媒体的一篇报道又将沉寂了数月的国产GPU话题送上了风口浪尖,围观者满意地咀嚼着戏谑文字下的精彩故事,将平日严肃枯燥的工作和沉闷的投资行情抛之脑后。

与之形成鲜明对比的,是国内所有秣马厉兵、枕戈待旦的GPU企业,他们眼里没有八卦,只有对国产GPU中场战局的复盘和下半场的策略规划。

针对近日的GPU话题,集微网第一时间采访到了壁仞科技创始人、董事长、CEO张文。张文表示:“对于国产GPU的未来,我和我的团队充满信心,这种信心正是造就我们团队凝聚力的核心要素。2023年将是国产GPU百花齐放后务实发展的关键一年,整条赛道都已经进入了拼产品落地的阶段。国产GPU能否成功,关键要看我们能否摒弃杂音,专注在产品落地这临门一脚。”

回顾上半场:硬的抉择

如张文所说,国内高端GPU玩家越来越多,回顾上半场开局时,这些玩家的打法却各不相同。产品路径主要分成了GPGPU和图形渲染GPU两大类别,前者有壁仞科技、登临、沐曦、天数智芯、珠海芯动力等,后者则有励算、深流微、瀚博、芯瞳、格兰菲等,也有全功能GPU定位的摩尔线程。

对于能够活过3年,并且顺利推出产品的GPU创业公司,路径选择这种事关公司存亡的战略性决策必然团队内在基因和市场形势做出的判断,背后往往是枯燥的市场分析数字、海量的客户调研数据,而不是像近期故事中武侠小说般的门派斗争。

以壁仞科技为例,一些创业初期常见的观点分歧如果长期存在,这家公司恐怕难以走到如今产品实现量产、送测客户和小规模落地的阶段。

关于壁仞科技的路径选择问题,该公司联席CEO李新荣告诉集微网:“虽然GPGPU和图形渲染GPU有各自不同的技术难点和市场特征,但他们有一个共同的特点,那就是需要大量人才和资金的投入,对于一家尚在早期的初创企业,同时在两条赛道进行两款产品的研发挑战巨大。因此壁仞科技选择聚焦用于通用计算的GPGPU赛道,优先在AI这个发展潜力相对更大的应用市场实现突破。当然,我们对未来的布局远不止于GPGPU,我们也在其他领域进行了相应布局,进行了一些研发所需的前期准备工作。”

大多数GPU企业都与壁仞科技一样,在两条路径中做硬的抉择。对此,沐曦CTO杨建指出,两条路径的显存类型、容量和带宽差异比较大,最终软件生态、成本需求、生产工艺选择也不同,因此国内GPU创业大多数会从团队建设、研发成本、生产工艺、目标市场等因素出发, 选择最适合自己单一产品路径入手,因为双线作战不仅难以保证公司实现基本营收,还会造成资源紧张,这在对于人员、资金要求巨大的GPU行业非常危险。

登临科技是另一家选择GPGPU赛道开局的本土企业,该公司创始人、董事长李建文在谈到抉择的初衷时指出,AI计算是过去7-8年最高速增长的赛道,如今传统的GPU产品在市场上早以被数据中心产品(计算为主)超出。

以全球最大的GPU企业英伟达为例,该公司最新财报显示,2022年前三季度在游戏和数据中心的销售额分别是72亿美元和110亿美元。而且在越来越多的场合中,英伟达也都自称是一家计算公司。

李建文表示,虽然通用计算和图形渲染最终会殊途同归,但国内玩家仍应该先选择适合的单一路径入场,这就要考虑到哪条路径更容易落地。

李建文首先提到:“相对而言,GPGPU的产品周期和客户切换难度更可控。反观渲染产品的壁垒则更深,面对消费者的游戏卡不但要二进制兼容,其对生态的要求也更高,在市场几乎被国际头部企业占领的情况下,初创企业很难在夹缝中生存下来。”

另外,李建文还强调,AI计算是一个变化的市场,初创企业能在变化中看到机会。而图形渲染GPU是一个非常固定的市场,小公司落地必然会更加艰难。

从目前各公司的融资情况也不难看出,选择GPGPU这条技术路径得到了更多的资本认可。但在渲染GPU这条更难的路上,瀚博半导体、芯瞳等国内企业也开始传出捷报,陆续都有高性能产品发布。

第一批国内GPU企业对于路径选择的上半场已经基本结束,各家企业的产品开始体现出差异化,包括时间节点和性能差异,而在这种差异化背后,GPU企业在下半场战局中还面临着同一个难题,即软件适配、产品落地等应用和销售的问题。

展望下半场:软的较量

张文在上文指出,整个国产GPU赛道都已经进入了拼产品落地的阶段。他领导下的壁仞科技也是率先踏入下半场战局的企业之一,该公司产品的落地情况自然而然成为了业界焦点。

壁仞科技总裁徐凌杰在接受集微网采访时表示,一款GPGPU产品合格与否,关键在于其落地的表现,而软件栈则是产品落地最核心的要素。

正如芯片硬件需要2-3年的开发周期,软件栈开发和优化、算法模型的适配等开发也需要企业在流片后继续投入大量时间和人力。徐凌杰指出,作为产业的后来者,国内GPGPU初创企业在基于自研软件开发平台的条件下,通常一款GPGPU从点亮到完成硬件调优、性能爬坡,再到软件栈建设达到送测要求,往往还需要1年左右的时间。

“这一过程充满了各种技术挑战,这种挑战不仅仅是壁仞科技遇到的,而是整个赛道所有玩家都无法回避的问题。当然,如果能够在软件栈开发上不断产生技术积累,并且逐步形成生态,那这个产品落地的过程会越来越快,而这也是壁仞科技今年加大软件开发层面投入的关键目标,”徐凌杰如是说。

进度同样领先的GPGPU明星企业天数智芯也指出,软件适配确实是整个行业需要共同面对的问题,目前国内的软件生态几乎90%的AI应用都基于国外主流厂商的软件方案,这是国内GPGPU发展的痛点。因此,天数智芯在产品的设计之初即关注到客户需要最大限度的降低跨平台开发成本。

英伟达在2022年宣布全球有300万程序员开发基于CUDA软件生态的应用,其在CUDA软件生态上构建了多个应用方向,例如高性能计算、人工智能、医学图像、大数据处理、自动驾驶、机器人系统、量子计算、加解密等。

沐曦CTO杨建指出,按照中国市场贡献英伟达35%的营收来推算,中国大约有90万CUDA程序员。能够让中国90万CUDA程序员实现0成本迁移的软件生态系统将赢得市场,并最大程度保证客户的盈利空间和客户经营的连续性

软件适配计算机主板系统、显示器型号和操作系统版本等方面都需要持续提高,因此杨建认为,截至2022年国产GPU产品销售还处于初级阶段,目前的产品也主要面向特定领域销售,而这些领域的订单受到宏观经济波动周期影响。

一位业内人士也直言,目前的国产GPU产品还没有形成竞争力,只能零散打入信创领域,但信创作为非商业市场,其市场空间并不大,因为国际领导厂商的产品不但价格更低,性能和可靠性也更好。

不过,除了信创领域,国产GPU还在其他领域积极渗透。天数智芯高管就告诉集微网,国产GPU在泛安防、云平台、大模型以及金融医疗等领域都有广泛的适用场景,且公司的产品已经在上述提到的领域中开始应用。

不难看出,大多数国内GPU企业并非闭门造车,同时也在苦心钻研软件适配这本难念的经。也只有大家齐心协力将生态完善,共同撕开产品落地的口子,国产GPU厂商才能真正将跑分数字转换成为国内各行发展所需要的澎湃算力。

一位熟悉国内GPU行业市场情况的资深人士告诉集微网,可能部分新成立的公司遇到了一些暂时的困难,但目前国内GPU企业之间进度区别并不大,软件适配程度也暂时没有明显的孰强孰弱之分。历史上半导体公司第一代产品就堪称完美的极少,应该给国产GPU多一些包容,多一些时间。

终局思考:中美脱钩下的出路

除了路径选择和产品落地的难题,中美科技脱钩大环境下的供应链问题也是每一家国内GPU的必修课。短期内,登临科技李建文表示,国产GPU的性能指标受到了直接影响,企业应尽快思考如何在高效率兼容的前提下通过架构创新来解决产品竞争力问题,从而在增量细分市场上先切入,并不断更新换代和增强能力,从而保证长期竞争力。

“商业市场的核心是产品竞争力,”李建文如是说。

另外,李建文还认为,目前美国限制是完全按照英伟达产品的思路制定的,需要同时碰到 I/O 和理论算力两条线才会受到影响。这也说明,在架构上照搬英伟达或者其它市售 IP 的路线,不仅商业上性价比无法胜过已有的产品,在管控下受到的影响也越来越大。在大的GPU 市场中,国内企业还是需要找到新的增量市场,做差异化创新才能抓住长期机会。

聚焦整个国内GPU行业,壁仞科技联席CEO李新荣则认为,应对国际政治的大环境,国内厂商在继续保持与现有供应链合作伙伴的紧密协作之外,还需要整个国内GPU产业链凝聚成一股力量,去支持国产供应链的建设。

在谈到具体细节时,沐曦CTO杨建告诉集微网,国内所有的GPU企业都要深入挖掘国际化人才储备,高度重视GPU IP的架构和微架构优化,积极拥抱基于chiplet的体系结构、EDA工具、生产工艺、封装工艺,以降低成本、打造安全供应链,同时布局全球性知识产权、商标、销售渠道。

国产GPU面临的中场危机,每一家企业或许都有不同的策略来缓解。至于如何扭转局面,或许只有同心协力才有机会在达摩克里斯之剑下突出重围。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载