不只5090,英伟达还发布了最小的“AI超算”与最大的世界模型
科技
科技 > 数码 > 正文

不只5090,英伟达还发布了最小的“AI超算”与最大的世界模型

作者 | 张勇毅

编辑 | 靖宇

还有人比英伟达的创始人黄仁勋,更适合做 2025 年 CES 的开幕主讲人吗?

作为标志着 CES2025 正式揭幕的活动,黄仁勋的主题演讲从一开始就是点燃众人期待的开年盛事。

当地时间 1 月 6 日,黄仁勋换了一身闪亮的蛇皮夹克——而不是他经常在发布会上穿的那件标志性夹克。「我夹克怎么样?」老黄在开场就用这身皮衣和人们开起了玩笑。

毕竟,这里是赌城拉斯维加斯,不「浮夸」一些都是对 CES 举办地的不尊重。

黄仁勋身上闪亮的皮衣,既代表了英伟达今年夸张的市值表现,同样意味着当晚的开场演讲中,他将发布一系列炸裂的产品。

如果你认为 RTX 5090 这样的新「核弹」是老黄演讲的重心,那显然看轻了当晚的发布会。英伟达早已经成为 AI 行业的「兵工厂」,发布会上黄仁勋不仅公布了 Omniverse+Cosmos 这样立足于物理世界的 AI 模型和整套生产流程,同时还曝光了一款仍未定名的桌面级 AI 超算「Project Digits」。

总结一句话,那就是,AI 发展的缰绳,依然牢牢掌控在英伟达的手中。

01

RTX5090 系列:算力加量大减价

RTX5090 系列|图片来源:英伟达

首先登场的是今年的旗舰显卡重头戏:RTX50 系列。

虽然经受着来自 AMD 的压力,但在经历数月的传闻后,英伟达终于在 CES 2025 上正式发布了下一代 RTX Blackwell GPU 系列,共包括四款型号:

RTX 5090,售价 $1,999

RTX 5080,售价 $999

RTX 5070 Ti,售价 $749

RTX 5070,售价 $549

其中,RTX 5090 和 RTX 5080 将于 1 月 30 日发售,RTX 5070 Ti 和 RTX 5070 将于 2 月发布。

RTX 50 系列采用全新的 Founders Edition 设计,配备双向流通风扇以及 GDDR7 显存,所有型号均支持 PCIe Gen 5 和 DisplayPort 2.1b 接口,可驱动高达 8K/165Hz 的显示输出。

得益于新架构 Blackwell 和 DLSS 4,RTX 5090 的性能据称比 RTX 4090 快两倍。不过功耗也增加了 125 瓦,但英伟达表示其效率更高,只有在满负荷时才会达到 575 瓦。

RTX 5080 性能同样提升巨大,据称比 RTX 4080 快两倍;黄仁勋同时表示 RTX 5070 的性能等同于 RTX 4090,但售价仅有 $549。

英伟达声称,RTX 5070 Ti 比 RTX 4070 Ti 快两倍,而 RTX 5070 的性能等同于 RTX 4090,售价仅 $549。

RTX50 系列性能相比 40 系列均有「翻倍」的提升|图片来源:英伟达

但这个「翻倍」的性能提升中,新一代支持多帧生成的 DLSS 4 技术同样功不可没,它能在传统渲染的基础上生成最多 3 个额外帧,帧率可提升高达 8 倍。同时利用生成式 AI 提升材质压缩与游戏角色面部质量。

黄仁勋也直言「没有生成式 AI,我们无法走到今天这一步」。

在演示中,英伟达展示了 RTX 5090 在《赛博朋克 2077》中开启 DLSS 4 后达到 238fps,而 RTX 4090 在 DLSS 3.5 下仅能达到 106fps。两款 GPU 均启用了完整的光线追踪功能。

DLSS 4 还应用了实时 Transformer 模型,可改进图像质量、减少拖影并在动态画面中提供更高细节。DLSS 4 的部分升级也将适配现有的 RTX GPU。

除了桌面级显卡系列,英伟达还将在笔记本电脑上推出 RTX50 系列 GPU,将于 3 月起由多家 PC 制造商发布产品登场。

当然也不能忘记针对中国市场特供的 RTX5090D 版本:从目前英伟达官网公开的信息来看,RTX5090D 在主要在 AI 算力上进行了削减,其他部分的性能没有改变。

RTX5090D 与 RTX5090 性能差别|图片来源:英伟达官网

02

Omniverse+Cosmos:

世界模型与数字孪生

除了 RTX5090 系列显卡,支撑起英伟达股价暴涨的,还有英伟达在世界模型领域的进展

在主题演讲中,黄仁勋介绍了名为 Cosmos 的一系列世界基础模型:这些模型能够预测并生成「物理感知」(physics-aware)的视频,其目的是为了解决当前 AI 模型「知其然不知其所以然」的问题。

目前,英伟达发布的 Cosmos 系列模型分为三大类:

Nano:用于低延迟和实时应用。

Super:用于高性能基线模型。

Ultra:用于最大质量和高保真输出。

这些模型参数规模从 40 亿到 140 亿不等,Nano 是最小的模型,Ultra 是最大的。虽然参数越多性能通常越好,但开发者仍然可根据具体应用进行微调,并可通过英伟达的 API 和 NGC 目录、GitHub 以及 Hugging Face AI 开发平台获取。

据黄仁勋在演讲中介绍,这些模型基于 9000 万亿个标记(tokens)和 2000 万小时的真实世界人机交互、环境、工业、机器人及驾驶数据训练而成,但并未透露这些学习数据的具体来源:此前已经有报道表示这些数据来源是 YouTube 视频。

对此,英伟达只是表示「使用的数据来自多种公共和私人来源,这些都符合法律规定」。

回到世界模型本身,有了海量的现实世界视频数据作为支撑,Cosmos WFM 模型能够根据文本或视频帧生成「可控的高质量」合成数据,用于机器人、自动驾驶汽车等领域的模型训练和开发。

Cosmos 能够基于物理定律,输出合理的图像用于训练机器人|图片来源:英伟达

虽然与传统意义上的「开源模型」有些偏差,但英伟达还是允许无论公司规模如何,研究人员和开发者都可以根据英伟达的开放模型许可协议自由使用 Cosmos 模型,并且该许可协议允许商业用途。

按照英伟达展示的案例,Cosmos 已经被应用于模拟真实环境,如工厂车间或驾驶场景。或者与 Sora 类似,使用多模态内容(如文本、图像、视频以及机器人传感器数据)的输入生成基于物理定律的视频。

目前,已经有包括 Wayve、Uber 这样的自动驾驶公司,在使用 Cosmos 用于加速自动驾驶技术的推进。黄仁勋也表示希望 Cosmos「能为机器人和工业 AI 领域带来像 Llama 为企业 AI 所带来的变革。」

除了世界模型,一同公布的还有英伟达数字孪生领域的新成果:Mega Omniverse Blueprint,一个用于创建工业数字孪生的框架。

英伟达表示,这一全新框架通过软件定义的测试和优化,为工厂和仓库带来了工业 AI 和机器人模拟的新平台。

据黄仁勋介绍,当前全球的 1000 万工厂、近 20 万个仓库和 4000 万英里高速公路构成了我们物理世界的「计算」网络。然而,这个庞大网络中的生产设施和配送中心网络仍然需要手动设计、操作和优化。

在仓储和配送中,操作员面临高度复杂的决策优化问题——包括人类工人、机器人、代理系统和设备之间的变量和相互依赖性仍然复杂,,当前的数字孪生仍然很难实现在这种复杂环境下的分析与处理。

针对这种物理世界的需求,英伟达发布了名为「Mega」的 Omniverse Blueprint 框架,用于在数字孪生环境中大规模开发、测试和优化物理 AI 和机器人队列,然后再部署到现实设施中。

目前,先进的仓库和工厂已经开始使用超过数百个自主移动机器人、机械臂和人形机器人与人类协作工作。由于越来越复杂的传感器和机器人自主系统的实现,因此需要在模拟中进行协调训练以优化操作、确保安全并避免中断。

针对机器人的自主系统,模拟路径规划的各种可能性,从而找出效率最高的版本|图片来源:英伟达

针对这种需求,Mega 提供了一个参考架构,基于英伟达加速计算、AI、Nvidia Isaac 和 Nvidia Omniverse 技术,用于开发和测试数字孪生。这些数字孪生可用于测试驱动机器人的 AI 大脑、视频分析 AI 代理、设备等,从而处理庞大的复杂性和规模。

通过这种数字孪生,企业可以不断更新其设施中的机器人大脑,以实现智能化的路径规划和任务分配,从而提升运营效率。

在模拟环境中,这些机器人可以通过感知和推理完成任务,规划下一步动作并在数字孪生中执行。这种循环会持续进行,Mega 精确跟踪数字孪生中所有资产的状态和位置。

与 IT 行业不同,物理工业市场仍在等待自己的软件定义时刻。「未来,每个工厂都会有一个数字孪生」黄仁勋说道。

03

Project DIGITS:超算中心搬回家

随着大模型「炼丹」在最近几年迅速成为全民浪潮,就连普通用户中都涌现出了了不少对高算力有需求的使用场景——但显然不是每个人都有条件搞 GPU 集群来训练自己的大模型。

针对这种需求与现实的落差,这次英伟达拿出了一个专属的解决方案:一台相当于 Mac mini 大小的计算单元 Project Digits。

能放在桌面上的 Project Digits|图片来源:英伟达

Project Digits的核心是新一代 GB10 Grace Blackwell 芯片,这款桌面级系统可以处理高达 2000 亿参数 的 AI 模型,同时使用标准家用电源插座实现供电——这点在以往同等算力需要更大且耗电更多的硬件上来讲通常是难以想象的事。

在 CPU 部分,Project Digits 采用英伟达自家的 Grace CPU,采用定制 20 核心 ARM 架构,每台系统配备了 128GB 的统一内存(普通笔记本电脑可能只有 16GB 或 32GB 的 RAM)以及高达 4TB 的 NVMe 存储空间。

英伟达还为 Project Digits 用户提供了各种 AI 软件,包括开发工具包、编排工具,以及通过英伟达 NGC 目录提供的预训练模型。操作系统运行基于 Linux 的 英伟达 DGX OS,并支持主流框架,如 PyTorch、Python 和 Jupyter

开发者可以利用英伟达 NeMo 框架对模型进行微调,还可以使用英伟达 RAPIDS 库 加速数据科学工作流程。

在本地开发和测试 AI 模型后,用户可以将这些模型部署到云服务或数据中心基础设施中,保持与 Grace Blackwell 架构和 英伟达 AI 企业软件平台的无缝对接。

不仅外观与 Mac mini 相似,Project Digits 甚至就连用法都与 Mac mini 异常接近:对于需要更强大算力的应用,两台 Project Digits 系统可以连接在一起,获得足以处理高达 4050 亿参数模型的性能。

如果你对这个模型体积没有准确概念,这里有一个参照物:Meta 目前最顶级的模型 Llama 3.1 有 4050 亿参数

换言之,有了两台这样的「Mac mini」,你就能实现在家搭建起一个能跑起来目前最顶级的大模型的「超算中心」。

Project Digits 将于今年五月正式推出,起售价为 3000 美元。虽然这仍然不是一个便宜的价格,但仍然是英伟达为个人开发者提供的一种能够接触到超级算力的解决方案,同时也为 AI 应用的研发与部署,带来了更高的灵活性和效率。

虽然 CES 上,消费电子才是主流,但是黄仁勋的开场,再次证明在仍在发展的 AI 浪潮中,基建的快速进化,才是重中之重。

算力、模型、应用落地,英伟达的「AI 基建三件套」已经越来越成熟,这才是为什么老黄并没有再次说出那句经典得「买得多、省得多」——他早已不需要说了,英伟达的重心早已不是单纯的「卖卡」,他们有了更大的目标和野心。而当晚的发布会上,黄仁勋已经将公司的计划「提前剧透」了。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载