新显卡
登场
作为科技行业的重要风向标,AI 霸占了 CES 2025 的全部焦点,以至于那些未沾 AI 的产品,几乎成了拉斯维加斯展会上的异类。
AI 当主角,英伟达 CEO 黄仁勋也当仁不让地打起了头阵。
作为「全村的希望」,他用一场振奋人心的开幕式主题演讲,外加一连串 AI 新品的重磅发布,让 CES 2025 的开场就炸响了 AI 圈的新年第一响。
演讲期间,换上新皮衣的老黄也摆姿势 cos 起了美队,引发全场欢笑。
没有让我们等太久,黄仁勋很快端出了我们等了许久的基于 Blackwell 架构的新一代 RTX 50 系列显卡。
其中,RTX 5090 GPU 是迄今为止的最快的 GeForce RTX GPU,配备了 920 亿个晶体管,每秒可实现超过 3352 万亿次 AI 运算,性能较上一代 RTX 4090 提升了近两倍。
RTX 5080 的设计目标是性能达到 RTX 4080 的两倍,并配备 16GB 的 GDDR7 显存,内存带宽为 960GB/秒,以及 10752 个 CUDA 核心。英伟达承诺,RTX 5080 将在性能上大幅领先于上一代 RTX 4080。
黄仁勋在演讲中如此强调:
我们已经认识到,AI 不仅仅是一个带来新商机的应用,更是由transformer实现的机器学习将从根本上改变计算方式。
RTX 50 系列发布距离 RTX 4090 和 RTX 4080 的发布已有两年时间。
RTX 40 系列 GPU 重点改进了光线追踪性能,并推出了深度学习超级采样(DLSS)3。而 RTX 50 系列则引入了 DLSS 4。
新一代 DLSS 技术的突破,让 AI 不再只是简单的帧生成,而是具备了「预见未来」的能力,也将在游戏开发和内容创作领域产生重要影响。
具体来说,DLSS 4 首次推出多帧生成功能,通过使用 AI 为每个渲染帧生成多达 3 帧来提高帧速率。
它与 DLSS 技术套件协同工作,与传统渲染相比,性能提高了 8 倍,同时通过 NVIDIA Reflex 技术保持响应速度。
DLSS 4 还引入了图形行业首个实时 Transformer 模型架构应用。
基于 Transformer 的 DLSS 光线重建和超分辨率模型使用多 2 倍的参数和 4 倍的计算能力,可在游戏场景中提供更高的稳定性、更少的重影、更高的细节和增强的抗锯齿效果。
DLSS 4 将在发布当天支持超过 75 款游戏和应用程序,并可在 GeForce RTX 50 系列 GPU 上使用。
拿我们熟悉的《赛博朋克 2077》以及《黑神话:悟空》等游戏来说,DLSS 4与多帧生成技术能显著提升这些游戏的性能。
据悉,装备 GeForce RTX 5090 的玩家,即便在开启全光线追踪、将所有画质设置调至最高的极致条件下,依然能享受到 4K 分辨率下 240 帧的流畅体验。
性能大涨,售价自然也涨了,具体四款显卡售价如下:
RTX 5090:1999 美元(当前约 14647 元人民币)
RTX 5080:999 美元(当前约 7319 元人民币)
RTX 5070Ti:749 美元(当前约 5488 元人民币)
RTX 5070:549 美元(当前约 4022 元人民币)
国行售价如下:
RTX 5090D 售价 16499 元起
RTX 5080 售价 8299 元起
RTX 5070 Ti 售价 749 美元起
RTX 5070 售价 549 美元起
在 Scaling law 疑似「撞墙」的情况下,肩负 AI 信徒众望的黄仁勋也大唱赞歌。
黄仁勋认为,Scaling law 并未失效,只要投入足够的计算资源和采用更复杂的算法,AI 的智能水平就能持续提升。
甚至可以说 Scaling law 在经历不同阶段的调整:
前训练扩展(Pre-training Scaling)阶段。随着互联网数据量每年翻倍,特别是多模态数据(视频、图像、声音)的爆发式增长,为 AI 训练提供了持续增长的数据基础。
后训练扩展(Post-training Scaling)阶段。通过强化学习和人类反馈等技术,AI 能够像有了「导师」一样不断优化自身。这个过程类似于毕业后的持续进修,AI可以针对特定领域进行微调,提升解决实际问题的能力。
测试时扩展(Test-Time Scaling)阶段。AI 在使用过程中能够灵活调配计算资源,通过推理、长时思考、问题分解等方式来提升解决问题的质量。
Blackwell 架构的互联技术 NVLink72 也正式亮相,结合强大的GPU、CPU、内存、网络和数据处理能力,适用于需要极高计算和数据处理能力的应用,如 AI 、科学计算和数据分析等领域。
具体亮点如下:
包含 72 个 Blackwell GPU,
能够提供 1.4 ExaFLOPS 的 TF FP4 性能,
配备了 576 个内存芯片,总容量为 14 TB(太字节),
具有 1.2 PB/s 的内存带宽。
包含 18 个 NVLink 交换机,拥有 1300 亿个晶体管,
包含 2592个Grace CPU核心,72 个 ConnectX-8 网络接口卡(NICs),
18个BlueField 数据处理单元(DPUs)
AI Agent 已经成为 2025 年的重要关键词,同时也是下一个重要的 AI 风口。
英伟达也对此提出了全新的发展愿景。
这种新一代 AI 系统将不再局限于简单的问答模式,而是能够像真实员工一样理解需求、互动交流并解决复杂问题。
它可以调用多种工具,从网络搜索到 PDF 阅读,从使用计算器到生成图表,通过多个模型的协同合作来完成任务。
为了实现这一目标,英伟达推出了包括 Nims 微服务平台和英伟达 Nemo 系统在内的完整解决方案。
Nims 将复杂的底层技术打包优化,支持视觉、语言、语音等多种AI模型在各类云平台上运行。
而 Nemo 系统则堪称 AI Agent 的「入职培训系统」,能够根据企业特定需求进行定制化训练,包含完整的评估反馈机制和安全护栏。
未来企业的 IT 部门将逐渐转变为「AI Agent 的人力资源部门」。
老黄表示:
世界上有 10 亿知识工作者,AI Agent 可能是下一个机器人行业,很可能是一个价值数万亿美元的机会。
发布会上,黄仁勋还宣布推出世界基础模型平台——「英伟达宇宙」(NVIDIA Cosmos),专注于理解和模拟物理世界。
该平台经过 2000 万小时视频训练,主要聚焦于物理动态,包括自然运动、人类行为和物体操作等场景,致力于教导 AI 理解物理世界的运作方式。
它包含自动回归模型、扩散基础、高级标记器和 AI 加速数据管道等组件,能够根据文本、图像或视频提示生成符合物理规律的虚拟世界状态。
从工业自动化到自动驾驶汽车,英伟达宇宙的应用范围极其广泛。
在工业领域,它可以模拟工厂运营,生成合成数据用于训练机器人。在自动驾驶领域,它能够将数千次真实驾驶数据扩展为数十亿英里的训练数据。
通用机器人的「ChatGPT 时刻」即将到来,有望在未来几年内推动机器人技术取得突破性进展。
关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察
超级计算机也不再是数据中心的专属,它正在走进每个人的口袋。
当初,黄仁勋曾经向 OpenAI 赠送了世界上第一台 DGX-1 AI 超级计算机。
作为专为深度学习设计的系统,DGX-1 整合了硬件、深度学习软件以及开发工具,使得用户能够简单快速地部署,也为今日的 AI 浪潮起到了很大的推动作用。
时隔多年,相比当年那台「箱子」大小的超级计算机,黄仁勋在发布会上展示的只手可握的 Project Digits 可谓惊艳全场。
搭载英伟达新型 GB10 Grace Blackwell 超级芯片,Project Digits 专为 AI 研究人员、数据科学家和学生设计,可提供高达 petaflop 级别的计算性能,可用于原型设计、微调和运行 AI 模型。
通过与 MediaTek 合作开发,GB10 具有连接到 20 核英伟达 Grace CPU 的英伟达 Blackwell GPU。
在 Project Digits 的外壳内部,芯片连接到 128GB 内存池和高达 4TB 的闪存。
英伟达声称单个 Project Digits 单元可以运行高达 2000 亿个参数的模型,如果有工作需要,两台连接在一起,可运行多达 4050 亿个参数的模型。
并且,它不仅可以作为私有云计算平台,还能秒变专业工作站,真正实现了「开箱即用」。Project Digits 将于今年 5 月通过英伟达的顶级合作伙伴推向市场,定价 3000 美元。
一场发布会,道不尽英伟达的 AI 野心。
从数据中心到个人桌面,AI 的浪潮正在席卷每一个计算终端,而英伟达,正在把这场革命的火种,播撒进每一台个人电脑。
当 RTX 50 系列显卡让游戏玩家体验到 AI 加持的性能,当 Project Digits 将超算变得不再高不可攀,那个 AI 无处不在的未来,也正在变得清晰可见。而这,或许正是英伟达一直以来努力追寻的愿景。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”