分享

英伟达新“桌面超算”800GB大内存,满血DeepSeek R1能装1个半

梦晨 闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

英伟达官宣新办公室落户中国台湾省台北市,但居然是从太空飞下来的吗?
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F8293e59fj00swi16r003jd000hs006um.webp
当然,这只是黄仁勋在Computex大会上展示的CG特效,但背后还有这样一层意思:
如此逼真的画面中,只有1/10的像素是显卡渲染的,剩下全部内容为AI预测。

当初是GeForce显卡让AI成为现实,现在AI反过来给GeForce显卡带来颠覆性变革。

除了正式宣布新办公室地址,会上英伟达还宣布多款重磅新品:
面向个人有DGX Station,在桌面跑1T参数大模型,这回刀法也不用了,足足给到800GB内存。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fd4b5f791j00swi16r000kd000hs009wm.webp
面向企业有RTX PRO Server,可加速从AI智能体、物理AI、科学计算到渲染、3D图形和视频等各种用例。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fead8453dj00swi16r000nd000hs00a0m.webp
同时老黄还表示英伟达正在经历一次转型,从一家芯片公司扩展到一家AI基础设施公司
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F64564343j00swi16r000id000hs00a0m.webp
过去几十年,英伟达从造GPU芯片到造超算系统,现在造数据中心都已经不满足了,接下来要交付的是“星际之门”xAI Colossus超级计算集群这样的大项目。
老黄表示,AI基础设施市场将以数万亿美元衡量。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fdf8f8e83j00swi16r001ed000hs009em.webp
此外,这场演讲中的其他亮点还有:

  • 发布半定制化NVLink Fusion(混搭,有IP就可用)
  • 推出英伟达AI数据平台
  • 宣布与迪士尼合作机器人项目

下面一起来看。
“买的越多,创造的越多”
今年第三季度,英伟达主打产品将升级到Blackwell架构GB300超级芯片
与GB200相比,GB300在算力和内存上约提升50%,网络连接性能则提升1倍。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F43cc52caj00swi16r000kd000hs00agm.webp
2个超级新品组成1个计算节点(node),老黄在现场还拆开实物,详细展示了其内部构造。
2018年的Sierra超级计算机中包含18000块英伟达Volten架构GPU,如今一个Blackwell计算节点就可提供同等的算力。
按黄式数学,这叫6年时间性能提升约4000倍。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fe768de7aj00swi16r000nd000hs00a1m.webp
将这些节点连接在一起就需要NVLink,这次老黄重点了系统的“脊柱”NVLink Spine,内含总长两英里(3.218公里)的5000条铜缆,将每块芯片之间全互联,实现每秒14.4TB的全连接带宽。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F2728d7caj00swi16r000nd000hs009hm.webp
这次宣布的新品则是NVLink Fusion,允许合作伙伴将NVLink技术应用于定制的机架。
也就是说,非英伟达的CPU和其他加速器也可以与英伟达产品结合使用,同时享有NVLink的高速连接。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fbadf2a5ej00swi16r000qd000hs00agm.webp
数据中心产品之外,英伟达在桌面产品上再次发力。
老黄先透露,之前宣布的个人AI计算机DGX Spark已全面投产,将于数周内上市。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fef8120cfj00swi16r000md000hs00a7m.webp
DGX Spark采用英伟达GB10芯片,能够提供每秒1000万亿次的AI运算,用于微调和推理最新AI模型。
升级款DGX Station,则首次搭载了与数据中心同款的GB300超级芯片
英伟达表示DGX Station属于全新设计的计算机类别,适用于在桌面上开发和运行大规模AI训练和推理工作负载。
高达784GB的大容量统一内存,最高支持运行1T参数的大模型,也就是说671B的满血DeepSeek R1能跑一个半。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fd4b5f791j00swi16r000kd000hs009wm.webp
面向企业的RTX Pro Server搭载了8块RTX PRO 6000服务器版GPU,96GB GDDR7内存,1.6TB/s内存带宽。
一台RTX Pro Server机架包括4台RTX PRO Server服务器,提供120PFlops的FP4峰值算力。
现场也特意用了DeepSeek R1模型的测试数据,每花费500万美元,RTX PRO Server的性价比是H100的四倍。
花更少的钱,生成更多的token。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F1986f3a1j00swi16r000nd000hs009xm.webp
对于这一系列新品,老黄这次改变了促销口号。
从“买的越多,省得越多”,变成了“买的越多,创造的越多”

c66f41ca219849a987b74f5b496dd9db.webp GPU之外一系列新发布


老黄表示,人类要查询像SQL这样的结构化数据,而AI想要查询的是非结构化数据,因此需要打造新型存储平台,也就是NVIDIA AI数据平台
这个新型的存储平台不再是依靠CPU,而是配备计算GPU。
并且打造了一个新型查询系统——Nvidia AIQIQ,就像SQL服务器、SQL软件和文件存储软件一样,类似一个复杂的软件层。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F8affead5j00swi16r000gd000hs009gm.webp
他还提到,加速运算始于CUDA-X,这个集合几乎包含了所有领域的加速运算。
比如,Aerial和Sionna能够将AI带到5G和6G;Monai可以用于医学成像;Earth-2用于天气预报;Coup quantum用于量子经典计算架构;以及Megatron、Dynamo、NIXL等包含了深度学习所有的训练库。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F4264ceb3j00swi16r000nd000hs00a3m.webp
英伟达正在研究一类量子经典或量子GPU计算平台——CUDAQ,与全球优秀企业合作,将AI带入5G和6G。
并且,老黄还提到未来的超级计算机就是具有QPU和GPU的QPU
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2F765b9945j00swi16r000pd000hs00a4m.webp
物理AI,是机器人革命的基石。
老黄举了个例子,比如说滚动一个球,根据球的速度,它可能到了汽车底下或者汽车的另一边,但它没有消失;又比如面前有张桌子,最好的选择是绕过它或者钻过去,而不是直接穿过它。
在人工智能时代,AI能够推理类似的物理事件是极其重要的。
而如今要做的事情就是研究一种能够根据提示自主生成视频,然后进行训练的机器人。
?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0519%2Fb499fc2aj00swi16r000ld000hs00a3m.webp
在此构想之下,英伟达/谷歌DeepMind/迪士尼合作开发了专为机器人开发而构建的新一代开源物理引擎Newton,可让机器人学习如何以更高的精度处理复杂任务。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则