比Blackwell算力提升5倍!黄仁勋展示Vera Rubin计算平台|直击CES

新浪科技讯 1月6日上午消息,一年一度的CES展会期间,黄仁勋在英伟达新品发布会上把一台2.5吨重的AI服务器机架搬上了舞台,并首次展示其Vera Rubin计算平台,黄仁勋表示,其命名是以发现暗物质的天文学家而命名,目标是加速AI训练的速度,让下一代模型提前到来。

黄仁勋表示,伴随着摩尔定律的放缓,传统性能提升方式已经跟不上AI模型每年10倍的增长速度,所以英伟达选择了极致协同设计,即在所有芯片、整个平台各个层级上同时创新。

Vera CPU具备88个NVIDIA定制Olympus核心,采用NVIDIA空间多线程技术,支持176个线程,NVLink C2C带宽1.8 TB/s,系统内存1.5TB(为Grace的3倍),LPDDR5X带宽1.2 TB/s,2270亿个晶体管。

Rubin GPU的NVFP4推理算力50PFLOPS,是前代Blackwell的5倍,拥有3360亿晶体管,比Blackwell晶体管数量增加了1.6倍,搭载第三代Transformer引擎,能根据Transformer模型需求动态调整精度。

ConnectX-9网卡则基于200G PAM4 SerDes的800 Gb/s以太网,可编程RDMA与数据通路加速器,通过了CNSA与FIPS认证,晶体管数量达到230亿。

还有专为新一代AI存储平台而构建的端到端的引擎BlueField-4 DPU,是一款具备面向SmartNIC与存储处理器的800G Gb/s DPU,搭配ConnectX-9的64核Grace CPU,晶体管数量1260亿。

还有NVLink-6交换芯片,连接18个计算节点,支持最多72个Rubin GPU像一个整体协同运行,在NVLink 6架构下,每个GPU可获得3.6 TB每秒的all-to-all通信带宽,采用400G SerDes,支持In-Network SHARP Collectives,可在交换网络内部完成集合通信操作。

第六款是Spectrum-6光以太网交换芯片,其拥有512通道,每通道200Gbps,实现更高速数据传输,集成台积电COOP工艺的硅光子技术,配备共封装光学接口(copackaged optics),晶体管数量达到3520亿。

黄仁勋介绍道,通过6款芯片的深度整合,Vera Rubin NVL72系统性能比上一代Blackwell实现了全方位的提升。在NVFP4推理任务中,该芯片达到了3.6 EFLOPS 的惊人算力,相比上一代Blackwell架构提升了5倍。在NVFP4训练方面,性能达到 2.5 EFLOPS,实现3.5倍的性能提升。

存储容量方面,Vera Rubin NVL72配备了54TB的LPDDR5X内存,是前代产品的3倍。HBM(高带宽内存)容量达到20.7 TB,提升1.5倍。在带宽性能上,HBM4带宽达到1.6 PB/s,提升2.8倍;Scale-Up带宽更是高达260 TB/s,实现了2倍增长。(罗宁)

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。