热点新闻

新浪科技讯 1月6日上午消息，一年一度的CES展会期间，黄仁勋在英伟达新品发布会上把一台2.5吨重的AI服务器机架搬上了舞台，并首次展示其Vera Rubin计算平台，黄仁勋表示，其命名是以发现暗物质的天文学家而命名，目标是加速AI训练的速度，让下一代模型提前到来。

黄仁勋表示，伴随着摩尔定律的放缓，传统性能提升方式已经跟不上AI模型每年10倍的增长速度，所以英伟达选择了极致协同设计，即在所有芯片、整个平台各个层级上同时创新。

Vera CPU具备88个NVIDIA定制Olympus核心，采用NVIDIA空间多线程技术，支持176个线程，NVLink C2C带宽1.8 TB/s，系统内存1.5TB（为Grace的3倍），LPDDR5X带宽1.2 TB/s，2270亿个晶体管。

Rubin GPU的NVFP4推理算力50PFLOPS，是前代Blackwell的5倍，拥有3360亿晶体管，比Blackwell晶体管数量增加了1.6倍，搭载第三代Transformer引擎，能根据Transformer模型需求动态调整精度。

ConnectX-9网卡则基于200G PAM4 SerDes的800 Gb/s以太网，可编程RDMA与数据通路加速器，通过了CNSA与FIPS认证，晶体管数量达到230亿。

还有专为新一代AI存储平台而构建的端到端的引擎BlueField-4 DPU，是一款具备面向SmartNIC与存储处理器的800G Gb/s DPU，搭配ConnectX-9的64核Grace CPU，晶体管数量1260亿。

还有NVLink-6交换芯片，连接18个计算节点，支持最多72个Rubin GPU像一个整体协同运行，在NVLink 6架构下，每个GPU可获得3.6 TB每秒的all-to-all通信带宽，采用400G SerDes，支持In-Network SHARP Collectives，可在交换网络内部完成集合通信操作。

第六款是Spectrum-6光以太网交换芯片，其拥有512通道，每通道200Gbps，实现更高速数据传输，集成台积电COOP工艺的硅光子技术，配备共封装光学接口（copackaged optics），晶体管数量达到3520亿。

黄仁勋介绍道，通过6款芯片的深度整合，Vera Rubin NVL72系统性能比上一代Blackwell实现了全方位的提升。在NVFP4推理任务中，该芯片达到了3.6 EFLOPS 的惊人算力，相比上一代Blackwell架构提升了5倍。在NVFP4训练方面，性能达到 2.5 EFLOPS，实现3.5倍的性能提升。

存储容量方面，Vera Rubin NVL72配备了54TB的LPDDR5X内存，是前代产品的3倍。HBM（高带宽内存）容量达到20.7 TB，提升1.5倍。在带宽性能上，HBM4带宽达到1.6 PB/s，提升2.8倍；Scale-Up带宽更是高达260 TB/s，实现了2倍增长。（罗宁）

比Blackwell算力提升5倍！黄仁勋展示Vera Rubin计算平台｜直击CES

相关推荐