新浪财经

首席观点∣英伟达GTC2025:发布GB300、Rubin,软件持续迭代

市场资讯 2025.03.24 07:25

金选·核心观点

作者:樊志远

业绩简评

2025年3月18日,公司举办GTC 2025活动,对未来新产品推出做出展望,公司未来将陆续推出GB300(GB Ultra)、Vera Rubin、Rubin Ultra等GPU产品,以及Infiniband与以太网的CPO交换机。

经营分析 

对于AI算力需求的可持续性,公司认为目前模型在推理端相比最早的生成式AI更为复杂,需要消耗更大算力。目前AI处在从简单的生成式AI,向助理式AI的发展阶段,助理式AI通过在推理侧引入强化学习等方式,相比最早的生成式AI推理需要更多步骤,需要消耗100倍的token,推理对于算有望产生持续性需求。

目前Blackwel持续出货,客户需求强劲。2024年微软Azure云、亚马逊云、谷歌云、Oracle云合计采购130万颗Hopper芯片,公司预计以上四个客户今年将采购360万颗Blackwell GPU die。

公司硬件持续迭代,预计25H2推出GB300 NVL72。GB300 NVL72将采用CX9网卡,同时单GB300芯片具备288GB HBM3e显存,容量较GB200有明显升级,算力是GB200 NVL72的1.5倍。公司预计26H2推出Vera Rubin NVL144,单机柜算力是GB300 NVL72的3.3倍,同时采用HBM4显存,第六代NVlink以及CX9网卡。公司预计27H2推出Rubin Ultra NVL576,单机柜算力是GB300 NVL72的14倍,将采用第七代NVLink。公司预计将在25H2推出Quantum-X CPO交换机,26H2推出Spectrum-X CPO交换机。

公司软件生态丰富度继续提升。公司基于CUDA针对一系列垂类行业推出了库,例如用于计算光刻的cuLitho、用于量子计算的CUDA-Q等。另外公司推出了dynamo系统,可以有效帮助GPU完成prefill和decode的任务,提升GPU利用效率。

风险提示 

云厂商CAPEX不如预期;AI发展不如预期;美国加大制裁力度;行业竞争加剧。

免责声明:本栏目刊载的信息仅为投资者教育的目的,不构成任何投资建议,投资者不应以该等信息取代其独立判断或仅根据该等信息作出决策。本栏目力求信息准确可靠,但对信息的准确性或完整性不作保证,亦不对因使用该等信息而引发或可能引发的损失承担任何责任。投资有风险,入市须谨慎。

(转自:国金证券第5小时)

加载中...