【银河电新】英伟达GTC大会跟踪:算力需求旺盛,供电、液冷及CPO持续升级
中国银河证券研究
核心观点
事件:美国当地时间3月17至21日,英伟达GTC大会将在加州圣何塞举行,英伟达创始人兼CEO黄仁勋发表演讲,英伟达展示其正在全栈布局构建 AI 时代的基础设施,并提出28年全球数据中心Capex超万亿美元。
数据中心供电向800V HVDC发展,BBU及LIC超级电容重要性持续增加。智算中心AIDC向GW级、超高效及高密化演进,空间、散热以及线缆管理等面临挑战。未来供配电系统从AC 400V不间断电源(UPS)和DC 240V向高压直流演进。短期来看,配置机柜侧挂电源可提高空间利用率以及散热。中期来看,800V HVDC是过渡方案,此方案中,新增IT Rack,带来800V直流到50V直流的power shelf增量;新增PDU,PDU分为输入AC-PDU和输出DC-PDU两个模块。长期来看,GW级AIDC向高效化、绿色化、低碳化发展,固态变压器SST链路短效率高,方便新能源并网,有望成为终极解决方案。未来,备电BBU以及锂离子超级电容LIC重要性持续增加。
液冷大势所趋,重点关注冷链系统化、全液冷以及制冷剂创新。未来AIDC制冷系统架构有望实现芯片(服务器)侧—机柜侧—末端空调侧—冷源侧的整条冷链。液冷方式上可能采用全液冷的方式,包括全冷板,全浸没,或者冷板+浸没的方式。此外,液冷新型制冷剂的革新将是主要方向之一。
首推CPO交换机,缩短铜缆路径,采用液冷散热。英伟达采用台积电3D堆叠硅光引擎以及微环调制器,推出1.6Tb/s CPO交换机。铜缆因成本低、短距高带宽优势,适用于机柜内连接。但随着AI大规模集群网络发展,传统铜缆和可插拔光模块延迟、功耗及信号损耗已成为瓶颈,横向扩展场景下,CPO更为合适,CPO从“可插拔光模块+交换机”转向“光引擎+芯片共封装”,缩短信号转换的物理距离,减少铜缆使用,也省去相关电连接器和PCB布线,降低信号损耗。随着CPO交换机数据传输速率的提高和芯片集成度的增加,需更高效的液冷方案(如浸没式液冷)对板载硅光器件进行高效散热。
多家中国公司现身GTC大会。诸多中资厂商亮相GTC大会,覆盖服务器及硬件设备(联想、富士康、华硕、广达等)、电源(台达、维谛、光宝、麦格米特)、液冷(台达、维谛、技嘉)等诸多环节。大陆厂商麦格米特突破AI 服务器电源边界,向电源整体解决方案提供商演进。
风险提示
新技术进展不及预期、算力需求不及预期、AI产业链上下游短期波动、AI应用发展不及预期、地缘政治风险
一、算力需求持续,全栈布局构建 AI基建
AI尽头是算力,算力尽头是电力。生成式AI向自主型AI和物理AI演进。2025英伟达GTC大会CEO黄仁勋强调算力的增长点是AI,将AI分为4个不同层次,分别是感知AI、生成式AI、自主型AI和物理AI。感知式AI,计算机视觉、语音识别,手写识别,处理简单的特定任务。生成式AI是指教AI如何从一种内容模式变换到另一种内容形式,或者变换同一形式的不同内容,文生图、文生视频、图生视频,氨基酸到蛋白质,原材料到化学品,或是一问一答深度思考的大语言模型(文生文)。代理AI不只拥有感知式AI和生成式AI的能力,它还可以计划和行动、它可以使用工具,可以自己上网找信息,看视频或其他格式的内容,通过利用外界工具来完成目标任务。物理式AI也就是“具身AI”,包括自动驾驶的智能汽车,灵活处理劳作事务的机器人,或者工业机器人,智能的物联网机器人等。目前,生成式AI向自主型AI和物理AI演进。
图一:AI正迈向新发展阶段
资料来源:英伟达,中国银河证券研究院
AGI及推理算力需求高达百倍,IDC 28年Capex超万亿美元。AGI推理带来海量标记需求并要求提升速度保持模型的响应速度和交互性,当前的AI推理模型计算需求比去年生成式AI时代高出了100倍。根据英伟达数据,2024年四大云服务提供商亚马逊、微软Azure、谷歌云GCP、甲骨文OCI采购Hopper架构芯片130万颗,而2025年他们已订购360万颗Blackwell架构GPU,预计2028年全球数据中心建设投资将达到一万亿美元。
图二:美国TOP4芯片需求提升
图三:全球IDC 2028年Capex超万亿美元
资料来源:英伟达,中国银河证券研究院
二、Blackwell架构正式发布,CPO交换机商业化提速
英伟达在CTC大会上展示其正在全栈布局 AI 时代的基础通过芯片架构(Blackwell→Rubin→Feynman)、硅光子学CPO的交换机、液冷散热成为标配等硬件迭代革新,打造互联互通的 AI 超级集群,并加速软件开源丰富生态(Dynamo、Omniverse)、行业渗透(机器人、自动驾驶、量子计算),构建生态护城河。我们认为,在当前推理AI以及物理AI需求加速释放,数据中心电源、高速铜连接、CPO、液冷散热作为算力基建新趋势仍值得长期关注。
Blackwell架构25H2推出,后续架构晚于预期
英伟达在GTC会上发布 Blackwell Ultra 与 Rubin 系列 GPU,并展示后续产品路线图。根据规划,Blackwell Ultra(GB300)计划25H2推出,Vera Rubin计划26H2推出, Rubin Ultra计划27H2推出,代号为Feynman新一代架构计划28年推出。Blackwell Ultra作为过渡性产品,通过内存和推理优化性能,GB300NVL72较GB200提升50%,液冷散热成为标配;Rubin架构性能有着代际飞跃,Rubin NVL144和NVL576性能是Blackwell Ultra NVL72的14倍,内存、芯片封装、网络连接等多方面革新服务超大规模AI部署;Feynman预示着算力将持续快速提升。‘
图四:英伟达GPU产品路线图及时间线
资料来源:英伟达,中国银河证券研究院
根据英伟达在GTC大会介绍,与前代产品相比,NVIDIA Blackwell、Rubin架构在算力、功耗、显存、互联技术等方面提升明显,配置的液冷板、网卡、网络交换机、铜缆、PCB版等硬件也随之迭代升级。
(一)智算需求助推AIDC高景气
智算需求爆发,DC向AIDC升级。目前传统数据中心受限于资源管理灵活性不足、架构耦合度高、工作负载管理相对静态等原因已无法满足AI的发展,AIDC智算中心需求兴起。AIDC智算中心(AIDC即Artificial Intelligence Data Center)是以人工智能计算任务为主的数据中心:基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的新型算力基础设施。AIDC智算中心与通用型IDC在技术架构、散热模式、应用场景和客户群体多个方面存在显著差异。相较于AIDC智算中心,通用型IDC数据中心更多地提供物理空间租赁服务,而智算中心则在此基础上增加了对计算能力的需求。
图五:英伟达Blackwell system配置
资料来源:英伟达官网,中国银河证券研究院
图六:英伟达Blackwell Ultra NVL72配置
图七:英伟达Rubin system配置
资料来源:英伟达官网,中国银河证券研究院
图八:英伟达Blackwell Ultra NVL144配置
资料来源:英伟达官网,中国银河证券研究院
图九:英伟达Blackwell Ultra NVL576配置
资料来源:英伟达官网,中国银河证券研究院
图十:纵向 Compute Tray 设计概念图
资料来源:英伟达官网,Semi Analysis,中国银河证券研究院
首推CPO交换机,缩短铜缆路径,采用液冷散热
推出首个CPO交换机,CPO从“可插拔光模块+交换机”转向“光引擎+芯片共封装”,缩短铜缆路径。英伟达采用TSMC 3D堆叠硅光引擎,推出1.6Tb/s 硅光引擎 CPO 交换机。英伟达指出CPO交换机是为横向拓展网络长距离运行场景设计,CPO交换机基于台积电工艺的3D堆叠硅光子引擎,采用新微环调制器(MRM)的1.6T硅光子CPO芯片以及高功率激光器以及可拆卸光纤连接器,可实现高速稳定的数据传输并方便设备维护,打破了超大规模和企业网络的旧有限制,助力AI工厂扩展到100万GPU甚至更多。相较于传统可插拔光模块,CPO缩短了电信号与光信号转换的物理距离,因而缩短铜线传输路径,也省去相关电连接器和PCB布线,降低信号损耗。根据英伟达数据,与传统方法相比,CPO交换机将能源效率提高到3.5倍,信号完整性提高到63倍,大规模组网可靠性提高到10倍,部署速度提高到1.3倍。
图十一:英伟达 Spectrum-X 与 Quantum-X Photonics(CPO 设计)
资料来源:英伟达,中国银河证券研究院
CPO交换机采用液冷设计高效散热。Quantum-X和Spectrum-X衍生产品分别为Quantum 3450-LD、Spectrum SN6810和Spectrum SN6800交换机。(1)NVIDIA Spectrum-X Photonics交换机预计26H2推出,具有多种配置,包括128个800Gb/s端口或512个200Gb/s端口,总带宽可达到100Tb/s,以及512个800Gb/s或2048个200Gb/s端口,总吞吐量可达400Tb/s。(2)NVIDIA Quantum-X Photonics交换机预计25H2推出,提供144个基于200Gb/s SerDes的800Gb/s InfiniBand端口。NVIDIA Quantum-X Photonics交换机AI计算网的速度是上一代产品的2倍,扩展性是上一代产品的5倍。随着 CPO 交换机数据传输速率的不断提高和芯片集成度的增加,其功率密度大幅提升,产生的热量也越来越多,散热要求随之提升,CPO交换机将采用液冷设计对板载硅光器件进行高效散热。
图十二:Quantum-X 和 Spectrum-X 三款衍生新品
图十三:资料来源:英伟达官网,中国银河证券研究院
英伟达Quantum-X 结构图
资料来源:英伟达,中国银河证券研究院
CPO的主要优势是显著降低了功耗,这是因为(1)在交换机本身,由于不再需要数字信号处理器(DSP)以及可以使用低功率激光光源,因此节省了大量电力。(2)CPO允许更大的交换机基数,允许集群通过使用CPO拥有两层网络,而不是使用DSP收发器的三层网络,即意味着消除了整个层和一组交换机,使得成本和功耗节省。根据Semi Analysis分析,对于一个400k* GB200 NVL72部署,从基于DSP收发器的3层网络转向基于CPO的2层网络,可以节省高达12%的集群总功耗——将收发器功耗从计算资源的10%降低到仅1%。
物理AI加速人行机器人规模化应用
英伟达强调来十年的关键领域将是物理人工智能与人形机器人,通过升级Cosmos AI、开源人形机器人模型Isaac GR00T N1以及联合开发Newton 物理引擎布局机器人。(1)Cosmos AI作为物理AI的数据引擎,支持可控数据生成与多模态推理,提供高性能的世界基础模型、数据处理管道与开发工具,提升机器人学习效率,加速基于物理的 AI 世界生成。(2)Isaac GR00T N1 是全球首款开源人形机器人功能模型,推出 Simulation Frameworks 加速开发,采用模仿人类认知的双系统架构,System 1 负责直觉式快速动作,System 2 基于视觉语言模型进行环境理解与任务规划。通过人类演示及 Omniverse 生成的合成数据训练,具备通用任务泛化、多步骤规划等能力。此外,还推出 Simulation Frameworks 加速人形机器人的开发。(3)Newton 物理引擎是 NVIDIA 与 Google DeepMind、Disney Research 合作开发,通过 NVIDIA Warp 实现 GPU 加速,支持复杂仿真、可微物理等,兼容主流框架,可大幅提升机器人仿真的速度与精度,能将机器人学习速度提升70倍。英伟达在GTC大会展示了搭载 GR00T N1 通用模型的仿人机器人 Blue,其采用双足轮式混合驱动,能灵活避障、上下楼梯,还能用机械臂完成递送咖啡、模拟太空舱维修等复杂动作,支持多模态交互。此外,英伟达与Boston Dynamics等企业合作推动机器人在汽车、医疗等行业的应用。
图十四:英伟达开源人形机器人模型Isaac GR00T N1
资料来源:英伟达,中国银河证券研究院
二,电源、液冷新品持续升级
(一)AI电源800V HVDC大势所趋,SST为长期解决方案
随着单机柜功率密度的提升,随着英伟达GPU芯片快速发展,芯片运行功率也从H100的700W提升到GB200功率的2700W,配套电源功率也随之从3KW提升至5.5KW,机架功率从19KW提升至33KW。未来配套电源产品PSU功率有望向27.5KW演进、单机架功率有望超55kW、末端电压等级提升及全直流系统演进,电压等级有望从50V攀升至800V。
智算中心AIDC迈向GW级、超高效及高密化演进
下一代数据中心有望从MW级走向GW级,电源向高压直流演进。AIDC智算中心有望从MW级走向GW级,AIDC面临诸多其他挑战,例如空间有限、AC配电损失大、功率因素减少、交流配电相位不平衡、损耗大等等。当前,AC 400V不间断电源(UPS)和DC240V高压直流(HVDC) 是当前供电系统常见的2种方案,未来AIDC供配电设计架构有望迎来颠覆性的变革,供电系统优化的关注点将转向更高电压等级。此外,对于高密度、高效率的智算中心而言,光缆已经占用过多机柜空间,更高电压的应用可以减少电源线占用的空间,同时考虑到未来智算中心中直流设备(光伏、储能、电池、IT服务器、直流充电桩、直流照明和空调设备等)的比重将越来越大,与其兼容的全直流供电架构也有助于数据中心及周边新能源、储能的广泛接入,并支持负载侧的智能化调控。针对面临的挑战,台达就AIDC电源短期、中期以及长期解决方案。短期解决方案即配置侧挂电源,中期方案即采用800V 高压直流HVDC供电过渡,而长期来看,GW级数据中心电源需配置SST固态变压器。不同方案下,电源及配用电设备也随之有所增减。
图十五:短期解决方案侧挂电源示意图
资料来源:Delta,中国银河证券研究院
HVDC过渡方案,电网的中压交流电(10kV/13.8kV/20kV/34.5kV )经变压器转换为 400V 交流电进行分配,传统400V交流供电逐步向高压直流供电转换。
当下(Today):400V 交流电进入交流电源供应单元(AC PSU shelf),功率 72kW,转换为 50V 直流电通过机架母线(Rack busbar)传输,再经多次转换(50V 到 12V,12V 到更低电压)供服务器(Server)及其 GPU 使用。
下一代(Next Gen - 50V Server):柜外新增 HVDC 侧挂电源(HVDC side - rack),功率大于 250kW,输出 800V 直流电。而后800V 直流电经IT rack转换为 50V 直流电后,后续柜内降压,实现50V到 12V、12V 到更低电压转换,为服务器及其 GPU 供电。新增IT Rack,带来800V直流到50V直流的power shelf增量;新增PDU,PDU分为输入AC-PDU和输出DC-PDU两个模块。
下一代(Next gen - 800V “native” Server):HVDC 服务器直接接收 800V 直流电,经转换为中间电压(IBV),再转换为更低电压供 GPU 使用。
图十六:中期解决方案HVDC过渡方案供电示意图
资料来源:Delta,中国银河证券研究院
未来AIDC走向GW级,SST是AIDC电源长期解决方案。数据中心基础设施的电力供应架构依旧可以大概分为4级,首先是通过固态变压器(SST)将交流电转换为 800V 直流电,而后800V 直流电通过直流—直流电源供应单元(DC/DC PSU)进一步转换先降至 50V 直流电,再降至 12V 直流电,最后经过转换为 0.8V 直流电,为图形处理器(GPU)供电。使用SST也可以接入多种可再生能源,包括储能设备、燃料电池、太阳能和风能。图十七:长期解决方案SST示意图
(二)液冷大势所趋,重点关注冷链系统化、全液冷以及制冷剂创新
智算中心呈现加速高密化,全液冷模式大势所趋。风液混合是目前解决高功耗芯片和机柜制冷的主要手段。但智算中心的单机柜功耗已经有大幅提升,单机柜从20~30KW发展到单机柜70~132kW,以及未来可能达到的200kW超高功率密度。目前,房间级风冷空调远端送风型式的散热能力上限为单机柜25kW,对于单机柜功耗在25~80kW的高密度散热需求,可采用列间空调、背板式风冷、薄板风墙等近端送风或冷板液冷技术。单机柜功耗在80kW以上时,风冷场景可采用冷冻水背板形式,但需增加背板门宽度和高度尺寸;采用液冷是大势所趋,但选择液冷技术方案时,10-30%热量仍然需要风冷进行散热,因此风液混合将成为大多数高密设计的标准。
图十八:湿冷技术演进示意图
资料来源:维谛,中国银河证券研究院
液冷系统化、全液冷模式以及制冷剂创新成重点关注。未来智算中心制冷系统架构有望遵循从芯片(服务器)侧—机柜侧—末端空调侧—冷源侧的整条冷链系统化解决方案。用户关注技术可靠性、运行能效、初投资、出柜率、占地空间、噪声程度、柔性调节以及对建筑条件要求等方面,不同制冷技术仍将在适合应用场景保持发展。液冷方式上可能采用全液冷的方式,包括全冷板,全浸没,或者冷板+浸没的方式。液冷新型制冷剂成本居高不下,液冷新型制冷剂的革新将是液冷技术革新的主要方向之一,比如用普通水作为液冷制冷剂的解决方案。
图十九:制冷技术应用评估
(三)台资及大陆厂商新品百花齐放
本次GTC大会上,台达、维谛、麦格米特等厂商纷纷就AI电源以及液冷产品提出系列解决方案。台达、维谛产品线全面,产品涵盖供配电设备、冷却、数字化管理、生命周期服务,贯穿设计、制造、安装和测试环节。麦格米特从 Power Shelf 向 Power Rack拓展,突破AI 服务器电源边界,向电源整体解决方案提供商演进
台达发布新品Power Capacitance Shelf功率电容架、新型800V HVDC 服务器电源、1.5MW 液-液冷却剂分配单元(CDU)、核壳液冷母线newly-launched Core Shell Liquid Cooling Busbars 、高密度功率电感(双电感 / 四电感)High Density Power Chokes (dual/quad) 等。其中PCS创新配置LIC超级电容,为AIDC提供削峰及备电。冷却方案上,台达提供1.5MW L2L液-液CDU(已获批进入英伟达特权列表 RVL 和 AVL,用于多个单机柜容量超 100 千瓦的高密度机架热管理)、冷板回路、4RUL2L液-液机架内CDU、6RU机架内CDU(冷却能力达200kW)、尖端风冷(3D均热板、服务器风扇、新型400-800Vdc HVDC机架风扇)等多种方式。
维谛发布360AI预制解决方案360Al pre-engineered solutions,功率等级覆盖400-1400kW,最多缩短 50% 部署时间。冷却方式上维谛提供芯片级液冷,可组合空气和液冷拓扑结构及不同散热方法,可组合空气和液冷拓扑结构及不同散热方法,如液-气(L2A)、液 —液(L2L)、液-制冷剂(L2R),具体到产品上分别为 1L88R(芯片液冷 + 空气散热)、1L100R、4XL400、12XL1200(芯片液冷+水/乙二醇散热且部分结合后门热交换器)、4L400R、4X160R(芯片液冷或风冷结合制冷剂);5L500、14L1400(芯片液冷+水/乙二醇散热)。
麦格米特发布了HVDC 800 VDC侧挂电源,涵盖服务器电源、配电单元PDU 、备用电源BBU、超级电容SuperCap、微型断路器MCB、汇流母线Busbar、微型熔断器Fuse等。
图二十:功率电容架PCS不同材料比较
资料来源:Delta,中国银河证券研究院
图二一:台达27.5kW HVDC PSU示意图
资料来源:Delta,中国银河证券研究院
图二十二:维谛14L1400芯片级液冷产品示意图
资料来源:维谛,中国银河证券研究院
图二十三:麦格米特BBU产品示意图
资料来源:麦格米特,中国银河证券研究院
五、风险提示
1、AI等新技术导入进展不及预期无法获得效率、成本等方面的优势提升产业升级放缓的风险;
2、算力需求不及预期导致AI应用受限导致AIDC需求下滑的风险;
3、AI产业链上下游短期波动导致AI产品需求下滑的风险;
4、AI基础理论发展停滞模型能力发展缓慢导致应用发展实际不及预期的风险;
5、海外政局动荡、海外贸易环境恶化直接限制AI以及电新行业发展带来的政策风险。
如需获取报告全文,请联系您的客户经理,谢谢!
本文摘自:中国银河证券2025年3月23日发布的研究报告《【银河电新】英伟达GTC大会跟踪:算力需求旺盛,供电、液冷及CPO持续升级》
分析师:曾韬、黄林
评级标准:
评级标准为报告发布日后的6到12个月行业指数(或公司股价)相对市场表现,其中:A股市场以沪深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准,北交所市场以北证50指数为基准,香港市场以恒生指数为基准。
行业评级
推荐:相对基准指数涨幅10%以上。
中性:相对基准指数涨幅在-5%~10%之间。
回避:相对基准指数跌幅5%以上。
公司评级
推荐:相对基准指数涨幅20%以上。
谨慎推荐:相对基准指数涨幅在5%~20%之间。
中性:相对基准指数涨幅在-5%~5%之间。
回避:相对基准指数跌幅5%以上。
法律申明:
本公众订阅号为中国银河证券股份有限公司(以下简称“银河证券”)研究院依法设立、运营的研究官方订阅号(“中国银河证券研究”“中国银河宏观”“中国银河策略”“中国银河总量”“中国银河科技”“中国银河先进制造”“中国银河消费”“中国银河能源周期”“中国银河证券新发展研究院”)。其他机构或个人在微信平台以中国银河证券股份有限公司研究院名义注册的,或含有“银河研究”,或含有与银河研究品牌名称等相关信息的其他订阅号均不是银河研究官方订阅号。
本订阅号不是银河证券研究报告的发布平台,本订阅号所载内容均来自于银河证券研究院已正式发布的研究报告,本订阅号所摘录的研究报告内容经相关流程及微信信息发布审核等环节后在本订阅号内转载,本订阅号不承诺在第一时间转载相关内容,如需了解详细、完整的证券研究信息,请参见银河证券研究院发布的完整报告,任何研究观点以银河证券发布的完整报告为准。
本订阅号旨在交流证券研究经验。本订阅号所载的全部内容只提供给订阅人做参考之用,订阅人须自行确认自己具备理解证券研究报告的专业能力,保持自身的独立判断,不应认为本订阅号的内容可以取代自己的独立判断。在任何情况下本订阅号并不构成对订阅人的投资建议,并非作为买卖、认购证券或其它金融工具的邀请或保证,银河证券不对任何人因使用本订阅号发布的任何内容所产生的任何直接或间接损失或与此有关的其他损失承担任何责任,订阅号所提及的任何证券均可能含有重大的风险,订阅人需自行承担依据订阅号发布的任何内容进行投资决策可能产生的一切风险。
本订阅号所载内容仅代表银河证券研究院在相关证券研究报告发布当日的判断,相关的分析结果及预测结论,会根据银河证券研究院后续发布的证券研究报告,在不发出预先通知的情况下做出更改,敬请订阅者密切关注后续研究报告的最新相关结论。
本订阅号所转发的研究报告,均只代表银河证券研究院的观点。本订阅号不保证银河证券其他业务部门或附属机构给出与本微信公众号所发布研报结论不同甚至相反的投资意见,敬请订阅者留意。
《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过微信订阅号发布的本图文消息仅面向银河证券客户中的机构专业投资者,请勿对本图文消息进行任何形式的转发。若您并非银河证券客户中的机构专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。
本订阅号所载内容的版权归银河证券所有,银河证券对本订阅号保留一切法律权利。订阅人对本订阅号发布的所有内容(包括文字、影像等)的复制、转载,均需注明银河研究的出处,且不得对本订阅号所在内容进行任何有悖原意的引用、删节和修改。
投资有风险,入市请谨慎。