算力租赁行业调研
(来源:纪要头等座)
1、算力市场供需与价格现状
·前期算力市场运行特征:2026年春节前国内算力市场需求主体以B端为主,涵盖大模型客户、互联网厂商、政府类客户,整体表现不温不火。核心原因是大模型公司完成训练后若资金流断裂,对应项目易停滞;同时受英伟达高端显卡制裁影响,国内算力供给端持续面临高端卡紧缺约束。
·春节后算力价格涨幅:2026年春节后,随着龙芯、智能体应用爆火打通C端算力稳定收入渠道,国内算力市场需求升温,高端卡、低端卡、推理卡市场价整体上涨30%左右,景气度较此前明显提升。
·主流算力卡价格水平:当前国内算力卡现货及租赁市场均处于供不应求状态,包括A800、A1100、A1200、5090在内的中低端及终端算力卡普遍一卡难求,具体价格及溢价情况如下:
a. 现货采购价格方面:超威B300系列不同配置现货价格差异显著,2T版现货价为640-660万元,3T版现货价约680万元,4T版现货价达700万元;H200采购价涨幅明显,2025年9月内存涨价前,不同品牌H200采购价约为210-230万元,当前超威品牌H200采购价已涨至350万元;B300期货价格持续上行,2025年10-11月B300刚推出时,满配4T版期货价约为450-460万元,当前原厂期货价已涨至520万元,现货价较原厂期货溢价约200万元,服务器从期货到现货的整体溢价水平达30%-40%。
b. 租赁价格方面:算力租赁价格与采购价格走势高度绑定,随采购端价格上涨同步抬升,当前主流机型均难寻一年期租赁资源:H100年租价格为6.7-6.8万元/台,春节前该机型租赁价约为5万元/台,涨幅明显;H200年租价格达8万元/台,春节前仅为6万元出头;H800作为主流机型之一,年租价格约为6.3-6.4万元/台;H20(141G配置)年租价格约为4万元左右。
·算力租赁规则与价格驱动:当前主流高端算力卡租赁以八卡整机为标的,最低签约周期为1年,签约时长越长价格越低:1年期合约价格相对最高,3年期租期价格略低,5年闭口租期价格最低。价格变动方面,当前算力市场仍处于资源紧缺、整机价格上升通道,周度价格不会出现大幅波动,但整体水涨船高,下游算力应用落地、Token售卖等需求均在持续争抢算力资源,客户下单时间越晚,面临的市场溢价水平越高,现阶段算力资源争抢的核心目标为拿到可用显卡现货,而非议价。
2、H200放开政策的市场影响
·H200放开政策进展:当前国内高端算力芯片管制呈现分化态势,B100等更高端芯片仍对国内禁售,H200管制政策出现松动传闻。网传10家国内头部企业(包含浪潮、联想、字节、抖音、京东、阿里等)已获得H200相关配额。目前H200放开政策仅在官方会议层面表面达成共识,尚未实质落地,相关事项仍在博弈交换中,若确定放开,政策传导至市场端预计至少需要3-4个月。
·H200放开对价格的影响:若H200能够实质放开,国内算力相关上下游租赁价格将回落,回落幅度预计为10%-15%,随后进入稳定区间;价格走势上短期先保持持平,随后逐步下行。当前算力相关产品价格高企核心原因是芯片供给不足,若H200放开政策未落地,国内算力芯片紧缺态势将进一步加剧。
·H200供给增量的影响:网传本次H200放开的总配额为75万片,平均每家获得配额的头部企业约可分到7.5万片,其中联想凭借生产能力获得H200售卖权。按单台H200服务器搭载8片芯片测算,75万片对应不到10万台H200服务器,该供给规模约占国内当前算力服务器存量的30%-40%,会对国内存量市场造成一定冲击。
内存、硬盘等配套零部件价格持续上涨,此前内存占单台整机成本的比例仅为10%左右,当前已升至30%-40%,直接推高整机生产成本。去年七八月份单台H200服务器的价格为220-230万元,当前叠加内存涨价等因素,单台H200服务器的成本已达270-280万元,配套成本的上涨大幅抵消了芯片供给增加带来的价格回落空间,因此即便H200放开,整机价格也不会出现大幅下降,无法回到此前的低价水平。
3、算力需求增长驱动因素
·国内需求增长逻辑:当前C端智能体、Token调用相关应用正逐步渗透,过往用户普遍没有使用龙芯、豆包等相关产品的习惯,随着C端市场持续成熟,用户使用习惯正逐步养成,渗透路径类似此前微信、抖音的普及过程。除C端外,B端市场需求空间同样广阔,未来无论是专业人员的生产工作场景,还是普通用户的日常生活场景,智能体调用、Token消耗的需求规模都将持续扩张。若后续算力需求增速超过供给增速,算力相关产品价格不会下降反而存在上涨动力,短期具备刚性支撑,长期仍有上行空间。
·海外需求增长逻辑:海外需求方面,中国算力及大模型服务具备显著价格优势:国内电价较低、运维成本可控,叠加Kimi、MiniMax等开源大模型快速发展,Token价格仅为ChatGPT等欧美同类产品的1/10,性价比突出。从需求结构来看,除美国大厂、科研机构等主体的高端大模型训练、专业度要求较高的应用场景会使用欧美本土大模型外,全球70%-80%的中低端算力需求,包括海外初创企业、独立开发者等群体的应用需求,均优先选择中国算力及大模型服务,全球中低端算力、大模型应用相关需求正持续向中国转移,国内算力服务器作为算力调度、Token生成的核心标准化基础设施,需求支撑强劲。针对国内大模型算力的部署位置争议,有观点认为国内大模型厂商在海外布局有云服务资源,美国用户使用国内大模型时算力可直接部署在海外云,无需将需求回传国内计算;但也有观点指出,国内大模型算力主要部署在国内,最多仅在东南亚地区少量部署,且受数据安全、数据出海相关规则约束,敏感数据相关计算不会轻易放在海外,当前中国Token产品正被全球开发者广泛使用。
4、算力需求结构与使用情况
·算力需求核心场景:当前算力消耗核心应用场景主要包括四类:a. 短视频生成,相关工具分高低端配置,月费从几十元到数千元不等,已渗透至C端,个人、小企业及家庭均可使用;b. 龙芯等C端智能体应用;c. 工业、医疗、金融等行业的智能体应用,可替代传统人工服务模式;d. 互联网大厂提供的智算公有云服务,头部厂商整合算力服务器,叠加大模型与云服务能力后,向政府、工业、大模型公司等全行业客户分发。
·算力需求主体结构:国内高端算力卡的持有主体呈现集中化特征,核心分为三类:a. 互联网大厂(阿里、腾讯、字节、华为等),持有60%-65%的高端算力卡,是最核心采购方,当前H800、A800、H100、H200等主流高端卡基本被这类主体采购,相关客户还包括润泽、协创等云服务相关企业;b. 政府、金融、军方等信创项目方,持有20%左右的高端算力卡,这类主体对算力采购的价格敏感度较低;c. 初创大模型企业等零散客户,持有15%左右的高端算力卡,典型客户包括月之暗面、杰瑞星辰、MiniMax、深势科技等。
·训练推理算力占比变化:随着大模型从训练阶段转向行业落地应用阶段,国内推理与训练的算力占比持续向推理侧倾斜。2025年国内推理算力规模为训练算力的1.5-2倍,当时已有Deepfake、V三、短视频生成等C端推理应用落地,字节等平台的视频内容生成需求均属于推理算力消耗,不占用训练算力资源。2026年推理算力规模已达训练算力的3-4倍,且以中低端算力需(更多实时纪要加微信:jiyao19)求为主,核心驱动因素是大模型训练完成后逐步在各垂直行业成熟落地,可用推理类产品持续丰富,龙芯等C端智能体、行业智能体、短视频生成等应用用户规模快速扩大。后续随着大模型在更多垂直领域渗透,推理算力占比仍将持续提升,仅特定领域的模型精细化打磨会产生新增训练算力需求,整体算力需求结构长期向推理侧倾斜。
·算力卡使用率情况:当前国内英伟达体系全品类算力卡的整体使用率达90%-95%,基本无闲置产能,不存在空闲未投入使用的英伟达算力资源。国产算力卡使用率极低,核心原因有两点:a. 硬件成本更高,同等算力下,华为昇腾910、海光、阿特拉斯等国产算力服务器的硬件价格为英伟达同规格产品的1.5-2倍;b. 生态适配成本高,英伟达基于库大生态可实现任务即买即部署,国产算力则需要半年左右的适配周期,仅应用于对成本不敏感的信创类项目,实际运行使用率较低。
5、国产算力卡发展现状与差距
·国产算力卡商用表现:当前国产算力卡的商用落地存在多维度短板,无问芯穹、并行科技等头部算力聚合分发平台均表示,其异构算力平台的国产适配仅为营销噱头,实际商用使用率极低。一是适配层面短板突出,国产卡的软件生态不完善,若要适配现有业务需付出约半年的编程改造成本,综合使用体验较差。二是性价比与英伟达产品差距显著,部分国产厂商宣称其产品性能可达英伟达H100的80%-90%,但实际测试中性能不足英伟达同级别产品的60%,相同电力消耗下的算力产出效率远低于英伟达产品,综合测算全生命周期成本远高于英伟达方案。因此当前算力相关企业的商用需求中80%-90%仍优先选用英伟达卡,性价比优势突出。三是应用场景较为局限,目前国产卡仅能落地于对成本敏感度极低、有强制信创要求的项目,例如军队、金融等领域的指定信创项目,完全遵循市场化商业规则的应用场景中国产卡基本不具备竞争力,使用率极低。
·国产卡技术差距趋势:当前国产算力卡与海外头部厂商的技术差距并未收窄,反而呈持续拉大的趋势。英伟达的算力产品迭代速度极快,从B200到B300的产品迭代周期仅约半年,后续还将推出入品系统等新一代产品,技术代差优势持续扩大。差距持续拉大的核心原因在于底层硬件制造环节的短板,国内当前仅能依靠采购的老旧光刻机勉强实现7纳米制程生产,而海外主流芯片制程已达0.3纳米,即将推进至0.2纳米,国内芯片制程落后海外1.5代以上。后续随着海外厂商逐步向2纳米、1纳米制程演进,国内算力卡在功耗、集成度、训练速度等方面的劣势将进一步扩大。尽管国内大模型可通过混合专家架构降低训练成本,但硬件制造的底层短板短期内难以突破,技术追赶仍面临较大阻碍。
6、算力租赁业务盈利情况
·算力租赁盈利水平变化:受英伟达中高端显卡禁运影响,当前硬件采购、内存、硬盘等成本均出现溢价。算力租赁价格涨幅可完全覆盖上述成本增幅,盈利水平明显提升,租赁业务利润率从此前的10%-20%提升至30%左右。以B300产品为例,此前售价约12万,当前报价16-19万仍被市场争抢。当前算力现货供给极度紧张,有客户求购64台B300现货,耗时一个半月仍未完成采购,需求支撑力度较强。
·算力投资回本与溢价:当前算力投资常规回本测算周期为3-5年,若按3年周期测算需制定高于市场平均的定价,在国内缺乏竞争力,因此行业普遍采用5年回本的测算逻辑。旧算力设备溢价显著,上市近3年的H100当时进货价为210万,当前旧设备售价仍可达210万,相当于3年租赁所得全部为净收益,几乎无折旧成本。其余旧机型同样供给紧张,A100、A800、4090等可同时用于推理、训练场景的整机供不应求,即便3-5台的小额采购需求也难寻现货。
7、算力行业发展前景展望
·算力行业长期发展趋势:算力行业当前仍处于发展初期,市场方兴未艾,属于蓝海赛道,目前已成为产业热点,创业需求旺盛,涵盖贸易、租赁分发、AI创业等多元方向。从行业发展逻辑来看,训练与推理具备协同发展关系:训练侧发展将带动推理侧成熟,而推理应用日益专业化后,也将对训练侧提出更高要求,催生新一轮训练需求,带动医疗、生物、工业等领域专用大模型落地,例如中科院旗下的紫东太初便是面向工业、医疗领域的大模型产品。当前算力领域热门创业方向为Token聚合分发平台,其运营模式为:先采购高低端硬件控制成本,再对接机房部署服务器,最后与开源大模型商谈授权、接入API,向境内外算力使用者分发算力。盈利层面,平台方利润率约为2%-5%,下游Token售卖代理商利润率可达20%-30%,销往欧美市场盈利可实现翻番,国内Token价格仅为欧美市场的1/5到1/10,成本优势显著。
·短期算力价格走势判断:当前算力领域需求端无压力,供给端仍处于持续短缺状态,支撑价格具备较强韧性,后续算力价格仍将上涨。短期算力价格的核心影响因素为H20的实质放开进度,相关政策落地尚需2-3个月过渡期:一方面政策落地需要对等的业务交换条件,仅公开场合的承诺不代表实质放开;另一方面相关产品库存不足,仍需生产周期,若H20未实现实质放开,算力紧缺情况将持续加剧。
Q&A
Q: 国内算力租赁市场当前的整体状况、价格变动趋势及供需情况如何?
A: 自今年春节后,国内算力租赁市场整体价格上涨约30%,高端卡及中低端卡均呈现一卡难求局面。当前H100月租价约6.7–6.8万元,H200约8万元,H800约6.3–6.4万元,H20约4万元。高端卡现货紧缺,超微B300四T配置现货价达680–700万元,较期货溢价显著。市场以年租为主流合约模式,资源持续紧张推动价格上行。
Q: 此前提及的春节后价格上涨30%具体指算力服务器采购价格还是租赁价格?
A: 该涨幅主要指算力租赁价格。租赁价格随采购成本上升同步传导:H100服务器租赁价由年前5万元/月升至当前6.7–6.8万元/月;H200由6万余元升至8万元/月。服务器采购端亦显著上涨,如H200采购价由去年210–230万元涨至当前约350万元,B300期货价由450–460万元升至520万元,现货溢价达200万元。
Q: H20型号服务器当前的租赁价格水平是多少?
A: H20当前租赁价格约为4万元/月左右。
Q: 算力租赁价格在周度或月度维度上是否存在明显波动?合约期限如何影响定价?
A: 市场无周租模式,主流为年租及以上。合约期限影响单价:一年期价格较高,三年期略低,五年闭口合约可进一步下探至约6万元/月。当前资源持续紧缺,晚签约一周或一月,因供需失衡加剧,价格呈水涨船高态势。
Q: 展望未来,H100等高端卡租赁价格是否仍有上涨空间?
A: 价格预计将继续上涨。当前市场处于资源紧缺通道,用户需求积压严重,仅能获取零星小集群。C端应用爆发带动Token调用量激增,叠加全球开发者因中国Token成本优势转向国内算力,需求增速显著快于供给,支撑价格上行。
Q: 若美国放开H200对华出口,对国内算力市场供需及价格将产生何种影响?
A: 若H200实际放开进口,预计租赁价格短期持平后回落10%–15%,但难回历史低位。75万片约折合9–10万台服务器,占国内现有高端算力存量约30%–40%,将缓解紧缺但无法逆转趋势。因内存、硬盘等部件成本已大幅上升,整机成本基础抬升,叠加需求持续高增长,价格下行空间有限。
Q: 当前推理与训练场景的算力消耗比例是多少?与去年相比有何变化趋势?
A: 当前推理算力需求已达训练的3–4倍,且比例持续扩大。去年推理与训练比例约为1.5:1至2:1,今年因大模型训练完成后向垂直行业推理应用快速渗透,叠加C端智能体普及,推理需求呈指数级增长。
Q: 从算力消耗结构看,互联网大厂、政府/金融机构、初创企业等主体的占比分布如何?
A: 互联网大厂占高端算力消耗约60%以上,为最大聚合分发平台;地方政府、金融机构及信创项目占20%–30%;初创企业及小型数据中心占约15%。需注意,国产算力在商业场景中使用率极低,主要限于政策驱动的信创项目。
Q: 当前英伟达系算力卡的实际使用率水平如何?国产算力卡的使用情况与差距何在?
A: 英伟达全系列算力卡国内使用率维持在90%–95%,基本无闲置资源。国产卡在商业场景中使用率极低,主因有三:硬件成本高、软件生态薄弱、实际性能差距大,且存在掉卡率高、开发适配周期长等问题。仅在不计成本的信创项目中被动采用。
Q: 推理场景中,短视频生成、C端智能体、行业应用、编程等细分领域的增速与占比情况如何?
A: C端智能体增速最快,使用量呈指数级增长,类比微信、抖音早期普及路径;短视频生成、行业智能体及编程辅助为重要增量场景。整体推理需求由大模型训练完成后的垂直落地驱动,应用广度与深度持续扩展。
Q: 公司是否提供算力设备交付后的运维及运营服务?
A: 公司提供全链条服务,包括从英伟达代工厂下单、物流清关、压测上架、交付实施至后续运维运营。曾为阿里云等客户派驻20人团队在东莞机房进行长期维护,但具体后台流量及客户使用数据因合规要求无法获取。
Q: 当前算力租赁业务的盈利水平与回本周期如何?价格上涨是否有效覆盖硬件成本上升?
A: 当前租赁业务毛利率显著提升,利润率约30%。以B300为例,五年期租赁报价达16–19万元/月。价格上涨(更多实时纪要加微信:jiyao19)有效覆盖硬件采购溢价,旧设备残值仍接近原采购价,折旧压力小。新入场者回本周期普遍按5年测算,3年回本需高价策略,市场接受度低。
Q: 以H100为例,租赁价格降至多少将接近盈亏平衡点?
A: H100租赁价格若降至约4万元/月将接近盈亏平衡。当前设备已使用近三年,二手残值仍维持在210万元左右,历史折旧成本较低,支撑当前高租金下的盈利空间。
Q: 公司是否有业务扩张计划,特别是在Token分发领域的布局?
A: 公司计划在深圳设立贸易公司及Token分发平台,聚焦Token聚合与分发生意。模式为采购高低端硬件、部署机房、接入开源大模型API,向全球用户提供Token服务,平台抽成约2%–5%。该业务受益于中国Token成本优势,已成行业热点方向。
Q: H20放开进口的实际进展与时间预期如何?对价格走势的综合判断是什么?
A: H20放开仍处政策博弈阶段,虽有高层表态,但需对等条件交换,预计落地需2–3个月过渡期,且库存与产能限制短期供给增量有限。综合判断:若未放开,价格将持续上涨;若放开,价格短期企稳后小幅回落10%–15%,但因成本基础抬升及需求高增长,长期仍呈上行趋势。
免责申明:以上内容不构成投资建议,以此作为投资依据出现任何损失不承担任何责任。