算力租赁行业调研

市场资讯 05.20 18:39

（来源：纪要头等座）

1、算力市场供需与价格现状

·前期算力市场运行特征：2026年春节前国内算力市场需求主体以B端为主，涵盖大模型客户、互联网厂商、政府类客户，整体表现不温不火。核心原因是大模型公司完成训练后若资金流断裂，对应项目易停滞；同时受英伟达高端显卡制裁影响，国内算力供给端持续面临高端卡紧缺约束。

·春节后算力价格涨幅：2026年春节后，随着龙芯、智能体应用爆火打通C端算力稳定收入渠道，国内算力市场需求升温，高端卡、低端卡、推理卡市场价整体上涨30%左右，景气度较此前明显提升。

·主流算力卡价格水平：当前国内算力卡现货及租赁市场均处于供不应求状态，包括A800、A1100、A1200、5090在内的中低端及终端算力卡普遍一卡难求，具体价格及溢价情况如下：

a. 现货采购价格方面：超威B300系列不同配置现货价格差异显著，2T版现货价为640-660万元，3T版现货价约680万元，4T版现货价达700万元；H200采购价涨幅明显，2025年9月内存涨价前，不同品牌H200采购价约为210-230万元，当前超威品牌H200采购价已涨至350万元；B300期货价格持续上行，2025年10-11月B300刚推出时，满配4T版期货价约为450-460万元，当前原厂期货价已涨至520万元，现货价较原厂期货溢价约200万元，服务器从期货到现货的整体溢价水平达30%-40%。

b. 租赁价格方面：算力租赁价格与采购价格走势高度绑定，随采购端价格上涨同步抬升，当前主流机型均难寻一年期租赁资源：H100年租价格为6.7-6.8万元/台，春节前该机型租赁价约为5万元/台，涨幅明显；H200年租价格达8万元/台，春节前仅为6万元出头；H800作为主流机型之一，年租价格约为6.3-6.4万元/台；H20（141G配置）年租价格约为4万元左右。

·算力租赁规则与价格驱动：当前主流高端算力卡租赁以八卡整机为标的，最低签约周期为1年，签约时长越长价格越低：1年期合约价格相对最高，3年期租期价格略低，5年闭口租期价格最低。价格变动方面，当前算力市场仍处于资源紧缺、整机价格上升通道，周度价格不会出现大幅波动，但整体水涨船高，下游算力应用落地、Token售卖等需求均在持续争抢算力资源，客户下单时间越晚，面临的市场溢价水平越高，现阶段算力资源争抢的核心目标为拿到可用显卡现货，而非议价。

2、H200放开政策的市场影响

·H200放开政策进展：当前国内高端算力芯片管制呈现分化态势，B100等更高端芯片仍对国内禁售，H200管制政策出现松动传闻。网传10家国内头部企业（包含浪潮、联想、字节、抖音、京东、阿里等）已获得H200相关配额。目前H200放开政策仅在官方会议层面表面达成共识，尚未实质落地，相关事项仍在博弈交换中，若确定放开，政策传导至市场端预计至少需要3-4个月。

·H200放开对价格的影响：若H200能够实质放开，国内算力相关上下游租赁价格将回落，回落幅度预计为10%-15%，随后进入稳定区间；价格走势上短期先保持持平，随后逐步下行。当前算力相关产品价格高企核心原因是芯片供给不足，若H200放开政策未落地，国内算力芯片紧缺态势将进一步加剧。

·H200供给增量的影响：网传本次H200放开的总配额为75万片，平均每家获得配额的头部企业约可分到7.5万片，其中联想凭借生产能力获得H200售卖权。按单台H200服务器搭载8片芯片测算，75万片对应不到10万台H200服务器，该供给规模约占国内当前算力服务器存量的30%-40%，会对国内存量市场造成一定冲击。

内存、硬盘等配套零部件价格持续上涨，此前内存占单台整机成本的比例仅为10%左右，当前已升至30%-40%，直接推高整机生产成本。去年七八月份单台H200服务器的价格为220-230万元，当前叠加内存涨价等因素，单台H200服务器的成本已达270-280万元，配套成本的上涨大幅抵消了芯片供给增加带来的价格回落空间，因此即便H200放开，整机价格也不会出现大幅下降，无法回到此前的低价水平。

3、算力需求增长驱动因素

·国内需求增长逻辑：当前C端智能体、Token调用相关应用正逐步渗透，过往用户普遍没有使用龙芯、豆包等相关产品的习惯，随着C端市场持续成熟，用户使用习惯正逐步养成，渗透路径类似此前微信、抖音的普及过程。除C端外，B端市场需求空间同样广阔，未来无论是专业人员的生产工作场景，还是普通用户的日常生活场景，智能体调用、Token消耗的需求规模都将持续扩张。若后续算力需求增速超过供给增速，算力相关产品价格不会下降反而存在上涨动力，短期具备刚性支撑，长期仍有上行空间。

·海外需求增长逻辑：海外需求方面，中国算力及大模型服务具备显著价格优势：国内电价较低、运维成本可控，叠加Kimi、MiniMax等开源大模型快速发展，Token价格仅为ChatGPT等欧美同类产品的1/10，性价比突出。从需求结构来看，除美国大厂、科研机构等主体的高端大模型训练、专业度要求较高的应用场景会使用欧美本土大模型外，全球70%-80%的中低端算力需求，包括海外初创企业、独立开发者等群体的应用需求，均优先选择中国算力及大模型服务，全球中低端算力、大模型应用相关需求正持续向中国转移，国内算力服务器作为算力调度、Token生成的核心标准化基础设施，需求支撑强劲。针对国内大模型算力的部署位置争议，有观点认为国内大模型厂商在海外布局有云服务资源，美国用户使用国内大模型时算力可直接部署在海外云，无需将需求回传国内计算；但也有观点指出，国内大模型算力主要部署在国内，最多仅在东南亚地区少量部署，且受数据安全、数据出海相关规则约束，敏感数据相关计算不会轻易放在海外，当前中国Token产品正被全球开发者广泛使用。

4、算力需求结构与使用情况

·算力需求核心场景：当前算力消耗核心应用场景主要包括四类：a. 短视频生成，相关工具分高低端配置，月费从几十元到数千元不等，已渗透至C端，个人、小企业及家庭均可使用；b. 龙芯等C端智能体应用；c. 工业、医疗、金融等行业的智能体应用，可替代传统人工服务模式；d. 互联网大厂提供的智算公有云服务，头部厂商整合算力服务器，叠加大模型与云服务能力后，向政府、工业、大模型公司等全行业客户分发。

·算力需求主体结构：国内高端算力卡的持有主体呈现集中化特征，核心分为三类：a. 互联网大厂（阿里、腾讯、字节、华为等），持有60%-65%的高端算力卡，是最核心采购方，当前H800、A800、H100、H200等主流高端卡基本被这类主体采购，相关客户还包括润泽、协创等云服务相关企业；b. 政府、金融、军方等信创项目方，持有20%左右的高端算力卡，这类主体对算力采购的价格敏感度较低；c. 初创大模型企业等零散客户，持有15%左右的高端算力卡，典型客户包括月之暗面、杰瑞星辰、MiniMax、深势科技等。

·训练推理算力占比变化：随着大模型从训练阶段转向行业落地应用阶段，国内推理与训练的算力占比持续向推理侧倾斜。2025年国内推理算力规模为训练算力的1.5-2倍，当时已有Deepfake、V三、短视频生成等C端推理应用落地，字节等平台的视频内容生成需求均属于推理算力消耗，不占用训练算力资源。2026年推理算力规模已达训练算力的3-4倍，且以中低端算力需（更多实时纪要加微信：jiyao19）求为主，核心驱动因素是大模型训练完成后逐步在各垂直行业成熟落地，可用推理类产品持续丰富，龙芯等C端智能体、行业智能体、短视频生成等应用用户规模快速扩大。后续随着大模型在更多垂直领域渗透，推理算力占比仍将持续提升，仅特定领域的模型精细化打磨会产生新增训练算力需求，整体算力需求结构长期向推理侧倾斜。

·算力卡使用率情况：当前国内英伟达体系全品类算力卡的整体使用率达90%-95%，基本无闲置产能，不存在空闲未投入使用的英伟达算力资源。国产算力卡使用率极低，核心原因有两点：a. 硬件成本更高，同等算力下，华为昇腾910、海光、阿特拉斯等国产算力服务器的硬件价格为英伟达同规格产品的1.5-2倍；b. 生态适配成本高，英伟达基于库大生态可实现任务即买即部署，国产算力则需要半年左右的适配周期，仅应用于对成本不敏感的信创类项目，实际运行使用率较低。

5、国产算力卡发展现状与差距

·国产算力卡商用表现：当前国产算力卡的商用落地存在多维度短板，无问芯穹、并行科技等头部算力聚合分发平台均表示，其异构算力平台的国产适配仅为营销噱头，实际商用使用率极低。一是适配层面短板突出，国产卡的软件生态不完善，若要适配现有业务需付出约半年的编程改造成本，综合使用体验较差。二是性价比与英伟达产品差距显著，部分国产厂商宣称其产品性能可达英伟达H100的80%-90%，但实际测试中性能不足英伟达同级别产品的60%，相同电力消耗下的算力产出效率远低于英伟达产品，综合测算全生命周期成本远高于英伟达方案。因此当前算力相关企业的商用需求中80%-90%仍优先选用英伟达卡，性价比优势突出。三是应用场景较为局限，目前国产卡仅能落地于对成本敏感度极低、有强制信创要求的项目，例如军队、金融等领域的指定信创项目，完全遵循市场化商业规则的应用场景中国产卡基本不具备竞争力，使用率极低。

·国产卡技术差距趋势：当前国产算力卡与海外头部厂商的技术差距并未收窄，反而呈持续拉大的趋势。英伟达的算力产品迭代速度极快，从B200到B300的产品迭代周期仅约半年，后续还将推出入品系统等新一代产品，技术代差优势持续扩大。差距持续拉大的核心原因在于底层硬件制造环节的短板，国内当前仅能依靠采购的老旧光刻机勉强实现7纳米制程生产，而海外主流芯片制程已达0.3纳米，即将推进至0.2纳米，国内芯片制程落后海外1.5代以上。后续随着海外厂商逐步向2纳米、1纳米制程演进，国内算力卡在功耗、集成度、训练速度等方面的劣势将进一步扩大。尽管国内大模型可通过混合专家架构降低训练成本，但硬件制造的底层短板短期内难以突破，技术追赶仍面临较大阻碍。

6、算力租赁业务盈利情况

·算力租赁盈利水平变化：受英伟达中高端显卡禁运影响，当前硬件采购、内存、硬盘等成本均出现溢价。算力租赁价格涨幅可完全覆盖上述成本增幅，盈利水平明显提升，租赁业务利润率从此前的10%-20%提升至30%左右。以B300产品为例，此前售价约12万，当前报价16-19万仍被市场争抢。当前算力现货供给极度紧张，有客户求购64台B300现货，耗时一个半月仍未完成采购，需求支撑力度较强。

·算力投资回本与溢价：当前算力投资常规回本测算周期为3-5年，若按3年周期测算需制定高于市场平均的定价，在国内缺乏竞争力，因此行业普遍采用5年回本的测算逻辑。旧算力设备溢价显著，上市近3年的H100当时进货价为210万，当前旧设备售价仍可达210万，相当于3年租赁所得全部为净收益，几乎无折旧成本。其余旧机型同样供给紧张，A100、A800、4090等可同时用于推理、训练场景的整机供不应求，即便3-5台的小额采购需求也难寻现货。

7、算力行业发展前景展望

·算力行业长期发展趋势：算力行业当前仍处于发展初期，市场方兴未艾，属于蓝海赛道，目前已成为产业热点，创业需求旺盛，涵盖贸易、租赁分发、AI创业等多元方向。从行业发展逻辑来看，训练与推理具备协同发展关系：训练侧发展将带动推理侧成熟，而推理应用日益专业化后，也将对训练侧提出更高要求，催生新一轮训练需求，带动医疗、生物、工业等领域专用大模型落地，例如中科院旗下的紫东太初便是面向工业、医疗领域的大模型产品。当前算力领域热门创业方向为Token聚合分发平台，其运营模式为：先采购高低端硬件控制成本，再对接机房部署服务器，最后与开源大模型商谈授权、接入API，向境内外算力使用者分发算力。盈利层面，平台方利润率约为2%-5%，下游Token售卖代理商利润率可达20%-30%，销往欧美市场盈利可实现翻番，国内Token价格仅为欧美市场的1/5到1/10，成本优势显著。

·短期算力价格走势判断：当前算力领域需求端无压力，供给端仍处于持续短缺状态，支撑价格具备较强韧性，后续算力价格仍将上涨。短期算力价格的核心影响因素为H20的实质放开进度，相关政策落地尚需2-3个月过渡期：一方面政策落地需要对等的业务交换条件，仅公开场合的承诺不代表实质放开；另一方面相关产品库存不足，仍需生产周期，若H20未实现实质放开，算力紧缺情况将持续加剧。

Q&A

Q: 国内算力租赁市场当前的整体状况、价格变动趋势及供需情况如何？

A: 自今年春节后，国内算力租赁市场整体价格上涨约30%，高端卡及中低端卡均呈现一卡难求局面。当前H100月租价约6.7–6.8万元，H200约8万元，H800约6.3–6.4万元，H20约4万元。高端卡现货紧缺，超微B300四T配置现货价达680–700万元，较期货溢价显著。市场以年租为主流合约模式，资源持续紧张推动价格上行。

Q: 此前提及的春节后价格上涨30%具体指算力服务器采购价格还是租赁价格？

A: 该涨幅主要指算力租赁价格。租赁价格随采购成本上升同步传导：H100服务器租赁价由年前5万元/月升至当前6.7–6.8万元/月；H200由6万余元升至8万元/月。服务器采购端亦显著上涨，如H200采购价由去年210–230万元涨至当前约350万元，B300期货价由450–460万元升至520万元，现货溢价达200万元。

Q: H20型号服务器当前的租赁价格水平是多少？

A: H20当前租赁价格约为4万元/月左右。

Q: 算力租赁价格在周度或月度维度上是否存在明显波动？合约期限如何影响定价？

A: 市场无周租模式，主流为年租及以上。合约期限影响单价：一年期价格较高，三年期略低，五年闭口合约可进一步下探至约6万元/月。当前资源持续紧缺，晚签约一周或一月，因供需失衡加剧，价格呈水涨船高态势。

Q: 展望未来，H100等高端卡租赁价格是否仍有上涨空间？

A: 价格预计将继续上涨。当前市场处于资源紧缺通道，用户需求积压严重，仅能获取零星小集群。C端应用爆发带动Token调用量激增，叠加全球开发者因中国Token成本优势转向国内算力，需求增速显著快于供给，支撑价格上行。

Q: 若美国放开H200对华出口，对国内算力市场供需及价格将产生何种影响？

A: 若H200实际放开进口，预计租赁价格短期持平后回落10%–15%，但难回历史低位。75万片约折合9–10万台服务器，占国内现有高端算力存量约30%–40%，将缓解紧缺但无法逆转趋势。因内存、硬盘等部件成本已大幅上升，整机成本基础抬升，叠加需求持续高增长，价格下行空间有限。

Q: 当前推理与训练场景的算力消耗比例是多少？与去年相比有何变化趋势？

A: 当前推理算力需求已达训练的3–4倍，且比例持续扩大。去年推理与训练比例约为1.5:1至2:1，今年因大模型训练完成后向垂直行业推理应用快速渗透，叠加C端智能体普及，推理需求呈指数级增长。

Q: 从算力消耗结构看，互联网大厂、政府/金融机构、初创企业等主体的占比分布如何？

A: 互联网大厂占高端算力消耗约60%以上，为最大聚合分发平台；地方政府、金融机构及信创项目占20%–30%；初创企业及小型数据中心占约15%。需注意，国产算力在商业场景中使用率极低，主要限于政策驱动的信创项目。

Q: 当前英伟达系算力卡的实际使用率水平如何？国产算力卡的使用情况与差距何在？

A: 英伟达全系列算力卡国内使用率维持在90%–95%，基本无闲置资源。国产卡在商业场景中使用率极低，主因有三：硬件成本高、软件生态薄弱、实际性能差距大，且存在掉卡率高、开发适配周期长等问题。仅在不计成本的信创项目中被动采用。

Q: 推理场景中，短视频生成、C端智能体、行业应用、编程等细分领域的增速与占比情况如何？

A: C端智能体增速最快，使用量呈指数级增长，类比微信、抖音早期普及路径；短视频生成、行业智能体及编程辅助为重要增量场景。整体推理需求由大模型训练完成后的垂直落地驱动，应用广度与深度持续扩展。

Q: 公司是否提供算力设备交付后的运维及运营服务？

A: 公司提供全链条服务，包括从英伟达代工厂下单、物流清关、压测上架、交付实施至后续运维运营。曾为阿里云等客户派驻20人团队在东莞机房进行长期维护，但具体后台流量及客户使用数据因合规要求无法获取。

Q: 当前算力租赁业务的盈利水平与回本周期如何？价格上涨是否有效覆盖硬件成本上升？

A: 当前租赁业务毛利率显著提升，利润率约30%。以B300为例，五年期租赁报价达16–19万元/月。价格上涨（更多实时纪要加微信：jiyao19）有效覆盖硬件采购溢价，旧设备残值仍接近原采购价，折旧压力小。新入场者回本周期普遍按5年测算，3年回本需高价策略，市场接受度低。

Q: 以H100为例，租赁价格降至多少将接近盈亏平衡点？

A: H100租赁价格若降至约4万元/月将接近盈亏平衡。当前设备已使用近三年，二手残值仍维持在210万元左右，历史折旧成本较低，支撑当前高租金下的盈利空间。

Q: 公司是否有业务扩张计划，特别是在Token分发领域的布局？

A: 公司计划在深圳设立贸易公司及Token分发平台，聚焦Token聚合与分发生意。模式为采购高低端硬件、部署机房、接入开源大模型API，向全球用户提供Token服务，平台抽成约2%–5%。该业务受益于中国Token成本优势，已成行业热点方向。

Q: H20放开进口的实际进展与时间预期如何？对价格走势的综合判断是什么？

A: H20放开仍处政策博弈阶段，虽有高层表态，但需对等条件交换，预计落地需2–3个月过渡期，且库存与产能限制短期供给增量有限。综合判断：若未放开，价格将持续上涨；若放开，价格短期企稳后小幅回落10%–15%，但因成本基础抬升及需求高增长，长期仍呈上行趋势。

免责申明：以上内容不构成投资建议，以此作为投资依据出现任何损失不承担任何责任。