AI芯片国产五强深度解析:出货量、技术路线与商业前景
(来源:洪泰智造)
波色子|CHINA High Tech Ground 专栏
导读:根据IDC 2025年度报告,中国AI加速卡市场总出货约400万张,本土厂商出货165万张,市场份额首次突破四成达41%。2026年Q1国产AI芯片迎来集体爆发——华为昇腾950PR量产,寒武纪季度盈利10亿元,国产四小龙加速向上挤压。本文基于IDC及一季报数据,系统梳理五强的出货规模、技术路线与市场前景。
📊 核心数据速览
指标 | 2025全年 | 2026Q1动态 |
|---|---|---|
| 中国AI加速卡总出货 | 400万张 | 昇腾Q1已出货15万张910卡 |
| 国产厂商合计 | 165万张,占比41% | 多家企业营收同比增超150% |
| 英伟达份额 | 220万张,下滑至55% | 预计2026年进一步收缩 |
| 华为昇腾出货 | 81.2万张,国产第一 | 950PR量产,2026目标150-200万颗 |
| 寒武纪净利润 | 20.59亿元(全年) | Q1: 10.13亿元,同比+185% |
| 海光信息营收 | 143.77亿元(全年) | Q1: 40.34亿元,同比+68% |
| 摩尔线程营收 | 15.06亿元(全年) | Q1: 7.38亿元,同比+155%,首次盈利 |
一、国产五强全景对比:IDC 2025年度数据
根据IDC 2025年度中国云端AI加速器市场报告,中国AI加速卡市场总出货约400万张。本土厂商出货共165万张,占41%。英伟达出货约220万张,从2024年约70%下滑至55%,国产替代迎来里程碑式拐点。
厂商 | 2025出货量 | 整体市占 | 2026Q1营收 | 主力产品 | 核心场景 |
|---|---|---|---|---|---|
| 华为昇腾 | 81.2万张 | 20% | 未公开 | 昇腾910C/950PR | 智算中心、运营商、政企 |
| 阿里平头哥 | 26.5万张 | 6.6% | 未公开 | 真武810E(5nm) | 阿里云推理 |
| 寒武纪 | 11.6万张 | 3% | 28.85亿元(+160%) | 思元590 | 互联网推理、中小模型 |
| 百度昆仑芯 | 11.6万张 | 3% | 未公开 | 昆仑芯3代 | 百度云+外部客户 |
| 海光信息 | 8.3万张 | 2% | 40.34亿元(+68%) | 深算DCU K100 | 信创、超算 |
数据来源:IDC 2025年度报告、各公司2026年一季报
二、华为昇腾:断层领先的国产王者
📊 2025全年成绩
2025年出货约81.2万颗,占国产总出货近50%,稳居中国AI加速卡市场第二(仅次于英伟达)、国产第一。相比2024年的64万张,同比增长约27%。
🚀 2026年Q1关键变量
2026年3月,昇腾950PR正式发布——这是昇腾系列首款搭载自研HBM的AI芯片。FP4精度算力达1.56PFLOPS,搭载112GB自研HBM显存,Atlas 350加速卡算力达英伟达H20的2.87倍。
型号 | FP16算力 | 显存 | 互联带宽 | 状态 |
|---|---|---|---|---|
昇腾910B | ~320 TFLOPS | 64GB HBM2e | 240Gbps | 2024量产主力 |
昇腾910C | 800 TFLOPS | 128GB HBM2e | 784GB/s | 2025量产 |
昇腾950PR | FP8: 1P / FP4: 1.56P | 112GB 自研HBM | 2TB/s | 2026Q1量产 |
数据来源:华为全联接大会2025
出货目标大幅上调:从2025年约70万颗上调至150-200万颗区间。据产业链调研,2026Q1已出货约15万张910系列卡。定价标准版约5万元,HBM版约7万元。
互联网订单爆发:字节跳动(150套超节点)、阿里和美团(各50套)等互联网大厂首次大规模转向国产芯片采购,单套超节点价格约2亿元。
优势:全栈自研(芯片+MindSpore+CANN),运营商级订单锁定长期出货,CloudMatrix 384超节点累计部署超300套 隐忧:NPU不兼容CUDA,开发者迁移成本高;定价偏高
三、阿里平头哥与百度昆仑芯:互联网大厂的芯片棋局
🏢 阿里平头哥
2025年出货约26.5万颗AI芯片,市占6.6%,位居国产第二。截至2026年2月,累计交付47万颗,年化收入已达百亿元级别。
真武810E采用5nm制程工艺,是国产五强中唯一采用5nm的厂商,能效比显著领先。但平头哥深度嵌入阿里云,"云芯一体化"既是优势也是限制。
优势:5nm先进制程,"云芯一体"TCO优势显著 隐忧:外部客户信任度低;出货与阿里云资本开支高度绑定
🏢 百度昆仑芯
2025年出货约11.6万颗,市占3%,与寒武纪并列国产第三。预计营收突破35亿元,外部客户占比从约30%提升至40%。
2026年重大事件:2026年5月正式启动科创板IPO辅导,同步推进港股上市,走"A+H"双资本市场路径。五年六轮融资,投后估值210亿元,股东含中国互联网投资基金、北京AI产业基金、比亚迪、中国移动等。
优势:十五年技术积累(2011年起步),最积极推动外部商业化的"大厂系"芯片公司 隐忧:体量偏小(11.6万张vs华为81.2万张),外部客户信任仍需时间培养
四、寒武纪:从"八年亏损王"到季度盈利10亿
📊 2025全年:首次全年盈利
出货约11.6万颗,同比+350%(2024年仅2.6万张),增速最快的专业芯片厂商。全年营收64.97亿元(+453%),净利润20.59亿元。
📈 2026Q1业绩炸裂
指标 | 数据 | 同比变化 |
|---|---|---|
营收 | 28.85亿元 | +159.56% |
归母净利润 | 10.13亿元 | +185.04% |
扣非净利润 | 9.34亿元 | +238.56% |
经营现金流 | 8.34亿元 | 上市以来首次季度转正 |
合同负债 | 3.96亿元 | 从0.01亿跳升(预示后续订单充沛) |
数据来源:寒武纪2026年一季报
核心驱动力:思元590芯片大规模出货。7nm Chiplet封装,FP16算力256TFLOPS,INT8算力512TOPS,96GB HBM2e,综合性能接近英伟达A100的80%,功耗降低约15%。通过自研Bangware软件栈实现CUDA兼容,迁移成本降低约70%。
型号 | 制程 | FP16算力 | 显存 | 状态 |
|---|---|---|---|---|
思元590 | 7nm Chiplet | 256 TFLOPS | 96GB HBM2e | 量产放量 |
思元690 | 更先进制程 | 预计翻倍 | - | 送测中 |
核心客户为字节跳动(第一大客户,占比超26%)、百度、阿里巴巴等互联网大厂。
优势:第三方中立身份(无母公司竞争),CUDA兼容降低迁移壁垒,Day 0适配DeepSeek V4 隐忧:前五大客户占88.66%营收,第一大客户字节跳动自身也在研发芯片
五、海光信息:x86+DCU双芯驱动的信创基石
📊 2025全年
出货约8.3万颗AI芯片,市占2%。但海光的独特价值在于:国内唯一同时拥有x86 CPU和GPGPU DCU双芯产品的IC设计公司。全年营收143.77亿元(+57%),净利润25.45亿元(+32%),研发投入45.69亿元(占营收31.78%)。
📈 2026Q1持续高增
指标 | 数据 | 同比变化 |
|---|---|---|
营收 | 40.34亿元 | +68.06%(创单季新高) |
归母净利润 | 6.87亿元 | +35.82% |
存货 | 73.3亿元 | 历史新高 |
合同负债 | 20.19亿元 | +123% |
研发投入 | 12.11亿元 | +58.61% |
数据来源:海光信息2026年一季报
深算DCU已与DeepSeek、Qwen3、混元、智谱等365款主流大模型适配,覆盖全球99%非闭源大模型。光合组织凝聚超过6000家生态合作伙伴。
核心壁垒:x86生态兼容 + 光合组织(6000+伙伴) + 信创基本盘(2027年核心系统100%国产化) 隐忧:架构源自AMD技术授权,部分舆论质疑自主性;DCU算力指标与华为、寒武纪有差距
六、国产四小龙崛起:向上挤压进行时
2025年末至2026年初,摩尔线程、沐曦相继登陆科创板,壁仞科技、天数智芯登陆港股,合计募资超百亿港元,"国产GPU四小龙"集体完成资本化跨越。
四小龙2025年业绩
公司 | 2025营收 | 同比 | 盈亏情况 | 上市板块 | 2026Q1营收 |
|---|---|---|---|---|---|
| 摩尔线程 | 15.06亿元 | +243% | 亏损收窄38% | 科创板 | 7.38亿元(+155%),首次季度盈利 |
| 沐曦股份 | 16.44亿元 | +121% | 亏损收窄44% | 科创板 | 5.62亿元(+75%),亏损收窄57% |
| 壁仞科技 | 10.35亿元 | +207% | 经调整亏损8.74亿 | 港股 | 未披露Q1 |
| 天数智芯 | 10.34亿元 | +92% | 亏损收窄32% | 港股 | 未披露Q1 |
数据来源:各公司2025年报及2026年一季报
向上挤压的三种路径
路径一:价格挤压。四小龙产品定价普遍低于华为和寒武纪。摩尔线程MTT S4000(FP16 100T,48GB显存,约3万元)vs 昇腾950PR标准版(5万元)和HBM版(7万元)。在中低端推理场景中,性价比优势对客户有较强吸引力。
路径二:技术追赶。摩尔线程旗舰级MTT S5000已规模量产,可支持万亿参数大模型训练;沐曦曦云C系列累计销量超5.5万颗。2025年国产GPU相关融资68起,总额超270亿元(+159%),资本加速技术迭代。
路径三:生态兼容。四小龙普遍主打"CUDA兼容"策略,与华为不兼容CUDA的NPU路线形成鲜明对比。对于长期绑定英伟达生态的开发者而言,迁移成本更低。摩尔线程通过MUSA架构实现CUDA代码零成本迁移。
挤压效应真相:当前市场处于增量爆发期,算力需求年增幅50%-100%,远未到存量竞争阶段。但隐忧已现——寒武纪客户高度集中(前五大88.66%),最大客户字节自研芯片;华为生态封闭在互联网客户中面临阻力;四小龙除摩尔线程Q1扭亏外,其余仍在烧钱,研发投入占比60%-86%。
七、市场前景展望
2026年核心变量
昇腾950PR量产与互联网订单爆发:最核心的变量。华为出货目标150-200万颗,标志从"政企主导"到"市场化驱动"的转折
寒武纪能否持续盈利:Q1盈利10亿但客户集中度高,思元690发布节奏是关键
四小龙能否全年盈利:摩尔线程Q1已转正,若2-3家全年盈利将改变格局分层
英伟达H200合规不确定性:英伟达因制裁计入45亿美元减值费用,为国产芯片创造更大窗口
资本市场密集IPO:2025-2026年国产GPU融资68起,总额超270亿元
行业趋势判断
时间维度 | 核心判断 |
|---|---|
| 短期(2026年) | 国产份额从41%提升至50%+,推理芯片出货量大幅增长,硬件成本仅为海外1/3 |
| 中期(2027-2028年) | 行业洗牌窗口开启,头部3-5家占据80%+份额,超节点渗透率从10-20%升至50-60% |
| 长期(2029年+) | 国产AI芯片从千亿级增长至万亿级,"系统级竞争"取代"单卡比拼" |
国产AI芯片五强中,你更看好哪一家的路线?华为的NPU独立路线、寒武纪的CUDA兼容策略、还是海光的x86生态路线?在四小龙加速追赶的背景下,你认为最终谁能跑出来?欢迎在评论区分享你的观点。
数据来源:
IDC 2025年度中国云端AI加速器市场报告
寒武纪、海光信息、摩尔线程、沐曦股份等公司2025年度年报及2026年一季报
华为全联接大会2025公开信息
路透社报道及公开行业调研数据
⚠️ 本文基于公开信息进行整理分析,旨在提供行业观察视角,不构成任何投资建议。所有数据均标注明确来源,如有更新请以官方披露为准。