【山证计算机】海光信息:国产CPU和DCU双领军,信创+AI驱动高速成长
山西证券研究所
投资要点
国产CPU和DCU双领军,技术和生态优势显著。海光信息成立于2014年,2016年获得AMD技术授权启动CPU产品研发,基于AMD的授权技术和海光的自研能力,公司秉承“销售一代、验证一代、研发一代”的策略,持续进行海光系列CPU和深算系列DCU产品的迭代,且主力CPU产品海光三号以及DCU产品深算二号均已实现量产。公司凭借技术与生态两大优势,成为了国内CPU和DCU领导者,在技术方面,公司持续重度投入研发,产品性能紧跟全球一线水平,并在国内厂商中保持领先;在生态方面,公司CPU基于生态完善的x86架构,且DCU的平台和架构高度兼容CUDA,能够实现对海外产品的无缝切换。
CPU性能和生态持续领跑国内市场,信创加速推动国产化率持续提升。公司基于AMD Zen1架构授权,初代产品海光一号较同期的国产CPU实现代际领先,且主力产品海光三号性能较前代产品全方位提升,综合产品性能持续领跑国内市场。同时在生态方面,公司CPU采用x86架构,相比于ARM和自研指令集架构,生态成熟度更高,可实现上层系统软件、应用软件等的无缝切换。目前国内服务器及桌面CPU市场合计达千亿规模,国产化替代空间广阔。随着财政对信创的支持力度不断加强以及行业信创临近中期节点,两大因素有望共同推动行业信创加速,同时CPU作为信创关键领域,国产化率有望实现快速提升。
AI芯片跻身国内第一梯队,充分受益国产AI算力产业浪潮。公司DCU芯片深算一号和深算二号过去主要应用于超算中心等高性能计算领域,是国内超算芯片领域领导者。为补齐DCU在大模型训练和推理场景下的短板,公司正在研发最新一代DCU产品深算三号,预计较深算二号在AI性能上将有数倍提升,并有望跻身国内AI芯片第一梯队。公司DCU采用GPGPU架构,并且软件平台DTK高度兼容CUDA生态,能够广泛适配国际主流AI框架和应用软件,同时大量采用国际主流开源组件,降低生态拓展难度。随着国内互联网及智算中心AI算力投入的持续增加,叠加美国芯片出口管制政策持续加码,公司有望充分受益AI算力的国产化浪潮。
盈利预测、估值分析和投资建议:公司作为国内CPU和DCU双领军,有望充分受益于CPU和DCU市场国产化率的持续提升,预计公司2025-2027年归母净利润29.45/42.28/56.47亿元,同比增长52.5%/43.6%/33.6%,对应EPS为 1.27/1.82/2.43元,PE为111.31/77.54/58.06倍,维持“买入-A”评级。
风险提示:客户集中度较高的风险;供应链风险;主要原材料价格上涨的风险;新产品研发进展不及预期。
财务数据与估值
资料来源:最闻,山西证券研究所
【海光信息:国产CPU和DCU双领军企业】
基于AMD技术授权,CPU和DCU持续迭代
海光信息成立于2014年,2016年获得AMD技术授权启动CPU产品研发,通过持续推进高端处理器产品的迭代升级,成长为国内CPU和DCU双领军企业。2014年海光信息成立,成立后不久,公司获得中科曙光、国科控股等参投的天使轮融资。2016年,公司与AMD合资成立海光集成和海光微电子两家子公司,并分别于2016年和2017年与AMD签署《技术许可协议》,约定AMD为两家合资公司提供高端处理器技术授权和技术支持,包括处理器核心和外围电路设计技术以及内置到处理器中驱动处理器硬件执行的微码系统等。基于AMD的授权技术和海光的自研能力,2016年以来公司秉承“销售一代、验证一代、研发一代”的策略,持续进行海光系列CPU和深算系列DCU产品的迭代,目前公司已发展成为国内CPU和DCU领域的领导者。
图1:海光信息发展历程
资料来源:公司招股说明书,公司2022年报,公司2023年9月20日投资者调研纪要,山西证券研究所
海光信息的主营产品分为通用处理器(CPU)和协处理器(DCU)两类。其中:1)海光CPU兼容国际主流的x86技术路线,具有丰富的软硬件生态优势,其核心组成包括处理器核心(Core)、片上网络和各类接口控制器,同时集成了复杂的微码系统。海光CPU按照代际进行升级迭代,目前已从海光一号迭代至海光四号,而每代际产品基于不同的产品定位,可细分为高端的7000、中端的5000和低端的3000系列,其中7000系列面向对计算能力、扩展能力、吞吐量有高要求的领域,包括大数据、人工智能等,3000系列主要应用于入门级服务器、工作站、工业控制等市场,5000系列面向边缘计算、云计算、分布式存储等应用场景。2)海光DCU属于GPGPU的一种,采用“类CUDA”通用并行计算架构,能够较好地适配国际主流商业计算软件和人工智能软件。从组成上看,计算单元是DCU的最主要部件,以深算一号为例,其最大集成64个计算单元。目前公司DCU产品包括深算一号和深算二号,主要部署在服务器集群或数据中心,支撑高复杂度和高吞吐量的数据处理任务。
图2:海光信息主营产品分为通用处理器(CPU)和协处理器(DCU)两类
资料来源:公司官网,公司招股说明书,山西证券研究所
管理层及研发团队具备中科系及AMD等芯片大厂背景
中科曙光是海光信息第一大股东,同时公司通过海光微电子和海光集成两家子公司持有AMD技术授权。目前公司无控股股东和实控人,前两大股东分别为中科曙光和成都国资(含成都产投有限、成都高投有限及成都集萃有限,系一致行动人),截至2024年12月31日,两大股东分别持股27.96%和17%。在参控股子公司中,海光微电子和海光集成是海光信息与AMD的合资公司,其中,海光微电子(海光持股49%、AMD持股51%)受让和使用AMD授权的x86处理器核相关技术,负责研发海光处理器核,并销售半成品给海光集成;海光集成(海光持股70%、AMD持股30%)受让和使用AMD授权的x86处理器外围相关技术,负责研发海光处理器外围相关技术,并对外销售海光处理器成品。
图3:中科曙光和成都国资为海光信息前两大股东
资料来源:wind,山西证券研究所
公司核心管理层大多具有中科系企业任职经历,其中董事长孟宪棠曾任国科控股副总经理,总经理沙超群曾任中科曙光高级副总裁,而公司核心技术骨干拥有AMD、英特尔等芯片大厂的任职背景。公司董事长孟宪棠毕业于香港科技大学获工商管理硕士学位,曾任国科控股(中科院控股有限公司)副总经理,并曾兼任中科可控和中科院资本管理有限公司董事;公司总经理沙超群毕业于北京理工大学获工学硕士学位,曾在中科曙光分管产品技术。公司核心技术骨干多拥有AMD、英特尔等国内外知名芯片公司的就职背景,并拥有成功研发x86和ARM处理器的经验。公司高度重视研发技术人才,截至2024年12月31日,研发人员共有2157人,占公司总人数的90.18%,同时,为锁住核心技术人才,公司设立蓝海轻舟员工持股平台,目前持股比例为6.09%。
表1:公司核心管理层多具备中科系企业任职背景
资料来源:公司招股说明书,公司2024年年报,Wind,山西证券研究所
核心产品放量推动营业收入和利润率持续提升
国产处理器需求增加叠加产品结构多元化,推动公司营业收入保持高速成长。近6年公司营收复合增长率高达89.1%,2024年公司实现营收91.6亿元,同比增长52.4%,主要原因在于国产处理器需求旺盛,同时公司快速丰富产品线,推动产品结构多样化发展,并且持续加大市场开发力度,不断拓展新客户。根据应用场景划分,2019年7000系列高端CPU处理器占据公司86%的营收,3000系列低端CPU和5000系列中端CPU分别占据13%和1%的营收,而到了2021年,7000系列CPU营收占比降至65%,3000和5000系列营收占比分别提升至16%和8%,此外,8000系列DCU自2021年上半年开始量产,并快速在多个行业进行试用推广,当年就贡献了10%的营收。根据产品代际划分,自2018年海光一号实现商业化应用,2020-2023年海光二号、深算一号、海光三号、深算二号陆续实现量产,持续满足客户需求,促进公司收入保持快速增长。
图4:近6年公司营收复合增长率达89.1%
资料来源:wind,山西证券研究所
图5:公司产品结构向多样化发展
资料来源:公司招股说明书,山西证券研究所
芯片研发规模效应叠加新产品持续迭代,公司毛利率持续提升。2019-2024年,除2022年因封装测试成本上升导致毛利率小幅下降,公司毛利率整体保持稳步增长态势,从37.3%提升至63.7%,主要原因在于,一方面,随着公司业务规模增长,规模效应显现,促使公司自研无形资产摊销金额占营收比重下降,另一方面公司持续进行产品迭代升级,而新一代际的产品毛利率通常高于上一代际,新一代产品快速放量推动公司整体毛利率提升。
图6:公司毛利率保持增长趋势
资料来源:wind,山西证券研究所
图7:不同代际产品毛利率对比
资料来源:公司招股说明书,山西证券研究所
公司费用率呈下降趋势,盈利能力持续改善。2019年以来,随着公司业务规模保持高速增长,同时运营效率持续提升,公司费用率呈下降趋势,销售、管理、研发费用率分别从2019年的6.58%、14.28%、46.27%下降至2024年的1.92%、1.55%、31.76%。在研发投入方面,尽管研发费用率有所下降,但公司仍高度重视高端处理器核心技术的研发,保持高强度的研发投入,2024年研发投入金额达34.5亿元,同比增长22.63%,占营收比重达37.61%。随着收入端和费用端持续改善,2019年以来公司归母净利润保持稳健增长,2021年实现扭亏为盈,2024年公司实现归母净利润19.3亿元,同比增长52.9%,同时公司净利率也从2019年-36.2%快速提升至2024年29.7%。
图8:公司费用率呈下降趋势
资料来源:Wind,公司2024年报,山西证券研究所
图9:公司归母净利润(亿元)及增速
资料来源:wind,山西证券研究所
【CPU:产品性能和生态优势显著,信创加速推动国产化率持续提升】
国内CPU市场达千亿规模,国产化替代空间广阔
CPU(中央处理器)是计算机系统的运算和控制中心,随着技术的不断进步,CPU不断在性能上实现提升,包括更高的主频、更多的核心数以及更强的并行处理能力。CPU主要由运算器(ALU)、控制器(CU)、寄存器(Register)构成。其中,运算器负责根据控制器的命令执行计算机的加减乘等算术运算、与或非和异或等逻辑运算以及移位、比较、传送等操作,控制器负责协调和控制计算机执行协调和控制机计算机各组件执行程序的指令序列,包括取指令、分析指令和执行指令,而寄存器负责存储运算器计算过程中产生的临时数据,包括向量寄存器、指令寄存器、地址寄存器、通用目的寄存器等。
图10:CPU主要由运算器、控制器和寄存器组成
资料来源:Computer Science GCSE GURU,山西证券研究所
CPU根据指令集可分为复杂指令集(CISC)和精简指令集(RISC)两大类,其中,复杂指令集以x86架构为主,精简指令集以ARM架构为主,此外还包括MIPS、RISC-V等架构。1)x86架构具有指令系统庞大、指令长度可变、功能复杂、寻址方式灵活的特点,并且在Wintel联盟的长期推动下,x86架构的应用软件生态及开发工具成熟度非常高。目前x86架构仍占据在服务器和桌面CPU芯片的主要份额,x86阵营的芯片厂商包括海外的英特尔、AMD以及国内的海光和兆芯;2)ARM架构具有低功耗、结构简单、指令执行效率高的优点,在软件生态、寻址灵活性、指令丰富度上弱于x86架构。ARM架构与安卓操作系统形成了AA体系,在移动端设备以及工控系统、大型机等特定场景下应用广泛。目前ARM阵营的主要芯片厂商包括海外的高通、三星、苹果以及国内的飞腾、鲲鹏等。
表2:复杂指令集(CISC)和精简指令集(RISC)对比
资料来源:公司招股说明书,《CPU技术与产业白皮书》,前海高乐,电子发烧友,半导体行业观察,山西证券研究所
CPU根据应用领域主要可分为服务器CPU和桌面CPU,二者在内核数量、缓存设计、主板配置等方面存在较大差异。其中,1)内核数量:为满足高性能计算要求,服务器CPU通常在单块CPU中封装更多物理内核,以英特尔CPU为例,至强系列服务器CPU目前最多可拥有196核,而酷睿系列桌面CPU的内核最多达24个;2)缓存设计:服务器CPU普遍采用三级缓存设计,且高速缓存容量明显更大,以英特尔CPU为例,至强CPU高速缓存容量可达504MB,而酷睿CPU的高速缓存容量仅为5-36MB;3)主板配置:服务器CPU配备的主板大多拥有多个CPU卡槽,可通过多路互联技术同时运行多个CPU,而桌面CPU通常仅安装一个CPU,同时,专为高性能计算设计的服务器CPU自带的核心显卡即可满足需求,而部分桌面CPU主板拥有显卡卡槽以放置独立显卡,满足日常游戏、图像处理等需求。
表3:服务器CPU和桌面CPU对比
资料来源:金山云,英特尔官网,强川科技,山西证券研究所
服务器CPU市场规模测算:基于IDC对国内服务器出货量等数据统计,我们测算2023年国内市场规模约为539亿元。其中:
1)国内服务器出货量测算:根据IDC数据,2023年中国服务器出货量约449万台,其中x86服务器出货量为362万台,占比达81%,并呈逐年下降趋势。同时,IDC预测24-25年国内x86服务器出货量将分别增长5.7%和5.5%,即2025年国内x86服务器将出货约404万台。假设24-25年x86服务器出货量占比逐年下降,分别为77%和73%,则2025年国内服务器出货量将达到553万台;
2)单台服务器包含的CPU数量测算:根据海光招股说明书引IDC数据,国内服务器以双路为主,2016-2020年双路服务器占比从80.0%持续提升至88.8%,2020年单路、四路、八路及以上服务器分别占比6.6%、4.5%、0.1%,我们假设平均每台服务器包含的CPU数量稳定在2块;
3)服务器CPU单价测算:基于海光招股说明书数据,2019-2021年海光CPU平均单价分别为4340、4400、3668元,其中21年均价有所下滑主要是因为低端的3000系列出货量大幅提升,而3000系列部分应用于工作站等非服务器场景。而根据Mercury Research数据可计算得出,英特尔在23Q3和24Q3的服务器CPU平均单价分别为1003美元(约7198元)和858美元(约6160元),AMD在23Q3和24Q3的服务器CPU平均单价分别为1227美元(约8810元)和1295美元(约9295元)。参考以上数据,同时考虑到海外巨头的服务器CPU产品单价一般更高,假设国内市场CPU平均单价稳定在6000元左右。
表4:中国服务器CPU市场规模测算
资料来源:IDC,中商产业研究院,海光信息2023年报摘要,海光信息招股说明书,Mercury Research,芯东西,The Next Platform,山西证券研究所测算
桌面CPU市场规模:目前英特尔和AMD在中国大陆的桌面CPU业务合计收入规模约636亿元,同时国产厂商在桌面CPU市场的收入规模仍然较小,未来具备较大的替代空间。
1)英特尔桌面CPU业务:CCG(PC客户端)部门收入可代表桌面CPU业务收入,2024年英特尔CCG部门收入为303亿美元,折合人民币约2174亿元,以中国区收入占比29%计算,2024年英特尔桌面CPU中国区收入为88亿美元(约632亿人民币);
2)AMD桌面CPU业务:客户端收入可代表桌面CPU业务收入,2023年AMD客户端收入为47亿美元,折合人民币约329亿元,以中国区收入占比23%计算,2023年AMD桌面CPU中国区收入为11亿美元(约76亿人民币)。英特尔和AMD在国内桌面CPU市场的合计收入规模约636亿人民币,提供了广阔的国产化替代空间。
公司CPU性能领跑国内市场,x86架构生态优势显著
目前国产CPU市场有海光、兆芯、鲲鹏、飞腾、龙芯、申威六大主流厂商,根据指令集架构可分为x86、ARM、自研指令集三大阵营,综合产品性能及市场份额来看,海光和鲲鹏处于第一梯队,其次为飞腾、兆芯、龙芯、申威。
1)x86(海光、兆芯):海光、兆芯通过合资、收购等方式获得x86技术授权,并基于引进的技术完成早期产品的研发,此后逐步进行技术吸收,并在后续产品迭代中实现自研。其中,海光基于AMD Zen1架构研发的初代产品便具备代际领先性,随后持续重度投入研发,产品性能保持国内领先;
2)ARM(鲲鹏、飞腾):鲲鹏、飞腾从ARM公司买断其ARM v8指令集架构永久授权,并自行定制CPU内核和芯片,依托华为和中国电子,鲲鹏和飞腾CPU具备一定的生态基础,但由于无法获得更新的ARM v9授权,并且ARM禁止厂商随意私自修改指令集,在自主可控方面存在隐患。其中,鲲鹏依托华为强大的技术研发能力,在产品性能上处于领先,而飞腾的PKS路线具有明显的安全优势;
3)自研指令集(龙芯、申威):龙芯、申威基于MIPS、Alpha等指令集架构,推出了自主研发的LoongArch、SW64等架构,在国产厂商中自主可控程度较高,但生态成熟度较低。其中,目前申威CPU已实现完全自主可控,但比较小众,主要应用于超算领域,而龙芯中科部分模块仍需依赖MIPS架构,公司在生态建设上已有积累,目前国内主流的办公软件都完成了LoongArch的适配,同时LoongArch通过软硬件结合的二进制翻译方式实现了部分兼容x86。
相比于主要竞争对手鲲鹏和兆芯,海光在产品性能和应用生态上具备优势。1)与鲲鹏相比,海光CPU采用x86架构,而在Wintel联盟的推动下,全球绝大多数应用软件均兼容x86架构,并且在操作系统方面,除Windows外,Linux同样兼容x86架构,因此使用海光的CPU能够实现上层系统软件、应用软件等的无缝切换,具备显著的生态优势;2)与同属于x86阵营的兆芯相比,海光的产品性能更优,海光CPU脱胎于当时国际领先的AMD Zen1架构,随后公司快速消化吸收授权技术并持续自研,同时主动扩展安全算法指令,内置密码计算等多种安全技术,实现领先的芯片安全防护能力,而兆芯的x86 CPU由于旧版专利授权限制以及VIA微架构先进性不足,产品性能提升相对较慢。
表5:国产CPU厂商指令集架构和生态对比
资料来源:Wind,海光信息官网,海光信息招股说明书,海光信息《8-2-1 会计师关于第一轮审核问询函的回复意见(2021年年报财务数据更新版)》,EETOP,《鲲鹏计算产业发展白皮书》,鲲鹏官网,飞腾信息官网,申威科技官网,龙芯中科招股说明书,澎湃新闻,天津市工信局,DIGITIMES,天津日报,艾法益登信息技术,山西证券研究所
2016年,海光通过合资子公司海光微电子和海光集成获得AMD x86指令集架构和Zen1架构源代码授权。2016年海光与AMD成立海光微电子和海光集成两家子公司,分别负责CPU核的研发以及CPU外围技术的研发和CPU成品的对外销售,并签署《技术许可协议》,根据协议,AMD需要向合资公司提供x86芯片永久技术授权及必要的技术支持,而公司生产的芯片仅面向国内市场销售。为此,AMD获得了价值2.93亿美元的授权费。
图11:海光信息通过与AMD成立合资公司获取x86和Zen1架构授权
资料来源:海光信息《8-1 发行人及保荐机构回复》,电子工程专辑,山西证券研究所
公司基于Zen1架构研发了海光一号,产品性能在当时的国产CPU中处于领先,并且与国际领先产品的性能差距控制在10%以内。AMD基于Zen1微架构推出的服务器CPU霄龙7001系列较当时国内主流产品具有代际领先性,根据SPEC 2017测试结果,AMD霄龙7001系列中7551的整型得分可达295,浮点得分可达268,对标英特尔同期的至强E5 v4系列产品。海光基于AMD Zen1架构研发的海光一号性能基本达到AMD同代产品霄龙7001系列技术指标,其中与AMD 霄龙7551相似型号的海光7185在SPEC 2017测试集上的整型得分为281,浮点得分为251,与AMD产品的性能差距在5%-7%,同时海光一号在国产CPU中保持领先,当时国内主流的飞腾FT-2000+/64等CPU基本对标2014年英特尔至强E5 v3系列的水平,与国际领先产品存在3年左右的差距。
海光充分消化吸收AMD的x86技术和Zen1微架构,继海光一号之后通过自研不断优化微体系结构,快速推出海光二号和海光三号,产品性能紧跟AMD同代产品,并持续领跑国产CPU市场,同时海光四号和五号也已启动研发。随着海光快速消化AMD的x86技术和Zen1微架构,公司基于自身产品策略,对CPU微架构进行重点优化。2017年公司在海光一号基础上对Core微结构进行优化,提升处理器核心性能和安全性能,研发了海光二号。根据SPEC CPU测试结果,海光二号性能较上代产品提升了22.71%-24.24%,并且与采用Zen2架构的AMD霄龙7542差距在12.99%-18.30%,同时在国产品牌中处于领先,海光二号7285的SPEC测试整型得分为348,高于当时主要竞品鲲鹏920 7260 318的整型得分。公司的海光三号进一步对CPU核心和片上网络微结构进行优化,包括优化取指单元中的分支预测器,实现更精确的分支预测算法和更高的预测带宽;优化内存控制器,将内存频率从2667MHz提升到3200MHz。海光三号性能进一步提升,旗舰型号7390的CPU核心数量达32个,线程数量为64个,主频达2.7GHz,并配有8个DDR4内存,综合性能继续领跑包括鲲鹏、飞腾在内的国产品牌。同时,海光四号和海光五号也分别于2019和2022年启动研发,目前进展顺利。
表6:海光7390综合性能处于国内领先
资料来源:海光信息官网,华为海思官网,龙芯中科官网,飞腾信息官网,兆芯官网,IT之家,山西证券研究所
行业信创将进入第二阶段,CPU国产化率有望加速提升
信创产业开始由党政向全行业覆盖发展,在替换系统上开始由外围系统向核心系统深化。2019年开始,信创迎来第一轮建设期,围绕党政领域,旨在全面替换省市级及以上级别政府机关的电子公文系统,同时金融、电信、电力等关键行业开启信创试点。第一轮党政信创的产品供应商选择主要参考信创目录,其中在CPU领域,龙芯、海光、飞腾、鲲鹏、兆芯、申威均已进入信创名录。2022年是信创产业承上启下的一年,市级以上党政机关的电子公文系统实现全面替换,并开始向电子政务系统延伸以及向区县级市场下沉,同时金融、电信等关键行业的信创也开始从局部试点向全面落地发展,信创产业逐渐步入第二轮建设期。在第二轮建设期,信创需求方在采购时将会更多考虑产品的性能和易用性。
图12:目前信创产业正以“2+8+N”的节奏快速推进
资料来源:亿欧智库,山西证券研究所
2024年以来,随着财政政策持续落地,对信创产业的资金支持力度有望持续加强,同时,考虑到当前临近行业信创中期节点,我们认为2025年信创有望加速落地。2024年5月,财政部发布超长期特别国债发行的有关安排,从发行时间看,本次特别国债将从去年5月中旬持续发行到11月中旬,从投向领域看,本次特别国债发行强调科技自立自强,将适度超前部署数字基础设施体系,旨在推动关键核心技术的突破和产业升级。而在2024年6月,财政部联合国家发改委、中国人民银行等发布了《关于实施设备更新贷款财政贴息政策的通知》,旨在通过财政贴息降低企业融资成本,促进企业进行设备更新,能够在一定程度上加快设备国产化替代进程,该政策的实施期限将持续到2024年年底。我们认为,随着本次超长期特别国债的持续发行以及贷款财政贴息政策的落地,信创资金支持力度增强,信创产业发展开始提速。同时临近2027年这一信创关键节点,考虑到此前的信创建设进度,我们认为未来信创大概率将加速。
图13:2020-2027年中国信创产业市场规模及增速
资料来源:亿欧智库,山西证券研究所
CPU是信创的关键领域,海光有望凭借产品性能和生态优势成为本轮信创CPU厂商的核心受益者。由于上一轮信创采用基于信创名录的采购模式,下游政企用户的信创采购更侧重于安全合规需求,因此党政信创对进入名录的供应商收入及业绩均有较大幅度的拉动,包括海光、龙芯、鲲鹏、飞腾等六大CPU厂商均有不同程度受益。而进入行业信创后,行业用户更看重产品的性能和生态,信创采购更加市场化,因此,我们认为,在本轮信创中具备产品性能和生态优势的厂商将更加受益,而海光作为国内CPU龙头厂商,具备强大的产品和生态优势,有望成为本轮信创的核心受益者。
图14:2018年以来海光信息营收变化情况(亿元)
资料来源:wind,山西证券研究所
图15:2018年以来龙芯中科营收变化情况(亿元)
资料来源:Wind,龙芯中科2024年度业绩快报,山西证券研究所
【DCU:AI芯片跻身国内第一梯队,充分受益国产AI算力产业浪潮】
互联网及智算中心持续加大AI投入,AI芯片国产化进程持续加速
AI浪潮下国内下游互联网和智算中心的算力需求持续旺盛,将推动国内AI芯片市场保持快速增长。1)互联网:23Q2开始国内互联网大厂积极布局大模型赛道,加速AI算力投入。考虑到AI对于国内互联网头部厂商而言,无论是赋能自身业务来提升竞争力还是服务下游客户来提高收入规模,都具备重要意义,因此未来互联网厂商AI相关资本开支仍将持续提升。在芯片选择方面,H20预计仍将占据较高份额,而昇腾910B等国产芯片的份额也将持续提升;2)智算中心:10月以来国内智算中心建设正全面提速,众多智算中心项目陆续进入交付阶段,同时新启动的智算中心项目的规划算力规模以及投资金额等均呈增长趋势。智算中心建设的参与方众多,格局较为分散,国内主流算力芯片均有望占据智算中心市场一定份额。
图16:互联网和智算中心是AI算力两大下游
资料来源:山西证券研究所绘制
随着美国芯片出口管制政策持续加码,英伟达主力AI芯片出口中国大陆受限,AI芯片的国产化进程有望加速推进。近年来美国不断加码对于高性能AI芯片的出口管制:1)2022年10月更新出口管理条例,提出总处理性能(TPP)和I/O带宽传输速率两大判断指标,禁止TPP不小于4800且I/O带宽不小于600GB/s的AI芯片向中国等地区出口,导致英伟达A100、H100等高端芯片出口受限;2)2023年10月美国商务部再次更新出口管理条例,新增性能密度(PD)指标,并设置1.6、3.2和5.92三个门槛,A800、H800、RTX4090等芯片进入出口管制名单;3)2024年美国政府再次对出口管制条例进行修订,将管制范围从AI芯片扩大到所有搭载AI芯片的电子设备。国内互联网大厂等下游客户为防止出现芯片断供风险,正逐步转向采购国产芯片或自研AI芯片,将推动AI芯片国产化率快速提升。
表7:美国芯片出口管制政策持续加码
资料来源:美国驻华大使馆官网,美国商务部官网,《产业经济评论》,中国社会科学院工业经济研究所,山西证券研究所
从超算到智算,深算三号有望进入国内AI芯片第一梯队
目前国产AI芯片厂商可分为三个梯队,第一梯队厂商包括华为昇腾、海光信息、寒武纪、百度昆仑芯等。1)第一梯队:代表厂商为华为昇腾、海光信息、寒武纪、百度昆仑芯,第一梯队厂商成立时间较早,已迭代了2-3代产品,具备较强的软硬件能力积累,在产品性能和量产规模方面保持领先,其中,华为昇腾910B已经基本对标英伟达A100,成为互联网厂商国产训练芯片的首选,而海光信息、寒武纪、昆仑芯等的新一代主力产品深算三号、思元590、昆仑芯三代等未来也将成为昇腾910B的有力竞争者;2)第二梯队:包括壁仞科技、天数智芯、沐曦等,这类厂商大多成立于2019-2021年前后,并以AI芯片起家,目前已拥有上市的产品,主力产品仍以推理卡为主,训练卡在产品成熟度和规模化落地方面与第一梯队厂商存在差距;3)第三梯队:包括起步不久的AI芯片初创企业以及特定行业的AI芯片厂商,目前这类厂商仍处于芯片设计、流片等早期阶段,或者产品仅用于特定行业,产品量产规模较小。
图17:国产AI芯片厂商分为三个梯队
资料来源:山西证券研究所绘制
表8:主要国产AI芯片硬件性能对比
资料来源:寒武纪官网,摩尔线程官网,平头哥官网,海光信息招股说明书,EETOP,皇华电子元器件IC供应商,Trendforce,山西证券研究所;注:平头哥含光800采用INT16和INT8算力,无单精度算力
2018年开始海光切入DCU市场,并于2021年实现量产,目前主力芯片包括深算一号和深算二号,主要面向超算领域,同时,公司开始切入AI场景,新一代产品深算三号有望实现AI性能的跃升。2018年公司启动深算一号的研发,在2021年量产当年便贡献2.39亿元收入。深算一号采用GPGPU架构,具备全精度浮点数据和各种常见整型数据计算能力,可提供FP64算力,并且主要应用于超算中心等高性能计算领域,在AI领域尤其是大模型训练场景应用较少。2020年公司启动深算二号研发,并于2023年正式发布,深算二号较前代产品性能提升了100%,同样主要面向超算领域。目前海光DCU已在国家超级计算郑州中心等超算中心落地。为进一步补齐DCU产品在大模型训练场景下的性能短板,公司正在研发新一代产品深算三号,我们认为,深算三号有望成为国内领先的AI芯片。
平台与架构高度兼容CUDA生态,实现生态端无缝切换
在技术路线上AI芯片可分为两大阵营,其中昇腾、寒武纪、平头哥和昆仑芯等采用ASIC架构,而包括海光、天数智芯以及壁仞科技、摩尔线程、沐曦等则采用GPGPU架构。1)ASIC:芯片专用性强而通用性弱,同时具有功耗低、性能高、体积小的优势,代表厂商包括昇腾、平头哥、昆仑芯、寒武纪,华为、阿里、百度本身具有大量特定的业务需求,因此通过自研ASIC芯片满足自身业务需求;2)GPGPU:英伟达、AMD均采用GPGPU架构,国产厂商中海光信息、壁仞科技、摩尔线程等AI芯片厂商中拥有多为AMD和英伟达任职经历的技术专家,选择了GPGPU的技术路线。
由于英伟达属于GPGPU阵营,公司DCU采用GPGPU架构有助于降低CUDA迁移难度并减少性能损失。目前大模型已深入到AI芯片硬件层面做优化,达到芯片片上缓存大小优化的级别,因此,芯片架构会影响大模型以及上层AI应用的性能,而具有同样架构的芯片,其模型和应用迁移的性能损失相对较小。海光和英伟达同属于GPGPU阵营,均通过采用大量并行计算单元的方式提升AI算力,而华为昇腾、寒武纪ASIC架构芯片主要围绕矩阵做脉动阵列计算,其AI核心专门应用于矩阵运算,与GPGPU架构差异较大。因此,相比于ASIC芯片,海光DCU的CUDA迁移效率损失更低。
表9:国产厂商AI芯片技术路线对比
资料来源:Wind,海光信息招股说明书,昇腾官网,澎湃新闻,海光信息官网,海光信息2024年报,寒武纪官网,中国科学院官网,壁仞科技官网,电子工程专辑,摩尔线程官网,证券时报网,平头哥官网,昆仑芯官网,山西证券研究所
海光DTK平台封装了ROCm相关组件,由于ROCm与CUDA相似度非常高,因此海光DTK平台能够高度兼容CUDA生态。AMD的ROCm框架借鉴了CUDA的许多设计理念,对CUDA具有高度兼容性。经过多年兼容经验积累,在主要模块上,ROCm与CUDA高度相似,其中,在软件库方面,ROCm的基础库几乎实现了与CUDA的一一对应,在编译器方面,ROCm以HCC对应CUDA的NVCC。同时,ROCm采用的核心编程模型HIP在语法和API接口上也类似于CUDA,大部分CUDA API调用都可以快速转换为HIP调用。而海光信息的开放软件平台DTK封装了ROCm生态相关组件,同时基于DCU硬件进行优化并提供完整的软件工具链,能够充分发挥ROCm高度兼容CUDA的优势,以更低成本将CUDA上运行的应用迁移到海光平台上运行。
图18:英伟达CUDA架构
资料来源:英伟达官网,山西证券研究所
图19:AMD ROCm架构
资料来源:AMD官网,山西证券研究所
同时,不同于华为昇腾、摩尔线程等厂商自行开发软件库、框架兼容程序等,海光充分利用开源社区,大量采用国际主流开源方案,较大程度上降低了生态拓展难度。海光DTK软件平台中MIOpen、Eigen、RCCL等软件库均来自于开源社区,且均为目前使用较广泛的方案,一方面能够降低软件开发工作量,提升用户吸引力,另一方面也方便用户进行二次开发,从而提升用户体验。
图20:海光DTK软件平台包含大量主流开源模块
资料来源:海光信息官网,山西证券研究所
【盈利预测及投资建议】
盈利预测
根据公司年报,我们将公司业务划分为高端处理器和技术服务两个板块。其中:
1)高端处理器业务:包括CPU和DCU两类产品,其中,在CPU产品方面,随着信创产业正式进入第二阶段,公司作为国产CPU领军厂商,具备显著的产品性能和生态优势,有望充分受益CPU国产化率的快速提升。同时,随着更高性能的海光四号和海光五号陆续发布并量产,未来公司CPU产品毛利率有望持续提升;在DCU产品方面,国内AI算力需求持续旺盛,同时美国芯片出口管制政策趋紧将推动AI芯片国产化率持续提升。随着新一代产品深算三号正式发布并实现量产,将带来公司DCU产品收入的快速增长。同时新一代产品的量产有望带动公司DCU产品毛利率持续提升。综上,我们预计2025-2027年公司高端处理器业务营收增速分别为43.6%、35.5%、32.3%,预计2025-2027年公司高端处理器业务毛利率分别为63.9%、64.2%、64.3%;
2)技术服务业务:主要为客户提供技术支持、技术咨询等服务,收入占比较低,我们简单假设该业务收入稳步增长、毛利率保持基本稳定,预计2025-2027年公司技术服务业务营收增速分别为5.0%、5.0%、5.0%,预计2025-2027年公司技术服务业务毛利率分别为71.1%、71.1%、71.1%;
整体来看,我们预计公司2025-2025年的营业收入分别为131.46、178.04、235.46亿元,同比增速分别为43.5%、35.4%、32.3%,毛利率分别为63.9%、64.2%、64.3%。
表10:海光信息盈利预测
资料来源:wind,山西证券研究所
估值分析
考虑到业务结构和商业模式的相似性,我们选取CPU行业头部厂商龙芯中科、AI芯片厂商寒武纪和景嘉微作为可比公司。可比公司2024-2026年PS平均值为126.0/60.1/43.2倍,海光信息2024年收入为91.62亿元,同时我们预计海光信息2025-2026年收入为131.46/178.04亿元,对应2024-2026年PS为35.8/24.9/18.4倍,显著低于可比公司平均水平。
表11:可比公司估值对比
资料来源:Wind,龙芯中科2024年度业绩快报,寒武纪2024年度业绩快报,山西证券研究所;注:采用2025年3月26日的收盘价,龙芯中科、寒武纪24年SPS根据24年度业绩快报计算所得、25-26年预测SPS采用Wind一致预期数据,景嘉微24-26年预测SPS均采用Wind一致预期数据,海光信息24年SPS为实际值,25-26年预测SPS基于自己的估值模型,收盘价和SPS单位均为人民币元
投资建议
公司是国产CPU和DCU双领军,技术和生态优势显著。在CPU方面,公司CPU性能持续领跑国内市场,同时在生态方面,公司CPU采用x86架构,相比于ARM和自研指令集架构,生态成熟度更高,可实现上层系统软件、应用软件等的无缝切换。目前国内服务器及桌面CPU市场合计达千亿规模,国产化替代空间广阔。随着财政对信创的支持力度不断加强以及行业信创临近中期节点,两大因素有望共同推动行业信创加速,同时CPU作为信创关键领域,国产化率有望实现快速提升。在DCU方面,公司正在研发最新一代DCU产品深算三号,预计较深算二号在AI性能上将有数倍的提升,并有望跻身国内AI芯片第一梯队。公司DCU采用GPGPU架构,并且软件平台DTK高度兼容CUDA生态,能够广泛适配国际主流AI框架和应用软件,同时大量采用国际主流开源组件,降低生态拓展难度。随着国内互联网及智算中心AI算力投入的持续增加,叠加美国芯片出口管制政策持续加码,公司有望充分受益AI算力的国产化浪潮。预计公司2025-2027年归母净利润29.45/42.28/56.47亿元,同比增长52.5%/43.6%/33.6%,对应EPS为 1.27/1.82/2.43元,PE为111.31/77.54/58.06倍,维持“买入-A”评级。