华泰 | 科技:持续看好AI算力需求,Agent进展提速
6月4-5日,我们组织了2025年中期策略会,我们看到:1)AI算力保持积极向上趋势,推理端与训练端共同推进算力需求;2)国内外Agent进展提速,业绩有望加速释放;3)Agent产品有望在数据复杂度低,业务流程标准化程度高,幻觉容忍度高的场景率先落地。
模型技术演进与产业进展角度共同证明AI算力需求持续上行
训练端与推理端两条主线都对未来AI算力需求保持积极推动:从近期的模型迭代趋势来看,后训练阶段scaling持续推进,预训练阶段的新架构探索有望开启Scaling Law新起点。同时从产业的角度,我们也看到了算力需求继续上涨的积极信号 :1)大规模算力集群随英伟达B系列交付节奏恢复加速落地。OpenAI星际之门项目与xAI Colossus是全球大规模算力集群的代表项目,目前处于加速落地进程中。2)CoreWeave作为北美最大的算力租赁厂商之一,从CoreWeave订单快速增长来看,高端GPU需求仍存在强劲的增长动能,证明了全球算力需求高景气度仍然存在,我们持续看好AI算力需求。
AI应用:加速从简单场景向复杂场景渗透
Agent为AI应用带来落地方式&商业模式的新范式,从策略会我们观察到,国内AI应用正加速实现从简单环节到复杂环节的产品升级。Agent应用能力边界拓展本质在于数据访问权限与模型能力边界的拓展,国内AI应用加速从简单数据环节向复杂数据环节进阶。我们还观察到AI应用目前进入新的发展阶段,具体体现在商业模式变革与对人力资源的直接替换。从“工具订阅”到“成果合同”,特征表现为企业不再为功能付费,而是为可量化 KPI 或直接收益买单。AI不再只是API,而是能自我触发、持续运行的数字劳动力,自主工作能力提升给企业带来切实效益,企业开始像部署人力资源一样部署 AI 资源。我们认为,随Agent向企业流程的进一步深化,ROI有望进一步明晰,落地节奏有望加速。
AI应用有望在数据流程标准化高&ROI可量化的领域有望率先放量
策略会上我们观察到,目前国内外AI Agent商业化进程均在加速推进,我们认为,Agent产品必须要与垂直行业数据、垂直场景数据深度结合,才能实现真正的商业化落地。从AI落地节奏来看,ToC场景因其需求简单、幻觉容忍度高等原因,推进速度更快,如AI大模型在游戏、电商、广告等领域进展加速。ToB场景中,我们在策略会观察到,AI在营销和销售领域的应用已从技术探索阶段迈入到规模化应用。营销和销售领域成为AI大模型落地最快的场景之一,我们认为,其核心原因在于其数据驱动的本质、业务目标的可量化性、流程的标准化特征与 AI 技术特性高度契合,在这些环节AI应用有望迎来率先放量。
风险提示:宏观经济波动;技术落地不及预期;本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
正文
AI算力:看好算力需求积极向上趋势
从策略会我们观察到,全球AI算力需求持续上行趋势不改,我们认为,训练端与推理端两条主线都对未来AI算力需求保持积极推动:
1)训练端来看,模型层后训练阶段不断有新的scaling路径涌现;新架构正在积极探索过程中,未来有望重启预训练阶段的算力需求叙事;全球大规模算力集群有望伴随英伟达B系列交付节奏的恢复加速推进,主权AI正逐步落地。
2)推理端来看,策略会上我们观察到,部分AI应用厂商已探索出可复制的落地场景,加速实现从简单环节到复杂环节的产品升级。Agent的加速落地有望带来tokens调用量十到百倍提升,推理需求有望加速放量,我们看好AI算力需求持续向上。
训练端:预训练Scaling Law有望开启新起点
训练端来看,总结最近的大模型迭代趋势,模型架构的改进或是Scaling Law提速的可行性方案,预训练有望诞生新的起点。从近期的模型架构探索来看,腾讯发布的混元大语言模型TurboS,是业界首个大规模部署的Transformer-Mamba专家混合(MoE)模型,通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的有机协同,实现了性能与效率的平衡。Google于5月的I/O大会上发布了Gemini Diffusion文本扩散模型,能够通过将随机噪声转换为连贯的文本或代码来生成输出,类似图像/视频生成模型的工作模式,Gemini Diffusion是大厂在商业化模型上首次将扩散模型用于文本生成,或是类似于OpenAI o1一样的重要路径转折点。自2024年下半年模型参数的扩大的趋势有所放缓,llya在NeurlPS演讲中表示互联网中用于模型训练的公开数据已到达瓶颈,我们认为,模型架构的改进或为预训练阶段找到Scaling Law的新路径,预训练阶段的AI算力叙事有望开启新起点。
产业端来看,我们也看到了算力需求继续上涨的积极信号,预训练的算力投入步伐从未停下。
1)大规模算力集群随英伟达B系列交付节奏恢复加速落地。OpenAI星际之门项目与xAI Colossus是全球大规模算力集群的代表项目,目前处于加速落地进程中。星际之门阿比林一期工程将包含8个建筑,每座建筑中都会有5万块完全互连的大型GPU集群,总共有多达40万块芯片,总发电容量将达到1.2GW,从最新释出的项目现场视频来看,目前其中2座主体建筑基本完工,伴随英伟达GPU的逐步交付正在进行算力机架与冷却系统的铺设。
2)北美算力租赁厂商订单加速增长,反映出大模型厂商对未来算力需求的乐观态度。CoreWeave作为北美最大的算力租赁厂商之一,3月底在纳斯达克上市,自上市以来涨幅接近260%,反映了美股资本市场对算力端的信心。2025年3月,公司与OpenAI签署5年119亿美元的合同;2025年5月,公司与OpenAI再签40亿美元拓展协议,期限至2029年;根据公司25Q1电话会,截至25Q1,公司收入积压为259亿美元,同比增长63%。从CoreWeave订单快速增长来看,高端GPU需求仍存在强劲的增长动能,证明了全球算力需求高景气度仍然存在,我们持续看好AI算力需求。
推理端:推理需求有望随Agent落地爆发
Agent需求的爆发或将驱动推理算力实现数十倍乃至上百倍的增长。据Artificial Analysis统计,在模型扩展律(Scaling Law)主导的初期阶段,增大模型参数是主要方向,这带来了约5倍的算力提升。进入模型后训练与推理为主导的阶段后,模型输出的Token数量显著增加,推动算力需求再增长约10倍。而步入Agent时代,算力需求激增的驱动力转变为单Agent处理单任务所需的请求次数(request),这一数量级预计提升约20倍。鉴于Agent几乎完全由推理模型驱动,这些因素叠加(参数增大×Token增长×请求量剧增)最终将导致整体推理算力需求呈现数十倍甚至上百倍的跃升。
Agent带来的大量的工具调用与信息交互驱动tokens消耗量数量级的提升。Agent对tokens消耗的核心动因在于:1)交互与任务复杂化:Agent需执行任务分解与编码,处理涉及多步子任务(常达数十个)或屏幕内容识别等复杂流程,远超Chatbot的单次交互Token消耗量。2)多Agent协同开销:未来多Agent协作场景会因跨Agent通信而产生额外算力需求。3)使用强度与模态增加:交互频次、任务复杂度及使用频率的提升,叠加屏幕识别等多模态输入,大幅推高了单位任务Token消耗。综上因素叠加或共同驱动整体算力需求几十到上百倍的提升。
AI应用:加速从简单场景向复杂场景渗透
Agent为AI应用带来落地方式&商业模式的新范式
从策略会我们观察到,国内AI应用正加速实现从简单环节到复杂环节的产品升级。Agent应用能力边界拓展本质在于数据访问权限与模型能力边界的拓展,国内AI应用加速从简单数据环节向复杂数据环节进阶。1)2C AI应用:完成从通用AI搜索向个人知识管理的产品升级,并加速进入生活Agent助理场景,以Manus为代表的通用型Agent实现商业化落地;2)2B AI应用:完成从企业知识库到单点Agent的能力跨越,伴随MCP、A2A等标准化协议推广,2B应用开始布局跨业务的多Agent协同功能,有望实现复杂场景的Agent交互与协同。
我们还观察到AI应用目前进入新的发展阶段,具体体现在商业模式变革与对人力资源的直接替换。1)从“工具订阅”到“成果合同”,特征表现为企业不再为功能付费,而是为可量化 KPI 或直接收益买单,SaaS 的“按座位收费”逻辑被快速侵蚀,销售、营销、风控等预算正迁移到“结果共享”或“按增收分成”的新合同里。2)“被调用”到“主动调度”的智能体操作系统,特征:AI不再只是API,而是能自我触发、持续运行的数字劳动力,自主工作能力提升给企业带来切实效益,企业开始像部署人力资源一样部署 AI 资源,运营中心出现“智能体排班表”,人力成本与AI计算成本出现此消彼长的新结构。
可商业化的Agent产品快速发展,Deep Research功能是目前最成熟的应用方式。从目前商业化的Agent产品来看,实现方式上以虚拟机为主,好处是不用占据用户的本地设备使用权限,可以完全在云端运行,而且支持多任务并行。另一种方式是利用模型的多模态能力对GUI(图形用户界面)进行推理,然后进行键鼠、触屏等操作来模拟人类,好处是可以绕开各类App的底层权限。功能上看,Deep Research最为成熟,本质是让大模型不停的搜索各种网页,然后根据用户的问题形成专业调研报告,一般会持续推理10-30min。
国内AI应用下半年加速落地可期
国内AI落地节奏来看,24年已初步验证,25年有望加速复制推广。我们筛选泛ERP、轻办公、AI+行业、数据等四大类AI应用公司,可以看到AI商业化验证24年已初步完成,我们以AI应用落地较快的汉得信息、鼎捷数智、万兴科技为例,三家公司24年AI应用收入已突破千万人民币。受益于DeepSeek带动下游客户AI需求,25Q1各家公司的业务进展显著提速。
MCP有望加速AI应用产业节奏,应用公司态度积极。MCP协议旨在实现AI应用开发的标准化,对于加速AI应用产业落地具有重要意义。海外Anthropic、OpenAI、Microsoft、Google,国内阿里、腾讯、百度已全面支持MCP,AI应用公司同样快速接入MCP生态。泛ERP类、数据类公司支持MCP,主要是在PaaS平台内提供MCP服务,便于企业开发者打造更丰富的Agent功能;轻办公类、AI+行业类公司支持MCP,主要作为MCP Server提供工具化能力。我们认为,AI应用放量趋势日益明显,产业生态正在加速完善。
未来展望:看好细分领域率先放量
数据流程标准化高&ROI可量化的领域有望率先放量
策略会上我们观察到,目前国内外AI Agent商业化进程均在加速推进,我们认为,Agent产品必须要与垂直行业数据、垂直场景数据深度结合,才能实现真正的商业化落地。
从AI落地节奏来看,ToC场景因其需求简单、幻觉容忍度高等原因,推进速度更快,如AI大模型在游戏、电商、广告等领域进展超预期。而在企业级市场,因ToB客户场景的复杂度更高、对模型幻觉的容忍度较低等原因,落地节奏相对ToC场景会缓慢一些。
在ToB垂直场景中,业务流程相对简单、对模型幻觉有一定容忍度的垂直场景落地更快,如办公、人力资源、营销、销售、智能客服等场景,AI商业化进展相对更快;而投资顾问、财务管理、AI辅助诊断等严肃场景,对模型幻觉率容忍度较低,此部分领域的Agent大规模广泛落地还有赖于大模型能力的进一步提升,但中长期来看,这些领域具有更为广阔的市场空间。
从ToB垂直行业角度看,教育、法律、金融、医疗、工业领域的AI Agent均在快速推进中,如教育领域正在迎来千人千面的学习革命;金融领域AI正在带来交易领域、个性化理财、风险管理等领域的快速变革;医疗AI正在从辅助诊断向健康管理的全面升级;工业领域,AI在预测性维护、供应链管理等领域发挥重大作用。这些行业具有共同的特征:行业数据丰富、信息化水平较高、AI大模型能够给行业带来效果显著的降本增效。
以AI+营销为例,看影响落地节奏的关键因素
在AI分论坛上国内AI+营销领域代表公司原圈科技对AI未来对营销领域的变革做出展望,我们观察到,AI在营销和销售领域的应用已从技术探索阶段迈入到规模化应用。营销和销售领域成为AI大模型落地最快的场景之一,我们认为,其核心原因在于1)其数据驱动的本质:营销领域是企业数据最密集的场景之一,涵盖用户行为、消费偏好、市场趋势等多维度数据。这些数据为 AI 模型提供了丰富的 “燃料”,使其能够快速学习并优化营销策略;2)业务目标的可量化性:营销和销售的核心目标(如销售额提升、提升广告支出回报率 ROAS、转化率、客户留存率)具有明确的量化指标,便于企业快速评估 AI 应用效果;3)流程的标准化特征:营销全链路(从内容生成、投放优化到效果分析)具有清晰的流程节点,流程的可拆解性降低了技术集成难度,企业无需重构业务体系即可快速部署 AI 解决方案。 这些特征与 AI 技术特性高度契合,落地较快。
企业客户对于AI营销的需求已经从单一工具向全链路智能中枢升级。营销链路可以分为公域引流阶段以及私域引流阶段,传统营销模式下企业注重在公域引流上的投入,但在后互联网时代下,越来越多企业注重要私域运营的重要性以实现企业业务的稳定增长。
1)洞察环节:企业利用AI打通线上线下数据,自动聚合多源数据(社交媒体、CRM、电商平台),实时生成市场趋势报告。
2)内容生产:营销内容生成与创意突破。基于大模型生成个性化文案、图像及视频,缩短创作周期。
3)媒介投放:利用AI进行精准营销,并动态优化广告预算分配,实现ROI的快速提升。
4)后链路管理:自动化客户触达与售后服务,提升客户互动体验。
AI营销/销售领域的市场格局分散,AI有望重塑行业格局。AI营销/销售领域的市场格局非常分散,按照沙利文《中国营销及销售SaaS解决方案市场行业研究报告》数据显示,2023年迈富时(Marketingforce)是中国最大的营销及销售Saas解决方案厂商,份额为3%;Saleforce、微盟、纷享销客、有赞市场份额分别为1.8%/1.8%/1.5%/0.9%。当前,AI已成为重塑数字营销及销售行业的重要力量。我们认为,对行业的深刻理解、AI技术领先性、成熟的销售网络、强大的品牌知名度等将成为厂商胜出的重要因素。
宏观经济波动。若宏观经济波动,产业变革及新技术的落地节奏或将受到影响,宏观经济波动还可能对IT投资产生负面影响,从而导致整体行业增长不及预期。
技术落地不及预期。若AI等技术落地不及预期,或对计算机行业公司整体产品迭代、收入增长节奏产生负面影响。
本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
研报:《2025年中期策略会速递——AI:持续看好算力需求,Agent进展提速》2025年6月8日
谢春生 分析师 S0570519080006 | BQZ938
郭雅丽 分析师 S0570515060003 | BQB164
范昳蕊 分析师 S0570521060004
袁泽世 分析师 S0570524090001
岳铂雄 分析师 S0570524080004
王浩天 联系人 S0570125010006
(转自:华泰证券研究所)