【信达计算机|豆包大模型行业深度】AI投入持续加大,C端、B端两手齐抓
市场投研资讯
(来源:信达证券研究)
主要观点
持续加大AI投入,字节AI算力投入在大厂中排名第一。组织架构侧,字节跳动专门组建了Flow部门和Seed团队,分别致力于于AI大模型的应用开发和基础研究。资源投入侧,字节跳动在服务器购置、IDC建设、AI IaaS服务规模均处于行业前列。具体来看,2024年字节采购服务器达80亿美元,位居国内各大企业第一,GenAI IaaS服务市场份额在2023H2及2024H1分别获得了国内市场份额的第一和第二。
豆包短时间内快速取得进步,各项测试性能不断刷新。2024年12月豆包大模型相比5月版本,面向 MMLU_pro 评测集,模型综合能力提升 32%,全面对齐 GPT-4o水平。仅过去一个月,豆包大模型1.5再探新的能力边界,在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。豆包·视觉理解的输入价格为每千tokens 0.003元,比行业平均价格降低85%(2024年12月18日数据)。
字节C端独具流量及生态优势,大模型将是其B端胜负手。在C端,字节通过旗下抖音、今日头条、巨量引擎等流量入口和推流方式帮助豆包建立用户规模优势。12月豆包第一、Kimi第二、文小言第三,豆包环比增加18.64%,月活人数达到7116万,相比竞争对手优势明显,为后续C端应用或硬件的推广提供了广泛的用户基础。在B端,字节通过火山引擎(基础设施平台)、扣子(AI应用开发平台)、飞书(企业协作平台)搭建B端生态链。但相比阿里、华为等大厂,字节在B端市场是后起之秀,用户数据有很大差距。大模型作为企业日后必备的信息化工具,或是字节能否拿下B端市场的胜负手。
B端Agent市场有望率先起量,信息化厂商大为受益。2023年中国AI Agent市场规模为554亿元,预计至2028年将达8,520亿元,其年均复合增长率为72.7%,有望实现整个SaaS应用体系的重构。在B端场景下,Agent可充当数字员工、个人助理、营销客服等工种,真正为企业创造价值。企业投入层面,根据火山引擎给出的数据,目前64%的中国企业预计其对AI的投资将增长10%-30%。大模型在企业的深度应用须通过Agent嵌入应用来实现,需依托企业信息化厂商来落地,且信息化厂商有望获得tokens分成收入,尤其利好有广泛落地场景的企业信息化厂商。
投资建议:建议关注汉得信息、乐鑫科技、润泽科技、联想集团。
风险因素:政策推进不及预期;技术发展不及预期;市场需求不及预期。
目录
投资聚焦
一、字节在AI领域的布局:长坡厚雪,后发先至
1.1分工清晰指明落地方向,硬件“预埋”奠定发展基础
模型+应用+硬件的三大板块格局,从后端到前端全栈式铺开。2023年2月,字节在大模型上部署了代号为“seed”的团队,专注于模型层。2023年底,字节正式组建Flow部门,专注于AI大模型的应用研发。模型研发+应用落地基本完整了字节从AI基础模型到落地应用的团队构成。目前字节已经开发的AI模型涵盖语言、语音、图片、音乐、视频、3D模型,乃至具身智能。对应落地应用端产品包括豆包、猫箱、星绘、即创、即梦等。此外,字节也将AI能力用于端侧智能硬件,目前主要有Ola friend智能体耳机、显眼包智能玩偶、智能学习灯等,一张覆盖全领域,从后端到前端的大模型研发-产品体系搭建完成。
2024年字节跳动居全球科技企业AI投入规模前列,可以从服务器购置、IDC建设、AI IaaS服务规模,三个维度进行分析。
服务器购置规模可观。全球口径,据Omdia预测,2025年服务器资本支出将增长22%,突破2800亿美元大关。这种强劲的增长趋势预计将持续整个2020年代,到2028年服务器市场规模将达到3800亿美元,并在2030年接近5000亿美元。全球2024年服务器市场达到2290亿美元,需求方前五排名依次为微软、亚马逊、谷歌、Meta和字节跳动,其中字节跳动在这一领域的开支为80亿美元,是国内相关企业的第一名。
推进大规模IDC建设。根据云头条公众号消息,火山云(大同)科技有限公司《火山云太行算力中心二期项目》于2025 年 1 月 13 日获得批复,该项目总投资45亿元,共规划 12 kW 服务器机柜 15604 台,规划网络机柜 510 架。作为参照,火山云太行算力中心一期项目总投资为28亿元。
AI IaaS服务规模方面,以生成式AI(GenAI)为口径,IDC咨询的数据显示,2024H1中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。细分来看:
1) GenAI IaaS市场同比增长203.6%,市场规模达52.0亿元人民币;
2) Other AI IaaS市场同比缩减13.7%,市场规模达37.1亿元人民币;
3) 智算集成服务市场同比增长168.4%,市场规模达57.0亿元人民币。
GenAI IaaS市场表现最为亮眼,或意味着资本投向从非生成式AI(用于传统渲染、仿真、视联网推理等业务场景)向大模型为代表的生成式AI转移。
火山引擎基于其长期储备的算力资源,发力GenAI IaaS服务,2023H2及2024H1分别获得了国内市场份额的第一和第二名,前三名包括阿里巴巴、火山引擎和商汤科技。叠加快速攀升的市场总规模,火山引擎的算力储备和IaaS资源有能力支撑其大模型训练、云算力输出及B端应用落地,并保持竞争优势。
1.2后发先至:豆包大模型短时间内取得快速进步,对标GPT-4o
豆包视觉理解模型发布,通用模型能力全面对标GPT-4o。豆包·视觉理解模型于 12 月 18 日在火山引擎 Force 原动力大会首次亮相。该模型可以通过视频聊天的方式,看懂世界,思考分析,辅助决策。完成诸多复杂的逻辑计算任务,包括解微积分题、分析论文图表、诊断真实代码问题等挑战性任务。识别方面,不仅了解物体类型、文字信息,更能通过光影纹理细节作出深度识别。理解推理方面,解答数学题、解析论文、情景提问、分析代码都可以实现。
豆包实时语音模型正式推出,真人级语音对话助力迈向AGI。2025年01月20日,豆包实时语音大模型正式推出,并在豆包 APP 全量开放。根据外部用户真实反馈,该模型整体满意度较 GPT-4o 有明显优势,语音语气自然度和情绪饱满度远高于后者。团队认为,该模型贴合中国用户实际需求,且发布即上线,有能力直接服务亿万用户,而非停留于演示 Demo 层面。
采用端到端框架,深度融合语音与文本模态。面向语音生成和理解进行统一建模,最终实现多模态输入和输出效果。在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过 Scaling ,最大程度实现语音与文本能力深度融合和能力涌现。在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在“智商”与“情商”之间寻求平衡。
后发而先至,大模型能力比肩GPT-4o。相比 5 月版本,豆包最强模型 Doubao-pro 能力大幅提升。面向 MMLU_pro 评测集,模型综合能力提升 32%,和 GPT-4o 持平,使用价格仅为 GPT-4o 的八分之一。分项目看,Doubao-pro 指令遵循能力提升 9%,代码能力提升 58%,GPQA 专业知识方面能力提升 54%,数学能力提升 43%,推理能力提升 13%,全面对齐 GPT-4o 水平。
仅仅过去一个月,豆包大模型1.5再探新的能力边界。2025年1月22日,豆包大模型1.5正式发布,模型综合能力显著增强。相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力。该模型在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。
打破价格壁垒,推动大模型能力下沉。以旗舰产品Doubao-pro-32k为例,输入价格为0.0008元/千token,输出价格为0.002元/千token,相比月之暗面Moonshot-v1-32K的0.024元/千token更为便宜,与降价后的通义千问qwen-plus模型价格齐平,但显著低于qwen-max模型。
相比国外竞品,豆包的价格优势则更为明显,豆包·视觉理解的输入价格为每千tokens 0.003元,比行业平均价格降低85%,显著低于Claude的0.021元、GPT-4o的0.0175元(2024年12月18日数据)。此外,豆包也可采取使用市场付费的方式计价,这为数据接口使用者提供了结构性优化费用的窗口。
1.3独具流量及生态优势,快速登顶月活数据国内榜单
从C端看,字节通过旗下抖音、今日头条、巨量引擎等流量入口和推流方式帮助豆包建立用户规模优势。在各家大模型的投放渠道中,基本都离不开字节的巨量引擎,字节凭借资源池的优势可以帮助旗下大模型更好地获取流量优势。有了最大规模的资源投入和领先的流量池,豆包大模型有望形成用户规模、知名度、模型能力的正反馈机制加速其生态成长,并助推B端落地。财联社数据显示,截至2024年11月15日,国内十款AI原生应用合计投放金额达15亿元。其中,豆包投放超过4亿元,排名第二。
投流能力对于建立C端认知和用户规模增长至关重要。根据第一财经杂志所引用的AppGrowing数据统计,豆包智能助手在2024年4月、5月的投放金额接近1800万元,6月上旬投放金额飙升至1.24亿元。而豆包MAU正是在6月、7月开始迅速起量并超过竞争对手。
国内月活跃人数(MAU)维度,豆包国内登顶并维持增长。根据36氪数据,2024年12月豆包第一、Kimi第二、文小言第三,豆包环比增加18.64%,月活人数达到7116万,相比竞争对手优势明显。全球数据,豆包月活低于ChatGPT的3.15亿,但仍能位居第二,环比增速则位居排名前十的最高位置。
从B端看,火山引擎及飞书提供了完整的生态保障。基础设施方面,火山引擎强劲的系统承载力保证大模型应用发挥乘数效应。火山引擎提供领先的算力供给、推理层优化策略和高水平系统调度能力,保证企业面临大模型需求涌现时可以拥有瞬时可用、高弹性的计算和通信资源。
软件层面,丰富的插件生态使得企业更好对接外部内容。火山方舟自研联网插件、内容插件和RAG知识库插件,将运营内容和技术积累共享给企业,以增强模型落地效果。例如,联网插件提供头条、抖音同款搜索能力,可实时连接获取互联网海量优质可信数据,大幅提升用户的意图识别检索水平;内容插件可对接更多新闻、视频和垂类内容信息;RAG知识库插件基于飞书文档解析技术,可自动将输入文档内容切片、归类、嵌入,并达到百亿数据的毫秒级检索,大幅提高企业内部知识搜索的相关性和准确性。
1.4 战略层面看,字节在大模型领域的大规模投入具备中长期确定性
我们认为,C端领域,字节有望通过在AI领域积极投入,助力其内容生成及分发业务,巩固领先优势。字节跳动作为国内领先的互联网企业,目前其核心业务围绕内容生成与分发展开,旗下主要产品包括:1)以文本、图片内容为主的今日头条;2)以短视频及直播电商为主的抖音;3)以长视频内容为主的西瓜视频;4)视频剪辑工具软件“剪映”;5)数字营销平台“巨量”;6)美颜相机应用“Faceu激萌”和“轻颜相机”。这些产品均需要进行文本、图片、视频,乃至数字人的生成和应用,这与AIGC目前的功能领域高度契合。面向未来,大模型生成有望成为仅次于相机和特效的内容生成工具,并普及至每位短视频作者,平台内嵌AI功能或将成为用户选择平台的胜负手之一。
B端领域,火山引擎有望以大模型为抓手实现企业用户的广泛突破。国内上一轮云计算浪潮的赢家有阿里、腾讯、华为,主营B端云计算业务的火山引擎,有意在新一轮大模型浪潮下,有望以大模型为抓手实现企业用户的广泛突破,在B端市场占据一席之地。火山引擎在拓展B端用户过程中,需要解决两个问题:一是如何触达用户,二是如何将其的AI能力嵌入用户信息化系统中。这个过程需要专攻企业信息化解决方案的计算机公司来实现,所以字节需要通过合作伙伴协助来实现其B端业务的广泛推广。
二、豆包有望赋能多个赛道快速实现进阶智能化
2.1 Agent市场有望率先起量,扣子平台助力低代码开发智能体
人类与AI 协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体(agent)。AI agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。AI 智能体相较于前两种模式,AI 的参与度更高、智能体模式更为高效,或将成为未来人机协同的主要模式。
中国AI agent行业经历两个阶段:前期铺垫阶段、起步探索阶段。2018-2022年,全球科技企业陆续推出大型语言模型(LLM),为 AI agent在各个领域的多样化应用奠定更广泛的基础。从BERT到GPT-3.5,大语言 模型能力逐年增强,同时中国大模型数量增加迅速。2023年至今,全球LLM应用趋于成熟,基于OpenAI设计更高效的模型架构以及更大规模参数,标志着AI agent概念的雏形诞生。同时国内互联网企业积极投入AI agent研发,包括百度、华为、字节跳动等,未来AI agent行业有望逐渐向产品化和市场化发展。
全球数据量高速增长,为AI agent发展提供数据资源。根据观研天下数据,2022年,全球数据规模已达到103ZB,预计2027年,全球数据规模可达到284.3ZB,2023-2027年CAGR可达到22%。中国数据量增长速度超过全球,2022年中国数据规模达到23.9ZB,占比23.2%。2027年中国数据量规模可达到76.6ZB,占比26.9%,2023-2027年中国数据规模CAGR为26%。
中国AI agent 市场空间广阔,其中以B端应用为主,C端成长潜力大。AI agent 市场规模包括To C端和To B端的应用价值。在To B端,AI agent将逐渐把SaaS应用全面进行改写重构;而在ToC端,AI agent作为生成式AI的商业化应用。AI agent B端应用占比大。2023年B端AI Agent市场规模为550亿元,占比99.3%;C端AI Agent市场规模为4亿元,占比0.72%。
根据观研天下数据,2023年中国AI Agent市场规模为554亿元,预计至2028年有望达8,520亿元,其年均复合增长率为72.7%。其中,预计2028年B端AI agent市场规模为8390亿元,占比98.5%;C端AI Agent市场规模为130.35亿元,占比1.53%。
在AI agent市场规模测算中,分为4个部分:a)中国SaaS市场规模;b)SaaS重构应用价值倍数;c)中国生成式AI市场规模;d)AI agent渗透率。其中,B端AI agent市场规模=中国SaaS市场规模×SaaS重构应用价值倍数;C端AI agent市场规模=中国生成式AI市场规模×AI agent渗透率。
在ToB端,预计在未来十年内,AI agent将会实现整个SaaS应用的重构,并其市场规模将达SaaS应用的十倍。与传统知识库基于文本的结构化管理模式相比,AI agent的向量数据库能自动学习和理解各种文档格式,实现更高效的知识管理和问题解答。在To C端,目前AI agent已较大范围的落地在电商、教育、旅游、酒店以及客服领域。从OpenAI、谷歌、Salesforce, Servicenow、Hubspot等全球头部的AI应用公司新产品即将发布情况来看,AI Agent有望成为2025年AI应用的新趋势,市场规模和应用场景持续扩大。
字节跳动推出的新一代AI agent开发平台扣子,允许用户快速搭建基于大模型的各种智能体bot,并发布到各个社交平台、通讯软件或部署到网站等其他渠道。目前,扣子专业版集成了1万+插件,可以调用国内流行的大语言模型如豆包、通义千问等。2024年12月18日,在火山引擎FORCE原动力大会上,正式发布了扣子1.5版本。扣子1.5集成了视觉理解、音乐、图像生成等模型,多模态能力进一步提升;目前扣子超过100万活跃开发者,已发布超过200万个智能体。随着未来豆包等大模型的发展以及应用渠道的开拓,扣子有望上线或更新更多功能与插件。
扣子提供低代码及可视化开发环境,用户和产品经理可低门槛上手。在基础大模型能力的帮助下,用户只需要几步就能开发一个有特定的角色设定、语言风格、知识库的智能体。具体开发步骤如下:
第一步,在人设与回复逻辑面板中描述智能体的身份和需要完成的任务或使命。用提示词定义智能体的特征,交代智能体的技能和表述限制,用户可以使用大模型对其编辑的人设进行结构化重塑以达到大模型运行的合适格式。例如以下是“夸夸机器人”的设定提示词:
第二步,在技能面板为智能体配置各种扩展能力。比如理解或总结 PPT、图片等多模态内容需要加入多模态插件,对于垂类模型需要添加专属的知识和数据库、外部搜索工具的搜索能力等等。这一步对于具有商用价值的大模型应用至关重要。
第三步,调试智能体并发布。配置好智能体后,就可以在预览与调试区域中测试智能体是否符合预期,之后可一键发布至公域。目前扣子支持将智能体发布到飞书、微信、抖音、豆包等多个渠道中。
2.2 火山引擎+实施伙伴,为B端数智化应用注入新活力
我们认为,大模型在B端市场的落地速度和可达市场规模相比C端存在差异。具体来看,大模型在c端的主要变现方式包括:提供内容创作与生产力工具变现;广告变现;通过AI赋能硬件变现等。其中,赋能硬件带动的产业变化和增值最值得期待。在B端,目前主要通过输出Agent进行变现,嵌入到现有企业IT的方方面面,成为企业级软件服务加质量提升的重要突破口。
在商用领域,大模型的代码能力和基础应答能力已经得到初步验证,能够在一定程度上帮助企业降低经营成本、提高IT开发效率,其市场的快速成长符合经济规律。这意味着,对于AI大模型厂商而言B端市场在收入兑现层面的确定性和重要性较高。以AI Agent(智能体)为例,在B端场景下,Agent能主动学习企业知识库并完成设定的任务目标,充当数字员工、个人助理、营销客服等基础工种,随着大模型本身能力的强化,商务领域的基础性、制式化工作或将借助AI提高自动化程度,B端AI Agent市场或将持续增长。市场规模层面,观研天下预测,我国B端 AI Agent市场规模有望在2025年增长至1718亿元,对比C端17.16亿元,B端市场占比超过99%,且这一趋势有望在中长期持续。
企业加速拥抱大模型,百舸争流下市场快速成长。根据火山引擎给出的数据,目前64%的中国企业预计其对AI的投资将增长10%-30%,企业实现大模型部署的周期已缩短至平均6-12个月,尤其在数字化领先的企业中,这一过程更为迅速。且整体来看,企业越早拥抱AI,越有可能获得市场的先发优势。
大模型的B端落地过程,与ERP实施具备一定相似性。
企业大模型业务落地能力建设可分为三阶段:
阶段一:计划准备阶段(可对比ERP售前咨询)。从企业整体的层面明确落地AI大模型的原始驱动力,分析与AI结合的可能性、行动路线并做好预期收益的管理。在确定需求和目标后,从资源盘点、流程梳理、能力自查三个方面来考虑并拆解目标,充分参考了解大模型落地所需的企业资源投入,制定详细周密的时间和建设计划。
阶段二:模型部署阶段(可对比ERP实施)。模型选择:结合具体的需求从模型精度、效果、参数规模、场景匹配度来筛选适合自身的模型。效果预测:预测AI大模型上线后的实际效果,包括准确率、用户体验、响应时间、TPM、RPM(TPM:Tokens Per Minute每分钟Tokens数量;RPM:Requests Per Minute每分钟请求数)。之后开展算力准备、开发平台搭建、模型接入方式选型、效果调优、安全测试等环节。
阶段三:迭代优化阶段(可对比运维和二次开发)。智能体优化,即针对基于大模型的智能体的能力和水平的持续提升。业务扩展,即将已成功的基于大模型的应用扩展至相关或更复杂的业务领域以挖掘更多的价值。
借助这一特性,包括火山引擎在内的大型云计算服务商,其售前咨询、技术支持团队能够很好地复制其在SaaS应用领域的成功经验,实现大模型在SaaS应用内的嵌入和新型AI应用的落地。
火山引擎发力B端大模型应用,落地案例不断积累。基于豆包大模型的AI能力,加上火山方舟一站式大模型服务平台,以及扣子、HiAgent等智能体开发平台,结合多行业落地经验和高效服务,火山引擎发力AI的B端落地。HiAgent 是火山引擎上线的企业专属的AI应用创新平台,高度适配企业个性化需求,让业务人员可以轻松构建智能体,让业务创新不受生产技能的限制。其核心能力包括:1)支持私有化部署,保护企业的数字资产和知识产权;2)通过丰富的企业级插件及灵活的自定义插件,让智能体可执行企业特有的操作和流程;3)支持多模型适配、按需使用不同模型;4)专属功能定制,按照行业属性和企业特点定制专属应用。
2.3智能可穿戴设备与AI周边产品,带来端侧智能芯片需求增量
AI眼镜作为集传统眼镜功能与智能化升级于一体的可穿戴设备,通过搭载AI语音助手、摄像头等组件实现多模态交互,具有智能化、多功能、时尚便携等优点。通过嵌入生成式人工智能模型应用,AI眼镜一般具备语音交互、物体识别、实时翻译、导航、社交互动等功能。
目前AI眼镜的发展有三个阶段,分别为无摄像头智能眼镜、带摄像头智能眼镜和带显示屏智能眼镜。1)无摄像头智能眼镜在传统眼镜功能上集成音频模块、无线通讯模块、AI加速器等器件,主要交互手段依靠语音交互和触摸交互;所提供功能相对较少,相应研发和硬件成本也最低。2)带摄像头智能眼镜,在原有基础上集成摄像头器件,根据内置的AI算法,实现图像识别功能。3)带显示屏智能眼镜,嵌入显示屏模块之后成为三种类型中集成度最高,但相应研发、硬件成本也最高。目前无摄像头智能眼镜和带摄像头智能眼镜发展成熟,工艺成熟,市场上已经存在成熟的产品,而带显示屏智能眼镜也有产品出现,但需要突破一些技术工艺。
AI智能眼镜代表传统眼镜的电子化和智能化趋势,其潜在的市场规模和销量空间与传统眼镜规模正相关。传统眼镜行业技术庞大、市场广阔,随着近些年AI智能眼镜产业链结构成熟完善,AI眼镜的市场需求和规模也在持续增长。根据观研报告网以及中商情报网的数据,2014-2023年全球智能眼镜市场规模从1.35亿美元增至36亿美元;全球智能眼镜出货量从 19.38 万台增长至 675.53 万台。其中,2021 年为行业规模峰值,全球智能眼镜市场规模达到50.31亿美元,出货量突破千万台。近两年随着技术迭代升级,2024年全球智能眼镜市场规模有望达到40亿美元,2025年达到48亿美元。
目前AI智能眼镜发展仍处于探索期,维深信息预计在2025年将会有更多参与者进场竞争,推动AI智能眼镜的发展趋向成熟,无显示AI眼镜有望走向大规模增长;到2030年后,AI+AR技术发展到成熟阶段,AI+AR智能眼镜进入高速发展期,最终实现对传统智能眼镜的替代,达到70%的渗透率。
多家公司布局探索Al智能眼镜方案,包括传统手机厂商、互联网大厂以及初创公司等。其中,2024年9月字节跳动已完成对开放式耳机品牌Oladance,Oladance作为全球开放式音频引领者,拥有OWS专利技术。开放式耳机音频技术和AI大模型技术正是AI智能眼镜产品所需的两大关键模块,另外字节跳动致力于探索豆包大模型与智能可穿戴设备的结合,并已经深度布局XR领域,旗下PICO处于国内XR头显领域领先地位。未来,字节凭借自身强大的技术实力、庞大的用户基数等优势,有望在AI眼镜领域取得领先地位。
人工智能以及物联网等前沿技术支持AI玩具的多功能发展。语音识别、图像识别、自然语言处理、情感分析等不断进步为AI玩具提供了强大的技术支持,使得AI玩具能够实现更加丰富的交互体验和学习功能。
消费者需求增加使AI玩具迎来良好发展机遇。随着生活节奏加快等因素,越来越多家长需要AI玩具来陪伴和教育孩子。AI玩具能够实时感知孩子的情绪变化并进行适时回应,能够通过深度学习等技术,了解孩子的兴趣和喜好,提供个性化的学习和娱乐体验。
AI玩具以其独特的互动性、个性化、教育性和创新等特点,在市场上展现出强大的竞争力。1)AI玩具能够实时感受到输入,包括语音、动作等并作出适当的响应;2)AI玩具可以学习孩子的喜好、习惯等,从而提供个性化的互动体验;3)AI玩具与大模型结合,能够在玩乐中传授知识、培养技能;4)随着AI技术的发展,AI玩具也不断创新互动方式和内容。
AI玩具市场规模有望快速增长。根据观研天下和共研网数据,2023年全球AI玩具市场规模超18亿美元,预计2030年全球AI玩具市场规模将达到351亿美元,2023-2030年年复合增长率超50%。
国内外企业纷纷布局AI玩具,字节跳动有望凭借豆包大模型等技术优势占据有利地位。海外企业特斯拉、OpenAI等公司已上线多种AI玩具,受到消费者追捧。国内AI玩具参与者分为传统玩具企业和新兴科技企业,其中字节跳动作为国内前沿科技大厂,于2024年推出了自己的AI玩具“显眼包”,其搭载了豆包大模型和集成了火山引擎的多项AI技术,不仅能理解并回应复杂问题,还可承担陪练口语、讲故事等多种功能。2024年12月18日举办的冬季FORCE原动力大会上,字节跳动和乐鑫科技以及ToyCity加深关于AI玩具领域的合作,通过整合乐鑫科技的物联网芯片技术和字节跳动的AI大模型技术,开发出更加智能、高效的玩具产品。
下游需求扰动因素影响消退,智能制造或将带动公司持续成长。回顾过去5年,受疫情影响,公司下游客户IT投入和业务实施进度均受到一定影响,公司收入规模在2020年触底。2021年,随着公司自主软件业务逐渐从发展阶段过渡到成熟阶段,交付效率和实施办法逐渐打磨成熟,成效逐渐在收入端有所呈现,2021、2022年营业收入同比增长12.76%和6.97%。2023年,公司重点储备、强化了AIGC应用能力及商务开拓力度,为AI场景化落地奠定基础,同年8月公司推出的AIGC应用产品及服务“融合AIGC平台H-COPILOT”,首年实现约2200万元的营业收入。
三、相关标的
3.1 乐鑫科技:智能终端加速芯片领军者,豆包大模型物联设备合作伙伴
乐鑫科技的物联网芯片被广泛应用于各种物联网IoT设备。从硬件特性来看,乐鑫的物联网芯片可以做到以下特性:1)卓越的无线链接性能;2)高速、稳定的云端连接;3)强大的边缘处理能力;4)完善的功耗管理策略;5)丰富的开源开发资源。
AI支持方面,以ESP32-S3为例,该产品增加了用于加速神经网络计算和信号处理等工作的向量指令,支持 AI 加速,可以实现高性能的图像识别、语音唤醒和识别等应用。本地化的AI加速能力对于追求自然对话的大模型陪伴类设备至关重要,一方面,快速识别能力能较为明显地降低云-端通信延迟,并提高客户使用体验。另一方面,随着精简后的小参数模型适配完成,本地运行AI也将成为可能。
火山引擎视频云 RTC 联合乐鑫、移远等物联网芯片制造商、解决方案供应商,推出「实时对话式 AI 嵌入式硬件」解决方案。硬件设备通过方案的 AI 语音交互框架即可无缝对接火山引擎 RTC 的实时通信能力和云端智能体服务。
在端侧,芯片集成了先进的音频处理技术,包括自动唤醒功能和音频3A 等,以提升音频输入的清晰度。同时,火山引擎 RTC 提供音视频传输,并具备抗弱网特性,以及智能体管理功能,确保设备即使在网络条件不佳的情况下也能稳定通话。在云端,智能体服务则可提供 Function calling 和知识库支持,使得硬件设备能够提供个性化服务和智能决策,满足用户的深层次需求。
针对大模型终端开发者,提供一站式端到端开发支持体系。乐鑫基于深厚的技术沉淀与丰富的生态经验,全力打造从芯片选型、硬件参考设计、软件方案到云平台集成的支持体系。以 ESP-ADF 多媒体软件框架为例,针对各种音视频应用精心设计,模块独立运行,可灵活插入各类算法,能适配 LLM 应用拓展,推动交互式开发工作。乐鑫的一站式支持体系,以更低成本、更高效率解锁智能设备交互的广阔空间。
3.2 汉得信息:与字节在B端大模型深度合作,寻求企业数字化新增量
作为火山引擎生态合作伙伴,汉得信息已获得火山引擎颁发的2023年度“方案生态优秀伙伴”奖项,充分体现了其和火山引擎之间的合作深度和对生态建设作出的有效贡献。我们认为,大型科技企业提供大模型的基础服务和持续迭代的能力,深耕各个行业的IT服务商借助原有客户资源和渠道优势提供高效、低成本的IT咨询和方案部署,二者相互配合有望成为未来B端AI大模型落地的重要形式。
数字营销仍是企业数字化的重点投入方向之一。秒针营销科学院数据显示,2024年,中国互联网广告市场收入增长13.55%,至6508.63亿元,广告与营销市场规模合计约为14,274亿元人民币,同比增长14.35%,增速较为可观。公司覆盖客群主要为各行业或专业领域排名靠前的企业,其数字营销需求较为丰富和复杂,客户希望通过数字化转型,建立互联网全渠道线上交易体系,建立品牌自主可控的私域电商,提高对消费者/客户的触达能力和影响力,提升营销转换效率和复购率,提高对传统渠道的管控效率等。生成式AI和大模型技术的高速发展,智能化已是大势所趋,大多数产品和流程都值得用AI重做一遍有望成为共识。
在营销领域,汉得信息基于自研AIGC平台,借助火山引擎 HiAgent平台和豆包大模型,通过OTO模式(线上到线下),构建智能交互引擎,打造线上线下一体化智能交互平台,陆续推出一系列智能体,包括智慧导购智能体、导购训练智能体、智慧服务智能体、运营质量检查智能体、竞品洞察智能体、SEO优化智能体等诸多智能体,并在客户项目中场景化落地,加速营销智能化升级。
智能制造领域,工信部数据,2023年,软件产品收入29030亿元,同比增长11.1%,增速较上年同期提高1.2个百分点,占全行业收入比重为23.6%。其中,工业软件产品实现收入2824亿元,同比增长12.3%。
利用AI技术,切实提高产品良率并实现可量化收益。以公司完成的某光伏企业项目为例,对于光伏切片行业而言,良品率提升1个点,对企业每年带来的收益可达数千万元。汉得信息通过对影响良率的60多个参数建立模型,建立AI模型,在车间用该模型实时监测产线上参数数据的变动趋势,当呈现良品率下降趋势的概率达到某一阈值时,对产线进行干预以避免良品率快速下降。这一应用在该客户成功上线后继续不断迭代调优,6个月后,整体生产良品率提升了1个点。同时该客户自有IT团队在这一过程中学习了AI的技术,在除良品率以外的其他各环节上已经能自主进行AI开发应用创新和迭代,目前每天在运行的AI任务已经达到120多个。
在供应链领域,汉得信息子公司亿砹科技专注于供应链物流数字化云平台与产业生态建设,从物流管理、效率工具、平台连接三个维度为企业数智化转型赋能。
亿砹供应链物流 EI-SCM 平台全面转型 AIGC 应用、甄零电子合同管理系统叠加 AIGC 能力、甄知燕千云客户服务系统叠加 AIGC 能力、汉得大数据平台基于 AIGC 打造的 Chat BI 产品等等陆续发布。通过将多系统入口集成到同一个交互入口、自动化处理,提升生产效率,降低系统应用门槛。
3.3 润泽科技:AIDC先行者,算力基础设施存量及增量兼备
存量方面,截止2024H1,公司已在京津冀·廊坊、长三角·平湖、大湾区·佛山和惠州、成渝经济圈·重庆、甘肃·兰州和海南·儋州等全国6 大区域建成了7 个AIDC 智算基础设施集群,基本完成了全国“一体化算力中心体系”框架布局,全国合计规划61 栋智算中心、约32 万架机柜。
增量方面,公司在建工程账面价值快速增长,展业趋势明确。回顾过去公司报表端在建工程科目的账面价值在2021年前后迎来快速上量,2021/2022/2023/2024H1分别为23.52/55.90/69.26/79.08亿元,显示出公司坚定投入数据中心及AI基建发展的信心。
AIDC方向,公司敏锐地抓住了AI技术革新为IDC领域带来的机遇,吸引了众多AI头部客户将核心训练模组部署于公司智算中心,取得了大规模AIDC订单,为公司持续高速发展注入新动力。2024年上半年,公司AIDC业务实现高速增长,收入达到20.6亿元,同比增长1147.85%。
液冷能力领先行业,公司将自研的液冷技术全面应用于全国多园区的下一代新型智算中心项目中,创造性地完成了高功率、高算网、高存储、多模组的多元融合架构智算集群基础设施设计,可实现单体建筑面积约22万平米、IT功率超200MW,在理论距离约束范围内可聚集13万张以上算力卡的集群,为高复杂度、高计算需求的万亿级大模型训练提供全方位的服务支持与技术保障。
3.4 联想集团:AIPC步入现实,结合豆包打造端侧智能助理
AIPC有望逐渐成为主流。IDC 预测,AI PC在中国PC市场中新机的装配比例有望在未来几年中快速攀升,有望于2027年达到85%,成为PC市场主流。短期内,AIPC有望释放用户换机需求,提振市场规模。中长期看,AIPC有望扩大单机价值量,使得全产业链获益。
联手火山和豆包,强化端侧AI能力。12月26日,在2024联想天禧生态伙伴大会上,联想正式宣布与火山引擎牵手合作,为其 AI 桌面助手如意(AI Stick),植入豆包大模型“超强大脑”,全方位提升用户体验。三大核心能力得以显著提升:1) AI搜索,超越传统搜索,就像装上了 “信息雷达”,让每一次点击都更加精准、高效;2)AI写作,无论是撰写深度文章、个人博客,还是快速生成营销文案、专业邮件模板,都能胜任;3)AI聊天,整合了豆包通用模型pro 的 AI 聊天,可以实现用户在办公、学习、休闲娱乐等过程中的多样化场景需求。
风险因素
政策推进不及预期。
AI大模型、智能体的落地会受到技术成熟度、商业可行性,以及同现有基础设施之间存在的矛盾等因素影响,行业政策的方向、力度、落地速度都可能会根据实际情况发生一定变化,进而影响行业的走向和趋势。但总体上看,智能化、信息化是互联互通、高度自动化的必要条件之一,也是经济社会的重要发展方向之一。
技术发展不及预期。
由于计算机技术本身涉及多个新兴领域的前沿技术,例如半导体设计制造、软件算法、计算机集群计算等,总体处于发展阶段,并未完全成熟,技术的可靠性仍有待市场的验证。此外,前沿技术的进步和迭代的速度也受到物理定律、投入规模、竞争烈度等诸多复杂因素影响,存在迟滞的可能。
市场需求不及预期。
计算机技术的落地受下游行业资本开支、信息化改造规模的影响,当下游行业本身不景气时,现金流的收窄也会使得企业减少对IT投入的规模,继而传导至上游,使得订单出现减少。其次,计算机技术本身需要为各个行业赋能,提供包括降本增效在内的实际增益,但这一过程存在不确定性,理论上有效的技术可能在实际落地过程中不及预期,无法激发客户的购置需求。
本文源自报告:《豆包大模型行业深度报告:AI投入持续加大,C端、B端两手齐抓》
报告发布时间:2025年3月3日
发布报告机构:信达证券研究开发中心
报告作者:庞倩倩 S1500522110006
研究团队:
庞倩倩,计算机行业首席分析师,华南理工大学管理学硕士。曾就职于华创证券、广发证券,2022年加入信达证券研究开发中心。在广发证券期间,所在团队21年取得:新财富第四名、金牛奖最佳行业分析师第二名、水晶球第二名、新浪金麒麟最佳分析师第一名、上证报最佳分析师第一名、21世纪金牌分析师第一名。
傅晓烺,计算机行业分析师,上海外国语大学硕士,2024年加入信达证券研究所,主要覆盖信创、AI算力等领域。
姜佳明,计算机行业研究员,南安普顿大学经济学硕士,2024年加入信达证券研究所,主要覆盖工业软件、智能驾驶等领域。