中金 | 具身智能系列(三):机器人与通信网络,织就智能脉络
中金点睛
机内通信系统可以看做具身智能系统的神经通信网络,以连接具身智能体各部件并传输多样化数据信号,机外通信则是具身智能系统中云-边-端协同及智能体之间协作的必要支撑,两张通信网络是具身智能不可或缺的系统级组件。我们认为,伴随着人形机器人在各个细分领域逐步迈入商业化落地节点并迎来渗透率的逐步提升,通信系统作为保障具身智能系统稳定运作的核心支撑,有望在人形机器人领域获得增量空间。我们对具身智能对内通信协议及对外通信方案进行探讨,预计至2030年中国人形机器人的通信系统价值量有望达到4.2亿元,2024-2030年CAGR有望达268%。
内部通信系统是具身智能的“神经网络”,Ethernet有望成为内部通信传输标准化的最终方案。具身智能内部通信网络将传感器、控制器、执行器等元件连接在一起,实现传感器采集信息的回传、本地化信息处理后控制指令的传递。具身智能端到端的通信方式、复杂的本体构造、以及与所处环境实时高频的交互需求,对内部通信能力提出高实时性、高可靠性、抗干扰性、低功耗、支持多元数据传输等要求。现阶段,不同类型传感器以及运动控制系统对通信的需求不同,内部通信架构未统一,呈现多种通信传输协议如USB、CAN、Ethernet、EtherCAT等并存局面;展望远期,我们认为若具身智能内部需建立起标准化通信系统,朝着车载以太网演进的Ethernet有望成为内部通信一体化的最终解决方案:1)可持续迭代支持长期需求演进;2)具备产业链复用优势,产业规模扩大促进成本下降;3)轻量化部署利于减轻机器人负载和能耗,缓解供电问题;4)更利于OTA的实现。
外部通信能力是具身智能系统运行迭代的基石,蜂窝通信与WiFi、星闪有望长期共存。外部通信对具身智能而言不可或缺,端侧的数据需要上传至云端进行模型训练,而持续迭代的软件算法也有赖于通信网络实现OTA升级,此外,云-边-端算力协同、实时状态监控、接收指令及智能体间的协同也需要对外通信能力。其中,蜂窝网络低延时、高带宽、无线漫游的优势难以替代,长期会在各类场景需求中持续演进落地;Wi-Fi凭借低部署成本、自组网优势集中发力于无漫游需求的具身智能落地场景。我们认为,蜂窝网络与Wi-Fi有望长期共存,而星闪在技术层面与具身智能的需求高度契合,但当前的产业链成熟度较低,未来有望在国产替代诉求下,在部分场景或下游客户实现对WiFi的替代。
风险
AI技术突破遭遇瓶颈,具身智能商业化落地不及预期,隐私安全问题。
大模型重塑具身智能未来,通信网络不可或缺
多模态大模型的高速迭代赋能机器人突破智能化瓶颈,迈向通用智能新时代。在大模型出现前,传统机器人在智能化层面主要存在以下三个瓶颈:1)不具备复杂任务的理解和规划能力,大多基于控制系统的指令完成交互任务;2)仅能完成垂直领域内的特定任务而不具备通用性;3)多模感知能力、认知能力较弱而限制了复杂环境的应用。而大模型基于Transformer架构,不同于可迁移性差、数据依赖度高的传统深度学习算法,模型的稳健性和泛化能力明显提升,为通用具身智能的落地奠定了基础,如谷歌在2023年发布的PaLM-E模型能够指导机器人实现长时序、one-shot、zero-shot等操作任务。此外,大模型的多模态感知能力赋能具身智能在复杂场景下的规划决策与推理,构建了人机交互的新范式,智能体通过配备的多模态传感器完成对实时环境信息的接收处理,并能够基于自然语言指令理解需求,拆解任务并生成行动计划。综上所述,大模型的持续迭代升级有望重塑具身智能领域,推动机器人的智能化与通用化升级。
图表1:具身智能整体框架
资料来源:《Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI》(Yang Liu, Weixing Chen等,2024),中金公司研究部
从感知到决策,AI赋能具身智能需要通过数据收集、模型训练、OTA升级与本地化推理四大阶段。在数据收集阶段,通过智能体采集、动态捕捉、视频学习等方式,AI大模型从真实环境或公共数据库等资源渠道收集数据,并基于海量多模态数据进行模型训练;在具身智能体的全生命周期中,通过OTA升级的方式,允许设备在不解体、不拆卸的情况下通过无线方式接收并应用新的软件或算法更新,保证持续适应变化的环境和任务需求,提升智能化水平;在场景落地中,利用边缘侧及端侧算力,实现毫秒级本地化推理,保障用户隐私的同时提升响应速度。
通信系统作为保障具身智能系统稳定运作的核心支撑,具身智能的通信系统包括对内通信及对外通信两大板块。其中,外部通信是AI系统与外部环境进行数据交换和指令交互的关键,包括使智能体将本地数据上传至云端进行模型训练,并不断优化升级模型算法并通过OTA模式下载到具身智能终端。对内通信则聚焦于智能体内部的通信及协调,智能体的传感器需要内部通信网络将数据传输至体内决策单元,推理决策后将执行命令通过内部通信网络发送至各执行模块,并确保不同模块之间的整体协同工作。
内部通信:智能之“神经”,贯穿数据传输与指令控制
“具身”特点使具身智能内部通信传输的要求提高
具身智能对内部通信提出高实时性、高可靠性、抗干扰、低功耗等一系列要求。具身智能的内部通信系统类似人体“神经系统”,将机器人内部的传感器、控制器、执行器等元件连接在一起,以串联和协调数据采集、数据处理、指令控制、任务执行等功能行为。具身智能内部传输的数据包括大量传感器采集的视频、音频等模拟数据、以及控制指令、状态数据等离散后的数字数据,不同功能模块之间多样数据的交互以及端到端的通信方式对内部通信能力提出更高要求。
► 高实时性要求:高实时性的内部通信是具身智能在瞬息万变的环境中及时学习并立刻反馈的必要条件。相较于大模型等离身智能,具身智能拥有真实的物理实体,通过“感知、决策、控制”三个环节实现与环境和用户的交互。从感知环节看,真实世界的环境具有实时变化的特点,这要求内部通信机制具有低延时性,能够及时将传感器感知到的变化传输到中央计算单元,根据高工机器人,具身智能分布式方案“大小脑”的协同延迟为ms级别。从控制环节看,机器人的动作和响应通常需要在短时间内完成,需具备高动态、高精度和高爆发的运动性能,其动作的延续、肢体的协调和指令的准确执行需要有高实时性的内部通信能力的支持,若通信过程有延迟,易导致机器人动作不准确或不协调。
► 高可靠性和抗干扰能力:具身智能下游应用场景丰富,环境的复杂多样、任务的容错率、服务的安全性等对内部通信提出了高可靠和抗干扰的要求。我们认为,高可靠性和抗干扰能力意味着内部数据传输的稳定,以避免因通信中断导致机器人突然停顿,或者数据丢包导致错误指令、操作失误等问题,帮助具身智能更好地适应多样化、充满不确定性的物理环境。
► 能够支持多元化数据传输:过去受限于虚拟形态,多模态大模型大多侧重文字、图像、音频、视频的理解;具身智能突破这一限制,除上述常见的多模态数据外,还包括力的反馈、温度、湿度、空间坐标、旋转角度、位移距离等触觉、姿态信息。我们观察到,不同类型数据的数据量和传输频率差异较大,如机器人的视觉传感器能够产生大量的图像数据,而关节位置反馈的数据量相对较小、但更新频率更高,我们认为,具身智能涉及多种不同类型数据的处理和融合,这要求内部通信传输系统能够支撑多元化数据的传输。
► 分布式和超多节点:具身智能本体的构造较复杂,由多个部件和子系统组成,每个部分都需要和其他部分进行通信。以人形机器人为例,其头部、四肢分布着大量传感器、执行器、控制器,躯干部分通常包含负责复杂决策的“大脑”和负责运动的“小脑”。对比PC、手机等常规电子类产品,躯体和四肢的存在导致具身智能内部各类器件分布较为分散,传输节点较多。此外,随着具身智能本体的运动,节点和器件位置发生动态变化,网络拓扑结构的变动对通信能力提出更高要求。
► 低功耗、小型化:具身智能不具备长时间连接电源的条件,由移动电池供电,受限于电池能量密度,目前人形机器人充满电后的持续工作时间仅能维持数小时,如Figure02、优必选Walker S的续航时间分别为5小时、2小时。我们认为,在能量有限的前提下,具身智能的移动电池需要为行走、抓取等耗能较多的运动控制环节、以及端侧算力硬件的智能决策环节提供更多能量,降低通信传输过程的功耗一定程度上有助于延长具身智能续航时间。此外,具身智能内部电子元器件众多,尤其是人形机器人的类人形态进一步局限了电子元器件的布局,我们认为随着未来具身智能不断迭代升级,硬件基础设施的增加或进一步挤占内部空间,小型化的内部通信系统设计有助于为具身智能留出更多供硬件迭代升级的物理空间。
► 可扩展性:具身智能产业目前仍处于发展早期,未来的成长空间较大。我们认为,短期来看,具身智能本体的内部架构将持续升级以探索更优的工作模式,如根据场景需要增加传感器,通信节点有望增加。长期来看,一方面,我们认为具身智能尚未达到最终形态,具有成长性,类似人体肌肉会因锻炼而增大,随着具身智能自身的不断学习,其某些硬件基础设施或需进一步扩展;另一方面,具身智能的制造成本较高、使用年限较长,未来新技术在已有机器人上的应用或依赖于其本身软硬件的可扩展性。我们认为具身智能内部通信网络架构亦需具备可扩展性,以支撑具身智能的长期发展迭代。
短期高中低速通信协议并存,长期看好以太网演进为内部通信统一标准
具身智能内部通信主要涵盖信息采集回传和控制信号发送两个重要环节。传感器采集外部信息后转换为数字信号汇聚到中央处理器,处理器对接收到的数据进行解码分析后、将控制指令发送到执行器,各单元之间的数据传输离不开各类通信协议的支持。
信息采集回传:从传感器到处理器的数据汇聚
具身智能搭载的传感器类型众多,不同传感器对通信能力的要求存在差异。传感器连接了物理世界与数字世界,传感器到处理器的数据通信是人形机器人实现感知和决策的关键。不同类型的传感器所采集的数据在数据量、采样精度和频率等方面存在差异,对通信传输的带宽、可靠性、实时性、稳定性等提出不同要求,我们在下文将区分不同传感器类型对所采用的通信协议进行探讨。
1、CMOS图像传感器
图像传感器是将光信号转化为电信号的关键器件,数据传输具有较高带宽、较小失真的要求。图像传感器采集的数据量较大,即使是压缩后的视频流,每秒数据量仍可以达到几十到几百Mbps;此外,数据质量会直接影响人形机器人环境感知和人机交互的效果,因此图像传感器采集后传输到处理器的数据对失真的容忍度较低。目前图像传感器采用的典型通信协议包括USB、LVDS、以太网(Ethernet&EtherCAT)等。
► USB(Universal Serial Bus,通用串行总线):一种常见的串行数据传输接口,支持多种设备之间的数据传输,目前USB4协议最高传输速度可达40Gbps。
► LVDS(Low-Voltage Differential Signaling,低电压差分信号):采用低电压差分信号的传输方式。LVDS使用两条电压幅值很低的信号线传输数据,功耗较低且能够减少电磁辐射,具有较强的抗干扰能力,适用于需要高速、高可靠性、高信号完整性数据传输场景,目前LVDS已经广泛应用于汽车的ADAS系统、车载显示系统、工业自动化控制系统等。
► 以太网:局域网的一部分,节点通过介质(如双绞线或光纤)连接至交换机,通过交换机实现数据的转发,在计算机网络中应用广泛。得益于以太网传输速率高、耗能低、兼容性好等优势,传统标准以太网被不断改进跨界应用于车载、工业等领域。汽车领域,车载以太网通过改进以太网物理层标准、使用时间敏感网络技术(TSN)、引入SOME/IP协议等方式实现了可靠性、实时性、成本、软硬件解耦等方面的优化。工业领域,EtherCAT(工业以太网)在标准以太网基础上进行了适配复杂工业环境的改造,标准EtherCAT协议的传输速率为100Mbps,而作为标准EtherCAT协议的扩展,EtherCAT G传输速率可达1Gbps和10Gbps。EtherCAT采用集总帧进行数据传输,具有较高的实时性,同时具备灵活的拓扑结构,可拓展性较强,但成本较高,目前主要应用于工业自动化、机器人控制系统中。
图表2:LVDS、USB、EtherCAT、Ethernet比较
资料来源:CSDN,中金公司研究部
现阶段图像传感器大多通过USB协议进行数据传输,结合不同工作场景亦可使用其他协议。我们认为,USB具备成本较低、开发简单、技术成熟等特点,是短期内大部分人形机器人图像传感器实现数据通信的主流接口协议。同时,由于具身智能下游应用场景丰富,所面临的环境复杂多样,如在高干扰的特殊领域,或需要采用具有高可靠性和抗干扰性的LVDS;在有高精度和高实时性要求的场景下可采用价格较高的EtherCAT。
长期来看,我们认为朝着车载以太网演进的Ethernet有望成为传感器数据传输最终的主流协议。与LVDS相比,据OPEN Alliance官网,使用车载以太网相较LVDS能够降低30%的重量及80%的成本;与USB相比,车载以太网可拓展性强,实时性和抗干扰性能力突出;与EtherCAT相比,车载以太网的成本更低。我们认为,人形机器人与智能汽车架构高度重合,搭载的传感器与车端重合度大,车载以太网在性价比、传输速率、轻量化等方面具备诸多优势,出于对人形机器人降本诉求、内部空间、电池续航、工作环境等方面的考量,我们认为若人形机器人内部传感器到处理器的数据通信方式未来走向统一,朝着车载以太网演进的Ethernet有望成为最终通信解决方案。
► 产业链优势:计算机以太网自1980年IEEE 802.3工作组成立以来不断迭代,形成了成熟的产业链体系。车载以太网依托计算机以太网发展而来,可最大限度利用计算机以太网的产业链红利,快速以低成本实现商用和规模化生产。具身智能内部通信和智能汽车相似,且主导企业包括特斯拉等知名车企,我们认为或可平行迁移以太网从生产到应用于智能汽车的全流程,通过复用车端成熟供应链实现规模化生产并取得成本优势。
► 轻量化部署:传统的计算机以太网使用四对或两对非屏蔽双绞线电缆进行传输,而车载以太网则利用回音消除技术,实现单对非屏蔽双绞线双全工传输,因此车载以太网可实现轻量化部署,我们认为Ethernet应用于具身智能则有望减轻人形机器人的负载和能耗,节省布线空间,能够一定程度上解决人形机器人电池续航有限和内部空间不足的问题。
► 实时性传输:计算机以太网具有非确定性,针对此问题,IEEE 802.1开发了TSN(时间敏感网络),能够为以太网协议的数据链路层提供一套时间敏感机制,使得快速包能够插入正在处理的包队列中被优先处理,保证了车载以太网的延迟在微秒级范围内。
2、激光雷达、毫米波雷达等
部分人形机器人的视觉传感方案采用激光雷达或者毫米波雷达方案,生成包含丰富信息的点云数据。激光雷达通过发射激光束探测目标,毫米波雷达则通过利用毫米波频段的电磁波进行探测。点云数据包含丰富的信息,比如XYZ坐标、RGB、GPS时间、回波次数、扫描角度等,传回处理器后,结合算法能够快速3D建模,从而实现机器人对周围环境的感知。从数据量看,根据激光雷达分辨率不同,产生的点云数据量不同,高频激光可在一秒内获约150万个点云,需要较大带宽。从用途看,点云数据用以构建机器人对整体环境的基本感知,影响机器人的目标追踪、路线规划等功能,对信息失真的容忍度较低。目前雷达采用的通信协议包括CAN、Ethernet、ModBus、FlexRay等。
图表3:CAN、Modbus、FlexRay比较
资料来源:CiA,Modbus物联网平台、CSDN,中金公司研究部
短期内,不同分辨率的激光雷达和各类视觉感知解决方案带来不同的点云数据传输需求。对于采用较低分辨率激光雷达、或毫米波雷达方案的人形机器人来说,由于数据量较少,对数据传输速率要求较低,可使用成本较低的CAN、Modbus等通信协议;对于采用高分辨率激光雷达或主要依靠激光雷达进行环境建模的人形机器人来说,较高传输速率的以太网可能是更合适的选择。长期视角下,和我们在前文对图像传感器的分析判断类似,我们长期看好Ethernet成为激光雷达、毫米波雷达等视觉传感器的统一通信方案。我们认为,人形机器人的进一步发展会对点云数据密度提出更高要求,且随着人形机器人的商用和规模化生产,成本需进一步下降,低速的CAN、Modbus和较昂贵的FlexRay不再适用;朝着车载以太网演进的Ethernet具备传输速率高、性价比高等优势,目前已有不少激光雷达采用,如大疆Livox生产的HAP(T1)激光雷达采用了百兆车载以太网接口。
3、麦克风
麦克风采集音频数据,数据量较小但强调时序性、同步性。相较于视觉传感器,麦克风采集的数据量相对较小,对带宽要求较低。但一方面,音频的连续性会显著影响语音识别、人机交互等的效果;另一方面,人形机器人可能涉及多音频通道,如麦克风列阵中的多路信号,因此我们认为麦克风的通信传输需具备较好的时序性和同步性。目前麦克风常用的通信传输协议包括USB、RTP、AVB(基于Ethernet)。
目前USB技术较为成熟且成本较低,应用于多种机器人的音频数据传输中;RTP兼容性较好,可适配各种传输介质,操作较为简单,网络环境较简单的情况下性价比较高;AVB传输稳定,适用于较为复杂的网络环境。长期来看,随着人形机器人算法和内部结构的复杂化,为实现更加精准的人机交互,我们认为声学传感器采集到的音频数据会更加丰富,USB、RTP难以满足传输需求,基于Ethernet的高实时性和同步性的AVB协议潜力较大。
4、力矩、温度等其他传感器
相较于前文展开讨论的三类传感器,力矩传感器、压力传感器、温度传感器、惯性测试单元IMU等类型传感器不需要进行连续长时间维度的感知,只需在人形机器人有对应任务的时候进行调用。这些传感器每次产生的数据量较小,但调用时数据的更新频率较高,侧重于对抗干扰性、可靠性、实时性的通信能力要求。
目前上述类型传感器的数据回传协议以CAN为主,我们看好长期向Ethernet标准化演进。CAN总线技术成熟、成本较低、抗干扰性强,虽然传输带宽较小,但基本能够满足这类低带宽传感器的数据回传需求,成为通信接口协议的主要选择。展望未来,我们认为统一机器人内部通信有望简化开发集成和布线结构,减少定制化接口开发成本,随着Ethernet通信成本的不断优化,有望替代传统CAN总线。
控制信号发送:从处理器到执行器的信息传递
人形机器人的运动控制系统常见由上位机(监测控制平台)、传感器模块、主站、从站(全身运动规划、关节运动控制)构成。中央处理单元接收到传感器传输过来的大量数据后,CPU将由GPU生成的高层级行为决策转换成低层级的系统命令,将包含位置、姿态、转速等信息的控制信号经由主站传递给位于从站的执行机构,驱动器负责解析控制指令并将指令转化为电流信号驱动相应电机,电机通过减速器等传动装置将动力传递到机械本体,从而完成对机器人系统的精准控制。
图表4:人形机器人运动控制系统框架图
资料来源:《高效双足步行机器人关节多模式运动控制系统》(朱杰,2019),中金公司研究部
具身智能控制信号的传输难点主要在于关节运动控制对实时性、稳定性和可靠性的严格要求。人形机器人需要对外部环境的变化迅速做出准确反应,任何信号的抖动或丢失都会导致人形机器人无法协调自身动作。实时性能够确保控制指令在毫秒级传递,避免动作延迟;稳定性保证信号传输一致,防止因抖动导致的动作偏差;可靠性则要求系统在各种条件下都能准确无误地执行指令,避免因信号丢失或错误而出现故障。目前产业中应用较多的运动控制通信协议包括Ethernet、EtherCAT等。
EtherCAT在多轴高精度伺服电机、大量传感器的网络化运动控制系统中优势显著,适配具身智能内部通信要求。近年来EtherCAT持续受到工业自动化市场欢迎,节点数量不断增长,根据ETG统计数据,2023年EtherCAT节点总数达到7710万个,同比增长30%,其中新增节点数约1800万个。EtherCAT的集总帧技术、灵活的拓扑结构、冗余设计等特点使其具备高带宽、低延迟、高灵活性以及高可靠性的通信能力,满足具身智能内部控制指令的传输要求,目前已在较多人形机器人的控制系统中应用。
► 高带宽、低延迟:EtherCAT采用独特的集总帧技术,将所有从站数据集中在一个帧内传输,使其具备较低的通信延迟和高效的数据处理能力,能实现微秒级的同步通信。通过这种方式,EtherCAT能够在较短时间内实现多轴运动控制设备之间的高度同步,确保系统在复杂的机械运动中保持精确协调。
► 高灵活性、可拓展性:EtherCAT主站使用标准以太网控制器,具有良好的兼容性,能够无缝集成驱动器、变频器等多种设备和系统,在有大量关节控制的人形机器人中能带来布线简化、生态协同等优势。
► 高可靠性和冗余设计:EtherCAT进行了冗余功能标准化,通过使用最后一个从站设备的OUT端口,进行了线缆冗余设计。当线缆断线时,原本的环形线路可以变为两条连接主机的链路,从而继续工作。此外,EtherCAT可以自动检测故障点,简化维护工作。
自由度提升带来通信负载增加,多主站EtherCAT解决方案表现出色。为实现更加精准和拟人的动作,人形机器人的关节数目不断增加,如特斯拉的Optimus Gen-2全身约有52个自由度,优必选的WalkerS全身约有41个自由度,同步增加了控制信号的通信负载。单一主站EtherCAT技术在同时控制多关节运动时或存在性能瓶颈,影响整个机器人系统的通信速率和实时性,利用EtherCAT多主站同步通信机制能够协助中央处理单元将数据同步释放到所有关节链路中,各个关节同时接收到相应指令、并按照规划好的轨迹进行运动。
图表5:国讯芯微NECRO SDK人形大模型生态适配(采用多主站EtherCAT通信)
资料来源:国讯芯微官网,中金公司研究部
EtherCAT成本较为高昂,在具身智能商业化之路中或难以全面适用。EtherCAT硬件成本较高,需要专用硬件支持,且系统设计较复杂,需要更多的开发和维护成本。此外,EtherCAT由德国倍福(Beckhoff)公司开发,采用EtherCAT的设备通常需要支付专利费用,同时还需进行兼容性认证。根据北京航空航天大学采购招标服务平台,国讯芯微的一套基于EtherCAT的具身智能控制模组NSPICR006NP成交价高达26918元。10月11日,特斯拉召开“We Robot”发布会,马斯克强调Optimus的最终场景是To C,我们认为机器人在C端走向大规模量产对成本的要求较高,考虑到EtherCAT协议在具身智能全身应用的价格较高,运动控制系统的通信需要兼顾成本和性能,长期来看向车载以太网演进的Ethernet有望成为主流选择。
综上讨论,现阶段具身智能内部通信系统架构不一,基于数据量和通信需求而选择不同协议,多种通信传输协议并存,若未来具身智能内部需建立起标准化通信系统,我们看好Ethernet成为具身智能内部贯穿信息采集回传、控制信号传递全过程的统一通信方案。Ethernet支持长期演进,能够匹配具身智能通信需求的持续升级;同时产业规模扩大推动器件成本下降、Ethernet的轻量化部署能够减轻机器人供电负担。此外,我们认为未来具身智能将走向软硬件解耦,如同智能手机,可通过OTA(over-the-air,云端升级)实现远程更新,然而在传统分布式架构下,诸如CAN等传统网络均属于面向信号的通信,软硬件通信已事先确定,在OTA升级时存在不便;Ethernet与CAN等传统协议不同,传输的数据是基于标准化的数据包格式,可以适应不同类型和大小的数据,在系统升级或引入新功能时,只需要更新软件即可,无需对底层硬件做出改变,更契合OTA模式。
产业链:以通信接口及交换芯片为载体,连接各功能单元
具身智能内部通信单元涉及到的底层硬件包括接口芯片、交换芯片及通信线缆等。
► 通信接口芯片:通信接口芯片是数据传输链路中关键的每一道关口,承担系统互联、数据传输的职能。在传输接口侧,SerDes(SERializer串化器/ DESerializer解串器)作为以太网、PCIe等高速串行链路数据通信协议的重要底层技术,通常以IP核集成或独立芯片的形式存在,其工作原理是在发送端将多路低速并行信号转换成高速串行信号,在接收端将高速串行信号重新恢复为低速并行信号,实现串、并行数据间的转换。接口芯片的种类较多,包括端口控制芯片、接口转换芯片、信号调理芯片、多工器/解多工器芯片等。
► PHY芯片:一种数模混合芯片,连接数据链路层设备与物理介质(如光纤、铜缆),部署在网络拓扑架构中的各个节点,是实现数据收发功能的重要硬件载体。具体而言,1)当设备向外部发送数据时,MAC通过接口向PHY芯片传送数据,后者将接收到的并行数据转化为串行数据、并按照物理层的编码规则进行数据编码、再将数据变为模拟信号传输到外部;2)当从外部设备接收数据时,PHY芯片将模拟信号转换为数字信号,解码后经过接口传输至MAC层。
► ADC/DAC(模数/数模转换器):ADC/DAC通常集成在人形机器人感知系统和执行系统中,实现温度、压力、速度、光强等模拟信号和电压、电流等数字信号之间的相互转换。其中,ADC用于将模拟信号转换为数字信号,传感器中通常包含一个ADC,将检测到的力或扭矩等模拟数据转换为数字信号,传输给控制器进行分析和处理,值得注意的是,在某些传感器设计中,ADC可能集成模拟芯片存在于数字传感器芯片上;DAC一般存在于控制系统中,将数字信号转换为模拟信号,以驱动电机和其他执行机构执行相应指令信息。
► 交换芯片:交换芯片是用于交换处理大量数据及报文转发的专用集成电路,主要部署在中央控制器或每一个分域控制器中(若存在分域),其工作在Layer2,基于MAC地址进行交换。
► 通信线缆:人形机器人的通信线缆作为关键连接部件,对于确保机器人高效稳定运行至关重要。它承担着连接电源、信号、数据传输与控制电路等重要功能,为适应机器人复杂运动,需具有出色的柔韧性、耐磨性、耐油性和抗拉强度。
外部通信:以无线通信为主,蜂窝网络与局域网方案有望长期共存
对外通信是具身智能持续迭代的底座,赋能云-边-端协同
具身智能通过对外通信实现云-边-端协同,推动自身迭代更新。具身智能体在完成复杂任务与自身性能迭代的过程中对外通信技术不可或缺。一方面,多模态的真实环境及交互数据是具身智能算法迭代的基础,端侧的数据需要上传至云端进行模型训练,以提升模型的能力,而持续更新迭代的软件算法也有赖于通信网络实现OTA升级。此外,正如我们在《科技硬件:具身智能系列:智机融合,人工智能时代的星辰大海》中分析,具身智能的实现需要云-边-端算力协同,对具身智能实时状态监控、接收指令及智能体间的协同也要求对外通信能力的支撑。
真实的环境数据及交互数据对于模型能力提升至关重要,通信网络支持端侧数据上传至云端训练。为提升具身智能体的环境自适应性与泛化能力以实现更优的决策规划,具身智能体需接收端侧的多模态环境数据(包括文本、图像、音频、视频等数据)以及触觉(如力的反馈、表面材质)、姿态(如空间坐标、位移距离、旋转角度)等互动信息,在截面静态信息之外也需要反映智能体与环境在时空维度上的动态变化数据,并通过基于Transformer神经网络等算法开发的多模态大模型实现物体属性识别、时空信息的理解、环境交互学习等能力。我们认为,对外通信网络是端侧数据上传到云端的基础,具身智能模型算法的训练迭代需要对外通信能力的支持。
具身智能的实现有赖于云-边-端多层次算力体系,各层次间的协同需要对外通信网络。具身智能面临多维感知、复杂环境、多样化任务、高交互实时性等挑战,综合考虑算力、时延、功耗等要求,云-边-端一体化的计算架构成为具身智能的算力底座。在典型的场景中,智能体将采集的环境交互数据在本地或上传至边缘侧进行初步处理,并进一步将处理结果上传至云端实现深度分析;同时,云计算平台将训练好的模型下发至边端侧,支持智能体的实时决策和控制。我们认为,云-边-端算力架构要求具身智能系统中云计算中心、边缘计算节点及端侧之间形成高效的协同和通信。
图表6:传统的集中式云计算与“云-边-端”协同模式
资料来源:中国联通研究院《算力网络架构与技术体系白皮书》(2020),中金公司研究部
智能体需要OTA升级,具身智能的对外通信网络是数据更新包的云-端传输纽带。以智能汽车的OTA为例,空中下载技术OTA通过SOTA/FOTA/COTA等技术使得原始设备制造商(OEM)远程直联目标联网车辆并传输数据更新包,为终端汽车的智能升级和远程个性化服务提供通道。相较于传统的汽车软件/固件升级,OTA技术能够绕开售后服务中心等物理场所,快速修复系统缺陷、软件/固件迭代等,节约用户与车企的时间及费用成本,并确保客户使用时的高效安全。汽车OTA升级架构和流程主要包括数据更新包的1)升级:根据待修复漏洞及升级需求生成更新包;2)传输:通过无线通信,如3G/4G/WIFI等通信模块,将更新包下载至对应车载模块和特定的ECU;3)安装:安装并确保新的镜像文件替换掉旧版本。我们认为,在逐步实现商业化落地的过程中,具身智能的软件算法仍将持续更新迭代,作为实现云-端更新包传输的纽带——对外通信网络在OTA升级中不可或缺。
对外通信能支持对具身智能系统的状态监控及控制,并赋能不同智能体间的信息交互及协同行动。随着具身智能体应用场景的复杂化与多元化,其任务流程通常涉及多个智能体,而不同智能体之间需要进行高效的信息融合与协同运行以共同完成任务,这一过程对网络拓扑结构、算力网络的组网及编排调度提出了新的挑战。为实现算力与通信能力的高度协同耦合,确保具身智能系统稳定、高效的交互协作,网络架构和通信规格需不断完善;此外,出于安全、隐私及工作效率等因素考量,对于具身智能体工作状态与硬件指标的实时监控尤为关键,包括通过通信网络检验智能体是否正常运行、是否有故障从而启动维修、任务执行情况监督、位置信息反馈等,基于反馈数据识别现有或潜在的故障模式和异常情况,发出预警信号,通知操作员或维护团队采取相应的维修措施,能有效减少智能体停机时间、提高智能体的作业效率和使用寿命。
以无线通信为主,差异化落地场景需要多样化通信网络支撑
由于具身智能接收的物理数据与交互数据具备多模态的特点,对外通信网络的带宽通常要求较高;同时智能体的可移动性及环境交互性也要求对外通信具备强稳定性与低时延。考虑到具身智能应用场景的多元性,在面临不同细分领域场景时,所适配的对外通信网络会根据组网难度、便捷性、成本等因素而有所差异。具身智能的对外通信通常具备以下特点:
► 高带宽及低时延:具身智能涵盖各种复杂的应用场景和交互需求,其数据涵盖视觉(图像、视频)、听觉(声音)、触觉(压力、温度、纹理等)、运动(关节角度、速度、姿态、角速度等)等多模态数据,具有数据量大的特征,要求通信网络具备高带宽。此外,具身智能与环境持续交互,要求具身智能体能够迅速根据环境变化做出响应和决策,不同智能体之间的协同合作也对通信网络的低延时提出了要求。以自动驾驶为例,根据中国汽车工业协会,实现L4-L5级别的自动驾驶,需满足时延小于10ms[1]。
► 可移动性:为理解现实动态环境并执行复杂任务,具身智能体需要在物理世界中移动并与环境进行互动感知,而智能体的可移动性对于对外通信网络的覆盖能力与稳定性等提出较高的要求。
► 细分领域众多:在具身智能系统的广泛应用中,不同细分领域和场景对其对外通信网络的需求呈现出显著的多样性。例如,在矿场大型工业环境、移动范围广泛的电网巡检机器人以及智能汽车等漫游需求较强的领域内,蜂窝网络凭借其广泛的覆盖范围和稳定的连接有助于确保信息通信的灵活性与稳定性;而在一些无漫游需求的场景,如固定区域的智能监控系统或室内自动化设备,无线局域网则更为合适。
基于具身智能应用场景的环境复杂性、可移动性、灵活性的需求,对外通信以无线通信为主。有线通信是以同轴电缆、光导纤维等导线作为传输媒质的通信方式;无线通信则依靠电磁波在空间传播达到信息交换的目的。有线通信具有传输稳定性好、速率快等优势,但由于需要铺设管线,前期建设投入及维护成本较高,且灵活性受限;无线通信则不需要物理连接线,依靠电磁波在空间传播达到传递信息的目的,具备低成本、高灵活性等优势。我们认为,在具身智能场景下,对外通信将以无线通信网络为主。无线通信能够迅速构建通信网络而无需繁琐的布线过程,缩短了具身智能的部署准备时间,支持动态增减设备也使得具身智能系统能够根据实际需求灵活调整;此外,无线通信规避了线缆的物理束缚,满足具身智能强移动性的应用需求。
在无线网络中,由于图像等多模态数据的通信带宽要求较高,状态类信息的实时性要求较高,LoRa、sigfox、NB-IoT低功耗广域网的技术与具身智能体的适配性相对较低。作为LPWAN技术的分支,LoRa、Sigfox与NB-IoT均实现了长距离传输、低功耗的优势,但作为制衡,LoRa与Sigfox的每日传输次数均有限制,同时在数据传输速率、吞吐量方面也较蜂窝网落后,并不适合对实时通信要求较高的场景;而NB-IoT虽不限制传输数据的次数,所携带的数据量相对较高,但受限于较窄的工作频谱带宽,NB-IoT的秒级时延无法达到实时处理反馈云-边-端的数据,此外,NB-IoT为追求低功耗而不支持Handover切换,故适合发挥在相对固定且没有实时通讯需求的领域,比如每日固定回报数据的传感器,可测量温湿度、PM2.5等特定环境数据。综上所述,LoRa、sigfox、NB-IoT通信技术在具身智能等需要强实时性交互、大量数据传输和低延迟反馈的领域中适配性相对较低。
蜂窝网络支持漫游需求较强的场景,满足大范围覆盖、远距离传输、高速率要求
蜂窝通信通过采用蜂窝无线组网技术实现终端和网络设备之间通过无线通道的连接,进而实现用户在移动中可相互通信,并具有越区切换和跨本地网自动漫游功能。蜂窝通信网络是平面拓扑的互联网络,由美国贝尔实验室于1947年首次提出,它将一个移动通信服务区划分成许多以正六边形为基本几何图形的覆盖区域,称为蜂窝小区。该划分方式解决了公用移动通信系统要求大容量与频率资源有限的矛盾。经历数十年发展,蜂窝通信在维持其广域覆盖范围优势的同时不断提高传输速度,目前正处于5G向5.5G演进的窗口期,根据IMT-2030(6G)推进组,面向2030年商用的6G网络将涌现出智能体交互、通信感知、普惠智能等新业务新服务[2]。
图表7:5G/5G-A/6G关键性能指标对比
资料来源:IMT-2020(5G)推进组《5G愿景与需求白皮书(2014年)》,IMT-2020(5G)推进组《5G-Advanced场景需求与关键技术白皮书(2022年)》,IMT-2030(6G)推进组《6G典型场景和关键能力白皮书(2022年)》,MWC23,新浪科技,中金公司研究部
在漫游强需求的场景中,蜂窝网络能够很好地支持设备的移动通信需求,同时提供低时延的通信服务,并保障信号的相对稳定性和连续性。在矿场场景、电网巡检等情况下,运营数据传输及任务协同高度依赖于无线通讯网络,当智能体移动导致需要在AP之间切换时,与局域网相比,蜂窝网络在移动接入、业务灵活、建设运维等方面具有明显优势,能够实现广网络覆盖与无线漫游体验的连续性。
► 在实时性与低延时方面,蜂窝通信毫秒级的时延能够支持智能体快速响应环境变化,根据IMT-2030(6G)推进组,6G的空口时延将进一步降低至0.1-1ms。工业场景中具身智能体大多需要进行实时感知和决策,此过程要求信息在云-端间实现低时延通信。
► 在大带宽多模态数据传输方面,具身智能通过视觉、听觉、触觉等多种感知方式完成对物理世界环境信息的感知,协同作业于较复杂环境中。5.5G蜂窝网络的1Gbps上行速率以及10Gbps的下行速率为具身智能多模态数据的高带宽传输提供支撑,能有效完成本体数据采集、视频学习等行为,将捕获的异构数据作用于具身智能的训练和应用。
► 在高并发连接方面,具身智能体可能需要与多个其他智能体设备进行交互通信,蜂窝网络能够支持大量设备的并发连接(5.5G的连接数密度目标达到10个/m2,6G的连接数密度目标10-100个/m2),这对于复杂的多智能体协同至关重要。
► 在移动性与灵活性方面,具身智能系统往往在动态环境中工作,蜂窝通信广域覆盖的特性使得智能体能够在不同AP之间无缝连接。在实际工业场景中,智能体往往处于移动状态,当其面临不同AP的覆盖区域交界处时,蜂窝网络能根据当前位置和目标位置之间的距离和信号强弱,智能选择和快速切换至质量更优的AP,提供稳定可靠无线漫游环境。
我们认为,蜂窝网低延时、高带宽、高并发以及无线漫游稳定等优势无法被Wi-Fi、星闪等网络取代,未来会通过持续提升通信性能及优化成本,朝着具身智能各类场景需求持续演进,将在具身智能系统中长期应用。
WiFi、星闪等局域网凭借性价比及组网便利性优势,支撑无漫游场景需求
无线局域网络(WLAN)连接方式主要包括Wi-Fi、星闪等,由于其易组建和低成本等特点比蜂窝通信更适合无漫游的场景需求。具体而言,无漫游需求的通信方式适配于位置固定或移动范围有限的应用场景。如智能家居环境中,各种电子智能设备如智能音箱、智能照明系统和智能摄像头等通常部署在固定位置,并通过WLAN网络进行互联和数据传输,无需进行网络漫游。无线局域网能够在无漫游需求的场景中便利地实现了无线通信、数据传输与设备连接等功能。
Wi-Fi具备组网便利性及成本优势,适合在活动范围相对固定的场景下具身智能体的对外通信。Wi-Fi是由IEEE(Institute of Electrical and Electronics Engineers,电气与电子工程师协会)负责标准制定,Wi-Fi联盟负责标准执行的无线局域网技术,其诞生目的是改善基于IEEE 802.11标准的无线网络产品之间的互通性。Wi-Fi多工作于2.4GHz和5GHz频段,其最主要的优势在于不需要布线,组网成本较低,截至2024年已迭代至Wi-Fi 7版本,具备46.1Gbps的最大数据传输速率以及高达320MHz的信道带宽优势。
Wi-Fi组网相对灵活便利,节省用户的时间与费用成本。相较于蜂窝网络由运营商巨额投资建设、维护及运营,Wi-Fi支持用户自行组建网络,无需依赖外部运营商的基站建设及繁琐的布线过程,大幅提升了组网灵活性和便捷性。此外,从成本角度来看,蜂窝网络的建设和维护成本高昂,而Wi-Fi则以其较低的硬件成本和简单的配置流程有效节省用户的使用成本。我们认为,Wi-Fi在无漫游需求的场景下具备优势,包括家庭、小型工厂等场景下具身智能体的应用。
图表8:WiFi与蜂窝网络技术指标对比
资料来源:51CTO,稀土掘金,tp-link官网,康希通信招股书,IMT-2020(5G)推进组《5G-Advanced场景需求与关键技术白皮书(2022年)》,中金公司研究部
中国原生新一代无线短距通信技术,星闪旨在解决当下连接痛点。星闪NearLink旨在提供低功耗、低时延、高速率和高可靠的通信特性,以增强接入星闪设备的流畅性体验。作为新兴的国内通信协议,其场景支撑相当于WiFi+蓝牙,空口接入层包含两类模式:SLE(Sparklink Low Energy,星闪低功耗接入技术)和SLB(SparkLink Basic,星闪基础接入技术)。从使用效果看,SLE对标蓝牙,针对低功耗低信息量场景;SLB对标W-iFi,针对高速率大信息量场景。
星闪SLB模式与Wi-Fi的应用领域有所重合,均专注于在高传输速率、低延时、传输信息量大的场景下为用户提供实时、低功耗与高安全性的信息通信。星闪的SLB模式融合大量5G技术,包括支持类似5G的异步HARQ(Hybrid Automatic Repeat reQuest,混合自动重传请求)技术、类似5G的频域调度设计和帧结构等,大幅提高星闪SLB模式的通信性能。此外,得益于独特的空口技术设计,星闪在保持与Wi-Fi 7近似传输速度的同时实现了微秒级时延,并通过支持Polar数据信道编码,大幅提高抗干扰能力,此外,星闪最大连接数达4096个,是Wi-Fi 7的16倍,能够较好地满足万物互联场景下对于设备接入数量的高要求。
图表9:星闪与Wi-Fi 7技术比较
资料来源:EET China,中金公司研究部
我们认为,蜂窝网络与WiFi、星闪会长期共存。一方面蜂窝网络低延时、高带宽、无线漫游的优势难以替代,长期会在具身智能各类场景需求中持续演进落地;另一方面Wi-Fi的低部署成本、自组网优势会集中发力于无漫游需求的具身智能落地场景。我们认为,蜂窝网络与Wi-Fi在具身智能不同应用场景下各有优劣,有望长期共存,而面对具身智能对短距离通信技术低延时、高传输速率、多并发等方面提出的要求,星闪在技术层面高度契合,但当前的产业链成熟度较低、规模效应尚未凸显导致成本相对较高,未来有望在国产替代诉求下,在部分场景或下游客户实现对WiFi的替代。
产业链:通信模组为关键中间环节,上游核心元器件包括基带芯片、射频器件等
具身智能的端侧对外通信功能主要通过通信模块实现,上游元器件包括基带芯片、射频相关器件(ADC/DAC、滤波器、PA、天线等)、存储芯片等。其中,通信模组位于产业链中游,市场空间跟随蜂窝物联网连接数的提升而扩容,中国厂商在通信模组环节占据大部分的市场份额,根据Counterpoint数据,1Q24全球蜂窝物联网模组出货量同比增长7%,其中移远通信、广和通和中移物联网为全球领先模组厂商,合计占据50%的市场份额。
图表10:蜂窝通信模组市场份额(按出货量)
资料来源:Counterpoint,中金公司研究部
通信模组的上游是基带芯片、射频器件等生产原材料,标准化程度较高。其中基带芯片、射频、存储为三大主要成本构成,技术壁垒相对较高,市场相对集中;PCB、阻容感元器件等行业竞争较为激烈,市场相对分散。
基带芯片:各类终端和设备实现移动通信的核心部件。基带芯片指用来合成即将发射的基带信号,或对接收到的基带信号进行解码的芯片,根据所支持的通信协议分为非蜂窝基带芯片和蜂窝基带芯片,由于在设计时需考虑多频段、多模兼容以及毫米波解决方案的纳入,基带芯片设计难度较高,主要参与者包括高通公司、联发科、三星、展讯、华为海思、紫光展锐等,根据Counterpoint[3],4Q22高通以40%的市占率稳居龙头地位,紫光展锐以20%的市占率居第二,翱捷科技ASR市占率快速提升至9.4%,位居第三。我们认为,受益于国内智能手机、通信模组的高市占率,国产基带芯片厂商有望凭借本土服务与性价比优势实现份额的扩张。
射频器件:实现无线信号的接收、发射与转换。射频器件通常由多个关键部分构成,包括功率放大器(PA)、滤波器(Filters)、DAC/ADC转换器、天线等。其中,滤波器是核心射频器件,其作用是使电磁信号中特定的频率通过并较大程度衰减其他频率,从而避免不同频段的信号之间产生干扰,实现信号的清晰传输与接收;ADC/DAC能够将模拟信号(数字信号)转换为数字信号(模拟信号);功率放大器(Power Amplifier,PA)是射频前端模组中的重要器件,负责将射频信号放大到足够的射频功率,并馈送至天线进行信号发射。在信号接收过程中,射频单元通过天线单元接收射频信号,经过低噪放、滤波、解调等接收链路(RX)处理后,再进行模数转换(ADC)、下变频,转换为基带信号并发送给基带单元;在信号发送过程中,射频单元接收从基带单元传来的信号,经过上变频、数模转换(DAC)以及射频调制、滤波、信号放大等发射链路(TX)处理后,经由天线单元发射出去。根据Fortune business insights,2023年全球射频半导体的市场规模为221.0亿美元,预计2024-2032年的CAGR为9.8%。
空间测算:伴随中国人形机器人需求提升,对内对外通信的市场规模有望实现高速增长
在《具身智能系列:智机融合,人工智能时代的星辰大海》报告中,我们基于各个细分场景下的1)人形机器人是否具备商用型;2)企业主体应用人形机器人的意愿,对人形机器人在不同行业中的商业化节点及渗透率进行分析,测算的中国人形机器人市场空间,预计中国人形机器人出货量在2030年达到35万台,2024-30年CAGR有望达317%;市场空间有望于2030年达581亿元,2024-30年CAGR达259%。我们延续前次报告的测算,进一步分析中国人形机器人中通信系统的市场空间。
► 对内通信:
以特斯拉Optimus为例,一个人形机器人包含旋转执行器14个、线性执行器14个、灵巧手2个以及双足。每个关节需要一套包括电机(无框电机或空心杯电机)、减速器或丝杠、力传感器、编码器、控制器在内的硬件系统,此外还需要搭配各种环境传感器、运动传感器、计算单元、电池、对外通信模块、外壳等其他部件。传感器采集外部信息后转换为数字信号传递给中央处理单元,中央处理单元对接收到的信息进行解码分析并对自身行为进行规划决策,向控制模块发出指令,由控制器精准控制执行机构的位置、速度、转矩等输出变量,整个工作过程中各单元之间均需要利用通信载体进行数据信息的传递,离不开各类通信接口芯片、交换芯片的支持。
图表11:特斯拉Optimus本体构成及直线执行器、旋转执行器、灵巧手主要构成
资料来源:特斯拉官网,机器人在线,特斯拉灵巧手专利文件,中金公司研究部
我们预期未来人形机器人的本体架构有望趋于统一,以特斯拉Optimus为主流架构对内部通信硬件的市场空间进行测算。结合前文对人形机器人内部通信传输两个环节的讨论:
► 1)信息采集回传:机器人内部每个传感器末端均需配置一个通信传输接口,以将传感器采集的数据传输至中央处理器,统计得到特斯拉Optimus现阶段搭载的传感器约40个,对应40个物理通信接口。
► 2)控制信号发送:人形机器人由于全身自由度较多,采用分布式控制有利于系统功能的并行执行,能够缩短响应时间,形式上表现为每个关节配置一个控制器、躯干配置总控制器。以EtherCAT通信为例,各关节从站控制模块需与调度协调模块(主站)进行通信、以及与关节驱动器进行通信以实现对电机位置、力矩的控制。EtherCAT从站控制器(ESC)包含ASIC、FPGA或微控制器(MCU)等多种方案,每一种ESC都配备2个通信接口,可外接或直接集成PHY芯片。目前特斯拉Optimus的14个直线执行器、14个旋转执行器和一双灵巧手估测搭载32个控制器(按照执行器和控制器配置比例1:1测算,每只灵巧手则搭载2个控制器以控制多个电机),对应64个通信接口。控制系统中的编码器则通常与电机相连,将各运动关节的位置、状态等信息传递至驱动器,需配置一个通信传输接口,特斯拉Optimus共搭载54个编码器,对应54个通信接口。
► 3)总控制器:总控制器一般位于机器人躯干内部,通过以太网通信方式与每个关节系统控制器相连,向关节控制器发送命令和控制数据,以及接收其反馈的状态信息,实现模块之间的数据交换、控制系统功能任务之间的轮转调度。EtherCAT主站控制器一般采用标准以太网网卡,包含以太网介质访问控制器(MAC)、PHY芯片、隔离变压器等器件,以太网控制器负责以太网数据链路的介质访问控制功能;PHY芯片连接物理介质(如双绞线等)与MAC层,将MAC传送过来的并行数据转化为串行流数据,再将数字信号转为模拟信号通过物理介质传输,或者实现反向的传输。
结合供应商渠道及我们的产业链调研。我们按照每个通信接口侧的芯片或IP核的平均价值量(5元)计算,单台人形机器人156个通信接口侧涉及到的器件成本占机器人BOM成本的比重约为0.35%,叠加内嵌于中央计算单元中的交换芯片和PHY芯片,我们估计单台人形机器人内部通信所需器件的综合成本占比为0.4%。
图表12:人形机器人关节执行机构硬件构成和工作原理
资料来源:《智能电动执行器关键技术的研究和开发》(刘俊,2007),固高科技招股书,中金公司研究部
我们在前文中提到,具身智能产业目前仍处于发展早期,未来产业走向成熟、零部件成本不断优化,根据应用场景以及性能需要增加更多传感器以提高自由度,例如在肩、腰部增配六维力传感器,在关节处增配更多力传感器,在头、胸等部位增加惯性传感器,电子皮肤(柔性传感器)逐步渗透指节、手掌等更多部位,内部通信节点有望进一步扩展。2024年5月,马斯克透露今年计划将Optimus的手部自由度从11个提升至22个[4]。我们预计到2030年,单台人形机器人增配各类型传感器后通信传输接口数量有望增长至180个。同时,我们认为随着机器人系统规模的扩大和功能的增加,目前采用的单主站架构或存在一定局限性,可能需要增加主站设备来分担通信和控制任务,假设将双手、双腿、头与躯干等所有传感器分配至4个主站中(如图表所示),数据通信的交换节点数量增加,综合考虑器件成本的年降(假设在成熟第2-5年每年同比下降20%、此后每年下降10%),2030年单台人形机器人内部通信相关芯片成本占比提升到0.5%。结合此前测算的中国人形机器人市场空间,我们预计2030年人形机器人内部通信相关芯片市场空间有望达到2.9亿元。
图表13:2024-30E中国人形机器人内部通信接口市场空间测算
资料来源:国家统计局,《中国投入产出表(2020年)》,《中国人口普查年表(2020年)》,中金研究院,高工机器人,中汽协,特斯拉官网,淘宝网,中金公司研究部
► 对外通信:
对外通信依赖于通信模组,以特斯拉Optimus为例,我们测算通信模组的成本占比约为0.2%。我们认为,随着国内人形机器人的下游需求扩张,通信模组作为人形机器人对外通信的必备零部件,有望实现市场规模的同步快速提升,预计2030年出货量达到35万颗,市场空间有望达到亿元量级。
图表14:2024-30E中国人形机器人外部通信模组市场空间测算
资料来源:国家统计局,《中国投入产出表(2020年)》,《中国人口普查年表(2020年)》,中金研究院,高工机器人,中汽协,特斯拉官网,淘宝网,中金公司研究部
风险提示
人工智能技术突破遭遇瓶颈。具身智能对算法、算力、数据等提出较高要求。具身智能要求算法强调感知的细度与广度、与环境的交互性以及控制的协调性;具身智能算力需要能够快速、实时地处理多模态感知数据;具身智能数据也需要向更大规模、更多模态方向发展。如果算法无法实现对环境的全面感知、理解,无法做出准确合理的运动规划,如果边缘算力无法满足大算力、低时延、低功耗的要求,如果数据无法通过仿真模拟、开源数据集的方式弥补,则会限制具身智能的迭代发展。
具身智能商业化落地不及预期。由于具身智能产业尚处于发展早期,供应链尚未成熟,并未形成规模效应,因此当前具身智能系统成本高昂,典型的人形机器人产品价格都在几十万元的价位,限制了其进入应用场景的落地;同时具身智能的商业化路径尚未明确,如何平衡技术成熟度与市场需求、安全可靠性与成本都是业内亟待解决的问题;此外技术迭代的不确定性、数据的稀缺性以及下游应用侧对具身智能的拥抱态度迥异可能会导致具身智能的商业化落地不及预期,进而影响对本体公司以及上游包括通信在内的零部件公司的经营表现。
隐私安全问题。具身智能需要通过多种传感器实时感知周围环境数据,随着具身智能未来深度进入家庭场景、特种等行业,其数据收集能力和分析能力增加了隐私入侵的可能性,同时其自主决策和行动的能力容易将隐私威胁转变为实害,使得隐私和数据保护所面临的问题更为复杂。若未能有效确立隐私安全、数据安全的保护机制,并明确与之配套的立法追责路径,则会对具身智能系统在更多应用场景落地造成影响。
[1]http://www.caam.org.cn/chn/38/cate_435/con_5232537.html
[2]《6G典型场景和关键能力白皮书》,IMT-2030(6G)推进组
[3]https://iotbusinessnews.com/2023/03/29/40684-global-cellular-iot-module-shipments-jump-14-yoy-in-2022-to-reach-highest-ever/
[4]https://www.36kr.com/p/2763971579542532
本文摘自:2024年12月17日已经发布的《具身智能系列(三):机器人与通信网络,织就智能脉络》
陈昊 分析员 SAC 执证编号:S0080520120009 SFC CE Ref:BQS925
朱镜榆 分析员 SAC 执证编号:S0080523070002
郑欣怡 分析员 SAC 执证编号:S0080524070006
李诗雯 分析员 SAC 执证编号:S0080521070008 SFC CE Ref:BRG963
彭虎 分析员 SAC 执证编号:S0080521020001 SFC CE Ref:BRE806