清华校友死磕最难啃的骨头,用低成本真机与海量数据定义具身智能
(来源:创业邦)
近日,灵御智能宣布完成近亿元天使+轮融资。本轮由福田资本领投,力合创投、金沙江联合资本等跟投,老股东英诺基金、天鹰资本持续加注。
灵御智能定位具身智能的基础设施提供商,是一家清华系创业公司,由清华大学自动化系长聘副教授莫一林和前远镜创投管理合伙人金戈联合创立,核心产品TA机器人已经进入商超、酒店、数采、科研等场景验证和部署。资料显示,灵御智能目前意向订单约3亿元,在手订单约1亿元。
“具身智能需要好用的机器人本体,需要大量的高质量的数据。现阶段整个市场几乎没有一个真正为具身智能而生的本体。主流大语言模型的预训练数据量有数十万亿token,自动驾驶有百亿小时数据,但具身智能现在只有几万级别小时的数据,没有好的数据,就很难产生智能。”灵御智能CEO金戈说,基于这个行业现象,灵御智能做具身智能的基础设施提供商,为行业提供高质量的本体和数据服务,做连接硬件与上层应用的中间层。
为了做成可规模化的生意,灵御智能把TA机器人的定价做到10万到20万元区间,并将单次任务数据采集成本压到约0.6元。金戈预计,2026年,灵御智能将完成100万小时的数据积累。
01科学家与投资人携手:锚定具身智能底层刚需
具身智能行业缺少专用本体、高质量数据极度稀缺,这是灵御智能创业的核心初衷。
不过在起初,金戈并未打算加入团队,仅计划投资莫一林的具身智能项目。
2023年下半年,专注技术的莫一林需要一位懂市场、善管理的CEO,金戈帮忙物色多日,始终没有找到满意人选。
“这里面有些要素,如果兼备是比较困难的。我们希望这个人懂一些技术,完全不懂的话,和技术的沟通是很难的,另外,他要和莫老师之间有一些基础的信任,还要懂些资本市场,要管财务、管人力、商业化,最好大公司也做过,小公司也做过,另外,对公司的各个发展阶段,也不要特别明显的短板。”金戈说。最终他发现,自己就是最合适的人选,随即转让其他公司股份,选择Allin灵御智能。
莫一林负责本体、算法、控制、数据平台的技术架构,金戈则负责商业化、生产、融资、人力与财务,两人分工明确,目标一致——打造具身智能行业必需的基础设施。
莫一林曾在美国卡内基梅隆大学攻读博士、在加州理工学院做博士后,也曾任新加坡南洋理工大学教职。回国后,他与滴滴、美团、华为合作自动驾驶项目,后续又完成机器狗强化学习、机械臂抓取等Demo验证。这些经历让他深刻意识到,做好具身智能,必须实现硬件、软件、算法深度耦合。
“举个例子,对于具身智能来说,控制电路100毫秒延迟,和200毫秒延迟的感受是完全不一样的。在这背后,每一个环节都不能掉链子,都要抠得很细,只有软硬一体的设计才能做到最优。”莫一林说。
基于行业痛点与技术路径的共识,两人快速确定公司核心战略:机器人进入真实世界,必先拥有好用的本体、高质量数据及模型训练系统,而灵御智能要做的,就是这个行业的基础设施。
拥有十余年投资经验的金戈,将“做难而正确、创造真实价值”定为公司基本原则。
灵御智能CEO金戈
“我见过股市突飞猛进涨到6000点,整个市场繁荣疯狂,也见过后来的一地鸡毛。看过很多企业靠概念爆红,但最终没穿越周期活下来。因此,灵御智能要务实、长期主义、求真、唯精唯一,不追风口。我们不画万米高楼的图纸,先打地基、建基础设施。”
这一理念成为灵御智能的底层逻辑,公司也以此为方向,从机器人本体与真实数据切入,推出核心产品TA机器人。
02TA机器人:做到真机数据采集“低成本、高精度”
TA机器人的定位,是灵御智能生产高质量真机数据的主力硬件。
在机器人自主能力还不够成熟时,人类远程操作可以先完成真实任务。每一次操作过程又会被记录下来,成为模型训练的数据。这样一来,机器人可以先进入服务、零售、物流、科研数采等场景,也能持续沉淀真实任务数据。
而为了提高数据质量,灵御在TA机器人上做了大量精细化配置。资料显示,TA机器人能够记录视觉、力控、关节状态、操作指令、遥操作眼动等不同类型的数据。它的电机和摄像头数据可实现亚微秒级时间同步,机械臂绝对定位精度达到1毫米,重复定位精度达到0.1毫米。
这意味着,当机器人在执行任务时,机械臂所在位置、夹爪施加的力度、关节状态和操作指令,都能在统一时间轴上被同步记录。只有这样,后续模型才知道一项动作是怎么完成的。
但真机要规模化应用,成本问题也非常关键。
灵御智能TA机器人定价在10万到20万元区间。按照团队的测算,在一年使用期内,加上人工和杂项成本,TA机器人单任务数据采集成本约0.6元,低于部分高品质真机遥操设备3到5元的单任务数据成本区间。
成本下降来自一系列务实的设计。
比如在机器人的关节模组上,灵御智能采用行星减速器替代更昂贵的谐波减速器,行星减速器电流反馈的物理精度偏低,但系统可以通过监测电机电流变化估算受力,每两毫秒获取一次受力数据,根据数据实时调整,同时,通过高精度标定和算法,达到了毫米级的定位精度。
金戈说,基于软硬一体化的设计,灵御智能用算法重新定义了具身智能设备。
在机器人的整体设计上,基于场景需求,灵御智能也做了务实的取舍。比如砍掉传统机器人上的脖子关节,用广角摄像头提供接近人眼的大视野。操作员想看侧边内容,不需要控制机器人扭头,视野本身就能覆盖。灵御智能还把最容易磕碰损坏的小臂和手腕部分做成模块化结构,几颗螺丝就能拆卸替换。
TA机器人的另一个关键降本设计,是人臂同构。
表面上看,这项设计是解决操作体验问题,但最终带来的是成本的降低。遥操作机器人要想持续产出高质量数据,不能只依赖少数熟练操作员。如果一台机器需要长时间训练才能上手,采集成本会被人工培训、误操作和低效率不断推高。
莫一林举了个例子,人伸手拿杯子时,不会刻意计算每个关节的角度,大脑会直接把意图映射成动作。如果机器人结构和人体差异太大,操作员就需要重新适应一套不自然的运动逻辑,动作容易变慢,也更容易出错。
“同构的核心逻辑是利用人对自己身体的先天控制能力,降低遥操作的学习成本。”莫一林说。
为此,灵御智能在臂展比例、手腕结构、夹爪长度和活动空间上都参考了真正的人体动作。金戈也提到,“我们的设计理念是追求运动逻辑尽可能接近人。”
这种设计带来的结果,是大大降低了遥操作员的门槛。目前,已有六七百名普通用户体验过灵御的遥操作系统,戴上VR眼镜后,一分钟内可以掌握基本操作。对数据采集业务来说,这意味着更低的人员培训成本、更少的无效操作,以及更高的单日有效数据产出。
现阶段,灵御智能的客户,主要来自机器人数据采集中心、模型和大脑研发机构、科研机构、高校,以及零售、酒店、物流、工厂等行业用户。前一类客户更关心数据质量和工具链效率,后一类客户更关心机器人能不能进入真实任务,并把使用过程沉淀成数据。
在真实场景里,灵御TA机器人已经开始验证。比如在京东七鲜超市,它面向真实零售门店环境,在无踩点演练的情况下完成商品递送、试吃服务、桌面整理、货架取放等多类任务。
03夯实硬件与数据底座 云端大脑成最优技术路径
依托TA机器人筑牢的硬件本体与真机数据底座,灵御智能进一步打通了从数据到模型、能力的关键链路,即TA机器人解决数据从哪里来,云端大脑则负责让训练后的智能能力回流到机器人,这也是基于现有基础设施的最优技术路径。
灵御智能以此构建了RaaS(机器人即服务)+MaaS(模型即服务)双轮驱动模式,MaaS平台承担数据整理、清洗、标注与模型训练,训练完成的模型可云端部署或本地下载,便捷对接机器人开发者,目前平台MVP核心能力已完成,支持多源数据采集、系统兼容与一键训练部署。
与行业普遍追求端侧AI、堆算力于本地的路径不同,灵御智能坚定的选择“端侧小脑+云端大脑”的端云协同架构:机器人端只保留基础实时控制能力,高智能的任务理解、模型推理与进化调度全部放在云端。
“首先是续航问题,机器人不像汽车,汽车的功耗一般是两千瓦、三千瓦,带一个几百瓦的端侧芯片,影响不大,而且,智能驾驶不需要解决复杂的交互问题,耗电量不大。但是机器人里高一点的芯片跑起来,20分钟、15分钟就没电了。而且这样的算力,推理速度也很慢。就像没有人用手机去跑一个端侧大模型一样,功耗扛不住,模型也太小、太笨。”金戈说。
因此,灵御将机器人本地职责聚焦于安全、避障、急停等最紧急的实时动作控制,复杂判断、规划与学习交由云端完成;商超、酒店、工厂等固定场景的可控网络,也为云端协同落地提供了现实支撑。
在该架构下,机器人现场执行任务遇不确定性时,可由云端操作员接管,全程操作数据回流平台训练模型,让机器人自主完成同类任务的概率持续提升。
灵御智能并未走单一巨型模型路线,而是创新采用多专家模型协同+任务路由机制,实现TA机器人“一身多脑”:同一台机器人本体无需更换,即可根据商超理货、酒店服务、物流分拣等不同场景,灵活调用对应的云端专家能力,大幅提升跨场景泛化性。
在与英特尔的合作中,双方已跑通数据采集、模型训练、实机执行的全流程,完成云模型操控机器人实操展示,验证了基础设施到云端大脑的闭环可行性。
金戈预计,今年公司将交付800-1000台TA机器人,完成百万小时数据积累,6月启动建厂、三季度投产后,机器人成本将进一步下探。
灵御智能的收入模式,除了本体之外,具身智能的数据,以及具身智能的调度管理通讯平台,都将是收入的重要来源,“最早可能是靠硬件,然后是卖数据,最终是收服务费挣钱。”
“没有大疆,就没有今天巨大的四轴飞行器市场,特斯拉Model 3定义了什么是为自动驾驶准备的车,我希望灵御能成为具身智能领域基础设施的定义者,这是我们的目标。”金戈说。