新浪科技

李想开炮:大部分车都是「假智能」

智能车参考

关注

贾浩楠 发自 副驾寺

智能车参考 | 公众号 AI4Auto

“给我拍张照片吧,要不网上留下的都是我举桌子的。”

2026年6月15日,理想技术日,李想站在台上,手里举着一块芯片——理想自研的AI芯片马赫100

台下笑了。

一年前MEGA HOME发布会上举桌板,有人觉得幽默,但也有人觉得滑稽,争议不少。李想很聪明地用自嘲和过去的形象划清界限。

而连同个人过去的标签,一起被李想甩倒身后的,还有“智能汽车”这四个字。

他说了一句很多人不爱听、也不一定认可的话:

“今天的智能汽车,其实不智能。”

意思是,理想不再跟友商卷智能汽车了——理想在做在思考的,是具身智能汽车应该长什么样?

物理AI怎么在一辆车上真的跑起来?

这不是一次升级。这是一次和主流产业界的割席断交。

是飞升还是飘了?李想给出的技术逻辑和实现路径,藏着答案。

李想的具身智能汽车,啥样的?

李想狂戳行业肺管子:“今天的智能汽车是假智能”,他的论点有三个。

安全上,传统智驾遇到复杂、极端场景会直接退出,把方向盘甩给毫无准备的驾驶员——近一半的智驾事故发生在接管瞬间,合规但不安全、不负责任。

能力上,智驾只会向前、向左、向右,不会像人一样倒车腾挪,也不会靠边停车。

效率上,你赶时间或走窄路时宁愿自己开,因为智驾太慢。一个号称“智能”的东西用起来比人还慢,用户凭什么买单?

基于此,李想定义的具身智能汽车是这样:它是一辆电动车,一位职业司机,一台AI计算机,一个生活助手。

四个角色合为一体,指向三大升维——从功能安全到保护人类安全,从调用功能到独立完成任务,从运行缓慢到比人类效率更高。

比如挖掘机爪臂伸出时减速、收起时通过——它看懂了;保安打手势,它识别停和走;激光雷达被遮挡,它自己靠边并请车主帮忙。

再比如一句“去新国展充电”,它自己找有空位的充电站导航过去;窄路会车时自主倒档礼让;泊车时对外喊话“麻烦让一下”;被保安告知不能停,它回“那我换个车位”。

生活助手场景更惊艳:用户丢出一串混乱的接人顺序和生日安排,它自动重排并规划最优路线;从Party模式到“哄宝宝睡觉”,它联动音乐、灯光、空调、悬架一键切换;甚至“耳机找不到了”,它直接回答“在扶手箱上”。

这些案例的共同本质:车不再等你“调用功能”,而是一个超级Agent,理解目标、自主完成。这就是李想所说的“独立完成任务,比人类更高效”

李想的具身智能技术栈

理想的打法很清晰:从最底层的计算范式开始重构,向上依次是芯片、操作系统、模型、交互,每一层都为物理AI原生设计,层与层之间深度耦合而非简单堆叠。

这套体系的核心逻辑可以概括为——用数据流芯片提供算力基座,用AI原生操作系统调度确定性延迟,用VLA融合模型理解物理世界,用Agent完成自主任务

四层一体,才能让车从“功能执行”变成“目标完成”。

最底层:芯片的范式革命——数据流架构

一切能力的起点是算力。但理想的判断是:传统芯片架构已经跑不动AI了——摩尔定律和登纳德缩放定律双双在失效边缘,但AI算力需求在以超指数级增长,这个剪刀差,是行业最深层的矛盾。

底层因素,是传统芯片架构基于冯·诺依曼,指令队列顺序执行,大量晶体管消耗在“取指、译码、调度、分支预测”这些管理开销上,真正用于计算的效率只有30%-50%。而AI计算天然是并行的、数据关系确定的。

理想给出的方案是抛弃指令驱动的范式,改用数据流架构

马赫M100芯片内部由56个计算单元和数据处理模块构成,通过网格总线和环形总线互联。没有中央指挥,数据在阵列中自由流动,流到哪里就在哪里触发计算

单芯片算力达到1280 TOPS——量产车的行业第一。数值之外,有数倍性能领先,比如官方给的案例是跑千问3.5大模型,甚至比一台4万元的桌面AI超算还要快1.5-2.7倍。

操作系统层:星环OS——AI原生神经系统

理想没有用安卓或Linux魔改,而是从零打造了星环OS,专门为AI原生和具身智能设计。它的核心任务只有一个:把感知、决策、执行全链路打通,确保关键任务的延迟是确定的、极短的。

传统车载OS是多层软件栈堆叠,传感器数据经过层层传递才能到达决策模块,每个环节都有不可控的抖动。星环OS为紧急刹车这类任务开辟了“火箭通道”,从硬件中断到执行器响应,整条链路被统一调度。

配合全栈自研的线控底盘,端到端反应速度做到了0.28秒,比人类平均反应快40%。120公里时速下,这多出来的0.17秒意味着提前6米刹停——一台劳斯莱斯幻影的长度,也是生存与毁灭的全部距离。

芯片和OS的深度协同,是理想软硬件一体化的第一道关。

模型层:VLA——让机器真正“看懂”物理世界

理想的模型体系分为两路,一路处理语言,一路处理物理世界,最终融合成完整的具身大脑。

语言智能负责逻辑推理和任务规划,包括端云双模型:云端的马赫Mind Pro是强Agent模型,Token消耗降38%,推理速度208 token/s,效率是主流模型的两倍以上。

端侧的马赫Mind Edge则Always-on运行在车机本地,毫秒响应、数据不上传、能直接调用车辆硬件。

两者配合,让车既能理解“先去接老大再去接老四最后给老四过生日”这种复杂指令,又能实时回答“我的耳机在哪”。

处理物理世界任务的核心是3D-ViT(Vision Transformer) ,将多视角摄像头同步采集的图像切分成固定大小的Patch(图像块),每个Patch被线性投影为一个向量,并加上时序信息(当前帧与前后若干帧)一起输入Transformer编码器,通过多头自注意力机制计算所有Patch之间的相关性。

然后编码器输出一个统一的3D场景表示——可以是体素网格或隐式神经场,每个体素附带语义类别标签。

3D-ViT的能力,是输出“在坐标(x,y,z)处有一个正在伸臂的挖掘机”这样的结构化语义信息,不需要预先为每一种可能出现的物体编写规则。

语言、物理AI模型,统一在MoE(Mixture of Experts,混合专家模型)下, 核心思想是将模型拆分成多个“专家”子网络,每个专家擅长处理某类特定输入。同时有一个“门控网络”负责判断当前输入应该由哪些专家处理。

使得MoE模型能在保持超大参数量(从而具备强大表达能力的)同时,将单次推理的计算量控制在一个较低水平。

本质上是让“看见、理解、行动”从一开始就在同一个框架里对齐,而非机械地把几个网络串联成“端到端”。

比如VLA将3D-ViT输出的3D语义场景直接输入到MoE架构的决策模块,形成端到端的统一模型,覆盖从像素到轨迹的全链路,所有参数联合优化,彻底消除了模块间的信息损耗和目标冲突。

交互与Agent层:从“调用功能”到“完成目标”

第一层是意图理解与任务拆解。当用户输入一段自然语言,语言模型(马赫Mind系列)先进行语义解析,将模糊目标转化为结构化的任务树——哪些硬件参数的变化符合用户的需求。

第二层是工具调用与跨域执行。传统车控是扁平的原子指令,Agent则构建了一个可调用的“工具库”,覆盖娱乐系统、车身控制、空调、底盘、导航、第三方应用等数十个域。

规划模块决定调用哪些工具、以什么顺序调用、如何处理依赖关系,内部还会维护一个短期记忆,记录当前车辆状态和执行进度,以便在长链路任务中支持恢复和纠偏。

第三层是端云协同的推理与响应。Mind Edge运行在车机本地,负责低延迟、高隐私的场景——如“耳机找不到了”这类实时问答,数据不传出车外。

马赫Mind Pro部署在云端,处理长链路、复杂推理的任务——如包含多个地点和约束条件的路线规划、需要外部知识检索的出行攻略。

Agent架构的语言智能部分与机器智能(MoE)并非独立运行,而是在决策层深度融合,Agent的最终决策需要同时满足语言指令的约束和物理世界的实时条件。

总结一下,理想把车打造成具身智能产品方案,技术框架的逻辑非常清晰:

最底层的数据流芯片马赫100,解决了“算得动”的问题;

星环OS解决了“来得快”的问题;

3D-ViT模型解决了“看得懂”的问题;

Agent解决了“做得到”的问题。

四层缺一不可,层层自研、层层打通,统一在MoE架构下。

行业第一份物理AI答案,理想给出的

2025年初,李想的一系列AI Talk并不被人理解——“有点颠,好好造车不行吗?”

一年多后,理想用Livis Day第一次给出了系统性、技术性的回应:AI汽车,不是加个语音助手或升级智驾,而是从芯片架构、模型架构、操作系统到体验的全套重构。

造车这件事本身,除了提供现金流和利润,更本质的是围绕这个汽车这个载体,构建一套从芯片到算法再到OS,甚至包括用户一侧的Agent的物理AI全栈技术平台

因为汽车本身足够普及、足够高频、足够复杂,也是最强的用户入口,背后连接着最广泛的终端触点。

物理AI内涵,不是模型对数字世界的脱离、泾渭分明,而是横跨虚拟和现实维度,完成各种物理的、语言的任务

换句话说,理想比任何自动驾驶玩家都更深一层。

相对绝大数把物理AI挂在嘴边,只有使命愿景、市值管理,却没有技术路线落地思考的L2玩家,理想领先不知多少个身位。

相对L4阵营来看,他们从Robotaxi的出租车产品需求出发,的确只需要把驾驶这件事做好,VLA中的L(language)是Over Kill,没必要。

但理想则从具身智能、物理AI与真实世界、用户的交互出发,没有单一押注vision based或language based,提出了任务导向、用户导向的综合软硬件技术——

第一次系统性地回答了物理AI怎么在车上落地,而物理AI的终点,远比自动驾驶要远。

可能被质疑、被模仿、或被证伪,但历史来看,从来没人可以假装理想的思考和实践不存在。

One More thing

不是老有人黑理想用户乱停车吗?

这次李想给了「官方回应」:

李想的AI形象坐在桌前,认真地翻阅一本名为 《停车的艺术》(The Art of Parking) 的书,封面还印着“如何正确泊车”,书页看起来已经被翻了不知道少次。

没人比李想更会玩梗,没人比李想更会自嘲。

加载中...