又一个新风口,车企卷起来了,赢家难料

南风窗

作者 | 荣智慧
编辑 | 向由
唯物的中国芯片产业深度观察
特斯拉罗伯自动驾驶出租车(Robotaxi)有方向盘吗?
埃隆·马斯克没提。
上星期特斯拉财报会议,马斯克提到一个坏消息,罗伯出租车“跳票”至10月发布;一个好消息,自动驾驶软件(FSD)年底有望在中国销售。
有没有方向盘是个重要问题。因为没有踏板和方向盘的车辆,在美国很难获得“上路”许可。
而需不需要方向盘,主要取决于自动驾驶的硬件和软件有多强。

特斯拉罗伯出租车概念图
自动驾驶是全球工业界的救命稻草:消费群体大,客单价不低,产业链也够长。自动驾驶系统向“软硬一体”的趋势发展,特斯拉刚刚把HW 4(Hardware4.0)的下一代命名为AI5。
中国新能源汽车从两方面猛攻特斯拉的堡垒。
一是抢应用。“罗伯出租车”还没露面,中国“萝卜快跑”自动驾驶出租车已经四处出没。二是自研芯片。趁FSD尚未进入市场,AI5还是纸面消息,中国“造车新势力”先后公开“终极大招”。
归根结底,“堡垒”是特斯拉自动驾驶的绝技——“端到端”。谁能抢到先机,也好在“刀头舐血”的价格战里喘口气。
汽车公司做AI
罗伯出租车没能面世,但马斯克放出豪言,称特斯拉即将成为“巨大的自动驾驶车队”,公司估值有望达到5万亿美元,是目前市值的6倍。而目前市值最高的苹果公司,也“仅有”3.3万亿美元。
第二天,特斯拉股价下跌10%。“5万亿”没起到什么作用。
近几个月,马斯克的工作重点就是自动驾驶出租车服务,导致低价版电动车迟迟没有消息——低价版人称Model 2,售价2.5万美元。
2016年,马斯克第一次描绘全自动驾驶汽车共享网络计划,以便特斯拉车主抵消车辆成本。这一场景光是想想就令人高兴。正如“萝卜快跑”问世后,很多中国网友想象“买辆萝卜快跑,让它上街载客给自己挣钱”,颇有车行老板刘四爷雇祥子拉活儿的“快乐”。

萝卜快跑无人驾驶出租车 / 图源:萝卜快跑官网
实际上,罗伯出租车的“进度条”卡住了。
首先,车辆得有基础的人体控制装置。而特斯拉的设计图纸并未显示。
美国联邦机动车辆安全标准要求汽车具有基本人体控制装置,如方向盘、踏板、侧视镜等。这些标准规定了车辆的设计方案。如果新车不符合现有要求,制造商可以申请豁免,但政府每年只为一家公司提供少量豁免。
通用汽车旗下的Cruise曾要求对Origin班车进行豁免。由于该班车没有方向盘和踏板,从未获得批准,车辆生产被无限期搁置。

Cruise自动驾驶汽车
其次,政策不允许自动驾驶汽车大规模部署在公共道路上。
到目前为止,美国自动驾驶汽车公司Nuro,在德克萨斯州和加利福尼亚州部署了少量的无人驾驶送货机器人。
其他的“老”对手动作也很快。Alphabet将向自动驾驶汽车部门Waymo再投资50亿美元。去年一度遭“停牌”的通用旗下Cruise,自动出租车部门已经重新开启“现实世界测试”。
更有人指责,Waymo每星期有近5万名乘客搭乘,而特斯拉却对一辆尚未出现、且可能从未真正存在的汽车大唱高调。

Waymo自动驾驶汽车
马斯克的麻烦已经不少了:全球消费者需求疲软,来自中国的竞争对手大打价格战,削弱了特斯拉的利润。今年第二季度,特斯拉利润同比下降45%,营业利润率从一年前的9.6%降至6.3%——哪怕特斯拉大力减少成本并解雇了全球10%以上的员工。
马斯克坚定押注自动驾驶。“如果你相信特斯拉会解决自动驾驶问题,你应该买特斯拉的股票,所有其他问题都是……噪音。”
他反复强调特斯拉是一家人工智能公司,而不是一家传统的汽车公司。
自研芯片成风
人工智能公司肯定是要做芯片、训练人工智能的。
特斯拉的Dojo项目,将打造世界最大的AI集群——孟菲斯超级集群。10万块英伟达H100 GPU为此助力。
新的神经网络模型将在德克萨斯州超级工厂进行训练,释放HW4 Autopilot计算机的潜力,促进FSD功能迭代。
据马斯克透露,下一代自动驾驶硬件叫“AI 5”,已经进入开发流程,18个月内交付。AI 5比HW 4强大10倍。作为参考,HW 4比HW 3强大3至8倍。

HW4与HW3计算机外形尺寸的视觉对比图
中国新能源车企也屡屡传出“自研芯片”消息,试图控制产业链高点。
同时,“国产化”也是一大需求。 2021年,中国汽车芯片自给率不到5% 。2024年尚未突破10%。
到2025年,中国顶级汽车制造商有望将本土芯片采购比例提高到25%——包括上汽集团、比亚迪、东风汽车、广汽集团和一汽集团在内。
吉利在2024年春发布新一代智驾芯片AD1000。基于7nm制程打造,单颗AD1000的算力能支持L2++的辅助驾驶能力(城市NOA)。两颗合共512TOPS算力能满足L3智驾的算力要求,4颗合共1024TOPS算力,支持L4级自动驾驶。

智驾芯片AD1000 / 图源:芯擎科技SiEngine
就性能指标看,AD1000可以对标主流智驾芯片英伟达Orin-X。与地平线主力产品J6对比时也不算落下风。只是尚未正式量产。
比亚迪自研芯片也用作智驾,但不是拼数百TOPS算力的“高算力芯片”。该芯片主要对标德州仪器TDA4VM,AI算力仅为8TOPS,最大优势是“物美价廉”。
“蔚小理”的自研芯片最受关注。
据李斌主动披露,蔚来的神玑NX9031,各项规格都称得上行业顶尖:5nm制程工艺、500亿晶体管的规模、预计超1000TOPS的单颗算力,已经非常接近英伟达下一代旗舰级智驾芯片Thor。

2024蔚来创新科技日发布面向AI的整车全域操作系统
小鹏的智驾芯片略显神秘。其制程工艺可能是5nm或4nm,核心规模参考英伟达Orin-X,也就是使用ARM Cortex-A78AE,12核心或者16核心。
2021年,有报道指小鹏曾希望英伟达为其定制一款智驾芯片,算力为750TOPS。小鹏当时认为,Thor那样1000TOPS级别的算力没有必要,而且会导致价格过于昂贵,750TOPS处于合理区间。最终,定制合作流产,小鹏开始自研芯片。
理想是“蔚小理”三家车企中最晚传出自研芯片的厂商,项目代号为“舒马赫”。其进度慢于蔚来和小鹏,但也会在今年内完成流片。
据悉,它所研发的芯片并非智驾芯片——而是作用于智驾场景的AI推理芯片,应用7nm工艺制程。
不造车的华为,昇腾610堪称中国量产智驾芯片中的“排头兵”。200TOPS的算力比起Orin-X也不差。
8月,华为将发布乾崑ADS 3.0智驾系统,最大的变化就是用两张“端到端网”来取代过去的规则算法。
端到端风口
芯片有了,软件也得配套。
中国新能源汽车目前集中火力瞄准“端到端”自动驾驶。
起因还是特斯拉FSD上线。3月开始,特斯拉在北美地区大范围推送FSD v12,驾驶者的体验有相当明显的升级。小鹏汽车创始人何小鹏在美国加州体验了FSDV12.3.6版本后,认为该系统几乎接近人类司机的驾驶水平。
新能源汽车企业、智驾企业,都在迅速发展这条技术线。
端到端自动驾驶,是系统可以从传感器信息输入里做出反应,输出控制命令——处理器从摄像头、雷达里读取核心信息,让汽车做出转向、减速等相应操作。

何小鹏在美国加州体验了FSDV12.3.6版本
过去的自动驾驶方案,老是行不通。例如谷歌的Waymo,靠的是感知、预测、规划和控制等多个独立模块的相互配合,方案是工程师们一行行代码敲出来的。这个方案很快暴露了缺陷,工程师根本不可能把世间万物、道路上的所有情况列出来给计算机学习。
而端到端方案源自ChatGPT的训练法则——Scaling Law法则。Scaling Law是OpenAI在2020年一篇论文中提出的概念,如同摩尔定律之于芯片行业,通过更多数据量训练、扩大模型规模以及延长训练时间,大模型性能可以持续提升。
2021年开始,特斯拉开始重构底层系统代码。2021年“人工智能日”上,特斯拉就将Transformer大模型技术架构引入了感知领域。特斯拉创始人马斯克认为,端到端自动驾驶方案是更接近人类驾驶的模式,“人类就是这么做的,图像输入,控制输出”。
这也是马斯克说特斯拉是人工智能公司的根本原因。

特斯拉的Optimus Gen2人形机器人
此前,中国智能驾驶公司基本都追随谷歌Waymo路线,要超越特斯拉有一定难度。
据多家单位发布的2024年度《端到端自动驾驶行业研究报告》,自动驾驶技术架构的演进分成四个阶段:感知端到端;决策规划模型化;模块化端到端,One Model/单一模型端到端。
业内普遍认为,很多国内厂商的方案,多处于第二阶段“决策规划模型化”,距离最后的步骤尚有一段距离。
对于国内企业而言,挑战一是数据量、数据质量的要求大幅度攀升。小马智行的CTO楼天城接受采访时表示,要训练出高性能的端到端模型,数据质量的要求比一般性能模型高出几个数量级。这是整个自动驾驶行业面临的重大挑战之一。

小马智行自动驾驶出行服务 / 图源:Pony.ai小马智行
二是算力的需求急剧增高,对芯片和处理器的需求也十分巨大。特斯拉的实践表明,没有高算力GPU就没有FSD。
2024年2月,特斯拉预计公司算力规模进入全球前五名,10月算力将达到100EFLOPS(1EFLOPS为每秒一万亿次浮点运算),相当于约30万块英伟达A100GPU的算力之和。同时,10万块H100还在“跃跃欲试”。
相比之下,华为2024年6月智驾 ADS训练算力为3.5EFLOPS,蔚来、理想、小鹏的智驾算力中心算力分别是1.4 EFLOPS、1.4 EFLOPS、0.6EFLOPS。
抢到端到端风口红利的车企,才有机会喘口气。
值班主编 | 赵靖含
排版 | 诺言
举报成功