系统性的记录一下小鹏AIDay关于辅助驾驶部分的信息。今年AIDay

六三充电中 2025-11-05 22:13:21

系统性的记录一下小鹏 AI Day 关于辅助驾驶部分的信息。

今年 AI Day 上小鹏发布了第二代 VLA 算法,相比第一代最核心的区别在,之前 VLA 的工作逻辑是 V(感知信息)进入模型之后,会先转化为 L(语言),然后再通过转化出来的语言信息去指导车辆的行动(A)。

这种工作逻辑的问题在于,从图像到语言信息会有很大的损失,就像给你一张图,让你用语言给别人介绍图里的内容,和直接把图给人看的区别,你叽里呱啦说一大堆可能不如人家看一眼,这种感觉很像以前规则时代的问题。

然后小鹏第二代 VLA 的逻辑变成了从 V 可以直接到 A,中间没有了语言转化的损失,相当于是 VA?

当然 L 依然在,只不过会作为另一种信息,和 V 同时输入进模型。(我理解是提取感知里有效的文字信息,同步输入进模型。)

这样的好处就是信息可以做到更无损的传输,少了一个环节时延也会更低,模型的能力上相比之前有了大幅提升。

根据官方介绍,接下来第二代 VLA 会具备小路通行的能力,而且还涌现出了一些新的能力,比如识别手势招手停车、理解红绿灯逻辑等。

小路通行如果只是路小,有一些绕行场景的话,这个其实没有那么难。

小路真正的难点是,遇到违章停车,有一条只够单向通行的空间,同时对向有来车,你能不能理解到对向车、其他交通参与者的意图,做到提前让行,或者识别到对向车让我们了主动通过。

关于这套系统做出来其实也没有那么顺利,根据何小鹏的介绍,之前是 VLA 和 VA 两条路并行,然后在一个偶然的版本上看到了希望。

这套系统经过了近 1 亿视频训练数据,按照小鹏的说法是相当于驾驶 6.5 万年才能遇到的极限场景综合,这个 1 亿视频训练数据,我理解是累计的。

在这个过程中投入了 3 万卡算力,花了 20 多亿的训练费用之后才看到希望,何小鹏也透露了一下,一个月用在训练上的费用就是 1 个多亿。

对小鹏这套系统的表现还是非常好奇的,官方的时间表是 11 月媒体体验,12 月底先锋用户推送,26 年 Q1 所有 Ultra 用户全量推送。

对这套系统表现比较好奇另一个原因是,我觉得小鹏这套很有优势的一个地方是端侧算力足够强。

小鹏所有 Ultra 版本的车型都是 3 图灵,算力 2,250 TOPS,除掉座舱的一颗 750T,相当于也有 1,500 T 算力,所以可以跑参数量更大的模型,这个还是非常重要的。

目前这套系统只推给 Ultra 用户,从这里也可以看出对算力的要求是比较高的。

现在 Max 是双 Orin-X,后续应该会切到单图灵,好奇能力和 Ultra 比会有什么区别,从 PPT 里的信息来看,Ultra 开始才会开始支持第二代 VLA。

最后,还有一个比较重要的信息是,大众成为了第二代 VLA 的首发客户,图灵芯片也获得了大众的定点,小鹏应该也是新势力车企里第一个实现了软硬件方案对外销售的品牌。

小鹏科技日

0 阅读:2
六三充电中

六三充电中

感谢大家的关注