刚听完小鹏新上任的智驾一号位刘先明讲解小鹏第二代VLA。总结一下,核心就是:极致

冰绿评汽车啊 2025-11-06 14:20:04

刚听完小鹏新上任的智驾一号位刘先明讲解小鹏第二代VLA。

总结一下,核心就是:极致是架构就是最美的。

——泛化(模型适应不同场景)-涌现(不可能的产品形态、业务形态变得顺理成章,过去是跷跷板,今天智驾能力可以稳定上涨)-演进(超越过去的i knew)

过去,智驾分两条路,产品的方法、技术的方法,如果技术能力不能就只能用产品的方法。

——要从终局思维出发:“距离l4还有多远”。刘先明认为,模仿学习的路走不通,99.9999%永远与L4有差距。

——自动驾驶问题=物理AI问题

但物理AI的难点主要有三个:

1.物理AI输入信号不再是结构性的文字信号,视频是离散的。

2.控制信号是连续的,离散化的token给不了连续信号。

3.强化需要是有监督的微调,按照步骤给分。解决物理AI要用world model。wm的定义是如果给它刺激,它要给反馈。

——小鹏第二代VLA的方法:

输入:拿掉text,(拿掉文字指令,比如super lcc,漫游类的业务形态)

云端:world simulation,上车的时候会拿掉云端的部署。

核心是:V+L—V,拆掉语言的拐杖,取掉语言的转译。

没有复杂的方法,本质上是大模型+大算力+大数据。

小寒船长总结了一句话,被刘先明认为很准确,大家可以参考:第一代VLA本质上是VL模型加了一个轨迹图,第二代VLA的本质是一开始就用三元组数据进行联合训练。

——小鹏第二代VLA特点:

1.高效率。过去只要有语言存在一定会需要监督、筛选,过去先train文字,再去讯。文字还是做token,

2.保证原始信号。人类做动作,过程是:理解场景——根据历史信息做判断——直觉做行动。物理世界是需要直接输出行动的。

3.无需数据标注(要去欧洲不需要定向采数据,只需要有小鹏的车就可以),模型可以使用无监督的数据。

4.无信息损失

5.极致的端到端

小鹏汽车

0 阅读:0
冰绿评汽车啊

冰绿评汽车啊

感谢大家的关注