刚听完小鹏新上任的智驾一号位刘先明讲解小鹏第二代VLA。总结一下，核心就是：极致

刚听完小鹏新上任的智驾一号位刘先明讲解小鹏第二代VLA。

总结一下，核心就是：极致是架构就是最美的。

——泛化（模型适应不同场景）-涌现（不可能的产品形态、业务形态变得顺理成章，过去是跷跷板，今天智驾能力可以稳定上涨）-演进（超越过去的i knew）

过去，智驾分两条路，产品的方法、技术的方法，如果技术能力不能就只能用产品的方法。

——要从终局思维出发：“距离l4还有多远”。刘先明认为，模仿学习的路走不通，99.9999%永远与L4有差距。

——自动驾驶问题=物理AI问题

但物理AI的难点主要有三个：

1.物理AI输入信号不再是结构性的文字信号，视频是离散的。

2.控制信号是连续的，离散化的token给不了连续信号。

3.强化需要是有监督的微调，按照步骤给分。解决物理AI要用world model。wm的定义是如果给它刺激，它要给反馈。

——小鹏第二代VLA的方法：

输入：拿掉text，（拿掉文字指令，比如super lcc，漫游类的业务形态）

云端：world simulation，上车的时候会拿掉云端的部署。

核心是：V+L—V，拆掉语言的拐杖，取掉语言的转译。

没有复杂的方法，本质上是大模型+大算力+大数据。

小寒船长总结了一句话，被刘先明认为很准确，大家可以参考：第一代VLA本质上是VL模型加了一个轨迹图，第二代VLA的本质是一开始就用三元组数据进行联合训练。

——小鹏第二代VLA特点：

1.高效率。过去只要有语言存在一定会需要监督、筛选，过去先train文字，再去讯。文字还是做token，

2.保证原始信号。人类做动作，过程是：理解场景——根据历史信息做判断——直觉做行动。物理世界是需要直接输出行动的。

3.无需数据标注（要去欧洲不需要定向采数据，只需要有小鹏的车就可以），模型可以使用无监督的数据。

4.无信息损失

5.极致的端到端

小鹏汽车

0 阅读：0

真有这么蠢的人，就像ai看病一样，我真麻了