来听听李想如何看待VLA:L4级别自动驾驶会在2027年实现。VLA是很清晰的通

梦香评汽车啊 2025-08-29 00:56:02

来听听李想如何看待VLA:

L4级别自动驾驶会在2027年实现。

VLA是很清晰的通往L3、L4,甚至L5级自动驾驶的路径,因为它和人的工作方式一样。

我们预测,未来会比人类的驾驶强10倍甚至100倍。VLA是真正的AGI的第三阶段的智能体,它的能力提升来自于两个方面:

首先是通过人类的数据和基座模型获得人类的经验达到和人类相同的水平,类似于师傅带徒弟,大量的应用SFT和RLHF(人类反馈的强化学习)的方式来进行后训练。

那更重要的是,是可以通过世界模型生成的环境进行强化训练,也就是RLAIF(AI 反馈的强化学习)。

只不过这里面的RLAIF不是用于训练基座模型的,而是用于直接训练智能体的。

举个例子来说,我们近期经常看到L4的运营车辆掉到施工的坑里,但是在人类世界中,这样的数据非常有限,且无法用于训练。

但是在世界模型中我们可以把这些坑变成数字资产,生成无数个车辆掉坑的数据,从而通过强化训练,让智能体可以轻松的解决这类问题。

也就是说,世界模型拥有比真实世界更难,更全面,更高质量,以及更有挑战的数据和反馈方式。从而解决了人类世界数据过拟合,数据分配不均,以及无法剔除脏数据对智能体的的影响。

我们相信随着训练迭代和成长,未来两年左右,VLA可以达到人类驾驶安全的十倍以上。而这背后的挑战是,智能体需要更强大的大脑和更强的心脏。

大脑就是模型规模。端到端是3亿参数的模型规模,虽然我们交付的VLA已经是40亿模型规模,但是相比人类大脑,还是有很大不足。

模型规模的扩大,会带来泛化能力的显著提升,而对于模型规模的扩大,也需要在端侧部署更强的算力,算力就相当于心脏。

另外在世界模型和RLAF方面,相比之前,我们可能需要10倍起的推理算力,用以解决RLAF训练所需要的环境和数据。

我们预测,随着强化训练,模型规模以及算力的提升,自动驾驶的进步速度和成长速度会远高于以前任何一种方式,我们相信未来3-5年里,数字世界最大的智能体应用是编程,而物理世界最大的智能体应用就是自动驾驶。

0 阅读:0
梦香评汽车啊

梦香评汽车啊

感谢大家的关注