李想:关于VLA我也说说我的一个看法。2025年,整个辅助驾驶...

电动知识小妹 2025-08-29 00:25:26
李想: 关于VLA我也说说我的一个看法。 2025年,整个辅助驾驶行业遇到了至暗时刻。相关技术和体验的整个上半年的进展缓慢,同时还面临了来自监管的挑战。 但我认为这是黎明到来前的黑暗,VLA 是很清晰的通往L3、L4甚至是L5级自动驾驶的路径。 因为它和人的工作方式一样,我们预测,未来会比人类的驾驶强十倍,甚至一百倍。 VLA 是真正的 AGI 的第三阶段的智能体,它的能力提升来自于两个方面。 首先是通过人类的数据和基础模型,获得人类的经验,达到和人类相同的水平,类似于师傅带徒弟。 大量的应用类似 SFT 和 RLHF 的方式,进行后训练,更重要的是是可以通过世界模型生成的环境进行强化训练,也就是 RLAF。 只不过这里的 R,RLAF 不是用于训练基础模型的,而是用于直接训练智能体的,举个例子来说,我们近期在国外国内经常看到 L4 的运营车辆掉到了施工场景的坑里,但是人类世界中这样的数据非常有限,且无法用于训练。 但是在世界模型中,我们可以把这些坑变成数据资产,生成无数个车辆掉坑的数据,从而通过强化训练,让智能体可以轻松地解决这类的问题。 也就是说,世界模型有比真实世界更难更全面,更高质量以及更有挑战的数据和反馈方式,从而解决了人类世界数据过拟合、数据分布不均以及无法剔除脏数据对智能体的影响。 我们相信随着训练迭代的和成长,未来两年左右 VLA 可以达到人类驾驶安全的十倍以上,而这背后的挑战是智能体需要更强的大脑和更强的心脏。 大脑就是模型的规模,端到端是 3 亿参数的模型规模,虽然然后我们交付的 VLA 已经是 40 亿的模型规模了。 但是跟人类大脑相比,还是有很大的不足。模型规模的扩大会带来泛化能力的显著提升,而对应模型规模的扩大,也需要在端侧部署更强的算力。 算力就相当于心脏,通过给大脑持续的供血,从而运行更大的模型。另一方面,在世界模型和 RLHF 层面,相比之前我们可能需要十倍起的推理算力,用以解决 RLHF 训练所需要的环境和数据。 我们预测,随着强化训练模型规模以及算力的提升,自动驾驶的进步速度和成长速度会远远高于以前的任何一种方式。 我们相信未来三到五年里,数字世界最大的智能体应用是编程,而物理世界最大的智能体应用就是自动驾驶。 而且呢,我相信 L4 级别的自动驾驶将会在 2027 年实现。 理想汽车 ​​​

0 阅读:3

猜你喜欢

电动知识小妹

电动知识小妹

感谢大家的关注