把L作为一种多模态数据输入,是行业共识。分歧点是,要不要有V-L-A的转换过程。

梦香评汽车啊 2025-11-05 16:40:03

把L作为一种多模态数据输入,是行业共识。分歧点是,要不要有V-L-A的转换过程。

小鹏VLA2.0选择了只把L作为数据输入,A是直出的。在自动驾驶时,其实就变成了V-A这个过程

但L并没有消失,这一点在小鹏的机器人上,会更显性。我猜测在车上,可能只存在于交互上了(并非COT)

这或许是小鹏座舱要做VLM的原因吧。

0 阅读:0
梦香评汽车啊

梦香评汽车啊

感谢大家的关注