把L作为一种多模态数据输入,是行业共识。分歧点是,要不要有V-L-A的转换过程。
小鹏VLA2.0选择了只把L作为数据输入,A是直出的。在自动驾驶时,其实就变成了V-A这个过程
但L并没有消失,这一点在小鹏的机器人上,会更显性。我猜测在车上,可能只存在于交互上了(并非COT)
这或许是小鹏座舱要做VLM的原因吧。
把L作为一种多模态数据输入,是行业共识。分歧点是,要不要有V-L-A的转换过程。
小鹏VLA2.0选择了只把L作为数据输入,A是直出的。在自动驾驶时,其实就变成了V-A这个过程
但L并没有消失,这一点在小鹏的机器人上,会更显性。我猜测在车上,可能只存在于交互上了(并非COT)
这或许是小鹏座舱要做VLM的原因吧。
作者最新文章
热门分类
汽车TOP
汽车最新文章