别克至境 L7 会首发 Momenta 6.0 方案,R6 大模型。
相比 5.0 ,Momenta 6.0 最大的变化就是基于强化学习。
5.0 也是大家主流路线,会找各种各样的老司机数据,让老司机来教会系统怎么开,以此类推攻克各个场景,让体验接近人。但是这种局限性就是始终很难超过人,始终是模仿的状态。
6.0 开始的强化学习,就不是单纯的模仿。系统通过奖惩反馈,能够自己主动去试错,去尝试,形成自主学习。没见过的场景也能自己找对策,而不是过去依赖人为设定的数据或者规则参数做决策。
因为驾驶本身就是一个决策序列,很多当下的决策会影响接下来的状态。所以也是我们说的为什么纯粹靠模仿走不通,因为模仿始终是一个当下的动作,开不出大家想要的连贯性,也始终不会超过人。
还有一个细节记得去年 Momenta 5.0 首发的都是像智己、昊铂、霸王龙。今年 R6 首发都是别克、 宝马、奔驰和奥迪了[哈哈]
别克至境L7首发搭载MomentaR6飞轮大模型