小米在广州车展上要发布自己的世界模型,未来车企基本上都会跟进世界模型,有能力的会自研世界模型,能力差点的就直接用公版了。聊聊什么是世界模型。简单来说可以把它看作是给机器加了一个“脑子”。根据已经看到的“画面”,猜到接下来会出现的 “画面” 。这里的 “画面” 不只是眼睛看到的图像,还包括耳朵听到的声音、身体感受到的震动,甚至汽车传感器捕捉到的距离、速度 —— 只要是人和机器能感知到的任何信息,都能成为它的 “素材”。比如说你看到绿灯还有三秒钟但是自己距离绿灯还有段距离,就会判断自己过不去,开始减速。理想状态下的世界模型和这一模一样,它的核心逻辑就是:输入“过去的信息”,输出 “未来的信息” 。这些信息可以是任何形式:图像、声音、文字、速度、距离,只要是能被记录下来的“感知数据”,都能被世界模型用来做预测。世界模型的预测不是瞎猜,之前的大模型就是瞎猜,大模型胡说八道大家也不是第一次见了。说到这里我还是好奇为什么某些人用AI伪造国家文件堂而皇之的发出来到现在还没事。比如,一个LLM可以描述篮球会弹跳,但它可能不理解为什么会弹跳。而世界模型可以帮助AI建立对三维物理世界的认知,理解物体的运动规律、碰撞、重力等。比如说画一个滚动的皮球,LMM能画出和之前看过的类似的画面,但如果皮球前面有个台阶,它不知道“皮球滚到台阶会掉下去”,可能还会画成继续往前滚。这也是之前的AI生图那么诡异的原因世界模型不一样,它不仅能识别到这是滚动的皮球,还能根据场景规律,预判接下来的剧情:皮球滚到台阶前,接下来会掉下去。看到这里你应该就明白世界模型对辅助驾驶的重要性了,它让辅助驾驶开车更像老司机。如果打个比方的话,之前的辅助驾驶像幼儿园小朋友,世界模型更像三年级的小朋友虽然有质的提升,但本质上还是小朋友,大家用的时候还是要小心谨慎一点
