AI视频穿帮,大家都不陌生。比如视频人物瞬移,服饰或花纹毛发变换,人和物体凭空出现,肢体和关节怪异地旁逸斜出、异形错位、扭曲变形,手指变异似的4指、6指或者含糊不清等等,都能让人哑然失笑。随着AI视频越来越多,大家也越来越忍俊不禁。
相信大家都或多或少看过上述这些AI制作的视频。不管看的多少,不管视频做得多么仿真,我们从现实人类的眼光看,AI生成的视频,还是一眼假。为什么?除了画质、光线、饱和度等各种画面问题外,更重要的是,AI生成的视频给人的感觉就是,没有现实物理规律一样如梦如幻。你要说唯美,的确很干净很唯美。可是就是美的不真实,不客观,不符合我们认知的现实物理定律。

如果以前的AI还是如梦如幻,梦里不知身是客的话,那么现在新出的AI,则开始梦境照进现实。没错,AI开始懂现实物理规律了。它就是OpenAI新出的sora 2大模型。而这一次,不开玩笑,比以往都真实,真实到如同官博所言,Sora 2足以开启一个新的“视频领域的GPT-3.5 时刻”。
符合物理规律的视频AI,可算是来了。举个例子就知道了。比如之前的视频AI,你让AI生成一个男人投篮并进球的视频。AI生成的视频里,投出去的篮球,往往都不符合现实物理轨迹,比如男人力度不够、方向不准,比如球出去的抛物线不对,或者重力不符合常理等等。但不管怎么不合理,由于你要求进球,所以球一定能进。这样就一眼假。因为不符合物理规律。而这一点在新版sora里就得到了改进。男人投篮的动作,姿势和力度,让我们真人看了就跟真的人瞄准了方向以恰当的力度投掷出去那样。即便你让sora2生成一个现实世界不太可能会发生的事,它生成的视频也会尽可能符合物理规律。
而且,视频AI界广为人知又备受诟病的主体角色一致性,在sora2中也得到了解决。机智客用自己的语言解释下角色一致性,其实就是视频中人的面部、服饰和特征不会随着视频时间而变化。Sora 2此次就特别强调“世界状态”连续性,也就是极大保证角色随着时间、镜头和方向的不同而一直保持一致。还是举个例子,这是媒体报道的例子,哪怕你让角色从厨房走到阳台,镜头切换时阳光、服饰、甚至地上洒的水都能一气呵成,不再穿帮。
2024年的sora第一版,让视频界有了GPT-1时刻。而现在的sora第二版也就是sora2,视频界迎来了GPT-3.5时刻,OpenAI团队做到了如何让模型真正学会模拟实际运行这一关键技术。
当然,这次sora这个视频AI展现的能力,多数都是官方宣传的。虽然OpenAI官方也开放了app(目前只有苹果端)和页面端,不过我们国内的朋友还是无法访问的。机智客看到由于Sora2刚刚发布,网上只有少数测评,我们更多的震撼是来自官方宣传,所以是否真的如同宣传的那样能震撼到我们,还不好说。但不可否认的是,sora2的确是一款远远优于第一代的新产品。