云霞育儿网

昨天马斯克的一则推文,揭开了一个事实,当前的 AI 大模型,已经充满了错误和垃圾

昨天马斯克的一则推文,揭开了一个事实,当前的 AI 大模型,已经充满了错误和垃圾,以至于为了上线新一代 Grok,马斯克的 xAI团队不得不重新梳理一遍整个人类的知识库,以便于“把遗漏的补上,把错的删掉!”

其实,每个大模型的品质不仅来源于其推理能力,更加决定于训练所用的数据库。谷歌Gemini很高的品质呈现,源于 Google 搜索引擎严谨的算法和高质量的内容积累,但也难免被一些网络上的垃圾所腐化。ChatGPT 等品质大幅下滑,也和生成式AI 的内容以讹传讹有关。

比较严重的是中文世界的DeepSeek,已经被谣言和错误信息污染到无法被信任,因为采用了大量的垃圾信息,国内很多大模型的状况都是如此。

但是马斯克说的,再用干净的数据重新训练模型的说法,也存在很大的问题——什么才是干净的数据,谁来判断是否干净?因为认知和知识的局限性,靠人工判断显然不现实,如果靠 AI来校验 AI,能力和尺度也不太值得信任。

全世界的生成式 AI 都已经被污染,这个或许就是残酷的事实。

当然,原生态的数据经过整理之后,品质肯定会好很多,但是尺度把握不当,更大范围的污染将会发生。

评论列表

小老虎
小老虎 1
2025-06-23 18:22
居然在AI世界里也这么垃圾
慕容日落
慕容日落 1
2025-06-23 18:17
我也很好奇,梳理完,AI大模型会不会说西方历史90%都是伪史,毕竟,AI思考完会发现很多东西根本不可能发生
DCDC
DCDC 1
2025-06-23 17:06
梳理全人类的知识库,马斯克的嘴巴一如既往的金光灿灿