博士级AI翻车现场：ChatGPT-5连地图都标错，OpenAI遭遇史上最大信任危机

【最新的 ChatGPT 应该达到“博士级”智能水平，但它甚至无法标注地图】

（CNN）人工智能炒作大师山姆·阿尔特曼（Sam Altman）如今陷入了危机公关模式。

OpenAI备受瞩目的ChatGPT机器人的最新版本本应达到“博士级别”的智能水平。它本应是该公司的一大飞跃，毕竟投资者已经向该公司投入了数十亿美元。

然而，ChatGPT却呈现出更平淡、更简短的人格特质，无法可靠地回答一些基本问题。由此引发的公众嘲笑迫使该公司不得不做出尴尬的道歉，同时仍然坚持其对机器人能力的夸大其词。

简而言之：它是个失败品。

关于这个名为GPT-5的模型的失误，有几点值得注意。

1. 它凸显了生成式人工智能诸多现存的不足之处，这些不足之处很快就被批评者抓住了（稍后会详细说说，因为这些内容相当有趣）。

2. 它引发了人们对OpenAI打造和销售人类愿意付费的消费产品能力的严重怀疑。对于投资者来说，这尤其令人担忧，因为OpenAI从未盈利，据报道其估值却高达5000亿美元。

让我们回到上周四，当时OpenAI终于向世界推出了GPT-5——据《华尔街日报》报道，比原计划晚了大约一年。这个行业的长处之一就是炒作，而在这方面，首席执行官山姆·阿尔特曼（Sam Altman）做到了。

在上周四发布前的直播中，阿尔特曼表示，与GPT-5交流就如同与“任何你需要的领域的真正博士级专家”交流一样。

阿尔特曼一如既往地以高调的风格表示，GPT-5让他想起了“iPhone从那些大像素的老款机型到视网膜显示屏的转变”。他说，新模型在明显和微妙的方面都有显著提升，“感觉像是我再也不想回到过去的东西。”阿尔特曼在新闻发布会上表示。

然而，当人们真正开始使用它时，情况就变了。

用户们纷纷测试GPT-5，并对其荒谬的答案进行嘲笑。

记者蒂姆·伯克（Tim Burke）在Bluesky上表示，他让GPT-5“给我展示一幅美国前12任总统的图表，上面有他们的面部图像以及图像下方的名字”。然而，机器人却返回了一张只有9个人的图像，还创造性地拼错了美国早期领导人的名字，比如“Gearge Washingion”和“William Henry Harrtson”。

对于要求列出最近12任总统的类似提示，GPT-5返回的图像中出现了两个乔治·W·布什（George W. Bush）的版本。不，不是乔治·H·W·布什（George H.W. Bush）和小布什，而是“George H. Bush”，并且他的儿子出现了两次。不过第二次出现时，小乔治看起来只是个普通路人。

GPT-5在标注美国基本地图时也遇到了困难，但正如科技作家埃德·齐特龙（Ed Zitron）在Bluesky上的帖子所展示的那样，这确实很有趣。

周三，我要求GPT-5给我一张美国地图时，它的表现稍好一些。有些人确实可以在没有博士学位的情况下正确标注佛蒙特州，但GPT-5却做不到。这是我第一次听说“Yirginia”这个州名。

当只有我们这些技术爱好者试图找出GPT-5的弱点时，它所犯的错误看起来很有趣。但一些ChatGPT的普通用户却笑不出来。尤其是因为用户们对新版本的人格特质——或者更准确地说，缺乏人格特质——感到特别不安。

在推出新模型时，OpenAI实际上淘汰了其早期模型，包括已经上市一年多且广受欢迎的GPT-4o，这使得即使是喜欢聊天机器人早期版本的人突然也无法使用它了。超过4000人在Change.org上签名请愿，要求OpenAI恢复该版本。

“我受够了ChatGPT 5，”一位用户在Reddit上写道，解释说他试图使用新模型运行一个“简单系统”，而早期的ChatGPT模型曾经能够处理这些任务。该用户表示，GPT-5“失控了”，删除了任务并更改了截止日期。

尽管OpenAI的支持者可能会将这归咎于个别事件甚至捏造的事件，但在GPT-5发布后的24小时内，阿尔特曼就陷入了危机公关，似乎对糟糕的反响感到措手不及。他在X上宣布了一系列更新措施，包括为付费订阅者恢复GPT-4o。

“我们预计在一次性推出这么多东西时会有一些颠簸，”阿尔特曼在帖子中表示，“但情况比我们希望的更糟糕！”

首席执行官未能预见公众的愤怒表明，他对大约7亿每周活跃用户如何使用其产品的了解并不深入。

也许阿尔特曼错过了所有关于人们与ChatGPT或竞争对手聊天机器人形成深厚情感联系的报道——这些报道来自CNN、《纽约时报》和《华尔街日报》，人们仿佛与这些机器人进行着无尽的对话，仿佛它们是真人一样。在Reddit上简单搜索一下就能了解其他人如何将这个工具融入到他们的工作流程和生活中。基本的市场调研本应让OpenAI明白，大规模更新并淘汰人们依赖的工具，其后果将不仅仅是“有点颠簸”。

当被问及对GPT-5的反弹时，OpenAI的一位代表将CNN指向阿尔特曼在社交媒体上的公开声明，这些声明宣布恢复旧版本，以及一篇关于该公司如何优化GPT-5的博客文章。

混乱的推出过程反映出整个人工智能行业都在努力证明自己是消费产品的生产者，而不是他们喜欢称呼自己的“实验室”——因为这种称呼听起来更科学，也转移了人们的注意力，让人们忽视了一个事实，即他们背后有投资者试图为自己赚取巨额财富。

人工智能公司通常会围绕模型在各种幕后基准测试中的表现大做文章，这些测试展示了机器人在复杂数学计算方面的能力。就我们所知，GPT-5可能在这些评估中表现出色。

但问题是，OpenAI把炒作推向了平流层，失望本应（或本该）是不可避免的。

“我真没想到OpenAI会在这么平庸的东西上砸了自己的招牌，”著名研究员、人工智能批评家加里·马库斯（Gary Marcus）写道，“在一个理性的世界里，他们的估值应该会受到影响，”他补充说，OpenAI尚未盈利，正在降低价格以维持用户数量，并且随着竞争加剧，人才也在大量流失。

对于像马库斯这样的批评家来说，GPT-5的失败是一种证明。正如他在博客中指出的那样，埃隆·马斯克（Elon Musk）的Grok等其他模型的表现也不尽如人意，即使是人工智能的支持者也发出了反对的声音，这似乎是一个转折点。

当人们谈论人工智能时，他们通常在谈论两件事之一：我们现在拥有的人工智能——具有有限、明确用途的聊天机器人——以及像阿尔特曼这样的公司声称他们能够打造的人工智能——能够超越人类智慧的机器，能够告诉我们如何治愈癌症、解决全球变暖、驾驶我们的汽车、种植我们的庄稼，同时在这一过程中娱乐并取悦我们。

然而，随着每一个新模型的推出，人工智能的承诺与现实之间的差距似乎越来越大。