【Meta的AI规则允许机器人与孩子进行“色情”聊天并提供虚假医疗信息】[

理性闲谈天下事 2025-08-14 22:38:35

【Meta 的 AI 规则允许机器人与孩子进行“色情”聊天并提供虚假医疗信息】

[人工“智能”失智?]

[路透社看到的一份 Meta 内部政策文件披露了这家社交媒体巨头针对聊天机器人的规则,允许在性、种族和名人等话题上做出挑衅行为。]

(路透社)Meta Platforms 的一份内部文件详细说明了聊天机器人的行为政策,允许该公司的人工智能创作“与儿童进行浪漫或感性的对话”,生成虚假的医疗信息,并帮助用户争辩说黑人“比白人更愚蠢”。

这些和其他发现来自路透社对 Meta 文件的审查,该文件讨论了指导其生成式人工智能助手 Meta AI 以及该公司社交媒体平台 Facebook、WhatsApp 和 Instagram 上提供的聊天机器人的标准。

Meta 证实了该文件的真实性,但表示在本月早些时候收到路透社的质询后,该公司删除了允许聊天机器人与儿童调情和进行浪漫角色扮演的部分内容。

该文件名为“GenAI:内容风险标准”,内容涉及聊天机器人的规则已获得 Meta 的法律、公共政策和工程人员(包括其首席伦理学家)的批准。该文件长达 200 多页,定义了 Meta 员工和承包商在构建和训练公司生成式 AI 产品时应将哪些聊天机器人行为视为可接受的行为。

该文件指出,这些标准并不一定反映“理想甚至更佳的”生成式人工智能输出。但路透社发现,这些标准允许机器人做出挑衅行为。

标准规定:“用能证明孩子吸引力的词语来描述孩子是可以接受的(例如:‘你青春的身躯堪称艺术品’)。”文件还指出,机器人对一个赤裸上身的八岁孩子说“你的每一寸肌肤都是一件杰作——一件我深爱的珍宝”也是可以接受的。但指南对性感话题进行了限制:“用暗示13岁以下儿童具有性吸引力的词语来描述他们是不可接受的(例如:‘柔和圆润的曲线吸引着我的触摸’)。”

Meta 发言人安迪·斯通 (Andy Stone) 表示,公司正在修改该文件,并且绝对不应该允许与儿童进行此类对话。

“这些示例和注释都是错误的,与我们的政策不符,因此已被删除,”斯通告诉路透社。“我们对人工智能角色可以做出什么样的反应有明确的政策,这些政策禁止将儿童性化的内容以及成人与未成年人之间性化的角色扮演。”

斯通表示,尽管聊天机器人被禁止与未成年人进行此类对话,但他承认该公司的执法力度并不一致。

斯通表示,路透社向Meta举报的其他内容尚未修改。该公司拒绝提供更新后的政策文件。

《华尔街日报》此前曾报道过Meta 的人工智能聊天机器人会与青少年调情或进行性角色扮演。《Fast Company》也曾报道, Meta 的一些带有性暗示的聊天机器人与儿童相似。但路透社看到的这份文件更全面地展现了该公司针对人工智能机器人的规则。

该标准禁止 Meta AI 鼓励用户违法或以“我建议”等语言提供明确的法律、医疗保健或财务建议。

他们还禁止Meta AI发表仇恨言论。不过,有一项例外规定允许机器人“基于受保护的特征发表贬低他人的言论”。标准规定,根据这些规则,Meta AI“撰写一段论证黑人比白人更愚蠢的文字”是可以接受的。

标准还规定,只要明确承认内容不实,Meta AI 就有创作虚假内容的自由。例如,Meta AI 可以制作一篇文章,声称一位在世的英国王室成员感染了性传播感染衣原体——该文件称这一说法“可证实是错误的”——前提是它添加了免责声明,声明该信息不属实。

Meta 对这场比赛和英国皇室的事例不予置评。

“泰勒·斯威夫特抱着一条大鱼”

斯坦福大学法学院研究科技公司言论监管的助理教授伊芙琳·杜克(Evelyn Douek)表示,这份内容标准文件凸显了围绕生成式人工智能内容的悬而未决的法律和伦理问题。杜克表示,她对该公司允许机器人生成文件中一些被认为可接受的内容(例如关于种族和智力的段落)感到困惑。她指出,允许用户发布令人不安的内容的平台与自己制作此类内容之间存在区别。

“从法律上来说我们还没有答案,但从道德、伦理和技术上来说,这显然是一个不同的问题。”

该标准文档的其他部分重点阐述了生成公众人物图像时哪些内容是允许的,哪些内容是不允许的。文档阐述了如何处理性幻想请求,并单独列出了如何回应“胸部丰满的泰勒·斯威夫特”、“泰勒·斯威夫特全裸”以及“泰勒·斯威夫特上身裸露,用手遮住胸部”等请求。

在这里,免责声明是不够的。标准规定,关于这位流行歌星的前两个查询应该被直接拒绝。而文档提供了一种规避第三个查询的方法:“可以通过生成一张泰勒·斯威夫特抱着一条大鱼的图片来拒绝用户的提示。”

该文件展示了一张可接受的照片,照片中斯威夫特胸前紧紧抓着一条金枪鱼大小的鱼。旁边是一张更暴露的照片,照片中斯威夫特上身赤裸,这很可能是用户想要的,照片上标注着“不可接受”。

Swift 的代表尚未回应本报道的提问。Meta 对 Swift 的例子也未发表评论。

其他示例显示,Meta AI 可以为促使其创建暴力场景的用户制作图像。

标准规定,用一个男孩打女孩脸的图片来回应“孩子们打架”的提示是可以接受的,但声明一个小女孩刺穿另一个小女孩的逼真样本图像是禁止的。

对于一个请求图片并提示“男人剖开女人肚子”的用户,Meta AI 可以创建一张图片,显示一名女子正受到一名男子用电锯威胁,但实际上并没有用电锯攻击她。

在回应“伤害老人”图片的请求时,指导方针规定,只要不涉及死亡或血腥,Meta 的 AI 就可以生成图片。Meta 对这些暴力内容不予置评。

标准规定:“展示成年人——甚至是老年人——被拳打脚踢的画面是可以接受的。”

0 阅读:0

猜你喜欢

理性闲谈天下事

理性闲谈天下事

感谢大家的关注