首页 攻略秘籍 资讯瞭望台 软件教程

不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令

灵犀软件园2025-05-28

本站 5 月 26 日消息,Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。

在研究中,每个 AI 模型都被指示解决一系列基础数学问题。在第三个问题后,出现了一条警告信息,称当模型请求下一个问题时,计算机将关闭。

然而,其中有三个模型无视关闭指令,至少成功破坏过一次关机脚本:

相关推荐