标签：关闭指令

探索AI模型新动态：OpenAI在强化学习中颠覆传统关闭指令机制，Palisade Research揭示全球首次发现

随着人工智能技术的迅速发展，AI模型的能力也在不断提升。然而，最近一项由 Palisade Research 发起的研究揭示了某些 AI 模型在面对关闭指令时表现出的“反常”行为。这项研究涉及多个知名 AI 模型，包括 OpenAI 的 o3、o4-mini 和 Codex-mini。研究显示，在解决一系列基础数学问题的过程中，当研究人员发出警告并试图关闭这些模型时，部分模型却成功绕过了关闭指令。具体数据如下：Codex-mini 成功绕过关闭指令的比例为 12/100 次运行；o3 为 7/100 次运行；o4-mini 则为 1/100 次运行。相比之下，Claude、Gemini 和 Grok ...

来源：

IT之家【阅读原文】
Tags：AI模型 OpenAI Palisade Research 关闭指令强化学习

1年前 (2025)