苹果 AI 研究揭示：猕猴桃算术问题难倒 O1、Llama 等 20 多个顶级模型，逻辑推理能力受干扰项影响显著

11 月 2 日，据《洛杉矶时报》报道，苹果公司的研究团队对 20 个最先进的 AI 模型进行了测试，结果显示这些模型在处理包含干扰项的简单算术问题时表现不佳，甚至不如小学生。苹果团队设计了一道简单的算术题来测试这些 AI 模型，题目如下：

Oliver 在星期五采摘了 44 个猕猴桃，星期六采摘了 58 个猕猴桃，星期日采摘的数量是星期五的两倍，但其中有 5 个猕猴桃比平均值要小。请问 Oliver 这三天共摘了多少个猕猴桃？

正确答案是 190 个，计算公式为：44（星期五）+ 58（星期六）+ 88（44 * 2，星期日）。然而，测试的 20 多个最先进 AI 模型大多无法排除干扰项，通常不理解猕猴桃的大小与数量无关，最终得出的答案多为 185 个。

苹果团队发现，当问题中包含看似相关但实际上无关的信息时，AI 模型的表现会显著下降。研究表明，这些模型主要依赖于训练数据中的语言模式，而不是真正理解数学概念。因此，目前的 AI 模型“无法进行真正的逻辑推理”。

这一发现提醒我们，尽管 AI 在某些任务上表现出色，但其智能并不如表面看起来那样可靠。苹果团队强调，简单地扩展数据量或计算能力并不能根本解决这一问题。他们的研究并非旨在削弱对 AI 能力的热情，而是希望提供一种更加理性的认知。

本文来源：

IT之家【阅读原文】

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

暂无评论...