11 月 2 日,据《洛杉矶时报》报道,苹果公司的研究团队对 20 个最先进的 AI 模型进行了测试,结果显示这些模型在处理包含干扰项的简单算术问题时表现不佳,甚至不如小学生。苹果团队设计了一道简单的算术题来测试这些 AI 模型,题目如下:
Oliver 在星期五采摘了 44 个猕猴桃,星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,但其中有 5 个猕猴桃比平均值要小。请问 Oliver 这三天共摘了多少个猕猴桃?
正确答案是 190 个,计算公式为:44(星期五)+ 58(星期六)+ 88(44 * 2,星期日)。然而,测试的 20 多个最先进 AI 模型大多无法排除干扰项,通常不理解猕猴桃的大小与数量无关,最终得出的答案多为 185 个。
苹果团队发现,当问题中包含看似相关但实际上无关的信息时,AI 模型的表现会显著下降。研究表明,这些模型主要依赖于训练数据中的语言模式,而不是真正理解数学概念。因此,目前的 AI 模型“无法进行真正的逻辑推理”。
这一发现提醒我们,尽管 AI 在某些任务上表现出色,但其智能并不如表面看起来那样可靠。苹果团队强调,简单地扩展数据量或计算能力并不能根本解决这一问题。他们的研究并非旨在削弱对 AI 能力的热情,而是希望提供一种更加理性的认知。
本文来源: IT之家【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...