(由多段落组成):
随着人工智能技术的飞速发展,AI模型在智商测试中的表现也引起了广泛关注。根据站长之家(ChinaZ.com) 4月27日的消息,IT行业传来最新动态:TrackingAI.com近期公布了一项有趣的发现——OpenAI推出的o3模型在门萨智商测试中取得了132分的高分。这项非官方的在线测试主要评估视觉模式识别能力,而o3作为一款专注于推理能力的AI模型,展现了卓越的表现。
o3的独特之处在于其“思考”过程。当用户发出指令时,o3会在回复前稍作停顿,分析相关提示并详细解释其推理逻辑。此外,这款模型还具备图像理解能力,可以对图片进行放大、旋转等操作。更值得一提的是,o3能够在浏览器中直接运行Python代码,并通过网络搜索获取最新事件信息。
OpenAI于去年12月首次公开了o3,并在今年4月16日正式发布,付费ChatGPT用户已可使用该模型。与此同时,谷歌的Gemini 2.5 Pro(Experimental)也在智商测试中获得了127分。Gemini 2.5 Pro同样是一款推理型模型,能够完成分类、预测、分析信息以及基于上下文和语气做出决策等任务。
除了OpenAI和谷歌,其他知名公司的AI模型也在智商测试中表现出色。例如,OpenAI同期发布的o4-mini取得了117分,这是一款在价格、速度和性能之间取得平衡的模型;美国Anthropic公司今年2月推出的Claude 3.7 Sonnet Extended得分为116分;埃隆·马斯克(Elon Musk)旗下的xAI公司推出的Grok-3 Sink则为110分。此外,中国的DeepSeek R1得分102分,Meta公司推出的Llama 4 Maverick得分为101分。
值得注意的是,大多数智商超过100分的AI模型都属于推理型模型。尽管智商分数并不能完全代表AI的真实智能水平,但它确实表明这些模型在一定程度上具备了像人类一样逻辑地解决复杂问题的能力。专家分析认为,随着推理能力更强的AI不断涌现,我们正逐步迈向一个全新的时代——“AI智能体(AI Agent)”将能够自主处理各种任务。
本文来源: