国际象棋赛 OpenAI o3 模型碾压夺冠，马斯克的 Grok 决赛遭零封

近日，在一场备受关注的“人工智能国际象棋表演赛”中，OpenAI 的 o3 模型脱颖而出，成功夺得冠军。这场比赛于 8 月上旬在谷歌旗下的 Kaggle 平台上举行，吸引了来自全球的八个人工智能模型参与角逐。经过三天紧张激烈的淘汰赛，最终 OpenAI 的 o3 在决赛中以 4-0 的比分完胜 xAI 的 Grok 4，展现了强大的棋力与稳定性。

本次比赛的规则设定颇具挑战性，所有参赛 AI 模型均未接受专门的国际象棋训练，仅允许在赛前通过互联网获取相关知识。这意味着 AI 需要依靠通用语言理解能力和逻辑推理来应对复杂的棋局。o3 在整个赛事中表现抢眼，不仅在决赛中横扫对手，还在半决赛中轻松击败了自家的 o4 mini，展现了其在策略制定和局势判断方面的优势。

另一方面，Grok 4 在进入决赛前的表现也十分亮眼，先后击败了谷歌的 Gemini 2.5 Flash 和 Gemini 2.5 Pro，一度被视为夺冠热门。xAI 的创始人埃隆・马斯克曾公开表示，xAI 团队并未专门针对国际象棋进行优化。尽管如此，Grok 4 在半决赛前的表现几乎无人能敌。然而，到了决赛日，它的状态明显下滑，失误频出，最终未能夺冠。

国际象棋对弈平台 Chess.com 的总编辑 Pedro Pinhata 在赛后分析中指出，Grok 4 在比赛后期失去了优势，尤其是在面对 o3 时显得力不从心。此外，国际象棋大师中村光也在直播中评论称，Grok 4 在比赛中出现了不少低级错误，而 o3 则保持了稳定的发挥。

世界排名第一的国际象棋选手芒努斯・卡尔森则从专业角度对 AI 的表现进行了点评。他表示，这两款 AI 的棋力大约相当于刚入门的业余棋手，ELO 等级分约为 800 分。卡尔森认为，AI 在“吃子”这类战术计算上表现出色，但在“将死”对手方面仍显不足，形象地比喻为“擅长收集食材，却不会做饭”。

值得一提的是，专为国际象棋设计的人工智能系统在历史上一直表现更为出色。例如，AlphaGo 曾在 2019 年击败韩国围棋名将李世石，而 IBM 的“深蓝”则早在上世纪就战胜了国际象棋传奇加里・卡斯帕罗夫。这些系统都经过了专门的训练和优化。在今年早些时候的一场国际象棋比赛中，Grok 和 ChatGPT 都曾输给专为国际象棋设计的 AI 程序 Stockfish，显示出通用 AI 与专用 AI 在特定领域仍存在差距。

本文来源：