国际象棋赛 OpenAI o3 模型碾压夺冠,马斯克的 Grok 决赛遭零封

整理后文章(适合SEO优化的多段落版本):

近日,在一场备受关注的“人工智能国际象棋表演赛”中,OpenAIo3 模型脱颖而出,成功夺得冠军。这场比赛于 8 月上旬在谷歌旗下的 Kaggle 平台上举行,吸引了来自全球的八个人工智能模型参与角逐。经过三天紧张激烈的淘汰赛,最终 OpenAI 的 o3 在决赛中以 4-0 的比分完胜 xAI 的 Grok 4,展现了强大的棋力与稳定性。

本次比赛的规则设定颇具挑战性,所有参赛 AI 模型均未接受专门的国际象棋训练,仅允许在赛前通过互联网获取相关知识。这意味着 AI 需要依靠通用语言理解能力和逻辑推理来应对复杂的棋局。o3 在整个赛事中表现抢眼,不仅在决赛中横扫对手,还在半决赛中轻松击败了自家的 o4 mini,展现了其在策略制定和局势判断方面的优势。

另一方面,Grok 4 在进入决赛前的表现也十分亮眼,先后击败了谷歌的 Gemini 2.5 Flash 和 Gemini 2.5 Pro,一度被视为夺冠热门。xAI 的创始人埃隆・马斯克曾公开表示,xAI 团队并未专门针对国际象棋进行优化。尽管如此,Grok 4 在半决赛前的表现几乎无人能敌。然而,到了决赛日,它的状态明显下滑,失误频出,最终未能夺冠。

国际象棋对弈平台 Chess.com 的总编辑 Pedro Pinhata 在赛后分析中指出,Grok 4 在比赛后期失去了优势,尤其是在面对 o3 时显得力不从心。此外,国际象棋大师中村光也在直播中评论称,Grok 4 在比赛中出现了不少低级错误,而 o3 则保持了稳定的发挥。

世界排名第一的国际象棋选手芒努斯・卡尔森则从专业角度对 AI 的表现进行了点评。他表示,这两款 AI 的棋力大约相当于刚入门的业余棋手,ELO 等级分约为 800 分。卡尔森认为,AI 在“吃子”这类战术计算上表现出色,但在“将死”对手方面仍显不足,形象地比喻为“擅长收集食材,却不会做饭”。

值得一提的是,专为国际象棋设计的人工智能系统在历史上一直表现更为出色。例如,AlphaGo 曾在 2019 年击败韩国围棋名将李世石,而 IBM 的“深蓝”则早在上世纪就战胜了国际象棋传奇加里・卡斯帕罗夫。这些系统都经过了专门的训练和优化。在今年早些时候的一场国际象棋比赛中,Grok 和 ChatGPT 都曾输给专为国际象棋设计的 AI 程序 Stockfish,显示出通用 AI 与专用 AI 在特定领域仍存在差距。

人工智能国际象棋比赛, OpenAI o3, Grok 4, AI国际象棋表现, Kaggle平台赛事

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...