人工智能新进展:Claude Opus 4.1正式上线,编程能力再创新高!

Anthropic官方近日宣布,Claude Opus 4.1已正式发布,这一版本在多个关键性能指标上实现突破,尤其在编程能力方面表现亮眼,再次巩固其在AI模型领域的领先地位。

此次更新并未提升价格,依旧与Claude Opus 4保持一致,真正做到“加量不加价”。官方也表示,这只是未来大规模升级前的一次预热,接下来几周还将带来更重磅的模型优化。

编程实力再攀高峰,轻松应对复杂任务

在SWE-bench测试中,Claude Opus 4.1的性能提升至74.5%,超越了此前的Opus 4、Gemini 2.5 Pro以及o3等多个主流模型,成为新的SOTA(State of the Art)标杆。

除了编程能力,该模型在深度推理、数据分析、多文件代码重构等任务上也表现出色。开发者实测中,仅通过“build the tetris game”一条指令,就能高效完成俄罗斯方块小游戏的构建,展现出极强的指令理解和执行能力。

客户背书加持,真实场景验证模型实力

为了进一步展示Opus 4.1的实际应用效果,Anthropic邀请了多位企业客户参与测试并分享使用体验。

日本乐天集团(Rakuten Group)表示,该模型在大型代码库中能够精准定位问题并修复bug,且不会引入新问题,极大提升了团队的工作效率。Windsurf团队也指出,从Opus 4到Opus 4.1的提升幅度堪比Sonnet 3.7到Sonnet 4的进步,说明此次升级确实意义重大。

值得一提的是,此前因OpenAI收购风波,Anthropic曾一度中断与Windsurf的合作。如今随着Windsurf被Cognition收购,双方关系得以恢复,这也被外界视为一次技术与商业关系的双重修复。

低调发布背后,暗藏战略意图

尽管此次更新被官方定义为“小升级”,但发布的Blog却信息量十足:不仅展示了模型性能提升,还巧妙地通过客户案例展示了其市场影响力和产品实用性。

在当前GPT-5和Gemini 3相关消息频出的背景下,Anthropic选择以技术为核心、以客户为背书的方式发布Opus 4.1,既避免了过度营销,也赢得了开发者和企业用户的信任。

此外,Anthropic还同步发布了Opus 4.1的System Card,详细说明了模型的训练背景、无害回应率等关键指标。数据显示,在开启推理模式后,模型的无害回复率高达99.06%,安全性和实用性兼具。

开放使用,全面支持主流平台

目前,Claude Opus 4.1已面向所有付费用户开放,包括Claude Code功能。用户还可以通过API接口,以及Amazon Bedrock和Google Vertex AI等平台进行集成使用,灵活性和可扩展性都非常高。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...