性能提升24%

以下为人工撰写风格、深度、SEO友好优化后的中文文章整理稿。在保留核心事实与科技张力的基础上，重构逻辑脉络、增强可读性与信息密度，规避原文重复表达与情绪化措辞，融入自然关键词布局、段落语义分层及搜索引擎偏好的结构化表达（如小标题引导、数据强调、术语解释），同时确保真实、合规、无夸大，并符合国内AI监管语境。

（由多段落组成）

Anthropic正式公布Claude Mythos预览版：性能突破显著，安全优先策略引发全球关注

2026年4月8日，人工智能安全前沿公司Anthropic通过官方博客及合作渠道，低调但郑重地发布了新一代大模型——Claude Mythos的预览版本。该模型并非简单迭代，而是在多项权威技术基准测试中实现跨越式提升：在面向软件工程任务的SWE-bench Pro中代码修复准确率提升24%；在经人工复核验证的SWE-bench Verified中仍保持13%的稳定增益；在终端交互与自动化操作类评估Terminal-Bench 2.0中，智能体执行能力跃升17%。对比当前行业公认的强基线模型Claude Opus 4.6，Mythos展现出系统性优势，标志着AI在复杂推理与具身编程能力上的新临界点。

“玻璃翼计划”启动：不开放、先防御，重构AI发布范式

值得注意的是，Anthropic并未同步开放Mythos的公共API或消费级访问权限。取而代之的是名为“Project Glasswing”（玻璃翼计划）的全球协同安全倡议。该计划核心理念是：以攻促防、未发先治。Anthropic将Mythos预览版定向提供给Amazon、Apple、Google、Microsoft、NVIDIA、Linux Foundation等头部科技企业及40余家关键开源基础设施维护方，授权其在受控环境中，主动调用Mythos进行漏洞挖掘、渗透测试与防御体系加固。此举打破传统“发布—适配—响应”的被动安全节奏，转向“预演—加固—共建”的主动防御新范式。

高阶代码能力伴生新型风险：AI原生漏洞利用能力进入实战阶段

技术评估显示，Mythos已具备远超常规白帽工程师的自动化漏洞识别与链式利用能力。测试中，该模型在主流操作系统内核、浏览器渲染引擎及云原生组件中，累计发现并验证了数千个高危及以上级别安全缺陷（CVSS评分≥7.5）。这并非理论推演，而是基于真实环境的可复现攻击路径生成。Anthropic明确指出：当AI能自主完成从静态分析、动态触发到权限提升的完整攻击闭环时，“AI安全”已从学术议题升级为国家级数字基建防护刚需。

真金白银投入：1亿美元专项额度+400万美元开源捐赠，夯实协同防御底座

为支撑玻璃翼计划高效落地，Anthropic宣布两项实质性资源承诺：第一，设立最高1亿美元的模型使用专项额度，覆盖合作伙伴在漏洞扫描、补丁验证、防御策略训练等环节的算力与工程成本；第二，向OWASP、OpenSSF等国际知名开源安全组织捐赠400万美元，用于构建AI友好的安全知识图谱、自动化修复工具链及开发者教育体系。这一组合举措，被业内视为近年来最具实操性的AI安全协同实践之一。

从实验室走向基础设施：AI安全需跨域共治，时间窗口正在收窄

Anthropic在公告中强调，面对AI原生威胁的指数级演化速度，单点防御已失效。未来网络安全防护体系必须融合前沿AI公司、软件供应链厂商、独立安全研究者、开源社区及政策制定者多方力量。据内部技术路线图预测，下一代模型在漏洞利用效率、零日发现速率等方面或将迎来新一轮跃迁，留给全球数字生态准备的时间可能仅剩数月。Glasswing不是终点，而是AI时代“安全左移”战略的关键起点——真正的挑战，不在模型有多强，而在人类能否跑赢它进化出的风险半径。

本文来源：