以下为人工撰写风格、深度、SEO友好优化后的中文文章整理稿。在保留核心事实与科技张力的基础上,重构逻辑脉络、增强可读性与信息密度,规避原文重复表达与情绪化措辞,融入自然关键词布局、段落语义分层及搜索引擎偏好的结构化表达(如小标题引导、数据强调、术语解释),同时确保真实、合规、无夸大,并符合国内AI监管语境。
(由多段落组成)
Anthropic正式公布Claude Mythos预览版:性能突破显著,安全优先策略引发全球关注
2026年4月8日,人工智能安全前沿公司Anthropic通过官方博客及合作渠道,低调但郑重地发布了新一代大模型——Claude Mythos的预览版本。该模型并非简单迭代,而是在多项权威技术基准测试中实现跨越式提升:在面向软件工程任务的SWE-bench Pro中代码修复准确率提升24%;在经人工复核验证的SWE-bench Verified中仍保持13%的稳定增益;在终端交互与自动化操作类评估Terminal-Bench 2.0中,智能体执行能力跃升17%。对比当前行业公认的强基线模型Claude Opus 4.6,Mythos展现出系统性优势,标志着AI在复杂推理与具身编程能力上的新临界点。
“玻璃翼计划”启动:不开放、先防御,重构AI发布范式
值得注意的是,Anthropic并未同步开放Mythos的公共API或消费级访问权限。取而代之的是名为“Project Glasswing”(玻璃翼计划)的全球协同安全倡议。该计划核心理念是:以攻促防、未发先治。Anthropic将Mythos预览版定向提供给Amazon、Apple、Google、Microsoft、NVIDIA、Linux Foundation等头部科技企业及40余家关键开源基础设施维护方,授权其在受控环境中,主动调用Mythos进行漏洞挖掘、渗透测试与防御体系加固。此举打破传统“发布—适配—响应”的被动安全节奏,转向“预演—加固—共建”的主动防御新范式。
高阶代码能力伴生新型风险:AI原生漏洞利用能力进入实战阶段
技术评估显示,Mythos已具备远超常规白帽工程师的自动化漏洞识别与链式利用能力。测试中,该模型在主流操作系统内核、浏览器渲染引擎及云原生组件中,累计发现并验证了数千个高危及以上级别安全缺陷(CVSS评分≥7.5)。这并非理论推演,而是基于真实环境的可复现攻击路径生成。Anthropic明确指出:当AI能自主完成从静态分析、动态触发到权限提升的完整攻击闭环时,“AI安全”已从学术议题升级为国家级数字基建防护刚需。
真金白银投入:1亿美元专项额度+400万美元开源捐赠,夯实协同防御底座
为支撑玻璃翼计划高效落地,Anthropic宣布两项实质性资源承诺:第一,设立最高1亿美元的模型使用专项额度,覆盖合作伙伴在漏洞扫描、补丁验证、防御策略训练等环节的算力与工程成本;第二,向OWASP、OpenSSF等国际知名开源安全组织捐赠400万美元,用于构建AI友好的安全知识图谱、自动化修复工具链及开发者教育体系。这一组合举措,被业内视为近年来最具实操性的AI安全协同实践之一。
从实验室走向基础设施:AI安全需跨域共治,时间窗口正在收窄
Anthropic在公告中强调,面对AI原生威胁的指数级演化速度,单点防御已失效。未来网络安全防护体系必须融合前沿AI公司、软件供应链厂商、独立安全研究者、开源社区及政策制定者多方力量。据内部技术路线图预测,下一代模型在漏洞利用效率、零日发现速率等方面或将迎来新一轮跃迁,留给全球数字生态准备的时间可能仅剩数月。Glasswing不是终点,而是AI时代“安全左移”战略的关键起点——真正的挑战,不在模型有多强,而在人类能否跑赢它进化出的风险半径。
本文来源:
量子位【阅读原文】

