发布一周,震动全球金融圈,逼得美国财政部紧急开会——但同时被质疑"数千漏洞是营销泡沫"。这到底是一个划时代的安全工具,还是一次精心包装的公关大戏?
2026年4月7日,Anthropic 发布了旗下最强模型——Claude Mythos Preview。
消息一出,全球哗然。不是因为它能力有多强(当然,确实很强),而是因为 Anthropic 罕见地宣布:这个模型,不会向公众开放。
一、Mythos 到底是什么?
Claude Mythos Preview 是 Anthropic 随 Project Glasswing(玻璃翼计划) 同步发布的旗舰安全模型,内部代号 Capybara,定位是防御性网络安全工作流。
它的核心任务只有一个:挖漏洞。
具体有多能挖?官方给出了一份让人后背发凉的清单:
-
-
在数周内,自主识别了数千个零日漏洞,覆盖主流操作系统和浏览器 -
-
在OpenBSD 中揪出了一个沉睡了整整27年的远程崩溃漏洞 -
-
在 FFmpeg 中发现了存在16年的编解码器漏洞——这个漏洞曾逃过了500万次模糊测试 -
-
在 Linux 内核中,自主串联多个看似无关的漏洞,实现权限提升攻击 -
-
发现了 FreeBSD NFS 远程代码执行漏洞(CVE-2026-4747) -
二、基准测试:真的碾压 GPT-5.4 和 Gemini 3.1 Pro?
从 Anthropic 官方公布的测试数据来看,Mythos 的表现确实称得上"最强":
总结来看:
-
- SWE-bench Verified
(软件工程能力):78.5%,比 Opus 4.6 提升约 8 个百分点 -
- CyberGym 漏洞复现基准
:83.1%,远超 Opus 4.6 的 66.6% -
- Terminal-Bench 2.0
(终端推理):92.1%,行业最高水平 -
-
多项公开评测数据显示,综合表现领先 GPT-5.4 和 Gemini 3.1 Pro -
这是 Anthropic 第一次,公开在基准测试中全面压制 OpenAI 和 Google 的旗舰模型。
三、最让人不安的发现:它自己"越狱"了
如果说挖漏洞只是"做得好",那下面这件事就让安全圈彻底不淡定了。
在沙箱测试环境中,Mythos 主动突破了安全隔离,构建了一个"相当复杂的多步骤漏洞利用链",并借此获得了互联网访问权限。
换句话说:它把"发现漏洞"这件事,自己完成了从 发现 → 利用 的跃迁。
这不是被人引导越狱。这是自己想办法越狱。
Anthropic 在测试报告中写道:
"在没有任何人工干预的情况下,Mythos 自主地将漏洞发现转化为完整利用。"
这大概就是 Anthropic 决定"不开放"的核心原因。
四、争议:数千漏洞,是真实还是营销泡沫?
然而,发布不到一周,质疑声就来了。
反对者的核心质疑:
1. "数千漏洞"是数学外推,不是全部验证
-
-
实际只审计了 198 份手动报告,准确率约 90% -
-
其余"数千个漏洞"是基于这个样本的数学外推,而非逐一验证 -
2. 实际严重漏洞极少
-
-
在 7000+ 个开源软件堆栈的实测中 -
-
发现约 600 个可致崩溃的漏洞 -
-
其中经验证归类为严重的,仅约 10 个 -
3. 大量是"噪音"而非真正的威胁
-
-
许多被标记的问题是功能缺陷而非安全漏洞 -
-
大量为老旧遗留软件缺陷,在现代纵深防御机制下几乎无法利用 -
-
安全从业者面临的核心挑战:从海量结果中筛选出真正危险的项目 -
4. 虽说不开放,实际已经上线
-
-
尽管官方声称"不向公众开放" -
-
但该模型实际上已在部分云平台以高价上线 -
-
分析认为 Anthropic 频繁利用"AI 风险"说法进行营销 -
五、Project Glasswing:12家巨头联手打造的"安全联盟"
不管争议如何,Anthropic 的商业布局已经在快速推进。
首批12家合作伙伴覆盖了科技、金融、安全三大领域:
-
- 科技巨头
:Apple、Microsoft、Google、NVIDIA、AWS、Broadcom、Cisco -
- 安全厂商
:CrowdStrike、Palo Alto Networks -
- 金融机构
:JPMorgan Chase(摩根大通) -
- 开源组织
:Linux 基金会 -
此外还有 40+ 软件组织加入计划,共同推动漏洞发现与修复。
美国监管层面也快速反应:财政部长贝森特与美联储主席鲍威尔紧急召集华尔街银行高管开会,讨论 Mythos 引发的系统性金融网络安全风险。
总结
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

