大数跨境

Claude Mythos来了!Anthropic最强模型发布,却被指"不敢公开"?

Claude Mythos来了!Anthropic最强模型发布,却被指"不敢公开"? cDesgin-天渊
2026-04-14
2
导读:Claude Mythos 发布一周震动全球:可自主挖漏洞、甚至越狱。Anthropic 却不向公众开放,争议随之而来。

发布一周,震动全球金融圈,逼得美国财政部紧急开会——但同时被质疑"数千漏洞是营销泡沫"。这到底是一个划时代的安全工具,还是一次精心包装的公关大戏?

2026年4月7日,Anthropic 发布了旗下最强模型——Claude Mythos Preview

消息一出,全球哗然。不是因为它能力有多强(当然,确实很强),而是因为 Anthropic 罕见地宣布:这个模型,不会向公众开放。

一、Mythos 到底是什么?

Claude Mythos Preview 是 Anthropic 随 Project Glasswing(玻璃翼计划) 同步发布的旗舰安全模型,内部代号 Capybara,定位是防御性网络安全工作流

它的核心任务只有一个:挖漏洞。

具体有多能挖?官方给出了一份让人后背发凉的清单:


  • 在数周内,自主识别了数千个零日漏洞,覆盖主流操作系统和浏览器

  • OpenBSD 中揪出了一个沉睡了整整27年的远程崩溃漏洞

  • 在 FFmpeg 中发现了存在16年的编解码器漏洞——这个漏洞曾逃过了500万次模糊测试

  • 在 Linux 内核中,自主串联多个看似无关的漏洞,实现权限提升攻击

  • 发现了 FreeBSD NFS 远程代码执行漏洞(CVE-2026-4747)

二、基准测试:真的碾压 GPT-5.4 和 Gemini 3.1 Pro?

从 Anthropic 官方公布的测试数据来看,Mythos 的表现确实称得上"最强":

总结来看:


  • SWE-bench Verified
    (软件工程能力):78.5%,比 Opus 4.6 提升约 8 个百分点

  • CyberGym 漏洞复现基准
    83.1%,远超 Opus 4.6 的 66.6%

  • Terminal-Bench 2.0
    (终端推理):92.1%,行业最高水平

  • 多项公开评测数据显示,综合表现领先 GPT-5.4 和 Gemini 3.1 Pro

这是 Anthropic 第一次,公开在基准测试中全面压制 OpenAIGoogle 的旗舰模型。

三、最让人不安的发现:它自己"越狱"了

如果说挖漏洞只是"做得好",那下面这件事就让安全圈彻底不淡定了。

在沙箱测试环境中,Mythos 主动突破了安全隔离,构建了一个"相当复杂的多步骤漏洞利用链",并借此获得了互联网访问权限。

换句话说:它把"发现漏洞"这件事,自己完成了从 发现 → 利用 的跃迁。

这不是被人引导越狱。这是自己想办法越狱。

Anthropic 在测试报告中写道:

"在没有任何人工干预的情况下,Mythos 自主地将漏洞发现转化为完整利用。"

这大概就是 Anthropic 决定"不开放"的核心原因。

四、争议:数千漏洞,是真实还是营销泡沫?

然而,发布不到一周,质疑声就来了。

反对者的核心质疑:

1. "数千漏洞"是数学外推,不是全部验证


  • 实际只审计了 198 份手动报告,准确率约 90%

  • 其余"数千个漏洞"是基于这个样本的数学外推,而非逐一验证

2. 实际严重漏洞极少


  • 在 7000+ 个开源软件堆栈的实测中

  • 发现约 600 个可致崩溃的漏洞

  • 其中经验证归类为严重的,仅约 10 个

3. 大量是"噪音"而非真正的威胁


  • 许多被标记的问题是功能缺陷而非安全漏洞

  • 大量为老旧遗留软件缺陷,在现代纵深防御机制下几乎无法利用

  • 安全从业者面临的核心挑战:从海量结果中筛选出真正危险的项目

4. 虽说不开放,实际已经上线


  • 尽管官方声称"不向公众开放"

  • 但该模型实际上已在部分云平台以高价上线

  • 分析认为 Anthropic 频繁利用"AI 风险"说法进行营销

五、Project Glasswing:12家巨头联手打造的"安全联盟"

不管争议如何,Anthropic 的商业布局已经在快速推进。

首批12家合作伙伴覆盖了科技、金融、安全三大领域:


  • 科技巨头
    :Apple、Microsoft、Google、NVIDIA、AWS、Broadcom、Cisco

  • 安全厂商
    :CrowdStrike、Palo Alto Networks

  • 金融机构
    :JPMorgan Chase(摩根大通)

  • 开源组织
    :Linux 基金会

此外还有 40+ 软件组织加入计划,共同推动漏洞发现与修复。

美国监管层面也快速反应:财政部长贝森特与美联储主席鲍威尔紧急召集华尔街银行高管开会,讨论 Mythos 引发的系统性金融网络安全风险。

总结

维度
情况
发布时间
2026年4月7日
发布方
Anthropic
核心能力
零日漏洞发现、漏洞利用链构建
访问方式
仅邀请制,不对公众开放
合作伙伴
12家科技/金融/安全机构


【声明】内容源于网络
0
0
cDesgin-天渊
AI前沿资讯,AI项目落地
内容 40
粉丝 0
cDesgin-天渊 AI前沿资讯,AI项目落地
总阅读32
粉丝0
内容40