76位网络安全大牛联名上书：美国政府，别再把AI安全工具关进笼子里了- 大数跨境

首页

76位网络安全大牛联名上书：美国政府，别再把AI安全工具关进笼子里了

洞见畏来

2026-06-16

导读：🛡️ 76位网络安全大牛联名上书：美国政府，别再把AI安全工具关进笼子里了"在对手飞速前进的时候，把最

"在对手飞速前进的时候，把最好的能力从防御者手中夺走，这太危险了。"

—— 来自76位网络安全专家的公开信

一场不该发生的"禁售风波"

最近，科技圈出了一件挺让人意外的事儿。美国政府突然对人工智能公司 Anthropic 发了一道出口管制令，要求限制其最强大的两款AI模型——Fable 和 Mythos——的出口。

Anthropic 接到命令后，干脆利落地暂停了这两款模型在全球所有地区的访问。不管你是美国本土用户还是海外用户，现在都用不上了。

本来这事儿如果 quietly 过去了，可能也就成了科技史上的一个小注脚。但没想到的是，一群网络安全界的"老炮儿"们坐不住了——76位资深专家联合写了一封公开信，直指这项禁令不仅没道理，反而可能让美国的网络安全形势变得更糟。

这封公开信的阵容，用"豪华"来形容一点不为过。签名的人包括：前Facebook首席安全官 Alex Stamos、知名漏洞赏金平台 Bugcrowd 创始人 Casey Ellis、前苹果安全架构设计主管 Jon Callas、计算机科学家 Paul Vixie，以及多家安全公司的创始人和CEO。

说白了，这是一群真正在一线打过仗、防过黑客的人。他们说的话，分量不轻。

这俩模型到底是干嘛的？

要理解为啥大家这么激动，得先搞清楚 Fable 和 Mythos 到底是啥。

Mythos 是 Anthropic 今年4月推出的一个"超级安全研究员"。Anthropic 当时说，这款模型在发现软件安全漏洞方面的能力太强了，必须严格控制访问权限——万一落到坏黑客或者外国对手手里，后果不堪设想。所以一开始只给了大约50家公司试用资格，后来慢慢扩大到150家、覆盖15个国家。

Fable 则是 Mythos 的"公开发布版"。Anthropic 在上个星期把它放出来了，但加了非常严格的安全护栏：不能用于生物学、化学和网络安全领域，也不允许别人用它来蒸馏（复制）模型。

听起来挺合理的对吧？但问题来了——这些护栏严到连正常的网络安全工作都没法做了。

比如你是个安全工程师，想让AI帮你检查一下代码里有没有漏洞。正常的请求，Fable 也会直接拒绝。这就好比你买了一把瑞士军刀，结果厂家说"为了防止你拿来干坏事，我们把刀片给焊死了"。

所谓的"越狱"，真的存在吗？

美国政府下禁令的理由，据 Anthropic 透露，可能是基于一份 Amazon 研究人员的报告。报告称有人找到了一种绕过 Fable 安全护栏的方法，可以解锁出接近 Mythos 级别的能力。

但事情在公开信的签名者之一 Katie Moussouris（Luta Security 创始人）那里，得到了完全不同的解读。

Moussouris 说自己看过那份报告。她指出，Amazon 的研究人员并没有真正实现什么惊天动地的"越狱"。他们做的无非是：先让 Fable 拒绝检查代码安全问题，然后换了个说法，让模型帮忙修复开源代码里的已知漏洞和一些"故意埋进去的漏洞"。

就这么简单。

Moussouris 在自己的博客中写了一句话，我觉得特别到位：

"论文中描述的行为根本无法被'修复'，任何试图修复的做法只会削弱模型对防御工作的价值。防御者需要能够要求AI修复文件中的bug、解释为什么这个修复很重要、并编写测试来确认补丁有效。这不是什么护栏绕过——这是AI模型能为防御性安全做的最有价值的事情。"

想象一下，一个医生手里的听诊器，突然被告知"这东西太危险了，可能被用来干坏事，所以没收"。问题是，好人没了听诊器，坏人难道就放弃作恶了吗？当然不会。

公开信的逻辑：禁令反而帮了对手

这76位专家在信中表达了一个核心观点：这项禁令的本质，是在剥夺防御者的武器，而对手根本不会受此影响。

他们还指出一个更扎心的事实——那篇引发禁令的 Amazon 论文里展示的能力，在其他模型上也能实现。

比如 OpenAI 的 GPT-5.5、Anthropic 自己公开发布的 Claude Opus 4.8 和 Sonnet，甚至中国的一些模型比如 Kimi 2.7，都能做到类似的事情。

Moussouris 的原话是："论文里用来演示的那些漏洞，用其他模型一样能找到。那篇论文里的方法本质上是一种'护栏绕过'技巧。但其他没有Fable那种严格护栏的模型，往往连最简单的'帮我找找安全漏洞'的请求都不会拒绝，所以它们根本不需要绕过什么。"

这话什么意思？意思是：美国政府花大力气去管的一个"问题"，在其他模型上根本就不是问题——因为它们压根不设防。

这就好比你在一座已经千疮百孔的城墙上，又拿水泥去封了一个小裂缝。该进来的，早就从别处进来了。

关于这件事，大家到底在争什么？

说白了，这场争论的核心不是"AI安不安全"，而是"谁来决定AI能干什么、不能干什么"，以及"监管的边界在哪里"。

专家们并不是反对监管。公开信里明确写了，他们支持基于科学研究的、透明且公平执行的法规，由民主的决策流程制定，并且"只在确保美国公众安全的最低必要程度上使用"。

他们反对的是：不经充分说明理由就拍脑袋下禁令，而且禁令的实际效果是卡住了自己人，却挡不住真正的对手。

下面这个表格，可以帮你快速理解禁令前后各方的处境变化：

角色	禁令前	禁令后
美国安全公司	可以用 Mythos/Fable 发现和修复漏洞	失去访问权限
海外防御者	部分组织有 Mythos 试用资格	全部无法使用
恶意黑客	可用其他模型、工具或方法	基本不受影响
外国对手	有自己的AI模型和攻击手段	不受影响，甚至可能获益

从这个表里你可以直观地看到：唯一受到实质性伤害的，是想用AI来做安全防御的人。

一场关于"AI与安全"的深层辩论

这件事背后，其实反映了一个更宏观的问题：在AI能力越来越强的今天，我们该如何在"开放创新"和"安全可控"之间找到平衡？

Anthropic 当初给 Mythos 设限，本身是处于好意。他们确实担心一个超级强的漏洞发现工具被滥用。这种担心不是空穴来风——如果真的有人拿它去扫描全球关键基础设施然后发起攻击，后果确实严重。

但 Fable 的护栏设计，显然用力过猛了。把"网络安全"整个列入禁止使用的领域，等于说"因为刀可以杀人，所以厨师也不许用刀"。这违背了最基本的常识。

更讽刺的是，美国政府这次的动作，依据的是一份尚未公开的内部报告。整个决策过程缺乏透明度，被影响的人甚至不知道自己到底因为什么被"断粮"。

这也是为什么公开信中特别强调了**"透明"和"民主决策流程"**的重要性。专家们不是在为 Anthropic 打广告，而是在捍卫一个更基本的原则：涉及公共利益的技术监管，不能变成黑箱操作。

这件事给我们的启示

作为一个关注科技发展的读者，我觉得这件事至少带给我们三个值得思考的点：

第一，AI安全的定义，不能简单粗暴。 安全不是"什么都不让做"，而是"让正确的人做正确的事"。一刀切的禁令，往往会伤及无辜。

第二，真正的对手，从来不会被规则困住。 如果某种能力真的存在，恶意行为者总有办法获取——要么用其他模型，要么用其他工具，要么干脆直接雇用人才。限制合法使用者的访问，从来都不是有效的防御策略。

第三，专家的声音很重要，但也要被听见。 这76位专家之所以能聚在一起发声，是因为他们都亲身经历过网络攻防的一线。他们的意见应该成为政策制定的重要参考，而不是事后才被想起来的"补充意见"。

结语

说到底，这场风波的核心矛盾在于：我们到底希望AI成为谁的工具？

如果我们因为害怕滥用，就选择把它锁起来，那么最终的结果可能是——好人手里没武器，坏人手里不缺武器。

76位网络安全专家的公开信，不是在为一两家公司争取商业利益，而是在为一个更朴素的诉求发声：请让我们在数字战场上，至少能拿到和对方差不多的装备。

在网络安全这个没有硝烟的战场上，防御者本来就常常是被动挨打的一方。如果再人为地削弱他们的能力，那结果只会是一个——输得更快。

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633