大数跨境

76位网络安全大牛联名上书:美国政府,别再把AI安全工具关进笼子里了

76位网络安全大牛联名上书:美国政府,别再把AI安全工具关进笼子里了 洞见畏来
2026-06-16
2
导读:🛡️ 76位网络安全大牛联名上书:美国政府,别再把AI安全工具关进笼子里了"在对手飞速前进的时候,把最

"在对手飞速前进的时候,把最好的能力从防御者手中夺走,这太危险了。"

—— 来自76位网络安全专家的公开信

               
一场不该发生的"禁售风波"

最近,科技圈出了一件挺让人意外的事儿。美国政府突然对人工智能公司 Anthropic 发了一道出口管制令,要求限制其最强大的两款AI模型——FableMythos——的出口。

Anthropic 接到命令后,干脆利落地暂停了这两款模型在全球所有地区的访问。不管你是美国本土用户还是海外用户,现在都用不上了。

本来这事儿如果 quietly 过去了,可能也就成了科技史上的一个小注脚。但没想到的是,一群网络安全界的"老炮儿"们坐不住了——76位资深专家联合写了一封公开信,直指这项禁令不仅没道理,反而可能让美国的网络安全形势变得更糟。

这封公开信的阵容,用"豪华"来形容一点不为过。签名的人包括:前Facebook首席安全官 Alex Stamos、知名漏洞赏金平台 Bugcrowd 创始人 Casey Ellis、前苹果安全架构设计主管 Jon Callas、计算机科学家 Paul Vixie,以及多家安全公司的创始人和CEO。

说白了,这是一群真正在一线打过仗、防过黑客的人。他们说的话,分量不轻。

               
这俩模型到底是干嘛的?

要理解为啥大家这么激动,得先搞清楚 Fable 和 Mythos 到底是啥。

Mythos 是 Anthropic 今年4月推出的一个"超级安全研究员"。Anthropic 当时说,这款模型在发现软件安全漏洞方面的能力太强了,必须严格控制访问权限——万一落到坏黑客或者外国对手手里,后果不堪设想。所以一开始只给了大约50家公司试用资格,后来慢慢扩大到150家、覆盖15个国家。

Fable 则是 Mythos 的"公开发布版"。Anthropic 在上个星期把它放出来了,但加了非常严格的安全护栏:不能用于生物学、化学和网络安全领域,也不允许别人用它来蒸馏(复制)模型。

听起来挺合理的对吧?但问题来了——这些护栏严到连正常的网络安全工作都没法做了

比如你是个安全工程师,想让AI帮你检查一下代码里有没有漏洞。正常的请求,Fable 也会直接拒绝。这就好比你买了一把瑞士军刀,结果厂家说"为了防止你拿来干坏事,我们把刀片给焊死了"。

               
所谓的"越狱",真的存在吗?

美国政府下禁令的理由,据 Anthropic 透露,可能是基于一份 Amazon 研究人员的报告。报告称有人找到了一种绕过 Fable 安全护栏的方法,可以解锁出接近 Mythos 级别的能力。

但事情在公开信的签名者之一 Katie Moussouris(Luta Security 创始人)那里,得到了完全不同的解读。

Moussouris 说自己看过那份报告。她指出,Amazon 的研究人员并没有真正实现什么惊天动地的"越狱"。他们做的无非是:先让 Fable 拒绝检查代码安全问题,然后换了个说法,让模型帮忙修复开源代码里的已知漏洞和一些"故意埋进去的漏洞"

就这么简单。

Moussouris 在自己的博客中写了一句话,我觉得特别到位:

"论文中描述的行为根本无法被'修复',任何试图修复的做法只会削弱模型对防御工作的价值。防御者需要能够要求AI修复文件中的bug、解释为什么这个修复很重要、并编写测试来确认补丁有效。这不是什么护栏绕过——这是AI模型能为防御性安全做的最有价值的事情。"

想象一下,一个医生手里的听诊器,突然被告知"这东西太危险了,可能被用来干坏事,所以没收"。问题是,好人没了听诊器,坏人难道就放弃作恶了吗?当然不会。

               
公开信的逻辑:禁令反而帮了对手

这76位专家在信中表达了一个核心观点:这项禁令的本质,是在剥夺防御者的武器,而对手根本不会受此影响。

他们还指出一个更扎心的事实——那篇引发禁令的 Amazon 论文里展示的能力,在其他模型上也能实现

比如 OpenAI 的 GPT-5.5、Anthropic 自己公开发布的 Claude Opus 4.8Sonnet,甚至中国的一些模型比如 Kimi 2.7,都能做到类似的事情。

Moussouris 的原话是:"论文里用来演示的那些漏洞,用其他模型一样能找到。那篇论文里的方法本质上是一种'护栏绕过'技巧。但其他没有Fable那种严格护栏的模型,往往连最简单的'帮我找找安全漏洞'的请求都不会拒绝,所以它们根本不需要绕过什么。"

这话什么意思?意思是:美国政府花大力气去管的一个"问题",在其他模型上根本就不是问题——因为它们压根不设防。

这就好比你在一座已经千疮百孔的城墙上,又拿水泥去封了一个小裂缝。该进来的,早就从别处进来了。

               
关于这件事,大家到底在争什么?

说白了,这场争论的核心不是"AI安不安全",而是"谁来决定AI能干什么、不能干什么",以及"监管的边界在哪里"

专家们并不是反对监管。公开信里明确写了,他们支持基于科学研究的、透明且公平执行的法规,由民主的决策流程制定,并且"只在确保美国公众安全的最低必要程度上使用"。

他们反对的是:不经充分说明理由就拍脑袋下禁令,而且禁令的实际效果是卡住了自己人,却挡不住真正的对手。

下面这个表格,可以帮你快速理解禁令前后各方的处境变化:

角色 禁令前 禁令后
美国安全公司 可以用 Mythos/Fable 发现和修复漏洞 失去访问权限
海外防御者 部分组织有 Mythos 试用资格 全部无法使用
恶意黑客 可用其他模型、工具或方法 基本不受影响
外国对手 有自己的AI模型和攻击手段 不受影响,甚至可能获益

从这个表里你可以直观地看到:唯一受到实质性伤害的,是想用AI来做安全防御的人。

               
一场关于"AI与安全"的深层辩论

这件事背后,其实反映了一个更宏观的问题:在AI能力越来越强的今天,我们该如何在"开放创新"和"安全可控"之间找到平衡?

Anthropic 当初给 Mythos 设限,本身是处于好意。他们确实担心一个超级强的漏洞发现工具被滥用。这种担心不是空穴来风——如果真的有人拿它去扫描全球关键基础设施然后发起攻击,后果确实严重。

但 Fable 的护栏设计,显然用力过猛了。把"网络安全"整个列入禁止使用的领域,等于说"因为刀可以杀人,所以厨师也不许用刀"。这违背了最基本的常识。

更讽刺的是,美国政府这次的动作,依据的是一份尚未公开的内部报告。整个决策过程缺乏透明度,被影响的人甚至不知道自己到底因为什么被"断粮"。

这也是为什么公开信中特别强调了**"透明"和"民主决策流程"**的重要性。专家们不是在为 Anthropic 打广告,而是在捍卫一个更基本的原则:涉及公共利益的技术监管,不能变成黑箱操作。

               
这件事给我们的启示

作为一个关注科技发展的读者,我觉得这件事至少带给我们三个值得思考的点:

第一,AI安全的定义,不能简单粗暴。 安全不是"什么都不让做",而是"让正确的人做正确的事"。一刀切的禁令,往往会伤及无辜。

第二,真正的对手,从来不会被规则困住。 如果某种能力真的存在,恶意行为者总有办法获取——要么用其他模型,要么用其他工具,要么干脆直接雇用人才。限制合法使用者的访问,从来都不是有效的防御策略。

第三,专家的声音很重要,但也要被听见。 这76位专家之所以能聚在一起发声,是因为他们都亲身经历过网络攻防的一线。他们的意见应该成为政策制定的重要参考,而不是事后才被想起来的"补充意见"。

               
结语

说到底,这场风波的核心矛盾在于:我们到底希望AI成为谁的工具?

如果我们因为害怕滥用,就选择把它锁起来,那么最终的结果可能是——好人手里没武器,坏人手里不缺武器。

76位网络安全专家的公开信,不是在为一两家公司争取商业利益,而是在为一个更朴素的诉求发声:请让我们在数字战场上,至少能拿到和对方差不多的装备。

在网络安全这个没有硝烟的战场上,防御者本来就常常是被动挨打的一方。如果再人为地削弱他们的能力,那结果只会是一个——输得更快

【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 633
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读228
粉丝0
内容633