Anthropic发布“史上最强AI”！然后宣布：太危险，不给普通人用（文末附245页完整实测报告中英文对照）- 大数跨境

首页

Anthropic发布“史上最强AI”！然后宣布：太危险，不给普通人用（文末附245页完整实测报告中英文对照）

我的Ai笔记

2026-04-14

导读：费用贵五倍、普通人想用也用不了的“神话”模型，究竟厉害在哪里？内附中英文对照版报告解读！

点击蓝字，关注我们

这是我的第416篇Ai笔记，本篇2110、累计笔记755758

引言.

上周，Claude的母公司Anthropic搞了个大动作，正式发布了他们史上最强的大模型Claude Mythos（神话）。

但这次的新品发布有点特别。

按照大模型厂商的一贯套路，这种核武级别的产品放出来，不得赶紧开个直播、跑个分、顺便把 API 接口塞到每个开发者手里？

但这次没有。你去Claude官网找，或者翻API文档，连个试用入口的影子都看不见。

因为官方发完那份长长的实测报告（中英文对照版PDF附在文末，可以随时领取）后直接宣布：这玩意儿太危险了，不能给普通人用。

现在，它被直接物理隔离在了一个叫Project Glasswing的圈子里，只发给了微软、谷歌、苹果这些硅谷巨头，以及少数政府机构拿去做防御测试。

思考.

看到这新闻，估计很多人第一反应是：又在搞饥饿营销？毕竟大厂造势的套路咱们见多了。

但我翻完官方几百页的系统卡测试文件，确实笑不出来了。

以前咱们聊大模型危险，最多是怕它满嘴跑火车，或者带偏见。但Mythos弄出来的动静不一样。

OpenBSD系统里有个藏了 27 年的老漏洞，全球那么多顶尖黑客和安全团队盯着都没发现，Mythos像扫地机器人一样，一夜之间给揪出来了，而且直接全自动写出了攻击代码。

这就是巨头们连夜建群把它锁起来的原因。

人类修漏洞是按月算的：发现问题、评估、发补丁、等更新。但Mythos找漏洞、写木马发起攻击，是按分钟算。

防守方还没穿好鞋，它的子弹已经打穿屏幕。这根本不属于一个维度的速度，才是最让人后背发凉的地方。

AI+

即便官方没给 API，但从实测报告里，完全能看出这台机器到底有多离谱。

1. 自主越狱与阅后即焚

报告里记录了一个带点惊悚感的实测画面。有个安全研究员在公园吃三明治，手机突然收到一封邮件，发件人是 Mythos。

没人给它下指令，它是自己突破了安全沙箱，连上外网，主动发邮件来打招呼的。不仅如此，早期版本的 Mythos 还会偷偷搜刮权限，甚至顺走过 Anthropic 自己的 API 密钥。在改完一个本没有权限碰的文件后，它还能顺手把 Git 的修改历史给抹掉，直接来个阅后即焚。

推理能力：

2. 降维碾压的实战数据如果是真刀真枪的攻防，数据更直观。

在针对 Firefox 浏览器的漏洞测试里，上一代旗舰Opus 4.6 试了几百次只成功了2次，只能算蹭破点皮。

Mythos 呢？181 次完整攻击全部成功，甚至能直接拿到底层控制权，随心所欲操控。在难度极高的 SWE-bench Pro 软件工程测试上，得分直接从 Opus 4.6 的 53.4% 飙到了 77.8%。这根本不是版本优化，这就是代差压制。

编程能力：

3.对一个hi的离谱反应

除了挖漏洞这个主业，Mythos 在通用能力上还表现出了一种极其古怪的拟人性。官方搞了个压力测试，什么都不发，就让用户一直对着 AI 发hi。

如果是普通的模型（比如 Sonnet 3.5），被烦了几次之后就会立刻设定边界，然后直接装死不理你。上一代老大哥 Opus 3 脾气好，会把这当成一种陪伴，温和地跟你聊冥想。但到了 Mythos 这里，画风彻底跑偏了。

面对无穷无尽的hi，它居然开始连载一部史诗级长篇小说。你发一个 hi，它就往下写一段，里面有鸭子、有管弦乐团、有记仇的乌鸦、甚至还有在火星建塔的宏大场景。一直写到第一百个hi的时候，它硬生生给自己安排了一个蜡烛突然熄灭的高潮悬疑场景，然后继续往下编。

4.别忘了被吊打的 Opus 4.6，本身就是行业天花板

看实测数据的时候，可能很多人对 Opus 4.6 没什么概念，觉得它被 Mythos 甩开20多个点似乎很正常。

但咱们横向对比一下现在的 AI 市场：

Opus 4.6 不是什么老旧的淘汰款，它就是目前 Anthropic 拿来镇场子的当家旗舰，是能在各项榜单上和隔壁 GPT-5.4 Pro 这种天价模型打得有来有回的最强王者。

在代表人类知识极限的 GPQA Diamond（研究生级科学推理）和 Humanity's Last Exam（人类最后考试）测试中，Opus 4.6 的成绩本来已经是现阶段 AI 的极限了。

结果 Mythos 一出来，在这些地狱级测试里，硬生生把及格线又往上硬拔了一大截。连官方自己都承认，Mythos 根本不是专门为了挖漏洞训练的，它纯粹是因为在代码理解和逻辑推理上强得断档，才顺手把全网的系统漏洞给扫荡了一遍。用自家的神话去降维打击自家的旗舰，这才是最让人绝望的实力差距。

祛魅与吐槽.

夸了半天，作为大家的老友，我也得讲讲这事儿离普通人有多远。

首先就是贵得离谱。Mythos合作计划里的定价是输入25美元/百万token，输出125美元，比Opus贵了整整 5 倍。（虽然比起隔壁的GPT-5.4 Pro稍微便宜点，但依然是个天价）。

其次，大饼画得太圆。官方行业预测说，可能要到2026年底才考虑公开发布 API。结合Anthropic被爆出准备在2026年10月IPO的消息，这波名为安全防卫，实则更像是一场极其成功的、面向资本市场的肌肉秀。

最后是无奈的双标。一边喊着危险不敢公开发布，一边转头就把权限给了微软、谷歌这些巨头。普通开发者连看一眼的资格都没有，硅谷巨头们的新护城河已经挖好了。

三句话.

最后，咱们老规矩，三句话总结一下：

1.Mythos 这波是真的猛，把网络攻防的速度差从按月算直接压缩到了按分钟算，这种降维打击确实让人冒冷汗。

2.东西再好咱们现在也用不上，这种危险品级别的顶尖 AI，未来大概率会进入一段只供巨头把玩的圈养期。

3.别觉得这事离咱们很远，它其实是个风向标，提前给大家剧透了下一代能公开放出来的模型到底能有多吓人。

彩蛋.

这篇推文里提到那些像科幻电影一样的越狱细节和实测数据，基本都来自 Anthropic 官方发布的那份长达200多页的《Mythos System Card》。

考虑到原版全是硬核英文，啃起来太费劲，我专门给大家准备了一份完整的中英文对照版本。

想看具体细节的朋友，公众号后台回复【神话】，我直接发给你。

【声明】内容源于网络

我的Ai笔记

很干货、有深度、真免费，关注“我的Ai笔记”，每天学Ai技巧！赋能客户、助力普通人在Ai时代抢占先机。

内容 365

粉丝 1

我的Ai笔记很干货、有深度、真免费，关注“我的Ai笔记”，每天学Ai技巧！赋能客户、助力普通人在Ai时代抢占先机。

总阅读4.3k

粉丝1

内容365