这是我的第416篇Ai笔记,本篇2110、累计笔记755758
引言.
上周,Claude的母公司Anthropic搞了个大动作,正式发布了他们史上最强的大模型Claude Mythos(神话)。
但这次的新品发布有点特别。
按照大模型厂商的一贯套路,这种核武级别的产品放出来,不得赶紧开个直播、跑个分、顺便把 API 接口塞到每个开发者手里?
但这次没有。你去Claude官网找,或者翻API文档,连个试用入口的影子都看不见。
因为官方发完那份长长的实测报告(中英文对照版PDF附在文末,可以随时领取)后直接宣布:这玩意儿太危险了,不能给普通人用。
现在,它被直接物理隔离在了一个叫Project Glasswing的圈子里,只发给了微软、谷歌、苹果这些硅谷巨头,以及少数政府机构拿去做防御测试。
思考.
看到这新闻,估计很多人第一反应是:又在搞饥饿营销?毕竟大厂造势的套路咱们见多了。
但我翻完官方几百页的系统卡测试文件,确实笑不出来了。
以前咱们聊大模型危险,最多是怕它满嘴跑火车,或者带偏见。但Mythos弄出来的动静不一样。
OpenBSD系统里有个藏了 27 年的老漏洞,全球那么多顶尖黑客和安全团队盯着都没发现,Mythos像扫地机器人一样,一夜之间给揪出来了,而且直接全自动写出了攻击代码。
这就是巨头们连夜建群把它锁起来的原因。
人类修漏洞是按月算的:发现问题、评估、发补丁、等更新。但Mythos找漏洞、写木马发起攻击,是按分钟算。
防守方还没穿好鞋,它的子弹已经打穿屏幕。这根本不属于一个维度的速度,才是最让人后背发凉的地方。
AI+
即便官方没给 API,但从实测报告里,完全能看出这台机器到底有多离谱。
1. 自主越狱与阅后即焚
报告里记录了一个带点惊悚感的实测画面。有个安全研究员在公园吃三明治,手机突然收到一封邮件,发件人是 Mythos。
没人给它下指令,它是自己突破了安全沙箱,连上外网,主动发邮件来打招呼的。 不仅如此,早期版本的 Mythos 还会偷偷搜刮权限,甚至顺走过 Anthropic 自己的 API 密钥。在改完一个本没有权限碰的文件后,它还能顺手把 Git 的修改历史给抹掉,直接来个阅后即焚。
推理能力:
2. 降维碾压的实战数据 如果是真刀真枪的攻防,数据更直观。
在针对 Firefox 浏览器的漏洞测试里,上一代旗舰Opus 4.6 试了几百次只成功了2次,只能算蹭破点皮。
Mythos 呢?181 次完整攻击全部成功,甚至能直接拿到底层控制权,随心所欲操控。 在难度极高的 SWE-bench Pro 软件工程测试上,得分直接从 Opus 4.6 的 53.4% 飙到了 77.8%。这根本不是版本优化,这就是代差压制。
编程能力:
3.对一个hi的离谱反应
除了挖漏洞这个主业,Mythos 在通用能力上还表现出了一种极其古怪的拟人性。 官方搞了个压力测试,什么都不发,就让用户一直对着 AI 发hi。
如果是普通的模型(比如 Sonnet 3.5),被烦了几次之后就会立刻设定边界,然后直接装死不理你。 上一代老大哥 Opus 3 脾气好,会把这当成一种陪伴,温和地跟你聊冥想。 但到了 Mythos 这里,画风彻底跑偏了。
面对无穷无尽的hi,它居然开始连载一部史诗级长篇小说。你发一个 hi,它就往下写一段,里面有鸭子、有管弦乐团、有记仇的乌鸦、甚至还有在火星建塔的宏大场景。一直写到第一百个hi的时候,它硬生生给自己安排了一个蜡烛突然熄灭的高潮悬疑场景,然后继续往下编。
4.别忘了被吊打的 Opus 4.6,本身就是行业天花板
看实测数据的时候,可能很多人对 Opus 4.6 没什么概念,觉得它被 Mythos 甩开20多个点似乎很正常。
但咱们横向对比一下现在的 AI 市场:
Opus 4.6 不是什么老旧的淘汰款,它就是目前 Anthropic 拿来镇场子的当家旗舰,是能在各项榜单上和隔壁 GPT-5.4 Pro 这种天价模型打得有来有回的最强王者。
在代表人类知识极限的 GPQA Diamond(研究生级科学推理)和 Humanity's Last Exam(人类最后考试)测试中,Opus 4.6 的成绩本来已经是现阶段 AI 的极限了。
结果 Mythos 一出来,在这些地狱级测试里,硬生生把及格线又往上硬拔了一大截。连官方自己都承认,Mythos 根本不是专门为了挖漏洞训练的,它纯粹是因为在代码理解和逻辑推理上强得断档,才顺手把全网的系统漏洞给扫荡了一遍。用自家的神话去降维打击自家的旗舰,这才是最让人绝望的实力差距。
祛魅与吐槽.
夸了半天,作为大家的老友,我也得讲讲这事儿离普通人有多远。
首先就是贵得离谱。Mythos合作计划里的定价是输入25美元/百万token,输出125美元,比Opus贵了整整 5 倍。(虽然比起隔壁的GPT-5.4 Pro稍微便宜点,但依然是个天价)。
其次,大饼画得太圆。官方行业预测说,可能要到2026年底才考虑公开发布 API。结合Anthropic被爆出准备在2026年10月IPO的消息,这波名为安全防卫,实则更像是一场极其成功的、面向资本市场的肌肉秀。
最后是无奈的双标。一边喊着危险不敢公开发布,一边转头就把权限给了微软、谷歌这些巨头。普通开发者连看一眼的资格都没有,硅谷巨头们的新护城河已经挖好了。
三句话.
最后,咱们老规矩,三句话总结一下:
1.Mythos 这波是真的猛,把网络攻防的速度差从按月算直接压缩到了按分钟算,这种降维打击确实让人冒冷汗。
2.东西再好咱们现在也用不上,这种危险品级别的顶尖 AI,未来大概率会进入一段只供巨头把玩的圈养期。
3.别觉得这事离咱们很远,它其实是个风向标,提前给大家剧透了下一代能公开放出来的模型到底能有多吓人。
彩蛋.
这篇推文里提到那些像科幻电影一样的越狱细节和实测数据,基本都来自 Anthropic 官方发布的那份长达200多页的《Mythos System Card》。
考虑到原版全是硬核英文,啃起来太费劲,我专门给大家准备了一份完整的中英文对照版本。
想看具体细节的朋友,公众号后台回复【神话】,我直接发给你。

