Claude“神话”模型降临：最强AI被装进笼子，然后分层出售- 大数跨境

首页

Claude“神话”模型降临：最强AI被装进笼子，然后分层出售

AIGC产业观澜

2026-06-10

导读：Fable 5和Mythos 5的发布让我感觉，大模型行业确实进入了一个新的阶段。不是那种“通用人工智能即将来临”的宏大叙事，而是一个更具体的、更落地的转变：AI正在从“能聊天的工具”变成“能干活的下

今天凌晨，Anthropic终于把藏了两个月的“Mythos（神话）”模型端出来了。

不是一款，是两款：Claude Fable 5和Claude Mythos 5。如果你只看名字，Fable 5像是产品线里又一个新成员，但按照Anthropic自己的说法，它属于Mythos-class，是他们终于敢拿出来给普通开发者和企业使用的公开版Mythos。

这两款模型共享同一个底层模型，区别只在于安全配置——Fable 5套上了安全护栏面向公众，Mythos 5解除了部分限制只给少数受信任用户，包括网络安全防御机构和关键基础设施提供商。同一条生产线下来的心脏，装进了两个不同的身体里。这件事本身就很有意思。关于Claude Mythos的故事，可参考我另一篇文章：当AI强到能掀翻整个安全行业，我们该怎么办？

更耐人寻味的是，就在前几天，Anthropic的CEO Dario Amodei还公开呼吁全球主要AI实验室建立协调一致的“刹车机制”，警告AI系统的进步速度可能很快导致递归式自我改进。结果不到48小时，自家最强模型就连夜上架。嘴上说不要，身体很诚实。你很难不把这理解成一种营销造势，但冷静想想，更值得关注的是这次发布透露出来的信号远比“技术升级”复杂得多。

我替大家快速上手试用了，如果你只按纯粹的聊天体验去测试Fable 5，甚至可能觉得有些地方还不如Claude Opus 4.6。这是因为它的本质已经变了：它不是一个单纯的孤立大模型，而是一个被策略路由器和安全防火墙重重包裹的工程化产品包。底座是Mythos-class，外面套了safeguards、fallback、审计、数据保留和可信访问计划。你用网页端或API选择Fable 5时，输入会先过一个前置分类器——问普通问题直接调用Fable 5纯血能力，问敏感问题（比如网络安全渗透、生物化学合成）则无缝切换到次一级的Opus 4.8来回答，或者在API层直接返回结构化拒绝。

官方透露，这个安全分类器平均在不到5%的会话中会被触发。但重点在于分布极不均匀：普通写文章、文书分析的用户可能一辈子碰不到，但安全研究人员、生物制药从业者，或者试图通过大量提问来蒸馏模型能力的开发者，会频繁“撞墙”。也就是说，Fable 5的体验不是一个固定的点，而是一个概率分布。你以为你用的是同一个模型，其实在不同风险区间摸到的是完全不同的能力面。

这套逻辑让我印象很深。过去我们理解的AI安全，无非是模型吐出一句“对不起，我无法回答这个问题”。但Fable 5展现了极其成熟的工业级思维：它引入了Capability Fallback能力降级系统，请求被拦截时API不会粗暴地抛HTTP错误，而是返回200 OK，在返回值里携带stop_reason: “refusal”，并明确告知是哪一个分类器拦截的。更狠的是计费补偿机制——如果请求在生成任何输出前被拦截，完全不计费；如果中途发生fallback降级，前半段按Fable 5计费，后半段按Opus 4.8计费。

数据留存政策也变了。从Fable 5和Mythos 5开始，Anthropic要求所有Mythos级模型的流量保留30天，覆盖第一方和第三方平台。官方说得直白：很多滥用模式和高危意图，从单一的一两次对话看不出来，必须把30天的上下文连起来做全局审计。对普通用户来说，这可能只是条款里的一行字；但对企业和机构客户而言，这是非常现实的数据治理问题。

/ 那颗共同的心脏到底有多强？

说完壳，来说核。

既然Fable 5和Mythos 5共享底层模型，两者在基础技术指标上完全一致。Anthropic官方给出的benchmark主要基于Fable 5，但如果你买通了Mythos 5的访问权限，拿到的是同样的底层能力——区别只在于一些危险方向是否被允许激活。

先看软件工程。在SWE-Bench Pro上，Fable 5拿到了80.3%，作为对比，GPT-5.5是58.6%，Opus 4.8是69.2%。在更接近真实工程场景的FrontierCode Diamond上，Fable 5是29.3%，Opus 4.8只有13.4%，GPT-5.5只剩5.7%。这已经不是多赢几个百分点的问题，而是直接拉开了代差。FrontierCode的残酷之处在于，它关心模型有没有工程品味——代码不仅要能跑，还要能被维护者接受。上一代Claude和主要对手在这里都被甩开了。

但数字远不如真实案例震撼。参与早期测试的金融科技公司Stripe，在一个5000万行Ruby代码库里让Mythos级模型做了一次全库迁移。正常情况下，这需要一个工程团队干两个多月。模型只用了一天。一天，5000万行，整个团队看傻了。Anthropic还提到，Fable 5完成的是一次“全库迁移”，包括理解项目结构、拆解任务、调整工具、纠错重来——说白了，它已经像一个能在工程现场独立干活的实习生。

视觉能力也升级得夸张。此前的Claude模型如果想玩RPG游戏《宝可梦·火红版》，必须在外部配置一整套复杂的脚手架，包括地图导航援助、内存游戏状态读取等。现在Fable 5实现了纯粹的“原生视觉盲打”——仅凭一张张原始游戏截图，在没有地图外挂的前提下，完全自主推演、策略规划，硬生生打通关了整部游戏。Anthropic还展示了它基于网页截图完整还原对应源代码、从物理第一性原理推导行星轨道运动并预测日食的能力。

长上下文和记忆能力也是这次升级的重点。Fable 5能在百万级token的长期任务里保持专注，还能利用自己的笔记改进输出。Anthropic拿《杀戮尖塔》做了测试：给模型接入持久化文件记忆后，Fable 5的表现提升幅度是Opus 4.8的三倍，到达最终章节的频率也提升了三倍。这说明模型不仅记住了之前的经验，还能主动利用这些经验优化后续决策——它正在“从自己的经验中学习”。

但最炸裂的部分，是它在生命科学领域的“自主科研”能力。这才是Mythos 5真正与所有公开模型拉开代差的地方。在蛋白质设计任务中，Mythos 5在完全没有人类协助的情况下，独立执行了生物学家的全部工作流：选择结合位点、运行生物信息学工具、遭遇运行失败时自己Debug。它设计出的14个蛋白质靶向复合物中，有9个已经进入了真实药物研发管线，覆盖免疫检查点、神经退行性疾病、肌肉疾病等高难度靶点。Anthropic官方直言：Mythos 5“是我们首个能够持续产生新颖且引人注目的科学假设的模型”。

更离谱的是基因组学研究。Mythos 5在几乎无人干预的情况下自主工作了一周多，汇集了横跨138个动物物种的数百万个单细胞数据，自己设计并训练了一个定制机器学习模型，用于识别亲缘关系极远的物种中执行相同功能的细胞。结果呢？这个由AI训练出来的、体积小了100倍的微型模型，在表现上直接击败了前不久刚发表在《Science》杂志上的最新科研成果。Anthropic计划在未来几个月内将这一结果正式发表。

网络安全方面同样惊人。ExploitBench Cap%上，Fable 5达到78.0%，Mythos Preview是69.0%，Opus 4.8只有40.0%，GPT-5.5只有34.0%。Anthropic称其拥有全球最顶尖的网安攻防能力，但仍判定为Tier 1，未达到可自主执行网络攻击的Tier 2阈值。放在防守者手里，它是安全工具；放在攻击者手里，它可能变成下一代自动化漏洞挖掘机。

/ 产业影响：AI开始“看人下菜碟”了

坦率地讲，Fable 5发布对产业界最深远的冲击，不是跑分有多高，而是它证明了“最强模型可以被驯服后交到每个人手中，而真正的完全体依然锁在可信者的保险柜里”。大模型行业正式跨入了新的阶段：模型本身强不强只是第一层；强模型如何被部署、被切流、被限制、被审计，变成了同等重要的硬核技术。

这背后的商业逻辑也很清楚。Anthropic正面临三股同时上桌的巨大压力：商业变现压力、监管合规压力、IPO前期的能力展示压力。对市场，它必须证明自己不只是一家只会讲“AI安全”叙事的情怀公司；对监管，它绝对不敢把底座Mythos原汁原味直接端上餐桌，否则其强大的网络安全、生物化学等高危能力会立刻变成监管和舆论的集火靶心。于是它玩了一手极高明的“金蝉脱壳”：把高风险的高阶模型能力，拆成了一个可出售、可监控、可降级、同时也能向监管交代的产品包。

这种分层策略对竞争对手的影响是直接的。OpenAI、Google、xAI等公司都被迫要回答一个更棘手的问题：当你的模型能力也接近这个水平时，你打算怎么控制风险？是跟进Anthropic加分类器和fallback，还是走开放路线冒监管风险？你很难想象OpenAI会把自己的最强模型也套上这么复杂的护栏，但如果不出台类似机制，在安全叙事上就会处于劣势。能力竞赛和安全竞赛同时开跑，而且跑道开始交叉了。

另一个值得注意的趋势是人机协作模式的转变。沃顿商学院教授Ethan Mollick在测试后给出了一个深刻洞察：人类正在从“施法者”变成“甲方”。过去用大模型就像念咒语——必须手把手指导，精雕细琢每一句Prompt，不断对话提示、纠正、引导。现在不一样了，Mollick直接向Fable 5喂了一份15页的复杂项目设计文档，留下一段宏观需求描述，然后9个多小时模型在后台完全自主运行：自己生成Agent工作流，内部调度多个小Agent分别搞调研、写大纲、相互校对、推翻错误假设、纠错重来。人类全程没有介入半步。9小时后，一个极高品质的成品直接交付到他面前。

Mollick说了一段耐人寻味的话：使用这个工具既令人愉悦又令人不安。愉悦在于，我只需提出要求，它就能实现。不安也在于，我只需提出要求，它就能实现。Mythos 5带来的不是“更强的问答”，而是“无需介入的交付”。AI从需要你指挥的士兵，变成了能独立完成项目的承包商。人类的核心能力，正在从“如何指挥AI”转向“如何验收AI的成果”。

坦白讲，这种转变对很多行业来说是个不小的冲击。你不再是那个事必躬亲的施法者，而是那个在最终成品上签字的委托人。公司的组织结构、岗位定义、人才需求都可能因此发生变化——如果AI能自己干一周活，那过去需要整个团队协作三个月才能完成的工程任务，未来可能只需要一个人配合AI就能搞定。

/ 中国大模型：传统基准追上了，但真正差距在别的地方

这次发布对中国大模型行业来说，消息好坏参半。

好消息是，在不少传统基准上，国产模型并不弱。拿DeepSeek V4-Pro Max来说，它在GPQA Diamond上有90.1%，LiveCodeBench有93.5%，SWE Verified有80.6%。这些数字放在全球范围都非常能打。Qwen3.7-Max也在多个标准测试中打出了存在感。如果只看这些榜单，中国模型和最强的闭源模型之间的差距已经很小了，甚至有些指标还能反超。

但坏消息是，到了更接近真实工程和长任务执行的指标，差距突然变得扎眼。SWE-Bench Pro上Fable 5是80.3%，DeepSeek V4-Pro Max官方表里的SWE Pro是55.4%；Terminal-Bench上Fable 5是88.0%，DeepSeek V4-Pro Max是67.9%。HLE with tools更是被拉开了十几个百分点。Fable 5在这些项目上全都是断崖式领先。

方向其实很清楚。DeepSeek强在性价比、开源和传统能力指标，Fable 5强在最贵、最容易卖出高价的任务——长任务agent、复杂工程协同、工具配合、真实代码库处理。如果你只是做单轮问答或者短代码补全，国产模型完全够用；但如果你想让人工智能连续工作几天，在你的项目里自主规划、纠错、交付完整成果，目前差距还很大。

另一个值得中国大模型厂商重视的点是安全架构。Anthropic这次展示的安全分类器+fallback+数据留存逻辑，实际上是一套可工程化的治理方案。国内目前对大型模型的监管主要聚焦在内容安全层面，对“模型能力被滥用”的防范更多依赖事后处置。是否也需要建立类似的能力分级访问机制？尤其是在网络安全、生物制药等敏感领域，这种方案不仅是对监管的回应，也可能成为产品进入行业客户体系的必要条件。

算力和成本也是个绕不开的话题。Fable 5的API定价是输入10美元/百万token、输出50美元/百万token——刚好是Opus 4.8的两倍，但不到此前Mythos Preview价格的一半。这个价格对很多中国开发者来说并不便宜。如果国产模型能够在保持能力接近的同时把成本压得更低，在价格敏感性高的市场里还是有竞争力的。但问题在于，Fable 5强调的“token效率”——即越是能长时间自主工作的模型，越要控制token消耗——说明单纯比每百万token的单价还不够，还要看完成同样任务需要消耗多少token。如果国产模型完成一个复杂任务要花两倍的token量，单价再便宜也不一定划算。

不过，中国大模型也有自己的优势。开源模式让开发者可以自己部署、定制、审计，这对数据安全要求高的行业客户来说是很大的卖点。而且国内在应用场景的深度挖掘上一直走得很前，如果能将类似Mythos 5的自主agent能力与具体行业流程深度结合，未必不能在垂直赛道上找到突破口。

/ 未来方向：从“聊天”到“干活”，还有很长的路

这次发布让我重新思考一个问题：大模型接下来到底往哪里走？

第一个方向已经很清楚：从“问答”转向“交付”。过去比拼的是“这个模型能不能正确回答我的问题”，现在比拼的是“这个模型能不能可靠地完成我交给它的整个项目”。这要求模型具备稳定的推理路径、较低的幻觉率、以及对复杂目标的长期跟踪能力。模型可以慢一点，但不能随便编；可以表示不确定性，但不能把不确定性包装成结论。

第二个方向是自主智能体能力的体系化。Fable 5能在数百万token的长期任务中保持专注，利用自己的笔记改进输出，甚至通过持久文件记忆“从经验中学习”。这种能力的背后是模型架构层面的改进——不仅仅是上下文窗口变大，而是一种新的任务处理方式。未来的竞争焦点会从“谁能记住更多”变成“谁能记好、用好、持续优化”。

第三个方向是安全机制的产品化。Anthropic这次把分类器、计费、日志、降级模型、可信访问计划全部融合进了一套服务流。这已经不是“在prompt里加两句系统提示词”的小打小闹，而是把安全做成了一个可审计、可收费、可问责的产品特性。可以预见，未来所有高能力模型的发布都会参考这个模板：能力越强，门槛越高。

第四个方向是垂直行业的深度整合。Mythos 5在网络安全和生物科学上的表现已经证明了，在受控环境下解禁部分能力，能够产生真正的产业价值。但这需要一套非常精细的信任机制——“可信访问计划”的概念会变得越来越重要。哪些人可以访问什么级别的模型能力，怎么审计他们的使用行为，怎么防范能力外溢——这些问题将决定AI能否真正进入关键行业的核心流程。

第五个方向是多模态和工具使用的进一步融合。Fable 5能仅凭视觉输入通关《宝可梦》，能根据截图还原网页源代码，能用自己写的CAD工具设计3D打印模型。这意味着模型的视觉能力不再停留在“识别图片里的猫”这种水平，而是进入了一个可以“看懂并操作界面”的阶段。当模型能看懂你的屏幕、理解你的工作流、自己调用工具链完成一个闭环任务时，AI助手这个概念才真正配得上“助手”两个字。

最后说点个人感受吧。

Fable 5和Mythos 5的发布让我感觉，大模型行业确实进入了一个新的阶段。不是那种“通用人工智能即将来临”的宏大叙事，而是一个更具体的、更落地的转变：AI正在从“能聊天的工具”变成“能干活的下属”。这个转变的冲击，可能比跑分刷榜来得更深远。

特别是“人类从施法者变成甲方”这个洞察，越想越觉得有道理。如果以后很多工作变成了“你提需求、AI执行、你验收”的模式，那人的核心能力就不再是精细化指挥，而是需求定义和结果判断。什么样的人能提好需求，什么样的人能准确判断AI交付成果的质量——这些能力会变得越来越值钱。

当然，问题也不少。数据留存30天的策略让一些人感到不安——虽然Anthropic强调数据不会用于训练，但对很多企业来说，自己的代码库、客户数据、内部流程被记录在第三方服务器上，始终是个隐患。还有，当Fable 5的安全分类器误判了合理请求怎么办？Anthropic承认当前护栏比理想状态更严格，后续会降低误伤率，但对于被挡在门外的研究人员来说，等待的时间成本是真实存在的。

最强的模型被装进了笼子，然后分层出售。这个时代，真的到来了。

—— END ——

（都看到这里了，还不关注我们吗？可以持续获得AI时代的生存指南哦 ↓）

往期回顾：

1. 词元出海：当西部绿电变成全球AI服务

2. 中国"未来产业"：从顶层设计到落地生根的深度透视

3. 当AI强到能掀翻整个安全行业，我们该怎么办？

4. 华为韬（τ）定律：当路被堵死，换条路也能跑出赛车速度

5. 一个让数学家头疼80年的问题，被AI偷偷干翻了

【声明】内容源于网络

AIGC产业观澜

坐看“AIGC”产业风云，当好“智数时代”的见证者