大数跨境

Claude“神话”模型降临:最强AI被装进笼子,然后分层出售

Claude“神话”模型降临:最强AI被装进笼子,然后分层出售 AIGC产业观澜
2026-06-10
2
导读:Fable 5和Mythos 5的发布让我感觉,大模型行业确实进入了一个新的阶段。不是那种“通用人工智能即将来临”的宏大叙事,而是一个更具体的、更落地的转变:AI正在从“能聊天的工具”变成“能干活的下

      今天凌晨,Anthropic终于把藏了两个月的“Mythos(神话)”模型端出来了。

      不是一款,是两款:Claude Fable 5和Claude Mythos 5。如果你只看名字,Fable 5像是产品线里又一个新成员,但按照Anthropic自己的说法,它属于Mythos-class,是他们终于敢拿出来给普通开发者和企业使用的公开版Mythos。

      这两款模型共享同一个底层模型,区别只在于安全配置——Fable 5套上了安全护栏面向公众,Mythos 5解除了部分限制只给少数受信任用户,包括网络安全防御机构和关键基础设施提供商。同一条生产线下来的心脏,装进了两个不同的身体里。这件事本身就很有意思。关于Claude Mythos的故事,可参考我另一篇文章:当AI强到能掀翻整个安全行业,我们该怎么办?

      更耐人寻味的是,就在前几天,Anthropic的CEO Dario Amodei还公开呼吁全球主要AI实验室建立协调一致的“刹车机制”,警告AI系统的进步速度可能很快导致递归式自我改进。结果不到48小时,自家最强模型就连夜上架。嘴上说不要,身体很诚实。你很难不把这理解成一种营销造势,但冷静想想,更值得关注的是这次发布透露出来的信号远比“技术升级”复杂得多。

      我替大家快速上手试用了,如果你只按纯粹的聊天体验去测试Fable 5,甚至可能觉得有些地方还不如Claude Opus 4.6。这是因为它的本质已经变了:它不是一个单纯的孤立大模型,而是一个被策略路由器和安全防火墙重重包裹的工程化产品包。底座是Mythos-class,外面套了safeguards、fallback、审计、数据保留和可信访问计划。你用网页端或API选择Fable 5时,输入会先过一个前置分类器——问普通问题直接调用Fable 5纯血能力,问敏感问题(比如网络安全渗透、生物化学合成)则无缝切换到次一级的Opus 4.8来回答,或者在API层直接返回结构化拒绝。

      官方透露,这个安全分类器平均在不到5%的会话中会被触发。但重点在于分布极不均匀:普通写文章、文书分析的用户可能一辈子碰不到,但安全研究人员、生物制药从业者,或者试图通过大量提问来蒸馏模型能力的开发者,会频繁“撞墙”。也就是说,Fable 5的体验不是一个固定的点,而是一个概率分布。你以为你用的是同一个模型,其实在不同风险区间摸到的是完全不同的能力面。

      这套逻辑让我印象很深。过去我们理解的AI安全,无非是模型吐出一句“对不起,我无法回答这个问题”。但Fable 5展现了极其成熟的工业级思维:它引入了Capability Fallback能力降级系统,请求被拦截时API不会粗暴地抛HTTP错误,而是返回200 OK,在返回值里携带stop_reason: “refusal”,并明确告知是哪一个分类器拦截的。更狠的是计费补偿机制——如果请求在生成任何输出前被拦截,完全不计费;如果中途发生fallback降级,前半段按Fable 5计费,后半段按Opus 4.8计费。

      数据留存政策也变了。从Fable 5和Mythos 5开始,Anthropic要求所有Mythos级模型的流量保留30天,覆盖第一方和第三方平台。官方说得直白:很多滥用模式和高危意图,从单一的一两次对话看不出来,必须把30天的上下文连起来做全局审计。对普通用户来说,这可能只是条款里的一行字;但对企业和机构客户而言,这是非常现实的数据治理问题。


/ 那颗共同的心脏到底有多强?

      说完壳,来说核。

      既然Fable 5和Mythos 5共享底层模型,两者在基础技术指标上完全一致。Anthropic官方给出的benchmark主要基于Fable 5,但如果你买通了Mythos 5的访问权限,拿到的是同样的底层能力——区别只在于一些危险方向是否被允许激活。

      先看软件工程。在SWE-Bench Pro上,Fable 5拿到了80.3%,作为对比,GPT-5.5是58.6%,Opus 4.8是69.2%。在更接近真实工程场景的FrontierCode Diamond上,Fable 5是29.3%,Opus 4.8只有13.4%,GPT-5.5只剩5.7%。这已经不是多赢几个百分点的问题,而是直接拉开了代差。FrontierCode的残酷之处在于,它关心模型有没有工程品味——代码不仅要能跑,还要能被维护者接受。上一代Claude和主要对手在这里都被甩开了。

      但数字远不如真实案例震撼。参与早期测试的金融科技公司Stripe,在一个5000万行Ruby代码库里让Mythos级模型做了一次全库迁移。正常情况下,这需要一个工程团队干两个多月。模型只用了一天。一天,5000万行,整个团队看傻了。Anthropic还提到,Fable 5完成的是一次“全库迁移”,包括理解项目结构、拆解任务、调整工具、纠错重来——说白了,它已经像一个能在工程现场独立干活的实习生。

      视觉能力也升级得夸张。此前的Claude模型如果想玩RPG游戏《宝可梦·火红版》,必须在外部配置一整套复杂的脚手架,包括地图导航援助、内存游戏状态读取等。现在Fable 5实现了纯粹的“原生视觉盲打”——仅凭一张张原始游戏截图,在没有地图外挂的前提下,完全自主推演、策略规划,硬生生打通关了整部游戏。Anthropic还展示了它基于网页截图完整还原对应源代码、从物理第一性原理推导行星轨道运动并预测日食的能力。

      长上下文和记忆能力也是这次升级的重点。Fable 5能在百万级token的长期任务里保持专注,还能利用自己的笔记改进输出。Anthropic拿《杀戮尖塔》做了测试:给模型接入持久化文件记忆后,Fable 5的表现提升幅度是Opus 4.8的三倍,到达最终章节的频率也提升了三倍。这说明模型不仅记住了之前的经验,还能主动利用这些经验优化后续决策——它正在“从自己的经验中学习”。

      但最炸裂的部分,是它在生命科学领域的“自主科研”能力。这才是Mythos 5真正与所有公开模型拉开代差的地方。在蛋白质设计任务中,Mythos 5在完全没有人类协助的情况下,独立执行了生物学家的全部工作流:选择结合位点、运行生物信息学工具、遭遇运行失败时自己Debug。它设计出的14个蛋白质靶向复合物中,有9个已经进入了真实药物研发管线,覆盖免疫检查点、神经退行性疾病、肌肉疾病等高难度靶点。Anthropic官方直言:Mythos 5“是我们首个能够持续产生新颖且引人注目的科学假设的模型”。

      更离谱的是基因组学研究。Mythos 5在几乎无人干预的情况下自主工作了一周多,汇集了横跨138个动物物种的数百万个单细胞数据,自己设计并训练了一个定制机器学习模型,用于识别亲缘关系极远的物种中执行相同功能的细胞。结果呢?这个由AI训练出来的、体积小了100倍的微型模型,在表现上直接击败了前不久刚发表在《Science》杂志上的最新科研成果。Anthropic计划在未来几个月内将这一结果正式发表。

      网络安全方面同样惊人。ExploitBench Cap%上,Fable 5达到78.0%,Mythos Preview是69.0%,Opus 4.8只有40.0%,GPT-5.5只有34.0%。Anthropic称其拥有全球最顶尖的网安攻防能力,但仍判定为Tier 1,未达到可自主执行网络攻击的Tier 2阈值。放在防守者手里,它是安全工具;放在攻击者手里,它可能变成下一代自动化漏洞挖掘机。


/ 产业影响:AI开始“看人下菜碟”了

      坦率地讲,Fable 5发布对产业界最深远的冲击,不是跑分有多高,而是它证明了“最强模型可以被驯服后交到每个人手中,而真正的完全体依然锁在可信者的保险柜里”。大模型行业正式跨入了新的阶段:模型本身强不强只是第一层;强模型如何被部署、被切流、被限制、被审计,变成了同等重要的硬核技术。

      这背后的商业逻辑也很清楚。Anthropic正面临三股同时上桌的巨大压力:商业变现压力、监管合规压力、IPO前期的能力展示压力。对市场,它必须证明自己不只是一家只会讲“AI安全”叙事的情怀公司;对监管,它绝对不敢把底座Mythos原汁原味直接端上餐桌,否则其强大的网络安全、生物化学等高危能力会立刻变成监管和舆论的集火靶心。于是它玩了一手极高明的“金蝉脱壳”:把高风险的高阶模型能力,拆成了一个可出售、可监控、可降级、同时也能向监管交代的产品包。

      这种分层策略对竞争对手的影响是直接的。OpenAIGoogle、xAI等公司都被迫要回答一个更棘手的问题:当你的模型能力也接近这个水平时,你打算怎么控制风险?是跟进Anthropic加分类器和fallback,还是走开放路线冒监管风险?你很难想象OpenAI会把自己的最强模型也套上这么复杂的护栏,但如果不出台类似机制,在安全叙事上就会处于劣势。能力竞赛和安全竞赛同时开跑,而且跑道开始交叉了。

      另一个值得注意的趋势是人机协作模式的转变。沃顿商学院教授Ethan Mollick在测试后给出了一个深刻洞察:人类正在从“施法者”变成“甲方”。过去用大模型就像念咒语——必须手把手指导,精雕细琢每一句Prompt,不断对话提示、纠正、引导。现在不一样了,Mollick直接向Fable 5喂了一份15页的复杂项目设计文档,留下一段宏观需求描述,然后9个多小时模型在后台完全自主运行:自己生成Agent工作流,内部调度多个小Agent分别搞调研、写大纲、相互校对、推翻错误假设、纠错重来。人类全程没有介入半步。9小时后,一个极高品质的成品直接交付到他面前。

      Mollick说了一段耐人寻味的话:使用这个工具既令人愉悦又令人不安。愉悦在于,我只需提出要求,它就能实现。不安也在于,我只需提出要求,它就能实现。Mythos 5带来的不是“更强的问答”,而是“无需介入的交付”。AI从需要你指挥的士兵,变成了能独立完成项目的承包商。人类的核心能力,正在从“如何指挥AI”转向“如何验收AI的成果”。

      坦白讲,这种转变对很多行业来说是个不小的冲击。你不再是那个事必躬亲的施法者,而是那个在最终成品上签字的委托人。公司的组织结构、岗位定义、人才需求都可能因此发生变化——如果AI能自己干一周活,那过去需要整个团队协作三个月才能完成的工程任务,未来可能只需要一个人配合AI就能搞定。


/ 中国大模型:传统基准追上了,但真正差距在别的地方

      这次发布对中国大模型行业来说,消息好坏参半。

      好消息是,在不少传统基准上,国产模型并不弱。拿DeepSeek V4-Pro Max来说,它在GPQA Diamond上有90.1%,LiveCodeBench有93.5%,SWE Verified有80.6%。这些数字放在全球范围都非常能打。Qwen3.7-Max也在多个标准测试中打出了存在感。如果只看这些榜单,中国模型和最强的闭源模型之间的差距已经很小了,甚至有些指标还能反超。

      但坏消息是,到了更接近真实工程和长任务执行的指标,差距突然变得扎眼。SWE-Bench Pro上Fable 5是80.3%,DeepSeek V4-Pro Max官方表里的SWE Pro是55.4%;Terminal-Bench上Fable 5是88.0%,DeepSeek V4-Pro Max是67.9%。HLE with tools更是被拉开了十几个百分点。Fable 5在这些项目上全都是断崖式领先。

      方向其实很清楚。DeepSeek强在性价比、开源和传统能力指标,Fable 5强在最贵、最容易卖出高价的任务——长任务agent、复杂工程协同、工具配合、真实代码库处理。如果你只是做单轮问答或者短代码补全,国产模型完全够用;但如果你想让人工智能连续工作几天,在你的项目里自主规划、纠错、交付完整成果,目前差距还很大。

      另一个值得中国大模型厂商重视的点是安全架构。Anthropic这次展示的安全分类器+fallback+数据留存逻辑,实际上是一套可工程化的治理方案。国内目前对大型模型的监管主要聚焦在内容安全层面,对“模型能力被滥用”的防范更多依赖事后处置。是否也需要建立类似的能力分级访问机制?尤其是在网络安全、生物制药等敏感领域,这种方案不仅是对监管的回应,也可能成为产品进入行业客户体系的必要条件。

      算力和成本也是个绕不开的话题。Fable 5的API定价是输入10美元/百万token、输出50美元/百万token——刚好是Opus 4.8的两倍,但不到此前Mythos Preview价格的一半。这个价格对很多中国开发者来说并不便宜。如果国产模型能够在保持能力接近的同时把成本压得更低,在价格敏感性高的市场里还是有竞争力的。但问题在于,Fable 5强调的“token效率”——即越是能长时间自主工作的模型,越要控制token消耗——说明单纯比每百万token的单价还不够,还要看完成同样任务需要消耗多少token。如果国产模型完成一个复杂任务要花两倍的token量,单价再便宜也不一定划算。

      不过,中国大模型也有自己的优势。开源模式让开发者可以自己部署、定制、审计,这对数据安全要求高的行业客户来说是很大的卖点。而且国内在应用场景的深度挖掘上一直走得很前,如果能将类似Mythos 5的自主agent能力与具体行业流程深度结合,未必不能在垂直赛道上找到突破口。


/ 未来方向:从“聊天”到“干活”,还有很长的路

      这次发布让我重新思考一个问题:大模型接下来到底往哪里走?

      第一个方向已经很清楚:从“问答”转向“交付”。过去比拼的是“这个模型能不能正确回答我的问题”,现在比拼的是“这个模型能不能可靠地完成我交给它的整个项目”。这要求模型具备稳定的推理路径、较低的幻觉率、以及对复杂目标的长期跟踪能力。模型可以慢一点,但不能随便编;可以表示不确定性,但不能把不确定性包装成结论。

      第二个方向是自主智能体能力的体系化。Fable 5能在数百万token的长期任务中保持专注,利用自己的笔记改进输出,甚至通过持久文件记忆“从经验中学习”。这种能力的背后是模型架构层面的改进——不仅仅是上下文窗口变大,而是一种新的任务处理方式。未来的竞争焦点会从“谁能记住更多”变成“谁能记好、用好、持续优化”。

      第三个方向是安全机制的产品化。Anthropic这次把分类器、计费、日志、降级模型、可信访问计划全部融合进了一套服务流。这已经不是“在prompt里加两句系统提示词”的小打小闹,而是把安全做成了一个可审计、可收费、可问责的产品特性。可以预见,未来所有高能力模型的发布都会参考这个模板:能力越强,门槛越高。

      第四个方向是垂直行业的深度整合。Mythos 5在网络安全和生物科学上的表现已经证明了,在受控环境下解禁部分能力,能够产生真正的产业价值。但这需要一套非常精细的信任机制——“可信访问计划”的概念会变得越来越重要。哪些人可以访问什么级别的模型能力,怎么审计他们的使用行为,怎么防范能力外溢——这些问题将决定AI能否真正进入关键行业的核心流程。

      第五个方向是多模态和工具使用的进一步融合。Fable 5能仅凭视觉输入通关《宝可梦》,能根据截图还原网页源代码,能用自己写的CAD工具设计3D打印模型。这意味着模型的视觉能力不再停留在“识别图片里的猫”这种水平,而是进入了一个可以“看懂并操作界面”的阶段。当模型能看懂你的屏幕、理解你的工作流、自己调用工具链完成一个闭环任务时,AI助手这个概念才真正配得上“助手”两个字。


      最后说点个人感受吧。

      Fable 5和Mythos 5的发布让我感觉,大模型行业确实进入了一个新的阶段。不是那种“通用人工智能即将来临”的宏大叙事,而是一个更具体的、更落地的转变:AI正在从“能聊天的工具”变成“能干活的下属”。这个转变的冲击,可能比跑分刷榜来得更深远。

      特别是“人类从施法者变成甲方”这个洞察,越想越觉得有道理。如果以后很多工作变成了“你提需求、AI执行、你验收”的模式,那人的核心能力就不再是精细化指挥,而是需求定义和结果判断。什么样的人能提好需求,什么样的人能准确判断AI交付成果的质量——这些能力会变得越来越值钱。

      当然,问题也不少。数据留存30天的策略让一些人感到不安——虽然Anthropic强调数据不会用于训练,但对很多企业来说,自己的代码库、客户数据、内部流程被记录在第三方服务器上,始终是个隐患。还有,当Fable 5的安全分类器误判了合理请求怎么办?Anthropic承认当前护栏比理想状态更严格,后续会降低误伤率,但对于被挡在门外的研究人员来说,等待的时间成本是真实存在的。

      最强的模型被装进了笼子,然后分层出售。这个时代,真的到来了。


—— END ——

(都看到这里了,还不关注我们吗 ?可以持续获得AI时代的生存指南哦 ↓)

往期回顾:

1. 词元出海:当西部绿电变成全球AI服务

2. 中国"未来产业":从顶层设计到落地生根的深度透视

3. 当AI强到能掀翻整个安全行业,我们该怎么办?

4. 华为韬(τ)定律:当路被堵死,换条路也能跑出赛车速度

5. 一个让数学家头疼80年的问题,被AI偷偷干翻了

【声明】内容源于网络
0
0
AIGC产业观澜
坐看“AIGC”产业风云,当好“智数时代”的见证者
内容 0
粉丝 0
AIGC产业观澜 坐看“AIGC”产业风云,当好“智数时代”的见证者
总阅读0
粉丝0
内容0