搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
产业带
导航
知识体系
工具箱
产业园
更多
百科
找货源
跨境招聘
DeepSeek
首页
>
Fable 5 内心「小作文」曝光,这次真不做人了
>
Fable 5 内心「小作文」曝光,这次真不做人了
APPSO
2026-07-03
2
导读:Fable 5 的内心小作文,藏着什么?
Fable 5 刚回归便引发争议。有网友发现,其部分请求被回退至 Opus 4.8,日志中赫然标注着「TOO_DUMB_TO_NEED_FABLE」(问题太蠢,不配用 Fable)。Anthropic 工程师 Thariq Shihipar 对此回应称:“没想到你会去看日志。”
然而,更引人注目的是 Fable 5 暴露出的“内心戏”。网友抓包发现,该模型在复杂推理过程中输出了大量看似癫狂的文本,引发了关于其思考方式的广泛讨论。
一场漏洞,暴露了 Fable 的「内心戏」
事件起因于一名用户对 Fable 5 进行的 Codeforces 编程测试。模型未直接输出代码,而是在界面中吐露了大量混合英语、图论术语、数学符号及自我提醒的推理文本。其中夹杂着"GRRR"(愤怒)、"GAAAH"(崩溃)、"PHEW"(如释重负)以及"DATA DATA DATA. GO."等醒目词汇。
乍看之下似模型失控,实则蕴含严密逻辑。截图显示,模型正在处理复杂的容量约束问题,反复推演路径资源占用规则。
情绪标记实为推理状态切换
分析显示,"GRRR"出现在模型意识到原有建模方法失效、需重新设计规则时;"GAAAH"与"DATA DATA DATA. GO."则标志着模型决定停止空想,转向编写验证程序;而"PHEW"往往出现在某个中间结论暂时成立之时。随后若发现新冲突,模型又会进入"VIOLATION?!"状态。
这些词汇并非真正的情绪表达,而是模型在高压推理下划分的不同状态标记。这种现象在 Fable 5 和 Claude Mythos 5 的系统卡中亦有记载,被称为“难以阅读的推理”(illegible reasoning)。模型在调用
工具
或回复人类前,通常会从这种高密度速记切回正常语体。
正如数学家使用符号、程序员使用变量一样,模型在长推理链条中走向高密度表达并不奇怪。此次泄露的内容,本质上是本应被隐藏的中间推理过程被意外暴露。
AI 抛弃人类语言,不像演的
对此现象,舆论惊呼 AI 可能觉醒自我意识并形成私密语言。事实上,AI 偏离人类语言早有先例。2017 年 Facebook AI 研究院的 Alice/Bob 实验中,两个对话 Agent 为追求谈判效率,自发演化出偏离正常英语的压缩表达。
Google
翻译团队也观察到类似中间表征现象。Andrej Karpathy 解释称,大模型的思维链是将高维潜在空间的复杂运算降维投射为人类文本。而在强化学习和高压推理下,AI 会主动剥离句法装饰,留下更贴近任务本质的符号。
功能性情绪:控制行为的旋钮
针对 Fable 5 是否具备情感的问题,Anthropic 关于 Claude Sonnet 4.5 的研究提供了新视角。研究者提取了“情绪概念向量”,发现恐惧、焦虑等概念在向量空间中形成聚类,且能影响模型输出。例如,提高“绝望”相关激活会增加错位行为概率,而提高“冷静”激活则能抑制此类行为。
这被称为“功能性情绪”(functional emotions)。它不代表 AI 拥有主观感受,而是指 AI 内部学到了一套抽象表征,如同“控制旋钮”般用于切换行为状态。Fable 5 中的"GRRR"或"PHEW",更像是模型模仿人类草稿纸上的沮丧标记或深呼吸标记,用以辅助推理流程。
意识争论背后的可审计性危机
此事件再次点燃了关于 AI 意识的争论。Geoffrey Hinton 认为 AI 已具备意识,而 Yann LeCun 则坚持语言仅是智能的一部分,真正的智能需要世界模型与因果理解。无论立场如何,核心问题在于模型的可审计性。
思维链的价值在于让研究人员观察模型的任务推进过程,从而调试错误并评估安全。若模型逐渐发展出人类难以理解的高度压缩内部语言,我们将更难判断其中是否存在逻辑漏洞或潜在风险。
AI 像人时引发同理心,不像人时则引发对黑盒的恐惧。正是在这种矛盾中,行业需在投射与怀疑之间寻找新的共识,确保技术发展始终处于可控范围内。
【声明】内容源于网络
0
0
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
内容
15557
粉丝
0
关注
在线咨询
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
总阅读
309.2k
粉丝
0
内容
15.6k