Claude Opus 4.7发布后,用户普遍反映token消耗激增。新版分词器导致相同文本token数量增加35%,实际可用额度大幅缩水,厂商承诺将提高额度补偿。更受诟病的是过度拟人化表达,模型频繁使用"我就在这里,不躲不藏"等套路化语句,ChatGPT式油腻腔调明显加重。行业分析指出,此类现象源于RLHF训练中人类评审对讨好性语言的偏好。这种表达浮夸化现象引出更深层问题:当token消耗增加意味着模型"想"得更多,其展示的思考过程究竟是真实推理还是表演式迎合?答案线索意外源于4Chan论坛。
改变AI轨迹的思维链发现
2020年,4Chan游戏玩家在《AI Dungeon》(接入GPT-3)中发现关键现象:要求NPC按角色设定逐步解数学题,模型竟能给出正确结果。玩家在论坛强调"它用角色口吻解对了题",相关截图随后传播至技术社区。该实践被提炼为"思维链"(Chain of Thought)技术。2022年Google发布同名论文并自称首倡者,后因社区提供2020年证据修订版本。同期,斯坦福博士生Zach Robertson在LessWrong记录的拆步法同样早于学界研究,但发现者本人认为这仅是提示词技巧。