一水 发自 凹非寺
量子位 | 公众号 QbitAI
ChatGPT文风“AI味”浓?原因可能出人意料。
一位肯尼亚作家指出:不是人类写得像AI,而是AI写得像他们。
近日,肯尼亚作家Marcus Olang’(以下简称小马)在社交平台发文,控诉其多篇文章因“过于像ChatGPT”被退稿。讽刺的是,他发现自己的写作风格与AI高度相似,并非偶然。
你们所认为的机器指纹,实际上却是我们教育的化石记录。
小马表示,自己从小接受的写作训练强调结构严谨、逻辑清晰、用词规范——文章如“完美大厦”,需有地基(引言)、承重墙(主体)和封顶(结论)。过渡词如“首先、其次、因此”被反复使用,复杂标点如分号、破折号也被鼓励,以展现语言掌控力。
我们从小被教导,文章必须像一座完美的大厦。这种写作是我们在KCPE(小学毕业考试)中决定命运的生存技能。
而这类高度规范化、正式化的书面表达,恰好是大语言模型训练数据中的主流文本类型。AI从海量论文、报告、书籍中学习“权威”写法,无意中复刻了全球南方国家,尤其是肯尼亚等前英殖民地的教育产物。
AI为了显得权威,最终听起来像个英语作文得“A”的肯尼亚小学生。它复制了大英帝国的语言幽灵。
更荒诞的是,这种风格如今反被AI检测工具判定为“非人类”。许多受过严格写作训练的非英语母语者,反而因文风“太流畅、太规整”被误判为AI生成。
小马的这篇控诉文章本身,就被某AI检测平台判定为“100%由AI生成”。
AI偏爱“delve”?因RLHF外包至非洲
类似现象也体现在词汇选择上。ChatGPT频繁使用“delve”(深入探究)一词,引发外界对其“AI口吻”的调侃。
数据显示,在PubMed等学术数据库中,“delve”的出现频率近年来激增10至100倍,暗示大量研究者正借助AI辅助写作。
进一步分析发现,这一现象与RLHF(基于人类反馈的强化学习)密切相关。为降低成本,多家AI公司将其RLHF任务外包至肯尼亚、尼日利亚等英语非洲国家。
当地测试员在标注和优化模型回复时,自然使用本地通用的正式英语表达,如“delve”、“explore”、“tapestry”、“leverage”等词因此被高频采纳,并内化为AI的“语言习惯”。
这也解释了为何ChatGPT的语调常带有某种“国际标准化书面语”特征——它本质上是全球南方教育体系与西方技术资本结合的产物。

