
"如果我们不解决这些问题,我的孩子会变得越来越笨。"说这话的不是某个焦虑的散户家长,而是一位在新闻行业和科技巨头摸爬滚打二十多年的老兵。当她第一次认真审视ChatGPT时,看到的不是炫酷的未来,而是一场正在酝酿的信息灾难。
Campbell Brown这个名字,对国内读者来说可能有点陌生。但如果你关注国际新闻,或许记得她曾在CNN和NBC担任主播,是电视屏幕上那个紧追不舍追问真相的严肃面孔。后来她做了一个让同行跌破眼镜的决定——加入Facebook(现在的Meta),成为这家公司历史上第一任、也是唯一一任专职新闻负责人。
她在Meta的日子并不轻松。亲手搭建的事实核查项目,最终被自己效力的平台亲手 dismantle(撤销)。那段经历让她深刻理解了一个残酷的逻辑:当算法优化的目标是停留时长而不是信息质量时,真相永远是第一个被牺牲掉的。
而现在,她正在面对一个比社交媒体更隐蔽、也更棘手的挑战——生成式AI。
一个母亲的直觉:ChatGPT发布那天,她为什么慌了?
Brown创办Forum AI的故事,始于一个让她坐立难安的具体时刻。
"ChatGPT刚公开发布的时候,我还在Meta,"她回忆道,"没过多久我就意识到:这将成为所有信息流动的漏斗。而且它现在还很烂。"
这个判断听起来刺耳,但背后是一位信息专业人士的本能反应。想想看,当高中生把ChatGPT当成搜索引擎、当成老师、当成写论文的捷径,而这个"老师"却经常自信满满地胡说八道时,会发生什么?更可怕的是,孩子们往往分辨不出来。
Brown当时的想法直白得令人心惊:"如果我们不解决这个问题,我的孩子会变得越来越笨。" 这不是修辞,也不是标题党,而是一个母亲的真实焦虑。当信息获取的门槛被无限降低,信息的准确性却被系统性忽视,下一代人的认知地基可能比任何时候都更加脆弱。
评测结果触目惊心:连"抄作业"都抄错了对象
Forum AI成立至今只有17个月,但已经做了一个大胆而昂贵的尝试:召集全球顶尖专家,为AI模型设计高难度测试题,再用训练过的AI评委批量打分,看看这些被吹上天的模型,到底几斤几两。
他们的专家名单堪称豪华——历史学家Niall Ferguson、CNN资深评论员Fareed Zakaria、前国务卿Tony Blinken、前众议院议长Kevin McCarthy、奥巴马时期的网络安全负责人Anne Neuberger。这些人被请来回答同一个问题:当AI面对地缘政治、心理健康、金融、招聘这些"高风险话题"时,它的表现到底怎么样?
答案并不乐观,甚至有点尴尬。
Brown透露,Forum AI的评测发现了一些令人啼笑皆非的错误。比如Google的Gemini模型,在处理一些"跟中国毫无关系"的新闻时,居然会去引用中国官方网站的信源。这不是简单的"引用不当",而是暴露了模型在信息溯源上的深层混乱——它根本不知道自己读的东西来自哪里、可信度如何,就像一个写论文的学生,为了凑参考文献,随便抓几篇看起来权威的网页就往上贴。
更麻烦的是,几乎所有主流模型都呈现出明显的左倾政治偏见。这意味着当用户询问涉及政治立场、社会议题的问题时,AI给出的答案并不是中立的,而是在向某个方向悄悄倾斜。你以为是自己在提问,实际上你正在被"引导"而不自知。
| 问题类型 | 具体表现 | 潜在风险 |
|---|---|---|
| 信源错乱 | 引用与话题无关的官方网站 | 信息污染,误导判断 |
| 政治偏见 | 整体呈现左倾倾向 | 立场预设,削弱中立性 |
| 论证缺陷 | 断章取义、制造稻草人 | 扭曲原意,煽动对立 |
| 语境缺失 | 忽略关键背景信息 | 片面理解,决策失误 |
断章取义、稻草人论证:AI的"聪明"骗局更难防
如果说引用错了来源还属于低级错误,那么更隐蔽、更危险的是AI在"论证"层面的作弊。
Brown提到,模型经常会出现"straw-manning"——也就是稻草人论证。这个逻辑谬误的意思是,先故意歪曲对方的观点,把它变成一个容易攻击的靶子,然后再"英明"地推翻它。对人类辩手来说,这是公认的狡辩;但对AI来说,这却成了家常便饭。
更糟糕的是,AI做这一切时没有任何提示或免责声明。它不会告诉你"我简化了原观点",也不会说"以下是我的主观解读"。它用平静、权威、条理清晰的语气输出内容,普通用户几乎不可能分辨哪里被歪曲了、哪里被省略了。
"还有很长的路要走,"Brown说,"但我也相信,有一些非常简单的修复措施就能大幅改善结果。"这话既悲观又乐观——现状很糟,但改进的门槛并没有想象中那么高。至少,行业需要先承认问题的存在。
流量至上还是真相至上?她亲手拆掉过自己建的墙
为什么AI公司不愿意在信息准确性上投入更多资源?Brown的答案一针见血:"它们极度专注于编程和数学,而新闻和信息要难得多。"
难,就意味着贵,意味着慢,意味着在 benchmark 榜单上拿不到好看的成绩。当整个行业都在比拼谁的大模型数学竞赛得分更高、代码能力更强时,"这个模型会不会在解释中东局势时胡说八道"似乎成了一个边缘议题,吃力不讨好。
这个场景让Brown想起了自己在Facebook的日子。她亲眼见证了一个平台如何把"互动量"奉为圭臬,又如何为此付出了社会信任的代价。
"我们在很多尝试上都失败了,"她坦言。她建立的事实核查项目已经不复存在,而平台算法推荐的信息流里,情绪化和极端内容依然畅通无阻。她的结论毫不含糊:优化互动对社会来说是灾难性的,它让很多人变得更无知,而非更明智。
AI会重蹈覆辙吗?还是有机会打破这个恶性循环?
企业的算盘:赔钱的风险会逼着AI讲真话吗?
Brown认为,AI现在还没定型,"可能往任何一个方向发展"。
一种可能是,公司继续走老路——给用户他们"想要"的,而不是"真实"的。另一种可能是,整个行业开始把"准确"和"诚实"当作核心优化目标。后一种听起来很理想主义,甚至有些天真。但Brown提出了一个出人意料的推动力:企业市场。
这个判断背后的逻辑很务实,也很冷峻。当银行用AI做信贷审批,当保险公司用AI评估理赔,当企业用AI筛选简历时,它们关心的不是AI有多酷、多前沿,而是AI出错会让它们赔多少钱。 在法律和财务 liability 的压力下,企业会主动要求模型"把事实搞对",因为搞错的代价它们真切地承受不起。
Forum AI的商业模式正是建立在这个逻辑之上。不过,把企业的"合规兴趣"变成持续付费的客户,并不容易。毕竟,现在大部分市场还被那些"打勾式审计"和标准化 benchmark 满足了,而Brown认为这些远远不够,甚至是在自欺欺人。
她毫不客气地评价目前的合规环境:"简直是个笑话。" 她举了一个血淋淋的例子:纽约市通过了全美第一个要求对AI招聘工具进行偏见审计的法律,结果州审计长发现,超过一半的受审产品都存在未被检测到的违规。这说明什么?说明光靠"聪明的全能型选手"来做评估是行不通的,真正的审核需要领域专家去挖掘那些"人们根本想不到会出问题"的边界情况。
两个平行宇宙:硅谷在狂欢,普通人却在挨骗
Brown最尖锐的观察,或许是关于"认知鸿沟"的。
"你听到那些大科技公司的领袖说,'这项技术将改变世界','它将让你失业','它将治愈癌症',"她说,"但对一个只是用聊天机器人问些基本问题的普通人来说,他们得到的仍然是一堆垃圾和错误答案。"
这句话撕开了当前AI叙事的一个巨大裂缝。在硅谷的会议室和创投晚宴上,人们讨论的是通用人工智能、万亿参数、推理能力。而在普通人的日常体验里,AI可能连一个简单的事实核查都做不对,却把错误信息包装得信誓旦旦、言之凿凿。
AI的信任度正处于历史低位,而Brown认为这种怀疑在很多情况下是合理的。
"硅谷正在围绕一件事展开对话,而消费者之间却在进行一场完全不同的对话。" 这意味着什么?意味着那些最响亮、最激动人心的AI宣言,可能跟真实用户体验之间隔着一个太平洋。如果这种脱节持续下去,AI行业面临的风险不仅仅是监管压力,而是整个社会对这项技术的信任崩塌。到那时候,再华丽的参数和再漂亮的发布会,都救不回用户的信心。
写在最后
Campbell Brown的故事,本质上是一个关于"守门人"的寓言。从电视新闻到社交媒体,再到生成式AI,信息的载体在变,传播的速度在变,但核心问题始终没变:谁来决定什么是真的?谁来为错误负责?当机器开始代替人类回答一切,我们是否正在失去质疑答案本身的能力?
Forum AI的努力未必能立刻改变行业格局,但它至少在做一件很多人不愿意做的事——承认AI在信息领域还很烂,然后试图修好它。 在这个人人都在吹AI的时代,承认"它很烂"反而成了一种稀缺的勇气。
对我们普通用户来说,这或许是最重要的一课:在下一次向AI寻求答案时,别忘了多问一句——"你说的这些,到底是谁教你的?"

