你看到的AI答案，可能全是"精心准备"的谎言- 大数跨境

洞见畏来

2026-05-15

导读：🤖 你看到的AI答案，可能全是"精心准备"的谎言"如果我们不解决这些问题，我的孩子会变得越来越笨。"说

"如果我们不解决这些问题，我的孩子会变得越来越笨。"说这话的不是某个焦虑的散户家长，而是一位在新闻行业和科技巨头摸爬滚打二十多年的老兵。当她第一次认真审视ChatGPT时，看到的不是炫酷的未来，而是一场正在酝酿的信息灾难。

Campbell Brown这个名字，对国内读者来说可能有点陌生。但如果你关注国际新闻，或许记得她曾在CNN和NBC担任主播，是电视屏幕上那个紧追不舍追问真相的严肃面孔。后来她做了一个让同行跌破眼镜的决定——加入Facebook（现在的Meta），成为这家公司历史上第一任、也是唯一一任专职新闻负责人。

她在Meta的日子并不轻松。亲手搭建的事实核查项目，最终被自己效力的平台亲手 dismantle（撤销）。那段经历让她深刻理解了一个残酷的逻辑：当算法优化的目标是停留时长而不是信息质量时，真相永远是第一个被牺牲掉的。

而现在，她正在面对一个比社交媒体更隐蔽、也更棘手的挑战——生成式AI。

一个母亲的直觉：ChatGPT发布那天，她为什么慌了？

Brown创办Forum AI的故事，始于一个让她坐立难安的具体时刻。

"ChatGPT刚公开发布的时候，我还在Meta，"她回忆道，"没过多久我就意识到：这将成为所有信息流动的漏斗。而且它现在还很烂。"

这个判断听起来刺耳，但背后是一位信息专业人士的本能反应。想想看，当高中生把ChatGPT当成搜索引擎、当成老师、当成写论文的捷径，而这个"老师"却经常自信满满地胡说八道时，会发生什么？更可怕的是，孩子们往往分辨不出来。

Brown当时的想法直白得令人心惊："如果我们不解决这个问题，我的孩子会变得越来越笨。" 这不是修辞，也不是标题党，而是一个母亲的真实焦虑。当信息获取的门槛被无限降低，信息的准确性却被系统性忽视，下一代人的认知地基可能比任何时候都更加脆弱。

评测结果触目惊心：连"抄作业"都抄错了对象

Forum AI成立至今只有17个月，但已经做了一个大胆而昂贵的尝试：召集全球顶尖专家，为AI模型设计高难度测试题，再用训练过的AI评委批量打分，看看这些被吹上天的模型，到底几斤几两。

他们的专家名单堪称豪华——历史学家Niall Ferguson、CNN资深评论员Fareed Zakaria、前国务卿Tony Blinken、前众议院议长Kevin McCarthy、奥巴马时期的网络安全负责人Anne Neuberger。这些人被请来回答同一个问题：当AI面对地缘政治、心理健康、金融、招聘这些"高风险话题"时，它的表现到底怎么样？

答案并不乐观，甚至有点尴尬。

Brown透露，Forum AI的评测发现了一些令人啼笑皆非的错误。比如Google的Gemini模型，在处理一些"跟中国毫无关系"的新闻时，居然会去引用中国官方网站的信源。这不是简单的"引用不当"，而是暴露了模型在信息溯源上的深层混乱——它根本不知道自己读的东西来自哪里、可信度如何，就像一个写论文的学生，为了凑参考文献，随便抓几篇看起来权威的网页就往上贴。

更麻烦的是，几乎所有主流模型都呈现出明显的左倾政治偏见。这意味着当用户询问涉及政治立场、社会议题的问题时，AI给出的答案并不是中立的，而是在向某个方向悄悄倾斜。你以为是自己在提问，实际上你正在被"引导"而不自知。

问题类型	具体表现	潜在风险
信源错乱	引用与话题无关的官方网站	信息污染，误导判断
政治偏见	整体呈现左倾倾向	立场预设，削弱中立性
论证缺陷	断章取义、制造稻草人	扭曲原意，煽动对立
语境缺失	忽略关键背景信息	片面理解，决策失误

断章取义、稻草人论证：AI的"聪明"骗局更难防

如果说引用错了来源还属于低级错误，那么更隐蔽、更危险的是AI在"论证"层面的作弊。

Brown提到，模型经常会出现"straw-manning"——也就是稻草人论证。这个逻辑谬误的意思是，先故意歪曲对方的观点，把它变成一个容易攻击的靶子，然后再"英明"地推翻它。对人类辩手来说，这是公认的狡辩；但对AI来说，这却成了家常便饭。

更糟糕的是，AI做这一切时没有任何提示或免责声明。它不会告诉你"我简化了原观点"，也不会说"以下是我的主观解读"。它用平静、权威、条理清晰的语气输出内容，普通用户几乎不可能分辨哪里被歪曲了、哪里被省略了。

"还有很长的路要走，"Brown说，"但我也相信，有一些非常简单的修复措施就能大幅改善结果。"这话既悲观又乐观——现状很糟，但改进的门槛并没有想象中那么高。至少，行业需要先承认问题的存在。

流量至上还是真相至上？她亲手拆掉过自己建的墙

为什么AI公司不愿意在信息准确性上投入更多资源？Brown的答案一针见血："它们极度专注于编程和数学，而新闻和信息要难得多。"

难，就意味着贵，意味着慢，意味着在 benchmark 榜单上拿不到好看的成绩。当整个行业都在比拼谁的大模型数学竞赛得分更高、代码能力更强时，"这个模型会不会在解释中东局势时胡说八道"似乎成了一个边缘议题，吃力不讨好。

这个场景让Brown想起了自己在Facebook的日子。她亲眼见证了一个平台如何把"互动量"奉为圭臬，又如何为此付出了社会信任的代价。

"我们在很多尝试上都失败了，"她坦言。她建立的事实核查项目已经不复存在，而平台算法推荐的信息流里，情绪化和极端内容依然畅通无阻。她的结论毫不含糊：优化互动对社会来说是灾难性的，它让很多人变得更无知，而非更明智。

AI会重蹈覆辙吗？还是有机会打破这个恶性循环？

企业的算盘：赔钱的风险会逼着AI讲真话吗？

Brown认为，AI现在还没定型，"可能往任何一个方向发展"。

一种可能是，公司继续走老路——给用户他们"想要"的，而不是"真实"的。另一种可能是，整个行业开始把"准确"和"诚实"当作核心优化目标。后一种听起来很理想主义，甚至有些天真。但Brown提出了一个出人意料的推动力：企业市场。

这个判断背后的逻辑很务实，也很冷峻。当银行用AI做信贷审批，当保险公司用AI评估理赔，当企业用AI筛选简历时，它们关心的不是AI有多酷、多前沿，而是AI出错会让它们赔多少钱。 在法律和财务 liability 的压力下，企业会主动要求模型"把事实搞对"，因为搞错的代价它们真切地承受不起。

Forum AI的商业模式正是建立在这个逻辑之上。不过，把企业的"合规兴趣"变成持续付费的客户，并不容易。毕竟，现在大部分市场还被那些"打勾式审计"和标准化 benchmark 满足了，而Brown认为这些远远不够，甚至是在自欺欺人。

她毫不客气地评价目前的合规环境："简直是个笑话。" 她举了一个血淋淋的例子：纽约市通过了全美第一个要求对AI招聘工具进行偏见审计的法律，结果州审计长发现，超过一半的受审产品都存在未被检测到的违规。这说明什么？说明光靠"聪明的全能型选手"来做评估是行不通的，真正的审核需要领域专家去挖掘那些"人们根本想不到会出问题"的边界情况。

两个平行宇宙：硅谷在狂欢，普通人却在挨骗

Brown最尖锐的观察，或许是关于"认知鸿沟"的。

"你听到那些大科技公司的领袖说，'这项技术将改变世界'，'它将让你失业'，'它将治愈癌症'，"她说，"但对一个只是用聊天机器人问些基本问题的普通人来说，他们得到的仍然是一堆垃圾和错误答案。"

这句话撕开了当前AI叙事的一个巨大裂缝。在硅谷的会议室和创投晚宴上，人们讨论的是通用人工智能、万亿参数、推理能力。而在普通人的日常体验里，AI可能连一个简单的事实核查都做不对，却把错误信息包装得信誓旦旦、言之凿凿。

AI的信任度正处于历史低位，而Brown认为这种怀疑在很多情况下是合理的。

"硅谷正在围绕一件事展开对话，而消费者之间却在进行一场完全不同的对话。" 这意味着什么？意味着那些最响亮、最激动人心的AI宣言，可能跟真实用户体验之间隔着一个太平洋。如果这种脱节持续下去，AI行业面临的风险不仅仅是监管压力，而是整个社会对这项技术的信任崩塌。到那时候，再华丽的参数和再漂亮的发布会，都救不回用户的信心。

写在最后

Campbell Brown的故事，本质上是一个关于"守门人"的寓言。从电视新闻到社交媒体，再到生成式AI，信息的载体在变，传播的速度在变，但核心问题始终没变：谁来决定什么是真的？谁来为错误负责？当机器开始代替人类回答一切，我们是否正在失去质疑答案本身的能力？

Forum AI的努力未必能立刻改变行业格局，但它至少在做一件很多人不愿意做的事——承认AI在信息领域还很烂，然后试图修好它。 在这个人人都在吹AI的时代，承认"它很烂"反而成了一种稀缺的勇气。

对我们普通用户来说，这或许是最重要的一课：在下一次向AI寻求答案时，别忘了多问一句——"你说的这些，到底是谁教你的？"

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633