千万曝光顶会论文陷争议，学者高健扬举证谷歌学术不端- 大数跨境

首页

千万曝光顶会论文陷争议，学者高健扬举证谷歌学术不端

知乎AI先行者

2026-03-30

导读：谷歌明明借鉴却不承认？

最近，AI 学术圈爆发了一场引发巨大争议的大厂与个人学者的学术诚信风波。

苏黎世联邦理工学院（ETH）博士后、RaBitQ 一作高健扬在知乎社区发文，实名指控 Google Research 发表在 ICLR 2026 的 TurboQuant 论文存在方法回避溯源、歪曲理论结论、刻意构造不公平实验对比等严重问题，且在多次沟通后仍拒不全面修正。

以下是原文内容。

@gaoj0017

RaBitQ第一作者

苏黎世联邦理工计算机博士后

3 月 27 日发布于知乎

大家好，我叫高健扬，目前在苏黎世联邦理工学院做博士后，我是 RaBitQ 系列工作的第一作者。

Google Research 于 2026 年 1 月被 ICLR 2026 会议接收的论文」TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate「中，有关已有的 RaBitQ 向量量化算法的描述，理论结果对比，实验对比均存在严重问题（详细情况后文会展开描述）。这些问题在论文投稿至 ICLR 2026 前已被我们通过邮件明确指出，TurboQuant 团队也明确表示已知情，但选择了不予修正。论文随后被 ICLR 2026 会议接收，然后通过 Google 官方渠道大规模推广，在社交媒体浏览量已达到数千万次。

我们此时公开说明，是因为错误的学术叙事一旦广泛传播，纠正的成本会越来越高。

背景：RaBitQ 是什么

RaBitQ 系列论文（如下所列）是我在新加坡南洋理工大学（NTU Singapore）博士期间的主要研究成果，导师为龙程副教授。论文于 2024 年发表，提出了一种高维向量量化方法，并从理论上证明其达到了理论计算机顶级会议论文（Alon-Klartag, FOCS 2017）给出的渐近最优误差界。

RaBitQ（arXiv:2405.12497，2024 年 5 月，随后发表于顶级会议 SIGMOD 2024）

扩展版（arXiv:2409.09913，2024 年 9 月，随后发表于顶级会议 SIGMOD 2025）

RaBitQ 的核心想法之一是在量化前对输入向量施加随机旋转（random rotation / Johnson-Lindenstrauss 变换），利用旋转后坐标分布的性质做向量量化，在理论上实现最优误差界。

TurboQuant 论文问题一：系统性地回避 TurboQuant 方法与已有 RaBitQ 方法的相似性

RaBitQ 与 TurboQuant 在方法层面有直接的结构联系，两者都在量化前对输入向量施加随机旋转（Johnson-Lindenstrauss 变换）。这是两篇论文方法设计中最核心、最接近的部分。

TurboQuant 的作者在 ICLR OpenReview 审稿平台上对审稿人的回复中，亲自这样描述自己的方法：

「We achieve this by first normalizing the vectors by their l2 norm and then applying a random rotation （随机旋转）to ensure the entries of the vectors will have a beta distribution post rotation.」

然而在这段回复、TurboQuant 论文中的方法介绍乃至整篇论文中，从未正面说明这一结构与 RaBitQ 完全一致。这一回避发生在以下背景之下：

2025 年 1 月（TurboQuant 论文在 arXiv 发布的数月前），TurboQuant 论文的第二作者 Majid Daliri 主动联系我们，请求帮助调试他自己基于 RaBitQ C++ 代码实现的 Python 版本。他详细描述了自己复现的步骤、代码片段和具体报错，这一点可以说明 TurboQuant 团队对 RaBitQ 的技术细节有充分的了解。之后在 2025 年 4 月他们在 arXiv 发布的论文版本，以及 2025 年 9 月他们在 ICLR 2026 会议投稿的论文版本中，他们将 RaBitQ 描述为 grid-based PQ，并且在描述中忽略了 RaBitQ 中核心的 random rotation 的步骤。ICLR 的一位审稿人也在审稿意见中独立指出：」RaBitQ and variants are similar to TurboQuant in that they all use random projection」，并明确要求更充分的讨论和比较。尽管如此，在 ICLR 会议最终版本论文中，TurboQuant 的作者不仅没有加入对 RaBitQ 讨论，甚至反而还将原本正文中对 RaBitQ 不完整描述移到了附录中。

为此，我们于 2026 年 3 月通过邮件联系了 TurboQuant 所有作者，提出了以上问题及纠正请求后，TurboQuant 作者在回复中以

「The use of random rotation and Johnson-Lindenstrauss transformations has become a standard technique in the field, and it is not feasible for us to cite every method that employs them.」

为由拒绝了这一请求。我们认为这一回应是在转移矛盾：作为在相同问题设定下率先将随机旋转（Johnson-Lindenstrauss 变换）与向量量化结合、并建立最优理论保证的具体先行工作，RaBitQ 应当在文中被准确描述，其与 TurboQuant 方法的联系应当充分讨论。

TurboQuant 论文问题二：错误描述 RaBitQ 的理论结果

TurboQuant 论文在不提供任何论据的情况下，将 RaBitQ 的理论保证定性为」次优」。TurboQuant 论文写道：

「While the paper』s theoretical guarantees are suboptimal, likely due to loose analysis — as practical performance surpasses theoretical bounds」

这句话直接将 RaBitQ 的理论保证定性为」次优（suboptimal）」，将原因归结为」较粗糙的分析（loose analysis）」。但论文没有提供任何推导、对比或证据来支撑这一判断。事实是：我们在拓展版 RaBitQ 论文（arXiv:2409.09913）的 Theorem 3.2 中，已经严格证明 RaBitQ 的误差界达到了理论计算机顶级会议论文（Alon-Klartag, FOCS 2017）给出的渐近最优误差界。因为这一结果，我们被邀请至理论计算机科学顶级会议 FOCS 的 Workshop 进行报告。为此，我们于 2025 年 5 月通过邮件与 TurboQuant 的第二作者 Majid Daliri 进行了多轮详细的邮件技术讨论，逐条澄清了 TurboQuant 团队对我们理论结果的错误解读。Majid Daliri 在邮件中明确表示已将这些讨论告知全体共同作者。然而后面 TurboQuant 论文在提交至 ICLR 2026、经过审稿、被接收，最终大规模宣发的全过程中，这个对 RaBitQ 理论保证的错误定性始终未被修正。一个没有证据支撑的断言，在被原作者具体指出错误、且 TurboQuant 作者方已明确知情的情况下，仍被保留在正式发表的 TurboQuant 论文中，我们认为这已超出普通失误的范畴。

TurboQuant 论文问题三：刻意创造不公平的实验环境

TurboQuant 论文使用劣化的实现、关闭多线程使用单核 CPU 测试 RaBitQ 的效果，却使用 A100 GPU 测试 TurboQuant 的效果。TurboQuant 报告的 RaBitQ 量化速度比我们开源实现的实际速度慢了数个数量级。 2025 年 5 月的邮件中，Majid Daliri 本人解释了这一差距的来源：

「we were using a single-core CPU instance, and multiprocessing was indeed disabled […] we weren』t fully utilizing parallelism, which explains why it was significantly slower」

我们的官方 RaBitQ 代码在论文发布至 arXiv 时（2024 年 5 月与 2024 年 9 月）就已经公开，并且默认采用多线程并行。并且，Majid Daliri 在 2025 年 1 月的邮件中还说明，他成功跑通 RaBitQ 的代码用以测试，但他用于实验的仍是自己翻译的 Python 版本。这意味着，TurboQuant 论文中对 RaBitQ 速度的报告，叠加了两层系统性的不公平条件：

1.使用自己翻译的 Python 代码，而非我们开源的 C++ 实现

2.使用单核 CPU，关闭多线程并行测试 RaBitQ 算法，但却使用 NVIDIA A100 GPU 测试 TurboQuant 算法

以上两点均未在论文中充分披露。读者看到的是 RaBitQ 比 TurboQuant 慢数个数量级这一结论，却无从知道这一结论建立在刻意创造的不公平的实验条件之上。

事件完整时间线

2024 年 5 月：RaBitQ 论文在 arXiv 发布，同时源代码公开（后面发表在顶级会议 SIGMOD 2024）

2024 年 9 月：拓展版 RaBitQ 论文在 arXiv 发布，同时源代码公开（后面发表在顶级会议 SIGMOD 2025）

2025 年 1 月：TurboQuant 论文第二作者 Majid Daliri 联系我们，请求协助调试 Python 版 RaBitQ 实现

2025 年 4 月：TurboQuant 论文在 arXiv 发布

2025 年 5 月：我们跟 Majid Daliri 通过邮件询问了实验条件的差异并清楚解释了 RaBitQ 的理论保证最优性， Majid Daliri 表示他已告知全体作者，但在我们要求修正 TurboQuant 论文中的事实性错误之后，Majid Daliri 停止回复

2025 年 11 月：我们发现 TurboQuant 论文被提交至 ICLR 2026 会议，且论文中的事实性错误并未修正，为此我们联系了 ICLR 2026 PC Chairs，未获回应

2026 年 1 月：TurboQuant 论文被 ICLR 2026 接收 2026 年 3 月：TurboQuant 团队通过 Google 官方渠道持续推广，社交媒体相关浏览量已达数千万次

2026 年 3 月：我们正式向 TurboQuant 全体作者发送邮件，阐述以上三个事实性问题并要求做出修正及澄清。截至目前为止，我们仅收到 TurboQuant 论文第一作者 Amir Zandieh 的笼统答复，承诺会修正问题二和问题三，但拒绝修正问题一（即讨论 TurboQuant 与 RaBitQ 在技术上的相似性）。并且，他们仅愿意在 ICLR 2026 正式会议结束之后才做相应修正

我们已经做了什么

在 ICLR OpenReview 发布公开评论： https://openreview. net/forum?id=tO3ASKZlok

向 ICLR General Chairs, PC Chairs, Code and Ethnics Chairs 再次提交正式投诉，附完整证据包

我们接下来会做什么

在 arXiv 发布详细的关于 TurboQuant 和 RaBitQ 的技术报告

考虑向相关机构进一步反映

最后

我们提出这些问题，目标是让公共学术记录准确地反映各方法之间的真实关系。一篇论文被 Google 以数千万曝光量推向公众，在这种体量下，论文中错误的叙事不需要主动传播，只需要不被纠正，就会自动成为共识，这也是我们选择公开记录的原因。

在此我们也恳请大家让更多人知道 TurboQuant 论文背后存在的问题，我们相信真理越辩越明。

Update: 经各位朋友建议在X和Linkedin上也发了消息，感谢大家的关注

https://x.com/gaoj0017/status/2037532673812443214

https://www.linkedin.com/feed/update/urn:li:activity:7443322114301956096/?originTrackingId=Vc0dkeibHUvsvZ4FSE0Tdw%3D%3D

任何机构或个人均可以自由地以盈利或非盈利的目的转载，需要注明出处

附：

RaBitQ Library 的开源代码链接：https://GitHub. com/VectorDB-NTU/RaBitQ-Library

知友讨论

@momo：

有趣了，谷歌都这么不地道吗

@HowarLi：

去年看这篇文章的时候就觉得里面的公式就是rbq换一种表达方式，在GPU上实现一遍，没什么新的东西。自己水一篇paper就算了，时隔一年还跳出来买量大肆宣发，相当气人的

@朱嫑膘：

已经在x转发，感觉是配合华尔街拿存储公司的筹码而放出的消息。

@流逸：

他iclr 10那个审稿人已经很神秘了，文章除了7b没别的size模型

@WZJRJ28：

有一说一，Rabitq确实吊，ann这个方向鱼龙混杂，你的几篇Paper算为数不多的清流了，都非常硬核工程化做的也很好

@sakura：

1111rabitq是我读过最敬佩的论文之一，包括方法的提出以及数学的推导每次看都无比佩服，支持作者维权

@鱼豆糊：

查了一下TurboQuant作者背景，只能说见怪不怪了

为什么 Token 不能叫机器之薪？

小学生也能看懂的几种大模型幻觉

MiniMax 连夜研究「马嘉祺」

🚀 AI 产品扶持计划：

知乎为 AI 产品提供定制宣发支持，了解/报名请戳：知乎「AI 新品非正式发布现场」扶持计划

🚀 知乎 AI 社群：

如果你是泛 AI 爱好者，对 AI 资讯感兴趣，欢迎扫码加入知乎 AI 社群↓，我们将每周送上 AI 周报，不定时发布 AI 线上线下活动与 AI 产品测试尝鲜。

知乎AI交流群

让一部分开发者先走起来

🚀 知乎科技账号正式登陆 X：

👉 https://x.com/ZhihuFrontier，聚焦「技术 × 观点」的跨语境对话

【声明】内容源于网络

知乎AI先行者

在智能之海寻找信标，航向未来。

内容 174

粉丝 0

知乎AI先行者在智能之海寻找信标，航向未来。

总阅读8

粉丝0

内容174