

谷歌承认“窃取”OpenAI模型关键信息：成本低至150元，调用API即可得手

亿海全球

2024-03-12

导读：OpenAI最终选择修改模型API，“有心人”想复现谷歌的操作是不可能了。

谷歌研究破解大模型关键信息

谷歌最新研究指出，通过模型API访问，可低成本提取大模型的关键信息，如隐藏维度大小及投影矩阵。这表明仅需不到2000次查询，成本低于20美元即可实现。

研究团队主要针对模型最后一层——嵌入投影层进行攻击，通过大量针对性查询和奇异值排序技术确定隐藏维度。

例如，在Pythia 1.4B模型中，通过超过2048次查询发现峰值出现在第2048个奇异值处，确认其隐藏维度为2048。

此外，可视化连续奇异值之间的差异也可用于验证是否成功提取关键信息。

此次研究由谷歌DeepMind主导，包括苏黎世联邦理工学院、华盛顿大学等机构的研究人员共同参与，甚至包含一位OpenAI研究员。

在实验过程中，谷歌团队已提前征得OpenAI同意，并在完成后删除所有相关数据。尽管具体数字未披露（如gpt-3.5-turbo的隐藏维度），但该研究引发业内广泛讨论。

论文提到防御措施包括从API端彻底移除logit bias参数或修改模型架构中最后一层隐藏维度等。

基于此，OpenAI调整了模型API策略，阻止类似操作再现。

【声明】内容源于网络

亿海全球

亿欧EqualOcean旗下账号。洞察国际趋势，解码出海新路径，助力中国质造纵横全球，共创产业新格局。

内容 1382

粉丝 0

亿海全球北京亿欧网盟科技有限公司亿欧EqualOcean旗下账号。洞察国际趋势，解码出海新路径，助力中国质造纵横全球，共创产业新格局。

总阅读47.9k

粉丝0

内容1.4k