《纽约时报》诉OpenAI数据保全令:AI治理的新分水岭
4亿用户数据留存争议揭示企业AI合规重大挑战
2025年5月13日,美国地方法官奥娜·T·王(Ona T. Wang)在《纽约时报》诉OpenAI案中签发保护令,要求OpenAI保留所有ChatGPT对话日志,影响全球超4亿用户[k]。此举成为AI数据管理的分水岭事件,标志着法院首次大规模强制保存AI生成内容,迫使企业重新审视隐私承诺、国际合规义务及AI系统与用户数据的关系[k]。
该诉讼始于2023年12月,《纽约时报》指控OpenAI非法使用其数百万篇文章训练AI模型[k]。争议焦点转向数据保存,源于《纽约时报》指控OpenAI系统性删除可能证明版权侵权的用户对话记录[k]。王法官的保护令要求OpenAI“保存并隔离所有本将被删除的输出日志数据”,无论删除源于用户请求或隐私法规要求[k]。
OpenAI反对称,该命令与其对全球用户承担的法律、契约、监管及道德承诺相冲突,且数据基础设施复杂,保留原定删除数据需大量工程改造与算力投入[k]。其抗辩理由包括:需保存600亿条难以检索的对话;仅0.006%数据可能相关;技术成本高昂;用户合理预期已删对话不会被保留[k]。
经2025年5月27日听证,法院澄清保全义务仅适用于特定ChatGPT服务方案,非“全面保全”[k]。OpenAI声明,ChatGPT免费版、Plus版、专业版、团队版及未签署“零数据保留协议”的API用户数据被纳入保全范围;企业版与教育版除外[k]。保全数据将存储于独立安全系统,仅限经审计的法务团队基于诉讼目的访问[k]。
OpenAI向地区法院法官西德尼·斯坦恩(Sidney Stein)提交异议动议,主张:无实质证据证明用户通过ChatGPT获取受版权保护内容;保全令造成不成比例负担;程序不公,基于已被证伪的数据破坏指控[k]。斯坦恩法官当庭驳回异议,维持保全令,指出OpenAI使用条款允许为法律合规保全数据,且用户隐私权益不能对抗法定证据保全需求[k]。他认可输出日志对查明潜在版权侵权具有关键证明价值[k]。
此案对企业AI治理产生深远影响[k]。采用AI解决方案的机构需重新评估证据开示义务,AI系统产生的新型电子存储信息(ESI)需专门处理[k]。企业应警惕供应商隐私承诺与法院命令之间的冲突,考虑在合同中增设数据保全告知与反对机制[k]。“零数据保留协议”可从根本上规避此类风险[k]。
前端数据标记与分类成为关键风险管理工具[k]。王法官曾担忧OpenAI未能提供足够信息判断自动销毁日志的关联性[k]。提示词(prompt-based)标记有助于识别潜在相关内容,避免诉讼中逆向工程的高昂成本[k]。随着主要AI模型供应商普遍涉诉,积极构建可操作的证据开示框架将成为企业竞争优势[k]。
该案将抽象隐私担忧转化为具体操作挑战[k]。随着《纽约时报》开始审查被保全日志,大规模AI数据调取的实际难度与潜在宪法争议或将浮现[k]。OpenAI持续上诉,未来可能由上诉法院确立全美AI数据治理先例[k]。并购尽职调查、合资决策及供应商选择将不得不纳入AI诉讼风险与数据保留架构评估[k]。
组织必须认识到,AI整合不仅涉及技术创新,更需理解法律原则随技术演进的动态过程[k]。具备前瞻性治理策略的企业,将更能应对未来不可避免的披露挑战[k]。

