大数跨境
0
0

杨皓森 王雨乔 | 从OpenAI对DeepSeek的指控看“蒸馏”行为的合法性

杨皓森 王雨乔 | 从OpenAI对DeepSeek的指控看“蒸馏”行为的合法性 知产前沿
2025-02-04
42
导读:更多知产前沿原创,请关注“知产前沿”公众号!

DeepSeek被指“蒸馏”OpenAI模型?技术合法性深度解析

从技术原理到法律边界,厘清大模型知识迁移的合规路径


作者 | 杨皓森 王雨乔

杨皓森,海瑞智法联合创始人、CEO

王雨乔,复旦大学中国金融法治研究院助理研究员

目次

· 引言 一、争议背景 二、何为大模型“蒸馏”技术 三、DeepSeek“蒸馏”OpenAI大模型的合法性分析 (一)“蒸馏”的争议解决机制及法律适用 (二)蒸馏行为的知识产权法分析 (三)蒸馏行为的不正当竞争法分析 四、蒸馏行为对人工智能产业及技术发展的影响 五、未竟的思考

引 言
Foreword
近期,DeepSeek模型引发外界对其是否采用“知识蒸馏”技术复制OpenAI成果的质疑。OpenAI称,2024年秋季监测到大量来自DeepSeek相关主体通过API调用其GPT模型,批量获取输出结果用于训练自身模型[1]。本文不预判事件对错,旨在系统解析知识蒸馏的技术逻辑,并结合法律框架分析其合规边界,为AI产业发展提供理性参考[1]

争议背景
大模型如GPT、BERT等虽推动AI技术进步,但高算力需求限制其在移动端等资源受限场景的应用。知识蒸馏作为模型压缩技术,成为实现轻量化部署的关键路径[1]
2025年发布的DeepSeek-R1凭借开源策略、显著低于OpenAI的训练成本(约为其1/20)及高性能表现迅速获得关注[1]。然而,其技术路径是否涉及未经授权的模型“蒸馏”,引发OpenAI关于知识产权侵权和不正当竞争的指控,成为行业焦点[1]
本文旨在厘清知识蒸馏的技术本质,结合现行法律分析其合规性,为产业实践提供参考[1]

何为大模型“蒸馏”技术
知识蒸馏(Knowledge Distillation)由Hinton等人于2015年提出,通过将大模型(“教师模型”)的知识迁移至小模型(“学生模型”),在降低计算开销的同时保留高性能[1]
该过程类比为教师向学生传授知识:不仅提供答案,更传递答案背后的推理逻辑与概率分布,即“暗知识”(Dark Knowledge),如“80%是A,15%是B”[1]。这种细粒度信息帮助学生模型更深入理解任务,提升泛化能力[1]
蒸馏主要包含三个步骤:教师模型训练、软标签知识传递、学生模型训练[1]。依据知识传递方式,可分为三类:
(1)基于输出的蒸馏:学生模型学习教师模型的输出概率分布;
(2)基于特征的蒸馏:学生模型学习教师模型中间层的特征表示;
(3)基于关系的蒸馏:学生模型学习数据间的结构关系,适用于跨模态任务[1]
知识蒸馏有效降低模型部署门槛,广泛应用于边缘计算与实时系统,是AI普惠化的重要技术路径[1]

DeepSeek“蒸馏”OpenAI大模型的合法性分析

(一)“蒸馏”的争议解决机制及法律适用

根据OpenAI《服务条款》,与使用其服务相关的争议(包括知识产权侵权、不正当竞争、违约等)需提交美国加利福尼亚州旧金山市进行仲裁[1]。若争议不属于仲裁范围,则应由旧金山当地的州或联邦法院管辖[1]。相关法律适用明确为加利福尼亚州法律(不含其冲突法规则)[1]。因此,潜在纠纷将在美国法律框架下,特别是加州法律和联邦法律体系中解决[1]

(二)蒸馏行为的知识产权法分析

目前全球对AI模型本身的知识产权保护尚不明确,中国法规侧重数据合规,美国对AI生成内容版权保护亦存争议[1]。分析应聚焦于OpenAI用户协议的约定[1]
1.  OpenAI用户协议核心条款梳理
协议规定,用户需确保输入内容(Input)的合法性并保留其所有权[1]。对于输出内容(Output),协议明确“将我们可能享有的全部权利、所有权和利益转让给用户”(assign to you all our right, title, and interest)[1]
2. 协议解释与权利归属的法律逻辑
(1)OpenAI对输入内容不享有权利:用户保留输入内容所有权,OpenAI不因此获得任何权利[1]
(2)OpenAI对输出内容不享有所有权:协议使用“转让”(assign)而非“许可”(license),表明OpenAI已将可能拥有的任何权利完整让渡给用户,自身不再持有[1]
(3)蒸馏技术下的数据权利归属
若蒸馏所用数据源于OpenAI的输出内容,依据协议,该数据的权利已归属于用户。因此,OpenAI并非权利主体,缺乏主张权利的法律基础[1]
此外,根据美国版权局立场,完全由AI生成、缺乏人类实质性创造性贡献的内容不受版权保护[1]。这进一步削弱了OpenAI对其输出内容主张著作权的可能性[1]

(三)蒸馏行为的不正当竞争法分析

在美国法下,评估蒸馏行为是否构成不正当竞争需考察是否对OpenAI造成“竞争性损害”及是否损害消费者或公共利益[1]
1. 竞争性损害分析
(1)竞争关系确认:使用OpenAI输出训练出的“学生模型”在功能、市场和用户上与OpenAI模型高度重合,构成直接竞争关系[1]
(2)竞争性损害认定:蒸馏可能导致OpenAI市场份额或商业价值下降。但竞争性损害本身不等同于违法。关键在于行为是否“不正当”[1]
由于用户协议已赋予用户对输出内容的完整使用权,其获取和使用数据的行为具有正当性。因此,即使造成竞争损害,也属于正当竞争范畴[1]。OpenAI若主张不正当竞争,需证明存在合同违约、商业秘密侵占等额外不法行为,仅凭竞争损害不足以成立[1]
2. 对消费者与公共利益的影响
不正当竞争分析亦考量公平与效率。允许基于公开API输出进行研究与模型开发,有助于促进技术进步、增加市场竞争、降低用户成本,符合公共利益导向[1]。除非能证明存在欺骗、混淆或滥用行为,否则单纯的技术借鉴更可能被视为推动创新的正当竞争[1]

蒸馏行为对人工智能产业及技术发展的影响
知识蒸馏作为模型优化的关键技术,其合法性边界直接关系到AI创新生态。明确用户对API输出的使用权,有助于鼓励基于已有模型进行二次创新和轻量化研究,促进技术普惠[1]。过度限制“蒸馏”等技术应用,可能抑制中小机构参与AI研发,不利于产业多元化发展[1]

未竟的思考
尽管当前协议和版权框架下,DeepSeek若仅使用OpenAI公开API输出进行蒸馏,其法律风险较低,但技术伦理与行业规范仍需探讨。未来需在保护原始创新与鼓励技术演进之间寻求平衡,建立更清晰的AI模型使用与数据共享规则[1]

模型蒸馏是否构成不正当竞争?法律与产业影响分析

技术中立性与市场竞争的边界探讨

公平取向关注市场竞争是否在公正条件下进行,重点审查是否存在滥用市场支配地位、虚假陈述或违反商业伦理的行为。在此标准下,若蒸馏行为涉及虚假归属(false attribution),即误导性地将学生模型输出标注为OpenAI生成内容,可能引发消费者混淆,触犯《兰哈姆法案》关于虚假来源标识的规定[k]
此外,若蒸馏模型未经实质性改进而直接复制OpenAI的独特输出内容,可能被认定为恶意复制(bad faith copying),构成不正当搭便车或商业诋毁[k]。然而,在用户依据合法合同获取输出数据的前提下,单纯的蒸馏行为并不必然破坏市场公平。除非OpenAI能证明存在误导性营销或其他违规行为,否则该技术应用不应因公平性理由被禁止[k]
效率取向下的积极影响
效率取向侧重评估市场竞争对整体经济效率、技术创新和消费者成本的影响。蒸馏技术有助于降低AI模型的计算开销,提升中小开发者和企业获取先进AI能力的可行性,促进技术扩散与市场竞争[k]
更多参与者的进入可能带来价格下降、服务质量提升和创新加速,从而增强消费者福利(consumer welfare)[k]。但若蒸馏生成的模型质量低下、可靠性不足,也可能损害用户信任,削弱AI产业公信力,监管机构可基于消费者保护原则介入干预[k]
参考美国司法实践,如Google LLC v. Oracle America, Inc.(2021)案中,最高法院认定API代码的合理使用有利于创新和竞争,支持有限复制。类似逻辑可能适用于AI训练数据争议,法院或倾向于认可合理数据使用对技术进步的积极作用,而非简单认定为不正当竞争[k]
综上,对OpenAI输出数据进行蒸馏是否构成不正当竞争,关键在于评估其竞争损害是否具有法律正当性,以及对公共利益的影响。鉴于用户协议已赋予用户对输出数据的完整权利,合法使用数据进行蒸馏属于正常市场竞争范畴,即便影响OpenAI市场份额[k]。从公平角度看,仅当存在虚假归属或恶意复制时才可能违规;从效率角度看,蒸馏有助于降低成本、推动技术普及,总体利于社会福利提升[k]

蒸馏技术对AI产业发展的影响

蒸馏技术虽可能挤压教师模型的市场收益,影响领先企业研发投入动力,但其长期社会影响需综合研判[k]
学生模型因参数少、成本低、推理快而广受青睐,可在部署层面替代部分教师模型功能。然而,高端应用场景如前沿科研、企业级系统仍依赖教师模型的顶尖性能。同时,学生模型的持续优化仍需教师模型支撑,若教师模型停滞,学生模型的进步也将受限[k]
合理机制下,教师与学生模型可形成互补,提升社会整体福利:降低AI使用门槛,促进中小企业和开发者创新;提高计算资源利用效率,减少能耗;加速AI在各行业的渗透,推动智能化升级[k]。但若市场过度依赖学生模型,可能导致教师模型研发动力减弱,长远看或抑制技术进步,损害公共利益[k]

未竟之问:技术发展与规则滞后的冲突

模型蒸馏作为学术与工业界广泛采用的技术,本身具有合法性,但目前处于法律与伦理的灰色地带[k]。其争议源于AI知识产权界定不清——训练数据与方法是否构成受保护权利尚无国际共识;同时,开源与闭源边界模糊,若OpenAI模型本身借鉴了开源成果(如Transformer架构),其主张的正当性可能受到质疑[k]
若相关指控成立,可能引发头部企业收紧技术开放,加剧闭源趋势,阻碍学术与中小企业创新,并迫使企业投入更多资源追溯数据来源,推高合规成本与开发门槛[k]
OpenAI需证明DeepSeek存在系统性、有意的复制行为,而非通过独立训练实现相似效果,这在技术上极具挑战。目前信息有限,需等待双方披露训练日志、模型架构等细节。应理性看待争议,避免单方面定论[k]。该事件凸显AI时代对数据使用规范、模型衍生品权属规则及行业标准的迫切需求[k]
根本矛盾在于技术发展速度远超现有法律框架。模型蒸馏本身中立,关键在于应用合规。未来行业或需建立数据溯源机制、模型衍生声明制度,推动跨国知识产权协议更新,并鼓励企业通过合作而非诉讼解决技术复用争议[k]
对开发者和普通用户而言,关注技术透明度与合规性,优先选择遵守开源协议和用户条款的工具,是规避法律与伦理风险的有效路径[k]



作者:杨皓森 王雨乔

编辑:Sharon

【声明】内容源于网络
0
0
知产前沿
各类跨境出海行业相关资讯
内容 7410
粉丝 0
知产前沿 各类跨境出海行业相关资讯
总阅读25.8k
粉丝0
内容7.4k