AIGC方兴未艾,人类与人工智能的纠葛纷争却已然烽烟四起。

(起诉状首页,源网络)
在开始介绍这起案件的前因以及可能的后果之前,首先需要对Stable Diffusion这款软件有个大致的了解。Stable Diffusion于2022年8月公开发布,是Stability AI开发的一款开源软件,它可被任何人免费部署和使用,同时任何人都可以参与软件的研发,加之其自对图片自定义程度高、上手难度低但产图质量高、模型种类多、不设内容过滤器等优势,使得它如此年轻却已然在AI绘画领域成为现象级的存在。
AI绘画软件并不是人类,没有自主学习的能力,需要被人类不断训练才能“成长”,最终“学会绘画”。短短一年多的时间,Stable Diffusion惊人的成长能力早已有目共睹,人类海量的在先画作是训练AI快速且深度地学习绘画的绝佳素材,我们常常把拿图片给AI学的这个过程称之为“喂图”,喂图训练AI学习绘画生成模型称之为“炼丹”。
Stable Diffusion完全开源,目前除了官方的默认模型,个人训练并发布的模型(俗称私炉模型),更是百花齐放。甚至由于版权问题,使得官炉在学习素材的来源和尺度上面存在较大限制,利用私炉作画出图逐渐成为了主流。
但无论是官炉模型还是私炉模型,一个成熟模型的形成都离不开“喂图”这一步,从法律角度来看,“喂图”这个行为便涉及对他人享有版权的作品进行一定程度上的利用,涉及潜在的侵权隐患。
再进一步来看,训练完毕之后,利用模型调整提示词进行文生图是否会产出与训练源相同或者高度相似的画作呢?为了深度研究和挖掘AI模型侵权的证据链条,国内外的研究团队都对AI扩散模型展开了大量的研究,马里兰大学和纽约大学的联合研究团队指出:利用Stable Diffusion模型生成的内容,与数据集(LAION-5B)作品(即训练源)相似度超过50%的可能性达到了1.88%,而这个比例的得出仅仅是研究员对比检索了LAION-5B中的1200万张图像,而这个超大数据集本身却包含超过50亿个图像和文本对。
简言之,无论是AI模型训练输入素材过程(训练阶段),还是AI模型形成产出画作过程(应用阶段),均有可能发生版权侵权问题。而“Stable Diffusion”AIGC模型版权侵权案诞生,也正是因为其依赖于LAION-5B这个超大数据集作为训练数据来源,而其中也包括了原告的权利作品。
原告Getty Images,1995年成立于美国西雅图,首创并引领了独特的在线授权模式——在线提供数字媒体管理工具以及创意类图片、编辑类图片、影视素材和音乐产品。它拥有8亿张图片库,1500万精品创意图片,保持每月5万余张更新。在本案中,原告认为Stability AI未经许可,获取与利用其版权作品作为Stable Diffusion的训练源,并声称被告已经从Getty images复制了至少1200万张受版权保护的图片,以及其对应的文本和元数据。

(诉状18页 左:Getty Images原图 右:Stable Diffusion生成图且带有Getty Images水印)

(诉状22页 Stable Diffusion生成的怪异图像且带有Getty Images水印)
LAION-5B图片元文件遵循的是知识共享许可协议(CC) 4.0协议,但图片本身的版权仍然受到保护。
在模型训练阶段,因为该数据集提供的是图像和文本的在线URL列表的索引,若Stability AI想要将这些图像作为训练源喂给官方模型,则可能涉及对版权作品复制权的侵害,因为其需要在对应网址下载后将版权作品源源不断地输入模型中。在模型应用阶段,根据相关研究以及原告的诉状部分展示内容,可推测利用模型产出的新画作存在与训练源高度相似的可能性,涉及落入复制权和改编权的控制范围。
在如今已经高度完善的授权许可商业模式下,被告如此大规模未经许可付费使用图像,根据美国版权法上的“四要素分析法”,分析Stable Diffusion训练阶段“喂图”行为的性质,其并没有在原作品的基础上增加更多的意义或者美感,而是将权利作品简单复制给AI模型让其进行增加噪点和去噪点的训练学习活动,这种大量使用原告作品的行为,显然给原告方权利作品的潜在市场产生了一定程度的影响,并且AI模型生成的图片也很大程度地挤占了原告作品的市场份额,被告对于涉案作品的使用看似较难落入合理使用的范畴,但本案最后的结果如何,目前还尚未可知。

(美国版权法 第1章第107条 关于“合理使用”的规定)
“从今天起绘画死亡了。”1839年,照相机被发明之初,法国一位知名艺术家如是说。可见摄影技术给绘画领域带来了多么巨大的冲击,尤其是在如肖像画等传统现实主义领域。而现如今,AI绘画以势不可挡的锐利速度发展壮大,以它的学习能力,可以产出任何一种现有的、符合市场需求的画作,如此强大且高效的工具,甚至是一个丝毫不懂绘画的初学者,也可以产出精美的画作。而这对于那些手执画笔,一笔一画将自己灵感凝结成形的艺术家来说,必定又是一次前所未有的变革性冲击。
而"私炉炼丹"这一模式,对于一些小众风格、小有名气的艺术家来说,更是致命的打击。任何一个人都可以从网络上自行获取艺术家已经公开发布的同风格作品并将它们全部喂给模型,从而得到与艺术家相同风格的模型,进行后续的使用甚至是商用。当独一无二的风格一夜间变得随处可获和唾手可得,艺术家的坚持是否又会被这些“模仿作品”淹没呢?艺术领域的创造性、繁荣性和多样性是否会衰退不前呢?如果放任现状不加任何约束的,答案可想而知。
目前,根据国内外的著作权法,只保护思想的“表达方式”而非“思想”本身,这种所谓的风格又难说可以落入表达的范畴,那构成实质性相似更无从谈起了,何谈认定侵权呢。而部署到本地的炼丹手段,对于权利人的举证来说,更是困难重重。
因此,如果认为AI模型训练构成合理使用,从某种角度上来说确实有利于技术发展,但与此同时,利益受损最严重的一定是艺术领域中“慢工出细活”的艺术家们。科技不应该是野蛮发展的,在我们无法预知AI绘画模型高度成熟时会给社会带来何种以及多大的负面冲击之前,仅用一句“合理使用”笼统判定所有AI模型训练都不构成侵权,在目前来看似乎有些武断。更具体一点说,合理使用是出于公共利益等目的考虑对版权这种绝对性权利的制约,若认定AI模型训练构成合理使用,仅此一个认定便会冲击到无数版权,使无数权利人处于利益受损而无法可依的状态。当利益的冲突过大,那便需要司法立法谨慎衡量。因此,就目前AI绘画模型大体发展未见明晰之时,无论是司法还是立法,都应适当保持摸着石头过河的态度。
科技创新的发展势不可挡,与目前的社会既定利益分配制度产生冲突已然不可避免,因而需要法律的出现进行再规制和分配。但众所周知,法律滞后于社会发展,又需要对社会发展作出前瞻性的规定,相信在不远的未来,法律会逐步实现艺术发展和科技创新的平衡,为艺术发展继续保驾护航,也为算法模型以及数据训练的版权保护提供更强有力的制度基础。

