AI训练数据的版权之争,可能迎来一个"官方解决方案"。
【导语】
AI公司训练模型需要海量数据,但获取这些数据的方式一直充满争议——要么是"偷偷摸摸"地爬取,要么是面临天价版权诉讼。
现在,亚马逊想解决这个问题:建一个"内容市场",让媒体公司能直接把内容授权给AI公司使用。
亚马逊的计划:做一个"内容中介"
据The Information报道,亚马逊正在与出版业高管会面,介绍其建立内容市场的计划。
在周二的一场AWS出版商大会之前,亚马逊已经"分发了提及内容市场的幻灯片"。
面对TechCrunch的询问,亚马逊发言人既不承认也不否认,只是说:
"亚马逊与出版商在业务的许多领域建立了持久、创新的关系,包括AWS、零售、广告、AGI和Alexa。我们始终在共同创新以最好地服务客户,但目前没有具体信息可以分享。"
典型的"既否认又确认"式回应。
为什么是现在?
AI行业对可授权内容的追求一直是一件"混乱的事情"。
-
lawsuit 不断:《纽约时报》起诉OpenAI和微软 -
指控不断:版权侵犯、未经授权使用内容 -
公关危机:AI公司被描绘成"内容盗贼"
现在,科技公司开始寻找合法且可持续的解决方案。
微软最近就推出了所谓的"出版商内容市场"(PCM),声称要给出版商"新的收入来源",同时为AI系统提供"规模化的高质量内容访问"。
亚马逊的举措,明显是对微软的回应。
这能解决版权问题吗?
从法律角度看,这是一个聪明的策略。
OpenAI已经与多家大型新闻出版商签署了内容授权合作协议:
-
Associated Press(美联社) -
Vox Media -
News Corp(新闻集团) -
The Atlantic(大西洋月刊)
但这些零散的交易并没有阻止诉讼潮。
一个集中的"内容市场"可能会改变游戏规则:
-
对AI公司:合法、透明地获取训练数据 -
对出版商:稳定的收入来源 -
对法律系统:减少诉讼案件
但这真的能解决根本问题吗?
出版商的困境:流量还是收入?
出版商们面临一个两难选择:
选择一:拒绝与AI公司合作
-
保护自己的内容不被用于训练AI -
但AI摘要可能会减少网站流量
选择二:与AI公司合作
-
获得授权收入 -
但可能会加速自己的"边缘化"
一项最近的研究声称,Google搜索结果中的AI摘要已经对网站点击率产生了"毁灭性"影响。
The Information的报道指出,出版商可能将这种市场模式视为比当前有限授权合作"更可持续的业务",能够随着AI使用的持续增长而"扩大收入"。
但问题是:当AI可以直接生成答案时,谁还会去点击原始链接?
行业趋势:从"偷窃"到"购买"
亚马逊和微软的举动反映了一个更大的行业趋势:
AI公司正在从"偷偷爬取内容"转向"正式购买内容"。
这是一个明智的商业决策:
-
减少法律风险 -
改善公关形象 -
确保训练数据质量
但这也提出了一个新问题:
小公司怎么办?
《纽约时报》这样的大媒体可以谈判出好价钱,但个人博主、小型新闻网站呢?他们的内容可能同样有价值,但在谈判桌上却没有话语权。
这可能会导致一种新的"数字鸿沟":
-
大媒体获得AI授权收入 -
小创作者被排除在外
对内容创作者的建议
如果你是一名内容创作者,这个市场趋势意味着什么?
1. 了解你的权利 了解版权法,知道你的内容如何被使用,以及如何保护它。
2. 考虑加入集体谈判 单打独斗很难与科技巨头谈判,但通过行业协会或联盟,小创作者也能发出声音。
3. 探索新的商业模式 当内容可以直接在AI中呈现时,传统的广告模式可能会失效。思考新的价值主张:社区、独家内容、个性化服务……
亚马逊的"内容市场"计划,可能是AI行业走向成熟的一个标志。
从混乱的"狂野西部",到规则明确的"正规市场"——这个转变对行业的长期健康发展是必要的。
但它也带来了新的问题:在一个AI可以直接生成内容的世界里,人类创作者的价值在哪里?
这个问题,可能比版权问题本身更难回答。

