生成式人工智能方兴未艾,以ChatGPT为代表的大语言模型展现出了对语言文字及文字承载逻辑的强大理解和推理的潜力,就此拉开AI大模型和通用人工智能的大幕。而2024年2月16日OpenAI推出的视频生成模型SORA,在基于视觉信息的空间计算和物理规律理解上,又一次呈现了令人印象深刻的能力。SORA是否真的如OpenAI所说是一个“世界模拟器”,是否真的照明了通用人工智能的道路? SORA生成六十秒连贯一致,具有相当三维认知的视频的基础技术原理和核心逻辑是什么?除了内容产业,还会对哪些行业和领域,有哪些近期和长中期的影响?

我其实更想听到的是号称要“被颠覆”的影视内容行业的人士怎么想这个事,他们会怎么应对。我个人由于搞过不少数字媒体,对这个行业有一些些的了解,在我看来,这个领域会有这个几个变化:
第一,短视频制作可能从此走上“AI为主,拍为辅”的模式,也就是几分钟的视频,以后确实不太需要用人来拍了,人主要出创意和提示指令就好,但我不觉得这意味着人人都可以靠SORA赚钱了,也不意味着短视频领域的蛋糕会突然变大,人们对短视频的消费注意度和时间都是相对稳定的,短视频再多,人们也只会挑前5%的内容消费 —— 意味着基本还是那5%的内容制作者会拿到收益。而有个群体会新进入到那5%,就是那些有创意,有美感,有经验,但实操不太行的人,这些人会因为工具的进步迅速出圈。

第二,长视频,影视作品的制作,会进入“人机协同”的阶段。原来一个作品大部分是靠拍摄,机器负责后期,而有了SORA,很可能真拍的部分会少很多,拍的画面或视频作为提示(Reference)扔给SORA,让AI按拍摄的风格色彩运镜之类的来补镜头,也许以后摄制组一个场景只要拍几个镜头就好(但还是要拍的)

第三,IP会更珍贵,版权会很重要。当制造一个东西太容易太普遍的时候,我们也许就需要用附加价值/衍生价值来形成差异化了,而IP(官方授权)就是一个最常用的附加价值,就象同一双鞋,同一个莆田生产线下来,一个打上Nike标,一个没Logo, 前者就贵了好多倍。
大胆设想一下,如果谁都可以生成紫禁城,最后紫禁城的内容是不是会多到根本挑不出太大差异出来?那如果有一个作品说,我这个紫禁城是得到IP授权的,是有故宫官方认证的,这会不会特别一点?(这就是NFT的逻辑);或者故宫官方为了避免生成的紫禁城作品太多太泛滥,会不会申请“被AI生成”的版权?这样一来,是不是很多IP都会因为担心被AI生成的太多,而限制AI生成内容中引用自己或跟自己类似的形象?由于AI能力加持,内容一定会出现过泛,可以想见,一方面是很多原创内容/设计/创意/品牌形象会更积极申请成为有版权保护的“IP”,另一方面,申请成功的IP会通过授权来获益。个人预计,这又会拉动区块链的发展。—— 仅代表尹智个人观点 Ken’s personal view only



