

解读|AI与创意的辨析：从卡牌到虚拟人

杭州文创数字科技研究院

2023-06-03

我不是一个非常正统的设计师，大学学的主要是化学，接触的行业和设计类别都比较杂。我有很多个标签，这些不同人生经历混合而成了一个我。在这个过程中我观察到一件很有趣的事情，所谓的创意存在于学科与学科之间，元素与元素之间的交汇之处。

在过去的一年里我做的所有的AIGC的作品都是不同元素的融合，以及不同工具创造产生的。今天在这里大概回顾一下这些不同元素和技术结合的作品。

这个是在去年上半年刚接触AI绘画的时候制作的一套数字藏品，发布在tophold的平台上。当时用的是MJ的V3版本的算法模型，AI绘画很擅长把不同的元素进行融合，比如这里我把完全相反的克苏鲁和可爱进行融合。得出了一系列这样的小怪兽。那个时候的Ai生成效果还比较初级，但是仍然能得到一些意外的惊喜。其实越是早期不完美的阶段，对于灵感的扩散越有效。

这也是去年早期用MJ生成的25张外星城市。因为mj无法生成视频，所以我使用了另外的AI工具通过读取图像的深度信息来把静态图片生成6s左右的视频。然后再把这些视频剪辑到一起。大家可以看一下大概的效果。

即使是二维的图片我们仍然会有各种方式把它制作成动态的视频。这是我的另一个尝试，其实素材就是上一个视频，然后通过AE后期制作了一个曼陀罗的效果。这个的灵感来自于荣格的金花的秘密，讲的是人在禅定的过程中看到的金色的花朵。

这里总结了一下AI视频的玩法思路。从去年到现在，有非常多种不同的AI视频工作流，这里大致总结出了6种。

第一种就是用静态图加一些别的AI工具或者后期制作视频。

第二种也是最早期AI通过直接生成序列帧的方式生成视频，这种方式生成的视频非常的具有梦幻感。但是很难具象化。

第三种也是今年的趋势就是文字直接生成有逻辑的视频，我们可以看到很多大公司在研发这个领域。

第四种是用AI生成的图片制作虚拟人，然后虚拟人可以生成相应的视频，这个常见的工具有did

第五种是用ai改变现有视频的风格。也叫做风格迁移。runway的gen1和gen2都是专注于这个方向的产品。

最后是一个影视行业的工作流，通过AI替换视频中的角色，可以大大减少视频的制作成本，过去需要渲染的步骤现在可以一键生成了。这个产品还在内测中。

除了视频我还进行了一些其他的尝试。这个是把AI生成的插画拆分成图层，然后制作成一个简单的AR效果。大家可以看一下。

接下来这个是跟一个卡牌制作公司合作的一套伟特塔罗牌。一共78张，是对传统伟特的另一种阐释。AI结合文创产品也有非常多的。

这个是我们团队用AI制作的一个虚拟人塔罗师，大致的流程是这样的，midjouney生成女巫的形象和场景。然后用SD拆分成图层，这个过程跟之前用AI制作AR的流程是一样的。

最后，通过调优好的大语言模型让这个塔罗师可以交互，并且以塔罗师的身份去回答问题。

大家可以来看一下效果。我问它五月份的运势。这个交互区别于传统的占卜程序，是可以实现多轮问答的。比如在问了一个五月运势之后，还可以继续追加提问，比如我问嗓子疼怎么办？

虚拟塔罗师的内测网址是：SigniFi.Life

上面的这些个人案例大家可以看到，都是不同领域，不同工具的结合。

在这些项目中我的角色更像是一个发起人和选择的人，而不是传统的创作者。

这就引发出了一个问题就是，创意这件事世人类独有的么？

AI绘画从去年到现在一直都有质疑声，比如下面这些评论，其实是我的塔罗牌项目发布后在评论区截取的真实案例，这也是比较常见和典型的一类说法，就是AI绘画是缝合全球艺术家的尸体。不知道大家是怎么看待这件事的。

我自己做设计师这么多年，其实发现创意这件事本身就混合不同的元素，然后从这些不同的融合中发现新的关系，这些建立在旧元素上面的新关系，我们管他叫创意。

所以我的结论是，一切都是融合，无论是人类创作者还是ai，everything is a remix是一部纪录片的名字，探讨的就是创意的本质，在它最新的2023年的版本里，加了一个小时关于AIGC的内容，大家可以去看看。

https://goo.gl/gtArc

其实在AIGC出现之前，原创和抄袭之间并没有一个十分明显的分界线，绝大多数的作品都可以看到前人的影子，并不存在一种真正的原创。

现在很多人去诟病AI抄袭画家的画风，其实画风的融合和模仿是一直存在的事情，著名的穆夏的画风，是融合了日本的浮世绘，拜占庭的装饰风，还有巴洛克的华丽，同时呢穆夏又被称为日本少女漫画的鼻祖。

而现在这一切不同的风格，都被融合到了大模型里，以提示词的形式存在。

我们从人工混合画风的时代进入到了机器混合的时代。

我们过去总是习惯于有个权威的艺术家来告诉你什么是美？什么是好的设计。

现在内容和画面的生成能力从一小部分人，下放到了几乎所有人。

包括midjourney在内的文生图模型，midjourney的成功其实在于它让社区里的所有人都来去帮它优化模型，midjourney的成功是无数这些普通人的选择优化得来的结果，并不是依靠某个天才的算法工程师。

我们可以把文生图大模型当然所有人类审美的共同体。

而大语言模型则是所有人类知识的共同体。

在这种大环境下，作为个体的人类开始恐慌是挺正常的一件事。我一部科幻小说叫忧郁的大象，讲的就是在人工智能的冲击下，人类艺术家对创造本质的一些思考。

这个我自己也很有感触，我觉得在AI绘画的语境下，自己更像是发现者，而不是创造者，但是我并不是很在意这个，aigc这个技术可以让个体有更多的可能性。

接下来我从几个维度去讲一下AIGC会如何扩展创作者的能力边界。

第一个就是时间的维度，这个很好理解，我们每个人每天都只有24小时，这是这个世界最公平的事情。但是aigc可以让你在有限的生命区间里体验到更多的事情。

过去我们画一张画需要一周甚至一个月，后来出现了扩散模型，一开始去年年初的时候disco diffusion生成一张图需要二十多分钟，然后变成了几分钟，现在SD和mj的生成速度都是以秒计算的。

过去一个画师一辈子可能只会形成一种自己独特的画风。现在我们可以很轻松的去把不同的画风进行融合，去尝试更多的可能性，我们可以通过控制不同模型的比重去调整最后的画风结果。

这个跟传统艺术家探索画风的过程其实并没有很大的差别，但是时间成本无限的压缩。

除了时间的维度，还有空间的维度。

我们可以通过AIGC技术去让已经不存在的人活过来。通过训练他们之前的语料数据，相对于之前只有一个外皮的虚拟人，有了对应的语言大模型，相当于给这个虚拟人注入了灵魂。

这个技术可以让大家跨越时空完成一些之前不可能的互动和对话。

除了这个之外还可以制作真人的数字分身。我们每个人的视觉，声音和语言的信息都可以作为数字资产去生成对应的虚拟人。

而这样生成出来的虚拟人，可以代替你实现很多之前需要真人去完成的事情，真人会犯错，但是虚拟人不会。

最后，AIGC可以无限的扩展你的技能。过去大家可能赖以生存的是一个单一的技能，绘画，设计，编程，这种都是单一的技能，单一的技能让你只能作为产业链的一环存在，当人工智能覆盖掉你的技能点的时候，作为工具人确实是非常容易被取代了。

但是从另外一个角度来看这个问题，你不把自己作为工具人，而是作为一个使用工具的人来看，你可以使用的技能也比之前多了很多，那么这些过去你需要花钱花时间去获取的技能，现在都可以通过AI工具便捷又低成本的获取，我们每个人可以去完成的事情也就得到了极大的拓展。

这些新的工具可以用来实现哪些事情呢？我们来讲讲创意的维度。这个是用sd的controlnet以瑞幸的logo做的几个图，再过去我们也有类似的广告创意方案，但是需要大量的制作成本，现在我们甚至可以把它做成一个工具让每个人都生成一张这样的品牌图。

这是另一个使用可口可乐logo训练出的微调模型制作的案例，也都是让所有的用户参与创作的。

其实由这两个案例我们可以看出，AIGC也在改变创意的传递方式，那么过去我们的营销方式是自上而下的，会有那么一个创意总监去制作一个创意广告，然后让用户被动的去接受。

现在呢？每个用户本身即是创作者又是传播者，而原先的设计师可能需要去引导用户去创造，而不是沉迷于自己去制作一个多么厉害的作品。

-END-

【声明】内容源于网络

杭州文创数字科技研究院

杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心，依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术，构建“技术研发—场景应用—产业赋能—国际协作”全链路生态，打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。

内容 473

粉丝 0

杭州文创数字科技研究院杭州文创数字科技研究院以“数字科技+文化创意”深度融合为核心，依托人工智能生成内容、数字孪生、区块链、元宇宙等前沿技术，构建“技术研发—场景应用—产业赋能—国际协作”全链路生态，打造长三角地区数字文创领域的技术创新引擎与产业孵化标杆。

总阅读664

粉丝0

内容473