点
击
蓝
字
关
注
我
们
# 大比武2024
本篇是参加“华夏伟业”杯第二届档案信息化公司业务与技术实力大比武(简称“大比武 2024”)的投稿文章,来自北京雨轩兰台文化传媒有限公司,作者:雒猛。
随着科技的飞速发展,AI技术逐渐深入我们的工作与生活,特别是随着2022年底ChatGPT的横空出世,AIGC(Artificial Intelligence Generated Content,内容生成式人工智能)开始登上历史舞台。作为从业10余年的档案信息化老兵,笔者却一直有一个档案文创梦,近几年一直在思考如何改变档案文创中存在的创意少、效率低、前期工作量大的问题。
当档案文创遇上AIGC,文字、图片、影像便“活”了起来!通过智能分析、深度学习、图像识别等AI技术的综合应用,挖掘档案背后的故事,将其转化为引人入胜的文创产品,您是不是很期待呢?笔者通过自己搭建AIGC运行环境不断尝试,终于探索出一条档案文创设计的速成之路,通过罗塞塔公众号平台分享给大家。
1
流程、工具和环境
1、基于AIGC的档案文创设计流程
整个流程大致分为六个步骤,如下图所示:
2、用到的软件工具
通用大模型:文心一言、讯飞星火、Kimi;
AIGC:ComfyUI、stable diffusion;
后期制作:Photoshop、ZBrush等。
3、硬件配置
服务器1
CPU:I7-11700 8核心16线程,
内存:128G,
显卡:RTX 3080TI 12G;
服务器2
CPU:E5-2699V4 44核心88线程,
内存:64G,
显卡:RTX3060 12G *2。
2
步骤分解
1、明确目标和定位
需要明确文创产品的目标和定位,第一步回答我们到底想要什么。将大脑中零散的词汇、记忆片段、不成熟的想法,或者直白想要的东西真实表达出来,然后通过AI串起来。
从示例1中可以看到,AI已经给出了部分建议,选择第四项“文创T恤和服饰”再进行二次优化。
标题有了之后不一定是你满意的,可以再进行多次优化,直到满意为止。
2、背景知识学习
知识的积累是循序渐进的过程,获取相关知识的途径非常多,但在这个AI时代,最高效的途径无疑就是借助“文心一言”、“Kimi”等通用大模型快速获取自己想要的知识了。
换个大模型再试试,确保获取知识的准确度,广度和深度(来自于网络资料,可直接访问网址链接):
通过以上的操作,知识已经获取到,剩下的就是我们自己去挑灯夜读了。
3、内容提炼
笔者在经历挑灯夜读学习后,最终选择“敦煌壁画中的飞天、仙女等形象”,进入下一步骤。
4、提示词和模型选择
既然确定了“敦煌飞天”作为文创产品的主题,下一步就要借助AIGC工具来帮我们设计了。笔者选用开源的ComfyUI来生成设计图,由于ComfyUI只接受英文提示词,需要进行翻译。
5、训练和出图
在训练、出图过程中需要多次调节以下几个参数:
批次(latent)
一般设置为10,值越大生成图片越多,但是速度会慢。
步数(steps)
一般设置为20,步数小的话噪点会多,步数大的话,图像越清晰,但是对显卡要求高,速度上也有影响。
图片与提示词的关联程度(CFG)
一般设置为8,CFG值越大,生成的图片细节越丰富。
提示词(prompt)
优美文雅且表达准确的提示词为图片的生成起到至关重要的作用,需反复修改提炼直至满意。可以先写好中文再利用讯飞星火等工具翻译成英文,再对英文进行优化。
6、挑选和调整
从AIGC生成的图片中挑选自己满意的,然后对其中的不满意处进行略微修图调整。下面直接上成品:
3
过程总结
为完成这篇文章,笔者花了差不多两个月时间对AIGC赋能档案文创设计的整个过程进行了摸索,虽说流程是走通了,但实际上细节方面还是有很多不明白的地方,特别是ComfyUI一旦出现后台英文报错就傻眼。
总结一下,上述AIGC框架(工具)的优缺点如下:
根据笔者的经验,这里面最关键的实际上是提示词,难怪现在已经出现了一个新的职业——提示词工程师。优质的提示词可以事半功倍,可以使AI回答的准确度以及生成的成果物质量更高。以下为笔者梳理的关于“如何写好提示词”的要点:
热文推荐
档案信息化
就看罗塞塔
高端交流群已开
加小罗,秒进群
点点“赞”和“分享”,给罗塞塔充点儿电吧~

