大数跨境
0
0

AIGC赋能红色档案微视频制作实践

AIGC赋能红色档案微视频制作实践 数字罗塞塔计划
2024-09-08
2
导读:得益于AIGC技术的便捷性和高效性,笔者认为档案资源中可挖掘的红色文化、历史文化等都可以通过AIGC技术实现,并借助新媒体平台进行广泛地传播,能够引发社会群体的共鸣和思考。

笔者从网上摘取了2024年部分与红色主题相关的新闻、社会热点、展览、活动等,如下图所示:

可以看出社会各界对红色文化的重视和关注,这无疑也促进了红色档案的收集、整理、保护和利用工作,使红色档案得以更好地发挥存史、资政、育人的作用。


红色档案是红色文化的重要载体,它以文字、图片、影像等形式记录了中国共产党领导人民进行革命、建设和改革的历史过程,是红色文化的直接体现。红色档案不仅记录了历史事件,更蕴含了革命精神、理想信念等红色文化的核心要素,是传承红色基因、弘扬红色精神的重要资源。


一、创作背景及思路


1

创作背景

近期,笔者无意中看到了一篇文章:【档案里的英雄故事】人民音乐家冼星海:珍藏81载的《入党申请书》(原文内容可扫描下方二维码查看),作者,刘慧鑫(河北省档案馆)。由于笔者今年以来一直在从事AIGC(Artificial Intelligence in Generation of Content,人工智能生成内容)方面的研究,就产生了制作这篇文章的微视频的冲动。图文的阅读方式相对较为静态,而微视频的展现方式则以其独特的视觉和听觉动态效果,为观众带来更加生动丰富的传播。


2

传统视频制作流程及其劣势

传统视频制作流程如下图所示:

存在的缺点:


3

AIGC视频制作流程及其优势

AIGC视频制作流程如下图所示:

存在的优点:


01



快速生成内容:AIGC可以根据用户输入的文本描述或关键词,自动生成视频内容,无需大量人工拍摄和剪辑,缩短了制作周期;

02



降低人力成本:传统视频制作需要大量专业人员的协作,而AIGC技术可以在一定程度上替代部分人工工作,减少人力成本;

03



提高内容多样性:AIGC能够基于海量数据生成多样化的视频内容,满足用户不同的需求,提升内容创作的灵活性和创新性。



二、软硬件设备及工具


1

AIGC平台及工具

LLM模型

文心一言、讯飞星火、Kimi、智普清言、豆包、Kolor(可灵)大模型;

图像模型

Stable Diffusion、ComfyUI、Magicmaker、绘画大师;

配音&剪辑

讯飞配音、剪映、PS;

模型插件

ComfyUI的Supir(放大修复)、ControlNet(图像重新着色)、SVD(场景)。


2

设备配置

PC

CPU:I7-11700 8核心16线程;

内存:128G;

显卡:RTX 3080TI 12G;

服务器

CPU:E5-2699V4 44核心88线程;

内存:64G;

显卡:RTX3060 12G *2。


三、制作步骤分解


1

文章整理

首要且至关重要的一步是对所选文章进行深入细致地整理。这一环节不仅关乎到视频内容的准确传达,还直接影响到观众的观看体验和理解深度。具体来说,整理文章的过程应涵盖以下几个方面:


01



文案构思与整体视频脚本设计:根据文章主旨,构思视频的主题、风格及叙述方式,确保视频能够精准传达文章的精髓;

02



关键信息提取:从文章中提取出最关键、最具吸引力的信息点,这些信息点将成为视频中的亮点或重点讲解部分;

03



图片大纲与素材准备:制定图片大纲,明确每张图片或素材在视频中的出现的时机和用途。


2

素材采集

采集素材是紧随文章整理之后的关键步骤。在这一阶段,需要特别关注图片大纲素材的采集,这是构建视频视觉框架的基础。在采集红色文化相关的历史照片时,由于这些照片年代久远,往往存在模糊、色彩失真等问题,而且基本都是黑白照片。为了提升视频的质量,还需要对这些历史照片进行高清修复处理。这包括去噪、锐化、色彩校正等一系列技术操作,旨在使照片恢复原有的清晰度和细节,同时尽可能还原其真实的色彩。


示例:


采用ComfyUI的Supir(一种基于Transformer的图像复原模型)放大修复,能够将低分辨率的图像放大到高分辨率,同时保持图像的细节和真实感,能够处理各种复杂的退化情况,如模糊、噪声、压缩等,实现高质量的图像复原。工作流如下:

(放大修复)

采用ComfyUI的ControlNet(基于深度学习的图像处理模型)对图像进行重新着色,模型可以指定图像中特定元素(如人物皮肤、头发、衣着等)的颜色,从而实现更精细的图像控制。该模型可以延伸到家庭照片、历史文档以及艺术作品,都可以通过这一技术焕发新生,重新获得色彩和生命力,如下所示:


3

文生图

大部分场景需要重新生成图片,也就是通过提示词生成对应的图片,注意这个过程中会产生大量的图片,需要从中筛选合适的。详细步骤可参考本号文章《AIGC赋能档案文创设计的尝试》


示例:


提示词:共产党军人在舞台上高兴地演唱,身穿八路军蓝灰色的衣服。


4

图生视频

基于以上的步骤生成图片后,接着基于图片再生成小视频(10秒内)。其核心原理为以静止图像作为条件帧,通过生成一系列连续帧来构建视频。这一过程中,模型会学习图像中的特征,并预测这些特征在连续时间帧上的变化,从而生成动态的视频内容。


5

视频合成

将生成的大量小视频导入剪辑工具后,需按照时间线或故事线的顺序进行排列,接下来的步骤便是进行剪辑和配音工作。在配音方面,由于已经准备好了文案,因此只需将字幕和文案导入即可,既可以选择真人配音,也可以选择AI配音。本视频采用了AI配音的方式。


四、制作总结


笔者也是第一次尝试将红色档案故事化、视频化,可以说完全是摸着石头过河。整个制作过程花了差不多两周时间,团队的小伙伴们付出了艰辛的努力,相关数据统计如下:

结果是好的,笔者带领团队终于利用AIGC技术成功制作完成一部红色档案微视频。


得益于AIGC技术的便捷性和高效性,笔者认为档案资源中可挖掘的红色文化、历史文化等都可以通过AIGC技术实现,并借助新媒体平台进行广泛地传播,能够引发社会群体的共鸣和思考。


由于经验欠缺,在整个制作过程中还存在很多不足的地方,总结如下:


01



部分素材质量不高:由于红色档案的年代久远,部分素材的质量不高,画面模糊、色彩失真等问题较为突出,修复和着色不够深入,这在一定程度上影响了微视频的整体观感。

02



大模型语料库不足:通用大模型虽然知识很丰富,但是不够专业,特别是红色文化相关的,局限性比较大。提示词和文生图需不断优化,这个过程耗费大量时间。

03



创新元素不足:虽然微视频的内容充实,但在创新元素方面还有所欠缺。未能充分融入现代视觉元素和创意手法,使得微视频在形式上略显传统。


数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!


热文推荐

全国电子印章平台推出,头疼的电子印章验证问题能解决了吗?

罗塞塔档案信息化问题汇编(第八期·上篇)

罗塞塔档案信息化问题汇编(第八期·下篇)

托勒密世界地图:现代地形图绘制的标杆诞生于公元2世纪

电子文件归档接口方式分析及应用实例


档案信息化

就看罗塞塔

高端交流群已开

加小罗,秒进群

点点“”和分享,给罗塞塔充点儿电吧~

【声明】内容源于网络
0
0
数字罗塞塔计划
保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
内容 524
粉丝 0
数字罗塞塔计划 保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
总阅读375
粉丝0
内容524