元宇宙的数字化身-虚拟数字人- 大数跨境

首页

元宇宙的数字化身-虚拟数字人

Matching美钦

2023-01-31

导读：虚拟数字人元宇宙元宇宙中的虚拟数字人并不是一个简单的虚拟形象，其借助更加先进的数据处理和分析能力掌握了更快速

虚拟数字人

元宇宙

元宇宙中的虚拟数字人并不是一个简单的虚拟形象，其借助更加先进的数据处理和分析能力掌握了更快速、持续的学习能力。

虚拟数字人的应用场景众多，可广泛与各行业领域相结合，包括电商直播、虚拟偶像以及品牌营销等方面。

No.1

什么是虚拟数字人

数字人

➤ 数字人（Digital Human / Meta Human）

又称虚拟人或虚拟数字人，是运用数字技术创造出来的、它是一种通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等数字技术所创造出的、与人类形象接近的、被赋予特定人物身份的、在视觉上拉近和人的心理距离并为人类带来更加真实的情感互动的数字化形象。

➤ 狭义的数字人

是信息科学与生命科学融合的产物，是利用信息科学的方法对人体在不同水平的形态和功能进行虚拟仿真。其研究过程包括四个交叉重叠的发展阶段，“可视人”，“物理人”，“生理人”，“智能人”，最终建立多学科和多层次的数字模型并达到对人体从微观到宏观的精确模拟。

➤ 广义的数字人

是指数字技术在人体解剖、物理、生理及智能各个层次，各个阶段的渗透。需要注意的是，数字人是正在发展阶段的相关领域的统称。

No.2

虚拟数字人发展历程

发展历程

➤ 20 世纪 80 年代，人们开始尝试将虚拟人物引入到现实世界中，虚拟数字人步入萌芽阶段。

该时期虚拟数字人的制作技术以手工绘制为主，应用极为有限。1982 年，日本动画《超时空要塞》播出后，制作方将女主角林明美包装成演唱动画插曲的歌手，并制作了音乐专辑，该专辑成功打入当时日本知名的音乐排行榜 Oricon，林明美也成为了世界上第一位虚拟歌姬。

1984 年，英国人 George Stone 创作出一个名为Max Headroom 的虚拟人物，MAX 拥有人类的样貌和表情动作，身穿西装，佩戴墨镜，曾参演了一部电影，拍摄了数支广告，一度成为英国家喻户晓的虚拟演员。由于技术的限制，其虚拟形象是由真人演员通过特效化妆和手绘实现。

➤ 21 世纪初，传统手绘逐渐被 CG、动作捕捉等技术取代，虚拟数字人步入探索阶段。

该阶段的虚拟数字人开始达到实用水平，但造价不菲，主要出现在影视娱乐行业，如数字替身、虚拟偶像等。电影制作中的数字替身一般利用动作捕捉技术，真人演员穿着动作捕捉服装，脸上点上表情捕捉点，通过摄像机、动作捕捉设备将真人演员的动作、表情采集处理，经计算机处理后赋予给虚拟角色。

2001 年，《指环王》中的角色咕噜就是由 CG 技术和动作捕捉技术产生，这些技术后续还在《加勒比海盗》、《猩球崛起》等电影制作中使用。2007 年，日本制作了第一个被广泛认可的虚拟数字人“初音未来”，初音未来是二次元风格的少女偶像，早期的人物形象主要利用 CG 技术合成，人物声音采用雅马哈的VOCALOID系列语音合成，呈现形式还相对粗糙。

➤ 近五年，得益于深度学习算法的突破，数字人的制作过程得到有效简化，虚拟数字人开始步入正轨，进入初级阶段。

该时期人工智能成为虚拟数字人不可分割的工具，智能驱动的数字人开始崭露头角。2018 年，新华社与搜狗联合发布的“AI合成主播”，可在用户输入新闻文本后，在屏幕展现虚拟数字人形象并进行新闻播报，且唇形动作能与播报声音实时同步。

2019 年，浦发银行和百度共同发布的数字员工“小浦”，也是利用自然语言处理、语音识别、计算机视觉等人工智能技术制作的虚拟数字人，可通过移动设备为用户提供“面对面”的银行业务服务。

➤ 当前，虚拟数字人正朝着智能化、便捷化、精细化、多样化发展，步入成长期。

2019 年，美国影视特效公司数字王国软件研发部负责人 Doug Roble 在 TED 演讲时展示了自己的虚拟数字人“DigiDoug”，可在照片写实级逼真程度的前提下，进行实时的表情动作捕捉及展现。今年，三星旗下的STAR Labs在CES国际消费电子展上展出了其虚拟数字人项目 NEON，NEON 是一种由人工智能所驱动的虚拟人物，拥有近似真人的形象及逼真的表情动作，具备表达情感和沟通交流的能力。

No.3

数字人不同类型

技术上分类

1.真人驱动型（动作捕捉成型）

2.计算驱动型（即由ai实时或捏脸等成型）

➤ 真人驱动型

主要是通过真人演员（二次元世界中也称为中之人）驱动数字人，在这种模式下虚拟数字人的语言、表情及动作等展现都与中之人的表现所对应，中之人通过佩戴面部捕捉、动作捕捉等设备实时获取面部、动作参数，并传递给对应的数字人进行相对应的口型、表情与动作驱动。由于真人驱动型数字人是通过真人传递操作，因此在动作灵活度和互动效果等方面有着明显的优势，被广泛应用于影视内容创作以及互动直播等领域。

真人驱动型数字人技术流程如下：

形象设计—>建模及绑定—>表情动作捕捉—>实时驱动—>渲染生成

➤ 计算驱动型

也被称为TTSA（Text To Speech & Animation）人物模型：主要通过深度学习技术、卷积神经网络等新型计算能力对虚拟数字人的语音、表情及动作等进行预测，根据计算结果驱动数字人模型，以生成相应的动画。由于虚拟数字人天生需要具有高度拟人化的特征，除了外观要求高度拟人化以外，在行为互动上也需要具备高度拟人化，具体来说包括：①在发音流畅度、韵律以及情感等方面需要符合真人发声习惯，②能准确识别用户需求，③能正确高效地理解用户的需求。因此，其驱动最终效果受到语音合成、语音识别以及自然语言处理等多种技术的共同影响。

计算驱动型数字人技术流程如下：

设计形象—>建模及绑定—>训练驱动模型—>内容制作—>渲染生成

应用上分类

1.服务型数字人-代替真人服务

2.身份型数字人-用于娱乐/社交

➤ 服务型数字人

顾名思义，服务型虚拟数字人的能力重点在于服务，根据应用场景的不同提供具有差异化的定制化服务，主要用于代替服务行业中具有重复属性的社会角色，执行偏标准化的工作，例如数字员工、虚拟客服、定制管家、医疗顾问等。目前国内的服务型虚拟数字人主要用于代替真人进行内容生产，并进行简单问答交互等。未来发展趋势是打造更具关怀度的助手等，利用多模态技术对用户进行关心、陪伴等。

A代替真人服务简单交互，代替真人标准服务的服务型数字人

B多模态ai助手深度交互，多模态个性化的服务型数字人

➤ 计算驱动型数字人

身份型虚拟数字人则更倾向于打造全新虚拟IP形象，即强调其自身身份，关注其人设背景等方面，通常应用于文娱游戏等领域，例如虚拟偶像、数字人直播、虚拟分身等。身份型虚拟数字人强调自身身份，通常存在两种形式：一种是以独立的虚拟个体存在的虚拟IP，其在现实世界中不对应任何真人，外貌、人设、爱好、背景等都由人为主观设定；另一种是虚拟世界的数字分身，主要是为每个人创造专属的数字分身，满足个人在虚拟世界中独特的身份需求。

A虚拟ip、偶像、主播

B虚拟世界第二分身

商用模式分类

1.IP类数字人

2.非IP类数字人

➤ IP类数字人

KOL型

歌舞型

品牌型

娱乐公司推出偶像型

明星分身型

➤ 非IP类数字人

功能型

学术型

身份型

视觉维度分类

1.2D数字人

2.3D数字人

➤ 2D数字人

可分为2D真人、2D分身、2D融合、2D卡通4种类型。

2D虚拟数字人特点：

2D真人：真人采集，形象逼真，唇形匹配，可听说切换，文本/声音驱动，制作周期4-6周。

2D分身：图片融合，数据采集成本低，文本/声音驱动，唇形匹配，制作周期4-6周。

2D融合：视频融合，千人千面建模，低成本建模，探索建模周期短。

2D卡通：2D绘制，形象生成周期短，服务器资源占用小，制作周期2-4周。

2D虚拟数字人主要用于金融服务场景

➤ 3D数字人

分为3D写实、3D风格化、3D卡通人物、3D卡通动物等类型。

3D虚拟数字人特点：

3D写实/3D风格化：真人扫描/3D建模，真人超写实，文本驱动。姿态、动作、景别灵活切换。制作周期3-4个月。

3D卡通人物/3D卡通动物：形象视觉效果优，动作、服装可更替种类丰富。制作周期3-6个月。

3D虚拟数字人多用于游戏、文娱、生活化场景。

角色分类

1. 完美偶像型

2. 前沿实验型

3. 真实生活型

4. 智能助手型

5. 行业专家型

在元宇宙概念的推动下，虚拟数字人市场迅速升温，各式各样的虚拟数字人频繁地出现在公众视野中。《中国AI数字人市场现状与机会分析2022》报告显示，中国虚拟数字人市场规模呈现高速增长趋势，预计到2026年将达到102.4亿元。以前，虚拟数字人的应用场景很窄，基本都是娱乐、偶像、代言人等领域。如今，虚拟数字人已经在企业数字化转型、体育、金融等不少垂直领域的应用场景实现落地。

END

END

欢迎使用，记得关注哟