大数跨境

元宇宙热浪助推数字人潮流:虚拟世界的人气新宠儿!

元宇宙热浪助推数字人潮流:虚拟世界的人气新宠儿! 元龙数字智能科技
2024-04-19
3
导读:元宇宙热浪助推数字人潮流:虚拟世界的人气新宠儿!

Counting homo sapiens

数智人潮流

虚拟世界新宠儿

快来打造属于你的数字分身

—元源AI数智人—


数智人并不仅仅是一个动画形象,其背后融合了一系列的黑科技,如算法、人工智能、语言系统、微表情捕捉与还原等。利用这些技术,可以创建一个与现实中的形象一模一样的数智人,甚至连声音和表情都能做到一致,作为我们在虚拟世界中的分身。然而,由于技术和成本的限制,目前的数智人产品质量参差不齐,有的定价高昂,有的制作粗糙。要将数智人融入到日常生活、娱乐和工作中,还需要进一步提高其质量并降低使用门槛。


01

 数智人类型

数智人分类

根据制作技术,数智人大致可分两类:

1. 真人驱动的数智人

2. AI驱动的数智人

两者的结果都是一个虚拟形象但使用的场景却大不相同。


接下来,我们来详细了解一下这两种数智人。


真人驱动的数智人制作使用过程可分三个步骤:

1. 建立3D数智人模型

2. 搭建动作捕捉设备

3. 真人实时驱动

这类数智人制作首先需要构建一个数智人模型,再用软件在模型上标注关键点,通过动作捕捉设备捕捉真人的眼神、表情、形态和动作与标注的关键点关联。因此,关键点的数量和位置的准确性直接影响数智人的真实度。在使用阶段,需要真人佩戴动作捕捉设备进行表演,通过真人的表情和动作驱动数智人运动。这类数智人虽然被称为数智人,但其实离不开真人的参与,可以理解为真人与3D形象的“双簧”。因此,这类数智人技术主要应用于影视领域,成本较高,对人的要求也较高。但由于成本高,目前的效果较为逼真。按照目前的情况,这类数智人技术不太适合日常生活应用,更适合专业机构制作专业节目。但随着技术的迭代和成本的进一步降低,这类技术将逐渐应用于一些场景,例如代替真人直播、仿真形象制作影视等。


02

 动作捕捉技术

动作捕捉

在这里不得不提起的是动作捕捉技术,它当前分为两个方面:

1. 穿戴式惯性动捕设备

2. AI驱动光学动捕设备


穿戴式惯性动捕设备一般价格较高,除非有专业需求,否则个人娱乐投入的成本较高。使用时需要穿戴设备,可能还需要一定的空间,整体投入很高。

AI驱动的光学动捕设备则是利用摄像头采集实时数据,并利用图像处理算法分析面部表情和行为体征的变化。例如,iPhone的拟我表情和抖音的美妆特效插件就是这种处理方式。但要处理高清或逼真的人物虚拟形象,需要更大的处理性能。无论是哪种动作捕捉技术,都相当于真人戴了一个面具。AI驱动的数智人是一种我们常用的模式,虽然效果可能受限于设备的处理能力,无法达到逼真的状态,但成本低,更适合娱乐和简单的应用场景。这种数智人不是靠真人驱动的,你可以输入一段文字,然后转换成数智人进行播报。它的语音、表情和动作都是通过工具设定或AI根据内容生成的。因此,这种虚拟人的技术可以完全脱离人,虽然目前真实度稍差,但黑科技实际上更多。例如,需要搭建文字转语音的能力;语音、唇动和各类微表情参数之间的映射关系;理解口语与形体的配合关系等。它的效果好坏与数据和模型训练有更大的关系。这类虚拟人的建设过程仍然有技术和成本,但使用时成本就变得很低。

当正式使用时,机器会首先基于TTS技术将输入的文本转化为语音,然后基于各类驱动模型生成当前语言对应的唇动和微表情,并根据模型调取设置好的各种预置姿态。这一系列处理后再逐帧组合成图片,最后将这些图片按顺序播放。通过自然语言理解技术(NLP能力),就能渲染出一段数字人视频。对于普通用户来说,根本不需要了解后台的技术逻辑,只需要写出讲话稿,选择一个虚拟形象,就可以生成一个主播视频。这种应用场景虽然目前很难满足复杂的影视和实时互动需求,但用于产品介绍、新闻播报、虚拟客服、在线教育甚至带货视频都是一个不错的选择。除了枯燥的文字和语音外,加入一个亲和的形象既好看又实用。

数字人市场前景广阔,无需支付高昂的费用请真人主播,只需简单配置即可生成宣传视频。虚拟主播无需休息,全年无休为您提供服务。根据智库数据分析,预计到2030年,我国数字人市场价值将达到2,703亿元。您对数字人市场的前景有何看法?



— END —


期待您与元源AI数智人携手共创未来!



【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.4k
粉丝0
内容901