文章来源《政务元宇宙》
▷数字人是继网页、App 之后,最新的交互载体和交互方式,是政务服务亲民、便民本质特征的最佳呈现。
▷依据形象、风格、对应关系、交互方式、驱动方式,可以将数字人划分为 32 种类型,根据政务应用场景,可选择不同类型的数字人。
▷数字人的构建不仅需要视觉上的科技感,更加需要思想上的含金量,需形神兼备,同步推进。
交互与数字人是政务元宇宙的媒介要素。
元宇宙的发展核心是对交互方式颠覆性的变革,从具体形态来看,交互方式包括智能眼镜、数字人、体感设备、脑机接口等,其中数字人是当前元宇宙交互过程中信息获取与传递的主要载体。
第一节 数字人——交互方式的变革
一、交互方式的演进
数字世界的交互,从一开始就摒弃了人类之间通常的交流方式。
最早的计算机只能采用穿孔纸带的输入方式,计算结果也是通过穿孔纸带输出来,其技术能力无法满足人们目光、语音、手势等自然交流方式。
之后,进入键盘、鼠标作为输入设备的阶段。
人们需要在“命令行”通过键盘输入“Copy”“Del”等命令,实现计算机操作。
但是普通人若不经过专业的培训,很难利用这种交互方式驾驭计算机。
用鼠标操作的图形界面,比起使用键盘的命令行界面要直观得多。
图形界面加上鼠标的交互,进一步简化了人们和数字世界的交流方式。
随着网络时代的到来,人们获取信息的主要来源发生了变化。
过去,人们只是利用鼠标、键盘从单一的计算机中获取信息。
有了网络,人们不用局限在一台计算机,而是通过这台联网的计算机,访问世界上所有公开的信息。
在这段 PC 互联网时期,人类与数字世界交互的主要方式是“鼠标+键盘”,主要载体是一个个网站。
随着 3G 移动网络、智能手机的出现,网络进入移动互联网阶段。
人类与数字世界的交互方式迎来一次重大变革,人们开始通过智能手机上网,交互载体也随之变化,内容丰富的 App 开始盛行。
根据中国互联网络信息中心发布的数据,我国 App 数量在 2018 年达到最高峰,为 452 万款。
App 成为人们获取信息服务和开展交互的重要渠道。
2021 年,迈入元宇宙元年,国内外各大厂商布局 AR/VR 设备,实现在下一个互联网时代中交互方式的市场卡位。
据国际数据公司 ( IDC ) 发布的《全球 AR/VR 头显市场季度跟踪报告 ( 2021 年第四季度 )》,2021 年全年全球 AR/VR 头显出货量达到 1123 万台,同比增长 92.1%。
未来,人类将通过 AR/VR 设备进入元宇宙中进行信息交互。

图 3-1 交互方式的演进
二、数字人:元宇宙的交互载体
数字人是元宇宙中人与人、人与物、物与物之间产生联系或发生交互的连接通道。
数字人是这个数字世界处理事务的基本单元、接收和传播信息的关键通道、实现服务功能的主要载体。
就像移动互联网时代广泛使用的 App,元宇宙时代一个个数字人将成为普及的交互载体。
随着元宇宙的发展,未来人类可能将有两个身份:真实世界的自己 ( 本我,有且只有一个 ) 和元宇宙中的自己 ( 数字人,可能不止一个 )。
同时,元宇宙中也会出现大量的与真实人类无对应关系的虚拟数字人。
这些数字人将成为人类生活、工作的重要支撑和必要补充。
1数字人是元宇宙中处理事务的基本单元
虽然目前多数数字人还在被设计、被制作、被驱动等模式下被动地发挥作用,基本没有自我意识和主动能力,其人工智能应用也是在特定应用场景下的局部和微观使用,更像是一种被赋予了人类外形的工具。
但元宇宙概念的提出和全方位的应用普及,对数字人的发展来说意义重大。
它将从元宇宙中获得完整的世界形态,人工智能应用也将逐渐变得普适和开放,数字人将逐渐不再以单一功能存在于元宇宙中。
多元化的数字人,以及未来更多用户所拥有的虚拟身份,都将是元宇宙中最基础的元素构成和最重要的应用场景。
2.数字人是元宇宙中接收和传播信息的关键通道
数字人在元宇宙中承担着信息制造和传递的责任,是现实与元宇宙场景互动关联的重要媒介,发挥着广泛而关键的作用。

图 3-2 信息传递的形态演进
元宇宙可能并非信息世界的终极形态,但其概念一经问世,几乎所有人都或多或少地意识到不久的未来,新一代的信息世界即将产生。
而每一个时代的信息世界,其实都有专属的信息传播和交互的主入口,就如纸张时代的书信、报纸和期刊,无线电时代的广播和电视,PC 时代的网站,手机时代的 App 一般,元宇宙时代也必然需要类似的主入口,数字人将成为连接真实世界和元宇宙虚拟场景的主要方式和手段。
3.数字人是元宇宙中实现服务功能的主要载体
人类与数字人应该是一种和谐共生的关系。元宇宙与真实世界之间并非零和游戏,而是齐头并进、相融相生。
数字人的应用可以为人们的现实生活带来实实在在的便利,并与人类实现共生共荣。
目前,数字人产业主要通过搭建内容生成平台,针对特定行业 ( 如政府、金融、媒体、电商等 ) 的人工智能客服、虚拟主播、虚拟助手、新闻播报等提供相关应用服务。
随着各类底层技术越发成熟,会有更多为公众服务的数字人应用场景出现,数字人将可以更广泛地为元宇宙时代的社会提供便利。
未来,随着数字人技术不断迭代创新,现实人类将可以凭借数字人深度参与实体经济的生产活动,各行业的工作效率也将得到显著提升,并反哺物理世界中的技术与产品,使数字人及元宇宙得以循环迭代升级。
第二节 数字人的分类方式
根据形象、风格、对应对象、交互方式、驱动方式这五个维度,我们可以对数字人进行综合分类。

图 3-3 数字人分类
一、按形象分类
根据呈现模式,我们可以将数字人分为 2D 数字人和 3D 数字人。
2D 数字人的呈现方式与目前的照片、图像类似,3D 数字人则需要额外使用三维模型进行描述。
由于早期 3D 数字人的技术成熟度不高,对算力要求较高,因此 2D 数字人占据了主流地位。
随着元宇宙时代的到来,相关技术和算力等底层基础能力快速提升,3D 数字人开始逐渐成为主流。
2D 数字人和 3D 数字人在呈现效果上的区别如表 3-1 所示。
表 3-1 2D 数字人与 3D 数字人的呈现区别

1-2D 数字人
2D 数字人的建模技术相较 3D 数字人简单,多以真人形象为建模的原始素材,并且几乎不需要使用渲染类工具软件,其呈现的最终效果只能在固定的单一视角下使用,不能旋转和在 3D 场景中移动。
2D 数字人的优势在于其制作成本较低,能够较为快速地生成和使用。
2-3D 数字人
3D 数字人的人物形象素材类型多种多样,如真人、卡通以及仿真再造等,最终需借助渲染工具进行三维立体展现,可以在不同场景下呈现不同姿态,与真实效果基本无差异。
3D 数字人对原型创意、美术设计及技术实现等提出了更高的要求,与 2D 数字人相比,其制作成本会显著增加,制作周期也会更长。

图 3-4 开普云 3D 虚拟政务大厅数字人
二、按风格分类
日本是最早开始数字人产业化的国家,其长期盛行的二次元文化催生了让“纸片人、卡通人”动起来、形成交互的情感需求。
随后,数字人开始在影视作品尤其是科幻类作品中频繁出现,行业发展驱动由小众文化的情感连接需求,向技术驱动转移。
动作捕捉、面部捕捉、3D 建模、渲染技术,以及人工智能的发展,极大地丰富了数字人的形态和应用场景。
1二次元风格数字人
二次元文化已经成为有广大受众、蕴含着巨大商业价值的文化热点之一。
数字人偶像作为二次元文化的衍生,具有庞大的潜在粉丝群体。
相比于真人偶像,数字人偶像经过对外形和人设的塑造,更接近于粉丝心中完美的形象,且不易出现负面新闻,按需定制的虚拟偶像能最大限度上满足粉丝的心理需求,比如《超时空要塞》中女主角林明美、现象级数字人偶像初音未来、国内首位数字人偶像歌手洛天依。
在制作方面,二次元虚拟人制作成本相对较低,技术门槛也在不断降低。
现在已经有各运营平台推出免费自定义功能,用户可以自由创建自己的虚拟角色,实现符合本人、机构风格的数字人。
2.真人写实风格数字人
真人写实风格数字人在营销模式上与二次元风格数字人类似,依靠社交平台、公益等方式积攒知名度,而后通过广告、演唱会等方式盈利。
但在制作上,由于需要极大地贴近真人形象,写实风格数字人的前期投入成本较高。
三、按对应对象分类
根据所对应对象的自然人和法人类型,数字人分为对应个人的数字人和对应机构的数字人。
1对应个人的数字人
对应个人的数字人一般为真实人类个体在数字世界的高度还原分身,具有明确的身份信息、生理特征和性格属性。
例如 2020 年 4 月,美国饶舌歌手特拉维斯·斯科特用严格按照他自己的身材比例和细节,甚至精确到他脚上所穿的鞋子型号的虚拟数字人,在游戏《堡垒之夜》里举办了一场直播演唱会,有 1200 多万玩家同时在线,相关视频超过 2 亿人次观看。
2.对应机构的数字人
对应机构的数字人多为政府或商业机构所创建,因此如何将其社会影响力和商业价值最大化是根本。
由于机构类型多样,对应机构的数字人也各式各样。
下面针对虚拟偶像、助理分身和虚拟客服三类数字人进行简单介绍。
( 1 ) 虚拟偶像
在互联网中,涌现出各种品牌的虚拟形象代言人,一般称之为虚拟偶像或者虚拟网红。他们在现实世界中并不存在对应的真人,其外貌特征、基本人设、各类偏好、背景信息等均是人为设定。
虚拟偶像以两种方式存在:
一是全新创造的 IP ( Intellectual Property,知识产权 ),如新华社首个虚拟网红形象“热爱 REAI”;
二是基于文本、漫画、游戏,将角色立体化后形成的可交互、可多渠道运营的虚拟 IP,比如游戏《穿越火线》的灵狐数字人等。

图 3-5 新华社新青年数字人:热爱 REAI
虚拟偶像相对于真人 IP,具备科技含量高、流量大、更安全、可延展四个特征,可实现跨时空、跨品牌、跨物种等带货代言。
这不仅解决了经纪公司对特定 IP 长期稳定持有的问题,还能够以偶像或网红为核心场景,让虚拟偶像高质量、高效率地参与高频、碎片且实时的直播、代言等运营活动。
( 2 ) 助理分身
助理分身式数字人多是基于真人形象进行再加工仿真创作,在通用场景或特定关怀类场景中提供顾问、关怀、陪伴、事务处理等助理式服务。
助理分身式数字人目前是国外数字人公司的业务发展重点,如三星 Neon、UneeQ、SoulMachines、HourOne 等。
不同于简单的虚拟客服,特定场景中的助理分身是高度个性化的。
除去多模态技术外,与业务相关的个性化分析及推荐系统在场景中同样重要。
目前,国外厂商已有的应用场景包括个性化理财顾问、心理咨询顾问、购物助理、健康顾问等。
( 3 ) 虚拟客服
目前,虚拟客服主要用于替代真人进行交流等内容生成,并进行问答互动等。
它可以降低用户对真人的需求,减少标准化内容的问答成本。
数字人可以提供动作、表情等更多维度的信息,将服务内容进行更丰富的呈现。
在内容方面,有声读物、文本内容等将有望快速扩展至视频领域。
希望实现融媒体转型的各级媒体机构,也在尝试通过使用虚拟主持人,低成本生成所需媒体内容。
在服务方面,针对特定场景 ( 如展厅、培训教室等 ) 的指引、导览等均能够以更为人性化和易于使用的数字人方式呈现。
在现有的技术条件下,业务需求和规则流程相对明确的客服场景,是目前虚拟客服较为理想的快速应用方式。
除去替代真人外,由于能够基于知识图谱、数据迭代等进行更快的业务知识升级,虚拟客服具有独特优势。
在具体使用中,通过预置知识库、知识图谱、用户自主配置触发条件等,虚拟客服可以对用户的基本诉求进行行为和语音识别,并以固定话术进行回应。
虚拟客服可以通过软硬一体大屏、电子播报屏、网站、App、小程序等形式更好地服务客户。
2021 年,大连税务局打造“塔可思” ( TAX ) 虚拟数字人服务体系,通过手机 App、税务网站、自助终端等各类涉税服务入口,提供集咨询、办理、查询、预约、诉求响应于一体的高效互动服务,使用户无论何时何地都如同置身于税务服务大厅与窗口真人服务人员交流一样,体验沉浸式服务。
四、按交互方式分类
数字人作为真实人类的映射和延伸,具有相应的社交属性。
但在元宇宙还没有产生自我进化和发展的规则之前,这种社交属性还只是停留在信息传播和反馈能力上,并不会立刻形成独立的自我意识和情感。
我们可以理解为,现在数字人的社交能力还是功能性的,数字人之间的差异在于是否能够在传达信息的同时,还可以对所接收到的信息进行分析判断并做出回应。
因此我们按照单向交流和双向交流两种交互方式来区分数字人。
1单向交流数字人
常见的单向交流的数字人场景是新闻播报类的,这种传媒形式是非常适合数字人的。
2021 年,《广播电视和网络视听“十四五”科技发展规划》提出“推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态”,单向交流形式的播报型数字人进入发展快车道。
新华社媒体融合生产技术与系统国家重点实验室打造的虚拟记者“小诤”,于 2021 年 6 月 17 日神舟十二号载人飞船发射当天首次亮相,为观众带来全新的航天采访体验。
央视新闻则引进人工智能技术打造了首位虚拟 AI 手语主播,为中国听障群体提供北京冬奥会手语服务。

图 3-6 新华社虚拟记者小诤
另外,受限于科技发展水平,目前超写实的数字人还不能无延迟、高质量地应用于手机端的实时服务,但超写实精度的虚拟人建模使得虚拟人的行为举止变得更加自然,通过离线制作高画质视频内容,并利用媒体矩阵广泛传播也成为目前很多虚拟偶像 IP 的主要运营手段,比如在北京冬奥会上大放异彩的谷爱凌,就将自己的数字分身“MeetGU”和新华社虚拟网红“热爱 REAI”一起,在冬奥会期间利用新华社、中国移动及咪咕视频三方的媒体矩阵进行赛事宣传,很好地提升了各自的 IP 影响力。
2.双向交流数字人
如果说单向交流的数字人似乎没有很强的社交能力,更像是个茕茕孑立于高速公路两侧的广告牌,孤芳自赏地等着别人来欣赏或者是被无视,那么具有双向交流能力的数字人则代表了未来,这也是发展的必然。
这里的“双向交流”其实是广义的,包括一对一、一对多、多对多等各种交流形式,而具体手段也可以是文字、语音、图形、动作中的一种或者多种的复合使用。
疫情期间各地区对异地往来人员都有不同的防疫管控要求,为了方便快捷地让人们出行无忧,开普云公司在 2022 年春节期间推出了“疫情出行数字人小助手”。

图 3-7 开普云“疫情出行数字人小助手”
使用者可以通过微信小程序,以语音输入模式和数字人小助手进行交流,查询各地春节期间的返乡、离乡及出行政策。
这是一个典型的一对多形式的双向交流。虚拟直播带货是目前最常见的双向交流的数字人应用场景,目前联合利华、纪梵希等传统头部企业均已布局,可以预见未来将会有更多的品牌布局虚拟人主播,来替代闲暇时段的静态页面,甚至是高峰时段的真人主播,为商家带来更多销售额,开拓业绩新增长点。
五、按驱动方式分类
根据量子位发布的《2021 年虚拟数字人深度产业报告》,从驱动方式来看,数字人可以分为真人驱动型数字人和 AI 驱动型数字人。
后者是近年来多模态技术和深度学习发展的技术集大成者。
1真人驱动型数字人
真人驱动型数字人指的是,在完成原画建模和关键点绑定后,动作捕捉设备或摄像头将基于真人的动作或表情等驱动数字人。
由于背后有真人操作,真人驱动型数字人在动作灵活度、互动效果等方面有明显优势,一方面能够在影视内容的创作中降低生产成本,为影视行业降低门槛,推动影视级内容向消费级转化,另一方面则多用于虚拟偶像、重要直播中,完成大型直播、现场路演等互动性、碎片化活动。
事实上,真人驱动这种技术思路可以看作是传统影视制作的进一步延续,近年来主要的技术突破在于动作捕捉环节。
随着图像识别技术,及姿势、表情等识别算法的进步,昂贵的惯性或光学动作捕捉设备不再是驱动的必备工具。
普通摄像头结合理想的识别算法已经能实现较为精准的驱动,如 iPhoneX 之后型号的苹果手机的摄像头已经可以支持简单的动作捕捉,显著降低了精细虚拟内容生成的门槛。
2.AI 驱动型数字人
AI 驱动型数字人的语音表达、面部表情、具体动作将主要通过深度学习模型的运算结果实时或离线驱动,在渲染后实现最终效果。
AI 驱动型数字人的最终效果受到:
语音合成 ( 语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯 )、
自然语言处理 ( 与使用者的语言交互是否顺畅、是否能够理解使用者需求 )、
语音识别 ( 能否准确识别使用者需求 ) 等技术的共同影响。
尽管在特定方向上,各感知类技术已有的商业化能力足以支撑数字人的制作,然而,要达到理想的效果,需要制作方在上述三个方面同时具有较强的能力。
第三节 政务元宇宙中的数字人
政务元宇宙中的数字人,承载了现实政府在元宇宙中为公众提供服务、维护虚拟世界秩序的职能。
政务元宇宙中的数字人必然有其鲜明的行业特点和应用级别,而且是建立在真实世界的社会制度、法律法规、社会伦理等规则基础上的,它的一言一行、声容仪貌等均需要与真实世界政府部门的实际状态匹配,并得到必要的授权和认证。
一、政务元宇宙中数字人的特点
政务元宇宙数字人的工作面向公众需求,在虚拟世界里精准确定服务对象和服务内容,扎实高效地提供服务,能够满足服务时间长、适应岗位多、协作程度高、服务态度好的要求。
政务元宇宙数字人可以提供 7×24 小时的服务,也可以通过多个复制体在同一时间不同的场合提供多种类型的服务。
政务元宇宙数字人的制作机构需要充分考虑这个特性和需求,重视政务元宇宙数字人的业务能力平台的技术研发和适应性训练,并在设计数字人时使他们具有适配多种业务场景、满足各类服务需求的能力。
政务服务工作错综复杂,一项工作往往涉及多个机构,内部也牵扯多个部门。
现实政务体系已经逐步实现了“一网通办”“一网统管”,而在元宇宙的政务服务中,数字人不仅要继承已有的服务模式,更要实现虚实两个体系的全面系统集成。
实现政策、对象、标准、管理、信息、考核等方面的无缝对接,进而建立政务元宇宙数字人牵头、各部门快速响应联动的服务机制。
政务元宇宙数字人需要用精准的服务保障服务温度,通过政策衔接、对象衔接、数据衔接,做到识别精准、执行精准、管理精准。
政务元宇宙数字人在设计时便应该树立“有人情味、有同理心、以人为本”的人设。
在具体开展政府服务工作时,态度不可“生冷硬”,要做到“人性化”,通过智能算法尽一切努力为群众排难解忧。
二、政务元宇宙中数字人的身份
现实世界中,身份是自然人、法人组织等在现代社会中进行生活、生产及参与其他社会活动的资格,一切法律关系均依赖于身份。
元宇宙中的身份源于现实社会的身份,以“数字分身”“数字化身”等形态存在。
因此,在政务元宇宙中,身份同样是个体和组织参与政务元宇宙活动的基础。
无论是现实社会中的身份,还是元宇宙中的身份,其权益如果需要得到法律的保护,首先身份本身必须是被法律所认可的,因此身份认证体系必须由政府主导建立。
在政务元宇宙中,无论是“数字分身”“数字化身”,还是其他形态的数字人,其身份都需要能够追溯到其代表的现实身份,这个现实身份可以是一个自然人,比如从个人数字分身追溯到本人,也可以是一个组织,比如从企业的形象代言数字人追溯到企业法人。
现实世界中自然人身份可以由法定身份证件确立,用密码学、生物特征识别等技术进行识别。
法人组织及非法人组织的身份均可由营业执照确立,用实体证件验证、密码学等技术进行识别。
互联网技术和应用的蓬勃发展,促进了身份认证应用的不断深化。
元宇宙中数字人身份将持续面临三个重要问题:真实有效性、身份统一性、数据安全性。
元宇宙数字人身份应具备现实身份的“信任根”,具有权威性和真实性,具备跨域互认的能力,并具有隐私保护的能力。
在这种要求之下,政务元宇宙的根身份管理模式应该是中心化的,建立在法定信任级基础之上,而验证技术可以是去中心化的,在不同的技术平台与业务平台上实现分层认证,在必要时进行根身份追溯。
三、政务元宇宙中数字人的演进
在政务元宇宙中,数字人的应用需要从技术成熟度和适用场景两个维度来考虑。
数字人涉及多种技术的整合,其中任何一个环节出现短板,整体都会受到影响。
从政务领域的场景出发,不同的场景对数字人的需求是有差异的,政务元宇宙数字人能力分为三个层次。
在具体实践中,依据不同的场景,这三种能力可并行推进。

图 3-8 政务元宇宙中数字人能力的三个层次
第一层次是播报型数字人。
这类数字人目前已经相对成熟,可以在政府网站、政务新媒体中实现新闻播报、政策解读、新闻发言、手语播报等服务,让内容的表现更加丰富、生动,让特殊人群获得更多信息传达的通道。
用户只需将播报内容输入平台,选择数字人的形象、音色、背景后,对播报内容的语速、语调等进行调节,即可快速生成播报视频。
第二层次是互动型数字人。
政务元宇宙的互动交流场景对数字人提出了更高的要求。
数字人可以通过预置知识库、知识图谱、用户自主配置触发条件等,对用户的基本诉求进行行为和语音识别,实现简单交互。
但这只是互动型数字人的初级形态,未来互动型数字人在服务过程中会更加拟人化和智能化,从辅助人类交互过渡到自主交互。
第三层次是服务型数字人。
在经历了前两个阶段的发展后,数字人的专业知识体系已经相当完整,专业领域的数字人专家也将出现,提供专业服务。
如果将数字人背后的知识体系进行联通,实现通用化交互,则全能型的数字人将会出现。
每个人都将会有一个服务型数字人,随叫随到,主动感知、提醒,成为工作和生活中的最佳助手,比如《流浪地球》中的领航员空间站核心智能主机“MOSS”,就是一个全能服务型数字人的典型代表。
四、数字人的服务能力支撑
政务服务涉及的部门多、专业性强、流程环节多且处理情形复杂,政府信息化建设也是多以业务条线的方式进行,如公安、民政、水利、农业、市场监督管理等,各政务服务部门间的信息化建设进度也存在较大的差异。
随着我国“互联网+政务服务”战略的实施、政务服务业务需求变化频率进一步加快,面对政务元宇宙的兴起与元宇宙产业发展的最新需求,数字人提供的政务服务也将呈现出多种形态,因此政务服务部门需要为播报型数字人、互动型数字人、服务型数字人逐步建立健全其支撑能力,建立数据、业务和技术的协同能力,形成开放共享、弹性扩展、灵活配置的支撑能力体系。
基于上述支撑能力体系,结合政务业务和公众需求,政务服务部门应创建不同的业务应用,如数字人政策问答、政务服务热线、云旅游导游等,构建垂直领域的数字人和虚拟现实等场景应用,并与现有业务进行对接,形成完整的政务元宇宙数字人应用。
政务元宇宙中的数字人支撑能力以数据为驱动。
互动型数字人和服务型数字人应整合各类数据,构造知识图谱,形成可复用的服务组件。
通过将不同系统的服务组件连接与融合,提供抽象、整合、可复用的政务服务。
通过不同业务系统的灵活构造和敏捷研发,实现场景与服务关联。

