作者简介
孙承乾
中国信息通信研究院信息化与工业化融合研究所工程师,长期从事人工智能、先进计算、数字经济、元宇宙等方面的研究工作。
王杨
中国信息通信研究院信息化与工业化融合研究所工程师,长期从事人工智能、先进计算、数字经济、元宇宙等方面的研究工作。
论文引用格式:
孙承乾, 王杨. 企业数据资产价值评价指标体系研究[J]. 信息通信技术与政策, 2024, 50(6): 30-36.
企业数据资产价值评价指标体系研究
孙承乾 王杨
(中国信息通信研究院信息化与工业化融合研究所,北京100191)
摘要:数据资产的价值评价是实现数据资产化的重要环节,对企业优化数据资产治理模式和指导数据资产估值定价具有重要意义。以综合性视角围绕数据资产的质量、成本、风险、应用四大维度,设置企业数据资产评价指标体系,并构建了一种结合阶梯型归一法、层次分析法等方法的企业数据资产价值评价模型。
关键词:数据资产;指标体系;价值评价
0 引言
自2014年大数据被首次写入政府工作报告以来,数据技术、应用、产业高速发展,数据在驱动经济社会发展中的基础性和战略性作用日益凸显。企业数据资产的价值评价是推动数据要素交易流通,实现数据资产化的关键环节。当前,国内外政府部门、企业以及金融机构纷纷探索企业数据资产价值评价工作,但是尚无权威、完善的企业数据资产价值评价体系,企业数据资产价值评价的指标设置、评价模型有待进一步研究和开发。本研究将尝试构建一种底层指标全部可测度,底层指标测度结果处理、各层级评价指标权重赋值、企业数据资产价值评价指数测算全流程可操作、可量化的企业数据资产价值评价指标体系,为数据资产价值评价方面的研究提供探索经验。
1 进行企业数据资产价值评价的意义
1.1 企业数据资产的概念
自数据资产的概念提出以来,各领域专家在会计、应用、信息技术等视域下对数据资产进行了不同方式的定义。本研究参考国家政策文件及标准[1-2]对数据资产进行定义,即企业数据资产是由企业合法拥有或者控制的,能进行计量的,能持续发挥作用并且能带来直接或者间接利益的数据资源。
1.2 企业数据资产的价值体现
企业数据的资产化是将企业所持有的数据资源作为资产实现科学管理并发挥其经济与社会价值的探索历程[3]。企业数据资产的价值体现在两个方面:一是内部管理价值,企业积累的数据在经过治理、存储后,通过数据挖掘、机器学习手段揭示企业生产、经营过程中更深层次的关系和规律,从而推动企业进行科学决策,实现降本增效;二是外部业务价值,企业根据市场需求,将拥有或控制的数据进行加工后形成对外服务的数据商品,为企业带来直接收益。
1.3 企业数据资产价值评价的意义
进行数据资产价值评价对企业数据资产的治理和交易流通具有重要意义。一是推动企业优化数据资产治理。进行数据资产价值评价能够帮助企业精准识别优劣质数据资产,从而推动企业改进数据治理框架、优化资源分配,提高数据资产质量和管理效率。二是指导数据资产估值定价。由于数据资产具有不同于传统无形资产的独特性质,数据资产估值定价模型通常在传统资产估值定价模型的基础上考虑数据质量、效用等作为修正因子,数据资产价值评价结果能够为资产估值定价提供参考。
2 数据资产价值评价指标体系
本研究参考各专业机构、学者在数据资产评价领域的研究基础,结合数据资产的特点,从数据质量、应用、成本、风险四大维度设置有代表性、可测度的指标构建企业数据资产价值评价体系(见图1)。
图1 企业数据资产价值评价指标体系
2.1 质量维度
数据质量是保证数据有效应用、数据价值充分释放的基础,是影响数据资产价值的核心因素。本研究以《信息技术 数据质量评价指标》(GB/T 36344—2018)、《电子商务数据资产评价指标体系》(GB/T 37550—2019)为参考[4-5],设置完整性、一致性、规范性、准确性、可访问性、时效性6项二级指标,对数据资产质量进行评价。
2.1.1 完整性
完整性是反映构成数据资产的数据元素的信息完整程度的指标,主要包括两个方面:一是数据记录的完整率,即属性值完整的数据记录的数量占数据资产全部记录数量的比率;二是数据元素填充率,即全部数据元素中被赋值元素数量的比率。数据记录是指对应于数据源中一行信息的一组完整的内容,数据元素是构成数据记录的最小单元。
2.1.2 一致性
一致性是指不同的数据在表述相同事物时保持的无冲突性,主要体现在数据内容的一致性以及数据逻辑的一致性两个方面。数据内容的一致性可通过数据资产中相同含义(位置不同)的数据元素获得相同赋值的比率进行反映。数据逻辑的一致性是指信息值满足逻辑约束关系的数据元素占数据元素总量的比率。
2.1.3 规范性
规范性描述了数据资产在标准和业务规则方面的合规性水平,主要包括数据值域合规率、元数据合规率、格式合规率3个三级指标,可通过符合值域、元数据、格式标准规范的数据元素数量占总数据量的比率对上述指标进行测度。
2.1.4 准确性
准确性是指构成数据资产的数据元素信息对其表述的真实事物或事件的精确程度,可从内容准确率、脏数据出现率、精度准确率等方面进行评价。内容准确率是指信息正确的数据元素数量占全部数据的比率。脏数据出现率是指非法字符和业务含义错误的数据元素占全部数据的比率。精度准确率是指满足相关标准规范精度要求的数据元素数量占数据元素总量的比率。
2.1.5 可访问性
数据的可访问性是反映构成数据资产的数据元素能够被及时、准确地访问和获取的指标。数据的可访问性可通过请求访问并成功的数据元素数量与请求访问数据元素总量的比率进行量化评价。
2.1.6 时效性
时效性是描述数据能够及时更新和维护程度的指标。一方面是数据自身的更新频率,即数据资产所描述的真实事物或事件信息发生变化后,对应的数据元素进行正确调整的时间间隔;另一方面是指数据资产能够在满足使用者实时业务需求的程度,可通过更新频率能够满足使用者实时业务需求的数据元素与数据元素总量的比率进行量化评价。
2.2 应用维度
数据的价值实现在于数据在业务场景的应用。本研究从稀有程度、应用广度、应用深度三个方面对数据资产的应用价值进行评价。
2.2.1 稀有程度
稀有程度是反映企业对数据独占程度的指标,稀有性较高的数据资产通常意味着更高的交易价值。数据资产的稀有程度可通过企业拥有特定类型数据量占该类型数据总量之比进行量化评价。
2.2.2 应用广度
应用广度是反映数据资产的信息维度多样性的指标。一方面是指数据资产自身信息维度的丰富程度;另一方面是指数据资产的信息维度与特定应用场景需求的匹配程度。信息维度的丰富程度可通过数据记录的字段数量进行量化评价。数据资产的信息维度与特定应用场景需求的匹配程度可通过数据记录中符合特定应用场景需求的字段数量与数据记录字段总数量的比率进行测算。
2.2.3 应用深度
应用深度是反映数据资产在业务场景中可以被使用的深入程度的指标,主要通过数据使用频率、市场规模等三级指标进行评价。数据使用频率是指规定时间内数据被访问、浏览、使用的数量;市场规模可通过同类数据资产在市场上的需求数量进行量化评价。
2.3 成本维度
成本是影响数据资产价值的关键因素,本研究基于企业数据资产管理的流程对数据资产的成本分为数据的获取成本和运维成本两个方面进行评价。
2.3.1 获取成本
数据资产的获取成本是指数据资产在规划设计阶段、获取阶段和处理加工阶段所花费的成本。数据资产规划设计阶段的成本,包括但不限于业务数据量情况估算规划、数据集空间占用存储情况规划、数据库设计语言与数据库字符集规划、数据库备份与还原方案规划等相关的项目经费、市场调研费、设计评审费、咨询费以及其他相关费用。数据资产获取阶段的成本,包括但不限于数据采集相关设备折旧费、数据购买费、人工工资、服务外包费以及其他相关费用。数据处理加工阶段的成本,包括但不限于数据采集后的整理、清洗、校验等入库前的数据处理相关设备折旧费、人工工资、服务外包费以及其他相关费用。
2.3.2 运维成本
数据资产的运维成本是指数据资产在存储阶段、维护阶段和优化阶段所花费的成本。数据资产存储阶段的成本,包括但不限于数据存储设备的购买及折旧费用、数据库的搭建相关人工工资、服务外包费以及其他相关费用。数据资产维护阶段的成本,包括但不限于数据库的维护、数据备份、数据迁移、应急处置执行及能力建设相关设备折旧费用、人工工资、服务外包费以及其他相关费用。数据资产优化阶段的成本包括但不限于数据资产信息的挖掘、分析、重构,知识提取、转化,算法、模型等数据产品的开发等相关设备折旧费用、人工工资、服务外包费以及其他相关费用。
2.4 风险维度
当前数据资产相关基础制度、支撑技术、交易市场尚未成熟,数据资产在管理和交易过程中面临安全等方面的风险,可能会造成数据资产价值的大幅贬损。普华永道提出了基于数据安全能力成熟度(Data Security capability Maturity Model,DSMM)模型的安全风险量化评价方法[6],将数据安全能力成熟度评价结果与安全风险发生概率进行关联,具体情况如表1所示。
表1 数据安全能力与风险发生概率对照表
本研究基于DSMM模型中数据生存周期阶段设置6个三级指标,分别为数据采集安全风险、数据传输安全风险、数据存储安全风险、数据处理安全风险、数据交换安全风险、数据销毁安全风险,并采用普华永道提出的安全风险量化评价方法对上述指标进行测度。
3 企业数据资产价值评价模型
本研究构建了一种可量化的企业数据资产价值评价模型(见图2),该模型通过对指标测度结果进行无量纲化处理并计算指标对应权重,最终得到一个取值在[0,1]之间的企业数据资产价值评价指数。
图2 企业数据资产价值评价模型
3.1 指标测度结果处理
本研究设计的企业数据资产价值评价指标体系共包含29 个可测度的三级指标,各三级指标的测度结果包括比率、金额、个数、频率等多种计量单位。为了消除不同量级的测度结果对评价指标的影响,确保评价指标能够进行比较和加权,需要对各评价指标的测度结果进行无量纲化处理。
3.1.1 极值标准化法
对于存在理论极值的指标,如内容准确率(理论最小值0%、最大值100%)等,通过极值标准化法对测度结果进行处理,具体为
其中,x表示某三级指标测度值,max表示该指标理论最大值,min表示该指标理论最小值,y表示该指标无量纲化处理后的评价值。
3.1.2 阶梯型归一法
对于不存在理论极值的指标(如使用频率等),本研究参考蒋维杨[7]等提出的基于大样本的阶梯型归一法对指标的测度结果进行处理。该方法是一种结合专家主观经验与客观指标数据的无量纲化方法,其核心思想是根据历史数据分析或行业专家经验,选取若干个能够显著区分指标测度数据对评价对象影响程度的特征点,根据特征点对指标数据进行分段,并在不同分段内通过不同函数(本研究采用线性函数)对这些原始指标数据进行相应评分。具体方式为:设x为指标测度值,D为x的取值范围,y是该指标无量纲化处理后的指标评价值,R为y的取值范围,函数f是x与y的关系函数,关系式为y=f(x)。
第一步:在指标测度结果的取值范围D内按递增顺序选取n个特征点p1,p2, …,pn,将D划分为n+1段取值区间。
第k个指标测度结果的取值区间段Dk可表达为
第二步:根据p1,p2, …,pn,在x的无量纲化处理后的评价y的取值范围R内选取f(p1),f(p2),…,f(pn)共n个点,将R划分为n+1段取值区间。
qi表示集合{f(p1),…,f(pn)}中第i小的元素,R可表达为
第k个无量纲化处理后的评价结果的取值区间段Rk可表达为
第三步:建立D与R取值区间之间的映射关系,并对y进行测算。对于D中任意一个取值区间段Dk,使其在R内都有唯一的取值区间Rl与之对应。对任意指标测度值x∈Dk(p1≤k≤pn),按照映射关系,存在一个无量纲化处理后的评价值y∈Rl,y可表达为
案例演示:假设某企业数据资产的数据使用频率为200 次/D,经过行业专家评估,该类数据资产的使用频率特征点和对应评价值结果如表2所示。
表2 数据使用频率指标特征点和对应评价指标值
根据公式(6),该企业的数据使用频率指标经无量纲化处理后的评价值为:y=0.2+((200-10)/(500-10))×(0.4-0.2)=0.28。
3.2 指标权重赋值
常见的评价指标赋权方法包括德尔菲法、熵权法、逼近理想点排序法、层次分析法等[8-11]。鉴于层次分析法层次结构清晰、可实施性高、定性定量分析兼顾的特性,本研究采用该方法对企业数据资产价值评价指标权重进行赋值。层次分析法通过将同一层级的指标进行两两比较,构建比较判断矩阵并进行计算后确定同层级指标对上级指标的影响程度。具体步骤如下。
第一步:设立标度。在专家对指标进行两两比较前,需要建立一个统一的、可量化的指标间相对重要程度判断标准。本研究采用1~9标度表来构建评分标度,具体见表3。
表3 标度值含义对照表
第二步:构建比较判断矩阵。依照标度表,对同属上级指标的下级指标间的相对重要程度进行评价,建立一个n×n的比较判断矩阵M,其中n代表同级别的指标数量,M的表达式见公式(7)。矩阵的元素mij表示第i个指标与第j个指标之间的相对重要程度,当i=j时,mij=1;mij与mji互为倒数。
第三步:计算特征向量。计算比较判断矩阵M的最大特征值λmax和对应特征向量v。
第四步:一致性检验。进行一致性检验是为了判断专家在建立比较判断矩阵时是否存在逻辑矛盾,如专家判断指标x比指标y重要、指标y比指标z重要,但是指标z比指标x重要等类似情况。通过计算一致性比率(Consistency Ratio,CR)判断一致性检验是否通过,CR是一致性指数(Consistency Index,CI)与平均一致性指数(Random Index,RI)之间的比值。其中,CI的计算方法见公式(8),RI的大小与比较判断矩阵M的阶数n有关,具体对应情况见表4。
表4 平均随机一致性指标表
如果CR≤0.1,表示比较判断矩阵M通过一致性检验,特征向量v的标准化结果w代表了各指标的权重向量。如果CR>0.1,需要重新调整判断矩阵,并重复上述步骤。
3.3 企业数据资产评价指数测算
在完成评价指标体系的搭建、评价指标的测度、指标测度数据的无量纲化处理、指标的权重赋值后,按照公式(9)对数据资产价值评价指数A进行计算。
其中,yij代表第i个二级指标下第j个三级指标的无量纲化处理结果,wij代表该指标对应的权重。
4 企业数据资产的估值
本研究设计的数据资产价值评价体系能够对数据资产估值定价提供参考。当前,数据资产估值方法主要有成本法、收益法、市场法。
(1)成本法:成本法的原理是核算生产数据资产过程中的各项成本,扣除价值贬损并加入数据质量、风险等影响因素进行修正,从而对数据资产进行估值。《资产评估专家指引第9号:数据资产评估》(中评协〔2019〕40号)提出的数据资产成本法估值模型表达式为
其中,P代表数据资产估值,TC代表总体成本,R代表数据资产投资回报率,U代表数据效用价值。
(2)收益法:收益法的原理是预估被评估数据资产未来产生收益,并将各期收益折现进行估值。梁艳[12]提出了基于多期超额收益法的数据资产估值模型,表达式为
其中,P代表数据资产估值,E代表企业现金流,Ew代表流动资产贡献值,Ei代表除数据资产外其他资产贡献值,Ef代表固定资产贡献值,j代表数据资产折现率,K代表数据资产价值调整系数。
(3)市场法:市场法的原理是以市场上已完成交易的相似数据资产价格为参照,分析参照数据资产与待评估数据资产差异并进行估值。基于市场法的数据资产估值模型表达式为
其中,P代表数据资产估值,P0代表对照数据资产交易价格,D代表待评估数据资产和对照数据资产的价值差异系数。
本研究设计的数据资产价值评价指标体系对数据资产估值模型中的修正系数提供了一种易理解、可量化的测算方式。对于成本法和收益法模型中的数据效用价值U,以及数据资产价值调整系数K,可参考数据资产价值评价指数A进行计算;对于市场法模型中的数据资产的价值差异系数D,可根据待评估数据资产的价值评价指数A与对照数据资产的价值评价指数A0进行计算,即D=A/A0。
5 结束语
随着数据资产的重要性日益凸显,科学合理、全面客观的数据资产价值评价指标体系将成为挖掘数据资产价值、推进数资产化的有力辅助工具。未来,我国政、产、学各界应加强数据资产评估、交易、安全等领域制度、标准、技术、产品的创新力度,为健全数据要素市场助力赋能。
Research on evaluation index system of enterprise data asset assessment
SUN Chengqian, WANG Yang
(Informatization and Industrialization Integration Research Institute, China Academy of Information and Communications Technology, Beijing 100191, China)
Abstract: Performing data asset assessment is a crucial step in realizing data assetization, holding significant importance for enterprises in optimizing data asset governance and guiding the valuation and pricing of data assets. This research establishes an evaluation index system of enterprise data assets by focusing on four aspects of data assets: quality, cost, risk, and application. It also constructs a quantitative data asset evaluation model that incorporates techniques such as the stepwise normalization method and the Analytic Hierarchy Process.
Keywords: data asset; index system; value evaluation
本文刊于《信息通信技术与政策》2024年 第6期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“ 信息通信技术前沿的风向标,信息社会政策探究的思想库 ”,聚焦信息通信领域技术趋势、公共政策、 国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
期刊荣誉与收录情况
AMI(2022版)A刊扩展期刊
RCCSE中国核心学术期刊
入选中国科协信息通信领域高质量科技期刊分级目录
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站(http://ictp.caict.ac.cn)已正式投入运行,欢迎投稿!
推荐阅读

