公众号消息中回复 资产 可下载PDF版,也可回复 清单 查看目前可下载的其他文件。
在这篇文章中,结合个人的工作经历、阅读的书籍、文章以及个人的思考,从外部数据、内部数据的利用的角度来谈谈自己现阶段对数据资产的一些看法。希望本篇的内容对大家有所启发。也希望大家在阅读时抱着怀疑的态度,结合自己的实际经验加以判断。
一、数据资产概述
1)数据资产的定义
国标《GB/T 40685-2021 信息技术服务 数据资产 管理要求》对数据资产 data asset的定义是:合法拥有或者控制的,能进行计量的,为组织带来经济和社会价值的数据资源。
中国资产评估协会2023年9月印发的《数据资产评估指导意见》中对数据资产的定义是:特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资源(数据资源是指经过加工后,在现时或者未来具有经济价值的数据)。
国际标准“ISO 55013:2024 Asset management — Guidance on the management of data assets”对data asset数据资产的定义是:data that has the properties of an asset 数据资产是具有资产的各种属性的数据。该定义中的asset资产一词是在国际标准“ISO 55000:2024 Asset management — Vocabulary, overview and principles”中有定义:asset: item, thing or entity that has potential or actual value to an organization. Assets can be physical or non-physical.资产是对一个组织具有潜在的或实际的价值的物品、事物或实体。资产可以是有形的或无形的。而其中价值value一词在该标准中的定义为:Value: results from satisfying needs and expectations. Value represents the result of considering positive and negative impacts, as well as financial and non-financial impacts, on stakeholders over a time horizon that includes all such impacts.价值是来自满足需求和期望的各种结果。价值代表考虑在一个时间范围下作用在利益相关方上包含所有正面、负面的影响以及财务和非财务的影响的结果。
在当前阶段,个人更倾向用ISO 55000、ISO 55013的定义来作为数据资产的定义,即数据资产是对于一个组织具有潜在的或实际的价值的数据,这种价值可能是包含财务影响的结果,也可能是包含非财务影响的结果。这么定义的原因是不同的数据适用的估值方法不同,有些可能比较适合从财务的角度来估值,有些则不是。对于不以数据为收入主要来源的组织,从数据的价值来看数据资产,会使得数据资产的适用范围更广。
2)关注数据资产的原因
有几个原因:
1.数据已成为许多组织各种活动开展所必不可少的部分,可通过数字经济的发展以及数据生产要素这一论述的提出来感知到这一点。
2.数据的价值还有许多可以优化、提升的空间,包括利用未发挥出价值的数据以及进一步提升已被利用的数据的价值。
3.通过系统地研究数据资产和应用数据资产管理与利用的良好实践,可达到提高数据利用的效率、效果、增加收入、降低成本、更合理管控风险以及提升相关方的满意程度等目的。
后面将从组织怎么更好利用外部数据以及内部数据两个方面来分析数据资产。
二、外部数据的利用
伴随着互联网、智能手机、通信技术等发展,外部数据也变得非常丰富。
1)外部数据的分类
公开的数据:有些是政府公开的数据,有些是非政府组织公开的数据。除了中文的数据,外文的数据也十分丰富。
例如政府网发布的法律法规、新政策通知、经济总体统计,东方财富网上可查询到的上市公司的年度报告,行业网站发布的行业统计数据、行业动态等。此外,出于一个目的发布的信息,可被不同人用于不同的目的,例如培训机构发布的培训内容信息、一些平台发布的采购信息,原先这些信息的发布是为了招学员、采购招标,但是这些信息也可作为组织内部相类似的培训的内容设计参考,组织内部开展与市场上已采购类似主题的活动的参考。
不公开的数据:常见有几种情况
1.只针对部分群体开放的数据,例如只有会员才可以访问的数据,监管机构发送给某些组织的文件
2.需要购买的数据,例如付费才能下载的电子书
3.通过交换可获取到的数据:例如不同的组织在业务合作中,会交换数据
2)外部数据的应用
1.根据应用场景的需求,去外部收集相关的数据或获取最新的数据。在发现有满足需要的数据的网站后,多留意网站上是否有其他可利用的数据。
2.将获取到的外部数据应用于特定的业务场景
3.加大外部数据在组织内部的共享,例如
(1)将数据放在组织人员可访问的网站供下载
(2)形成数据接口供组织内部系统调用
(3)形成组织内部的知识库
4.加强外部数据与内部数据的融合,例如
(1)结合外部数据来校验内部数据,提高内部数据准确的概率
(2)融合外部数据与内部数据,形成新的数据服务,对内、对外提供
5.增加对外部数据的分析,从外部数据中提取信息,例如
(1)分析外部机构发布的培训信息并结合组织实际情况,形成组织内部相应的培训方案
(2)分析国家、行业机构发布的标准文件、实践指南并结合组织实际情况,形成组织内部的相关实践指南
(3)分析外部机构发布的某类型项目的采购信息并结合组织实际情况,形成组织内部相似项目的建设方向的参考
6.加强组织成员的数据能力、数据技能,例如数据搜索能力、信息提取能力等,因为组织成员的数据能力与能否充分利用好外部数据密切相关。
3)外部数据的管理
1.外部数据的目录管理
(1)建立并保持更新组织从外部收集的数据(公开的数据、购买的数据、交换的数据)的目录/清单,目录可包括外部数据的提供方,外部数据的类别、外部数据包含的属性,外部数据提供的频率等信息
(2)建立并保持更新常用外部数据的网站目录,例如包括网站地址、网站介绍、网站都提供哪些数据等信息
(3)目录有更新,可考虑自动推送信息给相关方
2.外部数据的内容管理
(1)将外部数据统一存储在组织内部某一网站,供组织成员访问
(2)将外部数据的目录与外部数据的内容相结合,例如先查询外部数据的目录,找到外部数据的内容所在处或先根据目录申请访问外部数据内容的权限,然后再拿到外部数据。
3.外部数据的使用情况管理
(1)建立外部数据的使用跟踪机制,例如收集各类外部数据的访问情况
(2)结合外部数据的使用反馈,优化外部数据的采集、访问等过程
4)外部数据的作用
在整个外部数据的管理、利用过程中,可从效率、效果的角度来看外部数据发挥的价值或作用,例如
1.缩短组织成员(单次、多次、单个人、多个人)找到、访问数据的时间
2.随着外部数据在内部不断丰富,更好支持新成员的融入、帮助在组织中已经有一段时间的成员了解新的或不同领域的数据、知识
3.减少组织成员处理数据的时间
4.利用更加权威的数据
5.提高各类业务场景开展的效率、效果
6.帮助创造出新的业务场景
三、内部数据的利用
可从以下一些方面来考虑:
1)组织成员方面
1.提高人员的数据能力、数据技能,不同人员的数据能力,技能会有很大的差距,例如搜索能力、外文资料的阅读、Excel数据处理、PPT信息呈现等。
2.将组织成员隐性的知识转化显性的知识,例如形成各类培训资料、实践指南
2)数据利用方面
1.加强信息的披露,不管是内部相关方,还是外部相关方,信息的披露一般能帮助相关方对相关事务有更多了解,打消一些疑惑,增加各方之间的理解,为决策提供支持,例如电商平台的物流信息披露。
2.增强对数据的分析来优化产品、服务,例如通过对客服与客户的通话数据的分析来发现产品可能存在的问题并加以改进。此外,分析不仅仅有描述型的分析(即发生了什么),还有诊断型的分析(即为什么发生)、预测型的分析以及规范型的分析(也称指导型的分析,即应该做什么)
3.提高数据的共享,数据常常可以用于多种场景,数据利用越多,数据价值越高。不同数据间常常存在关联,通过关联也能增加数据的利用。
4.提升对非结构化数据的管理与利用,例如形成各种非结构化数据的目录来统一管理、共享非结构化数据、将非结构化数据与一些AI技术的结合、从非结构化数据中提取信息
5.从不同类型的数据出发,提高数据质量,例如提高接口文档的质量
6.增强对元数据(即描述数据或内容的数据)的管理与利用,借助元数据(描述型元数据、管理型元数据、使用型元数据)来更好管理组织中的数据,增加对元数据的分析,例如给元数据自动打标签、自动分类
7.内部数据与外部数据的融合,例如将内部数据与外部数据进行相互校验,提高数据准确的概率或将内容数据与外部数据的相结合,形成新的数据服务
8.与外部组织的合作,例如将数据出售给外部组织或进行某些数据交换
3)技术方面
1.优化数据共享过程,如果组织内部系统比较多,某些数据在不同系统间共享程度比较高或者系统间的数据交互比较多,可考虑建设专门的数据平台来承接数据共享的工作,减轻业务系统的负担,统一化数据的共享,例如建设主数据管理平台,数据共享平台。
2.如果组织成员比较多,数据比较繁杂,分析场景丰富,可考虑搭建专门的数据分析平台
3.通过数据架构的把控来更好管理系统间的数据流,每个系统所承载的数据,企业级、领域级、系统级的数据模型设计和落地等方面。
4)风险方面
需要增强与数据相关的风险的识别并采用对应的措施加以合理管控,例如
1.法律相关的风险,例如组织的相关实践是不是会违反《数据安全法》、《个人信息保护法》等法律
2.数据不可用的风险,例如因为系统故障导致数据不可用,使得部分业务活动无法开展。
3.数据泄露的风险,例如因数据有意、无意被泄露,造成组织的声誉受到损坏。
4.使用带有偏见的数据进行人工智能模型训练的风险
5)成本方面
组织开展各类数据活动都是有成本的,不管是人力上的投入,还是软件、硬件上的投入或直接的经济投入,而且还有机会成本(即一旦投入一些资源做某一事情,那么这部分资源就无法用到其他事情上),所以需要平衡收获与投入两者的关系并考虑不同投入的选择,做好投入在不同选择上的分配。
四、总结与推荐阅读
1)总结
在这篇文章中,从数据资产的定义、关注数据资产的原因、外部数据的利用以及内部数据的利用出发谈论了当前阶段自己对数据资产的一些看法。希望本文的探讨能对大家有所帮助,更深入地理解、管理与利用数据资产。
2)推荐阅读(点击即可查看)
信息书籍-数字技能 Jan A.G.M.van Dijk, Alexander J. A. M. van Deursen
谢谢阅读!

