数据资产管理资料整理（主数据标准构成）- 大数跨境

首页

数据资产管理资料整理（主数据标准构成）

数组智控产业发展科技院

2022-01-20

导读：主数据标准体系是分层级、分类别的，而且一个企业的业务类型及业务管控需求，直接决定了其主数据标准体系的层级与类

主数据标准体系是分层级、分类别的，而且一个企业的业务类型及业务管控需求，直接决定了其主数据标准体系的层级与类别。

通常一项完整的主数据标准应包含数据编码规则、数据的唯一性界定与分类标准、数据属性字段定义、数据字段的属性阈值与质量规则四部分。

1.数据编码规则

主数据编码规则是数据标准的主体，是保证主数据编码唯一性、完整性和通用性的基础。

编码是为了系统识别和检索而对数据编制的唯一标识。凡是纳入计算机信息系统管理的数据均要对其编码，如物料编码、供应商编码、客户编码等。

数据编码的目的在于将数据化繁为简，便于数据的管理。就编码本身而言，其本质是所代表对象的唯一标识。

因此，一套完善的主数据编码规则应充分考虑企业数据的现状、业务需求、系统需求与管理需求，以保证数据共享为原则，通过抽取数据中的公共部分，定义主数据的编码规则。

从编码的方法来说，一般可以分为三类：一类是描述型编码（DescriptionCode），另一类是智能型编码（Intelligent Code），还有一类是序列号编码（Serial Code）。

（1）描述型编码。

描述型编码使用直接的描述性字符或缩写进行编码定义，一般仅适用于编码对象的群体数量不是很大的情况，比如应用数据库。而通常情况下企业必然涉及更广、更细致的数据对象群，这时必须考虑采用后两种编码方式。

（2）智能型编码。

智能型编码一般由多个码段组成，具备一定的层次结构，每一个码段代表一定的含义，典型的例子是国内居民身份证号码。智能型编码之所以称其为“智能”，因为它确定了某种分类原则，使用者可以根据分类原则很容易从代码中直接了解到相关信息。

（3）序列号编码。

序列号编码也被称为流水码，其编码本身不具备任何含义，目的是赋予所代表对象的唯一编号。

智能型编码和序列号编码各有优缺点：

智能型编码通常采用分类层次原则，内涵丰富，便于查询和统计，同时具备一定的逻辑性，但相对来说，编码过程较长。

而序列号编码快速简单，但为了保证序列号编码的有效性和唯一性，必须配合严格的编码管理制度和方法，其编制过程需由专业部门按照相应的管理流程来制订。

从编码的发展过程来说，早期用得较多的是智能型编码方式，但随着各应用软件系统功能的日益强大和完善，越来越多的专家建议采用序列号编码或者简单分类的智能型编码。其原因主要是基于以下方面考虑：

（1）很多时候，智能型编码的分类层次原则非常难以确定。即便确定了一种看似比较理想的分类层次原则，实际使用时还是会遇到很多困难。

（2）一旦编码按照某种分类层次原则确定和创建以后，即便后来发现当时的分类划分是错误的，编码仍然难以改变。

（3）简单分类的智能型编码也存在一定的不足，即如何保证编码的唯一性。在对一个对象进行编码时，怎么确保这种需求是真实的，即系统中的确不存在该对象的编码，否则就会有重码存在。但总的来说，简单分类的非智能型编码扩展性较好，且重码可能性相对于序列号编码要低很多。

2.数据的唯一性界定与分类标准

（1）数据的唯一性界定标准。

如何保证数据的唯一性是主数据管理的重要内容，同时，也是保证主数据在多个信息系统，多个业务环节共享应用的基础。

因此，数据的唯一性界定标准是主数据标准的重要内容之一，这是根据每类数据的特点，确定数据唯一性的重要判断原则。

一般来讲，主数据可通过若干个唯一性属性字段来判断、界定该数据的唯一性。

如供应商主数据，其唯一性属性字段主要由供应商名称、组织机构代码及税号组成，其供应商数据的唯一性界定原则需要满足如下条件：

①供应商名称完全一致的，认为是同一供应商；

②供应商组织机构代码完全一致的，认为是同一供应商；

③供应商税务登记号完全一致的，认为是同一供应商。

（2）数据分类标准。

数据分类标准主要用于将具有相同数据属性、管理要求和信息系统要求的数据进行分类，通过分类实现对数据的专项管理。

以物资数据分类为例，物资主数据贯穿于企业物资供应链的整个过程，包括计划、采购、库存、配送和结算等。然而，物资种类繁多，包括石油管材、化工产品、阀门、工矿配件等多种，品名、规格多变，且同一种类的数据具有相同属性，管理要求也相同。

因此，根据该企业信息化建设及应用集成需求，将物资主数据进行分类管理，其分类原则包括：

①科学性、系统性、唯一性、适用性及可扩展性；

②以物资的自然属性作为分类依据，同时兼顾行业管理的需要；

③按原材料、制品、设备、配件进行排序。物资分类编码采用线分类法，代码编制是有含义的层次型等长数字代码。代码为4层8位结构，分别标识物资的大类、中类、小类、品名。

3.数据属性字段定义

数据承载着企业业务相关的各种信息，如产品信息、经营数据等。业务数据属性是数据标准中数据信息的体现形式，用于描述数据的特征和行为。

数据属性字段定义主要是指针对每类主数据，依据分类标准，与数据分布、信息交互要求，定义数据相应字段，并给予明确的定义，如字段长短、属性要求、字段类型等，形成基于属性字段的完整的数据字典表。

一般来讲，业务数据的属性字段包含自然属性与业务属性两类，如信息类别、信息子类、数据项编号、中英文名称、业务环境等属性字段。通用业务数据属性对数据项的定义内容包括：

（1）数据项代码：数据项的统一编码。

（2）数据项名称：数据项的中文名称。

（3）业务含义：数据项业务含义的解释。

（4）编码规则：该数据项数据域值的代码编码规则，如层次编码或顺序编码及编码的含义。

（5）编码长度：该数据项域值代码的长度约定。

（6）代码：该数据项特定域值取值代码。

（7）名称：该数据项特定域值取值名称。

（8）含义说明：该数据项特定域值的业务含义详解。

（9）其他说明或备注：如注明域值字典的参照标准、特例说明等。

4.属性阈值与质量规则

属性阈值与质量规则，主要用于规定每个数据字段内容的填写规范，除定义必填外，对填写规范进行阈值定义，包括：

（1）是否符合下拉取值；

（2）是否符合取值范围；

（3）是否符合正则表达式。

下拉取值是指在主数据管理系统中录入某个主数据时，用户可以点击下拉列表，选择相应的数据属性取值。如质量的基本计量单位，下拉列表提供毫克、克、千克等属性选项。

正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符及这些特定字符的组合，组成一个“规则字符串”。

这个“规则字符串”用来表达对字符串的一种过滤逻辑。以电话号码为例，该属性的阈值及质量规则为：填写时按照区号-电话号码-分机号的格式填写。如：010-89072647-206，建议采用以下正则表达式对电话号码进行验证：

正则表达式说明：国内区号（‘0’开头加2或者3位数字）或者国际区号（‘0’或者‘00’开头加2或者3位数字）加‘-’加7或者8位电话号码加‘-’加至少3位的分机号，其中区号和分机号可以为空。

合法范例：010-23412256，020-27765466-201，0731-3445654非法范例：未以‘-’分隔，以及所有含非数字字符的电话号码，

例如：0a0*11233323。

【声明】内容源于网络

数组智控产业发展科技院

以AI技术为底层能力，聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域，提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。

内容 986

粉丝 0

数组智控产业发展科技院以AI技术为底层能力，聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域，提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。

总阅读1.6k

粉丝0

内容986