大数跨境

数字化转型核心能力:数据模型

数字化转型核心能力:数据模型 iQuicker
2022-08-30
6
导读:数据模型是现实世界数据特征的抽象,根据应用层次可分为概念数据模型、逻辑数据模型和物理数据模型。

数字化分享

一起奔赴数字星辰大海

1

什么是数据模型


数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义,从抽象层次上描述了数据的静态特征、动态行为和约束条件。
数据模型的三要素分别是数据结构、数据操作和数据约束,同时数据模型根据应用层次可分为概念数据模型、逻辑数据模型和物理数据模型

2

数据模型的设计过程


数据的加工是一个逐步转化的过程,需要经历现实世界、信息世界和计算机世界这3个过程。将现实世界的客观对象转化为计算机中的数据,主要分为两个阶段:第一个阶段将现实世界中的客观对象抽象为概念模型第二个阶段是把概念模型转化为数据库管理系统支持的数据模型

图1 数据模型设计过程

1.现实世界
现实世界是指客观存在的事物及其事物间的联系。现实世界中的事物各个群体有着自己的特征,同时通过差别来对不同个体进行区分。例如生物医药、集成电路、智能机器人、新能源等不同领域的企业有着自己的特征,同时还可以通过企业营业额、是否上市等信息区分企业规模以及在产业链中的地位。
2.信息世界
信息世界是把现实世界的事物和联系,经过分析和抽象来形成信息,再对信息进行整理、归类和格式化后,就构成了信息世界,如企业信息和人才信息等。从现实世界到信息世界是通过概念模型来表达的,用以表示对现实世界的抽象与描述,如:E-R模型。
3.计算机世界
计算机世界是将信息世界的信息进行数据化后的产物,将信息用字符和数值等数据表示。将信息世界中的概念模型,进一步转换成数据模型,形成便于计算机处理的数据表现形式。

3

数据模型三要素


1.数据结构
数据结构用于描述系统的静态特征,包括数据的类型、内容、性质及数据之间的联系等。它是数据模型的基础,数据操作和数据约束都是建立在数据结构之上。
2.数据操作
数据操作用于描述系统的动态特征,包括数据的增、删、改、查等操作。数据操作主要描述在相应的数据结构上的操作类型和操作方式。

3.数据约束

数据的约束条件实际上是一组完整性规则的集合。完整性规则是指给定数据模型中的数据及其联系所具有的制约和依存关系,用以限定符合数据模型的数据库及其状态的变化,以保证数据的正确性、有效性和关联性。例如,限制员工薪酬不能为负,机构ID不能重复,产品名称不能为空等等,都属于完整性规则。

4

数据模型分类


数据模型可分为以下三种类型:

图2 数据模型分类

1.概念数据模型

概念模型是面向数据库用户、面向客观世界的数据模型,主要用来描述世界的概念化结构。概念数据模型完全不考虑信息在计算机系统内的表示,只用来描述业务所关心的信息结构,将各个事物之间的关联关系表示出来。因此数据库的设计人员在设计的初始阶段,不需考虑计算机系统及数据库管理系统的具体技术问题,只需分析数据以及数据之间的联系,通过概念数据模型描述现实世界中的业务数据,利用这些概念清晰地描述系统的静态特性、动态特性和完整性的约束条件。但是概念数据模型必须转换成逻辑数据模型,才能在数据库管理系统中实现。概念模型需要包含实体、属性、联系,如图3所示。
  • 实体用矩形表示,矩形内写上实体的名字;
  • 属性用椭圆表示,属性内写上属性的名称,用无向线段连接实体和属性;
  • 联系用菱形表示,菱形内写上联系的名称,用无向线段分别与有关实体连接,同时在无向线段旁标注联系的类型,例如员工与企业属于多对一的关系。

图3 员工与企业之间的联系

2.逻辑数据模型

逻辑数据模型以概念数据模型的框架为基础,并进一步细化和分解,面向业务实现设计的数据模型。逻辑数据模型需包含所有的实体和联系,确定每个实体的属性,定义每个实体的主键,指定实体的外键。
逻辑数据模型主要包括网状数据模型、层次数据模型和关系数据模型三种类型。这三种逻辑数据模型的根本区别在于数据结构不同,即数据之间联系的表达方式不同,层次模型用“树结构”来表示数据之间的联系,网状模型用“图结构”来表示数据之间的联系,关系模型用“二维表”来表示数据之间的联系,如图4所示。

图4 关系模型

3.物理数据模型

物理数据模型是面向计算机物理表示的模型,描述数据在存储介质上的组织结构的数据模型。物理数据模型在逻辑数据模型基础上,设计数据库的体系结构。它不但与具体的数据库管理系统有关,而且还与操作系统和硬件有关,同时还需考虑系统性能的相关要求。
物理模型将体现业务特点,如图5企业发展动态数据模型,结合企业发展动态新闻以及招聘信息来对企业未来发展进行预测。真实的业务场景会更加全面,因此实际业务的数据模型将更复杂。

图5 企业发展动态数据模型

每一种逻辑数据模型在实现时都有与其相对应的物理数据模型。数据库管理系统为了保证其独立性与可移植性,将大部分物理数据模型的实现工作交由系统自动完成,而设计者只设计索引、聚集等特殊功能。


作者简介 PROFILE

 王东 

曾就职于哈工大机器人、科大讯飞,从事过机器人嵌入式开发、智慧教育产品设计等工作,参与多项智能化、数字化项目。


点关注  / 不迷路


往期回顾

智能时代更需要数学思维

数字化转型:可视化工具选型要点分析

用户体验之“道”

数字化开发-开始敏捷之旅

数字化软件方案选型

数字化认知与实操落地路径思考

数字化价值链的变革

开篇:我们与我们的数字时代


【声明】内容源于网络
0
0
iQuicker
数字化路上的同行者
内容 26
粉丝 0
iQuicker 数字化路上的同行者
总阅读41
粉丝0
内容26