半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸的学科如天文学和基因学,创造出了“大数据”这个概念。
实践表明,大数据具有大容量、多样性、快速度、真实性等多种特征。利用数据融合、数学模型、仿真技术等,可以大大推动政府决策的科学性,甚至“揭示出原来没有想到或难以展现的关联”。大数据带来的改变了传统的思维方式和行为方式,将带来全新的商业模式和发展路径,企业运用数据创造了更大,更多的价值。因此,数据被业界公认为是企业的最宝贵资产之一,也是企业竞争力的重要武器。
数据资产通常被认为必须具备可控制、可量化、可变现的特性。但是,我们也应该看到我们在大数据面前必须应对各种前所未有的挑战——数据质量问题。数据造假威胁数据质量的生命线,错误发现使数据的解读和呈现都出现致命的谬误,数据盲点导致了信息时代的信息缺席。企业业务的成功,需要及时、完整和准确的数据提供支持。但经常能看到这样的现象:企业中几个部门的主管在汇报工作时,同一指标的数据不尽相同,甚至可能截然相反,到底哪个数据是正确的数据?无从确认。造成这种现象的原因很多,其中之一就是数据质量问题、统计口径问题。
数据乱象解决之道:全面的数据治理
数据治理是一种体系,是一个关注于信息系统执行层面的体系,这一体系的目的是整合IT与业务部门的知识和意见,通过将流程、策略、标准和组织的有效组合,对企业的信息化建设进行全方位的监管,需要企业高层的授权和业务部门与IT部门的密切协作。
数据治理涵盖于企业的整个信息化建设过程,它涉及每个系统,包括所有业务核心系统、数据仓库、ECIF、风险管理、合规支持等等,它需要一个统一的管理平台进行管理,而这个平台支持各种数据技术,包括元数据管理、数据标准管理,以及主数据管理平台、数据质量管理平台和数据服务平台。无论是对数据进行集成、整合、交换、还是同步,它们都在数据治理这个范畴内。最终实现所有数据的全方位监管,实现端到端的数据梳理和管理,确保数据的有效性、可访问性、高质量、一致性、可审计和安全性,这是数据治理的目标所在。但是数据治理并不急于买或者建工具,如果数据治理没有做过或没有做好,买/建工具都是浪费。首先需要注重一个比较“软”的方面就是数据标准管理,是很重要的一个环节,根据这个标准,通过相应的数据技术,对所有数据实现到端对端的梳理和管理,这就是整个数据治理的过程。
摘自:IT168


