大数跨境
0
0

数据治理趋势:运营能力

数据治理趋势:运营能力 溯原数科
2024-01-19
2
导读:对于世界各地的组织来说,无论行业、规模或重点领域如何,数据治理都已达到一个关键的拐点。长期以来,它一直被认为是风险管理的一个重要领域,其前提是实现法规遵从性、维护数据隐私以及确保数据作为企业资产的持续


编者按:联合国世界数据论坛(UNWDF)将于2024年11月11日至14日在哥伦比亚麦德林举行。此次论坛的目标,是推动全球数据合作,促进数据可持续发展,为实现2030年可持续发展目标提供支持。论坛将是国际社区共同努力的平台,为参与者提供分享见解、寻找合作机会的机会。截至目前,已有各个领域的专业人士表示期待在麦德林2024交流和分享经验。联合国世界数据论坛表示,希望所有有关方案的贡献者抓住这一机会,提交创新性的提案,共同促进全球数据合作,推动可持续发展议程的实现。上次联合国世界数据论坛是2023年4月在我国杭州举办的,今年此次活动的举办地——麦德林,位于南美洲哥伦比亚的西北部,是一座充满活力和文化底蕴的城市。作为哥伦比亚的第二大城市,麦德林以其美丽的山脉景观和宜人的气候而闻名。这座城市曾经是哥伦比亚咖啡产业的中心,如今已经发展成为现代化的大都市。

基于这样的背景,数据治理及数据运营能力显得尤为重要。

对于世界各地的组织来说,无论行业、规模或重点领域如何,数据治理都已达到一个关键的拐点。长期以来,它一直被认为是风险管理的一个重要领域,其前提是实现法规遵从性、维护数据隐私以及确保数据作为企业资产的持续可持续性。

然而,今天,它已经超越了其风险管理能力,大胆地进入运营领域,成为确定或影响数据驱动行动的最可行的结构之一。此外,最近的发展使其能够动态地、几乎是即时地做到这一点,并且可能与下游分析和随之而来的决策一样具有影响力。

“Gartner 的一大主题是活动元数据的理念,”TopQuadrant 首席执行官 Irene Polikoff 承认。“其中一个方面是它是可直接操作的;它实际上作系统实时用于执行各种操作。

数据治理将在 2022 年及以后提供的运营功能涉及元数据管理、数据建模、数据管理、机器学习和人工智能以及各种其他组件。

Privacera客户成功总监Purnima Kuchikulla补充道,它从一套主要的静态、被动的原则和协议过渡到一系列产生商业价值的用例的实时适用性,自然而然地支持了正在迅速发展的数据经济,在这种经济中,公司正在“走向数据市场”。

运营数据建模

从数据治理中衍生出的一些最有意义的运营操作源于数据建模。作为集体数据结构的一部分,不同系统之间的数据交换比以往任何时候都更加不可或缺,越来越多的组织采用这种数据管理方法。具有清晰语义和分类法的高度表现力的数据模型可以利用机器智能来推断不同数据系统的各种模式如何混合,以实现 TopQuadrant 首席技术官 Ralph Hodgson 所说的无摩擦集成。“你在不同的系统中拥有相似的信息,治理解决方案在这些不同系统中的表达方式之间有映射,”Polikoff 解释道。“当您需要在这些系统之间进行通信时,您可以实时参与治理解决方案。”

Hodgson指出,这种方法通过“避免编写特殊程序来利用治理领域所做的事情”来减少数据集成的成本、时间和精力。更重要的是,通过使用约束系统和智能推理能力,组织可以利用“产生新见解的能力”,霍奇森指出。最有说服力的例子是法规遵从性,其中有关一个数据源、法规或用户组的数据访问的逻辑推论可能会影响另一个数据源、法规或用户组的数据访问,以自动执行合规性措施。

元数据洞察

对数据模型中元数据的推断可以简化媒体和娱乐行业内容引擎的分类,例如,跨全球和本地来源获得近乎实时的结果。认知计算技术可以快速自动输入元数据;否则,“元数据描述及其关键字都将是手动的,”Contentserv 首席营销官 Jennifer Krizanek 证实。在其他示例中,对元数据的详细可见性可以预示事件或提供先前事件的可靠路线图,以确保数据沿袭和数据质量的主要内容。将元数据与 Datafold 首席执行官 Gleb Mezhanskiy 所说的“元数据图”连接起来,在企业规模上具有以下优势:

  • 数据沿袭和 BI:元数据提供的可追溯性对于理解和信任分析中的信息至关重要。在这个用例中,“如果有人查看了 BI 仪表板,它可以揭示谁在查看它以及数据来自哪里,”Mezhanskiy 提到。

  • 根本原因分析:通过分析元数据,可以很容易地说明与分析相关的流程中的任何异常值或异常值。“如果有人在仪表板上看到异常或看起来像错误的东西,因为有一个图表显示了数据是如何到达那里的,所以很容易进行根本原因分析,”Mezhanskiy坚持说。

  • 影响分析:Mezhanskiy指出,通过仔细检查用于生成有关表、列和数据行信息的SQL各个方面的元数据,“如果有人对它们进行了更改,你可以准确地知道会发生什么,因为你可以在图表中看到它。

操作元数据的能力(特别是在图形环境中)扩大了此数据治理方面的效用,以包括从参考数据到受控词汇的所有内容。积累元数据对于从中产生新的见解至关重要,例如在整个财务系统中自动传播参考数据规则或医疗保健系统中的记录管理规则。机器学习和基于规则的推理都可以产生由此产生的见解。“这是活动元数据的另一个方面:不仅是存在的内容,而且可以从明确声明的内容中生成或推断出的内容,”Polikoff评论道。

激活数据管理

数据管理员的赋权是数据治理从被动就业转变为主动就业的另一个直接影响。围绕以数据管理员为中心的受控数据访问的现代创新对于加快使用数据所需的时间至关重要,同时始终符合有关哪些用户查看哪些数据的治理标准。Privacera 首席执行官 Balaji Ganesan 透露,共享数据治理机制会“在 Snowflake 等基础设施中自动批准和提供集中式治理规则”。“例如,销售数据所有者可以说,这是我将允许 John Doe 访问的数据部分。

将集中式治理策略自动分发到分散式数据源中,消除了数据访问的 IT 瓶颈,促进了低潜在数据共享,并将最了解数据的数据管理员置于委派访问哪些数据的最前沿。Ganesan 回忆说,它取代了“过去需要数周才能完成的流程中的摩擦”,而平稳的流程需要几分钟才能以与运营相同的速度共享受治理的数据。这种方法基于主动数据管理,其中监管员“轻松配置数据并在需要时自动收回访问权限,但同时向合规人员证明谁在使用数据以及用于什么目的的完整审计跟踪,”Ganesan 表示。

数据质量

数据质量(以及随之而来的数据验证和数据可靠性方面)是任何形式的数据治理(尤其是在运营环境中)所依赖的基础。“如果你的数据一开始就不健康或不高质量,你就无法实现自动化或增强流程,”Krizanek 提出。Polikoff指出,将数据治理的主要内容(如主动元数据管理)嵌入到实时生成元数据的操作系统中,需要采取数据验证措施,以确保“它是合理的,并遵守最佳实践”。有几种方法可以在操作和传统决策值得信赖的级别上提高数据质量。

有些涉及 Krizanek 所描述的“传统的业务规则引擎、工作流、可以自动化该流程的东西,你有一个仪表板,它会告诉你现在它交给了这个人,然后这个人需要在它出去之前审查并添加这个部分。围绕Mezhanskiy所描述的“数据可靠性工程作为一种实践,以获得更好的数据质量和数据可靠性”,也出现了越来越多的运动。这种做法基于对元数据的严格评估,以便“正确的数据代表现实,”Mezhanskiy表示。最后,主数据管理解决方案对“多项数据质量检查进行了转换,以验证数据并对其进行规范化,”Krizanek 说。

机器学习

数据治理扩展其范围以涉及更接近运营的活动的另一种方式是逐步吞并人工智能的不同方面。智能推理的使用是最突出的例子;治理还涵盖了机器学习的各个方面。告知认知分析模型学习能力的功能可以被视为元数据。用于特征工程的专用特征存储越来越受到元数据管理、数据沿袭等治理支柱的影响,从而带来许多好处。

根据 Polikoff 的说法,“趋势之一是将机器学习模型管理和功能管理纳入数据治理解决方案。数据治理扩展到管理机器学习模型,机器学习过程利用数据治理解决方案,因为必须让模型准确、管理它们,并了解这些模型的相互关系以及它们的应用位置。

相反,机器学习通常用于通过推荐与之相关的操作来实现数据治理的不同方面。Krizanek 阐明了一个用例,在该用例中,此类建议用于“提高数据或其所属工作流的质量”。

比以往任何时候都更好

活动元数据的概念只是数据治理整体蜕变的一个方面,从关于如何使用数据的不变的、面向历史的戒律,到在直接影响生产的环境中使用它们的方式。组织可以通过有效地依赖运营数据建模、运营元数据管理和运营数据管理,从这一趋势中获益。这种方法依赖于数据质量,将治理扩展到数据科学中,并且是一种只有使用它的组织才应该的进步。


关于作者

杰拉尼·哈珀(Jelani Harper)是服务于信息技术市场的编辑顾问。他专注于语义技术、数据治理和分析的数据驱动应用程序。


【声明】内容源于网络
0
0
溯原数科
经中关村工信二维码技术研究院授权,已经获取国内顶级节点(综合一级节点)MA.15602独家建设运营权,负责全国各省市区、各部委(行业中心)、央企国企的MA标识代码授权、发行、解析、评定及相关产业服务。
内容 16
粉丝 0
溯原数科 经中关村工信二维码技术研究院授权,已经获取国内顶级节点(综合一级节点)MA.15602独家建设运营权,负责全国各省市区、各部委(行业中心)、央企国企的MA标识代码授权、发行、解析、评定及相关产业服务。
总阅读0
粉丝0
内容16