美创科技暗数据发现与分类分级系统通过中国信息通信研究院大数据产品能力评测数据安全专项首批数据分类分级工具评测。暗数据发现与分类分级平台是一款美创科技自主研发,通过对数据进行自动化识别、分类、分析的产品,为企业开展数据资产管理、数据安全治理、数据安全防护等提供支撑的平台化工具。该平台集合自动扫库扫表、模型匹配、数据统计、机器学习等技术,提供数据发现、数据含义识别、业务类型确认、数据分类分级、多维结果输出等功能,可根据分类分级策略智能化处理分类分级标签,可视化呈现数据分类分级结果。
从数据安全到数据治理与可视化应用,成立于2005年,美创科技围绕“聚焦数据安全,释放数据价值”战略,为用户安全地发挥数据资源价值,提供一站式产品服务。
企业组织数据规模量随着信息化、数字化进程持续增长,长久累积的数据如同冰山,大部分潜藏水面以下,不为人知,Gartner称其为“暗数据”,未被发现的暗数据中包含诸多敏感信息,同时蕴含巨大的价值。
对此,有效对暗数据进行识别、管理和使用,对数据资产进行梳理与分类分级将有助于企业组织合理分配数据保护资源和成本,是组织单位建立完善的全生命周期数据保护框架的基础,也是有的放矢地实施数据安全管理的前提条件。同时,统一的数据分级管理制度,能够促进数据在机构间、行业间的安全共享,有利于数据价值的挖掘与实现。国家、行业、地方也相继出台相关标准规范及试行指南,为落实数据分类分级管理提供指导性参考。

但目前,发现数据并进行分类分级工作仍面临系列挑战:
1、数据分类分级工作是涉及大量业务知识和数据专业工作的交叉性课题,大部分行业并无通用的标准和方法论,机构缺乏数据分类分级体系、人才、技术支撑,面对庞杂的业务数据难以进行合理、有效、全面的分类分级。
2、业界大多数数据分类分级系统实现思路是“先梳理现有数据,再结合人工方式进行分类分级”,这一过程繁杂、效率低下、周期长,且主观性比较强,准确性差。
美创科技将国家政策要求、行业标准、规则以及美创多年形成的方法论固化为产品,打造出暗数据发现和分类分级平台,平台致力于认识数据,推动数据透明化、有序化、价值最大化、流程自动化。
基于机器学习与数据挖掘技术的暗数据发现和分类分级平台能够对多种数据源进行接入和元数据扫描,按照发现模板对数据进行发现和分析,帮助用户将不可理解的数据自动化、智能化的转化为可认知的、分类有序的数据。支持全面捕获扫描数据、智能解析数据类型和含义、自动化分类分级,并以可视化的方式呈现资产发现和分类分级最终成果,支持用户对发现结果进行确认并同步到资产发现总览和分类分级总览。暗数据发现的结果通过标准API服务提供给其他系统,进行进一步管理和分析,实现资产价值的发挥和安全性的保障。
最终实现:
✦ 使企业信息资产的规模扩大近10倍。
✦ 缩短70%数据建设周期。
✦ 降低50%数据利用成本。
✦ 降低数据安全风险
✦ 帮助企业建立高质量、统一标准的数据环境。

暗数据发现和分类分级平台产品架构
产品功能特性:
1、 准确定位数据存储位置:支持用户输入IP范围,通过扫描IP范围的方式去自动化发现企业内部有多少数据库,包括数据库的IP、端口、数据库类型等信息。
2、 资产发现适配多种数据源:系统适配多种数据源,包括关系型数据库、大数据平台、云数据库等,通过广泛适配各种各样的数据源扫描相关数据,充分利用数据库内的数据信息进行统计分析,从而可以得到全面的关于数据分布、规模、种类的分析结果。
3、 内置发现模版,适配多个行业:通过对多个行业的分类分级标准的解读、整理,内置为系统的数据分类分级发现模版,能够实现对多个行业的自动分类分级梳理,包括医疗、金融、政府等。
4、 内置丰富数据标准和发现规则:内置的数据字典、标准和规则非常完善和健壮,目前包含5万多条数据字典,1500多个业务类型及近3000条发现规则。通过数据特征分析和NLP(自然语义识别)技术识别数据含义,同时还可以根据数据特征自动提取规则,实现规则的快速补充,确保识别覆盖率。
5、 发现结果可视化:系统提供丰富图表,通过可视化的方式展示数据发现和分类分级报告,直观清晰的展现数据富含的意义,使得用户可以快速的较容易的了解数据,同时支持用户对图表进行点击查看、缩放、拖拽并进行修改等操作,在帮助用户迅速了解大量数据的同时增加了交互性。

可视化报告
6、 提供接口和产品对接能力:提供标准对外接口方案,能与其他系统进行交互,将数据发现和分类分级的能力和结果提供给三方系统,能在数据安全治理、数据分级分类、数据资产管理等方面进行协作,更大发挥数据的利用价值。

1、将暗数据转化为明数据,扩大企业数据资产规模。
平台内置机器学习模型和丰富的语义资料,在面对不同行业多样化的数据时,可以自动适配进行发现。通过平台可发现数据含义,将用户不理解的看似无用的数据变成分类完善、容易理解、有业务价值的数据,并通过可视化的方式呈现,将最基础的数据变成了优质的数字资产。
2、敏感数据识别及分级,提升数据安全防护水平。
平台数据发现识别字段语义的功能,可帮助客户全面认识内部包含的数据,有哪些类别的数据,哪些数据属于敏感数据,实现敏感数据的自动识别,并可根据敏感程度、重要程度进行分级。敏感数据发现和分类分级的结果可通过标准接口方案可和数据安全治理平台、安全管理平台等系统进行对接,对数据安全开展分级防护,从而更有针对性的保护敏感信息,减少客户数据安全风险。
3.数据自动化分类分级,满足政策和合规要求。
随着《数据安全法》等法规的出台,从政策层面上提升了数据分类分级的要求和规范,平台通过对《个人信息安全规范》《证券期货行业数据分类分级指引》《政府数据 数据分类分级指南》《数据安全分类分级实施指南》等已经出台分类分级标准的学习、解读,沉淀行业知识、标准,形成完善的分类分级方法论,并转化为系统的发现模版,能够帮助用户自动化、快速实现数据的分类分级,满足政策和合规要求。
4.缩短数据建设周期,降低数据利用成本。
一般情况下,客户如果采用传统的方法进行数据治理、数据仓库建设,可能需要3-6个月,但是通过平台自动分析出表格中字段的含义,让实施人员在数据建设初期更快、更全地认识数据,为元数据管理、数据资源目录的数据准备阶段提供分类有序的数据,减少数据梳理或数仓建设初期减少人力的投入和时间成本。
同时,为满足行业用户数据分类分级要求,保证分类分级的规范性,有效提升分类分级的准确性和效率,美创科技结合自身数据安全经验及对相关法律法规、国内外标准研究基础,以“专业咨询服务团队、数据分类分级方法论和成熟工具”,形成了一套数据分类分级方案。

让数据从明珠蒙尘走向举目纲章,如今美创科技暗数据发现与分类分级平台已先后在大数据局、人社部门、银行等单位机构实践落地。
中国信通院大数据产品能力评测数据安全专项是面向数据安全产品供应能力的体系化、市场化评测体系,每年开展两批,评测基于数据安全推进计划(DSI)与大数据技术标准推进委员会制定的系列标准。通过对数据安全产品进行评测,有助于摸底我国数据安全市场现状,规范数据安全产品类型,促进数据安全市场健康有序发展。评测一方面为用户提供采购选型的参考,另一方面为厂商产品研发提供风向标。
目前,中国信通院正式启动数据安全产品评测工作。2022年6月份“大数据产业峰会”将为通过评测的产品颁发证书。欢迎相关单位积极报名参与。
联系人:
数据分类分级工具评测、数据脱敏工具评测
贾 真 13214220810
jiazhen@caict.ac.cn
数据审计工具评测
郝志婧 15712890577
haozhijing@caict.ac.cn


