

星河案例ㅣ中移信息：数据安全的创新解决方案实践

沙丘社区

2024-01-18

导读：通过介绍中移信息数据安全合规管控平台建设实践，为通信行业数据安全提供经验借鉴。

▏摘要

为了保障公司业务发展的数据安全，同时积极响应政策制度要求，中移信息统筹规划、整合资源、明确要求，开展基于AI与国密算法相结合的数据安全合规管控平台的研究与建设，补全现有数据安全防护短板，强化数据安全全生命周期闭环管理，实现数据的“可管、可控、可视、可溯源”。

▏问题

中国移动集团公司响应国家号召，积极打造数字集群，推动企业自身的数字化转型发展，但同时也面临着前所未有的安全风险与挑战，数据安全成为制约公司转型以及发展的最大短板之一。

▏行动

• 数据安全统一管控思路主要是构建安全框架，提升全员的安全意识，规范生产安全操作行为。主要的技术手段包括数据分级、安全加密、安全审计等，保护用户的隐私权以及个人信息，保障企业数据资产安全以及业务的健康发展，降低敏感数据在全生命周期各个环节的安全风险；

• 中移信息通过研究大语言模型，使用词向量模型、命名实体识别等技术对内容进行分词，针对数据中可能存在的敏感数据进行智能识别，将隐马尔可夫模型用于分词标记。此外，根据公司管理要求，制定敏感数据的识别评估模板，可以针对识别出的数据和文档，自动生成数据安全评估报告；

• 数据传输与存储过程中，中移信息采用国密算法SM4和SM2进行有效防护，后续交互数据可以确保不被第三方获取，保证传输安全。

▏结果

• 中移信息通过一整套敏感数据识别和保护的闭环安全管控体系，让安全贯穿数据的全生命周期，实现对包含关键基础设施系统在内的多个业务系统的数据安全支撑，在降低成本、提升效率、提升安全性等多个方面效益明显。

分享专家：魏佳，中移信息数据安全工程师

作者：沙丘社区分析师团队

案例企业

为顺应中国移动IT领域改革要求，中国移动整合原集团公司业务支撑系统部、中国移动（深圳）有限公司、南方基地IT支撑中心、政企公司M域等建设团队，于2018年1月设立“中国移动信息技术中心”，负责统筹管理全网IT工作，并承担集中化IT系统的运营和支撑。

项目背景

随着信息技术的迅速发展和全球化趋势趋势推进，国家高度重视和发展数字经济，规划并明确数据作为新时代数据经济发展的第五大生产要素。

中国移动集团公司响应国家号召，积极打造数字集群，推动企业自身的数字化转型发展，但同时也面临着前所未有的安全风险与挑战，例如2022年发现并且验证属实的数据泄露事件超过了3200起，较2021年增长近一倍。因此，数据安全成为制约公司转型以及发展的最大短板之一。

另一方面，国家监管单位以及中国移动集团公司在数据安全方面相继出台法律法规、行业标准等制度要求，规范公司的数据安全合规，履行数据活动中的安全保护义务，解决业务发展带来的数据安全痛点，应对日益迫切的数据安全风险。

解决方案

数据安全平台建设不是一蹴而就，而是基于长时间的规划建设、统筹兼顾、动态调整。数据安全合规平台整体框架如下，分为基础设施层、处理层、功能层和应用与展示层。

数据安全统一管控思路主要是构建安全框架，提升全员的安全意识，规范生产安全操作行为。主要的技术手段包括数据分级、安全加密、安全审计等，保护用户的隐私权以及个人信息，保障企业数据资产安全以及业务的健康发展，降低敏感数据在全生命周期各个环节的安全风险。

例如在数据采集环节，聚焦敏感数据智能识别发现能力，及时发现敏感数据；在数据传输环节，采用安全可靠的国密算法，保障数据安全传输；在数据存储环节，统一采用国密算法进行加密及密钥管理，提高数据存储的安全性；在数据使用环节，除了常规的用户认证、授权申请等功能，中移信息增加安全查看功能，进一步确保数据不泄露；在数据共享环节，对智能识别出的敏感数据按需进行脱敏、加水印等安全措施，为数据的完整性提供保障；在数据销毁环节，除了销毁原始数据，还有密钥、备份等数据的清理，确保数据得到完全清除，不可恢复还原。

安全审计、操作审计贯穿整个数据生命周期，及时发现违规行为，进行操作溯源。

随着AI以及大数据技术的发展，通过系统对敏感数据进行智能识别成为可能。中移信息通过研究大语言模型，使用词向量模型、命名实体识别等技术对内容进行分词，针对数据中可能存在的敏感数据进行智能识别，将隐马尔可夫模型用于分词标记。此外，根据公司管理要求，制定敏感数据的识别评估模板，可以针对识别出的数据和文档，自动生成数据安全评估报告。

评估报告主要基于数据分级分类的结果，根据类别、属性、重要及敏感程度等差异，提出采取适当的与数据安全风险相适应的管理措施和技术手段等建议，便于指导业务开展相关的工作，保障数据安全。

根据敏感数据类型确定数据收集、传输、存储、使用、共享、销毁等全生命周期各环节的管理要求，数据敏感性划分为5级：高敏感、敏感、较敏感、低敏感、非涉敏。敏感数据评估报告输出后，主动向评估人员发送评审待办，评估人员可以检查并确认报告。

完成敏感数据识别之后，对于敏感数据需要使用足够强度和速度的手段进行加密防护。数据传输与存储过程中，采用国密算法SM4和SM2进行有效防护，遵循国密算法SM4要求，首先生成随机的SM4对称密钥，并使用服务器公钥加密发送给服务端，仅服务端使用本地非公开的私钥可以解密，然后双方使用随机密钥，通过SM4算法加密后，后续交互数据可以确保不被第三方获取，保证传输安全。

针对每个数据文件生成一个一次性的随机对称密钥，使用公钥执行SM2算法，对随机密钥加密，保存非对称加密后的对称密钥，由于SM2的算法复杂性更高，完全无需定期更新SM2密钥对，即使需要更新SM2密钥对，也只需要处理全部随机对称密钥，处理时间相对处理全量涉敏数据文件要小上千倍。

完成敏感数据加密保护后，向用户提供安全查看的专用客户端，用户经过严格的身份验证后，可以访问被授权的敏感数据，生成并维护用户访问敏感数据的日志用于审计。安全查看浏览器支持水印，并且有效防范各类截屏、录屏、视频会议共享屏幕软件，提升数据安全防护水平。

用户访问敏感数据时，系统完成SM2和SM4两层解密，获得明文敏感信息，并且呈现在安全查看终端，呈现数据时，在图像上附加高透明度图片作为水印，水印包含当前用户名、访问时间、客户端IP地址等信息，安全查看客户端会不间断监听敏感 API，发现读取屏幕消息活动时，通过屏蔽截屏的功能，并用灰色块覆盖安全呈现客户端，避免用户截屏。安全查看客户端也会不间断的检查当前系统中的进程，发现黑名单中的录像软件后，会立即结束安全查看，并且主动跳出提示框，提示用户关闭录像软件。

对评估为较敏感以上等级的，数据共享时需要进行严格控制，对敏感信息进行脱敏、添加水印，并通过数字签名等手段保护数据文件完整性以避免数据泄露。

本项目遵循《电信网和互联网数据脱敏技术要求和测试方法》、《中移(动)信息技术有限公司数据安全管理办法》等管理要求，在数据共享、使用时完成数据脱敏，脱敏方案主要包括但不限于对用户身份和标识信息、用户服务使用数据进行脱敏。

价值与效果

经过深入研究涉敏数据智能识别、敏感数据加密保护、加密文件安全查看和复制防护全过程的技术趋势，中移信息形成一整套敏感数据识别和保护的闭环安全管控体系，让安全贯穿数据的全生命周期，为中国移动业务高质量发展保驾护航。具体的项目价值与效果体现在如下四个方面：

第一，AI精准识别敏感数据。在NLP大模型基础上，通过词向量模型、命名实体识别等技术，正确识别上下文语意，处理复杂的语言结构，包括多义词、词性变化等，识别准确率极高，敏感度（检出实际敏感信息/全部实际敏感信息）达99.5%，置信度(检出实际敏感信息/全部检出信息)达97.5%。随着培训历史材料的丰富，敏感度和置信度还能继续上升。

第二，国密算法助力安全可控。采用国密算法SM4实现涉敏文件加密防护，安全防护等级与AES基本相似，显著优于3DES算法。SM4在自主可控，避免漏洞及后门等方面，存在强大的优势。

第三，涉敏文件集中高效管控。采用线上评估的方式，集中管控涉敏文档，避免线下文件流转过程中数据安全不可控风险，记录生成文件操作日志，实现数据的“可管、可控、可视、可溯源”

第四，文件防泄漏守护数据安全。敏感数据安全查看时，携带明文敏感信息的数据无法下载到本地，同时也禁止本地缓存。通过水印记录当前用户及环境信息备查；通过屏蔽右键菜单、捕获系统消息、禁用常见截屏快捷键等手段，拒绝截屏、录屏类应用，全面保护数据安全。

【声明】内容源于网络

沙丘社区

数字化研究与服务机构

内容 672

粉丝 0

沙丘社区数字化研究与服务机构

总阅读99

粉丝0

内容672