基于大模型的通信数据分类分级与数据安全事件诊断技术研究与应用,不仅融合了OCR与多模态分析、敏感片段知识库等前沿技术,还实现了深度流量分析与数据安全风险建模,展现了极高的技术创新性。同时,其智能分类分级系统与数据安全诊断系统的结合应用,显著提升了数据安全防护的精准性与实时性,成果先进性显著。此外,该成果已成功应用于多家基础电信运营商与工业企业,充分证明了其高度的可复制性与推广价值。
问题
在数据安全建设方面,中移(上海)信息通信科技有限公司主要面临如下问题:
第一:数据识别与分类分级不够准确,传统方法在处理非结构化通信业数据时,往往难以达到高精度,导致数据资产管理效率低下以及数据安全保护措施不当,数据泄露风险增加。
第二:数据安全风险预警误报率高:风险误报率高,难以及时发现潜在威胁。
第三:数据安全防护体系不健全,未对不同类别、不同级别的数据实施差异性防护。此外,企业内安全产品联动性不强,数据安全防护能力有待提升。
行动
大模型微调:利用通信业数据样本集对LLM模型进行训练、微调,形成适合通信企业的模型,实现对结构化数据和非结构化文件的全面识别。
融合数据识别引擎搭建:大模型识别引擎结合关键词匹配、正则表达式等算法,构建新型数据识别引擎。规则引擎处理简单规则,大模型引擎处理复杂模式,实现高效、精准的数据分类分级。
数据扫描识别:构建扫描任务,完成元数据、文件资产扫描及数据识别分类。
构建数据资产地图:为高效管理企业数据资产、构建数据安全防护体系提供坚实基础。
数据安全风险诊断:实时监测数据使用情况,及时发现潜在风险。
数据安全防护:对低敏感数据实施脱敏,高敏感数据加密。嵌入数据水印,增强追踪溯源能力。
结果
•成功研制了智能分类分级系统与数据安全诊断系统。智能分类分级系统通过主动扫描技术,实现了结构化及非结构化数据的自动化识别和精准分类分级;而数据安全诊断系统则基于协议的精准识别与深度解析能力,有效识别出流量中的关键数据与潜在风险。此外,我们融合了OCR与多模态分析、敏感片段知识库构建、深度流量分析和数据安全风险建模、数据风险溯源与预警以及数据安全风险协同处置等关键技术,进一步提升了系统的智能化与精准性。
分享专家:唐双林,中国移动十百千专家、上海市正高级工程师;程治胜,北京亚鸿世纪科技发展有限公司高级专家
01
案例企业
中移(上海)信息通信科技有限公司是中国移动通信集团在上海设立的全资子公司,是面向北斗定位导航、智能网联汽车、新型工业化等领域提供信息化产品和端到端解决方案,集研发、运营、支撑、集成为一体的专业公司,主要开展5G+北斗高精度定位、toV车联网、梧桐风控、数字地图等业务。公司以5G发展为契机,结合新一代信息技术以及中国移动各方面优势,依托上海“五个中心”建设,发挥长三角地区经济发展和信息通信产业优势,辐射全国,通过5G赋能行业实现协同发展、融合创新,生态共建。公司自2018年11月成立以来,以“锻造核心能力深化战建协同”为发展主线,以工业能源、智慧交通、金融科技三大行业为立足点,围绕“三通”推动“三融” 聚焦院聚焦主建定位 ,不断加强产学 研合作,攻关29项关键核心技术、打造10大基础能力中台、成立12个联合实验室、形成30多项产品解决方案,构建产品能力体系,持续提升产品竞争力。
北京亚鸿世纪科技发展有限公司是任子行网络技术股份有限公司的全资子公司,是一家面向通信行业客户提供专业互联网网络与信息安全解决方案的国家级高新技术企业,公司有三个战略产品中心,九个研发部门,七个数据分析与网络安全专项实验室。主要客户为工信部、省通信管理局、信通院、工研院、三大基础运营商、未来网络等。目前行政总部设在北京、分公司设在武汉,业务遍及全国,拥有30个分支机构,能够为客户提供专业、高效的服务。亚鸿世纪承建了工信部全国互联网数据统一管理平台、移动互联网应用安全管理平台、国家工业互联网安全态势感知与风险预警平台、统一资源协作管理平台,全国25个省通信管理局互联网综合管理平台、9个省级工业互联网安全监测技术平台、12个省级统一大数据管理平台、7个省级互联网反诈平台、12个省级数据安全监测平台,协助工信部及各省通信管理局充分发挥互联网行业发展主管部门作用,建设了部-省-企业及省内涉网部门等多层次,多维度的互联网空间数据治理和网络与信息安全管理系统,为互联网治理提供了全面、及时、准确的数据基础和全局的监测及管控能力,为维护互联网网络安全提供了重要的支撑和保障。
02
一、项目背景
随着5G、云计算等技术的快速发展,通信数据量呈指数级增长,数据安全与合规性成为行业核心挑战。中移(上海)信息通信科技有限公司(简称“中移上研院”)作为中国移动数据安全领域的核心单位,聚焦通信行业四大核心痛点:
1. 数据分类分级精度不足:传统方法难以应对非结构化数据复杂性,敏感信息识别准确率低;
2. 资产管理碎片化:缺乏统一视图,数据资产分散,保护效率低下;
3. 风险预警滞后:传统监测手段误报率高,威胁响应时效性差;
4. 防护体系孤立:安全产品未联动,差异化防护能力薄弱。
二、核心问题与解决方案
(一)核心问题
通信数据多源异构,分类分级依赖人工,效率低且易遗漏;
安全事件诊断依赖经验规则,难以应对新型攻击手段;
数据资产分散,缺乏全生命周期动态监测能力。
(二)创新方案
中移信息联合北京亚鸿世纪科技发展有限公司,投入超500万元,历时2年研发“智能数据安全管控平台”,构建“大模型驱动+立体防护”体系:
1. 大模型融合引擎:
LLM微调与规则引擎互补:结合规则引擎(准确率68%)与大模型(准确率79%),实现结构化数据识别准确率达到90%以上、非结构化数据达到86%以上;
动态特征提取:支持40+主流数据库、10000+数据格式精准解析。
2. 智能风险诊断系统:
基于用户行为与数据访问模式分析,风险识别准确率从75%提升至93.5%;
支持数据泄露、违规传输等事件的实时溯源与阻断。
3. 分级防护体系:
低敏感数据:动态脱敏技术,保留数据可用性;
高敏感数据:加密+数字水印+防泄漏,确保传输与存储安全;
重要数据:全生命周期监测与自动化审计。
三、实施成效
1. 效率与安全双提升:
构建全域数据资产地图,覆盖10万+数据表与文件,实现“一业一例”责任矩阵;
数据安全事件响应速度提升70%,泄露风险降低85%。
2. 经济价值显著:
助力10家电信运营商、8家工业企业完成安全体系升级,年均减少经济损失超千万元;
获工信部2023年数据安全典型案例等多项荣誉。
3. 社会价值深远:
支撑中国移动工业互联网平台OnePower,累计监测数据资产500万多条,阻断风险事件2000多次;
输出行业标准15项、授权专利30项,培养专业人才1500+人,推动产学研用协同创新。
四、创新亮点
大模型深度赋能:首创LLM与规则引擎融合技术,突破非结构化数据分类瓶颈;
数据扫描与分类分级:完成数据资产扫描和分类分级工作。
动态信任评估:结合用户行为基线,实现数据访问权限动态调整;
全链路自动化:从风险识别到处置,构建“监测诊断响应”闭环流程。
五、推广价值
跨行业复制:方案已在通信、金融、工业领域落地,可扩展至智慧城市、AI+安全等场景;
标准引领:形成“分类分级风险评估防护体系”全流程标准,助力行业监管能力升级;
生态共建:联合产学研机构,推动数据安全技术国产化与人才生态建设。
六、未来展望
中移上研院将持续深化大模型与隐私计算、区块链等技术融合,打造“数据智能安全中枢”,推动通信行业向“主动防御、全程可信”演进,为数字中国建设筑牢安全底座。
案例标签:大模型| 数据分类分级 | 通信安全 | 智能诊断 | AI安全
牵头单位:中移(上海)信息通信科技有限公司
联合单位:北京亚鸿世纪科技发展有限公司

