编者荐语
当前电信运营商数字化转型中,普遍面临资源数据治理效果不佳、问题修复人工成本高企的挑战。对此,本文创新引入网络资源自愈智能体,融合认知推理与自动化执行能力,推动数据治理从 “人治” 走向 “智治”。该智能体不仅能显著提升问题数据修复效率,更能沉淀和复用修复经验,为运营商数据质量治理提质增效。本文旨在为通信行业智能化治理与系统建设提供参考。
基于LLM的网络资源数据自愈技术探索
亚信科技(中国)有限公司
摘要:本文提出一种基于人工智能技术的网络资源数据治理新方法,旨在解决传统治理中修复体系分散、过程黑盒化、能力难沉淀问题。通过构建具自主认知与决策能力的网络资源自愈智能体,整合大模型推理、修复经验知识库与运维工具链,依托语义解析、任务规划、人机回路校验纠偏三大能力,实现数据质量问题全流程智能化修复。该智能体可有效替代传统人工操作,为网络运维、IT 系统建设、业务运营部门赋能,助力运营商优化数据治理模式、降低运营成本。同时,本文指出该技术在数据质量依赖、模型决策可信度方面的挑战,为后续完善提供方向。
一
网络资源数据治理工作面临的问题
在当前数字化转型的浪潮中,电信运营商普遍面临网络资源数据治理效果不佳、人工干预成本高昂的挑战。尤其是在问题数据修复环节,修复体系分散并且高度依赖专家参与,极大制约了治理工作的效率与质量,并对依赖高质量数据的各项外部应用与服务支撑产生了显著的连锁负面影响。
目前运营商数据治理修复环节主要存在如下几个方面的问题:
· 修复体系分散低效,协同能力不足
修复能力分散于大量独立的脚本、特定工具及孤立的自动化程序中,缺乏统一的编排与调度平台。这种“烟囱式”的修复手段导致流程割裂,难以形成端到端的自动化闭环,协同效率低下。
· 修复过程黑盒化,风险管控缺失
修复动作通常涉及跨多个OSS系统的连续操作,但现有方式缺乏对执行步骤、逻辑判断和中间状态的透明化追踪。这种“黑盒”模式使用户无法有效监控与审计,存在误操作(如误删、误改关键数据)且难以回溯的潜在风险。
· 治理能力难以沉淀,可持续发展受阻
复杂问题的修复高度依赖专家个体的经验判断。这些隐性知识未能有效转化为结构化的、可复用的数字资产,导致“因人成事”,同类问题反复处理,治理成本居高不下。同时随着人员流动,组织治理能力随之流失,形成“能力断层”,制约团队的长期成长与治理水平的持续提升。
综上所述,传统的“打补丁”式或高度依赖人工的治理模式,在效率和规模上已难以满足当前要求,亟需将治理能力从“工具辅助”升级为“智能驱动”,实现治理修复过程的自动化、智能化。
二
网络资源自愈智能体
为克服传统数据治理模式中修复体系分散低效、过程黑盒化风险高、治理能力难以沉淀等核心问题,本文引入AI驱动的“网络资源自愈智能体”。网络资源自愈智能体,是一种以LLM为核心驱动,整合修复经验知识库与运维工具链的智能系统。该智能体旨在融合大模型的认知能力、领域知识库与原子化工具,构建统一的修复调度平台,实现问题数据的智能诊断、方案生成与精准修复全流程自动化,并通过透明化执行与知识持续积累,将传统依赖人工的治理模式,转变为基于数据和算法的自动化、智能化方式。
(一)网络资源自愈智能体的关键能力
为实现构建统一修复调度平台,实现问题数据治理的全流程自动化,网络资源自愈智能体需要具备以下关键能力:
1.语义解析能力
语义解析能力是智能体的“理解层”,核心任务是充当自然语言与机器可操作的结构化信息之间的翻译器,将模糊的用户指令转化为精确的机器可读的上下文。
该能力的实现包含两个核心步骤:
首先,进行动作识别与原子化分解:智能体对输入的描述修复经验的自然语言指令进行深度分析,识别出所有潜在的操作意图(如“查询”、“更新”、“比对”),并将复合指令(如“查询设备A并更新其端口状态”)分解为多个顺序执行的、不可再分的原子动作单元。
其次,进行细粒度信息提取:针对分解后的每个原子动作,智能体进一步抽取出执行所需的全量上下文要素,包括资源对象、资源属性、关联关系、查询条件约束、目标工具集以及结果判断与流程跳转逻辑。
2.任务规划能力
任务规划能力是智能体的“决策与组装层”,它基于语义解析输出的结构化信息,生成可直接驱动执行的具体行动计划。
该能力的核心任务是将解析后的原子动作与对应的工具集进行绑定,并编排成可执行的工作流。智能体根据已识别的资源信息与约束条件,自动生成精确的数据查询脚本;同时根据识别到的工具集名称,在平台工具链中进行匹配,并依据动作上下文自动生成该工具集调用所需要的入参。最后将所有原子动作单元、绑定的工具集与入参、以及步骤间的跳转逻辑,整合封装为一个完整的、机器可读的结构化计划对象。计划中明确了执行的顺序、条件和依赖关系,可以被自动化引擎调度执行。
3.基于人机回路的计划校验与纠偏能力
为了克服大语言模型固有的“幻觉”问题,避免直接执行未经校验的AI计划可能引发的严重后果,如误删关键数据、错误配置引发业务中断等。智能体设计并实现了人机回路校验与纠偏能力。该能力的核心任务是引入人工专家的判断,将人类专家的领域经验与常识作为最终决策的依据,弥补AI在特定场景下知识或经验的不足。确保生成的修复计划在准确性、安全性与可行性上满足生产要求,为数据修复的最终成功提供核心保障。
图1:人机协作流程图
该能力通过智能体的呈现层提供一个计划管理界面,将大模型生成的执行计划在界面中进行呈现。专家可以查看每一步的意图、需要调用的工具以及跳转逻辑,并可在界面上对步骤进行编辑。在计划正式执行前,系统提供沙箱测试能力,系统会完整展示每个步骤的模拟执行结果。专家根据执行结果,验证计划执行逻辑的正确性。测试通过的计划才被允许发布,投入到生产环境执行。
(二)网络资源自愈智能体的应用
图2:网络资源自愈智能体应用流程图
以“宽带业务与AAA设备、端口属性信息不一致”问题修复场景为例说明智能体的应用过程,分为5步:
Step1:修复经验知识库构建:使用人员通过自然语言描述专家修复经验,智能体向量化后存储进知识库。自然语言描述样例:
1.根据宽带账号查询AAA鲜活数据的SN码、OLTIP、PON口编号,有结果进行下一步
2.根据步骤1中的SN码查询综资ONU,有值更新宽带业务的ONU标识并进行下一步
3.根据步骤1中的OLTIP查询OLT,有值更新宽带业务的OLT标识并进行下一步
4.根据步骤1中的PON口和上一步的OLT资源标识查询综资PON口,有值更新宽带业务的PON口资源标识
Step2:自愈方案生成:大模型基于RAG、修复经验知识库以及工具集通过语义解析、任务规划自动生成自愈方案。执行逻辑如下图:
图3:自愈方案流程图
Step3:专家微调纠偏和测试:通过可视化的界面展现AI生成的自愈方案,专家根据经验和行业知识对方案进行调整并测试,确保自愈方案的准确性。
Step4:问题数据修复:针对质检平台导入的问题数据,智能体根据问题资源、问题描述自动匹配方案并驱动执行,推导输出正确结果。
Step5:数据更新闭环:智能体调用资源生产系统数据更新流程接口,实现数据的更新闭环。
三
面向不同客户的应用价值
网络资源自愈智能体通过重构数据治理模式,可以实现面向不同客户的精准赋能,构建共赢生态。
(一)面向网络运维部门
面向网络运维部门,通过部署7×24小时智能修复能力,系统可自动完成重复性数据问题处理,将一线人员从繁琐劳动中解放出来,转而聚焦于高价值任务;同时,跨系统数据一致率的提升,可以大幅缩短故障排查时间,有效降低客户投诉率。
在此基础上,系统通过构建数字化修复知识库,推动运维能力的持续沉淀与传承。新手可借助知识库快速掌握复杂问题处理能力,实现专家经验的数字化复用,形成“修复-反馈-优化”的闭环流程。
(二)面向IT系统建设部门
面向IT系统建设部门,通过打造标准化的原子操作平台与API接口,将原本碎片化的治理工具整合为可灵活编排的原子能力,可以显著降低系统间耦合复杂度,并大幅减少人工干预环节。
另外,平台深度融合大模型技术,使其能够快速理解并响应新型数据问题,持续提升系统的自适应与智能化水平。同时,平台支持知识库与规则库的持续扩展,具备良好的生态开放性,可便捷地与综资、网管等现有运维系统深度融合,为构建一体化的智能运维体系提供坚实支撑。
(三)面向业务运营与客户服务部门
面向业务运营与客户服务部门,通过提升数据质量与一致性,为业务敏捷响应与用户体验优化提供坚实基础。数据准确性的提升可以直接加速业务开通与故障修复流程,大幅缩短服务交付周期。同时,跨系统数据的一致性与可信度为业务决策与服务交付提供了可靠保障,能够有效减少因数据差错导致的业务异常,客户能够享受更流畅、可靠的服务流程,为前台部门创造可持续的服务竞争力。
四
网络资源自愈智能体的挑战
网络资源自愈智能体以AI为核,以数据为基,重构数据治理的“技术-流程-质量”三角能力,初步搭建了一套“治理即服务”的可持续运营模式,为电信运营商在5G+时代的数据驱动创新提供了新的解决方案。然而,该技术的成熟与大规模应用仍面临一系列亟待应对的挑战,主要表现在以下两个方面:
·数据质量与系统依赖性的挑战
智能体的决策高度依赖输入数据的准确性与接口的稳定性。若锚点数据本身存在大量噪声或不一致问题,或者底层系统接口发生变更,可能导致“垃圾进,垃圾出”的局面,甚至引发连锁性的误操作。
· 模型幻觉与决策可信度的挑战
大语言模型固有的幻觉问题在复杂场景下会更为突出,可能生成逻辑合理但实际错误的修复方案。尽管通过人机回路进行纠偏,但如何量化评估AI决策的可信度,建立一套完整的风险置信度评估与自动熔断机制,从而在效率与安全之间取得平衡,是走向高阶自动化必须要攻克的技术难关。
尽管网络资源自愈智能体在推动数据治理从“人治”到“智治”转型方面展现出显著潜力,但要实现其全面落地与规模化应用,仍需解决上述数据质量、模型可信、系统泛化、组织适配等多维挑战。通过持续的技术迭代、流程优化与组织协同,我们有望构建出更加成熟、可靠、可扩展的智能治理体系,最终实现网络资源数据质量的高水平自治与可持续运营。

