大模型技术的爆发式增长,正在重新定义智能运维的边界,然而,这也使得传统运维模式的局限性愈发凸显,人工经验驱动的方式,早已难以应对效率与准确性的双重挑战,而大模型的出现为解决这些问题带来了新思路,其中检索增强生成(RAG)技术成为关键一环。
该技术结合了大模型的生成能力与外部知识库的检索能力,使大模型回答问题不再局限于自身训练数据,而是能够实时查询并引用最新、外部且专业的知识。这对于需要处理大量运维手册、日志、告警信息等专业数据的智能运维场景而言,无疑是一项强大工具。
传统RAG方法的局限性
在面对智能运维领域复杂问题时,传统RAG方法所采用的“统一检索+一次性生成”流程,存在显著短板,如缺乏结构性、不适用于多跳问题、难以处理模态切换,这些短板往往难以满足精准诊断与高效解决的需求。
RAG新范式:静态DAG规划
静态DAG的RAG新规划能将复杂运维问题结构化拆解为多个可执行子问题,明确依赖关系并构建清晰DAG,搭建系统化解决框架。
它不同于业界传统动态规划的线性、动态调整路径(效率低且多轮交互易“意图偏离”),而是通过预先定义清晰可并行的任务流,提升复杂问题处理的效率与准确性。
静态DAG在智能运维中的
应用流程与优势
基于静态DAG的RAG规划方法为智能运维带来了显著的提升:
#
用户提出问题
接收用户输入的复杂运维问题,例如“告警服务器风扇报警后应采取哪些维修措施?”
#
LLM进行DAG规划
大型语言模型根据问题的复杂度和类型,将其结构化拆解成多个子问题,并梳理出它们之间的依赖关系
#
多模态执行检索
根据每个子问题的具体内容,选择最合适的模态进行检索
#
答案整合与输出
将所有子问题的检索结果进行整合,并根据预设的依赖关系,最终生成完整的、可解释的答案
这种方法的核心优势在于:
1
结构清晰:提前规划、合理拆解复杂问题,确保解决问题的逻辑链条完整且可追溯
2
调度高效:多个无依赖关系的子问题(如上文中的Q2a和Q2b)可以并行执行,提高了响应速度
3
可解释性强:每一个步骤、每一个子问题的解决路径都清晰可见,有利于故障定位和结果验证,让运维人员可以信赖并理解AI的决策过程
4
自适应模态检索:可以根据子问题的性质,选择最合适的检索方式(文本、图像等),有效整合多源异构信息
实验结果对比:
静态DAG的卓越性能
在一项针对多模态多跳问答数据集的实验中,基于静态DAG的方法取得了显著的优势。
如下表所示,相比其他方法,该方法在ExactMatch(回答与标准答案是否完全一致)和F1Score(回答与标准答案的词级重合度)两项关键指标上均表现优异,充分证明了其在解决复杂多模态运维问题方面的准确性。
|
方法 |
ExactMatch |
F1Score |
|
Binder |
51.0 |
57.1 |
|
MMHQA-ICL |
54.8 |
65.8 |
|
HPROPRO |
59.0 |
66.7 |
|
Ours |
60.61 |
69.65 |
「READING」
基于静态DAG的RAG方法,它不仅从根源上提升了答案的精准度与问题处理效率,更能让运维人员清晰回溯问题拆解的全流程,每一步信息检索的源头都一目了然,最终决策生成的逻辑脉络也清晰呈现。
我们有充分理由坚信,随着该技术不断迭代升级,智能运维系统对复杂问题的理解与解决能力将持续提升,更将引领整个智能运维领域迈向一个更高效、更可控的发展新境界。
更多智能运维大模型相关资讯可查阅以下:
AIOps探索|AI大模型开发困境如何破?Easy MCP开发平台给出完美答案
AIOps探索|Text2SQL:运维人摆脱SQL困扰的 “魔法钥匙”
AIOps探索|如何告别低效运维?擎创科技四位一体框架来助力
AIOps探索|大模型运维遇阻?擎创科技用知识图谱画出智能决策“导航图”
AIOps探索|大模型如何让运维从“局部洞见”跃升至“全局智能”
擎创动态|超越传统RAG!静态DAG多模态检索增强技术引爆智能运维新范式

擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择

