2025年10月17日、18日,GOPS运维大会·上海站盛大召开,汇聚了众多顶尖专家。其中,复旦大学计算机科学技术学院教授兼擎创科技首席科学家王鹏的分享成为焦点。
他以《智能运维中的知识库构建与使用技术》为主题,深入剖析了基于大模型与RAG(检索增强生成)技术的知识库创新实践,为行业提供了前瞻性思路。
一
知识库构建|从非结构化到结构化的突破
1
运维文档的痛点与机遇
王鹏教授指出,企业长期积累的运维文档、操作手册和工单数据存在两大核心问题:
非结构化困境:传统文档缺乏统一格式,信息分散,难以直接用于自动化运维
检索低效:通用RAG技术无法精准匹配运维场景中的结构化需求(如错误码、配置参数)
解决方案:通过“解析-字段抽取-对话结构化”三步法,将非结构化文档转化为结构化知识库。例如,应急预案文档可拆解为“场景-问题-解决方案-验证步骤”的层级结构,支持字段级精确检索。
2
技术创新:大模型+RAG的协同整合
王鹏教授团队提出“结构化转换+SQL式查询”的方案,突破传统RAG的局限性:
结构化转换:将文档转化为关系型数据库表结构,支持类似SQL的条件匹配(如WHERE错误码='500')
GraphRAG优化:针对长文本语义不匹配问题,提取实体粒度关系(如主机、服务),结合目录结构实现精准语义匹配
案例验证:在应急预案推荐场景中,通过chunk切分策略将文档拆分为独立模块,匹配告警内容后直接返回解决方案,检索效率提升60%以上。
二
知识库应用|驱动运维决策智能化
1
智能问答与多跳推理
结构化知识库支持多跳问答能力,例如:
问题:“如何处理数据库连接超时?”
推理路径:错误码定位→配置参数检查→应急预案调用→验证步骤执行
通过字段映射技术(如错误类型关联表),系统可自动生成解决方案,减少人工干预。
2
跨版本知识演化与影响分析
针对PostgreSQL等数据库的版本升级场景,知识库可实现:
版本对比:追踪参数变更(如WAL压缩算法从LZ4到ZSTD的演进)
兼容性评估:分析功能差异对用户升级决策的影响,提前规避风险
3
一致性校验与冲突检测
通过数据库中间件功能,知识库可自动检测配置冲突(如端口重复、参数阈值矛盾),并提供配置推荐和最佳实践发现,显著提升运维稳定性。
三
行业启示|结构化存储与混合检索的未来
1
结构化存储的实践建议
王鹏教授强调,企业应尽量从运维文档中提取结构化的知识,并在此基础之上进行检索和最终的答案生成,可大幅提升提取回答的准确性。
2
混合检索策略:提升确定性
针对检索准确性问题,他提出“通用RAG+个性化字段检索”的混合模式:
通用RAG:处理非结构化文本匹配
个性化检索:通过字段级条件(如时间范围、错误类型)过滤结果
结合相似度打分机制,确保返回结果与问题意图高度契合。
END
王鹏教授的分享为智能运维领域指明了方向——通过结构化知识库与大模型技术的深度融合,实现从“知识检索”到“决策推理”的跨越。
擎创科技将持续探索这一路径,助力企业构建高效、可靠的智能运维体系。

擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择

