目前GIS运维的痛点主要包括突发故障发现、报警、止损、修复和规避。早先运维手段相对匮乏,需定期检查各服务运行情况,由人工排查故障。SuperMap iManager为了解决这些问题,实现了对物理环境与GIS服务进行实时动态地监控、记录的能力,并支持设置报警规则,达到报警条件后立即向运维人员报告异常,从而提高运维效率。
随着业务量扩大,监控指标增多,异常数据频频出现,仅靠人工设置报警规则不能满足GIS运维需求。例如在日间访问高峰期,系统CPU使用率会因持续超出设定阈值造成多次报警,这些在高负载下的报警并非系统故障,会误导运维人员的判断。只设置静态阈值是不合理的,需要更加智能的报警方法,最好能够判断故障“真伪”。基于人工智能技术的GIS智能报警可以积累监控数据至样本库,从样本库中不断的学习、训练出合理的模型,通过此模型智能检测异常数据“真伪”,做到报警更合理、更智能。
SuperMap iManager 融入人工智能技术,可对所有监控数据智能检测。智能报警功能自动获取GIS监控对象数据,利用内置模型定期对数据自动智能检测分析,并将分析结果记录在“报警历史”中,支持随时查看,检测流程如图1。各GIS监控对象设有独立模型,您可以使用系统默认模型,也可根据需求采集数据样本后创建新模型。
图1
在智能报警中,正/负样本采集与模型学习是拥有智能判断与进化能力的关键。正样本是GIS监控对象正常运行的数据,比如前文提到的日间访问高峰期产生的多次报警数据,可视为正样本;负样本是GIS监控对象运行异常的数据,比如夜间访问低谷期产生的异常报警数据;模型是根据样本库中大量正负样本训练出的算法逻辑。
系统提供了默认的检测时间,此外,智能报警还支持自定义时间段检测。检测时可通过监控类型、报警对象以及监控项筛选出被检测对象,同时可指定要检测的时间段。如图2所示,监控类型为通用监控,监控对象为sample,监控项为CPU,使用默认模型进行检测,红色标注代表检测后判断为异常的数据。
图2
图3
图4
图5
GIS智能报警利用AI技术,基于训练模型不断检测监控数据,将检测结果记录到报警历史中,便于GIS运维人员查看、分析。它弥补了静态阈值监控运维缺陷,可智能判断监控数据报警“真伪”。支持正/负样本添加、删除,模型不断完善更新,保证检测结果的准确性。
欢迎下载、体验SuperMap iManager产品。
下载请戳:
http://support.supermap.com.cn/DownloadCenter/ProductPlatform.aspx
作者 | 私有云产品部 王伊湋

