灾备运维与安全之运维管理制度
灾备服务商依据ISO27001、ISO9001、ISO20000等国际和行业标准以及最佳实践的要求,建立了一套制度化、流程化、标准化的数据中心运营管理体系,用以规范数据中心的日常工作,并持续稳定运行,该管理体系通过专业认证并在长期的实施运行中不断的持续完善,其框架如下图所示:
细化说明灾备运维管理制度,如下表所示
|
内容说明
|
管理制度总纲
|
是一个纲领性文件,主要明确和描述备份中心的职责、工作目标、主要原则和工作内容,并对岗位设置和岗位职责和主要的管理原则进行界定。
|
岗位职责描述
|
针对数据中心的工作特点,对所需完成的各类工作确定岗位,并对各岗位的职责、工作内容、工作规范和管理制度进行明确和描述。
|
工作规程和管理规定
|
对整个数据中心范围的工作内容和有关的管理规定和工作规范和流程进行说明和明确,如安全管理规定、系统变更管理规定、生产故障处理和管理规定、机房进入管理规定等各方面的管理规定和制度。
|
操作手册
|
对具体的工作过程和操作命令序列,如能建立技术说明和操作手册均应尽可能建立,特别对日常经常需要进行的操作和在紧急状态下的操作过程均应建立操作手册,以确保有关操作和过程正确无误和稳定可靠。
|
日志记录
|
对日常巡检监控、设备系统的操作维护、人员设备的进出等建立日志记录表格,进行提醒、记录和检查,每天的日志记录表格需要操作人员、操作领班、值班经理和有关人员进行记录、检查和复核,确保每天的工作有序的进行和可追踪。
|
月报/统计报表
|
对各项工作需要有一定形式的月报等统计表格,如每月基础环境运行、设备系统更新维护情况、系统故障统计、通讯线路和流量统计、系统验证等多项内容,对各项情况有及时的分析和汇总,并适当建立与前期的对比表格。
|
年度统计报表
|
对各项工作需要有一定形式的年报等统计表格,如年度基础环境运行、设备系统更新维护情况、系统故障统计、通讯线路和流量统计、系统验证等多项内容,对各项情况有及时的分析和汇总,为业主方提供评估和决策的依据。
|
灾备中心运维管理制度
灾难备份系统日常运营管理的好坏,对项目的成功与否有着致关重要的影响。灾难备份系统中的设备平时处于备援状态,当灾难发生时,为保证其能接替生产中心的运行,需要灾难备份系统具有非常高的可用性和可靠性;不仅如此,当数据中心面向灾难备份系统的IT运行环境、业务处理流程、操作规程等发生变化时,要求在灾备中心的灾难备份系统上及时响应并进行同步变更和处理;要做好以上各方面工作,必须在生产中心和灾备中心之间建立良好的互动机制。因此,建立一套与之相适应的运营管理制度,对于整个灾难备份项目而言是必不可少的关键工作。
以基于ITIL的完善的内部管理制度为基础,结合客户业务实际情况和灾备项目需求,将建立的与之相对应的服务管理接口制度包括以下内容
内容
|
说明
|
日常操作运行管理
|
建立灾难备份系统的日常操作规程,包括:
ü灾难备份系统日常监控操作流程
ü灾难备份系统日常操作手册
ü日常维护例行工作流程
ü运行记录及工作报表
|
事件管理
|
建立灾难备份系统的问题管理流程,包括:
ü事件的受理和记录流程
ü事件定级及知会流程
ü事件追踪及升级流程
ü事件处理结果反馈流程
ü事件的通知策略
ü与变更、问题管理的接口管理
|
变更管理
|
建立灾难备份系统的变更管理流程,包括:
ü灾难备份系统基准文档维护流程
ü信息系统的变更知会流程
ü信息系统变更评估确认及处理流程
ü业务连续性计划变更维护流程
ü与事件、问题的接口管理
|
问题管理
|
建立灾难备份系统的问题管理流程,包括:
ü问题的受理和记录流程
ü问题定级及知会流程
ü问题的处理流程
ü问题处理结果反馈流程
ü与事件、变更的接口管理
|
应急响应及恢复管理
|
建立灾难备份系统的应急响应管理流程,包括:
ü紧急响应流程
ü灾难恢复IT及工作环境检查清单
|
BCP维护管理
|
建立BCP维护管理流程,包括:
üIT基准维护管理流程
ü子系统验证管理流程
ü灾难恢复预案的分发、保存及版本及更新管理办法
|
安全管理
|
建立灾难备份系统安全管理规程,包括:
ü安全管理架构
ü备份中心物理安全管理制度
ü安全保密制度
ü网络安全管理流程
ü备份系统分级授权机制
ü磁介质管理制度
|

