
1、容灾项目的特性
①、需求无法提前计划,所有容灾的设计都是在持续优化和测试过程中不断发现新的需求;
②、容灾测试点相互交错复杂,并行测试难度高,测试效率低;
③、项目测试环境依赖较多,复杂度高;
④、项目研发涉及到的业务场景覆盖广,涉及人员多,测试数据准备工作量大;
⑤、测试难度较其他普通业务项目要求高,需要同步根据日志定位所有的测试场景出现原因。
2、容灾测试遵循的标准
①、模拟极端错误发生,测试业务恢复功能和业务持续性流程;
②、发现平台潜在的隐患,确保出线突发情况时平台能够正常运行;
③、在极端流量冲击下,牺牲一小部分非主要业务功能或者一小部分用户体验,保障整体系统的稳定以及主要功能的正常运行(分流、服务降级);
④、进行测试时,需要同步分析日志(确认当前展示的结果是否是因为容灾测试用例生效而出现的)。
3、容灾测试的要点
①、核心原则:基于业务影响分析,全面提高IT系统的抗风险能力;
②、关注两个重要指标:RTO(恢复时间)和RPO(数据丢失量);
③、做好三件事:数据传输、业务切换、容灾演练和监控;
④、实现操作系统、文件、数据库、应用四项恢复。

