培训方案
(企业级・2 天实战版)
一、培训对象
数据库运维工程师(3 年 + 经验)、后端开发工程师(熟悉 SQL)
二、培训目标
1. 高可用实战:掌握企业级高可用架构设计,完成流复制部署、故障转移全流程,规避 90% 以上的生产级故障(如某银行核心系统 7×24 小时无中断案例)。
2. 性能优化:精准定位慢查询根源,通过参数调优、索引设计、分区策略,使电商订单查询性能提升 80%(某头部电商大促真实优化案例)。
3. 问题解决:实战演练内存溢出、锁竞争、IO 瓶颈等生产故障,输出可落地的《性能问题排查手册》。

三、培训方法
· 案例驱动:10 + 企业真实案例(金融 / 电商 / 物流),如某物流平台跨机房故障转移 45 秒恢复、某支付系统锁超时优化。
· 全真实操:基于 Docker 搭建集群环境,学员独立完成「流复制配置→压测→故障注入→性能调优」全链路操作(提供含 1000 万条数据的测试库)。
· 分组对抗:模拟生产突发场景(如主库宕机、慢查询激增),小组竞赛输出解决方案,讲师现场点评。
四、培训大纲
第一天:高可用架构实战(9:00-18:00 + 19:00-20:00 晚自习)
上午:高可用核心技术(理论 + 案例,3 小时)
· 案例导入:某金融系统因备份策略缺陷丢失 2 小时交易数据(行业痛点)
· 模块 1:高可用体系
o 核心概念:RTO/RPO 在企业中的真实定义(如银行要求 RTO<30 秒)
o 备份实战:物理备份(pg_dumpall + 压缩)vs 逻辑备份(pg_basebackup),企业级备份策略设计(每周全备 + 每日增量 + 实时归档)
· 模块 2:流复制与热备
o 配置实操:主从流复制一键部署(含 pg_hba.conf 安全配置)
o 故障演练:模拟主库断电,手动 / 自动故障转移(基于 pg_receivewal+patroni)
下午:故障转移与集群管理(实操 + 案例,3 小时)
· 案例实战:某电商双活集群跨机房同步延迟排查(真实 SQL 日志分析)
· 模块 3:故障转移机制
o 手动 failover:数据一致性校验(pg_isready+LSN 对比)
o 自动工具:patroni 配置(角色选举、重试策略)
· 模块 4:生产级集群部署
o 演练:3 节点流复制集群搭建(含 VIP 漂移、负载均衡)
o 防坑指南:网络分区、脑裂场景模拟与解决方案
晚自习:高可用场景复盘(1 小时)
· 分组复盘上午案例,输出《高可用巡检 checklist》
第二天:性能优化全链路实战(9:00-18:00 + 19:00-20:00 晚自习)
上午:性能诊断与参数调优(理论 + 实操,3 小时)
· 案例导入:某物流系统订单查询从 1.2 秒优化到 80ms(索引 + 分区组合拳)
· 模块 5:性能瓶颈定位
o 工具实战:pg_stat_statements 分析慢查询,pg_blocking_pids 定位锁竞争
o 硬件调优:SSD vs HDD 在 PostgreSQL 的 IOPS 差异(压测数据对比)
· 模块 6:配置参数调优
o 黄金参数:work_mem(按查询场景动态设置)、shared_buffers(60% 内存法则)
o 演练:根据业务场景(OLTP/OLAP)修改 postgresql.conf,压测验证效果
下午:查询优化与架构设计(实操 + 竞赛,3 小时)
· 案例实战:某支付系统交易表(5 亿行)分区优化(范围分区→哈希分区)
· 模块 7:查询性能手术刀
o EXPLAIN ANALYZE 深度解析:索引扫描 vs 顺序扫描决策逻辑
o 反模式优化:避免 SELECT *、优化 JOIN 顺序(电商订单 - 用户表 JOIN 案例)
· 模块 8:表结构与缓存管理
o 分区实操:按时间分区订单表,查询性能提升 400%(附 SQL 模板)
o 连接池配置:pgBouncer 会话池优化(某企业连接数从 2000→500 的资源节省)
晚自习:综合实战(2 小时)
· 全真模拟:给定某电商大促场景(含慢查询、锁超时、内存溢出),小组协作完成:
0. 诊断问题根源(提供 pg_stat 监控数据)
1. 编写优化方案(含 SQL 改写、参数调整、索引设计)
2. 现场演示优化效果(压测对比)
五、交付物
1. 《企业级 PostgreSQL 高可用部署手册》(含配置模板、故障预案)
2. 《性能优化 SQL 案例集》(50 + 生产级优化前后对比)
3. 实战环境镜像(含测试数据、监控脚本,可直接用于企业演练)
六、执行说明
· 环境准备:每人 1 台 Linux 虚拟机(预装 PostgreSQL 15、pgbench、Docker)
· 师资要求:5 年以上 PostgreSQL 实战专家,主导过 3 个以上企业级优化项目
· 考核方式:实操通过率 100%,案例复盘报告评分(聚焦可落地性)

