备份与灾难恢复

不怕一万,只怕万一。

灾难(Disaster)是小概率但高影响的事件:地震、火灾、数据中心级别的故障。虽然发生概率低,但一旦发生,如果没有任何准备,业务将遭受毁灭性打击。本模块详解 RPO/RTO 规划、备份策略、多活架构和灾难恢复计划,帮助你为最坏情况做好准备。

模块结构

基础概念

文章核心问题
灾难恢复概述灾难恢复的完整体系
RPO允许丢失多少数据
RTO允许中断多长时间
RPO/RTO 权衡如何在成本和风险间平衡

备份策略

文章核心问题
备份策略概述备份的完整策略
全量/增量/差异备份类型对比
冷/温/热备份备份介质选择
备份工具Velero/Restic/Xtrabackup

容灾架构

文章核心问题
多活架构多地多活设计
主备架构Active-Standby 模式
双活架构Active-Active 模式
单元化架构单元化设计思路
单元化设计单元化的实现
灾难等级不同级别的应对策略

实践

文章核心问题
切换演练如何定期演练
数据同步主从同步技术
成本分析容灾的成本权衡
灾难恢复计划如何编写 DRP
合规要求合规与审计

核心概念

flowchart LR
    A["RPO\nRecovery Point Objective"] --> |"允许丢失多少数据"| B["备份频率决定"]
    C["RTO\nRecovery Time Objective"] --> |"允许中断多长时间"| D["恢复能力决定"]

RPO/RTO 规划

业务类型RPORTO架构要求
核心业务(支付)分钟级分钟级实时同步 + 多活
重要业务(订单)小时级小时级准实时 + 主备
一般业务天级天级每日备份
归档数据周级周级冷备份

容灾架构演进

flowchart TD
    A["无容灾"] --> B["本地备份"]
    B --> C["异地备份"]
    C --> D["主备架构"]
    D --> E["同城双活"]
    E --> F["两地三中心"]
    F --> G["全球多活"]

    style A fill:#ffcdd2
    style G fill:#c8e6c9

准备好开始了吗?从灾难恢复概述开始。