--- title: "灾难恢复" type: concept tags: [recovery, backup, dr] date: 2026-04-16 --- ## Definition 灾难恢复(Disaster Recovery,DR)是指在系统发生严重故障(如硬盘损坏、系统崩溃、自然灾害)后,恢复业务运营和数据完整性的过程。灾难恢复计划(DRP)是企业 IT 运维的关键组成部分。 ## Key Metrics - **RTO(恢复时间目标)**:系统允许的最大停机时间 - **RPO(恢复点目标)**:可接受的最大数据丢失量 ## Recovery Strategies ### Level 1: 文件级恢复 - 场景:单个文件丢失或误删除 - 方法:从备份目录直接拷贝恢复 - 工具:cp、rsync ### Level 2: 系统级恢复 - 场景:系统崩溃但能通过 SSH 访问 - 方法:反向执行 rsync,从备份恢复 - 命令:`sudo rsync -aAXz /mnt/nas_backup/daily_sync/ /` ### Level 3: 整机恢复 - 场景:硬盘完全损坏 - 方法: 1. 使用 [[Clonezilla]] 恢复系统镜像 2. 使用 [[rsync]] 同步最新的增量数据 3. 实现"时间点恢复" ## Best Practices 1. **3-2-1 备份原则**:3 份副本、2 种介质、1 份异地 2. **定期测试恢复流程**:确保备份可用 3. **自动化备份**:使用 [[定时任务]] 实现无人值守 4. **分层备份**: - 实时:rsync 增量备份 - 每日:全量备份 - 周期性:Clonezilla 镜像 ## Related Concepts - [[增量备份]]:日常数据保护手段 - [[RTO]]:恢复时间目标 - [[RPO]]:恢复点目标 ## Related Entities - [[Clonezilla]]:整机镜像备份工具 - [[rsync]]:增量同步工具 - [[NAS]]:备份存储目标