RPO (Recovery Point Objective)

RPO (Recovery Point Objective) 是指系统发生故障时，能够接受的最大数据丢失量。它衡量的是数据保护程度——从故障时刻向前追溯，可接受丢失多长时间的数据。

Definition

"RPO is about protecting data. It's measured backwards from the moment of failure." — LaunchDarkly

RPO 是灾备规划的核心指标之一，与 RTO（恢复时间目标）共同构成灾备目标体系。

维度	说明
衡量对象	数据丢失量（Data Loss Amount）
测量方向	从故障时刻向后（Backwards）追溯
关注点	数据完整性（How Much Data Can Be Lost）

如果数据库在下午 3 点崩溃，而最后一次备份是下午 2 点，则：

RTO 和 RPO 衡量的是不同维度，必须同时优化：

场景	RTO 目标	RPO 目标	说明
电商结账	2 分钟	0 秒	必须快速恢复，且不能丢失任何交易
用户分析面板	30 分钟	1 小时	停机可接受，小时级数据丢失也可接受
内部 CRM	4 小时	15 分钟	停机可绕过，但近期客户更新很重要
博客/营销站	2 小时	24 小时	访问者可以等，丢失一天评论可接受

关键：不能只优化其中一个指标。

传统回滚（Full Deployment Rollback）在回滚过程中可能丢失新事务数据。而 Feature Flag 回滚不丢失数据：

Tier	场景	RPO 目标	说明
Critical	支付处理、交易系统	< 1 分钟	不能丢失任何金钱相关数据
Important	CRM、客户支持	< 15 分钟	近期客户更新不可丢失
Nice-to-have	文档站、内部工具	< 1 小时	数据可重建或接受丢失

最佳实践是同时设定 RTO 和 RPO，并将 Feature Flag / Kill Switch 纳入灾备工具链：