恢复时间目标(recovery time objective,RTO)是你在系统故障给商业造成巨大影响之前,将系统恢复到在线状态所需要的时间。但是RTO不是进行有效的灾难恢复计划的唯一尺度。
除了要决定机构的RTO,你还必须确定可以接受的恢复点目标(recovery point objectives,RPO),这是衡量在系统故障严重影响业务之前,机构可能会丢失多少数据的尺度。
RPO不是一个新概念;保护数据就是灾难恢复(DR)计划的全部目的。但是,很多公司的主管人员——甚至是一些技术人员——并不了解他们当前的RPO是什么,或者RPO应该要怎么样才能够保护其机构。
一般来说,只用根据公司所能够承受的数据丢失量就能够确定你所在机构的RPO。公司一般都以数据时间的形式来表示这种尺度。
例如,很多基于磁带的DR系统有至少24小时的RPO。尽管我们可以保证丢失更少的数据,但是最差的情况会是没有人及时进行每天的备份。
所以如果你在一天结束的时候碰到了灾难,而你还没有完成磁带备份(这是一个很不幸、但也不常见的情况),你就会丢失一个工作日的数据。
机构需要确切地确定它能够承担在一次灾难中丢失多少数据,这一点是至关重要的。一个机构要如何确定这个数量则是艺术和科学的结合,其方式就和确定RTO数量一样。
首先,到所要考察的数据系统的用户以及这些领域的管理层去,询问在灾难发生的时候他们能够承受的数据丢失量。就像我上周提到过的那样,你得到的答案几乎总是不切实际的;典型的回答更有可能是“零数据丢失”。
尽管实现这个RPO是有可能的,但是所需要的巨大的基础结构、带宽和软件成本使它只能够用于极度昂贵数据,而不能用于所有的情况。如果确实需要“零数据丢失”,那就要用心了——有多种DR计划可以选用,但是要记住的是:大多数都需要大规模、基于硬件的复制系统,而且需要光纤连接。
如果你能够协商获得一个更加灵活的RPO,那么在不同价位就有多种选择。基于软件的复制系统、基于硬件的镜像、Business Continuance Volume(BCV)和其他记录工具,以及无数基于磁带的系统都是可选的。
你可以混合使用或者匹配使用这些类型的系统,以创建能够满足从几分钟到多个小时RPO的要求。你还可以将其中的许多(方案)应用到单个的数据系统上,这样就能够获得不同的能力,以处理有不同RPO要求的不同系统。
此外,你可以将这些系统中的很多种(甚至是基于硬件的复制工具)与基于磁带和其他时间点复制系统组合起来,为每个系统创建多个DR级别。例如,如果有一个病毒毁掉了你复制的拷贝,那么从磁带上恢复的时间点拷贝可能就无法满足RPO,但是它们至少允许尽可能地多恢复一些数据。
RPO数量是需要正确定义和量化的、但是比较难以处理的多个尺度之一。然而,你对RPO的估计将会决定你机构能够使用的DR解决方案的类型——以及你的DR解决方案最终将花费的资金。