作为数据保护手段之一,数据复制技术正在被越来越多的机构所采用。随着时间的发展,数据复制已经演进成灾难恢复(DR)的不可缺少的组成部分,能够比传统的磁带备份提供更短的恢复点目标(PRO)和恢复时间目标(RTO)。
并非所有的复制都是一样的
从宏观上看,数据复制将来自一个存储位置的数据拷贝到一个或更多的其它本地或远程存储系统。但是,跳出这种基础任务之外,你会发现数据复制产品在几个关键方面是不同的:位置:复制发生的位置是主要差别之一。复制服务或软件可以运行在存储阵列上、网络中或主机(服务器)上。不过,基于阵列的复制一直统治着数据复制市场。
IDC存储软件研究经理James Baker说:“我们最近进行的一项研究显示,在2007年,基于存储的复制的全球收入中,83.7%是利用阵列到阵列的复制实现的,随后依次为基于主机的复制(11.5%)和基于网络的复制(4.8%)。”但是这一研究同时显示,基于主机和基于网络的复制正在追赶上来。到2012年,基于主机的复制预计将以18.2%的年复合增长率(CAGR)增长,而基于网络的复制预计CAGR将达到15.4%.这两类技术的预测增长速度大大高于基于阵列的复制10%的预测年增长率。
模式:有同步复制与异步复制两种:复制可以同步发生,数据同时写入到主和次级存储系统;或者可以异步执行,数据经过延时后复制到复制目标。
在同步复制中,主存储系统只在复制目标确认数据被成功写入后才执行I/O写。同步复制取决于充足的带宽和低延时,支持的复制距离从50公里到300公里。它一般在要求零RPO和RTO的应用(如高可用群集和要求主系统与目标系统之间100%同步的关键任务应用)中使用。相反,异步复制首先将数据写入主阵列,并且根据实现方法,将数据复制到内存或基于硬盘的日志中。然后它实时或按照计划的间隔将数据拷贝到复制目标。与同步复制不同,异步复制设计用于长距离复制,并大大降低了带宽要求。大多数基于阵列和基于网络的复制产品同时支持同步和异步复制,而基于主机的复制产品通常只提供异步复制。
类型:复制产品可以复制卷或逻辑设备号(LUN)上的数据块,或者执行文件级的复制。除了可以同时支持基于块和基于文件的复制的网络连接存储(NAS)外,基于阵列的复制产品通常运行在块级上。基于网络的复制产品也是如此。相比之下,多数基于主机的复制产品运行在文件级上。基于块的复制独立于平台,可无缝地跨不同操作系统运行。基于文件的复制产品高度依赖于特定操作系统,市场上的多数基于主机的复制产品是用于Windows操作系统的。与基于文件的复制不同,基于块的复制产品对连接的平台、文件系统或应用一无所知,它们依靠像快照这样的辅助服务实现任何类型的应用集成。因此,多数支持复制的存储阵列还提供或多或少与文件系统和像Exchange 与SQL Server数据库这样的关键应用集成的快照功能。
基于阵列的复制
在基于阵列的复制中,复制软件运行在一个或多个存储控制器上。这项技术在大中型公司中最为流行,这主要是由于规模更大的公司部署了提供数据复制特性的更高端的存储阵列。
具有15年以上历史的基于阵列的复制是最成熟和经过实践证明的复制方法,其可伸缩性只受到阵列的存储控制器的处理能力的限制。EMC复制解决方案产品营销经理Rick Walsworth解释说:“客户通过将数据复制分布到更多数量的存储处理器上来扩展我们的Clariion和Symmetrix阵列的复制性能。”
由于复制软件安装在阵列上,它非常适合拥有大量服务器的环境,原因如下:它独立于操作系统;能够支持Windows和基于Unix的操作系统以及大型机(高端阵列);许可费一般基于存储量而不是连接的服务器数量;它不需要连接的服务器上的任何管理工作。由于复制工作被交给存储控制器来完成,因此避免了服务器上的处理开销,从而使基于阵列的复制非常适合关键任务和高端交易应用。
基于阵列的复制的最大劣势是其缺少对异构存储系统的支持。除非阵列提供存储虚拟化选择――如HDS(Hitachi Data Systems)为其Universal Storage Platform (USP)所做的那样――基于阵列的复制通常只能在类似机型的阵列之间发挥作用。除了高度的厂商锁定外,基于阵列的复制的入门费用也比较高,它可能对于必须支持大量不同位置的公司来说尤其昂贵。总的来说,基于阵列的复制最适合统一采用一家存储阵列厂商产品的公司。
HDS公司业务连续性解决方案和产品营销高级经理Christophe Bertrand说:“由复制目标拉取而不是由源来推送的基于硬盘的变化日志的组合,使它极具可恢复性,能够自动从长时间的破坏中恢复。由于变化是由复制目标阵列拉取的,消耗的宝贵的处理时间由主阵列转移到了次级目标阵列。”
基于主机的复制
在基于主机的复制产品中,复制软件运行在服务器上,不依赖额外的硬件组件。这就使基于主机的复制成为部署起来费用最低廉和最容易的复制方式。
Double-Take Software公司解决方案工程主管Bob Roudebush指出:“部署基于主机的复制只需要把复制软件安装在源和目标服务器上就行了。”
大多数基于主机的复制产品都支持Windows,但对Linux和Unix的支持较为薄弱,因此平台支持显然是选择基于主机的复制产品时的关键评估标准之一。
在缺点方面,基于主机的复制给服务器增加了额外开销,安装的复制软件带来了引入未知行为的风险。Enterprise Strategy Group分析师Lauren Whitehouse说:“对于关键和高端应用服务器,IT经理一般更偏爱基于阵列的复制,而不是基于主机的复制,因为前者将服务器资源留给了应用,并且不会使服务器暴露于复制软件存在的潜在隐患和漏洞。”
此外,许可费用和系统管理任务随服务器的数量成比例增加,从而使基于阵列的和基于网络的复制在拥有大量服务器的环境中具有了优势。此外,基于主机的复制中的可见性通常限制在源和目标服务器。这与基于阵列的和基于网络的复制产品的中央架构非常不同,后两类产品使用户可以更加整体地了解复制基础设施。
基于主机的复制产品的目标市场一般是用不起另两种费用更贵的复制技术的中小企业。CA、Double-Take、InMage Systems、Neverfail和SteelEye Technology都在提供基于主机的复制产品,可使小公司以很少的成本实现DR和数据保护。虽然这类产品中的每一种产品都把数据从一个位置复制到另一个位置,但它们在效率、带宽节流、管理、高可用性故障切换能力、支持和应用集成等特性上是不同的。只有全面的评估才能了解哪种产品最适合某个环境。
除了这些独立的产品外,备份软件厂商也在把基于主机的复制集成到他们的备份套件中,希望把他们的产品扩展到利润丰厚的远程办事处和分支办事处数据保护业务中。
Symantec公司数据保护部产品营销高级经理Marty Ward说:“我们看到DR与数据保护的融合,我们认为数据复制能力是一种特性而不是独立产品。”多数备份软件厂商已经在为他们的备份套件提供基于主机的数据复制选件;一些例子包括:BakBone Software Inc的NetVault: Real-Time Data Protector; CommVault Continuous Data Replicator (CDR); 补充EMC NetWorker 的EMC RepliStor; Symantec Backup Exec Continuous Protection Server (CPS); 以及作为独立产品和NetBackup 选件的提供数据去重选件的Symantec NetBackup PureDisk.将传统备份与复制组合在一起的优势是在一个工具中管理复制和备份的能力。除了基于他们的基于主机的复制选件外,备份软件厂商一直在为把他们的备份套件与领先的基于存储阵列和基于网络的复制产品集成而努力,以使客户能够利用同一个工具管理所有的复制和备份。
CommVault公司产品管理副总裁Brian Brockway说:“正如在使用Continuous Data Replicator那样,所支持的阵列的基于阵列的复制被集成到备份应用索引和目录中,从而使用户只需在我们的应用中点击右键就可恢复基于阵列的快照。”同样,Symantec的Veritas NetBackup与40多种阵列和虚拟磁带库(VTL)集成,EMC NetWorker提供与EMC的RecoverPoint基于网络的复制产品的紧密集成。
基于网络的复制
在基于网络的复制中,复制发生在存储阵列与服务器之间。I/O在联机专用设备或光纤通道(FC)结构中被分离;I/O分流器分析入站的写I/O的目的地址,如果地址是复制卷的组成部分,则将这次I/O的副本转发给复制目标。基于网络的复制集基于阵列的和基于主机的复制的好处于一体。通过卸载服务器和阵列的复制工作负载,它可以跨大量的服务器平台和存储阵列运行,因而使它成为高度异构的环境的理想选择。多数基于网络的复制产品还作为选件或核心产品的组成部分,提供存储虚拟化。
当前的基于网络的复制产品要么为联机专用设备或是基于结构的。在使用联机专用设备时,所有的I/O都必须经过这种复制设备。从技术上讲,专用设备结束所有的入站I/O,然后发起转发给主存储和(在写I/O时)复制的存储目标的新I/O.这种联机方式一直受到性能和可伸缩性问题的困扰。IBM的SAN Volume Controller (SVC)是联机专用设备的典型代表。
可伸缩的架构和大量的缓存不仅使它可以突破性能和可伸缩性限制,而且在联机方式与更复杂的基于结构的实现方式相比较的简单性的帮助下,联机专用设备已成为基于网络的复制和虚拟化市场中成功产品之一。
在基于结构的(fabric-based)复制产品中,I/O的分离和转发在FC结构中执行。通过利用FC交换和把数据通道与控制通道分离,它成为性能最好的和最具可伸缩性的方式。大多数基于结构的复制产品运行在来自Brocade和Cisco的智能交换机上。尽管Brocade和Cisco都提供用于本地数据中心复制的数据移动管理器(DMM),但EMC和FalconStor Software等第三方厂商提供运行在Brocade和Cisco智能交换机上的更先进的基于结构的复制产品。EMC RecoverPoint就是这样的产品,它提供基于结构的、异步连续数据保护(CDP)以及与相当的基于主机的CDP产品不相上下的应用集成。虽然具有显而易见的好处,但基于结构的复制却没有得到很多的采用。StorageIO Group创建人、高级分析师Greg Schulz说:“基于交换机的复制和虚拟化被过度宣传了,但有人在做它,随着时间的发展,它将变成更普及。”
LSI的StoreAge存储虚拟化管理器(SVM)跨越了联机专用设备与依靠昂贵的智能交换机的基于结构的产品之间的界线。SVM与LSI的数据路径模块(这种模块插在已有的光纤通道交换机上,执行基于交换机的转发,它消除了对智能交换机的需要)的组合集IBM SVC的简单性与分离通道架构的性能和伸缩性于一体。HP似乎也这样认为,将LSI产品作为HP StorageWorks SAN虚拟化服务平台(SVSP)提供,用网络的复制和虚拟化产品来补充它的基于主机和基于阵列的复制产品。
虽然基于阵列、主机和网络的复制产品的市场份额将随着时间发展变化,但市场中将存在这三种方式的相应位置。尽管每一种方式都具有它自己的优缺点,但特定的环境和情况将最终确定复制应当发生在何处。
编看编想:
如何选择数据复制解决方案?
数据复制技术的发展正在逐渐改变数据保护和灾难恢复,基于复制的数据保护的使用正在增加,并将与传统的数据保护融合,更好地帮助企业实现备份。
此外,随着存储服务化和云计算的流行,托管的复制服务将变得更普及。基于复制的数据保护将成为保护虚拟化的服务器环境的重要选择。
选择数据复制解决方案要从几方面着手:首先,应从业务影响分析入手,来确定所需要的恢复时间目标(RTO)和恢复点目标(RPO)。对于不能接受数据丢失(RTO等于零)的应用,则需要同步复制。请注意同步复制的延时,因为它将拖累应用I/O的性能。如果存在任何延时风险或不可靠的带宽,或是对于超过一定距离(50到300公里)的复制,异步复制是比较理想的选择。
除了复制模式外,应用性能也会受到复制平台的影响。基于主机的复制会与应用争夺宝贵的处理器、内存和I/O资源。用户需要了解数据复制对带宽的需求、对带宽费用的影响以及会给其它应用和用户造成什么影响,可考虑采用广域网(WAN)优化设备来保持带宽。
此外,支持异构环境的复制产品由于支持较便宜或老阵列,可以大大降低成本。它们还限制了厂商锁定。
总而言之,用户应该根据自己的需求,综合比较,选择最适合自己的数据复制产品。