摘 要: 连续数据保护作为一种全新概念的灾难备份与恢复技术,具有广阔的发展前景。探讨了连续数据保护技术的概念、原理及特点,并对其发展方向做了一定的思考。
关键词: 灾难备份;恢复技术;连续数据保护
随着信息技术的发展,企业、政府等部门对信息系统的依赖日益加深,人们对信息系统的不间断运行能力及面对突发事件时的信息安全也提出了更高的要求。因此,灾难备份与数据保护技术成为人们关注的焦点。
1 灾难备份与恢复技术
根据中国国家标准GB/T20988-2007的定义,灾难是指由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受,达到特定时间的突发性事件[1]。灾难备份与恢复技术也叫业务连续性技术,它能够在灾难发生时,保证数据的可用性,并且在规定的时间内恢复系统的正常运行。
传统的灾难备份与恢复技术大体可分为两类:
(1)磁带备份技术。备份和恢复效率低,备份时间点不能过于密集,一般的备份计划是每周全备,每日增量备份,若发生灾难,将丢失当日未备份资料。但是磁带备份技术成本低廉,实施简便,介质便于异地长期保存,适合归档数据,备份整个系统。
(2)数据复制技术。主要有基于主机、存储、交换机、数据库等几种方式,复制技术实施成本较高,但技术成熟,复制和恢复效率也高,可以满足实时同步复制的要求,也可以做到远程复制。
传统的灾难备份与恢复技术已经在各个行业的信息系统中得到了广泛应用。但是,由于传统灾难备份与恢复技术固有的局限,无论磁带备份还是数据复制技术,都只能抵抗对数据的物理损坏,如磁盘的失效,文件系统的破坏等。而对于数据的逻辑损坏,如数据库或者文件中有错误的数据,传统的灾难备份与恢复技术则束手无策。当发现系统数据有错误时,采用磁带备份的系统,虽然有着多个恢复点可用,可以恢复到最近的正确备份点,但势必丢失大量的有用数据,代价巨大,已经失去了灾难备份的意义。而数据复制技术本质上只有一个恢复点即最近的停止备份时刻,复制的数据副本中必然也存在着同样的数据逻辑错误,根本无法恢复。
2 连续数据保护的概念及实现原理
2.1 连续数据保护概念的提出
传统灾难备份与恢复技术的根本局限在于只建立了1个或时间粒度较粗的几个恢复点,没有就每次数据的改变建立恢复点,若能针对数据的每次改变,都建立恢复点,则可以实现无损的数据恢复。连续数据保护CDP(Continuous Data Protection)的概念就是基于这一思想提出的。全球网络存储工业协会SNIA(Storage Networking Industry Association)对连续数据保护的定义[2]是:持续的追踪、捕获数据的变化并保存变化日志,以便恢复到之前的任意时间点。由此定义可以看出,连续数据保护并非一种具体技术,而是一个要达到的目标,只要能达到这个目的的任何方法、技术,均可称为连续数据保护技术。
2.2 连续数据保护的实现原理
连续数据保护并非对数据的变化进行简单的复制,而是对数据的每个变化记录日志或者编制索引,可以说,数据的每次变化,都会在CDP设备中保留一个备份版本,也只有这样,才能够将数据恢复到过去任意一个时间点。
为了实现不间断地捕捉数据的变化,通常的方法是在写磁盘时,对备份源和备份目标的数据进行比对,这种比对可以是基于档级的,也可以是基于磁盘块级别的,甚至可以是基于比磁盘块更小的粒度级别的。如美国飞康等公司的CDP设备,就可以在磁盘块大小为4 KB的情况下,将磁盘数据比对的粒度定为512 B。数据比对的粒度越大,比对操作所占用的系统资源越小,但备份源和备份目标之间的数据差异也越大,需要传输的数据量也越多;相反,数据比对的粒度越小,则比对操作所占用的系统资源就越大,但备份源和备份目标之间的数据差异也越小,需要传输的数据量也越小,这对于带宽较小的远程备份较为有利。
2.3 连续数据保护技术的优势
相对于传统的灾难备份与恢复技术,连续数据保护这一全新的技术有着以下优势:
(1)连续数据保护技术可以提供粒度无限精细的恢复点,因为数据的每次变化都被记录,所以从理论上来说,数据可以恢复到任意时间点。而传统灾难备份与恢复技术的恢复点时间粒度较粗,只能是少数几个用户定义的备份时间点。这也是连续数据保护技术最大的概念性突破。
(2)连续数据保护技术的备份目标区可以同时设置多个,如CDP设备的本地磁盘、文件服务器、网络接入设备(如NAS等)、CDP管理服务器等均可同时作为备份目标区,而传统灾难备份与恢复技术的备份目标区一般只能对应1个。
(3)连续数据保护技术强调快速的恢复能力,而传统灾难备份与恢复技术则侧重备份。对于CDP设备来说,备份是自动进行的,数据的每次变更都会触发保护操作,不需要人工干预,在灾难发生时,CDP支持瞬间恢复及快速故障切换,数据的恢复既可以由管理员来完成,也可以允许最终用户进行恢复。传统灾难备份与恢复技术侧重于对备份过程及备份数据的管理,管理员需要关注如备份窗口、备份周期、备份介质的保管等诸多问题,而在灾难发生时,却很难提供快速简便的恢复能力。
(4)连续数据保护技术可以同时提供多重灾备手段,比如CDP设备可以在向远程目标区复制数据的同时,将自身的存储空间和主机磁盘组成RAID1镜像,而此RAID是建立在逻辑存储层,所以主机磁盘原有的RAID丝毫不受影响。传统的灾难备份与恢复技术一般情况下只能提供一重保护。
3 连续数据保护的发展方向
各家厂商的解决方案在实现方法及产品功能上不尽相同,连续数据保护技术本身及其实现方案也在不断地完善发展当中。随着人们对数据备份及恢复需求的提高及软硬件技术发展,连续数据保护将在以下几个方面不断地发展。
3.1 连续数据保护技术本身的完善
连续数据保护技术的重点在于对数据变化的比对、索引、记录、压缩和传输,在这几个方面寻求更高效的算法,以提高数据备份及恢复的效率和可靠性,降低主机及网络等资源的占用,将是连续数据保护技术的主要改进方向。
3.2 连续数据保护产品的优化改进
目前,常见的CDP设备均是由X86服务器附加大容量的存储设备组成硬件,以Linux操作系统上运行的专用软件来提供数据保护能力,优点是硬件及操作系统技术成熟,厂家的重点放在了提供连续数据保护的应用软件上面,不足之处是CDP设备系统软件和硬件均未针对数据保护和存储做深度优化,这在一定程度上限制了CDP设备功能和性能的发挥。若能在硬件和系统软件层面针对数据存储和传输加以改进,则能大大提高CDP设备的可靠性和工作效率。
3.3 连续数据保护技术与传统灾备技术的整合
传统的灾难备份与恢复技术已经发展得较为成熟,与连续数据保护技术相比较,在对特定应用环境的适应性、性价比等方面,也具有自身不可替代的作用,而对于有些特殊的要求,CDP设备也难以满足,因此,将连续数据保护技术产品与传统灾难备份与恢复方案相整合,与此同时,使连续数据保护和传统灾难备份与恢复技术相互吸收融合,取长补短,将可以形成更为完善的灾难备份与恢复解决方案,能最大限度满足客户需求。
连续数据保护技术,其产品正在各个行业快速普及,这种思想新颖、特点鲜明的灾难备份与恢复技术为用户宝贵的信息资源提供了前所未有的保护与恢复能力。
参考文献
[1] 中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.信息安全技术信息系统灾难恢复规范(GB/T 20988-2007)[M].北京:中国标准出版社,2007.
[2] Storage Networking Industry Association. Continuous Data protection-solving the problem of restoration. http://www.snia.org/forums/dmf/knowledge/white_papers_and_reports/CDP_Solving_recovery_20080808.pdf.
[3] 范昊,彭超.持续数据保护技术的研究[J].科技资讯,2006(31):11-12.
[4] 颜军.飞康CDP,挑战传统灾备技术[J].金融电子化,2008(10):28.
[5] 刘旭辉.华为3COM税务连续数据保护CDP解决方案[J].军民两用技术与产品,2006(6):35-36.