构筑灾难备份系统延续企业生命
发布时间:2005年01月04日点击数:
作者:周涛 来源:世界计算机
摘要:
在当今的信息社会里,保持企业计算机系统的高可用性面临着严峻的挑战,恐怖事件、自然灾害(地震、火灾、洪水、雷电、飓风)、人为因素都有可能导致企业信息系统的瘫痪,毁灭关键业务数据。在企业对信息的依赖性越来越强的今天,数据已成为企业的生命源泉。
周涛,毕业于哈尔滨工业大学计算机科学与技术学院计算机科学与技术专业、硕士学位。现就职于中国工商银行数据中心、高级工程师、项目经理、长期从事金融科技工作。发表有《数据中心的起搏器》、《如何跨越异构平台》、《多功能自助终端系统的设计与实现》等多篇著作和论文,现主要关注于电子银行、证书安全方面的发展和研究。
一项调查表明,因灾难而丢失关键数据并且在几天内不能恢复关键业务的企业将会从市场上消失。对于依赖计算机系统运作的金融、电信、保险、民航、铁路和制造业而言,系统停机的可忍受时间更短。在“9·11”恐怖事件造成世贸大楼倒塌后,名列财富500强的金融机构摩根斯坦利公司在新泽西州灾难备份中心立刻切换运行,从而保障了公司全球业务的不间断运行,有效降低了灾难对于整个企业发展的影响,而很多没有建立灾难备份系统的企业却没有这样幸运。
在国内的金融领域,数据的灾难备份是业内广泛关注的一个热点。在一些中小型银行、证券机构和一些省级分支机构有实现存储级灾难备份的,此外,招商银行通过外包形式把灾备中心交给了IT公司。对于全国性的大型数据中心,到现今为止,还没有建立起真正意义上保证业务持续运转的灾备中心。
灾难备份之前要做什么
从概念上讲,灾难备份是指通过技术和管理的途径,确保在灾难发生后,企业的关键数据、数据处理系统和业务在短时间内能够恢复的过程。因此,在实施灾难备份项目之前,企业首先要分析哪些数据最重要,哪些数据要做备份、容灾,这些数据价值多少,再决定采用何种形式的灾难备份。灾难备份系统有不同的灾备层面,资金投入相差很大。在搭建灾难备份系统之前,需要考虑投入产出比。比如,要建立有备份主机的远程磁盘镜像,就要求灾难备份中心配备与生产中心性能匹配的全部专用设备,还要建设高成本的宽带网络,投入相当昂贵,只有金融、电信、民航、铁路等对信息实时性要求很强的行业才有必要采用。而对于信息技术依赖性不高的中小企业,重点考虑的是数据的存储备份。
建设灾难备份系统的目的是保证数据中心业务的高度持续性,所以建设数据中心是实施灾难备份中心的前提。对于已建立数据中心但没有灾难备份中心的企业,规划启动灾难备份系统已经迫在眉睫;对于有规划但还没有完成数据集中的企业,要提早考虑灾难备份系统。应用整合也是建设灾难备份系统的前提条件之一。软件运行平台的统一,设备选型的一致,应用版本的规范,相关应用的整合,都会大大减少灾难备份系统的实施难度,缩短实施工期,提高灾难备份系统的可靠性。
建立灾难备份系统同时,还要考虑建立完善的管理机制,最大限度地发挥好灾难备份系统的作用。据调查显示,灾备系统的40%故障率来自人为因素,另40%的故障源于应用系统故障,而只有20%的故障是由于火灾、水灾、地震等天灾造成的。所以保障灾备系统的长期稳定运营在于完善的管理机制,需要尽早建立灾难预防制度和灾难演习制度。因此,对于实施灾难备份系统的企业来说,要想真正发挥其作用,完善的管理机制不可或缺。
灾难备份不是简单的数据恢复
显然,灾难备份不等同于一般意义上的业务数据备份与恢复,数据备份恢复只是灾难备份中涵盖的一个方面。灾难备份系统还包括最大范围地容灾、最大限度地减少数据丢失、实时切换、短时间恢复等多项内容。可以说,灾难备份正在成为保护企业关键数据的一种有效手段。
灾难备份系统的核心技术是数据复制。目前数据复制的主要方式有同步数据复制和异步数据复制两种。同步数据复制是指对业务数据进行实时复制,数据中心和备份中心之间保持数据互为镜像,保持完全一致。这种方式实时性强,灾难发生时远端数据与本地数据完全相同,可以达到数据的零丢失,保证高度的完整性和一致性。同步数据复制的原理是每一个I/O写操作都需要等待远程复制完成后才释放,因此会对主机工作效率有一些影响。从传输距离上说,同步复制对网络延迟有严格的要求,数据传输距离较短,数据中心和备份中心的距离一般只能是几十公里。
异步数据复制是将本地生产数据通过后台同步的方式复制到异地。这种方式可能有分钟级的短时数据丢失,很难达到零数据丢失。异步复制的原理是对本地主卷写完成后,不必等待远程二级卷的写完成,主机立即可处理下一个I/O。因此,对本地主机性能影响很小。从传输距离上说,异步数据复制可以使用信道扩展器或其他技术,使传输距离延长,能够达到几千公里。
选择同城灾备还是异地灾备
那么,对于金融企业来说,究竟应该如何选择何种复制方式呢?换句话说,企业应该采取何种灾难备份的建设方案呢?
一般来说,企业需要结合自己的容灾目标和实际情况来考虑。如果系统性能是最优先的考虑对象,能够接受备份中心数据更新的较小延迟,就可以考虑采用异步数据复制方式。如果避免数据丢失是最优先的考虑,生产主机的工作负载能够承受同步拷贝带来的性能损失,运行中心和备份中心的距离不超过100公里,那就可以考虑采用同步数据复制方式。当然,对于数据宝贵、安全性要求高、依赖信息技术强和有保证高度业务持续性要求的大型企业,应该考虑两种方式的相互结合,这样才能确保关键数据的万无一失。
在以上两种数据复制方式的基础之上,可以建立两种相对应的灾难备份解决方案——同城灾备方案和异地灾备方案。同城灾备方案是指生产中心和灾难备份中心同在一个城市或相近区域内的灾难备份方案。这种方案会使数据中心和灾难备份中心之间的距离比较近,可以比较容易地实现数据的同步镜像,可以保证高度的数据完整性和数据零丢失。异地灾备一般是跨省域的,生产中心和灾难备份中心距离比较远,从技术角度看,通过异步数据复制更容易实现。同城灾备可以防范火灾、建筑物破坏等可能遭遇的风险隐患,但对于战争、地震、水灾等潜在的风险隐患就显得力不从心了,防范这些情况还需要考虑异地灾备方案。针对同城灾备和异地灾备各有所长的特点,为达到最理想的防灾效果,也可以考虑异地+同城的灾难备份方案,在异地灾备基础上,再建立同城备份站点。这种方案防灾效果完美,但资金投入会比较多。
澳大利亚大通-曼哈顿银行的灾备方案就是一个较为典型的例子。澳大利亚大通-曼哈顿银行的全球灾备系统有五个灾难备份中心,包括三个全球同城灾备中心,两个全球异地灾备中心。位于澳大利亚的同城灾备中心距离生产中心约30公里,两个中心使用两条高速的ATM通讯链路连接。银行所有的重要数据均在同城灾备中心的服务器上作镜像,同时,大通-曼哈顿银行在英国的全球备份中心对数据进行异地备份。为了减少开支,灾备中心作为银行内部在网络上的逻辑节点,不但提供了完整的灾难恢复服务,而且还提供某一服务器的热备份服务,新应用上生产前的测试服务等。
点击按钮自动加关注代码——新浪微博
周涛,毕业于哈尔滨工业大学计算机科学与技术学院计算机科学与技术专业、硕士学位。现就职于中国工商银行数据中心、高级工程师、项目经理、长期从事金融科技工作。发表有《数据中心的起搏器》、《如何跨越异构平台》、《多功能自助终端系统的设计与实现》等多篇著作和论文,现主要关注于电子银行、证书安全方面的发展和研究。
一项调查表明,因灾难而丢失关键数据并且在几天内不能恢复关键业务的企业将会从市场上消失。对于依赖计算机系统运作的金融、电信、保险、民航、铁路和制造业而言,系统停机的可忍受时间更短。在“9·11”恐怖事件造成世贸大楼倒塌后,名列财富500强的金融机构摩根斯坦利公司在新泽西州灾难备份中心立刻切换运行,从而保障了公司全球业务的不间断运行,有效降低了灾难对于整个企业发展的影响,而很多没有建立灾难备份系统的企业却没有这样幸运。
在国内的金融领域,数据的灾难备份是业内广泛关注的一个热点。在一些中小型银行、证券机构和一些省级分支机构有实现存储级灾难备份的,此外,招商银行通过外包形式把灾备中心交给了IT公司。对于全国性的大型数据中心,到现今为止,还没有建立起真正意义上保证业务持续运转的灾备中心。
从概念上讲,灾难备份是指通过技术和管理的途径,确保在灾难发生后,企业的关键数据、数据处理系统和业务在短时间内能够恢复的过程。因此,在实施灾难备份项目之前,企业首先要分析哪些数据最重要,哪些数据要做备份、容灾,这些数据价值多少,再决定采用何种形式的灾难备份。灾难备份系统有不同的灾备层面,资金投入相差很大。在搭建灾难备份系统之前,需要考虑投入产出比。比如,要建立有备份主机的远程磁盘镜像,就要求灾难备份中心配备与生产中心性能匹配的全部专用设备,还要建设高成本的宽带网络,投入相当昂贵,只有金融、电信、民航、铁路等对信息实时性要求很强的行业才有必要采用。而对于信息技术依赖性不高的中小企业,重点考虑的是数据的存储备份。
建设灾难备份系统的目的是保证数据中心业务的高度持续性,所以建设数据中心是实施灾难备份中心的前提。对于已建立数据中心但没有灾难备份中心的企业,规划启动灾难备份系统已经迫在眉睫;对于有规划但还没有完成数据集中的企业,要提早考虑灾难备份系统。应用整合也是建设灾难备份系统的前提条件之一。软件运行平台的统一,设备选型的一致,应用版本的规范,相关应用的整合,都会大大减少灾难备份系统的实施难度,缩短实施工期,提高灾难备份系统的可靠性。
建立灾难备份系统同时,还要考虑建立完善的管理机制,最大限度地发挥好灾难备份系统的作用。据调查显示,灾备系统的40%故障率来自人为因素,另40%的故障源于应用系统故障,而只有20%的故障是由于火灾、水灾、地震等天灾造成的。所以保障灾备系统的长期稳定运营在于完善的管理机制,需要尽早建立灾难预防制度和灾难演习制度。因此,对于实施灾难备份系统的企业来说,要想真正发挥其作用,完善的管理机制不可或缺。
显然,灾难备份不等同于一般意义上的业务数据备份与恢复,数据备份恢复只是灾难备份中涵盖的一个方面。灾难备份系统还包括最大范围地容灾、最大限度地减少数据丢失、实时切换、短时间恢复等多项内容。可以说,灾难备份正在成为保护企业关键数据的一种有效手段。
灾难备份系统的核心技术是数据复制。目前数据复制的主要方式有同步数据复制和异步数据复制两种。同步数据复制是指对业务数据进行实时复制,数据中心和备份中心之间保持数据互为镜像,保持完全一致。这种方式实时性强,灾难发生时远端数据与本地数据完全相同,可以达到数据的零丢失,保证高度的完整性和一致性。同步数据复制的原理是每一个I/O写操作都需要等待远程复制完成后才释放,因此会对主机工作效率有一些影响。从传输距离上说,同步复制对网络延迟有严格的要求,数据传输距离较短,数据中心和备份中心的距离一般只能是几十公里。
异步数据复制是将本地生产数据通过后台同步的方式复制到异地。这种方式可能有分钟级的短时数据丢失,很难达到零数据丢失。异步复制的原理是对本地主卷写完成后,不必等待远程二级卷的写完成,主机立即可处理下一个I/O。因此,对本地主机性能影响很小。从传输距离上说,异步数据复制可以使用信道扩展器或其他技术,使传输距离延长,能够达到几千公里。
那么,对于金融企业来说,究竟应该如何选择何种复制方式呢?换句话说,企业应该采取何种灾难备份的建设方案呢?
一般来说,企业需要结合自己的容灾目标和实际情况来考虑。如果系统性能是最优先的考虑对象,能够接受备份中心数据更新的较小延迟,就可以考虑采用异步数据复制方式。如果避免数据丢失是最优先的考虑,生产主机的工作负载能够承受同步拷贝带来的性能损失,运行中心和备份中心的距离不超过100公里,那就可以考虑采用同步数据复制方式。当然,对于数据宝贵、安全性要求高、依赖信息技术强和有保证高度业务持续性要求的大型企业,应该考虑两种方式的相互结合,这样才能确保关键数据的万无一失。
在以上两种数据复制方式的基础之上,可以建立两种相对应的灾难备份解决方案——同城灾备方案和异地灾备方案。同城灾备方案是指生产中心和灾难备份中心同在一个城市或相近区域内的灾难备份方案。这种方案会使数据中心和灾难备份中心之间的距离比较近,可以比较容易地实现数据的同步镜像,可以保证高度的数据完整性和数据零丢失。异地灾备一般是跨省域的,生产中心和灾难备份中心距离比较远,从技术角度看,通过异步数据复制更容易实现。同城灾备可以防范火灾、建筑物破坏等可能遭遇的风险隐患,但对于战争、地震、水灾等潜在的风险隐患就显得力不从心了,防范这些情况还需要考虑异地灾备方案。针对同城灾备和异地灾备各有所长的特点,为达到最理想的防灾效果,也可以考虑异地+同城的灾难备份方案,在异地灾备基础上,再建立同城备份站点。这种方案防灾效果完美,但资金投入会比较多。
澳大利亚大通-曼哈顿银行的灾备方案就是一个较为典型的例子。澳大利亚大通-曼哈顿银行的全球灾备系统有五个灾难备份中心,包括三个全球同城灾备中心,两个全球异地灾备中心。位于澳大利亚的同城灾备中心距离生产中心约30公里,两个中心使用两条高速的ATM通讯链路连接。银行所有的重要数据均在同城灾备中心的服务器上作镜像,同时,大通-曼哈顿银行在英国的全球备份中心对数据进行异地备份。为了减少开支,灾备中心作为银行内部在网络上的逻辑节点,不但提供了完整的灾难恢复服务,而且还提供某一服务器的热备份服务,新应用上生产前的测试服务等。
上一篇:信息安全需要立体防护
推荐专题
订阅
治理评论
- 治理评论第一期[01-20]
- 治理评论第二期[01-20]
- 治理评论第五期[01-20]
- 治理评论第三期[01-20]
- 治理评论第六期[01-20]
- 治理评论第四期[01-20]
- 太极凭什么中标12306? [09-26]
- 中国国际航空股份有限公司--书评[11-01]