关于数据级灾备与应用级灾备之间的区别和联系
数据中心灾备系统的分类

数据中心灾备系统的分类随着信息技术的不断发展和应用,数据中心在现代企业中起着至关重要的作用。
数据中心不仅承载着大量的业务数据和应用程序,还负责保护和存储这些数据。
然而,自然灾害、人为错误或硬件故障等不可预见的状况可能会导致数据中心的中断,给企业带来灾难性的影响。
因此,数据中心的灾备系统变得越来越重要,以确保数据中心在灾难发生时能够持续运作。
数据中心灾备系统的分类主要基于它们的可用性和恢复时间目标。
下面将介绍几种常见的数据中心灾备系统分类。
1. 离线备份灾备系统离线备份灾备系统通过定期备份数据,并将备份数据存储在离数据中心物理位置较远的地方。
一旦发生灾难,数据中心可以使用这些离线备份进行数据恢复,以保证业务的持续运行。
这种系统的优点是备份相对简单,成本较低。
然而,由于备份数据是定期进行的,灾难发生时会有一定的数据丢失,并且恢复时间较长。
2. 热备份灾备系统热备份灾备系统通过实时同步数据来保证数据中心的高可用性。
它将生产环境的数据实时复制到备份数据中心,以便在主数据中心发生灾难时,备份数据中心能够立即接管运行。
这种系统的优点是恢复时间较短,数据丢失较小。
然而,热备份灾备系统的成本较高,需要建立并维护两个数据中心以及数据同步的网络连接。
3. 冷备份灾备系统冷备份灾备系统在备份数据中心中准备好基础设施和系统环境,但不实时同步数据。
当灾难发生时,备份数据中心需要手动进行数据恢复,并恢复成为新的生产环境。
这种系统的优点是相对成本较低,且备份数据中心可以用于其他用途,节省资源。
然而,冷备份灾备系统的恢复时间相对较长,且数据丢失较大。
4. 高可用性集群灾备系统高可用性集群灾备系统通过在生产环境和备份数据中心之间建立集群,确保数据中心在灾难发生时可以无缝切换。
它使用心跳检测和故障切换机制来实现自动切换。
这种系统的优点是恢复时间非常短,几乎没有数据丢失。
然而,高可用性集群灾备系统的实施和维护成本相对较高。
在选择数据中心灾备系统时,企业需要综合考虑业务需求、数据价值、预算以及恢复时间目标等因素。
容灾备份的等级和技术

容灾备份的等级和技术容灾备份:容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。
根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。
数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。
当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。
应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。
在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行。
容灾备份的等级:设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。
根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。
第0级:没有备援中心这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。
第1级:本地磁带备份,异地保存在本地将关键数据备份,然后送到异地保存。
灾难发生后,按预定数据恢复程序恢复系统和数据。
这种方案成本低、易于配置。
但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。
为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。
第2级:热备份站点备份在异地建立一个热备份点,通过网络进行数据备份。
也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。
当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
第3级:活动备援中心在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。
当某个数据中心发生灾难时,另一个数据中心接替其工作任务。
这种级别的备份根据实际要求和投入资金的多少,又可分为两种:①两个数据中心之间只限于关键数据的相互备份;②两个数据中心之间互为镜像,即零数据丢失等。
数据中心灾备系统的分类

数据中心灾备系统的分类根据数据中心的安全要求,应对灾难恢复系统采用的技术路线做出全面的考虑。
1.数据级容灾和应用级容灾按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。
数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。
应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。
因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。
(1)数据级容灾。
通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。
数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。
数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。
(2)应用级容灾。
应用级容灾能保证业务的连续性。
在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。
应用级容灾系统是建立在数据级容灾系统基础上的,同时能完成数据和应用系统环境的复制存放和管理。
为实现发生灾难时的应用切换,容灾中心需要配置与工作系统同构和相同功能的业务网络、应用服务器、应用软件等。
应用级容灾还需要考虑数据复制的完全性、数据的一致性、数据的完整性、网络的通畅性、容灾切换的性能影响、应用软件的适应性改造等问题,以及为保证业务运行的所需设备、环境、人员及其相应的管理。
2.灾难恢复系统的在线/离线模式(l)在线模式。
在线灾难恢复系统要求工作系统与灾难备份系统通过网络线路连接,数据通过网络实时或定时从工作系统传输到灾难备份系统。
的三种异地容灾备份方案

在数据容灾中最常采用,也是最有效的方案是异地容灾。
这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。
试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。
从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商--IBM的几种异地容灾方案。
针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。
它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。
一、数据级灾备--PPRCIBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。
这是IBM的最高级别容灾方案,主要适用于大、中型和电信企业选用。
它的网络结构(如图1所示)。
在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。
在标准的实时备份方案中,服务器主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。
受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。
光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。
在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。
在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。
灾备云等级

如何区分灾备云(定位灾备云等级)灾备云最主要的区别是什么?一、灾备保护的什么?对于各行各业而言,用户数据、系统数据均是企业最核心、最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏。
只有完善的灾备方案,才能最终保障数据安全、业务连续性。
随着互联网市场的蓬勃发展,及用户对数据重视程度的日益提高,据智研数据中心统计数据,灾备行业的市场规模已达百亿规模,且预计会逐年持续增长。
二、什么是灾备?灾备是容灾和备份的简称。
灾备方案=容灾方案+备份方案。
•容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT 系统,互相之间可以进行健康状态监视和功能切换。
当一处系统因意外(天灾、人祸)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
侧重数据同步和系统持续可用。
•备份的定义:指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份或者多份拷贝,以增强数据的安全。
侧重数据的备份和保存。
三、灾备的两个关键技术指标RTO:RecoveryTime Object,恢复时间目标。
指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。
RTO是反映业务恢复及时性的指标,体现了企业能容忍的IT系统最长恢复时间。
设目标RTO值设定的越小,代表对容灾系统的恢复能力要求越强,但企业投资也越高。
RPO:Recovery Point Object,恢复点目标。
指灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。
RPO是反映数据丢失量的指标,体现了企业能容忍的最大数据丢失量的指标。
目标RPO值设定的越小,代表企业允许的数据丢失越少,企业损失越小。
设计灾备方案的核心是:帮助客户平衡RTO/RPO的需求和客户经济能力,找到最佳的实现技术和手段,适合的才是最好的。
四.灾备分三个等级:第一个是数据级灾备。
数据中心灾备系统的分类

数据中心灾备系统的分类根据数据中心的安全要求,应对灾难恢复系统采用的技术路线做出全面的考虑。
1.数据级容灾和应用级容灾按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。
数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。
应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。
因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。
(1)数据级容灾。
通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。
数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。
数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。
(2)应用级容灾。
应用级容灾能保证业务的连续性。
在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。
应用级容灾系统是建立在数据级容灾系统基础上的,同时能完成数据和应用系统环境的复制存放和管理。
为实现发生灾难时的应用切换,容灾中心需要配置与工作系统同构和相同功能的业务网络、应用服务器、应用软件等。
应用级容灾还需要考虑数据复制的完全性、数据的一致性、数据的完整性、网络的通畅性、容灾切换的性能影响、应用软件的适应性改造等问题,以及为保证业务运行的所需设备、环境、人员及其相应的管理。
2.灾难恢复系统的在线/离线模式(l)在线模式。
在线灾难恢复系统要求工作系统与灾难备份系统通过网络线路连接,数据通过网络实时或定时从工作系统传输到灾难备份系统。
基于数据库技术的应用级灾备技术分析

灾难 恢 复管 理服 务:包括 灾难 应 急恢复 预案 ,灾难恢 复组织架构和职 责,以及相关技 术切换流程和操作手册 。 应 用接 管服 务:应 用接 管服 务是 指生产 中心发生灾难后 ,灾备 中心接管业务应用 的过 程 ,在应用级 灾备建 设中,应用接 管服 务实现 自动化接管 ,即通过运维支撑平 台自动 完成灾 备端相应 的技术操作 ,减少人为操作产生 的误 操作风险 。 数据 复 制服 务:对 于结构 化数 据复 制采 用数据库数据复制方式 ,非结构化数据采用存 储数据复制方式 。
和影 响范围,提供相应的技术保护手段,使得 相应的业务可 以在规定的时间内恢 复。
2应用级灾备架构设计
2 . 1 应 用 级 灾备 理 论 架 构
如 下 灾 备 建 设 量 理 论 架 构 : 的 设 计 中 ’ 主 要 参 考 2 . ‘ 3 应 肚 用 川 级 灾 火 备 甘 逻 辽 辑 竹 部 署 省 架 术 构 刊
数l 据 库技术 ・ D a t a B a s e T e c h n i q u e
基于数据库技术的应用级灾备技术分析
文/ 顾楠 王 涛
应 用 级 灾备 是 在 数 据 级 灾 备
基础 上 ,在 灾备 中心 建立共 享 性
灾备 云 , 实现 灵 活 资 源 调 度 当 中 换 至 灾备 中 心 运 行 。 相 比 数据 大 幅 级 灾备 而 言,业 务恢 复时 间 能力 度 缩短 ,对 大规模 灾难 抵御
的 灾 备 中心 场 地 , 供 电 系统 , 通讯及空调系统;
【 关键词 】应用级 灾备 数据级 灾备 应用复制 数据 复制 灾难
1背景介绍
国家 电 网 公 司 通 过 S GI 8 6工 程 建 成 了 覆 盖公 司各 级单 位 的一体 化企 业级 信息 系统 , 覆盖 总部、省 ( 市) 两 级 属 地 化 的 数 据 中心 。 根据 公司 信 息化集 约发 展需 求,公 司还将 于 “ 十 二五 ”完成 数据 级 和应用 级 灾备建 设, “ 十 三 五 ”启 动 集 中 式 数据 中 心 建 设 。 数 据 级 灾 备 实 现 了 公 司 各 类 数 据 从 生 产 端到灾备端的多对一 的复制 ,灾难发生后 ,灾 备端数据回传生产端恢复使用 。应用级灾备则 是在数据级灾备基础上,根据不 同的灾难场景
灾备标准分级

国际标准SHARE78,这个标准将灾难恢复分成八个层次:那么从存储结构来看,SHARE78涵盖最简单的本地磁盘的备份,到将备份的磁带存储在异地,再到建立应用系统实时的切换的异地备份系统。
那么从恢复的时间点角度来看,SHARE78涵盖几天级,几小时级、几分钟、几秒级,这是零数据丢失。
SHARE78它将异地灾备的定义为如下七个级别,我们国家六个级别,它是定义七级别。
第一个级别第0级容灾方案:这个时候数据仅在本地进行备份,没有在异地备份,并且没有制定灾难恢复计划,这是最简单的一种,对吧,也是最便宜的一种。
第1级容灾方案,它将关键数据备份到本地磁带介质上,然后送往异地保存。
第2级容灾方案,就是在第1级的容灾方案的基础上,再增加了一个热备中心。
那么从第0级,第1级,第2级这三种容灾方案,到目前来说,应该说对于大中型企事业单位,已经不能再用了,已经被淘汰了。
被小的机构用是另外一回事。
大机构用的都是下面要介绍的3级以上的容灾方案,或者是容灾级别。
第3级,那么在这一级中,就通过网络将关键的数据进行备份,并且存放至异地,制定有相应的灾难恢复计划,有备份中心,并且配备部分数据处理系统及其网络通信系统。
第4级的容灾方案,那么这个时候增加了备份管理软件,自动通过通信网络将部分关键数据定时的备份到异地,这么一种功能。
同时还制定了相应的灾难恢复计划。
第5级的容灾方案,增加了硬件的镜像技术和软件的数据复制技术。
也就是说可以实现在应用站点与备份站点的数据多备份更新。
第6级容灾方案,这个时候利用专用的存储网络,将关键数据同步镜像至备援中心,数据不仅在本地进行确认,而且需要在异地进行确认,这个异地就是备援中心那个地方进行确认,实现零数据的丢失。
第7级也就是最高级的容灾方案。
那么这个时候当一个工作中心发生灾难时,能够提供一定程度的跨站点动态负载平衡和自动系统的故障切换功能,这是最高级的,这是SHARE78的情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
灾备的应用对于企业来说是一项重要的技术应用,对于企业数据安全起到了很大的作用。
谈到灾备这个话题,很多CIO就会把异地应用级灾备放在首位,还特别强调建设一个数据零丢失、应用自动切换的最高级别的异地灾备系统。
这其实是一个认识上的误区。
灾备的重要性是毋容置疑的,但这并不是说灾备就一定要建应用级,从实际需求出发,“选择适合自己的”才最重要。
按照行业通俗的说法,灾难备份从保障的程度上一般分为三个级别:数据级、应用级和业务级。
其中数据级、应用级都是在IT系统的范畴之内而言,业务级则考虑到IT系统之外的业务因素,包括备用办公场所、办公人员等。
数据级灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。
较低等级的数据级灾备可通过备份的数据人工方式保存到异地实现,比如将备份的磁带定时运送到异地保存就是方法之一。
而较高级的数据灾备方案则依靠基于网络的数据复制工具,实现生产中心和灾备中心之间的异步/同步的数据传输,比如采用基于磁盘阵列的数据复制功能。
应用级灾备是在数据级灾备的基础上,把应用处理能力再复制一份,也就是在异地灾备中心再构建一套支撑系统。
支撑系统包括数据备份系统、备用数据处理系统、备用网络系统等部分。
应用级灾备能提供应用接管能力,即在生产中心发生故障的情况下,能够在灾备中心接管应用,从而尽量减少系统停机时间,提高业务连续性。
灾备建设中,如何选择数据级,还是应用级呢?我们可以从灾备的目标、投入产出比等多个角度进行分析。
异地灾备应对的是小概率事件,需考虑投入产出比灾难的范畴很广,可能导致数据遭到破坏的计划外事件都属于灾难的范畴,其中包括自然灾害、业务运行所依赖的服务的中断、IT系统故障、人员错误操作、恶意攻击以及恐怖袭击等。
下图是业界权威机构对灾难的分类:从图上可以看到,无论是面对占据灾难比重44%的硬件故障,还是占据49%比重的软件、人为、病毒故障,需要的都不是远程的灾备保护,需要的只是本地的数据保护;而剩下的7%的自然灾难和社会灾难,才真正需要异地远程灾备。
也就是说,通过双机热备、本地备份、CDP这些在线/近线的数据保护手段,就能解决93%的系统故障;而远程异地灾备,不论是数据级还是应用级,应对的都只是7%的小概率事件。
既然远程灾备的目标是应对小概率事件(同城灾备是高效率的小概率事件,异地应用级是低效率的极小概率事件),那么,灾备的投入产出比就非常重要。
一般而言,应用级灾备的投入会是数据级灾备投入的2-3倍,甚至更高,而且每一次从生产中心切换到异地灾备中心都需要耗费的大量人力、物力和时间,而回切的过程也同样复杂而耗费精力巨大。
因此,相对于应用级灾备而言,数据级灾备的投入产出比更高。
与其建设昂贵的异地应用级灾备,不如做好本地的数据中心保护,再配合远程的数据级灾备。
因此,在现实环境中,我们更常见的是“本地CDP+远程数据级灾备”这种数据保护模式。
灾备建设需要考虑循序渐进,分级建设灾备建设的投入很大,不能一蹴而就一步到位,需要的是一个循序渐进的过程。
数据级灾备和应用级灾备并不冲突,数据级灾备是应用级灾备的基础,异地灾备可以先做数据级的。
很多的用户在建设灾备系统时,往往就先做数据级灾备,后续再扩展成应用级灾备。
这么做的原因是多方面的。
原因一,与异地应用级的灾备相比,异地数据级灾备的投入比较小,却可以在极端情况发生时起到作用。
在出现大地震等大面积的自然灾害的情况下,用户其实可以接受一个相对比较长的业务恢复时间,外界也会有一个比较大的容忍度。
有了异地数据备份后,就可以用几天甚至更长的时间来恢复业务,而不至于彻底瘫痪。
原因二,灾难备份建设不是一个简单的技术方案,而是一项系统工程,灾备中心的基础建设、IT系统需要一个逐步建设的过程,运行维护团队、技术支持力量需要长期培养锻炼才能具备理想的应急能力。
因此,先做数据级灾备,积累建设经验,培养灾备队伍,具备相当的能力之后,再建设应用级灾备系统就会容易很多。
此外,在从数据级灾备向应用级灾备过渡的过程中,还要根据业务系统按需划分灾备等级,不能一刀切。
即使在同一个单位或者部门内,也存在多个应用系统。
这些信息系统的重要性、复杂度都各不相同,对应的灾备等级也不相同。
因此,我们需要根据业务系统的实际需求来逐个确定灾备等级。
一般而言,“2/8原则”是比较常见的,也就是20%的应用是关键和核心的,需要应用级灾备,而80%的应用是非关键的,需要的只是数据级灾备。
在实际的异地灾备中心建设中,这种应用级和数据级混合的建设模式是最典型的。
在应用级灾备的建设过程中,还存在一些常见的误区,它们是:(1) 应用级灾备就是业务自动切换(2) 应用级灾备就是数据零丢失(3) 应用级灾备就是通过应用层(服务器或者应用软件)来做灾备就第一个误区而言,这其实是一种追求技术的理想主义,并不适用实际环境。
灾备中心的业务接管是一个管理和决策的过程,绝不是某一项具体的技术。
技术不能替代管理,技术也不能替代决策,这早已成为了业界的共识。
完善的灾备预案、适时的灾备演练、专业的技术支持队伍才是保障应用级灾备发挥作用的关键。
灾备切换是一系列操作的组合,不是单一的技术动作不管生产中心还是灾备中心,彼此的业务之间都有逻辑的联系,服务的启动顺序也有严格的要求。
比如数据库必须先启动,之后才能启动应用程序;应用服务器接管完成,才能进行网络的切换。
如果应用程序先于数据库启动,结果肯定会是出错。
在实际的灾备切换时,我们看到,操作员都会有一本完整的切换操作手册,上面说明了软件、硬件、服务的启动顺序,每一步的操作内容和预期的目标等等。
只有严格按照流程操作,才能确保灾备的顺利切换。
因此,灾备切换是一系列技术操作的过程组合,不是单一的技术动作。
灾备切换是一个决策的过程,不能依靠单一的技术实现灾难的类型多种多样,不是每一种灾难都需要启用灾备中心。
而每一次灾备中心的启用,都需要耗费大量的人力和物力。
因此,在发生灾难时,首要的是快速判断灾难的类型、可恢复性和后果等内容,然后根据灾备预案来决定是否启用灾备中心。
比如,通过本地备份只需要半小时就能在本地恢复业务,就完全不需要启用灾备中心。
此外,应用级灾备的对象往往是关键的业务,越关键的业务,切换就越需要慎重,这不是单一的个人意愿,往往需要的是集体的决策。
因此,灾备切换更是一个决策过程,而不是单一的技术实现。
在实际案例中,99%以上的用户都不会选择自动切换。
说到第二个误区“应用级灾备就是数据零丢失”,很多CIO都认为难以理解。
应用级灾备当然要求数据零丢失,这一点通过磁盘阵列的同步镜像软件就能实现,技术上根本没有难度,为什么说这是误区呢?让我们从技术上做一些分析。
镜像并不能保证数据的完全同步磁盘阵列具备同步镜像功能,能够实现主备磁盘阵列的完全数据同步。
但是,磁盘阵列的数据同步并不意味着应用的数据也是同步的。
为了提高性能,服务器一般都采用了写缓存,写缓存的数据并没有实时的真正写入到磁盘阵列上,因此,磁盘阵列上的数据和应用的数据是存在差异的。
如果生产中心发生了故障,即使磁盘阵列的数据是同步的,也无法保障应用服务器的缓存数据也同步传输到了灾备中心。
镜像会降低生产中心的性能镜像的实现机制是一个写IO要同时得到主备磁盘阵列的响应后,才能返回写OK。
也就是说,对数据的一个写操作,需要主备磁盘阵列的二次写操作确认和主备站点的来回传输,时延会是普通写操作的3-5倍,甚至更高。
因此,采用数据镜像后,会给生产中心带来比较明显的性能影响。
此外,如果链路不稳定,出现闪断、抖动等情况,就会进一步加大生产中心的影响。
从上述的分析可以看出,镜像方式并不像想象的那么完美。
那么什么机制才是比较有效的呢?一些厂家采用的准实时复制技术就是一种答案,比如H3C的自适应复制技术。
如果采用这种技术,IO写入主磁盘阵列就返回OK,然后复制模块再将这个写IO采用异步复制的方式传输到灾备阵列。
这种方式不会降低主磁盘阵列的性能,还能做到准实时的数据同步。
如果再把自适应复制技术和快照技术相配合,还能保证灾备中心的数据一致性,从而实现灾备中心的数据丢失量最少,数据肯定可用。
第三个误区也是我们经常碰到的,主要是把数据同步和应用接管两个概念混在了一起。
应用级灾备包括两个方面:数据同步和应用接管,其中数据同步是应用接管的基础,但数据同步和应用接管是两种不同的技术。
数据同步的技术多种多样,即可以基于存储阵列的复制软件实现,比如EMC MirrorView、H3C Replication等,也可以基于服务器或者应用软件实现,比如Veritas VVR、Oracle DataGuard等。
但不管采用何种技术,都只是在不同的层面实现了数据的同步,要具备应用接管,还需要其他组件的配合,比如DNS域名切换解析、备用网络启用、应用服务切换等等。
在现实环境中,我们最常见的应用级灾备方案是“磁盘阵列的数据复制+备用服务器”,也就是通过磁盘阵列来实现数据同步,通过备用服务器提供业务接管能力。
数据级容灾和系统级容灾都是在IT范畴之内,然而对于正常业务而言,仅IT系统的保障还是不够的。
有些用户需要构建最高级别的业务级别容灾。
业务级容灾的包括很多非IT 系统,比如电话、办公地点等。
当一场大的灾难发生时,用户原有的办公场所都会受到破坏,用户除了需要原有的数据、原有的应用系统,更需要工作人员在一个备份的工作场所能够正常地开展业务。
实际上,业务级容灾还关注业务接入网络的备份,不仅考虑支撑系统的服务提供能力,还考虑服务使用者的接入能力、甚至备份的工作人员。
简单来说,灾难备份的等级可以用三个嵌套的同心圆表示,从数据级灾备、应用级灾备到业务级灾备,业务恢复等级逐步提高,而需要的投资费用也相应增长。
由于灾备所承担的是用户最关键的核心业务,其重要作用勿庸置疑。
灾备涉及到众多技术以及众多厂商的各类解决方案,其复杂性也不言而喻。
因此,在灾备建设中,不论是数据级灾备还是应用级灾备,“选择适合自己的”是构建灾备系统的一条基本准则。
用户需要根据自身的实际需求量身打造,而在实际建设中,许多用户的灾备站点也都是经过长期积累、多次改造后形成的。