数据级灾备-应用级灾备-业务级灾备

合集下载

机房灾备方案

机房灾备方案

机房灾备方案第1篇机房灾备方案一、背景随着信息技术的飞速发展,企业对信息系统的依赖程度越来越高,机房作为企业信息系统的核心基础设施,其安全性、稳定性至关重要。

为保障企业信息系统在遭遇自然灾害、事故灾难等不可预见事件时,能够迅速恢复正常运行,降低企业损失,制定一套合法合规的机房灾备方案显得尤为重要。

二、目标1. 确保机房关键业务系统在发生灾难时,能够在规定时间内恢复正常运行;2. 保障机房数据的安全性和完整性;3. 提高机房运维人员应对灾难的能力;4. 降低企业在灾难发生时的经济损失。

三、方案内容1. 灾备体系建设(1)灾备中心选址根据企业实际情况,选择地理位置相对独立、远离自然灾害及事故灾难风险的地域作为灾备中心。

(2)灾备中心基础设施建设灾备中心基础设施建设应符合国家相关标准和规范,包括但不限于:供电系统、空调系统、消防系统、安防系统等。

(3)网络通信保障建立灾备中心与主生产中心之间的专用网络连接,确保在灾难发生时,数据传输的实时性和安全性。

2. 数据备份与恢复(1)数据备份策略制定数据备份策略,包括全量备份、增量备份、差异备份等,根据业务系统重要性及数据变化情况,选择合适的备份方式。

(2)数据备份频率根据业务系统数据变化情况,合理设置备份频率,确保数据安全。

(3)数据恢复测试定期进行数据恢复测试,验证备份数据的有效性和完整性。

3. 业务系统灾备(1)业务系统分类根据业务系统的重要性及恢复优先级,将业务系统进行分类。

(2)业务系统灾备策略针对不同类别的业务系统,制定相应的灾备策略,包括但不限于:应用级灾备、数据级灾备、硬件级灾备等。

(3)业务系统切换与恢复在灾难发生时,根据灾备策略,快速切换至灾备中心,确保关键业务系统正常运行。

4. 人员与培训(1)灾备团队建设组建专业的灾备团队,明确团队成员职责,制定灾备工作流程。

(2)灾备培训与演练定期开展灾备培训,提高运维人员应对灾难的能力;定期进行灾备演练,检验灾备方案的有效性。

灾备设计方案

灾备设计方案

RPO 是反映恢复数据完整
性的指标,在同步数据复制方式下, RPO 等于数据传输延迟的时间;在异步数据复制下,
RPO 基本为异步传输数据排队的时间。在实际应用中,考虑导数据传输的因素,业务数据 库与容灾备份数据库的一致性( SCN)是不同的, RPO 表示业务数据库与容灾备份数据库
SCN 的时间差。发生灾难后,启动容灾系统完成数据恢复, 据损失量。

制。
数据 库的异地复制技 术,通常采用日志复 制功能,依靠本地和 远程主机 间的日志 归 档与 传递 来实现 两端的数据一致。

与平台无关,
台 同构存 储

需要增加 专有的复制服 务器 同构主机、异构存 储 与平台无关
或带有复制功能的 SAN 交换








较高
能 资
源 对生产系统存储性能有影 对 网 络 要求高
综合来进行考量。后续在 1.6.1 数据同步章节,将会有这 4 类数据复制技术的综合对比,可 以作为选择的参考。
1.2.3 网络安全
通信网络是容灾系统的组成部分, 通信线路的质量也是容灾系统的性能指标之一, 其中包括
网络的数据传输带宽、网络传输通道的冗余和网络服务商的服务水平(网络年中断率)
。如
果容灾系统使用的通信网络是确定的, 为了比较不同容灾解决方案, 可以用单位存储容量的
1.4 容灾技术分析
1.4.1 备份方式
(1) 冷备份
备份系统未安装或未配置成与当前使用的系统相同或相似的运行环境
, 应用系统数据没有
及时装入备份系统。 一旦发生灾难, 需安装配置所需的运行环境, 用数据备份介质 (磁带或

信息灾备的实施及重要性

信息灾备的实施及重要性
2 . 1 . 1 数据级灾备 。
数据级 灾备 系统只保证数据的完整性 、 可靠性 和安全性 , 但提供实 时服 务的请 求在灾难中会中断 。应用级灾备 系统 能够提供不问断 的应 用服 务, 让服务请求 能够透 明f 在灾难发生 时毫无觉察) 地继续运 行 , 保 证数据 中心提供 的服务完整 、 可靠 、 安全 。因此对服务 中断不太敏感的 部分可 以选择数据 级灾备 , 以便节省成本 , 在数据级 灾备 的基础上构建 应用级灾备 系统 , 保证实时服务不 间断运行 , 为用户提供更好 的服务 。 数据级灾备 。通过在异地建立一份数据复制 的方式保 证数据的安 全性 , 当本地工作 系统 出现不可恢 复的物理故障时 , 灾备 系统提供 可用 的数据 。数据级灾 备是灾备 的基础形式 , 由于只需要 考虑数据 的复制 和存放 , 不需要考虑备用系统 , 实现起来相对简单 , 投资也较少 。 数据级 灾备需要 考虑 三方 面问题: 在线模 式与离线 模式 问题; 远程 数据复制技术问题; 同步与异步灾备问题
科技信息
信息 灾备 硇实旋及重要性
河 南化 工职 业 学院
[ 摘
郭 璇 李 阔
要] 如 今的大 多数企事业单位都 面对着铺天盖地的数据信 息, 包括 邮件 、 报告、 电子表格 、 业务信息等。如何保存和管理这些信
息, 并 同时实现 出现 灾难后为使业务持 续运行 所花 费的成本得到控 制和存储资源利 用率 最大化 , 成 为领 导、 高管和 I T经理们面临的 首要 问题 , 他们越发的感觉到 了信 息灾备的重要性。 [ 关键 词] 信息灾难 灾备 灾备 重要 性
2 .续性 。在数据 级灾备 的基础上 , 建立 备份的应用 系统环境 , 当本 地工作系统出现不可恢复 的物理故 障时 , 灾 备系统提供可用的数据和应用系统。 应用级灾 备系统是建立 在数据级 灾 备系统基 础上 的, 同时能完成 数 据和应用系统环境 的复制存放 和管理。为实现发生灾难 时的应用切 换, 灾备 中心需要配置 与工作 系统 同构和相同功能的业务 网络 、 应用服 务器 、 应用软件等。 应用 级灾备还需要考虑数据 复制 的完全性 、 数据的一致性 、 数据 的 完 整性 、 网络 的通畅性 、 灾备切换 的性 能影响 、 应用软件 的适 应性改造 等 问题 , 以及 为保证 业务运行所需 的设备 、 环境 、 人员及其相应的管理。 2 . 2 数 据备份技术 正常 情况下 系统的各种 应用在数据 中心运行 , 数据存放 在数据 中 心 和灾难备份 中心两地保存 。 当灾难 发生时 , 使用 备份数据 对工作系 统进行恢 复或将 应用切换到备份 中心 。灾难备 份系统中数据备份技术 的选 择应符合数 据恢复 时间或系统切换 时间满 足业务连续性 的要求 。 目前数据备份技术 主要有 如下几种: 2 . 2 . 1 磁带备份 。 基于 应用程序 的备份 。通 过应用程 序或者 中间件 产品 , 将数 据中 心 的数 据复制 到灾难备份 中心 。在正 常情 况下 , 数 据 中心 的应 用程序 在将 数据写入本 地存储 系统 的 同时将数据 发送到 灾难 备份 中心 , 灾难 备份 中心 只在后 台处理 数据 , 当数据 中心瘫痪时 , 由于灾难 备份中心也 存有生产 数据 , 所以可 以迅速接 管业务 。这种备份方 式往往需要 应用 程序 的修改 , 工作量 比较大。另外 , 由应用程序本身来 处理 数据的复制 任务 , 对应用系统 的性能影响较大 。 2 . 2 . 2 数据库的远程数据复制 。 基本原理是将数据 中心的数据库 日志传送到远程灾难备 份中心的 数据库 中 , 通过 日志同步两端 的数据库 。这种方式需 要数据库软件 的 支持 。由于数据 库方式 只是传送数据库 日志 , 与应用没有 直接 关系 , 因 此无须对应用程序 做大量修改。这种灾难备份方式 比较适 合于只对数 据库有远 程灾难备 份需求 , 传输 距离较长 且网络传输 带宽不大 的用户 环境 。 2 . 2 I 3 服务器逻辑卷 的远程数据复制 这种 方式在服 务器操作 系统逻辑卷管 理软件基础 上实现 , 通过I P

信息系统灾难备份技术综述

信息系统灾难备份技术综述

信息系统灾难备份技术综述灾备是确保数据和信息系统安全、稳定运行的一个极为重要的因素,对支撑管理起到十分重要的作用。

本文介绍了信息系统建设与灾难备份的背景,讨论了灾备系统的主要指标和基本类型,在此基础上论述了灾备系统的关键技术和实现方法,提出了灾备技术未来的发展方向和趋势。

1 背景党中央和国务院十分重视信息安全工作。

2003年,中办发[2003127号文《国家信息化领导小组关于加强信息安全保障工作的意见》,要求各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。

2004年,国家网络与信息安全协调小组办公室发12004]11号文《关于做好重要信息系统灾难备份工作的通知》。

明确指出,提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严重中断,保障社会经济的稳定。

2005年,国务院信息化工作办公室出台了《重要信息系统灾难恢复规划指南》,为灾难恢复工作提供了一个操作性较强的参考思路。

2007年,国家标准《信息系统灾难恢复规范》(GB/T20988—2007)正式颁布,这是灾备建设中具有里程碑意义的重要大事。

该标准对灾难备份、灾难恢复相关术语进行了规范和梳理,指明了灾难恢复工作的流程,明确了灾难恢复的等级和相关要素,制订了灾难恢复工作的主要环节及各环节具体工作等。

在2010年召开的第五届中国灾难恢复行业高层论坛上,提出了我国将全面启动灾难恢复体系建设,制定强制性灾备建设规范,完善灾备标准体系并及时出台灾难恢复服务资质管理办法,以促进政府相关部门、行业用户、企业灾难恢复保障体系的发展。

目前,许多政府部门和重要行业已经开始积极有序进行应急管理、灾难备份与恢复体系的建设工作。

近十年来,国土资源信息化建设发展十分迅猛,数据积累不断丰富,政务信息系统日渐增多,其安全性和稳定性显得愈来愈重要。

一旦发生人为或自然等突发性灾难,造成数据丢失或信息系统严重故障或瘫痪,将会直接影响到国土资源管理工作的正常运转以及一些企业和广大民众的利益。

的三种异地容灾备份方案

的三种异地容灾备份方案

在数据容灾中最常采用,也是最有效的方案是异地容灾。

这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。

试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。

从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商--IBM的几种异地容灾方案。

针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。

它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。

一、数据级灾备--PPRCIBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。

这是IBM的最高级别容灾方案,主要适用于大、中型和电信企业选用。

它的网络结构(如图1所示)。

在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。

在标准的实时备份方案中,服务器主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。

受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。

光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。

在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。

在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。

灾备方案资料

灾备方案资料
• 应用级灾备:关注业务系统的连续性和可用性,如应用切换和 容灾策略。
• 站点级灾备:确保整个站点在灾难发生时能够迅速恢复运行, 如多站点部署和备份站点策略。
• 灾备方案选择:根据企业业务需求、风险承受能力和成本预算, 选择合适的灾备方案。
• 评估企业业务需求和风险承受能力 • 平衡灾备方案的成本和效益
• 互联网行业灾备方案实践:通过实施数据备份、恢复、应用切换等方面的内容,保障互联网业务连续性和稳定性 。
• 数据备份与恢复:采用高效的数据备份和恢复技术,确保数据安全。 • 业务连续性计划:制定针对不同业务类型的业务连续性计划,确保业务在灾难发生时的连续性和稳定性。 • 灾备中心与基础设施设计:规划和建设灾备中心,满足互联网业务连续性和稳定性的需求。
DOCS SMART CREATE
灾备方案设计与实施
CREATE TOGETHER
DOCS
01
灾备方案的基本概念与重要性
灾备方案的定义与作用
灾备方案定义:为应对突发事件和灾难,确保企业 业务连续性和数据安全而制定的预防和应对措施。
• 预防和应对自然灾害、人为事故、技 术故障等 • 保障企业业务的连续性和稳定性 • 保护企业数据安全和客户利益
持续改进:根据实施结果和反馈,对灾 备方案进行持续优化和改进,提高灾备
效果。
• 收集实施过程中的问题和反馈 • 分析问题原因和影响 • 对灾备方案进行优化和改进
03
灾备方案的关键要素与技术
数据备份与恢复技术
数据备份技术:采用磁带、磁盘、光盘等存储介质, 将企业数据定期或实时复制到备份介质,防止数据
灾备方案对企业业务的影响与价值
灾备方案对企业业务的影响:确保企业业务在灾难 发生时能够迅速恢复,降低损失,提高业务连续性。

灾备云等级

灾备云等级

如何区分灾备云(定位灾备云等级)灾备云最主要的区别是什么?一、灾备保护的什么?对于各行各业而言,用户数据、系统数据均是企业最核心、最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏。

只有完善的灾备方案,才能最终保障数据安全、业务连续性。

随着互联网市场的蓬勃发展,及用户对数据重视程度的日益提高,据智研数据中心统计数据,灾备行业的市场规模已达百亿规模,且预计会逐年持续增长。

二、什么是灾备?灾备是容灾和备份的简称。

灾备方案=容灾方案+备份方案。

•容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT 系统,互相之间可以进行健康状态监视和功能切换。

当一处系统因意外(天灾、人祸)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。

侧重数据同步和系统持续可用。

•备份的定义:指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份或者多份拷贝,以增强数据的安全。

侧重数据的备份和保存。

三、灾备的两个关键技术指标RTO:RecoveryTime Object,恢复时间目标。

指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。

RTO是反映业务恢复及时性的指标,体现了企业能容忍的IT系统最长恢复时间。

设目标RTO值设定的越小,代表对容灾系统的恢复能力要求越强,但企业投资也越高。

RPO:Recovery Point Object,恢复点目标。

指灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。

RPO是反映数据丢失量的指标,体现了企业能容忍的最大数据丢失量的指标。

目标RPO值设定的越小,代表企业允许的数据丢失越少,企业损失越小。

设计灾备方案的核心是:帮助客户平衡RTO/RPO的需求和客户经济能力,找到最佳的实现技术和手段,适合的才是最好的。

四.灾备分三个等级:第一个是数据级灾备。

容灾及备份技术和关键指标(2022)

容灾及备份技术和关键指标(2022)

容灾及备份技术和关键指标(2022)数据复制软件经典的应用场景为灾备,包括备份、容灾、演练等,用于保障用户的数据安全和业务连续性。

(1)灾备的基础知识衡量一个灾备系统建设优秀与否,或是否符合等级保护要求的两大关键指标是恢复时间目标(RTO)、恢复点目标(RPO)。

恢复时间目标(RTO)∶Recovery Time Objective,即恢复时间目标,指的是用户业务系统所能容忍的业务停止服务的最长时间。

恢复点目标(RPO)∶Recovery Point Objective,即数据恢复点目标,指的是业务系统所能容忍的数据丢失量。

根据恢复的目标与需要的成本投入,灾备等级依次可分为数据级灾备、应用级灾备、业务级灾备,级别越高,需要投资的费用也相应增长。

云灾备∶狭义上,云灾备是将灾备看作一种服务,由客户付费使用灾备服务提供商提供灾备的服务模式,行业通常称为DRaaS,租户通过类似于灾备计算管理平台,按需设置容灾备份规则,实现对多租户的灾备管理,确保云端数据安全。

广义上,云灾备是本地灾备的延伸拓展,容灾备份的场景可发生于云平台,或本地与云平台间。

在云灾备的模式下,数据保护的对象和灾备的目标端由本地系统转向云端系统。

和本地灾备相比,云灾备的传输环境具有带宽窄、不稳定等特点,对数据复制技术的压缩能力、断点续传能力等提出了更高的要求。

云灾备(云容灾、云备份)提供商可以是云平台服务商,也可以是灾备服务商。

相比前者,灾备服务商在专业度、备份颗粒度、兼容性、跨平台系统迁移及数据保护方面,更有优势。

灾备演练∶指通过假设某种灾难场景发生时,如系统宕机、地震、火灾等,灾备系统或体系是否可紧急使用,进而进行的一种主动应急演练行为。

在金融、医疗、政务等领域常举行周期性的灾备演练。

业务连续性∶是灾备技术的升华概念,是一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况安全可用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

灾备介绍灾备对于数据中心建设来说,地位十分重要,按照业内通例,依据对数据与业务的保障程度来说,一般可以分为三个等级:数据级灾备、应用级灾备和业务级灾备。

我们经常听到有关灾备建设方案就是将异地应用级灾备放在首选,但这其实是灾备建设的一个误区,灾备虽然十分重要,但是并不是说进行灾备建设就一定要建设应用级的,进行灾备建设一定要从自己的实际需求出发,找到适合自己业务系统需求的灾备建设方案,这才是灾备建设合理思路。

对于灾备的级别,可能很多人都只了解其中的一两种,但是不能够了解的比较全面,而这几种灾备之间其实是存在联系的,所以想要彻底的了解灾备,就需要进行多方面的了解。

那么首先我们来看三个不同等级的灾备方式的关注点在哪里:数据级灾备、应用级灾备关注点都在IT信息系统本身,而业务级灾备则除了充分考虑IT系统外也关注了其他外部业务因素诸如办公环境、系统相关人员等。

下面我就介绍一下上面提到的三个不同级别的灾备方式。

数据级灾备主要关注点是数据,即在灾难发生之后,可以确保用户原有数据不受到损坏。

对于级别较低的数据级灾备来说,可以将需要备份的数据通过人工的方式保存到异地实现:如将备份的磁带(盘或光盘)定时运送到异地保存就是方法之一。

而较高级的数据灾备方案则依靠基于网络的数据复制工具,实现生产中心不同备份设备之间或是生产中心与灾备中心之间的异步/同步的数据传输,如采用基于磁盘阵列的数据复制功能。

应用级灾备是建立在数据级灾备的基础上的,对应用系统进行复制,以实现应用接管。

而在异地灾备中心再构建一套应用支撑系统是应用级灾备经常采用的方式。

支撑系统包括数据备份系统、备用数据处理系统、备用网络系统等部分。

应用级灾备能提供应用系统接管能力,即在生产中心发生故障的情况下,灾备中心便能够接管应用,从而尽量减少系统停机时间,保障业务连续性。

业务级灾备是最高级别的灾备系统。

它包括除了保障IT系统业务连续性外也提供非IT系统保障,如当发生大的灾难时,用户的办公场所可能会被损坏,用户除了需要原来的数据以外,还需要工作人员在一个备份的工作场所能够正常地开展业务。

那么这时就需要业务级灾备来保障业务连续性了。

实际上,业务级容灾还关注业务接入网络的备份,不仅考虑支撑系统的服务提供能力,还考虑服务使用者的接入能力、甚至备份的工作人员。

那么我们在进行灾备建设时,到底应如何选择呢?我们可以结合自身情况,从基础设施条件、灾备的目标、技术成熟度、投入产出比、数据与应用系统的重要性,业务关联度等多个角度进行分析。

异地灾备应对的是小概率事件,需考虑投入产出比灾难的范围很广,凡是可以导致数据或业务遭到破坏的计划外事件都属于灾难的范畴,诸如自然灾害、业务运行所依赖的服务的中断、IT系统故障、运维人员误操作、恶意攻击等。

下图是权威机构对灾难的分类:从上图可以看到,无论是面对占据灾难比重32%的硬件故障,还是占据61%比重的软件、人为、病毒故障,需要的都不是远程的灾备保护,需要的只是本地的数据保护;而剩下的7%的自然灾难和社会灾难,才真正需要异地远程灾备。

也就是说,通过双机热备、本地备份、CDP技术等数据保护手段,就能解决93%的系统故障;而远程异地灾备,不论是数据级还是应用级,应对的都只是7%的小概率事件。

既然远程灾备的目标是应对小概率事件〔同城灾备是高效率的小概率事件,异地应用级是低效率的极小概率事件〕,那么灾备的投入产出比就非常重要。

一般而言,应用级灾备的投入会是数据级灾备投入的2-3倍,甚至更高,而且每一次从生产中心切换到异地灾备中心都需要耗费大量的人力、物力和时间,而回切的过程也同样复杂而耗费精力巨大。

因此,相对于应用级灾备而言,数据级灾备的投入产出比更高。

与其建设昂贵的异地应用级灾备,不如做好本地的数据中心保护,再配合远程的数据级灾备。

因此,在现实环境中,我们更常见的是“本地CDP+远程数据级灾备〞这种数据保护模式。

灾备建设需要考虑循序渐进,分级建设灾备建设的投入很大,不能一蹴而就一步到位,需要的是一个循序渐进的过程。

数据级灾备和应用级灾备并不冲突,数据级灾备是应用级灾备的基础,异地灾备可以先做数据级的。

很多的用户在建设灾备系统时,往往就先做数据级灾备,后续再扩展成应用级灾备。

这么做的原因是多方面的。

原因一,与异地应用级的灾备相比,异地数据级灾备的投入比较小,却可以在极端情况发生时起到作用。

在出现大地震等大面积的自然灾害的情况下,用户其实可以接受一个相对比较长的业务恢复时间,外界也会有一个比较大的容忍度。

有了异地数据备份后,就可以用几天甚至更长的时间来恢复业务,而不至于彻底瘫痪。

原因二,灾难备份建设不是一个简单的技术方案,而是一项系统工程,灾备中心的基础建设、IT系统需要一个逐步建设的过程,运行维护团队、技术支持力量需要长期培养锻炼才能具备理想的应急能力。

因此,先做数据级灾备,积累建设经验,培养灾备队伍,具备相当的能力之后,再建设应用级灾备系统就会容易很多。

此外,在从数据级灾备向应用级灾备过渡的过程中,还要根据业务系统按需划分灾备等级,不能一刀切。

即使在同一个单位或者部门内,也存在多个应用系统。

这些信息系统的重要性、复杂度都各不相同,对应的灾备等级也不相同。

因此,我们需要根据业务系统的实际需求来逐个确定灾备等级。

一般而言,“2/8原则〞是比较常见的,也就是20%的应用是关键和核心的,需要应用级灾备,而80%的应用是非关键的,需要的只是数据级灾备。

在实际的异地灾备中心建设中,这种应用级和数据级混合的建设模式是最典型的。

在应用级灾备的建设过程中,还存在一些常见的误区,它们是:1.应用级灾备就是业务自动切换2.应用级灾备就是数据零丢失3.应用级灾备就是通过应用层〔服务器或者应用软件〕来做灾备就第一个误区而言,这其实是一种追求技术的理想主义,并不适用实际环境。

灾备中心的业务接管是一个管理和决策的过程,绝不是某一项具体的技术。

技术不能替代管理,技术也不能替代决策,这早已成为了业界的共识。

完善的灾备预案、适时的灾备演练、专业的技术支持队伍才是保障应用级灾备发挥作用的关键。

灾备切换是一系列操作的组合,不是单一的技术动作。

不管生产中心还是灾备中心,彼此的业务之间都有逻辑的联系,服务的启动顺序也有严格的要求。

比如数据库必须先启动,之后才能启动应用程序;应用服务器接管完成,才能进行网络的切换。

如果应用程序先于数据库启动,结果肯定会是出错。

在实际的灾备切换时,我们看到,操作员都会有一本完整的切换操作手册,上面说明了软件、硬件、服务的启动顺序,每一步的操作内容和预期的目标等等。

只有严格按照流程操作,才能确保灾备的顺利切换。

因此,灾备切换是一系列技术操作的过程组合,不是单一的技术动作。

灾备切换是一个决策的过程,不能依靠单一的技术实现灾难的类型多种多样,不是每一种灾难都需要启用灾备中心。

而每一次灾备中心的启用,都需要耗费大量的人力和物力。

因此,在发生灾难时,首要需要做的是快速判断灾难的类型、可恢复性和后果等内容,然后根据灾备预案来决定是否启用灾备中心。

比如,通过本地备份只需要半小时就能在本地恢复业务,就完全不需要启用灾备中心。

此外,应用级灾备的对象往往是关键的业务,越关键的业务,切换就越需要慎重,这不是单一的个人意愿,往往需要的是集体的决策。

因此,灾备切换更是一个决策过程,而不是单一的技术实现。

在实际案例中,99%以上的用户都不会选择自动切换。

说到第二个误区“应用级灾备就是数据零丢失〞,很多CIO都认为难以理解。

应用级灾备当然要求数据零丢失,这一点通过磁盘阵列的同步镜像软件就能实现,技术上根本没有难度,为什么说这是误区呢?让我们从技术上做一些分析。

镜像并不能保证数据的完全同步磁盘阵列具备同步镜像功能,能够实现主备磁盘阵列的完全数据同步。

但是,磁盘阵列的数据同步并不意味着应用的数据也是同步的。

这是因为为了提高性能,服务器一般都采用了写缓存,写缓存的数据并没有实时的真正写入到磁盘阵列上,因此,磁盘阵列上的数据和应用的数据是存在差异的。

如果生产中心发生了故障,即使磁盘阵列的数据是同步的,也无法保障应用服务器的缓存数据也同步传输到了灾备中心。

镜像会降低生产中心的性能镜像的实现机制是一个写IO要同时得到主备磁盘阵列的响应后,才能返回写OK。

也就是说,对数据的一个写操作,需要主备磁盘阵列的二次写操作确认和主备站点的来回传输,时延会是普通写操作的3-5倍,甚至更高。

因此,采用数据镜像后,会给生产中心带来比较明显的性能影响。

此外,如果链路不稳定,出现闪断、抖动等情况,就会进一步加大生产中心的影响。

从上述的分析可以看出,镜像方式并不像想象的那么完美。

那么什么机制才是比较有效的呢?一些厂家采用的准实时复制技术就是一种答案,比如H3C的自适应复制技术。

如果采用这种技术,IO写入主磁盘阵列就返回OK,然后复制模块再将这个写IO采用异步复制的方式传输到灾备阵列。

这种方式不会降低主磁盘阵列的性能,还能做到准实时的数据同步。

如果再把自适应复制技术和快照技术相配合,还能保证灾备中心的数据一致性,从而实现灾备中心的数据丢失量最少,数据肯定可用。

第三个误区也是我们经常碰到的,主要是把数据同步和应用接管两个概念混在了一起。

应用级灾备包括两个方面:数据同步和应用接管,其中数据同步是应用接管的基础,但数据同步和应用接管是两种不同的技术。

数据同步的技术多种多样,即可以基于存储阵列的复制软件实现,比如EMC MirrorView、H3C Replication等,也可以基于服务器或者应用软件实现,比如Veritas VVR、Oracle DataGuard等。

但不管采用何种技术,都只是在不同的层面实现了数据的同步,要具备应用接管,还需要其他组件的配合,比如DNS域名切换解析、备用网络启用、应用服务切换等等。

在现实环境中,我们最常见的应用级灾备方案是“磁盘阵列的数据复制+备用服务器〞,也就是通过磁盘阵列来实现数据同步,通过备用服务器提供业务接管能力。

数据级容灾和系统级容灾都是在IT范畴之内,然而对于正常业务而言,仅IT系统的保障还是不够的。

有些用户需要构建最高级别的业务级灾备。

业务级灾备的包括很多非IT系统,比如、办公地点等。

当一场大的灾难发生时,用户原有的办公场所都会受到破坏,用户除了需要原有的数据、原有的应用系统,更需要工作人员在一个备份的工作场所能够正常地开展业务。

实际上,业务级容灾还关注业务接入网络的备份,不仅考虑支撑系统的服务提供能力,还考虑服务使用者的接入能力、甚至备份的工作人员。

灾备选择的适用性原则简单来说,从数据级灾备、应用级灾备到业务级灾备,业务恢复等级逐步提高,而需要的投资费用也相应增长。

由于灾备所承担的是用户最关键的核心业务,其重要作用勿庸置疑。

灾备涉与到众多技术以与众多厂商的各类解决方案,其复杂性也不言而喻。

相关文档
最新文档