HP CA 灾备方案

HP CA 灾备方案
HP CA 灾备方案

HP CA软件灾备方案建议书

目录

核心数据容灾系统 (2)

4.2.1容灾概述 (2)

4.2.2关键业务系统中普遍存在的问题 (2)

4.2.3业务连续性/容灾的重要意义 (4)

4.2.4国外计算机业务系统灾难备份应用情况 (6)

4.2.5灾备系统实施容灾方案的意义 (7)

4.2.6什么是容灾系统 (8)

4.2.7灾难及应对分析 (9)

4.2.8系统建设的目标 (16)

4.2.9系统建设的原则 (17)

4.2.10业务系统现状 (17)

4.2.11灾备系统灾难备份系统解决方案(以下设备型号为示例) (18)

4.2.12容灾系统的管理 (23)

4.2.13培训 (25)

4.2.14测试灾难恢复计划 (25)

4.2.15测试方法 (25)

4.2.16维护 (26)

4.2.17惠普公司容灾实施服务内容 (26)

4.2.18HP容灾系统优势 (31)

核心数据容灾系统

4.2.1 容灾概述

在今天的科技社会中,IT技术的运用已经渗透到了我们生活和工作的各个层面,为我们带来了以往任何一次技术革命都没有的便利和迅捷,可以说,由于采用了IT技术的新的生产方式已经基本上代替了原来的生产方式,成为现代社会运作和发展的主流,我们对计算机系统的依赖超过了以往任何一种技术。

然而计算机系统在为业务的迅猛发展提供信息技术基础架构的同时,也带来了以往我们不曾发觉的负面因素。例如由于信息和处理的高度集中使业务运转过度依赖于IT系统,并会因为IT系统的突发问题而受到很大影响,严重的甚至可以导致业务系统无法正常进行。这些问题包括了进行系统检修和升级带来长时间的系统停机,系统自身的或者人为的因素或事故发生连锁性的扩大,以及不可预见的故障和突发性灾难等等。

如何避免业务运转受到影响,或者使业务影响尽可能降到最低,这是每一个企业管理者必须考虑和重视的问题。×××领导经过认真的思考,如何切实有效的保障制证系统等关键业务系统的连续运行已经成为领导层十分关

注的问题。

本方案的内容涵盖了高可用的信息技术基础平台建设、日常运作流程设计、突发事件管理和大型灾害的应对计划和策略,业务持续性管理团队建设和咨询等诸多方面的服务。希望能够帮助客户从技术、流程、人员三方面提高业务持续能力,保证关键业务的正常运行和发展。

4.2.2 关键业务系统中普遍存在的问题

提高IT系统的高可靠性以及IT系统的容灾建设早已不再是新鲜的话题了,随着许多用户实施业务系统大集中,针对IT系统的高可靠性和容灾能力的需求日渐突出,很多用户都已经实施了有针对性的容灾系统,并且更多讨论的是如何实现业务数据的有效保护和业务的连续性运行。

然而,目前大多数容灾系统的建设还是存在许多问题的。这些问题中不仅有技术层面的缺陷,更多的是在流程和人员方面的不足。这些问题可能导致的直接后果就是当发生灾难时,根本无法实现应用系统的快速恢复,甚至可能导致业务运转的长时间灾难性中断。我们可以列举出其中的一些:1.仅从产品功能层面考虑问题,最终建设的容灾环境仅是一个多种产品的堆积。仅实现了数据的远程复制或者离线存放,没有进行灾难的各种场景测试和灾难预演,并缺乏灾难恢复机制和危机应对流程。发生灾难时,不知道到底数据或者系统能否恢复正常。

2.进行了一定的测试和预演,但是缺少相应的灾难恢复计划和特殊情况下的行动指南,更没有全面的业务连续性计划。在真正发生灾难时,百废待兴、千头万绪的情况下,没有依据和参考,可能无法顺利进行有关操作。

3.有了灾难恢复计划等必要文档,但是没有及时的将IT系统,业务流程和管理人员等不断变化的信息更新,导致容灾手册成为一纸空文。

4.具备了以上的要素,但是容灾系统的建设局限在IT部门,缺少业务部门的参与和管理高层的介入和全力支持。发生灾害时,IT系统能够恢复但是业务流程仍无法恢复运转。

除了以上列出的问题之外,还有许多问题如容灾系统的负载能力估计不足,实施过程中没有严格遵循高可靠标准,实施过程工作界面过多沟通不足,日常运维管理方面存在不足和漏洞,缺少厂商、系统集成商的后续支持服务等等都可能导致业务持续性系统建设的失败。

除了以上的问题之外,另一类问题是项目小组仅将目光放在了大型灾难等突发事件的应对之上,而忽略了计划性停机对业务运行的影响。根据有关统计,非计划性停机只占13%的停机概率,而在非计划停机中大型自然灾难占的比例就更低了。所以在项目实施时,未能很好的优化现有系统和流程,没有充分发掘现有潜力,未能将日常操作流程和业务持续性目标充分整合,虽然实现了容灾但是仍没有从本质上解决持续性问题。

HP公司提供的业务连续性解决方案是基于HP公司长期的实践经验和业界公认的业务持续方法论(BCP),结合客户的具体实际情况,采用业界

先进成熟的产品和技术,由资深顾问和技术专家构成的实施小组遵循IT服务管理(ITSM)理念进行实施。充分考虑了以上普遍性问题,保证了项目目标的成功实现,同时HP公司可以提供整个容灾项目的整体解决方案单点后续支持服务,这一点完全不同于业界其他友商仅能提供单一产品支持的服务模式。

4.2.3 业务连续性/容灾的重要意义

在突发性灾难面前,目前的信息系统的确是非常脆弱的。当越来越多的人们已经习惯于工作、生活在基于计算机系统的支持环境中,任何关键信息系统运转的中断或者数据的丢失都将导致不可估量的损失。一个已经证实的数据是:网上银行每分钟运转中断成本为7000美元,企业资源管理系统为13000美元,而呼叫中心更是高达27000美元!据IDC的统计数字表明,美国在2000年以前的10年间,发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。

损失?(业务停顿5分钟

$400,000$500,000

资料来源

3

当然,早在数年前许多企业及政府要害部门就有了危机意识,他们也正在尽力避免危机的产生。对于例如计算机软硬件故障、人为因素以及资源不足等引起的计划性停机所导致的系统停止运转,众多的用户采用了各种解决方案如本地双机热备份、负载均衡、动态切换等,得以实现系统冗余,增强业务系统的高可用性。但是,无论对硬件和软件采取什么样的监控和改善措施,一场不可预测的突发性灾难,比如地震、火灾等降临时,业务数据还是会在瞬间消失。如何才能保证尽量减少业务数据的丢失、将危险与灾难的损失降低到最小程度呢?这就需要建立异地容灾系统。

容灾系统的核心就在于使用各种技术和管理手段将灾难的影响化解,在实践中主要表现为两个方面:一是保证业务数据的安全;二是保证业务的连续性。通过在生产站点和灾难恢复站点运行同样的系统,包括操作系统、基础数据库和应用软件,并通过数据复制完成在线和实时的数据复制,或者通过光纤通道的远程数据复制。假如工作站点发生突发灾难,不能再继续工作,这时容灾中心会将业务数据及时恢复到备用服务器上,并迅速将业务系统加载到备用服务器,然后实现业务的远程切换(Fail-over),恢复应用系统不间断的运行,在容灾中心实现业务的恢复运转,这个过程只需要几分钟或者几十分钟的时间;在此基础上,在灾难过后,生产系统恢复正常后,再将业务运行切换回正常的生产系统,实现业务系统的灾难恢复(Fail-back)。

一般来讲,一家运行关键业务的企业应该拿出IT总预算的7%到15%用于灾难备份与恢复。在发达国家,面对高级灾难防护,一般公司每月要支付大约5万美元到10万美元的费用,而对于大公司,这一数字可能高达100万美元。这个数字十分惊人,但当用户进行整体的评估和核算后,会发现一次业务中断所造成的经济损失将远远超过投资于业务持续性系统的成本。

在国内,当前应用级容灾系统的用户还不多。究其原因,首先观念是重要因素。容灾系统的投入相当大,而它所针对的只是一些诸如火灾、洪水、地震等小概率事件,因此,对许多用户来说,这种高投入和相对的小概率产出使他们望而却步。但是对于像财税研究机构这样的政府要害部门来说,关键数据丢失造成的损失是远远不能用财务数据来衡量的。同时还应当指出,容灾系统并不仅仅针对突发性灾害等小概率事件,其它一些宕机事件,如人

为误操作、机房事故(电源、空调、管道漏水)、计划内的系统维护和扩容等,也可使用异地容灾系统实现关键业务的持续运转。此外,在生产系统正常运转的情况下,容灾系统还可以被用来开展诸如数据挖掘、经营分析以及用户查询等其他业务,从而使为防止灾难而采购的软硬件设备在平时也能得到很好的应用。

如上所述,综合考虑业务中断、数据丢失所导致的损失和增值业务所带来的收益,容灾系统的建设投入还是值得的。

4.2.4 国外计算机业务系统灾难备份应用情况

灾难备份计划在发达国家电信行业和金融行业得到了较早实施,现已较为普遍。例如美国,因一九八五年纽约银行计算机故障,联邦管理部门更加强了在这方面的监管力度。现美国计算机业务系统一般出于以下三方面来考虑灾难备份计划:

重要数据保护与业务连续运行的需要:在美国,各行业内部竞争激烈,各项业务的正常开展完全依赖于计算机系统的高性能、高可靠运行,一旦因突发性灾难而造成数据丢失或业务中断,必将会造成重大乃至致命的打击。

审计的要求:美国较大型的企业一般会由第三方独立审计公司来提供其资信业务、管理等方面咨询服务,而世界著名的五大审计公司在对企业的评估项目中均包含灾难备份计划一项;评估企业数据在灾难等威胁破坏下数据的完整性与安全性,及业务可恢复性等,有些还会参于验证这种计划的具体操作过程。缺少灾难备份计划及其危害性会在报告中被显示出来。

法律的要求:美国政府及州政府通过多项法律强制性要求金融、电信等大型企业备有计算机安全及灾难备份计划。对于没有遵守这项灾难备份计划的企业,会遭受曝光及罚款等处理,同时亦可能对相关责任人进行罚款甚至监禁等处罚。已知的灾难例子有:日本神户大地震、美国佛罗里达州飓风(数百家企业实施了灾难备份计划)、台湾大地震等。

4.2.5 灾备系统实施容灾方案的意义

我国的相关政策法规:

2003年9月,中共中央办公厅、国务院办公厅转发了《国家信息化领导小组关于加强信息安全保障工作的意见》(中办发[2003]27号),提出各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复;

2004年1月9日全国信息安全保障工作会议上下发了《关于做好国家重要信息系统容灾备份工作的通知》;

2004年央行提出各银行要在2009年前完成灾难备份工作;

2005年1月国信办组织起草了《重要信息系统灾难恢复规划指南》;…

灾备系统自身业务需要:

灾备系统目前日常研发工作依赖于Oracle数据库软件,这套软件分别运行在2套由HP小型机组成的HA集群中,此配置保证了数据库服务应用在单机出现故障时可以迅速切换到集群中的另一台机器上去。当整个机房出现比较大的灾难时(如水灾、火灾等),2套HA集群内的主机都不能提供服务,更严重的是:灾难可能会对目前存放在EVA4000磁盘阵列中的数据造成损坏和丢失。即使事后可以通过备份来恢复数据,但是数据的部分丢失不可避免;而且新购买阵列、小型机的流程较长,灾备系统正常正常使用在较长的一段时间内都会受到严重的影响。因此,为了保证数据的安全性和应用的连续性,我们建议×××在一个备场地建立一个灾备数据中心,灾备数据中心的数据和主数据中心数据实时保持同步。

随着灾备系统的业务开展的深入,数据量的增加,必然要考虑建设灾难\备份中心,其目的就是在于防止一些灾难性的小概率事件可能对集中式信息系统造成的不可恢复的原始数据的丢失,这些灾难性事件可能包括为火灾、水灾、地震、电源故障及一些人为的操作失误等等。

综上所述,灾备系统建设灾难备份中心有如下的意义:

重要业务数据在灾难发生后得以保护。

●重要业务,核心数据库系统在灾难发生后可以在设定的时间内恢复,从而实现业务的连续运行

●业务计算机系统抵御突发性灾难的能力和级别提高

4.2.6 什么是容灾系统

容灾系统是业务永续运行的重要的组成部分。所谓灾难,通常是指引起关键业务的信息服务中断,且中断的时间及造成的损失超出企业所能承受的范围之外的意外情况。引起灾难的因素很多,可以是系统环境中的软件、硬件故障,有意或过失的人为破坏,还可能是因火灾、飓风、地震而引起的数据处理设备的损坏等等,只要造成了关键业务的中断,都是灾难。而容灾就是通过预先建立的备份中心、备份设备和备份数据等,在可以容忍的时间内恢复业务系统的正常运行,将企业因业务中断而导致的损失降低到预定的程度。

相对于业务永续运行来说,容灾强调的是企业的关键业务在灾难发生时的应对能力和恢复能力,即通过尽可能快速的、全面的企业业务恢复运作,将因灾难造成的损失降低到最小程度。显然,它并不保证业务的零间断能力;实际上,容灾系统的整个灾难恢复过程必须会造成一段时间的业务中断。另外,也正是因为可以容忍一段时间的业务间断,所以其实施难度、周期和规模都要远远小于实现业务持续性系统的建设。

从广义上讲,任何提高系统可用性的努力,都可称之为容灾。本地容灾,例如主机集群:当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续进行正常工作。而我们平时讲到的容灾,尤其是值得重视的容灾,一般都是指远程容灾。远程容灾可以这样理解:在各行业企业用户的IT系统中,必然有一部分(尤其是核心部分)是非常重要的,我们叫它生产中心。人们往往给生产中心配备一个备份中心,该备份中心是远程的,并且在生产中心的内部,已经实施了各种各样的数据保护。不论采取什么方式进行保护,当火灾、地震这类突发性灾难发生时,一旦生产中心瘫痪了,备份中心将能接管生产系统,继续提供网络服务。比如,全国铁路调度中心网

络系统,当发生火灾、地震等灾难性事件时,该系统仍要保持正常进行,不能因为调度中心出现灾难性事件,全国的铁路系统就处于瘫痪状态,让灾难不合理地蔓延。

我们认为,一个有效的高可靠性计算环境应该能够做到:

●数据中心任何计算机系统硬件,软件及应用的单点故障将不会影响整个数据中心的处理工作;

●数据中心由于灾难(火灾、地震、断电)等原因无法工作时,应有一个备份数据中心能够迅速接管关键应用,继续运行;

●主数据中心恢复后,应用系统、业务数据应能迅速切换回主中心运行。

4.2.7 灾难及应对分析

4.2.7.1 灾难的定义

一般来说,人们可将灾难分为下面几个类型:自然灾难(洪水、飓风、地震),外在事件(电力或通讯中断)、技术失灵(电脑宕机或网络受损)、设备受损(火灾)及人为操作(黑客入侵、恶意破坏、员工误操作)等。在本文中,灾难的定义主要是指自然的和人为的灾难,包括系统硬件,网络故障,机房断电,人为破坏甚至火灾地震等,例如台湾的台北大地震导致该区域内建筑及大部分机器均遭到严重破坏。而突发性灾难发生从而引发的IT 系统崩溃的后果将可能导致生产停顿,失去客户以及减少定单、收入,甚至威胁到企业的生存。

灾备系统面临着多种可能出现的风险和灾难因素,从类型上可以大致分为自然灾害和人为因素;从发生的概率看可以分为比较可能,可能,和基本不可能。分析各种风险是制定相应的容灾策略以预防或尽可能降低灾难影响的基础。

对业务环境中可能发生的突发性灾难归纳如下:

以上列出的灾难因素分析仅作一般性参考。灾备系统的具体情况(IT

系统环境,地理,人文,社会服务环境等),可以在项目的风险分析阶段针对性的明确与细化。

另一方面,从灾难的后果和影响来看,大致可以分为两大类:

业务停顿,但一般可以在能忍受的时间内完成本地修复,不需要异地切换。

例如:机房电源设备发生故障、IT设备软硬件故障、消防系统和空调系统等机房环境告警、人为因素误操作的情况等,电信供应商的IT系统普遍建立了相应的本地高可用性系统(HA)、备份/恢复策略,运维管理流程,并购买了IT厂商高级别支持服务,以及其它一些基础设施的防护措施等。我们建议×××首先应立足于现有系统环境,在现有条件下解决自身的灾难预防和风险规避问题,尽可能避免发生大的突发性灾难并降低灾难的破坏力。

同时需要统筹规划容灾系统的建设,按系统的方法论分阶段、有步骤进行相应的分析、设计、实施、测试、人员培训等工作。这也正是目前容灾规划所关注的课题。

4.2.7.2 容灾可以达到的目标层次

根据企业自身的现有环境、客观条件、投资规模、实施阶段的不同,容灾方案可以达到多种目标层次,这些层次可以在企业不同的层面上实现不同的容灾功能要求。下面的图表展示了各个容灾层次:

关于这些层次的描述如下:

数据保护:

数据保护的目标是防止企业在意外情况及突发灾难下丢失数据,通常采用异地数据备份或存储介质镜像的方法保护企业的数据资产。

应用保护:

应用保护的目标是在发生意外时不仅可以实现数据恢复,还要能够将数据恢复到灾难发生前的存储状态,以重新恢复应用系统,由于应用系统的数据通常都保存在数据库中,所以应用保护要保护应用数据以及调用这些数据的数据库,这层保护所采用的方法包括利用数据库事务日志和数据库/应用的备份。

同时应用保护使企业在意外发生时可以使用备用的系统进行业务操作,通常的策略是使用冗余的后备系统,利用高可用方案或群集技术实现系统切换。

系统保护:

系统保护更提高一个层次,它的目标是使企业在意外发生时可以使用备用的IT系统环境进行业务操作,通常的策略是使用冗余的后备系统,利用高可用方案或群集技术实现系统切换。

网络保护:

网络保护的目标是保证整个企业内网络环境的高可用性,通常的保护策略包括冗余网络,自动或手动路由调整,备份网络设备,以及网络环境数据的备份保护等。

数据中心保护:

数据中心保护的目标是保护作为整个业务节点的数据中心的高可用性,即在整个业务节点所依赖的所有IT系统崩溃时,使用后备的数据中心支持业务节点的工作。

运营节点保护:

和数据中心保护不同的是,运营节点保护的目标是抵御影响整个运营节点的物理建筑的灾难,这预示着需要有备份地点来用于业务处理。它和数据中心通常都使用包含整个业务支撑系统的冗余备份节点来实现,但是出于运营节点保护的需要,该备份节点距原来的运营节点的物理距离应至少在75公里以上,而且在灾备运营节点不但要有冗余的IT系统环境和网络环境,还应包括能够实现业务运营的相关资源,如业务人员、营业环境等。

地区保护:

最外层是地域的保护,它应对的对象是影响整个地区的灾难,如飓风,地震,暴风雪等。通常采用的容灾方式为远距离的容灾备份节点。

4.2.7.3 数据的远程复制

通常说来,对于远程灾难恢复方案建议用户建立两个数据中心,主中心和备份中心。正常情况下,应用运行在主数据中心的计算机系统上,数据也存放在主中心的存储系统中。当主数据中心由于断电,火灾甚至地震等灾难无法工作时,则立即采取一系列相关措施,将网络、电话线路切换至备份中心,并且利用备份中心计算机系统重新启动应用系统。

而这里最关键的问题就是切换过程时间最短,同时尽可能保持主数据中心和备份中心数据的连续性和完整性。而由于财务数据的重要性,如何解决主、备中心数据库数据备份,恢复则是灾难恢复方案的重点。

传统的磁带备份方式一般采取定点备份,而当系统崩溃时。距最近一次备份时间之间的数据将全部丢失,无法恢复。而且磁盘备份恢复时间比较长。由于速度慢,缺乏实时性,无法满足用户大数据量数据恢复及数据库连续性,实时性的要求。

而现在流行的灾难恢复方案主要是采用实时的数据备份的方式。它的主要原理是通过通信线路,实时地将主中心更新数据拷贝至备份中心存储系统中,保证主、备中心数据的实时一致性。当主中心无法工作时,备份中心可以立即接管业务,并且确保数据的最大完整性。其主要实施方法有:

◆应用中间件软件的实现方式:通过对应用程序的修改,利用交易中间件软件,将在线交易同时在生产中心和灾备中心执行;或者通过交易中间件软件将任何主中心的数据改变发送到备份中心,从而保证生产中心和灾备中心的数据一致性。这种方式的优点是对网路带宽的要求较低,缺点是需要修改应用。

◆利用数据库厂家的软件产品完成远程备份:现有的一些数据库厂家例如Oracle数据库可以提供STANDBY数据库功能,通过通信网络将实际

数据库日志文件传至备份中心存储系统,备份中心的STANDBY数据库按照主数据库结构从日志文件中重新恢复数据库。这种方法投资成本小,数据恢复相对磁带较快,缺点就是占用主机资源,日志文件建立过程中发生灾难时,则该日志数据将丢失。

◆利用数据复制软件完成远程备份:现有的一些EAI厂家的产品,例如TIBCO可以提供数据库和应用的数据的远程复制功能,通过安装在数据库和应用上的agent对数据库数据和应用数据进行监控,如果发生数据的变化就将变化发布到通信网络上,由具备接收能力的agent将数据接收下来,通过数据库接口将数据输入备用数据库。这种方法投资成本小,数据恢复相对磁带较快,可以实现灵活的数据复制策略,可以是不同的数据库软件和不同的平台,缺点就是占用主机资源和存储资源。

◆利用系统软件的镜像功能完成远程备份:利用操作系统的镜像工具软件,如HP MirrorDisk/UX和Volume Replicator,同时将数据写到本地和远程的数据中心。采用这种方式与应用和存储都无关,可实现异构存储且不需修改应用,缺点是对通信的质量要求较高。

◆基于存储的灾难备份方式:通过高端存储阵列容灾:通过惠普高端存储阵列产品HP EVA系列,可以实现主数据中心和备份中心的操作系统、文件系统、数据库的实时拷贝维护。不占用主机CPU,内存,I/O资源,如果企业已经拥有高端存储设备,则采用该方案非常理想,其缺点是两端必须采用同样的存储设备。

容灾技术对比表

根据灾备系统的现状,我们认为采用基于存储硬件级的复制方式来的实现异地系统的容灾方案才是符合灾备系统实际需求的,以下对将采取的技术进行介绍。

4.2.8 系统建设的目标

灾难备份/恢复系统的设计目标主要应从以下四个方面来考虑:

具体数据类型与目标的灾难保护:从灾备系统正常运作的角度分析各种业务数据,作出重要性与可恢复性要求的评估,并由此制定系统的数据灾难保护策略。

灾难发生后的可恢复业务分析:对灾备系统各个业务与管理流程进行分析评估,并由此制定系统业务的灾难备份政策,建议通过智能存储设备进行实时远程数据复制,首先实现数据级容灾。同时系统通过备份管理软件将其数据备份到大容量磁带库,实现对制证数据的本地保护。

灾难发生后的可恢复分析:对于突发性灾难这样的重大事件,有时受灾地区并不苟求所有系统的所有应用必须立即恢复运营,故可按比例和实际需求进行分析,并由此配备相应的设备。

灾难发生后的业务可恢复时间指标:我们通常将灾难的发生分为两类,一类

是可以预计具体时间的灾难,如损害性极大的台风,计划内的大面积电力系统检修等;另一类是不可预计突发性的灾难,如地震、恐怖袭击,主机系统的非计划性宕机等。针对两种不同灾难,要设定不同的恢复时间指标;并根据不同业务系统的各自特点,确定不同业务系统的灾难恢复时间.

4.2.9 系统建设的原则

根据灾备系统的实际情况,充分利用现有软硬件资源、网络资源,建立高性能、低成本的容灾系统。灾备系统容灾系统的建设原则应包括:(1)确保灾难情况下重要数据的安全存储;

(2)确保灾难发生后系统运行的及时恢复,包括数据的恢复;

(3)将灾备系统因灾害而导致的利益损失降低到最小程度;

(4)坚持容灾备份系统建设投资经济合理性的原则;

(5)确保系统的可扩充性、可维护性、可操作性;

(6)建立健全相应严密的管理制度和操作流程。

4.2.10 业务系统现状

灾备系统是以计算机技术为依托的信息处理系统。其安全性、可靠性极为重要,如果数据发生损坏、丢失,其后果将极为严重,不仅仅是影响了灾备系统的正常运行,有时甚至可能给个人、单位以至国家都带来无法估量的损失。尤其核心存储系统属于整个灾备系统业务集中处理系统,如果发生不可预见的故障和灾难,导致整个系统的崩溃,其影响将更大。因此,业务的拓展与灾难的防范是我们必须同等重视的问题。

灾备系统随着业务开展的深入,数据量的增加,必然要考虑建设灾难\备份中心,其目的就是在于防止一些灾难性的小概率事件可能对集中式信息系统造成的不可恢复的原始数据的丢失,这些灾难性事件可能包括为火灾、水灾、地震、电源故障及一些人为的操作失误等等。

目前的容灾系统绝大多数是以硬件容灾为主,因为其可靠性最高、性能最佳。硬件容灾要求存储阵列为较高档次的存储系统,这种高档次的阵列能够做到数据不通过主机就可以进行远程复制,如HP公司的EVA系列等可以实现硬件

容灾。

针对这些需求,我们为×××灾备系统设计了一套容灾方案供参考。

4.2.11 灾备系统灾难备份系统解决方案(以下设备型号为示例)

在异地容灾方式下,主中心与灾备中心同处×××在的城市——***。主中心的地点选在×××所在地;灾备中心则可根据用户选择。

在主中心,核心的数据系统是由两台RX6600服务器和一台EVA4000存储组成的业务系统。其连接方式均采用光纤连接。

在异地灾备中心我们同样选择EVA4000作为核心存储设备,并作为数据远程复制的介质。服务器我们选择一台RX6600作为灾难或紧急情况下业务恢复使用。连接方式同样采用光纤连接。数据的远程复制通过基于存储设备的HP Continuous Access EVA软件来实现。

主备中心之间的数据传送链路是容灾方案的一个重要部分。可以采用直接连接光纤或者DDN专线的方式。

该同城容灾方案的配备如下:

这一同城容灾方案的特点为:

在同城构建容灾平台,具有了一定的防灾抗灾能力;

无须对主机平台,应用系统和数据库结构进行任何修改,大大降低容灾方案实施风险;

数据容灾对主机系统透明,无须占用主机资源;

可以在主机或EVA磁盘阵列上灵活实现数据镜像卷对的生成,拆分,同步和删除操作,并可与应用脚本集成,自动运行;

容灾方案成功案例众多,技术成熟,安全稳定;

用户可以根据容灾距离和对性能的要求,选择采用CA同步复制方式,保证数据传输一致性和完整性,不会造成业务数据的瘫痪;

灾备中心配备主机,可以支持查询业务,同时也具有了在紧急情况下快速恢复业务的能力。

4.2.11.2 在灾备中心增加查询功能(未来)

容灾在保证数据安全性和在生产系统正常运转的情况下,还可以被用来

开展诸如数据挖掘、经营分析以及用户查询等其他业务,从而使为防止灾难

而采购的软硬件设备在平时也能得到很好的应用。

灾备系统的容灾方案设计保证了在灾备中心有一份完整的业务数据的

拷贝,因此这部分数据可以利用来进行数据查询系统的构建。

灾备云建设方案

科力锐灾备云服务项目方案书 深圳市科力锐科技有限公司 2019年2月

目录 一、项目服务背景................. 错误!未定义书签。 二、项目服务特点 (4) 三、科力锐灾备云平台和服务简介 (6) 四、科力锐灾备云平台和服务特点 (12)

近年来,国家大力推动“互联网+”战略,即通过“互联网+各个传统行业”的形式,利用先进的信息通信技术与传统行业进行深度融合,改造传统的生产、办公、经营方式,提高各个企事业单位的效率,创造新的发展生态。政府信息化全力推进,政府部门间、对企业、公民的政务全部以电子化开展,即用电子化、无纸化办公的形式取代传统的依靠纸质文档和人工流转办公的方式,大幅提升工作效率。企、事业单位也将生产、办公系统化,为繁荣社会经济、扩大城乡就业、增加财政收入、推动自主创新和促进科学发展发挥了重要作用。但部分企、事业单位依然存在着资金短缺、人才匮乏、管理滞后、信息化能力弱、产品和市场信息不畅、市场竞争力不足、互动渠道窄等问题,限制了产业竞争力的提升。 在国家推动“互联网+”战略的大背景下,企事业单位信息化系统急需数字化转型,数据资产化趋势明显,同时业务系统已经成为各个组织单位的“生命线”,越来越多组织已认识到灾备的重要性。 然而,由于主机故障、系统故障、软件逻辑错误、人为操作失误和病毒攻击(例如勒索病毒)等众多风险高发引发灾难,极大的威胁了企事业单位的IT应用系统的安全和服务的连续性,需要能够提供灾备服务作为防范各类风险的最后一道屏障,帮助发生系统灾难的企事业单位快速的恢复IT应用系统保障生产经营工作得以正常开展,意义十分重大。 因此,一方面需要考虑如何保障组织的核心数据资产不丢失,另一方面需要考虑如何保障组织的核心业务系统不停或者少停。 从灾备的角度而言,各企、事业单位将会面临以下几点挑战: 1、如何获取专业的灾备技术服务,降低数据丢失风险,满足数据保护需求。 2、如何能在降低灾备建设成本的基础上,让各单位都能够低成本使用成熟、可靠的 灾备技术方案,保障核心数据资产不丢失。 3、如何在缺乏专业的灾备运维管理人员,管理人员技术水平参差不齐的现状下,确 保在核心业务系统出现问题而中断时能够快速进行恢复。 4、如何在IT架构混合化、多元化的大环境和趋势下,确保灾备技术方案能面向未来 的适应各单位数据中心的快速扩展。

同城灾备系统实施方案

XXXXXXX客户中心机房设备监测及同城容灾系统项目 灾备系统实施方案 2011年5月25日 XXXXXXX有限责任公司信息中心

目录 第1章项目背景 (3) 第2章目标和范围 (3) 第3章灾备系统的规划 (4) 3.1.总体建设原则 (4) 3.2.灾备系统架构 (5) 3.3.数据复制策略 (5) 第4章灾备系统的实施 (6) 4.1.灾备DS5100的配置 (6) 4.1.1.磁盘组的划分 (6) 4.1.2.LUN的划分 (7) 4.1.3.存储HOST的配置 (8) 4.2.复制存储网络的配置 (9) 4.2.1.生产中心SAN连接 (10) 4.2.2.灾备中心SAN连接 (10) 4.2.3.Zone的划分 (10) 4.3.ERM的配置步骤 (12) 4.3.1.初始安装和配置 (12) 4.3.2.创建镜像关系对 (12) 第5章灾备数据验证 (19) 5.1.公文系统灾备数据的验证 (19) 5.2.邮件系统灾备数据的验证 (20) 5.3.财务银行系统灾备数据的验证 (21) 5.4.财务管理系统灾备数据的验证 (23) 5.5.统计报表系统灾备数据的验证 (24)

第1章项目背景 第2章目标和范围 灾备系统的建设是个循序渐进的过程,从灾备系统的业务和数据恢复能力上,可以将灾备系统分为数据级灾备系统和应用级灾备系统。数据级灾备系统的关注点在于数据保护,即灾难事件发生后如何确保重要信息系统的关键数据不会丢失或者遭到破坏。应用级灾备系统是在数据级灾备系统的基础上,不仅提供数据保护功能,而且还提供灾难事件发生后的业务接管能力。 XXXXXXX根据行业内信息系统的现状和灾备建设的总体规划,确定本项目的灾备建设目标为同城数据级灾备系统。 同城灾备系统与生产中心处于同一地理区域,面临同一区域性灾难风险,故同城灾备系统用于非区域性灾难事件,即:生产中心发生的设备故障,或者人为操作错误,以及生产中心所在建筑发生的水灾、火灾、电力异常等突发事件,导致生产中心重要信息系统的关键数据部分损坏或者完全丢失,致使生产中心业务系统陷于停顿。 本项目中,灾备系统建设的范围将涵盖集团公司重要信息系统的关键数据,这些重要信息系统包括: ?财务银行系统 ?财务管理系统 ?统计报表系统 ?人力资源系统 ?运销系统 ?协同办公系统

灾备技术分析

1.1.1灾备技术分析 1.1.1.1灾备等级建议 设计一个灾备系统,需要考虑数据安全保障、网络带宽、数据备份/恢复可用,关系到备份/恢复数据量大小、数据中心和灾备中心间的距离和数据传输方式、灾难发生时要求的恢复速度等。根据这些因素,通常将灾备分为四个等级。 第0级,无灾备中心:这一级灾备,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。 第1级,本地磁带备份,异地保存:在本地将关键数据进行备份,然后送到异地保存。灾难发生后,按照预定数据恢复程序恢复系统和数据。 第2级,主备站点备份:在异地建立一个热备份点,通过网络以同步或异步方式把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点将接替主站点的业务,从而维护业务的连续性。 第3级,活动灾备中心:在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份需要配置专用的硬件设备和复杂的管理软件,需要的投资相对而言是最大的,但恢复速度也是最快的。 通过比较分析,本项目拟采用灾备第2级进行数据灾备系统的建

设。 1.1.1.2灾备类型分析 灾备系统可以分为业务级灾备、数据级灾备、应用级灾备共三种类型。 (1).业务级灾备:主要在应用软件开发阶段,对数据进行主用数据库和灾备数据库的提交,这种方式需消耗10%左右的主机资源,对网络的要求也很高,因为其数据几乎是实时传递的,此外这种方式对系统开发人员要求极高,要注意每个模块跟数据相关的代码,否则极容易出现数据不一致的情况。 (2).数据级灾备:有基于存储阵列的数据镜像和基于管理软件的数据镜像两种方式。前者跟主机以及现有的IP网络没有关系,它通过FC(或FC-IP-FC)来实现阵列一级的数据同步,整体投资大,但数据安全性最有保障,且应用系统较多时实施较方便;后者需消耗10%~30%的处理器资源,对网络环境依赖较大。传统的数据备份可以认为是初级的数据级灾备方式,只是实效性差。 (3).应用级灾备:主要用于基于数据库的灾备,这种方式的系统变更的数据可以通过数据库本身的功能,通过IP网络从数据中心复制到灾备中心,这种方式不用兼顾应用层面和存储层面,整体成本是比较低的。传统的应用级灾备是通过主机一级的卷复制来实现数据灾备,对网络、主机的资源消耗较大。 根据业务需求并通过比较分析,本项目拟采用应用级的数据灾备方案。

医院数据中心异地灾备系统建设

1 医院数据中心异地灾备系统建设 医院数据中心 异地灾备系统建设 项目建议书 迪思杰(北京)数码技术有限公司 2010-8-24 目录

1 项目背景 随着医院信息化进程的不断深化,信息系统成为了支撑医院业务运行的重要平台,医院的全部业务服务来运作。为了保证该系统的稳定、安全、有效的运行,医院的IT部门都采用了双机、RAID、盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者数据丢失。但大部制,一旦数据库或硬件出现故障,较长时间不能恢复,对医院来说都是一次灾难,将会给给医院的了极大的经济损失: ü广东省人民医院电脑故障让患者受累 ü北京妇产医院挂号故障千人排队苦等 ü上海市第十人民医院停机4个多小时 ü通山县人民医院电脑故障无法交费老汉等2小时猝死检测室 ü闵行区医院电脑故障千余人等数小时挂号 ü华山医院网络故障2小时取不了药 ü中山市中医院系统出现故障,医院收费环节完全瘫痪,导致数千人看病受到ü第八人民医院医院电脑临时出故障沟通不畅引患者投诉 ü北京安贞医院电脑系统出现故障,造成大厅聚集近百名患者 ü上海一医院突发电脑故障造成大量病人滞留 ü齐鲁医院电脑突发故障患者排长队苦等 ü上海龙华医院电脑系统故障致排队人群至门口 ü东方医院电脑系统突发故障数百患者苦等三小时 因此迫切需要建设容灾系统,以保证计算机业务系统的连续运行,并提高信息系统抵御突发性灾难 本方案是迪思杰(北京)数码技术有限公司根据****医院提出的以上需求,所提出的利用DSG Real 的实时复制,从而满足“建设容灾系统,实现数据的远程备份和业务的不中断运行“的需求。DSG Realsync数据同步复制目前在国内有200多家客户,占到第三方数据复制软件市场70%以上的

XX银行灾备系统建设

银行灾备系统建设 在建设灾备系统的过程中,XX银行遵循国际灾备组织的科学方法论,在风险分析、业务影响、灾备策略、技术方案、业务连续性等灾备建设的各环节,借力专业服务商的能力与经验,在较短的时间内快速、高效地完成XX银行灾备系统的建设工作。 近年来,随着业务的高速发展,XX银行信息化建设的力度也越来越大,各类系统和数据逐步实现大集中,IT对业务的整体覆盖率达到84%。IT的大集中也带来了系统风险的集中。作为银行业务连续运行的保障,灾备系统建设一直都是科技部门的一项重要工作。XX银行十分重视这项工作,其灾备系统建设经历了数据异地备份、灾备系统外包和自建灾备中心等几个阶段。本文将对XX银行的灾备系统建设进行回顾和思考,并探讨了下一步的建设思路。 一、建设灾备系统的必要性 1.银行业务发展的需要 相关资料表明:金融行业在灾难停机两天内所受损失为日营业额的50%,如果在两个星期内未能恢复信息系统的正常运作,75%的公司将出现业务停顿,43%的公司可能再也无法开业,没有实施灾备系统措施的企业60%将在灾难后的2~3年间破产。由此可见,灾备和业务连续性建设直接关系银行生死存亡和可持续性发展的关键问题。 2.监管合规性的要求 一直以来,监管部门对银行信息科技风险管理给予了高度重视,近期也已连续发布了一系列的监管指引和要求。银监会下发的《商业银行数据中心监管指引》中明确要求:商业银行应于取得金融许可证后两年内,设立生产中心;生产中心设立后两年内,设立灾备中心;总资产规模一千亿元人民币以上且跨省设立分支机构的商业银行应设立异地灾备中心,灾难恢复等级达到《信息安全技术信息系统灾难恢复规范》中的第5级实时数据传输及完整设备支持。业务的发展和监管,都要求必须建立起完善的灾备体系和业务连续性保障体系。 二、灾备系统建设思路 如何建设灾备系统需要周密规划:除了要考虑技术实现外,还要考虑各类业务的不同需要;除了考虑资源投入外,还要考虑产出和利用;除了考虑通用的灾备模式,还要考虑自身的情况和能力。总之,没有所谓最好的灾备系统,只有最符合自身需要的灾备系统。 1.建设模式选择 目前,国内银行在进行灾备体系建设时一般有自建和外包两种模式,各有优缺点。自建是指银行独立建设数据中心,此模式具有较高的可靠性与安全性,但投入大、周期长,对银行技术人员的能力要求较高,适用于大型金融机构。外包是指由专业服务商在其数据中心内为银行提供数据与系统的灾备服务,此模式也能达到一定可靠性,投入小、周期快,对银行

灾备系统技术方案

目录 第1章灾备系统技术方案 (3) 1.1异地灾备项目概述 (3) 1.1.1项目目标 (3) 1.1.2项目范围 (3) 1.1.3项目建设原则 (3) 1.2项目建设整体集成工作需求分析 (4) 1.2.1XX图书馆异地灾备系统的总体要求分析 (4) 1.2.2XX图书馆存储设备现状分析 (6) 1.2.3异地灾备存储系统的技术要求分析 (8) 1.2.4项目建设重点工作分析汇总 (8) 1.2.5项目建设工作难点分析 (10) 1.3灾备系统技术方案 (13) 1.3.1方案的总体设计 (13) 1.3.2灾备建设的总体方案 (14) 1.3.3数据级灾备平台设计 (31) 1.3.4灾备链路及SAN网络设计 (33) 1.3.5核心业务数据同步复制技术方案 (38) 1.3.6非核心业务数据异步复制技术方案 (47) 1.3.7长期保存数据的灾备技术方案 (55) 1.4我方投标灾备技术方案优势 (59) 1.4.1与现有存储系统整合最好的灾备方案 (59) 1.4.2提供业界最先进存储灾备技术 (60) 1.4.3最合理的SAN网络设计及灾备链路方案 (60)

1.4.4采用业界评价最高的存储 (61) 1.4.5业内唯一可提供100%数据可用性承诺的存储 (62) 1.4.6业界公测性能排名第一的存储 (63) 1.4.7业界第一款支持双活存储集群的存储 (67) 1.4.8内置存储虚拟化功能 (72) 1.4.9扩展能力极其出色 (82)

第1章灾备系统技术方案 1.1异地灾备项目概述 1.1.1项目目标 通过建立XX图书馆异地灾备系统,提高XX图书馆核心业务系统的风险抵御能力,避免或减少灾难打击和重大事故对XX图书馆及XX图书馆核心业务系统和重要系统造成的损失,确保核心业务系统的数据安全和作业持续性,实现核心业务数据异地实时同步复制、非核心业务数据以及各类数字资源异地保存。 1.1.2项目范围 1、异地灾备系统的建设:包括存储设备、配套设备及软件的安装、调试和集成,机房综合布线实施等。 2、异地灾备系统的培训:提供异地灾备系统使用及运维培训,确保用户能够熟练掌握、使用和维护异地灾备系统。 1.1.3项目建设原则 XX图书馆异地灾备系统建设须遵循以下原则: 1、可靠和实用性原则 异地灾备系统的设备选型、设计规划和实施方案、运维方案等方面均需考虑可靠性,实用性。 2、可扩展性原则 异地灾备系统的设备选型和软件应充分考虑可扩展性,能满足由于业务增长和业务需求带来的扩展要求。 3、成本效益原则 根据灾难恢复目标,按照灾难恢复资源的成本与风险可能造成的损失之间取得平衡的原

虚拟化技术灾备解决方案原理分析

虚拟化技术灾备解决方案原理分析 虚拟化技术灾备解决方案的核心思想是双向复制,数据在其他地方实时产生一份可用的副本,此副本不需要做数据恢复,即可投入使用,当中断恢复后再还原回去。 当主服务器突然发生故障或者因其他损坏而停止工作时,和主服务器同步并做备份的虚拟主机开始启动,它将临时客串成为主服务器,同时向管理员发送邮件或者直接发送通知到管理员的移动终端上。当主服务器恢复后,虚拟机上包括操作系统、数据库、应用程序和其他相关数据都被无缝地迁移回原来的主服务器。完成这些操作只需要轻松地点击几下鼠标,用户根本感觉不到曾有业务中断。“这一切都是利用虚拟化技术灾备解决方案所带来的方便。”Novell公司工程师杨英宏说。 用户大量的业务系统依靠IT作为支撑,如果IT系统环境出现问题,将很难保证业务的正常运行,同时带来较大损失。市场上流行着各种各样的灾备技术和系统,但是,由于传统灾备系统的安装、配置和复杂度比较高,价格也比较昂贵,用户80%的投入只保护了20%的服务器,而且并不能真正保证业务运行。 灾备的目的是当灾难发生后,要立即恢复系统,尽快投入使用,所以灾备采用的各种技术,无论是数据备份、数据复制还是其他技术,都将围绕着业务的连续来进行。衡量这些灾备技术的指标主要是RPO(Recovery Point Object,恢复点目标)和RTO(Recovery Time Object,恢复时间目标)。 在虚拟化技术的灾备解决方案中,把要备份的目标定义为工作负载,这是指独立于硬件平台之上的一些应用运行环境,包括操作系统、数据和应用。 虚拟化技术灾备解决方案的核心思想是双向复制,数据在其他地方实时产生一份可用的副本,此副本不需要做数据恢复,即可投入使用,当中断恢复后再还原回去。数据复制的最大好处是副本数据立即可用,没有数据恢复时间,RTO 非常好。因为是实时复制,RPO也非常好,几乎不会丢失多少数据。

灾备方案

1.数据中心容灾备份解决方案 随着社会的发展和科技的进步,政府日常工作越来越依赖于数据处理来进行,政务系统的连续性依赖于数据中心系统的稳定运行。然而,灾难就像灰尘一样伏击在运营环境周围,政务系统的数据中心可能正在一个充满风险和威胁的环境下运行。如果不能对这些风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成严重的影响。如果核心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失。因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题。 1.1灾备解决方案原则 首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。 第二,数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的; 同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。 第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线。 第四,系统恢复时间要尽可能短。容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务。但往往在灾难发生时,主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进行操作。 第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其 他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。 第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括:SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以及快照技术等。其中基于IP的SAN远程数据容灾备份技术应用比较广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的。当备份中心存储的数据量过大时,可利用快照技术将其备份

服务器灾备方案

服务器灾备方案 一、服务器灾备的目的 服务器灾备计划就是在平时对服务器的重要数据、数据库、配置文件、应用服务等做备份,为了在发生重大灾难或者事故后,能尽快将原服务器中重要的数据、数据库或者应用服务等恢复出来继续给客户提供服务。 ※本方案适用于基于Windows操作平台下的服务器。 二、主要的服务器备份方式 按备份系统的准备程度,可将其分为冷备份、温备份和热备份三大类。 冷备份备份系统未安装或未配置成与当前使用的系统相同或相似的运行环境, 应用系统数据没有及时装入备份系统。一旦发生灾难,需安装配置所需的运行环境,用数据备份介质(磁带或光盘)恢复应用数据,手工逐笔或自动批量追补孤立数据,将终端用户通过通讯线路切换到备份系统,恢复业务运行。优点:设备投资较少,节省通信费用,通信环境要求不高。缺点:恢复时间较长,一般要数天至1周,数据完整性与一致性较差。 温备份将备份系统已安装配置成与当前使用的系统相同或相似的系统和网络运行环境,安装了应用系统业务定期备份数据。一旦发生灾难,直接使用定期备份数据,手工逐笔或自动批量追补孤立数据或将终端用户通过通讯线路切换到备份系统,恢复业务运行。优点:设备投资较少,通信环境要求不高。缺点:恢复时间长,一般要十几个小时至数天,数据完整性与一致性较差。 热备份备份处于联机状态,当前应用系统通过高速通信线路将数据实时传送到备份系统,保持备份系统与当前应用系统数据的同步;也可定时在备份系统上恢复应用系统的数据。一旦发生灾难,不用追补或只需追补很少的孤立数据,备份系统可快速接替生产系统运行,恢复营业。优点:恢复时间短,一般几十分钟到数小时,数据完整性与一致性最好,数据丢失可能性最小。缺点:设备投资大,通信费用高,通信环境要求高,平时运行管理较复杂。 在计算机服务器备份和恢复中,冷备份服务器(cold server)是在主服务器丢失的情况下才使用的备份服务器。冷备份服务器基本上只在软件安装和配置的情况下打开,然后关闭直到需要时再打开。 温备份服务器(warm server)一般都是周期性开机,根据主服务器内容进行更新,然后关机。经常用温备份服务器来进行复制和镜像操作。 热备份服务器(hot server)时刻处于开机状态,同主机保持同步。当主机失灵时,可以随时启用热备份服务器来代替。

数据中心灾备系统建设方案

数据中心灾备系统的分类 来源:机房360 作者:林小村更新时间:2010/11/19 11:50:11 摘要:本文为大家讲述数据中心的一些技术知识,具体为您讲述数据 中心灾备系统的分类情况。 根据数据中心的安全要求,应对灾难恢复系统采用的技术路线做出全面的考虑。 1.数据级容灾和应用级容灾 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。 (1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程

数据复制技术问题;同步与异步容灾问题。 (2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。 应用级容灾系统是建立在数据级容灾系统基础上的,同时能完成数据和应用系统环境的复制存放和管理。为实现发生灾难时的应用切换,容灾中心需要配置与工作系统同构和相同功能的业务网络、应用服务器、应用软件等。 应用级容灾还需要考虑数据复制的完全性、数据的一致性、数据的完整性、网络的通畅性、容灾切换的性能影响、应用软件的适应性改造等问题,以及为保证业务运行的所需设备、环境、人员及其相应的管理。 2.灾难恢复系统的在线/离线模式 (l)在线模式。在线灾难恢复系统要求工作系统与灾难备份系统通过网络线路连接,数据通过网络实时或定时从工作系统传输到灾难备份系统。对数据保护的实时性高,对业务连续性要求高,就需要采用在线模式。 (2)离线模式。离线灾难备份系统的数据通过存储介质(磁带、光盘等,搬运到异地保存起来实现数据的保护。离线模式适合于对数据保护的实时性要求不高的场合,离线模式设备比较简单,投资较少。 3.数据备份技术 正常情况下系统的各种应用在数据中心运行,数据存放在数据中

DR容灾网关--技术方案(本地灾备 简要)

为满足核心业务、数据的保护,本次灾备建设方案主要对多台Windows、Linux服务器及虚拟机服务器镜像保护。采用基于柏科DR容灾网关系统实现数据灾备解决方案:使用DR容灾网关对核心数据进行镜像,采用快照实现数据的逻辑错误恢复,采用一键式P2V启动功能实现操作系统的快速恢复;在本地信息中心,使用数据容灾网关特有的备份、归档功能对数据进行离线保护,最大程度对数据进行全方位的保护。 数据镜像 FC-SAN 数据镜像 部署说明 在生产中心部署一套DR3300容灾网关,利用DR3300容灾网关的数据镜像、智能快照、CDP持续数据保护、远程复制等技术实现本地应用级灾难接管。 ●架构规划 在生产中心增配一台DR容灾网关系统,DR容灾网关采用旁路非侵入式部署,只需加入FCSAN存储网络,即可以对生产中心多台服务器本地硬盘的操作系统、应用及核心存储数据进行保护,实现本地数据容灾保护。 在生产中心配备用虚拟化平台,可在本地系统出现故障时,5分钟内实现P2V 应用级业务接管。 ●业务及数据保护 客户端代理:在生产中心受保护服务器上安装客户端磁盘Agent映像代理软

件,将中心服务器硬盘数据或磁盘阵列数据镜像到DR容灾网关中。DR容灾网关通过磁盘Agent代理软件与这些应用程序集成或被直接调用,有相关的代理程序驱动数据库进入静止状态来做快照,来保证数据的一致性。 数据镜像:将DR容灾网关分别与应用服务器连接并分配相应的保护数据卷,满足各应用服务器数据的保护需求。平时对核心服务器的系统卷和数据卷均做镜像(MIRROR),通过磁盘镜像技术可以防止核心磁盘存储系统或服务器磁盘故障,发生故障时可以直接用DR容灾网关接替工作,对外提供服务,数据零丢失快照保护:通过对镜像的数据快照保护,保证了一体化保护设备上面保存了各应用服务器关键数据的多个历史副本,从而在发生逻辑错误(人为误删除、病毒感染、软件故障等)时可以快速恢复数据,重新起用应用。 数据的一致性保证: Oracle、MSSQL等都是结构化数据库,DR容灾网关快照与这些应用程序集成或被直接调用,有相关的代理程序驱动数据库进入静止状态来做快照,来保证数据的一致性。 持续I/O数据保护:对每个I/O操作进行持续“录像”保护,如果发生的是误删除、数据文件病毒感染、数据库损坏、数据不一致等情况,可恢复最近任意时间点的数据,数据丢失量(RPO)达到秒级。 远程数据复制:可以通过IP网络采用加密压缩和精简复制技术,将本地生产中心数据完整地复制到异地的DR容灾网关设备上,实现真正的异地容灾系统,使用精简灾备和数据压缩等传输技术,数据传输带宽只需要传统灾备1/8-1/32,传输成本大为降低。(后期可升级建设灾备站点) 灾难恢复 对数据存储的保护:如果本地生产中心核心磁盘存储系统故障,可以直接用DR容灾网关接替工作,对外提供服务,在数据“零”丢失的同时保证业务的连续性,避免了原有存储系统的单点故障。 远程启动功能:如果本地服务器操作系统故障,可用通过DR容灾网关SAN BOOT功能实现远程启动恢复操作系统和应用系统,防止操作系统和应用系统的故障。

两地三中心灾备解决方案

两地三中心灾备解 决方案

现,可实现生产与灾备服务器之间数据的实时复制和应用的快速切换。异地灾备中心由于其与生产中心不在同一机房,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,应用系统的切换也需要一定的时间,因此异地灾备中心能够实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。 1. “双活”+异地容错的技术方案 1.1 备端在线两地三中心灾备方案网络设计 本地容灾是指在本地机房建立容灾系统,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,本地双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点;异地灾备中心是指在异地建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心能够用备份数据进行业务的恢复。针对两地三中心灾备建设的需求,我们结合我们自主研发的软件的优势,设计了典型的建设方案。本地机房安装我们镜像系统,主备端同时在线,真正实现“双活”,是可见,可验证,可靠的容灾;异地机房安装实时备份,既能实现数据的实时复制,确保数据不丢失,又能任意时间点手动恢复,实现容错,而且无需主备硬件配置一致,还能降低成本。网络拓扑和部署如下:

2.2 备端在线容灾系统设计 在生产服务器上部署A镜像系统代理软件,在容灾服务器上安装A镜像系统服务器端软件,设置A镜像代理的检测路径为主存储路径,设置A镜像服务器路径为备用存储路径。经过Web管理界面配置镜像对象、全量和增量策略等。 1)当生产服务器处于正常工作状态时,把生产服务器的浪擎代理软件连接至服务器。当代理检测到主存储数据变化后,将捕获变化的数据实时的复制到备用存储上,实现了实时的复制。具体部署如下图:

Nutanix超融合平台双活与灾备技术介绍

Nutanix 超融合平台双活与灾备技术介绍

1Replication and DR 关于视频解说,你可以查看以下链接:https://youtu.be/AoKwKI7CXIM Nutanix提供原生的容灾(DR)和复制功能,它们构建于“快照”&“克隆”等功能之上。Cerebro是在分布式存储(DSF)中负责管理DR和复制的组件。Cerebro 运行于每个节点之中,通过内部选举产生Master(类似于NFS Master),并由此节点管理复制任务。如果当Cerebro Master所在的CVM发生故障,剩余的节点将选举出新的Master。通过:2020,即可打开Cerebro的相关界面。DR功能可以分解为以下关键要点: ●.Replication Topologies ●Implementation Constructs ●Replication Lifecycle ●Global Deduplication Replication Topologies 一直以来,有几种主要的复制网络拓扑:点对点(Site to site),菊花链(hub and spoke),全网状/部分网状(full and/or partial mesh)。相对于传统的方案,它们仅提供“点到点”或“菊花链”的方式,Nutanix提供“全网状”或更加灵活的“多到多”的拓扑方式。 Figure 11-36. Example Replication Topologies

这将让管理员能够灵活的配置复制功能,从而更好的满足公司需求。 Implementation Constructs 在Nutanix的DR,包含以下主要的功能组件: 远程站点(Remote Site) ●主要角色:远程站点的Nutanix群集 ●描述:远程站点的Nutanix群集,用于充当备份或DR的目标端。 专家提示: 请确保容灾端有足够的资源(计算/存储)用于接管生产端的业务虚机。 保护域(PD/Protection Domain) ●主要角色:同时保护的多个“虚拟机/文件”的逻辑组 ●描述:一组多个虚拟机或文件基于某个相同的保护策进行复制保护。一个PD可以 保护一整个容器(Container)或你所选中的多个虚拟机或文件。 专家提示: 你可以针对不同的RPO/RTO需求,创建都个不同的PD。例如你可以针 一致性组(CG/Consistency Group) ●主要角色:PD中多个相关联的VM或文件构成的一个子集,以实现故障时一致性。 ●描述:PD中多台相关联的VM或文件需要在“同一时刻”发起快照。从而确保在虚 拟机或文件回滚时的数据一致性。一个PD中可包含多个CG。

数据灾备建设实施方案

目录 一、需求分析 (2) 1.1 数据连续性面临挑战 (2) 1.2 需求分析 (4) 二、技术案 (6) 2.1 案一.数据集中保护建设案 (6) 2.1.1案设计 (6) 2.1.2案说明 (7) 2.2 案二.业务系统应用容灾及集中保护平台建设案 (11) 2.2.1案设计 (11) 2.2.2案说明 (11) 三、案优势及技术说明 (15) 3.1 案优势 (15) 3.1.1契合安全等级保护三级的建设 (15) 3.1.2业务连续性保障 (20) 3.1.3成本可控 (20) 3.1.4混合IT数据保护 (20) 3.1.5降低成本投入&最大化提高投资回报率 (21) 3.1.6极简化的数据保护系统 (21) 3.2 爱数备份柜数据保护技术 (21) 3.2.1 源端重复数据删除技术 (24) 3.2.2 虚拟化平台备份 (25) 3.2.3 LAN-free备份 (29) 3.2.4 远程复制(D2D2R) (30) 3.2.5 Oracle多通道备份等高级备份功能 (34) 3.2.6 操作系统备份与恢复 (36)

一、需求分析 1.1 数据连续性面临挑战 如保证计算机系统连续不断的运行,保护企业中最宝贵的数据资产,成为其稳定发展的关键。随着信息化建设的不断发展和完善,济康医药连锁有限公司不仅完成从IT基础设施到IT应用的过渡,而且即将搭建统一的数据平台。信息化办公使得工作人员的办公效率得到了很大的提高,同时为大家的协同工作也做到了高效和便捷。为更好地服务于贵单位用户,将会有越来越多的关键业务集中于计算机系统中,能否提供一个高可靠性和高可用性的信息服务成为衡量服务质量的一个重要指标,因此整个计算机信息化系统的安全可靠地运行将直接关系到贵单位的生产和未来的发展。而实际上,计算机信息系统时刻受到来自自然灾害、人为因素、供电、病毒、黑客攻击等各面的破坏和侵袭、因此,具备快捷便的数据备份、灾难恢复和数据恢复功能是现今系统网络管理的重要目标。 风险分析的目的是针对当前核心业务流程,系统环境和所存在的潜在风险确定系统可恢复能力级别,确定当前业务环境中的客观存在

容灾备份技术

容灾备份技术 从广义上讲,任何提高系统可用性的方法,都可称之为容灾。由于容灾主要是保护数据安全,或者说对数据进行维护。因此,以前常规采用的数据备份容易造成“备份的数据”与“数据库中的数据”不一致,使数据库很难恢复;而且,通过磁带备份恢复数据需要很长时间,恢复阶段中业务将处在停滞状态。同时,由于备份介质与生产系统之间的在线交易在物理上不好分开,所以当机房发生危险,如火灾、水灾以及其他的灾难性事件发生时,企业对数据的依赖性变强。数据丢失将导致企业的业务瘫痪,以至破产。 因而对业界来说,迫切需要解决的问题是:对那些关键应用来说,如何能保证书数据的安全性,以便能抵御灾难性的能力。 1.基于存储级的数据复制容灾软件: 这种容灾技术是实现基于智能存储系统的远程数据复制,大多都有开放性差的特点(不同厂家的存储设备系统一般不能配合使用)、对于主备中心之间的网络条件(稳定性、带宽、链路空间距离)要求较苛刻等缺点。 A.IBM PPRC IBM的PPRC(Point to Point Remote Copy,点对点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是IBM的最高级别容灾方案,主要适用于大、中型和电信、金融企业选用。 B.HP Continuous Access XP 一般而言,关键任务系统可以根据应用种类、恢复时间、丢失数据大小、连接方式以及距离的远近来选择容灾的方式。其中,应用种类包括数据库-裸盘系统、数据库-文件系统、文件(数据、媒体等)。在此基础之上,企业可以实施容灾的层次包括主机、SAN-SAN以及磁盘阵列到磁盘阵列三种方式。为此,HP提供了OpenView存储镜像软件(主机层次容灾)、CASA(SAN层次容灾)、XP CA以及EV A CA(磁盘阵列层次容灾)等方案来帮助用户实现不同的容灾方式,保证业务连续性。

智慧医院系统灾备项目解决方案

智慧医院系统灾备项目解决方案

目录 1 需求分析 (3) 1.1面临的挑战及需求 (3) 1.2建立高效灵活的数据容灾和备份解决方案 (3) 2 可行性分析 (4) 2.1建设目标 (4) 2.2建设思路 (4) 2.3 设计原则 (5) 3 系统建设方案 (5) 3.1 现状分析 (5) 3.2灾备建设 (6) 3.2.1统一存储架构设计 (6) 3.2.2双活数据中心存储设计 (7) 3.2.3 灾备中心整体架构拓扑图 (8) 3.2.4网络灾备拓扑图设计 (9) 3.2.5本地及远程数据备份系统MetroCluster设计 (9) 3.2.6 FlashCache与FlashPool加速区别与对比 (12) 3.2.7 虚拟化环境备份VMware VDP (14) 3.2.8 方案配置 (15) 4 方案优势 (17) 4.1统一存储架构 (17) 4.2读写的高性能 (18) 4.3安全性 (19) 4.3.1完善的应用连续性和数据安全保护解决方案 (19) 4.3.2数据的高可靠性 (21) 4.3.3 Oracle Dataguard 的优势 (21) 4.3.4备份数据一致性和100%可恢复特性 (24) 4.3.5对于个人文件数据的安全性 (26) 4.3.6重复数据删除 (26) 4.3.7国家标准《信息系统灾难恢复规范》最高等级要求 (27) 4.3.8灵活的多元化管理 (28) 5 未来规划 (28) 5.1横向和纵向的系统高扩展性 (28) 5.2重新规划与定义将退役设备 (29) 5.3对未来“云计算”数据中心的支持 (31) 6 厂商介绍 (32)

数据灾备建设方案

目录 一、需求分析 ................................................................................................................. 1.1 数据连续性面临挑战 1.2 需求分析 二、技术方案 ................................................................................................................. 2.1 方案一.数据集中保护建设方案 2.1.1方案设计 2.1.2方案说明 2.2 方案二.业务系统应用容灾及集中保护平台建设方案 2.2.1方案设计 2.2.2方案说明 三、方案优势及技术说明 ........................................................................................... 3.1 方案优势 3.1.1契合安全等级保护三级的建设 3.1.2业务连续性保障 3.1.3成本可控 3.1.4混合IT数据保护 3.1.5降低成本投入&最大化提高投资回报率 3.1.6极简化的数据保护系统 3.2 爱数备份柜数据保护技术 3.2.1 源端重复数据删除技术 3.2.2 虚拟化平台备份 3.2.3 LAN-free备份 3.2.4 远程复制(D2D2R) 3.2.5 Oracle多通道备份等高级备份功能 3.2.6 操作系统备份与恢复 一、需求分析 1.1 数据连续性面临挑战 如何保证计算机系统连续不断的运行,保护企业中最宝贵的数据资产,成为其稳定发展的关键。随着信息化建设的不断发展和完善,济康

系统容灾技术方案大全

系统容灾技术方案大全

目录 一、数据中心灾备系统的分类 (3) 二、数据库远程复制和异地容灾方案相关分析 (11) 三、数据备份与数据容灾 (14) 四、重复数据删除成就异地容灾 (15) 五、金税工程三期背景下省级容灾备份建设探索 (22) 六、安徽中烟数据集中容灾系统建设实践与探索 (36) 七、推荐九个容灾解决方案 (42) 八、推荐九个容灾解决方案 (42) 九、GDS灾难恢复解决方案 (62) 十、多级企业数据容灾解决方案对比 (65)

一、数据中心灾备系统的分类 摘要:本文为大家讲述数据中心的一些技术知识,具体为您讲述数据中心灾备系统的 分类情况。 1.数据级容灾和应用级容灾 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。 (1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。 (2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。

商业银行灾备体系建设方法分析

商业银行灾备体系建设方法分析 (发表于《金融电子化》2010年10月刊) 2012-03-23 16:26阅读(31)评论(0)商业银行灾备体系建设方法分析 随着金融业务对信息系统的依赖性日益增强,商业银行越来越重视生产中心信息系统的高可用性,投入了大量资源和人员。但是,在灾备体系建设方面,一方面由于起步较晚,另一方面由于我国还没有发生过导致银行生产中心瘫痪的灾难性事件,所以各家商业银行的经验并不是很丰富。本文在分析并明确灾备工作定位的基础上,归纳设计了灾备体系框架,并介绍了建设灾备体系的基本步骤,以供参考。 一、灾备工作定位 对企业来说,造成关键业务功能或流程中断的时间超过企业最大容忍程度的突发事件,都可以认为是灾难。对商业银行来说,由于几乎所有金融业务都依赖于信息系统的支撑,所以灾备管理通常是指信息系统的灾难备份与恢复管理,目的是为了应对生产中心信息系统发生严重故障或者瘫痪,已不能在可接受的时间内在生产中心本地恢复,通常需要将信息系统切换到灾备中心运行的情况。 灾备管理、应急管理、业务连续性管理和风险管理是经常容易混淆的几个概念。根据巴塞尔协议,商业银行风险管理包括对市场风险、信用风险和操作风险的识别、评估、监控、缓释和控制。业务连续性管理主要针对可能导致业务中断的风险或者已经发生并导致业务中断的事件进行管理。应急管理主要关注对各种突发事件的应急处置,该突发事件不一定会导致业务中断,但一定会对业务造成影响。可见,业务连续性管理和应急管理都是风险管理的组成部分,并且业务连续性管理与应急管理之间存在一部分交集,这个交集就是对导致业务中断的突发事件的管理。灾备管理是业务连续性管理和应急管理交集中的一种极端特殊情况,是专门针对IT灾难的。上述各个概念之间的关系及举例如下图所示:

相关文档
最新文档