灾备设计方案
信息系统灾备方案

信息系统灾备方案背景介绍:在当今数字化时代,信息系统已经成为组织运作的关键基础设施之一。
然而,由于自然灾害、人为错误、硬件故障等因素,信息系统可能会面临严重的中断风险。
为了确保组织的连续运营和信息资产的保护,采取有效的信息系统灾备方案变得至关重要。
一、灾备需求分析1. 业务连续性需求在信息系统中断时,组织能否在短时间内恢复正常运营,保证业务稳定进行是灾备方案的首要目标。
2. 数据完整性需求信息系统中的数据是组织的重要资产,必须确保在灾备过程中数据不会丢失或被损坏。
3. 系统可用性需求灾备系统必须具备高可用性,能够随时运行并提供稳定的服务,以满足组织的业务需求。
二、灾备方案设计1. 备份与存储策略定期对信息系统中的数据进行备份,并将备份数据存储在离线介质或远程数据中心中,以保证数据的安全性和可靠性。
2. 灾备设备与环境建立备用的硬件设备和环境,包括服务器、网络设备、存储设备等,并确保其与主系统的功能和配置保持一致。
3. 灾备流程与演练制定详细的灾备应急预案,并定期进行灾备演练,以验证方案的可行性和有效性。
4. 灾备团队与责任分工组建专业的灾备团队,明确各成员的职责和责任,并定期进行培训和知识更新,以应对各类灾备事件。
5. 监控与报警系统建立灾备系统的实时监控与报警机制,及时检测系统异常或故障,以便迅速做出应对措施,避免灾难的扩大。
三、实施与维护1. 灾备方案的实施根据灾备方案的设计,进行系统复制和数据迁移工作,并对备用设备进行功能测试,确保其能够正常工作。
2. 灾备方案的维护定期对备用设备进行状态监测和维护,确保其始终处于可用状态,并与主系统进行同步更新,以避免因配置不一致而造成的问题。
3. 事件响应与恢复一旦发生系统中断或灾备事件,灾备团队应按照预案迅速响应,采用合适的方法和工具进行恢复操作,确保系统能够尽快恢复正常运作。
4. 故障分析与优化每次灾备事件发生后,对灾备方案的实施与应对过程进行评估和分析,找出存在的问题和不足,并提出相应的优化方案,以不断提高灾备能力和效率。
系统灾备解决方案

系统灾备解决方案目录1. 内容概述 (3)1.1 目的和范围 (3)1.2 文档使用和更新说明 (4)1.3 术语和缩写 (6)2. 灾备解决方案概述 (6)2.1 业务关键性分析 (8)2.2 总体策略和目标 (9)2.3 主要业务功能和数据分级 (10)3. 灾备需求分析 (12)3.1 业务连续性和可用性要求 (13)3.2 数据保护要求 (14)4. 灾备设计 (15)4.1 灾备架构设计 (16)4.1.2 核心组件和系统架构 (18)4.2 备份和恢复策略 (20)4.2.1 数据备份策略 (21)4.2.2 应用系统备份和恢复策略 (23)4.3 灾备环境规划 (25)4.3.1 物理位置和安全要求 (26)4.3.2 网络和系统配置 (28)4.4 灾难恢复流程 (29)4.4.1 灾难预警和响应 (31)4.4.2 数据恢复和系统恢复流程 (32)5. 灾备实施 (33)5.1 系统迁移和测试 (35)5.1.1 迁移前的检查和准备 (37)5.1.2 数据的导入和导出 (38)5.2 监控和维护 (41)5.2.1 监控系统设计 (42)5.2.2 日常维护和定期检查 (44)6. 灾备运行和监控 (45)6.1 日常运行管理 (47)6.2 运行监控和维护 (47)6.3 性能优化 (49)7. 灾难应对和恢复 (50)7.1 灾前预警和管理 (51)7.2 灾难发生时的响应和操作指南 (53)7.3 灾难恢复执行 (54)7.4 灾后恢复验证和审计 (55)8. 文档和知识管理 (57)8.1 文档编制和更新 (58)8.2 知识转移和培训 (59)9. 法律和合规要求 (60)9.1 法律遵从性评估 (61)9.2 数据保护立法要求 (62)9.3 业务连续性和灾难恢复的ISO标准 (64)1. 内容概述本文档旨在提供一个全面而详尽的系统灾备解决方案,以保障组织在面临各种潜在的灾难性事件时,能够迅速恢复关键业务功能并最小化数据丢失和业务中断的影响。
ceph 灾备方案

ceph 灾备方案Ceph 灾备方案随着云计算和大数据时代的到来,数据的安全性和可靠性成为了企业和组织关注的重点。
Ceph作为一种分布式存储系统,具有高可靠性和可扩展性,因此备受青睐。
为了确保数据的持久性和可恢复性,制定一套完善的Ceph灾备方案是至关重要的。
一、灾备方案的必要性Ceph作为一种分布式存储系统,通过将数据分布在不同的节点上,提高了数据的可靠性和可用性。
然而,单一节点的故障或灾难事件(如火灾、地震等)可能导致数据的不可用或永久丢失。
因此,采取灾备措施是必要的,以保证数据的安全性和可恢复性。
二、Ceph灾备方案的设计原则1. 多活数据中心:构建跨多个数据中心的Ceph集群,以实现数据的多活部署。
这样即使一个数据中心发生故障,其他数据中心仍然可以提供服务。
2. 异地冗余备份:将数据在不同地理位置的节点上进行冗余备份。
这样即使某个地区发生自然灾害或人为破坏,数据仍然可以从其他地区恢复。
3. 定期备份:定期对Ceph集群中的数据进行备份,以确保数据的完整性和可恢复性。
备份数据可以存储在独立的存储系统中,以防止主集群的故障。
4. 自动化恢复机制:灾备方案应该具备自动化的数据恢复机制,能够在节点故障发生时快速地将数据恢复到正常状态。
这可以通过使用Ceph的自动化工具和脚本来实现。
三、Ceph灾备方案的具体实施1. 多活数据中心的构建:建立多个数据中心,并在每个数据中心中部署独立的Ceph集群。
通过使用Ceph的异步复制功能,将数据同步到其他数据中心的节点上,实现数据的多活部署。
2. 异地冗余备份的配置:将数据在不同地区的节点上进行冗余备份。
可以通过配置Ceph的存储池和副本数来实现数据的冗余备份。
确保每个数据中心都有足够的存储容量来存储备份数据。
3. 定期备份策略的制定:制定定期备份策略,定期对Ceph集群中的数据进行备份。
可以根据数据的重要性和变化频率来确定备份的时间间隔。
备份数据可以存储在独立的存储系统中,也可以使用Ceph本身的特性来实现备份。
机房灾备方案

机房灾备方案第1篇机房灾备方案一、背景随着信息技术的飞速发展,企业对信息系统的依赖程度越来越高,机房作为企业信息系统的核心基础设施,其安全性、稳定性至关重要。
为保障企业信息系统在遭遇自然灾害、事故灾难等不可预见事件时,能够迅速恢复正常运行,降低企业损失,制定一套合法合规的机房灾备方案显得尤为重要。
二、目标1. 确保机房关键业务系统在发生灾难时,能够在规定时间内恢复正常运行;2. 保障机房数据的安全性和完整性;3. 提高机房运维人员应对灾难的能力;4. 降低企业在灾难发生时的经济损失。
三、方案内容1. 灾备体系建设(1)灾备中心选址根据企业实际情况,选择地理位置相对独立、远离自然灾害及事故灾难风险的地域作为灾备中心。
(2)灾备中心基础设施建设灾备中心基础设施建设应符合国家相关标准和规范,包括但不限于:供电系统、空调系统、消防系统、安防系统等。
(3)网络通信保障建立灾备中心与主生产中心之间的专用网络连接,确保在灾难发生时,数据传输的实时性和安全性。
2. 数据备份与恢复(1)数据备份策略制定数据备份策略,包括全量备份、增量备份、差异备份等,根据业务系统重要性及数据变化情况,选择合适的备份方式。
(2)数据备份频率根据业务系统数据变化情况,合理设置备份频率,确保数据安全。
(3)数据恢复测试定期进行数据恢复测试,验证备份数据的有效性和完整性。
3. 业务系统灾备(1)业务系统分类根据业务系统的重要性及恢复优先级,将业务系统进行分类。
(2)业务系统灾备策略针对不同类别的业务系统,制定相应的灾备策略,包括但不限于:应用级灾备、数据级灾备、硬件级灾备等。
(3)业务系统切换与恢复在灾难发生时,根据灾备策略,快速切换至灾备中心,确保关键业务系统正常运行。
4. 人员与培训(1)灾备团队建设组建专业的灾备团队,明确团队成员职责,制定灾备工作流程。
(2)灾备培训与演练定期开展灾备培训,提高运维人员应对灾难的能力;定期进行灾备演练,检验灾备方案的有效性。
灾备方案资料

• 站点级灾备:确保整个站点在灾难发生时能够迅速恢复运行, 如多站点部署和备份站点策略。
• 灾备方案选择:根据企业业务需求、风险承受能力和成本预算, 选择合适的灾备方案。
• 评估企业业务需求和风险承受能力 • 平衡灾备方案的成本和效益
• 互联网行业灾备方案实践:通过实施数据备份、恢复、应用切换等方面的内容,保障互联网业务连续性和稳定性 。
• 数据备份与恢复:采用高效的数据备份和恢复技术,确保数据安全。 • 业务连续性计划:制定针对不同业务类型的业务连续性计划,确保业务在灾难发生时的连续性和稳定性。 • 灾备中心与基础设施设计:规划和建设灾备中心,满足互联网业务连续性和稳定性的需求。
DOCS SMART CREATE
灾备方案设计与实施
CREATE TOGETHER
DOCS
01
灾备方案的基本概念与重要性
灾备方案的定义与作用
灾备方案定义:为应对突发事件和灾难,确保企业 业务连续性和数据安全而制定的预防和应对措施。
• 预防和应对自然灾害、人为事故、技 术故障等 • 保障企业业务的连续性和稳定性 • 保护企业数据安全和客户利益
持续改进:根据实施结果和反馈,对灾 备方案进行持续优化和改进,提高灾备
效果。
• 收集实施过程中的问题和反馈 • 分析问题原因和影响 • 对灾备方案进行优化和改进
03
灾备方案的关键要素与技术
数据备份与恢复技术
数据备份技术:采用磁带、磁盘、光盘等存储介质, 将企业数据定期或实时复制到备份介质,防止数据
灾备方案对企业业务的影响与价值
灾备方案对企业业务的影响:确保企业业务在灾难 发生时能够迅速恢复,降低损失,提高业务连续性。
服务器灾备方案

服务器灾备方案随着信息化程度的不断提高,服务器的重要性也越来越突出。
为了保障服务器业务的持续运行以及数据的安全性,灾备方案变得至关重要。
本文将探讨服务器灾备方案的相关内容,以确保服务器在面临自然灾害、设备故障或人为破坏时能够正常运行。
一、灾备需求分析在制定服务器灾备方案之前,首先要对灾备需求进行充分的分析。
主要包括以下几个方面:1. 业务可用性要求:根据不同的业务类型和运行情况,确定服务器的可用性要求,如需要达到99.99%以上的可靠性。
2. 数据安全性要求:评估数据的重要性和保密级别,确定合适的备份和恢复策略,确保数据的完整性和可靠性。
3. 容灾时间要求:确定在灾害发生时,系统的恢复时间,即业务能够在多长时间内恢复正常运行。
4. 预算限制:考虑到不同的预算限制,制定合理的灾备方案,兼顾成本和效益。
二、灾备方案设计基于灾备需求分析结果,设计合适的服务器灾备方案。
主要包括以下几个方面:1. 设备冗余:通过采用冗余设备来提供可靠的服务,如采用双机热备份系统,主备服务器之间实时同步数据,当主服务器故障时,备份服务器能够立即接管服务。
2. 数据备份:定期对服务器中的重要数据进行备份,并将备份数据存储在不同的地理位置,以防止单点故障。
3. 虚拟化技术:通过虚拟化技术,将服务器的运行环境与硬件解耦,实现对物理机器的快速迁移和恢复。
4. 数据同步和复制:通过数据同步和复制技术,将服务器上的数据实时同步到远程备份服务器,以保障数据的安全性和完整性。
5. 网络拓扑设计:设计合理的网络拓扑结构,避免单点故障,保证网络的稳定性和可用性。
6. 灾难恢复计划:制定详细的灾难恢复计划,明确每个环节的职责和流程,确保在灾难发生时能够快速恢复系统运行。
三、灾备方案实施与测试设计完灾备方案后,需要进行方案的实施和测试工作,以验证方案的可行性和有效性。
1. 灾备设备配置:根据设计方案,将所需的设备进行配置和部署,确保设备能够满足灾备需求。
数据库容灾与灾备方案设计

数据库容灾与灾备方案设计随着信息化水平的不断提高,数据库在企业中扮演着越来越重要的角色。
然而,数据库也面临着各种潜在的风险,例如自然灾害、硬件故障、人为错误等,这些风险可能导致数据库服务不可用,进而影响企业的正常运营。
为了应对这些风险,数据库容灾与灾备方案设计显得尤为重要。
一、容灾与灾备的基本概念容灾(Disaster Recovery,简称DR)是指在数据库发生意外灾害后,能够尽快地恢复数据库服务,确保数据的完整性和可用性。
而灾备(Business Continuity Plan,简称BCP)则是指在数据库发生灾害后,能够继续提供服务,并在短时间内恢复到灾害前的正常运行状态。
二、灾备方案设计的要点1. 单机灾备方案单机灾备方案是灾备的基础,它包括备份与恢复策略、数据冗余和备份介质的选择。
首先,需要制定完善的备份策略,包括全量备份和增量备份,以保证数据的可靠性和恢复速度。
其次,数据冗余技术是确保数据的持久性和可用性的关键,可以采用镜像技术或者RAID存储技术。
最后,备份介质的选择也是非常重要的,可以选择磁带备份、云备份或者硬盘备份等。
2. 异地备份方案为了进一步提高数据库的容灾能力,可以选择异地备份方案。
异地备份是指将数据库的备份数据存储在离主数据库较远的地方,以防止单一地域的灾害对数据库造成影响。
可以选择跨城市、跨区域的数据中心进行备份,或者采用云备份等方式。
同时,需要保证异地备份的数据安全性,可以采用数据加密等技术。
三、容灾与灾备方案的测试与优化容灾与灾备方案设计完成后,需要进行测试以验证其可行性和有效性。
可以进行模拟灾难恢复测试,例如关闭主数据库,切换到备份数据库进行运行,检查整个恢复过程的时间、数据完整性和可用性。
测试结果将指导优化方案,例如缩短恢复时间、提高数据备份的频率等。
四、应对特定灾害的方案设计不同的灾害风险需要采取不同的应对措施,例如自然灾害、网络攻击和硬件故障。
针对自然灾害,可以选择多个异地备份点,避免单一灾害点的影响。
灾备方案设计

灾备方案设计灾备方案设计是一项非常重要的工作,它能够帮助组织在突发灾害或意外事件发生时迅速恢复业务,保障业务的连续性和稳定性。
一个好的灾备方案能够最大限度地减少灾害对组织的影响,并且能够在较短时间内重新建立业务运营的能力。
本文将从数据备份与恢复、设备冗余性和应急响应计划等角度探讨灾备方案设计的重要性和关键要素。
一、数据备份与恢复数据备份与恢复是灾备方案中最关键的一环。
在灾备方案设计中,建立完善的数据备份和恢复机制能够保证组织在灾害发生后能够快速地获取到最新可用的数据,从而避免数据丢失造成的损失。
在备份和恢复过程中,需要考虑数据安全性、备份频率和恢复时间等因素。
为了确保数据的安全性,可以采用加密、权限控制等措施进行数据保护。
同时,备份的频率应根据业务特点和数据变动情况来确定,以便在数据丢失时能够尽可能地恢复到最新的状态。
而恢复时间则需要考虑备份数据的存储介质和恢复过程的复杂度,以确保在最短的时间内完成数据恢复。
二、设备冗余性设备冗余性是指在灾备方案设计中通过引入冗余设备来保证业务的连续运行。
在设计冗余设备时,需要考虑设备故障的可能性和后果,以及冗余设备的容量和效能。
例如,在服务器冗余方面,可以采用主备服务器或者多台服务器并行工作的方式。
在网络冗余方面,可以采用双机房、多线路等措施来保证网络的稳定性。
而在数据库冗余方面,则可以采用主从复制、热备份等方式来保证数据的可用性。
通过引入设备冗余性,可以降低设备故障对业务的影响,增加业务的可用性和稳定性。
三、应急响应计划应急响应计划是指在灾备方案设计中建立的一套应对灾害或意外事件的操作流程和指导方针。
在灾备事件发生时,通过执行预先计划好的应急响应流程,可以最大程度地减少灾害带来的损失。
应急响应计划需要包括灾害类型的分析和评估、人员的角色和责任划分、沟通和协调机制等内容。
在制定应急响应计划时,需要充分考虑各种可能的灾害类型和程度,并根据实际情况和需求进行定制化设计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RPO 是反映恢复数据完整
性的指标,在同步数据复制方式下, RPO 等于数据传输延迟的时间;在异步数据复制下,
RPO 基本为异步传输数据排队的时间。在实际应用中,考虑导数据传输的因素,业务数据 库与容灾备份数据库的一致性( SCN)是不同的, RPO 表示业务数据库与容灾备份数据库
SCN 的时间差。发生灾难后,启动容灾系统完成数据恢复, 据损失量。
理
制。
数据 库的异地复制技 术,通常采用日志复 制功能,依靠本地和 远程主机 间的日志 归 档与 传递 来实现 两端的数据一致。
平
与平台无关,
台 同构存 储
要
需要增加 专有的复制服 务器 同构主机、异构存 储 与平台无关
或带有复制功能的 SAN 交换
求
机
复
制
高
高
性
高
较高
能 资
源 对生产系统存储性能有影 对 网 络 要求高
综合来进行考量。后续在 1.6.1 数据同步章节,将会有这 4 类数据复制技术的综合对比,可 以作为选择的参考。
1.2.3 网络安全
通信网络是容灾系统的组成部分, 通信线路的质量也是容灾系统的性能指标之一, 其中包括
网络的数据传输带宽、网络传输通道的冗余和网络服务商的服务水平(网络年中断率)
。如
果容灾系统使用的通信网络是确定的, 为了比较不同容灾解决方案, 可以用单位存储容量的
1.4 容灾技术分析
1.4.1 备份方式
(1) 冷备份
备份系统未安装或未配置成与当前使用的系统相同或相似的运行环境
, 应用系统数据没有
及时装入备份系统。 一旦发生灾难, 需安装配置所需的运行环境, 用数据备份介质 (磁带或
光盘) 恢复应用数据, 手工逐笔或自动批量追补孤立数据, 将终端用户通过通讯线路切换到
1. 数据中心容灾备份解决方案
随着社会的发展和科技的进步, 政府日常工作越来越依赖于数据处理来进行, 政务系统的连
续性依赖于数据中心系统的稳定运行。 然而, 灾难就像灰尘一样伏击在运营环境周围, 政务
系统的数据中心可能正在一个充满风险和威胁的环境下运行。
如果不能对这些风险采取有效
治理, 一旦数据由于某种原因丢失, 就很有可能对政府的日常工作造成严重的影响。
软 Access)
件 HDS TrueCopy
Brocade Tapestry DMM UIT SVM EMC VSM
两个中心同时上线。
第四, 系统恢复时间要尽可能短。 容灾系统主要是为了实现在主中心系统发生灾难时,
可以
在规定时间切换到备份中心, 保证数据不会丢失, 并且继续向用户提供服务。 但往往在灾难
发生时, 主要技术人员不能及时到达现场, 为了顺利实现系统间的切换, 应该让系统切换操
作尽可能地简单 ; 并建立固定化的、 标准化的切换流程, 要求维护人员在切换演习时严格按
压力等。 因此, 企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,
以保
证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。
第二, 数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心, 须保证容灾系统数据同步机制的可靠性。 因此, 建立可靠的数据同步校验机制是必须的 时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性, 这是数据容灾工作中非常重要的一部分。
RPO 就是新恢复业务系统的数
设计容灾系统不能只看 RTO 和 RPO,对于不同的业务系统和用户特殊的要求,其它一些指 标有可能成为选择容灾解决方案的主要因素。 例如, 某些地区为了防范一些特定自然灾害的 风险, 要求容灾备份中心与业务中心保持足够的距离, 在这种情况下, 容灾备份中心与业务 中心的距离要求就是容灾系统的重要指标。
存储系统数据复制
基于存储的 数据复制
虚拟存储技术
操作系统层数据复 制
应用程序层数据复制
基
通 过操作系 统或者
数据的复制 过程通 过本地 复制技 术是伴随着存 储局域
本
数据卷管理器来 实
的存储系统和远端的存 储 网的出 现引入的,通过构建虚
原
现对 数据的 远程复
系统之间的通信完成。 拟存储上实现 数据复制。
孤立数据或将终端用户通过通讯线路切换到备份系统, 恢复业务运行。 优点:设备投资较少,
通信环境要求不高。 缺点:恢复时间长, 一般要十几个小时至数天,数据完整性与一致性较
差。
(3) 热备份
备份处于联机状态, 当前应用系统通过高速通信线路将数据实时传送到备份系统,
保持备份
系统与当前应用系统数据的同步; 也可定时在备份系统上恢复应用系统的数据。 一旦发生灾
电子传输和部分设备支持
Level2
备用场地支持
Level1
基本支持
措施 实现远程数据实时备份,实现零丢失; 应用软件可以实现实时无缝切换; 远程集群系统的实时监控和自动切换能力; 实现远程数据复制技术; 备用网络也具备字哦那个或集中切换能力; 配置所需要的全部数据和通讯线路及网络设备,并处于就绪状态; 7*24 运行;更高的技术支持和运维管理; 配置部分数据,通信线路和网络设备; 每天实现多次的数据电子传输; 备用场地配置专制的运行管理人员; 预定时间调配数据,通信线路和网络设备; 备用场地管理制度; 设备及网络紧急供货协议; 每周至少做一次完全数据备份; 制定介质存取/验证和转储的管理制度; 完整测试和演练的灾难恢复计划;
能存储系统的远程数据复制技术, 它是由智能存储系统自身实现的数据远程复制和同步,
即
智能存储系统将对该系统中的存储器 I/O 操作请求复制到远端的存储系统中并执行。 由于在
这种方式下, 数据复制软件运行在存储系统内, 因此较容易实现主中心和容灾备份中心的操
作系统、数据库、系统库和目录的实时拷贝及维护能力, 且不会影响主中心主机系统的性能。
对于关键的业务, Primeton 建议采用同城热备+异地热备的方式进行部署,对于一般性的 业务,建议采用同城热备+异地温备(应用不启动,数据保持异步复制)的方式进行部署。
1.4.2 数据复制技术
目前数据复制技术主要有如下表所列 4 种,基于红色字体部分的要求,结合客户的需要, Primeton 推荐采用基于存储或者基于应用程序的数据复制技术来进行数据同步。
难,不用追补或只需追补很少的孤立数据,备份系统可快速接替生产系统运行,恢复营业。
优点: 恢复时间短, 一般几十分钟到数小时, 数据完整性与一致性最好,数据丢失可能性最
小。缺点:设备投资大,通信费用高,通信环境要求高,平时运行管理较复杂。
在计算机服务器备份和恢复中,冷备份服务器( cold server )是在主服务器丢失的情况下才
如果核
心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失。
因此,保证政务的连
续性和数据的高可靠性和可用性, 已经成为政府部门在数据中心建设中, 必须要考虑的问题。
1.1 灾备解决方案原则
首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。
比如, 采用数据复制技术对系统 I/O 带来的延迟, 应用数据同步对日常业务处理系统带来的
如果在系统恢复场具备了实时数据, 那么就可以做到在灾难发生时, 及时开始应用处理过程
的恢复。但这种方案也有开放性差 (不同厂家的存储设备系统一般不能配合使用
)、对于主、
备中心之间的网络条件 (稳定性、带宽、链路空间距离 ) 要求较苛刻等缺点。
1.2 灾备解决方案设计需要考虑的因素
1.2.1 RTO 和 RPO
使用的备份服务器。 冷备份服务器基本上只在软件安装和配置的情况下打开,
然后关闭直到
需要时再打开。
温备份服务器( warm server )一般都是周期性开机,根据主服务器内容进行更新,然后关 机。经常用温备份服务器来进行复制和镜像操作。
热备份服务器( hot server )时刻处于开机状态,同主机保持同步。当主机失灵时,可以随 时启用热备份服务器来代替。
RTO(RecoveryTime Object ):是指灾难发生后,从 IT 系统宕机导致业务停顿之刻开始, 到 IT 系统恢复至可以支持各部门运作, 业务恢复运营之时, 此两点之间的时间段成为 RTO。
RTO 是反映业务恢复及时性的指标,表示业务从中断到回复正常所需要的时间。
RTO 值越
小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的
RTO 有较大差别,基于光通
道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,
这种容灾解决方案具有最小的 RTO 。
RPO( Recovery Point Objective ),是指从系统和应用数据而言,要实现能够恢复至可以支
持各部门业务运作,系统及生产 占用部分生 产系统数据 库资 源
能有影响
技
术 成 成熟 熟
成熟度有待提高, 非主流复制 成熟
技术。
成熟
度
投
入 高,需要同构存 储
成
较高,需要 专有设备 较 高,需要同构主机
一般 部分 软件免 费,如 DataGuard
本
IBM PPRC
复 EMC SRDF
制 HP CA(Continues
就必 ;同
第三, 容灾系统的日常维护工作要尽可能轻, 并能承担部分业务处理和测试的工作。 容灾系
统的维护和管理是容灾切换成功的重要保证, 在系统建设中, 就必须要考虑系统的维护管理
流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心
; 所有新业务系统上
线时, 必须通知备份中心, 并在备份中心配置好数据同步机制 ; 对原程序的改动也必须保证