信息系统容灾演练实施方案
信息系统容灾演练实施方案

信息系统容灾演练实施方案容灾基本概念容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。
容灾是一个系统工程,它包括支持用户业务的方方面面。
而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。
容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。
从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。
为了达到更高的可用性,许多用户甚至建立多个冗余站点。
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。
要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。
现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。
容灾的七个层次等级1:被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。
这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。
一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。
网络容灾方案

网络容灾方案第1篇网络容灾方案一、背景随着信息化建设的不断深入,企业对信息系统的依赖程度越来越高,网络系统安全稳定运行的重要性日益凸显。
为了确保网络系统在面临各种灾难时能够快速恢复,降低灾难带来的影响,制定一套合法合规的网络容灾方案至关重要。
二、目标1. 确保网络系统在发生灾难时,数据不丢失、业务不中断。
2. 提高网络系统的抗灾能力,降低灾难带来的损失。
3. 合法合规地制定网络容灾方案,确保方案的实施符合相关法律法规。
三、方案内容1. 灾难类型识别根据企业所在地区的自然环境、网络环境等因素,识别可能发生的灾难类型,如地震、火灾、网络攻击等。
2. 风险评估对网络系统进行风险评估,分析灾难发生可能导致的影响,包括数据丢失、业务中断、设备损坏等。
3. 容灾策略(1)数据备份策略1) 采用定期备份与实时备份相结合的方式,确保数据安全。
2) 备份介质采用离线存储,防止灾难发生时备份数据受到破坏。
3) 定期对备份数据进行验证,确保备份数据的完整性和可用性。
(2)业务连续性策略1) 采用多活、主备等方式,实现关键业务的冗余部署。
2) 制定详细的业务恢复流程,确保在灾难发生时,业务能够快速恢复。
(3)设备冗余策略1) 对关键设备进行冗余配置,提高设备的抗灾能力。
2) 设备冗余应考虑设备的兼容性和可维护性。
4. 容灾体系建设(1)基础设施建设1) 建立容灾中心,确保容灾中心与生产中心之间的物理距离满足安全要求。
2) 容灾中心应具备独立的电源、网络、安全设备等基础设施。
(2)网络架构优化1) 采用多路径、多运营商的网络架构,提高网络的可靠性。
2) 实施网络隔离和访问控制,防止灾难发生时网络受到攻击。
(3)数据同步与恢复1) 采用数据同步技术,实现生产中心与容灾中心之间的数据实时同步。
2) 制定数据恢复流程,确保在灾难发生时,数据能够快速恢复。
5. 容灾演练与培训定期组织容灾演练,检验容灾方案的有效性,并对发现的问题进行整改。
IT系统灾备和容灾解决方案项目应急预案

应急联络机制
建立与服务商的紧急联络机制,包括联系方式、沟通流程和应急预 案。 定期进行联络测试,确保沟通顺畅,及业务的优先级至关重要。不同的业务系统和应用程序具有不同的关键程度,需要 根据其对业务运营的影响程度和用户需求来确定恢复顺序。
1
核心业务
紧急联络中心
建立紧急联络中心,确保灾难发生时能够及时联 系相关人员。
紧急通知系统
配备完善的紧急通知系统,能够快速、高效地将 灾难信息传递给所有相关人员。
灾难事件汇报
通讯保障
制定详细的灾难事件汇报流程,确保信息能够及 确保关键通讯线路的正常运行,并备有应急通讯
时、准确、完整地传递给领导层。
设备。
应急物资和设备的准备
应急预案的持续改进
定期评估
定期评估预案有效性,识别不足,改进方案。
沟通协调
与相关部门沟通,及时更新预案,确保一致性。
记录更新
记录改进内容,跟踪效果,确保预案始终有效。
2
故障切换
故障切换是指在系统出现故障时,将系统切换到备份系统,保证系统可以 正常运行。这个过程需要快速响应,并保证数据和服务的完整性。
3
切换测试
定期进行系统切换测试,确保故障切换机制的有效性和可行性。测试内容 包括系统配置、数据同步、网络连接等方面的测试,并确保切换过程顺利 完成。
应急通讯和汇报机制
概述
提供项目背景、目的、范围、适用范围和预案适用对象。
组织机构
明确应急组织的职责,包括应急领导小组、工作组、技术支持团队、沟通协调部门。
应急响应流程
定义灾难事件发生后的响应步骤,包括事件通知、评估、决策、执行、恢复等。
应急资源
列出可用的人员、设备、物资、技术支持、服务商等,并说明其角色和使用方式。
容灾建设方案

-提高企业应对灾害的能力;
-符合国家相关法律法规要求。
2.原则
-合法合规:遵循国家法律法规,确保方案合法合规;
-实用性:根据企业实际情况,制定切实可行的容灾方案;
-经济性:合理利用现有资源,降低建设成本;
-安全性:确保容灾系统具备较高的安全性,防止数据泄露。
三、容灾策略
1.数据备份策略
-定期检查备份设备、网络设备等基础设施,确保设备正常;
-监控系统性能,及时处理故障。
2.优化措施
-跟踪国家法律法规、技术发展趋势,适时更新容灾方案;
-优化数据备份策略,提高备份效率;
-优化灾难恢复流程,缩短业务恢复时间。
七、总结
本容灾建设方案旨在为企业提供一套合法合规、切实可行的容灾建设方案,以降低灾害风险,保障业务连续性。方案遵循国家法律法规,结合企业实际情况,从数据备份、容灾中心建设、灾难恢复等方面进行全面规划。通过实施本方案,企业将具备较强的灾害应对能力,为业务稳定运行提供有力保障。
3.灾难恢复策略
-制定详细的灾难恢复计划,涵盖人员、设备、流程等方面;
-定期进行灾难恢复演练,验证恢复流程的有效性;
-根据业务发展及法律法规要求,及时更新灾难恢复计划。
四、容灾系统架构
1.数据备份架构
-采用磁带库、磁盘阵列等备份设备;
-利用备份软件实现自动化备份操作;
-定期进行备份验证,确保备份数据的可用性和完整性。
-优化数据备份策略,提高备份效率;
-完善灾难恢复流程,缩短业务恢复时间。
七、总结
本容灾建设方案从合法合规、实用性、经济性、安全性等方面进行全面规划,旨在为企业提供一套高效可行的容灾建设方法。通过实施本方案,企业将具备较强的灾害应对能力,为业务稳定运行提供有力保障。在后续运维过程中,持续优化和调整容灾方案,以确保企业信息系统始终处于安全、可靠的状态。
数据库容灾方案的演练与应急响应方案设计

数据库容灾方案的演练与应急响应方案设计概述:在数字化时代,数据库作为企业重要的信息存储和管理工具,发挥着关键的作用。
然而,数据库故障和数据丢失是无法完全避免的风险,因此,容灾方案的演练与应急响应方案设计显得尤为重要。
本文将探讨数据库容灾方案的演练和应急响应方案的设计,以确保数据的安全性和可靠性。
一、数据库容灾方案的演练1. 确定演练的目标和范围在进行数据库容灾方案的演练之前,需要明确演练的目标和范围。
一般而言,目标是测试和验证数据库容灾方案的可行性和有效性,确保在实际应急情况下可以迅速恢复数据库服务。
而范围包括演练的时间、操作步骤,以及参与人员等。
2. 演练前的准备工作在演练之前,需要对演练环境进行准备。
首先,备份数据库并恢复到演练环境中,以确保演练过程中不会对正式生产环境造成影响。
其次,配置测试设备和相应的网络环境,以模拟实际的应急情况。
3. 演练过程演练过程中,应按照预定计划逐步执行各项容灾措施,以测试其可行性和效果。
包括数据库复制、故障切换、数据恢复等。
同时,还可以模拟各种异常情况,如网络中断、硬件故障等,以验证容灾方案的实用性。
4. 演练后的总结与改进演练结束后,需要进行总结与改进,以提高容灾方案的可靠性和完善性。
通过对演练过程进行评估和分析,可以识别潜在的风险和问题,并制定相应的改进措施,以提升数据库容灾方案的效能。
二、应急响应方案设计1. 建立应急响应团队应急响应方案需要建立一个专门的团队来负责应对数据库故障和应急情况。
此团队应包括数据库管理员、系统管理员、网络管理员、安全管理员等相关人员,以确保应急响应工作的高效运行。
2. 制定应急响应计划应急响应计划是为了在数据库故障或数据丢失时能够迅速、有效地响应和处置。
该计划应包括各种应急情况的预案,应急联系人清单,应急响应流程等信息。
同时,还应定期更新和测试应急响应计划,以确保其实用性和可靠性。
3. 监控和预警系统的搭建建立有效的监控和预警系统可以及时发现数据库异常,并迅速采取措施。
信息系统灾难救援方案

信息系统灾难救援方案
信息系统灾难救援方案是一个详细的计划,用于在发生灾难时恢复信息系统。
以下是一个基本的信息系统灾难救援方案的示例:
1. 确定目标和范围:确定需要恢复的信息系统、数据和业务流程,以及恢复的时间目标。
2. 评估风险:识别可能对信息系统造成威胁的风险,例如硬件故障、软件故障、自然灾害等。
3. 制定策略:根据风险评估结果,制定相应的备份和恢复策略。
这包括定期备份数据、制定恢复流程、选择合适的备份和恢复技术等。
4. 实施备份:按照备份策略,定期备份关键数据和系统。
确保备份数据可访问,并且存储在安全的地方。
5. 建立应急响应团队:组建一个由IT专家、业务管理人员和其他相关人员
组成的应急响应团队。
他们将在灾难发生时负责恢复工作。
6. 培训和演练:对应急响应团队进行培训和演练,确保他们熟悉恢复流程和技术。
7. 测试和验证:定期测试和验证备份数据和恢复流程的有效性。
确保在真实灾难发生时可以快速、准确地恢复系统。
8. 维护和更新:定期检查和维护备份数据和恢复设施,确保其可用性和可靠性。
更新灾难救援方案以反映组织的变化和新的风险。
在制定信息系统灾难救援方案时,需要考虑组织的特定需求和资源。
此外,应与业务利益相关者合作,以确保恢复计划与组织的战略目标保持一致。
信息系统容灾方案

信息系统容灾方案1. 引言在数字化时代,信息系统在企业和组织中起着重要的作用。
然而,任何一个信息系统都可能面临各种各样的灾害风险,如自然灾害、硬件故障、人为失误等。
为了确保信息系统的连续运行和数据的安全性,组织需要制定有效的容灾方案。
本文将介绍信息系统容灾方案的重要性,并提出一种可行的解决方案。
2. 信息系统容灾的意义信息系统在现代企业和组织中扮演着至关重要的角色。
它们不仅用于存储和处理大量的数据,还支持着业务流程和决策制定。
如果信息系统遭受灾害而无法正常运行,将对组织的运营和业务造成严重影响。
因此,信息系统容灾变得至关重要。
3. 信息系统容灾方案的关键组成部分一个完善的信息系统容灾方案应包括以下关键组成部分:3.1 备份策略备份策略是信息系统容灾方案的基础。
通过定期备份数据,可以确保即使系统出现故障或数据损坏,重要数据仍然可以恢复。
备份应该定期进行,并存储在离主系统足够远的地方,以防止灾害影响到备份数据。
3.2 灾难恢复计划灾难恢复计划是在系统遭受灾害后恢复正常运行的详细计划。
它应该规定每个人的角色和责任,并包含恢复系统所需的步骤和时间表。
这将有助于组织在灾难发生时迅速采取行动,以最小化停机时间和数据丢失。
3.3 容灾测试和演练定期进行容灾测试和演练是确保容灾方案可靠性的重要步骤。
通过模拟不同类型的灾难情况,可以评估容灾方案的有效性,并发现潜在的问题和改进点。
这将帮助组织更好地准备和应对实际灾难事件。
3.4 多地点冗余为了确保信息系统的连续性,可以在不同地点建立冗余系统。
这样,即使其中一个系统遭受灾害,其他系统仍然可以继续运行,确保业务不受影响。
多地点冗余需要考虑到系统之间的数据同步和故障转移机制。
4. 应对常见灾害风险的容灾方案不同类型的灾害风险需要采用不同的容灾方案。
以下是几种常见灾害风险的应对方案:4.1 自然灾害自然灾害如地震、火灾、洪水等可能对信息系统造成严重破坏。
为了应对自然灾害,可以在安全的地方建立备用数据中心,并通过云计算技术实现数据的实时复制和故障转移。
容灾系统方案

3.在实施过程中,确保合法合规,严格按照相关法律法规要求执行;
4.完成容灾系统建设后,组织验收,确保容灾系统满足业务需求;
5.定期对容灾系统进行评估和优化,提高系统性能。
六、后期维护
1.建立完善的运维管理制度,确保容灾系统正常运行;
2.定期对容灾系统进行维护和保养,包括硬件设备、软件系统和备份数据;
3.关注新技术发展,及时对容灾系统进行升级和优化;
4.定期开展培训和演练,提高运维人员的技术水平和应急处理能力。
本方案旨在为企业提供一套合法合规、高效可靠的容灾系统,以降低灾难带来的损失,保障企业业务的连续性和数据安全。在实施过程中,需遵循相关法律法规,确保容灾系统的合法合规性。同时,企业应根据自身实际情况,调整和优化方案,以满足业务发展需求。
(3)异地灾备中心:在发生区域性灾难时,提供数据恢复和业务接管能力。
2.数据备份
(1)采用定期备份策略,将关键数据备份至同城和异地灾备中心;
(2)备份数据包括:数据库、文件系统、应用配置文件等;
(3)备份方式:全量备份、增量备份和差异备份;
(4)备份频率:根据数据变化情况,合理设置备份频率;
(5)备份验证:定期对备份数据进行恢复测试,确保备份数据可用。
-异地灾备中心:应对区域性灾难,保障数据的长期存储和恢复。
2.数据保护
-备份策略:实施定期备份,包括全量备份和增量备份。
-备份类型:涵盖操作系统、应用数据、数据库和配置文件等。
-备份频率:根据数据变化情况,合理设定备份频率。
-备份验证:定期执行备份数据的恢复测试,确保备份数据的有效性。
3.容灾切换
-自动化切换:利用自动化技术实现生产中心与灾备中心之间的快速切换。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息系统容灾咨询服务项目信息系统容灾演练实施方案目录1演练背景 (4)2演练目标与原则 (5)2.1演练目标 (5)2.2演练原则 (5)3演练组织 (7)3.1演练组织结构 (7)3.2演练岗位人员安排 (8)4演练方案设计 (10)4.1灾难恢复演练场景 (10)4.2演练假设条件 (10)4.3演练系统范围 (10)4.4演练方式 (10)4.5演练方案技术要点说明 (11)4.6灾备系统技术方案概述 (12)5演练计划 (14)5.1演练时间 (14)5.2演练地点 (14)5.3演练总体流程 (14)5.4灾备演练流程大纲 (15)5.5灾备演练流程控制图 (15)5.6演练信息沟通方式 (15)6演练准备工作 (17)6.1灾备演练总体工作计划 (17)6.2人员准备 (17)6.3人员培训 (17)6.4业务验证准备 (17)6.5场地资源准备 (17)6.6演练风险分析 (18)7演练相关附件 (19)7.1附件1演练方案模板 (19)7.2附件2灾难恢复演练签到表 (19)7.3附件3灾难恢复演练切换记录表 (20)7.4附件4灾难恢复演练业务测试记录表 (21)7.5附件5灾难恢复演练业务部门问题与建议表 (21)1演练背景信息系统及服务在xx公司生产经营和业务创新中越来越重要,信息系统灾难直接威胁公司战略目标实现,为提高xx公司信息系统的风险抵御能力,减少灾难打击和重大事故发生时造成的损失,保障业务持续稳定运行,2017年8月xx公司启动了灾备体系建设专项工作,2017年12月完成灾备咨询规划,2018年5月完成灾备系统实施方案设计和软硬件资源采购,2018年12月中旬实施并完成同城灾备系统集成建设与系统联调测试,初步完成重要信息系统的应用级灾备体系建设。
灾备建设是xx公司信息系统安全运行保障体系的基础性工作,是保障信息服务业务连续性的必要手段,是适应当前IT建设和未来业务发展趋势的重大战略部署,是xx公司信息安全保障体系的重要组成部分。
灾难恢复演练是IT服务业务连续性建设的重要工作内容。
通过演练可检验应急响应和灾难恢复体系的完整有效性,使相关人员了解信息系统应急响应及灾难恢复目标和流程;全面验证技术及业务管理指挥、流程操作、协调配合等方面的综合能力;完成灾难恢复相关人员意识和知识技能培训;验证应急响应及灾难恢复能力。
本文档为灾备咨询服务商H3C在本项目中的文档交付物,为xx公司信息系统灾难恢复演练提供规划和指导。
本恢复演练规划方案对本项目中的灾难恢复演练的演练范围、演练方式、演练方案设计和演练计划进行了说明。
灾难恢复演练是一项持续性的、常态化的体系建设和维护工作,本规划方案做为演练范例,指导近期项目中的灾难恢复演练;后续演练需结合具体演练目标和内容不断修订和完善。
2演练目标与原则2.1演练目标本次演练主要实现以下目标:⏹确认同城灾备建设项目成果✓验证同城灾备中心对核心业务的实际接管能力;✓验证实际灾备网络切换技术方案的有效性;✓验证核心业务恢复预案流程及操作技术手册的适用性和有效性。
⏹进一步提升团队协作与恢复能力✓使恢复团队熟悉预案流程、熟练系统及业务恢复操作✓进一步明确各业务系统在演练中的组织和人员✓增强应急响应意识,提升综合执行能力,提高操作熟练度、流程流畅性及配合默契度⏹持续改进✓发现预案手册、恢复流程、灾备系统等问题和不足并持续改进完善⏹满足行业监管合规及审计要求2.2演练原则⏹安全第一✓演练过程严格控制对正常业务负面影响、尽量不影响生产系统正常运行;✓完善风险控制,将演练对生产业务负面影响降到最低;⏹务实高效✓对核心业务开展系统恢复及业务验证,覆盖典型容灾架构技术;✓实际检验IT执行效果、协调能力、操作技能,确保演练取得实效;⏹统一组织指挥✓集团信息化中心统一组织,基于灾难恢复管理平台工具统一灾备恢复过程指挥和任务调度,增强协作能力,提升灾备绩效;⏹业务验证仿真✓基于生产业务安全风险考量,采用符合真实业务场景的模拟数据做业务验证。
3演练组织3.1演练组织结构根据xx公司《信息系统灾难恢复预案》中规定的灾难恢复管理组织架构,结合本次演练目的,形成此次演练的组织架构。
本次演练由演练领导组、演练指挥组、演练执行组、演练保障组组成,其组织架构如下图所示。
本次演练中各工作组的角色与职能如下:⏹演练领导组✓负责对演练目标、演练方式、演练策略作出决策;✓负责对演练实施工作提出具体要求;✓负责协调演练实施方的工作关系,保障演练顺利进行;✓负责演练过程中出现异常情况进行决策。
⏹演练指挥组✓负责落实演练领导组的决策;✓负责制定具体演练方案和计划,提交演练决策领导组审阅;✓负责演练过程指挥、态势跟踪、资源调配与执行任务协调;✓负责编制演练总结报告,提交演练领导组审阅。
演练执行组包括IT恢复小组和业务验证组以及演练保障组。
⏹IT恢复组✓负责演练前生产中心、灾备中心技术准备工作;✓负责演练中网络、存储、主机、虚拟化、数据库等IT基础架构实施工作;✓负责演练业务应用系统的灾难恢复实施工作。
⏹业务验证组✓负责演练前准备业务测试案例;✓负责业务部门灾难恢复相关业务环境的确认工作;✓负责灾备切换后,对业务系统实施业务用例测试。
⏹演练保障组✓负责灾备演练中相关系统、相关技术、相关方案后线支持与指导;✓由xx公司IT系统相关产品与服务供应商组成。
3.2演练岗位人员安排4演练方案设计4.1灾难恢复演练场景本次演练模拟的灾难场景说明如下:由于人为、自然或技术原因,发生造成生产中心核心业务系统发生严重故障或瘫痪,使其支持的业务功能停顿或服务水平不可接受、达到特定时间的突发性事件,包括但不局限于机房电源故障及通讯故障、生产中心机房场所损坏、设备或软件故障或损坏、意外或人为操作失误、恐怖袭击、火灾、爆炸等。
4.2演练假设条件⏹仅有生产中心数据处理环境或者其关键组件由于非计划性事故或事件造成运行中止和中断,其它所有预先设计的备份中心、恢复场所都没有受到影响。
⏹有足够数量的具备所需技能的人员可以调配进行关键系统和业务的恢复。
⏹外部组织和机构(例如供应商)恢复期间能够提供合理的合作和响应。
4.3演练系统范围本次演练系统范围为:XX系统或XX系统或XX系统。
4.4演练方式选取演练方式时,以尽量减少影响生产系统正常运行为前提,根据以点带面原则,验证容灾中心提供灾难备份服务能力。
本次灾难恢复演练,在选取演练方式时考虑以下几点:✓所选演练方式对生产业务的影响尽可能小;✓可用于演练的时间窗口,选择能够在演练时间窗口内完成的演练方式;✓在演练验证范围、实施难度、产生影响以及演练效果之间进行平衡;✓演练可以选择采用真实切换或模拟切换方式进行。
✓两种方式都可以达到对容灾系统有效性进行验证的目的,以下对两种演练方式的对比:⏹演练覆盖业务范围不论真实切换还是模拟切换演练,演练的业务范围都将限于容灾中实现备份的业务系统部分,因此两种演练方式所能覆盖的业务范围是一致的。
⏹演练的验证效果真实切换演练:直接将生产系统切换至容灾系统,由容灾系统接管生产系统运行,在演练完成后,再将容灾系统回切至生产系统。
该方式能够直接验证容灾系统的可用性。
模拟切换演练:在演练期间不中断生产中心的生产系统运行,采用有效的方式模拟灾难场景,启动容灾系统,业务切换至容灾系统完成演练内容,验证容灾系统的可用性。
⏹演练对生产的影响真实切换演练:由于灾难备份系统的业务范围为核心业务,因此切换至容灾系统运行期间必定造成部分业务无法对外提供服务。
此外,真实切换必须进行系统的回切(主要是数据环境的回切),回切期间全部业务都将中断对外服务。
因此,真实切换演练将会对生产业务造成较大的影响。
模拟切换演练:通过一定的技术手段模拟生产中心的灾难,演练过程不会对正常的业务造成影响;并且通过合理选择演练时间,可以将对业务用户的影响降到最低。
⏹演练实施风险真实切换演练:该方式涉及范围广,实施过程复杂,对生产系统影响大,演练方案除了需要验证容灾系统的有效性之外,还要充分考虑过程中可能对生产造成影响以及相关的应急措施。
因此,该演练方式实施风险高。
模拟切换演练:不论发生何种问题,都有回退的空间,并且不会对真实业务造成任何损失。
该方式实施风险低。
综上所述,综合考虑xx公司实际及行业演练实践,灾备运行初期,组织、流程、系统尚不成熟,项目组确定当前采用模拟切换演练方式。
4.5演练方案技术要点说明⏹分离生产灾备中心间应用系统的灾备数据复制,恢复业务数据,依托灾备中心平台资源做应用系统恢复;灾备应用与生产环境隔离,不中断生产运行,正常工作时段实施。
⏹业务应用恢复中,需实施应用系统配置参数修改以匹配灾备环境IP地址变化。
⏹ 灾难恢复演练主要由数据恢复、应用恢复及业务验证三阶段组成,IT基础架构团队担负数据和系统平台资源恢复,业务运维团队担负应用恢复,业务部门用户(或业务运维团队)担负业务验证。
⏹ 使用仿真业务操作的模拟数据及测试用例做业务验证,演练完毕数据丢弃,不用反向追补到生产系统。
⏹ 演练业务应用终端手工配置灾备中心DNS 服务器地址,开通网络访问权限,基于智能解析设备访问灾备中心主机(或本地hosts 文件解析或IP 方式直接访问灾备中心应用系统)⏹ 该模拟切换演练不做基于DNS 的内网互联网网络切换⏹ 被演练的相关业务系统按照预先设置顺序依次实施灾备恢复演练。
4.6 灾备系统技术方案概述图4-1 灾备系统物理架构图如上图所示,xx 公司信息系统灾备架构设计总体说明如下:▪ 基于灾备优先级、灾备目标、系统部署和技术特点,经技术论证,对不同类型系统采用差异化灾备架构方案:增城数据中心黄埔数据中心新增设备1)数据库数据复制方案建议为:同构磁盘存储同步复制方案,该技术方案可以有效满足RTO,RPO的需求,同时适应现状,有效降低灾备系统的维护复杂度和运维人员的工作量等。
2)业务系统的前端应用服务器部署在VMware虚拟化平台上,虚拟机数量较多,应用服务器数据包括应用程序、配置及部分实时日志数据等,灾备方案建议为:VMware SRM方案。
3)AS/400平台服务器运行生产、销售等部分应用,当前存在2个数据中心之间的2台AS/400主机之间数据复制关系,基于数据库日志复制技术icluster及应用程序远程数据管理DDM;根据现状及相关讨论确认,AS/400平台的灾备数据复制架构维持现状:数据库日志复制技术icluster及应用程序远程数据管理DDM,根据需要本次项目会进行黄埔主机的硬件升级等工作,再进行相关的数据库复制部署实施。
4)邮件系统采用微软exchange 数据库可用性组(DAG)解决方案,实现跨数据中心的高可用灾备架构。
▪资源策略:分别在黄埔和增城数据中心配置与生产端对等的计算(部分降级或分期)、存储和网络等IT基础架构资源,满足应用级灾备目标定位,满足未来生产运行所需的基础资源支撑保障能力;▪灾备模式为互备:黄埔数据中心和增城数据中心分别运行部分应用系统,IT基础架构相互独立,在日常运行中每个数据中心将应用系统数据实时复制至对端,2个数据中心双活;在1个数据中心发生站点级别灾难时,对端数据中心将接管其应用,2个数据中心为互备;▪部分业务系统需要做少量基于灾备系统建设适应性改造:1)应用单边化改造:EPS,DCS,CMS/RBS等系统,应用和数据库迁移至同一数据中心。