第九章数据中心与信息系统灾难恢复

合集下载

数据中心管理中的灾难恢复与应急响应方法(十)

数据中心管理中的灾难恢复与应急响应方法(十)

数据中心管理中的灾难恢复与应急响应方法引言在当今数字化时代,数据中心作为存储和处理海量数据的关键设施,扮演着重要的角色。

然而,各种自然灾害和人为因素的不可预测性,使得数据中心在灾害中面临着潜在的威胁。

因此,灾难恢复和应急响应成为了数据中心管理中不可或缺的环节。

本文将探讨数据中心管理中的灾难恢复与应急响应方法。

I. 灾难恢复方法A. 灾难恢复计划的制定灾难恢复计划是数据中心管理中最重要的组成部分之一。

它应该涵盖灾难恢复的各个方面,并明确每个成员的角色和责任。

通过制定详细的计划,可以更好地应对潜在的灾难,减少恢复时间,并最大限度地减少数据损失。

B. 备份与恢复策略数据中心应该采取全面的备份策略,包括定期备份关键数据和应用程序。

同时,备份数据的存储地点应该远离主要数据中心,以避免单点故障。

此外,恢复策略也应该考虑到不同类型的灾难,例如硬件故障、网络中断等。

通过灵活的备份和恢复策略,可以确保在灾难发生时能够尽快地恢复数据中心的运营。

C. 业务连续性规划业务连续性规划是一种使得关键业务能够持续运作的策略。

在制订业务连续性规划时,数据中心管理者需要评估和优化数据中心的风险,制定适当的措施,以确保关键业务在灾难发生时能够持续运行。

例如,可以建立双活数据中心,通过数据的镜像备份和灾备机制实现系统的高可用性。

II. 应急响应方法A. 实时监控与警报系统数据中心管理应该通过实时监控系统来监测数据中心的运行状况,包括温度、湿度、电力、网络等各个方面。

一旦监测到异常情况,应该及时触发警报系统,以便管理员能够快速响应并解决问题,避免事故的进一步扩大。

B. 人员培训和演练数据中心管理团队应该定期进行培训和演练,以提高灾难应对和紧急处理的能力。

培训应包括灾难恢复程序的执行、应急响应策略的应用以及关键设备的操作和维护等。

通过培训和演练,数据中心管理团队能够更加熟悉应急措施,并能够在压力下迅速而准确地采取行动。

C. 合作与沟通在应急情况下,数据中心管理团队需要与其他部门和外部服务提供商合作和沟通。

数据中心管理中的灾难备份与紧急恢复方法(三)

数据中心管理中的灾难备份与紧急恢复方法(三)

数据中心管理中的灾难备份与紧急恢复方法在现代信息化社会中,数据中心扮演着重要的角色,它承载着企业和个人的海量数据,如果数据中心遭受到灾难,可能会引发巨大的经济和社会损失。

因此,灾难备份与紧急恢复方法在数据中心管理中至关重要。

一、灾难备份的重要性数据中心的灾难备份是指为了保护数据中心遭受自然灾害、黑客攻击、硬件故障等突发事件而采取的预防措施。

灾难备份的目的是确保数据的完整性和可用性,一旦发生灾难,能够及时恢复数据,并尽可能减少数据丢失的损失。

灾难备份不仅仅是一项技术手段,更是数据中心管理的一种安全策略。

二、常见的灾难备份方法1. 本地备份:将数据备份到本地存储设备中,如硬盘、磁带等。

本地备份的优势是备份速度快、恢复速度快,但存在着本地存储设备容量有限、单点故障风险大的问题。

2. 远程备份:将数据备份到远程服务器或云存储中。

远程备份的优势是能够充分利用云计算和网络技术,数据备份空间相对无限,且具备较高的可用性。

同时,远程备份还可以利用多地域的备份,以提高数据的安全性和可靠性。

3. 增量备份:只备份发生变动的文件和数据。

增量备份相较于全量备份能够节省存储空间和备份时间,但在恢复时需要将全量备份与增量备份结合使用。

三、紧急恢复方法灾难备份的目的是为了实现紧急恢复,及时将数据中心从灾难中恢复过来,最大限度地减少停机时间和数据丢失。

以下是常见的紧急恢复方法:1. 冷备份:在备份数据的同时,搭建一个与原数据中心相似的工作环境。

一旦发生灾难,可以迅速激活冷备份,并恢复到正常的工作状态。

冷备份具有较低的成本,但恢复时间较长。

2. 热备份:在备份数据的同时,维护一个实时镜像副本。

灾难发生时,热备份可以迅速接管工作负载,几乎没有停机时间。

热备份需要投入较高的资金和资源,但恢复时间非常短。

3. 容灾备份:将数据备份到不同地理位置的数据中心,以实现地理冗余和容灾。

一旦主数据中心遭受灾难,可以立即切换到备份数据中心,保证业务的连续性。

数据中心管理中的灾难备份与紧急恢复方法

数据中心管理中的灾难备份与紧急恢复方法

数据中心是现代企业中不可或缺的组成部分,它承载着企业重要的业务数据和应用系统。

然而,面对各种自然灾害和人为事故,数据中心的安全和稳定性也面临着巨大的挑战。

因此,灾难备份与紧急恢复方法成为每个数据中心管理者必备的技能。

灾难备份是指在数据中心发生灾害性事件时,通过备份数据和系统设置的方式,以便在灾害恢复后能够快速恢复业务。

这主要包括两个方面:备份数据和备份系统设置。

首先,备份数据是数据中心灾难备份的核心。

数据中心中的数据包括用户信息、交易记录、产品资料等,一旦发生灾害,这些数据可能会丢失或损坏,给企业带来巨大的损失。

为了解决这个问题,数据中心管理者应定期对重要数据进行备份。

备份频率应根据数据的重要程度和实时性来决定。

对于每天产生大量交易数据的企业来说,最好能够实现实时备份,确保数据的安全性和完整性。

除了备份数据,备份系统设置也是数据中心灾难备份的重要内容。

在灾难发生前,数据中心管理者应对系统进行全面的备份,包括系统配置、应用软件和平台等。

这样可以确保在灾难恢复后能够快速恢复整个系统设置,减少业务中断的影响。

紧急恢复方法是指在发生灾难后,数据中心管理者采取的措施以尽可能快地恢复业务。

紧急恢复方法包括两个方面:紧急响应和业务恢复。

首先,紧急响应是指在灾难发生时,数据中心管理者迅速响应,采取行动以减少损失。

当灾难发生时,数据中心管理者应立即通知相关人员,组织紧急小组并启动应急预案。

紧急小组应负责评估灾害情况、采取措施以避免进一步影响,并与相关组织和机构密切合作以获取支持。

其次,业务恢复是指在灾难发生后,数据中心管理者根据事前准备的恢复计划和备份数据,迅速恢复业务。

数据中心管理者应对备份的数据和系统设置进行验证,确保数据的完整性和准确性。

在恢复过程中,应优先恢复重要业务和关键数据,然后逐步恢复其他业务。

同时,数据中心管理者应定期评估业务恢复情况,及时调整和优化恢复策略,确保业务能够在最短的时间内恢复正常。

综上所述,数据中心灾难备份与紧急恢复方法是数据中心管理者必备的技能。

数据中心灾难恢复预案

数据中心灾难恢复预案

数据中心灾难恢复预案第一章灾难恢复预案概述 (3)1.1 概述 (3)1.2 编写目的 (3)1.3 适用范围 (3)第二章灾难恢复组织架构 (4)2.1 组织架构 (4)2.2 职责划分 (4)2.3 沟通协调 (5)第三章灾难风险识别与评估 (5)3.1 风险识别 (5)3.1.1 目的 (5)3.1.2 方法 (5)3.1.3 内容 (6)3.2 风险评估 (6)3.2.1 目的 (6)3.2.2 方法 (6)3.2.3 内容 (6)3.3 风险等级划分 (6)第四章灾难恢复策略 (7)4.1 恢复目标 (7)4.2 恢复策略 (7)4.3 恢复时间要求 (8)第五章数据备份与恢复 (8)5.1 数据备份策略 (8)5.1.1 备份范围 (8)5.1.2 备份类型 (8)5.1.3 备份频率 (8)5.1.4 备份方式 (8)5.2 数据恢复流程 (9)5.2.1 数据恢复条件 (9)5.2.2 数据恢复步骤 (9)5.2.3 数据恢复优先级 (9)5.3 备份存储管理 (9)5.3.1 存储设备管理 (9)5.3.2 备份介质管理 (9)5.3.3 备份策略调整 (9)第六章硬件设备恢复 (9)6.1 硬件设备清单 (9)6.2 设备恢复流程 (10)6.3 设备维护保养 (11)第七章网络恢复 (11)7.1.1 网络拓扑结构 (11)7.1.2 网络设备 (11)7.1.3 网络协议 (11)7.2 网络恢复流程 (12)7.2.1 网络故障分类 (12)7.2.2 网络故障检测 (12)7.2.3 网络恢复步骤 (12)7.3 网络安全策略 (12)7.3.1 防火墙策略 (12)7.3.2 入侵检测与防御 (12)7.3.3 安全审计 (13)7.3.4 数据加密 (13)7.3.5 安全备份 (13)第八章应用系统恢复 (13)8.1 应用系统清单 (13)8.1.1 目的 (13)8.1.2 清单内容 (13)8.1.3 清单管理 (13)8.2 应用系统恢复流程 (13)8.2.1 恢复流程启动 (13)8.2.2 恢复流程步骤 (14)8.2.3 恢复流程监控 (14)8.3 应用系统测试与验证 (14)8.3.1 测试目的 (14)8.3.2 测试方法 (14)8.3.3 测试周期 (15)第九章人员培训与演练 (15)9.1 培训计划 (15)9.1.1 培训目的 (15)9.1.2 培训对象 (15)9.1.3 培训内容 (15)9.1.4 培训方式 (15)9.1.5 培训周期 (15)9.2 演练方案 (15)9.2.1 演练目的 (15)9.2.2 演练类型 (15)9.2.3 演练频率 (16)9.2.4 演练流程 (16)9.3 演练评估与改进 (16)9.3.1 评估内容 (16)9.3.2 评估方法 (16)9.3.3 改进措施 (16)第十章灾难恢复预案管理 (17)10.1.1 修订原则 (17)10.1.2 修订流程 (17)10.1.3 更新周期 (17)10.2 预案发布与宣传 (17)10.2.1 发布范围 (17)10.2.2 发布方式 (17)10.2.3 宣传培训 (18)10.3 预案实施与监督 (18)10.3.1 实施责任 (18)10.3.2 监督机制 (18)第一章灾难恢复预案概述1.1 概述灾难恢复预案是数据中心应对突发性灾难事件,保证业务连续性和数据安全的重要文件。

信息系统灾难恢复方案

信息系统灾难恢复方案

信息系统灾难恢复方案第一章总则第一条为规范并指导我公司生产系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户的合法权益,根据国家信息安全法律法规及有关规定,制定本预案。

第二条生产系统灾难恢复工作应坚持“统筹规划、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。

第三条本指引所称灾难恢复为生产系统灾难恢复。

灾难恢复工作是指,为保障生产系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。

第二章总体工作要求当生产系统及相关业务流程发生重大变更时,应立即启动灾难恢复需求的再分析,并根据最新的灾难恢复需求分析重审和修订灾难恢复策略。

根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作。

加强与业务密切相关的机构间的协调,共同评估面临的风险,协同制定灾难恢复策略,提高整体风险防范和灾难恢复能力。

第三章灾难恢复项目小组的制定和职能1.管理组:小组人员:职责:统筹规划,指挥各小组按照既定计划进行执行。

2.部门恢复组小组成员:职责:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。

3.计算机恢复组:小组成员:职责:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。

4.损坏评估组:小组成员:职责:负责对公司损失的重要数据、财务进行总体评估。

并针对相应损失的财产进行汇总并结合拥有的保险进行申报。

5.安全组:小组成员职责:负责灾难发生后的人员、数据、财务的安全进行保护。

并制定相应的安全策略。

6.设备支持组:小组成员:职责:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。

7、数据恢复组:小组成员:职责:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

数据中心管理中的备份与灾难恢复最佳实践(一)

数据中心管理中的备份与灾难恢复最佳实践(一)

数据中心管理中的备份与灾难恢复最佳实践在现代科技发展的背景下,大量的数据积累成为了组织和企业的重要资产。

对于数据的备份与灾难恢复,是数据中心管理中至关重要的一环。

本文将探讨数据中心管理中备份与灾难恢复的最佳实践。

1. 数据备份数据备份是数据中心管理中最基础的一项任务,它确保了组织或企业在遭受数据丢失或灾难时可以迅速恢复数据。

在进行数据备份时,以下几点是值得注意的:定期备份数据备份应该定期进行,以确保数据的最新版本可以随时恢复。

根据数据敏感性和容错能力需求,可以设定每周或每日备份的频率。

多重备份数据备份应该采用多重备份的策略,即将数据复制到不同的存储介质中。

这样,在某一备份设备发生故障时,还可以通过其他备份设备来恢复数据。

离线备份离线备份是一种将数据存储在物理介质中(如硬盘或磁带)并将其从网络中隔离的备份方式。

这种备份方式可以防止网络攻击或病毒感染对备份数据的破坏。

2. 灾难恢复除了数据备份外,灾难恢复也是数据中心管理中的重要任务。

当灾难发生时,组织或企业需要采取措施来迅速恢复业务并保障数据的完整性。

以下是灾难恢复的最佳实践:制定灾难恢复计划制定灾难恢复计划是灾难恢复的第一步。

该计划应该明确表明在灾难发生时应该采取的具体步骤,包括通知相关人员、评估损失、应对灾难和恢复业务等。

定期测试灾难恢复计划制定灾难恢复计划并不足以确保成功的灾难恢复。

定期测试灾难恢复计划,可以帮助组织或企业发现潜在的问题并及时修复。

只有经过测试的计划,才能在灾难来临时发挥作用。

灾难恢复团队建立一个专门负责灾难恢复的团队是非常重要的。

该团队应该由具有相关技术和管理经验的人员组成,他们可以负责指导、执行和监督灾难恢复计划。

3. 新兴技术在备份与灾难恢复中的应用随着科技的进步,新兴技术在数据中心管理中备份与灾难恢复方面也得到了广泛应用。

云备份云备份是将数据备份到云平台的一种方式。

云备份不仅可以提供无限的存储空间,还可以实现自动备份和实时备份。

数据中心管理中的灾难备份与紧急恢复方法(一)

数据中心管理中的灾难备份与紧急恢复方法(一)

数据中心是企业运营中至关重要的组成部分,负责存储和处理大量的敏感信息和业务数据。

然而,由于硬件故障、自然灾害、黑客攻击等不可预测的事件,数据中心的连续性和安全性面临着巨大挑战。

因此,灾难备份和紧急恢复方法成为数据中心管理中至关重要的一环。

1. 数据备份与灾难恢复的重要性在数据中心管理中,灾难备份与紧急恢复方法是确保业务连续性和数据安全性的关键措施。

数据备份是指将关键数据的副本存储在多个位置,以防止数据丢失。

紧急恢复则是指在发生灾难事件后,迅速恢复业务运行并恢复数据。

这两者相辅相成,为数据中心提供了可靠的保障。

2. 灾难备份策略灾难备份策略包括完整备份、增量备份和差异备份。

完整备份是指将整个数据集备份到外部存储设备,需要较大的存储容量和时间。

增量备份则是只备份自上次完整备份以来发生的数据变化,减少了备份时间和存储空间的占用。

差异备份则是备份自上次完整备份以来发生的数据差异,比增量备份更加灵活,但需要更多的计算资源。

3. 灾难恢复方法灾难恢复方法包括冷备份、热备份和温备份。

冷备份是指将备份数据存储在离线存储介质中,一旦发生灾难事件,需要将备份数据还原到主要服务器中才能恢复业务。

热备份则是在备份服务器上实时备份数据,当主要服务器故障时,可以立即切换到备份服务器,保证业务连续性。

温备份则是将备份数据存储在近线存储介质中,数据可以更快地还原到主要服务器中,提供更快速的灾难恢复。

4. 多点备份与异地备份为了进一步提高数据中心的可靠性和安全性,多点备份和异地备份是常用的策略。

多点备份是指将备份数据存储在不同的位置,以防止单点故障。

异地备份则是将备份数据存储在物理上分离的地理位置,一旦发生本地灾难,可以从异地还原数据。

这两种方法可以有效地减少数据丢失的风险和灾难对业务的影响。

5. 灾难演练和定期更新灾难备份与紧急恢复方法并非一成不变的,企业需要定期进行灾难演练和测试。

通过模拟真实的灾难情景,可以检验备份和恢复方案的可行性和有效性。

数据中心管理中的数据备份与灾难恢复最佳实践

数据中心管理中的数据备份与灾难恢复最佳实践

数据中心是现代企业运营的核心,其中的数据备份与灾难恢复是数据中心管理中至关重要的环节。

在这个信息爆炸的时代,数据对于企业来说是最宝贵的资源之一,因此,有效的数据备份与灾难恢复策略对于企业来说至关重要。

本文将探讨数据中心管理中的数据备份与灾难恢复的最佳实践。

1. 数据备份的重要性数据备份是指将数据从存储设备复制到另一个介质,以便在原始设备发生故障或数据丢失时恢复数据。

数据备份的重要性不容忽视。

首先,数据备份是保障数据安全的重要手段。

数据中心存储的是大量敏感企业数据,如客户信息、财务数据等,如果意外丢失,会对企业造成巨大损失。

其次,数据备份是应对硬件故障的重要手段。

硬盘、服务器等硬件设备都有发生故障的风险,及时备份数据可以减少因硬件故障造成的停机时间。

此外,数据备份还是满足法规要求的必要手段,许多行业对于数据的备份与保护有着明确的规定。

2. 数据备份的最佳实践在数据备份的过程中,有一些最佳实践值得借鉴。

首先,选择合适的备份介质。

常见的备份介质有磁带、硬盘、云存储等,不同的介质具有不同的优缺点,企业应根据自身需求选择适合的备份介质。

其次,制定合理的备份策略。

备份策略应包括备份时间、备份频率、备份文件的存储位置等内容,合理的备份策略可以高效地保护数据。

此外,进行备份数据的验证也是非常重要的一步,通过验证备份数据的完整性和可用性,可以确保备份的有效性。

最后,加密备份数据是保障数据安全的必要措施,确保备份数据不会被未经授权的人访问。

3. 灾难恢复的重要性灾难恢复是指在数据中心发生灾难性事件时,及时恢复业务的过程。

灾难事件包括人为错误、自然灾害、黑客攻击等。

对于数据中心来说,灾难恢复是保障业务连续性的重要环节。

一旦数据中心发生灾难,如果没有有效的恢复策略,将会导致业务中断、数据丢失,给企业带来巨大损失。

因此,灾难恢复的重要性不言而喻。

4. 灾难恢复的最佳实践灾难恢复的最佳实践是确保业务快速恢复的关键。

首先,制定灾难恢复计划是必要的一步。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据中心是集成化的IT应用环境,并且随着业务的整合以及新业务的不断涌现,数据中心变得愈加庞大和复杂,业务数据也变得愈加关键。

任何断电、系统故障和人为操作不当都有可能造成关键数据的丢失,继而造成企业业务的停滞和不可估量的经济损失。

如何应对数据大集中所带来的风险已成为人们关注的重点。

为了应对各种自然灾难(火灾、水灾、地震等)和人为灾难(误操作、病毒等)对企业数据中心的安全和正常运行带来的冲击,近年来,信息系统灾难恢复(通常也称为“灾备”)建设日益受到社会的关注和重视。

信息系统灾难恢复是指将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。

为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程称为灾难备份。

正常情况下,对生产系统运行进行数据处理和支持关键业务功能运作的场所被称为生产中心。

在灾难发生时接替生产系统运行进行数据处理和支持关键业务功能运作的场所被称为灾难备份中心(简称“灾备中心”),它包括备用的数据处理中心、备用的工作环境、备用的生活设施和技术支持及运行管理人员。

生产中心是信息系统灾难恢复的对象,而灾备中心是信息系统灾难恢复的基础,生产中心和灾备中心是数据中心的不同形态,而数据中心则是信息系统灾难恢复的载体。

对于那些高度依赖其信息系统运作的行业和企业而言,为保障信息系统安全稳定运行,人们采用了从技术、管理直至备份等诸方面的措施。

其中数据中心基础设施是保障信息系统安全运行最重要的基础。

从国际行业经验来看,大部分引发信息系统灾难的事件完全可以通过加强数据中心基础设施建设及运维管理来消除、或者减轻其不良影响。

因此,对于业务连续性要求较高的行业和企业来说,选择高可用性数据中心作为生产中心和灾备中心是抵御灾难风险,保障业务持续运行的前提和根本。

9.2 数据中心的灾难恢复策略信息系统灾难恢复起源于20世纪70年代,目前在政府、金融、电信、交通、能源、公共服务业以及大型制造、零售业等对信息化依存程度高的行业应用极其广泛。

在震惊世界的“9•11”恐怖事件发生以后,“灾难恢复”更是成为全球性的信息化课题,即在政府或企业的数据中心遭遇自然灾难或人为侵害时,启用同城或异地建立的备份数据中心提供不间断的数据信息服务,从而保证政府或企业的业务连续性。

根据战略与业务需求的不同,灾难恢复基础设施可采用同城或异地两种布局方式。

同城方式是指生产中心与灾备中心处于同一地理区域,面临同一区域性灾难风险,一般距离在20~100km以内。

异地方式是指生产中心与灾备中心处于不同地理区域,通常不会同时面临同一区域性灾难风险,一般距离在数百公里以上。

在同城方式下,用于数据保护及应用访问的网络使用费用相对较低,用户灾难恢复响应及业务恢复速度较快,但抵御灾难的能力有局限性。

异地方式下,对区域性灾难的防范能力较强,但用于数据保护及应用访问的网络使用费用较高,用户灾难恢复响应及业务恢复速度相对较慢。

数据中心的灾难恢复解决方案取决于对生产中心及业务的风险分析和业务影响分析,根据分析的结果确定灾难恢复目标,尤其是恢复时间目标(RTO)和恢复点目标(RPO),进而选择同城、异地或同城加异地的灾难恢复策略。

9.3 灾备中心对数据中心的特殊要求灾备中心是以最高的可靠性和可用性为标准建设的,具备数据实时备份、冗余处理能力和网络传输条件,能够在主数据中心(生产中心)面临灾难无法正常运作的时候提供替代服务,对业务系统进行紧急恢复。

灾备中心和生产中心(包含互联网数据中心)都属于数据中心,都是对数据设备集中存放和管理的场所,在基础设施的要求上很多相同之处,有时两者能够同时设置在同一建筑体中,但服务对象和业务内容不尽相同,特别是在辅助配套设施方面存在极大的差异。

9.3.1. 选址要求数据中心在选址时通常需要远离加油站等易燃易爆场所,远离粉尘、强振动源和强电磁辐射源,选择交通通信方便、配套设施齐全、自然环境和地质条件良好的地方,从而有利于保证设备的安全运行,减少周围环境对其设备的危害,这是生产中心和灾备中心在选址时的共同点。

在选择或建设灾备中心时,应根据风险分析的结果,避免灾备中心与生产中心同时遭受同类风险。

灾备中心还应具有方便灾难恢复人员或设备到达的交通条件,以及数据备份和灾难恢复所需的通信和电力等资源。

灾备中心的选址应遵循以下主要原则。

1. 策略性首先,明确灾备中心的定位,即灾备中心的建设目的是防范什么样的灾难事件,在灾难发生时又能够提供何种服务。

根据定位的不同,在选址时应采取不同的策略,例如,灾备中心若想在局部战争条件下提供服务,在选址时就不能靠近军事目标或准军事目标等。

此外,应充分考虑物理安全性,避免建于闹市区,通常适宜建在郊区。

2. 风险性在选择或建设灾备中心时,应当充分考虑备选场址包含的风险是否在可容忍的范围之内,是否符合灾难恢复规划或业务连续计划的具体要求。

例如,生产中心与灾备中心之间应当保持一个安全距离,必须避免因同一灾难导致两个中心同时处于灾难事件当中的可能性。

又如,应选择独立的数据中心建筑物,有效隔离灾备中心与周边的建筑。

确保周边建筑发生火灾或其他紧急情况时,不会影响到灾备中心的安全。

此外,灾备中心应当确保与生产中心不在同一灾难风险区域,以规避灾难风险。

3. 科学性选择或建设灾备中心时,应对备选场址进行相关的场地风险评估,科学和全面地评价备选场址。

4. 适合性对于选定的场址而言,首先应符合《电子计算机场地通用规范》(GB/T 2887—2000)的要求;其次还要关注场址周边环境、地质地理条件、市政配套条件、电力供应条件以及通信服务商所能提供的服务能力等诸多因素,全面判断是否符合灾备中心的建设要求。

5. 便捷性对于灾备中心,其周边应有多条道路用于保证相关人员和物资能够顺利和快速到达。

例如,要求有2条或2条以上从机场到达灾备中心的道路,时间限制在1小时内。

确保主数据中心发生灾难时,相关业务专家和IT工程师能够迅速赶到灾备中心现场,实施恢复业务。

9.3.2. 基础设施要求从基础设施功能分区的角度考虑,生产中心和灾备中心都应当配置IT设备区、监控室、UPS室、会议室、其他设备用房、客户接待区、客户操作区、客户测试室和客户休息室等。

由于灾备中心需要为客户提供灾难发生时进行紧急恢复的工作空间,还应包括指挥中心室、新闻发布厅、VIP办公室、介质储存室和问题解决室等。

指挥中心室作为灾备中心的总控中心,实时反映灾备中心的运营状况,采用多方位自动化信息集中处理及多媒体信息展示方式,对灾备中心进行集中监控管理。

在客户较多的情况下,可以单独设立问题解决室作为客户各自的总控中心,通过带内和带外两种方式连接客户设备区域。

而新闻发布厅则是客户在灾难发生时或者灾难恢复后的新闻发布场所。

下面将简要介绍灾备中心基础设施涵盖的范围和基础设施规划原则。

1. 灾备中心基础设施涵盖的范围灾备中心是灾难恢复所需的、支持灾难备份系统运行的场所,包括介质的场外存放场所、备用的机房及工作辅助设施,以及允许灾难恢复人员连续停留的生活设施。

按照工作性质可分为工作设施、辅助设施和生活设施三个部分见表9-1。

表9-1 灾备中心基础设施分类2. 灾备中心基础设施规划原则(1) 经济性。

根据灾难恢复或业务连续计划的需求不同,选择或建设灾备中心时应根据实际情况给出适当的基础设施规划,降低成本。

(2) 空间性。

根据灾难恢复或业务连续计划的需求和面临的风险不同,针对灾备中心的特点应当预留足够空间,避免由于预留空间不足影响到灾备中心的正常运行。

例如,由于货运通道过于狭窄导致某些特定设备不能顺利搬运。

(3) 可靠性。

根据灾备中心的特点,规划时应注重基础设施的可靠性,尽量避免由于单点故障造成的风险。

(4) 低调性。

应考虑周边环境,不宜采用比较醒目的方式强调灾备中心,避免在特定条件下成为公众普遍关注的焦点,应采用融入周边环境的方式。

(5) 合理性。

应充分考虑各类设施之间的相互关系,合理布置并预留足够的扩展空间。

(6) 管理性。

应注重采用易于管理的技术或方法,提高灾备中心的工作效率,增强管理能力。

9.3.3. 运维管理要求灾难恢复业务的特殊性为灾备中心的日常运营管理带来了与众不同的挑战,具体包括:1. 7×24×365的要求由于大多数灾难的发生是无法预知的,作为灾备中心必须能够提供7×24×365不间断的灾难恢复服务,确保灾难事件发生后有足够的能力支持业务恢复。

如何能使灾备中心的工作人员时刻保持高度的责任心和敏感度去面对每一项日常工作,使企业的服务水平在一年的每分每秒都能保持同样的水平,这是灾备中心管理层所关注的一个主要问题。

2. “小概率、高风险”的管理要求由于灾难事件的发生属于小概率事件,因而真正能够使用到灾备中心的概率很小。

如何在平时几乎不使用的情况下,仅依靠日常的严格管理就能确保所有服务的可用性,则是灾备中心管理的另一个难点。

3. “演练为主,实操为辅”的日常管理要求如前所述,灾备中心的启用本身就是一个小概率事件,兼之在业务连续管理中有一个重要的原则就是要对业务连续计划经常演练。

因此,日常管理中应当经常采用各种各样的方式,使灾备中心的人员投入到不同的场景当中。

通过这种经常性的演练,让他们熟悉每一项工作的步骤,而且能逐渐适应灾难场境中所带来的各项压力,确保当灾难真正来临时,灾备中心的人员均能按要求完成相关工作。

4. 工作重复性较强由于灾备中心另一个重要的职责就是要确保放置在灾备中心的灾备系统平常的可用性。

因此,灾备中心应习惯于制订详细的设备检查与维护工作计划,然后按每半个小时、1个小时或其他频率实施计划。

5. 质量控制难度较大灾备中心归根到底就是通过日常严格的管理与训练有素的演练,在必要时提供灾难切换服务,能够满足RPO(灾难恢复时间点目标:主要指灾备系统可以恢复至灾难发生前的具体时间点)与RTO(灾难恢复时间目标:主要指利用灾备系统接管生产系统恢复运营所需要的时间)的要求。

保证灾难恢复的有效性是一项非常专业的工作。

灾备中心的运营管理非常复杂,从日常的运维到灾难发生时的应急响应、恢复和回退,是一个专业的、持续运行的过程,如图9-1所示。

图9-1 灾备中心运维管理9.4 灾难恢复国家和行业标准规范我国政府十分重视标准在信息系统灾难恢复建设中的规范性和指导性作用。

国务院信息化工作办公室于2005年4月份下发了《重要信息系统灾难恢复指南》(国信办〔2005〕8号),明确了灾难恢复工作的流程、灾难恢复能力的等级划分及灾难恢复预案的制订。

2007年6月14日,《重要信息系统灾难恢复指南》经修订完善后正式成为国家标准《信息安全技术信息系统灾难恢复规范》(GB/T 20988—2007)。

相关文档
最新文档