NEC容错服务器及存储系统实现远程容灾方案

合集下载

emc存储容灾技术解决方案设计

EMC VNX5400存储容灾技术解决方案2017年8月文案大全易安信电脑系统（中国）一、需求分析随着各行业数字化进程的推进，数据逐渐成为企事业单位的运营核心，用户对承载数据的存储系统的稳定性要求也越来越高。

虽然不少存储厂商能够向用户提供稳定性极高的存储设备，但还是无法防止各种自然灾难对生产系统造成不可恢复的毁坏。

为了保证数据存取的持续性、可恢复性和高可用性，远程容灾解决方案应运而生，而远程复制技术则是远程容灾方案中的关键技术之一。

远程复制技术是指通过建立远程容灾中心，将生产中心数据实时或分批次地复制到容灾中心。

正常情况下，系统的各种应用运行在生产中心的计算机系统上，数据同时存放在生产中心和容灾中心的存储系统中。

当生产中心由于断电、火灾甚至地震等灾难无法工作时，则立即采取一系列相关措施，将网络、数据线路切换至容灾中心，并且利用容灾中心已经搭建的计算机系统重新启动应用系统。

容灾系统最重要的目标就是保证容灾切换时间满足业务连续性要求，同时尽可能保持生产中心和容灾中心数据的连续性和完整性，而如何解决生产中心到容灾中心的数据复制和恢复则是容灾备份方案的核心容。

本方案采用EMC MirrorView 复制软件基于磁盘阵列（VNX5300-VNX5400）的数据复制技术。

它是由磁盘阵列自身实现数据文案大全的远程复制和同步，即磁盘阵列将对本系统中的存储器写I/O操作复制到远端的存储系统中并执行，保证生产数据和备份数据的一致性。

由于这种方式下数据复制软件运行在磁盘阵列，因此较容易实现生产中心和容灾容灾中心的生产数据和应用数据或目录的实时拷贝维护能力，且一般很少影响生产中心主机系统的性能。

如果在容灾中心具备了实时生产数据、备用主机和网络环境，那么就可以当灾难发生后及时开始业务系统的恢复。

文案大全二、设计拓扑图文案大全设计说明：1、2台存储和业务服务器同时接入到SAN网络中，互相能访问；2、两台存储之间通过光鲜链路分别连接2个控制器，实现存储冗余。

服务器容灾方案

服务器容灾方案在计算机网络和信息技术领域，服务器容灾方案是指一组策略和方法，旨在确保服务器在面临各种故障和灾难时能够保持高可用性和可靠性。

服务器在现代的商业环境中扮演着至关重要的角色，承担着存储和处理大量数据的重要任务。

因此，保障服务器的稳定性和可用性对于确保业务连续运行至关重要。

本文将介绍一些常见的服务器容灾方案，以帮助组织和企业建立强大的服务器容错和恢复计划。

一、备份和恢复策略备份和恢复策略是任何服务器容灾方案的基础。

在建立备份策略时，需要考虑以下几个因素：1. 备份频率：根据业务需求和数据变更频率，确定备份的频率。

关键数据可以每天备份，而对于不太重要的数据，可以每周或每月备份一次。

2. 备份介质：选择适合的备份介质。

常用的备份介质包括磁带、硬盘和云存储。

需要根据数据量和可用性的要求选择合适的备份介质。

3. 备份存储位置：将备份数据存储在不同的地理位置，以防止物理灾害对主服务器的影响。

可以选择不同的数据中心或云服务提供商作为备份存储位置。

4. 恢复测试：定期测试备份数据的可用性和完整性，并确保可以在发生故障时快速恢复。

二、冗余和负载均衡冗余是服务器容灾的关键组成部分之一。

通过增加服务器的冗余性，可以确保在一个服务器发生故障时，其他服务器可以接管其工作。

以下是几种常见的冗余和负载均衡策略：1. RAID（冗余阵列磁盘）：通过将多个硬盘组合在一起，创建一个冗余存储空间。

RAID可以提供数据冗余和容错能力，以防止硬盘故障导致数据丢失。

2. 心跳检测和故障转移：使用心跳检测机制可以监测服务器的可用性。

当主服务器发生故障时，备用服务器可以立即接管主服务器的工作，并确保业务连续运行。

3. 负载均衡：通过在多台服务器之间分配工作负载，实现负载均衡。

负载均衡可以提高服务器的性能和可用性，确保在发生故障时仍然能够提供稳定的服务。

三、灾难恢复计划由于不可预测的自然灾害、人为错误或技术故障，服务器可能会遭受灾难性的破坏。

容灾方案介绍

容灾方案介绍什么是容灾容灾，全称为“容错和灾备”，是指在系统发生故障时，能够通过一些手段减少故障对系统的影响或者能够快速地恢复系统的能力。

在企业级应用系统中，容灾是一项十分重要的工作，因为系统的故障往往会带来巨大的损失，不仅会影响到企业的业务运作，还会影响到公司的品牌形象和客户的信任度。

容灾方案分类容灾方案按照实现方式可以分为两大类：被动式容灾方案和主动式容灾方案。

被动式容灾方案被动式容灾方案是指只有在系统故障发生时，才会启动容灾机制。

被动式容灾方案一般采用备份和恢复技术，将系统及其数据备份到另一个位置或者另一个机房，并尽快恢复系统和数据。

被动式容灾方案适用于不需要24小时连续运行的系统，例如一些企业的内部应用系统、管理系统等。

主动式容灾方案主动式容灾方案是指在系统运行时，就能够根据事先设定的规则和策略，自动地进行容灾，保证系统的高可靠性和高可用性。

主动式容灾方案通常包括了整个容灾过程，从容灾策略的设计到系统恢复的全过程。

主动式容灾方案适用于24小时运行的应用系统、互联网应用系统、电子商务系统、金融系统等。

容灾技术分类容灾方案按照实现的技术可以分为以下几类：数据备份与恢复数据备份与恢复是最常见的容灾技术之一，也是最基础的容灾技术之一。

数据备份与恢复可以保证在系统故障时，能够及时恢复数据并尽快恢复系统。

数据备份与恢复适用于一些小型应用系统和企业内部应用系统等。

冷备份冷备份是指备份整个系统并将其存储在一个离线媒介中，如磁带、光盘等，在需要恢复失败的系统时，将备份的媒介安装在一个新的服务器中，并将新服务器配置成与故障的服务器一样的系统。

冷备份通常适用于大型企业的核心应用系统。

冷备份的优点是备份成本较低，缺点是恢复时间较长，不适合需要24小时连续运行的系统。

热备份热备份是指备份一个正在运行的系统，并在另一台服务器上运行已备份的系统。

热备份可以快速地恢复系统，并且很少有数据丢失的问题。

热备份适用于需要24小时连续运行的企业级应用系统和互联网应用系统。

系统容灾方案介绍

CL3-A
2
5
…
ca-bus bus01_01
CL3-B
0
0
…
ca-col col01_01
CL1-A
5
7
…
ca-fee fee01_01
CL1-A
0
0
…
ca-mq
mq01_01
CL3-A
47 147 41 20 3 39 26 11 共计 334
容量(GB) 649 2029 566 276 41 538 359 152 4609
16
现有SAN环境
17
项目实施后的SAN环境
18
XP10000划分
• 硬件配置
Cache : 16GB
CHIP端口： 16个
ACP：
1对
磁盘组： 146GB x 4 x 26 （裸容量14TB左右）
CL1-B
0
2
…
ca-dsbill dsbill01_01
CL1-E1
0
0
…
ca-dsbus dsbus01_01
CL1-F1
0
0
…
ca-dsfee dsfee01_01
CL1-E1
3
2
…
HORCM_INST ca-bill ca-fee ca-bus ca-col ca-mq ca-dsbill ca-dsfee ca-dsbus
端口
CL1 A
CL3 A
CL5 A
CL7 A
用途计费系统，采集系统帐务系统，MQ (预留) (预留)
CL1B CA-20917-CL1H,CA-20434-CL1H
端口用途 CL2A 计费系统，采集系统 CL4A 帐务系统，MQ CL6A (预留) CL8A (预留) CL2B CA-20917-CL2D，CA-20434-CL2D

系统容灾解决方案

系统容灾解决方案容灾基本概念容灾是一个范畴比较广泛的概念，广义上，我们可以把所有与业务连续性相关的内容都纳入容灾。

容灾是一个系统工程，它包括支持用户业务的方方面面。

而容灾对于IT而言，就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。

容灾还表现为一种未雨绸缪的主动性，而不是在灾难发生后的“亡羊补牢”。

从狭义的角度，我们平常所谈论的容灾是指：除了生产站点以外，用户另外建立的冗余站点，当灾难发生，生产站点受到破坏时，冗余站点可以接管用户正常的业务，达到业务不间断的目的。

为了达到更高的可用性，许多用户甚至建立多个冗余站点。

容灾系统是指在相隔较远的异地，建立两套或多套功能相同的IT系统，互相之间可以进行健康状态监视和功能切换，当一处系统因意外(如火灾、地震等)停止工作时，整个应用系统可以切换到另一处，使得该系统功能可以继续正常工作。

容灾技术是系统的高可用性技术的一个组成部分，容灾系统更加强调处理外界环境对系统的影响，特别是灾难性事件对整个IT节点的影响，提供节点级别的系统恢复功能。

要实现容灾，首先要了解哪些事件可以定义为灾难？典型的灾难事件是自然灾难，如火灾、洪水、地震、飓风、龙卷风、台风等；还有其它如原提供给业务运营所需的服务中断，出现设备故障、软件错误、网络中断和电力故障等等；此外，人为的因素往往也会酿成大祸，如操作员错误、破坏、植入有害代码和病毒袭击等。

现阶段，由于信息技术正处在高速发展的阶段，很多生产流程和制度仍不完善，加之缺乏经验，这方面的损失屡见不鲜。

容灾的七个层次等级1：被定义为没有信息存储的需求，没有建立备援硬件平台的需求，也没有发展应急计划的需求，数据仅在本地进行备份恢复，没有数据送往异地。

这种方式是成本最低的灾难恢复解决方案，但事实上这种恢复并没有真正达到灾难恢复的能力。

一种典型等级1方式就是采用本地磁带库自动备份方案，通过制定相关的备份策略，可以实现系统等级1备份。

服务器及存储实施方案

服务器及存储实施方案
在当今数字化时代，服务器和存储系统是企业信息技术基础设施中不可或缺的一部分。

为了实现高效的数据存储和处理，提高业务运行效率，企业需要设计和实施合适的服务器和存储方案。

首先，服务器方案需要根据企业实际需求进行定制化设计。

需要考虑到业务规模、性能要求、安全性、可扩展性等因素。

例如，对于规模较小的企业，可以选择一台独立服务器来满足需求；而对于规模较大的企业，可能需要采取分布式服务器的方案，通过服务器集群来实现负载均衡和故障容错。

同时，服务器方案还应该考虑到企业的预算和运维成本，选择合适的硬件设备和软件解决方案。

其次，存储方案需要根据企业的数据存储需求来设计。

存储系统可以根据存储介质的不同分为硬盘存储和闪存存储。

对于存储容量较大的应用，可以选择硬盘存储，而对于需要高速访问的应用，则可以选择采用闪存存储。

此外，存储方案还需要考虑到数据的备份和恢复问题，避免数据丢失或损坏。

可以通过设置RAID技术提高数据的可靠性和可用性。

同时，还需要考虑到存储系统的扩展性和容灾能力，以满足企业未来的发展需求。

另外，为了提高服务器和存储系统的效率和可靠性，还可以采取一些优化和安全措施。

例如，可以使用虚拟化技术来提高服务器的利用率，减少硬件成本和能耗；可以使用性能调优技术来提高服务器和存储系统的性能；可以使用防火墙和加密技术
来增强系统的安全性。

综上所述，企业在设计和实施服务器和存储实施方案时，需要考虑到业务需求、预算限制、性能要求、安全性等多方面因素。

通过合理的定制化设计和优化措施，可以提高企业的数据存储和处理效率，提升业务运行效率，增强信息安全保障。

SRDF容灾解决方案概述

SRDF容灾解决方案概述SRDF（Symmetrix Remote Data Facility）是一种高级数据复制技术，由戴尔EMC公司开发，用于实现数据的容灾和灾难恢复。

该技术通过在主机和存储系统之间建立远程数据镜像，可以将数据实时复制到远程位置，并能在发生灾难时快速恢复数据，确保业务的持续性和数据的安全性。

下面将详细介绍SRDF容灾解决方案的概述。

SRDF容灾解决方案基本架构如下图所示：[图]在SRDF容灾解决方案中，主要包含以下几个核心组件：1. 主机系统（Host System）：主机系统是运行应用程序的服务器，可以是物理服务器或虚拟机。

主机通过光纤通道（Fibre Channel）或以太网（Ethernet）连接到存储系统。

2. 存储系统（Storage System）：存储系统通常是戴尔EMC的Symmetrix系列产品，包括VMAX、PowerMax等。

存储系统负责存储和管理数据，并提供高级数据保护和复制服务。

3. 远程存储系统（Remote Storage System）：远程存储系统是主存储系统的镜像，位于远程位置。

远程存储系统通过光纤通道或以太网与主存储系统进行数据复制和同步。

4. 光纤通道（Fibre Channel）：光纤通道是连接主机和存储系统的高速传输介质，用于传输数据和控制信息。

光纤通道具有较低的延迟和高带宽，并能支持远距离的数据传输。

SRDF容灾解决方案的工作流程如下：1. 初始化：在开始容灾之前，需要对主存储系统和远程存储系统进行初始化配置。

主存储系统将指定一部分容量作为远程存储系统的镜像，并建立数据保护策略。

2. 复制数据：一旦完成初始化配置，主存储系统会实时将数据复制到远程存储系统。

数据复制可以通过同步或异步模式进行，同步模式要求主存储系统和远程存储系统的数据保持一致，而异步模式则允许一定程度的延迟。

3. 失效转移：当主存储系统发生故障或不可用时，自动切换到远程存储系统。

服务器容灾方案

服务器容灾方案服务器容灾方案简介在现代信息化时代，服务器作为承载各类业务的核心设备，其稳定性和可用性对于企业的正常运营至关重要。

然而，由于各种原因，例如硬件故障、网络问题、自然灾害等，服务器和网络设备可能会发生故障，导致业务中断和数据丢失。

因此，建立一套完善的服务器容灾方案对于提升系统的可用性和保证业务的连续性非常重要。

服务器容灾方案的重要性服务器容灾方案是为了实现服务器的高可靠性和高可用性，保证在服务器故障或异常情况下，能够尽快地恢复服务并保证数据不丢失。

以下是几个服务器容灾方案的重要性：1. **保证业务连续性**：服务器容灾方案可以确保在服务器发生故障或异常情况下，能够及时地切换到备用服务器，从而保证业务的连续性和稳定性。

2. **减少数据丢失**：通过备份和数据同步的手段，服务器容灾方案可以降低数据丢失的风险，并在故障恢复后恢复数据完整性。

3. **提高系统可用性**：通过服务器容灾方案，可以提高系统的可用性和响应速度，减少服务器故障对业务的影响，提升用户体验。

主要的服务器容灾方案1. 备份与恢复备份是服务器容灾方案中最基本的手段之一。

通过定期对服务器上的数据进行备份，可以在服务器故障或数据丢失的情况下，快速恢复服务和数据。

备份可以包括系统设置、应用程序和数据库等。

备份的方法可以分为物理备份和逻辑备份两种方式。

常见的备份方案有：- **完全备份**：完全备份是将服务器的所有数据和配置信息进行一次性备份，可以快速恢复服务器。

- **增量备份**：增量备份是只备份服务器上自上次完全备份之后新增或修改的数据，可以减少备份时间和存储空间。

- **差异备份**：差异备份是只备份服务器上自上次完全备份之后的变化数据，可以更加高效地恢复数据。

数据恢复可通过将备份数据还原到备用服务器上来实现。

备份与恢复方案可以手动操作，也可以借助自动化工具来实现定期备份和自动恢复。

2. 冗余备份冗余备份将服务器的关键组件和数据冗余部署在多个地点或多台服务器上，以提供故障转移和容错能力。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

NEC容错服务器及存储系统实现远程容灾方案---- NEC远程容灾方案1、远程异地容灾备份技术远程异地容灾功能是指当用户的主要业务应用系统所在环境由于遇到火灾，地震以及人为因素等意外情况而导致整个系统网络瘫痪时，通过异地的灾难备份中心的备份系统和网络，恢复关键性业务运行，确保数据的一致性和可靠性。

而实现完整灾难恢复功能的关键就是如何保证主应用系统中心和备份中心存储数据的实时一致性。

容灾主要是预防场地问题带来的数据不可用性，这些场地问题包括：电力中断：供电部门因各种原因长时间的中断；电信中断：各种原因造成的通信线路破坏。

自然灾难：地震，火灾，水灾等。

场地迁移：IP部门决定将数据中心迁移到其它地方等。

作为企业的关键业务，任何原因造成的业务中断都将影响其经济收入，降低市场分额，丢失客户，甚至造成企业破产。

容灾系统将这种“场地”故障造成的数据不可用性减到最小。

即当灾难发生时，容灾系统保证（1）数据在远程场地存有一致、可用的拷贝；（2）应用立即在远程现场运行。

1.1 异地容灾异地容灾系统的核心就在于在不同的地方将灾难化解，在实践中主要表现为两个方面：一是保证企业数据的安全；二是保证业务的连续性。

由于工作站点和灾难恢复站点运行同样的系统，包括操作系统、基础数据库和应用软件，并通过数据复制管理器完成在线和实时的本地复制，或者通过光纤通道的远程数据复制。

假如工作站点发生灾难，不能再继续工作，这时容灾中心会将业务数据及时恢复到备用服务器上，并自动将业务切换到备用服务器，然后实现业务的远程切换，恢复系统不间断的运行，在容灾中心实现应用的异地容灾，这个过程只需要几秒或者几分钟的时间。

与在单个数据中心的高可用性相比，异地容灾对系统提出了更高的要求。

异地容灾系统比集群系统能提供更高的高可用性和更快速的群集信息处理能力。

集群系统被放置在同一个地理位置或一个机房里面；而容灾系统至少需要两个机房，或分别放置在不同地理位置上。

集群系统中的每个成员之间的距离通常在三公尺之内；但容灾群集系统的两个机房之间的距离可以达到几百或者上千公里。

一旦灾难出现，如洪水、火灾、地震或恐怖分子的骚扰，只有不同地理位置的群集系统之间的相互“接管“才可以保证整个网络系统的正常运行。

集群系统的投资比较适中，较容易被用户接受；而容灾系统的投入非常大，需要立足长远的投资眼光，目前，国内各个行业都比较重视对容灾系统的投入。

异地容灾的核心就是在工作站点以外的地方将灾难化解，所以异地容灾解决方案的基本原理就是在工作站点一定距离之外设立灾难恢复站点，然后通过网络设备将生产站点和灾难恢复站点连接起来，以实现实时的数据同步。

异地容灾解决方案以存储区域网络为基础，在存储区域网络与网络之间采用光纤通道交换机来实现连接。

异地容灾系统的关键技术包括网络技术、存储技术与解决方案。

从网络层面而言，无论是ATM网络还是光纤网络，都已经在世界各地得到了广泛的应用；在存储技术方面，RAID、磁盘等基础技术已经成熟，磁盘阵列的应用已经遍布全球每一个角落；存储区域网络（SAN）在世界各地也得到了全面的认同。

因此，容灾方案的核心是两个关键技术：数据复制和应用的远程切换。

1.1.1 数据复制的分类存储复制也有两种方式可以实现：在存储阵列级或主机级。

基于阵列（或叫硬件）的存储复制通常价格昂贵，需要许多专用硬件，但往往最昂贵的费用是在远程连接的线路费用上，而且这种复制一般只能在同种阵列间进行。

主机级的数据备份是采用软件的方式，在CPU级完成的，独立于所使用的阵列。

数据复制采用TCP/IP标准协议完成。

1.1.2 基于存储系统的远程数据复制这种方法是基于磁盘阵列控制器的远程数据复制，它有在主副存储子系统之间同步/异步数据镜像的能力。

对主机的资源占用很小，能保证业务正常运行下的I/O响应。

缺点是占用大量的磁盘阵列资源，降低存储设备的性能；仅能实现数据的远程复制，对于应用的切换还需要软件来实现。

目前能够提供此类解决方案的厂商有NEC、IBM、HP、EMC等，上述厂商的方案有以下特点：硬件厂商只支持自己的硬件存储设备传输距离限制存储设备造价昂贵，扩展费用高须配置特殊硬件软件设备占用主机资源小占用存储设备（磁盘阵列）的大量资源，影响其性能1.1.3 基于主机系统的数据复制这是通过软件形式实现的数据容灾方法。

数据安全性方面的公司，NEC推出了一系列的跨平台存储管理软件的解决方案。

此种解决方案有如下特点：不依赖于存储硬件，用户可以灵活地选择任何厂家的磁盘阵列价格相对于硬件实现，便宜很多。

两个现场间的距离不限主机资源占用（约5%）在网络带宽不满足的条件下，软件方式取代硬件实现方法，应用相对光分。

1.2 数据复制技术数据复制是指将关键信息（数据和环境）安全、一致、实时的存放到容灾现场。

实际上，从一个服务器到另一个服务器的数据复制有很多方式可以完成。

传统地，一般采用磁带传送的技术分发数据。

但是，今天企业的运作完全建立在电子商务的基础上，对数据立即存取的要求越来越高，计费系统更是这样。

基于磁带的容灾系统虽然简单，但是它不支持这种数据立即存取的运行模式。

取而代之的是在线数据复制技术。

数据复制一般有两种基本的策略来取得：存储复制：批量地将文件或数据块从一台服务器传送到另一台或多台服务器。

存储复制独立于应用，这意味着运行在单台服务器上的多个应用，其数据可以同时复制到备用服务器上。

应用级复制：是应用相关的，例如数据库或Web 分别采用不同的复制方法。

一般这种复制在交易级（表或行）完成。

如果有多个应用在同一个服务器上，各自采用自己的复制技术。

相比之下，应用级复制管理复杂，常常只复制数据，而不能复制应用和系统的实时运行环境，影响应用在备份服务器上启动的时间。

存储复制在卷一级进行，对应用透明，具有极强的通用性，最重要的是复制整个应用环境，能够立即在备用服务器上运行应用，保证系统的高可用性。

1.3 数据复制实现方式软件数据复制方式具有配置灵活、价格低、高性能等特征。

NEC ExpressCluster镜像数据复制软件提供两种复制类型：同步复制和异步复制。

应用系统采用哪种复制模式，将决定于很多因素。

同步复制：在同步复制环境中，系统上的应用写操作完成之前，数据必须写到复制系统中。

这保证了任何时间任何情况下目标系统上的数据尽可能的新，即远程现场的数据和本地现场的数据有完全一样的影像。

但是如果数据复制的网络带宽不够，同步复制可能会带来本地系统性能下降。

异步复制：异步复制时，本地系统不等待对远程系统写的确认，复制软件将数据排队，在网络科研用的情况下批量的发送。

NEC ExpressCluster采用Log技术支持异步复制，以保证远程系统上的写操作与本地的写有同样的顺序，从而维护远程数据的完整性。

很多情况下，同步复制和异步复制模式结合使用。

例如当网络问题发生时，同步转换成异步，问题解决后，再转回同步。

从而保证容灾系统的可靠性。

2、两种容灾备份方式的分析由于异步远程更新的执行，应用程序不必等待远程更新的完成，因此远程数据备份的性能的影响通常较小，并且备份磁盘的距离和生产磁盘间的距离理论上没有限制。

然而，当传送中的数据在生产磁盘控制器中还没有形成数据一致组时生产中心发生灾难，这些数据就会丢失。

因此在系统和应用程序重新启动之前，需要额外的数据恢复。

所花费的时间和造成的影响取决于客户的环境，例如应用程序和设备配置的复杂性，更新的完整性等等。

对于异步复制，提交的记录被存储在主存储器的日志中，以最大程度确保主机应用程序性能。

这种模式也能帮助清除在其它复制方案中会遇到的严格的距离限制。

异步复制也可以在同步复制的广域网故障时作为一个备用模式。

2.1 基于主机端软件的异步容灾解决方案本地的高可用系统虽然能够做到IDC数据中心和应用中心本地系统的高可用，但有一个问题，如果一些不可抗拒的因素如地震、雷击等把整个中心的一些关键系统破坏了，还是会导致应用系统的长时间中断。

而对于IDC的24X7的关键业务，任何原因的短时间停顿都是不允许的，因此，有必要建设一个具有容灾功能的备份中心，当数据中心发生故障时，可由备份中心接管部分或所有的业务处理。

特别是当前一些IDC已经在几个城市建立了自己的数据中心,完全可以利用现有的这几个数据中心实现数据异地复制和容灾的功能，平时数据复制对客户可以达到Load-balancing的效果，当灾难发生时则起到备灾的功能。

容灾系统的数据中心建设，大致可分三个部分进行：1．备份中心主机网络存储系统的构建，以及应用系统的安装，这些可基本上与数据中心的环境一致2．建立数据中心与备份中心的数据同步传输系统3．建立基于广域网的集群系统，使得应用系统可以在广域网上进行切换对于网络连接，如果距离不超过40公里，建议采用光纤连接，同步方式是首选，但如果没有光纤资源，例如是在两个异地的城市之间，建议采用E1/T1的专线连接，当然，如果数据量很小，也可采用低速的专线连接，这里我们提出比较通用的第三方的开放系统的解决方案，以NEC公司的ExpressCluster做为方案进行说明。

NEC的ExpressCluster镜像可以支持数据远程复制。

通过广域网远程连接，ExpressCluster镜像可向远程备份系统同步进行逻辑卷复制，确保系统数据的高度可用。

ExpressCluster镜像采用可靠的连接和监听协议，保证远程备份站点与本地逻辑卷数据的一致性，为用户关键应用的灾难备份和恢复提供了有效的手段。

为了能够监测数据中心应用系统的运行情况，并能够在灾难发生时实现应用系统从数据中心到备份中心的切换，必须选用专门的广域网集群管理软件来实现。

NEC 的ExpressCluster软件可实现多集群的管理和应用系统的容灾。

整个容灾系统结构大致如下图所示：系统的运作过程如下：1．正常情况下，数据中心和备份中心的系统均处于运行状态，但业务处理系统只在数据中心运行；同时，业务系统对数据的任何修改，会定期地复制到备份中心2．当数据中心的NEC FT服务器某些部件发生故障，如进程出错、内存损坏等情况发生时，由于各部件都是冗余的，从而可以保证整个系统正常运行，也无需进行切换就可以继续运行当前的任务，比双机做CLUSTER更便于管理、更安全。

3．当灾难发生，导致数据中心整个系统瘫痪时，NEC ExpressCluster会马上监测到这种异常情况，及时向管理员发送各种警报，并按照预定的规则在备份中心启动整个业务应用系统4．数据中心的计算机网络系统修复后，NEC ExpressCluster可将备份中心的当前数据复制回数据中心，然后将应用系统从备份中心切换回数据中心，备份中心的系统重新回到备份状态。

由上可见，方案中所推荐的系统结构，能很好应付各种软硬件故障、人为或自然灾害对计算机处理系统的影响，保护业务系统的不简断运行，是一个真正具有容灾功能的高可用系统，能够保证IDC的业务在任何情况下都能高效稳定地运行。