双活数据中心与灾备解决方案

合集下载

双活数据中心与灾备解决方案

二级应用
三级应用
数据可用性成本
系统可用性成本
一级应用
恢复业务所需时间
RTO
0
时间轴
成本轴
25
类别
关键应用，核心应用
二三级应用
非生产应用
解决方案
双活数据中心
虚拟机复制
灾备切换调度
虚拟机复制
数据保护
SLA
RPO=0
RTO<15分钟
RPO<15分钟
RTO<4小时
RPO<1小时
RTO<24小时
应用场景
BC,DA,DR
二三级应用
开发/测试
数据库
教学/科研
同城双活
异地灾备
两地三中心
数据中心迁移
异地灾备
15
需求条件通过二层或三层IP网络连接两个数据中心采用基于vSphere或阵列的复制技术vSphere内置复制功能免费，RPO=15分钟-24小时，文件级一致性，虚拟机级别颗粒度支持异构存储，vCenter直接管理阵列复制功能由合作伙伴提供，需额外购买支持同步或异步复制，应用级一致性，LUN级别颗粒度应用一致性：Oracle DataGuard, SQL Always On, Exchange DAGVMware相关产品与服务vSphere Ent+VSANvCenter Site Recovery Manager
vSphere
生产站点
服务器
阵列
复制
vSphere复制
vSphere
灾备站点
服务器
主备式切换
双活切换
双向切换
双活数据中心
Recovery
Recovery
Production

双活数据中心解决方案

系统重启等
应急演练：定期进行应急演练，提高应急处理能力和团
队协作能力
持续优化：根据实际运行情况，不断优化应急恢复方案，提高数据中心的可靠性和稳
定性。
6
成功案例分析
某银行采用双活数据中心解决方案，实现业务连续性
某电商采用双活数据中心解决方案，应对双十一等大流量场景
某政府机构采用双活数据中心解决方案，保障政务系统稳定运行
故障排除：根据故障原因，采取相应措施进行故障排除
06
总结分析：对故障原因进行总结分析，提出改进措施，防止类似故障再次发生
故障处理流程
01
故障检测：实时监控系统，及时发现故障
03
故障修复：采取相应措施，修复故障
05
故障总结：分析故障原因，总结经验教训，提高系统可靠性
02
故障定位：分析故障原因，确定故障位置
1 确保两个数据中心的数据实时保持一致
数据压缩技
2 术：减少数据传输的带宽占用
数据加密技
3 术：保障数据传输的安全性
数据校验技
4 术：确保数据的完整性和准确性
负载均衡技术
概念：将网络流量均匀地分配到多个
服务器，提高系统 1
的性能和可用性
应用场景：双活数 4
据中心、云计算、负载均衡器等
3
数据中心容灾备份
01
应用场景：数据中心故障、自然灾害、网络攻击等
02
功能：实时数据备份、数据恢复、业务连续性保障
03
技术实现：存储虚拟化、数据复制、数据压缩等
04
优势：降低数据丢失风险、提高业务连续性、降低运营成本
业务连续性保障
01 双活数据中心解决方案可

医院双活数据中心灾备系统的探讨和实践

114Internet Security互联网+安全一、引言如今医院信息化建设不断发展，业务也在不断扩大，信息也成为医院的生产资源，业务流、资金流、信息流相互作用，贯穿医院运营管理的全过程。

各种业务系统产生的核心数据逐渐增多，业务系统容灾和数据备份保护显得尤其重要。

数据安全、业务连续和用户隐私保护，是信息化环境下各类用户最重要的安全原则。

如何通过灾备保证系统安全及业务连续性，成为医院信息科室关注的问题，经济性也是重要考量因素。

灾备系统规划建设中，将新旧设备分别建设于生产和容灾是合理化利用物理设备的有效解决方案。

二、医院现状我院现有HIS、LIS、EMR、PACS 等核心系统来承担医院的日常业务运行，HIS、LIS、PACS、EMR、体检、银医通、物资设备等业务系统都建有相应的备份功能，为了实现对系统和数据的多重保护，确保重要数据万无一失，同时提高系统和数据应急恢复能力，我们采用备份一体机AnyBackup 5.0对现有业务系统的生产数据、服务器操作系统、虚拟化平台的虚拟机系统和数据等重要数据采取统一的、集中的备份，同时采用增量备份和完全备份相结合的模式，提高防灾、容灾的能力。

备份一体机恢复数据需要专业的环境，恢复时间受环境搭建、硬件设备等影响。

原备份一体机基于应用层备份，无存储层备份。

医院原搭建的oracle RAC 群集的物理设备已经使用超过5年，我院已于今年进行更换。

但是闲置下来的RAC 群集物理设备变得相对鸡肋，使用在低端业务应用有些奢侈，使用在高端业务安全性能不够，原设计方案建设的软件无法与新搭建的软件并行。

三、需求分析为了保护我院信息化平台的数据信息，必须对其信息系统平台上的数据进行有效的备份。

通过配置相应的数据备份软件、磁带库等软、硬件系统，以防止因为硬件损坏、逻辑错误、人为误操作等故障而引起医院双活数据中心灾备系统的探讨和实践摘要：目的:在原有的业务双活主机架构基础上升级容灾备份系统，探索符合我院现状的容灾方案，进一步保障业务系统平稳运行，生产数据安全可用。

业务系统双活灾备服务方案

业务系统双活灾备服务方案一、为啥要有双活灾备。

咱先唠唠为啥业务系统得整这个双活灾备呢？你想啊，现在的业务就像一个超级精密的大机器，每一个小零件（数据和服务）都至关重要。

万一突然来个天灾人祸，像地震把机房震坏了，或者网络被黑客攻击得乱七八糟，要是没有个备份方案，那业务可就直接歇菜了。

这就好比你出门只带了一把钥匙，结果钥匙丢了，家都回不去。

所以啊，双活灾备就是给业务系统多准备几把“钥匙”，确保啥时候都能正常运转。

二、双活灾备是啥概念。

简单说呢，双活就是让两个数据中心或者多个站点都处于“活着”的状态，也就是同时都能对外提供服务。

这可不是一个主一个副的那种备胎关系，而是真正的平等关系。

用户不管访问哪个数据中心，都能得到一样的服务。

就像你有两个手机，两个手机都能打电话、发短信、上网，没有哪个是专门用来当备用的。

灾备呢，就是在灾难发生的时候，能够快速地把业务切换到备份的地方，保证服务不间断。

这就像是你在不同的地方都有房子住，这个房子出问题了，立马就搬到另一个房子去，还不耽误生活。

三、我们的双活灾备方案咋实现。

# （一）网络架构。

1. 高速链路连接。

咱得用高速网络链路把两个数据中心连起来，就像给它们之间修了一条超级高速公路。

这样数据在两个中心之间传输就特别快，用户访问起来也不会感觉到卡顿。

这条链路得是高带宽、低延迟的，就像那种超级跑车走的路，又宽又顺溜。

2. 智能路由策略。

还得有个聪明的路由系统。

这个路由就像一个交通指挥员，能根据网络的情况，自动把用户的请求分配到最合适的数据中心。

比如说，如果一个数据中心的访问量突然变大了，有点拥堵，那路由就会把一部分用户的请求引导到另一个比较空闲的数据中心去，让大家都能快速得到服务。

# （二）数据同步。

1. 实时数据复制。

数据是业务的核心啊，所以数据的同步特别重要。

我们采用实时数据复制技术，就像有个超级复印机，一个数据中心的数据一有变化，立马就复制到另一个数据中心去。

这样两个数据中心的数据就时刻保持一致，不管用户访问哪个中心，看到的都是最新的数据。

双活数据中心及灾备解决方案技术部分

requirements and their environment
NSX利用层叠网络实现双活数据中心
站点A
三层网络
站点A 边界网关
上联网络A
VM1
VM 2
vCenter Server
分布式逻辑路由器
逻辑交换机A 172.16.10.0/24
VM
4
逻辑交换机B
172.16.20.0/24
数据存储1
which also aligns with vMotion using Enterprise Plus
• vMSC enables disaster avoidance and basic Disaster Recovery (without the orchestration or testing
• VMotion an数d S据to保ra护ge VMotion
• 高效的数据备份与恢复 • 可通过运行计划与脚本实现自动化操作
灾难恢复
• 基于虚拟化层的异步复制 • 基于硬件设备的同异步复制 • 自动化应用切换管理 • 城域集群
方案特点
• 与应用程序和操作系统无关 • 与硬件设备无关 • 完善的保护 • 简单，经济
9
Fault Tolerance vs. High Availability
• Fault tolerance
– Ability to recover from component loss – Example: Hard drive failure
• High avail percentage in one year 99 99.9 99.99 99.999 “five nines”
Downtime in one year 3.65 days 8.76 hours 52 minutes 5 minutes

F5双活数据中心解决方案

F5双活数据中心解决方案[正文]1. 引言双活数据中心解决方案是为了提高系统的高可用性和灾备能力而设计的。

本文档将详细介绍F5双活数据中心解决方案的架构、功能和部署步骤。

2. 架构概述2.1 总体架构双活数据中心解决方案由两个数据中心组成，分别为Primary 数据中心和Secondary数据中心。

Primary数据中心负责处理主要业务流量，Secondary数据中心作为备份，用于容灾和故障转移。

2.2 组件介绍2.2.1 F5 BIG-IP Load BalancerF5 BIG-IP Load Balancer是整个解决方案的核心组件，用于负载均衡和流量管理。

它能够将流量分发到不同的服务器上，提高系统的性能和可靠性。

2.2.2 数据同步组件数据同步组件用于保持两个数据中心之间的数据一致性。

常用的数据同步方案包括同步存储和数据库复制等。

2.2.3 故障检测和故障切换组件故障检测和故障切换组件用于监测Primary数据中心的故障，并在发生故障时将流量切换到Secondary数据中心，实现无损切换。

3. 功能介绍3.1 高可用性双活数据中心解决方案通过将流量分发到两个数据中心，实现故障容错和高可用性。

即使一个数据中心发生故障，系统依然能够正常运行。

3.2 灾备能力双活数据中心解决方案还提供了灾备能力，即在发生灾难性事件时，可以快速将业务流量切换到备份数据中心，保证业务的持续性和可靠性。

3.3 流量管理F5 BIG-IP Load Balancer能够根据不同的算法和策略，将流量分发到不同的服务器上，提高负载均衡和系统性能。

4. 部署步骤4.1 网络规划在部署双活数据中心解决方案之前，需要进行网络规划，包括IP地址分配、子网划分、路由设置等。

4.2 组件部署按照架构概述中的组件介绍，逐步部署和配置F5 BIG-IP Load Balancer、数据同步组件和故障检测和故障切换组件。

4.3 测试与验证完成部署后，需要进行测试与验证，包括负载均衡、故障切换和数据同步等方面的测试，确保解决方案的稳定性和可用性。

双活数据中心项目解决方案

实时同步主备数据中心的数据，确保数据一致性。
灾难恢复计划
制定应对灾难事件的策略和流程，确保业务连续性。
数据同步机制
数据实时同步
通过数据同步引擎，实现主备数据中心数据实时同步。
数据校验
定期对数据进行校验，确保数据一致性和完整性。
数据备份
定期备份数据，以应对意外数据丢失或损坏的情况。
03
实施步骤与计划
双活数据中心项目解决方案
汇报人： 202X-01-08
目录
• 项目背景介绍 • 双活数据中心架构设计 • 实施步骤与计划 • 效益分析 • 技术风险与应对措施 • 项目成功要素与建议
01
项目背景介绍
业务需求
实现跨地域的数据同步和备份
01
双活数据中心能够满足业务在多个地域的需求，保证数据实时
同步，避免单点故障。
1 2 3
数据同步延迟
双活数据中心要求数据实时同步，但网络延迟、系统负载等因素可能导致数据同步出现延迟，影响业务连续性。
数据冲突
在双活数据中心中，由于数据实时同步，可能导致数据冲突，如两个数据中心同时更新同一数据项。
数据完整性问题
数据传输过程中可能出现数据丢失、损坏等情况，影响数据完整性。
网络稳定性挑战
网络设备故障
双活数据中心依赖于高可靠性的网络设备，任何设备的故障都可能导致数据传输中断。
网络带宽限制
双活数据中心需要大量数据传输，如果网络带宽不足，可能影响数据同步速度和业务连续性。
网络延迟与抖动
网络延迟和抖动可能导致数据同步延迟和业务性能下降。
高可用性保障
负载均衡
通过负载均衡技术，将业务流量分散到两个数据中心，确保任一数据中心故障时，业务仍能正常运行。

联想容灾双活方案,高效应对金融业灾备需求

联想容灾双活方案，高效应对金融业灾备需求突发事件造成的非计划宕机不可避免。

对于实现数据大集中的传统金融企业而言，灾难性的突发事件发生时，如何保障核心业务的在线性和连续性极为重要。

双活容灾解决方案能够充分利用原有IT 资源，实现应用级双活的无感知切换，达到对外业务服务的连续性，有效应对灾难性事件发生时业务宕机的风险。

在传统金融企业众多灾备方案中，双活容灾方案的突出优势值得关注。

1. 联想SVC 技术方案：针对大型数据中心核心业务，客户主要需求为双活数据中心或异地容灾中心，并可升级为两地三中心方案； 2. 联想HyperSwap 技术方案：针对中小型规模级数据中心，客户需求主要为简单的基于业务的数据中心双活； 3. 联想SureHA 技术方案：针对轻负载业务、单服务器场景，客户主要需求为服务器操作系统和业务7x24连续运行； 1. 跨数据中心切换：具备HyperSwap 功能的集群系统提供不同数据中心或数据中心内部的快速切换。

HyperSwap 是从MainFrame 移植下来的软件特性，主要使用Metro Mirror 的技术。

2. 存储虚拟化，实现容量和性能功能的三维动态扩展： 2.1. 通过单一控制界面管理所有存储。

传统第三方存储设备的容量作为 V5030 的一部分进行管理，显著提高生产效率； 2.2. 所有高级功能均可扩展到虚拟化存储，包括自动精简配置、FlashCopy、Easy Tier 和 Real-time Compression； 2.3. 可有效延长设备寿命，保护投资并提升现有存储资产的价值； 3. 不停业务地在线数据迁移：在外部存储与 Lenovo Storage V5030 系统间透明地迁移数据，实现不停业务地在线数据迁移。

4. 全自动切换、恢复，易于管理：支持两个数据中心的自动化切换，连续对外提供生产。

双活数据中心方案

双活数据中心方案双活数据中心方案是一种部署在不同地理位置的两个数据中心，旨在提供高可用性和灾备恢复能力。

这种方案能够确保在一个数据中心出现故障的情况下，另一个数据中心能够顺利接管服务，并保证用户体验不受影响。

以下将详细介绍双活数据中心方案的设计和优势。

1.数据复制：双活方案需要确保两个数据中心之间的数据实时复制或者近实时复制。

这可以通过数据库的主从复制、文件同步或者数据快照实现。

数据复制的目的是保持数据的一致性，以便在故障发生时能够无缝切换到另一个数据中心。

2.心跳检测和故障切换：为了监测数据中心的健康状态，通常会设置心跳检测机制，以确保数据中心之间的连接正常。

如果主数据中心出现故障，心跳检测会及时发现，并触发故障切换机制，将服务切换到备用数据中心。

故障切换的过程应该是自动化的，以减少人工干预和减少切换时间。

3.基础设施冗余：为了实现高可用性，双活方案需要在两个数据中心都配置冗余的基础设施，包括独立的电力供应、网络连接、服务器和存储设备等。

当一个数据中心发生故障时，备用数据中心能够顺利接管服务，而不会由于基础设施故障而导致服务中断。

1.高可用性：双活方案可以提供更高的可用性，因为即使一个数据中心出现故障，另一个数据中心仍然可以继续提供服务。

这种设计可以最大限度地减少服务中断的风险，并提供卓越的用户体验。

2.灾备恢复能力：双活方案能够提供更好的灾备恢复能力。

当一个数据中心发生灾难性故障时，备用数据中心可以快速接管服务，并恢复运营。

这种方案可以最大限度地减少业务损失，并提供持续的服务。

3.地理位置容灾：由于双活方案将数据中心部署在不同地理位置，可以有效应对地域性的自然灾害或人为事故。

即使一个地区受到灾害影响，另一个地区的数据中心仍然能够正常运营，确保数据安全和业务连续性。

4.故障切换和容错能力：双活方案通常自动化故障切换，减少人工干预的需要。

这种方案可以提供更快的故障恢复时间，并减少对用户的影响。

此外，双活方案中的数据复制和冗余设计可以减少单点故障的风险，提供更可靠的服务。

F5双活数据中心解决方案

F5双活数据中心解决方案本文档介绍了F5双活数据中心解决方案的详细内容，包括架构设计、实施步骤、配置要求等。

通过本文档，您将了解如何使用F5双活数据中心解决方案来实现高可用性和灾备性能的架构设计。

目录：1.介绍1.1 解决方案概述1.2 业务需求1.3 目标2.架构设计2.1 双活数据中心架构2.2 组件介绍3.功能详解3.1 高可用性配置3.2 灾备配置4.实施步骤4.1 环境准备4.2 配置双活数据中心功能4.3 配置高可用性4.4 配置灾备5.配置要求5.1 软件要求5.2 硬件要求5.3 网络要求6.测试与验证7.故障排除8.最佳实践9.安全考虑10.升级与维护11.参考文档1.介绍1.1 解决方案概述本解决方案基于F5双活数据中心技术，通过配置高可用性和灾备性能，实现业务系统的连续性和可靠性。

1.2 业务需求针对现有业务系统在单数据中心部署存在单点故障和灾备性能不足的问题，需要实现业务系统在多数据中心的高可用性和灾备性能。

1.3 目标本解决方案的目标是通过配置F5双活数据中心解决方案，实现业务系统在多数据中心的高可用性和灾备性能，保障业务的连续性和可靠性。

2.架构设计2.1 双活数据中心架构双活数据中心架构由两个数据中心组成，每个数据中心都部署了F5负载均衡设备和相关服务器设备。

双活数据中心通过高速网络进行数据同步和故障切换。

2.2 组件介绍2.2.1 F5负载均衡设备：用于实现负载均衡和高可用性功能，通过监控服务器的健康状态，将请求分发到可用的服务器上。

3.功能详解3.1 高可用性配置配置F5负载均衡设备的高可用性功能，包括监控服务器的健康状态、设置故障切换策略等。

3.2 灾备配置配置F5负载均衡设备的灾备性能，包括数据同步、故障切换、流量控制等。

4.实施步骤4.1 环境准备准备好所需的硬件设备、软件配置、网络环境等。

4.2 配置双活数据中心功能配置F5负载均衡设备的双活数据中心功能，包括设置数据同步、故障切换等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

双活数据中心与灾备解决方案多数据中心的建设需要投入大量资金，其项目周期往往很长，涉及的范围也比较大。

从技术上来说，要实现真正意义上的双活，就要求网络、应用、数据库和存储都要双活。

就现阶段来看，大多数客户的多数据中心建设还达不到完全的双活要求，主流的建设目标是实现应用双活。

目前客户建设多数据中心的模型可以归纳为以下几种：1.单纯的数据容灾：正常情况下只有主数据中心投入运行，备数据中心处于待命状态。

发生灾难时，灾备数据中心可以短时间内恢复业务并投入运行，减轻灾难带来的损失。

这种模式只能解决业务连续性的需求，但用户无法就近快速接入。

灾备中心建设的投资巨大且运维成本高昂，正常情况下灾备中心不对外服务，资源利用率偏低，造成了巨大的浪费。

数据容灾2.构建业务连续性：两个数据中心（同城/异地）的应用都处于活动状态，都有业务对外提供服务且互为备份。

但出于技术成熟度、成本等因素考虑，数据库采用主备方式部署，数据库读写操作都在主中心进行，灾备中心进行数据同步。

发生灾难时，数据中心间的数据库可以快速切换，避免业务中断。

双活数据中心可充分盘活企业闲置资源，保证业务的连续性，帮助用户接入最优节点，提高用户访问体验。

构建业务连续性3.提升业务服务能力：多个数据中心同时对外提供服务且互为备份，各中心的数据库可同时处理应用的读写请求，网络、存储、应用和数据库全部实现多活。

各数据中心独立运营，用户流量可被智能调度，形成灵活、弹性和可扩展的面向服务的业务架构。

提升业务服务能力数据中心业务连续性解决方案的几种主要应用场景同城双活：站点级双活(可支持应用级双活)，整合距离相对较近的两个数据中心中的计算、存储和网络资源，实现高度灵活的负载分配，结合数据中心内部的高可用机制，为业务连续性提供最高级别保障。

特点：1、跨数据中心实现高可用性与负载平衡，支持各种应用2、管理简便，成本较高3、数据零丢失，无单一故障点，可靠性高，可最大化业务在线时间4、距离有限，可实现城域级别的应用迁移与灾难避免/灾难恢复异地灾备在不限距离的两个数据中心之间构建备份关系，可抵御较大范围的灾难性事件对业务的影响。

通常部署在处于不同城市的两个数据中心之间。

特点：1、跨地域的业务连续性保护，包括应用迁移，灾难避免和灾难恢复等2、有效保障数据一致性及服务可用性，可实现较好的RPO和RTO两地三中心适用于对业务连续性要求较高的应用，通过集成同城双活与异地灾备两种解决方案，既能实现数据零丢失和故障自动切换,又能抵御区域性灾难对业务连续性的影响。

特点：1、同城两个站点之间的高可用提供数据零丢失的第一层保护2、异地数据中心之间的灾备功能实现第二层保护3、同城双活与异地灾备数据中心采用统一的管理平台4、软件定义的网络与存储可提供最大灵活性数据中心迁移1、整体搬迁•旧有数据中心停用，无缝迁移到新数据中心•可靠性与业务连续性是关键•带宽条件好的情况下可使用长距离在线漂移2、相互融合•新旧DC同时运营，资源进行整合•业务可根据需要在两数据中心之间调配•参考双活中心解决方案进行设计3、角色互换•新DC条件更好，成为主DC•旧DC作为新DC的灾备中心使用•参考灾备解决方案来进行设计双活数据中心整体设计数据中心整体上分为主中心和灾备中心，二者的网络架构、业务系统和服务能力都基本相同，同时对外提供服务，形成双活数据中心。

数据中心内部划分为互联网业务区（提供外网服务，如手机银行、网上银行等）、核心生产业务区（传统生产业务，如ATM、柜面等）、数据库区（生产/查询）和业务测试区，出于成本考虑，灾备数据中心不设业务测试区。

主备数据中心和各一级分行之间通过专线互联，利用动态路由协议组建企业内部专网。

外网业务全局负载设计模型实现方式（1）流量调度数据中心层面：我们推荐使用两层逻辑算法的智能DNS调度策略，首先，全局负载设备会判断用户的地理位置，将用户调度到就近的数据中心，解决南北互访的问题；其次，根据用户所属运营商选择对应链路供用户接入，解决跨运营商访问慢的问题。

此外，全局负载还可对客户端LDNS发起反向探测，判断用户网络质量，为用户选择最佳接入路径。

服务单元层面：WEB、APP和DB服务单元都配备了本地负载均衡器，用户访问流量到达数据中心内部后，由服务单元的负载设备根据预设策略分发给各服务器，可根据用户需求灵活选择轮询、优先级、最小连接等算法。

（2）业务连续性数据中心层面：通过DC Cookie保证用户接入同一数据中心。

用户首次访问时，本地WEB负载设备在响应数据包中插入DC Cookie，当客户端网络发生变化时，第二次访问就可能被调度到其他数据中心，这时其他数据中心的WEB负载设备会识别该Cookie，将用户请求转发至第一次处理该用户访问的WEB负载设备，再由该负载设备进行调度。

服务单元层面：WEB服务单元的负载建议通过cookie会话保持（插入、改写和被动）保证业务连续性；APP服务单元的负载可通过cookie或源IP会话保持保证业务连续性（是否需要会话保持，选择何种会话保持方式需要结合应用具体情况）；DB服务单元一般不需要会话保持。

（3）健康状态检查服务单元层面：通过内置的应用级健康监视器对服务器进行主动探测，提供HTTP、HTTPS、RADIUS、FTP等常用模板。

对于其他应用，提供接口供用户自定义检测内容和响应内容。

此外，还提供极具特色的被动健康检查功能，通过对TCP和HTTP协议的数据交互做采样分析，判断服务器的健康状态。

数据中心层面：全局负载与服务侧的各区域负载均衡联动，实时共享信息，判断服务侧整体服务能力；同时全局负载设备会探测出口各链路健康状态，结合服务侧整体服务能力和设备自身负荷情况，综合判断该数据中心的健康状态（正常、繁忙、故障）。

（4）故障切换服务单元层面：服务单元内部某服务器繁忙或故障时，将用户请求调度到其他正常服务器。

数据中心层面：a.某数据中心的WEB或APP服务器全部繁忙或全部故障时，用户接入链路不切换，通过专线将数据转发至正常数据中心对应服务单元。

b.主数据中心的数据库服务器全部故障时，用户接入链路不切换，通过专线将直接激活备数据中心的数据库，实现数据库一键切换。

数据库切换前需要验证数据库的正确性，用户需要完成数据验证并保证数据库按顺序切换。

c.数据中心的所有链路同时故障时，全局负载设备将用户流量平滑牵引至正常数据中心。

单链路故障时，可根据用户需求切换至本中心其他链路或其他中心同ISP链路。

此外，当某数据中心出现服务能力不足时（链路繁忙、服务单元繁忙等），全局负载设备还可以基于数据中心的整体健康得分情况将用户分流至其他数据中心，保障用户正常访问。

（5）安全保障数据中心层面：a.网络出口处部署DDos防护设备并在运营商处购买流量清洗服务，保证数据中心整体安全。

b.网络出口处部署FW和IPS设备，从网络层和应用层保证数据中心不被恶意入侵。

c.全局负载设备提供DNS防火墙功能，充分保证DNS安全。

DNSSEC 支持、UDP Flood、DNS 放大和反射服务单元层面：各服务单元部署防火墙，保证区域安全。

WEB服务单元直接面向互联网用户，需要部署SSL卸载设备实现SSL加解密，提高业务访问安全。

同时，通过部署WAF保障WEB服务器的安全。

（6）业务优化加速a.跨数据中心的数据库同步需占用大量带宽资源，且数据量非常大，部署WOC 设备可大幅压缩传输数据，削减流量。

WEB或APP服务单元跨数据中心通信时，通过WOC设备的协议优化和流缓存等技术实现加速。

当二者同时需要大量带宽资源时，优先保证数据库同步。

b.互联网区的WEB服务单元直接面向公网，受公网网络质量影响较大，负载均衡可通过协议优化、数据压缩和智能加速等技术减少网络环境影响，提高用户访问体验。

此外，外网用户会有大量重复请求，通过负载设备的高速缓存技术，对静态和内容进行缓存，减少服务器数据交互，降低服务器性能压力，提高访问速度。

（7）其他a.负载设备在服务单元内部通过旁路部署，为保证来回数据一致需要开启SNAT 功能，一般情况下，WEB服务器都需要统计用户访问源IP，可通过负载设备在HTTP头部插入X-Forwarded-for字段来透传用户真实源IP。

b.数据中心网络出口对各类设备性能要求较高，针对某些传统防火墙性能不足的情况，可以在防火墙前后各部署负载均衡设备，实现防火墙的负载。

需验证具体方案，包括防火墙透明和路由部署等问题。

c.考虑到极端情况，单数据中心需要能承载所有业务压力，建议选择2倍于实际性能需求的负载均衡设备。

负载均衡设备自身拥有过载保护机制，当CPU、内存等指标达到阀值时，向用户发出告警信息，并重定向或丢弃后续新建连接。

内网业务全局负载设计模型各分部数据中心与总部数据中心通过动态路由协议互联，形成大的企业内网环境。

其大多数业务（ATM、POS、签章、柜面等）通过IP地址直接访问，利用RHI路由注入的方式对外发布。

负载设备以M+N集群的方式分别部署在两个数据中心，不同的业务系统由不同的负载设备承载，解决了应用集中的风险问题，同时提供灵活的应用部署和无缝业务切换。

实现方式（1）流量调度数据中心对外发布4种业务，一般情况下，每台设备需要对外宣告4条路由，共16条路由，客户端最终访问的路径由动态路由协议自身策略（根据COST 值）决定。

而采用M+N方式的高可用集群，配合基于具体应用的IP-Anycast技术，每台设备承载一种主要业务，其他业务在该设备作为备份状态，设备对外宣告路由时，只宣告主要业务相关的路由，共4条，路由条目削减了75%。

（2）业务连续性内网业务比较特殊，客户端的位置和IP都相对固定。

不考虑故障情况，正常网络环境下，路由器根据COST判断访问路径时结果也相对固定，不存在同一客户端多次访问同一业务被调度到不同负载的情况。

负载设备可根据访问的源IP做会话保持，保证请求由同一服务器处理。

（3）健康状态检查服务器：通过内置的应用级健康监视器对服务器进行主动探测，提供HTTP、HTTPS、RADIUS、FTP等常用模板。

对于其他应用，提供接口供用户自定义检测内容和响应内容。

此外，还提供极具特色的被动健康检查功能，通过对TCP和HTTP协议的数据交互做采样分析，判断服务器的健康状态。

链路：提供多种方式的链路健康检查，可指定探测地址和探测协议。

（4）故障切换服务器：单台服务器故障时，负载设备将用户请求调度到其他正常服务器；当数据中心内某业务对应的所有服务器故障时，负载设备会删除为该业务宣告的路由，由其他负载设备接替其工作。

链路：当链路发生故障时，远端路由器和负载设备都可以探测到故障状态，客户端访问业务系统时，路由器会选择正常链路转发数据。

负载设备：当设备自身发生故障时，集群内其余设备会自动协商出一台设备接替其工作。