阵列双活容灾解决方案

合集下载

弱电安防--双活数据中心与灾备解决方案

双活数据中心与灾备解决方案多数据中心的建设需要投入大量资金，其项目周很长，涉及的范围也比较大。

从技术上来说，要实现真正意义上的双活，就要求网络、应用、数据库和存储都要双活。

就现阶段来看，大多数客户的多数据中心建设还达不到完全的双活要求，主流的建设目标是实现应用双活。

目前客户建设多数据中心的模型可以归纳为以下几种：1.单纯的数据容灾：正常情况下只有主数据中心投入运行，备数据中心处于待命状态。

发生灾难时，灾备数据中心可以短时间内恢复业务并投入运行，减轻灾难带来的损失。

这种模式只能解决业务连续性的需求，但用户无法就近快速接入。

灾备中心建设的投资巨大且运维成本高昂，正常情况下灾备中心不对外服务，资源利用率偏低，造成了巨大的浪费。

数据容灾2.构建业务连续性：两个数据中心（同城/异地）的应用都处于活动状态，都有业务对外提供服务且互为备份。

但出于技术成熟度、成本等因素考虑，数据库采用主备方式部署，数据库读写操作都在主中心进行，灾备中心进行数据同步。

发生灾难时，数据中心间的数据库可以快速切换，避免业务中断。

双活数据中心可充分盘活企业闲置资源，保证业务的连续性，帮助用户接入最优节点，提高用户访问体验。

构建业务连续性3.提升业务服务能力：多个数据中心同时对外提供服务且互为备份，各中心的数据库可同时处理应用的读写请求，网络、存储、应用和数据库全部实现多活。

各数据中心独立运营，用户流量可被智能调度，形成灵活、弹性和可扩展的面向服务的业务架构。

提升业务服务能力数据中心业务连续性解决方案的几种主要应用场景同城双活：站点级双活(可支持应用级双活)，整合距离相对较近的两个数据中心中的计算、存储和网络资源，实现高度灵活的负载分配，结合数据中心内部的高可用机制，为业务连续性提供最高级别保障。

特点：1、跨数据中心实现高可用性与负载平衡，支持各种应用2、管理简便，成本较高3、数据零丢失，无单一故障点，可靠性高，可最大化业务在线时间4、距离有限，可实现城域级别的应用迁移与灾难避免/灾难恢复异地灾备在不限距离的两个数据中心之间构建备份关系，可抵御较大范围的灾难性事件对业务的影响。

双活数据中心与灾备解决方案技术部分

requirements and their environment
NSX利用层叠网络实现双活数据中心
站点A
三层网络
站点A 边界网关
上联网络A
VM1
VM 2
vCenter Server
分布式逻辑路由器
逻辑交换机A 172.16.10.0/24
VM
4
逻辑交换机B
172.16.20.0/24
数据存储1
workload & IP mobility without the need to stretch VLANs
▪ Local egress is supported, however it does add complexity ▪ The appropriate deployment model will depend on customer
infrastructure failures • Fully automated response
11
长距离vMotion
功能简介
• Targeting cross-continental distances –up to 100 ms RTTs • Maintain standard vMotion guarantees • Leader in VM flexibility
capabilities of SRM)
• Loss of either NSX Components or the Datacenter Interconnect will results in a fallback to data plane
based learning using existing network state. Therefore there is no outage to data forwarding and without vCenter Server, there are no VM provisioning or migration operations

“双活”容灾,走好容灾建设每一步

“双活”容灾，走好容灾建设每一步建设容灾系统就是指利用各种技术和管理手段将灾难的影响化解，它的主要表现形式为两个方面：一是保证企业数据的安全；二是保证业务的连续性。

当各企业的信息化建设走向了一个新的层次，面临各类法规、竞争、高质量服务的新的要求时，能否有效的建立灾难防御体系就成了企业进一步发展的一个里程碑。

容灾系统的建设意义已经被铺天盖地的渲染，各级政府和行业也开始制定规则，规范信息系统在各种灾难下的危机响应水平，从各方面来看，是否有必要建设容灾系统已经走过了探讨的阶段，而摆在人们面前的却是另一个过去始料不及的问题---建立容灾系统的复杂性。

这个问题的复杂度在人们考虑灾备系统规划和建设方案时凸现了出来，例如：人们会发现当提出一个理想的各类业务统一灾难防御体系的建设目标之后，却无法选出满足要求的技术路线或者需要极为高昂的造价。

又比如，人们发现容灾体系建设中，IT部门却无法控制一个整体的容灾流程，而流程的制定又是一个需要全民意识的多兵种工程，等等诸如此类。

在建设容灾系统中，通常会遇到下面几个问题。

第一，在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。

比如，采用数据复制技术对系统I/O带来的延迟，应用数据同步对日常业务处理系统带来的压力等。

因此，企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险，以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。

第二，数据状态要保持同步。

为保证在灾难发生时，业务可以成功地切换到备份中心，就必须保证容灾系统数据同步机制的可靠性。

因此，建立可靠的数据同步校验机制是必须的；同时，还要考虑建立定时的、自动的数据同步核查对比机制，以检验两个中心数据的一致性，这是数据容灾工作中非常重要的一部分。

第三，容灾系统的日常维护工作要尽可能轻，并能承担部分业务处理和测试的工作。

容灾系统的维护和管理是容灾切换成功的重要保证，在系统建设中，就必须要考虑系统的维护管理流程。

宏杉科技双活存储解决方案介绍

MacroSAN 双活存储解决方案介绍杭州宏杉科技有限公司1. 解决方案概述在信息社会里，数据的重要性已经毋容置疑，作为数据载体的存储阵列，其可靠性更是备受关注。

尤其在一些关键应用中，不仅需要单台存储阵列自身保持高可靠性，往往还需要二台存储阵列组成高可靠的系统。

一旦其中一台存储阵列发生故障，另一台可以无缝接管业务。

这种两台存储都处于运行状态，互为冗余，可相互接管的应用模式一般称之为双活存储。

由于技术上的限制，传统的双活存储方案无法由存储阵列自身直接实现，更多的是通过在服务器上增加卷镜像软件，或者通过增加额外的存储虚拟化引擎来实现。

通过服务器上的卷镜像软件实现的双活存储，实施复杂，对应用业务影响大，而且软件购买成本较高。

通过存储虚拟化引擎实现的双活存储，虽然实施难度有一定降低，但存储虚拟化引擎自身会成为性能、可靠性的瓶颈，而且存在兼容性的限制，初次购买和维护成本也不低。

宏杉科技的对称双活存储（Symmetrical Dual Active Storage，简称SDAS）是一项专门针对双活存储方案的创新技术。

通过宏杉科技对称双活存储技术，可以不需要引入任何第三方软硬件，直接通过两台同档次的MS系列存储阵列实现两台存储的双活工作，互为冗余。

当其中一台存储发生故障时，可由另一台存储实时接管业务，实现RPO、RTO为0。

这是一种简单、高效的新型双活存储技术。

宏杉科技的SDAS技术，不仅支持近距离的双活存储系统，而且支持上百公里甚至更远的远距离双活数据中心。

近距离的双活存储可以采用更加高效的光纤交叉直连的方式进行组网部署，远距离的双活数据中心采用交换机连接方式，再配以仲裁者机制进行组网部署。

宏杉科技的SDAS两套存储之间的链路不仅可以支持10GE以太网，而且在业界率先支持40GE以太网技术。

40GE具有目前以太网应用领域中的最高的传输带宽，可以大大降低同步数据传输时延。

目前宏杉科技的MS3000、MS5500、MS7000存储产品都已经支持对称双活存储技术。

Fujitsu存储双活解决方案

Fujitsu存储双活解决方案谈谈Fujitsu 存储双活解决方案前两天，《高端存储知识》的作者西瓜哥发表了一篇文章《原来富士通ETERNUS DX S3系列已经支持双活，但好像没有看到仲裁机制》，文中对ETERNUS DX S3系列StorageCluster(存储高可用)解决方案进行了相关的介绍和应用场景的分析。

在这里要感谢西瓜哥对Fujitsu ETERNUS存储双活解决方案关注和技术普及，同时，我们也将对文中的一些理解偏差(姑且这么说吧)进行进一步的解释和阐述。

问题一：Storage Cluster是否有仲裁机制？要回答这个问题，我们首先来看看Storage cluster解决方案架构图。

这里仅简单说明一下：生产存储和备用存储之间使用FC链路，通过存储自带的远程复制技术实现LUN数据的实时同步复制，同时生产LUN和备份LUN都Mapping给前端业务主机。

当生产存储出现故障时，将自动切换到备用存储上，由于生产存储和备用存储Mapping 给前端主机的端口共享相同的一组逻辑WWPN/WWNN，所以对前端主机来说，后台只有一台存储，且切换是透明的，所以前端绝大多数应用是不会中断的。

上图中的工作站Storage Cluster Controller就是存储双活解决方案中的仲裁者，它时刻监控着生产存储、备用存储的健康状态，当生产存储或者备用存储出现问题，它就开始执行Failover策略。

这里需要说明的是Storage Cluster Controller并不是一个单独的软件，它只是一个后台服务进程，该服务进程集成在ETERNUSSF Storage Cruiser Agent软件中，需要单独准备一台工作站或者服务器安装ETERNUSSF Storage 管理套件。

那Storage Cluster Controller什么时候干活呢？它如何干活呢？它干些什么事呢？那就进入第二个话题----Storage cluster 故障处理机制。

阵列双活数据中心解决方案

保留一切权利。

非经本公司书面许可，任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

商标声明和其他华为商标均为华为技术有限公司的商标。

本文档提及的其他所有商标或注册商标,由各自的所有人拥有.注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束，本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。

除非合同另有约定，华为公司对本文档内容不做任何明示或默示的声明或保证。

由于产品版本升级或其他原因,本文档内容会不定期进行更新。

除非另有约定，本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。

华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编：518129网址：客户服务邮箱:客户服务电话：0755—28560000 4008302118客户服务传真：0755—28560111目录1适用场景（供参考，实际使用删除） (5)1。

1文档适用场景说明 (5)1。

2版本更新 (5)2概述 (6)2。

1项目背景 (6)2。

1.1项目概述 (6)2。

1.2建设总体要求 (6)2.2需求分析 (7)2。

2。

1需求分析 (7)2.2.2现状分析 (8)2.2.3建设目标(适用于升级改造） (9)2.2.4方案设计原则 (9)3存储双活架构选择 (10)3.1存储双活架构选择 (10)3。

1.1存储双活架构描述 (10)3。

1。

2业界存储双活技术路线 (10)3.1.3存储双活架构对比 (10)4系统方案设计 (13)4。

1整体架构设计 (13)4.1。

1方案描述 (13)4.1。

2存储双活架构的要求 (14)4.2存储双活方案详细设计 (16)4。

2。

1虚拟化存储双活设计 (16)4。

2.2双活读策略设计 (17)4.2.3优选路径设计 (17)4。

双活灾备方案

双活灾备方案方案一双活灾备方案在当今数字化高速发展的时代，数据和业务的连续性成为了企业生存和发展的关键。

时不时出现的自然灾害、硬件故障、人为失误等，都可能给企业带来致命的打击。

这就是我们制定双活灾备方案的背景，目的很简单，就是要确保在各种“幺蛾子”出现时，企业能够稳如泰山，业务不中断，数据不丢失。

其意义嘛，那可大了去了，不仅能保护企业的“钱袋子”，还能保住企业的声誉和客户的信任，不然一旦出问题，那可真是“凉凉”了。

咱们先定个小目标，方案实施后，在遇到灾难事件时，业务恢复时间要控制在 30 分钟以内，数据丢失量不超过 10 分钟的数据，系统可用性要达到 99.99%以上。

来看看现状，内部情况是咱们的业务系统越来越复杂，数据量也与日俱增，现有的备份手段有点跟不上节奏啦。

外部呢，竞争对手们都在加强灾备能力，市场对企业的服务连续性要求越来越高，客户可不会容忍咱们动不动就“掉链子”。

具体方案内容如下：首先，搭建双活数据中心，实现数据实时同步。

这就像是给数据找了两个“家”，一个“家”出问题，另一个“家”立马顶上。

然后，优化网络架构，确保数据传输的高效稳定，别让数据在“路上”堵着。

还有，建立完善的监控和预警系统，让咱们能提前发现问题，别等出了事才傻眼。

风险评估与应对这一块，可能会出现网络延迟导致数据同步不及时，那咱就多弄几条备用网络线路呗。

要是数据中心出现故障，得有快速切换的应急预案，平时多演练，关键时刻才不慌。

效果评估方面，用业务恢复时间、数据丢失量、系统可用性这些指标来衡量。

每季度进行一次评估，通过模拟灾难事件来测试方案的有效性。

怎么样，这方案是不是还挺靠谱？方案二双活灾备方案哎呀，如今这世界变化快，各种意外情况防不胜防。

要是企业因为没做好灾备，一下子业务中断、数据丢失，那可真是哭都没地方哭去。

所以咱得搞个双活灾备方案，这就是背景啦。

目的就是让企业在灾难面前也能昂首挺胸，继续赚钱，意义嘛，那就是给企业穿上一层“金钟罩铁布衫”，让它不怕风吹雨打。

“两地三中心”和“双活”简介--容灾技术方案

“两地三中⼼”和“双活”简介--容灾技术⽅案当前市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中⼼、两地三中⼼⼏种。

1、同城容灾同城容灾是在同城或相近区域内（ ≤ 200K M ）建⽴两个数据中⼼ : ⼀个为数据中⼼，负责⽇常⽣产运⾏ ; 另⼀个为灾难备份中⼼，负责在灾难发⽣后的应⽤系统运⾏。

同城灾难备份的数据中⼼与灾难备份中⼼的距离⽐较近，通信线路质量较好，⽐较容易实现数据的同步复制，保证⾼度的数据完整性和数据零丢失。

同城灾难备份⼀般⽤于防范⽕灾、建筑物破坏、供电故障、计算机系统及⼈为破坏引起的灾难。

2、异地容灾异地容灾主备中⼼之间的距离较远（＞ 200KM ) ，因此⼀般采⽤异步镜像，会有少量的数据丢失。

异地灾难备份不仅可以防范⽕灾、建筑物破坏等可能遇到的风险隐患，还能够防范战争、地震、⽔灾等风险。

由于同城灾难备份和异地灾难备份各有所长，为达到最理想的防灾效果，数据中⼼应考虑采⽤同城和异地各建⽴⼀个灾难备份中⼼的⽅式解决。

本地容灾是指在本地机房建⽴容灾系统，⽇常情况下可同时分担业务及管理系统的运⾏，并可切换运⾏；灾难情况下可在基本不丢失数据的情况下进⾏灾备应急切换，保持业务连续运⾏。

与异地灾备模式相⽐较，本地双中⼼具有投资成本低、建设速度快、运维管理相对简单、可靠性更⾼等优点；异地灾备中⼼是指在异地建⽴⼀个备份的灾备中⼼，⽤于双中⼼的数据备份，当双中⼼出现⾃然灾害等原因⽽发⽣故障时，异地灾备中⼼可以⽤备份数据进⾏业务的恢复。

本地机房的容灾主要是⽤于防范⽣产服务器发⽣的故障，异地灾备中⼼⽤于防范⼤规模区域性灾难。

本地机房的容灾由于其与⽣产中⼼处于同⼀个机房，可通过局域⽹进⾏连接，因此数据复制和应⽤切换⽐较容易实现，可实现⽣产与灾备服务器之间数据的实时复制和应⽤的快速切换。

异地灾备中⼼由于其与⽣产中⼼不在同⼀机房，灾备端与⽣产端连接的⽹络线路带宽和质量存在⼀定的限制，应⽤系统的切换也需要⼀定的时间，因此异地灾备中⼼可以实现在业务限定的时间内进⾏恢复和可容忍丢失范围内的数据恢复。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

可视化
全局拓扑、集中告警自动化，一键式容灾演练、恢复
本地高可用解决方案
方案架构
V
V
V
M

M
V
V
V
M
M
M
Other
SAN
Hu a we i
亮点
业务级高可靠
业务0中断数据0丢失
课程目录
为什么要做容灾？华为容灾解决方案OverVie w 华为阵列双活解决方案解析华为阵列双活竞争分析案例分享
FC/ IP SAN
生产存储
WAN
数据实时同步
FC/ IP SAN
IP网络
IP网络
仲裁设备
Hyp erMetro 存储双活设计
A-A 架构：双活LUN，双站点均可读写，数据实时同步
高可靠性设计：双重仲裁机制，跨站点坏块修复，提高系
生产存储
统可靠性
高性能设计：提供多种性能优化手段，减少站点间交互延
高
数据损坏
磁盘故障
每
应用中断
年
组件故障
的
发
网络问题
生
频
电源故障空调故障
率
区域性灾难
统计显示： 97%的局部故障会导致企业对外业务运行中断； 3%的全局故障引起企业数据丢失，可能导致企业消亡；
数据中心故障
建筑火灾
恐怖行动/ 国内动乱
低
自然灾害
单次发生的损失
低
高
如何有效应对故障和灾难对业务连续性带来的挑战- - - 建设容灾系统
HyperMetro 数据一致性保障
两地三中心容灾解决方案
方案架构
生产中心
A
SAN
A
同/ 异步复制
级联架构
同城容灾中心
异步复制
SAN
A’
生产中心
A
SAN
A
同/ 异步复制
并行架构
同城容灾中心
SAN
A’
异步复制
异地容灾中心
SAN
A“
异地容灾中心
SAN
A“
亮点
高安全
3 份数据容灾范围更大
平滑扩展
同城平滑扩展到两地三中心级联、并行灵活部署
同城链路SLA设计
链路复用（包括心跳互联、双活、复制等），组网简单优先传输：心跳 > 双活 & 同步复制IO流 > 异步复制IO
流
仲裁链路设计
支持10GE、GE网络，带宽2M b ps以上，IP可达
仲裁设备
最佳实践
组网原则
Hyp e rMet ro 同城互联网络与主机、存储互联网络保持一致、简化组网
华为容灾解决方案全景图
本地高可用方案
本地高可用解决方案
同城容灾方案
双活数据中心解决方案主备容灾解决方案
异地容灾方案
两地三中心容灾解决方案主备容灾解决方案
≤1 0 0 km
＞1 0 0 km
本地生产中心
同城容灾中心
异地容灾中心
双活数据中心解决方案
方案架构
生产中心1
VVV M MM
VVV MMM
W AN
生产中心2
VVV MMM
VVV MMM
SAN Other
SAN
Hyp e rMe tro
华为
华为
Other
亮点
真双活
6 层双活架构，业务级双活; 业务0 中断，数据0 丢失;
高性能
HyperMetro性能提升30% 100KM与本地性能一致
可视化
全局拓扑、集中告警故障自动切换、恢复
V3同城互联端口与前段主机端口不复用
Hype rMetro 数据双写流程
主机
Write IO
15
A阵列
2
双活LUN
4
3
3
跨站点双活AA集群 B阵列
4
双活成员LUN
双活成员LUN
Hyp e rMe tro 双写流程
1.主机下发IO写请求 2.申请分布式锁 3.本端阵列向本端Ca che 写入数据，同时将写请求发送远端阵列 4.本端写入数据成功，远端数据写入成功并返回本端阵列写成功 5.本端和远端都写入数据成功，向主机返回写入成功
HyperMetro 阵列双活架构
数据中心A
数据中心B
基本原理
Oracle RAC集群 VMware vSphe re集群 Fu sio nSphe re集群
……
在数据中心A和数据中心B各部署一套华为Ocea n St o r V3 存储，部署为双活模式，为两数据中心业务主机同时提供读写服务。任意数据中心故障，数据零丢失。
媒体医疗零售业制造业电信能源
来源： Ne t wo rk Com p u tin g, th e M e t a Gro u p a n d Con tin g e n cy Pla n n in g Re se a rch
单位：
金融万美元服务
影响IT系统业务连续性的灾难类型
设备故障
阵列双活容灾解决方案 HCS- So lutio n
课程目录
为什么要做容灾？华为容灾解决方案OverVie w 华为阵列双活解决方案解析华为阵列双活竞争分析案例分享
Page 2
IT系统业务连续的重要性
火灾停电
设备故障病毒爆发
每小时停机损失
9
648
280 200 160 63 110
时，业务性能提升30%
灵活扩展设计：支持异构，支持与快照、远程复制联动，
可扩展为两地三中心容灾方案
HyperMetro 组网设计
同城互联及仲裁网络设计
Ho st
Ho st
FC/ IP SAN
10GE / FC
FC/ IP SAN
网络互联需求
支持10GE、8G FC以及16G FC互联协议
灾备发展的新挑战
海量数据
容灾系统如何有效应对数据增长，保证业务在线？
容灾系统如何将对业务的影响降至最低，实现业务零中断、数据零丢失？数据量增速远超带宽增速，如何快速完成数据容灾？
业务永远在线
传统容灾模式投入大，利用率低，如何提升投入产出比？
高端存储只能复制到高端存储，容灾设备利用率低，如何提升投入产出比？容灾中心的资源如何更好的利用和共享，降低容灾TCO？灾备数据如何有效利用，实现增值？
主备容灾解决方案
方案架构
生产中心
VVV M MM
VVV MMM
W AN
容灾中心
VVV MMM
VVV MMM
SAN Other
SAN
Hyp e rRe p lic a ito n
华为
华为
Other
亮点
秒级PRO
IO级的数据复制功能，RPO≈0;
TCO低
存储高、中、低端互通异构、利旧
可视化
全局拓扑、集中告警自动化，一键式容灾演练、恢复
容灾系统管理范围广、难度大，如何简化？
人力有限，如何高效地完成容灾业务来支撑企业持续运作？容灾系统建设涉及服务器、网络、存储等设备，系统复杂，容灾业
务众多，如何管理和维护？
课程目录
为什么要做容灾？华为容灾解决方案OverVie w 华为阵列双活解决方案解析华为阵列双活竞争分析案例分享