第六章 双活容灾解决方案
双活数据中心及灾备解决方案技术部分

NSX利用层叠网络实现双活数据中心
站点A
三层 网络
站点A 边界网关
上联网络A
VM1
VM 2
vCenter Server
分布式逻辑路由器
逻辑交换机A 172.16.10.0/24
VM
4
逻辑交换机B
172.16.20.0/24
数据存储1
which also aligns with vMotion using Enterprise Plus
• vMSC enables disaster avoidance and basic Disaster Recovery (without the orchestration or testing
• VMotion an数d S据to保ra护ge VMotion
• 高效的数据备份与恢复 • 可通过运行计划与脚本实现自动化操作
灾难恢复
• 基于虚拟化层的异步复制 • 基于硬件设备的同异步复制 • 自动化应用切换管理 • 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
9
Fault Tolerance vs. High Availability
• Fault tolerance
– Ability to recover from component loss – Example: Hard drive failure
• High avail percentage in one year 99 99.9 99.99 99.999 “five nines”
Downtime in one year 3.65 days 8.76 hours 52 minutes 5 minutes
双活灾备方案

双活灾备方案方案一双活灾备方案在当今数字化高速发展的时代,数据和业务的连续性成为了企业生存和发展的关键。
时不时出现的自然灾害、硬件故障、人为失误等,都可能给企业带来致命的打击。
这就是我们制定双活灾备方案的背景,目的很简单,就是要确保在各种“幺蛾子”出现时,企业能够稳如泰山,业务不中断,数据不丢失。
其意义嘛,那可大了去了,不仅能保护企业的“钱袋子”,还能保住企业的声誉和客户的信任,不然一旦出问题,那可真是“凉凉”了。
咱们先定个小目标,方案实施后,在遇到灾难事件时,业务恢复时间要控制在 30 分钟以内,数据丢失量不超过 10 分钟的数据,系统可用性要达到 99.99%以上。
来看看现状,内部情况是咱们的业务系统越来越复杂,数据量也与日俱增,现有的备份手段有点跟不上节奏啦。
外部呢,竞争对手们都在加强灾备能力,市场对企业的服务连续性要求越来越高,客户可不会容忍咱们动不动就“掉链子”。
具体方案内容如下:首先,搭建双活数据中心,实现数据实时同步。
这就像是给数据找了两个“家”,一个“家”出问题,另一个“家”立马顶上。
然后,优化网络架构,确保数据传输的高效稳定,别让数据在“路上”堵着。
还有,建立完善的监控和预警系统,让咱们能提前发现问题,别等出了事才傻眼。
风险评估与应对这一块,可能会出现网络延迟导致数据同步不及时,那咱就多弄几条备用网络线路呗。
要是数据中心出现故障,得有快速切换的应急预案,平时多演练,关键时刻才不慌。
效果评估方面,用业务恢复时间、数据丢失量、系统可用性这些指标来衡量。
每季度进行一次评估,通过模拟灾难事件来测试方案的有效性。
怎么样,这方案是不是还挺靠谱?方案二双活灾备方案哎呀,如今这世界变化快,各种意外情况防不胜防。
要是企业因为没做好灾备,一下子业务中断、数据丢失,那可真是哭都没地方哭去。
所以咱得搞个双活灾备方案,这就是背景啦。
目的就是让企业在灾难面前也能昂首挺胸,继续赚钱,意义嘛,那就是给企业穿上一层“金钟罩铁布衫”,让它不怕风吹雨打。
医卫行业双活容灾解决方案

24
浪擎科技,双活容灾
实时复制
SQL 数据库
SQL 数据库
HIS生产服务器
HIS容灾服务器
2013年10月29日浪擎“双活”容灾助镇江市第三人民医院成功逃难
2013年10月29日,镇江市第三人民医院拨通了浪擎总部工程师的电话,因源端 突然出现问题,源端为集群,申请紧急支持远程协助服务。浪擎工程师接到电话后立 即在家里远程协助三院,在界面上备端模块恢复读写,手动将生产系统IP添加到备端 (备端数据库Oracle监听地址为机器名),添加之后,生产系统恢复正常,在3—5分 钟内接管完成,使医院全面恢复正常。 三院始建于1954年,经过54年的建设,是一所中西医结合、内外科并举,以传 染病诊治为特色的综合性医院。三院在2012年使用了浪擎A系镜像“双活”容灾,主 院区机房有4套重要业务系统,分别是HIS、EMR、LIS、成本核算和财务系统以及 PACS系统,环境部署是HIS架设在双机热备架构下,采用的是Windows操作系统, Oracle数据库;EMR、LIS、成本核算系统运行在Windows操作系统SQL Server数据 库平台上;PACS系统由数据库数据和文件数据组成,其中数据库数据保存在HIS的 Oracle数据库里,而文件由单独的文件服务器存放,文件服务器运行的是 Windows2003操作系统。
最多的区域级灾备中心建设案例
5
浪擎科技,双活容灾
浪擎产品线
系列 D系 (数据级) A系 (应用级) Y系 (云计算) 产品 DataBackup 实时、定时备份、准实时恢复 说明 适用 定时备份 实时备份 关键业务 双活容灾 灾备中心 数据中心 数据备份
实时备份
备份级灾备方案双活解决方案PPT

镜像
存储阵列
光纤
双中心同时提供服务
双中心可提供完全相同的服务
采用数据同步复制 +ORACLE RAC 技术 双数据中心间距离不超过 50公里
23
高可用同城/异地准双活(轮换)解决方案
接入层
中心A
<50KM
中心B
全局负载均衡
无需改造生产系统;任意数据中心
故障,灾备业务连续保护不受影响
>50KM
异地灾备中心C
灾备存储池
客户价值
距离无限制,组网灵活 虚拟机整体保护,操作简单 兼容性优,TCO较双活方案低
数据级容灾解决方案 — CDP容灾
生产站点
VM1
……
VMn
iSCSI
IPSAN
iSCSI
CDP服务器
容灾站点
VM1'
……
iSCSI
CDP服务器
VMn'
iSCSI
IPSAN
CDP ( Continuous Data Protection)数据保护技术。CDP系统通过不断监测被保护数据得变化和分流,实现对数据 的保护。 无需关注数据备份过程,当灾难发生后,只需简单地选择要恢复到得时间点即可实现数据得快速恢复。
Tier1- PTAM
8-12Hr 12-16Hr 24Hr
Day
Week
7
6级
数据0丢失和远程 实现远程数据实时备份,实现0丢失
集群支持
应用软件可以实现实时无缝切换 远程集群系统的实时监控和自动切换能力
5级
实时数据传输及 完整设备支持
实现远程数据复制技术 备用网络也具备自动或集中切换功能
4级 电子传输及完整 设备支持
联想容灾双活方案,高效应对金融业灾备需求

联想容灾双活方案,高效应对金融业灾备需求 突发事件造成的非计划宕机不可避免。
对于实现数据大集中的传统金融企业而言,灾难性的突发事件发生时,如何保障核心业务的在线性和连续性极为重要。
双活容灾解决方案能够充分利用原有IT 资源,实现应用级双活的无感知切换,达到对外业务服务的连续性,有效应对灾难性事件发生时业务宕机的风险。
在传统金融企业众多灾备方案中,双活容灾方案的突出优势值得关注。
1. 联想SVC 技术方案:针对大型数据中心核心业务,客户主要需求为双活数据中心或异地容灾中心,并可升级为两地三中心方案; 2. 联想HyperSwap 技术方案:针对中小型规模级数据中心,客户需求主要为简单的基于业务的数据中心双活; 3. 联想SureHA 技术方案:针对轻负载业务、单服务器场景,客户主要需求为服务器操作系统和业务7x24连续运行; 1. 跨数据中心切换:具备HyperSwap 功能的集群系统提供不同数据中心或数据中心内部的快速切换。
HyperSwap 是从MainFrame 移植下来的软件特性,主要使用Metro Mirror 的技术。
2. 存储虚拟化,实现容量和性能功能的三维动态扩展: 2.1. 通过单一控制界面管理所有存储。
传统第三方存储设备的容量作为 V5030 的一部分进行管理,显著提高生产效率; 2.2. 所有高级功能均可扩展到虚拟化存储,包括自动精简配置、FlashCopy、Easy Tier 和 Real-time Compression; 2.3. 可有效延长设备寿命,保护投资并提升现有存储资产的价值; 3. 不停业务地在线数据迁移:在外部存储与 Lenovo Storage V5030 系统间透明地迁移数据,实现不停业务地在线数据迁移。
4. 全自动切换、恢复,易于管理:支持两个数据中心的自动化切换,连续对外提供生产。
HC1209306-HCNP V3.0 第六章 双活容灾解决方案

目标
学习完本章节后,您将能够: 掌握双活数据中心解决方案如何做项目信息调研 掌握双活数据中心解决方案的方案设计 掌握双活数据中心解决方案部署 掌握双活数据中心解决方案容灾操作
目录
1. 项目信息调研 2. 方案设计 3. 华为VIS 6600T产品介绍 4. 双活数据中心解决方案部署
• • •
L3 GSLB • •
• •
•
部署方式
核心网关直连OTN设备
四台核心交换机间Full Mesh 或口字型连接
10GE/40GE链路互联
CSS/iStack+Eth-Trunk,整 网无环拓扑
可靠性保证
OTN传输:双发选收/组建 DWDM环网
L2互联链路:LACP通告
数据中心 1
服务器
数据中心2
VIS仲裁网络 VIS心跳网络 业务网络(VIS前、 后端,VIS互连)
生产存储2
光纤交换机
业务规划
应用类型
部署规划
备注
Oracle 11g
DC1中部署2节点,DC2中部署1节点,组 全AA工作,硬盘挂载方式推
成3节点Oracle RAC集群
荐ASM
SQL Server
DC1中部署1节点,DC2中部署1节点,组 成2节点SQL Server集群
Pool
• 单数据中心常见的SLB部署方式。 • Virtual Server由负载均衡设备集群
提供,则可以提供更高的可靠性。
GSLB
Client
GSLB
SLB HA集群
AP工作模式
DB2
DC1中部署1台AIX,DC2中部署1台AIX, 组成2节点HACMP集群
阵列双活容灾解决方案
按业务粒度仲裁— 一致性组仲裁
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
通用方案
站点A
站点B
服务器 优先站点
服务器
按业务粒度仲裁
站点A
站点B
服务器
服务器
ERP一致性组 CRM一致性组 OA 一致性组 We b 一致性组
可视化
全局拓扑、集中告警 自动化,一键式容灾演练、恢复
本地高可用解决方案
方案架构
V
V
V
M
M
M
V
V
V
M
M
M
Other
SAN
Hu a we i
亮点
业务级高可靠
业务0中断 数据0丢失
课程目录
为什么要做容灾? 华为容灾解决方案OverVie w 华为阵列双活解决方案解析 华为阵列双活竞争分析 案 例分享
华为容灾解决方案全景图
本地高可用方案
本地高可用解决方案
同城容灾方案
双活数据中心解决方案 主备容灾解决方案
异地容灾方案
两地三中心容灾解决方案 主备容灾解决方案
≤1 0 0 km
>1 0 0 km
本地生产中心
同城容灾中心
异地容灾中心
双活数据中心解决方案
方案架构
生产中心1
VVV M MM
VVV MMM
HyperMetro 仲裁设计-仲裁部署方案
仲裁部署
有第三方仲裁站点(推荐)
存储资源池
• 仲裁设备部署在第三方站点,与双活的两个数 据中心处于不同的故障域
双活数据中心与灾备项目解决方案概览共34页文档
谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
双活数据中心与灾备项目解 决方案概览
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞 不前时 ,我继 续拼搏 。
33、如果惧怕前面跌宕的山岩,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可 以被永 远肯定 。
双活解决方案
双活数据中心间通过专用网络连接,采用多路径、高带宽的网络架构,确保网络通信的稳定性和低延迟。网络设计包括:
-双向冗余网络连接,避免单点故障。
-虚拟路由器冗余协议(VRRP)实现网络设备的冗余。
-分布式拒绝服务(DDoS)防御措施,确保网络安全性。
3.存储设计
存储系统采用分布式存储技术,实现数据的冗余存储和实时复制。关键特性包括:
2.网络设计
双活数据中心之间采用高速专线连接,确保网络带宽满足业务需求。同时,采用虚拟私有云(VPC)技术,实现两个数据中心之间的内网互通。
3.存储设计
双活数据中心采用共享存储架构,通过存储复制技术(如SRDF、HyperMetro等)实现数据实时同步。此外,采用存储虚拟化技术,提高存储资源利用率,降低运维复杂度。
数据库系统采用双活配置,通过数据库镜像或复制技术,实现数据的实时同步。设计重点包括:
-数据库事务日志同步,保证数据一致性。
-自动故障恢复机制,减少人工干预。
6.应用设计
应用层采用微服务架构,服务间通过服务总线进行通信,提高系统的灵活性和可扩展性。设计要点包括:
-服务冗余部署,确保服务的高可用性。
-服务注册与发现机制,实现服务动态路由。
四、实施方案
1.硬件设备选型与采购:根据业务需求,选择合适的硬件设备,包括服务器、存储、网络设备等。
2.软件系统部署:在两个数据中心部署相同的软件系统,包括操作系统、数据库、中间件、应用系统等。
3.数据同步:配置存储复制和数据库镜像,实现双活数据中心之间的数据实时同步。
4.网络配置:配置双活数据中心之间的网络连接,确保内网互通,并设置防火墙、负载均衡等安全策略。
2.数据一致性需求:要求双活数据中心之间的数据实时同步,保证数据一致性和完整性。
双活容灾方案
双活容灾方案概述双活容灾方案是一种旨在保证系统高可用性和业务连续性的解决方案。
通过在不同地理位置部署多台服务器,并将其配置为主备模式,可以实现在主服务器故障时,自动切换到备份服务器以确保业务的顺利进行。
本文将介绍双活容灾方案的基本原理、常见的实现方式以及应用场景。
基本原理双活容灾方案的基本原理是通过在主服务器和备份服务器之间实现数据同步和状态同步,实现主备切换的自动化。
在正常情况下,主服务器负责处理业务请求,并将数据和状态同步到备份服务器。
当主服务器发生故障时,备份服务器会自动接替主服务器的角色,继续处理业务请求,从而实现业务的连续性。
实现方式双活容灾方案可以通过多种实现方式来达到高可用性和业务连续性的目标。
以下是一些常见的实现方式:1. 双机热备双机热备是最基本的双活容灾方案。
在双机热备方案中,主服务器和备份服务器配置相同的硬件和软件环境,业务数据实时同步到备份服务器上。
当主服务器发生故障时,备份服务器会立即接管主服务器的角色,并继续处理业务请求。
这种方案实现简单,容易理解和管理,但成本相对较高。
2. Active-Standby 方案在 Active-Standby 方案中,主服务器和备份服务器处于待命状态,只有主服务器处于活动状态处理业务请求。
备份服务器实时同步主服务器上的数据和状态,并且可以接收来自主服务器的心跳检测,以便在主服务器故障时及时接替其角色。
这种方案灵活性较高,可以根据实际业务需求进行配置和调整。
3. Active-Active 方案Active-Active 方案是一种更为复杂的双活容灾方案。
在这种方案中,同时存在两个主服务器,每个主服务器都能够独立地处理业务请求。
主服务器之间实时同步数据和状态,从而实现业务的高可用性和负载均衡。
这种方案适用于对性能和吞吐量要求较高的业务场景,但也需要更复杂的配置和管理。
应用场景双活容灾方案适用于对业务连续性要求较高的场景,尤其是关键业务系统和在线服务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
What
▪ ▪
项目规划 容灾需求
3
Why
▪ 问题与困难
来源于:某医疗保险项目背景
客户需求与提炼
本地、同城双活
关键数据库要求实时保持跨数据中 心完全一致
部署负载均衡设备和中间件实现跨 数据中心业务访问均衡和双活
即使单数据中心整体故障,业务不 能中断,数据不能丢失
RPO=0 RTO=0
是否需要数据迁移和网络改造, 业务部署时的中断时间的考虑
来源于:国内某项目现网环境
人力资 源管理
系统
应用类型
Oracle 11g Oracle 11g Oracle 11g Oracle 11g Oracle 11g
Oracle 11g
日数据变化量
容灾数据 量 (TB)
100M 800M 200M 100M 2000M
4000GB 2000GB 500GB 2500GB
根据前期客户需求信息确定该客户是否需要双活数据中心解决方案。 双活数据中心解决方案部署基本要求:
数据库和业务系统支持部署跨数据中心的双活 两个数据中心间的链路环境和距离支持部署双活数据中心解决方案,
Oracle RAC环境目前支持100km(链路距离) 如果数据中心间级联裸光纤链路少于4对,或者链路距离超过25km
来源于:某项目兼容性确认单
数据库
• • • • • •
操作系统
• • • • • •
应用程序
• • • • •
虚拟机
• • • •
文件类型及格式
• • • • • •
操作系统
操作系统版本
操作系统具体信 息
VMware
VMware
5.5
vSphere 5.5标准
版
Linux
2.6.32
Red Hat release 6.4
双活数据中心解决方案设计方法论
I(Investigation)
项目背景调研 调
客户需求与提炼
现网环境收集 研
D(Design)
兼容性确认)
设
容量计算和存储设计
双活链路设计
计
组网设计
业务规划设计
一、项目信息调研三要素
项目背景
客户需求与 提炼
现网环境收集
项目背景
1
Who
▪ 客户行业 ▪ 主要业务 ▪ 行业地位
需要收集 四类信息
网络信息
网络拓扑 数据中心间裸光纤情况
数据量
各数据类型大小 数据量总量大小 数据增量大小
现网环境收集
网络信息
网络拓扑 数据中心间裸光纤情况
物理环境信息
服务器型号及数目 生产存储型号及数目 交换机型号、数量
(双冗余)
IP交换机
主存储
光纤交换机
站点信息
数据中心1
数据中心2
对于需要接管的友商存储,查看VIS设备的兼容性列表,如果不在兼容 性列表,方案不能支持。
容灾容量计算
目前需要实施双活的生产容量
判断数据中心1是否需要扩容
确定数据中心2存储规划
收集当前用户 需要实施双活 的所有LUN的 规划和配置信 息,比如LUN 容量和RAID配 置。
建议客户针对 当前存储容量 进行扩容,保 证扩容后存储 满足未来3-5 年数据增量。 如果为接管友 商异构存储, 建议在数据中 心1扩容一台 新的华为存储。
windows
2008
Windows 2008 enterprise
数据库
Oracle SQL Server
数据库版本信 息
11.2 10
现网环境收集
例 站点
业务类 型
数据量
各数据类型大小 数据量总量大小 数据增量大小
资产财 务一体 化平台 综合数
据库 业务管 理系统 生产站点 电子商
务
OA
设备名称
主存储
服务器
交换机 FC交换机
主存储 服务器 交换机 FC交换机
数目(个)
型号
1
1台XX,软件版本:xxx
18
18台XX,HBA卡xxx
2
2台XX 10GE交换机
2
2台xx,8GB光模块*24
0
0
0
0
现网环境收集
例
业务系统
业务系统现部署方式 数据库版本及部署方式 虚拟化版本及部署方式
(光模块支持的光传输距离),需要部署波分设备 如果为租用带宽,需要针对带宽进行稳定性和性能测试,确保良好的
链路环境,带宽能满足双活带宽需求
兼容性
需要确认容灾保护对象的操作系统、数据库、存储设备的类型及版 本。
查看数据库集群、操作系统及虚拟化环境,看是否在VIS设备的兼容性 列表中。
查看操作系统是否在OceanStor UltraPath(多路径)的兼容性列表中, 如果不在,但是在VIS设备的兼容性列表中,则只能使用系统自带多路 径。
功能需求 物理机容灾or Oracle使用物理机搭建RAC集群,虚拟机部署32台宿主机 虚拟机容灾? 组成集群。
容灾业务需求 支持任意单点故障、单数据中心整体故障业务零中断
性能需求
关键应用保护 容灾目标
容灾部署影响
支持Oracle, Oracle RAC数据 库,VMware,FusionSphere,SQL Server的双活保护 RTO =0, RPO =0
容灾部署停机<24小时
运维需求
统一管理 便捷管理 状态监控
管理软件能够管理服务器、存储 支持可视化拓扑图和可视化管理 自动健康巡检、状态实时告警
现网信息收集
物理环境信息
服务器型号及数目 生产存储型号及数目 交换机型号、数量
业务系统
业务系统现部署方式 数据库版本及部署方式 虚拟化版本及部署方式
部署双活后业务性能要求
定期设备远 程巡检
快速设备告 警上报
设备状态管
理. . .
可视化展示和存 储层双活状态监
自主可控要求 ...
客户需求与提炼
例
来源于: 国内XX保险项目需求
需求类型
需求项
需求描述
容灾模式 1:1双活容灾,2个生产站点,双活模式。 容灾距离 同城距离(20km左右) 存储兼容异构? 现网有IBM存储,需要兼容友商存储
第六章 双活容灾解决方 案
目标
学习完本章节后,您将能够:
掌握双活数据中心解决方案如何做项目信息调研 掌握双活数据中心解决方案的方案设计 掌握双活数据中心解决方案部署 掌握双活数据中心解决方案容灾操作
目录
1. 项目信息调研 2. 方案设计 3. 华为VIS 6600T产品介绍 4. 双活数据中心解决方案部署
1TB
200M
1TB
目录
1. 项目信息调研 2. 方案设计 3. 华为VIS 6600T产品介绍 4. 双活数据中心解决方案部署
方案设计“五步法”
设计步骤
Design
Step1
双活可行性 分析
Step2 兼容性确认
Step3
存储容量和带 宽计算
Step4 组网设计
Step5 业务规划
双活可行性分析