HC1209306-HCNP V3.0 第六章 双活容灾解决方案
双活数据中心与灾备解决方案

二级应用
三级应用
数据可用性成本
系统可用性成本
一级应用
恢复业务所需时间
RTO
0
时间轴
成本轴
25
类别
关键应用,核心应用
二三级应用
非生产应用
解决方案
双活数据中心
虚拟机复制
灾备切换调度
虚拟机复制
数据保护
SLA
RPO=0
RTO<15分钟
RPO<15分钟
RTO<4小时
RPO<1小时
RTO<24小时
应用场景
BC,DA,DR
二三级应用
开发/测试
数据库
教学/科研
同城双活
异地灾备
两地三中心
数据中心迁移
异地灾备
15
需求条件通过二层或三层IP网络连接两个数据中心采用基于vSphere或阵列的复制技术vSphere内置复制功能免费,RPO=15分钟-24小时,文件级一致性,虚拟机级别颗粒度支持异构存储,vCenter直接管理阵列复制功能由合作伙伴提供,需额外购买支持同步或异步复制,应用级一致性,LUN级别颗粒度应用一致性:Oracle DataGuard, SQL Always On, Exchange DAGVMware相关产品与服务vSphere Ent+VSANvCenter Site Recovery Manager
vSphere
生产站点
服务器
阵列
复制
vSphere复制
vSphere
灾备站点
服务器
主备式切换
双活切换
双向切换
双活数据中心
Recovery
Recovery
Production
容灾解决方案

容灾解决方案容灾解决方案引言容灾(Disaster Recovery)是指在不可抗力因素引发的各类灾害中,通过可靠的技术手段,确保系统能够在最短时间内恢复正常运行,提供连续、稳定的服务。
容灾解决方案是实现容灾目标的具体实施方案,本文将介绍容灾解决方案的基本原则和常用技术手段。
容灾解决方案的基本原则在制定容灾解决方案时,需要遵循以下几个基本原则:1. 可靠性:容灾解决方案必须基于可靠的技术手段,确保系统能够在发生灾害时保持运行,并尽快恢复正常。
2. 可行性:容灾解决方案必须是可行的,在技术和经济上都能够被接受和实现。
3. 可扩展性:容灾解决方案应该具备良好的可扩展性,能够适应系统规模和业务变化带来的需求变化。
4. 高效性:容灾解决方案应尽可能地减小数据和服务的恢复时间,提供快速的灾难恢复能力。
常用的容灾技术手段数据备份与恢复数据备份与恢复是最基本、最常用的容灾技术手段之一。
通过定期备份关键数据,并将备份数据存储在不同地点的独立存储设备上,可以在数据丢失或遭受灾害时,快速恢复数据。
常见的数据备份与恢复技术包括:- 磁盘备份:将数据备份到磁盘设备中,可以实现快速的数据恢复。
- 磁带备份:将数据备份到磁带中,可以实现大规模数据的存储和长期保存。
高可用集群高可用集群是通过将多台服务器组成一个集群,提供冗余的硬件和软件环境,实现系统和数据的高可用性。
常见的高可用集群技术包括:- 主备切换:将主服务器的功能实时切换到备份服务器上,确保在主服务器故障时,系统能够快速恢复。
- 负载均衡:将用户请求均衡地分配到集群中的每个服务器上,提高系统的并发处理能力。
跨机房部署跨机房部署是通过在不同地理位置的机房中部署相同的系统和应用,实现系统和数据的分布式存储和备份,提高系统的容灾能力。
常见的跨机房部署技术包括:- 多活部署:在多个机房中部署相同的系统和应用,通过数据同步和负载均衡,实现系统的并发访问和容灾恢复。
- 异地多中心部署:在不同的地理位置建立多个数据中心,通过数据同步和延迟恢复,提供更高级别的容灾和灾难恢复能力。
双活数据中心解决方案操作与部署

生产阵列配置
创建主机(此处主机为VIS,为每个VIS控制器创建一个主机,并添加该控制 器的2个启动器到该主机)
Page 20
生产阵列配置
创建主机组(主机组是主机的集合,此处为所有VIS集群的主机,如果4节点 VIS集群则包含4个主机)
Page 21
生产阵列配置
创建映射视图(将LUN组与主机组建立映射关系)
Page 10
FC交换机配置
设置Domain ID:1、 切换为高级模式,2、Disable Switch->Apply,3、 填入Domain ID,4、Apply
Page 11
FC交换机配置
配置Zone:1、Create New Zone,2、从右侧将端口选入右侧,3、Save Config,4、Enable Config
FCSW 4
任务2:划分Zone
定义 Zone是指特定的交换机和设备能够进行通信的区域。通过FC交换 机跨数据中心级联和划分Zone的方式实现VIS6600T与存储阵列、 VIS6600T与应用主机以及VIS6600T节点间的链路互不干扰。
任务3:配置链路长距离模式端口
当链路用于长距离模式时,为该链路配置长距离端口。双活数据 中心解决方案中使用的每个FC端口都需要完成此配置。
Page 2
目录
1. 双活数据中心解决方案架构
2. 双活数据中心解决方案组网
3. 双活数据中心解决方案部署
Page 3
端到端双活数据中心解决方案架构
•GSLB:数据中心间负载均衡 •SLB:数据中心内负载 •中间件部署在虚拟机或者物理 机上 •Oracle或者其它数据库部署为 跨数据中心集群,共享磁盘由 VIS集群提供 •VIS部署为跨数据中心集群 •FC交换机冗余部署,跨数据中 心两两级联 •存储阵列将LUN映射给VIS集群 •波分设备实现跨数据中心的数 据传输(距离超过光模块传输距 离或者裸光纤数量不够时使用波 分) •第三方仲裁站点提供VIS集群的 仲裁盘
双活数据中心解决方案-通用

双活数据中心解决方案-通用1·引言在现代信息化时代,数据中心的高可用性和可靠性成为各个行业组织所追求的目标。
为了实现数据中心的高可用性,双活数据中心解决方案被广泛采用。
本文将介绍双活数据中心解决方案的通用架构和实施步骤。
2·概述2·1 解决方案概述双活数据中心解决方案是通过在两个地理位置相距较远的数据中心之间进行数据实时同步,以确保当一个数据中心发生故障时,另一个数据中心可以无缝接替其工作,保证业务系统的连续性运行。
2·2 设计目标双活数据中心解决方案的设计目标包括:●提供连续性的业务运行。
●最小化数据中心之间的数据同步延迟。
●最大化数据恢复速度。
●确保数据的一致性。
3·架构设计3·1 主备数据中心双活数据中心解决方案通常由一个主数据中心和一个备份数据中心组成。
主数据中心负责处理实时业务请求,备份数据中心作为主数据中心的镜像,并负责处理当主数据中心故障时的业务请求。
3·2 数据同步机制为了实现数据中心间的实时数据同步,双活数据中心解决方案通常采用以下机制:●数据异步复制。
●数据同步模式。
●数据冲突解决策略。
4·实施步骤4·1 前期准备在实施双活数据中心解决方案之前,需要进行以下准备工作:●确定主备数据中心的位置和网络架构。
●评估主备数据中心之间的网络带宽和延迟。
●确定数据同步机制和数据冲突解决策略。
4·2 网络连接实施双活数据中心解决方案需要建立可靠的网络连接,确保主备数据中心之间的数据实时同步。
4·3 数据同步配置配置数据同步机制,并根据实际需求进行性能调优和容错配置。
4·4 故障切换测试在实施双活数据中心解决方案之后,需要进行故障切换测试,确保备份数据中心能够无缝接替主数据中心的工作。
4·5 系统监控和运维建立有效的系统监控和运维机制,对主备数据中心进行实时监控,并定期进行数据中心切换和巡检。
h3c容灾解决方案

银行灾备中心建设,以应用容灾为核心,以业务持续性为重点,实现平安生产与运营。在容灾能力上,两地三中心是当前最好的容灾模式,能够最大程度的爱惜数据和业务持续性,应付重大区域性灾难。 在容灾方式上,主数据中心的关键业务数据实施同步到同城灾备中心,即一笔数据写入会在两个数据中心同时写入后返回,保证同城两中心数据的完全一致性;本地数据写入完成后,再由主数据中心或同城灾备中心异步将数据复制到远程的异地灾备中心。
上图中,Oracle数据库效劳器通过冗余FC SAN访问浪潮光纤磁盘阵列AS1000G2,AS1000G2可与另一台AS1000之间实现数据镜像,从而取得了数据的多个副本,数据的平安得以保证。而其它应用效劳器那么通过IP网络将数据存储在浪潮AS1000N网络存储中,AS1000N支持万兆网络连接,最多可支持10个千兆网络接口
2 银行容灾的行业监管
为了标准金融银行容灾备份和灾备中心的建设,人民银行在XX年提出要求:全国各商业银行在1~2年内数据灾难备份标准达到2~3级,在各银行完成数据集中后的2年内灾难备份标准必需达到5~6级。参考国际上相关组织在灾难恢复上的研究与实践,我国的国家标准《GB20988-XX-T 信息平安技术 信息系统灾难恢复标准》对容灾备份进行了标准化。
在运营方式上,多个中心之间能够在平常进行业务分担,也能够实现彼此完全业务互备,而后端实现数据同步。
篇二:数据中心的存储与容灾建设解决方案
数据中心的存储与容灾建设解决方案 [导读] 从数据的组织方式来看,数据中心的数据可分为文档数据和数据库数据。通常数据库中的数据是核心数据库治理系统产生的数据,其数据量不是专门大,但重要性超级高,而且其随机读写的访问方式关于存储系统的性能要求很高。
目前大多数的容灾系统都超级复杂而且投资昂贵,是不是所有数据中心的容灾都必需是这种模式呢?其实,很多用户的容灾需求是很简单的,确实是在碰到不可测的灾难时能够取得一份平安靠得住的数据副本,就能够够依照策略慢慢恢复用户数据和应用,利用浪潮的网络存储AS1000N就能够够实现这种简单而经济靠得住的数据容灾方案,如以下图所示:
双活数据中心技术架构解决方案

HA模式 线性拆分模式
双活模式 分布式集群模式
数据层双活技术比较
物理库 内存库
技术种类
技术特征
数据一致性
双活读 写
数据延迟
可维护性
可靠性
适用模式
基于数据逻 DSG、gg、 辑 复制软件 shareplex等
逻辑错误会 导 致不一致 ,无 法稽核
支持 支持
较差 较差
支持异构
成本较低
支持异构
较高
组网复杂,可靠 性 差,数据同步 性能 差
基于存储卷镜像 (存储自身虚拟 化
HDS GAD Huawei OceanStor V3
RPO=0
支持
较好 RTO=0
不支持
组网简单,维护
较低
方 便,但技术较
新, 实用经验少
基亍存储HA机制
IBM powerHA HyperSwap 、 日立的 HAM
1、故障下需要定位+决策+ 切换流程,超过0.5小时 2、劢态资源管理技术,容灾 资源闲置
3、 SRDF、PPRC等技术
传统方案:“主备”模式或“互备”双中心模式
两个中心平时均可承担业 务,同时对外服务,坏掉 任何一方丌影响。
“双活并行处理”模式,做到准0切换
双活应用架构
接入层:借劣DNS、全局负载均衡 等技术实现双活接入和智能路由, 流量调配
− DNS、全局负载均衡等 − 智能路由,流量调配
− 数据层连接自劢重连
− Ebus服务总线,分布式集 群架构
数据层
数据库层 技术改造
− 如Oracle extend rac − 分布式内存库
双活数据中心及灾备解决方案技术部分

NSX利用层叠网络实现双活数据中心
站点A
三层 网络
站点A 边界网关
上联网络A
VM1
VM 2
vCenter Server
分布式逻辑路由器
逻辑交换机A 172.16.10.0/24
VM
4
逻辑交换机B
172.16.20.0/24
数据存储1
which also aligns with vMotion using Enterprise Plus
• vMSC enables disaster avoidance and basic Disaster Recovery (without the orchestration or testing
• VMotion an数d S据to保ra护ge VMotion
• 高效的数据备份与恢复 • 可通过运行计划与脚本实现自动化操作
灾难恢复
• 基于虚拟化层的异步复制 • 基于硬件设备的同异步复制 • 自动化应用切换管理 • 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
9
Fault Tolerance vs. High Availability
• Fault tolerance
– Ability to recover from component loss – Example: Hard drive failure
• High avail percentage in one year 99 99.9 99.99 99.999 “five nines”
Downtime in one year 3.65 days 8.76 hours 52 minutes 5 minutes
阵列双活容灾解决方案

按业务粒度仲裁— 一致性组仲裁
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
通用方案
站点A
站点B
服务器 优先站点
服务器
按业务粒度仲裁
站点A
站点B
服务器
服务器
ERP一致性组 CRM一致性组 OA 一致性组 We b 一致性组
可视化
全局拓扑、集中告警 自动化,一键式容灾演练、恢复
本地高可用解决方案
方案架构
V
V
V
M
M
M
V
V
V
M
M
M
Other
SAN
Hu a we i
亮点
业务级高可靠
业务0中断 数据0丢失
课程目录
为什么要做容灾? 华为容灾解决方案OverVie w 华为阵列双活解决方案解析 华为阵列双活竞争分析 案 例分享
华为容灾解决方案全景图
本地高可用方案
本地高可用解决方案
同城容灾方案
双活数据中心解决方案 主备容灾解决方案
异地容灾方案
两地三中心容灾解决方案 主备容灾解决方案
≤1 0 0 km
>1 0 0 km
本地生产中心
同城容灾中心
异地容灾中心
双活数据中心解决方案
方案架构
生产中心1
VVV M MM
VVV MMM
HyperMetro 仲裁设计-仲裁部署方案
仲裁部署
有第三方仲裁站点(推荐)
存储资源池
• 仲裁设备部署在第三方站点,与双活的两个数 据中心处于不同的故障域
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
部署双活后业务性能要求
定期设备远 程巡检
快速设备告 警上报
设备状态管 理. . .
可视化展示和存 储层双活状态监 控
容灾业务报表
认证资质要求 提供原厂服务 自主可控要求 ...
客户需求与提炼
例
来源于: 国内XX保险项目需求
需求类型
需求项
需求描述
容灾模式 1:1双活容灾,2个生产站点,双活模式。 容灾距离 同城距离(20km左右) 存储兼容异构? 现网有IBM存储,需要兼容友商存储
Oracle RAC环境目前支持100km(链路距离) 如果数据中心间级联裸光纤链路少于4对,或者链路距离超过25km
(光模块支持的光传输距离),需要部署波分设备 如果为租用带宽,需要针对带宽进行稳定性和性能测试,确保良好
的链路环境,带宽能满足双活带宽需求
兼容性
需要确认容灾保护对象的操作系统、数据库、存储设备的类型及版 本。
第六章 双活容灾解决方 案
目标
学习完本章节后,您将能够: 掌握双活数据中心解决方案如何做项目信息调研 掌握双活数据中心解决方案的方案设计 掌握双活数据中心解决方案部署 掌握双活数据中心解决方案容灾操作
目录
1. 项目信息调研 2. 方案设计 3. 华为VIS 6600T产品介绍 4. 双活数据中心解决方案部署
功能需求 物理机容灾or Oracle使用物理机搭建RAC集群,虚拟机部署32台宿主机组 虚拟机容灾? 成集群。
容灾业务需求 支持任意单点故障、单数据中心整体故障业务零中断
性能需求
关键应用保护 容灾目标
容灾部署影响
支持Oracle, Oracle RAC数据库,VMware,FusionSphere,SQL Server的双活保护 RTO =0, RPO =0
需要收集 四类信息
网络信息
网络拓扑 数据中心间裸光纤情况
数据量
各数据类型大小 数据量总量大小 数据增量大小
现网环境收集
网络信息
网络拓扑 数据中心间裸光纤情况
物理环境信息
服务器型号及数目 生产存储型号及数目 交换机型号、数量
(双冗余)
IP交换机
主存储
光纤交换机
站点信息
数据中心1
数据中心2
来源于:某项目兼容性确认单
数据库
• • • • • •
操作系统
• • • • • •
应用程序
• •
• • •
虚拟机
• • • •
文件类型及格式
• • • • • •
操作系统
操作系统版本
操作系统具体信 息
VMware
5.5
VMware vSphere 5.5标准版
Linux
2.6.32
Red Hat release 6.4
数据库 Oracle
数据库版本信 息
11.2
windows
2008
Windows 2008 enterprise
SQL Server
10
现网环境收集
例 站点
业务类 型
数据量
各数据类型大小 数据量总量大小 数据增量大小
资产财 务一体 化平台 综合数
据库 业务管 理系统 生产站点 电子商
务
OA
来源于:国内某项目现网环境
双活数据中心解决方案设计方法论
I(In vest igat 项目背景调研 调
客户需求与提炼
ion) 现网环境收集 研
D(De sign)
兼容性确认)
设
容量计算和存储设计
双活链路设计 组网设计
计
业务规划设计
一、项目信息调研三要素
项目背景
客户需求与 提炼
现网环境收集
项目背景
1
Who
▪ 客户行业 ▪ 主要业务 ▪ 行业地位
2
What
▪ 项目规划 ▪ 容灾需求
3
Why
▪ 问题与困难
来源于:某医疗保险项目背景
客户需求与提炼
本地、同城双活
关键数据库要求实时保持跨数据中 心完全一致
部署负载均衡设备和中间件实现跨 数据中心业务访问均衡和双活
即使单数据中心整体故障,业务不 能中断,数据不能丢失
RPO=0 RTO=0 是否需要数据迁移和网络改造,
1TB
目录
1. 项目信息调研 2. 方案设计 3. 华为VIS 6600T产品介绍 4. 双活数据中心解决方案部署
方案设计“五步法”
设计步骤
Design
Step1
双活可行性 分析
Step2 兼容性确认
Step3
存储容量和带 宽计算
Step4 组网设计
Step5 业务规划
双活可行性分析
根据前期客户需求信息确定该客户是否需要双活数据中心解决方案。 双活数据中心解决方案部署基本要求: 数据库和业务系统支持部署跨数据中心的双活 两个数据中心间的链路环境和距离支持部署双活数据中心解决方案,
设备名称
主存储
服务器
交换机 FC交换机
主存储 服务器 交换机 FC交换机
数目(个)
型号
1
1台XX,软件版本:xxx
18
18台XX,HBA卡xxx
2
2台XX 10GE交换机
22台xxBiblioteka 8GB光模块*2400
0
0
现网环境收集
例
业务系统
业务系统现部署方式 数据库版本及部署方式 虚拟化版本及部署方式
容灾容量计算
目前需要实施双活的生 产容量
收集当前用户 需要实施双活 的所有LUN的 规划和配置信 息,比如LUN 容量和RAID配 置。
判断数据中心1是否需 要扩容
建议客户针对 当前存储容量 进行扩容,保 证扩容后存储 满足未来3-5 年数据增量。 如果为接管友 商异构存储, 建议在数据中 心1扩容一台 新的华为存储。
容灾部署停机<24小时
运维需求
统一管理 便捷管理 状态监控
管理软件能够管理服务器、存储 支持可视化拓扑图和可视化管理 自动健康巡检、状态实时告警
现网信息收集
物理环境信息
服务器型号及数目 生产存储型号及数目 交换机型号、数量
业务系统
业务系统现部署方式 数据库版本及部署方式 虚拟化版本及部署方式
查看数据库集群、操作系统及虚拟化环境,看是否在VIS设备的兼 容性列表中。
查看操作系统是否在OceanStor UltraPath(多路径)的兼容性列 表中,如果不在,但是在VIS设备的兼容性列表中,则只能使用系 统自带多路径。
对于需要接管的友商存储,查看VIS设备的兼容性列表,如果不在 兼容性列表,方案不能支持。
人力资 源管理
系统
应用类型
Oracle 11g Oracle 11g Oracle 11g Oracle 11g Oracle 11g
Oracle 11g
日数据变化量
容灾数据 量 (TB)
100M 800M 200M 100M 2000M
4000GB 2000GB 500GB 2500GB
1TB
200M