两地三中心-灾备解决方案
两地三中心容灾专项方案

Xx项目存放方案介绍目录1.现状综述 (4)2.总体建设方案 (4)2.1.建设原则和策略 (4)2.1.1.建设原则 (4)2.1.2.建设策略 (5)2.2.建设目标 (7)2.2.1.总体目标 (7)2.2.2.分期目标 (7)2.3.建设内容 (7)2.4.总体设计方案 (8)3.容灾的核心技术及选择 (9)3.1.容灾系统衡量指标 (9)3.2.容灾级别 (10)3.3.常见容灾建设模式 (11)3.3.1.同城容灾 (11)3.3.2.异地容灾 (11)3.3.3.两地三中心 (11)3.3.4.双活数据中心 (11)3.4.常用的数据复制技术 (12)3.4.1.基于存储层的容灾复制方案 (13)3.4.2.基于主机数据复制技术的灾备方案 (19)3.4.3.基于数据库的数据复制技术构建灾备方案 (20)3.5.如何选择最优的容灾方案 (28)3.5.1.数据容灾技术选择原理 (28)3.5.2.数据容灾技术选择度量标准 (29)3.6.本项目容灾模式及技术的选择 (29)3.6.1.容灾模式选择 (29)3.6.2.容灾中心选址 (30)3.6.3.数据复制技术的选择 (32)4.推荐方案概述 (33)4.1.技术路线选择 (33)4.2.总体方案架构 (33)4.3.数据库容灾系统设计 (35)4.3.1.Golden Gate技术原理 (36)4.3.2.各委办局和同城容灾中心之间的数据库复制 (37)4.3.3.同城容灾中心和异地容灾中心之间的数据库复制 (40)4.4.非结构化数据容灾系统设计 (40)4.4.1.同城容灾中心和生产中心之间的数据容灾 (41)4.4.2.同城容灾中心和远程容灾中心的数据容灾 (43)4.4.3.应用级容灾几种实现方式 (44)4.5.一体化集中备份系统 (45)4.6.容灾网络建设方案设计 (46)4.6.1.整体容灾网络架构设计 (46)4.6.2.前端服务网络容灾方案 (47)4.6.3.服务器数据网络容灾方案 (49)4.6.4.存储网络容灾方案 (50)4.6.5.本项目建议容灾网络方案 (51)5.本项目灾备系统建设的几点建议 (52)5.1.需要按照灾备要求梳理系统 (52)5.2.解决好数据库系统数据复制 (52)5.3.“现实”的切换策略 (53)6.软硬件设计 (54)6.1.软硬件总体选型原则 (54)6.2.同城容灾中心软硬件设计 (55)6.2.1.一体化备份系统 (55)6.2.2.数据库容灾系统 (56)6.2.3.云计算平台容灾系统 (57)6.2.4.同城数据存储容灾系统 (58)6.2.5.机房改造系统 (58)6.2.6.网络系统 (60)6.2.7.安全系统 (60)6.2.8.详细软硬件配置清单 (60)6.3.远程容灾中心软硬件设计 (63)6.3.1.远程数据备份系统 (63)6.3.2.远程数据库容灾系统 (64)6.3.3.远程云计算平台容灾系统 (65)6.3.4.远程数据存储容灾系统 (66)6.3.5.网络系统 (66)6.3.6.安全系统 (66)6.3.7.详细软硬件配置清单 (66)7.项目组织机构和人员培训 (68)7.1.领导和管理机构 (68)7.2.项目实施机构 (70)7.3.运行维护机构 (70)7.4.技术力量和人员配置 (71)7.5.人员培训方案 (71)8.项目实施进度 (72)8.1.项目建设期 (72)8.2.实施进度计划 (72)8.2.1.同城容灾中心建设计划 (72)8.2.2.异地容灾中心建设计划 (73)9.投资估算 (75)9.1.投资估算的说明 (75)9.2.投资估算 (75)9.3.估算编制依据 (76)9.4.资金来源与落实 (76)9.5.投资估算明细表11.现实状况综述XX市政府网站管理中心自成立之日起, 就根据集中建设标准完成了“XX市电子政务外网统一平台示范工程项目”建设工作, 完成了XX市124家党政部门接入工作, 完成了在全市范围内只铺设一套网络基础设施工作, 实现了市及电子政务外网和省、国家政务外网之间互联互通, 现在共有服务器500多台, 存放40多套, 布署虚拟服务器300多台。
金融行业两地三中心解决方案

用户容灾至同城云端灾备中心的架构
用户C 用户B 用户A
云
OS OS OS OS OS OS
私有云/托 管私有云
OS OS OS OS
共享服务器 组.
云灾备.云备份 1.实时数据复制 2.可独立、可共享 3.任意历史点恢复 4.部署简单,易于应用
用户容灾至同城云端灾备中心的架构
用户C 用户B 用户A
实时数据灾备
• 实时传输,字节级增量方式 • 和存储无关,支持异构存储 • 在线复制/在线备份 • 针对卷,目录或单个文件 • 海量小文件高性能传输处理 • NFS文件系统支持 • 无距离限制且对主机影响小 • 应用无关/全面支持 • 保证数据库一致性 • 数据压缩加密传输 • 图形化监控和管理
ELML ELMD
6
可扩展设备的 IDC机柜空间
7
金融数据天地 互备
8
驻场运维人员 办公坐席
金融行业客户需求解决
解决方案 | SOLUITONS
互金
Internet Finance
银行
Bank
证券
Stock
保险
Insurance
金融行业VIP专属区域
运营商传输设备预留 支持金融行业高密设备高电
金融级IDC SLA保障 5 MIN运维响应服务
活动灾备中心-同城模式
SITE
A
Synchronous Paths
600 Feet
• 很高的灾备恢复指标(RTO,RPO) • 主数据中心承担100%的生产负荷,同时数据镜像到灾备中心(可以演变为同城双活中心) • 无法预防同城级别的灾难 • 每个中心都需要定期进行演练
SITE
B
活动灾备中心-同城模式
光大银行打造“两地三中心、大同城小异地”灾备模式

光大银行打造“两地三中心、大同城小异地”灾备模式作者:史晨阳来源:《中国金融电脑》 2016年第1期光大银行始终高度重视信息科技应急工作,以业务优先恢复为应急首要原则,自2002 年在金融业率先实现“同城双活网络”开始,光大银行已逐步建成有光大特色、符合监管要求与国际通用准则的“两地三中心”灾备体系。
本文从灾备体系总体规划、运维管理经验、特点与问题以及下一步建设与管理构想等四个方面介绍光大银行灾备建设经验。
一、“两地三中心”灾备体系总体规划架构光大银行根据自身特点采用了“大同城,小异地”策略来建立“两地三中心”灾备体系。
“大同城”指以双活模式构建两个同城数据中心,通过部署必要的软硬件设备,使所有系统在两个中心都拥有相同处理能力,通过EMC SRDF 存储同步技术,实现生产数据在两个中心之间的实时同步。
两中心共同担负日常生产任务,一个中心可独立承载全部业务,既可防范机房等建筑物级别的风险,又增强同城中心日常生产容量弹性。
“小异地”指当发生地域性灾难时,以保障银行关键业务在重要渠道持续开展、对全行生产数据进行保护为目的而建立的异地灾备数据中心。
生产中心位于北京上地,同城酒仙桥灾备中心距离生产中心约21 公里。
同城灾备中心一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。
异地灾备中心位于武汉,距北京生产中心约1150千米,用于防范战争、地震、水灾等区域性灾难。
上地生产中心为自有机房,酒仙桥和武汉灾备中心采用场地外包、自主运维模式(光大银行两地三中心灾备体系整体架构如图1 所示)。
在灾备网络建设上,光大银行现有网络中采用的是双星型结构。
以同城主、备两个数据中心为两个核心节点,两个核心节点间由高速链路(DWDM)连接。
灾备中心与原有的2 个数据中心形成两地三中心的网络结构,通过灾备中心的建立形成三个数据中心的结构。
各分行通过三条链路分别上连至上地数据中心、酒仙桥数据中心和武汉灾备中心。
两地三中心容灾解决方案

两地三中心容灾解决方案2010-12-26目录1“两地三中心”容灾系统建设的功能目标 (3)2两地三中心”容灾系统技术方案 (4)2.1总体设计方案 (4)2.2容灾方案实现 (5)2.2.1同城应用级容灾方案 (5)2.2.2异地数据级灾备方案 (6)3基于SHAREPLEX的容灾方案 (7)3.1S HARE P LEX FOR O RACLE产品介绍 (7)3.2S HAREPLEX主要技术指标 (8)4成功案例 (10)4.1银联数据 (10)4.2山西移动 (12)4.3北京地税 (15)4.4S HARE P LEX国内部分客户 (18)1 “两地三中心”容灾系统建设的功能目标理想目标:在确保系统稳定安全的前提下,颠覆“切换时长、数据丢失,平时不用、浪费投资,决策困难、影响巨大,演练复杂、风险增加”的传统“灾备”模式,创建全新“容灾”理念,使新增投资平时发挥生产效力、实现容纳各种灾难、确保业务连续和数据安全的崭新模式。
同城应用级容灾:覆盖能被客户直接感知的各类业务,平时与主机房同时运行,负载均衡使用,可分担各查询业务流量。
当容灾机房或主机房任何一处出现灾难造成的非计划内停机,则另一个机房都能在保证不丢失数据的前提下,继续对外提供同样的服务,对业务或对客户的感觉影响极低。
异地容灾;异地容灾机房,存放一台存储设备和一台核心业务验证服务器,异步存储数据,容许0-15分钟数据丢失。
发生城市级灾难时仍可以有效恢复生产系统核心数据和,。
最终实际目标:以系统稳定、安全、高效为基本前提,经严格论证和实测,可以逐步退守,直至实现一定投资下“高可用性和高安全性”的平衡。
容灾系统将能够应对下述的灾难和风险,确保数据安全性和业务连续性:灾难发生的百分比统计电源问题硬件、软件、程序故障机房其它基础设施故障系统设计失误小失误/故障长期累加人为操作失误或渎职蓄意破坏/病毒/黑客网络/线路故障技术失败大规模自然灾害其它0102030405060708090100Number of Declarations2 两地三中心”容灾系统技术方案2.1 总体设计方案生产系统的容灾系统拟建成“两地三中心“模式。
面向“两地三中心”的银行灾备系统设计及实现

2 R O目标 。 P ] 复点 目标 , . P R ON恢 是指业 务系统
所允许 的在灾难过 程中的最大数 据丢失量, 用来衡量 容灾 系统的数据冗余备 份能力。 据国家标准及 同业 根
经验 , 确定银 行灾备系统 R O指标为 : P 同城 灾备 中心
务运转的快速恢复 , 保证业务连续性。 灾备系统运营模 式采用生产中心, 同城 灾备中心和异地灾备中心组成的
“ 地 三 中心” 式 。 两 模
RO T, P 和R O 可对应于 《 信息系统灾难恢复规范》 所规 定的灾备系统等级 ; 灾备拥有成本 , 一般包 括首次技术手段 , 具体包括备份 、 复制 、 镜像 、 集群 、 虚拟化
1灾备实现方式的选择。 . 当前灾备领域 “ 两地三中 心” 灾备模式 中主流的灾备方案存储级灾备和数据库级 灾备2 存储级灾备是通过对存放在线交易数据的存 种。
储设备物理磁 盘进行复制来实现数据的同城和异地传 输, 数据库级 灾备是 通过对数 据库变化 进行复制来实 现容灾 目 。 种方式的优缺点比较见表1 标 2 所列。 表 1炙备实现 方式比较
目
服
务一
一
■ 中国农业 发 展 银行 总行
李 小庆
核心业 务系统作为银行机构 中最为关键 的生产系 统, 其安全性 直接关 系到银行、 客户甚至国家的切身利 益, 更关系到银行的服务形象 , 如果遭受灾难 , 无法及 时恢 复数据和业务, 后果将不堪设 想。 因此 , 如何通过 管理 和技术提供系统7 2 / 时的高可用性 , x 4i x 增强系统 抵抗各种风险和灾难 的能力, 保障业 务的持续运作 , 已 经成 为银行信息化建设中必须实现 的任务。 要想确保银行业务系统的连续性, 须建设一套 必 容灾备 份系统 , 保证在 灾难发生时业务数 据不会发生 丢失 , 业务能够连续 进行处理 。 基于业 务保 障与数据 安全的考虑 , 业务连续性 除了需要保护数据之外, 还需 要主机 、 网络系统有完全 的备份和保护措施 , 在容灾 中
两地三中心容灾方案

(4)制定详细的容灾预案和操作手册;
(5)组织培训,提高相关人员操作技能。
2.验收标准
(1)数据同步:确保数据一致性、完整性和可靠性;
(2)灾备切换:确保业务无中断,数据不丢失;
(3)容灾环境:确保设备、软件、网络等资源满足业务需求;
(4)操作手册:确保预案和操作手册的完整性和实用性。
二、方案概述
两地三中心容灾方案是指在两个地理位置相隔一定距离的城市分别建立生产中心、同城灾备中心和异地灾备中心。其中,生产中心负责日常业务运行,同城灾备中心用于应对同城范围内的灾害,异地灾备中心用于应对跨城市的灾害。通过数据同步、应用切换等技术手段,实现业务系统的快速恢复和持续运行。
三、方案设计
1.数据同步
(3)切换过程应遵循以下原则:
a.先切换核心业务,再切换非核心业务;
b.优先保障关键业务的恢复;
c.切换过程中,确保用户无感知或感知最小。
3.灾备中心设
(1)同城灾备中心:
a.建立在距离生产中心一定距离的城市,避免因同城灾害影响生产中心和灾备中心;
b.设备配置与生产中心相同,具备足够的计算、存储和网络资源;
两地三中心容灾方案
第1篇
两地三中心容灾方案
一、背景与目的
随着信息化建设的不断深入,信息系统已成为企业、政府部门日常运营的重要支撑。然而,信息系统在带来便捷与高效的同时,也面临着诸多潜在风险,如自然灾害、系统故障等。为保障信息系统稳定、安全运行,降低因灾害导致的业务中断风险,提高业务连续性,特制定本两地三中心容灾方案。
5.加强对运维人员的培训,提高其技能水平。
六、总结
本两地三中心容灾方案旨在为企业、政府部门提供一种高效、可靠的容灾解决方案。通过数据同步、应用切换等技术手段,实现业务系统的快速恢复和持续运行,降低因灾害导致的业务中断风险。在实施过程中,需关注数据一致性、应用切换、容灾环境建设等方面,确保方案的顺利实施和验收。同时,加强运维管理,提高应对灾害的能力,为业务连续性提供有力保障。
两地三中心灾备解决方案

03
两地三中心灾备解决方案 的核心技术
容灾技术
01
02
03
容灾备份中心建设
建立容灾备份中心,确保 在发生灾难时,重要数据 能够迅速恢复。
数据备份与恢复
制定完善的数据备份与恢 复策略,保证数据的完整 性和可靠性。
业务连续性规划
对业务系统进行连续性规 划,确保在灾难发生时, 关键业务能够迅速恢复。
备份技术
总结词
互联网行业是数字化程度最高的行业之一,对数据的 安全性和可靠性也有着极高的要求,两地三中心灾备 解决方案为互联网行业提供了全面的数据备份和恢复 保障。
详细描述
互联网行业的数据量巨大,对数据的安全性和可靠性要 求极高。两地三中心灾备解决方案通过在两个地区建立 三个数据中心,实现了数据的实时备份和快速恢复。例 如,某大型互联网公司采用了两地三中心灾备解决方案 ,在主数据中心发生故障时,可以快速切换到备份数据 中心,确保业务的连续性和稳定性。同时,该方案还可 以根据业务需求进行扩展和优化,满足互联网行业不断 增长的数据存储和管理需求。
2. 增强数据安全性: 由于数据在两个地理 位置都有备份,因此 可以有效地防止数据 丢失和灾难性事件的 发生。
3. 可扩展性强:两地 三中心灾备解决方案 可以随着业务的发展 ,灵活扩展数据中心 的规模和容量。
4. 降低运营成本:通 过将数据备份到离用 户更近的数据中心, 可以减少网络延迟, 提高数据传输速度, 从而降低运营成本。
02
两地三中心灾备解决方案 概述
定义与特点
两地三中心灾备解决方案是一种高可用性、高可 扩展性的灾备方案,它通过在两个不同的地理位 置建设三个数据中心,实现数据的实时同步和互 备份。这种方案具有以下特点
广西政务云“两地三中心”多服务灾

第23期2022年12月无线互联科技Wireless Internet TechnologyNo.23December,2022作者简介:韦宇星(1989 ),男,广西柳州人,工程师,本科;研究方向:政务云,网络安全㊂广西政务云 两地三中心 多服务灾备设计与实现韦宇星(广西壮族自治区信息中心,广西㊀南宁㊀530000)摘㊀要:针对壮美广西㊃政务云已有的本地灾备模式单一㊁容灾能力弱的情况,相关部门开展了 两地三中心 灾备体系的建设㊂文章介绍了壮美广西㊃政务云基于 两地三中心 的容灾目标和灾备服务能力,探索和实践了异构云平台搭建㊁节级复制技术在政务云灾备体系中的应用,从技术路线选型㊁技术实施㊁创新点㊁应用成效讨论了壮美广西政务云灾备体系的建设内容和效果,实现了政务云上数据资源的同城和异地灾备,全面提升了信息系统的数据安全㊂关键词:政务云;两地三中心;灾备0㊀引言㊀㊀壮美广西㊃政务云于2019年3月基本建成,建设有互联网区和公用网络区的独立云平台㊂政务云在规划建设之初,仅规划建设本地备份系统,实现对政务云上的数据本地备份,主要向自治区级政务部门提供统一的IAAS 层政务云资源服务,随着广西政务数据资源管理与改革的推进,现已承载800多个系统㊂壮美广西㊃政务云是广西政务服务开展的重要基础设施,为保证政务云上信息系统的数据可靠,提供多种更安全的数据保护模式,因此开展壮美广西㊃政务云灾备体系的扩展建设十分必要㊂1㊀技术路线选型1.1㊀容灾模式㊀㊀较常见的容灾模式可分为同城容灾㊁异地容灾㊁两地三中心㊁双活中心等模式㊂同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式[1]㊂综合考虑容灾模式的成熟度㊁建设成本等因素,结合自治区级各政务部门提出的具体需求,壮美广西㊃政务云灾备体系架构在原有本地灾备的基础上,构建 两地三中心 模式,建设同城双中心和异地灾备中心㊂1.2㊀技术指标要求㊀㊀壮美广西㊃政务云构建的 两地三中心 模式,RPO /RTO 指标应至少达到以下要求㊂1.2.1㊀同城数据备份与恢复㊀㊀普通业务(等保备案3级系统),同城数据级全备份与恢复,RPO<60s;重要业务(等保备案3级系统),同城数据级持续备份与恢复,RPO<10s [2]㊂1.2.2㊀同城应用切换及发布㊀㊀重要业务(等保备案3级系统),同城基于软件备份的系统恢复与发布服务,RPO<60s;关键业务(等保备案5级系统),同城应用级应急接管与发布服务,RPO<10s㊂1.2.3㊀异地数据备份与恢复㊀㊀全部业务,同城灾备数据异地备份与数据恢复,RPOɤ30min;生产中心本地备份数据异地备份与数据恢复,RPOɤ24h㊂1.3㊀备份服务内容要求㊀㊀经过统筹考虑, 两地三中心 的灾备服务内容包括数据备份服务和关键应用系统接管服务设计,服务如下㊂1.3.1㊀同城数据级全备份与恢复服务㊀㊀对生产中心主机(含虚拟机和物理机,不包含实施应急接管服务和重要数据库系统实时备份与恢复服务的主机)基于备份软件进行准实时同步备份,实现每台备份主机在同城灾备中心有一份准实时克隆备份数据㊂1.3.2㊀同城数据磁盘阵列级异步复制备份㊀㊀对生产中心所有存储在政务云集中式存储系统上的数据进行磁盘阵列级异步复制备份,实现政务云集中式存储系统上的数据在同城灾备中心有一份克隆备份数据㊂1.3.3㊀同城数据级持续备份与恢复㊀㊀在同城数据级全备份与恢复的基础上,可选择部分主机中的重要目录文件或数据库进行持续数据保护,保留多份备份数据,并可恢复7天内任一时间点数据[3]㊂1.3.4㊀同城应用级应急接管㊀㊀对部分重要信息系统进行应急接管服务,应急接管服务实现生产中心的应用快速切换至同城灾备中心运行㊂1.3.5㊀同城重要数据库系统实时备份与恢复㊀㊀对部分重要应用的数据库系统进行实时备份服务,服务支持数据库系统的快速恢复及启动运行㊂1.3.6㊀同城应用级应急运行㊀㊀在同城数据级全备份与恢复㊁同城数据级持续备份与恢复㊁同城应用级应急接管和同城重要数据库系统实时备份与恢复的基础上,可实现部分应用手动切换到同城灾备中心运行,并向政务外网或互联网提供服务㊂1.3.7㊀同城灾备数据异地备份与恢复㊀㊀将同城灾备中心的所有数据,包括同城数据级全备份与恢复服务㊁同城数据级持续备份与恢复服务㊁同城应用级应急接管服务和同城重要数据库系统实时备份与恢复服务产生的数据远程复制到异地灾备中心保存,当发生灾难时可将相关数据恢复到同城灾备中心或生产中心㊂2 技术实施㊀㊀壮美广西㊃政务云生产中心位于南宁良庆区,同城灾备中心在考虑机房条件和距离的情况下,机房选择在南宁市高新区,距离生产中心直线16km;异地灾备中心机房选择在来宾市运营商机房,距离生产中心162km㊂2.1㊀灾备中心网络整体架构㊀㊀如图1所示,在南宁同城容灾中心的组网上,网络区域化分为互联网区㊁公用网络区㊁安全管理区㊂在互联网区㊁公用网络区各自搭建同城灾备云平台,互联网区云平台负责生产中心互联网区域业务的灾备,公用网络区域负责生产中心公用网络区域业务的灾备㊂安全管理区域承载本次项目所有的管理流量以及整个灾备中心的网络安全保障㊂在同城灾备中心部署独立的互联网出口,可以实现互联网区应用系统的切换发布;来宾异地备份中心仅做数据级灾备,利用备份软件实现操作系统层面数据存储备份,不再建设云平台㊂具体同城与异地灾备的网络互连设计如下:图1㊀网络架构(1)互联网区域与公用网络区物理上隔离,通过部署跨区域的数据交换系统实现受控的数据访问和网络互通㊂(2)同城灾备中心互联网交换机与生产中心互联网核心路由器之间通过2∗10GE 专线三层互连,实现信息系统应急接管后的业务发布访问;公共网络区与互联网区域一致㊂(3)灾备中心互联网接入交换机与生产中心互联网核心交换机之间通过4∗10GE 专线互连,其中两根接云厂商A 核心交换机,两根接云厂商B 核心交换机,每两根通过链路聚合的模式捆绑为一个逻辑接口,并在逻辑接口下配置trunk 模式放通相关VLAN,生产中心接口也做相关配置,实现二层互通,打通灾备中心与生产中心云平台资源网络,满足备份数据流;公共网络区与互联网区域一致㊂(4)灾备中心所有区域的网络㊁安全等设备均实现冗余部署,保证网络可靠性㊂2.2㊀备份软件网络架构㊀㊀针对容灾项目实施,网络设计为同城灾备中心与生产中心网络3层互通,保证同城灾备云平台上备份软件控制机与所需安装备份软件包的虚拟机网络互通㊂2.2.1㊀同城数据级全备份服务网络架构㊀㊀数据级全备份涉及生产中心上所有信息系统,用20对1的方式进行数据实时同步,网络采用三层互通的方式㊂(1)备份软件通过备份控制机进行策略下发,控制机分别与生产中心㊁灾备中心虚拟机网络可达㊂(2)备份软件数据同步工作是通过生产中心业务IP 与同城灾备中心对应灾备机的数据复制IP 可达实现㊂目前20个生产虚拟机数据同步至1台灾备中心的备份虚拟机内㊂2.2.2㊀同城生产中心持续数据保护服务网络架构㊀㊀基于数据级全备份服务架构的网络架构,可实现持续数据保护服务㊂(1)灾备中心承载灾备数据的虚拟机与灾备中心连续保护机器网络可达,实现关键业务数据的连续保护,20个灾备虚拟机数据同步至1台连续保护虚拟机内㊂2.2.3㊀异地数据级全备份服务网络架构异地数据级全备份涉及全网所有业务系统,采用20对1的方式进行数据定时同步,网络采用三层互通的方式㊂(1)异地备份软件通过异地控制机进行策略下发,控制机与同城灾备中心的备份虚拟机㊁异地备份虚拟机网络可达㊂(2)备份软件数据根据带宽完成对同城灾备虚拟机在来宾异地的数据同步,实现20对1的备份㊂2.3㊀备份软件资源和策略配置2.3.1㊀同城数据级备份实施㊀㊀采用多对一数据集中备份方式㊂生产中心4000台虚拟机,比例为20ʒ1,则在同城灾备中心云平台上开通200台实时备份虚拟机㊂在生产中心的虚拟机㊁同城灾备中心的实时备份虚拟机上安装备份软件,在灾备控制机上启动实时备份规则,全服务器备份任务首先会将源端系统所有数据(包括文件系统㊁用户数据目录)一次性同步到备份虚拟机上㊂2.3.2㊀同城数据级持续备份实施㊀㊀采用多对一数据集中备份方式㊂同城灾备中心的200台实时备份主机中获取数据(原主机为ȡ1000台),按照20ʒ1的比例,开通10台同城容灾中心持续备份虚拟机,属于一种级联备份,启动备份软件的CDP功能,实现7天的数据持续性保护㊂2.3.3㊀同城重要数据库系统备份实施㊀㊀同时采用一对一㊁多对一数据集中备份方式㊂未来将根据调研云租户的具体结果,混合采用复制和备份技术开展备份㊂选择采用备份软件的解析数据库在线日志的实时复制技术或基于文件系统实施复制的高可用技术㊂2.3.4㊀同城应用级应急接管实施㊀㊀采用一对一备份形式㊂生产中心虚拟机与同城灾备中心的虚拟机一一对应,使用备份软件的复制规则,将生产虚拟机直接复制至备份虚拟机,并且启用应用高可用功能㊂2.3.5㊀同城灾备数据的异地备份实施㊀㊀采用多对一的数据集中备份方式㊂备份同城灾备中心的所有数据,包括200台实时备份主机,50个数据库的灾备主机,50个应用(200个虚拟机),利用来宾异地中心的物理服务器开展备份㊂3㊀项目创新㊀㊀一是构建异构解耦容灾云平台㊂具备云平台无关性,实现生产中心和灾备中心之间使用异构云平台进行的统一灾备,避免了品牌锁定,增加整个政务云的数据可靠性,打造国内电子政务领域首例异构云容灾方案㊂二是应用字节级复制技术㊂基于异构政务云的场景,采用业界领先的字节级复制技术,以传统容灾20%的资源实现政务云上信息系统的数据业务容灾㊂三是提供全栈化的灾备服务㊂提供从网络㊁存储㊁数据库㊁虚拟化到应用的全栈容灾技术,提供多样化的容灾服务,实现低成本㊁高可靠㊁高安全㊁满足电子政务外网业务运行的主要场景灾备㊂4㊀结语㊀㊀本次项目灾备体系建设,实现对壮美广西㊃政务云生产中心进行同城灾备及异地备份,实现生产中心每台备份主机在同城灾备中心有一份准实时克隆备份数据,并且可支持部分核心业务系统在同城灾备中心同时进行恢复数据和启动应用,满足RPO小于30s, RTO小于30min的要求㊂[参考文献][1]黄亮,张宝君,唐心悦.高校多策略灾备解决方案[J].网络安全和信息化,2022(1):96-99.[2]许超彬.政务云平台容灾备份系统建设思路研究[J].电子测试,2019(13):122-123.[3]吕梅新.浅谈云灾备管理平台建设[J].信息技术与信息化,2021(3):53-55.(编辑㊀王雪芬) Design and implementation of multi service disaster recovery for Guangxigovernment cloud Two Places and Three CentersWei Yuxing(Information Center of Guangxi Zhuang Autonomous Region,Nanning530000,China) Abstract:In the face of the existing single local disaster recovery mode of the magnificent Guangxi government cloud and the weak disaster recovery capacity,the relevant departments have carried out the construction of the disaster recovery system of Two Places and Three Centers .This paper introduces the disaster recovery goal and disaster recovery service capability of the magnificent Guangxi㊃government cloud based on Two Places and Three Centers , explores and practices the application of heterogeneous cloud platform building and node level replication technology in the government cloud disaster recovery system,discusses the construction content and effect of the magnificent Guangxi government cloud disaster recovery system from the perspective of technology route selection,technology implementation,innovation points and application effects,and realizes the local and remote disaster recovery of data resources on the government cloud,the data security of the information system has been comprehensively improved. Key words:government cloud;Two Places and Three Centers;disaster preparedness。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 备端在线两地三中心灾备方案网络设计
本地容灾是指在本地机房建立容灾系统,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。
与异地灾备模式相比较,本地双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点;异地灾备中心是指在异地建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。
针对两地三中心灾备建设的需求,我们结合我们自主研发的软件的优势,设计了典型的建设方案。
本地机房安装我们镜像系统,主备端同时在线,真正实现“双活”,是可见,可验证,可靠的容灾;异地机房安装实时备份,既能实现数据的实时复制,确保数据不丢失,又能任意时间点手动恢复,实现容错,而且无需主备硬件配置一致,还能降低成本。
网络拓扑和部署如下:
2.2 备端在线容灾系统设计
在生产服务器上部署A镜像系统代理软件,在容灾服务器上安装A镜像系统服务器端软件,设置A镜像代理的检测路径为主存储路径,设置A镜像服务器路径为备用存储路径。
通过Web管理界面配置镜像对象、全量和增量策略等。
1)当生产服务器处于正常工作状态时,把生产服务器的浪擎代理软件连接至服务器。
当代理检测到主存储数据变化后,将捕获变化的数据实时的复制到备用存储上,实现了实时的复制。
具体部署如下图:
2)当生产服务器故障,或者存储故障导致生产系统无法正常提供业务支持时,本地容灾服务器可直接接替生产服务器工作保障业务系统的持续运行;当本地机房发生灾难时,异地机房的容灾服务器可直接接替生产服务器工作保障业务系统的持续运行。
具体部署如下图:
3)当生产系统恢复工作后,浪擎软件会继续其生产服务器的复制工作,并且在这之前会通过回切工具保障主备系统数据一致,具体部署如下图:
2.3 异地容错的容灾系统设计
如果本地机房发生故障,将异地容灾服务器中备份的数据进行手动恢复,可以直接恢复到原生产服务器(也可恢复到新服务器)。
备份存储系统保存了应用系统任意时刻的数据,恢复时可恢复到任意时间点,实现容错,具体部署如下图:
通过以上4点保证了备用存储上的数据和主存储上的数据完全一致。
避免了主存储的单点故障。
管理端可部署在备用服务器上或系统管理员主机上。
与一般的cluster不同,浪擎灾备系统不采用共享存储模式,首先避免了硬件方面的巨量投资;其次避免了由于共享存储硬件或者连接共享存储硬件链路的故障引起的业务系统中断,避免了单点故障.
2.4 备端在线的两地三中心容灾优势
1) 备端在线的容灾优势:
●所见即所得的容灾,备用系统直接处于在线运行的状态,是直接可见、可验证的。
不像其他容灾系统,一定要恢复后才能知道备用系统的好坏;
●应用级的复制技术,即镜像系统复制的数据是数据库事务,是属于应用层的,从而可以保证数据库数据的完整性;
●实施无需停顿业务系统,适合7X24小时连续运行的业务系统;
●不需要主备系统硬件保证一致性,极大的降低系统改造及投入的硬件成本,只需备份存储空间大一点就行;
●对网络带宽消耗非常小,不需专用的光纤传输网络,采用实时增量复制技术大大减少了资源的开销,对业务系统性能影响很小;
●一旦主系统发生故障,由于备用系统的数据库直接处于运行状态,无需数据恢复阶段,仅需恢复业务系统即可,所以整个备用系统替换主系统的过程非常快;
●采用实时增量复制技术,将数据复制到备用系统上,当主系统发生故障时,备用系统丢失数量极小,由于数据量小使得备份窗口趋于零,对主系统的性能影响很小;
●应用方式多样化,支持多对一、一对多等镜像方式,为后期提供扩展平台;
●基于WEB的统一管理平台,负责对服务器、数据库等进行配置,设置镜像策略,并监控复制链运行情况,方便管理。
WEB监控界面可监控全网的备份任务及运行状态。
每条监控记录就是一条完整的复制链路,包含镜像代理、镜像服务器、运行状态。
镜像系统监控
Web可监控全网所有镜像代理、镜像服务器的工作状态以及所有复制任务。
复制任务监控信息包括:
编号:根据任务复制的顺序来排序的。
类型:模块类型,有文件,SQL SERVER和ORACLE三种。
服务器:镜像服务器所在服务器IP。
目标数据库:镜像服务器端备份数据库的名称。
执行内容:具体复制的内容,数据库监控的是SQL语句,文件监控的是复制的文件名。
开始时间:任务开始执行的时间。
结束时间:任务执行结束的时间。
状态:任务执行完成后的状态,如果复制成功显示为成功,失败显示的是失败。
2) 实时备份
浪擎•服务器备份系统的客户端模块实时捕获数据变化,并进行实时增量传输,不间断的保护客户端数据,保障生产服务器的业务数据不丢失。
并且可以恢复到任意时间点和任意版本,无时无刻保护业务系统的数据安全。
3) 任意时间点还原
实时备份,保留所有的变化的数据块,可以根据用户的需求,恢复到任意的时间点的版本。
增量和差异版本的实时复制、传输技术,以及全量加增量合成存储技术实现了数据完整性和任意时间点还原的功能。
4) 裸机还原
通常情况下,裸机要想进行信息处理需要进行硬盘分区和格式化、安装操作系统、安装驱动程序、安装应用程序等繁琐的步骤,需要花费大量的时间才能构造一个可用的系统环境。
但是浪擎•服务器备份系统可以轻松地将备份好的系统恢复至裸机上,实现一步到位。
可以快速的恢复业务系统的运行环境,极大的降低业务系统的最大恢复时间(RTO)指标。
达到高
性能的容灾。
5) 容灾与容错相结合
采用CDP技术,系统能根据数据库事务日志的变化分析出数据库完整性点,在复制此数据到备用服务器的同时还将保存历史记录,保证系统可以以I/O数据块为单位恢复至任意时间点,并且每个数据版本都满足数据库级的一致性,即每个版本等都是正确可用的,而不需要尝试回退I/O。
从而真正防止因数据库误操作对企事业单位带来的损失。
6) 异机还原
支持异机还原,避免单机故障导致的数据无法还原、使用的风险。
即时在不同硬件上,也可以恢复出故障的系统。
克隆与部署操作系统,不受硬件限制。
在物理计算机之间以及物理计算机与虚拟机之间进行迁移。
7) 对系统影响小
安装过程无需停机,采用定时全量和实时增量的技术,对网络和系统资源占用极低,不会影响生产系统的运行。
所有的操作在用户端完成,用户通过访问一个WEB浏览器来设定备份计划和策略,浪擎•服务器备份系统将变化的数据从生产服务器捕获到,并传输到备份服务里,从而减少了对生产服务器的负担。
全量加增量合成存储备份技术,保证系统只需做一次全量备份即可,大大降轻系统负担。
8) 基于WEB的作业、管理、监控平台
支持Web-Manage平台,即所有的作业操作都可以在Web平台上完成。
支持远程WEB进行备份策略设置、作业监控、存储配置、空间管理等,无需进行现场维护。
通过设置备份计划与存储管理策略,让系统自动运行,极大地减少系统维护和管理工作量。
支持基于WEB的查询备份对象、图表的存储空间显示、备份策略管理、计划管理。
支持基于WEB的备份作业监控,可显示从触发、排队、启动、传输、存储整个过程。