利用存储虚拟化网关轻松实现云灾备一键式切换

合集下载

云计算大数据中心容灾备份项目设计方案

云计算大数据中心容灾备份项目设计方案

云计算大数据中心容灾备份项目设计方案XXX科技有限公司2023年XX月XX日目录一概述 (3)二建设目标 (3)三建设内容 (4)四规划设计 (4)4.1 政务云灾备架构规划设计 (6)4.2 部署方案设计 (7)4.3 灾备服务等级设计 (8)五解决方案 (10)5.1 数据库备份 (10)5.2 业务文件备份 (10)5.3 业务应用操作系统备份 (10)5.4 虚拟化平台备份 (11)5.5 数据压缩 (11)5.6 全局源端重复数据删除 (11)5.7 断点续传 (12)5.8 备份数据有效性验证 (12)5.9 备份空间测算 (12)5.10 备份策略规划 (13)5.11 灾备数据恢复服务 (13)5.11.1 虚拟机自动异机恢复 (14)5.11.2 文件丢失与误删 (14)5.11.3 数据库故障 (14)5.11.4 服务器系统故障 (14)一概述随着信息化建设逐步深入,依托云计算,大数据,人工智能等新技术的新一代云中心在统筹利用信息化资源,统筹管理和节约国家信息化支出方面,已经取得了很大的成效,从全国范围来看,各委办局业务上云已经初具规模,各地市云平台建设渐入佳境。

但是,地震、水灾、火灾等天灾突如其来;错误操作、人为破坏、恐怖袭击等人祸防不胜防;设备失效、软件错误、通讯中断、病毒木马等技术风险无处不在。

在各级政府越来越依赖信息系统安全运行的今天,一旦业务中断、数据丢失,可能造成的是致命威胁。

甚至导致政府正常运转和对外服务中断。

数据显示,40%的政府机关平均 3 年就会遇到一次意外威胁,云计算大数据中心作为今后政府行业信息化运行的平台,没有一个健全的灾备体系来应对这些事故隐患,造成的后果是无法用金钱来衡量的。

为贯彻中共中央国家政务信息化工程建设规划,国家信息化领导小组《关于加强信息安全保障工作的意见》和国务院《关于加快推进互联网+政务服务工作的指导意见》的精神,结合XXX云计算大数据中心的建设规划,将统筹规划和建设云灾备中心,以可以满足日益增长的云业务系统灾备需求,有效应对信息安全事件频发的严峻形势,而且能够避免政府信息化建设投资分散和重复建设,实现基础设施、信息资源、技术人力资源的共享,确保信息化公共基础设施建设的科学、有序发展。

同城应用级灾备中心建设探讨

同城应用级灾备中心建设探讨

Experience Exchange经验交流DCW215数字通信世界2020.120 引言近年来,随着信息技术和网络技术的快速发展,信息系统建设模式也随之发生了很大的变化,由原先的分布式建设方式逐渐向区域集中、全集中方式转变,同时国家大力推进云计算建设,各省市政府部门及企业建立起各自的云数据中心,数据的不断集中带来了容灾备份更严苛的要求,灾备中心的建立成为大型信息系统建设过程中重要的一部分。

具备完善灾备系统的同城灾备中心可以在保障数据安全的基础上,在一定程度上保证业务的连续性,提升信息系统整体的可靠性,在机架级、机房级、数据中心级等不同等级的故障发生时,最大程度地保障数据完整性及业务连续性。

1 存在的问题与发展方向1.1 现状及存在问题随着一体化信息系统建设的不断推进,在灾备方面,目前国内信息系统的建设中暴露出一些问题:1.1.1 灾备系统的建设落后从整体建设现状来看,一些发达国家的灾备建设起步较早,政府重视、制度完善、监管到位,在考虑灾备的同时会对业务连续性提出一定要求。

国内相关机构对于业务连续性计划的整体水平相对于发达国家较为落后,很多大型机构或企业缺乏可保障业务连续性的灾备体系建设。

1.1.2 区域级灾备保障建设较少灾备保障体系可根据物理距离分为本地灾备、同城灾备、异地灾备,不同距离影响数据备份的方式、策略及计划。

本地灾备的灾备中心距离近,数据同步快,成本低;同城、异地的灾备中心距离远,数据传输延迟高,传输成本高,同时需建设灾备中心接收备份数据并保障业务连续性。

目前国内只有部分大型机构或企业具备同城或异地灾备保障能力,大部分机构或企业对发生区域级灾难时的数据的实时有效性、业务连续性保障能力有限。

1.1.3 以数据级灾备建设为主,应用级建设较少数据级灾备体系建设仅能保障数据实时备份,对于故障或灾难导致的业务中断,无法保障业务连续性。

目前国内的应用级灾备体系建设需求主要在于银行、政府、互联网企业等对于业务连续性要求较高的大型企业或机构。

云灾备解决方案

云灾备解决方案

云灾备解决方案一、引言云计算技术的快速发展为企业提供了更加灵便和可靠的IT基础设施。

然而,灾难事件可能会对企业的业务连续性和数据安全性造成严重影响。

为了应对这些风险,云灾备解决方案应运而生。

本文将详细介绍云灾备解决方案的定义、原理、优势和实施步骤。

二、云灾备解决方案的定义云灾备解决方案是一种基于云计算技术的灾难恢复策略,旨在保证企业在灾难事件发生后能够快速恢复业务,并确保数据的完整性和可用性。

通过将关键业务和数据备份到云端,企业可以实现高可用性和弹性的灾难恢复能力。

三、云灾备解决方案的原理1. 数据备份与同步:云灾备解决方案通过定期备份企业关键数据到云端,并实时同步最新的数据变更。

这样,在灾难事件发生时,企业可以快速恢复到最新的数据状态。

2. 虚拟化技术:云灾备解决方案利用虚拟化技术,在云端构建一个与企业生产环境相似的虚拟环境。

当灾难事件发生时,企业可以将业务系统迁移到云端虚拟环境中,实现快速恢复。

3. 自动化管理:云灾备解决方案通过自动化管理工具,实现对备份、同步和恢复过程的自动化控制和监控。

这样可以提高恢复效率,并减少人工干预的风险。

四、云灾备解决方案的优势1. 高可用性:云灾备解决方案通过将数据备份到云端,实现数据的冗余存储和快速恢复。

即使企业的本地数据中心发生故障,也能够保证业务的持续运行。

2. 弹性扩展:云灾备解决方案利用云计算的弹性特性,可以根据业务需求快速调整资源规模。

这样可以为企业提供灵便的灾难恢复能力,避免资源浪费。

3. 成本效益:云灾备解决方案通过共享云计算资源和自动化管理,可以降低企业的灾难恢复成本。

相比传统的备份和恢复方案,云灾备解决方案更加经济高效。

4. 简化管理:云灾备解决方案通过自动化管理工具,简化了备份、同步和恢复过程的管理和监控。

这样可以减轻企业的管理负担,提高运维效率。

五、云灾备解决方案的实施步骤1. 需求分析:根据企业的业务需求和数据特点,确定云灾备解决方案的功能和性能要求。

云灾备介绍与分析

云灾备介绍与分析

1 云灾备现有技术
灾备的 目的是当灾难发生后 . 要立 即恢复系统 。 尽快 投入使用 , 所 以灾备采用的各种技术 . 无论是数据备份 、 数据复制 还是其他技术 , 都 将围绕着业务 的连续来进 行 。衡量这些 灾备技术 的指 标主要是 R P O ( R e c o v e r y P o i n t O b i e c t . 恢复 点 目标) 和R T O ( R e c o v e y r T i m e O b j e c t , 恢 复时间 目标1 在灾备解决方案中 , 其核心技术具体介绍如下 :
决核 心技 术. 并对 几种主要的云 灾备厂商技术进行 了对比分析。
【 关键词 】 云灾备 ; 存储 ; 虚拟化 0 引 言
随着现代社会网络信息化程度 的不断提高 , 社会 各行各业对信息 系统的依赖性 日益增强 . 信息系统的容灾备份 成为灾难发生时确保业 务连续性和数据可用性的重要 手段 。但 随着 云计算 应用的 出现 . 灾备 在 云计算应用 中的实施——云灾备成为一种新 兴的发展 。 当主服务器 突然发生故障或者因其他损坏而停止工作时 . 和主服务器 同步并做 备 份 的虚拟 主机 开始启动 . 它将 临时客 串成 为主服务器 . 当主服务器恢 复后 . 虚拟机上包括操作系统 、 数据库 、 应用程序和其他相关数据都被 无缝地迁移 回原来的主服务器 。 保障了业务系统运行不 间断 和数据 的 安 全可靠
2 0 1 3年
第2 3期
OI T论坛 0
科技信息
云灾备介绍与分析
杨鹏 川 ( 国家新 闻 出版 广 电 总局 海南 监测 台 , 海南术的不断推广应用, 云灾备技术为企业的容灾备份提供 了一种行之有效的解决方案。本文介绍了当今几种备灾解

FusionSphere服务器虚拟化灾备方案

FusionSphere服务器虚拟化灾备方案
容灾测试&故障恢复
eReplication容灾管理过程 - St中心
远程容灾中心
本地高可用方案 主备容灾解决方案(同步)
同城双活解决方案 主备容灾解决方案(同、异步) 三镜像容灾解决方案 虚拟化网关复制方案
主备容灾解决方案(异步) 虚拟化网关复制方案 云容灾解决方案 两地三中心容灾解决方案
部署方式
部署方式
说明
部署在物理机上
FusionSphere虚拟机备份:备份Openstack下的FusionSphere虚拟机采用LAN-Free组网方式,生产存储是FC SAN使用FC SAN作备份存储生产存储是FusionStorage,采用了与CNA节点的融合部署说明: 满足以上场景之一即可。
安装流程
安装流程分为两大阶段安装准备检查部署环境规划网络安装过程模板和软件包方式二选一具体流程如图示
模板部署虚拟机,自动的创建包括eBackup备份软件的虚拟机
安装过程 方式一:基于模板安装
安装过程 方式二:基于软件包安装
在服务器上安装标准SUSE11 SP3为SUSE11 SP3安装eBackup指定的内核补丁安装eBackup
FusionSphere服务器虚拟化灾备方案
技术创新,变革未来
学完本课程后,您将能够:掌握华为服务器虚拟化场景下备份相关知识掌握华为服务器虚拟化场景下容灾相关知识
FusionSphere服务器虚拟化备份方案详述FusionSphere服务器虚拟化容灾方案详述
服务器虚拟化备份组件
FusionComputeBCManager eBackup备份服务器备份代理
构建基本容灾环境
创建保护组 根据保护对象的类型选择创建保护组;选择指定站点的指定主机上的待保护的应用实例;选择需要的容灾策略模板。修改保护组策略与拓扑展示 针对保护组的保护策略配置修改执行的时间周期策略; 支持保护组的修改、删除、禁用、激活、导出和手动执行;支持保护组维度的逻辑拓扑展示。

应用级双活建设方案

应用级双活建设方案

1.逻辑架构2.方案简述某客户为了保证业务的连续性,需要部署双活数据中心,传统的数据中心解决方案,正常情况下只有主数据中心投入运行,备数据中心处于待命状态。

发生灾难时,灾备数据中心可以短时间内恢复业务并投入运行,减轻灾难带来的损失。

这种模式只能解决业务连续性的需求,但用户无法就近快速接入。

灾备中心建设的投资巨大且运维成本高昂,正常情况下灾备中心不对外服务,资源利用率偏低,造成了巨大的浪费。

两个数据中心(同城/异地)的应用都处于活动状态,都有业务对外提供服务且互为备份。

但出于技术成熟度、成本等因素考虑,数据库采用主备方式部署,数据库读写操作都在主中心进行,灾备中心进行数据同步。

发生灾难时,数据中心间的数据库可以快速切换,避免业务中断。

双活数据中心可充分盘活闲置资源,保证业务的连续性,帮助用户接入最优节点,提高用户访问体验。

3.实施方案详述真正的双活,要在数据中心的从上到下各个层面,都要实现双活。

网络、应用、数据库、存储,各层面都要有双活的设计,这样才能真正意义上实现数据中心层面的双活。

从某种程度上说,双活数据中心可以看做是一个云数据中心,因为它具有云计算所需的高可靠性、灵活性、高可用性和极高的业务连续性水平。

不仅能够满足应用对性能、可用性的需求,而且还可以灵活动态扩展。

3.1网络子系统3.1.1简述从网络上来看,双活数据中心需要将同一个网络扩展到多个数据中心,在数据中心间需要大二层网络连接并且实现服务器和应用的虚拟化数据中心互联技术。

大二层的网络技术有IRF、TRILL、SPB、EVI等。

IRF是将多台网络设备(成员设备)虚拟化为一台网络设备(虚拟设备),并将这些设备作为单一设备管理和使用。

IRF把多台设备合并,简化了管理提高了性能,但IRF构建二层网络时,汇聚交换机最多是可达4台,在二层无阻塞的前提下可接入13824台双网卡的千兆服务器,如果客户期望其服务器资源池可以有效扩充到2万台甚至更大,就需要其他技术提供更大的网络容量。

云灾备同城应用及解决方案

云灾备同城应用及解决方案云灾备同城应用是在云计算技术基础之上,建立灾备系统应用的一种方式。

灾备系统是为了防止在出现灾难或者意外情况时,能够迅速的实现业务连续性和数据安全性。

在同城情况下的云灾备应用,主要是为了应对地区性的事故和灾难,确保业务在瞬间切换的同时,数据还能够保持安全。

一般情况下,云灾备同城应用可以通过异地冗余或者热备等方式来实现。

云灾备同城的解决方案1. 分布式架构方案:采用分布式架构可以减少数据中心的单点故障,实现数据的备份和镜像,用于灾难时备份数据的快速转换。

2. 多层备份方案:在架构上采用多层备份,并且在备份过程中分别备份数据和应用程序,以确保数据安全和业务的连续性。

3. 自动化切换方案:利用自动化切换技术,实现自动化、秒级或者毫秒级的切换,以提高业务的连续性和可用性。

4. 虚拟化方案:通过虚拟化技术可以实现业务的高可用性,利用虚拟化技术实现实时同步和数据的互备,实现业务的快速切换和恢复。

5. 全面安全防护方案:采用全面安全防护方案可以有效的防止各种漏洞的攻击和数据盗窃,保证数据的保密性和完整性。

6. 多层网络隔离方案:通过网络结构的隔离和分层,实现数据的隔离和保护,以保证数据的安全性和完整性。

云灾备同城应用的优势1. 快速切换:同城灾备系统具有快速切换的能力,可以帮助企业快速应对突发事件和灾难。

2. 业务连续性:在出现灾难或其他意外情况时,同城灾备系统可以确保业务连续性,避免业务中断造成的经济损失。

3. 数据安全:同城灾备系统可以保证数据的备份和恢复,即使主机数据丢失,也可以通过备份数据快速恢复数据。

4. 经济实用:采用云灾备同城应用可以大大降低企业的投资成本和运维成本,从而提高企业的核心竞争力。

5. 服务可靠性:采用专业的云灾备同城应用服务提供商可以保证服务的可靠性和稳定性,确保企业业务的正常运转。

总之,云灾备同城应用是一种切实可行的技术方案,它可以为企业提供强大的灾备保障,确保企业数据的备份和恢复,同时提高企业的业务连续性和可靠性,减少企业因灾难和其他意外事故造成的经济损失。

云灾备解决方案

云灾备解决方案一、引言随着云计算技术的迅猛发展,越来越多的企业开始将关键业务数据和应用迁移到云平台上。

然而,面临的风险和挑战也随之增加。

灾备是企业信息化建设中不可或者缺的一环,而云灾备解决方案则成为了保障企业数据安全和业务连续性的重要手段。

二、云灾备解决方案的概述云灾备解决方案是基于云计算技术的灾备解决方案,通过将企业关键数据和应用备份到云平台上,以实现数据的安全存储和业务的快速恢复。

该解决方案具有高可靠性、高可用性和高灵便性的特点,能够有效应对自然灾害、硬件故障、人为错误等各种灾害事件。

三、云灾备解决方案的关键技术1. 数据备份与同步技术云灾备解决方案通过实时数据备份和同步技术,将企业关键数据实时备份到云平台上。

采用增量备份和差异备份的方式,可以最大程度地减少数据传输的时间和带宽消耗。

2. 数据加密与安全传输技术为保证数据的机密性和完整性,在数据备份和传输过程中,采用高强度的加密算法对数据进行加密处理。

同时,通过安全传输协议和防火墙等技术手段,确保数据在传输过程中不被篡改或者泄露。

3. 弹性计算与虚拟化技术云灾备解决方案利用云计算平台的弹性计算和虚拟化技术,可以在灾难发生后快速启动备份数据和应用,并提供高可用的计算资源。

通过虚拟化技术,可以实现跨地域、跨平台的快速恢复。

4. 自动化监控与故障转移技术云灾备解决方案通过自动化监控和故障转移技术,实现对备份数据和应用的实时监控和故障自动转移。

当主数据中心发生故障或者不可用时,系统能够自动切换到备份数据中心,保证业务的连续性。

四、云灾备解决方案的优势1. 高可靠性:通过将数据备份到云平台上,避免了传统灾备方案中单点故障的风险,提高了数据的可靠性和可用性。

2. 高可用性:云灾备解决方案采用多地域、多数据中心的架构,能够实现跨地域的快速故障转移和业务恢复,提供高可用的服务。

3. 高灵便性:云灾备解决方案可以根据企业的需求和预算灵便选择备份策略和存储容量,满足不同规模企业的需求。

云容灾的概念

云容灾的概念云容灾(Cloud Disaster Recovery,简称云灾备)是一种利用云计算技术来实现灾难恢复的方法。

它的目标是确保在发生灾难性事件时,组织的关键业务和数据能够在云平台上迅速、可靠地进行备份和恢复,以减小业务中断和数据丢失的风险。

以下是云容灾的一些关键概念:1.备份和存储:云容灾利用云计算提供的存储服务,将组织的关键数据备份到云平台。

这可以包括数据库、文件系统、虚拟机镜像等。

2.虚拟化和快速部署:云容灾通常使用虚拟化技术,将组织的整个IT基础架构(包括服务器、网络设备等)虚拟化为可在云环境中快速部署的形式。

这有助于提高系统的灵活性和恢复速度。

3.自动化:云容灾利用自动化工具和流程,使灾备过程更加自动化和可管理。

这包括自动备份、自动监控、自动故障切换等功能。

4.多地域冗余:云容灾通常利用云服务提供商在多个地理区域提供的数据中心,实现业务的多地域冗余。

这有助于防止由于某个地区发生的自然灾害或其他灾难性事件导致的数据丢失或业务中断。

5.按需资源:云容灾允许组织在需要时动态调整资源。

这意味着在灾难发生时,可以按需启动云中的虚拟机、存储等资源,以满足业务快速恢复的需求。

6.监控和测试:云容灾解决方案通常提供监控和测试工具,以确保备份的数据完整性,定期进行恢复演练,提高恢复的可靠性。

7.成本效益:与传统的灾备解决方案相比,云容灾通常更具成本效益。

由于采用云服务,组织无需投资大量资金购买和维护物理设备。

总体而言,云容灾为组织提供了更加灵活、高效、成本效益的灾难恢复方案,有助于保障业务的连续性和可靠性。

两地三中心容灾方案

Xx项目存储方案介绍目录1. 现状综述 (4)2. 总体建设方案 (4)2.1. 建设原则和策略 (4)2.1.1. 建设原则 (4)2.1.2. 建设策略 (5)2.2. 建设目标 (7)2.2.1. 总体目标 (7)2.2.2. 分期目标 (7)2.3. 建设内容 (7)2.4. 总体设计方案 (8)3. 容灾的核心技术及选择 (9)3.1. 容灾系统衡量指标 (9)3.2. 容灾级别 (10)3.3. 常见容灾建设模式 (11)3.3.1. 同城容灾 (11)3.3.2. 异地容灾 (11)3.3.3. 两地三中心 (11)3.3.4. 双活数据中心 (11)3.4. 常用的数据复制技术 (12)3.4.1. 基于存储层的容灾复制方案 (13)3.4.2. 基于主机数据复制技术的灾备方案 (18)3.4.3. 基于数据库的数据复制技术构建灾备方案 (20)3.5. 如何选择最优的容灾方案 (28)3.5.1. 数据容灾技术选择原理 (28)3.5.2. 数据容灾技术选择度量标准 (29)3.6. 本项目容灾模式及技术的选择 (29)3.6.1. 容灾模式选择 (29)3.6.2. 容灾中心选址 (30)3.6.3. 数据复制技术的选择 (32)4. 推荐方案概述 (33)4.1. 技术路线选择 (33)4.2. 总体方案架构 (33)4.3. 数据库容灾系统设计 (35)4.3.1. Golden Gate技术原理 (36)4.3.2. 各委办局和同城容灾中心之间的数据库复制 (37)4.3.3. 同城容灾中心和异地容灾中心之间的数据库复制 (40)4.4. 非结构化数据容灾系统设计 (40)4.4.1. 同城容灾中心和生产中心之间的数据容灾 (41)4.4.2. 同城容灾中心和远程容灾中心的数据容灾 (43)4.4.3. 应用级容灾几种实现方式 (44)4.5. 一体化集中备份系统 (45)4.6. 容灾网络建设方案设计 (46)4.6.1. 整体容灾网络架构设计 (46)4.6.2. 前端服务网络容灾方案 (47)4.6.3. 服务器数据网络容灾方案 (49)4.6.4. 存储网络容灾方案 (50)4.6.5. 本项目建议容灾网络方案 (51)5. 本项目灾备系统建设的几点建议 (52)5.1. 需要按照灾备要求梳理系统 (52)5.2. 解决好数据库系统数据复制 (52)5.3. “现实”的切换策略 (53)6. 软硬件设计 (54)6.1. 软硬件总体选型原则 (54)6.2. 同城容灾中心软硬件设计 (55)6.2.1. 一体化备份系统 (55)6.2.2. 数据库容灾系统 (56)6.2.3. 云计算平台容灾系统 (57)6.2.4. 同城数据存储容灾系统 (58)6.2.5. 机房改造系统 (58)6.2.6. 网络系统 (60)6.2.7. 安全系统 (60)6.2.8. 详细软硬件配置清单 (60)6.3. 远程容灾中心软硬件设计 (63)6.3.1. 远程数据备份系统 (63)6.3.2. 远程数据库容灾系统 (64)6.3.3. 远程云计算平台容灾系统 (65)6.3.4. 远程数据存储容灾系统 (66)6.3.5. 网络系统 (66)6.3.6. 安全系统 (66)6.3.7. 详细软硬件配置清单 (66)7. 项目组织机构和人员培训 (68)7.1. 领导和管理机构 (68)7.2. 项目实施机构 (69)7.3. 运行维护机构 (69)7.4. 技术力量和人员配置 (70)7.5. 人员培训方案 (70)8. 项目实施进度 (71)8.1. 项目建设期 (71)8.2. 实施进度计划 (71)8.2.1. 同城容灾中心建设计划 (71)8.2.2. 异地容灾中心建设计划 (73)9. 投资估算 (74)9.1. 投资估算的说明 (74)9.2. 投资估算 (74)9.3. 估算编制依据 (75)9.4. 资金来源与落实 (76)9.5. 投资估算明细表 (1)1.现状综述XX市政府网站管理中心自成立之日起,就按照集中建设的原则完成了“XX市电子政务外网统一平台示范工程项目”的建设工作,完成了XX市124家党政部门的接入工作,完成了在全市范围内只铺设一套网络基础设施的工作,实现了市及电子政务外网与省、国家政务外网之间的互联互通,目前共有服务器500多台,存储40多套,部署的虚拟服务器300多台。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

利用存储虚拟化网关轻松实现云灾备一键式切换
企业的各种业务系统和数据在经营过程中的作用越来越重要,容灾就是必须考虑的保护措施。

伴随着云基础架构的日趋成熟,云灾备技术应用越来越普遍,运行在云环境的企业关键应用的比重越来越大,在云环境中如何更简单的实施云容灾、更好的保证数据安全、更快速的恢复业务是所有用户的关注点。

容灾建设和灾备系统切换
一般而言,数据系统容灾建设是个庞大的工程,大型的灾备项目通常会经过立项、咨询、招投标、建设部署、测试验证、正式上线、日常维护等等。

通常选择的灾备技术路线将深深的影响到日后的维护复杂度。

在灾难恢复(DR) 站点,不管是计划内(如计划的站点迁移)还是计划外(如意外事件)的停机,恢复运行尤其需要精心准备。

做灾难恢复计划需要花费数月时间,但执行这一计划则需要在几分钟内完成。

在这宝贵的几分钟内,灾难恢复小组的所有成员都将集中精力,协调有序地执行他们的恢复程序。

在应用程序、硬件、网络以及存储小组执行的几十甚至几百个步骤中,稍有不慎便会出现差错。

人为错误、流程缺陷、方案问题,几乎任何事情都可能造成站点恢复延迟。

对很多人来说,这项艰巨的任务风险重重、难以预测。

在IT系统切换/回切的流程中,我们不难发现系统切换过程中,IT系统切换的流程按照停止业务应用、停止业务系统、同步数据、启动灾备数据备份系统、启动灾备业务处理系统,启动应用,验证数据,执行灾备中心重续运行;当需要将系统回切到生产中心,则再反之执行一遍,如此繁杂的操作步骤,无疑占用了大量的操作时间,且增加了误操作的几率。

实施一次容灾切切换,从准备切换到可以对外提供服务需要数个小时时间,主要时间消耗在以下几个方面和存在以下几个问题:
人为沟通和判断。

由于在容灾切换过程中需要根据实际的情况做大量人为判断,需要有有经验的工程师进行操作,并且要求工程师登陆不同主机输入大量命令,对每个命令都需要确认,以保证命令的正确性。

所以其间由于沟通、判断、确认等原因,在实际需要容灾切换的时候往往会耽误不少宝贵时间。

在数据同步层面,计划性切换时,保障数据的一致性,是必须的,当生产系统切换到容灾中心,首先要保证生产数据完全同步到灾备中心,以免发生数据丢失。

而在数据同步的过程中,需要人为发起数据同步,如果是多个卷或者多个数据库实例,可能需要多次执行数据同步的命令。

且数据复制同步完成后,需要操作人员判断数据同步是否正常,生产中心和灾备中心数据是否一致等。

在系统层面,在容灾切换中时间最长的是VG卷组激活步骤,特别是对于大型数据库来说,其VG卷组的数量往往是几十个之多,每个VG卷组都会包含十几个物理LUN,因此系统上面需要对每一个物理的LUN进行扫描和检查,因此拥有大量VG卷组的主机激活所有VG卷组需要大量时间。

对外应用系统,还需更改对外服务IP地址,以便能够使用灾备中心网络对外提供服务。

在网络层面,生产中心的对外网络停止服务,生产中心到容灾中心的数据复制完成后,需要将数据复制的网络进行反转,将复制关系调整为灾备中心到生产中心。

灾备中心对外服务网络随即打开,使得应用系统能够对外提供相应的应用服务内容。

对于日常运维人员来说,灾备建设不仅是需要日常的设备维护和巡检,灾备系统的可用性是运维人员最为关注的内容。

而要提高灾备系统的可用性,计划性灾备演练则成为验证灾备系统可用性的最有效的武器。

日前,一份针对CIO所作的调查表明,测试演练的意识正在进步之中,但测试演练的频率并没有增加;54%的受访者表明这样的测试演练一年进行两次左右。

这个频率依然相对低下,而且仅有41%的受访者在其执行的本就不多的测试演练中成功恢复
了所有应用程序。

之所以计划性测试演练工作的频率,在大多数企业中还相对低下,主要的原因在于容灾系统切换的繁琐的操作步骤和风险概率大所致。

如果引入自动化切换,将大大简化容灾切换的操作步骤,并且可以提高切换的成功率,让容灾系统切换演练成为日常维护的一部分。

自动化容灾切换势在必行
综上所述,容灾切换不仅仅是一部分或者是一个人能够搞定的事情,需要大量的前期准备工作,多方位的人员参与,容灾切换的复杂度也让容灾切换过程中风险骤然加大,任何一个错误将导致切换任务无法有效完成。

所以如果能够减少人为的操作和判断步骤,实现容灾切换的自动化操作,人仅仅参与容灾切换的决策,那么无疑将简单化容灾切换,使恢复操作风险可控化,实现高效稳定的容灾中心切换。

相关文档
最新文档