容灾整体解决方案

容灾整体解决方案
容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

容灾整体解决方案
第1章
前言
随着社会的发展和科技的进步,真实有效的信息已经成为企业赖以生存的 源泉,企业信息化的水平已经成为企业的核心竞争力。 随着企业信息化建设的普及与发展, 企业所面临的风险和威胁也越来越大。 外在的因素、内在的因素与更多不可欲知的灾难,时刻威胁着企业生存。绝大多数 企业都无法承担由于计划外系统中断造成的停机而带来的经济与信誉等诸多方面的 损失。而如何做到企业的业务永续运行,已经成为困扰企业经营决策者们的头等大 事。 在以往的企业信息化建设过程中,由于管理的需要,企业 IT 资源往往走过 一个从分散到集中的道路,当前企业信息化通常都是一个资源高度整合的系统。中 国有句古话“分久必合,合久必分” 。正是因为高度集中,一旦发生意外事故,势必 造成企业业务无法持续,这样威胁让企业信息化建设与管理者们夜不能寐,寝食难 安。为保证 7×24 全天候运行,企业需要一个全面的业务连续性计划,可以支持高 可用性、连续运营和灾难恢复。
2-

容灾整体解决方案
第2章
2.1 概述
容灾概述
什么样的威胁能够导致企业业务的中断?我国出台的《信息安全技术信息系统灾难 恢复规范》 (下称《规范》 )中明确定义:灾难是由于人为或自然的原因,造成信息系统 运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定 的时间的突发性事件,通常导致信息系统需要切换到备用场地运行。 下图数据来源于: Contingency Planning Research, Inc 1999 ( 1982-1997 (美国)样本数:6000 宗
由此可见,灾难不仅指自然的原因,也包括人为的原因。对于信息系统的连续性运 行来说, 灾难的范围很宽泛。 因为自然灾害或其他原因造成的数据丢失的案例经常发生。 事实上, 企业要保持业务连续性, 最大的威胁并不是来自于火灾、 地震等小概率、 大影响的灾难。相反,企业的业务更多地受到诸如人员错误、流程缺陷等事件的威 胁。虽然它们对业务的影响力远不如那些重大灾难,但是它们却时刻潜伏在企业的 周围,一触即发,同样会对企业造成致命的打击。不是所有的灾难都会毁掉整个数 据中心。很多灾难规模较小,如果有的话也只会影响到一个或者两个系统。我们还 是可以根据灾难的严重程度定义下面这样的灾难级别。 3-

容灾整体解决方案
一级 受到攻击和分析的威胁。如果有人声称知道业务系统里有后门可以进入或者准备用 病毒发动攻击,我们就认为正在受到攻击和分析的威胁。 遇到这种情况就,用户需 要要加强安全戒备,截击攻击者。此时,企业或机构还没有受到损失,攻击行动还 没有开始。 二级 这一情况不会对数据系统产生冲击,但是它仍然是企业必须解决的问题。例如,即 使安全漏洞让入侵者获得了敏感的信息,但是数据系统仍然在运行。但是,你必须 立即扭转这一局面。 三级 单个系统故障:单个系统故障造成其离线时间超若干分钟或者任意长时间,离线时 间取决于系统受到威胁的程度。这种情况需要立即进行应用转移,如果可能的话, 要转移到本地的备用系统上;否则,必须把系统从磁带上恢复到备用的硬件上。一 般来说,这种情况不会对商业运行造成巨大影响,但是必须尽快解决问题。 四级 单处致命故障或者多处非致命故障:在这种情况下,对商业运行的直接威胁已经发 生,但是,数据中心仍然在正常运行。如果有可能,还是要恢复到备用硬件和/或 进行本地的应用转移,但是响应时间现在变得非常重要。到达这一级别,系统正面 临大面积的威胁。 五级 数据中心即将或者已经发生故障,甚至更糟:断电、间谍活动、恐怖活动,以及自 然灾害都可以归入这一类。远程的应用转移或者使用基于磁带备份的数据来重建数 据中心是唯一的选择;这一级别会假设生产设施会有相当长的一段时间无法使用。
灾难范围的扩大,对企业的 IT 建设提出了新的挑战。为了保证企业 24x7 连续运营, 仅仅依靠传统的灾难备份/恢复已经满足不了业务的需求。从 IT 为业务服务的角度,业 界很早就提出了业务连续性的概念。 业务连续性涵盖面超出了 IT 灾备方案的范畴, 而是 一个包含了保证业务连续运行的各组成环节的管理流程。 什么是业务连续性管理(business continuity management)?BCM 是一套综合管理 体系 (从灾难恢复发展而来的一门管理学科) 它着眼于对各种潜在灾难和危险进行分析, 。 4-

容灾整体解决方案
并建立一套完善的业务持续计划(BCP)来防止或减少灾难事件给企业带来的损失 。它是 一项面向商业机构或政府组织信息安全与风险管理的综合管理流程,它使组织机构认识 到潜在的危机和相关影响,制定响应、业务和连续性的恢复计划,其总体目 标是为了提 高组织的风险防范与抗击打能力, 以有效地响应非计划的业务破坏并降低不良影响。 BCM 系统的整体规划、实施与运营包括信息系统的基础数据与应用系统灾难备份与业务恢复 计划 。 业务连续性管理与灾难恢复的关系又是怎么样的?下图为两者之间的关系
从图上我们可以看到,BCM 不仅仅包括灾难恢复,还包含风险管理,基础设施 管理,供应链管理,质量管理,健康与人身安全,知识管理等等内容。区分业务连 续性和灾难恢复是很必要的。严格地来说,灾难恢复是恢复数据的能力,是业务连 续性管理的一部分。
2.2 业务连续性管理简介
2.2.1 《规范》简介
上文已经提到了我国出台了《规范》 GB-20988-2007-T。 《规范》是我国容灾建设的 根本依据。 《规范》中的规定:我国灾难恢复等级划分:六级、七要素 5-

容灾整体解决方案
大致可以分为二类:数据类、应用类 “第 1 级”:数据介质转移(异地存放、安全保管、定期更新) “第 2 级”:备用场地支持(异地介质存放、系统硬件网络可调) “第 3 级”:电子传送和部分设备支持(网络传送、 、磁盘镜像复制) “第 4 级”:电子传送和完整设备支持(网络传送、网络与系统就绪) “第 5 级”:实时数据传送及完整设备支持(关键数据实时复制、网 络系统就绪、人机切换) “第 6 级”:数据零丢失和远程(在线实时镜像、作业动态分配、 实时 无缝切换) Tier1 的灾难恢复方案必须设计一个应急方案,能够备份所需要的信息并将它存储 在异地。 通常将本地备份的数据用交通工具送到远方。 这种方案相对来说成本较低, 但难于管理。 Tier2 相当于 Tier1 再加上热备份中心能力的进一步的灾难恢复。热备份中心拥有 足够的硬件和网络设备去支持关键应用。相比于 Tier1,明显降低了灾难恢复时间。 Tier3 是在 Tier2 的基础上用电子链路取代了卡车进行数据的传送的进一步的灾难 恢复。由于热备份中心要保持持续运行,增加了成本,但提高了灾难恢复速度。 Tier4 指两个中心同时处于活动状态并同时互相备份,在这种情况下,工作负载可 能在两个中心之间分享。在灾难发生时,关键应用的恢复也可降低到小时级或分钟 级。 Tier5 则提供了更好的数据完整性和一致性。 也就是说, Tier5 需要两中心与中心的 数据都被同时更新。在灾难发生时,仅是传送中的数据被丢失,恢复时间被降低到 分钟级。 Tier6 可以实现 0 或者极少的数据丢失率,被认为是灾难恢复的最高级别,在本地 和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力,当 发生灾难时,能够提供跨站点动态负载平衡和自动系统故障切换功能。 通常这 6 个级别的恢复时间与成本关系如下图
6-

容灾整体解决方案
恢复时间
连续可用
恢复机制取决于 可接受的停机时间和预算
成本 / 复杂性
镜像 同步复制
快速恢复
异步复制
一般恢复
磁带恢复
恢复时间 分钟 小时 天
《指南》中还规定了容灾系统中的主要构成 7 要素: 数据备份:介质转移、批量传送、流水日志、实时镜像 主处理系统:主机、存储、应用、环境 网络通讯:信道、设施、切换 灾 难 恢 复 预 案 : 计 划 与 评 审 、 测 试 、 演 练 、 文 档 、 保 障 联络、变更 BCP、DRP、DCM
运维管理:规章、管理、操作 技术支持:人员、技术、培训 基础设施:工作、生活、联络、供电 如图:
7-

容灾整体解决方案
而在容灾建设中, 我们如何确定是否达到目标呢?这就必须制定灾难恢复目标的参 考点:RTO 与 RPO 与总成本
2.2.2
恢复时间目标(RTO)与恢复点目标(RPO)
RTO,Recover Time Object,恢复时间指标,是指当灾难发生后,生产系统需要多 长时间能够恢复生产, 它是衡量企业在灾难发生后多长时间能重新开始运转的指标。 RPO,Recover Point Object,恢复点指标,是指灾难发生后,容灾系统能把数据恢 复到灾难发生前的哪一个时间点的数据,它是衡量企业在灾难发生后会丢失多少生 产数据的指标。 RTO 与 RPO 是容灾建设中非常关键的指标,直接与总成本相关。
8-

容灾整体解决方案
灾难覆盖面
可用的技术
成本
恢复速度
恢复程度
我们知道了 RTO,RPO 是灾难恢复的基本参考指标,那这些指标是怎么来的呢? 一般的流程是这样的:1:我们首先要建立业务发展模型与蓝图,根据这些模型与蓝图 确定各业务系统之间的逻辑关系、 重要程度等指标.2:风险分析(BA)根据以往本数据 中心的历史数据进行统计,分析可能存在的风险,及风险可能发生的比例,根据比例, 确定主要威胁.3:业务冲击分析(BIA):根据风险分析的结果,预计一旦发生相应的灾 难,会给企业造成如何的影响,这些影响都会带来如何的损失,各个系统恢复需要多 长时间,恢复的优先级是如何的(确立”关键活动”),各个系统允许丢失的数据的时 间是多久.4:确定连续性需求:需要评估各个系统恢复需要的资源(GAP).5:根据各个 系统的 RTO 与 RPO 要求,确定各个系统的业务连续性计划. 我们根据需要制定可达到目标的业务连续性计划,制定灾难恢复流程,建立人 力资源团队,建设基础设施并选择合适的技术手段来达到我们制定的要求! 这也就是我们通常说的灾难恢复体系的模型:计划与三要素:人员、流程、技术。
9-

容灾整体解决方案
2.3 容灾系统建设的流程
通常我们在建设容灾系统的流程上分为 3 大阶段,7 个主要步骤: 计划阶段:主要包括业务模型分析(确定各业务系统之间的逻辑关系) ,风险分析, 业务冲击分析, 当前业务环境及恢复能力分析, 然后根据分析结果(RTO,RPO)制定不 同的策略, 编制业务连续性计划, 根据计划进行容灾方案选择及业务恢复流程设计, 组建灾难恢复管理队伍。 实施阶段:在此阶段根据容灾方案进行容灾系统的建设,落实相应的规章制度。 管理阶段:应急预案的编制、测试、维护、评估与改进等.
7 个主要步骤: 1.灾难类型分析 2.业务冲击分析 3.当前业务环境及恢复能力分析 4.容灾策略制订 5.容灾方案设计 6.业务恢复流程设计 7.业务恢复流程及容灾方案管理和测试
灾难恢复建设流程
灾备建设起点 获得管理层支持 科技、业务、财务、 后勤支持等相关部门
数据处理中心风险分析 业务影响分析 确定灾难恢复策略与目标 成立灾难恢复专 门机构 分析灾难 备份需求 数据备份系统 备用数据处理系统 备用通信网络系统 灾备中心运营管理
日常监控与操作管理 问题管理与变更流程 演练管理 预案维护和评估 预案测试和演练 初稿的制订 初稿的评审 初稿的修订 预案的测试 预案的审核和批准
保持灾备 系统永续 运行
制订灾难 备份方案
制订灾难 恢复预案
实施灾难 备份方案 实施灾难备份方案 落实相应的规章制度 组建运营管理队伍
10-

容灾整体解决方案
在容灾建设的过程中,我们发现:灾难应急预案与灾难恢复演练很重要。我们的 应急预案是否可行,在一旦发生故障时,系统是否能够按照计划恢复?我们是否做 过多次的演练来反复完善我们的预案? 应急预案制定的原则:完整性,有效性,易用性,明确性与兼容性 至少包括的内容:
灾难应急预案应该是一个制定、评估、测试、改进、维护的过程,不断改进的过程。 而演练是检验应急预案最好的实践方法,能够提高企业的预案执行能力。 演练前应制定完备的演练方案,明确演练目标、范围、层次、形式等因素;演练后, 应对演练组织,过程,结果等进行评估,从而有效的对应急预案进行改进。 容灾演练的流程
11-

容灾整体解决方案
灾难演练流程
1.确定演练目标与范围 2.确定演练的时间 3.确定演练的测试方案 4.确定灾难演练计划 5.灾难备份中心提前准备就绪 6.灾难备援系统提前准备就绪 7.确定演练参加单位与人员 8.下发演练通知
演练准备 实施演练
1.模拟灾难发生 2.启动灾难宣告流程 3.模拟灾难断开数据复制链路 4.灾难备援系统准备 5.启用备援系统,并确认备援系统 的可用性和正确性 6.启动应用系统,并确认和验证应 用系统和数据的可用性 7.演练营业网点通信切换 8.灾备中心正式接替电脑中心运营 9.业务处理服务重续运行
1.恢复数据备份系统 2.恢复营业网点通信 3.清理演练环境,删除演练数 据
演练恢复 演练总结
1.更新灾难备份系统 2.文档资料更新 3.更新灾难恢复预案 4.形成演练总结报告 5.演练文档资料存档
应急响应与运作 应当制定和实施用于事件响应以及对事件所引起状况进行稳定的规程,包括建立和 管理紧急事件运作中心,该中心用于在紧急事件中发布命令。
2.4 容灾系统中的人员组织安排
容灾系统中成员构成: 领导小组 业务恢复操作组 技术功能操作组 外部协调和联系人员 设备和软件供应商联系人 外部协作机构 企业都应该设立一个由领导挂帅,各业务部门和 IT 部门联合组成的一个容灾指挥 小组。由该小组指挥,IT 部门和业务部门分别执行,IT 恢复计划和业务连续性计划 才能得到同步,从而达到容灾设计的目标。 以下是各个组的主要职能: a) 负责计划的执行 12-

容灾整体解决方案
b) 促进与其它组之间的交流,监督计划的测试和执行 c) 所有或是某一个成员可能领导特定的组 d) 协调恢复过程 e) 评估灾难,执行恢复计划,联系组长 f) 监控并记录恢复的过程 g) 是最终决定优先级设置、各种政策和过程的人 一旦发生灾难,每个人都知道自己应该做什么是容灾系统建设成功的重要因素!
13-

容灾整体解决方案
第3章 容灾建设中 IT 技术的选择
3.1.1 容灾中 IT 技术的选择
我们在做容灾系统方案设计时,根据不同的业务,不同的 RTO\RPO 需求,应当制定 不同的业务连续性计划, 根据不同的业务连续性计划选择不同的技术来实现相应的计划。 我们知道按照《指南》的规定容灾分为数据级的容灾与业务级的容灾。 数据级别容灾的关注点在于数据, 即灾难发生后可以确保用户原有的数据不会丢失 或者遭到破坏。数据级容灾较为基础,其中,较低级别的数据容灾方案仅需利用磁带库 和管理软件就能实现数据异地备份,达到容灾的功效;而较高级的数据容灾方案则是依 靠数据复制工具, 例如卷复制软件, 或者存储系统的硬件控制器, 实现数据的远程复制。 数据级别容灾是保障数据可用的最后底线,当数据丢失时能够保证应用系统可以重新得 到所有 数据。从这种意义上讲,数据备份属于该级别容灾,用户把重要的数据存放在磁 带上, 如果考虑到高级别的安全性还可以把磁带运送到远距离的地方保存, 当灾难发 生 后,从磁带中获取数据。该级别灾难恢复时间较长,仍然存在风险,尽管用户原有数据 没有丢失,但是应用会被中断,用户业务也被迫停止。 应用级容灾是在数据级容灾的基础上,再把应用处理能力复制一份,也就是说,在 备份站点同样构建一套应用系统。应用级容灾系统能提供不间断的应用服务,让用户应 用的服务请求能够透明地继续运行,而感受不到灾难的发生,保证信息系统提供的服务 完整、可靠、安全。一般来说,应用级容灾系统需要通过更多软件来实现,它可以使企 业的多种应用在灾难发生时进行快速切换,确保业务的连续性。 灾难恢复过程中, 通常分为本地与远程二个部分, 通过以下技术 (或层次) 来实现:
14-

容灾整体解决方案
灾难备份恢复技术 灾难备份恢复是指将数据从企业数据中心移动到另一个地点,以便最终恢复。可以 使用磁带备份的异地存储,或者数据中心到另一地点的数据复制实现。这种技术的 实现通常借助企业备份子系统,包括备份软件与硬件:物理带库或虚拟带库等。当 前市场主流的备份软件有 symantec|veritas netbackup、emc|legato netwoerker 等。 本地高可用性技术 指的是将一个或者多个数据系统故障转移至同一站点里立即可用的硬件资源上。例 如,如果某个数据服务器发生了故障,你可以立即让同一数据中心里的另一台物理 机器投入在线工作。这种技术的实现通常借助系统的高可用软件,市场主流的高可 用软件有 IBM HACMP,HP MC-SG,symantec|veritas VCS 等。 远程集群技术 远程集群技术把高可用性推向了一个更高的级别,它指的是在物理地点之间进行的 数据系统故障转移。这种技术的实现通常借助高可用软件的远程模式,市场上支持 远 程 集 群 技 术 的 高 可 用 软 件 有 IBM HACMP ( HACMP-XD ) Symantec|veritas , VCS(global 选项) 这种类型的解决方案比其他任何形式的恢复技术(在速度上)快很多。 远程数据复制技术 通常数据复制地工作机制主要包括同步和异步两种。 同步远程镜像(同步复制技术) 是指通过远程镜像软件, 将本地数据以完全同步的方式复制到异地, 每一本地的 I/O 15-

容灾整体解决方案
事务均需等待远程复制的完成确认信息, 方予以释放。 异步远程镜像(异步复制技术) 保证在更新远程存储视图前完成向本地存储系统的基本 I/O 操作,而由本地存储系 统提供给请求镜像主机的 I/O 操作完成确认信息,远程的数据复制以后台同步的方 式进行。通常由于链路的延迟与衰减, (关于链路的延迟与衰减,请参考附件 1)我 们通常把同步方式称作同城复制,把异步方式称作异地复制。 同步模式与异步模式的对比: 同步模式远程复制: 优点:无数据丢失,业务恢复时间极短; 缺点:1:由于链路延时与衰减的原因,有距离限制(通常不能超过 200KM) ; 2: 由于 1 笔 IO 写入必须主站点与灾备站点全部完成以后才算成功, 所以对生产 应用系统有性能影响; 3:对链路的要求很高,成本较高。 异步远程复制的总结: 优点:业务恢复时间极短,无距离限制,链路成本相对较低; 缺点:有少量数据丢失;
数据的远程复制技术根据作用层次的不同主要分为 3 类: 1. 基 于 存 储 层 面 数 据 复 制 : 主 流 产 品 : EMC SYMMTRIX SRDF 、 EMC CLARIION MIRRORVIEW、IBM PPRC、HDS TrueCopy 等等 2.基于主机层面数据复制:主流产品:Veritas Volume Replicator(卷远程复制) 、 veritas Storage Foundation(卷远程镜像) ibm glvm(卷镜像)等 3.基于应用层面数据复制:Oracle DataGuard,IBM DB2 HADR 等
基于存储子系统的远程复制: 采用基于存储的容灾方案的技术核心是利用存储阵列自身的盘阵对盘阵的数据块复 制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生 灾难时,可以利用灾备中心的数据在灾备中心建立运营支撑环境,为业务继续运营提供 IT 支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企 业的业务运营快速回复到灾难发生前的正常运营状态。 基于存储的容灾方案示意图如下: 16-

容灾整体解决方案
基于存储数据复制技术的容灾方案示意图
同步方式: (同城)
异步方式: (异地)
同 步 与 异 步 结 合 :( 通 常 称 作
2

3
中 心 甚 至
3
地 )
17-

容灾整体解决方案
采用基于存储数据复制技术建设容灾方案的主要缺点是: 通常必须采用同一厂家的存储平台, 通常也必须是同一系列的存储产品, 给用户 的存储平台选择带来一定的限制。 采用同步方式可能对生产系统性能产生影响, 而且对通信链路要求较高, 有距离 限制,通常在近距离范围内实现(同城容灾或园区容灾方案) 采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远 距离通信链路带宽有限的情况下实施。 灾备中心的数据仅用来做保护,通常不可用。 尽管有以上缺点, 基于存储的容灾技术方案仍然是当前企业最优先选择的容灾技 术平台 基于主机层面的的镜像或远程数据复制技术: 采用基于主机的容灾方案的示意图如下:
18-

容灾整体解决方案
基于主机的容灾方案示意图
采用基于主机系统的容灾方式的核心是利用主、备中心主机系统通过 IP 网络建 立数据传输通道,通过主机数据管理软件实现数据的镜像或远程复制,当主数据中 心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据,从而 给企业提供了应用系统容灾的能力。
采用基于主机的数据镜像或复制技术建设容灾方案有以下优点:
1 基于主机的方案最主要的优点是只对服务器平台和主机软件有要求,完全不依 赖于底层存储平台,生产数据中心和后备数据中心可以采用不同的存储平台; 2 既有针对数据库的容灾保护方案,也有针对文件系统的容灾保护方案。 有很多不同的基于主机的方案, 可以满足用户的不同数据保护要求, 提供多种不 同数据保护模式; 3 基于 IP 网络,没有距离限制
同时,采用主机的数据复制技术建设容灾方案有以下缺点:
1 基于主机的数据复制方案由于生产主机既要处理生产请求, 又要处理远程数据 复制,必须消耗生产主机的计算资源,因而对生产主机性能产生较大的影响,甚至 是产生严重影响。 19-

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

数据中心容灾备份方案完整版

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

数据中心容灾备份方案

数据保护系统 医院备份、容灾及归档数据容灾 解决方案

1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化HIS、LIS 和PACS 等系统是目前各个医院的核心业务系统,承担了 病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 2.1 数据备份解决方案 针对于医院的HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的LAN 或LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

容灾备份-解决方案方法

容灾备份系统 2010-8-11 项目背景 随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。

企业的IT 管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID 技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者 数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 二、功能介绍 实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性 数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备” 、“异 地实时灾备” ,全方位保证数据库安全。 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数 据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据 库在3-5分钟。 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停 期间的数据,并重新开始实时备份。 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触 发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。维护 方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据 交换,充分保证数据安全。 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热 容灾备份方式时,从站可采用低档Server 或高稳定性的PC(有足够的存储空间即 可),从而实现极低的总体成本。 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAM(S关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

某公司系统容灾解决建设方案

某公司软件容灾方案 1容灾软件 Symantec 的存储管理软件VERITAS Storage Foundation(简称SF)适用于企业存储管理的标准化平台,它不仅提供比操作系统本身逻辑卷管理器更加强大的在线卷管理功能,还提供许多高级的存储管理功能,其中包括用于容灾的数据镜像、数据复制等功能。是目前市场上广泛使用的容灾软件。 Symantec VERITAS Cluster Server(简称VCS)是一个用于容灾演练、应用级容灾的软件。它是在基本的HA软件功能的基础上发展而来的。 Veritas Storage Foundation 软件可以根据企业不同需求,提供不同的容灾解决方案,小到同城数据镜像,大到两地三中心数据容灾。SF与VCS紧密集成,可以提供完整的、从数据到应用、并自动实时演练的企业容灾方案。 铁道部高铁指挥实验系统采用了SF/VCS实现了容灾。

2数据同城镜像方式 利用灾备中信和主中心之间或者同机房内的裸光纤线路构成SAN环境,直接采用Storage Foundation在两个存储之间实现存储镜像。即所有数据都将同时写入两边的磁盘整列中。 如上图所示,主中心的服务器将应用的每个写i/o数据同时写入到两个中心的存储中。由于镜像的实现是依托于底层的Volume,所有数据存取的过程对于应用来说都是透明的。我们可以通过设臵Volume Manager的读取策略来指定主中心的服务器从本地的磁盘阵列上读取数据,加快数据查询的速度。 在这个场景中,数据发生物理错误的可能性基本上分为两种,生产中心的存储系统出现物理错误,如硬盘问题、光纤卡问题、光纤连接问题或光纤交换机问题等,另外一种就是整个数据中心出现故障。

数据容灾备份设计方案

数据容灾备份设计方案 1.1数据备份的主要方式 目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。 (1)本地备份异地保存 是指按一定的时间间隔(如一天)将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上,然后及时地传递到远离运行中心的、安全的地方保存起来。 (2)远程磁带库、光盘库 是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。 — (3)远程关键数据+定期备份 本方式定期备份全部数据,同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。 (4)远程数据库复制 生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝,通过通信线路将生产系统的数据库日志传送到备份系统,使备份系统的数据库与生产系统的数据库数据变化保持同步。 (5)网络数据镜像 是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪,并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统,备份系统则根据操作日志对磁盘中数据进行更新,以保证生产系统与备份系统数据同步。 (6)远程镜像磁盘 利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远 …

离生产系统的地方,镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。备份拓扑网络结构1.2(即东风东路院区中心机广州市第八人民医院具有两个不同地点的中心机房房和嘉禾院区中心机房),在这基础上是可以构建一个异地容灾的数据备份系统,以确保本单位的系统正常运营及对关键业务数据进行有效地保护,以下设计方案仅提供参考。嘉禾院区数据中心东风东院区数据中心 本方案中,我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。 1.在东风东院区数据中心部署一台EMC 480统一存储平台,配置一个大容量光纤磁盘存储设备,作为整个系统数据集中存储平台。 2.在嘉禾院区数据中心部署一台EMC 480统一存储系统,配置一个大容量光纤磁盘存储设备,作为整个平台的灾备存储平台。 ) 3.两地各部署两台EMC RecoverPoint/SE RPA,采用CLR技术,即CDP(持续数据保护)+CRR(持续远程复制),实现并发的本地和远程数据保护。 4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP(持续数据保护)技术实现本地的数据保护。. 5.两地采用EMC RecoverPoint/SE CRR(持续远程复制)技术,实现远程的数据保护。由于两地之间专线的带宽有限,可以采用EMC Recoverpoint/SE异步复制技术,将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小,如果后期专线带宽有所增加,RecoverPoint会自动切换同步、异步、快照时间点三种复制方式,尽最大可能保证数据的零丢失。 1.3本地数据数据保护(CDP)设计

“双活”容灾引领现代备份技术

“双活”容灾引领现代备份技术虽然每周全量夜间增量备份仍是常态,但很多组织机构逐渐发现他们的数据(以及恢复那些数据所需的条件)打破了长久以来传统备份所依赖的模型。存储管理人员备份操作不当,意味着困难并关键的备份现代化任务迎面而来。 备份现代化将是一个有点痛苦的过程,不仅需要选择一项备份技术,还需要考虑这种转变对关键业务处理和需求的影响。 备份替代技术考量 就备份现代化来讲,有各种各样的解决方案,无论经济实用型方案,还是舶来品。不过,当今有三类主要的数据保护策略: ·持续数据保护 ·快照 ·基于镜像的备份 CDP技术对数据进行近乎连续不断地保护。并非在夜间进行大型备份,CDP产品的备份全天候执行,每隔几分钟就进行一次。CDP产品首先将数据以块的方式复制到磁盘备份介质中。当某个块被创建或更改时,该块被备份。CDP有对版本信息进行跟踪的索引,而数据重删技术能够保证只有不重复的块会被存储到备份介质中。 快照与备份有所不同,前者并不创建数据的拷贝,而是提供将虚拟机、文件或应用回滚到先前某点状态的方法。快照是使用磁盘差分或指针的技术。由于快照并不进行实际备份,一些备份厂商将快照作为一种提高自身产品恢复能力的方式,而不是将其用作单独的数据保护策略。 基于镜像的备份代表着备份领域一种新的策略,并应用于虚拟机备份中。此类备份源于这样一种思想即备份处理对虚拟机进行整体数据捕获。如果需要进行恢复操作,将虚拟机的拷贝挂载至沙盒环境中用以承载数据。沙盒挂载能力有时也用来提供本地恢复测试甚至模拟实验能力。只要你受保护的资源全部部署在虚拟服务器上,基于镜像的备份就能够提供显著的灵活性。

重大业务考量。不管你选择使用哪种备份技术,都有一些与公司业务需求相关的重要因素需要考虑。一些因素在购买一个新的备份系统前就需要考虑,另外一些在新的备份系统安装完毕时,就需要立即考虑。 保留需求。选择一个现代备份系统时你最先需要考虑的你的备份保留要求,换句话说,你在多长的时间之内会需要检索数据。 这样的考虑很是重要,因为大多数现代备份方案都是基于磁盘或云服务,或者两者都是。以磁带为基础的备份能够提供近乎无限的保留跨度,因为你能备份到磁带上,而你想将磁带保留多久都可以,而基于磁盘的备份却并非如此。磁盘的容量是有限的,而容量会影响能够保留在备份中历史数据的总量。 快照的回滚可能引起数据库崩溃,除非该快照产品经过特殊设计,能够与你服务器上运行的应用一起工作。 即使磁盘的容量不是一个问题,一些现代备份应用也会有各种限制。比如,一些CDP 产品区分短期保存(磁盘)和长期保存(磁带),并对前者存储介质上的恢复点数量有十分严格的限制。 代理软件兼容性。如果你正在考虑的备份方案是基于代理的,那么就必须在购买之前把代理软件的兼容性当做一个首要考虑因素。尽管大部分备份软件提供商都会提供适用于大多数流行的操作系统的代理软件,你仍需要核实在你自己的环境下运行的操作系统中,该软件是否能正常使用。 业务识别性。在选择一个备份业务时,业务识别性是最重要的一个标准之一。如果你的备份不仅仅是文件数据,那么你的备份软件都必须支持你所运行的业务。 对于CDP或基于镜像的备份产品,业务识别性的确认通常意味着验证某备份产品是否包含一个Microsoft卷影复制服务(VSS),服务器上你所备份业务的运行需要它。对于快照产品,你则需要找寻细粒度应用回滚功能。 尽管大多数快照应用支持整个服务器的回滚,但可能会对数据库应用造成很严重的后果。因为在获取快照时,快照并不能捕捉储存在服务器内存中的处理状态。因此,快照回滚可能引发数据库崩溃,除非某快照产品对你服务器上的应用进行了定制化设计。 初始备份。在你付费并部署了现代备份解决方案之后,关于你的首次备份,有些事情需

双机容灾系统建设方案建议书

双机容灾系统建设方案建议书

第一章纯软方式双机热备系统建设方案提示:因为纯软双机只支持Windows平台,如不改变现有服务器的Linux操作系统,请跳过本章 由于上述的建设双机系统的必要性和双机系统数据的重要性,就需要搭建一个非常适合双机系统运行和数据存储的平台,以此来保障双机系统安全、高效的运行。只有这样,才能充分发挥双机系统在企业的核心作用,从而全面提升企业的竞争力和生产力。 结合贵方的需求和现状,我们设计一款纯软方式的解决方案,以供参考。 图4.1 拓扑结构图 1.1方案描述 使用用户原有得两台业务服务器,构成一对双机。因为纯软双朵只支持Windows平台,所以需要将两台服务器全部改成Windows 系列操作系统,将原Oralce 9i数据库改成Windows平台版本Oracle数据库。两台服务器通过双机软件组成双机热备系统,双机中任何一台机器发生故障的情况下,由备机接管相应的IP地址、主机名、数据库服务及业务应用。 硬件要求:两台服务器的配置相同(CPU、内存和磁盘分区的类型、大小),

同时配置双网卡 网络环境要求:两台服务器安装相同的操作系统、数据库、应用程序及服务将两台服务器部署到企业的以太网中,分别将两台服务器中的一块网卡设为业务网卡,并分配固定的物理IP地址。将两台服务器的另一块网卡作为心跳网卡,通过一条心跳线相连。两台服务为一主一从的关系,主机为当前业务服务器,从机为灾备业务服务器。主机上的业务数据会被双机软件通过心跳线同步到从机。 通过双机软件虚拟一个业务IP地址,对外提供服务。绑定在主机IP址上,当主机发生故障时,再自动切换到从机物理IP地址上进行绑定。同时,接管数据库服务,应用程序服务等相关业务服务。双机软件以一定时间频率通过心跳线从主机发送验证信息到从机,检验主机是否运行正常,当主机的IP地址,数据库服务,数据存储区三者之一发生问题,双机软件会认为主机业务已停止,需要从机进行业务接管。同时停止主机的服务,开启从机服务。 当主机需要进行系统维护,系统升级,硬件安装等操作时,可手动将业务切换到从机上。当操作完成时,再将数据同步回主机并将业务切换到主机上。 1.2本方案采用双机软件的特性 ●双机软件的产品和服务能够使信息不间断,它通过一个接近无缝的 处理来管理和保护贯穿一个企业的数据。 ●基于双机软件的高可用性和高可靠性,我们选择它作为核心信息系 统和数据库服务器的双机切换软件。

灾备方案

1.数据中心容灾备份解决方案 随着社会的发展和科技的进步,政府日常工作越来越依赖于数据处理来进行,政务系统的连续性依赖于数据中心系统的稳定运行。然而,灾难就像灰尘一样伏击在运营环境周围,政务系统的数据中心可能正在一个充满风险和威胁的环境下运行。如果不能对这些风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成严重的影响。如果核心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失。因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题。 1.1灾备解决方案原则 首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。 第二,数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的; 同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。 第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线。 第四,系统恢复时间要尽可能短。容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务。但往往在灾难发生时,主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进行操作。 第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其 他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。 第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括:SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以及快照技术等。其中基于IP的SAN远程数据容灾备份技术应用比较广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的。当备份中心存储的数据量过大时,可利用快照技术将其备份

点对点容灾解决方案 华为

华为点对点容灾解决方案技术建议书 临时方案 华为技术有限公司 2014年5月12日

目录 1项目概述 (4) 1.1项目需求 (4) 1.2华为点对点整体方案优势 (4) 2点对点容灾方案设计方案 (5) 2.1总体技术方案 (5) 2.1.1点对点容灾方案架构与组件介绍 (5) 2.1.2阵列异步远程复制子方案 (8) 2.1.3阵列同步远程复制子方案 (10) 2.1.4基于VIS的本地高可用子方案 (12) 2.1.5 Oracle Rac的持续化数据保护子方案 (14) 2.2设备选型方案 (14) 2.2.1华为T系列存储系统 (14) 2.2.2 Huawei Tecal RH2285 V2服务器 (18) 2.2.3 OceanStor VIS6600T (21) 2.2.4 OceanStor ReplicationDirector管理软件 (24) 3配置方案 (28)

术语说明

1 项目概述 1.1 项目需求 对于现行业务没有容灾保护的场景下,在面对灾难时,将面临数据丢失,业务长时间中断的风险。传统的单一站点的各种弊端和诸多不便,主要体现在以下几方面: ?难以有效保护核心数据:单一站点在面对突发灾难或者突发事件的时候,无法保护数据的完整性。一旦整个站点在地震等大规模灾难中彻底损坏,客户将面临数据全部丢失的风险。 ?难以提供合理的RPO和RTO:单一站点存在无法提供一个较小的RPO和RTO的限制。 ?系统维护困难:在对单一站点进行维护时,会面临长时间停止业务的风险,对于一个企业来说,业务停止的时间越长,企业受到的影响就越大。 ?难以有效利用现有存储资源:企业在更换高性能存储设备后,如何有效的利用陈旧设备是一个难题。 ?难以实现本地存储高可用:目前的单一存储很难提供有效的本地高可用支持,通过上层的应用软件来实现会影响上层主机性能。对于企业来说,如何在不影响业务运行性能的情况下实现本地存储的高可用是一个难题。 针对上述问题,建议使用点对点容灾方案。点对点容灾方案帮助企业解决数据保护问题,降低系统维护难度,充分利用企业资源,通过存储虚拟化技术实现本地高可用,为实现企业业务稳定、可靠的运行提供整体的解决方案。 1.2 华为点对点整体方案优势 华为公司针对本项目提供了端到端的解决方案。华为主要优势如下: (1)主要部件使用华为自研产品(如存储,交换机,服务器等),兼容性好,高性能,高可靠。 (2)提供较少的数据丢失(3S-5S的RPO)。华为能够提供秒级的RPO保护,为客户提供更好的数据保护。 (3)对华为的存储设备可以做到高中低端互通,充分的利用企业闲置的旧存储设备。 (4)通过存储虚拟化技术(VIS)实现本地存储系统的高可用,提高系统的可靠性。消除单阵列宕机时,业务无法运行的风险。 (5)对于光网络环境使用华为业界领先的光网络技术,提供高质量、高速率、远距离的数据传输支持。 (6)通过统一的管理软件,实现对整个存储资源的集中管理,大大提升管理系统的效率。 使用华为点对点整体方案,能够帮助企业: (1)保护核心业务数据

数据中心容灾备份方案

数据中心容灾备份方案 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于 15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

浪潮双活存储解决方案

浪潮双活存储解决方案 Prepared on 22 November 2020

浪潮数据中心存储双活解决方案 【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: ?AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。 上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在 AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个

XXXX公司Oracle数据库异地容灾方案

XXXX公司Oracle数据库异地容灾方案 2011年08月29日

1、公司简介 XXXX公司。 2、项目背景 ●XXXX有两个数据中心。 ●两个基地之间使用TCP/IP网络进行连接。 ●生产业务系统的后台数据库为Oracle。 ●数据库服务器操作系统为Windows。 ●数据库目前总体数据量约为2.4T。 ●生产系统为双机容错架构。 ●希望远程数据中心成为容灾中心。 3、解决方案 3.1方案原理 这是一个很典型的应用场景,用户对RPO、RTO的要求比较高,用户希望数据丢失尽可能少,恢复尽可能快。可是,要实现这一愿望,传统的容灾方案都是采用昂贵的存储设备或卷管理软件来实现,投入相当惊人,用户很难接受!CommVault的CDR连续数据复制是一个性价比很高的解决方案,工作原理如下图所示:

这个Oracle远程容灾方案的设计思想是:在容灾系统初始化时或备份系统被破坏时,利用备份和恢复来传送数据库的DBF文件;在数据库日常工作时,利用CDR来时复制数据库日志文件,并将日志回滚到备份数据中(对于双机架构来说,原理相同,所需模块相同, 如图生产主机可为双机或集群架构)。系统的数据流如下图所示:

3.2实施过程 在这个方案中,我们采用了CommVault的备份技术和CDR技术,数据共有4份冗余,除了生产数据外,还有容灾数据,本地备份和异地备份数据;这里需要注意的是,在两个数据中心的数据库都是使用本地数据为业务系统提供服务,并且将数据在两个数据中心之间相互复制,以便达到两个数据中心互为容灾中心的目的。整个容灾系统的建立共分4个阶段: ●初始化阶段:通过备份+恢复方式,在容灾站点生成初始化数据 ●容灾复制阶段: 1.通过CDR复制交易日志 2.自动回滚日志实现数据库容灾 3.每天做异地数据库的冷备份 4.每天做本地数据库的热备份 ●灾难重建阶段: 如果数据崩溃,由于本地和异地都有灾备数据,通过本地的直接恢复实现本地网络 的灾难数据重建,避免在远程网络上传送大量的初始化数据 ●容灾演练阶段: 将容灾站点的数据库打开,就可以使用了。恢复正常工作方式,只要将灾备的数据 恢复,然后回滚以前的日志数据,就能恢复容灾复制阶段。 4、技术要点 在这4个阶段中,充分利用了CommVault的独特技术: ●CDR复制:连续数据复制,复制数据库交易日志。 ●断点续传:支持从中断点继续传送。 ●GridStor:支持多个介质服务器使用不同地区的数据源,这样就不需要通过网络来 回传送大量的数据。 ●自动恢复和回滚:支持以时间或者自动的方式,恢复和回滚日志或其它数据,而不 需要手工执行。 ●辅助拷贝:支持将本地的备份数据复制到异地,实现异地的灾备。

异地容灾解决方案

存储升级整合与迁移方案规划建议书

目录 1. 方案总体规划 (4) 1.1存储现状及问题 (4) 2. 方案架构和选型分析 (6) 2.1高端存储平台选型论证 (6) 2.2整体方案及拓扑结构 (10) 2.3本次推荐的VSP及原有USP配置及容量规划 (11) 2.3.1 现有USP硬件配置及升级后配置情况 (11) 2.3.2 现有USP软件配置及升级后配置情况 (11) 2.3.3 新购VSP硬件配置情况 (11) 2.3.4 新购VSP软件配置情况 (12) 3. 数据迁移及服务 (13) 3.1数据迁移概述 (13) 3.1.1 当前系统架构 (13) 3.1.2 存储迁移架构 (13) 3.1.3 TrueCopy项目实施工作表 (14) 3.1.4 HUR项目实施工作表 (15) 3.1.5 ShadowImage项目实施工作表 (17) 4. 项目灾难备份演练、切换策略 (19) 4.1灾难备份演练策略 (19) 4.2灾难备份演练概述 (19) 4.2.1 灾难备份演练的目的 (19) 4.2.2 灾难备份演练的方法 (19) 4.3灾难备份切换策略 (21) 4.3.1 灾难备份切换概述 (21) 4.3.2 灾难备份切换策略 (21) 4.3.3 灾难切换及完整地意义的灾难恢复 (21) 4.3.4 灾难备份系统在技术层面可能存在的恢复缺陷 (22) 4.3.5 关键业务系统灾难恢复方案 (22) 5. 方案总结与介绍 (24) 5.1HDS存储方案特点 (24) 5.2HDS VSP高端存储指标和关键技术 (26) 5.2.1 存储虚拟化功能 (28) 5.2.2 存储逻辑分区技术 (29) 5.2.3 通用复制(UR)软件技术 (30) 5.3HDS VSP高端存储指标 (32)

相关文档
最新文档