数据存储容灾技术浅析

合集下载

数据库容灾的关键技术

数据库容灾的关键技术

数据库容灾的关键技术数据库是现代信息系统的核心组成部分,对于大型企业来说,数据库的稳定运行和数据的安全性至关重要。

然而,由于各种原因,如硬件故障、自然灾害、人为破坏等,数据库可能会遭受破坏或丢失。

为了保障数据库的连续可用性和数据的安全性,数据库容灾技术应运而生。

本文将介绍数据库容灾的关键技术。

一、备份与恢复技术备份与恢复技术是数据库容灾的基础。

通过定期备份数据库,可以在遭受灾难性破坏或数据丢失时进行数据恢复,保障数据库的连续可用性。

备份方式包括全量备份和增量备份,全量备份将数据库的全部数据备份下来,而增量备份则备份自上次全量备份以来的更新数据。

此外,还可以使用快照技术实现数据库的热备份,快照技术可以快速生成数据库的一致性镜像,并在发生故障时进行快速恢复。

二、异地备份技术为了进一步提高数据库的容灾能力,可以将备份数据存储于异地。

在遭受地区性灾难或者数据中心故障时,异地备份技术能够保证数据库的连续可用性和数据的安全性。

异地备份技术常用的方法包括:1. 异地镜像复制:将数据库的变更操作实时复制到异地备份服务器上,保持数据的实时同步。

2. 异地日志复制:将数据库的日志文件实时复制到异地备份服务器上,利用日志回放技术在发生故障时进行数据恢复。

3. 异地存储复制:将数据库的备份数据存储于异地,通过网络传输保障数据的安全性和完整性。

三、高可用集群技术高可用集群技术是数据库容灾的重要手段之一。

通过将多台服务器组成集群,实现数据库的共享和自动故障转移,可以提供高可用性的数据库服务。

常见的高可用集群技术包括:1. 主从复制:将一个主数据库的变更操作实时复制到多个从数据库,实现读写分离和故障转移。

2. 多活集群:在多个数据库之间实现双向同步,任何一台数据库出现故障时都能够自动切换到其他正常节点上。

3. 分布式数据库:将数据库水平切分成多个分片,每个分片都部署在不同的服务器上,实现负载均衡和故障转移。

四、容器化技术容器化技术是近年来兴起的一种新型数据库容灾技术。

数据中心灾备技术浅析

数据中心灾备技术浅析

数据中心灾备技术浅析在当今数字化时代,数据中心已成为企业和组织运营的核心支撑。

然而,各种自然灾害、人为失误、网络攻击等不可预见的因素随时可能威胁到数据中心的正常运行,导致数据丢失、业务中断,给企业带来巨大的损失。

因此,数据中心灾备技术的重要性日益凸显。

灾备技术,简单来说,就是为了在灾难发生时能够迅速恢复数据和业务,保障企业的持续运营。

它包括数据备份、数据恢复、业务连续性规划等多个方面。

数据备份是灾备技术的基础。

常见的数据备份方式有全量备份、增量备份和差异备份。

全量备份会将所有数据进行完整的复制,虽然备份过程较为耗时,但恢复时相对简单快捷。

增量备份则只备份自上次备份以来更改的数据,备份时间短,但恢复时需要依次应用多个备份集。

差异备份则介于两者之间,它备份自上次全量备份以来更改的数据。

在实际应用中,通常会根据数据的重要性、变更频率以及恢复时间要求等因素,综合选择合适的备份方式。

除了备份方式,备份的存储介质也有多种选择。

传统的磁带存储成本较低,但读写速度较慢,适合用于长期离线存储。

磁盘存储读写速度快,适用于需要频繁访问和快速恢复的场景。

近年来,随着云计算技术的发展,云备份也逐渐成为一种流行的选择。

云备份具有灵活扩展、成本可控等优点,但数据的安全性和网络带宽可能会成为限制因素。

数据恢复是灾备技术的关键环节。

当灾难发生后,能够快速、准确地恢复数据是至关重要的。

为了提高恢复效率,通常会提前制定详细的恢复计划,包括确定恢复的优先级、恢复的步骤和流程等。

同时,还需要定期进行恢复演练,以检验恢复计划的可行性和有效性。

在数据恢复过程中,数据的一致性和完整性也是需要重点关注的问题。

如果备份的数据存在不一致或不完整的情况,可能会导致恢复失败或者恢复后的数据无法正常使用。

因此,在备份过程中需要采取相应的措施来确保数据的一致性和完整性,比如在备份前先停止相关业务、使用校验和等技术对备份数据进行验证等。

业务连续性规划则是灾备技术的更高层次要求。

数据库备份与容灾技术

数据库备份与容灾技术

数据库备份与容灾技术数据作为企业和组织最重要的资产之一,必须得到有效的保护和管理。

数据库备份和容灾技术是一种保障数据完整性和可用性的重要手段。

本文将针对数据库备份和容灾技术进行深入探讨,并提供一些实用的建议和指导。

一、数据库备份技术数据库备份是将数据库中的数据和结构拷贝到另一个存储介质中,以防止数据丢失或损坏。

有效的数据库备份技术可以确保数据的持久性和可恢复性。

1.全量备份全量备份是指备份整个数据库的所有数据和结构,将数据库的完整副本存储到备份介质中。

全量备份可以提供最高的数据完整性和可恢复性,但备份时间较长,占用更多的存储空间。

2.增量备份增量备份是基于全量备份的基础上,只备份自上次备份以来的新增或修改的数据。

增量备份相对于全量备份可以减少备份时间和占用的存储空间,但在数据恢复过程中需要应用多个备份。

3.差异备份差异备份是备份自上次完整备份以来发生变化的数据,相比增量备份,差异备份只需要备份当次备份与上次全量备份之间的增量数据。

差异备份相对于增量备份可以减少备份时间和备份数量,但恢复时需要应用全量备份和差异备份。

二、数据库容灾技术数据库容灾是通过构建具有可用性和可恢复性的数据库系统,以防止因自然灾害、硬件故障或人为错误导致的数据库不可用或数据丢失。

常见的数据库容灾技术包括冗余备份、故障切换和灾备复制。

1.冗余备份冗余备份是指将数据库备份存储在多个地理位置或存储介质中,以确保即使某个备份发生故障,其他备份仍然可用。

冗余备份可以通过远程复制、镜像和跨地理位置备份来实现。

2.故障切换故障切换是指将数据库从一个故障的系统切换到一个备用系统,以确保数据库的持续可用性。

常见的故障切换技术包括主从复制、双机热备和集群化部署。

3.灾备复制灾备复制是构建分布式数据库系统的一种方法,通过将数据库复制到多个地理位置的系统中,以实现数据的多地备份和故障容错。

常见的灾备复制技术包括主备复制、多主复制和对等复制。

三、数据库备份与容灾的最佳实践进行数据库备份和容灾时,我们应该考虑以下几个方面来确保数据的安全和可恢复性。

数据库容灾解决方案

数据库容灾解决方案

数据库容灾解决方案数据库在现代企业中扮演着重要的角色,对于数据的可靠性和安全性要求越来越高。

然而,由于各种原因,例如硬件故障、自然灾害、人为错误等,数据库可能会遭受数据丢失或不可用的风险。

为了应对这些风险,数据库容灾解决方案变得至关重要。

本文将探讨几种常见的数据库容灾解决方案,并分析它们的优缺点。

一、主备复制主备复制是一种常见的数据库容灾解决方案。

它的原理是通过将数据库数据从主服务器复制到备份服务器,实现数据的冗余存储和备份。

当主服务器发生故障时,备份服务器可以快速切换为主服务器,从而保证数据的可用性和连续性。

优点:主备复制方案实施简单,成本相对较低。

备份服务器可以处于热备状态,即时响应故障,提高恢复速度。

缺点:主备复制方案不可避免地存在数据同步延迟问题,因为数据是通过网络传输进行复制的,可能会出现部分丢失的情况。

此外,备份服务器处于待命状态,资源利用率相对较低。

二、数据库镜像数据库镜像是一种高可用性和容灾解决方案,它通过将数据库实例实时复制到多个服务器上来实现数据的冗余存储。

当主服务器发生故障时,镜像服务器可以立即接管主服务器的工作,确保业务的连续性。

优点:数据库镜像方案具有较低的数据同步延迟和较高的数据可用性。

它可以实现实时数据同步,保证数据的完整性和一致性。

另外,镜像服务器可以承担部分主服务器的工作负载,提高资源利用率。

缺点:数据库镜像方案需要较高的硬件和网络设备,成本较高。

镜像服务器需要实时监控主服务器的状态,对系统资源要求较高。

三、数据库集群数据库集群是一种高可用性和高容灾性的解决方案。

它通过将数据库分布在多个服务器上,实现数据的冗余存储和负载均衡。

当某个节点发生故障时,其他节点可以接管工作,确保业务的连续性。

优点:数据库集群方案具有较低的数据同步延迟和较高的数据可用性。

它可以实现实时数据同步,并且具有较高的扩展性,可以随着业务的增长进行水平扩展。

缺点:数据库集群方案实施较为复杂,需要考虑节点之间的同步和通信问题。

浅谈云存储环境下的容灾关键技术

浅谈云存储环境下的容灾关键技术
关 键 词 :云 存 储 ;容 灾 ;技 术
中图分类号 :T 3 93 P0 .
文献标识码 :A 文章编号 :10 — 5 9( 1) 5 o5 - 2 07 99 2 2 0 一 1 6 0 0
云储存 ( lu t r g )的基本概 念是 云计 算 ( l u 机 的端 口数 量 、路 由器 的 型 号 、防火 墙 的类 型 、各 种 数 据 的 设 C o d so a e Cod c m u ig o p t n )概念上延伸和发展 出来的一个全新 的理念 ,云计 置、系统中服务器 的数量 、硬件系统 、操作规程 、设备连接线 算 在 信 息 领 域 之 中 有 着 重 要 的 地 位 ,其 是 分 布 式 处 理 路、I P地址、子掩码、共享信息等 问题。 (D s r b t d r c s i g) 并 行 式 处 理 (P r le i t iu e p o e Sn 、 aa l1 二、容灾系统研究现状 p o e sn )、 网 格 计 算 处 理 (G i cm u i g n r c s ig r d o p t n a d 对于早期的容灾系统来讲 , 其应用的范围十分有限 , 通常 p o e sn ) 应 用 的发 展 。云 储 存 是 通 过 整 个 网 络 ,将 及 其 被称之为本地容灾系统 , r c s ig 等 只是在本地范围之内进行 容灾服务器 因此 , 虽然这个本地容灾系统能够容忍硬件毁坏等 问 复杂与繁多的计算处理程序 自动分解成为无数子程序 , 并将这 的应用 。 些 子 程 序 由多 个 服 务 器 所 组 成 的 庞 大 系 统 , 经 过 计 算 分 析 之 题 的出现 , 但是对于火灾 、 建筑倒塌等 自然灾害却没有解决 的 后 , 处理结果回传 给用户。通过云计算 ,能够将网络上的所 有 效 方法 。 将 有信息在非常短 的时间之 内, 处理数 以万计 的信息 , 通过云储 随着科学技术 的不 断发展 与进步 , 容灾技术也在不 断的得 存 ,能够将这些大量 的信息储存在 网络之 中,以此来提供给用 到更新与改进 ,并逐渐 的出现 了异地容 灾系统。 种系统的产 这 户 的 需要 。 . 生,有效的解决 了上述问题 , 于各种 自然灾 害能够有 效的进 对 随着科学技术的不断发展与进 步, 计算机与互联 网的快速 行避免 , 但是仍然有着不妥之处,就是这种异地容灾系统降低 普及 , 各种信息都在越来越多的存储在计算机之中, 逐渐 的形 了数 据 恢 复 的 速 度 , 作 的 效 率 明显 降 低 。 了 有 效 的 对 这 些 工 为 成 了大量信息汇集在计算机存储系统上 。 这种 现象的出现, 使 问题予 以克服 ,出现 了云存储环境下的容灾技术 , 并在各个行 得数据的管理达到 了前所未有的高度 , 并且将信 息储存 的成 本 业 之 中得 到 了广 泛 的应 用 。 有效减低 , 但是在许多优点汇集的过程 中, 同样 出现了诸多的 通 过 上 诉 的分 析 , 在 当前 我 国 科 学 技 术 发 展 的现 实 情 况 问题 , 关 数 据 的 安 全 性 所 受 到 的 威 胁 也 在 不 断 增 加 。 存 储 下, 相 在 还存在着三个较为显著的 问题 : 一是在现有 的容 灾系统中 , 过程 中, 数据 的丢失对各行各业都产生 了极大的影响 。 容灾技 面对 大量 的备份数据 , 管理 系统还 不够 完善 ; 二是面对大规模 术 是在 二十世 纪九十年代 出现 的,并以惊人 的速度迅速 崛起 , 的数据容灾, 其灵活性和效率不高 : 三是在数据加密保护方面 , 不少大 型企业先后提 出了 自己的容 灾方 案, 这些方案 的应用在 还存在着很大的安全隐患。 三 、云 存 储 环 境 下 的 容 灾 关 键 技 术 定程度 上保证 了应 用系统的可恢 复性 , 但是 由于形式较为单 不能够 有效的满 足各 个行 业对 容灾能力的需求。 实际应 在 ( )云存储环境下的容灾关键技术 中的映射技术 一 用的过程中, 如果不能够有 效的保证数据在备份 的时候相对 安 云存储 环境下 的容 灾关键技术 中的映射 技术是 实现 信息 全,那 么就会 比没有 备份还要危 险,但是 ,一系列的加密工作 存储 的核心技术 ,追踪映射 技术十分关键 ,在通常情况下 ,云 会导致容灾技术得不到有效 的发挥 ,并且会产生制约的效果 , 存储 环境 下的处理程序和管理设备程序之 间会 形成 映射 关系, 因此 , 就需要一种技术能够完全的解决掉这些现实 问题 。 云储 这种 管理 能够直接 的影 响到容灾 系统 的应用 。 一是数据 自动迁 存的 出现 , 极大 限度 的解决 了这些现实 问题 , 并且给容灾技术 移,这种 方法 的应用是一种事件触发 的,并且触 发事件还包括 的应 用 给 予 了充 分 的保 障 。 了磁盘容量的扩展、缩小 ,磁盘的损坏、维修,磁盘的饱和 、 云 存 储 技 术 填充等一系列事件,一 旦这 个事件被 触发之后,相关文件就会 云存储 与云计算 比较相似 ,其所 指的都是通过 网格 技术 、 根据系统的指令直接进行映射 ,就是所谓的 白行保存 、复制 、 分布文件 、 中使用 等功能汇 集在 …起 进行 应用。其应 用原理 粘贴 、删除;二是磁盘透 明替换 ,这种方法的应用是使用者要 集 一 就是将网络中的大量信 息存 储在 计算机之中, 能够在 需要的时 先 创 建 一 个 云 存 储 环 境 , 这 样 一 个 环 境 下 将 相 关 的 映 射 数 在 候 在 最 短 的 时 间 内获 取 相 关 信 息 , 且对 疑难 问题 进 行 及 时 的 在容灾服务器上进行 多个副本 的备份 , 并 并且在备份的过程 中不 解答 。 对于云存储来讲 , 我们可 以从其J 一义上的概念上进行理 断的创 建副本 ,防止磁盘 出现损坏之 后无法还 原; 是磁盘容 三 解, 通过互联 网与局 域网的结构来分析 云储 存。所谓的云存 量调整 , 这种方法在应用 的时候有两种情 况, 一种 是对容量进 储 ,就是 以云状 的网络结构对信息进行储存 ,在通常情况下 , 行 扩充,在 这种情况 出现 的时候,主要是 由于磁盘 已经满载, 人们对其 的了解都 是通过局域 网和互联 网。 需要进行新磁盘的加载,然后对磁盘的容量进行修改 , 另一种 在常见 的局域 网系统 中, 如果我们需要有效 的将局域 网进 是对容量进行缩 减, 这种情况 出现的时候 , 在 直接将多余的磁 行高效 的操作 , 在通 常情况下 , 就需要使用者清楚 的知道 网络 盘拆掉就可 以,并不需要进行容量 的修改工作 。 中 的硬 件 与软 件 的 型 号 和配 置 , 并 且 还 需 要 知 道 其 网 络 地 址 、 ( )云存储环境下 的容灾关键技术 中的缓存技 术 二 应用 的交换机 型号、交换机 的端 口数量 、路 由器 的型号、防火 云存储 环境下 的容灾关键技 术中 的缓存 技术是存 储分 墙 的类 型、 各种数据的设置、 系统中服务器的数量、 硬件系统 、 机 构 的核 心 技 术 , 种 技 术 的核 心 思 想 所 指 的 就 是 通 过 准 确 的 这 操作规程、设备连接线路 、I P地址 ( 通常情况 下,所应用 的 计算 , 将缓存有效的应用到容灾系统之 中。 缓存在通 常情况下 , 都是 12 18 0 1 、子掩码 ( 5 . 5 . 5 . ) 9 .6.. ) 2 5 2 5 2 5 0 、共享信 息等 主要是用来 实现数据 的快速备份恢 复, 并且在一定 的过程 中进 等。 但是在应用互联网的过程中 , 使用者只需要知道在进行联 行 相关频率的恢 复。 云存储环境下 的容 灾关键技 术的缓存算 在 网过程 中的用户名和密码 , 就能够较为简单的将计算机接入到 法,主要有 以下两个方面 :一是本地容灾磁盘饱和计算 ,这种 网络之 中,并不需要知道 网络地 址、应用 的交换机型号 、交换 算法是将单位时间 内数据的恢复次数进行统计 , 然后将次数最

分布式存储和容灾备份技术

分布式存储和容灾备份技术

分布式存储和容灾备份技术随着互联网的普及和物联网的兴起,数据量急剧增加,数据的存储和管理成为了企业及个人面临的重要问题。

而传统的集中式存储方案显然已无法满足这种需求,因此分布式存储方案逐渐成为了趋势。

分布式存储是指数据分散存储在多个节点上,而非传统的集中式存储方式。

这种方式可以有效地缓解存储压力,提高系统的稳定性和可靠性。

同时,数据分布在多个节点上还可以提高数据访问的效率。

在分布式存储中,容灾备份技术尤为重要,以确保数据的安全和可靠性。

容灾备份技术是指在出现灾难等异常情况时,通过备份的方式恢复已经丢失的数据。

常见的容灾备份技术包括冗余阵列、镜像备份、异地备份等。

冗余阵列技术可以通过数据的多次备份实现数据的可靠性。

常见的冗余阵列包括RAID 1、RAID 5、RAID 6等。

对于RAID 1来说,数据被镜像到两个磁盘上,当其中一个磁盘发生故障时,另一个磁盘可以继续工作,从而保证数据的安全。

对于RAID 5和RAID 6来说,数据被分散存储在不同的磁盘上,当发生故障时可以通过计算和重建的方式恢复数据。

镜像备份技术是指将数据完全复制到备份设备上,以避免数据因为任何故障导致的数据损失。

在镜像备份中,数据存储在两个设备上,当其中一个设备故障时,另一个设备可以继续工作。

因此,镜像备份技术在容灾备份中扮演了关键的角色。

异地备份技术是指将数据备份到远离本地的地方,以确保当本地发生灾难时数据仍然可以找到。

这种方式一般涉及到跨地域的数据备份,因此需要依赖于高速的网络通信。

总之,分布式存储和容灾备份技术是当下互联网和物联网时代不可缺少的技术。

分布式存储可以提高系统的效率和可靠性,容灾备份技术可以确保数据的安全和可靠性。

随着数据量的不断增加,这些技术的应用也将不断深入,并将成为未来数据存储的主流方案。

数据库管理中的容灾与备份策略

数据库管理中的容灾与备份策略

数据库管理中的容灾与备份策略在数据库管理的过程中,容灾和备份策略是关键的环节。

容灾策略旨在保证系统在遇到故障或灾难时能够迅速恢复正常运行;备份策略则是为了保护数据,以防数据丢失或损坏。

本文将探讨数据库管理中的容灾与备份策略,并提供一些有效的方法。

一、容灾策略1.冗余系统为了实现容灾,建议在不同地理位置搭建冗余系统,确保在一个地区遭遇自然灾害时,另一个地区的系统能够保持正常运行。

冗余系统可以作为备用系统,可以随时接管主系统的工作。

2.虚拟化技术虚拟化技术能够将一个物理服务器虚拟成多个逻辑服务器,这样即使一个服务器出现故障,其他服务器仍然可以继续运行。

通过使用虚拟化技术,可以实现容灾策略,并且更加灵活地进行数据库管理。

3.数据同步数据同步是容灾策略中的重要一环。

通过实时或定期地将主数据库中的数据同步到备用数据库,可以确保数据不会因主数据库故障而丢失。

常用的数据同步方法包括数据库复制和基于日志的同步。

二、备份策略1.完整备份完整备份是指将整个数据库的所有数据都备份下来。

这是最基本的备份方法,可以保证在恢复时拥有完整的数据。

完整备份通常定期执行,例如每天夜间执行一次。

2.增量备份增量备份是指仅备份自上次完整备份以来发生变化的数据。

这样可以大大减少备份的时间和空间开销。

增量备份通常在完整备份之后进行,并在每次数据库更新后进行。

3.差异备份差异备份是指备份自上次完整备份以来发生变化的数据块。

与增量备份相比,差异备份只备份自上次备份以来的差异,而不是每次备份时的差异。

这样可以减少备份时的读写操作。

4.持续备份持续备份是一种实时备份策略,将数据库中的每个修改操作都记录下来,以便在需要时进行恢复。

持续备份通常与日志记录结合使用,能够提供非常高的数据恢复能力。

结语数据库管理中的容灾与备份策略是确保数据安全并保证系统连续性的重要措施。

通过实施容灾策略,可以减少系统故障的影响,保证业务的正常进行;备份策略则可防止数据丢失,将数据恢复到最新的状态。

数据库容灾与紧急恢复技术的成本效益分析

数据库容灾与紧急恢复技术的成本效益分析

数据库容灾与紧急恢复技术的成本效益分析随着信息化时代的到来,数据库成为了企业核心业务数据管理的重要组成部分。

为了确保数据的安全和可靠性,数据库容灾与紧急恢复技术成为了企业必备的技术手段之一。

本文将从成本效益的角度来分析数据库容灾与紧急恢复技术的运用价值和优势。

一、概述数据库容灾与紧急恢复技术是指通过应对各种自然灾害、硬件故障、人为错误等因素对数据库造成的数据损坏或停运引发的风险,来实现系统的高可用性和持续性可操作性。

常用的技术手段包括灾备数据中心、冗余备份、数据复制、容灾演练等。

二、数据库容灾的成本效益分析1. 数据风险防范随着企业数据的不断增长,数据安全和完整性问题成为了企业关注的热点。

通过数据库容灾技术,可以有效减少潜在的风险,保护企业的核心业务不受影响。

一旦发生严重故障或灾害,数据库容灾技术可以实现快速恢复,降低数据损失风险和业务停摆的影响。

这对于需要长时间保存数据或对数据保密性要求较高的行业,如金融、电信等,尤其重要。

2. 业务连续性保障数据库容灾技术可以有效保障企业的业务连续性。

传统的备份和恢复方式需要较长时间,而容灾技术可以实现几乎实时的数据复制和切换,将业务服务中断时间降至最低,极大地减少了业务损失。

例如,凌晨时段很多企业进行备份操作时,可以使用容灾技术实时复制数据,保障业务可用性。

3. 高可用性与灵活性数据库容灾技术通过使用冗余备份服务器、多路复制和集群技术,提供了数据的高可用性和灵活性。

一旦主服务器发生故障,备份服务器可以快速接管服务,实现连续运营。

而且,通过对数据实时复制到多个地点或数据中心,可以提供灵活的数据访问和容灾热备。

这样,无论是远程办公、异地备份还是灾难恢复都能够得心应手。

三、紧急恢复技术的成本效益分析在数据库紧急恢复技术中,常用的技术手段包括数据库备份和恢复、日志文件恢复等。

1. 数据可靠性和完整性保障通过数据库备份和恢复技术,可以实现数据的可靠性和完整性保障。

备份是将数据库的原始数据复制一份,并保存在其他服务器或存储介质上。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

容灾技术浅析本帖最后由爱如潮水于2009-10-29 10:42 编辑1.概念篇1.1 容灾的定义在给出容灾的概念之前,有必要先给出灾难的定义。

从一个计算机系统的角度讲,一切引起系统非正常停机的事件都可以称为灾难。

大致可以分成以下三个类型:自然灾害,包括地震、火灾、洪水、雷电等,这种灾难破坏性大,影响面广;设备故障,包括主机的CPU、硬盘等损坏,电源中断以及网络故障等,这类灾难影响范围比较小,破坏性小。

人为操作破坏,包括误操作、人为蓄意破坏等等。

容灾(Disaster Tolerance),就是在上述的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。

一个和容灾易混淆的概念是容错(FaultTolerance),容错指在计算机系统的软件、硬件发生故障时,保证计算机系统中仍能工作的能力。

容错和容灾最大的区别是,容错可以通过硬件冗余、错误检查和热交换再加上特殊的软件来实现,而容灾必须通过系统冗余、灾难检测和系统迁移等技术来实现。

当设备故障不能通过容错机制解决而导致系统宕机时,这种故障的解决就属于容灾的范畴。

另外一个容易和容灾混淆的概念是灾难恢复(DisasterRecovery),灾难恢复指的是在灾难发生后,将系统恢复到正常运作的能力。

灾难恢复和容灾的区别是,容灾强调的是在灾难发生时,保证系统业务持续不间断地运行的能力,而灾难恢复强调的灾难之后,系统的恢复能力。

现在的容灾系统都包含着灾难恢复的功能,所以本文的讨论除了包括容灾方面的内容,还包括了灾难恢复的部分内容。

1.2 容灾的评价指标现在工业界都以数据丢失量和系统恢复时间作为标准,对某个容灾系统进行评价,公认的评价标准是RPO和RTO。

RPO(Recovery Point Objective): 恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。

RPO标志系统能够容忍的最大数据丢失量。

系统容忍丢失的数据量越小,RPO的值越小。

RTO(Recovery Time Objective): 恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。

RTO标志系统能够容忍的服务停止的最长时间。

系统服务的紧迫性要求越高,RTO的值越小。

RPO针对的是数据丢失,RTO针对的是服务丢失,两者没有必然的联系,并且两者的确定必须在进行风险分析和业务影响分析之后根据业务的需求来确定。

1.3 容灾的分类由于容灾包含的内容比较广泛,对容灾的分类也可以从多个方面进行。

总的来讲,可以从容灾的范围和容灾的内容来区分。

从容灾的范围讲,容灾可以分成本地容灾、近距离容灾和远距离容灾。

这三种容灾能容忍的灾难是不相同的,采用的容灾技术也是不同的。

从容灾的层次讲,容灾又可以分成数据容灾和应用容灾,本质上讲,这两种容灾是密不可分的。

数据容灾是应用容灾的基础,没有数据的一致性,就没有应用的连续性,应用容灾也是无法保证的。

数据容灾是指建立一个备用的数据系统,该备用系统对生产系统的关键数据进行备份。

应用容灾则是在数据容灾之上,建立一套与生产系统相当的备份应用系统。

在灾难发生后,将应用迅速切换到备用系统,备份系统承担生产系统的业务运行。

1.4 容灾的等级划分由于容灾系统需要考虑众多的因素,目前,根据容灾系统中数据的丢失程度、生产系统和备用系统的距离,以及灾难恢复计划的状态等因素,公认的容灾级别划分如下:1. 本地容灾:即将系统数据或应用在本地备份,无异地后援。

这一级别的容灾,仅能应付本地的硬件损坏或人为因素造成的灾难。

2. 异地数据冷备份:即将系统数据备份到物理介质(磁盘、磁带或光盘)上,然后送到异地进行保存。

这种方案成本低、易于实现。

但是在灾难发生时,数据的丢失量大,并且系统需要很长的恢复时间,无法保持业务的连续性。

3. 异地数据热备份:即在异地建立一个热备份中心,采取同步或者异步方式,通过网络将生产系统的数据备份到备份系统中。

备份系统只备份数据,不承担生产系统的业务。

当灾难发生时,数据丢失量小,甚至零丢失,但是,系统恢复速度慢,无法保持业务的连续性。

4.异地应用级容灾:即在异地建立一个与生产系统相同的备用系统,备用系统与生产系统共同工作,承担系统的业务。

这种类似于RAID1的容灾系统,能够提供很小的数据丢失量,系统恢复速度是最快的。

但是,需要配置复杂的系统管理软件和专用的硬件,相对成本也是最高的。

在上述的级别之上,又有人提出业务级别的容灾级别。

对于正常的业务而言,仅靠IT系统的保障是不够的,业务级别的容灾包括众多非IT系统的设施,比如电话,办公环境等。

2.技术篇传统的容灾技术通常指针对生产系统的灾难采用的远程备份系统技术。

但是,随着对容灾系统要求的不断提高,现在的容灾技术包括了可能引起生产系统服务停止的所有防范和保护技术。

一般来讲,一个容灾系统中实现数据容灾和应用容灾采取不同的实现技术,数据容灾的技术包括数据备份技术、数据复制技术和数据管理技术等,而应用容灾包括灾难检测技术、系统迁移技术和系统恢复技术等等。

本章节对数据容灾相关的数据备份技术和复制技术以及应用容灾相关的灾难检测技术和系统迁移技术做初步的介绍和分析,其它的技术请参考相关技术资料。

2.1 数据备份技术数据备份就是把数据从生产系统备份到备份系统中的介质中的过程。

数据备份技术最初是备份到本地磁带,随着网络发展,现在的备份技术有了飞速的发展。

2.1.1 主机备份这种备份就是传统意义上的基于主机(Host-based)的备份。

主机负责将数据备份到和主机直接相连的存储介质上(一般是磁带)。

虽然这种备份的速度快,管理简单,但是仅能适应于单台服务器备份,并且在灾难恢复过程中,系统恢复的时间长。

2.1.2 网络备份随着网络的发展,传统的主机备份渐渐地转向了网络备份,即系统中备份数据的传输以网络为基础。

根据备份系统中备份服务器、介质服务器是否在同一个LAN中,可以将网络备份分为基于局域网的备份和远程网络备份。

基于局域网的备份特点是应用服务器、备份服务器和介质服务器共用一个局域网络,备份服务器统一管理备份的过程,多个应用服务器可以将各自的数据备份到介质服务器上。

这种备份方式可以共享介质资源,实现集中的备份管理。

缺点是对网络带宽和备份时间的压力比较大,并且不具备远程的容灾能力。

当然通过将介质(磁盘、磁带或光盘)运输到远程保存,可以具备一定的容灾能力。

远程网络备份,则是介质服务器与应用服务器不属于同一个局域网,备份服务器依然统一管理备份的过程,备份数据则是通过WAN,ATM或者Internet等公共网络传送到远程的介质服务器上。

这种备份方式基本上构成了一个异地的备份容灾方案。

由于备份数据在公共网络上传输,备份的速度、备份数据的完整性和安全性等方面都需要考虑。

2.1.3 专有存储网络备份当存储系统成为一个独立于备份系统的系统之后,特别是存储局域网(SAN:Storage AreaStorage)的发展,使得备份过程可以在存储局域网中实现,根据备份过程中对应用服务器的影响,专有存储网络备份可以分为LAN-Free 备份和Server-Free备份。

LAN-Free备份,是在存储网络(StorageNetwork)之上建立的一种备份系统。

在该备份系统中,生产系统的存储和介质服务器的存储直接通过专用存储网络进行连接,在备份过程中,庞大的备份数据不经过主机系统所在的网络,而是通过专用的存储网络传输到介质上。

这种备份方式的优点是共享介质资源,实现集中管理,不会对主机系统网络有影响。

缺点是实现比较复杂,成本相对较高。

Server-Free备份,则是建立在存储区域网(SAN:Storage AreaNetwork)的基础上,备份过程无需应用服务器参与数据传输的备份系统。

这种备份方式可以保证生产系统及其网络不受影响。

目前这种备份技术还不太成熟,对硬件的性能和兼容性的要求都很高。

专用存储网络备份更多关注的是存储系统的扩展性、可用性以及性能等方面的因素,可以讲存储局域网的发展将会在更大程度上提高系统的数据容灾能力。

2.2 数据复制技术和数据备份相比,数据复制技术则是通过不断将生产系统的数据复制到另外一个不同的备份系统中,以保证在灾难发生时,生产系统的数据丢失量最少。

按照备份系统中数据是否与生产系统同步,数据复制可以分成同步数据复制和异步数据复制。

同步数据复制就是将本地生产系统的数据以完全同步的方式复制到备份系统中。

由于发生在生产系统的每一次I/O操作都需要等待远程复制完成才能返回,这种复制方式虽然可能做得数据的零丢失,但是对系统的性能有很大的影响。

异步数据复制则是将本地生产系统中的数据在后台异步的复制到备份系统中。

这种复制方式会有少量的数据丢失,但是对生产系统的性能影响较小。

根据数据复制的层次,数据复制技术的实现可以分成以下四种:1. 存储系统数据复制:数据的复制过程通过本地的存储系统和远端的存储系统之间的通信完成。

这种方式的复制对应用来讲时透明的,可以直接实现数据容灾功能,也可以提供很高的性能,可是,对存储系统的要求比较高。

2. 数据交换层数据复制:这种方式的复制技术是伴随着存储局域网的出现引入的,即在存储局域网的交换层上实现数据复制。

实现方式可以通过专有的复制服务器实现,也可以通过存储局域网(SAN)交换机,将数据同步的复制到远端存储系统中。

3. 操作系统层数据复制:主要通过操作系统或者数据卷管理器来实现对数据的远程复制。

这种复制技术往往要求本地系统和远端系统是同构的,并且由于数据复制由主机系统完成,其效率和管理上也存在不少问题。

4.应用程序层数据复制:例如数据库的异地复制技术,通常采用日志复制功能,依靠本地和远程主机间的日志归档与传递来实现两端的数据一致。

这种复制技术对系统的依赖性小,有很好的兼容性。

缺点是本地应用程序向远端复制的是日志文件,这需要远端应用程序重新执行和应用才能生产可用的备份数据。

另外,由于各个应用程序采取的复制技术不同,无法以一种技术实现多种应用的数据复制。

2.3 灾难检测技术对于一个容灾系统来讲,在灾难发生时,尽早地发现生产系统端的灾难,尽快地恢复生产系统的正常运行或者尽快地将业务迁移到备用系统上,都可以将灾难造成的损失降低到最低。

除了依靠人力来对灾难进行确定之外,对于系统意外停机等灾难还需要容灾系统能够自动地检测灾难的发生,目前容灾系统的检测技术一般采用心跳技术。

心跳技术,其中一个实现是:生产系统在空闲时每隔一段时间向外广播一下自身的状态。

检测系统在收到这些“心跳信号”之后,便认为生产系统是正常的,否则,在给定的一段时间内没有收到“心跳信号”,检测系统便认为生产系统出现了非正常的灾难。

心跳技术的另外一个实现是:每隔一段时间,检测系统就对生产系统进行一次检测,如果在给定的时间内,被检测的系统没有响应,则认为被检测的系统出现了非正常的灾难。

相关文档
最新文档