两地三中心容灾解决方案

两地三中心容灾解决方案
两地三中心容灾解决方案

两地三中心容灾解决方案

2010-12-26

目录

1“两地三中心”容灾系统建设的功能目标 (3)

2两地三中心”容灾系统技术方案 (4)

2.1总体设计方案 (4)

2.2容灾方案实现 (5)

2.2.1同城应用级容灾方案 (5)

2.2.2异地数据级灾备方案 (6)

3基于SHAREPLEX的容灾方案 (7)

3.1S HARE P LEX FOR O RACLE产品介绍 (7)

3.2S HAREPLEX主要技术指标 (8)

4成功案例 (10)

4.1银联数据 (10)

4.2山西移动 (12)

4.3北京地税 (15)

4.4S HARE P LEX国内部分客户 (18)

1 “两地三中心”容灾系统建设的功能目标

理想目标:在确保系统稳定安全的前提下,颠覆“切换时长、数据丢失,平时不用、浪费投资,决策困难、影响巨大,演练复杂、风险增加”的传统“灾备”模式,创建全新“容灾”理念,使新增投资平时发挥生产效力、实现容纳各种灾难、确保业务连续和数据安全的崭新模式。

同城应用级容灾:覆盖能被客户直接感知的各类业务,平时与主机房同时运行,负载均衡使用,可分担各查询业务流量。当容灾机房或主机房任何一处出现灾难造成的非计划内停机,则另一个机房都能在保证不丢失数据的前提下,继续对外提供同样的服务,对业务或对客户的感觉影响极低。

异地容灾;异地容灾机房,存放一台存储设备和一台核心业务验证服务器,异步存储数据,容许0-15分钟数据丢失。发生城市级灾难时仍可以有效恢复生产系统核心数据和,。

最终实际目标:以系统稳定、安全、高效为基本前提,经严格论证和实测,可以逐步退守,直至实现一定投资下“高可用性和高安全性”的平衡。

容灾系统将能够应对下述的灾难和风险,确保数据安全性和业务连续性:

灾难发生的百分比统计

电源问题

硬件、软件、程序故障

机房其它基础设施故障

系统设计失误

小失误/故障长期累加

人为操作失误或渎职

蓄意破坏/病毒/黑客

网络/线路故障

技术失败

大规模自然灾害

其它

0102030405060708090100

Number of Declarations

2 两地三中心”容灾系统技术方案

2.1 总体设计方案

生产系统的容灾系统拟建成“两地三中心“模式。

同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。

同城应用级容灾的主要目标为业务连续性,同城双中心需要数据实时同步或准同步,RPO=0,同城范围有效保证了数据的安全性和业务连续性;

异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

异地灾备系统的主要目标为数据安全性,复制距离较远,容灾距离:一般200公里以上。主要应对地区级数据风险。本方案中计划在海口建立异地的数据备份中心。在异地复制方案

中,一般采用异步复制技术,需要尽可能降低数据丢失机率;带宽要求低,减少维护性成本;

● 数据库同步方案

在本方案中,建议使用SharePlex for Oracle 软件来实现生产系统数据库到同城灾备中

心和异地灾备中心的数据准实时同步。

● 非结构化数据同步方案

对于目前生产系统中的非结构化数据,同城的灾备中心可使用同时上传的方式,即应用

程序每次将文件上传时,要求必须同时上传到生产中心和同城的灾备中心,以保证应用切换后,所有非结构化数据均可在同城容灾中心访问。

异地的灾备中心,因仅需要实现数据的异地备份功能,则可以考虑使用脚本定期将生产

系统产生的非结构化数据传输到异地灾备中心的方式实现,文件的更新频率可根据生产系统业务量,以及容灾需求来确定,本方案中建议每30分钟同步一次增量的文件。同步方式可使用FTP 脚本或其他第三方文件同步工具实现。

2.2 容灾方案实现

异地灾备数据库生产数据库

同城灾备数据库终端客户

2.2.1 同城应用级容灾方案

由于目前生产系统才用的均为C/S 结构的应用,因此,本方案中,同城的应用接管建

议使用网络层面的切换来实现。当生产中心数据库主机出现系统级故障,暂时不可用时,可使用网络设备,通过IP地址或域名解析的方式,将所有终端客户重新指引到同城的灾备中心数据库服务器,实现业务的全面接管。

●切换决策

本方案中建议采用专用的负载均衡设备来实现IP地址或主机域名的切换,该设备通常可自动检测数据库是否可用等状态,并可实现自动的切换,但本方案中,考虑到整个系统的安全性和稳定性,建议最终的切换决策必须手工确认,如使用网络设备自动实现,则可能在某些特殊的情况下增加以外的切换风险

●正向接管和反向回切,

在出现问题后,SharePlex解决方案可以进行应用接管,而当原系统恢复正常时,可以将接管期间的增量数据反向同步回去,平滑地实现接管和反向回切。

●切换步骤及时间

本方案中的应用接管将主要包括网络切换和数据库的切换步骤,网络切换可有硬件设备自动完成,数据库切换则需要在切换前确认容灾数据库的运行状态,并执行一些相关的切换脚本,所有步骤均可在方案部署时统一编写脚本,确保整个切换步骤简单、迅速。

根据现有生产系统的实际情况,切换时间可控制在10-15分钟以内

●终端用户影响

生产系统现有的用户主要通过C/S方式访问系统,因此,在生产系统数据库出现故障时所有用户会出现数据库连接中断的错误,当灾备数据库实现接管后,仅需要重新连接数据库服务器即可继续使用,不需要任何额外的切换或操作步骤。

2.2.2 异地数据级灾备方案

生产系统异地灾备系统的设计目标是发生城市级灾难时仍可以有效恢复数据和柜面行内业务,即实现数据安全保护和核心业务的业务连续性,提供可恢复能力。

●数据保护能力

建立异地灾备系统最重要的目标是保障核心业务系统的数据安全,规避数据风险,保障数据在任何情况下万无一失。通过SharePlex进行数据复制,目标系统是一个打开的“看得见,摸得着”数据库,不会出现基于硬件方式复制在极端情况下无法打开数据库的风险,可以最大程度地保障宝贵数据的安全性。

●网络带宽使用

带宽使用较少不仅可以减少电信网络的租用费用,还可以满意日后数据增长的扩展性需求。通过SharePlex进行数据复制,对带宽使用只有日志文件1//3的内容,而且平均分布到所有时间点,可以极大地节省带宽租用的成本,不仅可以满足现有的需求,还可以满意日后数据增长的扩展性需求。

●复制延迟

数据延迟关系到灾难发生时的数据丢失多少,对于异地灾备来说,任何复制技术必然会数据延迟和数据损失,数据损失越少越好。SharePlex解决方案随时解析联机日志,存储到自己的队列并传输到目标系统,然后加载到数据库中,这个过程的延迟非常小。

3 基于SharePlex的容灾方案

3.1 SharePlex for Oracle产品介绍

下图所示为SharePlex for Oracle的基本结构:

数据捕获

SharePlex for Oracle由捕获进程来收集发生变化的数据,捕获进程驻留在源系统上,自动读取Oracle的在线日志文件。这种读操作是从操作系统的角度来完成的,而不是通过数据库。通过将日志文件作为获取变化信息的源泉,Quest可以完成数据的复制而不会给生产系统带来额外的开销。由于Oracle将所有的事物变化记录到日志中并使用日志文件进行系统恢复,因此Shareplex for Oracle可以通过解析日志文件保障数据的一致性。

捕获进程连续监控日志文件用以捕捉变化信息。当日志文件中出现一条新记录时,

SharePlex判断其是否属于被复制对象,如果是,则SharePlex为该条记录加入用于决定此记录将被发向那个主机的地址信息并将包含地址信息的记录存放到自己的队列中,存储队列存在于数据库之外。发生改变的数据被立即处理并被发送到目标系统中而不等待提交或回滚动作的完成,因为等待提交或回滚完成将带来延迟。当提交或回滚信息被写入日志文件时,它们也将被发送到目标系统中,从而在目标系统中完成相对应的操作。

捕获进程具有如下特点:

●捕获进程从Oracle 日志文件中读取信息,因此复制过程不会给生产数

据库实例带来性能问题;

●只有发生改变的数据被传输,而不是日志文件中的全部信息,因此

SharePlex的网络负载非常小;

●尽管需要在Oracle数据库中安装少量的对象用来存储有关复制的一些

基本信息,但源数据库不需要参与到数据捕获和传输过程中;

SharePlex的捕获进程不但可以读取在线的日志文件,而且可以读取归档日志,甚至当归档日志文件被移动到其它设备上时,SharePlex会发出提示信息。正是这种能力极大地增强了系统的冗余功能。例如,如果捕获进程由于某种原因被停止,当它重新启动后数据同步不会受到影响;

数据传输

SharePlex for Oracle在基于TCP/IP协议的网络环境完成源和目标系统之间的数据传输。其相关的进程确保数据的正确接收和网络数据包的正确顺序,从而提供网络传输冗余,确保数据的完整。整个数据传输过程无需其它的中间件。

应用数据

应用进程将传送到目标系统中的信息转化为SQL语句,然后发送给Oracle执行。

SharePlex能够实现精确复制的一个重要原因就是其能保证从源数据库到目标数据库的Oracle读一致性,不但按顺序复制事务,而且也复制上下文信息,将源数据库中发生变化的全部事务信息都复制到目标数据库中。

3.2 Shareplex主要技术指标

Shareplex产品的主要技术指标见下表:

4 成功案例

SharePlex for Oracle产品面世已经有十年时间,目前在全球范围内有1000家以上的成功案例,其中中国大陆地区有70家。

4.1 银联数据

银联数据服务有限公司是中国银联股份有限公司(简称“中国银联”)的子公司,公司成立六年来,以银行卡发卡数据处理外包服务为突破口,秉承“市场第一、客户第一、服务第一”的企业理念,积极进取,勇于开拓,赢得了广大客户的信任和尊重,在国内发卡数据处理外包服务市场处于绝对领先地位。截止2009年6月30日,公司已经与兴业银行、民生银行、华夏银行、中国邮政储蓄银行、花旗银行、东亚银行等境内外66家机构签署发卡外包服务合同,其中58家机构已经在银联数据发卡系统上发卡运营,卡量累计1700万张。公司主要业务包括:

●贷记卡业务:银联数据为客户银行提供发卡业务的一揽子解决方案。包括客户银行

的信用卡中心设计,业务规划、系统建设、业务培训和咨询,7X24小时运营,全

程服务。目前,已经与银联数据合作以外包模式发卡,和正在积极筹建中的合作

方已有邮政储蓄银行、华夏银行、民生银行、兴业银行、东亚银行等四十余家银

行。

●借记卡业务:是一个以处理卡片支付为主线,处理整个零售银行业务的系统,已经

过多年的实际生产验证。该系统具有客户管理、产品定义、卡片管理、账务处理

与会计核算、业务处理和风险控制等基本功能,支持转账与支付、储蓄存款、小

额信贷、个人理财等零售银行业务处理,提供有灵活的卡产品、业务产品定义和

卡片、客户个性化服务定制功能。

●银联数据预付卡业务:是一个专门用于发行和管理小额支付卡的系统,能够支持国

内外金融机构、非金融机构发行支付卡的业务处理。系统具有产品定义、卡片管

理和行业支付等基本功能,提供有灵活的卡片个性化服务定制功能。

业务挑战

为了提高为各个银行提供卡业务的服务质量,银联数据计划在北京建设异地灾备系统。技术需求如下:

●接管时间(RTO):2小时

●数据恢复点目标(RPO):15分钟

●目标系统平时能够承担查询业务,实时可用;

●对网络带宽的使用小,节省电信网络租用费用,提高投资回报;

●不影响源系统的运行;

●可扩展性强,能够支持未来三年的数据量;

解决方案

银联数据在与其它方案进行了仔细对比以后,确定选用Quest公司的SharePlex解决方案。SharePlex具有对带宽要求低,对源系统性能影响小,容易部署等特点。

SharePlex解决方案如下图:

●生产系统采用了Sun 25K,建立了四个分区,每个分区上运行1到多个Oracle实

例。包括不同公司的信用卡,贷计卡信息。

●针对每个实例,建立从上海到北京的复制链路。

●通过Shareplex建立生产中心到灾备中心的异地数据复制;

●当灾难发生时,通过灾备库进行容灾接管;

●灾备库可以在平时运行查询业务;

●生产中心每台机器上可能有多个数据库,与目标端的数据库一一对应。

用户收益

银联数据异地灾备项目实施后通过部署Shareplex解决方案,用户获得了以下收益:

1.实现了容灾系统建设目标

解决方案充分实现了容灾系统的建设目标,目标数据库出于打开的状态。能够确保目标数据的安全性。经过了几次容灾演习,非常顺利地实现应用接管和反向回切。RTO和RPO 满足大大低于预订目标。

2.网络带宽使用少,维护成本低

银联数据采用从上海到北京的复制,在目前带宽为4M的情况下能够保障复制的实时性。Shareplex for Oracle方案对带宽的使用只有日志文件1/3,对带宽占用较少减少了每年租用带宽的成本,提供了总体投资回报。

3.全面提升了银联数据的服务能力,

容灾系统建设后,为银联数据的中小银行的信用卡和贷计卡提供了容灾服务,服务的提升可以避免现有客户的流失,保持企业竞争力。

4.2 山西移动

用户概述

中国移动通信集团山西有限公司(简称中国移动山西公司),于1999年9月1日成立,2002年7月在香港和纽约成功上市,成为中国移动(香港)有限公司的全资子公司。注册资本28亿元人民币,资产规模超过80亿元,服务的用户数接近1500万。

山西移动主要经营移动话音、数据、IP电话和多媒体业务、计算机信息网络国际联网和基于移动通信业务的各类增值业务。除提供基本话音业务外,还提供数据、传真、IP电话、无线上网、宽带接入、视讯通、移动办公、信息点播、彩铃、彩信、手机证券等多种增值业务。拥有“全球通”、“神州行”、“动感地带”等著名服务品牌。

目前全省已建成了以营业厅服务、1860电话服务及互联网服务、大客户个性化服务为

主体的客户服务体系,营业网点达到4200多个。

业务挑战

集中化管理是IT系统发展的一个趋势,山西公司在完成BOSS系统的集中化管理后,大大提高了系统的可维护性、可管理性、可扩充性。

但正如把一筐鸡蛋放进一个篮子里一样,集中化管理也带来了一定的风险。而且,近几年随着业务的发展,集中的BOSS系统所支撑的客户规模剧增,如何提高系统运行的高可靠性、抵抗灾难、提高业务连续运行的能力就成为山西省移动公司现阶段面临的一个挑战。解决方案

山西移动根据业务的迫切需求,在与其它方案进行了仔细对比以后,确定选用Quest 公司的基于SharePlex业务支撑系统应急、报表解决方案。SharePlex具有对源系统性能影响小,复制延迟小,并能快速的实现关键业务的接管与反向回切,以及分担查询报表等业务等特点。

SharePlex解决方案如下图:

生产应用服务器

查询应用服务器

备份磁带库

Archive log

●生产系统使用采用Oracle RAC架构,由两个节点共同承担业务的访问;

●生产系统的数据安全主要有本地的磁带备份与基于Oracle Standby技术的容灾数据库保

障;

●应急、报表数据库采用SharePlex数据复制技术,实施的同步生产系统中交费等关键业

务,以及报表业务所需数据;

●应急、报表数据库一直处于可用状态,可分担生产系统的查询业务,以减轻生产系统数

据库的负担。

●当生产数据库出现系统故障,无法对外提供服务时,可由应急、报表数据库在3-5分钟

内实现关键业务的接管。

用户收益

山西移动的应急、报表方案能够解决各种发生概率较高的系统故障,保护关键业务应用在7X24小时内不间歇运行。从技术上保障了业务系统的连续性和数据的安全性。独立的报表、查询数据库也大大减轻了生产系统的负担,使得高峰期业务办理的性能有了大幅度的提高。

快速应用接管和反向回切

山西移动应急方案充分考虑到了应用、数据和系统各级的保护,当生产系统出现任何软

件、硬件或其他不可知故障时,占整个业务量75%以上的关键业务能迅速的实现应用的接管,接管步骤可在几分钟内完成;当应用切换到应急系统后,SharePlex的数据复制会自动切换成由应急系统到生产系统的反向复制,并把切换之后产生的数据变化,以对列文件的形式缓存在SharePlex独立的队列文件系统中,而当生产系统数据库恢复后,可将切换后所有的数据变化,反向增量同步回生产数据库,同时应用可以迅速切换回生产数据库运行。

SharePlex的应急解决方案大大的降低了切换时间、切换风险以及切换操作的成本,为山西移动的业务支撑系统提供了有效的业务连续性保障。

报表及查询业务的分担

通过应用和中间件双重灵活配置,充分保证了各种情况下报表打印和数据查询的正确性,即达到了降低生产数据库的额外压力,又满足了前台业务人员对业务数据即财务数据稽核的要求。

根据报表中心迁移到应急数据后对营业数据库性能分析,正常时段内,营业数据库的等待事件平均下降了10%,业务高峰时段内等待事件下降了20%左右,以前月初由于月报表打印导致回滚段资源紧张的情况已经不再出现。由于报表的分离,目前前台核心业务报表的打印速度提升了30%左右。

4.3 北京地税

用户概述

北京市地方税务局是主管北京市地方税收工作的市政府直属机构,于1994年8月15日正式成立。业务上接受国家税务总局的指导。它主要负责组织实施北京市各税(费)种的征收和管理(不包括已明确由国家税务机关负责征收的地方税部分)。同时进行税务法规、宣传等方面的等方面的工作。

北京地方税务局于1995开始建设税务管理信息系统,已经形成了连接全市23个区县分局及217个税务所的三级税务专网,实现了税收征管、办公及综合管理业务的电子化。目前北京地方税务局已经具备了进一步利用新技术,发展新的电子化应用,拓宽税收征管信息化应用领域,开展基于互联网技术的高度统一、严格规范的纳税服务的条件。

北京地税的容灾系统于2004年开始建设,其核心复制软件Quest Software的SharePlex,不但达到了系统的高可用性的目标,而且实现了投资收益的最大化。

业务挑战

随着最终客户网上纳税的开通(网上纳税的服务内容包括网上申报、企业年检审批、综合查询等业务。)以及数据集中机制的施行,鉴于税务行业的特点,最终客户对业务连续性和企业数据安全性的要求也越来越高,建设一个可靠而高效的容灾系统成为当务之急。另外由于数据量的不断增加,市局和各个区县的查询业务,已经严重的影响了生产系统的性能,很多查询业务只能等到晚上才能运行。用户希望在保护已有软、硬件投资的前提下,通过高效的容灾系统,实现系统的高可用性,全力保障系统24X7的可用性,同时为区县级市局的查询业务提供一个专用的与生产数据库准时是同步的查询数据库。

解决方案

北京地税根据自己对其它Quest产品已有的应用感受,在与其它方案进行了仔细对比以后,确定选用Quest公司的SharePlex解决方案。SharePlex具有对源系统性能影响小,独立性强,充分利用现有软、硬件资源和容易部署等特点。

SharePlex解决方案如下图:

车公庄生产中心

应用服务器

应用服务器

区县应用服务器

生产系统使用IBM HACMP双机技术,两个节点各自运行不同数据库,并互相进行本地的容灾,同时使用SharePlex实现两个生产数据库的异地容灾复制;

●容灾数据库在本次实施中使用单机环境,在主系统发生灾难时,可实现关键业务数

据的恢复;

●容灾数据库一直处于可用状态,可分担生产系统的查询业务,以减轻生产系统数据

库的负担。

●容灾数据库为区县税务局提供查询业务的数据源。

用户收益

北京地税容灾方案能够解决各种导致计算机系统失效的意外情况,保护业务应用在7X24小时内不间歇运行。从技术上保障了业务系统的连续性和数据的安全性。

1.快速应用接管

北京地税容灾方案充分考虑到了应用、数据和系统各级的保护,做到了:数据中心任何计算机系统硬件,软件,应用故障不影响整个中心的处理工作;数据中心由于灾难(火灾、地震)等原因无法工作时,有备份数据中心能够立即接管关键应用,继续运行;主数据中心恢复后,应用、数据可以迅速切换回主中心运行。

2.强大的数据恢复能力

Quest Software的SharePlex for Oracle提供快速、精确的数据复制功能,能够实时维护生产数据库的远程拷贝,在灾难发生时只有很少或没有数据丢失,极大程度地保证了数据的有效性。

系统灾难大多被理解为一个节点的系统环境崩溃掉了,但研究表明大多数的数据丢失并不是系统崩溃导致的。相反,一些意外事件,如删表、数据块级的数据损坏或数据文件的丢失才是数据丢失的主要原因,而北京地税的高可用和容灾方案可以有效地防止这类意外的发生。

目标数据的在线使用能够有效地对容灾系统进行测试,保障数据的准确性,从而避免容灾系统长期冷备,数据错误而无人发现的情况,能够确保容灾系统在灾难发生时被有效接管,进行数据恢复。

3.为查询业务及区县地税提供数据源

由于数据库复制软件独特的实现机制,容灾系统的数据可访问。容灾数据库的在线使用能够提高容灾系统的投资回报,增加容灾系统的利用价值。使投资变为可用,而不是单纯的冷备闲置。容灾数据库可以在以下场合:

●为查询系统提供数据源,减轻主系统的读取压力

●为区县用户提供数据访问及共享

●灾备系统可作为数据仓库的数据源

●不影响现有生产系统

4.4 SharePlex国内部分客户

数据中心容灾备份方案完整版

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

系统两地三中心方案

金融行业“两地三中心”数据备份与恢复方案设计 1.“两地三中心”设计背景 1.1.行业背景 中国有句俗话,“人无远虑,必有近忧”。伴随信息化的不断深入,银行越来越依赖信息系统,在信息化给社会和银行带来巨大好处的同时,这也使得银行的组织更易遭受攻击,从而造成业务系统的中断、数据丢失等。 近年来,越来越多的银行发现,他们的IT系统意外地、不必要地中断——即便是临时性的,也会使银行业务活动立即中断,无法继续开展,数据的丢失或访问中断,不仅影响了系统运行,还给银行造成重大损失。 1.2.业务持续性需求 银行的服务日益全球化,经济的增长和国民财富的急剧增长,客户的需求日益多样化和复杂化,对银行的服务质量的期望值越来越高,使银行保持业务连续状态成为当务之急。所谓业务连续,就是无论发生任何情况,关键系统和网络都持续可用。 传统意义上的备份和恢复计划无法继续满足需要。当今的预防措施应该包括风险评估、中断影响分析以及避免中断策略,必须将这些因素充分考虑进综合业务持续性计划。在信息时代,业务持续性不再是一项“可有可无”的工作,而是“势在必行”的重点规划。 1.3.“两地三中心”业务保障 影响业务持续性发展的因素很多,既有外部因素,如电力、通讯等;也有

内部因素,如场地、人员、决策、IT技术等。但从系统的观念看,可以说目前影响银行业务持续发展的最直接的威胁来自于信息系统的安全。 健全业务持续性风险的预防策略和措施,需要以下几点基于业务的需求: a)实施数据集中保护。随着数据日益成为银行的生命线,支持业务持续性的数据存储策略成为银行必须考虑的重点。它的优势在于,总体存储的方式可使银行降低购置和维护的成本,最大限度地减少管理多个独立业务系统的复杂性,提高银行数据的整体安全性。同时,存储容量也可得以优化,减少利用率偏低的现象。 b)采用冗余、集群、负载均衡能力等技术,消除单点故障,提高系统的高可用性,提高系统性能影响。 建立信息系统安全业务持续性保障体系,针对灾难性事件的预防目标,建议总、分行层面考虑建立异地容灾环境,建立异地备份机房,配备核心业务需要的基础设施、网络设备、通讯线路和计算机设备;建立数据服务器区,实现全行经营数据的集中保存。构建生产中心、同城灾备中心、异地灾备中心的“两地三个中心”灾备体系。 2.“两地三中心”灾难恢复系统布局 2.1.布局原则 a) 灾难备份中心设置在中华人民共和国境内; b) 灾难备份中心与生产中心之间距离合理,应避免灾难备份中心与生产中心同时遭受同类风险;

数据中心容灾备份方案

数据保护系统 医院备份、容灾及归档数据容灾 解决方案

1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化HIS、LIS 和PACS 等系统是目前各个医院的核心业务系统,承担了 病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 2.1 数据备份解决方案 针对于医院的HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的LAN 或LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

系统两地三中心方案样本

金融行业”两地三中心”数据备份与恢复方案设计 1.”两地三中心”设计背景 1.1.行业背景 中国有句俗话, ”人无远虑, 必有近忧”。伴随信息化的不断深入, 银行越来越依赖信息系统, 在信息化给社会和银行带来巨大好处的同时, 这也使得银行的组织更易遭受攻击, 从而造成业务系统的中断、数据丢失等。 近年来, 越来越多的银行发现, 她们的IT系统意外地、不必要地中断——即便是临时性的, 也会使银行业务活动立即中断, 无法继续开展, 数据的丢失或访问中断, 不但影响了系统运行, 还给银行造成重大损失。 1.2.业务持续性需求 银行的服务日益全球化, 经济的增长和国民财富的急剧增长, 客户的需求日益多样化和复杂化, 对银行的服务质量的期望值越来越高, 使银行保持业务连续状态成为当务之急。所谓业务连续, 就是无论发生任何情况, 关键系统和网络都持续可用。 传统意义上的备份和恢复计划无法继续满足需要。当今的预防措施应该包括风险评估、中断影响分析以及避免中断策略, 必须将这些因素充分考虑进综合业务持续性计划。在信息时代, 业务持续性不再是一项”可有可无”的工作, 而是”势在必行”的重点规划。

1.3.”两地三中心”业务保障 影响业务持续性发展的因素很多, 既有外部因素, 如电力、通讯等; 也有内部因素, 如场地、人员、决策、 IT技术等。但从系统的观念看, 能够说当前影响银行业务持续发展的最直接的威胁来自于信息系统的安全。 健全业务持续性风险的预防策略和措施, 需要以下几点基于业务的需求: a)实施数据集中保护。随着数据日益成为银行的生命线, 支持业务持续性的数据存储策略成为银行必须考虑的重点。它的优势在于, 总体存储的方式可使银行降低购置和维护的成本, 最大限度地减少管理多个独立业务系统的复杂性, 提高银行数据的整体安全性。同时, 存储容量也可得以优化, 减少利用率偏低的现象。 b)采用冗余、集群、负载均衡能力等技术, 消除单点故障, 提高系统的高可用性, 提高系统性能影响。 建立信息系统安全业务持续性保障体系, 针对灾难性事件的预防目标, 建议总、分行层面考虑建立异地容灾环境, 建立异地备份机房, 配备核心业务需要的基础设施、网络设备、通讯线路和计算机设备; 建立数据服务器区, 实现全行经营数据的集中保存。构建生产中心、同城灾备中心、异地灾备中心的”两地三个中心”灾备体系。 2.”两地三中心”灾难恢复系统布局

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

两地三中心容灾方案

Xx项目存储方案介绍

目录 1. 现状综述 (4) 2. 总体建设方案 (4) 2.1. 建设原则和策略 (4) 2.1.1. 建设原则 (4) 2.1.2. 建设策略 (5) 2.2. 建设目标 (7) 2.2.1. 总体目标 (7) 2.2.2. 分期目标 (7) 2.3. 建设内容 (7) 2.4. 总体设计方案 (8) 3. 容灾的核心技术及选择 (9) 3.1. 容灾系统衡量指标 (9) 3.2. 容灾级别 (10) 3.3. 常见容灾建设模式 (11) 3.3.1. 同城容灾 (11) 3.3.2. 异地容灾 (11) 3.3.3. 两地三中心 (11) 3.3.4. 双活数据中心 (11) 3.4. 常用的数据复制技术 (12) 3.4.1. 基于存储层的容灾复制方案 (13) 3.4.2. 基于主机数据复制技术的灾备方案 (18) 3.4.3. 基于数据库的数据复制技术构建灾备方案 (20) 3.5. 如何选择最优的容灾方案 (28) 3.5.1. 数据容灾技术选择原理 (28) 3.5.2. 数据容灾技术选择度量标准 (29) 3.6. 本项目容灾模式及技术的选择 (29) 3.6.1. 容灾模式选择 (29) 3.6.2. 容灾中心选址 (30) 3.6.3. 数据复制技术的选择 (32) 4. 推荐方案概述 (33) 4.1. 技术路线选择 (33) 4.2. 总体方案架构 (33) 4.3. 数据库容灾系统设计 (35) 4.3.1. Golden Gate技术原理 (36) 4.3.2. 各委办局和同城容灾中心之间的数据库复制 (37) 4.3.3. 同城容灾中心和异地容灾中心之间的数据库复制 (40) 4.4. 非结构化数据容灾系统设计 (40) 4.4.1. 同城容灾中心和生产中心之间的数据容灾 (41) 4.4.2. 同城容灾中心和远程容灾中心的数据容灾 (43) 4.4.3. 应用级容灾几种实现方式 (44) 4.5. 一体化集中备份系统 (45) 4.6. 容灾网络建设方案设计 (46)

电信核心业务系统容灾解决方案

电信核心业务系统容灾解决方案 Oracle 技术产品咨询顾问高壮志2004/05/24 随着电信运营商多年的系统建设,其核心业务系统的高可用性越来越受到人们的关注。从整个系统的角度来看高可用性,包括主机、操作系统、数据库、应用、网络设备等许多方面。而这些系统的一个显著特点就是以数据为中心,因此对数据的保护是整个系统高可用性的核心体现。Oracle数据库作为电信运营商核心系统的主流数据库,针对企业用户的重要数据、重要业务高可用性的需求提出了建立在数据库级别的容灾方案-- Oracle Data Guard (数据卫士)。 为什么要使用Data Guard 电信行业现有系统在容灾方面基本上有两种做法。一是采用备份的方法,即定期地将数据备份到硬盘和磁带上。这种方法的缺陷是实时性较差,恢复时间较长;另外备份设备和生产系统一般都处于同一物理位置,不能满足异地容灾的要求。另一种做法就是硬件镜像的做法,这种做法在硬件投资上较大,对两点间网络带宽有较大要求。鱼和熊掌,可否兼得?下面让我们来看看Oracle Data Guard解决方案。 Oracle Data Guard Oracle9i Data Guard 维护了一个或多个与客户生产数据的同步备份。Oracle9i Data Guard配置包括一个松散连接的系统集合,由一个生产数据库和若干备用数据库组成,形成一个独立、易于管理的数据保护方案。现有运营商的核心业务系统的数据库在物理位置上往往位于省信息中心或计费中心的机房内,如果在同一城市有其它机房或利用其它城市机房部署同步备份的数据库,通过Oracle网络服务连接到一起,就可以构成一个很好的容灾解决方案。在修改主数据库时,对主数据库更改而生成的更新数据即发送到备用数据库,这些更改在备用数据库被重新应用。当生产数据库出现故障时,备用数据库可以继续提供服务。 图1提供了一个例子。 图1简单的双工作区配置

XXX数据中心升级及容灾改造项目招标文件(原方案)

XXX数据中心升级及容灾项目 采购招标文件. 招标内容及技术要求 一、本项目工程建设的背景和现状 随着我院信息系统的不断发展,业务系统的数据量、数据处理量和数据存储量越来越大。因此,业务系统的稳定与否,系统的保护和数据的保护是否健全,已成为本系统是否正常运行的关键。随着数据集中处理的实施,可以预计,我院信息系统的业务运作、管理模式将越来越依赖于计算机系统的可靠运行。我院所提供服务的连续性以及业务数据的完整性、正确性、有效性,会直接关系到业务的生产、管理与决策活动。这就要求我们对网络、通信线路、服务器主机等关键硬件设备以及数据库,应用服务器等软硬件进行相应的故障保护和容灾备份部署。一旦某一环节出现异常情况,如火灾、爆炸、地震、水灾、雷击或某个方向通信线路故障等自然原因以及电源机器故障、人为破坏等非自然原因引起的灾难,我们可以快速及时的进行灾难恢复,将损失降到最低点。如果没有全面的考虑容错、容灾设计,那么在任何一个环节上发生故障和灾难,都会导致业务无法正常进行,造成重要数据的丢失、破坏,造成相关的部门的系统中断,不仅不能社会大众提供正常的医疗服务,甚至在极大程度上会影响医院的形象和声誉,使日后的工作无法正常开展下去。因此,根据本系统的特点,必须充分考虑各种灾难情况,建立灾难备份系统。另外我院于2008年对整个信息系统平台的软硬件设备进行升级和改造,至目前为止已经使用将近7年时间,目前的系统平台设备已经慢慢出现故障增多、性能下降等问题,也急需要对整个系统平台进行升级。

二、采购内容及招标需求 1. 采购原则及规范: 本次公开招标采购XXX数据中心升级及容灾项目的有关设备,投标人所投设备必须按招标文件规定的配置要求提供,并满足招标文件中提出的相关性能指标参数,同时应能满足XXX局信息化系统的当前以及今后3-5年内业务发展的需求。 投标人应对所提供的设备性能、质量负责,并提供相应的安装、服务、质保及技术培训。采购的设备所涉及的产品标准、规范,验收标准等,应符合国家有关条例及标准的规定。 2. 采购设备清单(预算:140万元)

容灾备份-解决方案方法

容灾备份系统 2010-8-11 项目背景 随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。

企业的IT 管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID 技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者 数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 二、功能介绍 实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性 数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备” 、“异 地实时灾备” ,全方位保证数据库安全。 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数 据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据 库在3-5分钟。 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停 期间的数据,并重新开始实时备份。 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触 发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。维护 方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据 交换,充分保证数据安全。 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热 容灾备份方式时,从站可采用低档Server 或高稳定性的PC(有足够的存储空间即 可),从而实现极低的总体成本。 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAM(S关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

华为业务连续性容灾解决方案两地三中心解决方案技术白皮书

业务连续性容灾解决方案 V100R003C00 两地三中心解决方案技术白皮书 文档版本 01 发布日期 2015-08-15 华为技术有限公司

版权所有? 华为技术有限公司2015。保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。 商标声明 和其他华为商标均为华为技术有限公司的商标。 本文档提及的其他所有商标或注册商标,由各自的所有人拥有。 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。 由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。 华为技术有限公司 地址:深圳市龙岗区坂田华为总部办公楼邮编:518129 网址:https://www.360docs.net/doc/553373639.html,

目录 1 概述 (7) 1.1 数据中心业务连续性的挑战 (7) 1.2 方案概述 (7) 1.3 方案亮点 (7) 2 两地三中心方案架构 (9) 2.1 级联组网架构 (9) 2.1.1 同步+异步级联方案 (10) 2.1.2 异步+异步级联方案 (10) 2.2 并联组网架构 (10) 2.2.1 同步+异步并联方案 (10) 2.2.2 异步+异步并联方案 (11) 2.3 双活组网架构 (11) 2.3.1 VIS双活+异步方案 (11) 2.3.2 HyperMetro+异步级联方案 (12) 2.4 关键组件技术实施要求 (12) 3 两地三中心方案工作原理 (14) 3.1 同步+异步级联工作原理 (14) 3.1.1 初始同步处理 (14) 3.1.2 IO处理流程 (15) 3.1.3 灾难切换处理 (16) 3.1.4 灾难恢复处理 (16) 3.1.5 链路和灾备端故障处理 (16) 3.2 同步+异步并联工作原理 (16) 3.2.1 初始同步处理 (16) 3.2.2 IO处理流程 (17) 3.2.3 灾难切换处理 (17) 3.2.4 灾难恢复处理 (18) 3.2.5 链路和灾备端故障 (18) 3.3 异步+异步级联工作原理 (18) 3.3.1 初始同步处理 (18)

(完整版)适合云化数据中心的备份容灾系统

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s o 适合云化数据中心备份容灾系统 以虚拟化、超融合、云平台等为形态的云化数据中心已经成为越来越多的企业机构数据中心升级方案。据权威媒体统计,云每年以25%的速度增加,其中虚拟化渗透率大于80%。云在按需交付、资源池化等方面有先天的优势,但随之也带来更多的数据和业务安全风险。无论是自建的云还是公有云,每年都频繁 发生大量的数据安全和业务中断事故。 在备份容灾管理领域,一方面IT 基础架构的云化变化速度已经大大超出了现有的数据保护技术的变化速度,而另一方面不少厂商又都声称自家的产品可以备

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s o 份云。那么到底该如何选择真正适合云化数据中心的备份容灾系统,本文重点从以下几个方面展开讨论。 什么是云化数据中心? 简单讲,就是当业务需要,数据中心可以在数分钟内增加或减少业务所需要的计算、存储、网络等资源。再简单讲,就是随时增加或减少可以安装部署业务应用软件的服务器。 自建云化数据中心的方案有多种思路,如下:1、虚拟化为中心的经典架构 这种方案是目前最主流的云化数据中心方案,主要采用的方案就是虚拟化操作系统、服务器与企业级集中式存储,该方案成熟度最高。这种方案,随着虚拟

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s 机规模增加,底层的集中存储会越来越感觉到不够用。这时候需要增加新的存储或服务器部署,重新迁移或分布虚拟机系统。2、以OpenStack 为代表的开源大集成架构 这套体系接近公有云平台的体系,主要的3个核心服务都采用高度弹性的方案来构成。随着引入的服务越多,运维管理复杂度也大幅度提升。目前开源体系最大的问题在于企业级运维管理的能力较弱,可靠性不能很好保障,可管理性差,易用性方面门槛很高,需要高度依赖商业发行版企业来保障持续的运行。这类平台通常是从几千到上万个虚拟机规模,是一些大型企业在重点升级的云 架构方案。 3、各类公有云的企业部署版本 国内的云计算公司,都相应推出了企业内部部署的版本,与OpenStack 的架 构类似,核心也包含3大核心服务,以及各类上层应用服务。第2、第3这类

数据中心灾备系统的分类

数据中心灾备系统的分类 根据数据中心的安全要求,应对灾难恢复系统采用的技术路线做出全面的考虑。 1.数据级容灾和应用级容灾 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。 (1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。 (2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。 应用级容灾系统是建立在数据级容灾系统基础上的,同时能完成数据和应用系统环境的复制存放和管理。为实现发生灾难时的应用切换,容灾中心需要配置与工作系统同构和相同功能的业务网络、应用服务器、应用软件等。 应用级容灾还需要考虑数据复制的完全性、数据的一致性、数据的完整性、网络的通畅性、容灾切换的性能影响、应用软件的适应性改造等问题,以及为保证业务运行的所需设备、环境、人员及其相应的管理。 2.灾难恢复系统的在线/离线模式 (l)在线模式。在线灾难恢复系统要求工作系统与灾难备份系统通过网络线路连接,数据通过网络实时或定时从工作系统传输到灾难备份系统。对数据保护的实时性高,对业务连续性要求高,就需要采用在线模式。 (2)离线模式。离线灾难备份系统的数据通过存储介质(磁带、光盘等,搬运到异地保存起来实现数据的保护。离线模式适合于对数据保护的实时性要求不高的场合,离线模式设备比较简单,投资较少。 3.数据备份技术 正常情况下系统的各种应用在数据中心运行,数据存放在数据中心和灾难备份中心两地保存。当灾难发生时,使用备份数据对工作系统进行恢复或将应用切换到备份中心。灾难备份系统中数据备份技术的选择应符合数据恢复时间或系统切换时间满足业务连续性的要求。目前数据备份技术主要有如下几种: (1)磁带备份。 (2)基于应用程序的备份。通过应用程序或者中间件产品,将数据中心的数据复制到灾难备份中心。在正常情况下,数据中心的应用程序在将数据写入本地存储系统的同时将数据发送到灾难备份中心,灾难备份中心只在后台处理数据,当数据中心瘫痪时,由于灾难备份中心也存有生产数据,所以可以迅速接管业务。这种备份方式往往需要应用程序的修改,工作量比较大。另外,

“双活”容灾引领现代备份技术

“双活”容灾引领现代备份技术虽然每周全量夜间增量备份仍是常态,但很多组织机构逐渐发现他们的数据(以及恢复那些数据所需的条件)打破了长久以来传统备份所依赖的模型。存储管理人员备份操作不当,意味着困难并关键的备份现代化任务迎面而来。 备份现代化将是一个有点痛苦的过程,不仅需要选择一项备份技术,还需要考虑这种转变对关键业务处理和需求的影响。 备份替代技术考量 就备份现代化来讲,有各种各样的解决方案,无论经济实用型方案,还是舶来品。不过,当今有三类主要的数据保护策略: ·持续数据保护 ·快照 ·基于镜像的备份 CDP技术对数据进行近乎连续不断地保护。并非在夜间进行大型备份,CDP产品的备份全天候执行,每隔几分钟就进行一次。CDP产品首先将数据以块的方式复制到磁盘备份介质中。当某个块被创建或更改时,该块被备份。CDP有对版本信息进行跟踪的索引,而数据重删技术能够保证只有不重复的块会被存储到备份介质中。 快照与备份有所不同,前者并不创建数据的拷贝,而是提供将虚拟机、文件或应用回滚到先前某点状态的方法。快照是使用磁盘差分或指针的技术。由于快照并不进行实际备份,一些备份厂商将快照作为一种提高自身产品恢复能力的方式,而不是将其用作单独的数据保护策略。 基于镜像的备份代表着备份领域一种新的策略,并应用于虚拟机备份中。此类备份源于这样一种思想即备份处理对虚拟机进行整体数据捕获。如果需要进行恢复操作,将虚拟机的拷贝挂载至沙盒环境中用以承载数据。沙盒挂载能力有时也用来提供本地恢复测试甚至模拟实验能力。只要你受保护的资源全部部署在虚拟服务器上,基于镜像的备份就能够提供显著的灵活性。

重大业务考量。不管你选择使用哪种备份技术,都有一些与公司业务需求相关的重要因素需要考虑。一些因素在购买一个新的备份系统前就需要考虑,另外一些在新的备份系统安装完毕时,就需要立即考虑。 保留需求。选择一个现代备份系统时你最先需要考虑的你的备份保留要求,换句话说,你在多长的时间之内会需要检索数据。 这样的考虑很是重要,因为大多数现代备份方案都是基于磁盘或云服务,或者两者都是。以磁带为基础的备份能够提供近乎无限的保留跨度,因为你能备份到磁带上,而你想将磁带保留多久都可以,而基于磁盘的备份却并非如此。磁盘的容量是有限的,而容量会影响能够保留在备份中历史数据的总量。 快照的回滚可能引起数据库崩溃,除非该快照产品经过特殊设计,能够与你服务器上运行的应用一起工作。 即使磁盘的容量不是一个问题,一些现代备份应用也会有各种限制。比如,一些CDP 产品区分短期保存(磁盘)和长期保存(磁带),并对前者存储介质上的恢复点数量有十分严格的限制。 代理软件兼容性。如果你正在考虑的备份方案是基于代理的,那么就必须在购买之前把代理软件的兼容性当做一个首要考虑因素。尽管大部分备份软件提供商都会提供适用于大多数流行的操作系统的代理软件,你仍需要核实在你自己的环境下运行的操作系统中,该软件是否能正常使用。 业务识别性。在选择一个备份业务时,业务识别性是最重要的一个标准之一。如果你的备份不仅仅是文件数据,那么你的备份软件都必须支持你所运行的业务。 对于CDP或基于镜像的备份产品,业务识别性的确认通常意味着验证某备份产品是否包含一个Microsoft卷影复制服务(VSS),服务器上你所备份业务的运行需要它。对于快照产品,你则需要找寻细粒度应用回滚功能。 尽管大多数快照应用支持整个服务器的回滚,但可能会对数据库应用造成很严重的后果。因为在获取快照时,快照并不能捕捉储存在服务器内存中的处理状态。因此,快照回滚可能引发数据库崩溃,除非某快照产品对你服务器上的应用进行了定制化设计。 初始备份。在你付费并部署了现代备份解决方案之后,关于你的首次备份,有些事情需

两地三中心数据容灾解决方案

钢铁企业两地三中心数据容灾解决方案 上海浪擎科技有限公司售前咨询部 2012年8月25日

目录 1. 信息安全,重于泰山 (3) 1.1备端在线两地三中心 (3) 2“双活”+ 异地容错的技术方案 (4) 2.1备端在线两地三中心灾备方案网络设计 (4) 2.2备端在线容灾系统设计 (4) 2.3异地容错的容灾系统设计 (6) 2.4备端在线两地三中心的容灾优势 (6) 附件: (11) 2.4附件1:部分案例介绍 (11)

1.信息安全,重于泰山 钢铁行业作为传统的制造行业,在逐步摆脱传统的业务模式,加速走向信息化生产时代。“如何保障业务系统的安全正常运行”的课题,一直是行业中讨论、尝试的重点。虽然信息化程度提高了,但信息安全问题不容忽视,尤其是针对业务系统的信息容灾处理成为重中之重。为了防止信息安全事故或事件的发生,尽管有相应技术防范措施,但是人为因素造成的安全风险仍然占有很高的比率。因此明确目前钢铁企业面临的主要信息安全问题并提出相应的信息管理措施十分必要。 随着信息化的发展,钢铁企业信息系统由以前单一的一、二级作业系统,向多级系统并存、互动发展。在SAP的定义中,钢铁冶金行业的信息系统架构被分解成五个层次,这五级系统分别是:一级设备控制系统;二级过程控制系统;三级车间或分厂级制造执行系统(即MES)等;四级钢铁企业资源计划系统(即ERP);五级钢铁企业间管理系统及决策系统。这五层系统之间相互集成、相互协调,构成了一个完整、复杂的钢铁企业信息系统。 那么问题来了,面对这样复杂的信息系统,如何才能保障生产系统在发生自然或人为的灾害时的业务运行呢?如何才能保证这样复杂的系统里的信息的安全呢?信息,作为企业宝贵的资源,其重要性已经得到了人们的充分认识。但是我们该如何保护这一资源?假设您就是企业的一位信息管理人员,当您的企业遭遇以下事故时,您将如何去面对: 1.某一天,企业的交易数据因操作失误而损坏; 2.某一天,工厂的所有生产数据因电源故障而丢失; 3.质量检测部门辛苦一年获取的质量数据因人为的恶意操作而丢失; 4.工厂保存的所有工人资料因为磁带的损坏而无法使用; 这样的例子还有很多很多。 那么这样的事故所带来的后果是什么?至少,很难想象这个不幸的企业还能毫发无损的健康生存。因为,对于信息时代的企业而言,健全的信息往往是维持其运转所必须的基本条件。所以,如何保护企业的信息资源,如何使企业免遭信息灾难,已经成为企业所必须考虑的沉重问题。 1.1备端在线两地三中心 基于这样的需求,浪擎设计的备端在线两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。本地机房的容灾主要是用于防范生产生产服务器发生的故障,异地灾备中心用于防范大规模区域性灾难。本地机房的容灾由于其与生产中心处于同一个机房,可通过局域网进行连接,因此数据复制和应用切换比较容易实现,可实现生产与灾备服务器之间数据的实时复制和应用的快速切换。异地灾备中心由于其与生产中心不在同一机房,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,应用系统的切换也需要一定的时间,因此异地灾备中心可以实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。

相关文档
最新文档