分布式环境灾备实现
hadoop灾备方案

Hadoop灾备方案简介Hadoop是一个分布式计算框架,用来处理大规模数据集的存储和处理。
在企业中,数据是非常宝贵的资产,因此灾备方案对于Hadoop集群至关重要。
本文将介绍如何建立Hadoop灾备方案,以确保数据的安全和可恢复性。
灾备需求分析在设计灾备方案之前,我们首先需要明确灾备的需求和目标。
常见的灾备需求包括数据备份、容灾和快速恢复。
下面是一些可能的灾备需求:1.数据备份:在主集群出现故障时,能够快速恢复数据。
2.容灾:当主集群不可用时,能够无缝切换到备用集群。
3.快速恢复:在发生灾难事件后,能够迅速恢复集群并继续正常工作。
灾备方案设计根据需求分析,我们可以设计一个基于冷备份和容灾的Hadoop灾备方案。
方案的主要步骤如下:1.数据备份:定期将主集群的数据备份到备用集群。
可以使用Hadoop的DistCp命令或其他备份工具来实现。
2.容灾:设置一个备用集群,该集群与主集群位于不同地理位置,以确保即使发生地域性的灾难,如自然灾害,也能保证数据的可用性。
3.快速恢复:在主集群发生故障或不可用时,通过DNS解析或负载均衡器的切换来实现从备用集群的快速恢复。
Hadoop数据备份Hadoop提供了多种备份和数据复制机制来保证数据的安全性和可恢复性。
数据备份工具1.DistCp:Hadoop自带的数据复制工具,可以将一个Hadoop集群的数据复制到另一个Hadoop集群。
它具有高效并行的特性,并支持增量备份。
2.rsync:一种开源的数据同步工具,可以通过SSH协议将数据从一个服务器复制到另一个服务器。
它是一个快速、灵活和可靠的备份解决方案,适用于小规模集群。
备份策略为了确保数据备份的有效性和完整性,我们建议采取以下备份策略:1.定期备份:定期执行数据备份任务,以保证备份数据的实时性和可用性。
2.增量备份:通过使用增量备份工具,仅备份发生变化的数据,以减少备份任务的时间和资源消耗。
3.双活备份:采用双活备份方案,即同时备份到两个备用集群,以确保备份的冗余性和灵活性。
ceph 灾备方案

ceph 灾备方案Ceph 灾备方案随着云计算和大数据时代的到来,数据的安全性和可靠性成为了企业和组织关注的重点。
Ceph作为一种分布式存储系统,具有高可靠性和可扩展性,因此备受青睐。
为了确保数据的持久性和可恢复性,制定一套完善的Ceph灾备方案是至关重要的。
一、灾备方案的必要性Ceph作为一种分布式存储系统,通过将数据分布在不同的节点上,提高了数据的可靠性和可用性。
然而,单一节点的故障或灾难事件(如火灾、地震等)可能导致数据的不可用或永久丢失。
因此,采取灾备措施是必要的,以保证数据的安全性和可恢复性。
二、Ceph灾备方案的设计原则1. 多活数据中心:构建跨多个数据中心的Ceph集群,以实现数据的多活部署。
这样即使一个数据中心发生故障,其他数据中心仍然可以提供服务。
2. 异地冗余备份:将数据在不同地理位置的节点上进行冗余备份。
这样即使某个地区发生自然灾害或人为破坏,数据仍然可以从其他地区恢复。
3. 定期备份:定期对Ceph集群中的数据进行备份,以确保数据的完整性和可恢复性。
备份数据可以存储在独立的存储系统中,以防止主集群的故障。
4. 自动化恢复机制:灾备方案应该具备自动化的数据恢复机制,能够在节点故障发生时快速地将数据恢复到正常状态。
这可以通过使用Ceph的自动化工具和脚本来实现。
三、Ceph灾备方案的具体实施1. 多活数据中心的构建:建立多个数据中心,并在每个数据中心中部署独立的Ceph集群。
通过使用Ceph的异步复制功能,将数据同步到其他数据中心的节点上,实现数据的多活部署。
2. 异地冗余备份的配置:将数据在不同地区的节点上进行冗余备份。
可以通过配置Ceph的存储池和副本数来实现数据的冗余备份。
确保每个数据中心都有足够的存储容量来存储备份数据。
3. 定期备份策略的制定:制定定期备份策略,定期对Ceph集群中的数据进行备份。
可以根据数据的重要性和变化频率来确定备份的时间间隔。
备份数据可以存储在独立的存储系统中,也可以使用Ceph本身的特性来实现备份。
云灾备解决方案

云灾备解决方案一、引言随着信息技术的飞速发展,数据对于企业的重要性越来越凸显。
然而,自然灾害、人为错误、硬件故障等各种因素都可能导致数据丢失或者无法访问,给企业带来巨大的损失。
为了应对这些风险,云灾备解决方案应运而生。
本文将介绍云灾备解决方案的定义、优势、实施步骤以及相关案例分析。
二、定义云灾备解决方案是指利用云计算技术,将企业的关键数据备份到云端,并通过灾备机制保证数据的高可用性和可恢复性。
它能够匡助企业在面临数据丢失或者无法访问的情况下,快速恢复业务运营,降低风险和损失。
三、优势1. 高可用性:云灾备解决方案采用了分布式存储和多备份机制,确保数据的高可用性。
即使某个数据中心发生故障,也能够快速切换到备用数据中心,保证业务的连续性。
2. 灵便性:云灾备解决方案可以根据企业的需求进行灵便配置,包括备份频率、备份数据的存储位置等。
同时,它还支持混合云和多云环境,使企业能够更好地利用不同云服务提供商的优势。
3. 成本效益:相比传统的灾备方案,云灾备解决方案能够显著降低企业的投资成本。
它不需要企业购买昂贵的硬件设备和维护人员,而是以按需付费的方式提供服务,大大降低了企业的运营成本。
4. 自动化管理:云灾备解决方案通过自动化的备份和恢复过程,减少了人为错误的风险。
同时,它还提供了可视化的管理界面,方便企业对备份和恢复操作进行监控和管理。
四、实施步骤1. 需求分析:根据企业的业务需求和数据特点,确定需要备份的数据范围、备份频率、恢复时间目标(RTO)和恢复点目标(RPO)等关键指标。
2. 选择云服务提供商:根据企业的需求和预算,选择合适的云服务提供商。
评估其数据安全性、可用性、性能以及技术支持等方面的能力。
3. 数据备份和传输:将企业的关键数据备份到云端,并确保数据的安全传输。
可以使用加密技术保护数据的机密性,同时采用增量备份和差异备份等技术减少备份数据的传输量。
4. 灾备演练:定期进行灾备演练,验证云灾备解决方案的可行性和有效性。
“双活”容灾,最灵活的应用方式

“双活”容灾,最灵活的应用方式提到灾备这个行业,很多用户、很多人觉得灾备离他们特别远,但是通过北方的都市之秋、南方的冻雨以及汶川大地震,国内的企业在这方面表现出了一些问题。
可以想象一个场景,比如说客户开户的银行,突然发生了9·11这样的事故,整个银行系统停顿、数据丢失。
如果它没有做灾备,可能这一切就化为乌有了。
所以,各个银行、各个证券公司最近这些年灾备的投入做了相当大的工作,为客户个人的资产、个人的信息、为服务的界面做了很多的保障。
所以,基本上人们看不到灾备,但是它一直在为你服务。
从另外几个角度来看,我们国家最近几年自然灾害和公共卫生事件,有非典、禽流感、水灾、南方的雪灾、冻雨、这次汶川大地震。
在这些自然灾害面前,我们面临的是怎么样去进行救助,怎么样能够把企业、政府的职能进行恢复。
在这些恢复过程当中,相应的应急体系和灾难恢复体系起到了相当大的作用,政府最近这些年也在应急管理上做了很多的工作,也形成了一整套的应急体系,企业对数据系统的备份,对业务所需要的连续的资源。
即使如此,面对大灾难的时候还是相当的无力和无助。
上海浪擎科技是国内最大的备份容灾软件厂商,在备份容灾领域具备一流品牌影响力。
公司产品和解决方案分为D(数据级灾备)、A(应用级灾备)、Y(云计算)、S(备份存储柜)四大系列,涵盖了从桌面到服务器、从备份到容灾、从本地综合备份管理到异地数据中心建设等各个方面,构建完整的备份、容灾、存储解决方案。
浪擎科技已为众多高端用户建设了大型的灾备中心或灾备系统。
客户遍及政府、金融、医疗、能源、电信、媒体、制造、教育等各行各业,有超过10000家用户,承建了最多的区域级灾备中心建设案例。
浪擎“双活”容灾拥有灵活的应用方式,系统支持丰富的复制连接拓扑,其中有一对一和多对一复制。
一对一复制,指的是在极为重要的业务系统中,为生产线上的主服务器建立一套备用系统非常关键。
当主服务器因宕机等意外状况而停止服务器,可立即启用备用服务器提供服务。
数据备份与恢复预案

1.数据抢救灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救, 抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。
此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。
2.损坏评估及启动应预案灾难发生后需根据情况汇报损失情况给损坏评估组,损坏评估组根据汇总信息进行消息告知。
损坏信息包括:a)公司重要数据服务器、监视、办公设备b)拥有在可以执行计划之内的关键性功能的员工c)保存公司重要数据的介质d)网络、通讯设备根据披露的损坏信息情况进行应急预案启动,如选举暂时领导、使用备份服务器、备份通讯设备进行替代等。
3.业务恢复计划业务恢复计划可划分为以下几个阶段:a)IT 基础设施恢复阶段:此阶段主要的目标是将对于保存数据的基础设施、业务系统所在的主机、公司网络架构进行恢复。
首先须根据损失评估的报告分析可继续利用的 IT 基础设施,如供电设施、交换机、服务器、防火墙等。
若有损坏不可用的设备,需及时同代理商进行沟通借用或者新购相应设备。
b)系统恢复阶段:系统恢复主要针对关键应用主机,如邮件服务器。
为节约时间需同时针对各个服务器系统进行快速恢复。
c)网络恢复阶段:网络恢复阶段的主要针对以下几点进行:关键商业应用系统的内部局域网和网络设备的支持外部广域网和电信服务待恢复系统和终端用户(公司同事)间的通讯4.业务系统数据恢复:首先须对业务系统的数据进行恢复,需要寻觅相应的恢复设备完成此操作,目前我们主要利用磁盘、远程灾备数据,可正常工作的主机或者同城备份机房进行数据恢复工作。
需要将抢救出的磁带、硬盘或者远程数据在对应设备上恢复出数据。
5.业务系统重搭建:由于一些业务系统的特殊性,需尽快与相应平台的供应商接口人取得联系,并申请暂时可用的许可文件等。
6.业务系统数据导入:数据恢复需根据导出的数据结合自己管理的业务平台进行数据导入 , 并测试可行性。
云计算中的容灾和灾备方案设计

云计算中的容灾和灾备方案设计云计算是当今信息技术领域的热点话题,它带来了许多便利和高效的解决方案。
然而,任何技术都不是完美的,也存在各种潜在问题和风险。
在云计算环境中,容灾和灾备方案设计是至关重要的,以确保系统的稳定性和可靠性。
本文将讨论云计算中容灾和灾备方案的设计原则和最佳实践。
第一部分:容灾和灾备的概述容灾(Disaster Recovery,简称DR)和灾备(Business Continuity,简称BC)是两个独立但密切相关的概念。
容灾指的是在灾害事件发生后,通过备份和恢复数据、应用和服务来恢复业务的过程。
而灾备则是指在灾害发生前采取的一系列措施,以保证业务的持续运行。
第二部分:云计算中的容灾和灾备需求云计算环境中的容灾和灾备需求与传统IT环境不同。
云计算的特点包括弹性扩展、虚拟化、远程访问等,因此容灾和灾备方案需要针对云计算环境的特点做出相应调整。
具体而言,云计算中的容灾和灾备需求包括数据备份与恢复、虚拟机镜像备份与迁移、网络连通性保证等。
第三部分:云计算中的容灾和灾备方案设计原则1. 多地点备份:通过在不同地理位置的数据中心进行备份,确保数据的高可用性和容灾能力。
2. 虚拟机镜像备份:将虚拟机镜像备份到不同位置的数据中心,以减少单点故障的风险。
3. 实时数据同步:采用实时数据同步技术,确保在灾难发生时可以快速恢复数据。
4. 弹性扩展能力:云计算环境的容灾和灾备方案应具备弹性扩展能力,能够应对突发的业务需求和高负载情况。
5. 容灾测试与演练:定期进行容灾测试和演练,验证容灾和灾备方案的有效性和可靠性。
第四部分:云计算中的容灾和灾备方案设计实践1. 数据备份与恢复:使用分布式存储技术将数据备份到多个数据中心,并定期进行数据一致性检查和恢复测试。
2. 虚拟机镜像备份与迁移:使用虚拟化管理软件进行虚拟机镜像备份和迁移,以实现虚拟机的高可用性和容灾能力。
3. 网络连通性保证:通过多个运营商的网络互联来确保网络连通性,避免单点故障带来的影响。
网络IP地址的冗余备份与灾备方案

网络IP地址的冗余备份与灾备方案随着互联网的飞速发展和各种在线服务的普及,网络的稳定性和可靠性变得越来越重要。
作为互联网连接的基本要素之一,IP地址的冗余备份和灾备方案成为了确保网络稳定运行的关键。
一、IP地址冗余备份方案1. 热备份(Hot Standby)热备份是指在主IP地址不可用时,备用IP地址能够立即接管主IP 地址的功能。
在这种方案中,主备IP地址之间会进行实时同步,确保备用IP地址时刻与主IP地址保持一致。
一旦主IP地址出现故障,备用IP地址会立即接替主IP地址的工作,用户几乎感受不到网络中断的存在。
2. 冷备份(Cold Standby)冷备份是指备用IP地址在主IP地址不可用时需要手动介入才能接管主IP地址的功能。
与热备份不同,冷备份需要在主IP地址发生故障时,管理员手动将备用IP地址配置为主IP地址。
这个过程需要一定的时间,可能会导致网络中断和服务不可用。
3. 温备份(Warm Standby)温备份是介于热备份和冷备份之间的一种方案。
在温备份中,备用IP地址与主IP地址之间会进行定期或者触发式的同步。
当主IP地址发生故障时,备用IP地址会自动接管主IP地址的功能,但可能会有一定的延迟。
二、灾备方案1. 分布式备份分布式备份是指将IP地址分散存储在多个地理位置不同的服务器上。
这样做的好处是即使某个服务器发生故障或遭到攻击,其他服务器仍然能够提供服务。
分布式备份可以通过网络云服务来实现,例如使用云服务器提供商的多个数据中心进行备份。
2. 容灾系统容灾系统是指在主服务器发生故障时,能够自动切换到备用服务器并提供服务的系统。
容灾系统通常具有独立的电源供应、网络连接和数据存储,以确保在主服务器发生故障时仍能够保持服务的连续性和稳定性。
这种方案通常适用于需要高可用性和故障恢复能力的关键应用。
3. 数据备份与恢复数据备份与恢复是灾备方案中至关重要的一环。
通过定期备份主服务器中的数据,可以在主服务器发生故障时迅速恢复数据并继续提供服务。
两地三中心灾备方案

两地三中心灾备方案1. 背景在现代化的信息技术条件下,各种灾难事件对企业的运营和数据安全构成了巨大的威胁。
为了确保业务的连续性和数据的安全性,灾备方案已经成为了企业不可或缺的一部分。
受到地缘环境、自然灾害等多种因素的影响,企业需要制定灾备方案,以保证业务的持续运营。
将业务系统和数据分散存储在不同地域的多个数据中心,是一种有效的方式,也是我们所提供的两地三中心灾备方案。
2. 方案概述两地三中心灾备方案是一种基于云计算和分布式系统的解决方案,通过将业务系统和数据分布在不同地域的三个数据中心中,以实现业务的高可用性和灾难恢复能力。
这三个数据中心包括两个主数据中心(A、B)和一个备份数据中心(C),分布在不同的地理位置上。
该方案的实施可以有效地应对自然灾害、设备故障、人为破坏等不可控因素对企业的影响,保障关键业务的连续性和可用性。
以下是方案的具体组成和设计。
3. 系统架构3.1 主数据中心两个主数据中心(A、B)是整个系统的核心,它们运行着企业的关键业务系统和数据。
每个主数据中心都具备完备且独立的硬件设施、网络和存储系统。
•主数据中心A:位于城市X,承担主要的业务运营和数据存储任务。
•主数据中心B:位于城市Y,作为主数据中心A的备份,能够及时接管业务运营和数据处理任务。
主数据中心之间通过高速网络连接,进行数据的实时同步和业务的状态复制。
主数据中心A负责主要的数据读写操作,而主数据中心B则负责数据的备份和业务的冷备。
3.2 备份数据中心备份数据中心C是系统的灾备中心,位于城市Z。
它的作用是保存主数据中心A和B的数据备份,并提供紧急的灾难恢复功能。
备份数据中心C与主数据中心通过专用线路进行数据的定期同步,确保数据的一致性。
在主数据中心发生灾难或不可用时,备份数据中心C会立即接管业务运营,保障业务的连续性。
4. 数据同步和备份策略为确保数据的一致性和完整性,我们采用以下策略进行数据的同步和备份:•日志复制:主数据中心A和B之间进行实时的数据同步,通过数据库日志的复制和传输,保持数据的一致性和完整性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布式数据库研究现状及发展趋势摘要随着大数据、云时代的到来,数据库应用需求的拓展和计算机硬件环境的变化,使分布式数据库系统应运而生。
为了符合当今信息系统的应用需求和企业组织的管理思想和管理模式。
分布式数据库提供了解决整个信息资产被分裂所成的信息孤岛,为孤岛联系在一起提供桥梁。
本文主要介绍数据库数据存储特点,以及分布式数据库灾备的实现方法。
关键词分布式数据库;发展趋势;现状及问题1.引言当今社会已进入了信息时代,人们将越来越多的信息存储在网络中的计算机上。
如何更有效地存储、管理、共享和提取信息,越来越引起人们的关注。
随着大数据、云时代的到来,数据库应用需求的拓展和计算机硬件环境的变化,集中式数据库已经不能满足人们的需求,因此分布式数据库系统应运而生,并且得到迅速发展。
分布式数据库是指利用高速计算机网络将物理上分散的多个数据存储单元连接起来组成一个逻辑上统一的数据库。
分布式数据库的基本思想是将原来集中式数据库中的数据分散存储到多个通过网络连接的数据存储节点上,以获取更大的存储容量和更高的并发访问量。
近年来,随着数据量的高速增长,分布式数据库技术也得到了快速的发展,传统的关系型数据库开始从集中式模型向分布式架构发展,基于关系型的分布式数据库在保留了传统数据库的数据模型和基本特征下,从集中式存储走向分布式存储,从集中式计算走向分布式计算。
分布式数据库系统是由分布于多个计算机结点上的若干个数据库组成,,每个子数据库系统都是一个独立的数据库系统,它们都拥有各自的数据库、中央处理机、终端,以及各自的局部数据库管理系统,分布式数据库在使用上可视为一个完整的数据库 ,而实际上它是分布在地理分散的各个结点上,它的数据存储方式与集中式数据库系统不同,数据被分片并分散存储于网络中不同的存储节点之上,并且每一个分片都有2到3个副本,以保证数据可靠性,但每一个存储节点上都只有部分数据,没有一个存储节点存有这样将为分布式数据库灾备的实现带来挑战,传统的基于卷、基于集中存储、基于传统数据库的两地三中心解决方案将不再适用于分布式环境灾备的实现,本文将主要介绍分布式数据库数据存储特点,以及分布式数据库灾备的实现方法。
2.分布式数据库数据存储特点分布式数据库是分布式数据库系统中各站点上数据库的逻辑集合。
它对集中式操作系统进行了扩充。
与集中式数据库一样,分布式数据库也是由两部分组成:一部分是关于应用所需要的数据的集合,称为应用数据库,它是分布式数据库的主体。
另一部分是关于数据库中数据结构的定义,以及全局数据的分片、分布的描述、称为描述数据库,也称数据字典、数据目录或元数据。
从分布式数据库的定义中,我们知道,所谓的分布式简单的说,就是把一个整体分成多个独立的个体,所以对于分布式数据库系统来讲,就是把一个大片数据分成多个独立的小数据存放在网络中的各个主机上,我们把这个过程就称为数据分片。
在分布式数据库系统中,对数据的分片有以下几种方法:(1)水平分片所谓水平分片就是按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段,简单地说,就是按关键字的特征来划分全局数据库。
(2)垂直分片所谓垂直分片就是把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。
在对数据库分片时,最好应避免出现过多的重复字段,但这种重复又是必要的,因为它们能够表达记特征,使局部数据库之间的记录能一一对应,这样的字段要求其值相对固,不要随意改动。
(3)混合分片在分布式数据库应用中,仅仅进行单一的水平分片或垂直分片往往是不够的,在数据库设计的时候,一般都同时用到这两种方法,这就是混合分片的方法。
所谓混合分片,简单地说就是以上两种方法的混合。
可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果可能是不相同的。
在对数据分片的过程中,并不是简单的水平,垂直分成多份就可以了,在分数据时必须有符合一定的要求和规则。
比如:(1)完整性要求必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。
(2)可重构要求必须保证能够由同一个全局关系的各个片段来重建该全局关系。
对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。
即“化整为零”的数据,还要能够再“化零为整”。
(3)不重复要求要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。
数据分布是分布式数据库的又一特征,是指分布式数据库中的数据不是存储在一个站点的存储设备上,而是根据需要将数据划分成逻辑片段,按某种策略将这些片段分散在各个站点上。
数据分布的策略主要有以下几种方法:(1)集中式:所有数据片段都安排在同一个场地上。
(2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。
(3)全复制式:数据在每个场地重复存储。
也就是每个场地上都有一个完整的数据副本。
(4)混合式:这是一种介乎于分割式和全复制式之间的分配方式。
3.分布式数据库灾备实现分布式数据库系统由分布于多个计算机结点上的若干个数据库系统组成,它提供有效的存取手段来操纵这些结点上的子数据库。
从分布式数据库数据存储方式可以看出,分布式在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个结点上。
当然,分布在各个结点上的子数据库在逻辑上是相关的。
由于分布式数据是分散存储的,整个数据库的数据被分散存储在不同的数据节点上,一份数据一般有三个副本,但对每一个存储节点来说,其数据并不完整,很难用传统的基于存储复制或CDP等技术来完成数据的实时复制,由于分布式数据库是近些年才发展起来的新技术,并没有通用软件可以完成不同分布式数据库数据复制的统一解决方案,需根据不同的分布式数据库采用相应的数据库复制软件来完成数据复制,但其原理基本相同,下面以达梦分布式数据库为例介绍分布式数据库实现两地三中心灾备的方法。
3.1.两地三中心灾备架构针对两地三中心灾备建设的需求,达梦公司利用MPP集群架构系统和数据库同步软件(dmhs)软件同步数据,设计了典型的建设方案,能为海量数据核心业务生产系统,提供高可用解决方案,其两地三中心组网如下图所示。
图:两地三中心架构图通过DMHS高效的数据同步可以以秒级的速度保持异地灾备中心的数据库系统(达梦)和同城灾备中心的同构备机数据库系统与生产数据库中心的主机数据库系统的数据一致性,并且符合实际的业务处理逻辑。
当生产数据库中心的数据库系统无法提供服务时,可在异地灾备中心的数据库系统上及时接管业务,实现生产系统快速切换和恢复,保持业务连续并使数据损失最小化。
DMHS采用从外部分析日志的方式,使得数据同步不需要对主机数据库进行复杂配置,对主机数据库系统几乎无影响,从而可以有效避免灾备系统对生产系统带来的性能影响。
3.2两地三中心灾备实现原理达梦数据同步软件DMHS,通过秒级数据实时同步可以有效避免传统备份系统导致的无法完全满足企业对于信息系统不中断服务的问题;通过变化日志捕捉可以有效降低传统ETL工具因创建触发器、影子表等对业务系统带来的性能影响;通过可读写的备机数据库系统可以解决传统备机系统仅作为后备而无法对外提供数据服务的问题。
DMHS的技术原理图如下所示。
DMHS采用并行处理体系,能够实时读取主机源数据库日志,以较低的资源占用实现大批量的数据实时同步。
在源端,DMHS采用优化的日志扫描算法实现目标数据的快速抽取。
在目的端,DMHS使用数据库本地ODBC接口访问备机数据库系统,同时可以通过事务重组、分批加载等技术加快数据装载的速度和效率,降低备机数据库系统的资源占用。
传输过程中,DMHS直接通过TCP/IP进行网络传输,无需依赖于数据库自身的传递方式,通过对传输对数据进行筛选和压缩,还可以进一步降低带宽需求。
DMHS的数据同步以源数据库的事务为单位,严格按照主机业务系统事务顺序实施数据同步,保障备机数据库与主机数据库的事务级完整性和一致性,确保备机数据库符合主机业务系统事务逻辑。
通过这种事务级粒度的数据一致性维护,使得备机数据库系统分担主机数据库系统上的业务负载成为可能。
数据在传输过程中可能因为网络故障而导致传输中止。
为保障数据传输的无丢失,DMHS使用检查点机制实现断点续传。
断点包括两个部分,即DMHS前置的变化数据捕捉模块数据抽取位置检查点和DMHS主程序的数据装载模块的已装载位置检查点。
DMHS的前置模块与主程序模块采取完备的消息应答机制来保障数据传输的可靠性和数据完整性。
前置模块只有在得到确认消息后才认为数据传输完成,否则将自动重新传输数据。
从而确保了灾备数据的完整性。
3.3两地三中心灾备解决方案特点➢可实现同城双活:与传统仅作为后备而无法对外提供数据服务的备机系统不同,DMHS的备机数据库系统是一套独立的可读写数据库系统。
通过高可靠的数据传输,DMHS备机数据库系统中的数据可以在业务处理逻辑上与主机系统完全保持一致。
应用系统通过简单配置,就可以使用DMHS的备机系统分担主机业务系统上的负载,提高业务系统效率。
同时,根据实际业务需要,还通过DMHS的备机系统还可以实现生产型业务与分析型业务的完全隔离双业务中心,提高应用系统整体性能。
➢体系结构高可扩展:DMHS的开放式体系结构使其能够适应各种异构数据平台。
系统安装部署简单但功能强大,可以根据用户需求采用非常灵活的方式配置出各种拓扑结构,包括一对一同步、一对多广播型同步、多对一聚合型同步、多对多同步以及级联同步等多种数据同步形式,满足用户的各种复杂数据同步需求。
➢支持数据复制压缩和加密:DMHS支持同步数据可筛选、数据过滤和简单的数据转换,实现满足业务需求的按需同步,有效的降低网络通信代价和存储成本。
DMHS数据筛选通过用户在需要同步的表上定义过滤和转换规则来实现。
DMHS还可和DMETL结合,实现更为复杂的数据清洗。
DMHS还支持传输数据压缩和加密,在进一步降低网络传输代价的同时,提高传输安全性,防止数据库数据在传输过程中被非法窃取。
4.结束语随着数据中心的建设和技术发展,分布式双活数据中心已经成为当前的技术热点。
而实现分布式双活的数据中心是一个具有挑战性的系统工程,涉及到数据中心的网络系统、服务器系统、数据库系统和存储系统等多个系统的分工合作。
随着数据库与存储双活技术的发展,未来分布式双活数据中心将消除数据层面对双活的限制,从而具有更好的灵活性。