浅谈容灾与容灾方案设计
分布式系统中的容灾与灾备设计(五)

分布式系统中的容灾与灾备设计在现代信息技术高速发展的时代,分布式系统已经成为许多企业和机构的核心架构。
然而,在构建和维护分布式系统时,容灾与灾备设计是一个至关重要的方面。
本文将讨论分布式系统中的容灾与灾备设计的原则、技术和最佳实践。
一、容灾与灾备的重要性分布式系统的容灾与灾备设计是为了应对可能发生的系统故障和自然灾害的影响,确保系统的稳定性和可用性。
容灾与灾备设计不仅可以减少系统停机造成的损失,还可以保持业务连续运行,提高用户体验,增加企业的竞争力。
二、容灾与灾备设计原则1. 多地区部署:分布式系统应该在不同地理区域部署,避免单点故障。
这样,即使一个地区发生故障,其他地区的系统仍然可以正常运行。
2. 数据备份:数据备份是容灾与灾备设计的核心。
应该定期将系统数据备份到不同的地点和存储介质中,以防止数据丢失。
3. 容错机制:分布式系统必须具备容错机制,能够在单点故障情况下自动切换到备用节点,保持系统的可用性。
4. 监控与预警:系统应该有自动化的监控和预警机制,能够及时检测到系统异常,并提供预警信息,以便及时采取应对措施。
5. 持续测试与复原能力:容灾与灾备设计并不是一次性完成的,而是需要持续测试和改进的过程。
系统应该具备快速复原能力,能够在灾难发生后迅速恢复正常运行。
三、容灾与灾备设计技术1. 数据复制:数据复制是容灾与灾备设计的关键技术之一。
通过将数据复制到多个地点,可以实现数据的冗余备份和高可用性。
常用的数据复制技术包括数据库复制、文件系统复制和对象存储复制等。
2. 负载均衡:负载均衡是分布式系统中常用的技术,通过均衡系统的负载,可以减少单个节点的压力,提高系统的性能和可靠性。
常用的负载均衡技术包括DNS负载均衡、软件负载均衡和硬件负载均衡等。
3. 容器化与虚拟化:容器化和虚拟化技术可以提供弹性和灵活性,使系统能够快速调整和扩展。
容器化技术如Docker和Kubernetes可以实现快速部署和迁移,而虚拟化技术如VMware和Hyper-V可以提供硬件资源的隔离和动态分配。
服务器容灾方案设计及实施

服务器容灾方案设计及实施在当今信息化时代,服务器已经成为企业运营中不可或缺的重要设备。
然而,服务器故障或灾难事件可能会给企业带来严重的损失,因此建立一套完善的服务器容灾方案显得尤为重要。
本文将探讨服务器容灾方案的设计及实施,帮助企业建立起可靠的服务器容灾机制。
一、容灾方案设计1. 业务需求分析在设计容灾方案之前,首先需要对企业的业务需求进行全面的分析。
明确关键业务系统和数据,确定其重要性和敏感性,以便有针对性地制定容灾策略。
2. 风险评估对可能导致服务器故障的风险因素进行评估,包括硬件故障、软件故障、自然灾害等。
根据评估结果,确定不同风险等级下的应对措施。
3. 容灾目标设定根据业务需求和风险评估结果,设定容灾目标,包括恢复时间目标(RTO)和恢复点目标(RPO),确保在灾难发生时能够及时有效地恢复业务。
4. 容灾策略选择根据容灾目标,选择合适的容灾策略,包括数据备份、异地容灾、冷热备份等。
结合实际情况和预算限制,确定最适合企业的容灾方案。
5. 技术方案设计基于选定的容灾策略,设计相应的技术方案,包括数据备份方案、灾难恢复方案、网络架构设计等。
确保技术方案能够实现容灾目标并具备可行性。
二、容灾方案实施1. 数据备份与恢复建立定期的数据备份机制,确保关键数据的安全性和完整性。
同时,建立数据恢复流程,定期进行数据恢复测试,验证备份数据的可用性。
2. 灾难恢复演练定期组织灾难恢复演练,模拟不同灾难场景下的应急响应和恢复过程。
通过演练,发现问题并及时改进容灾方案,提高应对灾难的能力。
3. 异地容灾建设在不同地理位置建立备用数据中心,实现异地容灾备份。
确保备用数据中心与主数据中心之间的数据同步和网络连接畅通,提高容灾的可靠性。
4. 监控与报警建立完善的服务器监控系统,实时监测服务器运行状态和性能指标。
设置报警机制,及时发现服务器异常情况并采取相应措施,防止故障扩大。
5. 容灾方案优化定期评估容灾方案的有效性和可靠性,根据评估结果对方案进行优化和改进。
云计算中的容灾和灾备方案设计

云计算中的容灾和灾备方案设计云计算是当今信息技术领域的热点话题,它带来了许多便利和高效的解决方案。
然而,任何技术都不是完美的,也存在各种潜在问题和风险。
在云计算环境中,容灾和灾备方案设计是至关重要的,以确保系统的稳定性和可靠性。
本文将讨论云计算中容灾和灾备方案的设计原则和最佳实践。
第一部分:容灾和灾备的概述容灾(Disaster Recovery,简称DR)和灾备(Business Continuity,简称BC)是两个独立但密切相关的概念。
容灾指的是在灾害事件发生后,通过备份和恢复数据、应用和服务来恢复业务的过程。
而灾备则是指在灾害发生前采取的一系列措施,以保证业务的持续运行。
第二部分:云计算中的容灾和灾备需求云计算环境中的容灾和灾备需求与传统IT环境不同。
云计算的特点包括弹性扩展、虚拟化、远程访问等,因此容灾和灾备方案需要针对云计算环境的特点做出相应调整。
具体而言,云计算中的容灾和灾备需求包括数据备份与恢复、虚拟机镜像备份与迁移、网络连通性保证等。
第三部分:云计算中的容灾和灾备方案设计原则1. 多地点备份:通过在不同地理位置的数据中心进行备份,确保数据的高可用性和容灾能力。
2. 虚拟机镜像备份:将虚拟机镜像备份到不同位置的数据中心,以减少单点故障的风险。
3. 实时数据同步:采用实时数据同步技术,确保在灾难发生时可以快速恢复数据。
4. 弹性扩展能力:云计算环境的容灾和灾备方案应具备弹性扩展能力,能够应对突发的业务需求和高负载情况。
5. 容灾测试与演练:定期进行容灾测试和演练,验证容灾和灾备方案的有效性和可靠性。
第四部分:云计算中的容灾和灾备方案设计实践1. 数据备份与恢复:使用分布式存储技术将数据备份到多个数据中心,并定期进行数据一致性检查和恢复测试。
2. 虚拟机镜像备份与迁移:使用虚拟化管理软件进行虚拟机镜像备份和迁移,以实现虚拟机的高可用性和容灾能力。
3. 网络连通性保证:通过多个运营商的网络互联来确保网络连通性,避免单点故障带来的影响。
容灾设计部署方案

容灾设计部署方案背景随着业务的不断发展,系统的可靠性和稳定性成为了一项非常重要的需求。
在系统遭受灾难性事件的时候,如何在最短时间内恢复业务变得尤为重要。
容灾(Disaster Recovery,简称DR)就成为了该领域中的一个重要的概念。
容灾设计原则•可用性:系统必须能够在任何情况下继续提供业务服务,保持高可用性。
•可恢复性:系统在灾难发生后,应该尽快恢复以避免业务中断。
•可靠性:系统应该实现数据完整性、数据一致性等,以保证系统的可靠性。
•可验证性:容灾系统应该定期进行测试,验证其可用性、可恢复性和可靠性等。
容灾设计方案容灾设计方案应根据系统需求、业务场景和实际情况综合考虑,选择相应的容灾方案。
具体的容灾方案如下:本地灾备本地灾备主要是通过备份数据、冗余设备、热备等方式来实现系统的容灾。
该方案主要针对单点故障和服务器硬件故障等情况下数据恢复和业务迁移。
本地灾备方案的优点是部署简单、成本相对较低,同时数据的传输速度也比较快。
但是,本地灾备的缺点是易受地域性灾害和系统故障的影响,并且可扩展性较差。
异地灾备异地灾备主要是通过将数据备份到异地机房,使用冗余设备、灾备网路等维护应用系统的高可用性,以快速恢复系统故障。
异地灾备主要针对灾害和地理位置等原因导致本地数据中心无法正常工作的情况下,数据恢复和业务迁移。
异地灾备方案的优点是数据能够在灾害发生前及时备份,即使发生意外也能快速恢复数据和应用系统。
缺点是成本相对较高,同时数据传输速度也较慢。
混合灾备综合本地灾备和异地灾备的方案,可以规避两者本身的缺点,以达到最佳的容灾效果。
混合灾备方案的优点是相对于本地灾备,具有更高的可用性和可靠性;相对于异地灾备,成本较低,应用系统可扩展性也更高。
缺点是需要额外的维护成本。
部署方案容灾设计部署方案需要结合具体的业务需求来考虑。
一般而言,需要在现有系统后端适配容灾模块。
其主要步骤如下:•选择合适的容灾方案;•制定容灾策略,明确容灾方案的实施流程;•部署容灾系统,进行系统测试;•定期对容灾系统进行测试,保证其可用、可恢复和可靠。
浅谈容灾与容灾方案设计

浅谈容灾与容灾方案设计自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。
在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。
灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。
震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。
08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。
容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。
一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。
容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。
信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。
容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。
统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。
虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。
我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数据的可恢复性难以验证、管理成本居高不下等问题。
以上种种因素使得部分准备建立容灾系统的用户裹足不前。
为此,国务院信息化工作办公室于2005年4月下发了《重要信息系统给灾难恢复指南》,而后2007年国家标准《信息系统灾难恢复规范》出台,指明了灾难恢复的流程,灾备建设的等级划分及灾难恢复预案的制定等内容,为企业的相关工作提供了有益的参考。
服务器容灾方案的设计与实施

服务器容灾方案的设计与实施在当今信息化时代,服务器对于企业的正常运行起着至关重要的作用。
然而,任何一台服务器都有可能发生故障或遭受攻击,对企业的运营造成巨大影响。
为了保障服务器及数据的安全可靠性,一项完善的容灾方案显得尤为重要。
本文将探讨服务器容灾方案的设计与实施,并提供一种适用于中小企业的简单有效方案。
一、容灾需求分析首先,我们需要对企业的服务器容灾需求进行全面分析和评估。
这包括对服务器系统的重要性及业务连续性要求的了解,对潜在风险和威胁进行评估,以及根据企业的实际情况确定服务器容灾的具体目标和策略。
二、服务器备份与恢复服务器备份与恢复是容灾方案的核心。
在确定了容灾目标后,我们需要选择合适的备份策略和工具。
常见的服务器备份方法有完整备份、增量备份和差异备份等。
根据实际需求,可以选择单一备份策略或结合多种备份策略。
重要的是确保备份的可靠性和完整性,并为备份数据选择合适的存储介质。
在服务器故障或数据丢失的情况下,服务器的快速恢复至关重要。
因此,在容灾方案中,我们需要采取相应的恢复策略。
这可能包括服务器镜像恢复、数据同步恢复和迁移恢复等。
选择适当的恢复策略,使服务器能够在最短的时间内恢复正常运行,对企业的业务影响降到最低。
三、多台服务器的负载均衡为了实现高可用性和容灾性,我们可以考虑将服务器集群化,通过负载均衡技术实现资源的合理分配和请求的转发。
这样一来,即使某一台服务器发生故障,其他服务器仍然能够继续提供服务,确保业务的持续性。
常见的负载均衡技术包括硬件负载均衡和软件负载均衡,具体选择应根据企业的实际需求和经济能力进行决策。
四、灾备数据中心的建设为了进一步提高服务器的容灾能力,我们可以考虑搭建灾备数据中心。
灾备数据中心是一个与主数据中心相对独立的数据中心,用于存储备份数据并提供业务容灾保护。
通过在灾备数据中心部署备用服务器和存储设备,可以在主数据中心发生故障时快速切换至灾备数据中心,保证业务的持续性。
容灾建设方案

容灾建设方案•容灾建设概述•容灾建设方案设计•容灾实施步骤•容灾管理策略•容灾案例分析•总结与展望目录01容灾建设概述容灾的定义与重要性容灾定义容灾是指在遭遇自然灾害、事故或重大故障等不可抗力因素时,能够迅速恢复信息系统正常运行,并保证业务连续性的一种机制。
容灾重要性随着信息化程度的不断提高,信息系统已经成为企业运营和管理的核心,一旦发生故障或灾难,将可能造成巨大的经济损失和声誉损失。
因此,容灾建设对于保障企业业务连续性和数据安全至关重要。
容灾分类根据容灾的建设目标和实现方式,可以将容灾分为数据级容灾和应用级容灾。
数据级容灾主要关注数据的备份和恢复,而应用级容灾则更注重保障业务的连续性。
容灾级别根据容灾的恢复能力和数据丢失程度,可以将容灾分为不同的级别,如数据备份级别、本地高可用级别、本地容灾级别、远程容灾级别等。
容灾的分类与级别容灾技术的发展趋势云计算技术的应用云计算技术为容灾提供了更加灵活和高效的解决方案,可以实现数据备份、恢复和迁移的自动化和智能化。
大数据技术的应用大数据技术可以帮助企业更好地管理和分析海量数据,提高数据的安全性和可靠性,为容灾建设提供更加全面的保障。
人工智能技术的应用人工智能技术可以通过机器学习和深度学习等技术手段,提高容灾系统的自动化和智能化水平,降低人工干预和操作风险。
02容灾建设方案设计容灾需求分析业务需求分析明确关键业务需求,确定容灾建设的目标、范围和要求。
风险评估识别潜在的业务风险,评估容灾建设的必要性和紧迫性。
资源投入根据业务需求和风险评估,制定容灾建设的资源投入计划。
遵循先进性、成熟性、可靠性、可扩展性等原则,选择适合的容灾技术。
技术选型原则比较不同技术方案的优缺点,选择最适合企业需求的容灾技术方案。
技术方案比较制定技术实施计划,明确技术实施的时间表、责任人和风险控制措施。
技术实施计划容灾技术选择遵循高可用性、高可靠性、可扩展性等原则,设计容灾架构。
架构设计原则比较不同架构方案的优缺点,选择最适合企业需求的容灾架构方案。
容灾实施方案

容灾实施方案随着信息技术的快速发展,数据的安全性和可用性变得越来越重要。
无论是自然灾害、人为破坏还是硬件故障,都可能导致数据丢失和服务中断。
因此,企业和组织应该制定一份完善的容灾实施方案,以应对潜在的风险并确保业务的持续运行。
一、容灾需求分析在制定容灾实施方案之前,首先需要对组织的容灾需求进行分析。
这包括对关键业务系统的重要性进行评估,确定恢复时间目标(RTO)和恢复点目标(RPO),以及评估容灾预算。
只有充分了解组织的需求,才能制定出切实可行的方案。
二、容灾方案设计容灾方案设计是整个实施方案的核心。
在设计过程中,可以考虑以下几个方面:1. 数据备份和恢复:数据备份是容灾的基础,需要制定数据备份策略,包括哪些数据需要备份、备份频率以及备份的存储位置等。
同时,还需要测试数据恢复流程,确保备份的有效性。
2. 硬件和设备冗余:为了避免单点故障,应考虑在关键设备和系统上实施硬件冗余。
例如,可以建立双机热备份系统,确保一台主机发生故障时,另一台备机能够立即接管工作。
3. 网络容灾:网络是现代企业和组织的生命线,因此需要建立网络容灾策略。
这可能包括使用多条ISP线路、建立VPN隧道或者部署分布式防火墙等。
通过这些措施,可以保证即使出现网络故障,业务仍能正常运行。
4. 数据中心容灾:数据中心是组织信息系统的核心,如果发生故障可能导致业务中断。
因此,建立备用数据中心可以帮助实现容灾。
备用数据中心的位置应远离主数据中心,并且应实施数据同步和服务切换机制。
三、容灾方案实施容灾方案的实施需要明确的计划和组织。
以下是一些可行的步骤:1. 制定详细的项目计划:明确每个阶段的时间表和任务分配。
确保团队成员了解他们的角色和责任。
2. 数据和系统迁移:当数据备份和冗余设备都准备就绪时,需要进行数据和系统的迁移。
这需要确保数据的完整性和准确性,并测试系统的功能。
3. 容灾演练:在正式实施容灾前,需要进行容灾演练。
通过模拟各种故障和恢复过程,可以评估方案的可行性并进行改进。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈容灾与容灾方案设计自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。
在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。
灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。
震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。
08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。
容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。
一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。
容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。
信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。
容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。
统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。
虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。
我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数据的可恢复性难以验证、管理成本居高不下等问题。
以上种种因素使得部分准备建立容灾系统的用户裹足不前。
为此,国务院信息化工作办公室于2005年4月下发了《重要信息系统给灾难恢复指南》,而后2007年国家标准《信息系统灾难恢复规范》出台,指明了灾难恢复的流程,灾备建设的等级划分及灾难恢复预案的制定等内容,为企业的相关工作提供了有益的参考。
要建设容灾工程必须提出容灾系统的建设目标,作为衡量和选择容灾产品技术和解决方案的参数。
例如:●备份/恢复的范围●灾难恢复计划的状态●业务系统与容灾系统之间的距离●业务系统与容灾系统之间如何相互连接●数据是怎样在两个系统之间传送的●允许有多少数据被丢失●怎样保证更新的数据在容灾系统被更新●容灾系统可以开始支持服务的能力在设计容灾系统时,还需要提供更加具体的设计指标。
建立容灾系统的最终目的,是为了在灾难发生后能够以最快的速度恢复数据服务,所以,容灾中心的设计指标主要与容灾系统的数据恢复能力有关,最常见的设计指标有:RTO 和RPO。
RTO(Recovery Time Objective)代表容灾系统在灾难发生后数据或者系统恢复所用的时间。
RPO(Recovery Point Objective)代表灾难发生时已经备份的数据与生产中心数据的时间差。
通常情况下,容灾系统投资较大,使用概率较低,因此,需要对总体投入成本(TCO)和投资回报率(ROI)进行认真的分析和计算。
从经济角度考虑,最佳的容灾技术不一定是最好的容灾解决方案,容灾系统的总体投入TCO和投资回报ROI,对于许多用户来说是十分重要的设计指标。
TCO 包括建立系统、维护系统和扩充系统的总投入,由于容灾系统的启用概率很低,新技术的发展和新产品的性能价格比的提高,必定造成容灾设备的贬值。
所以,对于容灾系统TCO越高,ROI越低。
不同企业的系统环境千差万别,从单机到大型数据中心,从小型单业务到复杂的多业务集成。
平台复杂度、数据复杂度、业务复杂度、管理复杂度的区别使得我们很难用简单的思维去理解和规划容灾系统。
容灾项目的推进不是需求与技术的简单匹配,而要深入地分析用户的应用环境,找到最适合的解决方案。
正所谓“没有最好的产品,只有最合适的方案”。
容灾的建设不能局限于技术类型的划分,而是帮助用户打破产品技术局限,根据不同应用的特点,综合地考虑RTO、RPO、TCO、RIO等指标和技术实现方式,提供从单业务系统到企业数据中心的多套灾难解决方案共用户选择。
用户不必过多地考虑不同技术的差异,仅需要理解技术方案与自身业务的匹配度。
例如,针对中小企业,UIT提出的基于主机容灾方案,充分考虑中小企业没有大型存储,环境简单的特点,支持从操作系统 -- 应用软件-- 数据的全面容灾保护,使得客户不需要关心数据结构和类型的差别。
UIT方案兼具HA与远程复制容灾功能,传输数据量小,容灾距离无限制等特点。
首先对生产系统做数据镜像,实时捕捉系统byte-level变化,当数据有任何变动时,将变动的部分更新至目标备用服务器,一旦生产数据库宕机,则灾备服务器立即接管相关的服务,系统实时数据复制与保护,最大程度降低服务中断时间,并可加强磁带备份机制,该方案同时支持SAN,NAS或 Microsoft Cluster Server(MSCS)等中小企业常用应用平台,系统环境不需要修改,最大限度的保护了现有设备的投资。
大型企业的容灾建设就需要另外的思路。
企业级数据中心的复杂度在于平台繁多,各类系统的RTO、RPO指标可能差距很大。
如果分散使用各类容灾技术,会极大的影响产品采购及后期使用维护的整体成本(CTO)。
所以在数据中心环境下建立灾备系统,不能单独考虑某个技术或产品适合某个系统的问题。
另外大型企业数据中心进行容灾建设的前提是数据的集中。
如果在数据分散存储的状态下做容灾规划是不可想象的。
因此统一的SAN存储结构最有利于容灾系统的设计。
UIT提出的存储虚拟化企业级容灾方案即基于以上环境,充分考虑大型数据中心对高可靠性、高性能、高扩展性的要求,利用带外虚拟化技术在现有的SAN 存储架构上增加虚拟化管理器来实现高级的统一存储管理和远程容灾功能。
UIT 方案提供先进的、集中简化的SAN管理及多层次的数据保护功能(快照和复制)。
企业用户能够更加有效地管理和利用存储系统,建立可靠的容灾环境,确保业务的可靠性和连续性。
同时,该解决方案能够使用户的存储基础构架更具扩展性和灵活性,支持不同厂商的存储平台,将选择权真正交还给用户,现有设备的投资受到保护,从发展的观点看能够真正降低企业的总体拥有成本(TCO)。
容灾备份技术的应用,帮助企业在发生不可抗拒灾难之后,能够在第一时间内恢复公司企业的重要数据,以求达到业务连续性的目的,是公司尽最大可能减少灾难下的损失,为企业赢得利益上的保证。
灾备建设基本方法的三个要素灾备建设的基本方法,一言以蔽之,就是灾备目标、拥有成本和灾备技术方案选型三者的权衡。
灾备目标,就是熟知的RPO和RTO,可对应于《灾备信息》所规定的灾备系统等级;灾备拥有成本,一般包括首次建设成本和后期运维成本;灾备技术方案,就是实现灾备目标的技术手段,具体包括备份、复制、镜像、集群、虚拟化等技术和技术组合方案。
灾备目标和拥有成本的关系是比较容易理解的,要实现或达到怎样的灾备目标或等级,就需要花费相应的成本,绝大部分的情况下,灾备目标和等级越高,总体拥有成本越高。
灾备目标和容灾备份技术方案的关系是,灾备目标决定了灾备技术手段的选择范围。
这里的“范围”是指一个技术产品群,也就是说达到同一个灾备等级是有多种技术可选择的,每种技术在业内又有不同的产品,如何选择是核心问题,也是用户在灾备建设中的最为困惑的问题之一。
本文正是通过对灾备关键技术的介绍,告诉您灾备技术选择的一般方法。
灾备技术需求新发展随着IT系统建设的日益复杂化,在灾备实际建设中,除了关注传统的灾备目标和等级要求(RPO和RTO)外,还涌现了一些典型的技术需求。
这些需求由于与灾备目标实现和总体拥有成本紧密相关,正逐步成为灾备建设技术评价体系的一部分,越来越受用户的重视。
归纳起来有以下几个方面。
1.生产系统的影响程度灾备部署和运行对生产系统的架构、性能的影响程度,表现为对生产系统资源的占用程度和部署容灾备份技术对原架构的更改程度,占用和更改程度越大,说明影响程度越高,越需要进行技术改善。
2.统一灾备能力目前中大型企业机构的数据中心都有多个IT系统,同时存在多品牌或不同档次的存储、服务器。
由于品牌技术的锁定,特别是存储系统的品牌锁定,灾备中心建设面临一个典型的技术无奈:为每套存储系统建立单独的灾备系统,庞大的多套灾备系统由此产生。
这样的情况下,不仅灾备成本居高不下,而且灾备日常运行维护投入也很高。
因此,越来越多的用户希望获得多个生产系统统一灾备的解决方案。
这样的方案有两个特点:第一,灾备中心只建设一套灾备系统,承载多个生产系统的灾备业务;第二,统一管理分散的多套生产系统的灾备业务。
3.逻辑软灾难应对需求据权威统计,IT系统计划外宕机的故障原因中,有49%是由于人为误操作、软件bug、病毒等逻辑软灾难造成的。
越来越多的灾备建设规划,将具备软灾难的恢复能力作为灾备系统的建设目标需求。
4.灾备链路带宽要求灾备建设有灾备距离要求,灾备链路规划是容灾备份技术建设的技术主题之一。
目前大部分用户的灾备链路都采用租用公共链路方式,灾备系统的链路需求与总体拥有成本强相关。
选用带宽要求小的灾备技术或者部署相关的带宽优化技术成为技术选型的方向。
5.灾备数据可用性低级的容灾备份技术需要在数据反向恢复后才能检验灾备数据副本是否完整一致,数据反向恢复操作对源数据是一次覆盖,具有极大风险。
用户需要这样的高级的灾备技术,无需进行数据恢复,能实现数据副本的即时可验证;灾备数据的可用性是指多大程度上实现灾备数据副本的可用,分为不可用、可用(需进行少量低风险操作后可用)、实时可用(源数据及其副本可同时提供业务访问)。
灾备基础数据同步技术灾备技术源于数据保护技术,其核心的技术思想是为数据在异地创建副本。
灾备技术就是利用数据保护的基础技术在几十公里、数百公里甚至千里之外的系统中创建数据的副本,实现生产系统和灾备系统的数据同步。
虽然实现某一灾备等级和目标有多种技术和产品,但纵观业界的灾备产品,万变不离其宗,都是基于以下几个数据保护与同步基础技术。
灾备数据同步技术实现与选型1.备份技术传统备份技术的实现已经被当前的用户大量应用并被熟知,技术实现不再赘述。
备份技术在技术成熟度和成本上是有优势的,但这个技术部署在灾备系统中是有明显局限性的,主要体现在以下几个方面:备份时间长,存在备份窗口,无法实时灾备,所以RPO至少在半天以上容灾备份技术有效性无法检验,灾备可靠性差备份有数据格式转换,灾备恢复时间长备份技术近几年有了一定的优化,主要有两个方面:基于磁盘备份技术,产生了D2D(磁盘到磁盘)和D2VTL(磁盘到虚拟磁带库)的备份方案。
这种技术方案大大缩短了备份时间,备份窗口进一步减小。