数据备份技术方案
数据备份方案

数据备份方案1. 简介数据备份是指将重要的数据复制到另一个存储介质,以防止数据丢失或损坏。
在现代电子化的环境中,数据备份变得尤为重要,因为各种意外情况可能导致数据丢失,如硬件故障、人为错误、自然灾害等。
本文将介绍几种常见的数据备份方案,以帮助您选择适合您需求的备份策略。
2. 本地备份本地备份是最基本和常见的备份方式,它将数据复制到本地存储介质,如硬盘、光盘、磁带等。
本地备份的优点是速度快,可以方便地访问和恢复数据。
然而,本地备份也存在一些缺点,比如容易受到硬件故障和自然灾害的影响,造成数据丢失的风险。
为了确保数据的安全性,以下是一些本地备份的最佳实践:•定期备份:定期备份是保持数据同步的关键。
根据数据的更新频率,您可以选择每日、每周或每月备份。
•多备份策略:维护多个备份点可以防止单点故障造成数据丢失。
您可以使用不同的存储介质来创建多个备份点。
3. 远程备份远程备份是将数据复制到远程位置的备份方式,以保护数据免受本地灾难的影响。
这种备份方式常见的应用场景是将数据备份到云存储服务商的服务器上。
与本地备份相比,远程备份的优势在于数据安全性更高,可以防止物理损坏和自然灾害等问题的影响。
以下是常见的远程备份技术和方法:•云备份:云备份是当前最流行的备份方式之一。
云备份将数据存储在云服务器上,用户可以通过互联网访问和管理备份数据。
云备份提供了高度可靠的数据保护机制,并且可以根据需要进行扩展和调整。
•远程服务器备份:在一些情况下,您可以选择使用专门的远程服务器作为备份目标。
远程服务器备份可以提供更多的灵活性和定制化选项,以满足特定的备份需求。
4. 增量备份与全量备份增量备份和全量备份是常见的备份策略,它们之间有一些区别。
•增量备份:增量备份是只备份相对于上一次备份发生变化的数据。
这意味着增量备份比全量备份更快速和节省存储空间。
然而,在进行数据恢复时,需要依次还原备份链上的多个增量备份点,时间和资源成本相对较高。
大数据备份方案

3.备份保留期限
(1)全量备份:保留最近12个月的数据。
(2)增量备份:保留最近4周的数据。
(3)差异备份:保留最近7天的数据。
三、备份介质
1.磁盘存储
(1)本地磁盘:作为数据备份的主要存储介质,用于存储全量、增量、差异备份。
(2)网络磁盘:作为数据备份的辅助存储介质,用于远程备份,提高数据安全性。
2.光盘存储
用于长期保存重要数据,以防磁盘损坏、数据丢失等情况。
四、备份与恢复操作流程
1.备份操作
(1)定期执行备份任务,确保备份按时完成。
(2)备份完成后,对备份数据进行验证,确保数据完整性。
(3)将备份数据存储在指定位置,并进行标注,便于查找。
2.恢复操作
(1)在数据丢失或损坏时,及时通知相关人员。
(2)定期审计备份记录,确保备份策略得到有效执行。
(3)对备份过程中发现的问题进行追踪,及时改进。
六、备份安全管理
1.权限控制
(1)严格限制备份操作权限,确保只有授权人员才能进行备份操作。
(2)对备份数据进行加密存储,防止数据泄露。
2.数据保护
(1)定期检查备份存储介质,确保数据安全。
(2)制定数据恢复应急预案,提高数据恢复效率。
2.备份审计
(1)记录备份操作的相关信息,包括备份时间、备份类型、备份数据量等。
(2)定期审计备份记录,确保备份策略得到有效执行。
(3)针对备份过程中发现的问题,及时进行改进。
六、备份安全管理
1.权限控制
(1)严格限制备份操作权限,确保只有授权人员才能进行备份操作。
(2)对备份数据进行加密存储,防止数据泄露。
本方案采用以下三种备份类型:
数据备份方案

数据备份方案一、背景介绍在现代信息化的时代,数据的安全性和可靠性对于企业和个人来说至关重要。
数据备份方案是为了保护数据免受意外数据丢失,如硬件故障、自然灾害、恶意攻击等因素的影响。
本文将详细介绍一种数据备份方案,以确保数据的安全性和可恢复性。
二、备份类型1. 彻底备份:将所有数据复制到备份设备中,包括文件、数据库、操作系统等。
这种备份类型比较耗时和占用存储空间,但是恢复速度快,适合关键数据的备份。
2. 增量备份:只备份自上次彻底备份以来发生变化的数据。
这种备份类型相对较快且占用存储空间较少,但是恢复过程较慢,需要先还原彻底备份,再逐步应用增量备份。
3. 差异备份:备份自上次彻底备份以来发生变化的数据块,与增量备份不同的是,差异备份只备份自上次差异备份以来的变化。
这种备份类型介于彻底备份和增量备份之间,占用存储空间较少,恢复速度也相对较快。
三、备份策略1. 定期备份:根据数据的重要性和变化频率,制定定期备份计划。
对于重要数据,建议每日进行彻底备份,以保证数据的安全性和可恢复性。
2. 存储介质选择:根据备份数据量和恢复速度的需求,选择适合的存储介质,如磁带、硬盘、云存储等。
磁带备份具有较高的存储密度和可靠性,但恢复速度较慢;硬盘备份速度较快,但存储密度相对较低;云存储备份方便灵便,但可能存在数据安全性和隐私问题。
3. 多地备份:为了应对自然灾害或者意外事故,建议将备份数据存储在多个地点,以确保数据的可靠性和可恢复性。
可以选择在不同的机房、不同的城市或者使用云备份来实现多地备份。
4. 数据加密:为了保护备份数据的安全性,可以采用数据加密技术。
对备份数据进行加密可以防止数据泄露和未经授权的访问。
四、备份工具1. 数据库备份工具:根据不同的数据库类型选择合适的备份工具,如MySQL、Oracle、SQL Server等。
这些备份工具提供了完整的备份和恢复功能,可以根据需求进行定时备份和增量备份。
2. 文件备份工具:常见的文件备份工具有rsync、robocopy、Bacula等。
数据备份方案

数据备份方案引言概述:在当今数字化时代,数据备份是保障数据安全的重要环节。
无论是个人用户还是企业组织,都需要采取合适的数据备份方案来防范数据丢失的风险。
本文将介绍一种有效的数据备份方案,以确保数据的完整性和可恢复性。
一、备份策略1.1 定期备份定期备份是数据备份方案中的基础步骤。
根据数据的重要性和变动频率,制定合理的备份频率。
对于个人用户,每周备份一次可能已经足够;而对于企业组织,每天或每小时备份可能更为适合。
1.2 多重备份多重备份是确保数据安全的重要手段。
采用多个备份介质,如外部硬盘、云存储等,将数据备份到不同的地点。
这样即使某个备份介质发生故障或遭受损失,仍然可以从其他备份介质中恢复数据。
1.3 自动化备份自动化备份可以减少人为错误和遗漏。
通过使用备份软件或脚本,可以定期自动备份数据,而无需人工干预。
这样可以确保备份的及时性和全面性。
二、备份介质选择2.1 外部硬盘外部硬盘是备份数据的常见选择。
它具有大容量、高速传输和相对低廉的价格优势。
选择可靠的外部硬盘品牌和型号,同时定期检查硬盘的健康状态,以确保备份数据的安全性。
2.2 云存储云存储备份方案可以将数据存储在云端服务器上。
它具有高度的可靠性和可扩展性,同时无需担心硬件故障或灾难性事件。
选择可信赖的云服务提供商,并确保数据加密和访问权限的安全性。
2.3 磁带备份磁带备份是一种传统的备份介质,适用于大规模数据备份。
它具有高容量、长期保存和低成本的特点。
选择高品质的磁带和备份设备,并定期检查磁带的完整性和可读性。
三、备份策略管理3.1 数据分类根据数据的重要性和敏感性,对数据进行分类管理。
将关键数据和敏感数据优先备份,并采取更严格的安全措施,如加密和访问权限控制。
3.2 定期检查备份定期检查备份的完整性和可恢复性非常重要。
通过恢复测试,验证备份数据的可用性,并确保备份介质的可靠性。
对于发现的问题,及时修复或替换备份介质。
3.3 更新备份策略备份策略需要与业务需求和技术环境保持同步。
几种常见的数据备份方案

几种常见的数据备份方案数据备份是一项重要的安全措施,可以防止数据丢失、损坏或被恶意访问。
以下是几种常见的数据备份方案。
1.本地备份:本地备份是指将数据备份到本地存储介质,例如硬盘、光盘、U盘或其他移动设备。
这种备份方案的优点是备份速度快,可随时访问备份数据。
然而,如果备份介质丢失、损坏或被盗,数据可能无法恢复。
2.云备份:云备份是指将数据备份到云存储服务提供商的服务器上。
这种备份方案的优点是数据安全性高,可以远程访问备份数据。
云备份还具有弹性和可伸缩性,适合大规模数据备份。
然而,云备份的缺点是依赖于网络连接和云服务商的可靠性,备份和恢复速度可能较慢。
3.增量备份:增量备份是指只备份发生更改的文件或数据块,而不是整个数据集。
这种备份方案可以减少备份时间和存储空间的消耗。
增量备份通常通过与之前的完整备份进行比较,只备份更改的部分。
然而,恢复数据时需要先恢复完整备份,再逐个应用增量备份。
4.镜像备份:镜像备份是指将完整的系统或数据复制到备份介质上。
这种备份方案可以创建系统的完全副本,包括操作系统、应用程序和数据。
镜像备份通常用于灾难恢复和快速系统恢复。
然而,镜像备份的缺点是备份和恢复时间长,需要大量的存储空间。
5.远程备份:远程备份是指将数据备份到远程地点的备份设备上。
这种备份方案可以提供地理上的分离,以保护备份数据免受地方性的灾难性事件影响。
远程备份可以是本地到本地的备份,也可以是本地到云的备份。
然而,远程备份需要可靠的网络连接和足够的带宽来实现备份和恢复操作。
6.定期备份:定期备份是指根据一定的时间间隔进行数据备份,例如每天、每周或每月备份一次。
定期备份可以确保数据的最新版本得以保存,同时可以减少备份操作的频率和数据存储的成本。
然而,定期备份可能导致数据丢失的范围较大,恢复时需要重新应用最近的完整备份,并且可能需要较长的恢复时间。
综上所述,数据备份方案可以根据实际需求和预算来选择。
常见的备份方案包括本地备份、云备份、增量备份、镜像备份、远程备份和定期备份。
数据存储备份方案

数据存储备份方案标题:数据存储备份方案引言概述:数据是现代社会中最珍贵的资源之一,因此数据存储备份方案至关重要。
在面临各种潜在的风险和威胁时,一个可靠的数据备份方案能够保护数据安全、避免数据丢失,并确保业务的持续运行。
本文将介绍一些常见的数据存储备份方案,匡助读者选择适合自己需求的备份方案。
一、本地备份方案1.1 外部硬盘备份:将数据存储在外部硬盘上,定期进行备份。
1.2 网络附加存储备份:使用网络附加存储设备进行备份,确保数据的安全性和可靠性。
1.3 RAID备份:使用RAID技术将数据分布在多个硬盘上,提高数据存储的可靠性和容错性。
二、云备份方案2.1 公有云备份:将数据备份到公有云服务提供商的服务器上,实现远程备份。
2.2 私有云备份:搭建私有云存储系统,将数据备份到自己的服务器上,加强数据的安全性和隐私保护。
2.3 混合云备份:结合公有云和私有云备份方案,根据数据的重要性和敏感性选择合适的备份方式。
三、增量备份方案3.1 定时增量备份:定期对数据进行增量备份,只备份发生变化的部份数据,减少备份时间和存储空间。
3.2 实时增量备份:实时监控数据变化,及时备份新的数据,保证数据的最新性和完整性。
3.3 差异备份:备份数据的差异部份,与彻底备份相比,减少备份时间和存储成本。
四、备份策略4.1 多重备份:采用多重备份策略,确保数据备份的多样性和完整性。
4.2 定期检查:定期检查备份数据的完整性和可恢复性,及时发现问题并进行修复。
4.3 灾难恢复计划:建立完善的灾难恢复计划,包括数据备份、数据恢复和业务恢复等方面,确保在灾难发生时能够迅速恢复业务。
五、数据加密与安全5.1 数据加密:对备份数据进行加密处理,确保数据的机密性和隐私保护。
5.2 访问控制:设定备份数据的访问权限,避免未授权访问和数据泄露。
5.3 安全传输:使用安全的传输协议和加密通道,确保备份数据在传输过程中不被窃取或者篡改。
结论:数据存储备份方案是保障数据安全和业务持续运行的重要保障措施,选择合适的备份方案对于个人用户和企业用户都至关重要。
数据备份方案

3.备份验证:定期对备份文件进行验证,确保备份数据的可用性。
七、数据恢复
1.恢复流程:明确数据恢复的操作流程,确保在数据丢失或损坏时,能够迅速、准确地恢复数据。
2.恢复测试:定期进行数据恢复测试,验证备份数据的有效性。
3.紧急恢复:针对重要业务系统,制定紧急恢复方案,确保在发生故障时,能够尽快恢复正常运行。
-通过内部会议、公告等形式,定期更新备份相关的信息。
七、方案评估与优化
7.1定期评估
-每年至少对备份方案进行一次全面评估,检查备份效果和潜在风险。
-根据评估结果,调整备份策略和操作流程。
7.2持续改进
-跟踪最展和法规要求,及时更新备份技术和策略。
本数据备份方案旨在为企业提供一个全面、可靠、安全的数据保护框架。所有相关部门应严格遵循本方案,确保数据备份工作的有效实施。通过持续的管理和技术优化,共同维护企业数据资产的安全与价值。
四、数据恢复
4.1恢复流程
-制定清晰的数据恢复流程,包括恢复步骤、责任人、恢复时间等。
-恢复流程应简单明了,以便在紧急情况下快速执行。
4.2恢复测试
-定期进行数据恢复演练,确保在真实恢复场景中能够高效操作。
-恢复测试应涵盖不同的备份类型和备份介质。
4.3紧急恢复
-对于关键业务系统,制定紧急数据恢复方案,减少系统停机时间。
八、数据安全
1.加密存储:对备份数据进行加密存储,防止数据泄露。
2.访问控制:严格限制备份文件的访问权限,防止未授权访问。
3.定期审计:对备份策略、备份操作进行定期审计,确保备份过程的合规性。
九、培训与宣传
1.培训:对相关人员进行备份操作、数据恢复等方面的培训,提高备份工作的效果。
数据备份方案

数据备份方案一、背景介绍在当前信息化时代,数据备份是保障数据安全和业务连续性的重要环节。
数据备份方案旨在确保数据的完整性、可靠性和可恢复性,以防止数据丢失或者损坏,保障企业的正常运营。
二、目标和要求1. 确保数据备份的完整性和可靠性,防止数据丢失或者损坏。
2. 提供快速、高效的数据恢复能力,减少业务中断时间。
3. 保护数据的安全性,防止数据被未经授权的人员访问。
4. 降低备份方案的成本,提高备份效率。
三、备份策略1. 定期备份:根据数据的重要性和变化频率制定备份计划,确保数据及时备份。
2. 彻底备份:每次备份时,将所有数据进行彻底备份,以保证数据的完整性。
3. 增量备份:在每次彻底备份后,仅备份新增或者修改的数据,以减少备份时间和存储空间。
4. 差异备份:在每次彻底备份后,仅备份与上次备份不同的数据块,以减少备份时间和存储空间。
5. 多点备份:将备份数据存储在不同的地理位置,以防止因灾害或者故障导致的数据丢失。
四、备份存储介质1. 磁带备份:适合于大规模数据备份,具有较高的存储容量和较低的成本。
2. 硬盘备份:适合于小规模数据备份,具有较快的备份和恢复速度。
3. 云备份:将备份数据存储在云平台上,具有高度的可扩展性和灵便性。
五、备份恢复测试定期进行备份恢复测试,验证备份数据的可用性和完整性,以确保在数据丢失或者损坏时能够快速恢复业务。
六、备份监控和管理1. 监控备份任务的执行情况,及时发现备份失败或者异常情况。
2. 管理备份数据的存储空间,定期清理过期或者无效的备份数据。
3. 定期评估备份方案的有效性和安全性,根据需求进行调整和优化。
七、数据安全保护1. 加密备份数据:对备份数据进行加密,防止未经授权的访问。
2. 访问控制:限制备份数据的访问权限,确保惟独授权人员能够访问备份数据。
3. 灾备方案:建立灾备中心,将备份数据存储在不同的地理位置,以应对灾害发生时的数据恢复需求。
八、总结数据备份方案是保障数据安全和业务连续性的重要措施。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据备份技术方案目录1.前言 (3)2.文件级备份 (3)3.块级备份 (3)4.远程文件复制 (4)5.远程卷镜像 (4)6.快照技术 (5)6.1.基于文件系统的快照 (6)6.2.基于物理卷的快照 (10)6.3.RoFW方式与CoFW方式比较 (12)6.4.快照的意义 (15)7.卷Clone技术 (17)7.1.备份到本地磁盘 (18)7.2.备份到SAN上的磁盘 (19)7.3.备份到NAS目录 (19)7.4.备份到磁带库 (20)7.5.信息生命周期管理 (20)7.6.分级存储 (20)8.备份通路 (21)8.1.本地备份 (21)8.2.通过前端网络备份 (21)8.3.通过后端网络备份 (22)N Free备份 (23)8.5.Server Free备份 (23)9.备份策略 (24)9.1.备份服务器 (24)9.2.介质服务器 (25)10.三种备份方式 (26)10.1.完全备份 (26)10.2.增量备份 (26)1.前言备份是为了增强企业关键数据可靠性和数据冗余性,备份的必要性不言而喻。
本文探讨备份常用的技术和分类。
所谓数据保护技术是指对当前时间点上的数据进行备份,如果说原始数据被误删除了,可以通过备份数据找回或恢复数据。
从底层来分,数据保护可以分为文件级保护和块级保护。
2.文件级备份文件级备份:将磁盘上所有文件通过调用文件系统接口备份到另一个介质上。
也就是把数据以文件形式读出,然后存储在另一个介质上面。
此时备份软件只能感知到文件这一层。
我们知道一般来说,文件在原来的介质上,可以是不连续存放的,通过文件系统来管理和访问。
当备份到新的介质上以后,文件完全可以连续存放。
正因为如此,没有必要备份元数据,因为利用新介质进行恢复的时候,反正会重构文件系统。
3.块级备份块级备份:就是不管块上是否有数据,不考虑文件系统的逻辑,备份块设备上的每个块。
这样好处是不通过调用文件系统接口,速度更快,缺点的是备份的时候会把所有的块复制一遍,但是实际上很多扇区的数据是不对应真实文件的,也就是会备份很多僵尸扇区。
而且备份之后,原来不连续的文件一样是不连续的文件,有很多的碎片。
4.远程文件复制远程文件复制:通过网络传输到异地容灾点。
典型的代表是rsync异步远程文件同步软件。
可以监视文件系统的动作,将文件的变化,同步到异地站点。
增量复制。
5.远程卷镜像这是基于块的远程备份。
与远程文件复制不同的地方在于,是把块数据备份到异地站点。
又可以分为同步和异步复制。
∙同步复制:必须等数据复制到异地站点以后,才通报上层IO成功消息∙异步复制:写入成功即可回复成功,然后通过网络传输到异地。
不能保证一致性,但是上层响应快。
基于块的备份措施,一般都是在底层设备上进行,不耗费主机资源。
6.快照技术远程镜像确实是对生产数据一种非常好的保护,但是需要镜像卷一直在线,主卷有写IO,那么镜像卷也需要有写IO。
如果想对镜像卷进行备份,需要将停止主卷的读写,然后将两个卷的镜像关系分离。
所以当恢复主卷的IO的时候,镜像卷不会再被读写。
然后才可以备份镜像卷的数据。
这样会存在一个问题,主卷上还继续有IO,将会导致数据与备份的镜像不一致。
所以主卷上所有的写IO动作,会以位图BitMap方式记录下来,BitMap上的每个位表示卷上的一个块,0表示未写入,1表示已写入,所以当拆分镜像以后,被写入了数据,程序将BitMap文件对应位从0变为1。
备份完成以后,再做数据同步即可。
可以看出上述过程比较的繁琐,而且需要占用一块和主卷一样大小的镜像卷。
快照技术就是为了解决这种问题,其基本思想是抓取某一时间点磁盘卷上的所有数据。
快照分为:基于文件系统的快照和基于物理卷的快照,下面介绍一下快照的底层原理。
6.1.基于文件系统的快照文件系统管理的精髓:链表、B树、位图,也就是元数据。
文件系统∙将扇区组合成更大的逻辑块来降低管理规模。
NTFS最大块可以到4KB,也就是8个扇区一组一个簇(Block),这样可以减少管理成本。
∙文件系统会创建所管理存储空间上所有簇的位图文件。
每个位代表卷上的簇(或者物理扇区)是否被使用,如果被使用,则置1。
∙文件系统保存一份文件和其对应簇号的映射链。
因为映射链本身和簇位图也是文件,也有自己的映射链,所以针对重要的元数据,有一个固定的入口: root inode。
写入新数据∙查找簇位图,找位值为0的簇号∙计算所需空间,分配簇号给文件∙将数据写入簇,再去文件——簇号映射图更新∙将对应的簇映射关系记录下来,到簇位图将对应位置改为1。
删除数据∙直接在簇号映射链中抹掉∙簇位图对应簇改为0。
可以看出删除数据实际上不会抹掉实际的数据。
所以,最重要的不是数据,而是文件——簇号映射链和位图等元数据。
也就是说我们要做备份,只需要把某时刻的文件系统中的映射图表保存下来。
但是必须保证卷上的数据不被IO写入了,同时又要不应用还不能中断。
既然原来的空间不能再写了,我们可以写到其他的空闲区域。
∙思路一:Copy on First Write (CoFW),在覆盖数据块之前,需要将被覆盖的数据块内容复制出来,放到空闲的空间。
∙系统中将有两套元数据链,原来的元数据指向当前,快照的元数据链指向历史。
原来的存储空间永远是最新的数据,历史数据会逐渐搬出到空闲空间里面。
∙思路二:Redirect on First Write (RoFW)。
先复制元数据,然后将针对源文件的更改都重定向到空余空间,同时更新元数据。
∙与CoFW不同的是,原来的数据块不会被覆盖。
同样的,系统也有两套元数据,一套是快照保存下来的,永远不更新,一套是源文件系统的,不断的更新。
其实只有首次覆盖的时候,才重定向,因为重定向以后的数据块,哪怕被覆盖了,也不影响之前快照保存的数据了。
到这一步,看上去挺完美,实际上存在一个问题: 如果元数据特别大怎么办?对于海量庞大的文件系统,元数据量可能到GB级别。
如果复制的话,时间上仍然太多。
我们可以回头想想,实际上元数据可以看做指针,指向具体存储的位置。
我们复制到元数据,相当于复制了一堆指针。
现在元数据太多了,我们能不能把这个元数据链的指针给复制了?当然可以,元数据有个根入口块,或者称为Super Block,这个块是固定不变的,里面存放有指向下一级元数据链块的指针。
那么操作系统每次载入元数据的时候,都需要从这个地址读入Super Block,从而一层一层的遍历。
6.2.基于物理卷的快照基于物理卷的快照比文件系统快照要简单得多。
因为LUN一般在底层磁盘上是恒定的,不像文件系统一样可以随机细粒度的分布。
所以可以认为LUN的元数据就是在底层磁盘的起始和结束地址。
这样在快照的时候,需要复制的元数据就更少了,但是完成了以后,需要按照一定粒度来做CoFW或者RoFW,还需要记录更多数据映射指针,就比较难受了。
对于实现了块级虚拟化的系统如NetApp、XIV、3PAR等,它们的LUN在底层位置是不固定的,LUN就相当于一个文件,存在元数据链来进行映射管理的维护,所以这些系统实现快照的原理与文件系统快照类似。
基于物理卷的快照,相当于给物理卷增加了“卷扇区映射管理系统”。
在底层卷实现快照,可以减轻文件系统的负担。
卷扇区方都是用LBA来编号的,实现快照的时候,程序首先保留一张初始LBA表,每当有新的写入请求的时候,重定向到另一个地方,并在初始的LBA表中做好记录,比如:原始LBA:卷A的10000号,映射到LBA:卷B的100号。
值得说明的是,文件系统无法感知重定向,文件系统在它的映射图里面还是记录了原始的LBA地址。
此时如果来了新的写IO,有两种方式一种是Write Redirect,另外一种是Copy on Write。
所谓Write Redirect就是将文件系统的读写请求,重定向到卷B,这样每次IO其实都会查找快照映射表,降低了性能。
所以引入了Copy on Write。
所谓Copy on write,就是当写请求来的时候,先把原来的扇区的数据复制一份到空闲卷,然后将新数据写入原卷。
不过这种复制操作只发生在原卷某个或者快照之后从未更新过的块上面,若是某个块在快照之后更新过了,说明之前的数据已经转移走了,可以放心的覆盖。
所以Copy on Write实际上是让旧数据先占着位置,等新数据来了以后先把原来的数据复制走,再更新,而且一旦更新了一次,可以直接覆盖。
带来的好处是,原卷上的数据随时是最新的状态,每个IO可以直接访问原卷的地址,而不需要遍历映射表。
6.3.RoFW方式与CoFW方式比较不管是RoFW还是CoFW,只要上层向快照后没有更新过的数据块进行写,都需要占用一个新的块。
所以如果将所有扇区块都更新了,新卷的容量和原来的容量应该一样大,但是通常不会覆盖百分之百,所以只要预设原容量的30%即可。
IO资源消耗:∙CoFW方式下,如果要更新一个从未更新的块,需要复制出来,写到新卷,然后覆盖原来的块,需要一次读,2写。
∙RoFW方式下,只需要一次写即可,也就是直接重定向到新卷上,然后更新映射图中的指(在内存中进行)。
所以RoFW相对CoFW方式在IO资源消耗与IO延迟上有优势。
由于只有首次覆盖才会Copy或者Redirect,那么如何区分是否是首次覆盖呢?可以使用记录表(文件级快照)或者位图(卷快照)来记录每个块是否被覆盖过。
对于读IO:∙CoFW:因为总是更新的源卷,所以源卷总是代表最新的状态,所以任何读IO都会发到源来执行。
∙RoFW:需要首先查询位图来确定目标地址是否被处理过,如果是,则转向重定向后的地址。
RoFW会影响读性能,因为重定向出去以后,数据块排布都是乱的,如果把快照删除后,不好清理战场,严重影响后续的读写性能。
综合来说,RoFW比较吃计算资源,而CoFW比较耗费IO资源。
我们知道其实一般来说读比写多,当覆盖第二次以后:∙CoFW不会发生IO惩罚,读IO一直没有惩罚∙对于RoFW,就算完全被Redirect过了,对于读或者写IO,均需要遍历位图,永远无法摆脱对计算资源的消耗。
尤其在LUN卷级快照下,原本卷在底层磁盘分布式是定死的,寻址非常迅速。
但是RoFW 引入了,LUN的块随机定向到其他的空间的,所以需要记录新的指针链,而且被写出的块不是连续排列的。
对性能影响非常明显的。
绝大多数的厂商使用的还是CoFW,但是一些本来就使用LUN随机分块分布模式的存储系统比如XIV、NetApp等,都使用RoFW,因为原本其LUN的元数据链就很复杂,而且原来就是随机分布的,RoFW的后遗症对它们反而是正常的。
6.4.快照的意义快照所保存下来的卷数据,相当于一次意外掉电之后卷上的数据。
怎么理解?上层应用和文件系统都有缓存,文件系统缓存的是文件系统的元数据和文件的实体数据。