第一章、快照(Snapshot)技术发展综述

合集下载

SQL与snapshot快照技术

SQL与snapshot快照技术

快照(snapshot)的概念快照(snapshot)是某个数据在某一特定时刻的镜像,也称为即时拷贝,它是这个数据库的一个完整可用的副本。

存储网络行业协会SNA对快照的定义是:关于指定的数据集合的一个完全可用的拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。

SQL Server 2005使用基于行版本控制的隔离级别初探(1)行版本控制隔离行版本控制的隔离是SQL Server 2005的一个新的隔离框架。

使用行版本控制的隔离可以在大量并发的情况下,显著减少所得产生,并且与NoLock相比,它又可以显著降低肮脏读,幻影,丢失更新等现象的发生(READ_COMMITTED_SNAPSHOT)当在基于行版本控制的隔离下运行的事务读取数据时,读取操作不会获取正被读取的数据上的共享锁(S 锁),因此不会阻塞正在修改数据的事务。

另外,锁定资源的开销随着所获取的锁的数量的减少降至最低。

使用行版本控制的已提交读隔离和快照隔离可以提供副本数据的语句级或事务级读取一致性。

行版本控制隔离的优势所在使用行版本控制的隔离级别具有以下优点:·读取操作检索一致的数据库快照。

·SELECT 语句在读取操作过程中不锁定数据(读取器不阻塞编写器,编写器也不阻塞读取器)。

·SELECT 语句可以在其他事务更新行时访问最后提交的行值,而不阻塞应用程序。

·死锁的数量减少。

·事务所需的锁的数量减少,这减少了管理锁所需的系统开销。

·锁升级的次数减少。

行版本控制隔离的原理SQL Server 2005的行版本控制原理上很简单,就是在库表中每一行的记录上都悄悄的增加了一个类时间戳列(行版本列)。

当使用行版本控制的隔离时,SQL Server 2005 Database Engine 向使用行版本控制操作数据的每个事务分配一个事务序列号(XSN)。

事务在执行BEGIN TRANSACTION 语句时启动。

第一章、快照(Snapshot)技术发展综述

第一章、快照(Snapshot)技术发展综述

第一章、快照(Snapshot)技术发展综述摘要:传统数据备份技术存在备份窗口、恢复时间目标RTO和恢复时间点RPO 过长的问题,无法满足企业关键性业务的数据保护需求,因此产生了数据快照技术。

本文对快照技术的概念、特点、实现技术和发展现状进行了概括性阐述,并对其未来的发展进行了展望。

关键词:快照,备份,复制,镜像,写时复制,指针重映射作者简介:刘爱贵,研究方向为网络存储、数据挖掘和分布式计算;毕业于中科院,目前就职于赛门铁克@Symantec,从事存储软件研发。

Email: Aigui.Liu@注:作者学识和经验水平有限,如有错误或不当之处,敬请批评指正。

PDF格式下载:/source/1613486一. 引言随着计算机技术和网络技术的不断发展,信息技术水平不断得到提高。

人类进入称为信息社会的二十一世纪后,诸如数字通信、数字多媒体、电子商务、搜索引擎、数字图书馆、天气预报、地质勘探、科学研究等海量数据型应用的涌现,各种信息呈现爆炸式的增长趋势,存储成为信息计算技术的中心。

应用对存储系统的要求不断提高,存储容量不断升级,从GigaByte到TeraByte、 PetaByte、ExaByte,愈显巨大。

图灵奖获得者Jim Gray提出一个新的经验定律:网络环境下每18个月生产的数据量等于有史以来的数据量之和。

与此同时,现代企业对计算机的依赖性严重增强,信息数据逐渐成为企业赖以生存的基础,数据损坏或丢失将给企业带来巨大的损失。

由于黑客、病毒、硬件设备的失效以及火灾、地震等自然灾害的原因,使系统和数据信息遭到破坏甚至毁灭,如果不及时地进行恢复,将对企业造成巨大的损失,所以备份容灾技术显得尤为重要。

尤其,9.11等事件造成的灾难性后果使人们更加深刻地认识到数据信息的价值和意义,日益重视数据的保护。

在过去的20多年中,虽然计算机技术取得了巨大的发展,但是数据备份技术却没有长足进步。

数据备份操作代价和成本仍然比较高,并且消耗大量时间和系统资源,数据备份的恢复时间目标和恢复点目标比较长。

Snapshot快照实验

Snapshot快照实验

使用这种标准的通用快照功能,包括物理服务器、虚拟机、台式机和笔记本
电脑等等。快照的实施、操作和管理也都很简单。像一样,很多磁盘阵列的
快照功能也可以被 、备份服务器和备份等软件直接调用。一些磁盘阵列厂商
还有可供非平台应用系统使用的代理程序。

基于磁盘阵列的快照也有一些缺点:和维护费用昂贵;对非平台的应用

但是,使用便利的工具和附加功能也需要成本,软件和维护费相当昂贵,
一般是按照机器数量和磁盘卷容量来计算。大多数公司的数据量增长很快,
需要使用快照的地方也越来越多,因此,操作和管理也将更复杂。
• 四、基于磁盘阵列的快照

大多数磁盘阵列的软件系统里都含有快照功能。基于磁盘阵列的快照与
基于的快照有非常相似的优点,即所有与磁盘阵列相连的计算机系统都可以
其中既有使用专有操作系统的设备,也包括大量基于 软件的各种。

通过网络连接到的计算机系统都可以使用这种标准的通用快照,包括物
理服务器、虚拟机、台式机和笔记本电脑。它也非常容易操作和管理。基于
的快照往往同 (卷影复制服务)、备份服务器和备份等软件集成在一起使用。 一些厂商还为非平台的数据应用系统开发了代理程序。其它一些与快照有关 的技术还包括重复数据删除(公司,软件公司和的产品),有些厂商甚至提供了 带有自动精简配置功能的快照,目的是让快照占用的空间变得更少。

使用时,通常要付出额外的成本,包括为每台服务器购买(许可证)和维护
费。而且,像基于文件系统的快照一样,我们可能还要面对系统之间的协调
问题和复杂的技术实施问题。
• 三、基于的快照

本质上就是一个经过优化的、或是专门定制的文件系统,运行在特定的

Snapshot技术平台(中文)

Snapshot技术平台(中文)

Snapshot技术平台 SnaPshot技术平台是Applied Biosystems,ABI公司推出了专为检测SNP 设计的分析软件和试剂盒可对多个SNP 位点同时进行基因分型,也被称为minisequencing 。

该方法针对不同突变位点设计不同长度的引物SNaPshot 反应后,产物通过电泳分离、五色荧光检测、Gene mapper 分析,可在一次电泳胶内检测多个SNP位点。

这个平台是建立在3730,3130等PCR测序仪上的技术。

3730XL型DNA序列检测仪一. SnaPshot工作原理应用 SNaPshot 进行定点的序列分析 ,其基本原理遵循了DNA 直接测序中的双脱氧终止法,所不同的是PCR 反应中只有不同荧光标记的ddNTP。

由于每个SNP 位点的引物3′端都紧靠SNP点,因此每一种引物在聚合酶作用下 ,根据模板的的序列 ,只延伸一个核苷酸。

然后用先进的荧光检测系统 ,检测延伸的那个核苷酸的种类。

1.多重SNaPshot反应的工作原理:在一个SNaPshot反应体系中,针对每个待测SNP 位点在其上游或下游设计一条单向的寡核苷酸引物(正向引物或反向引物),引物的Tm 值要求在50度以上,在AmpliTaq聚合酶和 4种不同荧光标.记的ddNTP存在的情况下,各条引物与各自互补的DNA 模板结合, 聚合酶在引物的3’末端延伸单个碱基反应即告终止,产物的长度为引物长度+1bp。

延伸的碱基就是该样本在该位点上的基因型,其中纯合子表现为单峰,杂合子表现为双峰。

为了能够分辨不同SNP的不同基因型,可在引物的5’末端加上不同长度的Poly C 或Poly T,使各条引物以长度区分。

经电泳将其分开。

最短的引物一般设定为20bp, 相邻两个SNP的引物之间长度一般相差4-6个核苷酸,以便区分。

多重SNaPshot反应即利用引物间长度的差异和单碱基延伸4种荧光标记的ddNTP 而最终达到区分不同SNP 位点的作用, 一次反应可以同时对4-5个SNP进行基因分型, 是一种通量较高的基因分型的方法。

NAS技术详解:SnapShot技术详解

NAS技术详解:SnapShot技术详解

NAS技术详解:SnapShot技术详解SnapShot是WAFL文件系统“任意位置写入”功能带来的一项突出优势。

一份SnapShot是文件系统的在线只读拷贝。

创建文件系统的一份SnapShot仅仅需要几秒钟的时间,并且除非原始文件被删除或者更改,数据快照并不占用额外的磁盘空间。

这种只有当数据快发生改动时才进行数据快复制的技术被称作“Copy-on-write”,只有修改活动文件系统中的数据块并写入磁盘中新的位置时,SnapShot才会占用额外的磁盘空间。

用户可以采用SnapShot作为数据的在线备份,以备将来进行数据恢复时使用。

用户也可以方便的把SnapShot快照备份到磁带上。

无需将Filer系统下线,用户管理员就可以将最近的SnapShot快照备份到离线存储系统中。

SnapShot技术详述WAFL文件系统本身就可以理解成数据块树状结构,其根部的数据结构描述了inode文件信息。

这份inode文件信息则包含了对文件系统中所有inode的描述,它包含诸如空闲块图和空闲inode图等元数据信息。

WAFL通过复制根数据结构创建新的数据拷贝SnapShot。

因为根数据结构只有128B,并且不需要在硬盘上复制其他数据块,一个新的SnapShot几乎不耗额外的磁盘存储空间,除非用户修改或者删除文件系统中的数据。

Filer可以对一个卷组创建最多255个SnapShot快照。

SnapShot快照可以通过手动或者人为预先定制策略的方式来自动创建。

每一个SnapShot快照可以保存的时间取决于文件系统变动的频度。

在众多应用环境中,文件系统中的大部分数据并不是每天在变化,比如一个使用10MB大小Home Directory的用户,其数据通常每天只变动100到500KB。

当文件变动缓慢的时候,SnapShot可以在线保存数天甚至数周,直到他们消耗的磁盘空间过多以至用户无法接受。

而另外一些文件系统中的数据则在经常不停的变动,比如CAD应用环境下,需要经常覆盖写入许多大尺寸的文件,甚至可能一两天内就会更新整个文件系统的存储内容。

快照技术的实现方式

快照技术的实现方式

快照技术的实现方式
1. 存储层面,在存储领域,快照技术通常是通过记录存储设备上数据块的状态来实现的。

存储设备可以使用写时复制(Copy-on-Write)或写时合并(Copy-on-Merge)等技术,在创建快照时只记录数据块的变化,而不实际复制整个数据块。

这样就可以在快照中保留先前的数据状态,而不会占用额外的存储空间。

2. 虚拟化层面,在虚拟化环境中,快照技术可以通过虚拟机监视器(VMM)或者存储虚拟化层来实现。

虚拟机快照可以记录虚拟机的内存状态和磁盘状态,使得在需要时可以快速恢复虚拟机到先前的状态。

存储虚拟化层也可以提供快照功能,允许在存储级别对虚拟机的磁盘进行快照备份和恢复。

3. 文件系统层面,一些文件系统也提供了快照功能,可以记录文件系统的状态,包括文件和目录的结构、权限和元数据等信息。

这样可以在文件系统级别实现数据的备份和恢复,而不需要依赖于底层存储设备的快照功能。

总的来说,快照技术的实现方式涉及存储层面、虚拟化层面和文件系统层面等多个方面,不同的实现方式有各自的优缺点,可以
根据具体的应用场景和需求来选择合适的实现方式。

希望这些信息能够帮助你更全面地了解快照技术的实现方式。

rocksdb snapshot 原理

rocksdb snapshot 原理

RocksDB 的快照(snapshot)功能是一种基于多版本并发控制(MVCC)的技术,它可以在数据库运行过程中捕捉到一个一致性的数据视图。

快照可以帮助实现事务隔离,以及在数据库恢复时提供一致性的数据状态。

RocksDB 的快照原理主要涉及以下几个方面:1. 快照实现:RocksDB 使用双向链表结构来存储和管理快照。

每个快照都包含一个指向链表前一个快照的指针和一个指向链表后一个快照的指针。

这种结构使得快照之间可以形成一个环状链表,方便进行快照的遍历和查找。

2. 快照创建:当创建一个新的快照时,RocksDB 会将其插入到链表的末尾。

此时,新快照的前一个快照指针指向当前链表的最后一个快照,后一个快照指针指向链表的下一个快照(如果存在的话)。

3. 快照迭代:通过快照迭代器(snapshot iterator)可以遍历指定快照时刻的数据。

迭代器会根据快照链表中的指针,依次访问每个快照,并读取对应时刻的数据。

在迭代过程中,如果遇到已标记为删除的快照,迭代器会跳过这些快照。

4. 快照删除:当快照的生命周期结束时,RocksDB 会将其从快照链表中移除。

这通常发生在数据库恢复或者事务完成之后。

删除快照时,需要更新链表中前一个快照和后一个快照的指针,以断开快照之间的链接。

5. 多版本并发控制(MVCC):RocksDB 的快照功能与 MVCC 密切相关。

MVCC 允许多个事务在不同版本的数据上并发执行,从而提高数据库的并发性能。

快照在 MVCC 中起到了关键作用,它使得事务可以访问到一致性的数据视图,从而确保事务的正确执行。

总之,RocksDB 的快照原理主要基于双向链表结构来存储和管理快照,通过快照迭代器来遍历和读取快照时刻的数据。

快照功能在实现事务隔离和数据库恢复一致性方面起到了重要作用。

Snapshot快照实验

Snapshot快照实验

Snapshot快照实验应用场景容灾备份是数据存储备份的最高层次,一个更加完善的容灾系统,能提供不间断的应用服务(应用容灾)。

灾难备份建设是一项周密的系统工程,也是一个全新的危机管理领域。

灾难备份建设不仅需要进行灾难备份中心建设和IT系统购置,更需要有灾难备份技术、危机管理、风险管理、业务连续计划制订、灾难演练和灾难恢复等灾难备份专业领域知识。

此外,灾难备份也不同于一般的IT项目,它是单位机构业务流程的延续,它需要建立完善的灾难备份中心运营管理体系,需要不断保持业务连续性计划的有效性,以保障灾难备份中心能持续发挥灾难备份功能。

经常应用的主要是数据容灾,数据容灾的保护对象是生产系统产生的业务数据。

为了更好地实现数据的容灾,数据容灾方案必须能够实现对数据库数据、基于文件系统的数据,甚至对系统的数据卷,进行实时有效保护。

数据容灾的根本目的,是能够重新利用复制的数据。

也就是说,数据容灾的核心是恢复,如果容灾的数据无法恢复和重新使用,就失去了容灾的意义。

另外还有目前发展较快的磁盘阵列级数据容灾,利用高性能磁盘阵列(硬件层次)的高级数据复制功能,通过存储子系统之间的通讯,并结合一些主机端的管理工具,来实现用户端数据和容灾中心对数据的传输复制。

复制通过用户端和容灾中心磁盘阵列上的微处理器实时完成。

将灾难发生时,可以将关键数据的损失降至最低,而且不需要主机干涉或占用主机资源,可以做到灾难发生的同时实现应用处理过程的恢复。

快照(Snapshot)的定义是:指数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。

快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。

从技术细节讲,快照是指向保存在存储设备中的数据的引用标记或指针。

我们可以这样理解,快照有点像是详细的目录表,但它被计算机作为完整的数据备份来对待。

当已经有了快照时,如果有人试图改写原始的LUN 上的数据,快照软件将首先将原始的数据块拷贝到一个新位置(专用于复制操作的存储资源池),然后再进行写操作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章、快照(Snapshot)技术发展综述摘要:传统数据备份技术存在备份窗口、恢复时间目标RTO和恢复时间点RPO 过长的问题,无法满足企业关键性业务的数据保护需求,因此产生了数据快照技术。

本文对快照技术的概念、特点、实现技术和发展现状进行了概括性阐述,并对其未来的发展进行了展望。

关键词:快照,备份,复制,镜像,写时复制,指针重映射作者简介:刘爱贵,研究方向为网络存储、数据挖掘和分布式计算;毕业于中科院,目前就职于赛门铁克@Symantec,从事存储软件研发。

Email: Aigui.Liu@注:作者学识和经验水平有限,如有错误或不当之处,敬请批评指正。

PDF格式下载:/source/1613486一. 引言随着计算机技术和网络技术的不断发展,信息技术水平不断得到提高。

人类进入称为信息社会的二十一世纪后,诸如数字通信、数字多媒体、电子商务、搜索引擎、数字图书馆、天气预报、地质勘探、科学研究等海量数据型应用的涌现,各种信息呈现爆炸式的增长趋势,存储成为信息计算技术的中心。

应用对存储系统的要求不断提高,存储容量不断升级,从GigaByte到TeraByte、 PetaByte、ExaByte,愈显巨大。

图灵奖获得者Jim Gray提出一个新的经验定律:网络环境下每18个月生产的数据量等于有史以来的数据量之和。

与此同时,现代企业对计算机的依赖性严重增强,信息数据逐渐成为企业赖以生存的基础,数据损坏或丢失将给企业带来巨大的损失。

由于黑客、病毒、硬件设备的失效以及火灾、地震等自然灾害的原因,使系统和数据信息遭到破坏甚至毁灭,如果不及时地进行恢复,将对企业造成巨大的损失,所以备份容灾技术显得尤为重要。

尤其,9.11等事件造成的灾难性后果使人们更加深刻地认识到数据信息的价值和意义,日益重视数据的保护。

在过去的20多年中,虽然计算机技术取得了巨大的发展,但是数据备份技术却没有长足进步。

数据备份操作代价和成本仍然比较高,并且消耗大量时间和系统资源,数据备份的恢复时间目标和恢复点目标比较长。

传统地,人们一直采用数据复制、备份、恢复等技术来保护重要的数据信息,定期对数据进行备份或复制。

由于数据备份过程会影响应用性能,并且非常耗时,因此数据备份通常被安排在系统负载较轻时进行(如夜间)。

另外,为了节省存储空间,通常结合全量和增量备份技术。

显然,这种数据备份方式存在一个显著的不足,即备份窗口问题。

在数据备份期间,企业业务需要暂时停止对外提供服务。

随着企业数据量和数据增长速度的加快,这个窗口可能会要求越来越长,这对于关键性业务系统来说是无法接受的。

诸如银行、电信等机构,信息系统要求24x7不间断运行,短时的停机或者少量数据的丢失都会导致巨大的损失。

因此,就需要将数据备份窗口尽可能地缩小,甚至缩小为零,数据快照(Snapshot)、持续数据保护(CDP, Continuous Data Protection)等技术,就是为了满足这样的需求而出现的数据保护技术。

二. 快照概念快照(Snapshot)是某个数据集在某一特定时刻的镜像,也称为即时拷贝,它是这个数据集的一个完整可用的副本。

存储网络行业协会SNIA对快照的定义是[1]:关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。

快照可以是其所表示的数据的一个副本(duplicate),也可以是数据的一个复制品(replicate)。

快照具有很广泛的应用,例如作为备份的源、作为数据挖掘的源、作为保存应用程序状态的检查点,甚至就是作为单纯的数据复制的一种手段等。

创建快照的方法也有很多种,按照SNIA的定义[2],快照技术主要分为镜像分离(split mirror) 、改变块(changed block)、并发(concurrent) 三大类。

后两种在实现时通常使用指针重映射(pointer remapping)和写时拷贝(copy on write)技术。

changed block 方式的灵活性及使用存储空间的高效性,使得它成为快照技术的主流。

第一种快照是镜像分离。

在即时拷贝之前构建数据镜像,当出现一个完整的可供复制的镜像时,就可以通过瞬间“分离”镜像来产生即时拷贝。

这种技术的优点是速度快,创建快照无须额外工作。

但缺点也很显明,首先它不灵活,不能在任意时刻进行快照;其次,它需要一个与数据卷容量相同的镜像卷;再者,连续地镜像数据变化影响存储系统的整体性能。

第二种快照是改变块[3]。

快照创建成功后,源和目标共享同一份物理数据拷贝,直到数据发生写操作,此时源或目标将被写向新的存储空间。

共享的数据单元可是块、扇区、扇道或其他的粒度级别。

为了记录和追踪块的变化和复制信息,需要一个位图(bitmap),它用于确定实际拷贝数据的位置,以及确定从源还是目标来获取数据。

第三种快照是并发[3]。

它与改变块非常相似,但它总是物理地拷贝数据。

当即时拷贝执行时,没有数据被复制。

取而代之,它创建一个位图来记录数据的复制情况,并在后台进行真正的数据物理复制。

三. 不同存储层次的快照实现“计算机科学中的任何问题,都可以通过增加间接层次来解决”-Butler Lampson,1992年图灵奖获得者。

对于快照技术,我们可以在存储系统中的不同层次来实现,可以在磁盘阵列、文件系统、卷管理器、NAS系统或备份系统中来实现。

图1 存储系统栈与快照实现存储栈由一组硬件和软件组件组成,为运行在主机操作系统上的应用系统提供物理存储介质,如图1所示。

快照可以采用很多不同实现方式,也可以在存储栈中的不同层次来实现,大致分为软件层和硬件层两类,也可分为基于控制器的快照和基于主机的快照两类[4]。

基于控制器的快照,在存储设备层或硬件层中实现,由存储系统硬件提供商管理并集成于磁盘阵列中。

这种快照在LUN级(块级)完成,独立与操作系统和文件系统。

基于主机的快照,在设备驱动和文件系统级之间实现,通常由文件系统、卷管理器或第三方软件来执行。

这种快照不依赖存储硬件,但却依赖于文件系统和卷管理软件。

该快照作用于逻辑数据视图,这与基于控制器的快照的不同,它作用与物理数据。

在以上各个存储层次中,物理存储层和卷管理器是最适合实现快照的两个组件,它们可以方便地利用物理存储,是当前主流的实现层次。

文件系统层实现快照是一个可行的选择,然而诸如数据库等应用会直接选择使用逻辑卷来实现快照,因为在文件系统层它们不能被快照技术所管理。

一般来说,没有必要在应用层实现快照,对于备份机制,可以利用下层的文件系统或卷管理器接口来实现,但需要应用暂时停顿以保证快照数据一致性。

总的来说,基于软件层的快照易于操作,且提供比较好的恢复粒度,而基于硬件层的快照往往更高的性能和容错性。

目前,存储厂商提供了在不同存储层次实现快照的存储产品。

快照在存储子系统中实现的有IBM TotalStorage Disk Systems、NetApp NAS 、EMC Symmetrix,在虚拟化层中实现的有IBM Total Storage SAN Volume Controller,在卷管理器中实现的有Veritas Volume Manager、Linux LVM、IBM Tivoli Storage Manager LVSA、Microsoft® Windows® 2003 VSS System provider,在文件系统中实现的有AIX JFS2、IBM TotalStorage SAN File System、IBM General Parallel File System、IBM N series、NetApp filers、Veritas File System。

四. 快照实现方式及技术快照技术能够实现数据的即时影像,快照影像可以支持在线备份。

全量快照是实现所有数据的一个完整的只读副本,为了降低快照所占用的存储空间,人们提出了写时复制(COW ,Copy-On-Write)和写重定向(ROW,Redirect on Write)快照技术。

另外,还出现了其他一些快照技术的实现方式,如日志、持续数据保护等,可以提升快照的相关性能。

1、镜像分离(Split Mirror)镜像分裂快照技术在快照时间点到来之前,首先要为源数据卷创建并维护一个完整的物理镜像卷:同一数据的两个副本分别保存在由源数据卷和镜像卷组成的镜像对上。

在快照时间点到来时,镜像操作被停止,镜像卷转化为快照卷,获得一份数据快照。

快照卷在完成数据备份等应用后,将与源数据卷重新同步,重新成为镜像卷。

对于要同时保留多个连续时间点快照的源数据卷,必须预先为其创建多个镜像卷,当第一个镜像卷被转化为快照卷作为数据备份后,初始创建的第二个镜像卷立即与源数据卷同步,与源数据卷成为新的镜像对。

镜像分裂快照操作的时间非常短,仅仅是断开镜像卷对所需的时间,通常只有几毫秒,这样小的备份窗口几乎不会对上层应用造成影响,但是这种快照技术缺乏灵活性,无法在任意时间点为任意的数据卷建立快照。

另外,它需要一个或者多个与源数据卷容量相同的镜像卷,同步镜像时还会降低存储系统的整体性能。

[5]2、写时复制(COW, Copy On Write)图2 写时复制快照写时复制快照使用预先分配的快照空间进行快照创建,在快照时间点之后,没有物理数据复制发生,仅仅复制了原始数据物理位置的元数据。

因此,快照创建非常快,可以瞬间完成。

然后,快照副本跟踪原始卷的数据变化(即原始卷写操作),一旦原始卷数据块发生首次更新,则先将原始卷数据块读出并写入快照卷,然后用新数据块覆盖原始卷(如图2)。

写时复制,因此而得名。

这种快照技术在创建快照时才建立快照卷,但只需分配相对少量的存储空间,用于保存快照时间点之后源数据卷中被更新的数据。

每个源数据卷都具有一个数据指针表,每条记录保存着指向对应数据块的指针。

在创建快照时,存储子系统为源数据卷的指针表建立一个副本,作为快照卷的数据指针表。

当快照时间点结束时,快照建立了一个可供上层应用访问的逻辑副本,快照卷与源数据卷通过各自的指针表共享同一份物理数据。

快照创建之后,当源数据卷中某数据将要被更新时,为了保证快照操作的完整性,使用写时复制技术。

对快照卷中数据的访问,通过查询数据指针表,根据对应数据块的指针确定所访问数据的物理存储位置。

写时复制技术确保复制操作发生在更新操作之前,使快照时间点后的数据更新不会出现在快照卷上,保证了快照操作的完整性。

写时复制快照在快照时间点之前,不会占用任何的存储资源,也不会影响系统性能;而且它在使用上非常灵活,可以在任意时间点为任意数据卷建立快照。

在快照时间点产生的“备份窗口”的长度与源数据卷的容量成线性比例,一般为几秒钟,对应用影响甚微,但为快照卷分配的存储空间却大大减少;复制操作只在源数据卷发生更新时才发生,因此系统开销非常小。

相关文档
最新文档