虚拟机容错-云技术

合集下载

如何进行虚拟化存储的容错设置(五)

虚拟化存储的容错设置是确保数据在存储过程中不会丢失或损坏的关键。

在虚拟化环境中，容错设置可以帮助保护存储设备，防止硬件故障和人为错误引发的数据丢失。

本文将探讨如何进行虚拟化存储的容错设置。

**1. RAID技术**RAID（冗余磁盘阵列）是一种常见的容错设置，通过将数据分散存储在多个磁盘上，以提高数据的容错能力。

在虚拟化存储环境中，RAID技术可用于创建虚拟磁盘，提供容错能力。

例如，RAID 1（镜像）将数据完全复制到另一块磁盘上，这样当一块磁盘损坏时，另一块磁盘仍然可用，数据不会丢失。

另外，RAID 5（奇偶校验）在多个磁盘上使用奇偶校验来保护数据，当一个磁盘损坏时，可以通过重新计算奇偶校验来恢复数据。

**2. 快照**快照是一种容错设置，可以在存储设备上创建数据的副本，以便在数据损坏或删除时进行恢复。

在虚拟化存储环境中，快照能够提供即时恢复的能力。

通过定期创建快照，可以保留特定时间点的数据状态。

当发生数据错误或数据丢失时，管理员可以使用快照恢复数据到之前的状态。

此外，快照还可以用于测试和开发环境，以便在出现问题时能够快速还原环境。

**3. 多路径存储（MPIO）**MPIO是一种容错设置，可以通过多个路径将存储设备连接到主机，以提高存储的可靠性和性能。

在虚拟化存储环境中，使用MPIO可以避免单点故障，确保数据在多条路径上传输。

通过使用多个存储适配器和路径，MPIO可以实现故障切换和负载均衡。

当一条路径发生故障或出现性能问题时，MPIO会自动将数据切换到其他可用路径上。

这种容错设置不仅提高了存储系统的可靠性，还可以增加数据访问的速度。

**4. 数据备份**数据备份是一种传统的容错设置，用于定期创建数据的副本，并将副本存储在不同介质上，以便在数据丢失时进行恢复。

在虚拟化存储环境中，数据备份可以用于保护虚拟机和虚拟磁盘的数据。

通过使用备份软件，管理员可以定期创建虚拟机的镜像并存储在不同的介质上，如磁带或远程存储。

云计算中的虚拟化技术使用中的常见问题

云计算中的虚拟化技术使用中的常见问题在云计算领域，虚拟化技术是实现资源共享和提高效率的关键。

虚拟化技术能够将一个物理资源划分为多个逻辑上独立的虚拟资源，并且能够在不同的虚拟机上运行不同的操作系统和应用程序。

然而，在云计算中使用虚拟化技术时，常会遇到一些常见问题。

本文将探讨这些问题，并提供相应的解决方案。

首先，一个常见的问题是虚拟机的性能问题。

虚拟化技术本质上是通过在物理主机上运行多个虚拟机来共享资源。

然而，由于资源的共享，不同虚拟机之间可能存在性能抢占的情况，导致性能下降。

解决这个问题的一种方法是合理分配资源。

可以通过动态资源调整的方式，根据不同虚拟机的需求来分配相应的资源，确保每个虚拟机得到足够的资源来保证性能。

此外，还可以采取负载均衡的策略，在多个物理主机之间分配虚拟机，以减少性能抢占的情况。

其次，虚拟机的网络问题也是一个常见的挑战。

在虚拟化环境中，虚拟机之间需要进行通信，还需要与外部网络进行交互。

然而，由于虚拟机的网络是通过虚拟网络来实现的，可能会存在网络延迟和网络带宽不足的问题。

针对这个问题，可以采取多种方法来改善虚拟机的网络性能。

一种方法是通过使用高性能的虚拟网络设备，如虚拟交换机和虚拟网卡，来提高网络带宽和减少延迟。

另外，还可以通过优化网络配置和网络拓扑，合理规划虚拟机的部署位置，减少网络传输路径的长度，提高网络性能。

此外，虚拟机的安全性也是一个重要的问题。

在云计算中，虚拟机之间是相互隔离的，但虚拟机之间的安全隔离并不是绝对的，可能存在虚拟机之间的安全漏洞。

为了增强虚拟机的安全性，可以采取一系列的措施。

首先，要确保虚拟机及其运行的应用程序都是最新的，及时安装漏洞补丁，防止已知的安全漏洞。

其次，可以使用虚拟机防火墙和安全组等技术来限制虚拟机之间的通信，只允许合法的网络流量通过。

此外，还可以使用入侵检测和防御系统来监控和阻止潜在的安全威胁。

最后，虚拟机的备份和恢复是一个关键的问题。

在云计算中，虚拟机可能会由于硬件故障、软件故障或人为错误等原因而发生故障，导致数据丢失和服务中断。

云计算平台的容错与故障恢复机制设计

云计算平台的容错与故障恢复机制设计随着云计算技术的快速发展，越来越多的企业和个人将业务和数据迁移至云平台。

云计算平台的容错与故障恢复机制设计变得尤为重要，因为任何系统都有可能面临故障和中断。

为保证云计算平台的高可靠性和稳定性，合理设计容错与故障恢复机制成为迫切任务。

首先，容错机制是确保云计算平台能够在面临硬件和软件故障时仍能正常运行的关键。

为此，云计算平台应具备以下核心特性：1.冗余备份：通过多点部署和数据冗余备份，确保物理服务器、存储设备和网络设备的备份。

这样即使某个节点发生故障，其他节点可以接管工作，不会中断用户的服务。

2.故障监测与自动切换：建立监控系统，实时监测服务器的运行状态和性能指标，一旦发现故障或异常，及时通知运维人员，并自动进行服务迁移或切换，从而最大程度减少因故障而导致的服务中断时间。

3.负载均衡：通过负载均衡技术，将用户请求平均分摊到多个服务器上，避免单个服务器负荷过高而导致的性能下降或故障。

4.故障恢复：云计算平台应该具备快速、可靠的故障恢复能力，能够自动感知和诊断故障，并通过故障恢复策略将服务迅速恢复至正常状态，减少用户的影响。

其次，故障恢复机制是云计算平台在发生故障时能够快速恢复服务的重要保障。

在设计故障恢复机制时，应注意以下几个方面：1.数据备份与恢复：定期备份重要数据，确保数据在发生故障时能够快速恢复。

同时，备份数据的存储位置应与原始数据的位置相隔离，以防止在硬件故障时造成数据丢失。

2.故障隔离与恢复：将云计算平台划分为多个独立的模块，当发生故障时，能够快速识别和隔离故障模块，并进行故障恢复，避免故障影响扩散。

3.容错和弹性：在设计云计算平台时，应考虑到硬件和软件的容错能力，确保平台在面临故障时能够继续提供服务。

同时，通过弹性设计，实现自动扩展和收缩，以适应业务流量的变化和故障的发生。

4.监控与报警：建立实时监控系统，对云计算平台进行全面的监控，并设置相应的报警机制，一旦发生故障，能够及时通知相关人员，进行故障排查和恢复。

服务器双机热备虚拟化方案和容错的对比材料课件

双机热备的缺点
01
成本高
双机热备方案需要两台服务器，成本较高。
02
资源利用率低
双机热备方案中，一台服务器作为备份，资源利用率较低。
03
服务器虚拟化方案
虚拟化的工作原理
01 虚拟化技术
通过虚拟化技术，将一台物理服务器划分为多个独立的虚拟服务器，每个虚拟服务器可以运行独立的操作系统和应用程序。
适用场景
双机热备适用于对数据安全和系统可用性要求极高的场景，如金融、电信、医疗等关键业务领域。虚拟化适用于需要灵活扩展、提高资源利用率和降低运营成本的场景。容错则适用于对系统可靠性要求高的场景，如航天、军事等。
业务需求
双机热备主要满足业务连续性和数据一致性的需求，虚拟化则侧重于提高资源利用率和降低成本，容错则强调系统可靠性和稳定性。
性和稳定性。
未来展望
01
02
03
双机热备
未来双机热备将与云计算技术深度融合，提供更高效、安全、可靠的数据中心服务。
虚拟化
虚拟化技术将继续发展，实现更智能化的资源调度和管理，推动企业数字化转型。
容错
容错技术将不断升级和完善，为各种高可靠性和稳定性要求的应用场景提供有力支持。
THANKS
服务器双机热备虚拟化方案和容错的对比
材料课件
目录
• 引言 • 服务器双机热备方案 • 服务器虚拟化方案 • 服务器双机热备与虚拟化的对比 • 容错技术介绍 • 双机热备、虚拟化与容错的综合比
较
01
引言
目的和背景
随着企业业务的快速发展，服务器的高可用性和数据安全性变得越来越重要。服务器双机热备和虚拟化技术作为解决这些问题的有效手段，被广泛应用于企业IT架构中。

云计算中的容错处理

云计算中的容错处理云计算作为一种创新的计算模式，已经广泛应用于各行各业。

在云计算环境中，容错处理是一项非常重要的技术，它旨在确保云计算系统能够在存在故障或错误的情况下依然保持高可靠性和可用性。

本文将探讨云计算中的容错处理技术，并分析其在提升系统稳定性和可靠性方面的作用。

一、容错处理的定义容错处理技术是指在计算系统中，在遇到硬件故障、软件错误或其他异常情况时，通过采用各种手段和策略，使得系统仍能够保持正常运行或者快速恢复到正常状态。

容错处理旨在提高系统的可用性和可靠性，确保系统能够持续地为用户提供服务。

二、容错处理技术的应用1. 冗余备份冗余备份是最常见的容错处理技术之一。

它通过创建备份副本来保护数据和应用程序免受故障的影响。

在云计算环境中，数据和应用可以在不同的服务器和节点上进行冗余备份，以确保即使发生硬件故障或其他故障，数据和应用仍然可用。

2. 异地备份异地备份是指将数据或应用复制到地理上分布较远的位置。

这样一来，即使一个地区发生了灾难或故障，其他地区的备份依然可以正常工作。

异地备份可以保证云计算系统的连续性和可靠性，防止因为地区性错误或故障而导致的服务中断。

3. 容错算法容错算法在云计算中起着至关重要的作用。

容错算法可以检测、纠正和恢复错误或故障，确保系统能够持续运行。

常见的容错算法包括冗余检验、纠删码等。

这些算法可以有效地提高云计算系统的可靠性和稳定性。

4. 负载均衡负载均衡是云计算中的另一项重要技术，它可以将任务和请求均匀地分布到不同的服务器上，避免某个服务器负载过重而导致系统性能下降或服务中断。

负载均衡技术可以提高系统的可用性和扩展性，并实现容错处理。

三、容错处理技术的优势采用容错处理技术在云计算环境中具有重要的优势：1. 提高系统可靠性：容错处理技术可以有效地防止和纠正错误和故障，提供高度可靠的系统性能。

2. 提高系统可用性：容错处理技术可以在发生故障时实现快速恢复，避免系统停机时间过长，提供连续的服务。

云计算平台的可靠性与容错性分析与改进

云计算平台的可靠性与容错性分析与改进云计算已经成为了现代信息技术的重要组成部分，提供了高效、灵活的计算资源共享与管理方式。

然而，随着云计算平台规模和复杂性的不断增加，其可靠性和容错性也面临着挑战。

本文将分析云计算平台的可靠性和容错性问题，并提出改进措施。

首先，云计算平台的可靠性是指其在长时间运行过程中，能够持续提供稳定的服务而不中断。

然而，由于底层硬件、网络、软件等各种因素的影响，云计算平台可能会出现故障、延迟或崩溃等问题，导致服务中断。

为了提高云计算平台的可靠性，可以采取以下措施：第一，建立冗余系统。

冗余系统是指在云计算平台中备份多个资源，当其中一个资源发生故障时，可以自动切换到备份资源，保证服务的连续性。

例如，使用冗余存储设备、服务器和网络连接等，以确保数据能够被安全地存储和传输。

第二，加强监控和预警机制。

通过监控各个组件的运行状态和性能指标，可以实时了解云计算平台的运行情况，并及时发现和解决潜在问题。

此外，建立预警机制，可以在关键指标达到预警阈值时，提前预警并采取相应措施，防止故障的发生。

第三，实施备份机制。

通过定期备份数据和配置文件，可以在系统故障或数据丢失时快速恢复。

备份数据可以存储在不同地点、不同区域的存储设备上，以提高数据的可靠性和可恢复性。

此外，云计算平台的容错性是指其在硬件、网络或软件故障的情况下，能够自动修复或迁移服务，保证用户的操作和数据不受影响。

为了提高云计算平台的容错性，可以采取以下措施：第一，使用虚拟化技术。

虚拟化技术可以将物理资源抽象为虚拟资源，实现资源的动态分配和迁移。

通过虚拟化技术，可以实现虚拟机的迁移，当某个物理服务器发生故障时，将虚拟机迁移到其他正常运行的物理服务器上，实现服务的无缝迁移。

第二，采用容器化技术。

容器化技术可以将应用程序及其所有依赖项打包到一个独立的容器中，并在不同的环境中运行。

容器化技术具有轻量、快速启动和停止的特点，可以快速恢复服务，并减少故障对其他容器和系统的影响。

服务器虚拟化平台的可靠性与容错性分析实例

服务器虚拟化平台的可靠性与容错性分析实例随着信息技术的飞速发展，服务器虚拟化成为了现代企业建设IT 基础设施的重要方式。

服务器虚拟化平台通过将一个物理服务器划分为多个虚拟服务器，提供了更高效、灵活和可靠的资源管理。

本文将针对服务器虚拟化平台的可靠性与容错性进行分析，并以实例进行说明。

一、什么是服务器虚拟化平台的可靠性与容错性可靠性是指服务器虚拟化平台在使用过程中能够持续稳定地提供服务的能力。

容错性是指服务器虚拟化平台在遇到硬件故障或软件错误时，能够自动切换或恢复到正常状态的能力。

可靠性与容错性是评估服务器虚拟化平台稳定性和可用性的重要指标。

二、服务器虚拟化平台的可靠性分析1. 高可用性架构服务器虚拟化平台通常采用高可用性架构，通过冗余设计来避免单点故障。

典型的架构包括使用多个物理服务器构建集群，通过负载均衡实现资源的分布式管理，当某个物理服务器发生故障时，其他服务器能够自动接管工作，并保证服务的连续性。

2. 快速故障切换当服务器虚拟化平台的某个虚拟机或物理服务器发生故障时，快速故障切换能够减少服务中断的时间。

通过实时监测和自动调度，故障切换可以在毫秒级的时间内完成，提高了系统的可用性和稳定性。

3. 数据备份与恢复服务器虚拟化平台通过数据备份与恢复机制，保证了业务数据的安全性和可靠性。

通过快照技术和实时复制，可以将数据备份到其他物理服务器或存储设备中，一旦发生故障，可以快速恢复数据，并保证数据的一致性。

三、服务器虚拟化平台的容错性分析1. 容错虚拟化服务器虚拟化平台通常支持容错虚拟化技术，通过在集群中运行多个虚拟机的备份实例，实现对虚拟机的容错保护。

一旦某个虚拟机发生故障，备份实例能够自动接管工作，保证服务的连续性。

2. 高可扩展性服务器虚拟化平台具有高度的可扩展性，可以根据业务需求随时增加或减少资源。

当业务负载超出某一物理服务器的承载能力时，可以通过增加物理服务器来分担负载，从而提高系统的容错性。

虚拟机的高可用性与容错技术(七)

虚拟机的高可用性与容错技术（1200字）引言在当今信息技术飞速发展的时代，虚拟化技术得到了广泛应用。

虚拟机作为一种重要的虚拟化技术，不仅可以提高资源利用率，降低成本，还能提供高可用性与容错保护。

本文将探讨虚拟机的高可用性与容错技术，分析其重要性和影响。

一、高可用性的概念高可用性是指系统能够长时间连续运行而不会中断的能力。

在传统物理机环境下，提高系统的可用性通常需要付出巨大的成本，因为需要实现冗余设备和复杂的故障切换机制。

而在虚拟化环境下，高可用性可以比较容易地实现。

二、虚拟机的高可用性技术1. 负载均衡负载均衡是一种常见的实现高可用性的技术。

通过将虚拟机分布到不同的主机上，可以提高系统的可用性。

一旦一台主机发生故障，其他正常运行的主机可以接管它的虚拟机，保证系统正常运行。

2. 冗余备份备份是一种常用的保障数据安全的措施。

在虚拟化环境下，可以通过将虚拟机进行实时冗余备份，当主机发生故障时，可以快速恢复虚拟机，减少系统故障对业务的影响。

3. 快速故障恢复虚拟化平台提供了快速故障恢复的功能。

一旦主机发生故障，虚拟化平台可以自动将虚拟机迁移到其他正常运行的主机上，保证系统的连续运行，并且不会对用户产生明显的中断。

三、容错技术的作用容错技术是指在系统发生故障时，能够保证系统不会中断，并能够自动从故障中恢复。

与高可用性相比，容错技术更加强调系统的自动恢复能力。

1. 内存冗余内存冗余技术是通过对内存中的数据进行冗余存储，以应对内存故障的技术。

通过对内存数据的冗余存储，可以在发生内存故障时，迅速恢复系统，并保证系统的连续性。

2. 主机冗余主机冗余技术是指在系统运行的过程中，保证至少有一台主机处于正常工作状态。

通过主机冗余技术，即使一台主机发生故障，其他主机也能够自动接管其虚拟机，并保证系统的正常运行。

3. 存储冗余存储冗余技术是指通过对存储数据进行冗余存储，以应对存储故障的技术。

通过对存储数据进行冗余存储，可以在发生存储故障时，快速恢复数据，并保证系统的连续性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

虚拟机容错戚正伟，管海兵上海交通大学摘要：云计算的基础设施目前已经取得了很大的进展，各种开源和商业化系统已经部署和运行。

但如何解决系统的高可用容错是目前大规模低成本部署所面临的主要问题之一。

本文从虚拟机容错的角度出发，描述了目前包括Xen、Remus、Kemari、SecondSite、Memory Mirroring等典型容错系统的进展。

1.简介目前，云计算、物联网、大数据等概念已经耳熟能详，在学术界和工业界都取得了很大的成功。

各种“XaaS”的概念被提出来，其中比较公认的是云计算系统分为“IaaS”、“PaaS”、和“SaaS”三层，也分为共有云、私有云和混合云。

在云计算基础设施层面，虚拟化技术取得了长足进展，涌现出OpenStack等四种主流的开源云计算框架，国内也有阿里云、盛大云、新浪云等商业运行的云系统。

随着系统的大量部署，系统高可用和容错的重要性日益凸显。

2010年1月，Heroku公司在Amarzon EC2平台上的虚拟机发生故障，影响了44000个应用程序[1]。

2011年4月，Amarzon EBS发生故障，停机长达12小时，5天之后故障也没有完全修复[2]。

因此，虽然很多云系统已经针对底层的系统软硬件故障做了系统、应用层面的容错设计，例如Apache Hadoop、Google GFS等基础设施，但针对不同的云服务质量（QoS）要求，仍需要提供某种级别的虚拟机高可用性。

在系统容错方面，除了传统的基于硬件冗余、软件备份和检查点技术之外，基于虚拟机的容错成为研究的热点之一[13]。

本文从NSDI 2008最佳论文Remus[3]开始，讲述了虚拟机容错的相关研究动态。

2.Remus：虚拟机异步容错Xen、VMware、KVM分别实现了各自的系统热迁移（Live Migration）方案，一旦故障发生，采用内存页面预拷贝优化技术能够显著减少停机时间。

Remus在Xen的基础上采用虚拟机复制的方法来提供容错，增加了磁盘同步过程，采用固定时间间隔（通常为25毫秒）来定期备份系统，而且能够做到及时更新，每个活跃的TCP会话都能被备份，透明地备份整个虚拟机（对现有系统不需要做任何修改）。

一旦故障发生，能够继续在备份机上运行，提供了较高的可用性。

图-1 Remus架构[3]Remus采用异步复制(Asynchronous replication)和投机执行(Speculative execution)的方法来优化系统性能(如图-1)，实验表明，在每秒40个检查点的情况下，针对Linux 2.6.18内核编译所带来的开销为103%。

与Remus类似，Kemari[4]是一种支持HVM模式的热迁移方案，通过监控系统事件通道，如果有事件发生，则暂停被迁移的虚拟机，并传输自上次同步后发生变化的内存页面实现源和目标主机的虚拟机同步，同步结束后继续执行。

该方法不适合事件频繁发生的服务器环境，否则将导致系统经常同步，影响对外服务。

华中科技大学实现了基于UMLinux的全系统记录和重放热迁移[5]，通过Copy-on-write（COW）的方式设置检查点，但每次内存写操作会引起一个缺页错误。

经过增量检查点优化，实验表明，其停机时间小于300毫秒[12]。

3.虚拟机容错扩展自Remus等相关项目提出以来，学术界和工业界在这个方面做了大量的相关研究[6](例如PipeCloud[14])。

Remus目前已经被Xen 4.0所支持，在此基础上提出了SecondSite系统（如图-2），将容错作为一个服务（Disaster Tolerance as a Service）[6]。

SecondSite 能够在互联网上进行跨数据中心的虚拟机复制，通过检查点压缩等优化技术，有效地降低了复制开销。

图-2 SecondSite架构[6]HP、Google和VMware等提出了HydraVM[7]，与一般的内存复制不同，该系统将最近的完整印象保存在共享存储设备中，采用增量检查点技术进行优化（如图-3），一个备份虚拟机能够在1.6秒之内被完全恢复，获得了一种低开销的虚拟机容错方法。

图-3 HydraVM架构[7]4.基于内存冗余的虚拟机容错以上介绍的是基于虚拟机热迁移和虚拟机复制的方法进行容错，通过虚拟机定期复制，由此带来大量的开销，而且由于采用定期检查点，一旦发生故障，有可能丢失状态信息。

目前的虚拟机一般在内存中运行，通过内存冗余，可以提供一种透明的容错方案。

目前主要有硬件冗余和软件冗余两种方案。

HP Advanced ECC[8]、Google ECC[9]等均提供了硬件支持的内存透明冗余,Google和IBM在这个方面申请了不少专利[9-11]。

以HP ProLiant[8]为例，通过提供冗余内存，不仅做到出现故障时自动容错，还支持内存的热插拔。

硬件冗余除了成本比较高之外，还不太灵活，无法根据不同的QoS要求，提供不同的容错级别，因而无法低成本部署到云环境中。

上海交通大学提出了一个基于虚拟化技术的内存实时备份与恢复的软件高可靠方案Memvisor。

通过二进制翻译技术，将系统的写内存指令加上备份内存的写操作，从而构造了一个与原内存内容同样的备份空间。

通过硬件虚拟化技术，透明构造备份内存，实时监测内存的分配与释放。

一旦发生内存硬件错误，则虚拟监控层将损坏内存的内容从备份空间中提取出来，并重新建立物理页与该内存空间的映射，从而实时将系统内存错误进行透明恢复（如图-4）。

通过Sysbench、thttpd、SQLite的实验表明，Memvisor系统除了在写内存有一定的开销，其他方面的开销都比较少，达到了系统低负载的设计目标。

与硬件冗余内存相比，提供了更为灵活可定制的备份内存。

与现有的应用级虚拟机备份和迁移相比，提供了实时性更好并且对应用透明的轻量级高可用内存方案。

图-4 Memvisor架构[7]5.结论在现代云计算平台上，系统高可用性要求逐步提高，例如Amazon EC2 云计算服务的可靠性要求为99.95%。

针对虚拟化云环境，在容错与高可用方面已经取得了很多成果[13]，例如：Remus、Kemari、HydraVM等，但如何低成本地部署到实际的云平台上还面临许多挑战。

国内在这方面奋起直追，已经取得了若干世界一流的科研成果，但如何进行产业化推广和应用，仍是需要迫切解决的问题。

参考文献[1] C. Brooks. Heroku learns the hard way from amazon ec2 outage. ,January 2010[2] Summary of the Amazon EC2 and Amazon RDS Service Disruption in the US East Region./message/65648/[3] Brendan Cully, Geoffrey Lefebvre, Dutch T. Meyer, Mike Feeley, Norman C. Hutchinson,Andrew Warfield: Remus: High Availability via Asynchronous Virtual Machine Replication.(Best Paper) NSDI 2008.[4] Yoshiaki Tamura, Koji Sato, Seiji Kihara, and Satoshi Moriai. Kemari: Virtual MachineSynchronization for Fault Tolerance. USENIX A TC '08.[5] Haikun Liu, Hai Jin, Xiaofei Liao, Liting Hu, Chen Y u: Live migration of virtual machinebased on full system trace and replay. HPDC 2009: 101-110[6] Shriram Rajagopalan, Brendan Cully, Ryan O'Connor, Andrew Warfield: SecondSite:disaster tolerance as a service. VEE 2012: 97-108[7] Kai-Yuan Hou, Mustafa Uysal, Arif Merchant, Kang G. Shin, Sharad Singhal. HydraVM:Low-Cost, Transparent High Availability for Virtual Machines. http://www.hpl./techreports/2011/HPL-2011-24.pdf[8] HP Corporation. HP advanced memory protection technologies. http://h18000.www1./products/servers/technology/memoryprotection.html.[9] J M Deegan, High reliability memory subsystem using data error correcting code symbolsliced command repowering. US Patent 7,206,962, Google[10] John M. Borkenhagen, Jan M. Janick. Memory mirroring with memory compression. USPatent Application Number: 12/947926. 2012. Google[11] James A. O'Connor et al. High availability memory system. US Patent 8,086,783. IBM.[12] HaiKun Liu, Hai Jin, XiaoFei Liao, Bo Ma and ChengZhong Xu. VMckpt: lightweight andlive virtual machine checkpointing. SCIENCE CHINA INFORMA TION SCIENCES 2012,DOI: 10.1007/s11432-011-4501-7.[13] Peng Lu. Resilire: Achieving High Availability at the Virtual Machine Level. http:///lu_proposal.pdf.[14] Timothy Wood, Andres Lagar-Cavilla, K. K. Ramakrishnan, et al. PipeCloud: UsingCausality to Overcome Speed-of-Light Delays in Cloud-Based Disaster Recovery. ACM SOCC 2011。