存储、集群双机热备方案

合集下载

双机热备方案之二(存储容灾)

双机热备方案之二(存储容灾)

高可用方案之二高可用中的存储容灾方案北京蓝科泰达科技有限公司2009-8企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。

随着信息时代的到来,关键数据的安全、持续可用问题直接关系到企业的生存和发展。

用户对于保证数据的安全、持续可用的方案需求也变得多元化、复杂化,单一的解决方案已经逐渐不能满足用户的实际需求。

蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达高可用存储容灾解决方案,目的在于保证数据永不丢失和系统永不停顿,彻底解决传统高可用系统中存储设备单点故障的风险。

而采用蓝科泰达科技有限公司硬盘虚拟化产品SyMirror,可以最大限度的保护用户的数据信息,将用户的不同的存储设备进行同步复制,同时虚拟存储系统提供用户透明化的存取访问,任何一台存储设备的故障都会在SyMirror软件的检测下迅速切换到备用存储设备继续使用。

而故障的存储设备修好后,重新加入SyMirror系统后,SyMirror会自动将增量数据同步到加入的存储设备。

具有国际领先技术的蓝科泰达SyMirror软件,具有以几个特点:1、数据实时同步功能,确保两台存储设备的数据在任保时候保持一致。

2、透明化的数据存取功能,任何一台存储设备的损坏都不影响用户使用存储设备。

3、虚拟存储中的任何一个真实的存储设备都可以在任保时候轻松离线工作。

4、智能增量数据实别功能,确保加入虚拟系统中的存储设备进行快速增量同步。

5、存储设备之间的容灾切换时间小于1秒钟,对用户存取数据几乎无任何影响。

6、同PlusWell HA软件系统紧密配合,随动切换。

实现真正意义的高可用冗余存储方案。

北京蓝科泰达科技有限公司的高可用存储容灾方案结合了PlusWell HA高可用软件的高可用性及PlusWell SyMirror虚拟存储软件的透明化特点,结合二者之优势为客户提供了一套没有单点故障的高可用存储容灾方案。

服务器双机热备方案完整版

服务器双机热备方案完整版

服务器双机热备方案 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】双机热备方案双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

1.集群技术在了解双机热备之前,我们先了解什么是集群技术。

集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。

这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。

一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。

计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。

一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。

当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。

其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。

当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。

可见,双机热备是集群技术中最简单的一种。

2. 双机热备适用对象一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。

有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。

但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。

我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。

要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。

存储双机热备方案

存储双机热备方案

存储双机热备方案介绍存储双机热备方案是一种用于保障数据持久性和高可用性的技术方案。

通过将存储设备配置成主备两台,实现数据的实时同步和快速切换,以确保在主节点故障时能够无缝切换到备节点继续提供服务。

本文将介绍存储双机热备方案的原理、实施步骤和实现要点。

原理存储双机热备方案基于主备切换的原理,通过实时数据同步和热切换技术来确保数据的持久性和高可用性。

实时数据同步存储设备主备节点之间通过网络实时同步数据。

当主节点上的数据发生变化时,将立即同步到备节点上。

主备节点之间的数据同步方式可以采用镜像同步或增量同步的方式。

镜像同步是将主节点上的数据完全复制到备节点上,以保持主备节点之间的数据完全一致。

镜像同步通常适用于数据量较小或网络带宽较大的情况。

增量同步是将主节点上的数据变化部分同步到备节点上,以减少数据传输量和同步延迟。

增量同步通常适用于数据量较大且变化频繁的情况。

热切换技术当主节点发生故障或需要维护时,可以通过热切换技术将备节点切换为主节点,以实现无缝切换。

热切换技术通常基于心跳检测和自动故障转移。

心跳检测是通过在主备节点之间周期性地发送心跳信号,来检测主节点的状态。

当主节点无法正常响应心跳信号时,备节点会自动切换为主节点,提供数据服务。

自动故障转移是在主节点故障时,自动触发备节点切换为主节点。

自动故障转移通常需要配合集群管理软件或存储设备的管理工具实现。

实施步骤实施存储双机热备方案主要包括以下步骤:1.确定主备节点的配置要求:包括硬件配置、操作系统和存储设备的版本要求等。

2.配置主备节点的网络连接:确保主备节点之间可以正常通信,并具备足够的网络带宽来支持实时数据同步。

3.配置存储设备的主备模式:根据存储设备的类型和厂商提供的管理工具,将主备节点的存储设备配置为主备模式。

4.配置数据同步方式:根据实际需求,选择镜像同步或增量同步的方式,并配置同步参数。

5.配置热切换技术:基于心跳检测和自动故障转移的技术,配置主备节点的热切换参数和策略。

双机热备配置及方案

双机热备配置及方案

公司数据集中存储备份方案一、用户现状2、操作系统和数据都在同一台服务器中,服务器使用时间有长有短。

3、用户数据只做了一些简单的备份,数据备份/恢复管理操作复杂,数据恢复时间长。

二、需要分析1、根据用户现在状况,数据与操作系统在同一台服务器的硬盘分区中,存在非常大的风险,操作系统出现问题时,很可能导致数据丢失。

数据库数据移置到高性能存储中,与操作系统分离,以提高数据保存的安全性可靠性。

2、服务器提供的硬盘数量有限,提供的最大IOPS数受硬盘数量限制,高峰时期,可能会出现响应延时。

磁盘存储能够提供更多硬盘,从而增加需要的IOPS,以提高业务系统整体性能。

3、未来用户会增加很多高性能应用系统,也需要高性能的存储系统来支撑,为了避免重复投资,设计存储时,需要考虑存储目前的应用,以及将来的性能要求和扩容需要。

4、由于单机运行,会存在单点故障,当某台服务器出现问题后,那么不能正常运行,建议选择双机热备系统,当某台服务器出现问题后,另外一台服务器共享存储里的数据,可对外提供服务器,保证业务的连续性。

5、由于电子设备都不能保证不出问题,同时,生产数据只有一份,一旦丢失,可能带来致命的错误,需要考虑数据保护机制,提供高效自动、易操作的中文图化管理系统。

三、方案设计1、数据集中存储根据以上需求分析,需要考虑2台数据库服务器,通过芯跳线组成双机热备,增加一台高性能数据存储。

本方案设计中,选择FC SAN存储架构方式,通过存储与服务器的HBA卡连接;对网络架构不作大的改动,只对服务器存放在服务器中数据进行迁移到存储中。

对应用系统需要提供高业务连续性时,只要在现有基础上增加双机热备(HA)即可。

针对綦江自来水公司公司的数据类型,主要是以SQL或者ORACLE等数据库的结构化数据和一些文件类的非结构化数据为主。

SQL/ORACLE等数据库的结构化数据,属于典型的数据库应用特征,普遍容量不大,随机IO读写非常频繁,属于性能要求大于容量需求的应用,因此对于这类数据的存储,优先考虑存储的性能要满足应用需求。

服务器及存储高性能双机热备方案

服务器及存储高性能双机热备方案

服务器及存储高性能双机热备方案前言对于如何保护企业数据的安全性,是每一个所有企业信息主管(CIO)最为重要的事情,数据的丢失以及整个系统的瘫痪将会带来巨大的损失以及付出沉重的代价。

因此如何在有效地减少预算成本的前提下又能更好的对数据进行备份呢?多数人可能会选择磁带机,但是有经验的IT专家则认为,一个稳定的可靠的系统中数据及作业的重要性已远超过硬件设备本身,怎样确保及保障数据应用的可用性与可靠性呢?为了解决数据的高可用性的问题,通常需要采用双机容错的群集方案。

今天推荐一款最常用的数据备份存储解决方案即惠普服务器及存储高性能双机热备方案供大家参考。

一、双机热备方案的集群套件HP P2000G3 MSA的概述HP P2000 G3 MSA智能存储系统是专门为中小企业的电子邮件、财务数据、数据库备份等应用定制的。

HP StorageWorks P2000 G3 MSA 阵列系统的灵活性如何才能解决不断增长的存储需求和预算有限问题?该产品提供高性能8 Gb 光纤通道、Combo FC/iSCSI、6 Gb SAS、1 Gb 或10 GbE iSCSI 连接阵列,旨在以合理的价格实现高效的存储整合。

选择FC/iSCSI Combo 控制器,可通过两个协议灵活共享阵列资源,充分满足各种规模部门的需求和预算要求。

所有P2000 G3 MSA 阵列均标配64 快照和Volume Copy 功能,可加强数据保护。

光纤通道或Combo FC/iSCSI 控制器,通过可选的Remote Snap 软件实现复制功能。

阵列允许部门和中小型企业将容量按需扩展到最多149 块硬盘。

可混合使用LFF 和SFF 企业级SAS 和归档级SATA 硬盘。

可配置单一控制器,以降低初始成本,也可配置双控制器,为要求苛刻的入门级客户提供较高的可用性和性能.二、双机热备方案的服务器群集工作原理服务器群集是一组协同工作并运行群集软件的独立服务器。

双机热备的方案

双机热备的方案
2.减少系统故障带来的影响,提高企业关键业务的抗风险能力。
3.优化运维管理,降低运维成本。
三、方案设计
1.系统架构
本方案采用双机热备架构,包括两台服务器、共享存储设备、网络设备以及双机热备软件。服务器间通过心跳线连接,实时监控对方状态。
2.服务器选型
根据业务需求,选择性能稳定、兼容性好的服务器设备。服务器硬件配置应保持一致,以确保负载均衡。
3.存储设备
采用共享存储设备,为两台服务器提供数据存储空间。存储设备应具备高可靠性和高性能,以满足业务需求。
4.网络设备
网络设备应具备高可用性,为双机热备提供稳定、高速的网络环境。
5.双机热备软件
选择成熟、可靠的双机热备软件,实现服务器之间的实时监控、故障切换和数据同步。
6.故障切换策略
设定合理的故障切换策略,确保在服务器发生故障时,能够迅速切换至备用服务器,降低业务中断时间。
2.降低系统故障带来的经济损失和信誉损害,提高企业核心竞争力。
3.提高运维效率,降低运维成本。
三、方案设计
1.系统架构
本方案采用双机热备架构,包括两台服务器、一台共享存储设备和网络设备。服务器之间通过心跳线连接,实时监测对方的状态。
2.服务器选型
根据业务需求,选择性能稳定、兼容性好的服务器设备。服务器硬件配置应保持一致,以确保负载均衡。
b.定期检查双机热备软件的运行状态,确保故障切换正常。
2.故障处理
a.服务器发生故障时,立即启动故障切换流程。
b.分析故障原因,排除故障,恢复服务器正常运行。
c.定期总结故障处理经验,优化故障处理流程。
3.数据备份
定期对关键业务数据进行备份,确保数据安全。
4.系统升级

服务器双机热备方案

服务器双机热备方案

双机热备方案双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

1.集群技术在了解双机热备之前,我们先了解什么是集群技术。

集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。

这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。

一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。

计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。

一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。

当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。

其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。

当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。

可见,双机热备是集群技术中最简单的一种。

2. 双机热备适用对象一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。

有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。

但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。

我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。

要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。

因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

服务器与存储高性能双机热备方案

服务器与存储高性能双机热备方案

服务器及存储高性能双机热备方案前言对于如何保护企业数据的安全性,是每一个所有企业信息主管(CIO)最为重要的事情,数据的丢失以及整个系统的瘫痪将会带来巨大的损失以及付出沉重的代价。

因此如何在有效地减少预算成本的前提下又能更好的对数据进行备份呢?多数人可能会选择磁带机,但是有经验的IT专家则认为,一个稳定的可靠的系统中数据及作业的重要性已远超过硬件设备本身,怎样确保及保障数据应用的可用性与可靠性呢?为了解决数据的高可用性的问题,通常需要采用双机容错的群集方案。

今天推荐一款最常用的数据备份存储解决方案即惠普服务器及存储高性能双机热备方案供大家参考。

一、双机热备方案的集群套件HP P2000G3 MSA的概述HP P2000 G3 MSA智能存储系统是专门为中小企业的电子邮件、财务数据、数据库备份等应用定制的。

HP StorageWorks P2000 G3 MSA 阵列系统的灵活性如何才能解决不断增长的存储需求和预算有限问题?该产品提供高性能 8 Gb 光纤通道、Combo FC/iSCSI、6 Gb SAS、1 Gb 或 10 GbE iSCSI 连接阵列,旨在以合理的价格实现高效的存储整合。

选择 FC/iSCSI Combo 控制器,可通过两个协议灵活共享阵列资源,充分满足各种规模部门的需求和预算要求。

所有 P2000 G3 MSA 阵列均标配 64 快照和 Volume Copy 功能,可加强数据保护。

光纤通道或 Combo FC/iSCSI 控制器,通过可选的 Remote Snap 软件实现复制功能。

阵列允许部门和中小型企业将容量按需扩展到最多 149 块硬盘。

可混合使用 LFF 和 SFF 企业级SAS 和归档级 SATA 硬盘。

可配置单一控制器,以降低初始成本,也可配置双控制器,为要求苛刻的入门级客户提供较高的可用性和性能.二、双机热备方案的服务器群集工作原理服务器群集是一组协同工作并运行群集软件的独立服务器。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

存储集群双机热备方案目录一、前言 (3)1、公司简介 (3)2、企业构想 (3)3、背景资料 (4)二、需求分析 (4)三、方案设计 (5)1.双机容错基本架构 (5)2、软件容错原理 (6)3、设计原则 (7)4、拓扑结构图 (7)四、方案介绍 (10)方案一1对1数据库服务器应用 (10)方案二CLUSTER数据库服务器应用 (11)五、设备选型 (12)方案1:双机热备+冷机备份 (12)方案2:群集+负载均衡+冷机备份 (13)六、售后服务 (15)1、技术支持与服务 (15)2、用户培训 (15)一、前言1.1、公司简介《公司名称》成立于2000年,专业从事网络安全设备营销。

随着业务的迅速发展,经历了从计算机营销到综合系统集成的飞跃发展。

从成立至今已完成数百个网络工程,为政府、银行、公安、交通、电信、电力等行业提供了IT相关系统集成项目项目和硬件安全产品,并取得销售思科、华为、安达通、IBM、HP、Microsoft等产品上海地区市场名列前茅的骄人业绩。

《公司名称》致力于实现网络商务模式的转型。

作为国内领先的联网和安全性解决方案供应商,《公司名称》对依赖网络获得战略性收益的客户一直给予密切关注。

公司的客户来自全国各行各业,包括主要的网络运营商、企业、政府机构以及研究和教育机构等。

《公司名称》推出的一系列互联网解决方案,提供所需的安全性和性能来支持国内大型、复杂、要求严格的关键网络,其中包括国内的20余家企事业和政府机关.《公司名称》成立的唯一宗旨是--企业以诚信为本安全以创新为魂。

今天,《公司名称》通过以下努力,帮助国内客户转变他们的网络经济模式,从而建立强大的竞争优势:(1)提出合理的解决方案,以抵御日益频繁复杂的攻击(2)利用网络应用和服务来取得市场竞争优势。

(3)为客户和业务合作伙伴提供安全的定制方式来接入远程资源1.2、企业构想《公司名称》的构想是建立一个新型公共安全网络,将互联网广泛的连接性和专用网络有保障的性能和安全性完美地结合起来。

《公司名称》正与业界顶尖的合作伙伴协作,通过先进的技术和高科产品来实施这个构想。

使我们和国内各大企业可通过一个新型公共网络来获得有保障的安全性能来支持高级应用。

《公司名称》正在帮助客户改进关键网络的经济模式、安全性以及性能。

凭借国际上要求最严格的网络所开发安全产品,《公司名称》正致力于使联网超越低价商品化连接性的境界。

《公司名称》正推动国内各行业的网络转型,将今天的"尽力而为"网络改造成可靠、安全的高速网络,以满足今天和未来应用的需要。

1.3、背景资料随着计算机系统的日益庞大,应用的增多,客户要求计算机网络系统具有高可靠,高可用性,而网络系统是否能够可靠、高速、稳定的运行取决于网络的心脏——服务器是否有最佳的容错,备份手段,已经成为一个日渐突出的问题。

根据相关机构的调查表明,在服务器的硬件中,最容易发生故障的仍然是可动的机械部分即硬盘(故障发生率为52%),其次是内存(占23%)和电源(占6%),三者之和约占硬件故障的80%以上。

但是,在目前的服务器中,对硬盘,内存,电源所实行的基本可靠性措施可以说已经相当完备。

中档以上服务器可以利用标准件或可选件来配置磁盘控制器和冗余电源。

所用的机器中都配置了高可靠性的ECC内存,基本上消除了由典型故障所造成的停机事故。

在软件故障中,WINDOWS NT 的事故约占60%,由应用引起的故障约占40%。

群集备份技术是解决由软件(或硬件)引起可靠性降低的有效措施。

群集技术是用网络将两个以上的服务器连接起来,当一台服务器停机时,集群中的其他服务器在保证自身业务的基础上,将停机服务器的业务接管。

二、需求分析贵单位现有1台IBM235(志强3.0/1G内存/73G*3/RAID5/冗余电源/Windows2003标准版),作为全厂的主域控制器,控制局域网内部(不能上Internet)300用户和300台计算机,07年预计增加到400用户和400台计算机;安装有网络版卡巴斯基主控台和杀毒软件;提供网络版绘图软件的解密服务,约50用户;最主要的工作是提供SQL Server数据服务,装有SQL 2000 OEM版,目前只提供数据服务供50左右使用,即将增加110用户,同时提供数据和图片服务(每日数据量约为条写入;将生产用图纸存入数据库,供用户浏览,日增加量约为200张30K左右的jpg图片)估计每用户同时开启最大进程为20条(20*160=320条)。

1台IBM236(志强3.2/2G内存/146G*3/RAID5/冗余电源/Windows2003标准版),作为全厂的备份域控制器,最主要的工作是提供SQL Server数据服务,装有SQL 2000 标准版,为全厂考勤系统提供数据服务,约50用户使用。

1台IBM235(志强3.0/1G内存/73G*2/ Windows2003标准版)提供Internet网络的简单代理和域服务。

机房目前使用山特C6KW/2H供电系统;核心交换机尚有4个1000M电口、4个单模光口和4个多模光口可用。

总厂约300台计算机没有存储和备份系统。

根据现有网络环境中服务器使用现状,将现有服务器之间连接到AbeStore2615磁盘阵列,磁盘阵列系统做为数据库服务器的存储。

主机服务器和备机服务器与AbeStore双机软件配套使用。

双机服务器是一组独立的服务器,运行UPM 双机软件服务,并象单个系统一样进做。

通过运行着UPM应用服务的服务器编组,可组成一级服务器双机热备.从而对资源和应用程序提供高可用的、可扩展的、可管理性的。

双机的目的是,在出现故障或断电的情况下,保证客户对资源和应用程序的访问.如果群集里的服务器由于故障或维护的缘故,不可用,资源和应用程序将移到其它可用群集节点上.保证服务的不间断工作三、方案设计3.1、双机容错基本架构双机容错的目的在于保证数据永不丢失和系统永不停机,采用智能型磁盘阵列柜可保证数据永不丢失,采用双机容错软件可保证系统永不停机。

它的基本架构共分两种模式:双机互备援(Dual Active)模式和双机热备份(Hot Standby)模式。

1)双机互备援(Dual Active)基本简介所谓双机热备援就是两台主机均为工作机,在正常情况下,两台工作机均为信息系统提供支持,并互相监视对方的运行情况。

当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over)异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop),但正常运行主机的负载(Loading)会有所增加。

此时必须尽快将异常机修复以缩短正常机所接管的工作切换回忆备修复的异常机。

切换时机(Take Over)●系统软件或应用软件造成服务器宕机●服务器没有宕机,但系统软件或应用软件工作不正常●SCSI卡损坏,造成服务器与磁盘阵列无法存取数据●服务器内硬件损坏,造成服务器宕机●服务器不正常关机2)双机热备份(Hot Standby)基本简介所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机科尽早通知系统管理员解决,确保下一次切换的可靠性)。

当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop)。

工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将备份机的工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机。

切换时机(Take Over)●系统软件或应用软件造成服务器宕机●服务器没有宕机,但系统软件或应用软件工作不正常●SCSI卡损坏,造成服务器与磁盘阵列无法存取数据●服务器内硬件损坏,造成服务器宕机●服务器不正常关机3.2、软件容错原理UPM容错软件提供了一个完全容错的软件解决方案,并提供数据、应用程序和通信资源的高度可用性。

UPM容错软件不需要任何特别的容错硬件,并访问特定节点的配置数据。

UPM容错软件会自动地提供错误检测和现场恢复。

在出现故障的情况下,UPM容错软件会将保护资源自动转换到一个根据预先设定好优先权的系统。

在实际进行切换用户时,会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,UPM容错软件会在所选择的节点上自动地恢复操作。

1、心跳故障检测HeartbeatUPM容错软件在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。

即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,UPM 容错软件就把这条路径标示为失效(红色)。

如果你只定义了一条通信路径,当UPM 容错软件把这唯一的一条通信路径标为失效时, UPM容错软件便立即开始恢复过程。

然而,如果你有冗余路径, UPM容错软件能够通过第二条路径确定是系统故障还是只是通信路径有问题。

如果UPM 容错软件开启优先级第二的通信路径并收到了心跳信号,它就不开始切换动作,而只需要把第一条通信路径标成红色(失效),作为信号告诉你需要修复有故障的路径。

一般情况下UPM容错软件只在下列事件发生时,启动系统恢复功能:所有的通信路径故障。

如果所有节点都没能收到心跳信号,把所有通信路径都标为失效,UPM 容错软件开始安全检查。

安全检查失败。

当所有通信路径故障时,UPM容错软件向整个网络发出安全检查信号。

如果信号指出配对系统还“活”着的时候,UPM容错软件不启动切换机制。

如果安全检查没从配对节点返回信号,UPM容错软件就开始切换动作。

因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用多条通信路径。

2、通信路径UPM容错软件支持在节点之间和心跳通讯中,使用如下通讯路径:(1) Heartbest,心跳。

你可以使用任何的网络硬件接口,只要它能够支持TCP/IP的通讯协议。

一般是一组服务器上直联的两块网卡,这样的硬件包括:以太网、快速以网。

(2) TCP/IP,既公网。

当Heartbeat心跳出现故障的时候,UPM容错软件会启动TCP/IP 的检测。

这样的硬件包括:以太网、快速以网。

UPM 容错软件假定当通过心跳信号检测其它服务器失败时,则认为此服务器是关闭的。

因此,为了避免不必要的失效切换,最好建立两种以上独立的物理路径,使用至少两种心跳。

例如,如果两个服务器被一个心跳连接起来,并且,从属服务器来的心跳信号无法被主服务器所检测到,则下面之一是可能引起这一现象的原因:服务器的全部网卡或端口失败电缆失效主服务器暂时挂起主服务器失败失效切换只可能在最后一种情况下才发生。

相关文档
最新文档