双机热备解决方案讲解

双机热备解决方案讲解
双机热备解决方案讲解

双机热备解决方案

方案特点:

双机热备可以采用第三方双机软件实现,也可以采用windows server系统自带的mscs来实现双机热备。两套相同应用的服务器采用主/备机模式,主备机采用心跳线连接,

备机会监测主机的运行状态,如果主机出现故障,备机可以自动接管主机的应用继续服务,保证业务的连续性。双机热备的方案建议采用存储设备,数据全部存放在存储设备中,保证数据的一致性,可以让备机顺利接管主机应用。也可以选择不带存储来实现双机。需要软件支持,相当于两台服务器做镜像的模式。

避免的风险:

随着业务对IT系统的依存度越来越高、为保证业务连续性、IT系统的安定、连续运行成为必需。系统中断服务、业务被中断的可能性如下所示。

一、由于操作错误造成系统停止

二、软件/硬件故障

三、利用备份软件等进行恢复的情况下、长时间的操作导致业务中断

四、自然灾害

您的收益:

一、系统安全:双重保护,实时保护公司重要的无形资产

二、业务连续性:IT系统7x24在线,减少停机时间,提供最优质的IT服务

三、IT体验:提高企业员工IT使用体验,提高工作效率

四、满意度:先进的IT系统能更好的服务客户,提高客户满意度

WINDOWS故障转移群集

故障转移群集是一种高可用性的基础结构层,由多台计算机组成,每台计算机相当于一个冗余节点,整个群集系统允许某部分节点掉线、故障或损坏而不影响整个系统的正常运作。一台服务器接管发生故障的服务器的过程通常称为"故障转移"。

如果一台服务器变为不可用,则另一台服务器自动接管发生故障的服务器并继续处理任务。群集中的每台服务器在群集中至少有一台其他服务器确定为其备用服务器。

故障转移群集可应用于Windows server 2003、Windows server 2008、Windows 2012 server等操作系统中部署。

适用环境

1. 硬件组件、应用程序或服务出现故障导致程序或服务无法使用或影响工作;例

如某服务器电源出现故障,如果该该服务器和电源都是唯一的,则存在单点故障,

并且服务器提供的应用程序将不可用。

2. 计划内的服务器停机或维护影响应用程序的可用性;例如要更新无备用服务器

的一台数据库服务器

上的操作系统,你可能需要重启或停止应用程序服务才能安装更新修补程序;

3. 监视和维护多服务器层增加了对系统和网络资源的要求。例如你需要多台服务

器提供多种应用程序服务,各自独立的服务器不利于监视与维护;

工作原理

故障转移群集必须基于域的管理模式部署,以“心跳机制”来监视各个节点的健康状况;备用服务器以心跳信号来确定活动服务器是否正常,要让备用服务器变成活动服务器,它必须确定活动服务器不再正常工作。

同步状态

备用服务器必须首先将其状态与发生故障的服务器的状态进行同步,然后才能开始处理事务。主要有三种不同的同步方法:

?事务日志。在事务日志方法中,活动服务器将其状态的所有更改记录到日志中。

一个同步实用工具定期处理此日志,以更新备用服务器的状态,使其与活动服务器

的状态一致。当活动服务器发生故障时,备用服务器必须使用此同步实用工具处

理自上次更新以来事务日志中的任何添加内容。在对状态进行同步之后,备用服

务器就成为活动服务器,并开始处理事务。

?热备用。在热备用方法中,将把活动服务器内部状态的更新立即复制到备用服

务器。因为备用服务器的状态是活动服务器状态的克隆,所以备用服务器可以立

即成为活动服务器,并开始处理事务。

?共享存储。在共享存储方法中,两台服务器都在共享存储设备(如存储区域网

络或双主机磁盘阵列)上记录其状态。这样,因为不需要进行状态同步,故障转

移可以立即发生。

示例

?

示例图

第一台服务器(Database01) 是处理所有事务的活动服务器。仅当Database01 发生故障时,处于空闲状态的第二台服务器(Database02) 才会处理事务。群集将一个虚拟IP 地址和主机名(Database10) 在客户端和应用程序所使用的网络上公开。

部署过程

基本条件

1. 两台加入域管理模式的计算机,windows server 2003或以上服务器操作系统;

2. 能作为共享存储卷的设备作为仲裁磁盘;(例如支持iscsi协议的NAS或软件)

3. 每台计算机有独立作为传输心跳信号的网卡;

注意要点

(以Windows Server 2008为例)

1. 首注意网卡绑定顺序,以域网络优先;

2. 禁用心跳线网络NETBIOS;和一些无关的协议及服务;

3. 各节点能通过域主机名相互通信(域内DNS作用);

4. 共享磁盘、仲裁磁盘可多链路使用;

5. 严格执行群集测试要求;

6. 各个节点的系统补丁和版本一致;

7. 故障转移群集不能与NLB负载均衡共处于一台逻辑计算机的系统上(可以用

虚拟机分担);

8. 防火墙会阻挡群集通讯,需要配置允许群集和域相关服务通过;

9. 安装虚拟网卡有可能导致MAC地址一样无法建立群集;

10. 域控制器不建议安装在群集节点上。

RoseHA软件群集

1.概述

对现代企业来说,利用计算机系统来提供及时可靠的信息和服务是必不可少的;另一方面,计算机硬件与软件都不可避免地会发生故障,这些故障有可能给企业带来极大的损失,甚至整个服务的终止,网络的瘫痪。可见,对一些特别的企业或公司,系统的高可用性显得更为重要。因此,必须有适当的措施来确保计算机系统提供不间断的服务,以维护系统的可用性。RoseHA是一个商用的企业级软件解决方案,它可提供全面的可用性管理,把计划的和非计划的停机时间降到最低,能满足发展的但严格的世界电子商务模式所要求的正常工作时间。电子商务需要增加不停机时间以保证为顾客进行各种服务;

不管哪种企业,多大规模,RoseHA都能为他们的“无间断商务”发挥重要作用。在平台

方面,RoseHA支持Windows,Linux及Solaris。在应用方面,RoseHA支持Oracle,Microsoft SQL Sever,Microsoft Exchange,Sybase,MySQL等多种主流应用。

2.软件简介

RoseHA双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、应用软件和RoseHA高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoseHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被RoseHA软件捕捉。当捕捉到这种变化后RoseHA 就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供TCP/IP网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕后,可以根据RoseHA的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。

RoseHA容错功能实现的关键是在系统发生错误进行切换时,对客户端来说主机是透明的,即主机的切换在工作端看来没有变化,所有基于主机的应用都正常。RoseHA采用了虚拟IP 地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换虚拟地址始终指向工作主机,在客户端看来主机是透明的。在进行网络服务时,在双机系统后台RoseHA提供一个逻辑的虚拟地址,任何一个客户端需要访问系统时只需要使用这个虚拟地址。当双机系统中的一台服务器出现故障时,RoseHA会将另外一台服务器网卡的IP

地址更换为这个虚拟地址,继续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务也没有间断。除IP地址外,HA还可以提供虚拟的计算机别名供客户端访问。对于数据库服务,当有一台服务器出现故障时,另外一台服务器就会自动接管数据库引擎,同时启动数据库和应用程序,使用户数据库可以正常操作。当Active主机发生故障时,RoseHA将自动将服务迅速的切换到备机。并在共享存储备的基础上,继续为客户端提供业务服务。

3.主要功能特点介绍

3.1自动切换当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232/SCSI/网络线缆断开),RoseHA将确定由于某种故障而终止的应用,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。

3.2自动检测在集群系统的每一台服务器内,RoseHA具有两个核心进程,他们互相监控(如:系统宕机、HA进程被杀掉、RS-232、网络、SCSI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复。

3.3支持多条心跳路径可以将网线和RS-232串口线作为在集群系统上运行的RoseHA的心跳线。配置多条心跳路径可以避免系统的单点故障。

3.4网络可靠性如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。如果该服务器配备了冗余的网络接口,RoseHA会使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,HA会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。

3.5磁盘可靠性需要将应用的全部数据存储在两台服务器都能访问到的共享磁盘中。建议使用磁盘阵列来存储数据,这样可以避免单点失败,而且便于对系统的容量进行扩充。对由Volume Manager管理的磁盘阵列,RoseHA提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。

3.6应用可靠性在高可用性系统中可以运行多个应用。每一个应用是作为一个服务而存在的。在服务器中,当某个服务失败而其它服务正常运行时,RoseHA将处理这个失败的服务。在将这个服务切换到另一台服务器上时,该服务器上运行的服务也不会受到影响。对于

与网络不相关的纯数据应用,只需要切换数据存储和数据处理软件。而在与网络相关的客户机/服务器应用,除了要切换数据存储和数据处理软件外,还需要切换相关的虚拟IP。如果希望两个服务独立地进行切换,则此两个IP地址不能相同。如果使用了相同的IP地址,在发生切换时,RoseHA会将所有使用该IP的服务都切换到另外一台服务器上去。

3.7友好的界面RoseHA提供了友好直观的图形安装界面和监控管理界面。通过直观而又方便的JAVA Applet管理界面,用户可以交互式地对集群系统进行配置、监控和管理,并可以利用Applet的网络特性,通过网络对系统进行远程管理,实时地显示出主机系统及服务的状态。

3.8灵活的Active-Active模式和Active-Standby模式RoseHA支持Active-Active模式和Active-Standby模式。用户可指定每台服务器的作用(active or standby),指定要监控的服务和硬件部分,定义指定的服务发生故障后要采取的进一步行动(如是否重新启动该服务、允许的最大启动时间等)。

3.9丰富的附加功能提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写执行状态诊断及错误恢复工作的Agent程序。

4.软件规格

4.1支持的操作系统平台Windows:Windows 2000 ServerWindows 2000 Advanced ServerWindows Server 2003Windows Server 2003 EnterpriseEditionWindows Storage Server 2003Linux:Red Hat Enterprise Linux2.1/3.0/4.0SuSE Linux Enterprise Server 9/10TurboLinux Server 10Asianux Linux 1.0/ 2.0Solaris: Solaris 2.6 for x86 / sparcSolaris 7 for x86 / sparc Solaris 8 for x86 / sparc Solaris 9 for x86 / sparcSolaris 10 for x86 / sparc

4.2支持的应用程序RoseHA支持多种应用的数据复制和应用切换,并能与重要的应用如数据库:Microsoft SQL Server、Exchange 2000/2003/2007、Oracle、文件服务器等紧密配合。RoseHA支持的应用包括:数据库:MS SQL Server、Oracle等文件服务器WEB应用服务邮件服务器(Exchange2000/2003/2007)用户应用软件。

相关主题
相关文档
最新文档