Suse_Linux_11 _双机集群配置文档

Suse_Linux_11 _双机集群配置文档
Suse_Linux_11 _双机集群配置文档

Suse Linux 11 双机集群配置文档

一安装前准备

1.两台装有suse 11 sp1操作系统的服务器,每台服务器有两块

网卡。

2.Suse 11 sp1系统安装碟或者ISO文件。

3.suse 11 sp1 HA 安装碟或者iso文件

SLE-11-SP1-HA-x86_64-GM-Media1.iso

二安装Heartbeat

通过yast2工具添加heartbeat,

选择软件—附加产品

如图1:

添加HA应用url

勾选“高可用性”安装

三Heartbeat配置

下面以浙江移动流量服务器双机热备为例,讲述heartbeat的配置。

1. 网卡设置

主服务器:bond0 10.70.238.157/26 bond0:0 10.7.8.1

备服务器:bond0 10.70.238.158/26 bond0:0 10.7.8.2

浮动IP:10.70.238.159/26(之后将对其进行配置)

因浙江移动要求主机双线路,所以服务器上两网卡做了bond,

两台服务器的bond0:0口用直通线连接作为心跳线

2.主机系统配置

(1) 在两台服务器上修改/etc/hosts文件,修改

内容如下:

10.70.238.157 pc-zjdamglk01.site pc-zjdamglk01

10.70.238.158 pc-zjdamglk02.site pc-zjdamglk02

10.7.8.1 pc-zjdamglk01.site pc-zjdamglk01

10.7.8.2 pc-zjdamglk02.site pc-zjdamglk02

3. 开启同步服务

在主服务器上开启同步服务,配置如下:

1、启动YaST 并选择杂项> 群集或在命令行中运行yast2 cluster 启动初始群集配置对话框。

2、在通讯通道类别中,配置用于群集节点间通讯的通道。此信息会写入/etc/ais/openais.conf 配置文件。

通信通道用10.7.8.0网段,组播地址,端口不变。为每个群集节点指定唯一的ID,建议从1开始,此处可勾选自动生成ID。

3、在安全类别中,定义群集的身份验证设置,如果激活启用安全身份验证内会对群集节点间的通讯使用HMAC/SHA1身份验证。此身份验证方法需要一个共享的密钥,用于保护和鉴定消息,指定的身份密钥将用于群集中的所有节点,勾选生成身份密钥文件创建,它会写

入/etc/ais/authkey

4、在服务类别中,选择每次引导此群集服务器时都启动OpenAIS

5、群集通讯,添加群集中所有节点,点击同步文件,生成密钥,

开启csync2服务。

4. 配置同步服务

1、在群集中的其他服务器上完成同步服务器的配置,与主服务器相同,群集节点添加时无需添加服务器,只需要开启csync2服务。拷贝主服务器中/etc/csync2/csync2.cfg和/etc/csync2/key_hagroup

pc-zjdamglk01:~ # cd /etc/csync2/

pc-zjdamglk01:/etc/csync2 # scp ./csync2

root@10.70.238.158:/etc/csync2/

…….

pc-zjdamglk01:/etc/csync2 # scp ./key_hagroup

root@10.70.238.158:/etc/csync2/

2、在所有节点上开启rcxinetd服务

pc-zjdamglk01:~ # rcxinetd start

添加开机启动

pc-zjdamglk01:~ # chkconfig csync2 on

pc-zjdamglk01:~ # chkconfig xinetd on

3、在主服务器上同步

pc-zjdamglk01:~ # csync2 –xv

第一次运行会有两个文件报错,/etc/csync2/csync2.cfg和/etc/csync2/ key_hagroup强行同步这两个文件

pc-zjdamglk01:~ # csync2 –f /etc/csync2/csync2.cfg

pc-zjdamglk01:~ # csync2 -f /etc/csync2/key_hagroup

再运行同步命令

pc-zjdamglk01:~ # csync2 -xv

Marking file as dirty: /etc/sysconfig/pacemaker

Marking file as dirty: /etc/sysconfig/openais

Marking file as dirty: /etc/csync2/csync2.cfg

Marking file as dirty: /etc/corosync/corosync.conf

Connecting to host pc-zjdamglk02 (SSL) ...

Updating /etc/corosync/corosync.conf on pc-zjdamglk02 ...

File is already up to date on peer.

Updating /etc/csync2/csync2.cfg on pc-zjdamglk02 ...

File is already up to date on peer.

Updating /etc/sysconfig/openais on pc-zjdamglk02 ...

File is already up to date on peer.

Updating /etc/sysconfig/pacemaker on pc-zjdamglk02 ...

File is already up to date on peer.

Finished with 0 errors.

成功,查看联机状态运行crm_mon

pc-zjdamglk01:~ # crm_mon

如图,可看到群集中有两台主机,pc-zjdamlk01 和pc-zjdamglk02都为online状态。

5.配置群集服务实现地址浮动

1、在确认群集通讯正常后,配置服务实现地址浮动,运行crm

进入crm壳进行配置,些处有help命令提供帮助

进入配置

crm(live)# configure

crm(live)configure# property no-quorum-policy=ignore

crm(live)configure# property stonith-enabled=false

crm(live)configure# commit

完成基本配置

2、服务地址配置

crm(live)# configure

crm(live)configure# primitive fcaredb ocf:heartbeat:IPaddr params ip=10.70.238.159 cidr_netmask=255.255.255.192 nic=bond0

crm(live)configure# commit

注:

Fcaredb 为服务名

Parems ip 为浮动ip

Cidr_netmask 子网掩码

Nic 为浮动ip网卡

配置完成

检查服务启动情况

crm(live)# resource

crm(live)resource# show

fcareapp (ocf::heartbeat:IPaddr) Started 也直接在系统中查看

显示为fcareapp服务启动,活动主机pc-zjdamglk01

3、检查测试

重启主机看地址是否可在群集中浮动

备份与集群的区别

什么是数据备份 数据备份顾名思义,就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。 数据备份的根本目的,是重新利用,这也就是说,备份工作的核心是恢复,一个无法恢复的备份,对任何系统来说都是毫无意义的。作为最终用户,一定需要清醒的认识到,能够安全、方便而又高效的恢复数据,才是备份系统的真正生命所在。 一个好的备份系统,应该能够以很低的系统资源占用率和很少的网络带宽,来进行自动而高速度的数据备份。 数据备份作为存储领域的一个重要组成部分,其在存储系统中的地位和作用都是不容忽视的。对一个完整的 IT 系统而言,备份工作是其中必不可少的组成部分。其意义不仅在于防范意外事件的破坏,而且还是历史数据保存归档的最佳方式。换言之,即便系统正常工作,没有任何数据丢失或破坏发生,备份工作仍然具有非常大的意义——为我们进行历史数据查询、统计和分析,以及重要信息归档保存提供了可能。 还有,数据备份更多的是指数据从在线状态,剥离到离线状态的过程,这与服务器高可用集群技术以及远程容灾技术,在本质上有所区别。虽然从目的上讲,这些技术都是为了消除或减弱意外事件给系统带来的影响,但是,由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。集群和容灾技术的目的,是为了保证系统的可用性,也就是说,当意外发生时,系统所提供的服务和功能不会因此而间断。对数据而言,集群和容灾技术是保护系统的在线状态,保证数据可以随时被访问。而相对来说,备份技术的目的,是将整个系统的数据或状态保存下来,这种方式不仅可以挽回硬件设备坏损带来的损失,也可以挽回逻辑错误和人为恶意破坏的损失。然而,一般来说,数据备份技术并不保证系统的实时可用性。也就是说,一旦意外发生,备份技术只保证数据可以恢复,但是恢复过程需要一定的时间,在此期间,系统是不可用的。在具有一定规模的系统中,备份技术、集群技术和容灾技术互相不可替代,并且稳定和谐的配合工作,共同保证着系统的正常运转。 备份、集群和容灾之间的比较表 数据备份技术高可用集群技术容灾技术 防范意外事件物理硬件故障是是是 病毒发作是部分部分 人为误操作是部分部分 人为恶意破坏是否否 自然灾害否否是 保护对象数据和文件是是是 应用和设置部分是是 操作系统部分是是 网络系统否否是 供电系统否否是 系统恢复系统连续性不保证保证保证 数据损失有少量损失完全不损失完全不损失 可恢复到时间点多个当前当前 其他方面数据管理方式搬移到离线在线共享或同步在线同步 适用系统规模任何系统规模中型或大型系统大型系统

ODA数据库一体机与传统双机集群方案比较

传统解决方案ODA数据库一体机购买2台服务器,2套正版操作 系统,双机集群软件,4 块光纤HBA卡, 两台光 纤交换机,一台光纤存储 阵列 一台ODA 安装部署集成商或者专业工程师来 进行部署有基本IT技能的人员都能进行部署

部署过程非常复杂:安装操作系统,配置网络集群,部署Oracle数据库,进行大量的测试调优工作部署过程非常简单,通过安装向导进行一键安装 一般需要一周左右时间完成最长2小时完成所有部署工作 维护升级管理 员 需要专业的系统管理员, 网络管理员和数据库管理 员 对系统维护文员的专业技能 要求不高 日常 监控 和诊 断 复杂:需对操作系统,存 储,数据库,集群软件分 别进行监控和诊断 简单:使用Appliance Manager对整个ODA进行 系统监控和诊断,包括硬 件,操作系统和数据库。 补丁 升级 管理员在多个供应商处寻 找最新的补丁版本,手工 对服务器硬件、固件、操 作系统和数据库软件打补 丁。无版本一致性检测, 可能会出现版本冲突等问 题,甚至导致系统故障。 Appliance Manager拥有一 键补丁的功能,在Oracle唯 一补丁程序接入点获取所有 最新版本补丁程序并进行快 速安装,无版本冲突等问 题。 高可用性无法保证多个厂商间产品 兼容性的问题,尤其是在 界定软、硬件问题时存在 诸多困难。 来自多个厂商的部件难以 做到高效配合,最终影响 数据库系统的整体性能。业内同级别解决方案最高的高可用性,数据库服务器、存储、网络以及操作系统软件、数据库软件、系统部署诊断软件有效的整合在一体机中,ODA是Oracle数据库解决方案最佳实践: 硬件全部采用冗余设计,采用三重数据镜像保护,数据重建速度是Raid5等方式的上百倍

存储、集群双机热备方案

存储集群双机热备方案

目录 一、前言 (3) 1、公司简介 (3) 2、企业构想 (3) 3、背景资料 (4) 二、需求分析 (4) 三、方案设计 (5) 1.双机容错基本架构 (5) 2、软件容错原理 (6) 3、设计原则 (7) 4、拓扑结构图 (7) 四、方案介绍 (10) 方案一1对1数据库服务器应用 (10) 方案二CLUSTER数据库服务器应用 (11) 五、设备选型 (12) 方案1:双机热备+冷机备份 (12) 方案2:群集+负载均衡+冷机备份 (13) 六、售后服务 (15) 1、技术支持与服务 (15) 2、用户培训 (15)

一、前言 1.1、公司简介 《公司名称》成立于2000年,专业从事网络安全设备营销。随着业务的迅速发展,经历了从计算机营销到综合系统集成的飞跃发展。从成立至今已完成数百个网络工程,为政府、银行、公安、交通、电信、电力等行业提供了IT相关系统集成项目项目和硬件安全产品,并取得销售思科、华为、安达通、IBM、HP、Microsoft等产品上海地区市场名列前茅的骄人业绩。 《公司名称》致力于实现网络商务模式的转型。作为国内领先的联网和安全性解决方案供应商,《公司名称》对依赖网络获得战略性收益的客户一直给予密切关注。公司的客户来自全国各行各业,包括主要的网络运营商、企业、政府机构以及研究和教育机构等。 《公司名称》推出的一系列互联网解决方案,提供所需的安全性和性能来支持国内大型、复杂、要求严格的关键网络,其中包括国内的20余家企事业和政府机关. 《公司名称》成立的唯一宗旨是--企业以诚信为本安全以创新为魂。今天,《公司名称》通过以下努力,帮助国内客户转变他们的网络经济模式,从而建立强大的竞争优势:(1)提出合理的解决方案,以抵御日益频繁复杂的攻击 (2)利用网络应用和服务来取得市场竞争优势。 (3)为客户和业务合作伙伴提供安全的定制方式来接入远程资源 1.2、企业构想 《公司名称》的构想是建立一个新型公共安全网络,将互联网广泛的连接性和专用网络有保障的性能和安全性完美地结合起来。《公司名称》正与业界顶尖的合作伙伴协作,通过先进的技术和高科产品来实施这个构想。使我们和国内各大企业可通过一个新型公共网络来获得有保障的安全性能来支持高级应用。 《公司名称》正在帮助客户改进关键网络的经济模式、安全性以及性能。凭借国际上要求最严格的网络所开发安全产品,《公司名称》正致力于使联网超越低价商品化连接性的境界。《公司名称》正推动国内各行业的网络转型,将今天的"尽力而为"网络改造成可靠、安全的高速网络,以满足今天和未来应用的需要。 1.3、背景资料 随着计算机系统的日益庞大,应用的增多,客户要求计算机网络系统具有高可靠,高

服务器双机热备方案定稿版

服务器双机热备方案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份

技术。但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存

双机热备、集群及高可用性入门

双机热备、集群及高可用性入门

什么是双机热备? 双机热备这一概念包括了广义与狭义两种意义。 从广义上讲,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。(相关文章:为什么需要双机热备?) 双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。但在实际应用中,可能会出现多台服务器的情况,即服务器集群。(相关文章:双机软件与集群软件的异同) 双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。(相关文章:双机热备的实现模式) 实现双机热备,需要通过专业的集群软件或双机软件。(相关文章:双机与集群软件的选择) 从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。(相关文章:双机热备、双机互备与双机双工的区别) 为什么要做双机热备? 双机热备针对的是服务器的故障。 服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。而如果技术人员不在现场,则恢复服务的时间就更长了。 而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务不能恢复会造成多大的影响。 在考虑双机热备时,需要注意,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。

高可用多机集群数据备份双机热备方案

PLUSWELL多机集群、数据备份解决方案 北京蓝科泰达科技有限公司 2008年7月

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux 平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据 库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可 被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确 保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

最新利用赛门铁克veritas SFHA技术实现双机集群架构案例

利用赛门铁克 v e r i t a s S F H A技术实现双机集群架构案 例

利用赛门铁克veritas SFHA技术实 现双机集群架构案例 一、系统拓扑结构: (一)环境描述 两台IBM P750 小型机,其中A机和B机组成一个Oracle Rac,两个存储上划分同等Lun。 (二)SFRAC功能 1.通过底层VXVM功能,实现两个盘柜的镜像(Mirror),保证在一个阵列出现down机,损坏等情况下保证应用的可用; 2.通过文件系统CFS,提供Oracle的并行操作,到达Oracle RAC的功能。 3.设置IO Fencing功能,防止因心跳线断掉,而出现的脑裂情况。 二、详细功能: (一)镜像功能 赛门铁克Storage Foundation采用独特的镜像双写技术,构造全冗余的存储高可用架构,在存储层面实现“HA”,当一个存储发生硬件故障时,业务系统主机会自动采用另一个镜像存储提供数据,核心业务丝毫不受影响。另外,

当生产存储性能下降到一定程度时,Storage Foundation会自动断掉主机与生产存储的连接,直接读取镜像存储数据,使业务应用性能免受生产存储性能的恶劣影响。而且Storage Foundation能够实现异构存储之间的高可用HA,最大限度避免来自同构同型号存储的Bug并发影响。该技术彻底消除核心业务系统的存储单故障点,减少业务中断风险,有效加固存储层面的高可用性,减少意外停机时间。 (二)DMP动态多路径 DMP(Dynamic):采用Symantec DMP组件(动态多路径)实现主机对存储的多路径读写;在 I/O 路径出现故障时,确保可以访问存储设备,保证数据的可用性;通过I/O路径优化算法改进I/O 性能。其主要功能如下: 1.光纤多通道的Fast failover 快速切换; 2.I/O 路径优化,提供六种算法:平衡路径,循环,最小队列长度,自适应,优先级,单个活动路径; 3.自动发现光纤路径; 4.动态监测多路径的状态; 5.异构环境支持,支持所有主流的磁盘阵列。 (三)IO fencing

服务器双机热备方案

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID 技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID

技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器

Windows Server 2008集群 + SQL Server 2008数据库主主模式双机集群

第一步准备工作 事先把操作系统、数据库、计算机名、IP地址等等相关内容提前规划好,本次数据库双机集群实验全程是在VMware虚拟机环境下搭建,一共使用四台虚拟机进行,分别是一台DC服务器、一台存储服务器、两台数据库服务器。实际生产环境中,物理存储绝大部分都是走光纤通道(Fibre Channel),即服务器上会安装一块HBA连接到光纤交换机,而模拟实验中是使用基于网络的iSCSI存储,为了进一步简化硬件数量,本次实验中,两台数据库服务器上就不专门新建用于存储通信的网卡了,直接让一张网卡在提供对外业务通信服务的同时,顺便承载起和iSCSI存储通信的工作,具体信息如下: DC服务器 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-DC 网络模式:桥接 新建域名:https://www.360docs.net/doc/e44321463.html, 新建域组1:DBEngine(数据库引擎组) 新建域组2:DBAgent(数据库代理组) 新建域组3:DBAnalysis(数据库分析服务组) 新建域用户1:DBAdmin(数据库管理专用帐号) 新建域用户2:DBServices(数据库运行专用帐号) IP地址:192.168.1.100 DNS地址:192.168.1.100 备注1:DBAdmin、DBServices这两个域用户需要加入DBEngine、DBAgent、DBAnalysis这三个域组 备注2:DBAdmin、DBServices这两个域用户需还要加入数据库服务器A、数据库服务器B的本地管理员组 存储服务器 操作系统:Windows Server 2008 R2 + Windows Storage Server 2008 R2 计算机名:iSCSI 网络模式:桥接 iSCSI软件:iSCSI Software Target 3.3 IP地址:192.168.1.200 新建磁盘数量:4 磁盘用途容量:仲裁盘(2G)、MSDTC盘(5G)、数据盘A(10G)、数据盘B(10G) 数据库服务器A 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-A 网络模式:业务线使用桥接,心跳线使用VMnet1 数据库:SQL 2008 R2 Enterprise With SP1 IP地址1:192.168.1.101(业务线) IP地址2:192.168.88.101(心跳线) DNS地址:192.168.1.100 集群名称:Wanghualang-HA 集群虚拟IP地址:192.168.1.250 MSDTC集群虚拟IP地址:192.168.1.240 SQL Server 网络名称A / B:SQLha01 / SQLha02 SQL Server 实例名称A / B:WanghualangSQL01 / WanghualangSQL02 SQL Server 实例虚拟IP地址A / B:192.168.1.241 / 192.168.1.242 挂载盘名称和盘符分配:仲裁盘(Q)、MSDTC盘(M)、数据盘A(D)、数据盘B(E) 数据库服务器B 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-B 网络模式:业务线使用桥接,心跳线使用VMnet1 数据库:SQL 2008 R2 Enterprise With SP1 IP地址1:192.168.1.102(业务线) IP地址2:192.168.88.102(心跳线) DNS地址:192.168.1.100 集群名称:Wanghualang-HA 集群虚拟IP地址:192.168.1.250 MSDTC集群虚拟IP地址:192.168.1.240 SQL Server 网络名称A / B:SQLha01 / SQLha02 SQL Server 实例名称A / B:WanghualangSQL01 / WanghualangSQL02 SQL Server 实例虚拟IP地址A / B:192.168.1.241 / 192.168.1.242 挂载盘名称和盘符分配:仲裁盘(Q)、MSDTC盘(M)、数据盘A(D)、数据盘B(E) 第二步安装配置iSCSI存储 本次实验将使用 Windows Storage Server 2008 R2 来搭建存储服务器,新建一台虚拟机安装 Windows Server 2008 R2 操作系统,按事先规划配置好IP地址,并禁用防火墙!载入 Windows Storage Server 2008 R2 镜像,进入 Windows Storage Server 2008 R2 文件夹,安装 Windows6.1-KB982050-x64-EnterpriseBranding 程序。

HA和集群的概念

1.1 什么是集群简单的说集群cluster就是一组计算机它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点node。一个理想的集群是用户从来不会意识到集群系统底层的节点在他/她们看来集群是一个系统 而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。 1.2 集群系统的主要优点1高可扩展性2高可用性HA集群中的一个节点失效它的任务可传递给其他节点。可以有效防止单点失效。3高性能负载平衡集群允许系统同时接入更多的用户。4高性价比可以采用廉价的符合工业标准的硬件构造高性能的系统。2.1 集群系统的分类虽然根据集群系统的不同特征可以有多种分类方法但是一般把集群系统分为两类1、高可用High Availability 集群简称HA集群。这类集群致力于提供高度可靠的服务。就是利用集群系统的容错性对外提供724小时不间断的服务如高可用的文件服务器、数据库服务等关键应用。负载均衡集群使任务可以在集群中尽可能平均地分摊不同的计算 机进行处理充分利用集群的处理能力提高对任务的处理效率。在实际应用中这几种集群类型可能会混合使用以提供更加高效稳定的服务。如在一个使用的网络流量负载均衡集群中就会包含高可用的网络文件系统、高可用的网络服务。 2、性能计算High Perfermance Computing集群简称HPC集群也称为科学计算集群。在这种集群上运行的是专门开发

的并行应用程序它可以把一个问题的数据分布到多台的计 算机上利用这些计算机的共同资源来完成计算任务从而可 以解决单机不能胜任的工作如问题规模太大单机计算速度 太慢。这类集群致力于提供单个计算机所不能提供的强大的计算能力。如天气预报、石油勘探与油藏模拟、分子模拟、生物计算等。 3.1 什么是高可用性HA 计算机系统的可靠性用平均无故障时间MTTF来度量即计算机系统平均能够正常运行多长时间才发生一次故障。系统的可靠性越高平均无故障时间越长。可维护性用平均维修时间MTTR来度量即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好平均维修时间越短。计算机系统的可用性定义为MTTF/MTTFMTTR 100。由此可见计算机系统的可用性定义为系统保持正常运行时间的百分比。计算机产业界通常用如下表所示的9的个数来划分计算机系统可用性的类型。可用性分类可用水平每年停机时间容错可用性999999 1 min 极高可用性99999 5 min 具有故障自动恢复 能力的可用性9999 53 min 高可用性999 8.8 h 商品可用性99 43.8h 负载均衡服务器的高可用性为了屏蔽负载均衡服务器的失效需要建立一个备份机。主服务器和备份机上都运行High Availability监控程序通过传送诸如“I am alive”这样的信息来监控对方的运行状况。当备份机不能在一定的时间内收到这样的信息时它就接管主服务器的服务IP并继续提

双机热备搭建系统项目解决方案

UPS电源安装实施方案 1.双机集群介绍 1.1.双机集群的原理说明 双机容错是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。当一台主机出现故障的时候,可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行。在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极保护了数据的安全性和性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间完全恢复正常使用。这是目前采用较多的一种模式。

1.2.双机系统逻辑图 1.3.双机热备实现模式 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。基于存储共享的双机热备是双机热备的最标准方案。这种方式采用两台(或多台)服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。两台服务器可以采用热备(主从)、互备、双工(并行)等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间完成,从而对业务不会造成影响。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。

在win7下的vmware上搭建双机学习环境群集双机热备Cluster

一、群集介绍 服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cluster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。(说明:本文档编写的目的是为了帮助大家实现所关心的如何在VMWare Workstation中完成典型群集的配置步骤,不会具体的涉及到如何安装群集应用程序,如Exchange群集等) 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤 SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点 故障回复: 某节点从宕机状态转为联机状态后,仍然继续宕机前的工作,为其他节点分流 三、实验环境介绍及要求 1、拓扑图

(1) DC软件配置信息 OS:Windows Server 2003 X86 SP1 中文企业版Role: Active Directory域控制器 Domain:https://www.360docs.net/doc/e44321463.html, ServerName:https://www.360docs.net/doc/e44321463.html, IP:192.168.0.254 (以“桥接”方式连接)Netmask:255.255.255.0 Gateway:192.168.0.254 (2) Cluster Node A软件配置信息 OS: Windows Server 2003 X86 SP1 中文企业版Role: Member Server ServerName:https://www.360docs.net/doc/e44321463.html, IP1:192.168.0.1 (以“桥接”方式连接)Netmask1:255.255.255.0 Gateway1:192.168.0.1 Dns1:192.168.0.254 IP2:10.0.0.1 (以“VMnet2”方式连接)Netmask2:255.0.0.0 Gateway2:None DNS2:None (3) Cluster Node B软件配置信息 OS: Windows Server 2003 X86 SP1 中文企业版Role: Member Server ServerName:https://www.360docs.net/doc/e44321463.html, IP1:192.168.0.2 Netmask1:255.255.255.0 Gateway1:192.168.0.1 (以“桥接”方式连接)Dns1:192.168.0.254 IP2:10.0.0.2 (以“VMnet2”方式连接)Netmask2:255.0.0.0 Gateway2:None DNS2:None

集群存储软件与双机热备的性能对比

集群存储软件与双机热备的性能对比 集群存储软件是几乎和双机热备一同产生的技术,但是为什么在市场占有率上失去了优势,这是一直都在探究的问题,下面我们就详细的了解下集群存储软件的相关知识。 在双机热备应用方面,有两大类软件产品。一类是双机软件(HA),另一类则称作集群存储软件(Cluster),这两类软件是有差异的。 它们都是为实现系统的高可用性服务的,都解决了一台服务器出现故障时,由其他服务器接管应用,从而持续可靠地提供服务的问题。 它们都是通过心跳技术在进行系统检测。 但是,双机软件只能支持两台服务器以主从方式或互备方式工作。而集群存储软件除了支持双机工作外,还可以支持多台服务器(Multi Node)工作,同时部署多个应用,并在多个服务器间灵活地设置接管策略。 在两种情况下需要使用集群存储软件:一是有超过两个应用,本身就需要部署三台或更多的服务器。二是只有两个应用,但每个应用的负载均较大,不宜采用双机互备的方式,而是需要由第三台服务器来作为这两个应用的备机。 一般地讲,集群存储软件具有更多的技术含量,具备更高的可靠性。同时,往往价格(平均到每台服务器)也高于双机软件。 在选择产品时,应根据应用的实际情况来确定。最理想的方式,则是在应用数量少、负载不是很大时先使用双机软件,然后在应用数量增多、负载增大时平滑过渡到集群存储软件。 双机备份和集群的原理与比较 什么是双机热备? 所谓双机热备就是使用互为备份的两台服务器共同执行同一服务,其中一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server)。在系统正常情况下,工作机为应用系统提供服务,备份机监视工作机的运行情况(工作机同时也在检测备份机是否正常),当工作机出现异常,不能支持应用系统运营时,备份机主动接管工作机的工作,继续支持关键应用服务,保证系统不间断的运行。 什么情况下需要采用双机热备? 用户可以根据系统的重要性以及终端用户对服务中断的容忍程度决定是否使用双机热备。比如网络中的用户最多能容忍多长时间恢复服务?如果服务不能很快恢复会造成什么样的后果等。对于承担企业关键业务应用的服务器需要极高的稳定性和可用性,需要7×24不间断服务,推荐使用双机热备。 我已经有了RAID,以及磁带备份,还有必要做双机吗?或者,如果我做了双机备份,还有必要做磁带备份吗? RAID和数据备份都是很重要的。但RAID技术只能解决硬盘的问题,备份只能解决系统出现问题后的恢复。而一旦服务器本身出现问题,不论是设备的硬件问题还是软件系统的问题,都会造成服务的中断。因此,RAID及数据备份技术不能避免服务中断出现,对于需要持续可靠地提供应用服务的系统,双机还是非常必要的。数据备份是保障数据安全性的必不可少的措施。因为不论RAID还是双机,都是一种实时的备份。任何软件错误、病毒影响、误操作等等,都会同步地在多份数据中发生影响。因此,对于关键业务即使采用了双机方案也还是一定要进行数据的备份,以便能在数据损坏、丢失时进行恢复。 如何选择与实施双机热备的配置方案? 以应用为主导,以高可用性为宗旨,分析需求的必要性; 2. 选择确定具体的设备、软件的型号等。需要注意的是: 不同的软件或是硬盘等存储设备,他们之间存在兼容性的问题,因此在购买

DB2 HA双机集群

数据是现代随需应变业务的血液;存储和移动数据的系统(服务器、网络、数据库)是这个系统的心脏。但是如果没有 heartbeat ——对这些数据具有可靠而快速的访问,且宕机时间最少——那么这两者都是惰性组件。 简介 本系列的第一篇文章 Linux 上的高可用中间件,第 1 部分:Heartbeat 和Apache Web 服务器简要介绍了高可用(HA)的概念,以及如何安装并配置 heartbeat。本篇文章是本系列的最后一篇文章,它将介绍如何在一个冷备份(cold standby)配置中使用 heartbeat 为 DB2 UDB 8.1 实现一个 HA 方案。 关于 heartbeat Heartbeat 是 Linux-HA 项目中提供的一个公用包。Heartbeat 提供了 HA 系统所需要的基本功能,例如启动/停止资源,监视集群中系统的可用性,在集群节点之间切换共享的 IP 地址信息。Heartbeat 还可以通过一个串口线或以太网接口来监视特定服务(或多个服务)的健康信息。当前的版本支持一个两节点的配置,其中使用特殊的 heartbeat "pings" 来检查服务的状态和可用性。 在这种实现中,heartbeat 会检测主节点的失效情况,并发起故障迁移的过程: 在主节点上停止 DB2 进程 在主节点上释放共享磁盘 在主节点上释放该服务的 IP 地址 将这个服务的 IP 地址添加到备用节点上 在备用节点上加载这个共享磁盘 在备用机器上重新启动 DB2 进程 为了最好地理解本文的内容,您需要对 DB2 UDB 和高可用集群有一个基本的理解。本系列的第一篇文章介绍了对于软件的高可用性来说这意味着什么,以及如何在一个两节点的系统上使用 High-Availability Linux 项目安装并设置 heartbeat 软件。 DB2 UDB 和 HA 基础 在 heartbeat 集群中使用的任何 DB2 UDB 都必须将数据全部存放在共享磁盘上,这样在发生节点失效的情况时,就可以在依然存活的机器上访问这些数据。运行数据库实例的节点还必须在内部磁盘上维护很多文件。这些文件包括与节点上的所有数据库有关的文件。 与数据库实例有关的文件会被分别存放在内部磁盘和外部磁盘上。图 1 详细介绍了 DB2 文件系统的组织,它介绍了在我们的测试中针对实例 db2inst1 和数据库 hadb 的设置。

双机热备简介

双机热备简介 一、双机热备 双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。其实现过程如下图所示: 图(1) 为什么要做双机热备? 双机热备针对的是服务器的故障。 服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。双机高可用系统解决方案,为用户提供了具有单点故障容错能力的系统平台。它采用主服务发生故障时备服务器接管的机制,实现在线故障自动切换,实现系

统7×24小时不间断运行,避免停机造成的损失。 (一)纯软件双机热备 纯软件双机热备是在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统,一般支持数据库和应用软件实现双机热备。 方案一:Windows(或者Linux)+ Rose Mirror HA+ORACLE(或者SQL Server)的双机热备 网络拓扑: 图(2) 投资采购软硬件设备: (1)数据库服务器:两台数据库服务器,每台服务器至少两个网络口; (2)操作系统:windows或者linux操作系统; (3)数据库软件:Oracle或者SQL Server企业版; (4)集群软件:Rose mirror HA(Rose公司); (5)交换机:核心交换机一台。

集群方案对比分析

集群方案分析 前言 目的 在我司部分项目实施过程中,用户提出了要求采用”双机”的方案。目前业内双机技术方案比较多,能解决的问题、达到的目标、用户拥有成本也不相同。本文试图给出主要技术方案的比较,供项目选型参考。 集群的概念 计算机集群简称集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。 按功效,可将集群分为: 高可用性集群High-availability (HA) clusters 负载均衡集群Load balancing clusters 高性能计算集群High-performance (HPC) clusters 网格计算Grid computing 高可用性集群提供了尽可能大的平均无故障时间时间、尽可能小的平均故障恢复时间。在集群内部署冗余设备,当系统中某台机器发生故障时,备用机器立刻启动接管任务。我们通常说的双机热备就是一种高可用性集群。 负载均衡集群提供了根据各个节点的闲置能力情况,将并发访问分散到各个节点上的功能,以使得集群整体的处理能力最大化,或当个任务的等待时间最小。 高性能集群、网格计算着眼点在于如何将一个大型任务分解到集群的各个节点中协同处理。主要应用领域包括天气预报、核试验仿真等。在我司目前及未来的主要项目中,一般不包含此类大型任务处理的需求,而主要处理多用户并发的小任务。这些并发小任务处理的性能问题特别适合使用负载均衡集群予以解决。 按照各种集群产品的技术路线,可将集群分为: 系统层集群 系统层集群是集群平台。在这个平台之上可以部署各个应用。由集群负责管理、监控应用,当节点发生故障时,集群将各种应用转移到后备节点上。Windows 故障转移群集就是其典型代表。 应用层集群 特定应用所构成的集群。例如,数据库应用集群,web服务器集群。相应的集群只能实现特定应用的故障转移。

双机热备方案

双机热备方案

双机热备方案

一:需求分析 客户当前采用二台IBM X3850X5服务器加ROSE MIRRO HA软件在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统。RoseMirrorHA 经过现有的以太网络基础环境,经过TCP/IP 协议,在两台主机之间实现了数据的实时镜像,不需要额外的硬件投资。在充分利用已有资源的基础上,经过先进的软件技术,实现纯软的高可用性系统。但ROSE MIRRO HA只是针对高可用性的双机热备,但客户的数据量过大时,如果一台服务器出现故障,另一台服务器在接管数据时将会对庞大的数据进行校验,这将会是一个漫长的过程,而客户的应用将会受到灾难性的问题。考虑到数据量增大的问题,因此建议客户考虑使用存储来实现双机热备份,这样将会在服务器出现故障的情况下,避免需要经过漫长的等待来实现应用的切换,这样将真正实现高可用性和高安全性。 二:双机介绍 双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由客户现用两台X3850X5服务器经过IBM B24光纤交换机和外接共享磁盘阵列柜DS5020来连接,并经过相应的双机热备份软件来实现的双机热备方案。在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是经过磁盘阵列集中管理和数据备份的。数据集中管理是经过双机热备份系统,将所有站点

的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证应用服务不间断。双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证应用服务运行不间断。 双机热备份方案中,根据两台服务器的工作方式能够有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。 双机热备模式即当前一般所说的active/standby 方式,active 服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(一般各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active 服务器出现故障的时候,经过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是当前采用较多的一种模式,但

相关文档
最新文档