Linux高可用集群系统的结构和原理分析
高可用集群 三节点原理

高可用集群三节点原理高可用集群是一种分布式计算系统,它通过将多个节点(一般为三个节点)连接在一起,以实现数据的冗余备份和资源的共享,从而提高系统的可用性和容错能力。
下面将介绍三节点高可用集群的工作原理。
在三节点高可用集群中,每个节点都是一台独立的服务器,具备相同的硬件和软件配置。
这三个节点通过高速网络互连,并通过软件共享存储来实现数据的同步和共享。
集群中的节点可以分为两个角色:主节点(Primary)和备节点(Secondary)。
在正常运行状态下,主节点负责处理客户端请求,并将数据同步至备节点。
同时,备节点以热备份的形式,实时复制主节点的数据和状态。
这样,在主节点发生故障或不可用时,备节点可以立即接管并继续提供服务,实现故障的无缝切换。
为了确保高可用性和数据一致性,集群采用了心跳机制和共享存储的方式。
心跳机制用于监控节点的状态,每个节点定期发送心跳信号以及当前节点的状态信息给其余节点。
如果主节点的心跳信号长时间未接收到,备节点可以判断主节点已经失效,并将自己切换为主节点运行。
共享存储用于存储集群的数据,主节点和备节点通过共享存储来实现数据的同步,确保数据在节点之间的一致性和可用性。
除了故障切换外,三节点高可用集群还可以进行软件和硬件的维护操作,如升级、扩容、修复等,而不会中断用户的访问。
这是因为在进行维护操作时,可以通过将一个节点切换到维护模式,并将其任务和数据迁移到其他节点上,再进行相应的操作。
维护完成后,将节点切换回正常模式,实现集群的无缝恢复。
综上所述,三节点高可用集群通过节点之间的数据同步和故障切换,提高了系统的可用性和容错能力。
它可以保证在主节点故障或维护时,集群可以继续正常提供服务,从而保证系统的稳定性和可靠性。
Linux系统的高可用性和冗余设计原则

Linux系统的高可用性和冗余设计原则Linux操作系统作为一种开源的操作系统,被广泛应用于各种服务器和系统中。
高可用性与冗余设计是保障系统稳定性和可靠性的重要因素。
本文将探讨Linux系统的高可用性和冗余设计原则。
一、高可用性的原则高可用性是指系统能够持续正常运行,不间断地提供服务。
在Linux系统中,实现高可用性的原则主要包括以下几个方面:1. 避免单点故障:单点故障是指当系统中某个关键组件或设备出现故障时,整个系统无法正常工作。
为避免单点故障,可以采取冗余设计,将关键组件进行冗余部署。
2. 负载均衡:负载均衡是通过将任务或服务分摊到多个服务器上,实现系统资源的合理利用,提高系统的处理能力和对故障的容错能力。
常见的负载均衡技术包括DNS轮询、反向代理和集群等。
3. 快速故障恢复:当系统出现故障时,快速恢复是保障系统高可用性的关键。
通过实时监控系统状态,及时发现并处理故障,采取自动化的故障恢复机制,可以有效减少系统的停机时间。
4. 数据备份和恢复:合理的数据备份策略可以确保数据的安全性和完整性。
将关键数据进行定期备份,并测试恢复过程,以确保在数据丢失或系统故障情况下,能够迅速恢复数据。
二、冗余设计的原则冗余设计是指在系统中添加冗余部件或组件,以提高系统的可靠性和可用性。
在Linux系统中,常见的冗余设计原则包括以下几个方面:1. 硬件冗余:通过使用多个相同的硬件设备,如磁盘阵列、双电源等,来实现硬件级别的冗余。
当一个设备发生故障时,其他设备可以接管工作,从而保证系统的连续性。
2. 网络冗余:通过使用多条网络链路或网络设备,如交换机、防火墙等,来保障网络的高可用性和冗余性。
当某个网络设备或链路发生故障时,其他设备或链路可以提供继续的网络连接。
3. 高可用性集群:通过将多个服务器组成集群,实现资源的共享和故障的容错。
利用集群管理软件可以实现自动的故障转移和负载均衡,提高系统的可靠性和可用性。
4. 容灾和备份:将关键数据备份到远程地点或云存储中,以便在主服务器发生故障或灾难时进行灾备恢复。
集群系统主要分为两种

日本的F5公司开发出了高可用性集群BIG-IP,它是使用于本地网络站点或数据中心的高可用的、智能化的负载平衡产品,它提供了对网络流量的自动和智能的管理。与前几种集群系统不同的是,BIG-IP向用户提供的是一个即插即用设备,而其它的提供的都是软件方法。
IBM、Microsoft和Intel于2000年7月联合发布了一种高可用性服务器集群软件及硬件包,这种服务器集群的配置包括32台IBM Netfinity 8500R及Intel Pentium Ⅲ Xeon处理器,运行IBM的DB2 Universal Database和Microsoft Windows 2000 Advanced Server操作系统,每分钟可以执行440879次交易。这套系统面向数据密集的应用,特别是B2B、电子商务和企业资源规划领域。
在科学计算领域中,人们开始把注意力投向通过普通PC机或工作站的集群来代替昂贵的超级计算机。比较成功的例子是高性能集群系统Beowulf,它最初是由NASA的Goddard Flight Center进行开发的,主要目的是支持大规模的科学计算问题,如地球和太空科学面临的一些计算问题。
国内也有不少公司进行了集群系统的研究和开发工作。
-控制结点
又可称之为前端机,用于系统管理员控制和管理整个集群的,主要性能体现在整体综合性能上。
存储系统:
存储系统为整个集群系统提供网络文件系统的服务,其性能必须满足可靠性高、容量大、I/O带宽高、延迟低等要求。
存储系统分I/O结点和磁盘阵列两部分,I/O结点的配置、个数以及磁盘阵列的类型、容量都可以根据用户的应用类型和需求进行灵活的配置。
系统管理网络:
专门服务于集群管理通信的管理网络,它连接集群系统中所有的结点,采用可靠性高、背板交换能力强的企业级主干以太网。同时监控集群系统运行环境和软硬件核心部件工作状态等信息的监控网络,采用Intel的网络监控软件以及专用的集群管理软件与其配合对整个集群进行管理。
利用Linux操作系统进行服务器集群管理

利用Linux操作系统进行服务器集群管理在当今信息时代,服务器集群已经成为现代企业中不可或缺的一部分。
而要有效地管理服务器集群,利用Linux操作系统是一个明智的选择。
本文将介绍如何利用Linux操作系统进行服务器集群管理。
一、服务器集群管理的基本概念服务器集群是由多台服务器组成的,旨在提高系统的可靠性、可用性和性能。
服务器集群管理的核心目标是促进集群中服务器的协同工作以提供高负载、高性能和高可用性的服务。
二、Linux操作系统简介Linux操作系统是一个免费且开源的操作系统,具有出色的稳定性和安全性,广泛应用于服务器领域。
Linux操作系统提供了一系列工具和命令,用于管理集群中的多台服务器。
三、服务器集群管理工具1. SSH(Secure Shell)SSH是一种网络协议,可用于在两个网络设备之间进行加密通信。
通过SSH,管理员可以在远程终端登录服务器,执行管理操作。
2. Shell脚本Shell脚本是一种在Linux操作系统中编写的可执行脚本,用于批量执行一系列命令。
管理员可以编写Shell脚本来进行服务器集群管理任务,如自动化安装软件、配置系统参数等。
3. rsyncrsync是一种高效的文件复制工具,可用于在服务器之间同步文件和目录。
管理员可以使用rsync命令将文件从一台服务器复制到集群中的其他服务器,实现数据的同步和备份。
4. PacemakerPacemaker是一个开源的高可用性集群管理软件,可用于监控和管理服务器集群中的资源。
通过配置Pacemaker,管理员可以实现自动故障切换和负载均衡等功能。
四、利用Linux操作系统进行服务器集群管理的步骤1. 安装Linux操作系统首先,管理员需要在每台服务器上安装Linux操作系统。
可以选择适合企业需求的Linux发行版,如Ubuntu、CentOS等。
2. 配置SSH登录在每台服务器上,管理员需要配置SSH服务,以便能够通过SSH 协议远程登录服务器。
软件开发知识:利用集群技术构建高可用性的系统

软件开发知识:利用集群技术构建高可用性的系统随着互联网技术的不断发展,越来越多的企业和组织都在构建自己的高可用性系统,以保证业务的稳定性和数据的安全性。
其中的关键技术之一就是集群技术,通过多台服务器的联合工作,实现高可用性的系统构建。
本文将从以下四个方面深入阐述集群技术构建高可用性系统的要点和步骤。
首先,介绍集群技术的基本概念和原理。
其次,探讨如何利用集群实现系统的负载均衡和故障转移,同时介绍相关的软件和工具。
第三,详细解释如何选用适合的硬件设备和网络结构来搭建集群系统。
最后,对常见的集群系统故障进行分析,提出应对方法。
一、集群技术概述集群技术是一种将多台计算机联合起来构成一个高性能、高可用性、高扩展性的计算机系统的技术。
集群系统通常由多个相互独立的服务器节点组成,节点之间通过特定的网络通信协议进行数据的交换和共享。
在集群系统中,任何一个计算机节点都可以以工作节点的身份进入到整个集群体系中,从而实现任务的分配和执行。
而整个集群系统也可以通过编程、配置等方式实现负载均衡和故障转移,从而提高系统的可用性和稳定性。
二、集群技术实现高可用性系统的原理和步骤2.1负载均衡负载均衡是集群技术中最基本的概念之一。
在一个系统或服务中,用户的请求往往是随机分布的,不同请求的负载也会有所差异。
而通过负载均衡技术,可以将不同请求分配到不同计算机节点中进行处理,从而实现系统的负载均衡。
负载均衡可以分为硬件负载均衡和软件负载均衡两种类型。
硬件负载均衡一般采用专用网络交换机或路由器来实现,比如F5、NetScaler等;而软件负载均衡通常采用虚拟网络设备或软件来实现,比如Nginx、HAProxy等。
2.2故障转移故障转移指在集群系统中,如果某个节点出现了故障,如何及时将请求转发到其他节点,以保证系统的可用性和稳定性。
故障转移也可以分为硬件故障转移和软件故障转移两种类型。
硬件故障转移一般采用专用的硬件设备或热插拔设备来实现,比如磁盘阵列设备或高可用性存储系统。
linux系统工作原理

linux系统工作原理
Linux系统是一种开源的操作系统,它的工作原理可以分为以下几个方面:
1. 内核:Linux系统的核心是内核,它是操作系统的最底层,负责管理计算机的硬件资源,包括CPU、内存、输入输出设备等。
内核还负责管理进程、线程、文件系统等系统资源,同时提供了一些系统调用接口供上层应用程序使用。
2. Shell:Shell是用户与Linux系统交互的界面,它提供了一种命令行或图形界面的方式让用户与系统交互。
Shell还可以执行脚本,自动化执行一些操作。
3. 文件系统:Linux系统的文件系统是一个层次化的树形结构,根目录为/,其下有很多子目录和文件。
文件系统还提供了权限控制、链接等功能,保证了用户数据的安全和稳定性。
4. 进程管理:Linux系统采用了进程的方式管理系统资源,每个进程都有自己的独立空间,同时可以与其他进程通信。
Linux系统还支持多线程,提高了系统的并发处理能力。
5. 网络管理:Linux系统支持TCP/IP协议,可以实现网络通信。
Linux系统还提供了一些网络管理工具,如netstat、ping等,方便管理员进行网络管理和故障排除。
总之,Linux系统的工作原理是一个复杂的系统,它通过内核、Shell、文件系统、进程管理、网络管理等组成部分协同工作,为用户提供了一个高效稳定的操作系统环境。
Linux系统卜HA集群的研究

Linux系统卜HA集群的研究[摘要]本文介绍集群的基本信息和集群的分类。
重点研究linux 系统下高可用性集群(ha:high availability)的工作原理、三种方式和基本架构,在此基础上讨论了高可用性集群在生产环境中的配置、搭建与应用。
[关键词]集群;高可用;故障;服务中图分类号:tp393.08 文献标识码:a 文章编号:1009-914x (2013)11-0198-02一、高可用性集群简介(ha集群)高可用性集群主要是为了使整体服务尽可能不间断,以便考虑计算硬件和软件的其他问题。
如果高可用性集群的服务所在节点出现故障,它将自动飘移到其他节点[1],以便继续工作。
ha集群通过特殊软件把独立的系统(node)连接起来,组成一个能够提供故障切换(faileover)功能的集群[2]。
ha集群可以保证在多种故障中,关键服务的可用性、可靠性及数据完整性。
其主要分为三种方式:1、主从方式(非对称)一台主服务器上面运行对外提供的服务,其他作为从服务器,监测主服务器存活状态,当主服务器故障时,服务会自动切换至从服务器上。
2、对称方式(互备互援)两台服务器上都运行对外服务,并且互相监视对方是否出现故障,不能继续提供服务,若一方故障则服务自动切换到另一台服务器上。
3、多机方式(多机互备)这种方式比上面两种更安全有效,它增加了服务器的数量,可避免多点故障。
二、ha集群的搭建下面演示搭建的是linux系统下双节点高可用集群,共需要四台pc机。
1、storage服务器配置注意关掉iptables&selinux配置yum,按照上面配置修改主机名和ip地址,编辑/etc/hosts 文件。
#vi /etc/hosts-----------------------------------------------------------192.168.10.10 storage192.168.10.11 node1192.168.10.12 node2192.168.10.13 manager-----------------------------------------------------------# yum install ntp -y# vim /etc/ntp.conf-----------------------------------------------------------13 restrict 192.168.10.0 mask 255.255.255.0 nomodify notrap-----------------------------------------------------------# /etc/init.d/ntpd start# watch-n 1 ntpq –p当reach大于等于17时,ntp时间同步服务可用# yum install vsftpd –y# /etc/init.d/vsftpd start# mkdir/var/ftp/iso# mount/dev/cdrom/var/ftp/iso//安装树配置完成# fdisk /dev/sda//新建一个40g的分区n l+40gw# partprobe/dev/sda# fdisk-l# yum install scsi-target-utils -y# vim/etc/tgt/targets.conf//设置集中存储-----------------------------------------------------------------------------2425 backing-store/dev/sda1026 write-cache off27------------------------------------------------------------------------------# /etc/init.d/tgtd restart# tgtadm--lld iscsi--mode target--op show3、 node1 & node2服务器配置==node1 & node2==按照上面配置修改主机名和ip地址,编辑/etc/hosts文件。
无负载均衡器的Linux高可用负载均衡集群系统

第3 3卷 第 3期
3 3 No. 3
计
算
机
工
程
20 07年 2月
Fe ua y 0 br r 2 07
Co p e gi e rng m ut rEn n e i
・网络 与通信 ・
文章 编号:1 o-48 073_1 _o 文献标识码:A 0 _32( 0)_03 _2 0 2 0_ 6
节点 ,而且服务器 节点之间互为备份 ,在一个节点失效后 ,另外一个备份节点将接管其工作 ,从而构建一个 不需要负载均 衡器的 Ln x i 高 u
可用负载均衡 集群 系统。
关健词 :虚拟 MA C;负载均衡 ;高可用 ;Ln x i u
Hi h・v i b l y a d Lo d- a a c u t rS s e g - a l i t n a ・ l n eCl se y t m a a i b
外部网络
然后根据 调度算法 ,选择后端 的一 台真实服务器进行 用户请
求的处理 。这也就意味着用户如果需要负载均衡集群 ,那么 他 们就需要额外购买一个单独的负载均衡 器来 完成该功能 , 但 是这对于一般 的中小企业来说,无疑是增加了成本。此外 , 在政府 和企 业信息化过程 中还需要同时具备 负载均衡和高可 用功能 的集群系统 , 而传统的高可 用集群系统仅实现 fi v r aoe l 功 能,没有 负载均衡功能 ,从而并不能完全满足 当前需求 。 所 以市场迫切需要一个低成本的融合 高可 用与 负载均衡功能 的集群 系统 。 针对于这种实际的市场 需求 ,本文提 出了无负载均衡器 的 Ln x高可用负载均衡集群系统 :系统 中两个服务器 节点 iu 同时工作 ,运行同一服 务,并各 自承担负载的一部分,同时 两节点之间相互备份 ,当检测到其 中一个节点 失效 后,另外
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2007-09-15 第一作者简介:左 婷(1979-),女,吉林省四平市人,现为吉林师范大学信息网络中心研究实习员.2007年11月吉林师范大学学报(自然科学版) .4第4期Journal of Jilin Normal University(Natural Science Edition)Nov.2007Linux 高可用集群系统的结构和原理分析左 婷1,吴会军2(1.吉林师范大学信息网络中心,吉林四平136000;2.吉林省水文水资源局,吉林长春130000)摘 要:通过对目前常用Linux 平台上高可用集群系统的软、硬件基本结构和工作原理的分析与研究,构建容易扩展、高可用、易维护和管理、高性价比的计算机系统.关键词:L inux;高可用集群系统;结构;原理中图分类号:T P393 文献标识码:A 文章编号:1000-1840-(2007)04-0115-02目前,很多国际知名软件公司和计算机厂商都推出了自己的集群产品,其中值得一提的是T he H igh A vailabilityL inux Project 的开放源代码Heartbeat,已经同商业集群软件一样成熟,而且较后者应用更为灵活.本文将着重介绍SuSEL inux Enterpr i se Server 10平台上Heartbeat2.0.8组成结构和工作原理.1 Linux 高可用集群系统的基本概念伴随着集群技术的发展,出现了一些关于集群系统的概念和术语.(1)集群资源和集群资源代理.在集群系统中,所有由集群控制和管理,并将其以单一和统一的形式提供给客户端用户使用的计算机资源称为集群资源,例如:一种服务、一个IP 地址、一个磁盘驱动,甚至可以说:除了节点,其它任何软硬件资源都可以成为集群资源.而集群资源代理是为了控制和管理某一集群资源而编写的代理程序脚本,集群软件通过特定集群资源代理来操控某一集群资源,Heartbeat 套件本身已经包含了一些常用资源代理,开发人员也可以自己按照一定的规范编写;(2)指定协调者(也称主节点).主节点除了具有其它一般节点具有的集群节点基本功能外,还负责对整个集群系统的状态进行监控、分析和转换,对集群系统下达集群指令,协调各节点的操作等,实际上是整个集群系统的大脑!,显然一般情况下,整个集群系统只有一个主节点,但当某些特殊情况发生时,例如主节点不再是集群中的节点,主节点将发生迁移,即位置发生了变化,另一个节点将代替它成为主节点;(3)ST ON IT H.英文 Shoot T he Other NodeIn T he Head !的缩写,代表一种将错误操作的节点进行隔离的技术,为了防止错误操作的节点对集群资源进行破坏性控制和操作,使其不断重新启动或关机,从而使其无法取得对集群资源的控制权;(4)裂脑和仲裁.在某种情况下,由于软硬件失败导致各节点无法相互确定彼此的状态时,整个集群将被分裂为几个部分,每个部分都想取得对集群资源的控制权,以保证集群的高可用,这种对集群资源的竞争将严重破坏集群资源的完整性和一致性,甚至导致整个集群瘫痪、硬件被损坏的严重后果,这种情况称为裂脑.为了防止裂脑的发生,由仲裁协议决定哪个部分来取得对集群资源的控制权,为了继续保证系统的高可用,一般将控制权交给节点数超过原集群节点数一半的部分,同时将其它节点进行隔离;(5)单点故障(失败).单点故障是指由于系统中某一组件的故障或运行失败从而导致整个集群系统瘫痪和应用服务完全停止,因此,在高可用集群的构建中应尽量避免单点故障.2 Heartbeat 的主要进程Heartbeat 的所有集群功能都是由它的进程和它们之间相互通信来具体实现的.(1)集群资源管理器(CRM ,Cluster Resource M anager).CRM 是集群系统中最主要的管理进程,它负责对整个集群资源的管理和约束,包括资源的配置及相互间依赖关系,并决定资源运行的状态、位置和时间等.另外它还负责监控本地资源管理器完成这些工作,CRM 通过与系统的每一个组件通信来相互作用和协调操作,CRM 通过heartbeat 通讯模块进行节点间通讯,从CCM 接受当前集群的成员信息,指令ST O NI TH Daremon 如何工作,负责记录系统日志等;(2)策略引擎(PE,CR M Policy Eng ine).PE 是CRM 的一个组件,只能在主节点上运行.PE 的功能是根据当前集群的状态及集群资源的约束配置计算出集群的下一个状态,即为T E 生成将要执行的计划和策略;(3)执行引擎(T E,CRM T ransi tion Engine).T E 也是CRM 的一个组件,只能在主节点上运行.T E 的功能是按照P E 生成的集群状态变化计划和策略,指令集群节点上的LRM 对具体的集群资源进行操作;(4)∀115∀集群信息库(CIB,Cluster Information Base).作为CRM的一个组件,CIB进程实际上是自动复制的、由CRM收集的关于集群资源和节点信息的副本,为了方便使用,这个副本的所有信息都将写入cib.x ml文件;(5)身份认证进程(CCM, Consensus Cluster M embership).CCM主要负责对集群节点变化的监控,集群状态的变化很大程度上取决于资源运行节点的状态变化;(6)本地资源管理器(L RM,L ocal Resource M anager).L RM实际上是一种抽象的资源代理,在CRM的控制下,通过相应的资源代理对本地资源进行操作.由于具有插件式的结构,L RM支持多种类型的资源代理(对应的规范不同):OCF(Open Cluster F ramewo rk)类,hear tbeat类,LSB (L inux Standar ds Base)类和ST ON IT H类;(7)ST ON IT H Daremon.ST ON IT H代理的功能是对集群中节点通过调用ST O NIT H API实施隔离,确保ST ON IT H设备(或资源)仅被集群中的某个节点子集访问;(8)无阻塞日志代理(log d).新版本Heartbeat为防止因消息过多造成阻塞,容易丢失日志,使用了logd,CRM可以将系统日志完整写入syslog或某一文件;(9)hear tbeat底层通讯模块.heartbeat通讯模块主要负责各节点间的集群信息传递,能够在多种传输媒介以多种传输方式通信,其功能十分强大;(10)应用心跳代理(ap phbd,Application heartbeat Daremo n).apphbd是可选的,功能主要是单独为某一应用提供更高一个级别(而不是系统级)的可用性,它定时对某一应用进行更深入的检测,发现错误后通知RM D,RM D将采取一系列措施在应用级别对应用进行恢复;(11)应用恢复代理(RM D,R ecovery M anager Dare mon).与apphbd一起配合在应用级别提供高可用性.3 Heartbeat工作原理(1)启动Heartbeat后,集群中所有组件之间的通讯也就开始了,各组件之间的信息交换是通过heartbeat底层通讯模块执行的,同时,hear tbeat底层通讯模块还提供各节点之间通讯连接状态信息,包括连接的节点信息,连接失败和恢复的时间等;(2)一旦这种连接状态发生改变,消息将被传送给CCM,CCM则发送信息包给集群中其它节点的CCM,当前哪些节点通过身份认证,哪些没有,从而最终确定集群中的节点状态是否改变;(3)如果CCM确认集群节点的状态发生了改变,它将首先通知CIB进程,CIB进程则根据最新的节点状态更新自己的信息,然后,CCM再通知CRM,CRM 确认CIB进程的信息改变后,将触发PE,PE通过检查CIB 中状态信息等,根据预先定义的策略,生成相应的集群状态变化操作指令序列,并将其传递给CRM;(4)然后CRM又将操作指令序列提交给T E进行进一步执行;(5)T E根据操作指令序列操控集群中每个L RM执行特定的操作,如按特定顺序启动某些资源服务;(6)T E将跟踪每个操作的执行情况,直至指令序列全部完成,然后将执行结果反馈给CRM;(7)以上过程在集群运行过程中是按顺序重复执行的.4 总结只有在高可用集群的结构和工作原理深入理解基础上,根据客户的具体需求,才能够构建出高性价比集群系统.同时,对构建的高可用集群系统进行全面的测试也是至关重要的,这有助于发现系统构建过程中未发现的问题,为了应付将来的系统扩展、升级和维护,建立一个试验集群是必须的.参考文献[1]周孝生,龚菊仙,韩东儒.SUSE Linux10[M].北京:人民邮电出版社,2007.[2][美]威尔(W ehrle K.),汪青青,卢祖英(译).Linux网络体系结构∀∀∀Linux内核中网络协议的设计与实现[M].北京:清华大学出版社,2006.[3][美]科珀(Dopper,K.).Linux企业集群∀∀∀用商用硬件和免费软件构建高可用集群[M].北京:中国水利水电出版社,2007.The Analysis on Architecture and Principles of theHigh Availability Cluster SystemZ UO Ting1,W U H ui-j un2(1.College of Informati on Netw ork,Jilin Normal Un i versity,S ipi ng136000,China;2.Surveying Bureau of Hydrology and Water Resources of Jilin Province,Changchun130000,China)Abstract:T hrough the analysis and research on basic architecture and work pr inciples o f the High-Availabilit y Cluster System based on L inux,to create easily-extended,hig hly available,and easily-maintain-and-manage computer system w ith hig h per formance and price ratio.Key words:L inux,the hig h availability cluster system,ar chitecture,principles∀116∀。