集群HA负载均衡技术
HAProxy负载均衡原理及企业级实例部署haproxy集群

HAProxy负载均衡原理及企业级实例部署haproxy集群⼀ HAProxy简介HAProxy是⼀种⾼效、可靠、免费的⾼可⽤及负载均衡解决⽅案,⾮常适合于⾼负载站点的七层数据请求。
客户端通过HAProxy代理服务器获得站点页⾯,⽽代理服务器收到客户请求后根据负载均衡的规则将请求数据转发给后端真实服务器。
同⼀客户端访问服务器,HAProxy保持回话的三种⽅案:1 HAProxy将客户端ip进⾏Hash计算并保存,由此确保相同IP访问时被转发到同⼀真实服务器上。
2 HAProxy依靠真实服务器发送给客户端的cookie信息进⾏回话保持。
3 HAProxy保存真实服务器的session及服务器标识,实现会话保持功能。
haproxy拓扑结构图⼆配置⽂件解析Haproxy安装后默认没有配置⽂件,需要⼿动创建/etc/haproxy.cfg。
启动haproxy时⽤-f指定配置⽂件路径。
haproxy的配置⽂件包含全局设置段与代理段,global是全局段,defaults、listen、frontend、backend为代理段。
frontend⽤来匹配客户端请求的域名或者URL;backend 定义后端服务器集群haproxy配置⽂件参数详细解析配置项描述global chroot<jail dir>将⼯作⽬录切换到<jail dir>并执⾏chrootdaemon后台⼯作模式uid进程账户id,建议设置为haproxy专⽤账户gid进程组id,建议设置为haproxy专⽤组log<address><facility>配置全局syslog,可以设置两台⽇志服务器nbproc<number>指定后台进程数量pidfile<file>指定pid⽂件ulimit-n<number>设置每个进程最⼤⽂件描述符数量maxconn<number>每个进程⽀持的最⼤并发数tune.bufsize<number>设置buffer⼤⼩,默认16384Bmode可选tcp、http、healthtimeout check<timeout>设置检查超时时间contimeout<timeout>设置连接超时时间balance roundrobin设置轮询负载bind<address>:port定义⼀个或者多个监听地址和端⼝stats auth admin:admin设置监控界⾯的⽤户名和密码stats refresh<number>统计页⾯刷新间隔时间option httplog使⽤http⽇志cookie<name>启⽤cookie的保持连接功能option forwardfor允许插⼊这种数据包头,可以让后端服务器获取客户端ip option abortonclose负载⾼时,⾃动关闭处理时间长的请求option allbackups后端服务器宕机,是否激活全部备机,默认启动第⼀个备机option dontlognull不记录空连接⽇志,主要⽤于不记录健康检查⽇志代理设置option redispatch后端某个机器宕机,强制把请求转发给健康机器monitor-uri<URi>检查uri⽂件是否存在,依次判断主机的健康状态monitor-fail if site_dead服务器宕机时,返回503代码option httpchk<uri>使⽤http协议检查服务器健康状态retries<value>服务器连接失败后的重试次数timeout client客户端最⼤超时时间,单位毫秒timeout server服务器最⼤超时时间,单位毫秒timeout connect最⼤连接超时时间,单位毫秒default_backend默认后端服务器组use_backend当条件满⾜时,指定后端服务器组acl<name><criterion>定义访问控制列表三 Haproxy实例部署本例使⽤listen定义⼀个监控端⼝;使⽤frontend定义⼀个前端80端⼝;通过backend定义名为inside_servers 和 external_servers的服务器组;使⽤default_backend定义默认服务器组external_servers;external_servers包括和 两台服务器inside_servers包含 ⼀台服务器服务器名称⽹络配置 eth0:10.10.10.10eth1:192.168.1.2 eth0:192.168.1.3 eth0:192.168.1.4 eth0:192.168.1.51 ⾸先配置web服务器在web1 web2 web3上安装httpd并配置⽹卡vim /etc/sysconfig/network-scripts/ifcfg-eth0DEVICE=eth0BOOTPROTO=staticIPADDR=192.168.1.3NETMASK=255.255.255.0GATEWAY=192.168.1.2ONBOOT=yesTYPE=Ethernetservice network restartyum install -y httpdiptables -Fiptables -Xservice iptables savesetenforce 0sed -i s/enforcing/disabled/g /etc/sysconfig/selinuxecho "web1 192.168.1.3" > /var/www/html/index.html service httpd restartchkconfig httpd onweb2 web3机器上执⾏与web1相同步骤,注意修改部分参数2 接着haproxy服务器配置设置两块⽹卡vim /etc/sysconfig/network-scripts/ifcfg-eth0DEVICE=eth0BOOTPROTO=staticIPADDR=10.10.10.10NETMASK=255.0.0.0ONBOOT=yesTYPE=Ethernetvim /etc/sysconfig/network-scripts/ifcfg-eth1DEVICE=eth1BOOTPROTO=staticIPADDR=192.168.1.2NETMASK=255.255.255.0GATEWAY=192.168.1.1ONBOOT=yesTYPE=Ethernetservice network restartservice iptables stop内核调优,修改系统⽂件vim /etc/security/limits.conf* soft nofile 65535* hard nofile 65535配置⽇志⽂件,添加三⾏vim /etc/rsyslog.conf$ModLoad imudp $UDPServerRun 514local3.* /var/log/haproxy.logyum -y install gcctar zxf haproxy-1.6.11.tar.gz -C /usr/src/ cd /usr/src/haproxy-1.6.11/make TARGET=linux2628make installmkdir /var/haproxy3 创建配置⽂件vim /etc/haproxy.cfgglobalmaxconn 4096log 127.0.0.1 local3 infochroot /var/haproxyuid 99gid 99daemonnbproc 1pidfile /var/run/haproxy.pidulimit-n 65535stats socket /var/tmp/statsdefaultslog globalmode httpmaxconn 20480option httplogoption httpcloseoption dontlognulloption forwardforoption redispatchoption abortonclosestats refresh 30retries 3balance roundrobincookie SRVtimeout check 2000mstimeout connect 5000mstimeout server 50000mstimeout client 50000mslisten admin_status #定义haproxy的监控界⾯bind 0.0.0.0:6553mode httplog 127.0.0.1 local3 infostats enablestats refresh 5s #监控页⾯⾃动刷新时间5sstats realm Haproxy\ Statistics #登录监控页⾯提⽰符stats uri /admin?stats #监控页⾯URL路径stats auth admin:123456 #监控页⾯的账户密码stats hide-version #隐藏haproxy版本frontend web_service #定义前端服务器bind 0.0.0.0:80mode httplog globaloption httplogoption httpcloseoption forwardfor#acl inside_src src 192.168.1.0/24 #定义acl#use_backend inside_servers if inside_src #判断acl的源地址,把请求转发到inside_servers组default_backend external_servers #默认服务器组backend external_serversmode httpbalance roundrobin #轮询真实服务器option httpchk GET /index.html #检查index⽂件,判断服务器是否健康##定义后端真实服务器,向cookie中插⼊web1信息,check进⾏健康检查,检查时间间隔为2000ms,##连续两次健康则认为是正常开启的,连续三次检查失败则认为宕机,服务器权重1server web1 192.168.1.3:80 cookie web1 check inter 2000 rise 2 fall 3 weight 1server web2 192.168.1.4:80 cookie web2 check inter 2000 rise 2 fall 3 weight 1#backend inside_servers#mode http#balance roundrobin #轮询真实服务器#option httpchk GET /index.html #检查index⽂件,判断服务器是否健康#server web3 192.168.1.5:80 cookie web3 check inter 2000 rise 2 fall 3 weight 14 启动haproxy服务service rsyslog restart #重启系统⽇志服务haproxy -f /etc/haproxy.cfg #启动haproxy服务echo "/usr/local/sbin/haproxy -f /etc/haproxy.cfg" >> /etc/rc.local5 测试验证浏览器访问监控页⾯多次刷新访问将得到web1和web2 不同页⾯信息。
服务器集群与负载均衡-推荐优秀PPT

集群系统
二、集群技术的目的
3 提高可扩展性 用户若想扩展系统能力,不得不购买更高性能的服务器,才能获得额外 所需的CPU 和存储器。如果采用集群技术,则只需要将新的服务器加入 集群中即可,对于客户来看,服务无论从连续性还是性能上都几乎没有 变化,好像系统在不知不觉中完成了升级。 4 增强可靠性 集群技术使系统在故障发生时仍可以继续工作,将系统停运时间减到最 小。集群系统在提高系统的可靠性的同时,也大大减小了故障损失。
集群系统
三、集群系统的分类
硬件设备更稳定 2. HAProxy运行的硬件上,完全可以支持数以万计的并发连接, 同时可以保护你的web服务器不被暴露到网络上。
如果采用1集、群高技性术,能则计只算需要集将群新的(H服P务C 器C加lu入s集te群r中) 即可,对于客户来看,服务无论从连续性还是性能上都几乎没有变化,好像系
越来越高,服务器的负载也就越来越高。
——1H)AP升ro级xy提网供络高可服用务性器、负,载采均衡用以更及快基于的TCCPP和UH,TTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。 增加更多的内存,使其具有更强的性能;
但日益增长的服务请求又会使服务器再
次过载,需要再次升级,这样就陷入了
软件负载均 衡技术是指在服务器集群中的代理服务器上安装一个相应的负载均衡软件来实现的一种负载均衡技术。
1)基础防2、火墙高功可能用——性数集据群包过(H滤A Clu2s)t资er源)隐藏和内容安全
该技术通过对服务器进行性能优化,使流量能够平均分配在服务器群中的各个服务器上,其能有效地解决数据流量过大、网络负荷过 重的问题,并且不需花费昂贵开支购置性能卓越的服务器,充分利用现有设备,避免服务器单点故障造成数据流量的损失。
HA的应用和原理

HA的应用和原理1. 什么是HAHA(High Availability),即高可用性,是指系统或应用在任何时候都能保持可靠的运行,不会因为单点故障而导致系统的停机或服务的中断。
HA的目的是确保系统的连续性和可靠性,提高系统的稳定性和可用性。
2. HA的应用场景HA的应用广泛,特别适用于对系统可用性要求较高的领域,如电子商务、金融、医疗等。
以下是一些常见的HA应用场景:•数据库HA:通过使用数据库HA方案,确保数据库的高可用性,当主数据库故障时能够自动切换到备用数据库。
常见的数据库HA方案包括主备复制、数据库集群、数据同步等。
•Web服务HA:通过使用负载均衡器、集群等技术,将用户的请求分发到多个服务器上,当某个服务器出现故障时,能够自动切换到其他正常运行的服务器,保证服务的正常运行。
•应用程序HA:将应用程序部署在多台服务器上,并通过负载均衡器等方式进行负载均衡,确保应用程序的高可用性。
当某台服务器故障时,能够自动切换到其他正常运行的服务器上。
3. HA的原理HA的实现原理多种多样,不同的应用场景和需求会采用不同的HA方案。
下面介绍一些常见的HA原理:•主备复制:在数据库HA中较为常见的一种方案。
主数据库将数据实时复制到备份数据库,当主数据库故障时,备份数据库会自动接管工作,成为新的主数据库,保证了数据的连续性。
•数据同步:类似于主备复制,但是不同的是,在数据同步方式中,多个数据库实例之间是相互同步的,数据的修改会同时反映到其他数据库实例中,当其中一个数据库出现故障时,其他数据库可以继续提供服务。
•负载均衡:通过将用户请求分发到多个服务器上,实现负载均衡,平衡服务器之间的压力,当某个服务器出现故障时,请求会自动切换到其他正常运行的服务器上,保证服务的可用性。
•故障检测与恢复:通过定期检测服务器或服务的可用性,当检测到故障时,会自动触发故障恢复机制,进行故障切换或故障修复,保证系统的正常运行。
4. HA的优势HA的应用能够带来许多优势,以下列举一些常见的优势:•提高可用性:通过使用HA方案,能够减少系统或服务的停机时间,提高系统的可用性,确保系统的连续运行。
HA和集群的概念

1.1 什么是集群简单的说集群cluster就是一组计算机它们作为一个整体向用户提供一组网络资源。
这些单个的计算机系统就是集群的节点node。
一个理想的集群是用户从来不会意识到集群系统底层的节点在他/她们看来集群是一个系统而非多个计算机系统。
并且集群系统的管理员可以随意增加和删改集群系统的节点。
1.2 集群系统的主要优点1高可扩展性2高可用性HA集群中的一个节点失效它的任务可传递给其他节点。
可以有效防止单点失效。
3高性能负载平衡集群允许系统同时接入更多的用户。
4高性价比可以采用廉价的符合工业标准的硬件构造高性能的系统。
2.1 集群系统的分类虽然根据集群系统的不同特征可以有多种分类方法但是一般把集群系统分为两类1、高可用High Availability集群简称HA集群。
这类集群致力于提供高度可靠的服务。
就是利用集群系统的容错性对外提供724小时不间断的服务如高可用的文件服务器、数据库服务等关键应用。
负载均衡集群使任务可以在集群中尽可能平均地分摊不同的计算机进行处理充分利用集群的处理能力提高对任务的处理效率。
在实际应用中这几种集群类型可能会混合使用以提供更加高效稳定的服务。
如在一个使用的网络流量负载均衡集群中就会包含高可用的网络文件系统、高可用的网络服务。
2、性能计算High Perfermance Computing集群简称HPC集群也称为科学计算集群。
在这种集群上运行的是专门开发的并行应用程序它可以把一个问题的数据分布到多台的计算机上利用这些计算机的共同资源来完成计算任务从而可以解决单机不能胜任的工作如问题规模太大单机计算速度太慢。
这类集群致力于提供单个计算机所不能提供的强大的计算能力。
如天气预报、石油勘探与油藏模拟、分子模拟、生物计算等。
3.1 什么是高可用性HA 计算机系统的可靠性用平均无故障时间MTTF来度量即计算机系统平均能够正常运行多长时间才发生一次故障。
系统的可靠性越高平均无故障时间越长。
负载均衡集群方案

负载均衡集群方案摘要:负载均衡集群方案是一种通过在多台服务器之间分配负载的技术,用于提高系统的可用性和性能。
本文将介绍负载均衡集群的概念和原理,并讨论一些常用的负载均衡集群方案,包括硬件负载均衡器和软件负载均衡器。
一、引言负载均衡是指将负载(如用户请求、网络流量等)分布到多个服务器上,以实现资源的合理分配,提高系统的可用性和性能。
负载均衡集群方案是负载均衡技术在集群环境中的应用,通过多台服务器的协同工作,提供高可用性和可伸缩性的服务。
二、负载均衡集群的原理负载均衡集群的原理基于以下几个关键概念:1. 服务器健康检查:负载均衡器周期性地检查集群中的服务器是否正常工作,如检查服务器的响应时间、负载情况等,根据检查结果将请求路由到不同的服务器。
2. 负载均衡算法:负载均衡器根据负载均衡算法,将请求均匀地分发给集群中的服务器,以实现负载均衡。
常用的负载均衡算法包括轮询、加权轮询、最少连接数等。
3. 会话保持:对于需要保持会话状态的应用(如购物车、登录状态等),负载均衡器可以使用会话保持机制,将同一个用户的请求路由到相同的服务器,以保证会话的一致性。
三、硬件负载均衡器硬件负载均衡器是一种将负载均衡功能集成在硬件设备中的解决方案。
硬件负载均衡器具有高性能、高可用性和可靠性的特点,常用于大规模的企业级应用。
1. 基于网络层的负载均衡器:网络层负载均衡器通过在传输层(如TCP/IP协议栈)上进行请求分发,将请求转发到不同的服务器。
常用的网络层负载均衡器有F5 BIG-IP、Cisco ACE等。
2. 基于数据链路层的负载均衡器:数据链路层负载均衡器通过在数据链路层(如以太网帧)上进行请求转发,将请求传递到不同的服务器。
常用的数据链路层负载均衡器有Brocade ServerIron、Cisco Catalyst等。
四、软件负载均衡器软件负载均衡器是一种通过软件实现负载均衡功能的解决方案。
相比硬件负载均衡器,软件负载均衡器具有灵活性和可定制性的优势,适用于中小型应用。
HA主备路由模式的原理+HA和负载均衡的区别

HA主备路由模式的原理+HA和负载均衡的区别HA主备路由模式的原理HA是High Availability缩写,即⾼可⽤性,可防⽌⽹络中由于单个防⽕墙的设备故障或⽹络故障导致⽹络中断,保证⽹络服务的连续性和安全强度。
⽬前,ha功能已经是防⽕墙内⼀个重要组成部分。
主备模式(Active-standby):在⼀个冗余组中,有两台防⽕墙,⼀台处于主状态。
在这个状态下,防⽕墙响应ARP请求,并且转发⽹络流量;另⼀台处于备份状态,该防⽕墙不响应ARP请求,也不转发⽹络流量。
主备之间同步状态信息,当主墙down机或⽹线故障时,进⾏主备切换。
主主模式(Active-active):在⼀个冗余组中,有两台防⽕墙,两台都处于主状态。
两台防⽕墙都响应ARP请求,并且转发⽹络流量;主主之间同步状态信息,当⼀主墙down机或⽹线故障时,进⾏切换,由另⼀主墙转发⽹络流量。
提⾼了数据包处理的吞吐量,平衡了⽹络负载,优化了⽹络性能。
NGFW的HA功能只⽀持两台设备。
在nat/路由模式和桥接模式下⽀持主主和主备两种⼯作模式。
HA功能要求两台设备的型号相同、组⽹⽅式相同、软件版本⼀致。
在以上条件不⼀致的情况下,HA功能有可能失效。
两台HA设备之间同步信息和通讯信息采⽤专⽤的以太⽹⼝,称为HA接⼝。
HA接⼝连接⽅式为直连。
为了维护HA状态的正确性和报⽂同步,必须妥善维护接⼝的连接。
HA接⼝的任何中断都可能导致不可预测的后果:⽐如两台设备可能同时⼯作状态(处于主备⼯作状态时),若重新连接之后,两台设备重新开始HA启动过程。
HA和负载均衡的区别⼀般所讲的HA基本都是采⽤主备模式⼯作,其中⼀台⼯作,另外⼀台是备⽤设备,只有主设备出现故障或⼈为切换,另外⼀台备⽤设备才会⼯作,当然HA也有双主的部署⽅式。
负载均衡可以说是把两台或多台设备做到同时对外提供服务,在所有设备都⼯作的时候,且是互为备份的状态,达到设备利⽤率最优的状态。
相关:。
ha模式的工作原理

ha模式的工作原理在计算机系统中,高可用性(HA)模式是一种非常重要的容错机制,它能够确保系统的连续运行和数据的安全。
本篇文章将详细介绍ha模式的工作原理,包括其基本概念、硬件要求、软件要求、工作流程以及常见问题和解决方案。
一、基本概念高可用性模式(HA,High Availability)是指通过各种技术和管理手段,使得一个或多个服务能够在不间断的情况下运行,从而保障系统的稳定性和可靠性。
该模式主要包括硬件故障自动切换、软件容错、负载均衡等技术,以提高系统的可用性和性能。
二、硬件要求要实现ha模式,硬件要求主要包括以下方面:1. 服务器:至少两台服务器,用于运行相同的操作系统和应用服务。
2. 网络设备:交换机、路由器等网络设备,用于连接服务器和客户端。
3. 备份设备:备用硬盘、磁带等存储设备,用于数据备份和恢复。
三、软件要求实现ha模式需要选择合适的软件,以满足以下要求:1. 高可用性软件:如Heartbeat、Zookeeper等,用于监控和管理服务器集群。
2. 集群软件:如Pacemaker、Mongrel等,用于实现服务器之间的互斥、同步和故障自动切换。
3. 备份软件:如rsync、shadowcopy等,用于定期备份数据,确保数据安全。
四、工作流程ha模式的工作流程如下:1. 双机环境:两台服务器同时运行相同的操作系统和应用服务,相互备份。
2. 故障检测:高可用性软件会实时监测服务器的状态,一旦发现故障,会立即报警。
3. 自动切换:当一台服务器出现故障时,集群软件会自动将请求切换到另一台正常运行的服务器上,确保服务不间断。
同时,备份设备上的数据会进行同步更新,以便在需要时进行恢复。
4. 数据备份:使用备份软件定期备份数据,确保数据安全,防止数据丢失或损坏。
5. 配置管理:对所有服务器进行统一的配置管理,确保所有服务器运行在相同的标准配置下,提高系统的稳定性和可靠性。
五、常见问题及解决方案在实现ha模式的过程中,可能会遇到一些常见问题,以下是一些解决方案:1. 网络延迟:当两台服务器之间的网络延迟较大时,会导致自动切换失败。
ha集群解决方案

ha集群解决方案
《ha集群解决方案》
随着互联网的不断发展,对于网站和应用程序的高可用性和可靠性要求越来越高。
因此,高可用(HA)集群解决方案成为
了企业和组织在搭建服务器和数据库系统时关注的重点之一。
HA集群解决方案是一种通过集群技术来实现高可用性和负载
均衡的系统架构。
它通过将多个服务器或节点连接在一起,实现资源共享和任务分配,从而提高系统的稳定性和性能,防止因单点故障而导致的服务中断。
在实际应用中,HA集群解决方案通常包括硬件和软件两个方面。
在硬件层面,可以通过使用具有冗余功能的服务器和网络设备来防止硬件故障对系统的影响。
而在软件层面,可以利用负载均衡器、故障转移和数据同步技术来实现高可用性。
对于企业来说,选择合适的HA集群解决方案需要考虑诸多因素,如成本、性能、可扩展性和易用性等。
常见的HA集群解决方案包括Linux-HA、Pacemaker、Keepalived等。
这些解决
方案不仅能够提供故障转移和负载均衡功能,还能够实现互备、冗余存储和数据同步,从而进一步提高系统的可用性和稳定性。
总的来说,HA集群解决方案在今天的互联网时代发挥着重要
作用,它不仅能够帮助企业提高网站和应用程序的可用性和可靠性,还能够降低因故障而造成的损失。
因此,企业和组织在
搭建服务器和数据库系统时,不妨考虑采用适合自身需求的HA集群解决方案,以提升系统的稳定性和性能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集群、双机、负载均衡、HA、HPC、NLB
1.1什么是集群
简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。
这些单个的计算机系统就是集群的节点(node)。
一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。
并且集群系统的管理员可以随意增加和删改集群系统的节点。
1.2 集群系统的主要优点:
(1)高可扩展性:
(2)高可用性HA:集群中的一个节点失效,它的任务可传递给其他节点。
可以有效防止单点失效。
(3)高性能:负载平衡集群允许系统同时接入更多的用户。
(4)高性价比:可以采用廉价的符合工业标准的硬件构造高性能的系统。
2.1 集群系统的分类
虽然,根据集群系统的不同特征可以有多种分类方法,但是一般把集群系统分为两类:
(1)、高可用(High Availability)集群,简称HA集群。
这类集群致力于提供高度可靠的服务。
就是利用集群系统的容错性对外提供7*24小时不间断的服务,如高可用的文件服务器、数据库服务等关键应用。
负载均衡集群:使任务可以在集群中尽可能平均地分摊不同的计算机进行处理,充分利用集群的处理能力,提高对任务的处理效率。
在实际应用中这几种集群类型可能会混合使用,以提供更加高效稳定的服务。
如在一个使用的网络流量负载均衡集群中,就会包含高可用的网络文件系统、高可用的网络服务。
(2)、性能计算(High Perfermance Computing)集群,简称HPC集群,也称为科学计算集群。
在这种集群上运行的是专门开发的并行应用程序,它可以把一个问题的
数据分布到多台的计算机上,利用这些计算机的共同资源来完成计算任务,从而可以解决单机不能胜任的工作(如问题规模太大,单机计算速度太慢)。
这类集群致力于提供单个计算机所不能提供的强大的计算能力。
如天气预报、石油勘探与油藏模拟、分子模拟、生物计算等。
3.1 什么是高可用性 (HA)
计算机系统的可用性(availability)是通过系统的可靠性(reliability)和可维护性(maintainability)来度量的。
工程上通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性。
于是可用性被定义为:MTTF/ (MTTF+MTTR)*100%
负载均衡服务器的高可用性
为了屏蔽负载均衡服务器的失效,需要建立一个备份机。
主服务器和备份机上都运行High Availability监控程序,通过传送诸如“I am alive”这样的信息来监控对方的运行状况。
当备份机不能在一定的时间内收到这样的信息时,它就接管主服务器的服务IP并继续提供服务;当备份管理器又从主管理器收到“I am alive”这样的信息是,它就释放服务IP地址,这样的主管理器就开开始再次进行集群管理的工作了。
为在主服务器失效的情况下系统能正常工作,我们在主、备份机之间实现负载集群系统配置信息的同步与备份,保持二者系统的基本一致。
HA的容错备援运作过程
自动侦测(Auto-Detect)阶段由主机上的软件通过冗余侦测线,经由复杂的监听程序。
逻辑判断,来相互侦测对方运行的情况,所检查的项目有:主机硬件(CPU和周边)、主机网络、主机操作系统、数据库引擎及其它应用程序、主机与磁盘阵列连线。
为确保侦测的正确性,而防止错误的判断,可设定安全侦测时间,包括侦测时间间隔,侦测次数以调整安全系数,并且由主机的冗余通信连线,将所汇集的讯息记录下来,以供维护参考。
自动切换(Auto-Switch)阶段某一主机如果确认对方故障,则正常主机除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程
序,并进行后续的程序及服务。
自动恢复(Auto-Recovery)阶段在正常主机代替故障主机工作后,故障主机可离线进行修复工作。
在故障主机修复后,透过冗余通讯线与原正常主机连线,自动切换回修复完成的主机上。
整个回复过程完成由EDI-HA自动完成,亦可依据预先配置,选择回复动作为半自动或不回复。
3.2、HA三种工作方式:
(1)、主从方式(非对称方式)
工作原理:主机工作,备机处于监控准备状况;当主机宕机时,备机接管主机的一切工作,待主机恢复正常后,按使用者的设定以自动或手动方式将服务切换到主机上运行,数据的一致性通过共享存储系统解决。
(2)、双机双工方式(互备互援)
工作原理:两台主机同时运行各自的服务工作且相互监测情况,当任一台主机宕机时,另一台主机立即接管它的一切工作,保证工作实时,应用服务系统的关键数据存放在共享存储系统中。
(3)、集群工作方式(多服务器互备方式)
工作原理:多台主机一起工作,各自运行一个或几个服务,各为服务定义一个或多个备用主机,当某个主机故障时,运行在其上的服务就可以被其它主机接管。