冗余与双机热备图文稿
第22章 冗余系统

第二十二章冗余系统组态王提供全面的冗余功能,能够有效地减少数据丢失的可能,增加了系统的可靠性,方便了系统维护。
组态王提供三重意义上的冗余功能,即双设备冗余、双机热备和双网络冗余。
本章将分三节分别详细讲述这三种冗余方式的特点和实现方法。
22.1 双设备冗余22.1.1双设备冗余概述双设备冗余,是指设备对设备的冗余,即两台相同的设备之间的相互冗余。
对于用户比较重要的数据采集系统,用户可以用两个完全一样的设备同时采集数据,并及组态王通讯。
系统结构示意如图22.1:主设备从设备图22.1 双设备冗余示意图正常情况下,主设备及从设备同时采集数据,但组态王只及主设备通讯,若主设备通讯出现故障,组态王将自动断开及主设备的连接,及从设备建立连接,从设备由热备状态转入运行状态,组态王从从设备中采集数据。
此后,组态王一边及从设备通讯,一边监视主设备的状态,当主设备恢复正常后,组态王自动停止及从设备的通讯,及主设备建立连接,进行通讯,从设备又处于热备状态。
这样就要求从设备及主设备应完全一样,即两台设备要完全处于热备状态。
而且组态王中在定义该设备的IO变量时,只能定义变量及主设备建立连接,而从设备无需定义变量,完全是对主设备的冗余。
22.1.2双设备冗余的功能具体地说双设备冗余主要是实现数据的不间断采集。
由于采用了设备冗余,因此一旦主设备通讯出现中断,从设备可以迅速将采集到的数据传给主设备继续及组态王进行通讯,从而保持数据的完整性。
22.1.3 双设备冗余的设置22.1.3.1 双设备冗余设置的步骤双设备冗余定义的步骤大致为:◆从设备定义◆主设备定义变量定义(主设备)双设备冗余设置一般先定义从设备,然后再定义主设备,定义主设备时可将已定义的设备定义为从设备。
也可以同时将两个设备都定义,然后再指定住、从设备。
22.1.3.2 从设备定义从设备的设置及一般的I/O设备设置方法相同,工程人员根据设备配置向导就可以完成从设备的配置,具体设置方法请参见“第六章 IO设备管理”。
双机热备

双机热备图1:双机热备双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备,双机高可用按工作中的切换方式分为:主-备方式(Active-Standby方式)和双主机方式(Active-Active方式),主-备方式即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。
而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。
组成双机热备的方案主要的三种方式基于共享存储(磁盘阵列)的方式共享存储方式主要通过磁盘阵列提供切换后,对数据完整性和连续性的保障。
用户数据一般会放在磁盘阵列上,当主机宕机后,备机继续从磁盘阵列上取得原有数据。
如下图所示:图2:传统的单存储方式这种方式因为使用一台存储设备,往往被业内人士称为磁盘单点故障。
但一般来讲存储的安全性较高。
所以如果忽略存储设备故障的情况下,这种方式也是业内采用最多的热备方式。
全冗余(双机双存储)方式基于单台存储的传统双机热备方式,确实存在存储单点故障的情况,为实现存储冗余,存储高可用也已经越来越多的被用户接受。
我们从理解上可以看出,双机热备最早是为解决服务器的计划性停机与非计划性宕机的解决方案,但是我们无法实现存储的计划性停机与非计划性宕机带来的服务器停机,而存储作为双机热备中唯一存储数据的设备,它一旦发生故障往往会造成双机热备系统全面崩溃。
随着科技的进步,云存储,云计算发展,对于存储热备已经进入了成熟及快速发展阶段,双机热备也随着技术的进步,进入到了没有单点故障的全冗余双机热备方式。
如图:图3:存储热备方式这种方式的特点在于:1、存储之间的数据复制不经过网络,而是由存储之间进行复制。
2、两个存储之间的复制是完全实时的,不存在任何时间延时。
3、主备存储之间的切换时间小于500ms,以确保系统存储时不产生延时。
windows双机热备文档

目录结构目录结构 (1)一、群集介绍 (2)二、群集专业术语 (2)三、环境介绍及要求 (3)1、网络拓扑结构 (3)2、软件配置说明 (3)3、硬件配置要求 (4)四、安装群集前的准备工作 (5)1、创建共享磁盘 (5)2、网络及系统配置 (9)五、安装群集服务 (20)1、在A 节点上新建一个群集 (20)2、将B 节点加入现有群集 (26)六、配置群集服务 (31)1、群集网络配置 (31)2、心跳适配器优先化 (33)3、仲裁磁盘配置 (34)4、测试群集安装 (34)七、故障转移测试 (37)1、初级测试 (37)2、高级测试 (38)一、群集介绍服务器群集是一组协同工作并运行Microsoft 群集服务(Microsoft Cluster Service,MSCS)的独立服务器。
它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。
它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。
如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。
(说明:本文档编写的目的是为了帮助大家实现所关心的如何在VMWare Workstation 中完成,典型群集的配置步骤,不会具体的涉及到如何安装群集应用程序)二、群集专业术语节点: 构建群集的物理计算机群集服务: 运行群集管理器或运行群集必须启动的服务资源: IP 地址、磁盘、服务器应用程序等都可以叫做资源共享磁盘: 群集节点之间通过光纤SCSI 电缆等共同连接的磁盘柜或存储仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志资源状态: 主要指资源目前是处于联机状态还是脱机状态资源依赖: 资源之间的依存关系组: 故障转移的最小单位虚拟服务器: 提供一组服务--如数据库文件和打印共享等故障转移: 应用从宕机的节点切换到正常联机的节点故障回复: 某节点从宕机状态转为联机状态后,仍然继续宕机前的工作,为其他节点分流三、环境介绍及要求1、网络拓扑结构2、软件配置说明(1) 域控服务器(DC)软件配置信息OS:Windows Server 2003 X86 SP1 中文企业版Role: Active Directory 域控制器Domain:ServerName:IP:192.168.0.124Netmask:255.255.255.0Gateway:192.168.0.124(2) TurboMail邮件服务器 A 软件配置信息OS: Windows Server 2003 X86 SP1 中文企业版Role: Member ServerServerName:IP1:192.168.0.1Netmask1:255.255.255.0Gateway1:192.168.0.124Dns1:192.168.0.124IP2:10.1.1.15Netmask2:255.0.0.0Gateway2:NoneDNS2:None(3) TurboMail邮件服务器B 软件配置信息OS: Windows Server 2003 X86 SP1 中文企业版Role: Member ServerServerName:IP1:192.168.0.2Netmask1:255.255.255.0Gateway1:192.168.0.124Dns1:192.168.0.254IP2:10.1.1.16Netmask2:255.0.0.0Gateway2:NoneDNS2:None3、硬件配置要求(1) 网卡1) 群集中的每个节点需要有两个网卡。
最新服务器双机热备解决方案样本

最新服务器双机热备解决方案12020年4月19日服务器双机热备解决方案前言数据信息是当今社会进步、发展的关键。
面对日益庞大的计算机网络,用户的要求是网络能够可靠、高速、稳定地运行。
当前大部分网络服务都是采用中心服务器的模式(只有一台服务器),服务器的高可靠性、高可用性是网络安全运行的关键,一旦服务器出现故障,所提供的服务就会被中断,影响正常工作,并可能丢失关键数据,从而造成严重后果。
无论对企业的有形和无形资产都带来不必要的损失。
如何在故障情况下尽快恢复使用并保证数据的安全,已经成为一个日渐突出的问题。
服务器双机热备份技术正是解决由软硬件故障引起可靠性降低的有效措施,该技术较为成熟,成本相对较低,具有安装维护简单、稳定可靠、监测直观等优点,在网络保障中获得了广泛的应用。
一、双机热备阐述什么是双机热备?所谓双机热备份,概况地说,就是用网络两台服务器连接起来,平时互相备份,共同执行同一服务。
当一台服务器停机时,能够由双机中的另一台服务器自动将停机服务器的业务接管,从而在不需要人工干预的情况下,保证系统能持续提供服务。
什么时候需要双机热备呢?一般服务器要长年累月(7 X 24 小时)不间断工作,其备份工作就绝对少不了。
因此,决定是否使用双机热备,应首先对系统的重要性,以及终端用户对服务中断的容忍程度进行考虑,然后再来决定是否使用双机热备。
比如网络中的用户最多能容忍多- 1 -2020年4月19日长时间恢复服务?如果服务不能很快恢复会造成什么样的后果等等。
二、双机热备拓扑图以及工作原理- 2 -2020年4月19日双机热备工作示意图三、双机热备方案介绍在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是经过磁盘阵列集中管理和数据备份的。
数据的集中管理是经过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。
RoseMirrorHA镜像服务器双机热备解决方案报告书和具体配置

RoseMirrorHA镜像服务器双机热备解决方案及具体配置一、双机热备拓扑图以及工作原理双机热备工作示意图二、双机热备方案介绍在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。
数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。
用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。
所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。
一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件RoseHA)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。
双机备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即双机热备模式、双机互备模式和双机双工模式。
下面分别予以简单介绍:∙双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。
当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。
这是目前最理想的一种模式。
∙双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。
服务器配置相对要好。
∙双机双工模式: 是目前Cluster(集群)的一种形式,两台服务器均为活动状态,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份。
铁路行车调度集中系统功能和原理—双机热备

举例
命令没有执行成功,仅作提示作用,系统不必 处理。
单网通信断,仅作报警,不必倒机,因分散自 律调度集中系统设计为双网,单网通信断并不 影响使用。
区间轨道区段采集某硬件故障,在邻机没有故 障时可倒机。
双网通信断,在邻机无故障或轻故障时倒机, 因双网断已经影响使用,必须倒机。
程序跑飞、逻辑混乱或出现安全问题,此时, 即使是单机也要停机(重启)。
基本倒机原则
2 同一应用双机之间的倒机
●一种是主机主动通知备机升级为主机 ●一种是顺序
• CTC系统的倒机顺序是按照 影响面较小的部位或者相对 次要的设备先倒机的原则。
车站自律机与联锁操表机主机
● 如:车站自律机主机与联锁操表机主机之间 通信断的情况,车站自律机先倒机,车站自 律机倒机后没有解决问题的,联锁操表机进 行倒机。
应用服务器与某接口服务器
● 如:CTC中心的应用服务器主机与某接口服 务器主机之间双网通信中断时,某接口服务 器要先倒机,只有接口服务器倒机后还没有 解决问题的情况下,才进行应用服务器的倒 机。
双机热备冗余模式
双机热备的工作原理
双机之间只有主机在工作,主机与客户 机交换信息、进行控制等,备机所完成 的任务就是保持与主机同步。一旦主机 故障或由于维修等原因退出,使主机不 再工作,备机便升为主机继续工作,而 不影响整个系统
严重程度
故障情况下,可能会使双机热备的机器工作状态发生变化,即发生倒机。
双机热备冗余模式
基本倒机原则
1 双网连接下和单网连接下的倒机
应用1的 A机
应用1的 B机
应用1的 A机
应用1的 B机
应用2的 A机
应用2的 B机
双网连接的双机应用示意图
UPS多机冗余

UPS多机冗余随着Internet网络、电子商务、IDC机房的飞速发展,用户对UPS供电系统的可用性提出了更高的要求,已经到了要求可用性为99.999%的程度,也即1年365天中,UPS供电系统的断电时间不能超过5分钟。
但是,如果从UPS单机的角度来看,无论其技术如何发展,仍然摆脱不了容量和可靠性的限制。
那么,我们在保护原有投资的情况下,如何实现UPS系统可靠性的提高呢?随着技术设备的日益增多和网络技术的普遍采用,为更好地满足用户对UPS的容量和可靠性的更高要求,在单机的基础上,可以用组合也就是冗余连接的方法来实现UPS容量和可靠性的提高。
UPS的冗余连接有两种方式:热备份连接和并联连接。
热备份连接热备份的目的:确保负载设备不会在市电停电时因主机保障而断电,保证计算机等负载设备数据不会丢失。
热备份要解决的关键问题:旁路开关的切换要有严密的电路控制,保证不会在切换时有任何断电情况发生。
热备份连接是指当单台UPS不能保证满足用户提出的可靠性要求时,就可以再接一台同规格的单机来提高可靠性。
任何具有旁路(Bypass)环节的UPS都可以进行热备份连接,两台单机的连接方法如图1所示。
图1 两台UPS热备份连接图这种连接非常简单,当把UPS1作为主输出电源而把UPS2作为备用机时,只需将备用机UPS2的输出与UPS1的旁路Bypass1输入端相连就可以了,不过此时UPS1的旁路Bypass1输入端一定要与UPS1的输入端断开。
在正常情况下,由UPS1向负载供电,而UPS2处于热备份状态空载运行;当UPS1故障时,UPS2投入运行接替UPS1继续向负载供电。
只有当UPS2由于过载或逆变器故障时,才闭合旁路开关Bypass2,负载改由市电供电。
两台热备分连接的UPS系统可靠性比单台UPS的可靠性提高了两个数量级,并且,这种系统的连接方式简单易行,即使是不同品牌的机器,只要规格容量相同,就可连接,不需再增加另外的设备。
核心交换机双机热备解决方案

核心交换机双机热备解决方案一、项目背景稳定持续的系网络系统运行变得越来越重要,而原来有单机核心三层交换数据潜 伏巨大的崩溃风险。
VRRP (虚拟路由冗余协议)技术来解决该问题,以实现主、备核心三层交换设 备之间动态、无停顿的热切换。
二、方案设计:2.1、 简要介绍VRRP 的基本概念。
通常情况下,内部网络中的所有主机都设置一条相同的缺省路由,指向出口网关 (即图1中的交换机S9300A ),实现主机与外部网络的通信。
当出口网关发生 故障时,主机与外部网络的通信就会中断。
图1局域网缺省网关Gateway: 10,0.0.1 IP Address:10,0.0.4/24 4Ethernet 配置多个出口网关是提高系统可靠性的常见方法,但需要解决如何在多个出口网 关之间进行选路的问题。
VRRP (Virtual Router Redundancy Protocol )是 RFC3768 定义的一种容错协议, 通过物理设备和逻辑设备的分离,实现在多个出口网关之间选路,很好地解决了 上述问题。
在具有多播或广播能力的局域网(如以太网)中,VRRP 提供逻辑网关确保高利 用度的传输链路,不仅能够解决因某网关设备故障带来的业务中断,而且无需修 改路由协议的配置。
2.2、 V RRP 工作原理:S93OOAGateway: 10.0.0.1IP Address:10,0.0.2/24Gateway: 10,0.0.1 IP Address;10.0.0.3/2410.0.0.1/24vrrp只定义了一种报文—- vrrp报文,这是一种组播报文,由主三层交换机定时发出来通告他的存在。
使用这些报文可以检测虚拟三层交换机各种参数,还可以用于主三层交换机的选举。
VRRP中定义了三种状态模型,初始状态Initialize,活动状态Master 和备份状态Backup,其中只有活动状态的交换机可以为到虚拟IP地址的的转发请求提供服务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
冗余与双机热备
集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)
冗余与双机热备
冗余:
指重复配置系统的一些部件,当系统发生故障时,冗余配置的部件介入并
承担故障部件的工作,由此减少系统的故障时间 Redundan,自动备援,即
当某一设备发生损坏时,它可以自动作为后备式设备替代该设备。
冗余系统配件主要有:
电源:高端服务器产品中普遍采用双电源系统,这两个电源是负载均衡的,即在系统工作时它们都为系统提供电力,当一个电源出现故障时,另一个
电源就承担所有的负载。
有些服务器系统实现了DC的冗余,另一些服务
器产品如 Micron公司的NetFRAME 9000实现了AC、DC的全冗余。
存储子系统:存储子系统是整个服务器系统中最容易发生故障的地方。
以下几种方法可以实现该子系统的冗余。
磁盘镜像:将相同的数据分别写
入两个磁盘中。
磁盘双联:为镜像磁盘增加了一个I/O控制器,就形成了磁盘双联,使总线争用情况得到改善; RAID:廉价冗余磁盘阵列(Redundant array of inexpensive disks)的缩写。
顾名思义,它由几个磁盘组成,通过一个控制器协调运动机制使单个数据流依次写入这几个磁盘中。
RAID3系统由5个磁盘构成,其中4 个磁盘存储数据,1个磁盘存储校验信息。
如果一个磁盘发生故障,可以在线更换故障盘,并通过另3
个磁盘和校验盘重新创建新盘上的数据。
RAID5将校验信息分布在5个磁盘上,这样可更换任一磁盘,其余与RAID3相同。
I/O卡:对服务器来说,主要指网卡和硬盘控制卡的冗余。
网卡冗余是在服务器中插上双网卡。
冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所拥有。
PC服务器如 Micron公司的NetFRAME9200最多实现4个网卡的冗余,这4个网卡各承担25%的网络流量。
康柏公司的所有 ProSignia/Proliant服务器都具有容错冗余双网卡。
PCI总线:代表Micron公司最高技术水平的产品NetFRAME 9200采用三重对等PCI技术,优化PCI总线的带宽,提升硬盘、网卡等高速设备的数据传输速度。
CPU:系统中主处理器并不会经常出现故障,但对称多处理器(SMP)能让多个CPU分担工作以提供某种程度的容错。
双机热备:
所谓双机热备就是使用互为备份的两台服务器共同执行同一服务,其中一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server)。
在系统正常情况下,工作机为应用系统提供服务,备份机监视工作机的运行情况(工作机同时也在检测备份机是否正常),当工作机出现异常,不能支持应用系统运营时,备份机主动接管工作机的工作,继续支持关键应用服务,保证系统不间断的运行。
什么情况下需要采用双机热备
用户可以根据系统的重要性以及终端用户对服务中断的容忍程度决定是否使用双机热备。
比如网络中的用户最多能容忍多长时间恢复服务?如果服务不能很快恢复会造成什么样的后果等。
对于承担企业关键业务应用的服务器需要极高的稳定性和可用性,需要7×24不间断服务,推荐使用双机热备。
我已经有了RAID,以及磁带备份,还有必要做双机吗或者,如果我做了双机备份,还有必要做磁带备份吗 RAID和数据备份都是很重要的。
但RAID技术只能解决硬盘的问题,备份只能解决系统出现问题后的恢复。
而一旦服务器本身出现问题,不论是设备的硬件问题还是软件系统的问题,都会造成服务的中断。
因此,RAID及数据备份技术不能避免服务中断出现,对于需要持续可靠地提供应用服务的系统,双机还是非常必要的。
数据备份是保障数据安全性的必不可少的措施。
因为不论RAID还是双机,都是一种实时的备份。
任何软件错误、病毒影响、误操作等等,都会同步地在多份数据中发生影响。
因此,对于关键业务即使采用了双机方案也还是一定要进行数据的备份,以便能在数据损坏、丢失时进行恢复。
如何选择与实施双机热备的配置方案
1. 以应用为主导,以高可用性为宗旨,分析需求的必要性;
2. 选择确定具体的设备、软件的型号等。
需要注意的是: 不同的软件或是硬盘等存储设备,他们之间存在兼容性的问题,因此在购买之前应咨询专业人员,避免出现采购了双机软件后对相关的存储设备存在不兼容等现象。
3.在实施完成后,一定要进行测试,以确保工作正常,而且应注意在运行过程中定期的对系统是否能够正常切换进行测试。