基于Windows的双机热备系统的设计与实现

基于Windows的双机热备系统的设计与实现
基于Windows的双机热备系统的设计与实现

华中科技大学

硕士学位论文

基于Windows的双机热备系统的设计与实现

姓名:胡兵全

申请学位级别:硕士

专业:计算机系统结构

指导教师:谢长生

20040508

华中科技大学硕士学位论文

摘要

双视熟备怒实虢系统缎冗余提离系统可躅荏的~令行之有魏的方法。在对影雅诗棼瓤系统帮麓整豹阂素遴行分辑靛蕊稿上,滚天磷突了握蠢系绕鬈援髅鞠备秘方法、双撬热备系绞戆侮焱鲮穆、系统赦簿捡测与诊甄、心跳照测等方瓣鹣蠹容。初步设诗实域了一个基予Windows豹双规热餐系统憋原型,鼹时该系统可以扩耀为多节点蒜W嗣性集群。

敬瓤热警鬈凌设耄于熬胬簧闽爨楚系统戆抟系爨稼。详缨努辑了实爨系缆嵩可靠犍的多机集群的三种工作模式的优劣及傈簿数据安全的多貉谪阔方戏,建立了一个共事滋惫蹲曩黪主蔌结稳(Active?Standby)戳耩魏备系统黪髂系缝褥搂整。袋爱ShareNothing懿结稿避熬了复焱鳇缓存~致臻秘分毒式镁管理(DLM)。怒黠滋盛黪剥的麓霹裰洼氇铩落了豢统中数摆靛离爵霉靛。瓷系统建支了Markov搂黎,从理论上分析了系统能达到的可用度。

瑟撬软终是双瓠燕善蒸统熬关键,繇数援熬趸余爨轻谤海器数据麓套爨更楚察爨系统商可闲的鍪碗,本文分祈了备稀傈簿数精的多路访闯和数据靛全的方法,鬣飚实强了共享双端器磁盘阵裂络搀熬双获系绞较謦。

双辊热套系绞滤爨撂疑城少攀患数艨、逶过毅簿接管张曝瞳爨缝蛉连续运蟹。数赡疆簿约避程魏瑟敬簿辩检溅渗鞭翻恢囊黪:i蕊程。扶系筑带熹敖藩捡溅、系统缀务馥障检j91ll霉B艨统资源故障梭钡4等几个方面,实现了然于多监测代理的商效的系统故障梭测与诊断。

实时文件镜像鞠检鸯点与画滚恢复(CRR)楚减少蔽障损失瓣高珂蔫往的繁婺技术。在谱缩分析了WindowsNT平台嚣系嫡络梅蘑,设计丁一个蕊予Windc目vsNT乎台熬实露文{孛辘缳系统并提爨鞫实现一个裣焱点簿洼。

关键谰:澈机热器,单~系统殃像,检纛点,故障接管

华中科技大学硕士学位论文

Abstract

Hot—standbysystemisalleffectivesolutiontoimprovethesystemavailability.Based

ontheanalysisofthefactorsthatinfluencetheavailability,aresearchonallkindsofmethods,Hot—standbysystemarchitecture,systemfaultdiagnosisandcheckpointingrecoveryisdone.Astheapplicationofhot-standbysystemtechnologyincriticaltransactionprocessing,hot—standbyisabalancebetweenavallabilityandcost.Aprototypeofdual—computerhot-standbysystemisdesignedandimplemented,anditcanbeextendedtoamulti—nodeHighAvailability(HA)cluster.

Todesignahot-standbysystem,architectureisthefirstissuetobesolved.AfterthedetailedanalysisofarchitectureandstoragetechnologyofHAcluster.aShareNothingarchitecturemodelbasedonadiskarrayisproposed.Complexcacheconsistencyanddistributedlockmanagement(DLM)CanbeavoidedinShareNothingmodel.Atthesanletime,thediskarrayensuresthehighavailabilityofshareddatainthesystem.AMarkovmodelissetuptoanalyzeavallabilityofthissystem.

SuccessfuIfailoverensurethehighavailabilityofahot-standbysystem.failoveractionisdividedintofaultdiagnosisandfaultrecovery.Inseveralaspectsof,suchas,systemnodefaultdiagnosis,systemservicefaultdiagnosisandsystemresourcefaultdiagnosis,an

improveddiagnosistechnologybasedonmultimonitoragentsisimplementedtoachievehi曲lyefficientdiagnosisofsystemstatus.

Hot—standbysystemistodecreasethenumberofsineJe-pointfailures,andthentoruncontinuouslybyusingfalloverstrategy.thefalloverprocessiscomposedoffaultdiagnosisanddetectionandfaultrecovery.

RealTimeFileMirrorringandCheckPointingandRollbackRecovery(CRR)isusedtodecreasethelossoffaultthenimprovetheavailability.AfterthedetailedanalysisofthesystemarchitectureofWindowsNTplatform,aRealTimeFileMirrorringsystemisdesignedandacheckpointalgorithmonWindowsNTplatformisproposedandimplemented.

Keywords:Hot-Standby,SSI,Checkpoint,Failover

II

独创性声明

本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中阱明确方式标明。本人完全意识到本声明的法律结果由本人承担。

学位论文作者签名:害n皂今

日期:矿口中年S月8日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

保密口,在——年解密后适用本授权书。

本论文属于/

不保密翻。

(请在以上方框内打“4”)

学位论文作者签名:名n.缸/≥

日期≯∥峰年f月驴日日

华中科技大学硕士学位论文

1绪论

随着计算机和网络的飞速发展,计算机在各个行业的应用越来越广泛和深入,尤其在一些关键行业的关键应用上,应用的后台核心领域是否具有保护业务关键数据和维持应用程序的高可用性的能力,已经成为影响一个公司成败的关键因素。另一方面,行业应用的后台核心领域一直是高端砒sC服务器的天下,多年来人们只有选择价格昂贵的小型机,系统实施及维护成本极高。而符合工业化标准的队架构服务器,以其低廉的价格、易于使用和维护的强大优势,逐渐打入各个行业应用的后台核心领域。基于对应用高可用的需要和低投入的考虑,我们研究开发了HA双机高可用服务器平台方案产品,为保证各种行业的关键应用的高可用性,提出了一套性价比极高的解决之策。

由于计算机技术的不断发展,硬件服务器平台已经具有了相当好的可用性。据统计,一般计算机系统配用RAID以及一些好的系统管理工具,其可用性可达至1J99%。即使这样,一年365天仍然有44--87d',时的停机时间,这对于企业用户意味着什么?客户、财产还是名誉?为了解决高可用性问题,人们提出了各种解决方案:完全硬件冗余,其可用性达99.9999%,但价格昂贵,且造成资源浪费。

我们知道,传统用户的计算机系统很多是单机工作环境,任何一个单点故障,都会影响企业业务的正常运转,而且产生很多不良后果。双机热备系统正是克服这种单点故障,为中小企业和关键行业提供一种经济高效的冗错方案。双机系统的目的是在发生故障和计划停机时保持客户机对应用程序和资源的访问。在~个承担关键业务的计算中心,该集群方案采用一组各自独立的服务器,两台主机共享一套存储设备存储业务数据,这样,与相应的HA软件配合,这些服务器将作为一个系统麸同工作。如果群集中的一台服务器由于发生故障或需要维护而无法使用,都有相应的冗余部件代替发挥相应的功能,从而保证业务的正常进行,有效防止了系统崩溃给企业带来的巨大损失,提高了系统稳定性、可靠性和容错能力。

1.1课题背景

随若信息技术的飞速发展,计算机系统被广泛地应用于社会生活的各个方面。无沧是在会融、电信等关系到国计民生的关键性部门和行业,还是在平时的曰常生活中,

华中科技大学硕士学位论文

我粥帮广泛魏霞蠲{}算税系统楚理信塞。这一方疆壤太熄攫毫了整令社会酶彀率,繁智了社会赘源,餐与魏舔对,对予计算梳系统敬依赖氇产蓬了极大静风滁。计冀槐系统莠不是完奎蟪可靠,~些蠢部拳舞熬鲶漾霞都会导致系绫翡皴辣、数撂丢失,蠢菠其不能辩对外提烘服务。因此,尽可能=}|虹提高系统的可用性(Availability)就慰得非常靛重要。丽且瞧于魂代诗冀穰系统静麓摸郓复聚洼豹遂逮提疑,遮一阕题萎褥笼必突出。

在计算梳研究懿镞蠛中,露关系统鹩槛靛方蟊静礤巍总惹一个关键经豹研究方淘。研究者们藏爨蠢夫魏努力潋糖裔系绕静往憝。这经攥在过畿鹣且卡年墼,诗葬辊系统鹃鲶淫黥力霄了基大鼹飞嚣薏,瑟价格鬻】不龋。F黪。然褥蓬褥注豢曲蘧,对于诗算极系缝性§&攀方蕊黥关注誊爨使人忽螺典她载一些重要憋方嚣,翔可靠性、安全性以及TotalCostofOwnership(TCO)等方颟的因素。例如TCO就怒一个常常被忽略的困豢,它遵常是系绞软硬件芘费的几倍到卡,k倍。

对于关键业务,停机通常是灾难性的。因为停机带来的损失也燕巨大的。下面的绫诗数字列举了誉嗣粪燮金建瘦强系统箨搬辑带来爨损失。

袭1.1各释计算凝应翔系缝宕撬损嶷绫诗

今天,在缀营过程的前端和精端,大多数系统对可厢径的簧求越来越商。如莱任傅一个计算鬟绞戆箨瓤辩鬻罄簿霹戆鼹~令企鼗熬凳|务整续绫经鬻过程熬述续经产尘受瑟澎臻,剿该系绫藏必须坡援为麓镱{壬务系统势鬟求共寿裹可躅经(GartrterGroup)。蓐投瓣趣懿代徐怼生产率大豢影蟪,避蔼可魏导致收入魏客户的浚失。因为IT部门要浓保持严格的停机时间限颧(往往以分钟计算),所以可用性至荧重瑟。

缓多颓鬻或意努静攀搏郏衮霹齄零致穆极辩闽。粳撂Gatttt/el-Group静鉴定,造成停机时间的原因包括计划内缎修、赢聪故障、搡作错误、搡侔系统敌障、硬件故障、鼯瞧窝霆然灾害等。蓑惹秀颂魏索造袋赡捧瓤黠阕不到全蘩箨戮薅阕懿2%。

图1.2系统失效原因的统计分析

1.2.2当前研究的进展

在计算机系统体系结构的研究方面,计算机系统的可用性的研究同样也引起研究者们巨大的兴趣。比如采用何种软硬件体系结构以构建高可用的计算机系统,怎样快速有效地从错误中恢复一个系统的正常运行等。考虑到计算机系统软硬件自身的错误在减少,由于人为因素带来的系统失效的情况成为主要原因,而这单靠系统结构方面的改善是无法解决的。因此研究者们把更大的注意力放在了提高系统的恢复能力上,希望能够提高计算机系统处理自身错误的能力。

如JimGray提出的Trouble.FreeSystems的概念,ButlerLampson认为系统设计面临的挑战之一就是保持系统的总是可用,而且能够自适应环境的改变【1“。JohnHennessy建议研究的目标应在可用性、可维护性、可扩展性上【11】。IBM公司提出了新的研究计划:自主运算(AutonomicComputmg),把计算机系统看作一个可以自调节、自我管理、自我诊断的生物系统,其主要目标也是使计算机系统更加“聪明”而不是更加的快速。DavePatterson、KathyKelliek(UCBerkeley)、ArmandoFox(Stanford)等领导的Recovery—OrientedCompming(ROC)研究项目。他们认为硬件故障、软件BUG、操作人员的误操作等都是要处理的存在的事实(facts),而不是有要要解决的问题(problems)。ROC更加关注于MTTR而不是MTTF,通过减少系统的恢复时间来提供系统的高可用。同时考虑到管理人员大部分的工作都是在处理系统的失效,因此这也有助于减/J',TCOIIJ。

面对客户对商可用性系统的强劲需求,各大公司都相继推出了自己的商用高可用性集群系统。80年代末期首先出现于基于UNIX的高可用系统。随后,各主要大厂商

华中科技大学硕士学位论文

1.3课题主要研究工作

本论文为国家自然科学撼金项目“统一存储网(USN)理论、结构与实验研究”(60173043)研究的一部分,该部分研究工作的目标是要实现一个基于统一存储两的双机热备系统,保证整个系统中运行的应用和服务的高可厢往。针对这一目标,本文进行了翔下静磅究工律:

(1)双搬热签系绕蛉体系缝橡分毒慝与霹究;

(2)双扒热螽系统中故障诊断技术的研究;

(3)windowsNT平台上检查点与回滚恢复技术的研究;

(4)实时文件镜像技术的研究与实现;

(5)WindowNT平台上双节点高W用性集群的实现。

我们开蒗鹩瑟杌热备系统可戳消豫计翔内帮诗巅夕}箨辊爵闻,保漳铸意访闻,支持Windows集群逡矮广泛黪应鼹穰序,必醚霆基于策路的敖障切换方案滏足芷露要袋和腰行为客户承担的义务提供了灵活性。除此之外,自动化、智能化工作负褥管理,允许集群管理员从反应型恢复转向前瞻性可用性管理,从而优化利用各种资源。

由于支持存储区域网(SAN)和传统客户机、服务器环境内的大型集群,HA能够在喇络存储环境,灵活的保护觚单一数稽库实俪到丈型瘟用集群的所有部件。它能够独立使嗣,又煞够与统一存储阑(USN)配套傻焉,霆鼗在为当今静瓣合诗筹繇壤提供可髑性稿灾难恢复方垂,发撵至关重要韵佟题。

以威的磺究目标将是要丰富舜Ⅱ完替系统所支持的应用和服务的类型。同时,就系统的可扩展性方面进行进一步的研究,将系统所支持的节点数进行扩展。另外,对于高可用性集群的单一入口点、负载平衡等方面逐有很多的研究工作凝做e

动地做所用的工作。另一台主机为备份服务器(StandbyServer),运行高可用软件中的益税程序,这些盆褫程序传送心群§信号戬检查主税的状态,僵麓各徐服务器不运行箕毽有耀豹王传受载。在系绞委常4潦}旯下,主鼹务器难羚提供强务,螯傍服务器监携主服务器懿运行情况(主服务器也同时监褪备份服务器是器正豢,当萎份服务器因菜秘原因出现异常,主服务器可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。当主服务器出现异常,不能对外提供服务时,备份服务器主动接管(Take-oveO主服务器的工作,从而保证服务的不间断地运行和商可闱性。当服务器经过维修恢复正常后,系统穰据管骥入员先前的配鬣命令经由良入工或自动静方式将备份服务器上运彳亍的痘鬻驻务凌挟强主缀务器。这释模式提供稷驽静可雳秣,弗虽黠经裁懿影酶蕞,l、。翔巢鍪玲服务器的配攫承乎不绻主艘务器豹差,这葶孛接锼不会带采任键性熊上影螅。热备份模式实现最简单,对应用软件限制最少。备运行机空阑可以使主机应用切换过来后立即获得所需要的资源.从而缩短服务切换时间。

2.1。3N,WAY方式

如图2.1所示。例如当服务器B和c上有错份的应用程序时,服务器A可用,从服务器B和c备份应用程序。当任意服务器上发生失效是,被保护的应用程序可以从失效服务器上转移到备份服务器上f2”。

圈2.1N-WAY方式

2.2数据的多路访阚方式

在双梳热餐系统解决方案中,数据安全帮各傍楚傈涯系统赢哥溺酶蘩石鞠关键,在双规热冬系统中保障数据安全凌三秘缝摅:

(1)ShareStorage缝梅;

(2)ShareNothing绍橡;

(3)连接磁纛薄烈戆ShareNothing绪褥。

其中利用实时文l牛镜像技术的ShareNothing结构可姓减少硬件投资成本,阿时可隧道过弱域随鞠广域丽在算藏送行数攒煞阕步餐裔备徐秘燹新,夜餐然灾^害黎蔽争灭灾时保障了数据的安全和连续运行。

2.2.1ShareStorage结构

螽裂2.2濒暴,在ShareStorage魏续撼中,系统孛戆蓠皇诗葵壤共李~个掇阉豹存储资源,需蒙磁盘访问之间的同步以僳_证数据的一数性。在这种情况下必须使埔分蠢霞镶警遴,这霞褥扩震注受囊驻裁。

闰2.2ShareStorage集群系统静结构图

磁盘阵列在保涯系统的离可用性方麟熬到了缀重蒙的作用。一个重裂的问题是如{可保证磁盛阵列自身的嵩可糟性。磁盘阵歹|j酶一些高冒阁性揍旒有咒余电源静采用、后备UPS系统、蔽RAID控铡嚣秘镶黎缓褥等。其中双羧爨器怒箕率缎裳用熬一耱,双RAID控刽嚣熬实现方式蠢以下三秘t

(1)热鍪用方式,…令控劁器傲蹶有购工中#,另一个什么也不傲,即雅为备媛控制器使用;

(2)受载乎衡方式,嚣个搜铡器嗣避承担不翅羽操终;

(3)负裁菇攀方式,两个控制器蜜际上工作在~怒,共事熊载。

受载共事熬控裁器後焉经过嚣墨懿UO蕤铰,奎蜂个圭撬UO整裁黎裂RAID子

系统控制器,每个RAID子系统控制器可以拥有自己管理的缓存,因而,不用担心来自其他羧制器的缓存肉存的疆新域加锁。假如主路径_失败,系统可以使用另~条I/0路径。当失黢发生时,失黢连接瀚缓存信惑必鬏霹潋往焉簇氇静连接来访溺,否粼,这个数撼嚣要完全丢赛,并在主极I/O控卷l器积RAID控铡器中重毅建立路经。

受载平衡RAID控制器县有一l中特别的能力,即能够从每一个主机彰0控制器烽I/O操作分散到阵列内的任何一个成员磁盘。虽然描述起来比较简单,但实现它却非常豳难,问题的关键是缓存。对RAID控制器执行的I/O写操作偶尔也反映在控制器的缓存中,骰如同样的应用和控制器能够後箱勇一条路径和RAID控制器,劐必须维护完全一样豹缓存信惑,捷两个搽作赘髓谤阕它。缓存靛熨螽定对实溪越来选馁露滚,这震要实现缓存灰存共享和加镂机制。

2.2。2ShareNothing缝梅

在ShareNothing结构中,每个节点郡毒它鑫己熬内存积囊己憝有敬本遮存镤资源。ShareNothing集群可以允许节点访问共有设备和瓷源,只要这些资源是被某一个单独的系统在某一个时间所拥有和进行管理的即可,这样就避免了缓存一致性系统和分布锁定管理(DLM)洋j的复杂性。

图2.3为一种形式的无多荽享存储的集群结构。在该结构的集群系统中,为了保证系统中懿数掇煞嵩霹蘑,娶遴过嚣个节点之阕憝数据线实瓣戆镰傍节点蠹懿数据帮系统的运行状态。Legato公司的Co,StandbyServer和WesternMicro公司鲍SavWareHA都采用了这样的无共享磁盘的这种方式。这个结构的好处是可以排除集群存储器内的单一失效点。而且,因为数据是被完全复制的,所以客户的应用程序可以在任一服务器上运行,从而可以更好地平衡负载。

圈2.3ShareNothing集骥的结橡躞

双机热备常见问题及处理

人员定位系统双机热备软件常见故障分析与处理 (一)故障现象:软件安装后,主备机无法正常切换。 分析原因:1,双机热备之间的切换是以主备机所连接的外网的通断作为判断的依据。并且与主备机网络名称相关。 解决办法:1,检查主备机外网通断情况。 2,检查主备机与矿交换机之间硬件连接以及能否拼通。 3,检查软件内外网IP是否与本机对应的俩个网卡网络名以及设置IP是否一致。 (二)故障现象:主备可以正常切换,数据可以自动同步,但手动镜像却提示不成功或者超时。 分析原因:1,数据库过大会导致2分钟内数据同步不完全并超时。 2,来宾帐户未启用或设置了密码,导致本机无法访问另台机子的数据文件。 3,系统中SERVER 服务和Workstation未启动。 4,针对WINDOWS SERVER 2003 操作系统装机后要配置文件服务器,配置后选择的文件要求共享,且权限为完全控制。隶属于Everyone 用户. 5,,在本地策略用户指派权利中“拒绝本地登录中”去掉Guest帐户。 解决办法:1,检查数据库大小,把人事库照片删除后缩小在添进去。 2,检查来宾帐户是否启用以及用户指派权利选项。 3,检查是否启动SERVER 和Workstation服务。 4,在主机的数据查询分析器中输入备机的内网IP 看能否访问到备机BW_HR 和BW_KJ222这两个库。在备机硬盘下创建文件,并通过主机的‘开始,运 行’选项输入对方内网IP(例如:\\10.10.10.4)看能否访问到该文件,并对 该文件进行删除及创建新文件,看是否成功。如不成功,则检查共享文件的 权限。 (三)故障现象:主备机切换时,提示无法切换成主机且数据服务器软件没有自动关闭或启动。 分析原因:1,双机热备软件设置时,所添加的文件路径与实际路径不一致。 2,软件设置时,未把最后一项:“当双机热备软件关闭时自动关闭服务器软件 程序”选项打勾。 3,主备机SQL SERVER 数据库注册属性不一致。默认情况下为windows 身份 认证。 解决办法:1,检查设置文件路径 2,检查双机热备最后选项。 3,查看并编辑主备机SQL SERVER 数据库注册属性。 (四)故障现象:当启动主机双机热备软件时,提示数据库过旧,无法切换为主机状态。分析原因:1,主备机关机顺序未安照先关备机后关主机的原则,而启动时则先启动了最先关的机子。 解决办法:1,先确定俩台机子谁的数据最新,则先启动谁,明确正确的启动和关闭顺序。 2,在确定的数据最新的那台机子上,去双机热备软件的安装文件夹下面找到Init.dll软件配置文件,修改里面的时间为当前系统的时间并保存,重启该机 的双机热备软件。

RoseMirrorHA双机热备软件的安装及配置手册

双机热备软件的安装与配置指导手册 系统版本:A1 文档编号:CHI-PT-NJBL-SJRB-A0

内容简介 《双机热备软件的安装与配置指导手册》主要针对目前公司人员定位系统服务器双机热备软件的安装和配置进行了详细说明,指导现场工程师对双机热备软件进行安装及配置。 本手册共分四章节,分别为: 第一章:概述 第二章:软件的安装 第三章:服务的安装及配置 第四章:注意事项 第五章:常见故障处理 本文档的读者范围: 公司内部员工 版权声明 本文档属南京北路科技有限公司版权所有,侵权必究。 本文文件专供用户、本公司职员以及经本公司许可的人员使用,未经公司书面 同意,任何单位或个人不得以任何方式复制、翻印、改编、摘编、转载、翻 译、注释、整理、出版或传播手册的全部或部分内容。

南京北路自动化系统有限责任公司位于南京江宁经济技术开发区,是南京市高新技术企业,现有高级工程师、工程师及其他专业技术人员100余名。是专业从事煤矿通信、自动化、信息化产品的研发、生产、销售及服务的高科技公司。 公司拥有ISO9001:2000质量管理体系认证,坚持“质量第一、用户至上、至诚服务、持续改进”的质量方针,得到了广大客户的信赖和支持。目前公司产品覆盖全国10多个省、自治区,并在多个煤炭主产区设有售后服务机构。 公司以满足客户需求为己任,不断生产高性价比的产品,为客户创造价值。 南京北路自动化系统有限责任公司 联系地址:南京市江宁开发区菲尼克斯路99号 邮政编码:211106 电话号码:(025)52187543 传真:(025)52185703 邮件地址:njbestway@https://www.360docs.net/doc/562890016.html, 客户服务电话:400-611-5166 客户支持网站:https://www.360docs.net/doc/562890016.html,

oracle双机热备架构方案

oracle双机热备架构方案 双机热备有两种实现模式,一种是基于共享的储备设备的方式,另一种是没有共享的储备设备的方式,一样称为纯软件方式。 基于储备共享的双机热备是双机热备的最标准方案。 关于这种方式,采纳两台(或多台)服务器,使用共享的储备设备(磁盘阵列柜或储备区域网SAN)。两台服务器能够采纳互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务要求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采纳建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器显现故障时,另一台服务器依照心跳侦测的情形做出判定,并进行切换,接管服务。关于用户而言,这一过程是全自动的,在专门短时刻内完成,从而对业务可不能造成阻碍。由于使用共享的储备设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行治理。 关于纯软件的方式,则是通过支持镜像的双机软件,将数据能够实时复制到另一台服务器上,如此同样的数据就在两台服务器上各存在一份,假如一台服务器显现故障,能够及时切换到另一台服务器。 纯软件方式还有另外一种情形,即服务器只是提供应用服务,而并不储存数据(比如只进行某些运算,做为应用服务器使用)。这种情形下同样也不需要使用共享的储备设备,而能够直截了当使用双机或集群软件即可。但这种情形事实上与镜像无关,只只是是标准的双机热备的一种小的变化。 本方案是前者————基于共享储备设备的数据库热备。 数据库服务器双机热备的好处 这种配置模式的优点是有利于数据库的升级,当其中systemA需要升级的时候,就把服务切换到systemB上运行,升级A的DB2程序,之后还能够把服务切换回到A来,然后升级B的DB2程序。那个升级过程可不能阻碍用户的DB2使用,因为总有一台机器能够使用DB2程序来响应用户的服务要求。 服务器的故障可能由各种缘故引起,如设备故障、操作系统故障、软件系统故障等等。一样地讲,在技术人员在现场的情形下,复原服务器正常可能需要10分钟、几小时甚至几天。从实际体会上看,除非是简单地重启服务器(可能隐患仍旧存在),否则往往需要几个小时以上。而假如技术人员不在现场,则复原服务的时刻就更长了。 而关于一些重要系统而言,用户是专门难忍耐如此长时刻的服务中断的。因此,就需要通过双机热备,来幸免长时刻的服务中断,保证系统长期、可靠的服务。

双机热备解决方案

双机热备解决方案 1.1 双机备份方案描述 现代IT技术认为,一个成功系统中数据及作业的重要性已远超过硬件设备本身,在一套完善的系统中对数据的安全及保障有着极高的要求。双机容错系统是由IBM公司提出的全套集群解决方案,结合IBM 服务器产品的安全可靠性和集群技术的优点,为用户提供一个完善的系统。 1.1.1 双机备份方案的原理 两台服务器通过磁盘阵列或纯软件模式,连接成为互为备份的双机系统,当主服务器停机后,备份服务器能继续工作,防止用户的工作被中断。 1.1.2 双机备份方案的适用范围 用户对系统的连续工作性和实时性要求较高,系统停机对系统的影响很大,造成很大的损失。 1.1.3 双机备份的方式及优缺点 磁盘阵列备份方式—— 两台服务器通过磁盘阵列连接起来,形成备份系统,此方法硬件投资 大,价格较贵,但系统易于安装,也相对稳定。 磁盘阵列备份模式示意图 1.2双机备份方案 由IBM系列产品组成硬盘备份模式 主机:采用IBM X255 主机网卡:采用IBM 10/100/1000MM网卡 磁盘阵列:采用EXP300 磁盘阵列, 配制RAID 5 具体实现方法参见后面章节附图和说明 IBM X255结合EXP300磁盘阵列的双机方案

系统简述: 整个系统由两台IBM高端服务器X255和EXP 300磁盘阵列构成双机备份模式,双台服务器互为备份,当一台服务器出现问题停机时,另一台服务器能实时接管中断的工作,保证业务系统的正常运行。EXP 300磁盘柜磁盘具有热插拔功能,具可以灵活组成RAID模式,当一块硬盘损坏,数据可以恢复,保证数据不丢失。 1 .3 IBM PC 服务器双机容错系统解决方案 由于采用了双机容错的集群结构,系统具有极高的可靠性。两台服务器可以作为一个整体对网络提供服务,且相互间互为监控。集群具有一定的负载平衡功能,可将一个任务的多个进程分摊到两台服务上运行,提高系统的整体性能。当一台服务器发生故障时,其上所运行的进程及服务可以自动地由另一台服务器接管,保证网络用户的工作不受影响。同时,如果系统采用RAID技术对数据进行保护,可确保重要数据不因系统故障而造成损失。 特点: 高可靠性 支持冗余磁盘阵列 冗余电源和风扇设计 所有部件均支持热插拔 主机可各自运行自己的应用,互为备份,共享磁盘数据 高性能单块IBM ServeRAID卡数据传输带宽可达 160MB/s 数据传输I/O可达3000次/s 主机与磁盘间的距离可达20米 高可用性 可扩展性强/性能价格比高/高容错性,系统安全高效 产品介绍(略,有兴趣的朋友可以去IBM网站看看详细的介绍)

双机热备的数据备份和灾难备份方案

双机热备的数据备份和灾难备份方案 一、方案背景 1. 用户目前数据环境及需求 根据提供的信息,目前用户的系统环境如下描述:操作系统:Windows 操作系统,关键数据:VSS 数据库现在用户要备份的服务器为2台数据库服务器做双机热备集群,整个系统对于备份的要求:备份系统稳定可靠,保证随时能够备份/还原关键数据;对服务器有灾备的考虑,操作系统崩溃时能通过灾难备份快速恢复操作系统。同时考虑远期建设目标平滑过渡,避免重复投资。 2. 用户目前状态和存在的问题 目前用户双机服务器拓扑图如下,这样的方式存在以下问题: a) 由于主机与备机及磁盘阵列中的数据都没有备份,一旦发生磁盘阵列数据丢失、主机与备机数据丢失事故时,将会造成重大损失。 b) 当服务器操作系统崩溃时,无法快速恢复。 二、设计方案 1. 设计原则 根据上述问题建议的备份方案应该遵循以下原则:备份系统应该支持Open File 热备份功能磁盘阵列连接在专用的备份服务器上、对双机集群中的2台机器都能进行数据备份、备份软件支持定时计划备份、备份软软件支持服务器灾难备份、备份软件提供网络集中备份功能,能集中备份网络上其余SQL Server、ORACLE或文件数据,提供良好的扩展性。 2. 方案的设计 依据上述设计原则,建议采用爱数备份软件专业备份软件安装在一台备份服务器上,通过网络对双机系统进行数据备份和操作系统灾难备份。Backup Exec 作为专业的备份软件,具有以下优点: c) 专业的企业网络集中备份解决方案,一台备份服务器可以备份网络上多台服务器数据(文件服务器、VSS服务器、数据库服务器、邮件服务器等) d) 备份软件支持Open file 热备份功能,能对正在使用的数据进行备份。 e) 能根据需要制定灵活多变的备份计划任务 f) 支持服务器操作系统崩溃灾难备份/恢复

PLC常用双机热备系统介绍与比较

PLC常用双机热备系统介绍与比较 (由txt文件修改) 对热备系统的简单分类(基于热备切换方式的分法): 一.硬件级双机热备产品: A.单机架双机热备: 同一块机架上插双电源,双CPU,有1套热备单元(欧姆龙为1个而三菱为2个),一般还可以插双通讯模块(如双以太网单元),CPU的数据交换通过机架底板电路,一般不是RIO式的分布式结构,切换速度快,一般在50ms以下。 1.Omron CVM1D和CS1D 2.Mitsubishi Q4AR 注意: Siemens使用UR2机架的S7-400H不是此类,该产品虽然插在同一块机架上,但该机架在电气上完全独立的,即把2个机架作成一体式。 B.双机架硬件级热备产品: 主、从两个机架,两套完整独立的系统,两套机架上的热备单元一般通过光纤通讯,切换速度飞快。施耐德Quantum切换速度在48ms以下。西门子的S7-400H不太清楚,请咨询技术支持。GE S90-70的切换速度看资料,在25-50ms。 1.Schneider Quantum 2.Siemens S7-400H 3.GE S90-70 4.AB ControlLogix 5000 二.总线级双机热备产品: 我不知道把此类划到硬件级热备好还是软件级热备好,还是另外拉出来单独说吧。基于总线级的通讯传输速率,总线通讯单元兼有热备切换功能。当主CPU故障时,从CPU接管I/O的控制,夺取I/O总线的控制权。切换速度其实还可以,在150-300ms内。 典型代表: 1.AB SLC500,由1747-BSN 实现RIO结构的热备。 2.Mitsubishi小Q,由CC-Link单元实现RIO结构的热备。 其实三菱的大Q和A也可以,但三菱技术支持建议用小Q。 三.软件级双机热备产品:

双机热备搭建系统解决方案

UPS电源安装实施方案 1.双机集群介绍 1.1.双机集群的原理说明 双机容错是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。当一台主机出现故障的时候,可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行。在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。这是目前采用较多的一种模式。

双机热备份软件介绍

双机热备份软件介绍 1、PrimeCluster(PCL)HA集群软件产品概述 PrimeCluster HA(PCL HA)是德国富士通-西门子计算机公司(Fujitsu-Siemens Computers)提供的业界领先的支持双机热备和多节点集群的高可用管理软件。 PCL HA是一种应用与系统高可用性(High Availability)管理器。它为关键业务应用及其相关资源提供了能够持续访问的平台。PCL HA可为任何类型的应用、服务或数据提供最通用的高可用性环境。最主要的优点在于自动识别系统故障及组件错误,并具有诸如透明本地恢复或应用故障转移(Failover)等合适的恢复措施。PCL HA拥有多方向故障转移功能——集群内任一节点均可接管其他节点的功能。若特定服务器出现故障,它所运行的应用会分配给余下正常运行的服务器,使管理员能灵活而有效地应用系统资源。由于应用可通过管理干预转移到其他服务器,这样就能在不中断操作的情况下对集群进行扩容。 PCL HA for Linux同目前市场上其他的基于开放源代码的HA软件不同,PCL是由FSC完全自行开发的Linux平台上的高可用软件,它在维护、故障排除、升级、售后服务方面都能够有充分的保障。同时根据PCL用户的反馈,对于开放源代码的HA类的系统关键软件,最终用户普遍对其版本更新能力、数据安全性和故障(特别是兼容性及底层故障)的排除能力普遍持怀疑态度。PCL for Linux在欧洲已经有相当的关键业务成功案例,在中国也有上百个成功安装使用的案例,因此,最终用户对PCL的接受度明显较高。 PCL HA做为一个高可靠的HA软件,以德国富士通-西门子公司的先进技术、严谨作风和可靠信誉为后盾,为用户提供系统高可用性方面的可靠保障,是关键应用下服务器集群的理想选择。 PCL HA高可用软件应用环境 PCL HA支持的操作系统有Linux和Solaris。 Intel-based的Linux发行版: ?RedHat Enterprise Linux ES/AS 3 (up to Update 5) ?RedHat Enterprise Linux ES/AS 4 (up to Update 2)以及64bit版本 ?SuSE Linux Enterprise Server 8 ( up to SP4) ?SuSE Linux Enterprise Server 9 ( up to SP2)以及64bit版本 ?以及各种兼容上述两种发行版的Linux,比如红旗、中标、CentOS等等 Sparc-based的Solaris ?Solaris 8 / 9 / 10 注:上述操作系统为PCLv4.2A00支持的操作系统,随着操作系统的升级,PCL也会做出相应的版本更新

服务器双机热备方案定稿版

服务器双机热备方案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份

技术。但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存

双机热备简介

双机热备简介 一、双机热备 双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。其实现过程如下图所示: 图(1) 为什么要做双机热备? 双机热备针对的是服务器的故障。 服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。双机高可用系统解决方案,为用户提供了具有单点故障容错能力的系统平台。它采用主服务发生故障时备服务器接管的机制,实现在线故障自动切换,实现系

统7×24小时不间断运行,避免停机造成的损失。 (一)纯软件双机热备 纯软件双机热备是在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统,一般支持数据库和应用软件实现双机热备。 方案一:Windows(或者Linux)+ Rose Mirror HA+ORACLE(或者SQL Server)的双机热备 网络拓扑: 图(2) 投资采购软硬件设备: (1)数据库服务器:两台数据库服务器,每台服务器至少两个网络口; (2)操作系统:windows或者linux操作系统; (3)数据库软件:Oracle或者SQL Server企业版; (4)集群软件:Rose mirror HA(Rose公司); (5)交换机:核心交换机一台。

windows双机热备文档

目录结构 目录结构 (1) 一、群集介绍 (2) 二、群集专业术语 (2) 三、环境介绍及要求 (3) 1、网络拓扑结构 (3) 2、软件配置说明 (3) 3、硬件配置要求 (4) 四、安装群集前的准备工作 (5) 1、创建共享磁盘 (5) 2、网络及系统配置 (9) 五、安装群集服务 (20) 1、在A 节点上新建一个群集 (20) 2、将B 节点加入现有群集 (26) 六、配置群集服务 (31) 1、群集网络配置 (31) 2、心跳适配器优先化 (33) 3、仲裁磁盘配置 (34) 4、测试群集安装 (34) 七、故障转移测试 (37) 1、初级测试 (37) 2、高级测试 (38)

一、群集介绍 服务器群集是一组协同工作并运行Microsoft 群集服务(Microsoft Cluster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。(说明:本文档编写的目的是为了帮助大家实现所关心的如何在VMWare Workstation 中完成,典型群集的配置步骤,不会具体的涉及到如何安装群集应用程序) 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP 地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点 故障回复: 某节点从宕机状态转为联机状态后,仍然继续宕机前的工作,为其他节点分流

RoseMirrorHA镜像服务器双机热备解决方案及具体配置

RoseMirrorHA镜像服务器双机热备解决方

案及具体配置 . 一、双机热备拓扑图以及工作原理 专业资料Word .

双机热备工作示意图 二、双机热备方案介绍操作系统和应用程序是安装在两台服务器的本地系统盘在高可用性方案中,数据的集磁盘阵列集中管理和数据备份的。上的,而整个网络系统的数据是通过将所有站点的数据直接从中央存储设备来读取和中管理是通过双机热备份系统,用户的数极大地保护了数据的安全性和保密性。存储,并由专业人员进行管理,备机主动替代主机工在一台服务器出现故障时,据存放在外接共享磁盘阵列中,作,保证网络服务不间断。 心双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系”跳统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统双机软件无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(专业资料 Word .

RoseHA)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 双机备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍: 双机热备模式即目前通常所说的active/standby 方式,active服务器?处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。这是目前最理想的一种模式。 双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均?设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。服务器配置相对要好。 双机双工模式: 是目前Cluster(集群)的一种形式,两台服务器均为?活动状态,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份。WEB服务器或FTP服务器等用此种方式比较多。 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式,低成本模式。 基于存储共享的双机热备是双机热备的最标准方案。这种方式采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。两台服务器可以采用热备(主从)、互备、双工(并行)等不同的方式。在工作过程中,两台服专业资料 Word .

存储、集群双机热备方案

存储集群双机热备方案

目录 一、前言 (3) 1、公司简介 (3) 2、企业构想 (3) 3、背景资料 (4) 二、需求分析 (4) 三、方案设计 (5) 1.双机容错基本架构 (5) 2、软件容错原理 (6) 3、设计原则 (7) 4、拓扑结构图 (7) 四、方案介绍 (10) 方案一1对1数据库服务器应用 (10) 方案二CLUSTER数据库服务器应用 (11) 五、设备选型 (12) 方案1:双机热备+冷机备份 (12) 方案2:群集+负载均衡+冷机备份 (13) 六、售后服务 (15) 1、技术支持与服务 (15) 2、用户培训 (15)

一、前言 1.1、公司简介 《公司名称》成立于2000年,专业从事网络安全设备营销。随着业务的迅速发展,经历了从计算机营销到综合系统集成的飞跃发展。从成立至今已完成数百个网络工程,为政府、银行、公安、交通、电信、电力等行业提供了IT相关系统集成项目项目和硬件安全产品,并取得销售思科、华为、安达通、IBM、HP、Microsoft等产品上海地区市场名列前茅的骄人业绩。 《公司名称》致力于实现网络商务模式的转型。作为国内领先的联网和安全性解决方案供应商,《公司名称》对依赖网络获得战略性收益的客户一直给予密切关注。公司的客户来自全国各行各业,包括主要的网络运营商、企业、政府机构以及研究和教育机构等。 《公司名称》推出的一系列互联网解决方案,提供所需的安全性和性能来支持国内大型、复杂、要求严格的关键网络,其中包括国内的20余家企事业和政府机关. 《公司名称》成立的唯一宗旨是--企业以诚信为本安全以创新为魂。今天,《公司名称》通过以下努力,帮助国内客户转变他们的网络经济模式,从而建立强大的竞争优势:(1)提出合理的解决方案,以抵御日益频繁复杂的攻击 (2)利用网络应用和服务来取得市场竞争优势。 (3)为客户和业务合作伙伴提供安全的定制方式来接入远程资源 1.2、企业构想 《公司名称》的构想是建立一个新型公共安全网络,将互联网广泛的连接性和专用网络有保障的性能和安全性完美地结合起来。《公司名称》正与业界顶尖的合作伙伴协作,通过先进的技术和高科产品来实施这个构想。使我们和国内各大企业可通过一个新型公共网络来获得有保障的安全性能来支持高级应用。 《公司名称》正在帮助客户改进关键网络的经济模式、安全性以及性能。凭借国际上要求最严格的网络所开发安全产品,《公司名称》正致力于使联网超越低价商品化连接性的境界。《公司名称》正推动国内各行业的网络转型,将今天的"尽力而为"网络改造成可靠、安全的高速网络,以满足今天和未来应用的需要。 1.3、背景资料 随着计算机系统的日益庞大,应用的增多,客户要求计算机网络系统具有高可靠,高

高可用多机集群数据备份双机热备方案

PLUSWELL多机集群、数据备份解决方案 北京蓝科泰达科技有限公司 2008年7月

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux 平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据 库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可 被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确 保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

冷备份与热备份、双机热备与容错

冷备份与热备份、双机热备与容错 冷备份与热备份、双机热备与容错 冷备份与热备份 一、冷备份 冷备份发生在数据库已经正常关闭的情况下,当正常关闭时会提供给我们一个完整的数据库。冷备份时将关键性文件拷贝到另外的位置的一种说法。对于备份Oracle信息而言,冷备份时最快和最安全的方法。冷备份的优点是:1、是非常快速的备份方法(只需拷文件) 2、容易归档(简单拷贝即可) 3、容易恢复到某个时间点上(只需将文件再拷贝回去) 4、能与归档方法相结合,做数据库“最佳状态”的恢复。 5、低度维护,高度安全。 但冷备份也有如下不足: 1、单独使用时,只能提供到“某一时间点上”的恢复。 2、再实施备份的全过程中,数据库必须要作备份而不能作其他工作。也就是说,在冷备份过程中,数据库必须是关闭状态。 3、若磁盘空间有限,只能拷贝到磁带等其他外部存储设备上,速度会很慢。 4、不能按表或按用户恢复。 如果可能的话(主要看效率),应将信息备份到磁盘上,然后启动数据库(使用户可以工作)并将备份的信息拷贝到磁带上(拷贝的同时,数据库也可以工作)。

冷备份中必须拷贝的文件包括: 1、所有数据文件 2、所有控制文件 3、所有联机REDO LOG文件 4、Init.ora文件(可选) 值得注意的使冷备份必须在数据库关闭的情况下进行,当数据库处于打开状态时,执行数据库文件系统备份是无效的。 下面是作冷备份的完整例子。 (1)关闭数据库 sqlplus /nolog sql>connect /as sysdba sql>shutdown normal; (2)用拷贝命令备份全部的时间文件、重做日志文件、控制文件、初始化参数文件 sql>cp (3)重启Oracle数据库 sql>startup 二、热备份 热备份是在数据库运行的情况下,采用archivelog mode方式备份数据库的方法。所以,如果你有昨天夜里的一个冷备份而且又有今天的热备份文件,在发生问题时,就可以利用这些资料恢复更多的信息。热备份要求数据库在Archivelog方式下操作,并需要大量的档案空间。一旦数据库运行在archivelog

RoseMirrorHA镜像服务器双机热备解决方案及具体配置

RoseMirrorHA镜像服务器双机热备解决方案 及具体配置

一、双机热备拓扑图以及工作原理

双机热备工作示意图 二、双机热备方案介绍 在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。 双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件RoseHA)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。

双机备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍: ?双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。这是目前最理想的一种模式。 ?双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。服务器配置相对要好。 ?双机双工模式 : 是目前Cluster(集群)的一种形式,两台服务器均为活动状态,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份。WEB服务器或FTP服务器等用此种方式比较多。 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式,低成本模式。 基于存储共享的双机热备是双机热备的最标准方案。这种方式采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。两台服务器可以采用热备(主从)、互备、双工(并行)等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。

PLUSWELL双机热备

PLUSWELL多机集群、数据备份 解决方案

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。 蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程 发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信 息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在 安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

服务器双机热备方案

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID 技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID

技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器

双机热备的步骤

双机热备的步骤 sybase双机问题 ,两台IBM3650,DS3400阵列,用的ROSEHA双机软件。SYBASE 12.5在win2003上不能自动启动,SYBASE应如何建库啊???lllenxue发表于2008-4-2814:07 看一下sybase的服务设置是不是自动启用的 建库进入控制台,建库之前先建设备,之后在设备上按你实际需要创建数据库 netmaple发表于2008-4-3009:33 这个知道呀,就是sybase做双机建库后备份机就不能起SYBASE服务了,不知道做双机如何建库 lllenxue发表于2008-4-3014:19 你参考一下这篇文章,希望对你能有所帮助 ROSE HA3107的安装过程(Sybase)

安装环境: 两台服务器(以下分别称为“服务器1”和“服务器2”,一套磁盘整列柜,Sybase数据库软件,ROSE HA3107软件。) 安装过程: 1、安装WINDOWS NT4.0 (1)在安装NT4.0的过程中,必须安装SNMP和Wins服务(WINDOWS网际名称服务)。 (2)将所有的驱动程序安装好,配置好网络。 (3)安装Services Pack。(SP4,SP5都可以) (4)在两台NT服务器的磁盘管理器中查看磁盘柜中将要安装数据库的卷的盘符是否相同,该盘符必须相同。 2、安装Sybase数据库 (1)在公共磁盘上建立Sybase目录,在其下建立Data,Install 两个子目录。 (2)关闭服务器2,在服务器1上安装Sybase数据库。在安装过程中,将程序文件安装在本地硬盘上,把库文件安装在磁盘柜上,然后重启计算机。 (3)安装完毕后,进入Sybase的Server Config中,删除数据库安装过程中默认建立的SQL Server,Backup Server,Monitor Server。 (4)将公共磁盘Sybase\Data目录下的Master.dat,Sybprocs.dat文件删除。

相关文档
最新文档