双机热备和单机容错技术

双机热备和单机容错技术
双机热备和单机容错技术

双机热备份技术在方案中的应用实例

双机热备份技术是企业在进行自己的存储服务上经常使用的技术,当我们在使用的时候会出现很多不解的问题,下面我们就实际情况来了解下双机热备份技术的具体工作流程。

目前主流应用的服务器容错技术有三类,它们分别是:服务器群集技术、双机热备份技术和单机容错技术。它们各自所对应的容错级别是从低到高的,也就是说服务器群集技术容错级别最低,而单机容错技术级别最高。由此可知它们各自应用的行业容错级别需求也是从低到高的。本文主要介绍后两种容错技术,先来看一下双机热备份技术。

一、双机热备份技术

双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份技术软件组成。

在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份技术系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。

双机热备份技术系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。

双机热备份技术方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。

双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是目前采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。

双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。

双机双工模式:是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。

二、单机容错技术

从上面的分析我们知道,双机热备份技术所采用的是两台配置完全一样的服务器系统,其实服务器群集方案中的容错技术也是一种多服务器容错技术。而本节所要介绍的单机容错技术则是在一台服务器实现高性能容错的,它的容错能力要远比服务器群集和双机热备份中容错能力要高,所以更加适合那些如证券、电信、金融、医疗等对容错能力特别苛刻的行业。

以往的集群系统在出现故障的情况下,需要中断服务器的运行,然后用一定的时间切换至备用的服务器上面进行运行,才能进行维修和恢复,这其中所付出的成本和带来的损失是用户最不愿意看到的。具有容错技术的容错服务器,最大的优势就在于它能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动重新同步运行,从而有效的解决了客户的后顾之忧。正因如此,具有容错技术的容错服务器,正在冲击前几年兴起的双机热备份技术和集群技术,越来越被人们所关注。同时,更为难得的是它可以在采用符合工业标准部件的服务器中实现(IA架构服务器),极具竞争力的成本优势,更使得容错服务器令人刮目相看。

容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份;通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。目前很多容错系统是基于IA架构的服务器,与Windows 2000完全兼容,实现以前只有在RISC系统上才能实现的容错。这种容错技术在IA服务器上的实现,将IA服务器的可靠性提高到了99.999%,同时服务器的运行是不间断的。

双机热备份技术和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现99.9%的可用性,容错服务器却可以实现99.999%的可用性。这样,双机热备份技术大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。还要注意的一点是双机热备份与服务器群集并不一样,双机热备份通常要求两对路服务器的配置完全一样,而服务器群集则没有这方面的严格要求,这也是许多读者容易混淆的。

另外,双机热备份技术方式由于需要至少2台服务器,导致在软件采购(操作系统、中间件、双机备份软件等)、软件维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机备份软件出现故障后,其维修的难度较高,对客户会带来较大困难。因此虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,而其总成本(TCO)却远远低于双机备份方式的成本。但是就其灵活配置方面,双机热备份技术方案更具优势,许多热备份方案都是由一些系统集成商组合不同厂家服务器产品进行的,可以满足不同客户需求。但总体来说,容错服务器是未来发展的趋势。

如何实现的双机热备

如何实现的双机热备 2009-01-05 12:19:58 一.介绍 作为服务器,需要提供一定的24X7的安全保证,这样可以防止关键节点的宕机引起系统的全面崩溃。春笛公司在长期的邮件系统方案实施过程 中,利用OpenSource开源软件,结合金笛邮件系统,成功地为多家单位实施了大容量邮件系统的高可靠双机热备方案。 基于linux的 HA软件可靠稳定,比使用商业版本的HA软件降低成本约9成左右。 在这里我们用 lvs 和 DRBD 实现了一个真实环境下的双机热容错集群。 这里的关键技术是如何实现ip代换, mon/heartbeat检测, 文件同步。 同样这一方法稍加改动就可以实现oracle热备份、ldap热备份等。 二.方案描述 将真实服务地址绑定到一个虚拟网卡(eth0:1)上通过检测程序 (heartbeat)来将主机或是备份主机的虚拟网卡(eth0:1)激活。从而实现热备份。使用网络硬盘RAID来同步文件。检测程序通过内网进行监控。 金笛高可用邮件系统架构(双机系统) F 2 工作模式

a) 正常状态:

正常工作状态 b) 备份激活: node1失效,node2激活状态c) 主机就绪: node1故障排除,恢复状态

d) 切换回正常模式: 需要手动停止备份服务器的服务,系统会自动切换回正常模式 三.软硬件需求 两台双网卡主机完全安装 redhat6.2 主机IP 10.0.0.126 备份主机IP 10.0.0.250 实际服务即浮动IP 202.93.204.68 邮件系统: 金笛邮件系统Jindi-Mail2.0 (https://www.360docs.net/doc/8d4016315.html,) HA软件: ftp://https://www.360docs.net/doc/8d4016315.html,/pub/ha/piranha-docs-0.4.17-2.i386.rpm ftp://https://www.360docs.net/doc/8d4016315.html,/pub/ha/piranha-gui-0.4.17-2.i386.rpm ftp://https://www.360docs.net/doc/8d4016315.html,/pub/ha/piranha-0.4.17-2.i386.rpm ftp://https://www.360docs.net/doc/8d4016315.html,/pub/ha/ipvsadm-1.11-4.i386.rpm https://www.360docs.net/doc/8d4016315.html,plang.tuwien.ac.at/reisner/drbd/download/drbd-0.5 .8.1.tar.gz 安装软件: rpm –Uvh ipvsadm* piranha*两台主机都要装 金笛邮件系统安装 DRBD 安装 Tar zvxf tar -zvxf drbd-0.5.8.1.tar.gz cd drbd make make install 有如下相关文件 /usr/sbin/drbdsetup /lib/modules/2.2.18pre11-va2.1/block/drbd.o /etc/ha.d/resource.d /etc/rc.d/init.d/drbd /sbin/insmod drbd进行测试 应返回”Using /lib/modules/2.2.18pre11-va2.1/block/drbd.o” 四.设置 编辑/etc/lvs.cf文件 #Example of /etc/lvs.cf #还需要smtpd popd这两个启动脚本 service = fos # 采用fos模式 primary = 10.0.0.126 # 主ip地址(qmail) backup = 10.0.0.250 # 备份主机ip地址(Backup) backup_active = 1 # 激活备份 heartbeat = 1 # 激活Heartbeat heartbeat_port = 1050 # Heartbeat端口 keepalive = 2 # heartbeat间隔单位秒 deadtime = 10 # 判定死机间隔 rsh_command = ssh # 文件同步方案选ssh

容错方案和双机热备方案的对比 2

为什么选择容错 Stratus容错服务器与双机热备方案比较

一、容错技术和集群的比较: 1、可靠性比较:

容错服务器的可靠性可达到99.999%以上,其设计原理是“容错原则---容忍错误发生,当出现任意单点故障时,不会对系统造成任何影响,系统仍然连续工作”。而集群方案的可靠性只能在99.9%~99.99%之间,其设计原理是“避错原则----当系统出现故障时,如何补救错误、避免错误进一步扩大”。 2、拓扑结构比较: 计算机业界对可靠性的定义 容错服务器独立服务器 阵的独立服务器 系统 消除单点心 系统结构复杂 环节过多,外部连接 故障发生点多 系统结构简单 如同单机,内部连接 故障发生点少 无单点故障的集群方案 无单点故障的容错方案

3、软硬件架构: 在系统架构中,容错服务器结构简单,且是单软件映像。 1、 工作原理比较: 硬软件结构复杂 依赖集群软件 对所有软件和硬件要求苛刻 切换机制只能覆盖部分实际应用情况 硬软件结构简单 纯硬件容错结构 对所有软件无特殊要求 时钟同步,无需切换

容错方案在出现任何单点故障的情况之下系统工作状态均不会中断,且是零切换时间,进而完整的保护了静态数据及动态数据。 2、维护管理及实施比较: 由于容错服务器的冗余全部是依靠硬件完成的,避免了对软件及人为因素的依赖,因此,其实施及维护非常简单、方便。 3、集群和容错软硬件可靠性实测比较: System Application Fault-Tolerant Cluster Conventional 容错方案的软硬件可靠性是最高的;集群方案虽然略微提高了硬件的可靠性,但却牺牲了软件本身的可靠性。

HCSCA105 HCNA-Security-CBSN 第五章 防火墙双机热备技术V2.5

1

●双机热备份技术的出现改变了可靠性难以保证的尴尬状态,通过在网络出口位置部署两 台或多台网关设备,保证了内部网络于外部网络之间的通讯畅通。 ●USG防火墙作为安全设备,一般会部署在需要保护的网络和不受保护的网络之间,即位 于业务接口点上。在这种业务点上,如果仅仅使用一台USG防火墙设备,无论其可靠性多高,系统都可能会承受因为单点故障而导致网络中断的风险。为了防止一台设备出现 意外故障而导致网络业务中断,可以采用两台防火墙形成双机备份。

●为了避免路由器传统组网所引起的单点故障的发生,通常情况可以采用多条链路的保护 机制,依靠动态路由协议进行链路切换。但这种路由协议来进行切换保护的方式存在一定的局限性,当不能使用动态路由协议时,仍然会导致链路中断的问题,因此推出了另一种保护机制VRRP(虚拟路由冗余协议)来进行。采用VRRP的链路保护机制比依赖动态路由协议的广播报文来进行链路切换的时间更短,同时弥补了不能使用动态路由情况下的链路保护。 ●VRRP(Virtual Router Redundancy Protocol)是一种基本的容错协议。 ●备份组:同一个广播域的一组路由器组织成一个虚拟路由器,备份组中的所有路由器一 起,共同提供一个虚拟IP地址,作为内部网络的网关地址。 ●主(Master)路由器:在同一个备份组中的多个路由器中,只有一台处于活动状态, 只有主路由器能转发以虚拟IP地址作为下一跳的报文。 ●备份(Backup)路由器:在同一个备份组中的多个路由器中,除主路由器外,其他路 由器均为备份路由器,处于备份状态。 ●主路由器通过组播方式定期向备份路由器发送通告报文(HELLO),备份路由器则负责 监听通告报文,以此来确定其状态。由于VRRP HELLO报文为组播报文,所以要求备份组中的各路由器通过二层设备相连,即启用VRRP时上下行设备必须具有二层交换功能,否则备份路由器无法收到主路由器发送的HELLO报文。如果组网条件不满足,则不能使用VRRP。

容错关键技术

容错关键技术 一个容错系统包含四个要素:首先是故障检测,这是容错系统必不可少的环节,其他环节以此为基础;其次是对出现的故障所造成的影响进行评估并限制其进一步传播;最后是对确定为不可恢复的故障进行处理。 容错的基本步骤概括起来是故障检测→处理故障→系统恢复。 防止故障造成系统失效有两种基本技术:即是故障掩蔽技术和系统重组技术。 故障掩蔽是防止故障造成差错的各种技术,换句话说要将发生的故障隐蔽起来。这类技术不要求在容忍故障前检测故障,但要求做到故障包容。故障包容是指使故障的影响局部化,不希望一个故障全局地影响整个系统的性能。在故障效应达到模块的输出之前,通过隔离或校正来消除它们的影响,从而达到容错的目的。 掩蔽技术不改变系统的结构,即系统部件的逻辑关系相对固定,因此掩蔽技术又称静态冗余技术。当掩蔽冗余因模块中的故障而耗尽时,再发生故障就会在输出产生错误。 系统重组是防止差错导致系统失效的各种技术。系统重组技术首先做到故障检测,然后做到故障定位,最后做到系统恢复。 系统重组技术称动态冗余技术。 故障掩蔽技术及系统重组技术是达到容错的两种基本途径。而它们又建立在资源冗余的基础上的。资源冗余主要有两种基本形式:硬件冗余和软件冗余。 1、硬件冗余 实时系统中应用最广泛的冗余形式是硬件的物理重复。随着半导体元件体积的缩小及成本的下降,硬件冗余成为更实用的一种冗余方法。硬件冗余有两种形式:被动冗余和主动冗余。 被动硬件冗余又称静态硬件冗余,是指冗余结构并不随故障情况的变化的冗余的形式。被动硬件冗余应用了故障掩蔽的概念,将发生的故障隐蔽起来,防止故障造成差错。被动硬件冗余的基本机理是通过多数表决隐蔽发生的故障。这种冗余方法一般用于多机系统。 主动硬件冗余又称动态硬件冗余,是通过故障检测,故障定位及系统恢复来

双机热备ServHA 镜像集群节点更换操作教程

ServHA镜像集群节点更换(或重新连入)操作手册一、手册目的 本手册介绍ServHA镜像集群的节点更换、节点重新连入的操作步骤,当用户部分硬件损坏、系统及其应用重新安装导致的原有集群配置丢失时,可按照本手册操作步骤对集群进行恢复。 注:如严格按照本手册操作,可以在集群对外服务不中断的情况下将重新连入的节点加入集群。 手册中我们假定原有集群中一台服务器的集群配置完全丢失(同时其应用也均未安装,如更换了硬盘、重新安装了操作系统),下文中这台配置丢失的服务器我们称之为“新节点”(因为其配置完全丢失,在集群看来,这完全是一个全新的节点),原有的正常服务的主机我们称之为“原节点”。 本手册前提为:新节点完全与集群脱离关系,原节点还在受集群管理,集群对外服务正常,只是新节点在集群看来已经完全离线。 (我们以一次MySQL镜像集群恢复全过程作为例子,至于其他应用其原理与操作步骤都与此例相同。) 二、配置前准备工作 首先镜像集群中目前对外正在服务,所以新节点连入时,其业务数据必须以原节点为准,在配置前,必须在新节点划分出一个大于等于原节点镜像盘空间的分区,这个分区作为新节点的镜像盘,这样才能在不损失数据(数据是以原节点镜像盘为准的)的同时将新节点连入镜像集群,这点非常重要。同时记得将新节点的IP地址等还原为离线前的状态(即设置新节点的IP地址为之前集群中离线节点的IP地址)。

在新节点完全脱离集群后,集群工作状态如下图(配置监控端):(此例中节点192.168.1.91 为新节点、192.168.1.92为原节点)双机连接状态 资源树状态,此时原节点正常对外服务(即192.168.1.92) 镜像包状态

PLUSWELL双机热备

PLUSWELL多机集群、数据备份 解决方案

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。 蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程 发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信 息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在 安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

stratus ftserver 2700 容错服务器 说明书

容错服务器ftServer2700/4700/640 0操作与维护指南

第一部分系统概览 系统特征 Stratus ftServer2700、4700和6400系统包含冗余的组件,他们同时处理相同的指令(锁步技术)。如果其中一个组件出现错误,它的冗余组件将会继续工作,消除系统停机时间和数据丢失。 Stratus故障安全软件为时钟同步技术增加了一个安全层,阻止许多因为停机或者断电所引起的软件错误。软件问题被捕获、分析,报告给Stratus,允许技术支持人员在软件问题出现之前准确定位出错处。Stratus 的强化的设备驱动更加的增强了在ftServer系统上的操作系统的可靠性。 Stratus ActiveService Network(ASN)提供可选的远程服务和Stratus Customer Assistance Center(CAC)的系统事件管理或者你的授权的Stratus服务代理商。 很多ftServer系统的组件是用户可更换单元(CRU),允许最少的培训或工具的现场人员进行简单移除和替换故障组件。 系统图释 每个ftServer2700,4700和6400系统都是安装在机架上的,包括底盘和两个CPU-I/O模块,前端面板由一个DVD驱动和USB口组装成,黑色的面板是由一个可选的连接到ASN网络的调制解调器组成,整个机器还包括一些外围组件。 ftServer2700,4700和6400系统分别为下列配置: ●ftServer2700系统:单路四核处理器 ●ftServer4700系统:双路四核处理器 ●ftServer6400系统:双路八核处理器 注意··················································· 在ftServer2700系统中,在second插槽中仍然有散热片以便气流通畅。 图1-1展示ftServer2700,4700和6400系统包含宝石切面外科的前置外观。在宝石切面外 壳的右上边有四个灯管,当外壳被安装的时候它们提供了系统状态等的显示信息。

Windows server 2003双机热备教程(共享磁盘阵列式)

Windows 2003双机热备 时间:2010-06-06 23:05来源: 作者:编程点击:1804次 Windows2003标准版没集成双机热备份软件,只有用企业版的。系统安装本文所述双机热备是采用微软公司Windows2003 Server操作系统,非第三方管理软件。硬件需求:1、两台服务器,一台为主域控制器,另一台为额外域控制器;... Windows2003标准版没集成双机热备份软件,只有用企业版的。 系统安装 Windows2003 Server操作系统,非第三方管理软件。 、两台服务器,一台为主域控制器,另一台为额外域控制器; 2、每台服务器配置两块网卡,和两块阵列卡(一块做本地服务器磁盘阵列,另一块连接磁盘柜阵列); 3、一台用来共享资源的存储设备(本文为Dell221s磁盘阵列柜); 、一条点对点的反转网线(充做心跳线);两条将服务器接入网络的网线。 行数据转移。以下一同描述主域控制器和额外控制器的安装: 1、服务器分为主域控制器(主服务器)和额外域控制器(从服务器),这里将主域控制器标名为hrb0,将额外域控制器标名为hrb1; 2、将hrb0 的第一块网卡做为外网(局域网)使用的网卡,表明public,第二块网卡做为私网(与hrb1的连接)使用的网卡,表明private; 3、在主服务器上安装Windows 2003 Server Enterprise(过程略); 4、配置tcp/ip协议: 外网: 10.195.10.18 掩码:255.255.255.0 网关:10.195.10.210 DNS:10.195.10.19 10.195.10.18(把对方服务器IP作为本机的主DNS,本机地址做备用DNS) 内网: 192.168.0.1 掩码:255.255.255.0 (网关空) DNS: 192.168.0.2 192.168.0.1(把对方服务器IP作为本机的主DNS,本机地址做备用DNS) 5、安装补丁; 6、其它相关配置完成后,关闭服务器,准备连接磁盘阵列; 7、将磁盘阵列柜的应用模式调至"群集模式"(在盘柜的背面有滑动开关,调至靠近模块拉手一侧);由于在"群集模式"下,RAID卡会占用ID15的槽位,所以ID15槽位的磁盘在以后的配置应用过程中不会起到作用,建议将盘柜ID15槽位的硬盘取下,做为以后的备用硬盘。 8、将主域控制器的RAID卡连接线接至磁盘柜的EMM插口,磁盘阵列的另一EMM插口留给额外域控制器,如果服务器上的阵列卡是双通道的,两个服务器连接SCSI线的通道要一致。(即:如果主域控制器是连接通道1,则额外域控制器也需要连接通道1); 9、顺序开启磁盘阵列柜、主域控制器; 10、启动服务器,在开机过程中根据提示,配置阵列卡(阵列卡详细配置参见第二部分文档)。 11、服务器重启进入Windows 2003 桌面后,右键点击"我的电脑"-'管理'-'磁盘管理',这时可以看到磁盘阵列已经被计算机搜索到,但没有分区和分配盘符,不能应用; 12、在磁盘显示栏中,右键点击"磁盘0"(磁盘阵列柜)的位置,将磁盘阵列的磁盘"转换到基本磁盘"; 13、给磁盘阵列分区时要特别注意,所有的磁盘分区必须为"主磁盘分区";第一个分区的大小推荐为1G,这是预留给群集中的仲裁磁盘专用的;其它的分区大小根据实际应用确定;分配盘符时要考虑额外域控制器的分区,做到两台服务器一致;(提示:每台域控制器最好留有空闲的磁盘,作为突发情况使用,磁盘阵列柜上的所有磁盘分区必须格式化为NTFS。) 域控制器配置详解 域控制器的创建有主域控制器创建和额外域控制器创建两种,额外域控制器的创建直接参阅第22 条。 1、域控制器的创建,域控制器的创建是以后其他工作的基础,在安装Windows 2003 Server之后创建的,Win2003安装后首要配置网卡的IP地址。 2、Ip地址配置完成后开始创建域控制器:"开始"-"程序"-"管理工具"-"配置您的服务器向导"。 3、在欢迎窗口中直接点击"下一步"; 4、配置向导会检测本机河网络中的配置,如果服务器中的两个网卡有其中一块没有插入网线或额外控制器服务器没有开启,向导会有警告提示,但不会影响后续的配置,可以直接"继续"通过; 5、如果是配置群集中的主域控制器(第一个域控制器),在单选中要选择"第一台服务器的典型配置",如果不是第一个域控制器,选择"现有域的额外域控制器";

服务器双机热备方案

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID 技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID

技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器

冗余设计与容错设计

冗余设计与容错设计 1.冗余与容错的概念 提高产品可靠性的措施大体上可以分为两类:第一类措施是尽可能避免和减少产品故障发生的避错”技术;第二类措施是当避错难以完全奏效时,通过增加适当的设计余量和替换工作方式等消除产品故障的影响,使产品在其组成部分发生有限的故障时,仍然能够正常工作的“容错”技术。而冗余是实现产品容 错的一种重要手段。

“容错(fault tolerance)”定义:系统或程序在出 现特定的故障情况下,能继续正确运行的能力。“冗余(redundancy)”定义:用多于一种的途径来完成一 个规定功能。“容错”反映了产品或系统在发生故障情 况下的工作能力,而“冗余”是指产品通过多种途径完成规定功能的方法和手段。“容错”强调了技术实施的最终效果,而“冗余”强调完成规定功能所采用的不同方式和途径。严格地说,冗余属于容错设计范畴。 从原理上讲,冗余作为容错设计的重要手段,其实施流 程和原则也同样适用与其他容错设计活动。

2.冗余设计 2.1.目的 冗余设计主要是通过在产品中针对规定任务增加更多的功能通道,以保证在有限数量的通道失效的情况下,产品仍然能够完成规定任务。

2.2 .应用对象 (a) 通过提高质量和基本可靠性等方法不能满足任务可靠性 要求的功能通道或产品组成单元; (b)由于采用新材料、新工艺或用于未知环境条件下,因而其任务可靠性难于准确估计、验证的功能通道或产品组成单元; (c)影响任务成败的可靠性关键项目和薄弱环节; (d)其故障可能造成人员伤亡、财产损失、设施毁坏、环境破坏等严重后果的安全性关键项目; (e)其他在设计中需要采用冗余设计的功能通道或产品组 成单元。

ORACLE 10g双机热备安装手册

ORACLE 10G双机热备安装手册 1安装前准备 ●Windows 20003操作系统已经安装好群集,确保服务器群集正常 ●群集配置如下: ?SERVER1机(xjmes3)PUBLIC IP 地址:10.205.28.217 ?SERVER2机(xjmes4)PUBLIC IP 地址:10.205.28.218 ?群集(xjmesserver)虚拟IP 地址:10.205.28.216 ●O盘为IBM DS300磁盘柜的盘符,为共享磁盘。 ●ORACLE 10G 数据库服务器软件 2在Server1机上安装Oracle 10G 群集切换到Server1上,Server2关机。 在o盘建oracle和log两个空文件夹。 2.1修改HOSTS文件 修改Server1机器上的HOSTS文件(在C:\WINDOWS\system32\drivers\etc文件夹中)如下图:

2.2仅安装数据库软件 在Server1机安装ORACLE,不安装数据库文件,只安装ORACLE数据库软件,主目录安装在本机磁盘(如C盘)。 ●在下图安装类型中选择高级安装: ●点击下一步,进入下图页面:

●把上图的路径o改成c (服务器本机自带的盘符),点击下一步,进入下图页面: ●点击上图页面的下一步,进入下图:

●当上图页面左下侧出现“0个要求将验证”时,点击下一步,将进入下图页面: ●在上图中选择“仅安装数据库软件”,再点击下一步按钮,进入下图页面:

●点击上图页面的安装按钮,进入下图页面: ●若需要改动可以点击上图“停止安装”按钮,然后点击“上一步”,即可进行调整,如果不需 要改动等安装进行到100%后,将会自动进入安装结束页面下图:

ftServer容错服务器日常维护手册

ftServer容错服务器日常维护手册 2009-9-9 上海海得 1. ftServer 系统启动和关闭 每个ftServer 服务器都有两个电源按钮(每个CPU-IO 机箱都有一个电源按钮),在系统插上电源线后,系统中仅有一个电源按钮亮灯,且处于活动(Active)状态,这个按钮被称为主用按钮(Primary), 可用于当前系统的启动。另外的那个电源按钮被称为备用按钮(Standby)。(在一定条件下,主用按钮和备用按钮会做切换。)ftServer 服务器需要连接两路电源,我们建议至少其中的一路使用UPS输出的电源,以防因电源故障造成的系统停机;ftServer 服务器背部有连接显示器的端口,还有3 个USB口供连接键盘和鼠标使用。 如果我们需要启动系统,只要先打开显示器电源,然后按一下ftServer 的主用按钮即可;在正常情况下,如果需要关闭系统,必须在Windows系统中操作:开始——关机——确定, Windows会处理当前文件操作,并关闭系统。 在系统运行时,如果我们长时间按下主用电源按钮,可以强行关闭系统操作(这可能会导致系统或应用数据被破坏,用户应承担相应的风险) 2. ftServer 上的各种LED指示灯 ftServer 服务器上有各种LED 指示灯,它们显示了当前的系统或部件的运行情况; 分别说明如下: CPU-IO机箱状态指示灯 每个CPU-IO 机箱均有两组状态指示灯,分别位于机箱前部的左侧(机架式)或下方(塔式)和机箱后部的左下侧(机架式)或左上侧(塔式)。每组指示灯中有一个绿灯代表电源指示灯;有一个红灯代表故障鉴别灯;有一个白/橙双色灯代表单双运行状态灯;(见下图)观察这些指示灯,可以大致判断该CPU-IO机箱的当前运行情况。 (机箱前部) (机箱后部)

Excel服务器教程

目录 目录 (11) Excel服务器教程 (33) 第一章引言 (33) 一.什么是Excel服务器 (33) 二.Excel服务器的主要特色 (33) 三.Excel服务器版本功能区别以及适用对象 (55) 四.使用Excel服务器需要的环境 (55) 第二章安装Excel服务器 (77) 一.Excel服务器企业版的安装 (77) 二.Excel服务器客户端的安装方法 (1717) 三.卸载 (2121) 四.升级安装 (2222) 第三章 Excel服务器的设置与登录 (2323) 一.MS Office相关配置 (2323) 二.IE的配置 (2323) 三.启动“Excel服务器服务” (2525) 四、登录Excel服务器管理控制台 (2626) 五、Excel服务器客户端连接与断开 (2727) 第四章 Excel服务器的初始设置 (2929) 一.设置全局公共信息 (2929) 二.建立部门 (3030) 三.定义角色 (3131) 四.添加用户 (3333) 第五章 Excel服务器的简单应用 (3535) 一、建立一个Excel服务器模板 (3535) 二、定义数据项 (3838) 第六章数据规范 (4747) 一.报表的填报 (4747) 二.问题 (4848) 三.数据规范 (4949) 四.为模板定义数据规范 (5050) 五.应用数据规范 (5252) 第七章函数 (5555) 一.用“客户名称”带出“责任销售员”。 (5555) 二.用“产品名称”带出“计量单位”。 (5858) 三.应用ESF_mnyToCap将小写金额转变为大写金额 (6060) 第八章表间公式 (6262) 一.定义 (6262) 二.实现表间公式 (6262) 第九章工作流........................................ 错误!未定义书签。错误!未定义书签。 一.定义......................................... 错误!未定义书签。错误!未定义书签。 二.实例......................................... 错误!未定义书签。错误!未定义书签。 第十章统计与查询.................................... 错误!未定义书签。错误!未定义书签。 一.销售日汇总................................... 错误!未定义书签。错误!未定义书签。 二、查询的实现................................... 错误!未定义书签。错误!未定义书签。 第十一章外部数据源.................................. 错误!未定义书签。错误!未定义书签。 一.引入MS ACCESS数据源......................... 错误!未定义书签。错误!未定义书签。 二.MS SQL Server 2000作为外部数据源 ............ 错误!未定义书签。错误!未定义书签。

双机热备解决方案讲解

双机热备解决方案 方案特点: 双机热备可以采用第三方双机软件实现,也可以采用windows server系统自带的mscs来实现双机热备。两套相同应用的服务器采用主/备机模式,主备机采用心跳线连接, 备机会监测主机的运行状态,如果主机出现故障,备机可以自动接管主机的应用继续服务,保证业务的连续性。双机热备的方案建议采用存储设备,数据全部存放在存储设备中,保证数据的一致性,可以让备机顺利接管主机应用。也可以选择不带存储来实现双机。需要软件支持,相当于两台服务器做镜像的模式。 避免的风险: 随着业务对IT系统的依存度越来越高、为保证业务连续性、IT系统的安定、连续运行成为必需。系统中断服务、业务被中断的可能性如下所示。 一、由于操作错误造成系统停止 二、软件/硬件故障 三、利用备份软件等进行恢复的情况下、长时间的操作导致业务中断 四、自然灾害 您的收益: 一、系统安全:双重保护,实时保护公司重要的无形资产 二、业务连续性:IT系统7x24在线,减少停机时间,提供最优质的IT服务 三、IT体验:提高企业员工IT使用体验,提高工作效率 四、满意度:先进的IT系统能更好的服务客户,提高客户满意度

WINDOWS故障转移群集 故障转移群集是一种高可用性的基础结构层,由多台计算机组成,每台计算机相当于一个冗余节点,整个群集系统允许某部分节点掉线、故障或损坏而不影响整个系统的正常运作。一台服务器接管发生故障的服务器的过程通常称为"故障转移"。 如果一台服务器变为不可用,则另一台服务器自动接管发生故障的服务器并继续处理任务。群集中的每台服务器在群集中至少有一台其他服务器确定为其备用服务器。 故障转移群集可应用于Windows server 2003、Windows server 2008、Windows 2012 server等操作系统中部署。 适用环境 1. 硬件组件、应用程序或服务出现故障导致程序或服务无法使用或影响工作;例 如某服务器电源出现故障,如果该该服务器和电源都是唯一的,则存在单点故障, 并且服务器提供的应用程序将不可用。 2. 计划内的服务器停机或维护影响应用程序的可用性;例如要更新无备用服务器 的一台数据库服务器 上的操作系统,你可能需要重启或停止应用程序服务才能安装更新修补程序; 3. 监视和维护多服务器层增加了对系统和网络资源的要求。例如你需要多台服务 器提供多种应用程序服务,各自独立的服务器不利于监视与维护; 工作原理 故障转移群集必须基于域的管理模式部署,以“心跳机制”来监视各个节点的健康状况;备用服务器以心跳信号来确定活动服务器是否正常,要让备用服务器变成活动服务器,它必须确定活动服务器不再正常工作。 同步状态 备用服务器必须首先将其状态与发生故障的服务器的状态进行同步,然后才能开始处理事务。主要有三种不同的同步方法:

对容错服务器的正确理解

被误读的NEC容错服务器 误读一:容错很好很昂贵 由于容错服务器采用的是硬件全冗余的技术,而且在两套硬件之间还通过独立芯片和软件保证故障时零时间切换,因而其价格要比同规格的PC服务器高出许多。 更为典型的一个用户反馈是:NEC容错服务器产品很好,可用性很高,但是不是像IBM的z系列和HP的NonStop系列动辄都是百万美元? 从上述两种态度可以看出中国用户对容错的应用定位尚属模糊。根据IDC 数据,广义概念上的容错市场约占整个服务器市场的4%,包括IBM的System z、HP的NonStop和NEC的Santa Clara、Express 5800/ft以及Stratus的ftServer 6200,前三者为传统大型主机,后二者为容错服务器。显而易见,这一市场面对的是属于中高端的窄众用户。 而了解上述用户特征后自然明白,容错所谓的昂贵其实纯属误读:如果只需要进行基础IT建设的成长型企业,完全可以采用普通的塔式和机架式服务器,而不必使用容错产品;如果是需要高可用性的中高端用户,那么容错服务器相对大型主机而言,其实相当便宜。以NEC的容错服务器Express 5800/ft为例,目前最低配置的成本甚至已经与同规格的双机热备方案相当。 误读二:虚拟化取代容错 随着用户对计算资源利用率、灵活调度的高度渴求,导致近几年来虚拟技术在PC服务器上快速增长,VMware、Citrix等技术供应商也迅速走红,由此也产生了这样一种观念:虚拟万能,即通过虚拟就能实现计算资源的灵活配置、调度并保证故障时的自动迁移。 虚拟化真是万灵丹吗?显然不是。从硬件架构的层次上看,虚拟层位于底层硬件之上,只能解决虚拟机及其应用的故障迁移。如果是底层硬件故障,诸如主板故障、电源故障、CPU损坏等,虚拟技术是无能为力的。 随着虚拟化技术的普及,容错服务器会变得越来越重要。因为当物理机宕掉的时候,它会影响运行在其上的虚拟机,所以越是依赖虚拟技术的用户越需要保证底层硬件的高可用。 误读三:容错使用很复杂 对于使用过大型主机和双机热备等高可用方案的用户来说,配置及管理系统绝对是一个技术上的考验。这也使得一些用户产生了“高可用等于高复杂”的观点。

容错服务器技术vs双机冗余

容错服务器技术vs双机冗余 2009-05-21 来自:网界网作者:宋家雨收藏 单机容错技术以Stratus公司的ftServer、惠普公司的NonStop服务器和NEC公司的Express5800/ft为代表。这种技术具有比双机冗余方案更高的容错能力。 1980年,当Bill Fost先生苦思冥想在为新公司取个什么名字的时候,无意间看到了飞机外层层叠叠的云层,由此“Stratus”诞生了。但是Bill Fost没有想到,1990当他们注册北京办事处的时候,竟然可以使用“美国容错计算机公司”,这种用技术术语命名公司的现象,此后再也没有出现过。不知道国内有多少用户知道“美国容错计算机公司”,进而了解容错技术,但是相信,这几年数量有限与很多技术领先型公司相类似,“酒香不怕巷子深”是其风格,市场上的低调在一定程度上制约了发展。 容错的含义比较宽泛,这种不确定性容易引发歧义,增加理解上的难度。从概念上来说,容错是指服务器对于错误的容纳能力,是应用过程中对于服务器稳定性追求的一个目标。为了这样一个目标,有几种技术上的实现方法,目前国内谈论最多的是三种:服务器群集技术、双机冗余服务器方案和单机容错技术。 实际上,服务器群集和双机冗余的技术比较类似,双机冗余是最简单的集群,是其一个特例,也可以把服务器集群技术视为双机冗余的延伸,可以理解为一种多机容错的方案。在一般的讨论之中,集群技术是为了解决计算性能不足的问题,通过多台服务器的集群计算,为高性能计算领域应用提供所需要的高性能。采用集群技术,通过多台服务器之间的负载均衡,可以解决服务器单点故障所引发的系统不稳定,提高系统的可靠性,因此集群具有更好的容错能力,但是在实际的应用中,集群技术多用于高性能计算。 单机容错技术以Stratus公司的ftServer、惠普公司的NonStop服务器和NEC公司的Express5800/ft为代表。这种技术具有比双机冗余方案更高的容错能力。据记者查阅有关技术资料,双机冗余系统的可靠性可以达到99.9%,也就是3个9的能力,而Stratus公司的方案,其可靠性可以达到5个9。在记者的采访中,惠普公司企业服务器产品经理陈武胜表示,其NonStop服务器作为目前惠普公司最高档的服务器,其可靠性可以达到7个9的水平。在记者看来,双机冗余与单机容错有很多的差异,绝不是3个9和5个9的区别。为了了解这些区别,记者分别采访了有关软硬件厂商,并结合实际的应用案例,帮助读者了解有关容错服务器的技术。 产品技术篇之一“没有错误”的容错服务器技术 单机容错技术是我们为了区别双机冗余技术对Stratus等容错服务器的称谓,但是在我的采访中,有关服务器厂商都不愿意采用这个称谓,他们更愿意采用容错服务器,因为单机只是一个表现形式,并不能准确表达其技术的特征。IDC资询师将这种技术称之为“没有错误”的容错服务器技术。 容错与同步技术

网络工程规划与设计案例教程项目三_任务四_H3C_SecPath_T200-M_IPS

H3C SecPath T200-M 入侵防御系统 一、产品概述 H3C SecPath T200-M IPS (Intrusion Prevention System )集成入侵防御与检测、病毒过滤、带宽管理和URL 过滤等功能,是业界综合防护技术最领先的入侵防御/检测系统。通过深入到7层的分析与检测,实时阻断网络流量中隐藏的病毒、蠕虫、木马、间谍软件、网页篡改等攻击和恶意行为,实现对网络应用、网络基础设施和网络性能的全面保护。SecPath T200-M IPS 适用于小型网络的数据中心和中小型网络边界。 图1 SecPath T200-M 外观 二、典型组网 IPS 在线部署方式部署于网络的关键路径上,对流经的数据流进行2-7层深度分析,实时防御外部和内部攻击。 路由器交换机SecPath IPS 在线部署模式 内部网络 图2 SecPath T200-M 在线部署 IDS 旁路部署方式对网络流量进行监测与分析,记录攻击事件并告警。 路由器交换机 SecPath IPS 旁路部署模式 内部网络 镜像 图3 SecPath T200-M 旁路部署 三、产品特点

1、强大的入侵抵御能力 SecPath IPS是业界唯一集成漏洞库、专业病毒库、应用协议库的IPS产品,特征库数量已达10000+。配合H3C FIRST(Full Inspection with Rigorous State Test)专有引擎技术,能精确识别并实时防范各种网络攻击和滥用行为。SecPath IPS通过了国际权威组织CVE(Common Vulnerabilities & Exposures,通用漏洞披露)的兼容性认证,在系统漏洞研究和攻击防御方面达到了业界顶尖水平。 2、专业的病毒查杀 SecPath T200-M IPS集成卡巴斯基防病毒引擎,内置卡巴斯基专业病毒库。采用第二代启发式代码分析技术、独特的实时监控脚本病毒拦截技术等多种最尖端的反病毒技术,能实时查杀大量文件型、网络型和混合型等各类病毒;并采用新一代虚拟脱壳和行为判断技术,准确查杀各种变种病毒、未知病毒。 3、零时差的应用保护 H3C专业安全团队密切跟踪全球知名安全组织和厂商发布的安全公告,经过分析、验证所有这些威胁,生成保护操作系统、应用系统以及数据库漏洞的特征库;H3C通过了微软的MAPP (Microsoft Active Protections Program)认证,可以提前获得微软的漏洞信息。同时,通过部署于全球的蜜罐系统,实时掌握最新的攻击技术和趋势,以定期(每周)和紧急(当重大安全漏洞被发现)两种方式发布,并自动或手动地分发到IPS设备中,使用户的IPS设备在漏洞被公布的同时立刻具备防御零时差攻击的能力。 4、带宽滥用控制 SecPath T200-M IPS能帮助用户遏制非关键应用抢夺宝贵的带宽和IT资源,从而确保网络资源的合理配置和关键业务的服务质量,显著提高网络的整体性能。 5、网络基础设施保护 SecPath T200-M IPS具有强大的攻击防护和流量模型自学习能力,当攻击发生、或者短时间内大规模爆发的病毒导致网络流量激增时,能自动发现并阻断攻击和异常流量,以保护路由器、交换机、VoIP系统、DNS服务器等网络基础设施免遭各种恶意攻击,保证关键业务的通畅。 6、灵活的组网模式 透明模式,即插即用,支持在线或IDS旁路方式部署;融合了丰富的网络特性,可在MPLS、802.1Q、QinQ、GRE等各种复杂的网络环境中灵活组网。 7、便捷的管理方式 支持本地和分布式管理。在单台或小规模部署时,通过IPS内置的Web界面进行图形化管理;在大规模部署时,可通过H3C安全管理中心SecCenter对分布部署的IPS进行统一监控、分析与策略管理。

相关文档
最新文档