服务器软件故障

服务器软件故障
服务器软件故障

服务器软件故障

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。

有一台HP LH6000R服务器,配置为双PIII XEON700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module(VRM)over/under-voltage2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。

FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH/CMC A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH 命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。

任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。

目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。

当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是

否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具

服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。

服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。

相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。

曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。

这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。

在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随操作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL 一切正常。

对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。

还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。

人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。

正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的

HP web hosting server appliance,因此我向他提供了一些使用规则。

这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它操作系统均有效)。

正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才

能使系统进入正常的关闭过程中。

另外,为了避免数据丢失,你应该按照如下的步骤操作:

·经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。

·安装第二块硬盘并与原来的硬盘设置成镜像,

一旦Server Apliance未能正确关闭,并无法重起,请按如下操作恢复:

1.当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。

2.连接串口线的另一头到一台运行Windows的PC的串口上。

3.运行超级链接程序(HyperTerminal),并设置端口的参数为19200,n-8-1, Flow control-None.你可以看到appliance的控制提示,并要求你输入管理员口令。

4.重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。

5.敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。

6.在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)

翻至Defaults…并按右箭头键选中。

翻至Root Password…并按右箭头键选中。

翻至Random并按右箭头键选中,会提示一个随机产生的密码。

记下此密码。

翻至Yes并按右箭头键选中,系统密码会立刻更改。

7.回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。

8.为修复分区,请按如下方法操作:

对于sa1100,按顺序输入:

[…]#:fsck/dev/hda5

[…]#:fsck/dev/hda6

[…]#:fsck/dev/hda7

对于sa1120,按顺序输入:

[…]#:fsck/dev/sda5

[…]#:fsck/dev/sda6

[…]#:fsck/dev/sda7

当所有的分区都被修复后,应回到“#”提示符下。

9.输入“reboot”重新启动系统。

如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。

对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。······································

说行天下是非常不错的小说网站大全,你值得拥有。

十大X86服务器常见故障——硬件篇

十大X86服务器常见故障——硬件篇 ?摘要:由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… ?标签:X86服务器常见故障 说起X86平台的CPU,我们可能会如数家珍的报出N多种,Inter的至强5600、至强7500,AMD强劲的12核心x86处理器--“Magny-Cours”(马尼库尔)等等。在它的基础上,辅以带ECC、ChipKill、热插拔技术的内存;防止数据异常丢失的RAID硬盘;提供不中断电力供应的冗余电源等等共同构建出一个完整的X86服务器。 由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。因此,X86应该算是我们广为熟知的架构了。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… 硬件故障篇 Top10 网卡 服务器网卡 故障回放:近几日,内网用户通过代理服务器进行连接时不太稳定,ping的速度有时低于1ms,有时高达500多ms,数值相差之大也说明了网络时好时坏。起先判断是蠕虫病毒作祟,但经过详细筛查,确定非病毒引发的故障;再对网线进行测试,衰减、串扰、回波损耗等各项技术指标都在正常指标之内,最后更换网卡故障才得以解决。 解决方案:我们知道一款优秀的网卡除了拥有高速率外,还需要关注2个技术指标,TOE(TCPOffloadEngine,TCP减负引擎)技术和RSS(Receive-sideScaling接收端调节)技术,它们能大幅减轻CPU的资源,解决了输入/输出流(I/O)的瓶颈,使网络吞吐大幅提升,这两项技术可以使系统的响应指标的TPS值能提升2.1到2.5倍,所以一块好的网卡是保证服务器快速、稳定连接的保障。 一般来说,网卡出现故障的状况较低,即便是损坏也可以使用独立网卡代替,它的危害程度也不是很高。 危害程度:★★ 控制难度:★

服务器故障排除方法

服务器故障排除方法 本文主要是针对一些服务器出现的简单的故障进行排查处理,主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题,第二部分讲述了一些服务器硬件故障排除的实例,第三部分讲述了一些服务器软件故障排除的实例 第一部分服务器故障排除的基本原则性问题 一、服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压? 2.检查电源指示灯,如果亮,正常吗? 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗? 4.是否更换过显示器,更换另一台显示器。 5.去掉增加内存。 6.去掉增加的CPU 7.去掉增加的第三方I/O卡 8.检查内存和CPU 插的是否牢靠 9.Clear CMOS 10.更换主要备件,如系统板,内存和CPU 二、服务器故障排错的基本原则是什么 1.尽量恢复系统缺省配置

a:硬件配置:去除第三方厂商备件和非标配备件; b:资源配置:清除CMOS,恢复资源初始配置; c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序; d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗? 2.从基本到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。 3.交换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件; b: 交换NOS载体,既交换软件环境; c:交换硬件,既交换硬件环境; d:交换整机,既交换整体环境; 三、服务器故障排除需要收集哪些信息? 服务器信息: 1.机器型号 2.机器序列号(S/N: 如:NC00075534)

服务器维修故障诊断思路大全

前言: 相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。 本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦 当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决) 目录: 一、服务器常见故障分类 二、服务器常见故障现象及其对应排错方法 三、服务器排错基本原则 四、服务器故障需要收集哪些信息 五、服务器硬件故障排错实例 六、服务器软件故障排错实例 七、服务器常见内存故障现象 一、服务器常见故障类型分类: A. 开机无显示 B. 加电BIOS自检阶段故障 C. 系统和软件安装阶段故障和现象 D. 操作系统启动失败 E. 系统运行阶段故障 二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示) 1. 检查供电环境 2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。) 3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动 4. 是否更换过显示器,尝试更换另外一台显示器 5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试 6. 是否添加了CPU,如果有增加CPU尝试去掉 7. 去掉增加的第三方I/O卡包括Raid卡等 8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服) 9. 尝试更换主板、内存等主要部件 10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下 B.加电BIOS自检报错 1. 根据BIOS自检报错信息提示 2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启 3. 做最小化测试 4. 尝试清除CMOS 5. 看能否正常进入BIOS C. 系统安装阶段故障和现象 1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表) 2.系统安装蓝屏(对蓝屏故障代码诊断) 3.安装在分区格式化的时候找不到硬盘 (阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装) 4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡) (使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可) 5.安装过程是死机 (检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题) 6.引导光盘安装失败

服务器常见故障及解决办法

服务器常见故障排除 服务器常见故障一、造成服务器无法启动的主要原因: 1)市电或电源线故障(断电或接触不良) 2)电源或电源模组故障 3)内存故障(一般伴有报警声) 4)CPU故障(一般也会有报警声) 5)主板故障 6)其它插卡造成中断冲突 服务器常见故障二、服务器无法启动? 1)检查电源线和各种I/O接线是否连接正常。 2)检查连接电源线后主板是否加电。 3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 服务器常见故障三、系统频繁重启? 造成系统频繁重启的原因: 1)电源故障(替换法判断解决) 2)内存故障(可从BIOS错误报告中查出) 3)网络端口数据流量过大(工作压力过大) 4)软件故障(更新或重装操作系统解决) 服务器常见故障四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 1)软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 2)硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)

微软WSUS补丁管理服务器常见故障解决方法

微软WSUS补丁管理服务器常见故障解决方法 WSUS是由Microsoft提供的,为Microsoft操作系统、Microsoft Office、Microsoft服务器类产品(ISA Server等)和其他产品(Visual Studio系列等)提供补丁管理的服务器。许多企业都部署了WSUS服务器,但WSUS服务器的使用并不是一帆风顺的。本文介绍在使用WSUS服务器中碰到的几个重要问题并介绍解决方法。 当CPU占用率100% 在第一次配置WSUS服务器时,在为工作站配置并使用WSUS服务器升级系统时,有些工作站的速度会变得非常慢。这些工作站的任务管理器可能会显示CPU 占用率为100%, svchost.exe进程也可能占用100%或将近100%的CPU资源(如图1、图2)。 图1 CPU占用率100%

图2 svchost.exe占用了大量CPU资源 出现这种问题时,可以暂时中止svchost.exe进程,下载补丁并在工作站上安装,然后重新启动计算机就可以解决该问题。需要注意,在安装补丁的时候,出现图3所示的界面才表示补丁被正确安装了。在有的工作站上,需要反复多次地安装这个补丁才能解决问题。 针对这个问题,还有以下两点说明:1.WSUS服务器已经提供了这个补丁,但由于各种原因,有的工作站不能及时安装,所以就会出现CPU占用率100%的现象。2.当WSUS在后台自动安装补丁时,CPU占用率暂时可能会达到100%,但不会一直在100%,而是在40%~100%之间反复。出现这种情况是正常的。 工作站不能联系WSUS 在使用gpedit.msc配置工作站进行WSUS服务器更新,或把编辑好的“注册表文件”导入工作站并从企业内部进行WSUS服务器升级,在第一次做这些工作时,为了让工作站立刻从WSUS服务器下载补丁,需要在命令提示符下输入以下内容: Wuauclt /detectnow Wuauclt1 /detectnow 然后再使用netstat -an,如没有发现到WSUS服务器的连接,或没有使用上述命令,但过几天之后工作站没有从WSUS服务器下载任何补丁,并且在WSUS 服务器上也没有发现该工作站,那么需要在该工作站上安装WSUS客户端代理程序,并重新启动计算机来解决这个问题。

视频服务器核心技术及常见故障解决方法

视频服务器核心技术及常见故障解决方法 随着各地城市监控项目的需求,国内网络应用的稳定与高带宽的飞速发展,这些都成为推动网络监控走向市场的的外部因素。和视频服务器类似的产品就是视频编码器了,但很多时候我们把视频服务器和视频编码器等同起来,但真正的视频服务器和编码器的最大区别是视频服务器更重视视频编码数率和低带宽传输,真正做到优秀的视频算法和产品的结合。 视频服务器在监控中作用 什么是网络视频监控?网络视频监控是相对模拟监控和数字监控而言的。在模拟监控系统中,图像的传输、交换以及存储均基于模拟信号处理技术。数字监控引入了先进的数字信号处理技术,实现了以DVR为典型代表的数字化存储。而网络监控以数字信号处理为基础,采用网络化的方式实现信号的传输、交换、控制、录像存储以及点播回放,并通过设立强大的中心管理平台(CMS),实现对系统内所有编解码设备及录像存储设备的统一管理与集中控制。对用户而言,仅需登录中心管理平台,即可实现全网监控资源的统一调用、浏览和管理。网络视频监控实现了端到端的网络化,系统架构由IP前端、TCP/IP网络、中心管理平台、网络存储设备、电视墙解码器以及客户端等几个部分组成。 视频服务器从核心功能上可以分为视频编码器和视频解码器两大类。视频编码器位于网络视频监控系统的前端,而视频解码器则位于用户访问端(或称为后端)。 视频编码器用于实现前端信号(视频、音频及其它信号)的数字化压缩和网络化,具体功能包括监控点模拟视音频信息和报警信息的接入、编码/压缩、传输以及外围设备(如摄像机、云镜、矩阵等)的控制。上述信息经视频编码器处理后通过IP网络上传至中心管理平台,再由中心管理平台分发至客户端、视频解码器以及录像存储设备。 视频编码器与网络摄像机最大的差异在于,视频编码器的视频源来自模拟摄像机,需要与模拟摄像机配合使用,而网络摄像机是一体化的,本身就集成了模拟视频采集功能。从目前的情况来看,尽管网络摄像机正在大量涌现,但因为以下两个原因,视频编码器仍将在网络视频监控系统中占据不可替代的重要位置:一是大量已建的模拟和数字监控系统亟待网络化改造,为了保护现有模拟摄像机的投资,这些改造将产生庞大的视频编码器部署需求;二是目前网络摄像机的选择面还远远没有模拟摄像机大,难以满足不同用户差异化的应用需求,所以很多应用场合必须基于模拟摄像机加视频编码器的模式实现前端的数字化网络化。 视频解码器则用于在PC客户端的控制下接收平台转发过来的网络视频监控码流,解码输出模拟信号到电视墙、音响等外围设备,通常部署在用户的监控中心。视频解码器与PC客户端的不同在于,视频解码器一般基于硬件解码,通过专门的显示设备显示监控图像,而PC客户端直接通过PC显示屏显示监控图像。由于PC客户端还有更多控制管理功能,且接入灵活、操作方面,所以基于PC客户端进行监控浏览的应用越来越普遍。但由于视频解码器基于硬件,性能稳定、图像质量好,因此对于很多需要集中解码上墙的应用还是有着很普遍的意义。 网络视频服务器关键技术 ARM+DSP双核构架 目前市场上的主流处理芯片,包括TI的达芬奇系列和海思的3510系列都采用了ARM+DSP 的双核架构。在这个架构中,ARM是芯片的主控处理器,负责控制芯片各个模块的工作以及运行操作系统、网络协议、应用软件等;DSP系统主要负责视音频编解码业务处理,通过处理器配合视频编解码模块共同完成音视频的编解码。 H.264视频压缩算法 H.264是由ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家

服务器常规维修与判断方法

服务器故障排除方法 相比PC而言,服务器出故障的机率是小多了,但是它出故障造成的损失可也大多了。作为服务器维修人员需要了解一些服务器故障恢复的基本知识,知道在维修时可以做些什么来最快速的解决问题也可以减少故障停机时间。 本文并不是一本服务器故障解决的完全手册,但如果能够认真的按照下面的步骤维修维护,它也许可以解决大多数问题,但当你做完所有的这一切仍不管用时,不用惭愧,去找维修专家吧,可以放心的是,这些维修步骤不会出现大的损害,最坏的情形是“It does not work at all”。 本文主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题。第二部分讲述了一些服务器硬件故障排除的实例。第三部分讲述了一些服务器软件故障排除的实例 第一部分服务器故障排除的基本原则性问题 一、服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压? 2.检查电源指示灯,如果亮,正常吗? 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗? 4. 是否更换过显示器,更换另一台显示器。 5. 去掉增加内存 6. 去掉增加的CPU 7.去掉增加的第三方I/O卡 8. 检查内存和CPU 插的是否牢靠 9. Clear CMOS 10. 更换主要备件,如系统板,内存和CPU 二、服务器故障排错的基本原则是什么 1. 尽量恢复系统缺省配置

a:硬件配置:去除第三方厂商备件和非标配备件; b:资源配置:清除CMOS,恢复资源初始配置; c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序; d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗? 2. 从基本到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。 3. 交换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件; b: 交换NOS载体,既交换软件环境; c:交换硬件,既交换硬件环境; d:交换整机,既交换整体环境; 三、服务器故障排除需要收集哪些信息? 服务器信息: 1.机器型号 2.机器序列号(S/N: 如:NC00075534) 3.Bios 版本 4.是否增加其它设备,如网卡,SCSI 卡,内存,CPU 5.硬盘如何配置,是否做阵列, 阵列级别 6.安装什么操作系统及版本(Winnt 4, Netware, Sco, others)

服务器常见软件故障分析及解决

服务器常见软件故障分析及解决 服务器软件故障是在服务器故障中占有比例的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。 有一台HP LH6000R服务器,开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:"Voltage Regulator Module (VRM) over/under-voltage 2.88V/0V"。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。 维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。 FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为Flash.EXE,然后将从网上下载的LH6KC.BIN(CPU管理板的FIRMWARE)拷贝到一张Dos启动盘上,用这张盘启动服务器。然后

在DOS下运行"FLASH /CMC A:LH6KC.BIN",刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH 命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。 任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。 目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。 当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU 占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。 由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以Windows NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有

DELL服务器硬件报错——错误代码和解决方法

以下为DELL服务器常见硬件故障代码,帮助大家快速定位DELL服务器硬件故障。代码文本原因纠正措施 E1000Failsafe voltage error.Contact support.(故障保护电压错误。请联 络支持人员。)查看系统事件记录以了解严重故 障事件。 断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E1114Ambient Temp exceeds allowed range.(环境温度超过了许可范 围。)环境温度到了超出许可范围的某 个点。 请参阅"系统冷却问题故障排除"。 E1116Memory disabled, temp above range.Power cycle AC.(已禁用内 存,温度超出范围。请关闭交流电源 再打开。)内存已超过许可温度,系统已将 其禁用以防止组件损坏。 断开系统的交流电源 10 秒,然后 重新启动系统。 请参阅"系统冷却问题故障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E1210Motherboard battery failure.Check battery.(母板电池故障。请检查电 池。)CMOS 电池丢失,或电压超出许 可范围。 请参阅"系统电池故障排除"。 E1211RAID Controller battery failure.Check battery.(RAID 控制 器电池故障。请检查电池。)RAID 电池丢失、损坏或因温度 问题而无法再充电。 重新插入 RAID 电池连接器。请参 阅"安装 RAID 电池"和"系统冷却 问题故障排除"。 E1216 3.3V Regulator failure.Reseat PCIe cards.(3.3V 稳压器故障。请 重置 PCIe 卡。)3.3V 稳压器出现故障。请卸下并重置 PCIe 扩充卡。如果 问题仍然存在,请参阅"扩充卡故 障排除"。 E1229CPU # VCORE Regulator failure.Reseat CPU.(CPU # VCORE 稳压器故障。请重置 CPU。)特定处理器 VCORE 稳压器出现 故障。 请重置处理器。请参阅"处理器故 障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E122A CPU # VTT Regulator failure.Reseat CPU.(CPU # VTT 稳 压器故障。请重置 CPU。)特定处理器 VTT 稳压器出现故 障。 请重置处理器。请参阅"处理器故 障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E122C CPU Power Fault.Power cycle AC.(CPU 电源故障。请关闭交流电源 再打开。)接通处理器电源时检测到电源故 障。 断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E122D Memory Regulator # Failed.Reseat DIMMs.(内存稳压器 # 故障。请重置 DIMM。)某个内存稳压器出现故障。重置内存模块。请参阅"系统内存 故障排除"。 E122E On-board regulator failed.Call support.(机载稳压器故障。请联络 支持人员。)某个内置稳压器出现故障。断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E1310Fan ## RPM exceeding range.Check fan.(风扇 ## 转速超出范围。请检 查风扇。)特定风扇的每分钟转数超出预期 的操作范围。 请参阅"系统冷却问题故障排除"。 E1311Fan module ## RPM exceeding range.Check fan.(风扇模块 ## 转 速超出范围。请检查风扇。)特定模块中的特定风扇的每分钟 转数超出预期的操作范围。 请参阅"系统冷却问题故障排除"。 E1313Fan redundancy lost.Check fans.(风扇冗余丢失。请检查风 扇。)系统中的风扇不再有冗余。如果 再次发生风扇故障,系统将存在 过热危险。 请查看 LCD 以了解其它滚动信 息。请参阅"风扇故障排除"。 E1410System Fatal Error detected.(检测到系统严重错误。)检测到严重的系统错误。请查看 LCD 以了解其它滚动信 息。断开系统的交流电源 10 秒, 然后重新启动系统。 如果问题仍然存在,请参阅"获得

服务器常见故障的判断与维修汇总

服务器常见故障的判断与维修 一、造成服务器无法启动的主要原因 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动解决办法 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出) 网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: * 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 * 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理) 注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。 五、安装操作系统时提示找不到硬盘 无物理硬盘设备

服务器故障应急响应方案说明

服务器故障应急响应方案说明

服务器故障应急措施方案 ?部门?版本编号Ver_1.0 ?日期?密级公司内部使用 文档信息 文档名称服务器故障应急措施方案 日期版本号更新说明 -03-14Ver_1.0 建立文档、初始化

1.方案概述 导致服务器出现故障的问题是一个庞大的集合,能够分成很多种导致服务器出现故障的原因,根据服务器故障出现的状况进行分类,确定故障属于哪一个级别,根据相应的故障级别对故障做对应的处理,确保故障的处理流程是标准化的。 如果没有一套故障处理的标准,工程师只能靠经验去判断,可是依靠经验判断并不是不能够,有时候这种处理方式会很高效,可是大多数这种处理方式都是不太合理的,如果更换了运维工程师,显然每一个工程师经过经验去判断故障原因的方式都不尽相同,这样的差异将会使故障处理事后不能够得到很好的记录与存档,以供其它工程师以后借鉴故障处理案例。 故障处理标准化的优点: A.根据流程能够确定哪些故障应该立即汇报上级,哪些能 够自行解决后,再写故障处理报告汇报上级,这样做有 助于提高故障处理效率。 B.对于工程师经验判断,可能出现判断失误的情况,根据 故障判断流程,能够不遗漏任何可能的情况对服务器故 障进行排除。

C.有时候工程师处理了故障之后只是简单的做了一下汇 报,并没有一些故障处理过程的记录,以及故障处理的 详细时间记录,这样对需要追溯以前的具体情况的时候 就束手无策了。 2.划分故障等级 故障级别故障说明故障处理第一步 Ⅰ级(紧急)当系统出现下列相当严重的现象时,属一级故 障: 系统整体瘫痪,全部操作失去响应; 系统崩溃,关键硬件或文件系统损坏无法自 动修复; 发生间歇性、随机性、重复性的启动或应用 退出,无法保障公司业务的正常处理。 立即汇报上级 Ⅱ级(重要)当系统出现下列比较严重的现象时,属二级故 障: 关键部件(含软、硬件)停止工作,导致系 统降低运行状态,客户业务受到严重影响; 系统整体性能严重下降,无法自动恢复正常 运行状态; 重要数据、参数和配置信息损坏,无恢复, 导致客户数据及业务记录严重损失; 立即汇报上级 Ⅲ级(关键)当系统出现下列现象时,属三级故障: 部分设备或软件异常,局部功能受限,系统 整体仍可正常工作,对客户业务影响不大或 存在隐患; 关键备用设施因故障离线,主用设施仍能正 常工作; 系统运行指标(例如: I/O 效率、 CPU 效 率)受到直接或间接影响,客户业务处理缓 慢; 立即汇报上级 Ⅳ级(告警)当系统出现下列情况而不影响客户业务时,属四 级故障: 不在运行状态的线路、端口损坏; 出于安全考虑而且是受保护的软件降级或应 用重启; 因存储空间不足导致的性能下降; 系统硬件、软件产品功能、安装、或配置方 面的支援; 业务依然能够正常运作,可是服务器报出故 故障排错判断

服务器软件故障

服务器软件故障 服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。 有一台HP LH6000R服务器,配置为双PIII XEON700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module(VRM)over/under-voltage2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。 FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH/CMC A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH 命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。 任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。 目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。 当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是

服务器及IT设备日常维护

服务器及IT设备常维护 一、服务器基本维护知识 ◆服务器硬件维护注意事项 请不要在服务器内扩配或改配未经厂商认证的部件 静电释放和静电释放保护措施:静电释放会对主板、硬盘、板卡和系统的其它部件造成损害,在您要对系统硬件进行设臵时,最好在防静电环境下进行,如果没有这个条件,操作人员尽量佩带防静电手环(一端接地)。 静电释放和板卡持拿:因为板卡上的芯片对静电特别敏感,持拿板卡必须小心,只能接触主板的边沿。当板卡暂时不用时,必须把它放回专用的防静电袋中(封闭),芯片朝上放在接地平台上。 机箱盖:为了系统正常散热和空气流通,在系统上电前一定要安装机箱盖,否则会对系统部件造成损害 ◆服务器维护通常步骤 (1)普通硬件部件检测 1、确保在机箱和主板之间不存在短路。 2、把和主板相连接的线缆断掉,包括键盘和鼠标。 3、移走所有的外插板卡。 4、安装一颗 CPU (确保安装牢固) 5、连接机箱面板控制连线和电源指示灯LED连线到主板 6、检查跳线设臵是否正确 (2)硬件级系统维护 1.请检查一下系统、BIOS设臵是否正确。许多问题都是由系统设臵不正确造成的。 2.请检查一下内存是否够用和硬件的兼容性。 3.通知客户退出网络,将服务器电源关闭,将机箱盖打开。 4.检查电缆和板卡插接是否正确。 5.将连接的硬件一件一件拆除下来,逐步发现问题的所在 ◆系统BIOS ?BIOS设臵又称CMOS设臵,是基本的输入输出系统,可以利用专门的设臵程序对系统参数和硬件参数进行调整。 ?由于BIOS对系统的运转和启动有重大影响,所以,设臵了不当的参数后可能会引起硬件资源之间的冲突,或者降低系统运行的性能,因此,了解BIOS的设臵对配臵您的服务器很重要,如果没有特殊的需要,建议您使用系统出厂时的默认值,不要随意改变BIOS。 二、服务器硬件故障诊断与排除 ◆主板 CMOS清除 除了可清除口令外,如果机器使用一段时间后,BIOS自检出现不正常的提示,可以先做CMOS清除试一下。有时系统出现一些提示,CMOS清除会起到意想不到的作用。 服务器开机无显,可能与主板有关,需要有经验的工程师作判断。 板卡、线缆与主板接触不好,会导致机器不启动。 在开机无显时,可以移去内存,开机如果有内存报警的声音(可以查服务器手册判断内存报警

服务器常见的十四个故障-分析解决方案

服务器常见的十四个故障分析解决方案 一、造成服务器无法启动的主要原因 : 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动 ? 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启 ? 造成系统频繁重启的原因: 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出)

网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 软件故障 硬件故障 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法)

服务器常见故障

服务器常见故障——硬件篇(1) 由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… AD: 说起X86平台的CPU,我们可能会如数家珍的报出N多种,Inter的至强5600、至强7500,AMD强劲的12核心x86处理器--“Magny-Cours”(马尼库尔)等等。在它的基础上,辅以带ECC、ChipKill、热插拔技术的内存;防止数据异常丢失的RAID硬盘;提供不中断电力供应的冗余电源等等共同构建出一个完整的X86服务器。 由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。因此,X86应该算是我们广为熟知的架构了。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… 硬件故障篇 Top10 网卡 服务器网卡

故障回放:近几日,内网用户通过代理服务器进行连接时不太稳定,ping的速度有时低于1ms,有时高达500多ms,数值相差之大也说明了网络时好时坏。起先判断是蠕虫病毒作祟,但经过详细筛查,确定非病毒引发的故障;再对网线进行测试,衰减、串扰、回波损耗等各项技术指标都在正常指标之内,最后更换网卡故障才得以解决。 解决方案:我们知道一款优秀的网卡除了拥有高速率外,还需要关注2个技术指标,TOE(TCPOffloadEngine,TCP减负引擎)技术和RSS(Receive-sideScaling接收端调节)技术,它们能大幅减轻CPU的资源,解决了输入/输出流(I/O)的瓶颈,使网络吞吐大幅提升,这两项技术可以使系统的响应指标的TPS值能提升2.1到2.5倍,所以一块好的网卡是保证服务器快速、稳定连接的保障。 一般来说,网卡出现故障的状况较低,即便是损坏也可以使用独立网卡代替,它的危害程度也不是很高。 服务器常见故障——硬件篇(2) 2010-08-17 13:18 杨欢 51CTO 我要评论(1)字号:T | T 由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… AD: Top 9 风扇

服务器常见的十四个故障及分析

一、造成服务器无法启动的主要原因: 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动? 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启? 造成系统频繁重启的原因: 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出) 网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 软件故障 硬件故障 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死

机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理) 注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。 五、安装操作系统时提示找不到硬盘? 故障原因: 无物理硬盘设备 硬盘线缆连接问题 没有安装硬盘控制器驱动或驱动不相符 六、如何获得驱动程序? 使用随机光盘制作相应驱动 七、为什么用正确的驱动仍然无法加载硬盘控制器驱动? 查看是否启用了hostraid功能。

服务器常见问题

服务器常见问题 Q1 问题描述:为什么处理器报错或自检过程中只找到一个处理器 A1 解决方法:开机--〉按F2 键,进入SETUP 1)依次MAIN -- > PROCESSOR〉-CLEAR PROCESSOR ERRORS [将此选项值设置为YES ; 2)依次ADVANCED -〉- RESET CONFIGURATION DATA [ ] 将此选项的值设置为YES ; 3)依次SERVER >-- PROCESSOR RESET [ ] 将此选项的值设置为YES ; 4)依次SERVER >-- SYSTEM MANAGEMENT:回车--> CLEAR EVENT LOG [ :] 将此选项的值设置为YES 5)按F10,保存退出; Q2 问题描述:为什么开机自检无法通过 A2 解决方法: 1)机器切断电源,将机箱打开,用COMS CLEAR跳线的跳线帽将COMS CLEAR跳线的另外两个针短接(跳线参看主板说明书); 2)机器加电,自检,等机器自检完毕,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可; 3)机器重新开机。 Q3问题描述:怎样格式化SCS硬盘 A3 解决方法: 开机--〉出现CTRL+A B息时,按CTRL+A进入--〉选中通道A -->选中SCSI UTILITY>--将检测到硬盘-->选中要检测的硬盘 -->选中FORMAT可对硬盘进行全面格式化 选中VERIFY可对硬盘进行检测,检查是否有坏道 注意:在格式化硬盘时不能中断或停电,不然会损坏硬盘 Q4问题描述:PL400 CMOS如何清除 A4解决方案:CMOS清除的方法(要跳线的位置): 位于3Pin PwrLED和In tel NB82802AB8芯片之间的JBC2跳线,将2、3短接 Q5 问题描述:机器开机常见问题处理 A5 解决方案: 1、装完系统后,显示器出现花屏现象,系AGP显卡故障。更换后一切正常。 2、开机黑屏,不自检,并且报两声嘟声,系内存未插紧。重插内存,故障解决。 3、开机散热风扇不转,而机箱后侧风扇却转(说明主板已上电),系CPU 散热风扇电源线插错 (插到机箱风扇电源接口),插到RIMM1,侧面的CPU风扇接口后故障解决。 Q6问题描述:NAS 4100, 4300操作指导 A6 解决方案: 一、正常状态 将一台新机器拿出来后,通电开机即可.(接上网线连入网络),在网络中的客户端安装好软 件MaxNeighbornhood(随机有一张光盘的),运行它,它会在网络中搜索MAXTOR NAS.(注意:要等NAS完全启动后才会搜索得到,如果一次找不到,可以搜索多次,要注意网络是通的.)** 另外可以用WIN2000 中带的一个附加组件网络服务来连接,它比MaxNerghbornhood 好用. 搜索到后用鼠标双击它就会有IE窗口来连接,基于WEB的管理?在IE中可以对它进行全面管 理,注意操作时一般的东西不要改,如果机器有问题,你可以先查看磁盘管理器查看硬盘的状

相关文档
最新文档