―运行‖,键入―dxdiag‖并回车打开―Di" />

AD故障解决

AD故障解决
AD故障解决

Windows Server 2003安装过后需要进行的配置

Win Xp技巧2007-11-07 11:01:59 阅读191 评论1 字号:大中小订阅

一、启用硬件加速

硬件加速:桌面点击右键--属性-> 设置--高级--疑难解答。把该页面的硬件加速滚动条拉到―完全"

,最好点击―确定‖保存退出。这期间可能出现一瞬的黑屏是完全正常。

二、启用DirectX加速

DirectX加速:打开―开始‖-> ―运行‖,键入―dxdiag‖并回车打开―DirectX 诊断工具‖,在―

显示‖页面,点击DirectDraw, Direct3D and AGP Texture 加速三个按钮启用加速。

三、启用声卡:

系统安装后,声卡是禁止状态,所以要在控制面板-> 声音-> 启用,重启之后再设置它在任务栏

显示。

现在我们还要启用音频加速。在运行中输入Services.msc然后按回车,会出现Services窗口,找到Windows Audio服务,双击打开,把启动类型设置为"自动",点击"应用",然后点击"启动"启动该服务。

最后我们还要使用DirectX诊断工具,在运行中输入dxdiag并回车,打开声音选项卡,把"硬件的声音

加速级别"的滑块拖动到"完全加速"。

四、允许声音加速

如果你使用的是Windows server 2003标准版请从第二步xx作,因为标准版已允许声音服务。

打开―开始‖-> ―运行‖,键入―Services.msc ‖,在出现的窗口中找到―Windows Audio‖并双击它,然后在启动模式的下拉菜单选择―自动‖,并点击―应用‖->―开始‖ -> ―确定‖打开―开始‖-> ―运行‖,键入―dxdiag‖并回车打开―DirectX 诊断工具‖,在―声音‖页面,

把―声音的硬件加速级别‖滚动条拉到―完全加速‖。

五、启用ASP 支持

Windows Server 2003 默认安装,是不安装IIS 6 的,需要另外安装。安装完IIS 6,还需要单独

开启对于ASP 的支持。方法是:

控制面板-> 管理工具-> Web服务扩展-> Active Server Pages -> 允许。

六、取消关机原因的提示

在关闭Windows Server 2003操作系统时,系统会弹出一个提示窗口,要求大家选择关闭计算机的原因选项;尽管这种方法可以增强系统的安全性,确保用户更有效地管理和维护计算机;不过每次关机或者重新启动系统,都要选择关机原因,实在没有必要。所以,为了进快地关闭计算机,大家可以按下面步骤来

取消关机原因的提示:

1、打开控制面板窗口,双击―电源选项‖图标,在随后出现的电源属性窗口中,进入到―高级‖标

签页面;

2、在该页面的―电源按钮‖设置项处,将―在按下计算机电源按钮时‖设置为―关机‖,单击―确

定‖按钮,来退出设置框;

3、以后需要关机时,可以直接按下电源按键,就能直接关闭计算机了。当然,我们也能启用休眠功

能键,来实现快速关机和开机;

4、要是系统中没有启用休眠模式的话,可以在控制面板窗口中,打开电源选项,进入到休眠标签页

面,并在其中将―启用休眠‖选项选中就可以了。

如果是中文版,则:gpedit.msc,计算机配置-> 管理模板-> 系统-> 显示关机事件跟踪-> 禁用。

七、禁用开机CTRL+ALT+DEL

管理工具->(本地安全策略) -> 本地策略-> 安全选项-> 交互式登录:

不需要按Ctrl+Alt+Del,禁用之。慎用!搞不好会进不去系统。

注意:为系统安全起见,一开始设置时管理员的密码就不要留空。

八、启用硬件图形加速

现在我们准备启用你的硬件图形加速。在桌面的空白处点击鼠标右键,依次点击Properties -> Settings 选项卡-> Advanced ->Troubleshoot 选项卡,然后把硬件图形加速的滑块拖动到Full。点击

OK退出。

活动目录(Active Directory)域故障解决实例(一)

Win Xp技巧2007-11-07 11:09:01 阅读2003 评论0 字号:大中小订阅

A1、客户机无法加入到域?

一、权限问题。

要想把一台计算机加入到域,必须得以这台计算机上的本地管理员(默认为administrator)身份登录,

保证

对这台计算机有管理控制权限。普通用户登录进来,更改按钮为灰色不可用。并按照提示输入一个域用户

帐号或

域管

理员帐号,保证能在域内为这台计算机创建一个计算机帐号。

二、不是说―在2000/03域中,默认一个普通的域用户(Authenticated Users)即可加10台计算机到域。‖

吗?

这时如何在这台计算机上登录到域呀!

显然这位网管误解了这名话的意思,此时计算机尚未加入到域,当然无法登录到域。也有人有办法,在

本地

上建了一个与域用户同名同口令的用户,结果可想而知。这句话的意思是普通的域用户就有能力在域中创

建10个

新的计算机帐号,但你想把一台计算机加入到域,首先你得对这台计算机的管理权限才行。再有就是当你

加第11

台新计算机帐号时,会有出错提示,此时可在组策略中,将帐号复位,或干脆删了再新建一个域用户帐号,

joindomain。注意:域管理员不受10台的限制。

三、用同一个普通域帐户加计算机到域,有时没问题,有时却出现―拒绝访问‖提示。

这个问题的产生是由于AD已有同名计算机帐户,这通常是由于非正常脱离域,计算机帐户没有被自动

禁用或

手动删除,而普通域帐户无权覆盖而产生的。解决办法:1、手动在AD中删除该计算机帐户;2、改用管

理员帐户

将计算机加入到域;3、在最初预建帐户时就指明可加入域的用户。

四、域xxx不是AD域,或用于域的AD域控制器无法联系上。

在2000/03域中,2000及以上客户机主要靠DNS来查找域控制器,获得DC的IP 地址,然后开始进

行网络身份

验证。DNS不可用时,也可以利用浏览服务,但会比较慢。2000以前老版本计算机,不能利用DNS来定

位DC,只能

利用浏览服务、WINS、lmhosts文件来定位DC。所以加入域时,为了能找到DC,应首先将客户机TCP/IP

配置中所配

的DNS服务器,指向DC所用的DNS服务器。

加入域时,如果输入的域名为FQDN格式,形如https://www.360docs.net/doc/bd6916332.html,,必须利用DNS中的SRV记录来找到DC,

如果客户机的

DNS指的不对,就无法加入到域,出错提示为―域xxx不是AD域,或用于域的AD域控制器无法联系

上。‖2000及以

上版本的计算机跨子网(路由)加入域时,也就是说,加入域的计算机是2000及以上,且与DC不在同

一子网时,

应该用此方法。

加入域时,如果输入的域名为NetBIOS格式,如mcse,也可以利用浏览服务(广播方式)直接找到

DC,但浏览

服务不是一个完善的服务,经常会不好使。而且这样虽然也可以把计算机加入到域,但在加入域和以后登

录时,

需要等待较长的时间,所以不推荐。再者,由于客户机的DNS指的不对,则它无法利用2000DNS的动态

更新动能,

也就是说无法在DNS区域中自动生成关于这台计算机的A记录和PTR记录。那么同一域另一子网的2000

及以上计算机

就无法利用DNS找到它,这本应该是可以的。

若客户机的DNS配置没问题,接下来可使用nslookup命令确认一下客户机能否通过DNS查找到DC

(具体见

前)。能找到的话,再ping一下DC看是否通。

A2、用户无法登录到域?

一、用户名、口令、域

确保输入正确的用户名和口令,注意用户名不区分大小写,口令是区分大小写的。看一下欲登录的域是

否还

存在(比如子域被非正常删除了,域中唯一的DC未联机)。

二、DNS

客户机所配的DNS是否指向DC所用的DNS服务器,讨论同前。

三、计算机帐号

基于安全性的考虑,管理员会将暂时不用的计算机帐号禁用(如财务主管渡假去了),出错提示为―无法

域连接……,域控制器不可用……,找不到计算机帐户……‖,而不是直接提示―计算机帐号已被禁用‖。可

AD用户和计算机中,将计算机帐号启用即可。

对于Windows 2000/XP/03,默认计算机帐户密码的更换周期为30 天。如果由于某种原因该计算机帐

户的密

码与LSA 机密不同步,登录时就会出现出错提示:―计算机帐户丢失……‖或―此工作站和主域间的信任关

系失

败‖。解决办法:重设计算机帐户,或将该计算机重新加入到域。

四、默认普通域用户无权在DC上登录

见下一小节的B1。

五、跨域登录中的问题

在2000及以上计算机上登录到域的过程是这样的:域成员计算机根据本机DNS配置去找DNS服务器,

DNS根据

SRV记录告诉它DC是谁,客户机联系DC,验证后登录。

如果是在林中跨域登录,是首先查询DNS服务器,问林的GC是谁。所以要保证林内有可用的GC。

如果是要登录

到其它有信任关系的域(不一定是本林的),要保证DNS能找到对方的域。

A3、如何解决本地或域管理员密码丢失?

本地管理员密码丢失,可通过删除sam文件(2000SP3以前)或通过NTpassword软件来解决。但

要解决域管理

员密码丢失,它们就无能为力了,这时就需要用到―凤凰万能启动盘‖中的ERD Commander 2002了,接下

来我们将

详细讨论使用此盘解决管理员密码丢失问题。

1、上网搜索―凤凰启动盘‖或―凤凰万能启动盘‖,大约178M;

2、下载后解压缩,将其内容刻录成光盘;

3、用此光盘启动计算机,显示XP安装界面,Start ERD Commander 2002环境;

4、出现选择菜单,选择第一项:ERD Commander 2002;

5、出现类似XP的启动界面

6、进入选择系统安装的路径,一般会自动测出操作系统、版本及是否域控制器;

7、出现类似的XP桌面:选择Start/Administrative Tools/Locksmith;

8、进入ERD Commander 2002 locksmith向导界面,下一步;

9、选择Administrator,重设其密码;(此时切不可手动重新启动计算机,否则此修改将无效)

10、选择Start/Logoff,点OK;

11、稍候片刻,点reboot后重新启动计算机

凤凰启动盘中的ERD Commander 2002功能强大,不仅可破解本地管理员密码,包括NT/2000/XP/03

的各个版

本。还可以破解NT/2000/03域管理员密码,均已实验证明。由于可自动识别操作系统和版本,及是否

DC,所以用

户在操作时,重设密码的方法都是一样的。对于03,重设密码时要注意符合密码策略中要求的符合复杂性

要求,

且密码最小长度为7,否则重设的密码会无效。

A4、无法使用域内的共享打印机?

现象:计算机重启或注销,再登录进来,无法使用以前安装的域内的共享网络打印机,为用户重新安

装打印

机,当时可以打印,但不久问题又会出现。用户反映说有时能打印,有时就是不能打印。

其原因在于用户没有登录到域(很多用户即使计算机加入到了域,也经常习惯性地选择登录到本地机),

没有域用户身份,当然无权访问域内的资源。而且关键是Windows系统在这里有个小毛病,它并不象你访

问共享文

件夹那样,由于没有身份而提示你输入用户名和密码来进行验证,而是直接提示你―拒绝访问,无法连接‖、―当前打印机安装有问题‖,―RPC服务不可用‖等等(在不同的操作系统或应用程序中提示会所不同)。

解决办法有3种,最好还是用方法1。:

1、要求用户将其域用户帐号加入到本地管理员组,以后每次都以域用户帐号登录。

说明:这本身就是微软推荐的一种办法。因为如果不这样,普通用户以本地管理员身份登录时,控制本机

没问

题,但访问域资源时需要输入域用户名和口令;而用户若以域用户身份登录,又没有本机管理特权。比如

说:无

法关机,无法修改网络等配置,无法安装软件、驱动等。这样做了以后,用户以域用户身份登录,同时他

又是本

地管理员。

2、在打印服务器上启用Guest用户,保证everyone有打印权限。但这样做不安全,所以不推荐。

3、在客户机上每次要使用打印机前,在开始—运行:\\PrintServer,这时会提示你输入用户名和密码。通

过验

证后,再去使用打印机。很显然这样方法比较麻烦。

A5、无法访问域内的共享资源?

上例中我们提到过客户机如果加入到了域,但用户选择登录到本地机。当访问域内共享资源时,会提示

输入

用户名和口令。若不出现提示,直接出现拒绝访问。一般是由于目标计算机上启用了guest,而guest用户

没有权

限造成的。

接下来的讨论实质和域的关系不太,但确实是我们访问网络共享资源中经常会碰到的问题:基于UNC

路径的I

形式来访问时的故障,如在开始/运行:\\10.63.243.1。前提:在网卡、协议、连接没问题的情况下。即在

ping通的前提下,若\\10.63.243.1不通,排错可从下面几个方面来考虑。

1、目标机的―Microsoft网络的文件和打印机共享‖服务的问题。

提示:―\\10.63.243.1 文件名、目录名或卷标语法不正确‖。

检查:服务是否安装、是否选中,或重装一下。

操作:网上邻居/右键/属性/本地连接/右键/属性

2、由于访问相关的net logon、server、workstation服务务未正常启动的影响。

提示:

(1)若目标机(为域成员)上的net logon服务停了:―试图登录,但网络登录服务未启动‖。

(2)若目标机上的server服务停了:―\\10.63.243.1 文件名、目录名或卷标语法不正确。‖

(3)若本机的worstation服务停了:―\\10.63.243.1 网络未连接或启动‖。连其它计算机,也是一样的

提示。

检查:相应服务是否已经正常启动。

操作:我的电脑/右键/管理/服务和应用程序/服务下

3、由于本机与其它计算机重名(指NetBIOS名称)的影响

提示:访问任何计算机均提示:―找不到网络路径‖。

检查:重启一下,看是否有―网络中存在重名‖的提示。可能上次开机时没注意给忽略了。

操作:我的电脑/属性/网络标识/属性/计算机名下,修改计算机名。

4、XP/03由于默认安全策略:―帐户:使用空白密码的本地帐户只允许进行控制台登录‖的影响

提示:\\10.63.243.1无法访问。您可能没有权限使用网络资源。请与这台服务器的管理员联系以查明您是

否有访

问权限。登录失败:用户帐户限制。可能的原因包括不允许空密码,登录时间限制,或强制的策略限制。

检查:改用非空密码的帐户试试,或查看XP/03目标机上的本地策略。

操作:开始/运行:gpedit.msc。计算机配置/Winodws设置/安全设置/本地策略/安全选项下,由默认值―

启用‖改为―禁用‖。

注意:域帐号访问不受此策略限制。

5、网络共享访问被筛选器的设置所阻止

提示:找不到网络路径

检查:TCP/IP筛选、IPSEC、RRAS筛选器是否被启用,且TCP端口139和445被禁用。

操作:

(1)网上邻居/属性/本地连接/属性:TCP/IP—高级—选项—TCP/IP筛选

(2)网上邻居/属性/本地连接/属性:TCP/IP—高级—选项—IP安全机制(3)开始/程序/管理/路由和远程访问/IP路由选择/常规/接口/右键属性/常规:输入/输出筛选器。

说明:

(1)RRAS筛选器只在2000/03 Server版中才有,IPSEC只有在2000的上述位置才有。

(2)若你就想设置筛选器,基于端口控制,不让别人访问你的网络共享资源,需要同时禁止TCP:139

和445口。

(3)由于此种原因产生的访问故障,一般是由于实验后忘了复原,或别人故意和你开玩笑。

A6、在AD域中,如何批量添加域用户帐号?

作为网管,有时我们需要批量地向AD域中添加用户帐户,这些用户帐户既有一些相同的属性,又有一

些不同

属性。如果逐个添加、设置的话,十分地麻烦。一般来说,如果不超过10个,我们可利用AD用户帐户

制来实现。如果再多的话,我们就应该考虑使用csvde.exe或ldifde.exe来减轻我们的工作量了。最后简

介绍一下利用脚本(可利用循环功能)批量创建用户帐号

一、AD用户帐户复制

1、在―AD域和计算机‖中建一个作为样板的用户,如S1。

2、设置相关需要的选项,如所属的用户组、登录时间、用户下次登录时需更改密码等。

3、在S1上/右键/复制,输入名字和口令。

说明:

1、只有AD域用户帐户才可以复制,对于本地用户帐户无此功能。

2、帐户复制可将在样板用户帐户设置的大多数属性带过来。具体如下:

二、比较csvde与ldifde

三、以csvde.exe为例说明:域用户帐户的导出/导入

操作步骤如下:

1、在―AD域和计算机‖中建一个用户,如S1。

2、设置相关需要的选项,如所属的用户组、登录时间、用户下次登录时需更改密码等。

3、在DC上,开始/运行:cmd

4、键入:csvde –f demo.csv

说明:

(1)不要试图将这个文件导回,来验证是否好使。因为这个文件中的好多字段在导入时是不允许用的,如:

ObjectGUID、objectSID、pwdLastSet 和samAccountType 等属性。我们导出这个文件目的只是为了查

看相应的

字段名是什么,其值应该怎么写,出错信息如下:

(2)可通过-d –r参数指定导出范围和对象类型。例如:

-d ―ou=test,dc=mcse,dc=com‖ 或-d ―cn=users,dc=mcse,dc=com‖

-r ―< Objectclass=user>‖

1、以上面的文件为参考基础,创建自己的my.csv,并利用复制、粘贴、修改得到多条记录。例如:

dn,objectClass,sAMAccountName,userAccountControl,userPrincipalName

"CN=s1,OU=test,DC=mcse,DC=com",user,S1,512,S1@https://www.360docs.net/doc/bd6916332.html,

"CN=s2,OU=test,DC=mcse,DC=com",user,S2,512,S2@https://www.360docs.net/doc/bd6916332.html,

………………,其它可用字段,我试了一下,见下表(不全):

6、导入到AD,键入csvde –i –f my.csv –j c:\

说明:-j用于设置日志文件位置,默认为当前路径。此选项可帮助用户在导入不成功时排错。

有一点大家必须明确的是:我们在这里做AD域用户帐户复制、做AD域用户帐户的导出/导入,并不能代

替―AD备份

和恢复‖。我们只是在批量创建用户帐号,帐号的SID都是重新生成的,权利权限都得重新设才行。(当然

我们可

以把导入的用户,通过memberof字段设到一些用户组中去,使它有权利权限。但这与利用―AD备份和恢

复‖到原

状,完全是两回事)。

四、利用脚本创建批量用户帐户

1、利用脚本创建用户帐号(用户可参考下例)。

Set objDomain = GetObject("LDAP://dc=fabrikam,dc=com")

Set objOU = objDomain.Create("organizationalUnit", "ou=Management")

objOU.SetInfo

说明:在https://www.360docs.net/doc/bd6916332.html,域创建一个名叫Management的OU。

Set objOU = GetObject("LDAP://OU=Management,dc=fabrikam,dc=com")

Set objUser = objOU.Create("User", "cn= AckermanPila")

objUser.Put "sAMAccountName", "AckermanPila"

objUser.SetInfo

objUser.SetPassword "i5A2sj*!"

objUser.AccountDisabled = FALSE

objUser.SetInfo

说明:在Management OU下创建一个名叫AckermanPila的用户,口令为i5A2sj*!,启用。

Set objOU = GetObject("LDAP://OU=Management,dc=fabrikam,dc=com")

Set objGroup = objOU.Create("Group", "cn=atl-users")

objGroup.Put "sAMAccountName", "atl-users"

objGroup.SetInfo

objGroup.Add objUser.ADSPath

objGroup.SetInfo

说明:在Management OU下创建一个名叫atl-users的用户组,将用户AckermanPila加入到这个组中。

Wscript.echo "Script ended successfully"

说明:显示―脚本成功结束‖信息

2、利用脚本中的循环功能实现批量创建用户帐号

Set objRootDSE = GetObject("LDAP://rootDSE")

Set objContainer = GetObject("LDAP://cn=Users," & _

objRootDSE.Get("defaultNamingContext"))

For i = 1 To 1000

Set objUser = objContainer.Create("User", "cn=UserNo" & i)

objUser.Put "sAMAccountName", "UserNo" & i

objUser.SetInfo

objUser.SetPassword "i5A2sj*!"

objUser.AccountDisabled = FALSE

objUser.SetInfo

Next

WScript.Echo "1000 Users created."

说明:在当前域的Users容器中创建UserNo1到UserNo1000,共1000个用户帐户

A7、我的计算机不知道怎么回事,系统时间总是被改快1小时?

加入域的计算机,没有自己的时间。这是因为时间参数,在AD复制中是一个极为重要的因素。如:决

定多主

控复制时,谁的修改最终生效。所以整个域的时间,都由域的PDC仿真主控来控制,整个林的时间都由林

根域上的

PDC仿真主控来控制。

说明:如果整个林的时间都快1小时,对你AD的正常工作没有任何影响。

解决:修改林根域的PDC仿真主控计算机的时间。实际工作中,要先查看域内计算机的时区设置是否

正确。

A8、建立AD域,需要有什么样的权限才行?

1、若是创建林内的第一个域,即林根域,只要有目标计算机上的本地管理员权限即可。

2、作为已有域的附加DC,需要该域的域管理员(Domain Admins)权限。

3、安装子域的DC,或新树的DC,都涉及到林结构的改变,需要林管理员(Enterprise Admins)权限才

行。

A9、如何在2000域中添加一台03的DC?

03和2000比,功能更强大了,在域和AD的体系结构上也有了一些变化(参见前面:域、林功能级别)。

但微

软的产品十分讲究向前兼容,我们可以实现在一个2000域中加入03DC、加入03DNS,并且DC间的AD

复制,DNS间的

区域传输,都好像没有版本差异一样。

但要注意:直接就在03计算机上安装AD是不行的,会收到出错提示―Active Directory版本不同‖。我们

要做一些准备工作,在2000DC(SP2及更高)上运行03光盘/I386/adprep,具体第一步:adprep /forestprep

行林准备,第二步adprep /domainprep进行域准备。

顺便说一下:03可以作为2000域的附加DC,2000也可以作为03域的附加DC,而直接在2000上

安装AD即可,不

需要准备。

A10、创建AD域时,由于没有NTFS分区,导致AD安装失败?

在2000/03成员或独立服务上上运行dcpromo命令,安装AD,将其提升为DC,其上必须有一个NTFS

5.0分区,

用来保存AD的sysvol文件夹。

注意:2000的NTFS分区是NTFS 5.0,NT4的是NTFS 4.0,NT4必须安装SP4后,才可访问2000的

NTFS分区。如果C是

引导分区,即系统夹winnt或windows所在分区,采用FAT32分区,系统会自动查找下一个可用的NTFS

分区来存放系

统卷,如d:\sysvol。如果找不到NTFS分区,就会出错,导致AD安装失败。这时可利用convert命令将

某个FAT32分

区转成NTFS分区,这个转换会保持数据的完好。但要注意这个转换是单向不可逆,想回复到FAT分区,

除非重新格

式化该分区。以转换D盘为例,具体操作如下:

1、开始/运行:convert d: /fs:ntfs

2、提示是否转换,键入y确认转换。

说明:这时并没有真正开始转换,如果后悔,可以到注册表HLM\当前控制\控制\会话管理\BootExecute下,

删除

其值Convert d: /fs:ntfs 。

3、重新启动计算机,将在登录界面出现前,真正实施FAT到NTFS的转换。

A11、安装AD域时,出现NetBIOS名称冲突?

在安装AD时,安装选项会要求输入:新域的DNS全名,在这里应该输入新域的完全有效域名FQDN,

形如:

https://www.360docs.net/doc/bd6916332.html,。系统会打算以mcse作为此域的NetBIOS名称,并在网络中检查是否存在重名,需要等一会

儿。

如果不重名则设为mcse(建议用户不要修改此名),重名系统则自动设为mcse0,建议用户最好换个名

字,因为你

的网络可能还会有2000以前版本的老系统,考虑到NetBIOS名称解析和DNS名称解析的互助,保持一

致性比较好。

说明:NetBIOS名称,只是为95/98/NT等老版本用户通过―浏览服务‖或WINS来识别这个域用的,如

果确信域

内计算机都是2000及以上系统(它们通过DNS定位域),其实NetBIOS名称冲不冲突,都无所谓。这

种冲突可能源

自于网络中如果已有一个域,名字叫做https://www.360docs.net/doc/bd6916332.html,,DNS名虽然不冲突,但是NetBIOS名称冲突。也可能

是你安装了

一个https://www.360docs.net/doc/bd6916332.html,域未能完全成功,又再次安装导致的,这样情况倒可以强行将NetBIOS名称将为mcse,

而不是

mcse0。

A12、安装AD完成后,重启登录非常慢,甚至长达20分钟之久。

这一般是由于用一台运行了一段时间的2000/03 Server来安装AD造成的,故障较难定位。若重启几次

后就正

常了,则不必理会。如果多次重启后还是非常慢,那就要重装系统及AD了。建议:最好在新装的系统上

来安装

AD,这样不容易出问题。

A13、安装AD时,选择了在本机安装DNS,但安装结束后,在DNS中未生成SRV记录?

如果决定在安装AD过程中在本机安装DNS,应在安装前,将本机TCP/IP配置中的DNS服务器指向

自己,这样在

安装AD完成后重启时,SRV记录将被自动注册到DNS服务器的区域当中去的,生成四个以下划线开头

的文件夹,如

_msdcs。03DNS在这里夹的层次结构有所变化,将_msdcs.域名夹提升了一级,直接放到了查找区域下,

但本质没

变。如果安装前忘了将DNS指向自己,也可以后补上。然后到计算机管理/服务下,重启Net Logon服务

即可。这

样可以把启动时未能注册到DNS服务器的SRV记录(缓存在windows\system32\cache中)写入DNS。

如果仍然不行的

话,那只好重启DC了。

A14、安装子域失败。

在保证权限(需要林管理员权限,不要误以为是父域管理员权限)、DNS没问题的情况下,最常见的安

装子域

失败的原因就是域命名主控失效,出错提示为:―由于以下原因,操作失败:AD无法与域命名主机xxx联

系。指定

的服务器无法运行指定的操作。‖

说明:域命名主控要正常工作,它本身要求GC必须可用。这是由于:为了保证域的名字在林中唯一,

域命名

主机需要查询GC。若是2000林,GC必须和域命名主机在同一台计算机上才行。若是2003林,不要求

GC必须和域命

名主机非得在同一台计算机上。

解决:保证域命名主控联机,如果确信其已无法正常工作,可强制传给(查封seize)林内的任意一台

DC,子

域的DC也可以。原来的主控必须被重做系统后,才可连入网络,以保证域命名主控的林唯一性。

A15、修改用户密码需要几分钟,甚至更长的时间。

前面我们介绍过:PDC仿真主控负责最小化密码变化的复制等待时间,若一台DC接受到密码变化的请

求,它必

须通知PDC仿真主控。若是PDC仿真主机失效,收到该请求的DC必须经过一段时间的查找后,确认真

的找不到PDC仿

真主控了,才会自己修改用户密码。所以在此情况下,应首先检查PDC仿真主控。如果确信其已无法正

常工作,

可强制传给(查封seize)域内的任意一台DC。原来的主控必须被重做系统后,才可连入网络,以保证

PDC仿真主

控的域唯一性。

A16、正常卸载AD时的常见问题

在实际工作中有时我们需要改变服务器角色,或者将实验中安装的DC回复到普通成员/独立服务器身

份,这就

要进行AD的卸载。

1、卸载时会提示给新的本地管理员设置密码

2、附加DC卸载后,仍在域中。

3、如果AD不能卸载,应从以下几方面考虑:

(1)网卡是否正常工作

即使你整个林中只有一台计算机,也要保证网卡正常工作,才能将AD卸载。网卡不工作或禁用网卡都会导致AD无法卸载,提示―卸载SYSVOL文件夹出错‖

(2)权限

权限要求与安装AD时类似,若一个林中只有一个域,那么你要卸载的就是林根域,需要林管理员

(Enterprise Admins)权限;卸载附加DC需要该域的域管理员(Domain Admins)权限;卸载子域或树,

涉及到

林结构的改变,也需要林管理员权限。

(3)DNS

一般应保证与安装时所用DNS一致。如果做了DNS规划,必须保证1中权限所要求的管理员身份能通

过DNS找到

相应DC,进行验证。

(4)域命名主控

卸载时只要涉及到林结构的改变,就需要保证域命名主控有效;卸载附加DC时不要求域命名主控有效。

但要注意的是:卸载时,域命名主控失效的出错信息与安装时的―AD无法与域命名主机xxx联系‖提示不同,

具体

是:由于以下原因,操作失败。以提供的凭据绑定到服务器xxx失败。―RPC服务器不可用‖。

(5)卸载的顺序

与安装顺序相反,应该先逐级卸载下面的子域,最后卸载树根域、林根域。否则将导致子域无法卸载,

而存

在的子域还有问题,找不到林根域、树根域了。

因为这时极有可能架构和域命名主控及GC未转移,林管理员组和架构管理员组(Schema Admins)已

经随林根

域的删除而没有了。为什么这么说呢?因为如果管理员考虑到主控及GC等的转移问题,也就不会误删除

林根域

了。

A17、AD无法正常卸载,或者说DC无法正常降级为成员服务器?

1、Dcpromo /forceremoval强制卸载AD

2、重设目录恢复模式下的管理员密码:

2000:winnt\system32\setpwd.exe

2003:使用ntdsutil实用工具,set dsrm password

如果按照上例的要求,还是无法正常卸载AD,且出错提示未提到DNS方面的故障。考虑本机上已安装

有的应用

程序,你还不想重做系统,可考虑使用如下办法。

1、开始/运行,在命令行中输入regedit或regedt32打开注册表编辑器。

2、找到以下的键值:

HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Product Options

键值:ProductType 类型:REG_SZ

3、将原来的值―LanmanNT‖改为―ServerNT‖。

说明:

(1)LanmanNT表示本机为域控制器DC,ServerNT表示本机为非DC。

(2)只有当CurrentControlSet1和CurrentControlSet下的键值:ProductType 所等于的数据不同时,即

一个为

ServerNT,一个为LanmanNT才允许修改。否则将会出如下提示:

¨对于2000:―系统已检测到干预您的注册产品类型,这是您对软件许可证的侵犯。干预产品类型是不

允许

的。‖

¨对于03:―系统检测到您的注册的产品类型有篡改现象。这是对软件许可证的侵犯。篡改产品类型是不

许的。‖

(3)教学实践中可以利用ntdsutil将子域的server对象(实质指DC)手动删除,然后运行dcpromo降级,

降级失

败后演示此知识点。

接下来,方法一:

1、重新启动计算机,按F8键进入到―目录服务恢复模式‖。

说明:

(1)在此模式下,AD不工作,以便对AD库文件及系统卷sysvol进行操作。

(2)登录的口令不同于平时所用的口令,是在安装AD时,所设的目录恢复模式下的口令。保存在本机一

个SAM库

文件中。

2、删除存放活动目录数据库的文件夹,默认为C:\WinNT\NTDS,或C:\Windows\NTDS。

3、删除存放系统卷的文件夹,默认为C:\WinNT\SYSVOL,或C:\Windows\SYSVOL

4、重新启动计算机。

5、由于还有一些作为域控制器的注册表键值和文件存在,所以在重新启动完计算机后,还需要使用dcpromo

命令

来升级计算机B到一个临时的域的域控制器(域名可以任意填写),然后再用dcpromo命令降级,这样才

会完整地

删除所有和域控制器相关的注册表键值和文件。

方法二

1、开始/运行,在命令行中输入dcpromo

2、由于前面已经修改了注册表,此时为AD安装界面,而非卸载界面。

3、会遇到如下出错提示:―由于网络上名称冲突,选定默认的NetBIOS域名?xxx‘‖。

说明:xxx为你修改注册表前原来域的NetBIOS名称。

4、不必介意出错提示,手动设置你想要的名称。比如你此次的域为https://www.360docs.net/doc/bd6916332.html,,则手动设xxx改为ABC即

可。

5、再接下来会遇到提示:―c:\winnt\ntds文件夹不是空的,当升级处理开始时,要删除文件夹中所有的文

吗?(如果不,请指定另一个文件夹。)‖

6、选择:是

说明:

(1)在选择系统卷的夹,如c:\winnnt\sysvol后,时间可能会比较长,请耐心等待。

(2)和正常安装时一样,可能会碰到DNS错误提示,一般选择在本机安装DNS即可。

(3)也可能会出现―计算机已脱离域,帐号未被禁用‖的提示,不必理会。

(4)最重要的一点是:这第一次非常可能不成功,再重来一遍dcpromo即可。

7、如果这次安装是为了清除残余的注册表键值和垃圾文件,可再次运行dcpromo进行卸载。当然直接使

用这台

DC,也是可以的。

最后强调一下,此方法并不是万能的。一是前面我们已经提到的,有时注册表不允许修改或者改完了存

上。再有就是如果在卸载的一开始,就出现有关DNS的出错信息,必须首先排除DNS故障才行。

A18、如何清理AD数据库中的垃圾对象。

如果我们非正常卸载AD子域、DC等,就会在AD元数据库中留下垃圾。比如上面的例子,又比如未经

AD卸载就

把DC计算机的系统重做了。这些垃圾对象一般来讲无碍大局,但如果我们想优化AD的性能,不想给用

户带来不必

要的麻烦(比如用户选择登录到已经不存在的子域),就可以利用ntdsutil工具进行元数据库清理

(metadata cleanup),来删除垃圾对象。具体操作如下:

1、开始/运行:cmd,在命令行下键入ntdsutil。

说明:

(1)直接,开始/运行:ntdsutil,也可以。

(2)进行元数据库清理,不要进到目录恢复模式下。

(3)进行元数据库清理,可以在非DC的2000/XP/03计算机上进行。但有些操作(如使用ntdsutil工具

进行授权恢

复、整理移动AD库文件)必须在DC上进行。

(4)在ntdsutil的每级菜单下都可以通过键入:?或HELP,查看本级菜单下可用的命令。

2、在ntdsutil: 提示符下,键入metadata cleanup ,然后按ENTER。

说明:ntdsutil是个分层的多级命令行工具,用户在键入名字时,可简写,只要不同于本级命令中的其它命

令即

可。比如上面的命令metadata cleanup可简写为m c。

3、在metadata cleanup: 提示符下,键入connections ,然后按ENTER。

4、在server connections: 提示符下,键入connect to server servername,然后按ENTER。

说明:

(1)其中servername 是指域控制器的DNS名称,用主机名或FQDN均可。注意:虽然联机说明中提

到了可以用IP

去连,但实际上发现用IP去连接,会出现参数不正确的出错提示。

(2)在这里要连接的DC,应是一个正常工作的、可操作的DC,而不是你要清理的那个DC对象。

5、键入quit ,然后按ENTER 回到metadata cleanup: 提示符。

6、键入select operation target ,然后按ENTER。

7、键入list domains ,然后按ENTER。

说明:此操作将列出林中的所有域,每一域附带与其相关联的一个数字。

8、键入select domain number,然后按ENTER。

说明:其中number 是与故障服务器所在的域相关的数字。

9、键入list sites ,然后按ENTER。

10、键入select site number,然后按ENTER。

说明:其中number 是指域控制器所属的站点号码。

11、键入list servers in site ,然后按ENTER。

说明:这将列出站点上所有服务器,每一服务器附带一个相关的数字。

12、键入select server number,然后按ENTER 。

说明:其中number 是指要删除的域控制器。

13、键入quit ,然后按ENTER,退回到Metadata cleanup 菜单。

接下来,根据需要,删除相应的垃圾对象:

14、键入remove selected server ,然后按ENTER。

此时,Active Directory 确认域控制器已成功删除。若收到无法找到对象的错误报告,Active Directory 可

已删除了域控制器。

15、或者键入remove selected domain,然后按ENTER。

说明:要想删除域,必须得先删除这个域的server对象(实质是DC)才行。

16、键入quit 然后按ENTER 直至回到命令符。

如果清理的是Server对象,还需要:1、到Active Directory 站点和服务上,展开适当站点,删除相应Server对象。2、到Active Directory 用户和计算机上,双击打开Domain Controllers这个OU,删除相应

的DC对

象。

如果清理的是Domain对象,还需要到Active Directory域和信任关系上,删除相应的已经没有用的信任

系。否则该域名还会出现在登录的域列表。

在实际操作中,必须先做元数据清理,然后再到相应的管理工具中删除相应的对象。若是直接到管理工

具中

去删,系统将不允许删除。

A19、欲替换域中唯一的一台DC,如何传送五种主控和转移GC。

一、传送五种主控

操作:

1、安装第二台DC(假设为DC2,原来的为DC1),

2、到相应的管理工具(具体见前)下,右键连接到域控制器:DC2,

3、右键/操作主机/相应标签下,点击更改即可。

说明:

1、其实在图形界面下,操作很简单,关键看能不能成功。

2、目标都在下面,只有架构的特殊,目标在上面。

3、如果DC都是最近安装的,极易成功。如果是运行了一段时间的,就不好说了。但我估计你的成功率应

在九成以

上,因为一般网管都不太动这个。

4、传送结构主控时,若目标已是GC,会提示出错。可以不理会,继续。因为结构主控负责:更新外部对

象的索引

(组成员资格),不应该和GC在同一个DC上,应手动移走,否则将不起作用。而单域不需要基础结构

主控非得有

效,我们一般平常用的都是单域,默认基础结构主控就和GC在一起,不起作用。

5、若传送不成功,不要着急,等5分钟~2小时不等,你什么都没做,再试可能就成功了。可以利用AD

站点和服务/

站点/默认的第一个站点名/SERVER/DC/ntds setting/AD连接/右键/立即复制副本,来强制AD马上复制。

但有时

候,仅依赖于此,还是不行,还得等。

6、至于把老DC从AD中去除,在开始/运行/DCPROMO,卸载AD。不要选―这是域中最后一台DC‖,若

能成功卸载,

就一切OK了。如不成功,可以直接把原DC废掉重装。AD中会有原DC的垃圾对象,也不影响什么。若

非要清干净,

参见前例。

7、如果原角色DC已经无法访问,就只能进行强制传送了,也就是查封(seize)。查封的实质就是强行

推出新的

主控,会有数据的丢失。在图形界面下会有提示:原主控无法联系,是否强行传送。选择―是‖,进行的就

是查

封操作。

8、利用ntdsutil工具roles下transfer命令和seize命令也可以实现上述操作。实验中发现,无论是用transfer

是seize,关键看是否能连接到原主控。连接下情况,就是传送;不连接情况下就是查封。如:在连接情况

下,使

用查封(seize)命令,操作的结果仍是传送:原主控不再是主控,目标成为新的主控。

二、转移GC

GC不具有唯一性,可在AD站点和服务中,将DC2设为GC。操作如下:

1、在Default-First-Site-Name/servers/dc2/NTDS Settings/右键/属性。

2、选中―全局编录‖。

3、你会看到在选项下面的说明:发布全局目录所需要的时间取决您使用的复制拓扑。

说明:不要急于把DC1断开,应等待足够长的时间,局域网环境一般也就是几分钟。是否将GC的内容成

功传送,可

在DC2上查看注册表

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\NTDS\Parameters下是否有这样一条:

Global

Catalog Promotion Complete=1。若未传送完,没有这一条。

A20、如何进行AD的备份与恢复

最好的办法是作为系统状态数据的一部分,利用2000/03自带的备份工具来进行备份/恢复。备份工具位

于:

开始/程序/附件/系统工具下。利用备份/恢复系统状态数据,可以恢复之前的域用户帐户数据和DNS,以及

安全设

置、组策略设置、还有配置等等。但DHCP、WINS等需要单独备份。

说明:

1、DNS区域必须为AD集成区域,如果不是,在备份之前,将标准主区域转成AD集成区域即可。因为

AD集成的意

思就是:将DNS区域信息,作为AD的一部分进行存储、复制。

2、管理工具下有关AD和域的管理工具的快捷方式不会被恢复(03仍未解决这个问题),可以运行2000S

光盘I386

\adminpak.msi,将所有的域管理工具追加上。也可手动开始/运行/MMC,添加相应的管理工具,如DNS、

AD用户和

计算机等。

3、重装的2000/03系统,不必安装AD,直接恢复就行。开机,F8,目录恢复模式,恢复大约需要4-5

分钟。(实

际当中我也试了,新装的系统,没有安装AD,在正常启动模式下恢复也可以,因为它根本没有AD,不涉

及到AD正

在工作,不允许替换的问题,只不过时间会稍长一些,约7-8分钟)

4、2000下利用备份工具恢复系统状态数据时,需要手动将―如果文件已存在:不替换‖改为―如果文件已

在,总是替换‖。

具体操作:工具/选项/还原:选择―无条件替换本地上的文件‖。否则2000在恢复时,可能不会把

winnt\sysvol\sysvol(里面是组策略具体的设置值,被称为GPT)给恢复回来。03DC上没有这个问题,系

统会自

动提示是否替换,选择―是‖即可。

5、具体备份/恢复的步骤,参考下例。

计算机网络故障处理与维护方法(毕业论文)

五年制高职商贸信息专业毕业论文 计算机网络故障处理与维护方法 班级 姓名 学号 指导老师

目录 【摘要】 (1) 一、计算机网络故障的分类 (1) (一)计算机网络物理故障 (4) (二)计算机网络逻辑故障 (3) 二、计算机网络常见故障的处理 (1) (一)本地连接断开 (1) (二)本地连接收限制或无连接 (1) (三)本地连接正常,但浏览器无法连接网页 (1) 三、如何加强网络的维护 (1) (一)概括的说,应做到: (4) (二)具体来说,应该做到: (3) 四、结论 (8) 【参考文献】 (3)

计算机网络故障处理与维护方法 【摘要】 本文就网络中常见故障进行分类,针对各种常见网络故障提出相应的解决方法,并就如何加强网络的维护进行了概括论述。 网络出现故障是极普遍的事,其种类也多种多样,在网络出现故障时对出现的问题及时进行维护,以最快的速度恢复网络的正常运行,掌握一套行之有效的网络维护理论方法和技术是至关重要的。 【关键词】 网络故障分类处理维护 一、计算机网络故障的分类 计算机网络故障主要是指,用户在使用计算机网络过程中或网络在运行过程中出现的问题,导致计算机网络不能正常使用。通常计算机网络故障可以按照其故障的性质,分为物理故障和逻辑故障。 (一)物理故障: 物理故障也就是硬件故障,一般是指网络设备或线路损坏、接口松动、线路受到严重干扰,以及因为人为因素导致的网络连接错误等情况。出现该类故障时,通常表现为网络断开或时断时续。物理故障主要包括: (1)线路故障

线路故障的发生率在日常的网络维护中非常高,约占发生网络故障的60%~70%。线路故障包括线路的损坏和线路受到严重干扰。 (2)接口故障 接口故障通常包括插头松动和端口本身的物理损坏。如:双绞线RJ45接头的损坏。 (3)交换机或路由器故障 交换机或路由器故障在这里是指设备出现物理损坏,无常工作,导致网络不能正常运行的情况。 (4)网卡故障 网卡也称网络适配器,大多安装在计算机的主机部。通过主机完成配置和。网卡故障主要包括网卡松动、主机网卡插槽故障、网卡本身物理故障等。 (二)逻辑故障: 逻辑故障也称为软件故障,主要是指软件安装或网络设备配置错误所引起的网络异常。与硬件故障相比,逻辑故障往往要复杂得多。常见的网络逻辑故障有:主机逻辑故障、进程或端口故障、路由器故障等。 (1)主机逻辑故障 主机逻辑故障通常包括网卡驱动程序、网络通信协议或服务安装不正确、网络地址参数配置有误等。对计算机网络用户来讲,该类故障是十分常见的网络故障之一。 (2)进程或端口故障 进程或端口故障是指一些有关网络连接的进程或端口由于受到病毒或系统

云服务器故障应急处置预案

云服务器故障应急预案 一、目的 为了确保云服务器(以下简称云平台)使用过程中遇到突发事件后能正确、有序、高效地进行应急处理,保障工作的正常运转,结合实际,特制定本预案。 二、适用范围 本预案适用于云平台中可能出现的各类突发事件。 三、预案流程 云平台服务故障预防措施包括分析风险,建立检测体 系,准备应急处理措施,控制影响扩大。 3.1上报 各部门在云平台使用过程中遇到突发问题导致系统无法正常运转时,报技术部系统对接人确认,情况属实立即报知运维工程师和数据库管理员。 3.2 了解和分析根据实际情况,技术部安排应急值班(附表1),确保

到岗到人,联络畅通,技术人员即时开展软件的检修工作,对具体情况进行了解并进行初步判断、处理,并将初 步情况上报运维工程师知晓。 3.3处理方法 3.3.1如突发问题为操作系统引起 首先由技术人员对突发问题进行分析,确定引起问题 的具体原因,如操作系统已无法启动,则由技术人员将具体情况通报运维工程师,进行系统备份恢复,如操作系统可启动,则由技术小组根据实际情况进行妥善快速处理。 3.3.2如突发问题为软件引起 首先由技术人员收集系统日志,对突发问题进行分 析,确定引起问题的具体原因,通过讨论确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。 3.3.3如突发问题为网络引起 技术人员先将问题反馈给数据中心运维人员,协调网 络管理员进行初步检查后确定问题原因,并在最短时间内 给予解决。在事件处理过程中,技术人员要随时将突发问题处理情

况上报数据中心运维人员。 334如突发问题为数据库引起 技术人员先将问题反馈给数据库管理员和服务器运维人员,确定问题。数据库软件本身问题,可切换至实时备份数据库。也可以采用新建立数据库,恢复备份的数据库文件,如果原云服务器都无法恢复,可以采用其他云服务 器进行恢复。 3.3.5特殊情况处理 准备好阿里云平台的帐号、域名备案、服务器,如遇目前云平台UCLOUD都无法使用的特殊情况,全部迁移至阿里云平台。 技术部负责每周二和周五15点检查ucloud余额情况, 若余额低于5000元当天申请续费付款流程,确保余额大于5000元;检查完成后,需登记〈云服务器例行检查记录表》注:定期对服务器进行检查,填写云服务器例行检查记录表。 四、信息安全事件分类 4.1有害程序事件 有害程序事件是指畜意制造、传播有害程序,或是因受到有害程序的影响而导致的信息安全事件。有害程序是指 插入到信息系统中的一段程序,有害程序危害系统中数据、应用程

运维故障处理思路 (3)

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间-—”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报警, 还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

网络运行维护及机房应急方案计划

网络运维小组应急预案 随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 本预案共分为应用系统故障应急流程和机房突发事件应急流程 系统故障应急流程 一、系统故障应急流程说明 1、故障发生 系统运维服务小组可从以下途径得知故障的发生: 1.1、运维服务中心通过网管告警发现故障 1.2、维护站点通过维护巡检发现故障 1.3、用户发现故障,报给呼叫中心 1.4、驻场工程师发现故障 2、报障受理 监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。 3、信息研判 运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。 4、预案启动 如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。 5、资源确认

系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源: 我公司技术支持人员; 相关厂家技术支持人员; 我公司聘请的技术专家 6、预案执行 按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。 7、预案终止 预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。 8、结果上报 预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。

服务器故障排除方法

服务器故障排除方法 本文主要是针对一些服务器出现的简单的故障进行排查处理,主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题,第二部分讲述了一些服务器硬件故障排除的实例,第三部分讲述了一些服务器软件故障排除的实例 第一部分服务器故障排除的基本原则性问题 一、服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压? 2.检查电源指示灯,如果亮,正常吗? 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗? 4.是否更换过显示器,更换另一台显示器。 5.去掉增加内存。 6.去掉增加的CPU 7.去掉增加的第三方I/O卡 8.检查内存和CPU 插的是否牢靠 9.Clear CMOS 10.更换主要备件,如系统板,内存和CPU 二、服务器故障排错的基本原则是什么 1.尽量恢复系统缺省配置

a:硬件配置:去除第三方厂商备件和非标配备件; b:资源配置:清除CMOS,恢复资源初始配置; c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序; d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗? 2.从基本到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。 3.交换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件; b: 交换NOS载体,既交换软件环境; c:交换硬件,既交换硬件环境; d:交换整机,既交换整体环境; 三、服务器故障排除需要收集哪些信息? 服务器信息: 1.机器型号 2.机器序列号(S/N: 如:NC00075534)

APG典型故障处理小结

APG典型故障处理小结 1、故障:intelligent networks management interface 分析:此告警表明文件系统在处理intelligent networks management interface (INM)接口连接时出错。 此时有两种情况:1、ACTIVE CONNECTION FILE BUFFER表明缓冲区文件有误; 2、INM LOG FILE表明INM的LOG文件处理时出错,此种情况比较常见,LOG FILE因为某些偶然原因被删除后就会出现这种情况,例如有时LARGE RESTART或是RELOAD后丢失此子文件。 处理: 用指令ssmpi:sfn=n+1其中SFN:SUBFILE NAME。n为最后一个INMLOG中的子文件的数目,出现这种情况。APG40中可以用CPFLS -S指令直接查看INMLOG 中的子文件情况。 2、故障:APG40系统中文件无法传到OSSDESTx的问题。 分析:多数此类告警都可以用指令CDHLS -L 查看所有路径的OSSDESTx 的传输类型和参数定义有否正确。大多数都不会有参数丢失的情况,然后用CDHVER 查看告警制定的OSS路径的状态是否OK,否则用指令CDHVER -M 人工修正使状态变为正常,消除告警。 但是有的告警比较特殊例如: AP FILE PROCESSING FAULT CAUSE FILE TRANSFER FAILED TRANSFER QUEUE ALOG DESTINA TION SET OSSDEST ALOG Problem Data Transfer error 分析处理过程:先试着用以上常规的处理方法即以上指令来设法消除此告警:1、用acease无法消除告警

问题解决思路讲解

解决问题的方法--问题解决七步法 俗话说:授人以鱼,不如授人以渔。 教人解决一个问题,不如教人解决问题的方法。问题解决七步法作为开展现场改善的基本方法,要解决的就不只是单个问题,而是如何去解决成百上千 问题的思路。将通常进行改善的PDCA过程,细分成七个关键的步骤,整理出来形成指导改善开展的方法,就是问题解决七步法。有问题就应该解决,似乎顺理成章,然而,很多时候问题并未得到有效解决。究其原因,一是欠缺解决问题的意识,二是缺少解决问题的方法。而七步法在这方面有其良好的效果。一方面,问题解决七步法为你提供了解决问题的方法,特别是当你遇到有较大不确定因素的问题,没有太多相似案例可以借鉴时,七步法很容易派上用场,它告诉你的是一种有效的思维逻辑。另一方面,当你需要借助解决问题的过程,培养员工的问题意识和解决问题的能力时,问题解决七步法更能体现其价值。因为仅仅解决单个问题不过是就事论事,养成解决问题的习惯才是一个团队学习能力的体现。 以下对七个步骤加以简单介绍。 STEP-1现状把握 说明:现状把握告诉我们在解决问题之前,首先要明白问题之所在,这是有效解决所有问题的前提。仅仅笼统地说这里不好、那里不好,并不能帮你更好地分析问题。以下三点有助你更准确地把握问题之所在: 1、从习惯找“问题”到习惯找“问题点” 问题:零件摆放混乱 问题点:待检/合格/不良等不同状态的零件未明确区分 问题:工作台脏乱差 问题点:边角料和工具配件随手扔、灰尘污垢未清扫 问题:工人效率低 问题点:搬运作业时间长,所占作业比重过大 2、从习惯“统述问题”到习惯“分述问题(现象+影响)” 统述问题:

每天出入库都有木踏板被损坏,严重点的通常都丢掉了,浪费了不少钱,也不利于节约资源,不利于环保,破损轻点的又弃之可惜,有几次随产品出货还被海外客户投诉了。 分述问题:(现象+影响) 1)有部分损坏的木踏板全部废弃,耗费资源; 2)每天约废弃18块,成为环境污染源,不利于环保; 3)整个木踏板大部分完好未再利用,浪费公司资金; 4)木踏板有少部分损坏弃之可惜,出货至海外后引起投诉。 3、从习惯“抽象”谈问题到习惯“量化”谈问题 抽象: 1)操作时行程较远 2)生产效率低。 量化: 1)操作时单程平均距离1米(1PCS) 生产数:1800PCS/日 员工每日来回行程:1800×1×2=3600米 2)生产1PCS行走约5秒每天生产1800PCS 花在行走的时间: 1800×5×264工作日/年=660小时 当然问题的关键还在于员工是否有兴趣去发现问题,也就是我们常说的问题意识。我认为有两方面值得 关注: 1、上级对待问题的态度所营造的氛围 2、责任人自身对手头工作的热爱程度。 >>>方法:

网络运维方案

网络运维方案-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

1服务体系 1.1总体原则和基本措施 1.1.1我公司在提供服务时要根据辽宁XX的服务需求情况和要求,遵循下 述基本原则: 以保证辽宁XX业务系统稳定正常为目标,全力保障所维护设备的正常 运行为最高指导原则 统一组织管理和调度针对本服务项目的技术资源,保证在客户需要时 能提供符合要求的人员和设备支持 以单一的接口保证双方的沟通能够简捷有效,并易于落实责任 建立快速响应机制,保证在特殊情况下,能够通过快速机制提供响应 通过责任到人、过程监控制等保证服务的效率和质量 1.1.2我公司采取如下主要措施: 采取7×24小时轮流值班制度,保障客户问题能在第一时间得到响 应; 采用问题升级制度,即在响应不到位或问题难以尽快解决的情况下, 将问题升级给更高级别的技术管理层。 根据辽宁XX的需要和知识产权的许可与辽宁XX共享与本项目服务相 关的部分技术信息资源。 通过我公司客户服务系统管理服务请求的登录和服务过程的监控等, 通过对过程记录文档的审计总结保证服务质量和服务过程改进。 1.1.3我公司与国内各大运营商有长期的合作关系,在沈阳本地设有分支机 构。我公司与本合同的维保设备原厂家具有一定的合作和授权关系。

1.1.4在项目实施后,我公司项目组与客户技术人员协商,制定出更合理的 资源配置方案。 1.2服务组织和人员 1.2.1公司人员 1.2.1.1我公司技术服务人员应有设备厂家的技术资格认证和多年维 护客户设备类型的工作经验,并根据客户设备种类、数量、分布、服务 要求,配备足够人员。我公司应有经过认证的专业技术服务人员可以作 为本项目的储备力量,当有紧急事情需要协助时,可以随时进行调配。 1.3备件管理 1.3.1在本地拥有专业的售后服务部门和备件库,配备有较强的技术支持和 服务资源,我公司能够利用这些资源对辽宁XX提供良好的快速响应和支持。 1.3.2我公司提供本项目维保设备相关的备件库、备品备件清单、所在地情 况和提供服务情况,备件库情况要求能随时接受检查。 1.3.3如需进行备件更换,须提供原厂商配件,不得使用假冒伪劣配件等。 发生硬件损坏时,应根据服务级别尽快提供备件以便及早解决故障。服务商须保证备件来自合法渠道。 1.4服务方式 1.4.1要求我公司提供包含并不限于如下服务方式: 7x24小时响应。 远程技术支持。 现场技术支持。

大型网络监控故障处理思路和方法

大中型网络IPC如果出现摄像头延迟,图像时常掉线,各几天就出现问题等一系列有关网络视频信号达不到的IPC的问题。如何快速定位是那个设备或者线材出现问题呢? 首先施工选材方面我们要使用国标的网线和抗拉性强的网线,(电源线,网络摄像头和有关网络摄像头其它配件,不在本文介绍,回头我会详细介绍。本文重点阐述问题是有关网络摄像头图像延迟,无图像问题) 现在市场上有好多种材质的网线,我以市场常见的网线为例子,一个个说明: 1)铜包钢网线:它的电阻100米大概是75-100欧姆左右!这种网线也是市场上最便宜的网线,电阻水通信效果也不怎么好!! 2)铜包铝网线:它的电阻100米大概是24-28欧姆左右!这种网线在市场上比较好卖,因为它便宜,且通信距离和效果都不错,可是他的使用寿命不是很长,因为他的抗氧化性差! 3)铜包银网线:铜包银网线又叫高导铝网线,材质比铜包铝要纯,它的电阻大概是100米15欧姆左右,这种网线算是网线的新品种,价格也不贵,上网距离比铜包铝网线要远几十米,但是它的不足跟铜包铝网线是一样的,寿命都是不长,一样的弱点,抗氧化性差!说好听的是铜包银网线,说不好听的也是铜包铝网线,但是它的成本是比铜包铝实实在在的贵好几十块钱,当然他的性能也是铜包铝网线没法比的! 4)铜包铜网线:这种网线电阻也不小,100米电阻值大概是42欧姆左右,上网性能一般,但是他抗氧化性强,使用寿命比铜包铝那些长得多! 5)无氧铜网线:无氧铜网线电阻是最小的,100米电阻大概是9.5欧姆左右,这种网线是目前市场上性能最好的网线!最优质的网线!电阻小,传输距离远,速率高且使用寿命长!基本上现在市场上就是以上面五种材质网线为主,其他的就暂时是不说了,希望可以相互促进和学习! **以上是选材方面,如果使用的线材质量过关。摄像头出现问题,那就可以直接排除了。接下来阐述如何检测故障原因。看图

运维常见问题详细解决方案

运维工作及常见解决方案

1.概述 1.1编写目的 编写本解决方案的目的是对运维人员在遇到问题的时候提供一个可参考的依据。运维人员以此解决方案作为今后在运维工作中遇到相同问题的一个指南和依据,指导运维人员如何去解决类似问题。也为新来运维人员熟悉运维工作。本解决方案主要从问题类型、问题描述和解决方案等方面进行说明。 1.2适用范围 适用于运维人员、新来运维人员及相关人员。 2.运维工作流程 ?客户打找运维服务,接到电话,先判断是由运维做还是的 人做; ?运维分机号为1,,先记录房间号,报修时间,服务开始时 间,故障现象及记录接线人。 ?负责人先想解决方法,告知运维人员大体方向,运维人员 根据了解的情况想解决方案,在去见客户的时候知道如何 操作; ?负责人给运维人员派工单,运维人员去执行; ?执行完之后跟负责人交待此次工作结果;

?回复,双方接收 ?每周的运维工作数据及运维工作报告的电子档须在下周一 十点前发送到负责人邮箱中。 3.运维工作内容 1)终端软件维护 2)网络调整 3)电话调整 4)机房巡检 5)服务器操作:应用系统包括安全系统、移动执法系统、备份系 统、机房监控系统;网络设备包括交换机、路由器、防火墙、 流量控制系统。 6)机房清洁 7)空调维护 8)其他 4.常见问题解决方案 4.1电脑装应用软件的步骤 新台式机和笔记本: ●装OFFRICE,正版序列号为 ●杀毒软件

●360安全卫士,修复系统漏洞,点击修复,在安装路径中产生 一个hotfix文件夹,然后把工具中的hotfix文件夹里面所有文 件拷贝到安装路径下的hotfix文件夹; ●装常用的工具:Wara,暴风影音,Adobe,QQ,MSN,以及用户要求 的免费软件 旧电脑: ●IP设置,每次都要记录IP,在用完之后把IP设置为原来的IP ●旧机器在装系统之前,我的文档及桌面上的文件要备份,用U 盘拷贝出来再装系统(要特别注意财物室的机器重装系统, 在装系统之前还需要把C盘里面的某些文件给拷贝出来) 注意事项: 1.不装克隆XP 2.不安装盗版软件 4.2常见问题类型 4.2.1打印机

网络故障排除思路

锐捷产品网络故障处理总结内部公开 目录 网络故障排除技术总结 (1) 1.网络故障排除技术概览 (1) 1.1在当今日益复杂的网络中进行故障排除 (1) 1.2网络故障的一般分类 (2) 1.3一般网络故障的解决步骤 (2) 2.网络排错常用诊断工具介绍 (8) 2.1 Ping命令 (8) 2.2 Traceroute 命令 (13) 2.3 Show命令 (18) 2.4 Clear命令 (22) 2.5 Debug命令 (23) 3.故障排除常用方法 (26) 3.1分层故障排除法 (26) 3.2分块故障排除法 (27) 3.3分段故障排除法 (27) 3.4替换法 (29) 4. 故障排除对排错技术人员的要求 (29) 4.1对协议要求有精深的理解 (29) 4.2能够引导客户详细描述出故障现象和相关信息 (29) 4.3充分了解自己所管理和维护的网络 (31) 4.4及时进行故障排除的文档记录和经验总结 (32)

网络故障排除技术总结 1.网络故障排除技术概览 1.1在当今日益复杂的网络中进行故障排除 当今的网络互连环境是日趋复杂的,而且随着需求发展的步伐这种复杂性是日益增长的,主要原因如下: ?现代的网络要求支持更广泛的应用:包括内容上的数据、语音、视频的应用;接入方式上有线,光纤,无线,多协议转换器,逻辑链路的应用;网络结构上二层,三层,二三层混合,VPN等的应用。 ?新业务发展使得网络的的需求不断增长,新技术的不断出现。例如:百兆以太网向千兆、万兆以太网的演进;各种防范攻击技术的出现;提供QoS 能力;IPV6的支持等。 ●新技术的应用同时还要兼顾传统的技术。例如,传统的网络体系结构仍 在某些场合使用。各种协议的发展,使得新网络的建设需要兼容原来的基础而进行改造。 ● 图1-1多样业务的需求和各种先进技术的引入 使网络日益复杂

一次现场故障处理的总结

一次实际现场故障处理的总结 2011年7月27日,北京西便门邮政一台安装红旗DC5sp4的服务器在早上运行时ORACLE报错,不能读一个表,导致ORACLE不能正常运行,然后直接影响这台服务器的正常运行。其管理员查看系统内存占用过大,要求红旗公司派下现场给予处理。 经我们现场检查,发现其ORACLE运行时内存共占用54GB左右,而其总的物理内存 为64GB。然而待服务器重启后,还未启动ORACLE,内存就被ORACLE用户的进程占用了49GB左右。现场初步判断应该是ORACLE配置的问题。建议让ORACLE公司派人来检查一下问题。我们同时收集了该服务器运行信息回公司分析。第二天给予明确回复。 28日,对昨天下现场工作进行分析总结。 通过这第一次下现场,从中学到不少实用技巧,发现售后服务工作需要有比较全面的 知识和技术,才能对故障现象进行深入准确地分析,发现问题,并提出解决或建议方案。 首先,检查系统运行状态主要用到的命令有如下四个: 一、ps命令 ps-ef&&显示所有进程,并用ASCII字符显示树状结构,表达程序间的 相互关系。ps-ef|wc-l&&统计当前共有多少个进程在运行。 ps-ef|grep oracle&&查看与oracle有关的所有进程信息。 具体命令解释如下: 1)ps a显示现行终端机下的所有程序,包括其他用户的程序。 2)ps-A显示所有程序。 3)ps c列出程序时,显示每个程序真正的指令名称,而不包含路径,参数或常驻服 务的标示。 4)ps-e此参数的效果和指定?参数相同。 5)ps e列出程序时,显示每个程序所使用的环境变量。 6)ps f用ASCII字符显示树状结构,表达程序间的相互关系。 7)ps-H显示树状结构,表示程序间的相互关系。 8)ps-N显示所有的程序,除了执行ps指令终端机下的程序之外。 9)ps s采用程序信号的格式显示程序状况。 10)ps S列出程序时,包括已中断的子程序资料。 11)ps-t<终端机编号> 指定终端机编号,并列出属于该终端机的程序的状况。 12)ps u 以用户为主的格式来显示程序状况。 13)ps x 显示所有程序,不以终端机来区分。 最常用的方法是ps-aux,然后再利用一个管道符号导向到grep去查找特定的进程,然 后再对特定的进程进行操作。

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

计算机网络几种典型故障的处理及维护方法

计算机网络几种典型故障的处理及维护方法 摘要网络故障极为普遍,网络故障的种类也多种多样,要在网络出现故障时及时对出现故障的网络进行维护,以最快的速度恢复网络的正常运行,掌握一套行之有效的网络维护理论、方法和技术是关键。就网络中常见故障进行分类,并对各种常见网络故障提出相应的解决方法。 关键词网络故障网络维护分类解决办法 随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,互联形成日渐庞大的网络系统。计算机网络系统的稳定运转已与功能完善的网络软件密不可分。计算机网络系统,就是利用通讯设备和线路将地理位置不同的、信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享:因此,如何有效地做好本单位计算机网络的日常维护工作,确保其安全稳定地运行,这是网络运行维护人员的一项非常重要的工作。 在排除比较复杂网络的故障时,我们常常要从多种角度来测试和分析故障的现象,准确确定故障点。 一、分析模型和方法 (一)七层的网络结构分析模型方法 从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的而且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是:从物理层的链路开始检测直到应用。自上而下是:从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。 (二)网络连接结构的分析方法 从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端三个模块。 1、客户端具备网络的七层结构,也会出现从硬件到软件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以在分析和测试客户端的过程中要有大量的背景知识,有时PC的发烧经验也会有所帮助。也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性的还是共性的,这将有助于自己对客户端的进一步检测作出决定。 2、来自网络链路的问题通常需要网管、现场测试仪,甚至需要用协议分析仪来帮助确定问题的性质和原因。对于这方面的问题分析需要有坚实的网络知识和实践经验,有时实践经验会决定排除故障的时间。 3、在分析服务器端的情况时更需要有网络应用方面的丰富知识,要了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。 (三)工具型分析方法 工具型分析方法有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。 (四)综合及经验型分析方法靠时间、错误和成功经验的积累 在大多数的阿络维护工作人员的工作中是采用这个方法的,再依靠网管和测试工具迅速定位网络的故障。 二、计算机无法上网故障排除 1、对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。 如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡

服务器维修故障诊断思路大全

前言: 相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。 本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦 当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决) 目录: 一、服务器常见故障分类 二、服务器常见故障现象及其对应排错方法 三、服务器排错基本原则 四、服务器故障需要收集哪些信息 五、服务器硬件故障排错实例 六、服务器软件故障排错实例 七、服务器常见内存故障现象 一、服务器常见故障类型分类: A. 开机无显示 B. 加电BIOS自检阶段故障 C. 系统和软件安装阶段故障和现象 D. 操作系统启动失败 E. 系统运行阶段故障 二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示) 1. 检查供电环境 2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。) 3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动 4. 是否更换过显示器,尝试更换另外一台显示器 5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试 6. 是否添加了CPU,如果有增加CPU尝试去掉 7. 去掉增加的第三方I/O卡包括Raid卡等 8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服) 9. 尝试更换主板、内存等主要部件 10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下 B.加电BIOS自检报错 1. 根据BIOS自检报错信息提示 2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启 3. 做最小化测试 4. 尝试清除CMOS 5. 看能否正常进入BIOS C. 系统安装阶段故障和现象 1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表) 2.系统安装蓝屏(对蓝屏故障代码诊断) 3.安装在分区格式化的时候找不到硬盘 (阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装) 4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡) (使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可) 5.安装过程是死机 (检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题) 6.引导光盘安装失败

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一 例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、 查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但 是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中 断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化 呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做 “ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、 制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方 案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。

确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或 工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更 等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系 统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更 大部份故障是由于变更导致,确定故障现象后,如果有应的变更,有助于从变 更角度出现分析是否是变更引起,进而快速定位故障并准备好回切等应急方案。 是否可缩小范围 一方面应用系统提倡解耦,一支交易会流经不同的应用系统及模块;另一方面,故障可能由于应用、系统软件、硬件、网络等环节的问题。在排查故障原因时 应该避免全面性的排查,建议先把问题范围缩小到一定程序后再开始协调关联 团队排查。 关联方配合分析问题

LTE常见故障总结

L TE-FZHA(RL25)常见故障总结 目录 LTE-FZHA(RL25)常见故障总结 (1) 1.System module failure (0010) (3) 2.BTS reference clock missing (1898) (3) 3.Configuration error: Unit initialization failure (0012) (3) 4.Configuration error: Not enough HW for LCR (1868) (4) 5.Configuration error: Power level not supported (4008) (4) 6.Cell configuration data distribution failed (6253) (4) 7.Failure in optical RP3 interface (4064) (5) 8.Failure in optical RP3 interface (0010) (5) 9.Baseband bus failure (3020,1906) (5) 10.RF module failure (6259,1911、1711、1712) (5) 11.Cell power failure (4090) (6) 12.GPS Receiver alarm: Control Interface not available (4011) (6) 13.X2 interface setup failure(6304) (6) 14.Transport layer connection failure in X2 interface (6) 15.Failure in replaceable baseband unit (7) 16.Temperature alarm(0002) (7) 17.VSWR(1838) (7) 18.Failure in optical RP3 interface (2004) (8) 19.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (8) 20.Failure in optical RP3 interface(2000) (8) 21.光纤交叉连接 (8) 22.基站始终无法建立S1连接,只到configed状态 (9) 23.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (9) 24.某一个小区的RRU无法识别 (9) 25.BBU版本无法识别 (10) 26.校准初步排查 (10) 27.本地IP地址和路由正常,ping不通MME和网关 (11) 28.TRS文件始终无法生效 (11) 29.三种疑难告警 (12) 30.远程ping不通基站 (12) 31.风扇告警 (12) 32.BTSlog有link消息,但是pinger始终不亮 (12) 33.驻波问题 (13) 34.pinger正常,但是SM里小区显示橙黄色告警 (13) 35.几个特列 (13) 36.FOSI 和FOSN的光功率范围 (13) 37.不同频段RRU类型 (13)

常见网络故障的排除方法

常见网络故障的排除方法 我们在进行网络硬件和软件的安装之后,可能会遇到各种问题,导致无法连通网络。要解决这些网络问题,必须具备丰富的软、硬件知识。局域网的组建并不复杂,但是很多时候局域网的故障会把人弄得焦头烂额。因此对网络故障测试和调试的方法是解决问题的关键。 局域网的故障主要分硬件故障和软件故障两种。其中硬件故障比较难诊 断和解决。 一、硬件故障 硬件故障又分为以下几种: 1、设备故障 设备故障是指网络设备本身岀现问题。如网线制作或使用中岀现问题,造成网线不通。在一般硬件故障中,网线的问题占其中很大一部分。另外,网卡、集线器和交换机的接口甚至主板的插槽都有可能损坏造成网络不通。 2、设备冲突 设备冲突是困扰电脑用户的难题之一。电脑设备都是要占用某些系统资源的,如中断请求、I/O地址等。网卡最容 易与显卡、声卡等关键设备发生冲突,导致系统工作不正常。 一般情况下,如果先安装显卡和网卡,再安装其他设备,发生网卡与其他设备冲突的可能性就小些。 3、设备驱动问题 设备驱动问题严格来说应该算是软件问题,不过由于驱动程序与硬件的关系比较大,所以也将其归纳为硬件问题。主要问题是岀现不兼容的情况,如驱动程序、驱动程序与操作系统、驱动程序与主板BIOS之间不兼容。 二、软件设置故障 除了硬件故障外,软件设置不正确也会导致局域网岀现各种各样的故障。 1、协议配置问题 协议作为电脑之间通信的语言”如果没有所需的协议,协议绑定不正确,协议的具体设置不正确,如TCP/IP协 议中的IP地址设置不正确,都是导致网络出现故障的原因。 2、服务的安装问题 局域网中,除了协议以外,往往需要安装一些重要的服务。举例来说,如果需要在Windows系统中共享文件和打 印机,就需要安装Microsoft文件和打印共享。

服务器常见故障及解决办法

服务器常见故障排除 服务器常见故障一、造成服务器无法启动的主要原因: 1)市电或电源线故障(断电或接触不良) 2)电源或电源模组故障 3)内存故障(一般伴有报警声) 4)CPU故障(一般也会有报警声) 5)主板故障 6)其它插卡造成中断冲突 服务器常见故障二、服务器无法启动? 1)检查电源线和各种I/O接线是否连接正常。 2)检查连接电源线后主板是否加电。 3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 服务器常见故障三、系统频繁重启? 造成系统频繁重启的原因: 1)电源故障(替换法判断解决) 2)内存故障(可从BIOS错误报告中查出) 3)网络端口数据流量过大(工作压力过大) 4)软件故障(更新或重装操作系统解决) 服务器常见故障四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 1)软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 2)硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)

相关文档
最新文档