运维培训(常见故障排查)

运维培训(常见故障排查)
运维培训(常见故障排查)

运维培训课程(一)

常见故障排查

常见名词含义

1、IP地址

IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.”

分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。

IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传输的就是私有地址。私有地址有以下几个段:10.0.0.0-10.255.255.255、172.16.0.0-172.31.255.255、192.168.0.0-192.168.255.255,其他的都是共有地址,当然还有127.0.0.0/8是本地环回地址。

子网掩码的含义,子网掩码的作用是用来区分网段与节点的位置,比如说32位的IP地址,前面24位表示网段,后面8位表示节点地址的话,掩码就是255.255.255.0。

在交换式的网络中只有在同一网段的主机才可通信。

2、DNS服务器

DNS是域名解析服务器,作用是用来把域名解析成IP地址,这样计算机就能在网络找到相应的WEB服务器了。

比如说https://www.360docs.net/doc/183446189.html,,这个地址计算机是不认识的,

必须要靠DNS来解析这个域名的地址,换句话说DNS 就好比是翻译。我们长宽的DNS有211.162.31.8跟211.162.31.9,南京电信的DNS有218.2.135.1跟202.102.24.35。

DNS只跟浏览网页有关,跟其他的应用没有关系。DNS

自动获取就可以了,也可以手工指定,但是一定要设

置正确的DNS。

3、带宽

带宽是上网的时候用户跟INTERNET互联的带宽,就好比道路的宽度是一样的。带宽的单位是bit/s(比特/秒)。

带宽分上行跟下行。这里一定要跟下载速度区分开来,下载速度的单位是Byte/s(字节/秒)。一个Byte是8个bit。b/s与B/s一定要分清楚。

4、PING

Ping命令是用来检测连通性最常用的工具。这是个DOS 命令,必须在DOS窗口下运行。一般格式是ping 目标地址回车,比如ping 192.168.1.1 。也可以跟一些参数,比如-t\-l,如ping 192.168.1.1 –t –l 1024 ,这个的含义是一直ping直到手工终止,并且包的大小被指定为1024个字节。下面是几张截图:

5、netstat

netstat 是检查当前电脑的TCP与UDP连接状态,如下图:

参数-n是只查看TCP连接的状态,第一项Proto是协议,Local Address是本地地址,Foreign Address 是远程地址,State是状态。这里如果是要查看游戏IP的话,只需要看建立状态(ESTABLISHED)的远程地址,比如这里的221.130.182.92:80。80是端口号,80是网页。

一般游戏的端口号是比较大的数字,一些固定的端口号有21:FTP;23:telnet;网页:80等。

常见故障以及解决办法

一、终端用户类

1、691

691故障可能原因有 A 用户名或者密码错误

B 机房捆绑错误

C 账号已经到期

D 账号已经登陆

691的处理方法是查看BOSS的错误日志。

2、678和815

678是我们遇到最多的故障现象了。可能引起的原因也是最多,虽然它的解释就一句“远程计算机没有相应”。下面就把可能的原因列出来:

A 线路故障用户电脑一直到拨号服务器之间的线路不通

B 设备故障用户电脑一直到拨号服务器之间任何一

台设备损坏

C 用户使用了路由器

D 存在环路

E 用户电脑网卡损坏

处理这种678的故障有一个诀窍:故障一定出现在所有出现678故障的电脑的公共位置。比如说同楼道2个用户出现678,那就去找这2家用户入户线的公共位置,很显然是楼道交换机处;如果同一栋楼不同楼道的4家用户出现了678,那就去找这4家用户的公共位置,很显然是楼道光电所在地;整个小区都是678,那就去找这整个小区的用户线路的公共位置,那显然是社区机房了。

3、769

原因:A 用户电脑网卡被禁用

B 用户电脑网卡驱动没有安装或者没有正确安装

4、676、619等

原因:A 账号已经登陆

B 拨号软件损坏

C 电脑尚未完全启动

D 错误678的原因都有可能

E 设备丢包严重

5、故障现象:网页打不开,能PING通网关,游戏也正常。

原因:A 我们的DNS服务器未正常工作

B 设置了错误的DNS服务器(正常的是211.162.31.8跟211.162.31.9)

C 设置了浏览器代理

D 用户电脑系统故障

6、故障现象:PING网关丢包。

原因:A 设备本身存在丢包(网卡、交换机、光电等)

B 接触不良,多半出现在水晶头、模块、网卡等接头处

C 线路拥塞,比如网内有中毒电脑在发送大量的数据包。

7、故障现象:获取到192开头的IP地址。

先说明一下,有3个段的IP地址是私有地址,

10.0.0.0-10.255.255.255,172.16.0.0-172.31.255.255,

192.168.0.0-192.168.255.255。私有地址的意思就是谁都可以使用的IP地址,不需要申请跟付费,但是这种地址不能在广域网中出现。我们的认证服务器所分配的IP地址均为公有地址。如果获得以上3个地址段的任何一个IP 地址,这说明在用户电脑的附近存在一台DHCP服务器。

原因:A 手工指定的静态IP地址

B 用户家使用了路由器

C 本小区内存在代理服务器

8、故障现象:网络电缆被拔出

说明用户家电脑至最近的一台交换机间线路不通,这时候拨号也是显示678。

原因:A 线路不通

B 网卡损坏

C 线缆类型不对,使用的是交叉线而非直通线

D 对端设备损坏

E 网卡速率与交换机的速率不一致

9、故障现象:打开网页慢、游戏慢。

这里的速度慢主要的参照对象是比平时使用时的速度。

其实这两种现象要分开来讨论。网页打开慢,是大多数网页还是个别网站,这里只讨论大多数网站的情况。

原因:A DNS服务器相应慢

B 线路拥塞

C 存在丢包(到网关)

D 浏览器中病毒,CPU使用率过高甚至100%

玩游戏(网络游戏)速度慢的原因:

A 游戏服务器人数过多

B 游戏服务器故障

C 电脑中病毒

D 到达游戏服务器的数据包延迟过高,甚至丢

E 到网关就存在数据包丢失

10、故障现象:本地连接显示10M或者100M

本地连接显示的10M或者100M的意思是网卡到我们最近的一台设备之间的链路速度是10M或者100M,并不是指本身的带宽就是这么多。一般情况下我们的交换机都是10/100M自适应的,意思就是可以自动根据对端的设备来改变自身的速率。我们的五类线也是支持100M 传输速率的。用户的网卡一般也是10/100M自适应的。

所以一般情况下用户家电脑上本地连接显示是100M。如果出现10M的可能原因有:

A 交换机端口只支持10M

B 手工更改了网卡的速率为10M

C 线路衰减很大,一般是网线过长(超出100米)

D 附近存在电磁波干扰

11、故障现象:本地连接受限制或者无连接

其实这种现象是正常的。我们现在采用的是PPPOE认证方式,PPPOE是基于以太网的点对点协议。这种认证方式与普通的网页认证加DHCP的方式的区别是需要上

网的时候,用户需要拨号,向拨号服务器发送账号与密码,如果通过了,拨号服务器会分配一个合法IP给拨号请求者。在用户的电脑上我们会发现多了一个宽带连接,其实这是一个虚拟的本地连接。它是基于真实的物理网卡所创建的虚拟网卡。所以原来的本地连接就会显示受限制,IP地址分给了这个虚拟的网卡。这个时候真实的网卡是不能禁用的。

12、故障现象:拨号正常,网页打不开,游戏上不了

原因:A 电脑的操作系统故障

B 大网出口中断

C 楼道交换机损坏

13、故障现象:用户使用路由器后不能上网

原因:A 路由器没有设置成PPPOE模式

B 路由器的DHCP功能没有打开

C 进户线未插在路由器的WAN口

D 路由器本身是坏的

14、故障现象:用户使用路由器后一台电脑可以上网,另一

台却不可以

原因:A 路由器的DHCP功能没有打开,能上的那台设置了静态IP跟路由器正常互联,不能上网的那台却没

有设置IP地址

B 路由的LAN口有坏口

C 不能上网的电脑本身的问题(软硬件故障)

15、暗线问题

暗线问题主要是找线的过程,一定要准确。一般装修过的房子都会放暗线,但是每家的布线都是不一样的,不过有个共同点,线虽然在墙里,但是线头必须在墙外。先找线头,再通过测线仪测线把具体布线情况找出来。最常见的布线方法有三种:

A 在客厅汇总,然后分别与每个房间连接,再引一根线与户外线连接;

B 每个房间的线都直接放到户外

C 一根线进户,然后经过每个房间,形成串联

这三种情况下,接线方式稍微有些不同,如果是用户不使用路由器,那么就没有区别,如果是使用路由器,要同时几台电脑上网,接线方式就不一样。第一种情况只需要将路由器放在客厅,就可以保证每个房间都能上网;第二种情况下就比较麻烦,因为路由器不能放到户外。但是这路有个小技巧,用户家的线都是8芯五类线,我们可以把路由器放在任何一个房间,用其中4芯将进信号给路由器,再用剩下的4芯与另一个房间的线对接,这样就可以保证2个房间的上网了;第三种情况也可以参照第二种情况的方法,来保证2个

房间的上网。

在测试线路的时候一定要节省水晶头,不要把每个线头都打上水晶头再来测线,只需要在一头打上水晶头,在另一边将线短路就可以测试了。

题目:1、在客厅有3个线头,分别连到3个房间,如何以最快的速度把线找对?

2、在一根暗线的两头都打上A类水晶头,测试结果是,发送端与接收端都是124567亮,这根线是否还可以使用?

3、在用户家发现有一个房间的线打上水晶头后,接上测线仪的发送端后发现12345678按顺序亮,能说明什么问题?

4、在用户家发现有一个房间的线打上水晶头后,接上测线仪的接收端后发现12345678按顺序亮,能说明什么问题?

16、家用路由器

现在的家庭有多台电脑的情况已经很多了,要实现共享上网最好的方法就是买个家庭路由器,价格便宜,简单方便。家庭路由器一般是1个WAN口加4个LAN口,WAN口用来接进线,LAN口接电脑。具体的配置要看宽带运营商的上网方式,是自动分配地址的(DHCP)还是PPPOE拨号,还

是静态地址类型。就南京长宽而言有两种方式,家庭用户一般都是PPPOE拨号,商业客户一般都是静态地址。所以在设备路由器的时候一定先要知道是哪种上网方式。另外路由器还有DHCP的功能,可以给LAN口自动分配私有IP地址。有3个段的IP地址是私有地址,10.0.0.0-10.255.255.255,172.16.0.0-172.31.255.255,192.168.0.0-192.168.255.255。私有地址的意思就是谁都可以使用的IP地址,不需要申请跟付费,但是这种地址不能在广域网中出现。各个厂商的路由器分配的地址可能不一样,但是原理都是一样的。使用路由器的时候一定要注意,不要将进线接到LAN口,这样的话不但起不到路由器的作用,还会给其他用户分配似有IP地址。

问题:1、用户家电脑接上路由器后,本地连接受限制,说明什么问题?

2、用户家电脑接上路由器后,可以开QQ,网页打不开,说明什么问题?

17、具体应用

具体应用指具体的游戏、网站等应用,可能会出现打开慢或者掉线之类现象,这个时候最好查看下对应服务器的IP 地址。如果是网站可以使用Ping、nslookup、netstat命令来查看对应的IP地址,如果是游戏,可以登陆后使用netstat 命令来查看对应服务器的IP地址。查到后发邮件给网管,告诉他具体的问题现象以及查到的IP地址跟端口号。网管收到邮件后查看到达这些服务的路径,来选择调整。最简单的办法就是网通的服务器的话,就让访问这个服务器的流量从网通接口出去,如果是电信服务器,就从电信接口出去,来达到传输的最佳效果。具体的应用还有很多,比如邮件、VPN、炒股软件等等,具体解决步骤都是大同小异,先查到对端IP 地址,再让网管来查看具体的数据路径,再选择调整。

问题:1、如何查看https://www.360docs.net/doc/183446189.html,的IP地址?

2、如何查看QQ游戏的IP地址?

18、操作系统问题

操作系统的故障也是比较频繁,显而易见的比如:死机、蓝屏、启动不了等,不易察觉的有:拨号678、浏览器打不开等。如果是操作系统故障最好能用另一台正常的电脑来作比较,好让用户相信我们所说的问题。那么在重新做系统的时候要注意以下几点:1、征得用户同意;2、做好文件备份;3、做好驱动备份;4、最好不要打开机箱;5、把常用软件帮用户装好;6、保证可以上网。其实最重要的不是要把系统做的多么专业,而是要跟用户沟通,拉近跟用户的距离,不要自己做自己的。

19、排线问题

用户家里或者户外如果要排线,一定要遵循以下几点要求:1、横平竖直,隐蔽并且美观;2、不要与强电过于靠近或者平行走线;3、遵循100M规则;4、线一定要固定牢固;5、尽量不要走门缝等容易被挤压到的地方;6、征

得用户的同意方可走线。最主要的是第3条遵循百米规则,我们所使用的五类线,要保证100兆的传输速率,就必须遵循这个规则。在实际的使用过程中,不可能做到那么的准确,如果感觉比较远,或者用户家的电脑网卡不能启用100M的速率,那么必须在中间增加一个信号放大设备,比如交换机。如果在中间位置不能架设机箱,那么就必须使用光纤来代替五类线。

问题:有一家拉线用户,距离比较远,肯能有130米,用户家电脑的本地连接显示“本地电缆没有插好”,有什么解决办法?

20、水晶头

五类线所使用的水晶头称之为RJ45水晶头,跟电话线所使用的RJ11是有区别的。RJ45是8针,RJ11体积上要稍小,只有2针。如下图:

RJ45RJ11 水晶头的制作规范有两种,T568A跟T568B,两种打法是世界通用的标准。

T568A的线序是:白绿、绿、白橙、蓝、白蓝、橙、白棕、棕

T568B的线序是:白橙、橙、白绿、蓝、白蓝、绿、白棕、棕

如下图:

这里的白绿、白蓝指的是跟对应颜色相缴的白线。

长宽所使用的是A类线序,只要不说明的地方一律使用A类线序。

直通线与交叉线的概念:

直通线:线的两端是一致的打线顺序,都是A类或者都是B类,称为直通线。

交叉线:线的两端是不一致的打线顺序,一都是A类,另一头是B类称为交叉线。

直通线跟交叉线使用的地方稍微有所区别。

如果两端的设备是一致的需要使用交叉线;如果两端的设备是不一致的设备需要使用直通线。比如:

电脑交叉线电脑

交换机交叉线交换机

交换机直通线电脑

交换机直通线光电

当然实际应用中会有些不一样,有些设备是比较智能的,它会自动判断需要使用的线缆类型来自我调整,比如交换机与交换机本来是需要交叉线来互联的,但是使用了直通线,那么这些智能交换机会自动把对应的端口改成交叉口而保证链路的正常建立。当然我们在实际工作中不能依赖这些智能设备,该使用何种线缆就使用何种线缆。

水晶头出现故障还是比较少的,比较常见的故障是:1、在制作水晶头的时候没有压好导致松动,时间常了就会解除不良;2、水晶头被氧化导致接触不好;3、在压线的时候弹片弯了,导致接触不好引起丢包。遇到水晶头故障的时候处理起来很简单,只要重新做一个就好,主要是在找故障的时候我们往往会忽略水晶头故障,所以在处理任何故障的时候都要细心一点,不要放过任何可能原因。

问题:一楼道中使用华硕8口交换机,用户可以上网,但是换成GES1008后,其中一个用户家电脑显示“本地电缆没有插好”,可能原因?怎么解决?

二、楼道类

1、光电收发器

光纤与五类线的区别,它们所承载的信号也是不一样的,光纤是光信号,五类线是电信号。光电转换器的功能就是负责把光信号与电信号的互相转换,同时提供光源。所以这种设备同时具备光口与电口两种端口。先来看下设备的外观。

光电光电光电模块

机架式光电机架式光电

如果是模块化的光电转换器都是支持热插拔的,不需要断电后再装卸模块。

光口跟电口分别有指示灯来指示对应的链路状态,亮表示链路通畅。

电口的连接线就是五类线,光口的连接线是光跳线,如下图:

FC—FC SC—SC ST—SC

光跳线特别要注意的地方是不能拉跟折,这些线是很脆弱的,里面的玻璃丝非常细,外力是很容易折断的。所以在使用的时候要轻拿轻放。

光纤的连接线一般是成对出现的,如果两跟线插反了会不会损坏设备呢?怎么判断正反呢?光跳线插反了是不会损坏设备的,那么怎么判断正反呢,如果反了,光链路指示灯是不会亮的。那么如果不知道哪个灯是光链路指示灯怎么办呢?人为把跳线对调下,或者拔出跳线,哪个灯灭了,哪个灯就是光链路指示灯。

光电的故障有可能是光口故障也可能是电口故障,在处理的过程中可以通过看灯的闪烁或者通过另一台设备的对比来判断故障点。光电易出故障有:1、光口或者电口不亮;2、不能传输数据;3、丢包;4、特殊数据包无法通过。在处理此类故障的时候最好能有一台确定是好的光电来做比较,当然能使用笔记本测试下数据是最好的。

2、交换机

交换机的功能就是负责数据的交换与传输。根据性能的不

同可以分为二层交换机、三层交换机与多层交换机,在二层交换机里面也有可网管与不可网管的区分。这里只讨论不可网管的二层交换机。(以下所说的交换机均指不可网管二层交换机)

交换机是处在OSI七层模型的第二层,是可以识别MAC 地址的。这是交换机与HUB的最大区别。既然能够识别MAC地址,那么交换机的数据传输就可以做到点对点的传输。一台100M的交换机接10个用户,是不是每个用户分到10M带宽呢?不是的,每个用户都是100M的速率。用户互相之间是没有影响的。通过下面的图示来认识一下交换机的外观。

D-Link24口交换机48口交换机

5口交换机

IT运维手册故障及处理

IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网

①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

运维常见问题详细解决方案

运维工作及常见解决方案

1.概述 1.1编写目的 编写本解决方案的目的是对运维人员在遇到问题的时候提供一个可参考的依据。运维人员以此解决方案作为今后在运维工作中遇到相同问题的一个指南和依据,指导运维人员如何去解决类似问题。也为新来运维人员熟悉运维工作。本解决方案主要从问题类型、问题描述和解决方案等方面进行说明。 1.2适用范围 适用于运维人员、新来运维人员及相关人员。 2.运维工作流程 ?客户打找运维服务,接到电话,先判断是由运维做还是的 人做; ?运维分机号为1,,先记录房间号,报修时间,服务开始时 间,故障现象及记录接线人。 ?负责人先想解决方法,告知运维人员大体方向,运维人员 根据了解的情况想解决方案,在去见客户的时候知道如何 操作; ?负责人给运维人员派工单,运维人员去执行; ?执行完之后跟负责人交待此次工作结果;

?回复,双方接收 ?每周的运维工作数据及运维工作报告的电子档须在下周一 十点前发送到负责人邮箱中。 3.运维工作内容 1)终端软件维护 2)网络调整 3)电话调整 4)机房巡检 5)服务器操作:应用系统包括安全系统、移动执法系统、备份系 统、机房监控系统;网络设备包括交换机、路由器、防火墙、 流量控制系统。 6)机房清洁 7)空调维护 8)其他 4.常见问题解决方案 4.1电脑装应用软件的步骤 新台式机和笔记本: ●装OFFRICE,正版序列号为 ●杀毒软件

●360安全卫士,修复系统漏洞,点击修复,在安装路径中产生 一个hotfix文件夹,然后把工具中的hotfix文件夹里面所有文 件拷贝到安装路径下的hotfix文件夹; ●装常用的工具:Wara,暴风影音,Adobe,QQ,MSN,以及用户要求 的免费软件 旧电脑: ●IP设置,每次都要记录IP,在用完之后把IP设置为原来的IP ●旧机器在装系统之前,我的文档及桌面上的文件要备份,用U 盘拷贝出来再装系统(要特别注意财物室的机器重装系统, 在装系统之前还需要把C盘里面的某些文件给拷贝出来) 注意事项: 1.不装克隆XP 2.不安装盗版软件 4.2常见问题类型 4.2.1打印机

桌面运维面试题

1.电脑无法上网(打不开网站),请给出你的排查步骤? 1)首先确定物理链路是否联通正常。 2)查看本机IP、掩码、网关、DNS的设置情况是否正确。 3)Ping本机回环地址,检测网卡驱动及TCP/IP协议是否安装正常。 4)测试到网关或路由器的通畅情况,先测网关,然后再测路由器一级一级的测试。 5)测试Ping公网IP的通畅情况(记住几个外部IP)。 6)使用nslookup 或Ping 测试DNS是否能正常解析网站域名。 注:也可以在1、2步完成之后,从后向前排查。 2.请口述DNS的解析过程

当浏览器或应用程序要求解析一条域名时,首先检查本机H osts文件和DNS缓存中是否存在对应的条目,如果有,直接返回该条目,如果没有,则开始下面的查询步骤。 1)客户机提出域名解析请求,并将该请求发送给本地域名服务器。 2)当本地域名服务器收到请求后,就先查询本地的缓存,如果有该纪录项,则本地域名 服务器就直接把查询的结果返回。 3)如果本地的缓存中没有该纪录,则本地域名服务器就直接把请求发给根域名服务器, 然后根域名服务器再返回给本地域名服务器一个所查询域(根的子域)的主域名服务 器的地址 4)本地服务器再向上一步返回的域名服务器发送请求,然后接受请求的服务器查询自 己的缓存,如果没有该纪录,则返回相关的下级的域名服务器的地址。 5)重复第四步,直到找到正确的纪录。 6)本地域名服务器把返回的结果保存到缓存,以备下一次使用,同时还将结果返回给客 户机。 3.电脑开机黑屏无反映,常见的排错方法是什么? 1)按主机电源开关,看主机开关指示灯是否亮起,若不亮,检查主机电源线是否接触 良好,检查插板等是否通电。若亮灯,继续下一步。 2)主机指示灯亮,看显示器指示灯是否亮起,若不亮,检查显示器电源连接线以及信 号线(VGA线),是否接触良好。【若之前挪动过电脑或重新拔插过VGA连接线,就要检查看两端的的针是否有异常,若发生断针或歪斜针,纠正使其端正即可解除 故障】若完好,继续检查下一步 3)主机灯亮、显示器灯亮、数据线完好,电脑仍旧是黑屏,且硬盘灯不闪烁,键盘灯 也不亮,这时候先断开主机电源,然后按主机电源开关,在不通电的情况下按主机

(2020)运维常见问题解决方案v

运维常见问题解决方 案v

运维工作及常见解决方案 运维人员编写 2010年12月

1.概述 1.1编写目的 编写本解决方案的目的是对运维人员在遇到问题的时候提供一个可参考的依据。运维人员以此解决方案作为今后在运维工作中遇到相同问题的一个指南和依据,指导运维人员如何去解决类似问题。也为新来运维人员熟悉运维工作。本解决方案主要从问题类型、问题描述和解决方案等方面进行说明。 1.2适用范围 适用于运维人员、新来运维人员及相关人员。 2.运维工作流程 ?客户打找运维服务,接到电话,先判断是由运维做还是的 人做; ?运维分机号为1,,先记录房间号,报修时间,服务开始时 间,故障现象及记录接线人。 ?负责人先想解决方法,告知运维人员大体方向,运维人员 根据了解的情况想解决方案,在去见客户的时候知道如何 操作; ?负责人给运维人员派工单,运维人员去执行;

?执行完之后跟负责人交待此次工作结果; ?回复,双方接收 ?每周的运维工作数据及运维工作报告的电子档须在下周一 十点前发送到负责人邮箱中。 3.运维工作内容 1)终端软件维护 2)网络调整 3)电话调整 4)机房巡检 5)服务器操作:应用系统包括安全系统、移动执法系统、备份系 统、机房监控系统;网络设备包括交换机、路由器、防火墙、 流量控制系统。 6)机房清洁 7)空调维护 8)其他 4.常见问题解决方案 4.1电脑装应用软件的步骤 新台式机和笔记本:

●装OFFRICE,正版序列号为 ●杀毒软件 ●360安全卫士,修复系统漏洞,点击修复,在安装路径中产生 一个hotfix文件夹,然后把工具中的hotfix文件夹里面所有 文件拷贝到安装路径下的hotfix文件夹; ●装常用的工具:Wara,暴风影音,Adobe,QQ,MSN,以及用户 要求的免费软件 旧电脑: ●IP设置,每次都要记录IP,在用完之后把IP设置为原来的IP ●旧机器在装系统之前,我的文档及桌面上的文件要备份,用U 盘拷贝出来再装系统(要特别注意财物室的机器重装系统, 在装系统之前还需要把C盘里面的某些文件给拷贝出来) 注意事项: 1.不装克隆XP 2.不安装盗版软件 4.2常见问题类型 4.2.1打印机

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

桌面运维面试题

1.电脑无法上网(打不开网站),请给出您的排查步骤? 1)首先确定物理链路就是否联通正常。 2)查瞧本机IP、掩码、网关、DNS的设置情况就是否正确。 3)Ping本机回环地址,检测网卡驱动及TCP/IP协议就是否安装正常。 4)测试到网关或路由器的通畅情况,先测网关,然后再测路由器一级一级的测试。 5)测试Ping公网IP的通畅情况(记住几个外部IP)。 6)使用nslookup 或Ping 测试DNS就是否能正常解析网站域名。 注:也可以在1、2步完成之后,从后向前排查。 2.请口述DNS的解析过程

当浏览器或应用程序要求解析一条域名时,首先检查本机H osts文件与DNS缓存中就是否存在对应的条目,如果有,直接返回该条目,如果没有,则开始下面的查询步骤。 1)客户机提出域名解析请求,并将该请求发送给本地域名服务器。 2)当本地域名服务器收到请求后,就先查询本地的缓存,如果有该纪录项,则本地域名服 务器就直接把查询的结果返回。 3)如果本地的缓存中没有该纪录,则本地域名服务器就直接把请求发给根域名服务器, 然后根域名服务器再返回给本地域名服务器一个所查询域(根的子域)的主域名服务器的地址 4)本地服务器再向上一步返回的域名服务器发送请求,然后接受请求的服务器查询自 己的缓存,如果没有该纪录,则返回相关的下级的域名服务器的地址。 5)重复第四步,直到找到正确的纪录。 6)本地域名服务器把返回的结果保存到缓存,以备下一次使用,同时还将结果返回给客 户机。 3.电脑开机黑屏无反映,常见的排错方法就是什么? 1)按主机电源开关,瞧主机开关指示灯就是否亮起,若不亮,检查主机电源线就是否接触 良好,检查插板等就是否通电。若亮灯,继续下一步。 2)主机指示灯亮,瞧显示器指示灯就是否亮起,若不亮,检查显示器电源连接线以及信号 线(VGA线),就是否接触良好。【若之前挪动过电脑或重新拔插过VGA连接线,就要检查瞧两端的的针就是否有异常,若发生断针或歪斜针,纠正使其端正即可解除故 障】若完好,继续检查下一步 3)主机灯亮、显示器灯亮、数据线完好,电脑仍旧就是黑屏,且硬盘灯不闪烁,键盘灯也 不亮,这时候先断开主机电源,然后按主机电源开关,在不通电的情况下按主机电源开

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一 例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、 查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但 是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中 断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化 呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做 “ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、 制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方 案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。

确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或 工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更 等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系 统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更 大部份故障是由于变更导致,确定故障现象后,如果有应的变更,有助于从变 更角度出现分析是否是变更引起,进而快速定位故障并准备好回切等应急方案。 是否可缩小范围 一方面应用系统提倡解耦,一支交易会流经不同的应用系统及模块;另一方面,故障可能由于应用、系统软件、硬件、网络等环节的问题。在排查故障原因时 应该避免全面性的排查,建议先把问题范围缩小到一定程序后再开始协调关联 团队排查。 关联方配合分析问题

运维培训(常见故障排查)

运维培训课程(一) 常见故障排查 常见名词含义 1、IP地址 IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.” 分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。 IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传输的就是私有地址。私有地址有以下几个段:10.0.0.0-10.255.255.255、172.16.0.0-172.31.255.255、192.168.0.0-192.168.255.255,其他的都是共有地址,当然还有127.0.0.0/8是本地环回地址。 子网掩码的含义,子网掩码的作用是用来区分网段与节点的位置,比如说32位的IP地址,前面24位表示网段,后面8位表示节点地址的话,掩码就是255.255.255.0。 在交换式的网络中只有在同一网段的主机才可通信。 2、DNS服务器 DNS是域名解析服务器,作用是用来把域名解析成IP地址,这样计算机就能在网络找到相应的WEB服务器了。 比如说https://www.360docs.net/doc/183446189.html,,这个地址计算机是不认识的,

必须要靠DNS来解析这个域名的地址,换句话说DNS 就好比是翻译。我们长宽的DNS有211.162.31.8跟211.162.31.20,南京电信的DNS有218.2.135.1跟202.102.24.35。 DNS只跟浏览网页有关,跟其他的应用没有关系。DNS 自动获取就可以了,也可以手工指定,但是一定要设 置正确的DNS。 3、带宽 带宽是上网的时候用户跟INTERNET互联的带宽,就好比道路的宽度是一样的。带宽的单位是bit/s(比特/秒)。 带宽分上行跟下行。这里一定要跟下载速度区分开来,下载速度的单位是Byte/s(字节/秒)。一个Byte是8个bit。b/s与B/s一定要分清楚。 4、PING Ping命令是用来检测连通性最常用的工具。这是个DOS 命令,必须在DOS窗口下运行。一般格式是ping 目标地址回车,比如ping 192.168.1.1 。也可以跟一些参数,比如-t\-l,如ping 192.168.1.1 –t –l 1024 ,这个的含义是一直ping直到手工终止,并且包的大小被指定为1024个字节。下面是几张截图:

(完整word版)桌面运维服务设计指南

桌面运维服务设计指南 1管理服务类 1.1管理服务列表 根据管理服务内容,形成管理服务列表。 1.2档案建立 1)资料档案清单 根据附件的《档案清单模板》,和客户搜集资料,制定《XX项目档案清单》。 2)档案建立 由项目负责人分派给各运维工程师进行,进行档案搜集整理,搜集完毕由项目负责人统一归入电子档,可参考运维部CMDB目录结构根据用户特点进行修改。 交付物:《XX项目电子档案库》 3)档案维护 所有后续记录类更新工作由服务台来进行;变更及技术类文档由项目负责人来进行,并在《XX项目档案清单》作好相关记录。

1.3流程建设 1)事件管理流程建设 根据运维体系事件管理流程建设,对日常发现、参与的事件进行记录。 2)问题管理流程建设 根据运维体系问题管理流程建设,对发现的已知和潜在问题进行记录。 3)变更管理流程建设 根据运维体系变更管理流程建设,对软、硬件基础设施等配置的改变进行记录。 4)知识库建设 根据运维体系知识库管理流程建设,包括日常故障解决办法、思路,各类说明文档、常用软件、驱动等。 交付物:《事件登记单》、《问题管理单》、《变更管理单》、《故障知识库》(可参考附件模板)。 2 主动服务类 2.1主动服务列表 根据主动服务内容,形成主动服务列表。

2.2硬件维护 常见硬件维护内容包括打印机维护、PC机维护及协议中约定的其他硬件维护。 打印机维护主要内容包括打印异常维护、耗材更换(硒鼓、墨盒等),具体操作步骤可参考运维部知识库---桌面运维---- 《3、打印机日常维护》。 PC机硬件维护内容包括:CPU、内存、硬盘、声卡、显卡、主板、电源等硬件的扩容、检测、故障定位及更换。具体实施过程及故障排除方法请参考运维部知识库----《1、SDSTC-IE-01-2013 桌面运维作业手册》 2.3杀毒管理 杀毒管理主要内容为配置、管理病毒更新服务器,统一部署防毒软件,根据用户方实际需求设置服务器端、客户端病毒库更新频率(服务器实时更新,每日更新,或指定日期更新等)、制定客户端病毒扫描计划,处理更新异常等情况。 网络版杀毒软件配置过程可根据杀毒软件厂商提供的操作教程或用户手册,如网络版卡巴斯基部署过程可参考运维部知识库---桌面运维---《4、卡巴斯基网络版产品配置指南》。 当客户端无法升级病毒库时,应首先检查内网通信是否正常,然后检查代理设置是否正常。 2.4系统优化 在系统初装或重装之后对操作系统进行必要的优化,关闭多余的系统服务,删除无用

桌面维护个人总结

桌面维护个人总结 《桌面维护个人总结》的范文,觉得有用就请下载哦篇一:桌面支持与系统管理总结 第一章计算机组装与维护 1) 计算机硬件组成:CPU、内存、硬盘、光驱、显卡、主板、电源 2) CPU:中央处理器(Central Processing Unit );整个计算机运算与控制的核心 a) 核心数 b) 主频 c) 缓存 3) 主板:连接各种硬件设备 a) 接口:RJ45、PATA(IDE)、SATA、PCI-E、CPU接口、DIMM(内存插槽) b) 芯片组:决定着主板的全部功能(支持的硬件类型、容量等) 4) 内存 a) 容量:内存的容量大小 b)频率:内存的处理速度 c)三通道技术 d)DDR3 5) 硬盘 a) 容量:单位为兆字节或千兆字节

b) 转速:硬盘盘片的旋转速度,单位是rpm c) 类型:传统硬盘、固态硬盘 6) 光驱 a) 传输速率:50X CD-ROM、16X DVD-ROM 7) 显卡 a) GPU即图形处理器(Graphic Processing Unit) b) 显存即帧缓存,用来存储GPU处理过或即将提取的渲染数据 8) 显示器:屏幕尺寸、画面比例、接口 9) 计算机组装 a) 安装CPU b)安装散热片 c)安装内存 d)安装硬盘和光驱 e)安装显卡f)安装前面板 e)安装驱动程序 10) BIOS a) 输入/输出系统的简称、存储计算机基本硬件的信息、不可以随意拔插 b) BIOS作用:加电自检、初始化、引导操作系统 11) 进入BIOS设置工具的方法:开机时按Del或F2键等 a) 设置一:屏蔽软驱:Drive A、Drive B、None b) 设置二:设置密码:Password c) 设置三:清空BIOS密码:拔掉电池思想汇报专题、BIOS 跳线 d) 设置四:引导顺序:Boot

运维常见问题详细解决方案

运维常见问题详细 解决方案

运维工作及常看法决方案

1.概述 1.1编写目的 编写本解决方案的目的是对运维人员在遇到问题的时候提供一个可参考的依据。运维人员以此解决方案作为今后在运维工作中遇到相同问题的一个指南和依据,指导运维人员如何去解决类似问题。也为新来运维人员熟悉运维工作。本解决方案主要从问题类型、问题描述和解决方案等方面进行说明。 1.2适用范围 适用于运维人员、新来运维人员及相关人员。 2.运维工作流程 ?客户打找运维服务,接到电话,先判断是由运维做还是 的人做; ?运维分机号为1,,先记录房间号,报修时间,服务开 始时间,故障现象及记录接线人。 ?负责人先想解决方法,告知运维人员大致方向,运维人 员根据了解的情况想解决方案,在去见客户的时候知道 如何操作; ?负责人给运维人员派工单,运维人员去执行; ?执行完之后跟负责人交待此次工作结果;

?回复,双方接收 ?每周的运维工作数据及运维工作报告的电子档须在下周 一十点前发送到负责人邮箱中。 3.运维工作内容 1)终端软件维护 2)网络调整 3)电话调整 4)机房巡检 5)服务器操作:应用系统包括安全系统、移动执法系统、备份 系统、机房监控系统;网络设备包括交换机、路由器、防 火墙、流量控制系统。 6)机房清洁 7)空调维护 8)其它 4.常见问题解决方案 4.1电脑装应用软件的步骤 新台式机和笔记本: ●装OFFRICE,正版序列号为 ●杀毒软件

●360安全卫士,修复系统漏洞,点击修复,在安装路径中产 生一个hotfix文件夹,然后把工具中的hotfix文件夹里面 所有文件拷贝到安装路径下的hotfix文件夹; ●装常见的工具:Wara,暴风影音,Adobe,QQ,MSN,以及用户要 求的免费软件 旧电脑: ●IP设置,每次都要记录IP,在用完之后把IP设置为原来的 IP ●旧机器在装系统之前,我的文档及桌面上的文件要备份,用 U盘拷贝出来再装系统(要特别注意财物室的机器重装系 统,在装系统之前还需要把C盘里面的某些文件给拷贝出 来) 注意事项: 1.不装克隆XP 2.不安装盗版软件 4.2常见问题类型 4.2.1打印机

日常运维电脑故障处理经验集锦

日常运维电脑故障处理经验集锦 1、引言 计算机软硬件系统庞大,总会出现这样那样的问题,现将笔者近段时间遇到的四个计算机故障及处理方法写出来与大家分享,权当抛砖引玉,请大家批评指正。 2、现象描述 故障1、一台式电脑,一次卸载网卡驱动后,重新安装驱动,再设置网卡为原来的地址时提示:“该地址已被分配给另外一块网卡”。设置失败,但设置新的IP 地址没有问题,但我公司采用固定IP加MAC绑定策略,只能使用原来的IP地址。 故障2、一台式电脑,每次打开IE 浏览器,单击超链接打开新窗口时,弹出的窗口都特别小,必须经过手工拖放或点击最大化窗口才能阅读IE浏览器里面的内容,影响用户正常使用。 故障3、一台式电脑开机无法进入系统,出现提示:“NTLDR is missing Press CTRL+ALT+Del to restart”,无法进入桌面,重新启动电脑,系统仍然出现相同的提示。 故障4、一台笔记本电脑,系统无线网卡驱动已经安装,笔记本前面的无线开关已经打开,但是在搜索无线网络时,找不到任何无线网络,且面板前无线网络指示灯不亮,通过笔记本热键切换也不起作用。 3、处理过程 故障1:点击【开始】菜单选择【运行】输入regedit命令敲回车,进入注册表编辑器,选择【编辑】菜单选择【查找】输入刚才提示冲突的IP地址,找到注册表项,并将该项删除,如下图所示,重新启动计算机,原来的IP地址

设置成功。 删除该 故障2:打开IE浏览器,将浏览器窗口调整到合适大小后,关闭浏览器,再次打开浏览器时窗口就是关闭前的窗口大小。 故障3:该故障在Wingdows系统中非常常见,处理方法一般有两种,一种是修改NTLDR文件,另一种是直接拷贝正确的NTLDR文件来覆盖原来的文件。第一种方法我们可以使用winpe的【Windows系统引导修复】工具修复系统,笔者使用的是大白菜3.0版winpe(不同版本操作略有区别),具体修复方法如下:重新启动电脑,选择进入winpe系统维护系统,点击【开始】---【程序】---【目标Windows系统维护】---【Windows系统引导修复】如图所示:

IT运维管理守则(故障及处理)

精心整理 2019年-9月 IT 运维手册 第二篇 硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD 统。 I 可更换同型号电源线,排查故障。 II 内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS 设置解决。

精心整理 2019年-9月 III 灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV 主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方⑵无法正常上网 ①网络设置问题 此原因较多出现于需手动指定②DNS I IP 地址来访问,如果可以访问,则为DNS 出错或DNS 服务TSP 提供的DNS 服务器地址,也可用其它地方可正常使用DNS 服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP 协议-属性-使用下面的DNS 服务器地址)。不用的ISP 有不同的DNS 地址。有时候则是路由器或网卡的问题,无法与ISP 的DNS 服务连接,这种情况可重启路由器或重新设

... 置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。 2显示器 ⑴无图像显示 ①开机无反应 I检查电脑的外部接线是否接好,把各个连线重新插一遍,看故障是否排除。 II如果故障依旧,接着打开主机箱查看机箱内有无多余金属物,或主 ...

it运维年度工作总结

it运维年度工作总结 总结一:it运维管理工作总结 至20XX年10月底,XX有限公司在xx公司的运维又届满一年的时间了。在这为期一年的运维工作当中,xxxx的业务飞速发展,设备数量不断增加,人员的技术水平和业务知识有了显著的提升。我们的队伍在技术水平和管理经验上也有了本质的提高。 一、细致缜密的完成计划中的日常运维工作:严把质量;服务至上;严格要求;技术领先。 1.承接运维工作初始信息技术部的各位领导就对我们的运维工作给予厚望,并提出了认真完善服务水平的方针。我们在服务过程中严格按照这一要求,以对保障xxxx的发展,对用户负责的精神,把“严把质量,服务至上”的原则贯穿于日常工作的各个环节之中。使本运维期过程中的客户满意度有了非常显著的提高,多次获得了用户的认可。 2.对于在工作中信息技术部提出的新要求、新方案,我们及时相应配合,本着“严格要求”的原则,对于提出的要求科学性的分析研究,及时提出完整周密的解决方案,并拟请用户试行或测试后实施。有力的保障了运维工作的及时有效性。 对于提高服务业务技术水平上,按照信息技术部的统一规划,按时完成一系列的既定培训计划。按照“技术领先”的

原则,通过技术上的培训提高了业务水平和解决故障的效率;通过制定有效的安全机制和培训,健全了xxxx信息外包人员安全机制;通过保密制度的培训使运维人员能够树立自觉维护xxxx的信息安全防范意识;通过客户服务意识的培训提高了客户的满意度。 二、吸收先进经验,保质保量的完成运维的各项任务:运维期内主机、服务器、网络和桌面均没有发生严重的生产安全事故,对于一些潜在的威胁也都在得到信息技术部门的批示下,审慎周密的完成了整改工作。运用先进的技术和经验提高劳动效率和运维工作质量: 1.运用先进的运维工具提高劳动效率。通过监控软件随时保持信息的及时性、可控性,一旦发生问题可以迅速定位和修复。 2.经过信息技术部指导,我们在运维工作中大量了采用WEB2.0技术。使我们在高效完成运维工作的情况下,为xxxx 节约了大量的费用投入。 3.在工作的过程中注意新技术和新方法的学习和收集,对于有利于运维工作的成功方案及时整理并提交信息技术部。经过5年来的维护工作存储了大量的知识库信息。 三、适应任务需要,及时解决运维过程中的遇到的问题: 1.在运维过程中遇到突发问题及时与信息技术部门相关人员进行沟通,对于紧急情况的处理按照《应急预案》进行

CEMS运维常见问题汇总1

CEMS运维常见问题汇总 一SO2偏值 SO2测量数据偏大 1:用压缩空气进行零点标定,标气标定 2:检查分析仪排气管是否堵塞,用手摸有没有正常排气 3:检查分析仪SO2通道温度是否在40度左右,SO2通道透光度是否在30W以上 SO2测量数据偏小或者出0 1:用压缩空气进行零点标定,标气标定 2:检查飞碟过滤器是否堵塞或者积水 3:检查疏水过滤器是否积水 4:检查冷凝器温度是否在5度以下 5:检查预处理管路是否有积水 6:检查伴热管是否加热,温度是否在120度左右 7:检查采样探头是否堵塞,清理采样探头滤芯,用铁杆疏通采样探头探杆 8:排除法。检查预处理采样气管是否漏气先查室内再查伴热管和测点 SO2数据异常波动 1:检查分析仪SO2通道温度和透光度 2:通标气看是否没动 3:检查预处理气路,采样系统是否漏气 4:有煤燃烧不充分,产生大量CO,CO浓度偏大,波动剧烈对SO2测量会产生干扰CO>1000PPM对很多表计(特别是便携式表计)干扰很大 二NO偏值 NO2测量数据偏大 1:用压缩空气进行零点标定,标气标定 2:检查分析仪排气管是否堵塞,用手摸有没有正常排气 3:检查分析仪NO2通道温度是否在40度左右,SO2通道透光度是否在30W以上NO通道温度越大,NO数据测量越大 NO2测量数据偏小 1:用压缩空气进行零点标定,标气标定 2:NO一般不溶于水,管路有水基本不影响NO数据 3:排除法。检查预处理采样气管是否漏气先查室内再查伴热管和测点

NO数据异常波动 1:检查分析仪NO2通道温度和透光度 2:通标气看是否没动 3:检查预处理气路,采样系统是否漏气 4:检查冷凝器是否正常工作 NO进口出口数据不一样 1:一般NO出口数据大于进口,大10%左右 2:用压缩空气和标气进行标定,检查分析仪内部通道有无问题 3:检查是否漏气 4:进出口误差超过50%,说明测量有问题,应对系统做检查 三O2偏值 O2偏大或者偏小 1:零点标定(通压缩空气) 2:检查分析仪O2探头电压,一般要在9mv-13mv之间 3:检查预处理系统是否漏气,探头是否堵塞 O2量突然增大在20左右,然后缓慢恢复正常 O2量突增一般是O2探头输出电压突然增大导致,说明O2探头输出不稳定,发现这种情况应及时更换O2探头,否则会频繁出现此情况,影响折算值 分析仪O2是显示星号 1:说明超出测量范围,应重新用压缩空气对分析仪进行标定 2:O2探头输出电压小于6mv,分析仪会出现M提示,需要更换O2探头 3:O2探头输出电压小于5mv,分析仪报警F,O2量测量显示星号 进口出口O2关系 1:一般情况下,实际烟道内进口O2小于出口O2 2:由于测点不一样,采样系统预处理系统气密性不一样,会导致进出口O2量数据存在误差,1%之内正常,超出2%就说明系统有问题,需要标定和检查系统是否漏气 3:采样探头老化,探头密封圈破损变形,也会导致漏气,O2量误差偏大 分析仪进水后,需要把氧探头拆下来,进行清理,否则水和SO2产生,亚硫酸会腐蚀O2探头

运维故障处理思路

运维故障处理思路内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但是原因还未定位。 经理过来了解情况:“系统恢复了吗”、“故障影响是什么”、“交易中断了吗”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键 盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅 是报警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了 的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机 器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法:

1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更

光伏电站运维常见故障及解决方法

常见的故障及解决方法 国内投资光伏电站的人士越来越多,光伏电站出现故障的事件也是层出不穷,有感于此,下面广东太阳库技术人员分享光伏电站日常运行中可能会出现的常见故障以及解决方法,以便为项目开发人员或业主提供参考。 1.1 、故障现象:逆变器屏幕没有显示 故障分析:没有直流输入,逆变器LCD是由直流供电的。 可能原因: (1)组件电压不够。逆变器工作电压是100V到500V,低于100V 时,逆变器不工作。组件电压和太阳能辐照度有关。 (2)PV输入端子接反,PV端子有正负两极,要互相对应,不能和别的组串接反。 (3)直流开关没有合上。 (4)组件串联时,某一个接头没有接好。 (5)有一组件短路,造成其它组串也不能工作。 解决办法:用万用表电压档测量逆变器直流输入电压。电压正常 时,总电压是各组件电压之和。如果没有电压,依次检测直流开关,接线端子,电缆接头,组件等是否正常。如果有多路组件,要分开单独接入测试。

如果逆变器是使用一段时间,没有发现原因,则是逆变器硬件电路发生故障,请联系我公司售后。 1.2 、故障现象:逆变器不并网。 故障分析:逆变器和电网没有连接。 可能原因: (1)交流开关没有合上。 (2)逆变器交流输出端子没有接上 (3)接线时,把逆变器输出接线端子上排松动了。 解决办法:用万用表电压档测量逆变器交流输出电压,在正常情况下,输出端子应该有220V或者380V电压,如果没有,依次检测接线端子是否有松动,交流开关是否闭合,漏电保护开关是否断开。 1.3、PV过压: 故障分析:直流电压过高报警 可能原因:组件串联数量过多,造成电压超过逆变器的电压 解决办法:因为组件的温度特性,温度越低,电压越高。单相组串式逆变器输入电压范围是100-500V,建议组串后电压在350-400V 之间,三相组串式逆变器输入电压范围是250-800V,建议组串后电压在600-650V之间。

维护工作常见问题和解决办法

维护工作常见问题及解决办法 一Notes部分 1.用户notes可以登录但是邮箱无法打开查看点击邮箱后报出的错误根据报错使用不同的方法解决 提示“远程服务器不是已知的TCP/IP主机”或者“找不到服务器的路径。要追踪此链接,请使用‘文件’—‘惯用选项’—‘用户惯用选项’—‘端口’—‘追踪’(Notes客户机)或‘跟踪’命令(Domino)”如下图: 解决办法:添加dns 首选10.16.198.198 备用10.16.198.199 替换hosts文件将hosts放到C:\WINDOWS\system32\drivers\etc路径下替换原文件 2.提示“服务器未响应。可能是服务器宕机或者出现网络问题。如果此问题仍然存在。请与管理员联系。”如下图: 解决办法:检查用户本地连接连接是否正常 如显示“网络电缆拔出”检查网线墙点 如显示“已连接上”可以PING一下notes服务器 不通的话检查IP地址子网掩码网关DNS配置是否正确。如果配置都没有问题可以尝试重启一下电脑或者将本地连接禁用然后再启用 通的话可能是由于一些杀软或防火墙造成如瑞星防火墙可尝试卸载

3.提示“您没有访问数据库的权限”如下图 解决办法:检查用户internet邮件地址邮件文件邮件服务器地址是否根据cnooc 通讯录中的信息配置正确 如配置没有问题可能此用户的Notes帐号做过“迁移”或“改名”,首先检查此id 是否为最新ID 如果是则为ID已更新邮箱的存取控制列表没有更新 需要联系notes管理员要一个用户迁移之前的ID 用旧的ID打开邮箱手动更新存取控制列表。 具体方法为:用旧的ID打开邮箱点击“文件”—“数据库”—“存取控制”—“添加”—点击蓝色人头像—选择“cnooc通讯录”— 在“查找以下列字符开头的名称”中输入ID名称,然后在下面的列表中选择需要的—“添加”—“确定”然后将用户类型选择为“个人”权限为“管理者”将“删除文档”前面的钩画上,最后确定。如下图

运维常见故障100问

加油卡常见故障100问 管控启动检测不到raid卡(赵超) 1、重新插拔raid卡(赵超) 2、更换raid卡槽(赵超) 3、重新插拔主板(赵超) 1、管控系统启动到/smc20不动(赵超) 1、Ctrl+C跳过 2、进入系统,把第四分区挂载到smc20分区下 mount /dev/sda4 /smc20 3、拷贝/database、/record、/txt、/muxtemp(POS站还需拷贝/pos)到第三分区 4、卸载第四分区umount /smc20 5、格式化第四分区 mke3fs /dev/sda4 6、挂载第四分区,重装管控系统。拷贝回数据库文件,重启工控机(赵超) 2、系统启动出现红色NG(赵超) 1、提示给出root的密码,输入密码123456(不可见) 2、用命令修改第三或者第四分区(常见为第三分区)fsck /dev/sda3 3、提示?的地方,按Y继续 4、修复完成后,reboot重启 3、系统无法进入图形界面(赵超) 1、Ctrl+Alt+F1 ,字符界面下登录 2、输入setup,回车后选择第一项 X configuration 出现如下界面 3、选择第三项 Monitor Configuration 出现如下画面,把第二个数值改小,然后保存、退出、重启。

4、如重启后仍无法进入图形界面,选择第四项Videocard Configuration,出现下图 检查分辨率是否正确 5、可以在字符界面下输入startx,检查能否登录(赵超) 4、输入root 密码123456后重复跳出登录框(赵超) 1、检查主目录下文件是否已满(赵超) 2、重启前是否拷贝过大容量的文件到根目录下(赵超) 5、输入用户名密码后,初始化外围设备通不过(赵超) 1、进入字符界面 2、进入tmp目录 3、删除ksocker-root目录 4、重启(赵超) 6、中石化加油站管控提示300、40000错误(赵超) (一) 1、备份数据库 2、删除gkdb.log 3、命令修复 dbsrv7-f gkdb.db(赵超)

相关文档
最新文档