MSTP专线故障维护案例

MSTP专线故障维护案例
MSTP专线故障维护案例

MSTP专线故障维护案例

一、前言背景

以太网专线业务,是基于SDH传输技术、构建于MSTP设备平台上、通过以太网接口为客户提供服务的数据专线业务。随着MSTP技术的发展与成熟,跨域专线电路采用MSTP平台传输正呈逐年上升趋势,而MSTP电路在故障发生时又存在定位困难、处理时间长等问题,给维护工作带来不小压力。本文主要以MSTP电路故障处理为例,总结日常工作中积累的一些维护经验,望能对后期的MSTP客户电路维护提供借鉴。

二、MSTP电路故障处理思路

MSTP电路在开通前期需要通过SDH层业务配置、端口属性配置、TAG 属性、封装协议等较多设置项目(如图 1 以太网专线电路配置示意图),在故障定位时关注点较多所以并没有一成不变的处理方法,可以根据现场实际情况再结合自己的维护经验和对维护手段的熟悉程度进行处理。MSTP 电路故障定位可以参照“先告警后性能、先SDH后以太网、先日志后测试、先内部后外部”的原则。

图1以太网专线(MSTP)电路配置示意图

三、MSTP专线电路类型和故障处理主要方法、步骤

在以太网专线电路故障处理时,首先需了解此故障电路的全程拓扑情况(如图2 省际以太网专线拓扑图),从而有利于故障的进一步定位。然后按以太网故障电路处理思路进行指导下,主要步骤进行逐一处理。

Z

图2 省际以太网专线(MSTP)拓扑图

1.以太网专线电路类型

目前我市以太网专线电路按跨域范围主要分为国际以太网专线、省际以太网专线和市内以太网专线。

按业务落地类型分为三种:

(1)两端业务都在骨干传输(主要为二干传输,下同)以太网接口落地;

(2)一端业务在骨干传输以太网接口落地,另一端业务通过骨干与本地网电路互连后在本地网以太网接口落地。

(3)两端业务都经骨干与本地网电路互连,在本地网设备以太网业务落地。

2.以太网专线电路故障处理主要方法和步骤

以太网专线故障一般分为三大类:业务完全中断(Ping包不通);业务未完全中断,Ping包通、但存在持续丢包或时延现象;业务未完全中断,Ping小包正常、Ping大包有丢包或者时延现象。

根据上述三种情况可以故障定位时主要从以下几方面检查:

(1)以太网电路相关端口的告警情况

先检查该以太网电路全程路由上的端口和时隙的告警情况,特别是我市内可监控的骨干或本地网相关端口和时隙的告警情况。通过分析告警对故障进行初步定位。

常见告警和性能

SDH业务层面告警和性能情况:LOP、AIS、UNEQ、B3SD、LPBBE等;

以太网层面告警和性能情况:ETH-LOS、GFP帧失步告警、LCAS带宽减少告警等。

(2)测试帧功能

以太网单板提供一种验证VCTRUNK端口之间互通性的、使用GFP管理帧实现的测试帧。可以用于验证单板之间VCTRUNK连接的配置正确与否, 即SDH业务配置和VCTRUNK通道绑定配置是否正确。业务正常情况下,发送测试帧的数量和收到的应答帧数量应该相同。

(3)以太网端口间挂PC测试或数据设备PING/TRACERT功能

采用在两端以太网盘口上分别挂PC进行对PING的方法,非常有利于故障的定位,可快速定位是传输问题还是外部问题。同时,如果在条件不具备的情况下,也可以由数据设备PING/TRACERT功能帮助定位。

(4)测试仪表测试

可通过以太网测试专用仪表对故障通道进行吞吐量、丢帧率、时延、时延抖动四个关键性能指标的进行端到端测试或单端口环回测试。

四、维护案例介绍

1.现象描述

2013年12月31日客响中心报障称位于西永保税B区的英业达(重庆)科技有限公司的一条省际以太网专线电路(速率为2M)中断,需要立即处理。该电路对端用户在外省,跨越一级干线、二级干线和本地网3个传输平面,中间全部是155M电路互联,并在本地用户侧以太网端口落地。本市内拓扑图如下:

2.问题分析

该电路属于以太网专线电路中两端业务都经骨干与本地网电路互连,并在本地网设备以太网接口落地类型。针对无法和查看SDH层告警,在条件允许的情况下可以考虑通过其他途径如更改电路时隙配置等方法来进行定位。

3.问题处理过程

(1)由于该电路在我市内骨干全程都经过155M通路穿通,查询相应的通道无告警,且该通道上的其他业务正常。

(2)本地网查看以太网端口无告警,查看RMON(远程网络监控)性

能时发现收外省方向无数据包。

(3)由于前往用户机房路途较远,考虑到故障处理时效性,在抢修人员前往用户机房的同时,先排除骨干段电路的故障。采用时隙环回的方法,在外省骨干侧做时隙环回,本市二干传输平面修改电路时隙配置,将业务直接落地在二干SDH的2M支路口上,并挂表测试。测试通道正常且无误码。

(4)我端抢修人员到达用户机房确认外接设备正常,而对端人员未到达无法进行配合测试。后经查二干设备有空闲的以太网端口可用,则再次修改时隙配置,将穿通业务直接落地在二干以太网盘,并于用户侧人员一起挂PC作对PING测试,结果正常。

(5)经过3和4两步操作基本可以排除是我市内电路故障引起,最终也确定为外省故障。

4.总结

此类故障在处理时,由于省际以太网专线电路在一、二干传输层面均采用155M电路互联,而无法查看SDH告警或直接挂表测试来定位是否是本市内段问题。但是可以通过时隙环回,且临时更改业务落地点,来做相应的测试。

五、小结

随着以太网专线电路对MSTP传输平台的大量应用,对传输维护人员的要求越来越高,与传统SDH维护相比以太网传输需要对数据通信技术和产品有更深的学习、认识。本文仅仅对以太网专线电路维护中碰到的一些基础问题做个总结,以期在日后维护中提供借鉴。

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2 [故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2 [故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [故事之三]光纤链路造侵蚀损坏6 [故事之四]水晶头损坏引起大型网络故障7 [故事之五] 雏菊链效应引起得网络不能进行数据交换9 [故事之六]网线制作不标准,引起干扰,发生错误11 [故事之七]插头故障13 [故事之八]5类线Cat5勉强运行千兆以太网15 [故事之九]电缆超长,LAN可用,WAN不可用17 [故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21 [故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24 [故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27 [故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29 [故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32 [故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34 [故事之十七]六类线工艺要求高,一次验收合格率仅80%36 第二部:网络脏腑篇39 [故事之一] 服务器网卡损坏引起广播风暴39 [故事之二]交换机软故障:电路板接触不良41 [故事之三]防火墙设置错误,合法用户进入受限44 [故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47 [故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49 [故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52 [故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54 [故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57 [故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60 [故事之十]PC机网卡故障,攻击服务器,速度下降62 [故事之十一]多协议使用,设置不良,服务器超流量工作65 [故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67 [故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70 [故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72 第三部:网络免疫篇75 [故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75 [故事之二]局域网最常见十大错误及解决(转载)78 [故事之三] 浅谈局域网故障排除81 网络医院的故事 时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:) [引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路 很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。 故障1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。 故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。 故障解决 如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。 故障2:5口交换机只能使用4口 故障现象 办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。 故障分析 UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使

典型网络故障总结

典型网络故障总结 网络故障的一般分类 网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下: ?连通性问题 硬件、系统、电源、媒介故障 配置错误 不正确的相互作用 ?性能问题 网络拥塞 到目的地不是最佳路由 转发异常 路由环路 网络错误 一般网络故障的解决步骤 故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。 故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。 网络故障排除基本步骤 我们以一个故障排除的实例来学习如何应用这些步骤。

案例:某用户网段广播包过多造成该网段的服务器FTP业务传输速度变慢 组网图如下: 某校园网的三个局域网,其中10.11.56.0为一个用户网段,10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢 1. 故障现象描述 要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。 如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题: ●这个问题是连续出现,还是间断出现的? ●是完全不能备份,还是备份的速度慢(即性能下降)? ●哪个或哪些局域网服务器受到影响,地址是什么? 正确的故障现象描述是: 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约只有0.6Mbps。 2. 故障案例相关信息收集 本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径: ●向受影响的用户、网络人员或其他关键人员提出问题; ●根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show命令等; ●测试性能与网络基线进行比较。 如上述案例,可以向用户提问或自行收集下列相关信息: ●网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? ●是否有用户访问受影响的服务器时没有问题? ●在非高峰期日志服务器和备份服务器间FTP传输速度是多少? 通过该步骤,可以收集到了下面一些相关信息: ●最近10.11.56.0网段的客户机不断在增加; ●129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;

传输故障排除案例集锦(HUAWEI)

1 业务中断的处理 1.1 更换光板类型错误导致对端收光不正常 【系统概述】 某传输组网如图1所示,4个OptiX 2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。其中,3号站和2号站之间距离较长,使用了BPA 光放板。 1w MSP OptiX 2500+23 4e e e e w w w 图1 系统组网图 【故障现象】 某日机房维护人员发现2号站接收3号站方向的S16有R-LOS 告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA 有IP-FAIL (无输入光)告警,3号站的BA 有IP-FAIL 告警。 【故障分析及排除】 BPA 板光口1对应的是BA (功放,将 S16的输出光信号放大14或17dBm );光口2为PA (前放,当输入光功率在-22dBm ~-32dBm 之间时,光口OUT2输出光功率变化范围在-7dBm ~-21dBm )。光信号经过BPA 的尾纤连接及信号流向如图2所示:

OUT IN IN OUT OUT IN S16BA PA S16 3号站2号站 图2 BPA光信号流向 (1) 根据光信号经过BPA的信号流可以看出,由于3号站光放板 的BA未收到光信号,导致了2号站的PA、S16报收无光。 可以判断故障点在3号站; (2) 维护人员带S16、BPA、尾纤、光功率计到3号站; (3) 在3号站测试S16板的输出光功率值,光功率计显示无光信 号。可以判断是S16板故障; (4) 将带的S16板插上,测试S16输出光功率为0dBm,恢复尾 纤连接; (5) BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI; (6) 查询2号站S16,仍有R-LOS告警; (7) 在3号站,将换上去的S16板发光功率衰减到-15dBm做自环, 告警消失。判断新换上去的S16并没有损坏; (8) 为什么仍有告警呢?分析原因是3号站的S16板使用有错, SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。 (9) 查看3号站原来使用的S16的光板类型,为SS62S1605;刚 换上去的S16类型为SS62S1604; (10) 更换同类型的S16,故障消除。

电业局网络故障诊断案例分析

案例分析-某电业局网络故障诊断 一、故障描述 故障地点: 某电业局 故障现象: 网络严峻堵塞,内部主机上网甚至内部主机间的通讯均时断时续。 故障详细描述:

网络突然出现通讯中断,某些VLAN不能访问互联网,且与其它VLAN的访问也会出现中断,在机房中进行ping包测试,发觉中心交换机到该VLAN内主机的ping包响应时刻较长,且出现间歇性丢包,VLAN与VLAN间的丢包情况则更加严峻。 二、故障详细分析 1.前期分析 初步推断引起问题的缘故可能是: ●交换机ARP表更新问题 ●广播或路由环路故障 ●人为或病毒攻击 需要进一步猎取的信息: ●网络拓扑结构及正常工作时的情况 ●交换机ARP表信息及交换机负载情况 ●网络中传输的原始数据包 2.具体分析 首先,我们从网络治理员那儿,得知了网络中主机共450台左右,

同时得到了网络的简单拓扑图,如图1所示。 (图1 网络原始拓扑简图) 从图1能够明白,网络中划分了6个VLAN,分不是10.230.201.0/24、10.230.202.0/24、10.230.203.0/24、10.230.204.0/24、10.230.205.0/24、10.230.206.0/24、,其中201~205这5个VLAN分不用于一个部门,而206为服务器专用网段。各VLAN同时连接上中心交换机(Passport 8010),中心交换机再连接到防火墙,由防火墙连接到Internet以及省单位。大致了解了网络拓扑后,我们以超级终端方式登录中心交换机,发觉交换机的负载较大,立即清除交换机ARP表并重启,但故障仍然存在,因此我们决定对网络进行抓包分析。

案例分析某中学网络故障诊断

案例分析-某中学网络故障诊断 一、故障描述 故障地点: 江苏省某中学校园网 故障现象: 严重网络阻塞,客户机之间相互时严重丢包,校园网用户访问互联网的速度非常慢,甚至不能访问。 故障详细描述: 整个校园网突然出现网络通讯中断,内部用户均不能正常访问互联网,在机房中进行包测试时发现,中心机房客户机对中心交换机管理地址的包响应时间较长且出现随机性丢包,主机房客户机对二级交换机通讯的通讯丢包情况更加严重。 二、故障详细分析 1. 前期分析 初步判断引起问题的原因可能是: ●交换机表更新问题 ●广播或路由环路故障 ●病毒攻击 需要进一步获取的信息: ●信息 ●交换机负载 ●网络中传输的原始数据包 2.故障具体分析排查 开始实际具体排查工作: 1.在主机房的客户机和以下的客户机上分别使用“–”命令查看缓存信息,结果正常; 2.登录中心交换机查看各端口的流量,由于交换机反应速度较慢,操作超时,无法获得负

载的实际流量; 3.使用科来网络分析系统捕获并分析网络中传输的数据包,具体过程如下。 在中心交换机上做好端口镜像配置操作,并将分析用笔记本接到此端口上,启动科来网络分析系统捕获分析网络的数据通讯,约分钟后停止捕获并分析捕获到的数据包。 中学校园网的主机约为台,一般情况下,同时在线的有台左右。在停止捕获后,我们在科来网络分析系统主界面左边的节点浏览器中发现,内部网络()同时在线的主机达到了台,如图,这表示网络存在许多伪造的主机,网络中可能存在伪造地址攻击或自动扫描攻击。 选择连接视图,发现在约分钟的时间内网络中共发起了个连接,且状态大多都是客户端请求同步,即三次握手的第一步,由工作原理可知,工作时首先通过三次握手发起连接,如果请求端向不存在的目的端发起了同步请求,由于不会收到目的端主机的确认回复,其状态将会一直处于请求同步直到超时断开,据此,我们现在更加断定校园网中存在自动扫描攻击。 详细查看图的连接信息,发现这些连接大多都是由主机发起,即连接的源地址是。选中源地址是的任意一个连接,单击鼠标右键,在弹出的右键菜单中选择“定位浏览器节点>>端点”,这时节点浏览器将自动定位到主机。 (图网络中的连接信息) 选择图表视图,并选中连接子视图项,查看主机的连接情况,如图所示。查看图可知,这台主机在约分钟的时间内发起了个连接,且其中有个连接都是初始化连接,即同步连接,这表示主机肯定存在自动扫描攻击。

PING大包丢包网络故障分析案例、解决方案

PING大包丢包故障分析 1.1. 故障描述 1. 故障环境 网络结构如下图所示: 如上图所示,两边网络通过光纤相连,中间设备只有光电转换器,到单位B的内部网络有一台防火墙 2. 故障描述 单位B在进行网络测试时,在单位B的出口路由器处PING单位A的出口路由器时,PING大包会出现丢包现象,但是PING小包正常。 1.2. 故障分析 1. 分析方法 主要通过专有的网络分析工具(科来网络分析系统)将故障时相应的数据包捕获下来进行深度分析,并通过分析发现相应的异常,从而定位故障原因的方法。 2. 部署科来网络分析系统 我们在单位B的光电转换器和路由器之间串连一个交换机,利用交换机的端口镜像功能,镜像两个端口的流量,并将科来网络分析系统部署在交换机的镜像口,如下图所示: 3. 分析数据包 通过故障重现,即在路由器接口处进行PING测试,并同时捕获数据包,得到的数据包如下图所示:

如上图所示,我们在使用大包PING对端时,对端返回了一个超时的数据包,查看它具体的数据包解码,如下图: 造成该故障的原因是因为,我们在网络中传输大包时,由于网络中“最大传输单元”的限制,大数据包会发生分片,当分片数据包都到达目的端时会发生重组,一旦有一个分片丢失就会造成数据报重组超时,所以会发送超时的差错提示。 4. 分析结论 我们在进行PING测试时,数据包只经过了光电转换器和中间链路,所以造成该故障的原因就是光电转换器或中间链路丢包造成的。 1.3. 总结 当我们在分析数据包时,发现通信的数据包中有异常的数据包,那么我们就需要关注它是何种应用的数据包,通过分析异常的数据包可以帮助我们快速的找到故障原因,从而解决故障。

《网络案例及故障分析》报告

《网络案例及故障分析》报告 (大三第一学期) 学生姓名: 学生班级: 学生学号:

目录 1.项目要求及分析.......................................................................................................... - 1 -1.1课程设计的目的及要求........................................................................................... - 1 -1.1.1课程设计目的: ................................................................................................... - 1 -1.1.2案例需求: ........................................................................................................... - 1 -1.1.3组建所需设备: ................................................................................................... - 1 -1.2考核设计具体要求................................................................................................... - 2 -1. 2.1本维护和运营中心内部结构图 ........................................................................... - 2 -1.2.2网络中心机架图 ................................................................................................... - 3 -1.3校园网络拓扑结构图............................................................................................... - 3 -1.4详细设计步骤........................................................................................................... - 4 -1.4.1网络vlan设计....................................................................................................... - 4 -1.4.2划分网段、IP地址与VLAN .................................................................................. - 4 -1.5设备配置与验证....................................................................................................... - 6 -1.5.1配置部分代码 ....................................................................................................... - 6 -1.5.2机架设计图 ........................................................................................................... - 7 -1.5.3测试网络连通性后可知 ....................................................................................... - 8 -2.总结与心得............................................................................................................... - 8 -2.1实验总结................................................................................................................... - 8 -2.2心得体会................................................................................................................... - 8 -

网络故障一个经典案例

交换机是局域网中一种很重要的网络设备,它的工作状态与客户端系统的上网状态息息相关。可是,在实际工作过程中,交换机的状态很容易受到外界的干扰,那样一来局域网中就会出现各种各样的网络故障;为了保证网络运行稳定,我们必须在平时对交换机进行妥善管理、维护,避免交换机发生故障。这不,笔者在对单位局域网进行维护时,曾经遇到过物理连接不当,而造成楼层交换机无法ping通的故障现象。这种网络故障的排查让笔者颇费一番周折;由于该故障相对典型,而且其排查思路可供借鉴,现在笔者就将它贡献出来与大家分享。 案发现场 笔者所在的大楼包含若干个单位,为了保证每个单位都能独立上网,并且要求它们的上网状态不受其他单位的影响,笔者选用了路由交换机作为大楼网络的核心交换机,同时在交换机上对每个单位设置了不同的虚拟工作子网。由于各家单位分布在不同的楼层,每个楼层分布的单位家数也不完全相同,有的楼层有两、三家单位,有的楼层多达五、六家单位,不同楼层的单位工作子网全部通过对应楼层的交换机,连接到大楼局域网中,并通过大楼网络中的硬件防火墙访问Internet网络。 为了提高网络管理效率,网络管理员平时都会通过远程连接方式对交换机进行管理、维护;可是,今天早上一上班,笔者在扫描诊断局域网核心交换机各个交换端口的工作状态时,发现其中某个交换端口处于down状态。查看网络管理档案,找到连接该端口的是四楼某二层交换机,远程登录该楼层交换机时,发现迟迟无法登录成功,使

用ping命令测试该交换机的IP地址时,返回的结果为“Request time out”;就在笔者纳闷为什么没有人报故障时,电话铃声如期而至,果然来自四楼的用户开始接二连三地报修网络故障了。根据上述故障现象,笔者估计可能是楼层交换机的工作状态出现了意外,于是跑到该故障交换机现场,切断该设备的电源,过一段时间后再次接通电源,进行重新启动,等到启动操作完毕后,笔者又使用了ping命令测试该交换机的IP地址,此时返回的结果已经正常,而且远程登录操作也能够很顺利地进行。然而,半个小时之后,该故障交换机又出现了相同的故障现象,并且进行ping命令测试时,又返回了不正常的测试结果;后来笔者不放心,又重新经过反复启动测试,发现故障交换机始终无法正常ping通。 深入排查 既然经过反复重启不能解决问题,笔者估计引起该故障的原因比较复杂,考虑到这种故障现象在网络管理过程中经常会碰到,于是笔者按照下面的思路进行了深入排查: 1、考虑到整个大楼网络中,只有四楼的某个楼层交换机出现这种现象,笔者初步判断可能是该楼层交换机自身问题引起的,为了能够确保可以准确定位故障原因,笔者准备利用一台工作状态正常的交换机来替换故障交换机,看看故障现象是否仍然存在;同时,将那台被怀疑可能存在问题的交换机连接到一个独立的网络工作环境,经过半个小时的测试、观察,笔者看到那台被连接到独立网络环境的故障交换机工作状态是正常的,而且在该网络环境下可以ping通它的IP

计算机网络故障典型案例分析

计算机网络故障典型案例分析 【摘要】本文分析了前段时间园区网络出现的故障,找到故障原因,并提示解决方案。 【关键词】网络;计算机;无线路由器;ARP协议 1 故障现象 公司目前接入网络的计算机有一千多台,思科交换机有40多台,有段时间园区网络出现计算机上网及访问内部服务器时断时续,腾讯通一会掉线,一会上线,导致园区所有应用系统服务器法访问,对生产及办公造成严重影响。 2 故障分析 出现以上情况时,我通过Cisco Network Assistant监控软件对园区网络监控发现,园区机房的核心交换机CPU负荷率达到100%,核心交换机下连的思科交换机CPU负荷率也达到100%,导致思科交换机无法处理正常的数据交换。如下图所示: 图1 根据Cisco Network Assistant监控软件的记录日志分析判断问题产生源所在的交换机,对该交换机所有端口做镜像口,并对镜像口通过wireshark软件对ARP 协议进行分析,通过对交换机ARP数据包分析发现,网络中有大量的192.168.1.1的广播,根本看不到正常的网络包之间传输。如下图所示: 图2 ARP协议的作用是负责将逻辑地址转换成物理地址,每一个网络中的主机都有一个ARP调整缓存(ARP cache)里面存储着本主机目前知道的逻辑地址到物理地址的映射关系,该表不是静态的,可以随着时间而动态地更新。ARP协议是一个通用性协议,除了可以将IPV4地址解析为MAC地址外,也可以用于其他的地址类型解析,如IPX地址,对于以太网上的TCP/IP来说,ARP协议的作用就是将目标设备的IP地址解析成MAC地址。根据上图所示,网络中不止一台无线路由器,这些无线路由器未经配置直接连入公司网络内,因无线路由器出厂默认IP地址为192.168.1.1,当有多台192.168.1.1的无线路由器时,DHCP 功能未关闭。会有计算机获取到192.168.1.0这个网段的IP地址,这个网段的地址是非法地址,网关即为无线路由器的IP地址。当这台获取非法IP地址的计算机访问网络时,就会先去访问网关192.168.1.1,但因网络中有多台192.168.1.1的无线路由器,所有的路由器都会回应这台计算机发出的请示并广播自己的IP 地址和MAC地址,根据ARP广播包的数据结构,多台192.168.1.1的无线路由器之间也会出现互相广播,这样就会产生ARP广播风暴。大量的192.168.1.1的

计算机网络故障典型案例分析

计算机网络故障典型案例分析 刘成 (河南中孚实业股份有限公司计划管理部,河南巩义451200) 摘要:分析了前段时间园区网络出现的故障分析,找到故障原因,并提示解决方案。 关键词:网络、计算机、无线路由器、ARP协议 故障现象: 公司目前接入网络的计算机有一千多台,思科交换机有40多台,有段时间园区网络出现计算机上网及访问内部服务器时断时续,腾讯通一会掉线,一会上线,导致园区所有应用系统服务器法访问,对生产及办公造成严重影响。 故障分析: 出现以上情况时,我通过Cisco Network Assistant监控软件对园区网络监控发现,园区机房的核心交换机CPU 负荷率达到100%,核心交换机下连的思科交换机CPU负荷率也达到100%,导致思科交换机无法处理正常的数据交换。如下图所示: 根据Cisco Network Assistant监控软件的记录日志分析判断问题产生源所在的交换机,对该交换机所有端口做镜像口,并对镜像口通过wireshark软件对ARP协议进行分析,通过对交换机ARP数据包分析发现,网络中有大量的192.168.1.1的广播,根本看不到正常的网络包之间传输。如下图所示: ARP协议的作用是负责将逻辑地址转换成物理地址,每一个网络中的主机都有一个ARP调整缓存(ARP cache)里面存储着本主机目前知道的逻辑地址到物理地址的映射关系,该表不是静态的,可以随着时间而动态地更新。ARP协议是一个通用性协议,除了可以将IPV4地址解析为MAC地址外,也可以用于其他的地址类型

解析,如IPX地址,对于以太网上的TCP/IP来说,ARP协议的作用就是将目标设备的IP地址解析成MAC地址。根据上图所示,网络中不止一台无线路由器,这些无线路由器未经配置直接连入公司网络内,因无线路由器出厂默认IP地址为192.168.1.1,当有多台192.168.1.1的无线路由器时,DHCP功能未关闭。会有计算机获取到192.168.1.0这个网段的IP地址,这个网段的地址是非法地址,网关即为无线路由器的IP地址。当这台获取非法IP地址的计算机访问网络时,就会先去访问网关192.168.1.1,但因网络中有多台192.168.1.1的无线路由器,所有的路由器都会回应这台计算机发出的请示并广播自己的IP地址和MAC地址,根据ARP广播包的数据结构,多台192.168.1.1的无线路由器之间也会出现互相广播,这样就会产生ARP广播风暴。大量的192.168.1.1的ARP广播包通过上联端口广播到园区机房核心交换机4503上,导致4503交换机的操作系统里的ARP input 进程处于高负荷处理状态,这样导致核心交换机4503的CPU负荷处于100%的状态。核心交换机就无法处理其它交换机发过来的正常数据包,就造成了连接交换机的计算机访问网络出现时断时续的状况。 故障处理: 根据无线路由器广播时发布的MAC地址,在交换机的MAC-add表里找到对应的接口,找到无线路由器。然后把该无线路由器的IP地址修改为192.168.20.1 255.255.255.0。另外一台改成192.168.20.2 255.255.255.0以此类推,同时把DHCP功能关闭。这样网络中同IP地址的无线路由器只有一台。就不会发生访问一个IP地址,所有同IP地址的无线路由器都应答广播的现象。 参考文献 【1】李磊,网络工程师考试辅导2009 作者姓名:刘成 出生日期:1983年1月13日 毕业院校:河南职业技术学院学历:大专 职称:操作员 目前职位:网络工程师

故障案例分析

靖边压气站压缩机组故障案例分析案例一:压缩机组因振动过高产生的故障 靖边压气站三台压缩机组均为往复式压缩机,往复式压缩机存在往复惯性力产生的机械振动和压缩气体产生的气流脉动,导致机组振动。如果压缩机各管区内的气流脉动频率和管道各区域的固有频率与压缩机的工作频率(转速)处在共振范围内,将产生共振现象,使机组振动大影响机组的安全运行。以下为几例因机组振动引发的故障: 故障一:C#压缩机组仪表气进气管压力表接头处断裂 1、基本情况 2004年11月7日22:00,正在值班的人员听见现场产生大的气流声,判断压缩机房发生天然气泄漏,在无法判断泄漏点时及时关闭工艺区进站球阀、关闭燃料气总供气阀,使机组停机,同时打开机房门窗保持通风状态,检查泄漏点。 2、原因分析 停机后经现场检查发现为C#机组燃料气总管引出的仪表气压力表引压管弯头处断掉,机组燃料气在此处大量泄漏。因压力表引压管管径较细且无支撑,压力表选取150mm,机组在运行时产生的振动使弯管处形成应力疲劳导致引压管弯头处发生裂管及断管现象。 3、处理结果 因仪表气的压力相对比较稳定,临时处理拆卸压力表,用丝堵封堵取压口运行机组。 4、经验总结 通过此次故障的发生及事后的经验总结: 1)、在发生气体大量泄漏时及时关闭工艺区进站球阀、关闭燃料气、工艺气阀门,使机组停机,同时打开机房门窗保持通风状态,检查泄漏点,故障处理的果断及时。 2)值班人员在无法确定具体泄漏点时,可通过值班室工控机燃料气及工艺气流量的变化判断哪个机组哪个系统泄漏量的大小,通过可燃气体报警仪数值的变化大小判断可燃气体浓度及哪台机组哪个部位泄漏。根据确定的泄漏系统、泄漏量及可燃气体浓度采取可行的处理措施。 5、预防措施 1)机组上燃料气、启动气、供油管线一般较细且弯管较多,应对这些管线振动较大的位置给予固定的支撑,同时能尽量减少弯管的路径。例行检查要认真到位;

相关文档
最新文档