最全的网络故障案例分析及解决方案

最全的网络故障案例分析及解决方案
最全的网络故障案例分析及解决方案

第一部:网络经脉篇2

[故事之一]三类线仿冒5 类线,加上网卡出错,升级后比升级前速度反而慢2

[ 故事之二]UPS 电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [ 故事之三]光纤链路造侵蚀损坏6

[ 故事之四]水晶头损坏引起大型网络故障7

[ 故事之五] 雏菊链效应引起得网络不能进行数据交换9

[ 故事之六]网线制作不标准,引起干扰,发生错误11

[ 故事之七]插头故障13

[ 故事之八]5 类线Cat5 勉强运行千兆以太网15

[ 故事之九]电缆超长,LAN 可用,WAN 不可用17

[故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX 网络后无法上网18 [ 故事之十一] 网线共用,升级100Mbps 后干扰服务器21

[ 故事之十二] 电梯动力线干扰,占用带宽,整个楼层速度降低24

[故事之十三] “水漫金山”,始发现用错光纤接头类型,网络不能联通27

[ 故事之十四] 千兆网升级工程,主服务器不可用,自制跳线RL 参数不合格29

[ 故事之十五] 用错链路器件,超五类线系统工程验收,合格率仅76%32

[ 故事之十六] 六类线作跳线,打线错误造成100M 链路高额碰撞,速度缓慢,验收余量达不到合同规定的40 %;34

[ 故事之十七] 六类线工艺要求高,一次验收合格率仅80%36

第二部:网络脏腑篇39

[ 故事之一] 服务器网卡损坏引起广播风暴39

[ 故事之二]交换机软故障:电路板接触不良41

[ 故事之三]防火墙设置错误,合法用户进入受限44

[ 故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47

[ 故事之五]PC 机开关电源故障,导致网卡工作不正常,干扰系统运行49

[故事之六]私自运行Proxy 发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52

[ 故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54

[故事之八]中心DNS 服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57

[ 故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60

[ 故事之十]PC 机网卡故障,攻击服务器,速度下降62

[ 故事之十一] 多协议使用,设置不良,服务器超流量工作65

[ 故事之十二] 交换机设置不良,加之雏菊链效应和接头问题,100M 升级失败67

[ 故事之十三] 交换机端口低效,不能全部识别数据包,访问速度慢70

[ 故事之十四] 服务器、交换机、工作站工作状态不匹配,访问速度慢72

第三部:网络免疫篇75

[ 故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75

[ 故事之二]局域网最常见十大错误及解决(转载) 78

[ 故事之三] 浅谈局域网故障排除81

网络医院的故事

时间:2003/04/24 10:03am 来源:sliuy0 整理人:蓝天(QQ :12015152)

[引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,

新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

工作的网络也常常给人带来无穷的烦恼甚至是巨大的损失。网络世界中最忙乱、心里最感底气不足的人恐怕要数网络管理人员和运行维护人员了。他们时时刻刻都在为他们的网络担心,病毒、黑客、速度变慢、网络崩

溃.......................................

[小康档案]:三年前负责管理Coneill 公司,一家快速成长的公司的网络,曾自认为是NT 和

Novell 、Unix 等平台以及Oracle 方面的专家,擅长协议分析和网管软件的使用,每天忙于安装设置不断加入网络的设备和系统,应付不断增加的各种意外事件、报警和陷井,处理网络设备经常性的增加、删除、更改和系统设置、连接等方面的故障和问题。至于如何提高网络的运行效率、如何合理调整网络流量并配置网络设备、如何防止网络问题的发生、如何采用宽带网络设备组网及应用等则基本上无暇顾及。一年前,小康从网络健康学院毕业后到网

络医院就职,负责网络的体检(测试)和故障诊断,专门为哪些网络发生严重问题的“病人”提供帮助。现在他已经是一位经验丰富的网络健康维护的医生,巡诊故事多多。

第一部:网络经脉篇

[故事之一]三类线仿冒5 类线,加上网卡出错,升级后比升级前速度反而慢

[症状]今天是我第一次巡诊,病人抱怨他的大多数站点上网连接速度比系统升级前还慢,有的站点时断时续,有的则根本不能上网。原来用的是10M 以太网,工作非常稳定,性能优良。升级后全部更换为100M 系统,出现上述症状。用户总数未有增加,也没有启用大型软件或多媒体应用软件。重装系统软件、应用软件,重新设置服务器和网站,查杀病毒,Reset 所有联网设备均不奏效。其中,有两台机器换到另一地点后能基本正常工作。用笔记本连接

到这两个不正常链路的集线器端口上网,也能正常工作。更换这两根网线后现象依旧。将机器还原到原位置,更换网卡(原卡商标为3COM 卡)后恢复正常,不知何故。由于以太网大多数用户不能工作,只好暂时退回到10M 以太网系统。

[诊断过程]从10M 系统的网管上观察,网络的平均流量为3% ,低于40%,由于未运行大型软件和多媒体软件,应该不会感到任何速度上的“折扣”。将FLUKE 的F683 网络测试仪接

入Hub 端口,测试网络流量为35%。碰撞率为23 %,远远高于5%的健康标准。报告的错误类型有:延迟碰撞、FCS 帧错误、少量本地错误。基本可以断定是布线系统的严重问题。遂对线缆进行测试,结果显示除了测试点的两根电缆线外,其余所有布线链路的衰减和近端串扰均不合格,用3 类标准测试这些电缆则显示全部合格。查看线缆外包装上印有Lucent Cat5 的字样,可以断定是仿冒产品。测试两台工作站的链路长度分别为78 米和86 米,测试其网卡端口,显示网卡发射能力(信号幅度)不足,并且仪器上没有内置的3COM 厂商标记显示。

[诊断点评]用3 类线外覆5 类线产品标记在假冒伪劣产品中为数不少。用户在10M 以太网环境中不会出现应用上的问题,一旦升级到100M 环境在只有少数短链路能勉强使用。对于两台更换地点后能正常工作的网站,查明链路长度只有3 米,且为标准的5 类线(平时此站点用于临时测试)。原地点测试长度为45 米和37 米,由于网卡发射能力弱,信号在100M

系统衰减大,造成上网困难。改在3 米链路连接时,衰减的影响小,故可以正常上网。网卡测试显示为仿冒卡。

[后记]一个月后,“病人”打电话告述我,重新布线后网络工作完全正常,即使跑一些多媒体软件也丝毫没有停顿的感觉。不好的消息是,原来的系统集成商已不知去向,无法索赔了。

[故事之二]UPS 电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错

[症状]今天的病人是一家著名的证券公司。上午9:45,用户来电请求紧急救援,说大户室中

的一群声称遭受巨额无端损失的愤怒的股民们正聚集在营业部计算中心的机房门前,质问为

什么实时交易的动态信息显示屏幕出现大片空白,数据刷新和交易的速度都极慢,且经常中断,根本无法进行交易。扬言如果不立即恢复交易,将砸掉证券交易所的计算机。交易大厅的散户门也开始向机房云集,

如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个希巴烂。放下电话直立即直奔该营业部,途中继续用移动电话了解得知,该网络为10M 以太网,用户数为230 个。从卫星接收广播的行情数据,并回传交易信息。由于从卫星接收机监测口观察接收数据完全正常,故网管人员初步判定是

网络系统的问题。两个月前就开始有传输数据错误的现象出现,有时数据更新出现空白,数据更新速度偶

尔变慢,有时出现断续。虽用网管和协议分析仪检查过,但因这种“症状”并不连续出现,且

对网络的速度和股民的交易基本没有影响,故一直心存侥幸,没有彻底查找真正的故障根源。前天参加

“第二轮证券系统Y2K 统一认证测试”,顺利通过。利用剩余时间对硬件设备进行了检测和维护,之后进行联网检查,网络表现正常。不料今天开市就出现严重问题。

[诊断过程]用F683 网络测试仪监测网络30 秒,观察网络流量为81%(但网管报告为0.2%),错误帧97.6%。错误类型为Ghosts(占93%)、FCS错误(又称CRC错误)和Jabber,即幻象干扰、帧校验错误和超长帧,这表明网络中有大量的非法数据包存在。此类症状一般以电磁干扰和接地回路方面的问题居多。为了确定干扰源的准确位置, 将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。重新打开集线器组电源,用F43电源谐波测试仪观察,发现谐波含量严重超标(最高

970mV)。该网络用一台大型UPS电源给所有网络设备供电,测试UPS输入电源谐波,约为输出电源谐波含量的30%,

明显低于输出端的指标,断定为内谐波含量超标。启动小型备用UPS 后,网络恢复正常工

作(为减少负荷,网络设备分批轮换接入),但网络测试仪显示仍有错误存在,错误率(幻象干扰)下降为1.3%。再次关断集线器组的电源,类型为Ghosts的幻象干扰错误率下降为0.8%, 证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。摇动卫星接收机的数据输出电缆,幻象干扰时有时无,拔下电缆则干扰消失。网管人员回忆前日维护机器时曾动过该电缆。由此造成连接不良。为使股民能继续交易,稳定情绪,在更换电缆后又将原UPS 启

动继续工作提供服务。收市后再更换大型UPS,故障彻底排除。

[诊断点评]故障原因有二,一是UPS 对电源的净化能力下降,网络外谐波容易从电源系统串入网络系统,为重大故障的发生提供了基础,但只是累积的内谐波超标还不足以引发致命问题。二是接地回路问题,给大量的内谐波串入网络提供了通道。内谐波是指从电源净化设备的输出端比如UPS 的输出端测得的谐波功率,由各种用电设备产生(网络设备绝大多数都采用开关电源,本身就是一个较大的谐波源)。本案中,大量的内谐波功率叠加后从卫星接收机数据输出电缆串入交易网络,一方面以幻象干扰的形式侵蚀网络带宽

(此时网络测试仪监

测到的错误类型即为Ghosts),当以太网的网络总流量高于80%时,会导致绝大多数的网络

瘫痪;另一方面,串入的内谐波将干扰正常数据传输(与正常的卫星广播数据叠加,表现为

FCS 帧错误和少量长帧),使卫星接收机接收到的数据出错,显示屏出现大片空白或不能实时更新数据。本故障为累积故障,两个月前因UPS 性能下降就开始出现少量干扰超标,不过这没有引起网管人员的足够重视。前天维护设备后又增加了电缆接地回路的干扰问题。但因当时未将卫星接收机连入网络, 网管人员仅检查了网络部分的工作状况, 所以此时的网络表现肯定是正常的。直到今天临近股市开市, 当接通卫星广播数据的输入通道时, 问题才爆发出来。此时内谐波干扰信号大举入侵网络,几乎造成网络瘫痪。关断集线器组电源,内谐波总功率下降,干扰信号强度减弱,错误率自然有所下降。更换

UPS电源后,错误率大幅下降(理论上应降为零)。但因接地回路问题使50Hz电源及其高次谐波感应信号仍能进入网络形成较小数量的错误帧。需要注意的一点是, 一般人在更换UPS 后看到网络恢复正常工作即认为故障已经排除,因此很容易忽视仪器监测指示仍存在的少量错误(1.3%),这可能使“接地回路问题”这一重大故障隐患得以长期存在下去。

此故障的诊断网管系统基本上无能为力。

[建议]电源谐波功率含量和网络错误率要定期测试,当发现错误帧时一定不要掉以轻心。另外,一路电源能带动的工作站建议不要超过30 台,否则应象划分网段那样重新划定供电区域。以免内谐波功率累积过大,超过设备的容许范围。如果您的网络可靠性要求很高,或者您的网络对您来说非常重要,那么建议您将主要的网络设备如服务器、路由器等,在网络规划设计时就选择由单独的UPS 供电。

[故事之三]光纤链路造侵蚀损坏

[症状]周末,要下班了,我正在计划如何安排假期,接某银行来电,报告该行某支行下辖的西区营业部网络瘫痪,营业部所管理的33 台ATM 取款机也全部不能提供取款服务,用户反响强烈。已经两天了,解决都没有问题,要求网络医院立即派人帮助排除。西区营业部和支行在同一个大院的两幢大楼内,之间用一对90 米的光纤将营业部的网络与支行的网络连接起来,路由器、服务器等都设在支行计算中心(100BaseT 以太网)。营业部的网络结构为10BaseT 以太网,五天前发现网络速度变慢,用户抱怨ATM 取款机等待时间太长。由于营业部没有配备任何网络测试和维护的工具,为了定位故障,请支行计算中心的网管人员协助检查。从支行一端的网络监测显示,一切正常。从计算中心打开营业部交换器的Mib ,观察流量正常,为5%,发现只有很少量CRC/FCS 错误,没有发现严重异常,用协议分析仪捕捉数据包观察,也未发现严重的问题,遂怀疑是病毒侵害营业部子网。昨日夜间进行了查杀病毒,重装系统,恢复数据等工作,症状大大减轻。但未能经受住昨夜暴风雨的考验(本周天气除昨天下午间晴外,连续降雨),最终于今晨“死网”。

为便于观察,支行网管人员在计算中心将连接营业部的交换机用集线器暂时取代,结果导致支行网络速度也变慢。检查营业部内的交换数据无障碍,断定是传输通道的问题。拔下光纤,支行速度恢复正常,插上光纤则上述现象重新出现。进一部测试光纤链路,连接和衰减均符合要求。故障排除工作陷于停顿。

[诊断过程]据网管人员介绍的上述情况,光纤和交换机已经过了网管人员初步检测,基本正常。可以初步判定问题出在链路通道上。将F683 网络测试仪接入营业部交换机,观察网络

基本正常。进行通道测试,检测营业部到支行的ICMP Ping 测试结果,成功率约0.8%,路

由追踪支行服务器,成功率约0.5%。从支行集线器上观察,流量18%,属正常范围,但发现大量幻象干扰”错误“Gosts”(16),拔除光纤,则错误为0%,至此可以肯定错误与营业部网络及其通道有关。将营业部与支行连接的交换机接口串入一个4端口的集线器,用F683 网络测试仪观察网络,流量5%,发现大量幻象干扰(97% ),拔除光纤,错误消失。寻找光纤接线箱,发现支行一侧的接线箱外包装已被撞击变形、破损

(据说是半年前安装空调时被

吊车臂碰坏),雨水已将3 号接头完全浸蚀(3号接头用于连接营业部)。清洁接线箱内的所有光纤接头,用电吹风加热干燥光纤的插头插座,重新更换并密封接线箱,故障彻底消失。

[诊断评点]光纤链路经常被忽视。本故障中,光纤接头因雨水侵蚀和污染,从营业部送来的信号被大量反射, 此时若只测试光纤链路的物理性能是合格的。但由于此段光纤只有90 米, 强反射信号经过较少的衰减后与正常信号叠加,破坏了数据的结构(包括数据帧帧头信号格式),网络测试仪即认为这是幻象干扰信号而不是正常的数据信号。此时只有少数信号可能侥幸通过。由于集线器和交换器不具备前期碰撞的识别能力, 所以从网管上只能观察到数据帧后半部分被破坏后所表现出来的少量FCS/CRC 类型的错误,此错误往往被人忽视。昨天重装系统后因天气转晴, 光纤接头性能有所好转, 症状减轻。昨夜暴雨又使网络陷入灾难境地。加上今天测试光纤链路显示正常,致使故障排除陷于停顿,束手无策。[建议]交换器对均衡网络负荷、隔离故障网段对网络的影响有很好的效果,但也因此经常成为网管系统监测中的“黑洞”。用网络测试仪定期监测网络可以将故障消灭在萌芽状态之中。

定期测试分很多种,我们将在以后的连载中陆续介绍。本故障如不及时处理,其它光纤接头连接的网络也会陆续出现严重问题。

[故事之四]水晶头损坏引起大型网络故障

[症状]某大公司IT 经理黄先生是我的朋友,新年将近,喜事却不多。今天来电要求帮忙查找“元凶”。事情是这样的,公司规模发展很快,两周前对网络实施了一次比较大的扩容工程,新增加了200 台工作站(为新员工配备),网络规模由2000个站点增加到2200 个站点,全部在一个网段中。该公司采用

100BaseT 以太网结构,用两个路由器实现与生产基地和开发基地的连接(新换2 个155ATM 骨干),以前我曾建议他们将网段划分小一些,以便管理和隔离故障,但因网络未出现什么大的故障,加上黄先生本人的丰富经验和自信以及维护经费未落实等原因,网络一直保持了这种大型网段的“危险结构”。这次扩容同时将两条广域网骨干链路升级到155ATM ,但网段结构仍然未作根本调整,计划留待下期工程时再作打算。本周内网络已多次出现阻塞现象,每天至少两次,每次阻塞时间10?30分钟不等。逐个仔细检查了新安

装的200 台工作站,没有发现任何问题。由于故障不是持续存在,Boss 催得又紧,故令黄先生颇有些

“精疲力尽”的感觉。

[诊断过程]上午10:00,打开路由器的MIB 库,记录的参数基本正常,网络平均流量13%。

其中有约1.5%左右的碰撞,表明网络结构的绝大部分构件是好的。给新增加的200 台工作

站Share 一个软件,然后每40 台一组同时下载并操作该软件,结果证明200 台工作站工作基本正常。将F683 网络测试仪接入网络,同时将F693 网络流量分析仪也接入网络进行监测。下午14:21分,网络阻塞现象出现,持续时间15分钟,F693流量分析仪监测的流量正

常,平均流量从9%上升到13%,一分钟后下降为8%,但F683 网络测试仪的流量报告为84%左右,其中碰撞帧占82%?87%,少量FCS损坏帧(约2%?4%左右)。记录该时间前后的Protocol Matrix 协议对话图谱,发现在15 分钟阻塞时间内共有1 37个工作站曾发送或接收过数据,其中4个工作站一直在持续收发数据,有一个工作站发送的数据包流量一直占其它工作站流量总和的15 倍左右。幸好黄先生以前对站点的

Mac 地址做过文档备案,依据仪器显示的Mac 地址我们立即确定了这4个工作站的使用者(流量最大者是财务科陈小姐的地址)。随即询问他们最近有无更动过硬件和网线,有无增删或调整过软件,回答均是“没有”。询问陈小姐刚才在使用何种软件与生产基地的小张联络(Protocol Matrix 协议矩阵指示为小张的工作站)。回答是“机器一直就连在网上,但刚才没有使用计算机”。将网络测试仪连接到陈小姐的台式机网卡接口上,模拟发送流量,结果碰撞随流量的增加而大幅增加。测试该链路的网卡和网线,显示插头为3类插头,链路近端串扰超差比较多。重新更换5类插头后,网络恢复正常。

经过私下再三询问原因,陈小姐才道出了实情。

[诊断评点]本故障是由更换不适当的3类插头引起的。新员工小张是陈小姐的多年不见的同

学,也是个网虫。此次与陈小姐在新公司相遇,自然倍感亲切。一周前小张在帮陈小姐安装新声卡时不慎将插头损坏,随意用一个3 类插头更换之。临近新年,陈小姐在小张的指点下从网上陆续下载了不少大容量的贺年卡,均为动态电影格式,可以在网络上实时传送播放并加上双方对话,非常有趣。该站点平时使用的财务软件无论是传输速度和数据量都很小(3k 左右),对整个网络系统影响不大。但在向小张放送解压后的动态电影贺年卡时数据流量约在3~4Mbps 左右。由于网线问题,事后推算传输的数据帧约有13%是有效的,其余均被反射和串绕所破坏须重新发送,表现为网络上大量的碰撞帧和少量的FCS帧。

[建议]大型网络不划分网段既不便于管理又很难隔离网络故障,此种结构是非常少见的,同

时也是非常危险的。该公司网络大部分采用的是集线器,只有很少几台交换机,这对故障隔离也是不利的。另外,一定要对员工进行上机前教育,不能随意增删、更改软件和网络设置。所幸的是黄先生本人经验非常丰富,平时已将文档备案工作做得很细致(国内多数网络在文

档备案时不将网卡的Mac 地址备案),否则是不可能在半小时内查出本故障,一般来讲,可能会耗费1?3天左右的时间才行。

[后记]黄先生经过此次“洗礼”,也悟出一点当好IT 经理经理的绝招。至少他已不再认为仅凭经验就可以“打遍天下无敌手”。网络维护是一门艺术,更是一门科学或工程,没有适用的工具和科学的方法是达不到这最高的“艺术境界”的。至于陈小姐,我们还是愿意善意地再为她,也为小张保守一段时间的“秘密”。

[故事之五]雏菊链效应引起得网络不能进行数据交换

[症状]下午某市工商局信息中心来电,其下辖的某县工商局今晨与市局的联网出现问题,速度与往常相比速度慢了许多。其中与该县工商大厦七楼的计算机基本上不能进行数据交换。而与其它楼层的计算机通信虽然速度较慢但还基本上能维持正常的数据交流。由于该市在规

划计算机网络广域联网方案时没有考虑将来自身维护的问题,只是简单地在工程合同中将维护工作交给工程承包商负责,自己没有配备专门的工具和培训专门的人员来维护网络。该工程承包商当时负责此项工程的人

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2 [故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2 [故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [故事之三]光纤链路造侵蚀损坏6 [故事之四]水晶头损坏引起大型网络故障7 [故事之五] 雏菊链效应引起得网络不能进行数据交换9 [故事之六]网线制作不标准,引起干扰,发生错误11 [故事之七]插头故障13 [故事之八]5类线Cat5勉强运行千兆以太网15 [故事之九]电缆超长,LAN可用,WAN不可用17 [故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21 [故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24 [故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27 [故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29 [故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32 [故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34 [故事之十七]六类线工艺要求高,一次验收合格率仅80%36 第二部:网络脏腑篇39 [故事之一] 服务器网卡损坏引起广播风暴39 [故事之二]交换机软故障:电路板接触不良41 [故事之三]防火墙设置错误,合法用户进入受限44 [故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47 [故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49 [故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52 [故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54 [故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57 [故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60 [故事之十]PC机网卡故障,攻击服务器,速度下降62 [故事之十一]多协议使用,设置不良,服务器超流量工作65 [故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67 [故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70 [故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72 第三部:网络免疫篇75 [故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75 [故事之二]局域网最常见十大错误及解决(转载)78 [故事之三] 浅谈局域网故障排除81 网络医院的故事 时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:) [引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

典型的网络故障分析、检测与排除

典型的网络故障分析、检测与排除 摘要: 网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断及排除进行了阐述。根据网络故障的性质把网络故障分为物理故障与逻辑故障。其物理故障也就是网络设备的故障。其逻辑故障是网络中配置管理的错误。也可根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。本文主要介绍路由器故障、配置故障、及连接故障的诊断与排除。通过运用工具和方法分析出导致网络故障的主要原因,及解决方法。 关键词:计算机网络,网络故障,分析诊断,物理类故障,逻辑类故障 引言 计算机网络故障是与网络畅通相对应的一个概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。采取有效的故障防预措施网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为网络用户经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。本文从实际出发,即工作中遇到的网络故障,描述了通过运用网络知识进行故障排除。按照故障现象—>故障分析-->故障解决的研究路线阐述了如何在实际中排除网络故障,及其在网络安全的应用中的重要性。 本文着重讲解了网络故障的排除方法,通过运用解决问题的策略与排除故障的思路在故障现场很快的检测出是属于哪种故障然后再基于故障提出方案给予解决。 正文: 一、网络故障 (一)物理类故障 物理故障,是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。比如说,网络中某条线路突然中断,这时网络管理人员从监控界面上发现

配电网故障预控措施及典型案例分析

配电网故障预控措施及典型案例分析 发表时间:2016-11-04T15:05:20.767Z 来源:《电力设备》2016年第15期作者:章勇王浩张彬彬 [导读] 笔者配网故障防范措施入手进行阐述,再通过本单位出现的典型故障案例进行分析,并提出相关整改措施及事件启示。 (国网江苏省电力公司徐州供电公司江苏徐州 221005) 摘要:随着配电电网建设发展,提高供电可靠率、减少配电网故障是一个系统工程,不仅要加强配电网络的运行维护与管理,加强配电网络的建设,还需要加大对故障情况的分析,要从多方面努力才能取得实效。供电企业在进一步提高配电网络的供电可靠性和运行经济性、为广大用户提供优质服务的同时,也为企业带来更大的社会效益和经济效益。保障配网设备的安全稳定运行,减少设备故障的发生。笔者配网故障防范措施入手进行阐述,再通过本单位出现的典型故障案例进行分析,并提出相关整改措施及事件启示。 关键词:配电网,运行,供电可靠性,故障,异常 0 引言 提高供电可靠性、减少配电网故障率,是配电运检专业一项重要基础工作和综合性很强的生产工作,需要从配电网自动化管理作为抓手,针对造成配网故障的主要影响因素,了解故障根源,采取可靠的10kV配电网的预控故障管理措施,才能将各类故障异常遏制。配电网故障的原因气候环境有较大关联,其诱因最终导致的是配网设备故障,发展至事故,首先应对配电网气候环境、设备负荷及人员管理等因素采取相应预控措施。 1 配电网故障原因分析及预控措施 1社会环境造成配网故障的主要方面 社会经济高速发展带来了楼宇建设、交通繁忙,对线路通道造成一定安全隐患,车辆碰撞杆塔导致线路故障的情况时有发生,尤其在夜间或施工场所。基建施工场所对配电网的破坏也是有发生,主要表现在以下方面:①施工机械、物料超高超长碰触带电部位或破坏杆塔;②基面开挖伤及地下敷设电缆;③修路、建房、烧砖等取用土时,对架设在田间地头电杆地段进行取土,破坏了电杆基础,造成电杆倾斜倒塌。 2社会环境因素采取的预控措施 针对道路交通造成的隐患,采取的措施非常必要,一般建议采用反光漆作为方法措施之一,离地面20cm起往上粉刷杆塔,黄黑颜色相间,各3道,色带高度为20cm则可。对屡屡遭受碰撞的杆塔,可在来车前方1m处设置防撞混凝土墩,并刷上类似的反光漆并在拉线上套上带反光标示的护筒;或迁移该类杆塔。 针对施工现场的反故障措施主要有以下几个方面:加大宣传力度,利用各种传媒长期、广泛宣传保护电力设施的重要性,解释破坏电力设施所带来的严重后果以及肇事者应负的责任;有开挖可能的地下线路,适当设置警示牌,增加巡视的次数。 3气候环境造成配网故障的主要方面 根据多年来的配网运行管理经验,耐张点的悬式绝缘子在雷击时极少发生闪络故障,故障发生点集中在针式绝缘子上,应进一步提高针式绝缘子的耐雷水平有助于提高线路的防雷能力。 在配电架空线路抗击冰冻方面,加强线路的抗倾覆能力是关键。大雪会造成线路积雪增加导线荷载,当气温下降到一定程度时,伴随着雪雨水还会在导线上形成覆冰,从而引起导线弧垂增加,受力增大造成到杆断线故障。 2气候环境因素采取的预控措施 针对雷击事故,应提高绝缘子的耐雷水平,特别是针式绝缘子的耐雷水平。安装线路避雷器,部分特殊线路段加装避雷线。提高绝缘子的绝缘等级,只是其中一个方面,还不足以保障线路在遭受雷击后能安全运行,配套措施是增加泄雷通道,而安装线路避雷器则是一个经济、简单、有效的措施。线路避雷器安装地点的确定原则是尽量安装在周围无高层建筑物、地方开阔的线路段上,尤其是雷击多发区周围有高层建筑物屏蔽雷电的线路段可不用考虑安装,以节省投资。雷电高发区的确定可参考气象部门已确定的雷区分布图另一方面可借助雷电信息定位系统的统计数据核实线路是否处于雷击多发区。 10kV线路避雷器建议选用带金属氧化物避雷器的复合绝缘子。定期检测接地网,确保接地网的接地阻值合格。确保了足够数量的泄雷通道后还应保证泄雷通道畅通无阻,而合格的接地网是保障泄雷通道畅通的一个关键原因。定期进行接地网的阻值检测期,对阻值不合格的接地网,视运行时间和实际检测的阻值情况,可分别采用重新构造接地网或增打地极的方法处理。 针对冰雪灾害天气,建议在积雪结冰或风口地段尽量减少档距和多采用耐张段,拉线设置合理,拉盘合格,尽量防止故障进一步扩大。必要时采用人工除冰的办法,尽量减少损失。 5针对设备陈旧及负荷采取的预控措施 对于重载配电网线路和公用台区应每月开展负荷监测工作。对于长期稳定过负荷的馈线建议采取预警制度,及时制定整改方案转接负荷;对于柱上断路器、跌落式熔断器、阀式避雷器、针式绝缘子、高损配变、高低压配电柜、并沟线夹等早期投运的残旧设备,应选用技术参数高的现行产品结合全年的停电计划安排轮换工作。 6针对针对运行管理方面采取的预控措施 在运行管理方面,应着重抓好巡视维护及消缺两项工作。巡视维护方面应针对不同的天气、季节特点,每月度制定巡视计划,落实责任人,确保巡视到位。巡查发现的缺陷或隐患应设专人进行分析归类,按先急后缓、是否需要停电等的条件制定计划,落实消缺工作。同时应根据单位实际清况,建立健全考核激励机制,对每条线路应独立建立档案,分线分杆进行登记,将线路运行情况、巡查记录、设备缺陷、危险点、特殊区域或地段、消缺等全面录入生产系统,作为月度绩效考核的主要依据。 2 一起配电网故障的案例分析 配电网运行管理人员,应对管理制度的执行方面,加强对典型配电故障对分析,提出改进的措施。下面一起配网断路器渗水的设备故障进行分析,并提出相关措施及事件启示。

【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路 很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。 故障1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。 故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。 故障解决 如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。 故障2:5口交换机只能使用4口 故障现象 办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。 故障分析 UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使

常见网络故障的分析及排除方法

常见网络故障的分析及排除方法 【摘要】计算机网络是一个复杂的综合系统,网络故障十分普遍,故障种类也极其繁杂。本文在对具体的网络故障分析基础上,给出了相应的排除方法。 【关键词】网络故障;常见故障;分类诊断;物理故障;逻辑故障 一、网络故障的分类 网络故障的成因无非是硬件和软件两个方面。按照网络故障的性质,网络故障可划分为物理故障与逻辑故障两类。物理故障也叫硬件故障,是指由硬件设备所引发的网络故障。在硬件故障中线路故障、端口故障、集线器或路由器故障及主机物理故障是较为常见的几种故障。 逻辑故障又称为软故障,表现特征为网络不通,或者同一个链路中有的网络服务通,有的网络服务不通。究其根源,是由于设备配置错误或者软件安装错误所致。路由器逻辑故障、主机逻辑故障、病毒故障是几种常见的逻辑故障。 二、排除故障的具体方法 排除故障的方法是不外乎从软件设置和硬件损坏两个方面来考虑: ㈠物理故障及排除方法 1、线路故障最普遍的情况是线路不通,是网络中常见的故障。线路损坏或线路受到严重电磁干扰时最容易引发该故障。诊断此故障时,若线路很短,最直接的方法是将该网络线一端插入一台能够正常连入局域网的主机的RJ45插空内,另一端插入正常的集线器端口中,然后在DOS环境下,使用PING命令在本主机上检测线路另一端主机(或路由器)的端口能否响应,用TRACEROUTE命令检查路由器配置是否正确,根据检测结果进行判断;若线路稍长,不方便移动,可使用网线测试仪器进行线路检测;若线路太长,或线路由电信供应商提供,则需要与提供商协同检查线路,确认是否线路中间出现了故障。 对于存在严重电磁干扰的检测,可以使用屏蔽性能很强的屏蔽线在该线路上进行通信测试,若通信正常,表明存在电磁干扰。若问题依旧,可排除电磁干扰故障。 2、端口故障分为插头松动及端口本身的物理故障。此类故障一般会直接影响到与其相连的其他设备的信号灯状态。信号灯较直观,通过信号灯大体上可以判断出故障的发生范围及有可能存在的因素。检测时,首先应检查RJ45插头是否松动或检查RJ45接口是否制作完好,然后查看集线器或交换机的接口,如果某个接口存在问题,可以更换接口后再进行验证是否真的存在端口故障。 3、路由器或集线器故障会直接导致网络不通。这类故障也是网络上一种常见的故障,故障的现象与线路故障很相近,在诊断此种故障时,必须用专门的诊断工具来收集路由器的端口流量、路由表、路由器CPU温度、负载及路由器的内存余量、计费数据等数据。检测时,可采用替换排除法,用通信正常的网线和主机来连接路由器或集线器,若通信正常,表明路由器或集线器没有故障;反之则应调换路由器(或集线器)的端口来确认故障;很多情况下,路由器(或集线器)的指示灯表明了其本身是否存在故障,正常的情况下对应端口的指示灯为绿色指示灯。通过以上测试后,若问题依旧,可断定路由器或集线器上存在故障。 4、主机物理故障包括网卡物理故障,网卡插槽故障,网卡松动及主机本身故障。对于网卡插槽故障和网卡松动的诊断可通过更换网卡插槽来进行。如果更换插槽仍不能解决故障,可将网卡放到其他正常工作的主机上测试,若正常通信,是主机本身故障,若无法工作,是网卡物理物理故障,更换网卡故障可排除。

典型网络故障总结

典型网络故障总结 网络故障的一般分类 网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下: ?连通性问题 硬件、系统、电源、媒介故障 配置错误 不正确的相互作用 ?性能问题 网络拥塞 到目的地不是最佳路由 转发异常 路由环路 网络错误 一般网络故障的解决步骤 故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。 故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。 网络故障排除基本步骤 我们以一个故障排除的实例来学习如何应用这些步骤。

案例:某用户网段广播包过多造成该网段的服务器FTP业务传输速度变慢 组网图如下: 某校园网的三个局域网,其中10.11.56.0为一个用户网段,10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢 1. 故障现象描述 要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。 如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题: ●这个问题是连续出现,还是间断出现的? ●是完全不能备份,还是备份的速度慢(即性能下降)? ●哪个或哪些局域网服务器受到影响,地址是什么? 正确的故障现象描述是: 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约只有0.6Mbps。 2. 故障案例相关信息收集 本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径: ●向受影响的用户、网络人员或其他关键人员提出问题; ●根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show命令等; ●测试性能与网络基线进行比较。 如上述案例,可以向用户提问或自行收集下列相关信息: ●网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? ●是否有用户访问受影响的服务器时没有问题? ●在非高峰期日志服务器和备份服务器间FTP传输速度是多少? 通过该步骤,可以收集到了下面一些相关信息: ●最近10.11.56.0网段的客户机不断在增加; ●129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;

地市级10kV配网典型故障处理案例分析

地市级10kV配网典型故障处理案例分析 摘要:本文着重分析了10kV配网运行中两点同相接地、两点不同相接地、疑似单相接地等特殊故障现象,并提出正确迅速的处理方法,确保配网安全运行。 关键词:配网运行;典型故障;处理方法 一、漯河电网配网故障分析的意义 漯河配网规模越来越大,配网故障也日趋复杂,对配网的安全可靠运行要求越来越高。漯河地区10kV电网正常运行方式为中性点不接地系统。10kV单相接地故障是漯河配网的各类故障中发生几率最高的一种,单相接地故障(不包括瞬间及间隙性接地)占比80%以上。现对配网典型故障进行分析,总结规律,从而作出正确迅速处理,确保电网安全稳定运行,同时作为经验学习材料供新进学员学习。 二、10kV小电流接地系统的判断 如何判断小电流接地系统的各种故障。中性点不接地电网发生单相接地短路的现象是:故障相电压降低为零,其他两相电压升高或上升为线电压,其接地相的判别方法为: 1、如果一相电压指示为零,另两相为线电压,则为零的相即为接地相; 2、如果一相电压指示较低,另两相较高,则较低的相即为接地相; 3、如果一相电压接近线电压,另两相电压相等且这两相电压较低时,判别原则是“电压高,下相糟”,即按A\B\C相序,哪一相电压高,则其下相即可能为接地相。 各种单相接地短路的特征 故障类型各相对地电压特点故障相判别 单相完全接地一相电压为零,两相升高为线电压电压为零的相为接地相 单相不完全接地一相电压降低但不到零,两相升高但不相等,其中一相可略超过线电压电压降低相为接地相 单相断线一相电压升高,不超过 1.5Ue,两相电压降低且相等,不低于0.866Ue 电压升高相为断线相

关于网络故障方面的一些常见的问题及解决方法

关于网络故障方面的一些常见的问题及解决方法 21 号。如果有,必须手工更改这些设备的中断和 I/O 地址设置。 34 、故障现象:在“网上邻居”或者“资源管理器”中只能找到本机的机器名。 故障分析、排除:网络通信错误,一般是网线断路或者与网卡的接触不良,还有 可能是 H u b 的问题。 35

故障现象: 可以访问服务器, 也可以访问 Int ern et , 却无法访问其他的工作站。 故障分析、排除:如果使用了 w i n s 解析,可能是 wins 服务器地址设置不当;检 查网关设置,若双方分属不同的子网而网关设置有误,则可能看到其他工作站;检查 子网掩码设置。 36 、故障现象:网卡在计算机系统无法安装。

故障分析。排除:第一种可能是计算机上安装了许多其他类型的接口卡,造成中 断和 I/O 地址冲突。可以先将其他不重要的卡拿下来,在安装网卡,最后在安装其他 接口卡。第二种可能是计算机中有一些安装不正确的设备,或者有未知设备一项,是 系统不能检测网卡。这时应该删除未知设备中的所有选项,让偶重新启动计算机。第 三种可能是计算机不能识别这一种类型的网卡,一般只有跟换网卡了。 37 、故障现象:局域网上可以 Ping 通 I P

地址,但 P i n g 不通域名? 故障分析、排除: T C P/I P 协议中的“DNS设置”不正确,请检查其中的配置。 对于对等网, “主机”应该填写自己机器本身的名字, “域”不需填写,DNS服务器 应该填自己的IP。对于服务器/工作站网,主机应该填写服务器的名字,域填写局 域网服务器设置的域, DNS 服务器应该填写服务器的 I P 。 38

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例

5G通信网络优化最佳实践之5G演示之接入失败问题总结案例 目录 5G演示之接入失败问题总结案例...................................................................错误!未定义书签。 一、问题描述 (2) 二、分析过程 (4) 2.1SA组网架构和终端注册流程 (4) 2.2测试设备和SIM卡排查 (6) 2.3信令分析 (7) 2.4基站对比排查 (12) 2.5问题定位结论 (14) 三、解决措施 (14) 四、经验总结 (14)

【摘要】由于5G新技术刚投入使用,在业务演示中经常涌现各种各样的技术问题,对现场技术人员技能要求高。本文以佛山电信在业务演示中定位解决某紧急技术问题的过程为例,说明演示保障中应对技术问题的思路和方法。在这次保障中,5G手机和CPE不能附着网络,时间紧迫,现场技术人员通过更换SIM卡、更换终端设备、更换基站、核查对比参数和license、分析信令等多种手段进行快速排查,最终在业务正式演示开始前成功定位问题。本文总结了该问题的定位过程,为演示保障中如何处理技术问题提供参考。 【关键字】5G 演示 【业务类别】5G 一、问题描述 5G网络作为第五代移动通信网络,以其超高速率、超低时延和超大连接,将大大加速智能驾驶、智慧医疗、智能工业制造等新技术新应用的落地,推动构建一个全移动和全联接的社会。因此政府和各行各业也都对5G表达了浓厚的兴趣,2019年以来5G业务演示在佛山如火如荼地进行。 佛山电信为接待政府和行业伙伴,计划5月18号在电信魁奇大楼通过5G体验车和华为5G手机Mate20X演示5G业务,组网模式为SA组网。体验车业务包括5G速率体验、360 度VR直播、16路4K高清视频直播、IPTV点播等,体现5G网络超大带宽特点;Mate20X 演示业务包括5G速率体验、5G通话等。为了关键时刻不出问题,业务演示前一天分别进行了体验车和手机业务验证,业务正常。 下图为体验车内高清视频演示屏幕示意图。 下图为高清视频演示网络组网架构示意图。

某公司网络PING延迟故障案例解析

某公司网络PING延迟故障案例解析 一、故障描述 故障地点: 石家庄某公司 故障描述: 网络通讯严重阻塞,用户访问外网服务器以及互联网的速度均非常缓慢,甚至不能访问,PING 网关延期。如图: 二、故障详细分析 1. 前期分析 初步判断引起问题的原因可能是: ●ARP病毒 ●网络病毒攻击 开始实际工作配差 1、登录到各交换机,查看内存及CPU的利用率,均正常。 2、通过OMNIPEEK捕获并分析网络中传输的数据包,具体过程如下。 在核心交换机上做好端口镜像,启动OMNIPEEK,约3.08分钟后停止捕获并分析捕获到的数据包。 XX公司网的主机约为300台,一般情况下,有200台左右上网,等停止分析后,我们在OMNIPEEK主界面左边的节点浏览器中发现的主界面查看,在EXPERT的Hierarchy中查看,诊断tcp connection refused时间竟然达到了5731个,感觉很是不对。如图:

进行定位查看,发现有一台计算机极为不正常如图:

由以上看到,可能被外部的DDOS攻击,可能是此计算机感染病毒,进一步查看如图: 可以看到外网计算正在通过135端口正在扫描此计算机,因此可以断定正在被DDOS攻击,此计算机一定感染了木马之类的蠕虫病毒。 找到问题的根源后,正准备对CAI2主机进行隔离,过了一会儿,再次PING网关,还是延迟,但不是太严重了,感觉还是有计算机感染病毒或有ARP攻击,随即再次分析此包,但最终没

有找到可疑的计算机,其间也关闭了几个流量有问题的计算机,但问题还是不能解决,正在百思不得其解时,突然脑子一动:何不尝试着通过分析我自己的计算机,再排查故障呢? 于是笔者选择了科来网络分析系统6.7试用版啊?(笔者只有50个用户的抓包,因此刚开始选择了OMNIPEEK。)设置好过滤条件,这里为什么选在192.168.1.1呢,笔者怀疑是不是有人设置了和网关相同的IP地址呢?选择如下图: 打开自己的计算机进行PING,然后用科来进行抓包,58秒后如下图: 其中8c:68是笔者计算机的MAC,09:37为网关MAC,突然多出了一个A9:4D.查看分析如图:

网络故障案例与故障排除方法

网络故障案例与故障排除方法 一、网络故障案例 故障现象: 一日早晨上班开机,Windows XP系统正常启动后,顺手打开Internet Explorer浏览器,想好好浏览一下当日的新闻快报,却发现IE浏览器的窗口里空空如也。认真一查,发现IE提示为“DNS错误”,刷新几次都是如此,看来网络出问题了。 故障处理: 首先怀疑的当然是DNS服务器了,于是赶忙启动系统的“控制面板→网络连接→网络属性”菜单,点选其中的TCP/IP协议,查看罗列其中的DNS列表,发现配置并没有错误,打了个电话给当地的ISP机房热线,回答是出奇的肯定:DNS No Problem! 难道是我的网络或系统出了故障吗? 大概是最近病毒泛滥成灾的缘故吧,我又想到是否我的机子染了病毒或木马,于是马上拿出最新的防毒软件和防火墙软件,一阵穷追猛打,结果是病毒一个也没有,网站仍然登不上去。 这时我开始怀疑机子的网络配置出了问题,于是点“开始”菜单里的“运行”项,在其中输入cmd并回车,进入了DOS命令行窗口,在其中敲入“Ipconfig /all”回车。这时本机的网卡状态,包括MAC 地址,IP地址,子网掩码,网关地址及DNS服务器等关键参数全部罗列出来,我左顾右盼也没发现任何差错。看来问题不在软件上,而是硬件有麻烦了。

无意中我查看了一下桌面右下角图标的网络状态,发现网络的发送/接收数据包数目居然都是0!这怎么可能?难道是网卡不行了?可是网络右下角的连通状态提示分明给出了“以10M速度连接”的提示,而我在“运行”窗口中敲入“Ping 127.0.0.1”作回环测试,也报告一切正常。于是我理所当然地将网卡故障的可能性排除在外。 转念我又把矛头指向了单位局域网中那台价低位廉、年久失修的交换机上。跑过去一看,嘿!果然不出所料,连接我的桌面电脑的交换机端口指示灯居然不亮!难道这就是问题的根源?可是去问问同事,大伙儿异口同声表示上网正常,这表明这台年迈的交换机还健康长寿,再将同事所用的交换机端口与我互换,他们仍能正常上网,这表明交换机上与我机子相连的接口亦无问题,这下惟一的希望就在连通网卡与交换机之间的网线上了。 由于平时用此网线上网一直正常,因此对它的接线配对无可怀疑,惟一的可能或许是器件老化及经常拔插导致接触不好,四处奔波借来一个网线连通测试仪一测,接近100MB的良好连通性差点让我气歪了嘴!看着网络状态上几乎凝固了的“0”数据包收发,百般无奈之中抱着试试看的想法打开了机箱,看着固化在主板上的那个网卡,烦乱中我用手狠狠地敲了它两下——没想到奇迹发生了!网络状态上的收发数据包计数从“0”变成了“10”,“90”,“200”……顺手打开IE浏览器,一个个熟悉的网站顿时映入眼帘!原来故障的源头竟是这最不放在心上的网卡!它与主板的牢固粘合导致软件测试时报告一切正常,而它在与网线接口处的微小松动却使得网络在物理上已完全隔

传输故障排除案例集锦(HUAWEI)

1 业务中断的处理 1.1 更换光板类型错误导致对端收光不正常 【系统概述】 某传输组网如图1所示,4个OptiX 2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。其中,3号站和2号站之间距离较长,使用了BPA 光放板。 1w MSP OptiX 2500+23 4e e e e w w w 图1 系统组网图 【故障现象】 某日机房维护人员发现2号站接收3号站方向的S16有R-LOS 告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA 有IP-FAIL (无输入光)告警,3号站的BA 有IP-FAIL 告警。 【故障分析及排除】 BPA 板光口1对应的是BA (功放,将 S16的输出光信号放大14或17dBm );光口2为PA (前放,当输入光功率在-22dBm ~-32dBm 之间时,光口OUT2输出光功率变化范围在-7dBm ~-21dBm )。光信号经过BPA 的尾纤连接及信号流向如图2所示:

OUT IN IN OUT OUT IN S16BA PA S16 3号站2号站 图2 BPA光信号流向 (1) 根据光信号经过BPA的信号流可以看出,由于3号站光放板 的BA未收到光信号,导致了2号站的PA、S16报收无光。 可以判断故障点在3号站; (2) 维护人员带S16、BPA、尾纤、光功率计到3号站; (3) 在3号站测试S16板的输出光功率值,光功率计显示无光信 号。可以判断是S16板故障; (4) 将带的S16板插上,测试S16输出光功率为0dBm,恢复尾 纤连接; (5) BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI; (6) 查询2号站S16,仍有R-LOS告警; (7) 在3号站,将换上去的S16板发光功率衰减到-15dBm做自环, 告警消失。判断新换上去的S16并没有损坏; (8) 为什么仍有告警呢?分析原因是3号站的S16板使用有错, SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。 (9) 查看3号站原来使用的S16的光板类型,为SS62S1605;刚 换上去的S16类型为SS62S1604; (10) 更换同类型的S16,故障消除。

10个最常见的网络故障

10个最常见的网络故障(上) 网络发生故障是难免的,重要的是如何在发生故障后快速地隔离和排除故障。网络维护人员应该配备相应的工具和相应的知识,以便及时、有效的找到和解决问题。本文讨论了网络技术人员和工程师经常遇到的十个令人头疼的问题,通过分析问题的描述和症状的了解,讨论使用何种工具来帮助查找这些故障。本文的案例都具有广泛地应用价值。 问题1:逮捕物理层的滥用者 故障症状:不能登陆或时断时续。只影响一个工作站,而该站原先没有问题 问题分析:电缆终端链路太长。用户每天都移动,弯曲,连接和切断网络终端(尤其时膝上型笔记本电脑)。廉价的电缆测试仪就能检查这种问题。在你能确切地说是电缆的问题之前,通常首先考虑不是电缆的问题。这需要使用网络测试工具来证明本地网段的健康状况是否良好,集线器端口功能是否正常,网卡及其驱动程序工作是否良好。最后,检查网络互连设备是否有问题。 只有此时,你才会知道为了孤立有问题的终端,断开的连接器或是接地回路等问题该从何处着手测试电缆。在铜轴线网络中,搜寻在同轴“T型头”和网卡之间的断头,在UTP网络中,连续运行仪器图测试功能,不断扭动终端以识别接触不良或短路。 解决问题:更换工作站连接电缆,更换损坏的连接器,或者必要的话停止使用水平电缆。再次全面检查处理过的电缆。 问题2:快速以太网比升级前的以太网还慢 故障症状:10Mbps的以太网速度慢,升级为100Mbps快速以太网后甚至不能连接上网。影响新工作站或升级的工作站连接上网。 问题分析:对于UTP5类非屏蔽双绞线,用电缆测试仪测试其是否符合对应100Mbps 传输速率的EIA/TIA-TSB67标准。某些在10Mbps以太网工作正常的电缆链路因为近端串扰太大在100Mbps以太网就不能正常工作。信号耦合到邻近线对引起高频信号传输失败。将UTP的线对分开甚至会使网络在达到一定流量时瘫痪 解决问题:更换或停用不能连接的链路,故障清除后再全部测试处置过的链路。 问题3:无效的看门狗 故障症状:不能连接Novell网络的Netware远程服务器。影响本网段内与服务器相连的所有工作站 问题分析:检查网段的健康状况,注意观察其利用率,碰撞,错误帧和广播帧水平。此时可观察到大量的碰撞或错误帧,该碰撞或错误帧可引起客户机和服务器之间“Hello”帧出

电业局网络故障诊断案例分析

案例分析-某电业局网络故障诊断 一、故障描述 故障地点: 某电业局 故障现象: 网络严峻堵塞,内部主机上网甚至内部主机间的通讯均时断时续。 故障详细描述:

网络突然出现通讯中断,某些VLAN不能访问互联网,且与其它VLAN的访问也会出现中断,在机房中进行ping包测试,发觉中心交换机到该VLAN内主机的ping包响应时刻较长,且出现间歇性丢包,VLAN与VLAN间的丢包情况则更加严峻。 二、故障详细分析 1.前期分析 初步推断引起问题的缘故可能是: ●交换机ARP表更新问题 ●广播或路由环路故障 ●人为或病毒攻击 需要进一步猎取的信息: ●网络拓扑结构及正常工作时的情况 ●交换机ARP表信息及交换机负载情况 ●网络中传输的原始数据包 2.具体分析 首先,我们从网络治理员那儿,得知了网络中主机共450台左右,

同时得到了网络的简单拓扑图,如图1所示。 (图1 网络原始拓扑简图) 从图1能够明白,网络中划分了6个VLAN,分不是10.230.201.0/24、10.230.202.0/24、10.230.203.0/24、10.230.204.0/24、10.230.205.0/24、10.230.206.0/24、,其中201~205这5个VLAN分不用于一个部门,而206为服务器专用网段。各VLAN同时连接上中心交换机(Passport 8010),中心交换机再连接到防火墙,由防火墙连接到Internet以及省单位。大致了解了网络拓扑后,我们以超级终端方式登录中心交换机,发觉交换机的负载较大,立即清除交换机ARP表并重启,但故障仍然存在,因此我们决定对网络进行抓包分析。

LTE核心网常见投诉案例分析

LTE核心网常见投诉案例分析 案例一:临时方案用户预换卡不能使用2、3G业务 【故障现象】 临时方案的用户,在更换USIM卡但未开通4G业务的情况下,在4G网络的覆盖下,用4G手机终端可能无法正常使用2,3G业务。只能在4G手机上设置“2,3G only”,才能恢复正常使用。 【故障分析】 临时方案的用户,在更换USIM卡但未开通4G业务的情况下,当前BOSS系统只是将用户的IMSI鉴权信息通过BOSS指令存储到HSS,并未建立IMSI和MSISDN的关联,即未放号为签约用户的任何2、3G的分组域、电路域和4G 业务的签约信息。这种场景下HSS给MME返回 DIAMETER_ERROR_USER_UNKNOWN的错误码,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN码后,给终端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值。终端收到“EPS services and non-EPS services not allowed”的NAS值后,不再尝试重新选网。【故障解决】 针对这种临时方案的用户,如果只更换USIM卡不签约4G业务,根据测试,MME给终端返回#7 “EPS services not allowed”的NAS值能够使终端较快地重选到2、3G网络。根据协议中定义的映射规则,HSS需要给MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的错误原因值,对应到HSS上,

无线路由器故障经典案例追踪分析

在企业环境下部署无线网络,方便了企业内部的移动办公。而无线路由器则是无线网络的核心组件,它的运行状态决定了无线网络的传输能力。正因如此,维护无线路由器,使其安全高效地运行是管理员首先要考虑的问题。 下面列举几个无线路由器的经典案例,希望对大家有所帮助。 案例1:无法登录无线路由器的设置页面进行路由设置 原因:排除硬件及其连接故障,主要是之前登陆时所创建的连接有误。 排除故障: 第一步:首先检查路由器与电脑的硬件无线连接情况,检查路由器LAN口上的指示灯是否正常。 第二步:如果计算机中装有防火墙或实时监控的杀毒软件,都暂时先关闭,然后将本机IP 地址设为与路由器同一网段,再将网关地址设为路由器的默认IP地址。 第三步:打开浏览器的Internet选项对话框,在连接选项中,如果曾经创建过连接则勾选从不进行拨号连接选项,点击局域网设置按钮,将已勾选的选项全部取消选中即可。 案例2:提示网络不通,连接错误 原因:硬件错误,连接故障及其无线网卡的设置都可能造成网络连接故障。 排除故障: 第一步:首先要检查的是连接配置上有无错误,在确保路由器电源正常的前提下查看宽带接入端,路由器上的指示灯可以说明宽带线路接入端是否正常,由说明书上可以辨认哪一个亮灯为宽带接入端及用户端,观察其灯闪亮状态,连续闪烁为正常,不亮或长亮不闪烁为故障。我们可以换一根宽带胶线代替原来的线路进行连接。 第二步:如果故障依旧,查看路由器的摆放位置与接收电脑的距离是否过远或中间有大型障碍物阻隔。这时请重新放置路由器,使无线路由器与接收电脑不要间隔太多障碍物,并使接收电脑在无线路由器的信号发射范围之内即可。 第三步:无线网卡的检查也必不可少,可以更换新的网卡并重新安装驱动程序进行调试,再网卡中点击查看可用的无线连接刷新网络列表后设置网卡参数,并再属性中查看有无数据发送和接收情况,排除故障。 提示:当然路由器自身的硬件故障也是导致线路不通的直接原因,但这并不是我们所能解决的范围,应及时联系厂商进行维修或更换。

网络故障案例手册Ver1.0

网络故障案例手册 Ver1.0

目录 案例编号20130208 (4) 交换机硬件故障引起网络中断 (4) 典型症状 (4) 其它现象 (4) 处置方法 (4) 案例具体原因 (4) 扩展 (6) 案例编号20130604 (6) 症状 (6) 处置方法 (6) 处置结果 (8) 扩展 (8) 案例编号20130614 (9) 症状 (9) 处置方法 (9) 处置结果 (9) 扩展 (9) 案例编号20131016 (10) 症状 (11) 处置方法 (11)

处置结果 (11) 扩展 (11)

案例编号20130208 交换机硬件故障引起网络中断 典型症状 A.在交换机log中出现如下信息%SW_MATM-4-MACFLAP_NOTIF: Host 68b5.99cd.d276 in vlan 8 is flapping between port Gi0/33 and port Po2; B.交换机在线检查各项参数未见异常,交换机重启后报错,无法加载IOS; 其它现象 交机机载高,网络延迟大,网络丢包。 处置方法 交换机离线与网络隔离,与故障交换机连接的服务器切换到备用交换 机中。 如不确认引起此故障的具体交换机,可将交换机与主网络逐一隔离。 案例具体原因 管理网络端口Port-ASIC芯片自检Fail。 以下为故障交换机启动自检全过程Log front_end/ (directory)

extracting front_end/fe_type_1 (34760 bytes) extracting front_end/fe_type_2 (78400 bytes) extracting front_end/front_end_ucode_info (86 bytes) extracting ucode_info (76 bytes) POST: PortASIC CAM Subsystem Tests : Begin HTD POST: Basic Test Failed POST: POST Failed POST: PortASIC CAM Subsystem Tests : End, Status Failed POST: CAM test failed POST Failed: disabling stack links and shutting down SDP driver class subsystem initialization failed *Mar 1 00:00:35.668: %SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output. *Mar 1 00:00:35.668: %SYS-2-ASSERTION_FAILED: Assertion failed: "reg_used_xdr_portid_to_lc_logical_slot()" -Process= "Init", ipl= 0, pid= 3 -Traceback= 1DDA7F8 1DDAF44 1D46E6C 11EC2B0 11EC4A0 286CC78 286CD10 1DE64B8 1DE66F4 1A2F5C8 1A26098

PING大包丢包网络故障分析案例、解决方案

PING大包丢包故障分析 1.1. 故障描述 1. 故障环境 网络结构如下图所示: 如上图所示,两边网络通过光纤相连,中间设备只有光电转换器,到单位B的内部网络有一台防火墙 2. 故障描述 单位B在进行网络测试时,在单位B的出口路由器处PING单位A的出口路由器时,PING大包会出现丢包现象,但是PING小包正常。 1.2. 故障分析 1. 分析方法 主要通过专有的网络分析工具(科来网络分析系统)将故障时相应的数据包捕获下来进行深度分析,并通过分析发现相应的异常,从而定位故障原因的方法。 2. 部署科来网络分析系统 我们在单位B的光电转换器和路由器之间串连一个交换机,利用交换机的端口镜像功能,镜像两个端口的流量,并将科来网络分析系统部署在交换机的镜像口,如下图所示: 3. 分析数据包 通过故障重现,即在路由器接口处进行PING测试,并同时捕获数据包,得到的数据包如下图所示:

如上图所示,我们在使用大包PING对端时,对端返回了一个超时的数据包,查看它具体的数据包解码,如下图: 造成该故障的原因是因为,我们在网络中传输大包时,由于网络中“最大传输单元”的限制,大数据包会发生分片,当分片数据包都到达目的端时会发生重组,一旦有一个分片丢失就会造成数据报重组超时,所以会发送超时的差错提示。 4. 分析结论 我们在进行PING测试时,数据包只经过了光电转换器和中间链路,所以造成该故障的原因就是光电转换器或中间链路丢包造成的。 1.3. 总结 当我们在分析数据包时,发现通信的数据包中有异常的数据包,那么我们就需要关注它是何种应用的数据包,通过分析异常的数据包可以帮助我们快速的找到故障原因,从而解决故障。

相关文档
最新文档