华为交换机故障排查案例
交换机光模块匹配故障案例

一,事情起因:早上接到开山机械股份有限公司的网络管理员打来电话,告知公司中部分网络无法使用,急需上门调试。
立马开车前往故障地点。
开山机械股份有限公司分一,二两个厂区,核心设备都放在一区的中心机房,一区使用光纤连接二区并通过二区二层交换机完成分点。
实际遇到的问题是二区所有计算机无法上网,一区计算机访问网络没有任何问题。
二,故障现象:一区计算机访问网络没有任何问题,基本上排除了三层交换机和光路的故障。
马上奔赴二区核心机房,经过了解原来二区各个网络点都是通过光纤接入到交换机连接到一起的,使用了两台华为交换机,这两台交换机通过后面板的堆叠模块堆叠连接到一起,其中一台交换机被配置为主交换机,另一个是从交换机。
在主交换机上通过光纤模块连接光纤至一区中心机房的交换机。
到二区堆叠交换机处一看,发现主交换机加电后所有交换机端口指示灯都呈红色,并不停闪烁。
20秒左右后闪烁停止,所有指示灯熄灭,然后过一段时间后又会出现所有指示灯再次出现红色显示的现象,此现象反复出现,不管在指示灯呈红色还是熄灭状态下用笔记本连接到相应端口都无法正常上网。
三,初步分析问题:由于以前也曾经遇到过交换机所有端口对应指示灯呈现红色的问题,这个是广播风暴的体现,主要是因为交换机的某两个端口通过一根网线连接到一起。
于是根据这个线索进行查询,看有没有网线连接照成环路的问题。
反复查看后没有发现任何问题,看来不是广播风暴造成的。
将自带的笔记本通过网线连接到了二区主交换机上,发现对应的端口显示灯是绿色的,说明工作正常。
这时笔者发现一区主交换机上面板显示M1(模块一)工作不正常,只有一个灯处于亮状态,其他显示速度,工作模式等指示灯都是灭的,这说明该模块并没有正常工作,而相应的M2这个堆叠模块则工作正常。
笔者马上到交换机后面看看光纤连接是否正常,将光纤跳线重新插拔后TX灯始终不亮,而RX则始终亮着。
看来是光纤模块或光纤线出问题了。
首先查看光纤线和接口是否正常,从一区中心机房打红光过来,把光纤插头拔下在暗处可以看到有亮光,说明有信号,该光缆是好的,也说明了从一区到二区这段光纤线路应该没有问题。
华为路由器故障处理案例教程

2. 相关信息收集
搜集有助于查找故障原因的详细信息: – 向受影响的用户,网络人员或其他关键人员提出问题; – 根据故障描述性质,使用各种工具搜集情况,如网络管理系统, 协议分析仪,相关display和debug命令等; – 测试性能与网络正常情况下的记录进行比较. 通过该步骤,我们收集到了下面一些相关信息: – 最近91.XX.56.0网段的客户机不断在增加; – 91.XX.0.0网段的机器与备份服务器间进行FTP传输时速度正 常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有 0.6Mbps; – 在非高峰期日志服务器和备份服务器间FTP传输速度正常,大 约为6Mbps
7. 循环进行故障排查过程
可能原因1:网络91.XX.56.0到网络91.XX.0.0的路 由不是最佳路由. 制定的方案:在91.XX.56.0网段的网关上使用 "tracert 91.XX.245.253"命令,发现探测报文返 回时长仅为10ms,表明该可能原因并不是造成故障 的原因.我们进入循环排错过程.
4. 各种可能原因列表
该步骤列出根据经验判断和理论分析后总结的各种可能原因 如上述案例,可能原因如下: – 网段91.XX.56.0的性能问题,其原因可能为 : 日志服务器A的性能问题 91.XX.56.0网络的网关性能问题 91.XX.56.0网络本身的性能问题 – 中间网络性能问题,主要是到网络91.XX.0.0的路由不是最 佳路由
PING命令
在PC机上或Windwos NT为平台的服务器上,ping命 令的格式如下: ping [ -n number ] [ -t ] [ -l number ] ipaddress -n ping报文的个数,缺省值为5; -t 持续地ping 直到人为地中断,Ctr+Breack暂时中 止ping命令并查看当前的统计结果,而Ctr+C则中 断命令的执行. -l 设置ping报文所携带的数据部分的字节数,设置 范围从0至65500
华为OLT故障处理经典案例分析

华为OLT故障处理经典案例分析作者:严娟来源:《硅谷》2012年第24期摘要:在OLT日常维护工作中,用户系统的故障所占比重最高,引起用户系统的故障原因有很多,现象也不尽相同。
本文通过案例详细介绍了OLT的故障原因和处理流程。
关键词:华为OLT、故障处理、忙音2012年9月,武广OLT下挂的ONU广州北站发生了一次故障,此故障的处理过程几乎囊括了OLT故障处理的所有手段,是OLT故障处理的一个典型案例。
现象描述:广州北站ONU第一条电路PCM告警,本室做2M环回,OLT侧正常。
打直2M后,告警消失。
第二天,又发生相同告警,检查发现2M头虚焊,重做2M头告警消失。
PCM告警消失后,工区反映所有电话呼入呼出都忙音。
对于OLT单个用户故障,一般从三个方面入手:1、外线故障。
在机房MDF架甩开外线,插上话机听是否正常,如正常便是外线原因。
2、硬件故障。
ASL板故障、PV4板故障、PWX板故障、时钟问题以及用户话机故障。
因为是单个用户出现问题,所以一般不可能是整块板及时钟问题,大都是ASL板上相应的端口问题或话机问题。
3、数据设置错误。
用户数据由交换机侧设置,检查用户数据即可。
大面积用户故障,主要有三种:1、网管维护系统中,半框或整框单板呈现为红色故障态。
故障原因包括:数据设置错误,传输问题,PV4板硬件故障。
2、半框或整框用户板故障,但PV4板正常。
故障原因包括: 2M收发接反,或把到其它框的2M接到了故障框。
3、忙音现象。
故障原因有四种:(1)用户过多,话路不够分配。
一个ONU两条2M,可以满足60个用户同时提机通话,按照收敛比1:4,可以安装240个用户。
超过240个用户,可能会有忙音现象出现。
这个问题通过扩容便可以解决。
(2)2M链路硬件故障。
由于2M链路连接不好,引起2M链路物理层的故障。
观察网管是否有线路告警,通过逐段环回等操作定位。
(3)2M链路正常,但是呼叫时隙分配到该链路时不能通话。
可能是由于2M链路连接交叉错位引起(俗称鸳鸯线),通过维护台发起链路身份标识,便可验证是否鸳鸯线。
排除华为OLT PON口下的业务上行网速慢的故障案例

关键字:pon口下业务上行网速慢摘要:本案例对日常工作中常遇到的网络不稳定的故障采用排除法及告警分析法进行故障定位,对网络不稳定网速慢及PON口下存在非法入侵的发光设备这类故障的处理思路进行整理,对排障过程及方法进行了总结。
案例正文:故障现象:1,100M专线用户反映网络不稳定,下载文件正常但上行网速慢,发生故障时带附件的电子邮件无法正常发送,玩QQ及微信发送图片失败。
2,在用户现场通过第三方测速网站测速,显示下载可以达到83.07Mbps,而上行只有1.03Mbps甚至更低;3,重启ONU终端后,ONU上线慢,且网速无改善;4,更换ONU终端后,ONU设备MAC地址无法被自动发现,无法正常注册。
(一)上行网速慢故障处理思路:1,排除用户局域网设备导致故障的可能;2,检查用户线路的光衰耗值是否在正常范围内;3,由于用户反映下行正常但上行业务异常,因此需检查该用户接入OLT设备的配置的线路模板中DBA参数是否适当;4,检查OLT设备上联中继带宽及流量是否正常;5,PON网络中的其他故障(含设备板卡及光模块及PON口下的长(乱)发光的异常入侵等因素)6,根据上述检查情况,指导相关(线路维护)人员到现场协助排除故障。
根据上述思路采取的故障排除方法:1,在ONU的以太口直接连接单台电脑测试,故障现象仍然存在。
2,在华为OLT设备上通过命令#display ont optical-info 7 1 查看该ONU的收发光均在正常工作范围内(ONU收OLT方向为-19.17dBm;ONU发光为2.05 dBm)3,在OLT设备上通过命令#display dba-profile all检查该用户使用的线路模板中调用的DBA 14模板参数无误:上行保证带宽为102400kbps4,在OLT设备上通过命令#display port state all 和display port traffic 0检查OLT设备上联中继带宽和流量正常(当前双上联的10GE端口带宽占用率约为11%)5,在OLT设备上通过命令#anti-rogueont autodetect on(OFF检查完毕要及时关闭)和在PON板下用命令#anti-rogueont manual-check 7手动排查排查PON口下的异常入侵等因素,通过命令#display port state 7检查PON口工作状态:发现该PON口下出现非法入侵的流氓ONT “存在”在OLT设备上通过命令#display alarm history alarmparameter 0/5/7查看该PON口近期产生的全部告警信息并顺利找到入侵告警如下:根据上述5个排查步骤,至此对该故障原因确认为:该OLT的0/5/7 PON口下存在非法入侵的发光设备。
华为交换机端口提示CRC错误解决方法

华为交换机端口提示CRC错误解决方法华为交换机端口提示CRC错误解决方法1、问题现象查询端口计数,发现端口有大量的CRC错包,并且不断增长。
[HUAWEI-GigabitEthernet0/0/1]display this interface GigabitEthernet0/0/1 current state : UPLine protocol current state : UPUnicast : 888962,Multicast : 0Broadcast : 0,Jumbo : 0CRC : 4782,Giants : 0Jabbers : 0,Throttles : 0Runts : 0,DropEvents : 02、解决方案首先将两端的端口协商模式设置为一致,设置成非自协商模式,或均设置成自协商模式,结果问题依旧。
最后更换网线解决。
3、经验总结CRC错包一般是由于物理链路问题造成的,出现CRC错包后,首先要排除物理链路的影响。
交换机端口错误包分类(1)input errors:各种输入错误的总数,显示范围是20bit。
(2)runts:表示接收到的超小帧个数。
超小帧即接收到的报文小于64字节,且包括有效的CRC字段,报文格式正确。
(3)giants:表示接收到的超长帧个数。
超长帧即接收到的有效报文字节长度大于1518(如果是带tag报文,大于1522),且小于设备能接收的超长帧最大值(1536)。
(4)CRC:表示接收到的CRC校验错误报文个数,即接收到的报文在64~1518(带tag 报文是1522)字节范围内,且字节是整数,而CRC校验错误。
(5)frame:也是CRC校验出错报文个数,报文字节不是整数,其他同上。
(6)aborts:表示接收到的非法报文总数,包括:○1报文碎片:小于64字节,且CRC校验错误(报文字节是整数或非整数)。
○2jabber帧:大于1518(tag报文是1522)字节,且CRC校验错误(报文字节是整数或非整数)。
【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。
为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。
故障1:交换机刚加电时网络无法通信故障现象交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。
另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。
故障分析由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。
这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。
所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。
如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。
故障解决如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。
不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。
故障2:5口交换机只能使用4口故障现象办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。
原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。
故障分析UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。
借助UpLink端口,集线设备可以使用直通线连接至另外一个集线设备的普通端口,这样就不必使用交叉线。
交换机和集线器的芯片通常为×4,所以集线设备端口大多为4口、8口、16口、24口等,如果制作成5口,就会浪费3个模块,从而增加成本。
华为传输设备常见案例集

华为传输设备常见案例集案例一:标题:光功率正常S16板上报R-LOS告警序号:SC0000189826资料类别:案例库产品族:SDH 产品:OptiX 2500+(Metro 3000)故障类别:其他关键字:白光RX LWC现象描述:2500+设备和波分1600G设备对接,S16板连接LWC板,某日S16板突然上报R-LOS 告警,引起MSP环倒换。
告警信息:R-LOS原因分析:1、本端光板S16故障;2、LWC故障;3、线缆故障。
处理过程:1、通过光功率测试S16入口侧的光功率,发现不带光衰为-7dBm,加了光衰为-12dBm,光功率正常,不是线缆和光衰故障。
2、对S16单板的收发光口自环,发现R-LOS告警消失。
3、在LWC的TX口测试光功率发现,发光为-6.5dBm,但将RX和TX口自环发现,本地LWC和对端的LWC都上报R-LOS告警。
4、更换本地的LWC单板,发现问题解决。
R-LOS告警消失。
5、后确认LWC发白光,虽然测试到光功率,但实际上该光不能被S16板识别,导致S16板上报RLOS。
建议与总结:类似故障处理时,不能单纯的靠光功率来定位故障,还得需要从多个角度去分析问题,检查每一个故障可能。
标题:新建网元ID号与网关网元相同导致的奇怪现象序号:SC0000187064资料类别:案例库产品族:SDH 产品:OptiX 2500+(Metro 3000)故障类别:ECC_Fault关键字:ID 网关网元现象描述:组网情况:网元ID为15、16的组成无保护链,15号为网关网元,网元101、102、103、104、105为10G设备组成STM-64的复用段环,17、18、19、20为101带出的2500+扩展子架,网元1、2、4、5为10G设备组成STM-64的复用段环,7为1带出的2500+扩展子架,其中16、101、17、18、19、20、1、7在同一机房,16和1通过扩展ECC相连,7和101通过扩展ECC相连。
h3c交换机典型故障归类和排除方法

h3c交换机典型故障归类和排除方法h3c交换机典型故障归类和排除方法一台交换机设备无论性能多么好,都会存在潜在的故障问题,就像人一样,无论多么健康,也总会出现有一些小毛病,能够做到防范于未然当然是好事,但是对于这个作为网络重臣的交换机来说,日夜“操劳”不断,偶尔出现问题也是在所难免的,所以当故障出现了,就要正视故障,及时地解决问题。
尽管交换机的故障多种多样,但是问题的根源就如:“天下武功出少林”一样,万变不离其宗,殊途同归,而且经常出现的也就这么几种,下面为大家归纳了几类典型的故障及其解决方法,读者也大可以触类旁通,举一反三,希望对交换机的日常故障处理工作有所帮助。
1.电源故障故障现象:开启交换机后,交换机没有正常运作,而且发现面板上的POWER指示灯并没有亮,而且风扇也不转动。
故障原因:这种故障通常是由于外部供电环境的不稳定,或者是电源线路老化,又或者是由于遭受雷击等而导致电源损坏或者风扇停止,从而导致交换机不能正常工作。
还有可能是由于电源缘故而导致交换机机内的其他部件坏的损坏。
解决方法:这类问题很容易发现也很容易解决,当发生这种故障时,首先检查电源系统,看看供电插座有没有电流,电压是否正常。
要是供电正常的话,那就要检查电源线是否有所损坏,有没有松动等,若电源线损坏的话就更换一条,松动了的话就重新插好。
如果问题还没有解决,那问题就应该落在交换机的电源或者是机内的其他部件损坏了。
预防方法也比较简单,首先要做的就是保证外部供电环境的稳定,这可以通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压象。
可能的话,建议最好配置UPS系统(不间断电源)。
还有的就是采取必要的避雷措施,以防雷电对交换机造成的损害。
2.电路板故障故障现象:有一个电脑室经常出现一部分电脑不能访问服务器的现象。
一开始以为是网络布线不规范和网卡设置被学生修改了,所以机房管理员经常对网线进行测试和重新设置系统的网络配置。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
华为交换机故障排查案例
华为交换机是一种常见的网络设备,用于在计算机网络中传输数据。
然而,由于各种原因,交换机可能会出现故障,导致网络中断或性能下降。
下面列举了一些华为交换机故障排查案例,希望能对读者有所帮助。
1. 网络中断:当网络中断时,首先要检查交换机的电源是否正常,以及是否有任何硬件故障。
如果电源和硬件都正常,则可能是由于配置错误或软件问题导致的。
此时,可以通过查看交换机日志来查找问题,并尝试重新配置交换机。
2. 性能下降:如果网络性能下降,可能是由于交换机的负载过高或网络拓扑不合理导致的。
可以通过查看交换机的流量统计信息来确定是否存在负载过高的情况,并尝试优化网络拓扑以提高性能。
3. VLAN故障:VLAN是一种逻辑分区技术,用于将交换机划分为多个虚拟局域网。
如果VLAN无法正常工作,可能是由于交换机端口配置错误或VLAN故障引起的。
可以通过检查端口配置和VLAN设置来解决问题。
4. STP故障:STP(Spanning Tree Protocol)是一种用于防止网络环路的协议。
如果STP无法正常工作,可能会导致网络中断或性能下降。
可以通过查看交换机的STP配置和状态来确定是否存在STP故障,并尝试重新配置或调整STP参数。
5. 电力故障:如果交换机无法正常供电,可能会导致整个网络中断。
可以通过检查交换机电源和电缆连接来确定是否存在电力故障,并尝试修复或更换故障设备。
6. 网络攻击:如果交换机遭受网络攻击,可能会导致网络中断或性能下降。
可以通过检查交换机的安全配置和日志来确定是否受到攻击,并尝试加强安全措施以防止类似攻击再次发生。
7. 端口故障:如果交换机端口无法正常工作,可能会导致网络中断或性能下降。
可以通过检查端口状态和配置来确定是否存在端口故障,并尝试重新配置或更换故障端口。
8. 路由故障:如果交换机无法正确路由数据包,可能会导致网络中断或性能下降。
可以通过检查交换机的路由表和路由配置来确定是否存在路由故障,并尝试重新配置或调整路由参数。
9. QoS故障:QoS(Quality of Service)是一种用于优化网络性能的技术。
如果QoS无法正常工作,可能会导致网络中断或性能下降。
可以通过检查交换机的QoS配置和统计信息来确定是否存在QoS故障,并尝试重新配置或调整QoS参数。
10. 软件故障:如果交换机的软件出现问题,可能会导致各种故障。
可以通过升级或重新安装交换机的软件来解决问题。
在进行软件升级或重新安装之前,建议先备份交换机的配置和数据,以防止数据
丢失。
以上是一些常见的华为交换机故障排查案例,希望能对读者有所帮助。
在排查故障时,建议先确定故障的范围和影响,并采取逐步排除的方法,逐步缩小问题的范围,最终找到并解决问题。
同时,也建议及时备份交换机的配置和数据,以便在解决问题时能够恢复到正常状态。