13-以太网故障定位-20031225

合集下载

以太网故障处理

以太网故障处理
. .
VLAN 1 2 2
. .
已知单播:在相应的端口转发 未知单播:在同一VLAN内所有端口广播 广播:在同一VLAN内所有端口广播 组播:根据动态或是静态的组播表进行部分端口转发 典型案例:


以太网环路对业务的影响
组播报文的抑制方式
HUAWEI Confidential Page 17
以太网基础知识回顾
数据通信分层结构在网络设备上的体现 网络中的每个设备不需要支持数据通信都每一个层次.通过处理自己支持的层 次的PDU封装,实现网络设备的互通互联 ,比如数据特性单板支持处理数据链路 层的PDU封装,以后可能也可以支持网络层的PDU封装.
应用层 传输层 网络层 数据链路层 以太网物理层 网络层 数据链路层 以太网物理层 SDH层 数据链路层 SDH层 以太网物理层
VLAN 101 VLAN 102
MAC
单板
同享带宽以太网透传业务
单板
HUAWEI TECHNOLOGIES CO., LTD.
HUAWEI Confidential
Page 12
以太网基础知识回顾
EOS的组网应用- EPL业务
VLAN 13 VLAN 11 VLAN 12 VLAN 10 MAC

同步&异步
SDH 传输依靠时隙作为寻址手段 , 要求同一连接的数据必须周 期性出现,全网严格同步;数据通信利用PDU封装携带寻址信息, 不需要同一连接的数据周期性出现;

帧长度固定&变长 SDH 帧字节数为固定长度和固定格式 ;而数据通信根据功能和 层次不同,其帧结构在一定范围里变化.
HUAWEI TECHNOLOGIES CO., LTD.
典型案例 :对接以太网端口 ,一端是非协商模式 ,一端是自协商模式时 ,自协商 工作模式将是错误的.影响网络正常使用.

以太网故障排查

以太网故障排查

据经验发现大多数网络故障是与硬件有关的:比如电缆、中继器、Hub、Switch和网卡等。

本文描述了以太网典型故障的查找过程。

一、故障查找的一般规则以太网的故障查找可分为5个步骤:1.收集所有可以收集到的有价值的信息,分析故障的现象。

2.将故障定位到某一特定的网段,或者是单一独立功能组(模块),也可以是某一用户。

3.确认是特定的硬件故障还是软件故障。

4.定位与修复故障。

5.验证故障的排除。

一般来说,最好的办法是先把故障细分或隔离在一个小的功能段上,即首先排除最大的简单段,从任何一个方便的、靠近问题的站点入手,利用二分法隔离故障,再继续使用二分法直至把故障划分到最小的单位。

网管人员不要过多指望用户会给出完整准确的情况描述,最好由自己来确认一下。

当然也可以让用户演示所发现的问题。

由于网络故障带来的压力和混乱,人们经常忽略一些细节问题。

如果某个部件出了问题,最好不要立即去替换它,除非能肯定故障的来源。

二、故障查找应注意的事项由于以太网采用通用总线拓扑结构以及物理层可扩展的潜在问题,所以某个特定物理层的问题会以不同的方式显示出来,而且由于采用的测试手段、位置和环境不同,显示出的现象还常常有矛盾。

为了避免被假象误导,推荐两个故障查找的步骤:1.沿网段多做几次测试如果故障现象随测试点的不同还保持一样的话,就可以依照所测试出的故障现象去排除。

如果故障现象在一些或所有的测试点都不相同的话,就要把查找故障的方向定在物理层(除非有特别提示),例如去查找坏的电缆、噪声环境、接地循环等故障。

2.要提高测试质量,在测试的同时要把测试仪器设置成至少可同时发送较低的流量。

由于增加了网络流量,微小的和间歇性的物理层问题会被暴露出来。

三、典型的网络故障故障1、不能访问服务器或某项服务在这里设定服务器或某项服务以前是正常的,并且已经做过如下的工作:重新冷启动PC机(热启动不能复位全部的适配卡)。

确认PC机没有本身的硬件故障。

确认所有的网络电缆都连接正确。

02-以太网故障查询、定位方法小结

02-以太网故障查询、定位方法小结

02-以太⽹故障查询、定位⽅法⼩结以太⽹数据板的相关查询和定位(SS61ET1)我们希望各位能熟悉下⾯的相关内容,但本资料的⽂档结构顺序并不代表处理实际问题所应遵循的排查流程,因为故障类型多样,需要排查点多不相同,所以,希望通过本资料能给⼤家⼀个⽐较清晰的思路,同时在处理实际问题的时候结合相关的各种命令和⼿段来综合的处理,有关的故障处理流程请参考相关资料。

本资料虽然⼤多数命令是针对SS61ET1单板的,不过⽬前在⽤的⼤多数以太单板、业务相关故障都可参考本资料的⼤部分故障排查、处理思路。

原理都是相通的。

同时,也希望⼤家在了解本资料的同时能充分思考,结合各⾃⼯作中的实际情况不断的提出需求和指正,使本资料不断完善、充实、内容准确,从⽽能更好的帮助、指导我们的⼯作,更好的提⾼⽤户的满意度。

⼀.故障定位发⽣事故时该查询哪些数据,⼀直是困扰以太⽹板维护的⼀个问题,这⾥总结了⼀些常⽤的定位⽅法和查询命令,及其含义的注解,希望对以后的维护⼯作有所帮助。

与SDH故障定位思路⼀样,以太⽹故障定位也遵循“先外部、再内部;先软件、再硬件;先单板、再系统”的原则,充分利⽤性能事件、环回、测试帧等技术⼿段,结合⼯具软件、测试仪表进⾏有计划有步骤的定位。

⾸先需要对于事故做⼀下初步的定位,⾸先排除SDH层⾯的问题,通过查询相关的告警和性能,确认SDH层⾯没问题后,转⼊以太⽹层⾯的定位。

对于以太⽹业务的故障定位,还是⾸先检查有⽆和ET1板相关的告警,主要集中在⼀些低阶的告警。

⽐如BIP-EXEC,TU-LOP,LP-SLM等等。

注意查询时候最好使⽤单板侧的告警查询命令::ptp:bid,16,0如果存在低阶业务告警,可以对SDH层⾯进⾏⼀些相应的检查,否则就需要定位⼀下是否是对接的路由器或者以太⽹交换机的故障造成。

这种定位⽐较困难,⼿段也不多。

环回当然是我们的法宝了,有关环回的⼀些常⽤命令请参见第4节相关内容。

找局⽅数据维护⼈员配合也是很重要的,⼀般多⽤PING+环回⼿段来定位故障点。

宽带网络故障定位指导书

宽带网络故障定位指导书

宽带网络故障定位指导书宽带网络故障定位指导书文档密级:内部公开目录第1章网络故障概述 (1)1.1 常见故障分类 (1)第2章上网速度慢故障分析 (3)2.1 用户客户端问题 (3)2.2 网络服务器(web站点或其他网络服务器)问题 (3)2.3 网络侧具体网络设备问题 (4)2.3.1 案例一:MA5100 ADSL用户反馈上网速度始终很慢,ping 网关时延很大(32字节长度,延时达到50到60ms)。

(5)2.3.2 案例二:MA5200用户上网速度慢的问题一般定位方法 (6)2.4 网络结构问题 (7)2.4.1 带宽分析 (7)2.4.2 案例:不能点拨VOD的问题处理方法 (10)2.4.3 ATM网络问题 (10)2.4.4 以太网络 (14)2.4.5 IP 网络 (15)2.5 网络攻击问题 (17)2.5.1 网络攻击案例一:Radium 8750 DHCP Relay功能失效分析 (17)2.5.2 检测网络攻击手段之一:LANSWITCH端口镜像的应用 (20)第3章用户端口掉线 (23)3.1 ADSL用户掉线 (23)3.2 ADSL用户打游戏“掉线”和“卡壳”问题 (26)第4章数据包丢失 (27)4.1 Ping程序参数说明 (27)4.2 Ping大包不通 (28)4.3 Ping大包丢包 (29)4.4 Ping小包丢包 (29)4.5 Ping包时延过大 (30)4.6 案例:MA5200对IP分片报文重组故障引起丢包的案例分析 (30)第5章其他问题引起的网络故障 (33)5.1 NAT问题 (33)5.1.1 案例一:NAT应用层网关不支持某些协议引起的网络不通问题 (33)5.1.2 案例二:NAT转换时使用IP POOL中不同IP引起的问题 (34)5.1.3 案例三NAT对分片(Fragmentation)IP报文的处理 (34)5.2 没有保存数据,设备重启引起部分用户数据丢失 (35)附录一:通过ACL过滤防范网络攻击 (36)宽带网络故障定位指导书文档密级:内部公开关键词:故障处理宽带产品网络摘要:本文针对宽带网络中常见网络故障现象和故障定位方法进行了描述。

以太网通信中常见故障原因分析

以太网通信中常见故障原因分析

以太网通信中常见故障原因分析摘要:随着社会的不断发展,以太网通信技术逐渐走入历史的舞台。

通过以太网通信技术能够实现生产过程中的合理控制和实时监控。

但是经过调查发现,相比于其他的发达国家,我国的以太网通信发展较晚,相关技术手段尚未完全。

因此,在以太网运用的过程中仍然存在着一些不容忽视的问题,这些问题导致一些常见故障的发生。

本文主要对这些常见故障进行分析,进而提出相应的解决措施,以期能够改变这一现状,从而促进以太网在我国的进一步推广。

关键词:以太网;通信故障;原因一、前言随着社会的不断进步,为了能够对生产过程进行实时的监控与控制,从而保证生产质量,很多企业都利用以太网技术来达到这一目的。

经过调查研究发现,以太网技术在我国的发展起步较晚,因此相关通信技术仍未达到成熟阶段,因此在实际运用过程中,以太网技术经过会出现一些故障,进而导致设备无法正常工作。

为了能够避免这样的问题再次发生,也为了促进以太网技术在我国的进一步发展,本文主要通过分析以太网技术在通信的过程中常见问题,进而提出针对性的解决措施[1]。

二、网络通信设备使用中常遇到的问题(一)不确定性分析众所周知,以太网技术在通信的过程中实际上是利用了网络的共享性,其核心技术主要为CSMAΠ CD,这一种核心技术的工作原理为使用具有冲突检测功能的载波来侦听多路访问。

然而这一核心技术在实际运用的过程中却容易出现这样的问题:由于这一技术在使用时网络内的任何一个站点都需要相同的信道进行输送,如果在这个过程中存在两个及两个以上的站点同时发送信号,那么就会发生信号冲突,进而导致任何一条信号都出现错误,进而影响到通信系统的传输效率。

虽然以太网技术在设置时规定了网络中的站点发生冲突时,需要等待一定的时间间隔就可以再次发送,但是这段时间间隔是随机的,因此无法满足精确时间的通信需求,这就是以太网通信过程中的不确定性。

(二)不可靠性分析以太网技术最初主要运用在较为简单的办公条件下,但是随着以太网技术的不断推广,越来越多的工业企业在通信过程中使用以太网技术来进行信息传输。

Windows 2003 TCPIP故障排除

Windows 2003 TCPIP故障排除

第12章TCP/IP 故障排除在二十世纪九十年代,Microsoft 通过引入完全重写的 TCP/IP 堆栈,开始显著提高Microsoft 网络的可伸缩性。

新的 TPC/IP 堆栈的设计目的是为了采用性能和易管理性方面的很多进展,它是业界标准 TCP/IP 协议的高性能实现。

随着每一代 Microsoft® Windows®的诞生,Microsoft 对 TCP/IP 协议堆栈的实现得到了持续不断的发展,并且会包括增强性能、安全和可靠性的新功能和新服务。

Microsoft®Windows Server™2003 操作系统的 TCP/IP 协议堆栈是可以自行调整的,可伸缩性更强,更易于管理,速度更快,且更安全。

TCP/IP 协议堆栈及其关联服务是默认安装的,而且无法再通过使用“网络连接”功能卸载它们。

像以前版本的 Windows 服务器操作系统一样,这个系统也提供了很多诊断和修复工具,以帮助您快速查明和解决 TCP/IP 通信问题。

除了在以前版本的 Windows 服务器中包括的工具外,增加了新的工具和功能以帮助您解决 TCP/IP 通信问题。

本章讨论 Windows Server 2003 中包括的各种故障排除实用程序和工具,并提供了您可以用来解决 TCP/IP 通信问题的基本结构。

本章内容TCP/IP 通信过程概述 (3)故障排除概述 (10)无法访问主机名或 NetBIOS 名称 (28)IP 路由故障排除 (34)服务故障排除 (40)其他资源 (41)2第 12 章TCP/IP 故障排除本文档包含的信息代表 Microsoft Corporation 在发布之日对所讨论问题的最新观点。

由于 Microsoft 必须对不断变化的市场情况作出反应,因此本文档不应被视为 Microsoft 方面的承诺,而且 Microsoft无法保证所提供的任何信息在出版之日后的准确性。

网络通信模块故障定位手册

网络通信模块故障定位手册1. 前言网络通信模块是现代设备中必不可少的一部分。

无论是家庭智能化设备,还是工业自动化设备,都离不开网络通信模块。

因此,当网络通信模块出现问题时,必须能够快速且准确地找到故障,并进行解决。

本手册旨在帮助用户快速地定位网络通信模块故障,并提供相关解决方案。

2. 故障现象网络通信模块故障可能会出现以下几种现象:1.设备无法连接到网络或者连接的网络速度慢;2.设备连接到网络但是无法与其他设备进行通信;3.设备能够连接到网络和其他设备,但是无法访问互联网;4.网络通信模块的指示灯异常,例如灯一直闪烁或者不亮。

以上现象可能会是网络通信模块故障的表现之一,但这并不意味着出现以上现象就是网络通信模块故障。

出现以上现象时,需要进行故障排查,得出正确的结论。

3. 故障排查首先需要检查网络通信模块的物理连接,包括网线、天线等是否连接良好。

如果网络通信模块的物理连接出现故障,则需要排除物理连接的故障。

如果物理连接的故障已经排除,仍然无法正常连接到网络,则需要进行以下排查:1.检查网络配置是否正确。

检查网络设置是否正确,如IP地址、子网掩码、网关等。

可以使用其他设备连接同一个网络来检查网络配置是否正确;2.检查网络通信模块的软件配置是否正确,例如SSID、密码、安全模式等。

可以通过重置网络通信模块来恢复默认设置;3.重启网络通信模块或其他相关设备。

重启设备以重新连接网络并检查网络通信模块是否正常。

如果仍然无法解决故障,则需要进一步排查。

可以使用其他设备来连接同一个网络,并检查其他设备是否能够正常连接。

如果其他设备也无法正常连接,那么问题可能是网络本身的问题,而不是网络通信模块的故障。

4. 故障解决方案如果经过故障排查后,发现是网络通信模块的故障,则需要进行以下解决方案:1.更换网络通信模块。

如果网络通信模块已经损坏,则需要更换设备并重新配置;2.升级网络通信模块的固件。

有时候网络通信模块的故障是由于固件版本过低或者出现了BUG,需要升级网络通信模块的固件;3.联系售后服务。

判断网络故障的原因及解决方案

判断网络故障的原因及解决方案判断网络故障的原因及解决方案随着我国教育信息化的深入,各高等院校的网络建设发展日趋完善。

经过十余年的建设,高校校园网覆盖面迅速扩大,建设水平逐步提高,应用面不断扩展,如今的校园网已和广大师生的工作、学习和生活紧密联系在一起。

下面是店铺整理的关于判断网络故障的命令及方法,欢迎大家参考!1、整个网络奇怪的不通在实际的故障解决过程中,对于一些较大型的网络还容易出现整个网络不通的奇怪故障。

说它奇怪,是因为所有的现象看起来都正常,指示灯、配置都经过检查了,任何问题都没有,但网络就是不通;而且更另人叫绝的是在不通的过程中偶尔还能有一两台计算机能够间隙性的访问。

其实这就是典型的网络风暴现象,多发生在一些大中型网络中。

既网络中存在着很多病毒,然后彼此之间进行流窜相互感染,由于网络中的计算机比较多,这样数据的传输量很大,直接就占领了端口,使正常的数据也无法传输。

对于这种由病毒引发的网络风暴解决的最直接的办法就是找出风暴的源头,这时只需要在网络中的一台计算机上安装一个防火墙,例如金山网镖,启用防火墙后你就会发现防火墙不停的报警,打开后可以在“安全状态”标签的安全日志中看到防火墙拦截来自同一个IP地址的病毒攻击,这时你只要根据IP地址找出是哪一台计算机,将其与网络断开进行病毒查杀,一般即可解决问题。

小提示:作为网络管理员,即使在正常情况下也有必要安装金山网镖这样的防火墙,找出网络中流串的病毒源头,作出预防,避免危害进一步的扩大。

但是要避免网络风暴最佳的办法还是划分子网和安装网络版杀毒软件。

划分子网,这样每个子网内的计算机比较少,这样病毒即使相互传播,产生的数据量也不大,不会危及整个网络,而安装网络版杀毒软件则可以保持整个网络高速畅通的运转。

2、组策略导致网络不通这种故障主要存在于Windows 2000/XP/2003系统之间,是因为组策略设置了禁止从网络访问。

因此我们可以在“运行”窗口中输入“Gpedit.msc”并回车,在打开的组策略窗口中依次选择“本地计算机策略—计算机配置—Windows设置—安全设置—本地策略—用户权利指派”,然后双击右侧的“拒绝从网络访问这台计算机”,在打开的窗口中将里面的帐户列表选中并删除即可。

第5讲 以太网络故障诊断与排除

第5讲:以太网络故障诊断与排除
本章重点介绍以下内容: ● 以太网络故障诊断概述; ● 以太网络帧校验序列故障诊断与排除; ● 网络性能降低时的诊断与排除; ● 节点失去网络连接时的诊断与排除; ● 以太网中常见的故障诊断与排除; ● 以太网业务维护测试。
5.1 以太网络故障诊断概述
5.1.1 以太网络故障查找的步骤 以太网络故障查找应以确定以太网络的故障点,恢复网络 的正常运行为目的。以太网络的故障查找可分为5个步骤: 1.收集所有可以收集到的有价值的信息,分析故障的现象; 2. 将故障定位到某一特定的网段,或者是单一独立功能组 (模块),也可以是某一用户; 3.确认是特定的硬件故障还是软件故障; 4.定位与修复故障; 5.验证故障的排除, 恢复网络的正常运行。 以太网络故障查找应分网段查找, 先把故障细分或隔离在 一个网段上, 从靠近问题的站点入手,分析用户的情况描 述,确认故障的现象,排除与修复故障。
5.4 节点失去网络连接时的诊断与排除
1. 单个节点失去网络连接 故障原因如下。 (1) MAU的网线或网卡与网络的连接松动或连接失效。 单个节点突然与网络完全失去连接的主要原因如下: MAU连接松动; 连接电缆断开、短路或有噪声干扰; 网卡失效。 此时需检查电缆、接头、网卡是否有问题,在必要时应 予以替换。为了确定故障是否是节点本身,可以用一个 工作正常的节点(如笔记本电脑)完全替换有故障的节点, 如果网络连接恢复正常,则表示故障源在节点内部,否 则表示故障源在网络侧。
3. 网络中的某个网段与其余网段之间失去了路由连接 故障原因: 路由器的端口配置不正确。例如端口没有被激活、端口的运行模式不正 确、连接失效、协议没有被激活或布线错误等。 检查路由器的安装和配置是否正确。 路由器的地址表、映射表或路由表的配置有误。 检查路由器的配置。 路由器的过滤器设置有误。 检查路由器的过滤器设置情况,特别是要检查使用了通配符以及有可能 阻塞备份路由或负载分担路由的过滤项。 与路由器WAN端口相连的WAN链路失效。 检查WAN链路的工作是否正常。 没有设置默认网关。 检查路由器中是否配置了默认网关。 子网掩码配置有误。 全面检查网络文档中有关子网掩码的所有配置情况。 定时器配置有误。 检查路由器中不同协议的定时器参数配置是否正确,并与这些定时器的 默认值相比较,特别是在网络中使用了不同厂商的路由器设备时。

网络故障定位

一般来说,中ARP病毒的主机会一直向网络中发送ARP数据包,交换机上的 ACT指示灯则会频繁闪烁。可以先将此网线拔掉,再查看整个网络情况。
返回
如何检查核心交换机和出口路由器或防火墙
1、查看这些设备的CPU、内存使用情况; 2、查看这些设备的端口、软件配置情况; 3、使用抓包软件查看整个网络中的数据,通过查看这些数
2、线路连接:RJ45模块、RJ45头、网线、光纤等 3、网络设备:交换机、路由器、防火墙,包括软件、配
置和硬件损坏等
四、常用诊断方法
引起网络故障的原因多种多样,但是归纳起 来都属于上面3个范围。如何定位故障点?
方法:望、闻、问、切 望:查看故障表现 闻:是否有设备硬件ቤተ መጻሕፍቲ ባይዱ障产生的气味,比如烧电源 问:询问故障发生时候的相关问题 切:使用工具、软件进行诊断,比如网线测试仪、
据确定是否存在一些网络攻击、冲击波病毒、ARP病毒等 影响网络正常的因素。
返回
激光笔、ping、sniffer、Wireshark等等
五、网络故障定位步骤
1、从故障范围查看
开始
一个电脑 网络故障
接在同一个交 换机上的电脑 都有同样故障
同一个VLAN中 的电脑都有同样 网络故障
全校所有电脑 都有同样网络 故障
1、查看网络属性设置 2、查看系统、防火墙软件 3、查看网线 4、检查网卡 5、重新装系统
网络断 断续续
网络应用 速度缓慢
1、TCP/IP设置
2、交换机或出 口设备的配置等
3、主机上的防 火墙类软件等
1、线路不 稳定
2、ARP病 毒
1、网内数据接近 或者超出超出网 络设备的承受能 力或出口带宽
2、线路问题
3、电信问题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文档密级:内部公开
华为机密,未经许可不得扩散
2
工程师的疑惑
MSTP产品以太网故障定位的难点:
当我们接到用户投诉时,如何迅速完成以下工作 判断是否真的发生了故障 判断故障的严重程度 判定故障界面
定位故障原因
解决之道:知己(MSTP)知彼(数通)
文档密级:内部公开
华为机密,未经许可不得扩散
3
以太网理论基础
文档密级:内部公开
华为机密,未经许可不得扩散
6
网络产品基础
“知彼”的第二项——数通宽带产品知识
产品的功能与分类 了解数通产品的基本功能与分类,掌握与其对接的要点。 常见主流网络产品 了解常见主流数通产品的主要功能与网络地位,学习其 基本的配臵方法。 混合组网与测试 具备根据业务和对接数通设备需要设计MSTP网络的能 力,具备根据对接数通设备特点筹划联合组网测试的能力。 熟悉了宽带产品,才能远离处理对接问题时的尴尬与无奈, 才能底气十足的和C公司的NB工程师交涉,才能让用户用崇拜 的眼光仰视自己……
基于不同平台的单板的共性与特征 封装协议、封装颗粒、接口类型、功能实现、版本特 征、配臵方法…… 单板的性能指标 吞吐量、时延、背靠背和交换容量 单板可支撑故障定位的功能 环回、测试帧、流量统计、黑匣子、SDH类告 警与性能、以太网类告警与性能(RMON) 单板固有缺陷 运行稳定性、软件BUG、批次问题……
文档密级:内部公开
华为机密,未经许可不得扩散
9
以太网性能分析
最直观的定位工具--RMON
处理SDH故障时,我们首先做的就是查告警查性能,同样,处理以太 网故障时,我们第一步也是查清告警和性能。请注意,涵盖SDH侧和 以太网侧。 排除A类告警:Ethlos、AIS、LOP等必然导致业务中断的告警 排除B类告警和性能:B3SD、LPBBE等导致业务丢包 错包 接收 碰撞与延迟 发送 流控 接收 硬件异常
文档密级:内部公开
华为机密,未经许可不得扩散
15
案例分析
准确判断故障(二)
网络割接,次日用户投诉不能上网,QQ、E-mail和WEB全部中断, 但Ping各个门户网站都能通,运营商M检查数通设备一切正常,于是向我 司工程师小A申述传输故障。 小A接到申诉后: 吸取了上次的经验,和用户确认的确能Ping通,于是认为故障在上游数 通环节,与ET1无关,至于为何割接后出现问题那纯属偶然。运营商M也 认为小A有理,又去折腾了半天数通产品还是没搞定,于是又投诉小A说 的确是传输割接引起的故障,要求必须到现场处理。 小A极不情愿但又有点心虚的到了现场: 告警、性能都正常,看不出毛病 Ping的确是通的 PC直连在ET1都不能上网 小A一筹莫展了,咋办呢?可恨用户刁蛮,问题 显然跟传输无关嘛。 问题真的跟传输无关吗?
文档密级:内部公开
华为机密,未经许可不得扩散
11
以太网故障定位方法
故障类型---业务严重受损
判定故障原因是否在MSTP侧
探询故障的触发事件--是否对网络做过操作、发生倒换等 隔离法:两端直接使用PC互Ping 发测试帧:简单实用,但并非所有产品都支持
定位故障点
法宝一:环回--老套路,再熟悉不过的东东了 法宝二:测试帧--不支持咋办啦?不支持那就用法宝三呗。 法宝三:RMON性能统计 套路:从近端开始逐段环回(以太网单板、交叉、线路),每环回一段, 通过测试帧测试是否收、发一致,当收发不一致时,即找到故障所在点。 如产品不支持测试帧功能,则只能利用PC发包,通过单 板端口RMON的收、发包数量是否一致来判断。 “啊哈哈哈哈……这点小问题,轻松搞定!” “STOP!别得意太早,想想还遗漏了什么?”
收、发包数量一致就万事大吉了吗
NO!如果硬件出现故障,有可能会将包随机修改后发送出去, 从而导致实际业务产生大量异常甚至中断。
总结陈词:一般而言,业务出现明显受损的故障
相对容易判定故障界面,同时其定位手段容易流程 化、规则化,加上故障现象较单一,因此定位难度 较低。 提醒:1、正确的配臵是应首先确保的。 2、环回定位手段仅针对以太网透传版本。
文档密级:内部公开
华为机密,未经许可不得扩散
7
工具使用
工欲善其事,必先利其器
工具软件
SERV-U:FTP服务器端软件,可基于WIN98/2000/XP平台,利用 FTP可在一定条件下近似反映出通道带宽。 SNIFFER:简明实用的抓包工具,可基于WIN98/2000/XP平台,处 理疑难杂症时推荐使用,缺点是发包功能较弱。 SolarWinds:功能纷繁复杂,适合数通专业人员使用,附带的Ping 工具功能强大,并可输出log文件,缺点是部分功能不够准确,会对用 户产生误导。
文档密级:内部公开
华为机密,未经许可不得扩散
14
案例分析
准确判断故障
某日,用户投诉不能上网,QQ、E-mail和WEB全部中断,Ping门户 网站都不通,运营商M检查数通设备认为一切正常,于是向我司工程师小 A申述传输故障。 小A接到申诉后: 反映一:心想这下问题大了,啥都干不了,肯定ET1出了大问题。于是 一边打800一边飞奔到现场,手忙脚乱查告警查性能,最后没招了还折腾 着跟小B求援要他到对端接个PC来对Ping一把。 反映二:心想ET1挺稳定的呀,不会这么容易撂担子,用户也动过设备, 肯定是其他哪个疙瘩出茬子了。于是,仔细而冷静的分析了用户的故障现 象,发现用户都是使用域名上网,难道是DNS不正常?那就Ping一下 Internet的某个IP或者Telnet到某个BBS,果然,此时Ping和Telnet都正常, 显然是DNS出了故障。 总结:做为一个网络用户,平日多思考一下网络业务的实现原理和过程, 了解其中关键环节,出现问题时应站在业务的高度来分析,要能看到传输 以外的其他环节。
再内部;先软件、再硬件;先单板、再系统”的原则,充分利用性能 事件、环回、测试帧等技术手段,结合工具软件、测试仪表进行有计 划有步骤的定位。 业务全阻 步骤 业务部分丢包 弄清故障现象 非故障 SDH侧 查询伴随的告警和性能 以太网侧 难点:判定故障界面 MSTP故障 数通产品故障 对接故障
恭喜恭喜:一旦判定了故障界面,则整个定位工作完成了70%
华为机密,未经许可不得扩散
10
发送
重点分析RMON:
文档密级:内部公开
以太网性能分析
RMON分析
A类错包事件(蓝色字体) AlignmentErrors:对齐错误---碰撞引起或硬件故障(对端居多) FCSErrors:CRC校验错---碰撞(全双工VS半双工)、网线质量差或 受到干扰、对端硬件故障 结论:查端口模式、查网线、查对端硬件 B类碰撞相关事件(紫色字体) 结论:1、本端口实际工作在半双工模式,建议调整到全双工模式; 2、CSMA/CD算法所决定,非故障。 C类流控事件(绿色字体) 结论:反映了通道的“拥挤”程度,建议根据需要扩容。 D类硬件异常(红色字体) DropEvents:由于FIFO溢出而导致的丢包 结论:若数量较大,则先硬复位单板,如现象持续,则更换单板。
文档密级:内部公开
华为机密,未经许可不得扩散
16
案例分析
深入理解单板工作原理
小A无奈之下打数通800求援,学到一招:Ping大包。My god!果然 200字节以上的大包都Ping不通,看来问题的确出在传输上。 配臵原因?硬件损坏?版本缺陷? 思路:对于此类问题,首先应从单板的工作原理下手分析,找到导致问 题发生的可能原因,然后逐项排除。 ET1将以太网帧首先拆分成N个64字节的分片,然后轮循放进虚通道绑 定的VC12中传送,对端从相应的VC12中取出完成的分片后再恢复成一个 完整的以太网帧发送出去。 因此,绑定的任意一个VC12出现异常或两端虚通道绑定的VC12没有一 一对应,都会导致业务出现有规律的损伤。 如何定位: 检测配臵是否出现了两端VC12不对应的情况 排除法,减少绑定的VC12(二分法) 总结:1、检查业务Ping要带包长参数,建议包长1500字节 2、要理解单板原理,从原理出发来分析问题
“知己”的第一项——以太网
CSMA/CD 端口工作模式 帧格式 以太网各种错帧 以太网流控 VLAN 何时需要?如何实现?实际效果? 二者有何联系?
三者有何联系?错帧对业务的影响?
功能、实现与 引Βιβλιοθήκη 的问题?文档密级:内部公开
华为机密,未经许可不得扩散
4
以太网特性单板基础
“知己”的第二项——以太网特性单板
文档密级:内部公开
华为机密,未经许可不得扩散
17
案例分析
了解用户业务的特征
某日,用户投诉和公司总部的网络连接异常,网络速度缓慢。运营商已 排除数通设备故障可能,要求小A处理。 端口性能事件中反映收到了较多的超长包,初步怀疑是这些超长包被 丢弃而导致的业务异常,但这些超长包从何而来呢? 咨询运营商数通人员得知:此用户新近开通了VPN业务。 VPN业务需要在用户数据帧的基础上打上MPLS或IP Tunnel标签,因 此会将数据帧加长N个字节,如果用户数据帧较长,则打上VPN标签后会 超过1522字节,而ET1将此类超长帧丢弃。 修改ET1的MTU值即可解决问题。 提醒:目前VPN技术正在逐步向基于MPLS的二层VPN过渡,由于此类 VPN的MPLS标签在以太网帧头之前,老一代以 太网单板(ET1/EGT等)不能识别此类封装格 式会将所有帧丢弃。配合用户开VPN业务时, 一定要了解清楚其VPN的实现方式,并决定是 否需要使用EMS/EFS系列单板。
同SDH相比,以太网特性单板规格更多、配臵和应用更复杂, 只能多花精力来学习和记忆!当然,理解是记忆的基础。
文档密级:内部公开
华为机密,未经许可不得扩散
5
数通理论基础
“知彼”的第一项——数通理论知识
数据通信的发展 了解数据通信技术的发展历史,加深对各项数通技术的理解, 把握数据通信发展的趋势。 高层协议 初步掌握TCP/IP协议族主要内容,了解交换、路由等方面 基础理论知识。 业务内容与实现 了解应用层业务内容与高层协议的关系,了解业务与底层 技术的联系。 根本目的:建立一套系统的数据通信知识体系,并同已有 的传输知识体系有机结合,站在业务的角度、网络的角度来 思考问题、理解网络。
相关文档
最新文档