最全的网络故障案例分析及解决方案
04WLAN维护案例集

案例4:AP版本过低。2011年10月,临沭县府第四家属院用户反映,该 热点存在5#楼全楼无信号现象。 问题处理: 首先排除了AP掉线问题。在现场测试发现,应用PING AP的ip地址 存无法PING通,登陆AC后用iwconfig命令发现该AP下发配置存在问题。 再次查询版本后,发现该AP软件版本过于老旧。 解决方案: 夜间对无信号的AP进行升级工作,问题得以解决。
案例1 沂蒙学院信号强度良好,但用户反映网速慢(有信号网速慢) 处理过程:用户反映后首先想到就是设备问题,现问大唐查了下设备的情况, 得知设备没有出现故障后,到现场测试信号强度,发现信号强度也良好,有 自己测了下下载速度,确实很慢,继而又发现有很多信号强度良好的AP都使 用同一信道,改掉信道后下载速度明显加快。 故障分析:AP一般使用1 ,6 ,11这三个信道,因为信道相隔超过5个才可以 达到相互之间不干扰,所以在处理下载速度慢时可以考虑是否是因为同频干 扰引起,此外做工程的时候AP信道划分也还是很有必要的。
案例3 用户投诉wlan信号良好但无法上网(有信号,无法上网) 处理过程:查看用户设置发现用户使用了上网助手的窗口拦截功能,导 致portal页面不能弹出。停用上网助手的窗口拦截功能,重新连接任意网 址,成功弹出portal页面 故障处理完成。 故障分析:远程查看AP连接状态,结果正常,排除传输问题 在机房热点做测试,发现可以正常使用,排除与3A服务器IP连接故障 我方现场维护人员发现用户终端可成功获取地址,只是不能出现portal页 面,无法输入认证信息,导致无法上网判断为用户终端问题。 案例4 一台AP关联下下的WLAN用户上网经常掉线(经常掉线) 处理过程:通过对干扰源的工作频段的研究,将AP的工作频段进行修改从 而消除干扰源对AP的近频干扰。当然当这种修改时也要对与该AP临近的其 他AP的工作频率进行更改,从而消除由于AP频段改变带来的临近AP的近频 干扰 故障分析:检查掉线的用户所在的位置到AP之间是否存在阻隔物,导致AP 信号无法对这些位置上的用户进行覆盖。通过现场调查发现即使坐距离AP 很近位置上的用户也存在掉线的问题,并且这些位置的用户与AP没有发现 任何阻隔物。 检查AP的周边环境是否存在较强的干扰源,导致AP所工作的频段受到干扰, 造成网卡不定期的与AP断开连接。通过观察我现当前台的音箱声音开大时 用户的掉线频率就会变的更为频繁,至此定位,由于AP工作能频段受到干 扰导致WLAN用户掉线
常见网络故障的检测与排除方法

在修复后,需要验证故障是否已完全排除,网络是否恢复正常。
预防措施
针对此次故障,制定相应的预防措施,以避免类似问题的再次发生。
04 案例分析
案例一:网络连接故障
总结词:网络连接故障通常表现为无法访问互 联网或无法连接到特定网站。
01
1. 检查网络连接设备是否正常工作,如路 由器、调制解调器等。
• 网线故障
网线断裂、水晶头松动或损坏。
• 网卡故障
计算机网卡出现故障,导致无法正常连接网络。
软件故障
总结词
软件故障通常涉及到操作系统、网络协议、 驱动程序等方面的问题。
• 操作系统故障
由于操作系统崩溃或配置错误导致网络连接 中断。
• 网络协议故障
网络协议配置错误或协议栈异常。
• 驱动程序故障
网卡驱动程序不兼容或缺失,导致无法正常 连接网络。
Wireshark
一款流行的网络协议分析器,可以捕获数据包 并进行分析,帮助用户诊断网络问题。
Network Scanner
用于扫描网络上主机的端口和服务,检测开放 的端口和服务,可能存在的安全风险。
MTR (My Traceroute)
结合了ping和traceroute的功能,提供详细的路径分析和报告。
03 常见故障排除步骤
故障定位
01
确定故障范围
首先需要确定故障影响的范围, 是局部还是全局,以便于缩小排 查范围。
收集信息
02
03
分析故障现象
查看网络设备的日志、告警信息, 以及用户反馈的问题现象,有助 于快速定位故障原因。
根据收集到的信息,分析故障的 表现和影响,以便于定位故障点。
故障隔离
网络安全案例分析

前言随着网络时代的发展,现在生活离不开网络,业务往来需要网络、日常生活也需要网络、现在还有网上购物等等。
网络给大家带来了方便快捷的服务,也给商家们带来不少的利益。
但是随着网络面的不断扩大也给人们带来不少的坏处,例如:网络欺诈,传播不良信息,网游,严重影响人们的日常生活。
网络犹如一把“双刃剑”,有利即有弊,但是只要正确的利用网络我相信它会给人们带来很大的好处。
现在无论什么地方都遍布在网络中,网络无处不在。
现在学校里也都用电脑教学,就连小学生也对电脑了如指掌,也导致了现在小学生沉迷于网络游戏的越爱越多,给家长带来了很大的困扰。
作为网络管理部门,应该对网吧进行严格排查,必须持身份证进入网吧,如有未成年人则对网吧管理人员进行处罚,同时对未成年人进行知识教育,要明白自身的使命同时让他明白网游的危害。
我们都知道数据传输是通过很多设备的,在这期间可以对其进行一些命令的删减,还有个网站的搜索以及传播的内容进行查看,以免传播不良信息对未成年人造成危害,同时对带宽进行控制,控制流量。
每天规定上网时间,到晚上一定的时间就断网断电,保障学生的睡眠。
其次,就是网络诈骗还有一些恶意网页。
一部分是学生自身的知识以及一些安全意识,防止上当受骗。
其次,网络管理员需要用访问控制技术、防火墙技术、漏洞扫描技术、入侵检测技术等,来控制恶意网页传播,以免病毒入侵电脑,造成用户的数据丢失或者泄密,给用户的财产安全一定的保障!网络就是一个虚拟的大世界,在这个世界里有形形色色的人,网络管理员相当于警察,传播不良信息的人相当于现在那些违法乱纪的人,但是在这个虚拟世界里还没有成文的“法律”,因而造成了现在的要大家意识到网络安全是多么重要。
目录一公司简介 (1)二网络需求分析 (3)三网络体系架构 (5)四网络安全体系架构 (6)五安全产品选型 (8)六安全策略制定 (13)七产品配置 (14)八总结 (13)一公司简介华为技术有限公司是一家生产销售通信设备的民营通信科技公司,总部位于中国广东省深圳市龙岗区坂田华为基地。
室分RRU反向链路RSSI高告警问题解决案例

室分RRU反向链路RSSI高告警问题解决案例张海成滨海分公司无线网络优化中心摘要:滨海体育馆RSSI异常,排除干扰、设备自身等问题,通过仪器及经验的进一步排查,最后认定天馈系统部分无源器件损坏,最终通过更换器件得以解决。
通过对这个案例的描述,了解排除室内分布反向链路RSSI告警的大致方式。
1、问题描述某日滨海体育馆反向链路RSSI高告警,到现场测试后发现,手机RX正常,TX值偏高,有掉话现象,在靠近天线的区域能正常呼出呼入,但TX值最高可达+20dbm左右,在RX值为-70 dbm左右区域,手机正常呼入呼出较为困难。
2、问题分析室内分布RSSI高告警可能由以下几种问题导致:1、网管配置管理RSSI告警门限设置不正确。
2、存在外界干扰、导频污染。
3、室内天馈系统出现损害。
4、RRU出现故障。
3、解决方案首先查看网管配置数据,RSSI告警门限为-90dbm,RSSI告警恢复门限为-95dbm,配置正确。
针对导致该告警的各种原因,到现场进行逐一分析和查看,首先进行故障定位:1、关闭RRU电源,重新启动RRU,待RRU恢复后,故障依旧存在,可初步判断RRU 自身运行无问题。
2、用驻波仪测试天馈系统主干及平层的驻波,发现天馈驻波比在正常的范围内,证明天馈系统驻波无问题。
3、因为楼层比较少,并且主干部分的器件和接头不是很多,所以排除主干故障比较容易,于是把主干上的所有接头都重新做了一遍,同时更换了器件,但故障依旧存在。
4、一般情况下,通过以上步骤的排查,基本可以定位故障,可此故障依然没找出原因,只能对每个平层进行查看排除。
首先用一个大功率负载,把三层天馈系统堵起来(这样相当于第三层不存在),发现故障依旧存在;然后恢复三层天馈系统,再堵二层天馈系统,故障仍然存在;最后把一楼天馈系统堵起来,发现故障消失,证明一层天馈系统肯定有问题。
问题终于发现,故障总算开始定位,为解决这个平层故障,做了以下步骤:1、用驻波仪再次测试平层驻波,发现驻波相当好,一般来说,RRU反向RSSI高最直接的原因就是由于驻波高造成的,但现在驻波这么好,反向RSSI却非常高,感到非常棘手。
中国电信XXX分公司2024年提升网络健壮性双物理路由上联整治案例分享

中国电信的XXX分公司在2024年提升网络健壮性方面采取了双物理路由上联整治的措施。
下面将介绍这个案例的具体情况和实施过程。
该分公司是一家较大的电信运营商,为了提升网络的稳定性和可靠性,决定对网络的双物理路由上联进行整治,以减少网络故障和停机时间,提高用户体验。
首先,该分公司对网络设备进行了全面的评估和优化。
他们对现有的网络设备进行了细致的分析,找出了存在的问题和隐患。
然后,针对问题设备,他们进行了硬件和软件的升级,以确保设备能够满足高负载和稳定运行的要求。
其次,该公司进行了网络架构的改进和优化。
他们对网络的拓扑结构进行了重新设计,采用了多个物理路由上联的方式。
这样可以将流量分散到不同的路径上,减少单点故障的风险。
同时,他们采用了冗余备份的策略,即备份路由器的冗余设备,一旦主路由发生故障,备份路由会自动接管,保证网络的连续性。
第三,该公司建立了强大的监控和管理系统。
他们使用了专业的网络管理软件,对网络设备进行实时监控,并及时发现和解决潜在问题。
监控系统还能够生成报警信息,提醒管理员及时采取措施。
此外,他们还建立了完善的故障处理机制,指定了专门的工作人员负责处理网络故障,确保故障能够快速解决,减少停机时间。
最后,该公司进行了全面的测试和演练。
他们在实施整治之前对方案进行了充分的测试,验证了网络的稳定性和可靠性。
此外,他们还组织了定期的演练,让工作人员熟悉应急处理流程,提高了应对网络故障的能力。
通过这些措施的实施,该分公司成功提升了网络的健壮性。
2024年期间,他们的网络故障率明显降低,用户的投诉量也大幅减少。
在此基础上,他们还进一步优化和提升了网络的性能,提供了更好的服务。
总之,中国电信的XXX分公司在2024年通过双物理路由上联整治,提升了网络的健壮性。
他们通过对设备的优化和升级、网络架构的改进和优化、建立强大的监控和管理系统以及测试和演练等措施,成功降低了网络故障率,提高了用户的满意度。
这个案例为其他电信运营商在网络提升方面提供了借鉴和参考。
宽带故障案例

排查过程:按照系统给出的错误代码,可以得 知这是ADSL宽带用户名或密码错误引发的故障。按 照错误代码提示,找宽带客户服务中心重新设臵了 ADSL密码之后,故障仍然没有解决,这证明ADSL 帐号和密码存在异常问题。
17
分析和处臵:通常情况下,引起ADSL帐号和密码异常的情况主要有以下 几个:① 帐号被锁定;② 用户名和密码错误;③ 帐号被盗用。当ADSL拨号 出现678的错误代码时,要根据情况分析一下到底是什么原因导致宽带无法成 功连接。找宽带客服重新设臵了密码之后,故障仍然没有解决,故障的真正原 因只能是帐号被盗用或帐号被锁定。由于本地的ADSL帐号和固定电话已经做 了捆绑,看来,故障原因只能是ADSL帐号被锁定了。重新找宽带客服,将帐 号解锁之后,故障解除。
13
分析:出现这种情况的主要原因是用户MODEM坏造成 MODEM内部有环路,原在机房测试好的端口一旦接入外线, MODEM的内部环路又再次使AD端口自动关闭。
故障判断要点:对于这类故障,首先要判明ADSL 网络自 身是否存在故障。其次检查用户的电脑软硬件系统搭配是否得 当,软件系统是否有问题。第三要了解用户的使用习惯,给用 户合理的解释,指导用户正确地使用,如正确选择游戏服务器。
7
出现以上现象的电脑首先要建议用户进行杀毒处理,但是由于目前杀毒 软件对很多病毒无法安全消除,通常会采用隔离或删除感染了病毒的文件的 做法来控制病毒的危害,因此,杀毒有可能会造成电脑操作系统的崩溃。鉴 于此,装维人员在遇见这类故障时,应建议用户自已杀毒或请专业化的公司 来进行杀毒处理,不要动手帮助用户杀毒,以避免发生纠纷。 另外的一个问题,也是我们在排除故障时应注意的,即电脑硬件系统和 软件系统的搭配不当,将严重影响电脑的运行速度,正确的搭配建议如下:
中国移动PON网络应用故障案例库
中国移动PON网络应用故障案例库中国移动通信集团北京有限公司2011年2月目录1.项目概述 (3)1.1.背景和意义 (3)1.2.研究内容 (3)1.3.编制依据 (3)2.PON网络故障点分析 (3)2.1.PON网络结构 (3)2.2.PON网络常见故障分析 (4)2.2.1.光网络层常见故障 (4)2.2.2.业务应用层常见故障 (5)2.2.3.其他常见故障 (5)3.PON网络应用问题案例分析 (5)3.1.光网络层故障案例 (5)3.1.1.传输距离超过20km (5)3.1.2.PON链路光功率衰耗过小 (6)3.1.3.PON链路光功率衰耗过大 (7)3.1.4.光纤接头不匹配导致ONT无法注册 (7)3.1.5.光纤链路性能恶化引发误码丢包 (8)3.1.6.异常发光ONU导致同PON口下所有ONU业务异常 (8)3.1.7.SDH光端机误接入PON网络导致多个ONU业务异常 (8)3.1.8.上联光口单纤中断导致业务中断 (9)3.1.9.设备与交换机两端光模块配置错误导致链路异 (9)3.1.10.上行设备光模块问题导致组播节目不流畅 (10)3.2.业务应用层故障案例 (11)3.2.1.ONU掉电重启后业务配置下发丢失 (11)3.2.2.业务配置模板与ONU设备类型不兼容 (11)3.2.3.流量模板中设置的业务流下行速率值较小导致机顶盒下载节目列表慢 (11)3.2.4.PC MAC地址重复导致PPP拨号失败 (11)3.2.5.电话打不通但能上网 (11)3.2.6.OLT与BRAS之间双路由引起的宽带拨号业务676故障 (11)3.2.7.SN相同导致ONT无法注册 (11)3.2.8.OLT与ONU之间双路由保护出现ONU离线问题 (11)3.2.9.OLT上联接口VLAN配置与BRAS VLAN配置不匹配导致业务中断 (11)3.2.10.网关地址冲突造成上网业务全部中断 (11)3.2.11.设备网线类型设置为AUTO导致与传输对接不成功 (11)3.2.12.组播流TTL值设置不当导致用户无法收看节目常 (11)3.2.13.用户点播节目一段时间后画面停止 (11)3.2.14.未配置Hostip导致用户不能点播节目 (11)3.2.15.未配置Fast leave导致用户下载速率慢 (11)3.2.16.QoS配置不合理导致V oIP业务质量较差 (11)3.2.17.错误配置导致DHCP拨号不成功 (11)3.2.18.ACL配置不合理导致专线用户不能上网 (11)3.2.19.设备没有转发未知多播报文导致下挂路由器建立OSPF路由失败 (11)3.2.20.上级设备开启广播抑制功能导致级联的设备下用户拨号困难 (11)3.2.21.BRAS侧数据配置问题导致OLT接入的拨号用户无法正常上网 (11)3.2.22.拨号用户提示721错误 (11)3.2.23.E1映射到T-CONT中带宽配置不当引起丢包 (11)3.2.24.远程升级ONU软件版本失败 (11)3.2.25.OLT工作在IGMP Proxy模式下IGMP协议版本互通故障 (11)3.2.26.V oIP语音质量问题 (11)3.2.27.V oIP话机摘机忙音故障 (11)3.2.28.ONU上配置了管理地址导致从OLT下发IP失败 (11)3.2.29.ARP映射不匹配导致无法从维护网口登录ONU设备 (12)3.2.30.ONU由于H.248接口没有正常注册无法进行数据保存 (12)3.2.31.MA5616开启环路检测导致用户端口自动关闭 (12)3.2.32.OLT与对端设备的链路聚合配置不一致导致用户有时打不开网页 (12)3.2.33.ONU上配置的广播域太多导致PC经常无法获取DHCP分配的地址 (12)3.2.34.ONU设备用户VLAN和组播VLAN不同导致组播不通 (12)3.2.35.OLT的PON口有组播带宽限制导致新加入的节目无法播放 (12)3.2.36.承载组播方式工作的私有协议的二层透传业务专线的配置问题 (12)3.2.37.承载RIP协议的二层透传业务专线的配置问题 (12)3.2.38.MA5616下挂公话只能接不能打的问题 (12)3.2.39.MA5620E软交换功能故障 (12)3.2.40.MAC地址老化时间过短导致OLT下挂UA5000的VOD组播用户花屏 (12)3.2.41.不同组播IP映射到相同的组播MAC导致某组播频道节目卡 (12)3.2.42.OLT与交换机LACP配置问题导致对接不成功 (12)3.2.43.POTS配置冗余导致语音业务闪断 (12)3.2.44.IMS未配置号码属性支持T38导致ONT上传真业务故障 (12)3.2.45.ONU拨号后要等4-5s才出现回铃音的情况故障 (12)3.2.46.ONU 体彩、福彩掉线故障 (12)3.2.47.ONU设备开通呼叫转接引起的故障 (12)3.2.48.BRAS负载过大导致IPTV节目故障 (17)3.2.49.ONU发传真故障 (17)3.2.50.ONU宽带拨号678故障的分析 (17)3.2.51.ONU下挂无线AP电脑无法获取IP 问题的故障分析 (17)3.2.52.丢失关键包导致语音断话故障 (17)3.2.53.MGC链接断开告警频现的故障 (17)3.2.54.无回铃音故障处理 (17)3.2.55.拨号数图格式问题导致二次拨号故障 (17)3.2.56.语音业务通信中断后,不能自动注册 (17)3.2.57.ONU下联设备ARP攻击导致同一PON口下所有用户pppoe拨号678故障 (17)3.2.58.IPTV业务HTTP页面失败故障 (17)3.2.59.三方通话问题处理 (17)3.3.其他故障案例 (17)3.3.1.单路电源功率不足导致设备频繁重启 (17)3.3.2.电压不稳定导致ONU反复上下线 (18)3.3.3.板卡温度异常引起ONU不能同步 (18)3.3.4.OLT机框内单板之间软件版本不匹配导致的故障 (19)3.3.5.备用主控板无法正常启动 (19)3.3.6.电磁干扰引起上联口时通时断问题 (20)4.PON网络运维建议 (21)4.1.光网络层故障排查方法 (21)4.1.1.在线测试和诊断 (21)4.1.2.离线测试和诊断 (22)4.1.3.PON光链路自动测试和诊断系统 (22)4.2.业务应用层故障排查建议 (23)1. 项目概述1.1 背景和意义随着网络演进和业务发展的需要,中国移动正进入全业务宽带网络的发展阶段,PON 设备以其高带宽、长距离传输、全业务接入能力成为实现FTTx 的主流技术,因此是今后中国移动全业务宽带网络发展战略中不可缺少的技术实现手段。
EPON常见故障处理流程和案例
这类故障通常表现为数据传输过程中出现错误或丢包现象,可能是由于ONU的MAC地址未正确配置 、VLAN划分不正确、环路未正确配置等原因。
协议相关故障
总结词
协议相关故障通常表现为EPON系统无法正常通信,可能是由于协议栈配置错误、协议 参数不匹配等原因。
详细描述
这类故障通常表现为EPON系统无法正常通信,可能是由于OLT和ONU之间的协议栈配 置不正确、协议参数不匹配等原因。
故障恢复
修复故障
根据故障隔离的结果,修复有问题的设备或线 缆。
验证恢复
重启相关设备,观察设备指示灯状态和网络连 通性,验证故障是否已恢复。
预防措施
针对故障原因,采取相应的预防措施,避免类似故障再次发生。
04 EPON故障处理案例分析
案例一:OLT端口故障
要点一
总结词
OLT端口故障通常表现为上联网络中断,故障端口下挂接 的ONU无法注册。
EPON常见故障处理流程和案例
contents
目录
• EPON网络概述 • EPON常见故障类型及原因 • EPON故障处理流程 • EPON故障处理案例分析 • 总结与展望
01 EPON网络概述
EPON技术简介
定义
EPON(以太网无源光网络)是一种 基于以太网技术的光纤接入网络,采 用无源光网络(PON)架构,通过单 芯光纤实现数据、语音和视频等多种 业务的接入。
初步排查
02
检查网管系统,查看告警信息和性能统计,分析故障可能的原
因。
现场排查
03
到设备所在现场,检查设备外观、指示灯状态以及线缆连接情
况。
故障隔离
确定故障范围
根据故障定位的结果,将故障隔离到具体的设备 或线缆。
路由器故障典型案例分析
路由器故障1:不堪重负,路由器外网口关闭1、网络环境某单位使用的是Cisco路由器,租用电信30MB做本地接入和l0MB教育网双线路上网,两年来网络运行稳定,路由器也没有发生故障。
随着网络用户数量增加,原来电信30MB已不能满足需要,于是决定租用电信1OOMB来解决带宽问题。
电信采用光纤接入到单位机房后,使用百兆光电转换器经转换后通过双绞线接到路由器外网口上面,该路由器使用是千兆电口作为外网口,由于光电转换器只有1O0MB,该端口连接后速度显示100MB。
2、外网端口流量为零经过几天的运行,管理员发现每天当路由器外网口流量超过50Mbps/s后,该端口就会出现“Receive Errors” ,流量超大,错误信息很多。
突然有一天,出现外网不能上了,Telnet到路由器上面,发现电信对应的外网口没有流量,显示状态为UP,路由器上其他端口工作正常。
第一反映是电信的那边出现问题了,是电话通知电信那边查检一下,对方很快回应说没有什么问题,并询问是否光电转换器死机了。
于是管理员将光电转换器重启后,故障依然。
没有办法,只好将路由器重启一下,故障排除。
谁知,过了不到一个小时,故障又重现。
Telnet到路由器后将该外网口执行shutdown 和undo shutdown后,故障排除。
谁知,将所有有关病毒的安全策略应用到该端口,将tcp mss修改为2048(厂商默认1460),故障依然出现。
3、故障分析管理员发现在故障发生时,CPU显示23%,Memory为33%,不算太高,关键是其他接口都正常工作,看样子问题还是出现在这个端口上面。
可这个端口已用了两年了,升级扩容以前没有出现端口不能正常通讯的情况,端口硬件应该是有什么问题。
通过网管软件对端口关闭前的流量检测,发现该端口关闭前有很大的流量通过(超过80Mbps/s) ,显示端口的错误信息也比较多。
通过分析得知应该是网络流量太大,利用率过高所致。
流量超过80%后,造成端口不能正常。
常见网络故障的检测与排除方法教学课件
03
常见网络故障排除方法
硬件故障排除
总结词
硬件故障通常表现为网络连接不稳定、网速慢或无法连 接网络。
详细描述
检查网络设备(如路由器、交换机、调制解调器等)的 连接是否牢固,确保所有设备都正常工作。如果设备出 现故障,可能需要更换或维修。
详细描述
检查计算机是否正确连接到目标无线网络,并确保无线网 络的SSID、加密方式和密钥正确。同时,检查公司内部 网络的配置,确保计算机的IP地址和子网掩码等设置正确 。
总结词
检查网络设备的配置,确保它们正确配置了IP地址、子网 掩码、默认网关等参数。
详细描述
错误的网络设备配置可能导致无法正常访问网络。检查网 络设备的配置,确保它们符合网络拓扑结构和地址规划。
自动化ห้องสมุดไป่ตู้
自动化技术将进一步提高网络故障检测与排除的效率和准确性,减少故障排查时间,提 高网络可用性。
集成化
未来的网络故障检测与排除系统将更加集成化,能够整合各种网络设备和系统,提供一 体化的故障管理解决方案。
THANKS
感谢观看
总结词
检查网线是否完好,是否有破损或老化现象。
详细描述
网线老化或破损可能导致网络连接不稳定或无法连接网 络。如果发现网线有问题,应立即更换新的网线。
总结词
检查网络设备的电源是否正常。
详细描述
电源故障可能导致设备无法正常工作,进而影响网络连 接。确保所有设备都接通电源,并且电源适配器正常工 作。
软件故障排除
总结词
检查路由器的配置,确保路由表正确无误。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一部:网络经脉篇2[故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2[故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4[故事之三]光纤链路造侵蚀损坏6[故事之四]水晶头损坏引起大型网络故障7[故事之五] 雏菊链效应引起得网络不能进行数据交换9[故事之六]网线制作不标准,引起干扰,发生错误11[故事之七]插头故障13[故事之八]5类线Cat5勉强运行千兆以太网15[故事之九]电缆超长,LAN可用,WAN不可用17[故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21[故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24[故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27[故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29[故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32[故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34[故事之十七]六类线工艺要求高,一次验收合格率仅80%36第二部:网络脏腑篇39[故事之一] 服务器网卡损坏引起广播风暴39[故事之二]交换机软故障:电路板接触不良41[故事之三]防火墙设置错误,合法用户进入受限44[故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47[故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49[故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52[故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54[故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57[故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60[故事之十]PC机网卡故障,攻击服务器,速度下降62[故事之十一]多协议使用,设置不良,服务器超流量工作65[故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67[故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70[故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72第三部:网络免疫篇75[故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75[故事之二]局域网最常见十大错误及解决(转载)78[故事之三] 浅谈局域网故障排除81网络医院的故事时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:12015152)[引言]网络正以空前的速度走进我们每个人的生活。
网络的规模越来越大,结构越来越复杂,新的设备越来越多。
一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病工作的网络也常常给人带来无穷的烦恼甚至是巨大的损失。
网络世界中最忙乱、心里最感底气不足的人恐怕要数网络管理人员和运行维护人员了。
他们时时刻刻都在为他们的网络担心,病毒、黑客、速度变慢、网络崩溃....[小康档案]:三年前负责管理Coneill公司,一家快速成长的公司的网络,曾自认为是NT和Novell、Unix等平台以及Oracle方面的专家,擅长协议分析和网管软件的使用,每天忙于安装设置不断加入网络的设备和系统,应付不断增加的各种意外事件、报警和陷井,处理网络设备经常性的增加、删除、更改和系统设置、连接等方面的故障和问题。
至于如何提高网络的运行效率、如何合理调整网络流量并配置网络设备、如何防止网络问题的发生、如何采用宽带网络设备组网及应用等则基本上无暇顾及。
一年前,小康从网络健康学院毕业后到网络医院就职,负责网络的体检(测试)和故障诊断,专门为哪些网络发生严重问题的“病人”提供帮助。
现在他已经是一位经验丰富的网络健康维护的医生,巡诊故事多多。
第一部:网络经脉篇[故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢[症状]今天是我第一次巡诊,病人抱怨他的大多数站点上网连接速度比系统升级前还慢,有的站点时断时续,有的则根本不能上网。
原来用的是10M以太网,工作非常稳定,性能优良。
升级后全部更换为100M系统,出现上述症状。
用户总数未有增加,也没有启用大型软件或多媒体应用软件。
重装系统软件、应用软件,重新设置服务器和网站,查杀病毒,Reset 所有联网设备均不奏效。
其中,有两台机器换到另一地点后能基本正常工作。
用笔记本连接到这两个不正常链路的集线器端口上网,也能正常工作。
更换这两根网线后现象依旧。
将机器还原到原位置,更换网卡(原卡商标为3COM卡)后恢复正常,不知何故。
由于以太网大多数用户不能工作,只好暂时退回到10M以太网系统。
[诊断过程]从10M系统的网管上观察,网络的平均流量为3%,低于40%,由于未运行大型软件和多媒体软件,应该不会感到任何速度上的“折扣”。
将FLUKE的F683网络测试仪接入Hub端口,测试网络流量为35%。
碰撞率为23%,远远高于5%的健康标准。
报告的错误类型有:延迟碰撞、FCS帧错误、少量本地错误。
基本可以断定是布线系统的严重问题。
遂对线缆进行测试,结果显示除了测试点的两根电缆线外,其余所有布线链路的衰减和近端串扰均不合格,用3类标准测试这些电缆则显示全部合格。
查看线缆外包装上印有Lucent Cat5的字样,可以断定是仿冒产品。
测试两台工作站的链路长度分别为78米和86米,测试其网卡端口,显示网卡发射能力(信号幅度)不足,并且仪器上没有内置的3COM厂商标记显示。
[诊断点评]用3类线外覆5类线产品标记在假冒伪劣产品中为数不少。
用户在10M以太网环境中不会出现应用上的问题,一旦升级到100M环境在只有少数短链路能勉强使用。
对于两台更换地点后能正常工作的网站,查明链路长度只有3米,且为标准的5类线(平时此站点用于临时测试)。
原地点测试长度为45米和37米,由于网卡发射能力弱,信号在100M 系统衰减大,造成上网困难。
改在3米链路连接时,衰减的影响小,故可以正常上网。
网卡测试显示为仿冒卡。
[后记]一个月后,“病人”打电话告述我,重新布线后网络工作完全正常,即使跑一些多媒体软件也丝毫没有停顿的感觉。
不好的消息是,原来的系统集成商已不知去向,无法索赔了。
[故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错[症状]今天的病人是一家著名的证券公司。
上午9:45,用户来电请求紧急救援,说大户室中的一群声称遭受巨额无端损失的愤怒的股民们正聚集在营业部计算中心的机房门前,质问为什么实时交易的动态信息显示屏幕出现大片空白,数据刷新和交易的速度都极慢,且经常中断,根本无法进行交易。
扬言如果不立即恢复交易,将砸掉证券交易所的计算机。
交易大厅的散户门也开始向机房云集,如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个希巴烂。
放下电话直立即直奔该营业部,途中继续用移动电话了解得知,该网络为10M以太网,用户数为230个。
从卫星接收广播的行情数据,并回传交易信息。
由于从卫星接收机监测口观察接收数据完全正常,故网管人员初步判定是网络系统的问题。
两个月前就开始有传输数据错误的现象出现,有时数据更新出现空白,数据更新速度偶尔变慢,有时出现断续。
虽用网管和协议分析仪检查过,但因这种“症状”并不连续出现,且对网络的速度和股民的交易基本没有影响,故一直心存侥幸,没有彻底查找真正的故障根源。
前天参加“第二轮证券系统Y2K统一认证测试”,顺利通过。
利用剩余时间对硬件设备进行了检测和维护,之后进行联网检查,网络表现正常。
不料今天开市就出现严重问题。
[诊断过程]用F683网络测试仪监测网络30秒,观察网络流量为81%(但网管报告为0.2%),错误帧97.6%。
错误类型为Ghosts(占93%)、FCS错误(又称CRC错误)和Jabber,即幻象干扰、帧校验错误和超长帧,这表明网络中有大量的非法数据包存在。
此类症状一般以电磁干扰和接地回路方面的问题居多。
为了确定干扰源的准确位置,将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。
重新打开集线器组电源,用F43电源谐波测试仪观察,发现谐波含量严重超标(最高970mV)。
该网络用一台大型UPS电源给所有网络设备供电,测试UPS输入电源谐波,约为输出电源谐波含量的30%,明显低于输出端的指标,断定为内谐波含量超标。
启动小型备用UPS后,网络恢复正常工作(为减少负荷,网络设备分批轮换接入),但网络测试仪显示仍有错误存在,错误率(幻象干扰)下降为1.3%。
再次关断集线器组的电源,类型为Ghosts的幻象干扰错误率下降为0.8%,证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。
摇动卫星接收机的数据输出电缆,幻象干扰时有时无,拔下电缆则干扰消失。
网管人员回忆前日维护机器时曾动过该电缆。
由此造成连接不良。
为使股民能继续交易,稳定情绪,在更换电缆后又将原UPS启动继续工作提供服务。
收市后再更换大型UPS,故障彻底排除。
[诊断点评]故障原因有二,一是UPS对电源的净化能力下降,网络外谐波容易从电源系统串入网络系统,为重大故障的发生提供了基础,但只是累积的内谐波超标还不足以引发致命问题。
二是接地回路问题,给大量的内谐波串入网络提供了通道。
内谐波是指从电源净化设备的输出端比如UPS的输出端测得的谐波功率,由各种用电设备产生(网络设备绝大多数都采用开关电源,本身就是一个较大的谐波源)。
本案中,大量的内谐波功率叠加后从卫星接收机数据输出电缆串入交易网络,一方面以幻象干扰的形式侵蚀网络带宽(此时网络测试仪监测到的错误类型即为Ghosts),当以太网的网络总流量高于80%时,会导致绝大多数的网络瘫痪;另一方面,串入的内谐波将干扰正常数据传输(与正常的卫星广播数据叠加,表现为FCS帧错误和少量长帧),使卫星接收机接收到的数据出错,显示屏出现大片空白或不能实时更新数据。
本故障为累积故障,两个月前因UPS性能下降就开始出现少量干扰超标,不过这没有引起网管人员的足够重视。
前天维护设备后又增加了电缆接地回路的干扰问题。
但因当时未将卫星接收机连入网络,网管人员仅检查了网络部分的工作状况,所以此时的网络表现肯定是正常的。
直到今天临近股市开市,当接通卫星广播数据的输入通道时,问题才爆发出来。
此时内谐波干扰信号大举入侵网络,几乎造成网络瘫痪。
关断集线器组电源,内谐波总功率下降,干扰信号强度减弱,错误率自然有所下降。
更换UPS电源后,错误率大幅下降(理论上应降为零)。
但因接地回路问题使50Hz电源及其高次谐波感应信号仍能进入网络形成较小数量的错误帧。