某电台故障处理报告
收音机电路故障分析及排除方法PPT演示文稿

(4)检修逻辑
21
低频啸叫
啸叫 判断啸叫类型
中频啸叫
高频啸叫
更 换 电是 池
电源电压 正常吗?
否
更换C8
VT2静态工 作点正常
否
调整 VT2偏
吗?
置
VT1静 态工作 点正常
否
调整 VT1 偏置
吗?
正常
接入中和 电容或更 换三极管
正常 减小C2电容量或更换三极管
(1)低频啸叫,故障原因一般是电池电压太低,电源 滤波电容(如C8)失效,退耦电阻(R6)短路,音量 电位器接错而产生正反馈,或输入变压器线头接反。
(2)中频啸叫,C3开路引起啸叫,喇叭会出现“吱吱” 声,调到电台位置附近便发出尖叫;三极管电流放大系 数太大、静态工作点不正常等引起的整个频率段都有的 中频自激啸叫。
1
5.1 常用检查方法
1、直观检查法 通过视觉、听觉、触觉来查找故障部位,这是一种简便有效 的方法。
(1)检查接线,在面包板上接插电路,接错线引起的故障占 很大比例,有时还会损坏器件。如发现电路有故障时,应对 照安装接线图检查电路的接线有无漏线、断线和错线,特别 要注意检查电源线和地线的接线是否正确。为了避免和减少 接线错误,应在课前画出正确的安装接线图。
(1)通断法 用于检查电路中连线是否断路,元器件引脚是 否虚连。要注意检查是否有不允许悬空的输入端 未接入电路,尤其是CMOS电路的任何输入端不 能悬空。一般采用万用表电阻挡R×1或R×10挡进 行测量。
3
(2)测电阻值法 用于检查电路中电阻元件的阻值是否正确;检查 电容器是否断线、击穿和漏电;检查半导体器件 是否击穿、开断及各PN结的正反向电阻是否正常 等。检查二极管和三极管时,一般用万用表的 R×100或R×1K挡进行测量。在检查大容量电容 器(如电解电容器)时,应先用导线将电解电容 的两端短路,泄放掉电容器中的存储电荷后,再 检查电容有没有被击穿或漏电是否严重,否则, 可能会损坏万用表。在测量电阻值时,如果是在 线测试,还应考虑到被测元器件与电路中其它元 器件的等效并联关系,需要准确测量时,元器件 的一端必须与电路断开。
广播电视故障处置预案范文

一、前言为确保广播电视安全播出,提高应对突发故障的能力,保障广大受众收听收看权益,特制定本广播电视故障处置预案。
本预案适用于广播电视系统在运行过程中出现的各类故障,旨在明确故障处置流程、责任分工及应急措施,确保故障得到及时、有效的处理。
二、预案目标1. 确保广播电视安全播出,减少故障对受众的影响。
2. 提高故障处理效率,缩短故障恢复时间。
3. 明确故障处理责任,确保故障处置工作有序进行。
三、组织机构及职责1. 成立广播电视故障处置领导小组,负责统一指挥、协调和监督故障处置工作。
2. 成立故障处理应急小组,负责具体实施故障处理工作。
故障处置领导小组:组长:XX(单位负责人)副组长:XX(技术部门负责人)成员:XX(技术部门人员)、XX(运维部门人员)、XX(安全部门人员)故障处理应急小组:组长:XX(技术部门负责人)副组长:XX(技术部门人员)成员:XX(技术部门人员)、XX(运维部门人员)、XX(安全部门人员)四、故障分类及处置流程1. 故障分类(1)一般故障:影响局部区域或少数受众收听的故障。
(2)重大故障:影响大面积区域或多数受众收听的故障。
(3)紧急故障:可能导致广播电视安全播出风险的故障。
2. 故障处置流程(1)发现故障1)运维人员通过监控平台、现场巡查等方式发现故障。
2)发现故障后,立即向故障处理应急小组报告。
(2)应急响应1)故障处理应急小组接到报告后,立即启动应急预案。
2)应急小组组长根据故障情况,决定是否启动紧急预案。
(3)故障排查1)应急小组组长组织技术人员对故障原因进行排查。
2)根据排查结果,确定故障类型和处理方案。
(4)故障处理1)根据故障类型和处理方案,采取相应措施进行故障处理。
2)故障处理过程中,确保不影响其他系统正常运行。
(5)故障恢复1)故障处理后,进行测试验证,确保故障已得到解决。
2)恢复正常播出。
(6)故障总结1)故障处理后,应急小组组长组织相关人员对故障原因、处理过程进行总结。
广播电视传输设备的故障分析与修复

广播电视传输设备的故障分析与修复随着科技的发展和人们对信息传输的需求不断增加,广播电视传输设备在我们日常生活中扮演着越来越重要的角色。
然而,在使用广播电视传输设备的过程中,我们难免会遇到一些故障问题。
本文将针对广播电视传输设备可能出现的故障进行分析,并提供相应的修复方法。
一、无信号故障及修复方法无信号是广播电视传输设备使用过程中最常见的问题之一。
当我们在电视上看节目或者收听广播时,突然屏幕变黑或者收音机中断,那么很可能是出现了无信号故障。
此时,我们应该采取以下步骤进行修复:1.检查信号线路是否连接稳固。
首先,检查电视天线和电缆线是否与设备连接紧密,避免出现松动造成信号中断的情况。
若发现松动,应重新连接并固定好。
2.调整天线方向和位置。
有时信号中断可能是由于接收天线位置不佳或者方向不正确造成的。
可以尝试稍微调整天线的方向和位置,找到最佳接收效果。
可以借助已有的信号测试工具来判断信号强弱和方向。
3.检查设备设置。
有时信号中断可能是由于设备设置错误导致的。
可以进入电视机导航菜单或者广播设备设置界面,检查信号源是否选择正确,并进行调整。
4.信号增强器安装。
如果以上方法仍然无法解决无信号问题,可以考虑安装信号增强器来增强信号接收能力。
信号增强器可以在电器店购买并安装。
二、图像模糊故障及修复方法图像模糊是广播电视传输设备常见的故障之一。
当我们在电视上收看节目时,发现图像模糊不清,无法清晰辨认,这时就需要采取以下修复方法:1.调整频道和图像比例。
有时图像模糊可能是由于频道信号不稳定或者图像比例设置不当导致。
可以调整频道,寻找信号稳定的频道,并且调整图像比例以适应电视屏幕大小。
2.清洁屏幕。
图像模糊也可能是由于屏幕表面的灰尘和污垢导致的。
可以使用专用的电视屏幕清洁剂和柔软的抹布轻轻擦拭屏幕,保持屏幕清洁。
3.检查信号接口。
有时候图像模糊可能是由于信号接口损坏或者连接不良导致的。
可以检查信号线和接口是否松动或者腐蚀,如果发现问题,重新连接或更换信号线。
广播电视发射机故障监测与处理

广播电视发射机故障监测与处理作为国家的喉舌,广播电视具有其特色。
因而,广播时刻有特定的要求,需要计算在几秒钟内中止广播的时刻。
假如在节目制作到用户接收过程中出现故障而没有及时发现,就会产生一定的问题,因此,这个问题需要实时监控广播和电视发射机故障。
在操控和监测体系中,发射机能否正常工作反映在对于前向功率、反射功率和过电流的监测的具体数值之中。
此三项数值如果没有达到一定的指标,就需要暂时停止广播进而激活备用的发射机,查找存在的具体故障。
因而,对于这三个数字的监测可以说是很重要的。
1广播电视无线发射台站发射机故障监测与处理出现故障的具体现象1:发射机已打开,电源已接通,目标正常。
调制推进,电流正常。
前向功率为 2.6kW,反射功率正常。
发送器出现故障警报,备用发射机激活。
对于存在的故障原因进行剖析:发生该故障的时候,先对于小盒模块进行替换,如果替换之后之前出现的问题依然没有解决,说明该故障的原因是小箱有所损坏。
如果各个指示灯和指示表显示是正常情况,此时的发射机的启动模块也是正常情况下进行的运作,那么该故障出现的原因可能是操控的监控器出现问题。
此时,就需要用正常的代替备用的监测器,来确认是否是监控模块中存在一定的问题。
应用万用表对监测输出的电平进行测试,如果发现前向功率输出电平不正常,正向功率计显现 2.6kW应正常。
相反,怀疑正向功率监测的基准电平是不是存在问题。
对于产生的故障进行的处理:考虑电压由可变电阻RP202进行的设置。
在对于RP202进行测量后,如果没有产生损坏的情况,那么就对于电阻值进行一定的调整,进而使基准的电压恢复到3.7V的预设值,此时的发射机可以恢复正常进行广播。
出现故障的具体现象2:对管理播出的按钮进行关闭操作,此时的广播灯会出现闪烁的状态,如果这个时候的正向入射功率和反射功率显示的是正常的,另一个指示器正常,但发射机在几秒钟内被阻断,备用的发射机被激活。
对于存在的故障原因进行剖析:发射机面板上的所有小盒和监控模块指示器正常显现,无法经过索引查看。
业余电台RST信号报告

稍粗糙略有交流声
5
非常清晰(无背噪无杂音无断续)
5
信号一般
5
比较平衡的音调
6
信号良好
6
平稳较好的音调
7
信号较强
7
接近平稳较好的音调
8
信号很强
8
好的稳定音调
9
信号非常强
9
非常纯正悦耳的音调
↑↑语音通信只报R和S这两种↑↑
↑电报、电传等通信才报T↑
业余电台RST信号报告
信号可辨识度Readability
信号强度Strength
音调报告Tone
1
信号不可辨认
1
信号极其微弱
1
信号非常粗糙
2
信号不易辨认(背噪极强或打重机枪)
2
信号很弱
2
很粗糙不稳定
3
能辨认但困难(背噪较强或开始打机枪)
3
信号弱
3
粗糙不稳定
4
容易
教你如何给出信号报告及电台黑话5篇

教你如何给出信号报告及电台黑话5篇第一篇:教你如何给出信号报告及电台黑话五九要拆开来看,先说那个五吧,前面的这一位数的意思是话音的清楚程度,共分为五级,非常清楚,没有北京,为五.全是噪音,话音无法听清了,为一,比如听对方的声音很清楚,但稍有一点噪音,就应该是4,噪音不小,但听对方说话没问题,就是3,噪音很大,听对方说话困难,就是2,这东西没有表能显示出来,要通过感觉来给出.可以参考代表话音的清晰程度,共分为5级: 5=信号完全清晰,没有任何背景噪音4=信号清晰,话音可以完全抄收,但是有轻微的背景噪音3=信号可以辨别,话音可以勉强可以分辨,有较强的背景噪音2=信号很难分辨,话音几乎完全无法抄收,背景噪音非常强1=信号完全无法分辨,话音完全被背景噪音覆盖再说那个九,就是信号强度,只有有信号强度表(台子上叫S表)的人,才能知道信号强度,比如2720,信号强度表共有14个格,14个格全起来了,就是九,起来七八个格,就是五,不起表,就是0.怎么报出正确的信号报告呢?首先,你要根据你接收的信号质量来判断对方的清晰度,不论这是你的S表上信号强度显示如何,只要他的话音清晰可辨,没有背景噪音,即使S表没有信号强度显示,清晰度可以报5,也就是说你可以报出51或者52的信号报告,反之不论你的S表上的信号强度多么强,只要他的话音中夹杂着背景噪音,都不应该报5的清晰度,你可以报49或者39,具体选择什么样的清晰度值就看你的判断了。
正确的信号报告对于我们正确的了解设备的使用状况、通联效果有着很重要的作用,但是也不必反复的要求对方给出信号报告,除非你觉得你的设备使用的不正常或者是你刚刚调整完设备。
最后,再说一个关于信号的报告的注意事项,大家尽量不要老去中继要信号报告,第一次打开中继的时候可以要,以后就没有必要了。
因为中继的位置很高,功率也很大,基本上能够打开中继的设备,从中继上要到的信号报告都是59的,没有实际意义。
举几个例子吧,比如在路上抄到ACE了,S表起格10个,大约也就是7,听他的声音不错,但有点噪音,那他的信号就是47 比如在路上抄到278了,信号不起表,听着有噪音,但是听她说话没问题,那就是31的信号不过此处说的是正规的信号报法,不过现在中继上是胡报,中继转发的信号是很强的,一般在四环路内,信号强度肯定是9,不过传发的信号有噪音,所以,就给个52,53的信号报告,和标准的是差很多的,呵呵,不过大家都这样,也就这样了,他们的报法是最次是50,最好是59加或60,等于把信号强度省了,只从语音清楚的程度上把信号分为从50到59的发个档了,各位也就别纠正了,反正是玩啊,呵呵,你一纠正,就成卫道士了,找别人盖你呢另外,不论是中继频率还是直发频率如果有朋电台黑话1.“有吗,有吗,有吗?”这是一种非常不礼貌的呼叫方式,相当于“有朋友能抄收吗?”,遇到这样的呼叫,应该不予理睬!2.“插入”用于申请插入别人的谈话,这个简语应该慎重使用,频率空闲无人呼叫的时候不应使用这个呼叫,有人通联的时候,除非你想加入他们的话题,或者有非常紧急的事情,尽量不要插入!而且在插入结束以后,应将话筒还给原来在频率上通联的朋友;3.“明了”某俱乐部用语,其实应该用“明白了”、“了解了”或者用英语“copy”来回答,不准确的缩略语会给人不好的印象;4.“over”用在每次发射结束时,用以通知对方你已经停止呼叫的短语,中文表示应为“完毕”;5.“73”用作结束语,用作一般性的问候,男女朋友或者夫妻还可以用“88”代表爱与吻;6.“信号59+”信号报告,前一个数字代表对于对方传送过来的语义理解的程度,完全可以了解对方的意思没有任何背景噪音,1则代表完全无法听懂对方在说什么,背景噪音把语音完全淹没了;后面的9代表接受到的信号强度,1最低9最高,59+的信号代表最好的信号质量。
设备故障排除报告
设备故障排除报告引言本报告旨在记录设备故障排除过程,以及最终解决方案。
报告将涵盖设备故障描述、排查过程、问题分析和解决方案等内容。
设备故障描述在某日期和时间,我们的设备遇到了故障。
故障描述如下:- 故障现象:请具体描述设备出现的故障现象,包括任何异常行为或警报。
- 影响范围:请说明故障对业务或操作产生的影响范围。
例如,是否导致停机,生产延误或数据丢失等。
- 故障发生频率:请说明故障发生的频率和时长。
是否是一次性故障还是持续不断的故障。
排查过程为了解决设备故障,我们采取了以下排查步骤:1. 步骤一:请详细记录第一步的排查过程和结果。
2. 步骤二:请详细记录第二步的排查过程和结果。
3. 步骤三:请详细记录第三步的排查过程和结果。
问题分析经过排查过程,我们对设备故障的原因进行了分析。
以下是我们得出的结论:1. 问题一:请列出第一个问题的具体描述。
- 原因:请说明导致该问题的可能原因。
- 解决方案:请提供解决该问题的具体方法或建议。
2. 问题二:请列出第二个问题的具体描述。
- 原因:请说明导致该问题的可能原因。
- 解决方案:请提供解决该问题的具体方法或建议。
解决方案基于上述问题分析,我们提出以下解决方案:1. 解决方案一:请详细描述第一个问题的解决方案。
2. 解决方案二:请详细描述第二个问题的解决方案。
总结通过以上排查和分析,我们成功解决了设备故障,并提出了相应的解决方案。
我们将继续监控设备运行情况,以确保故障不再发生。
如果您对本报告有任何疑问或需要进一步信息,请随时联系我们。
感谢您的支持与合作。
> 注:本报告仅针对特定设备故障,并不适用于其他情况。
请在具体情况下进行相应修改和调整。
基站故障处理报告模板
基站故障处理报告模板1. 引言本报告旨在描述和分析基站故障,并提供相应的处置措施和解决方案。
本次故障报告涵盖了以下内容:- 故障时间和地点;- 故障影响范围和具体表现;- 故障的原因分析;- 解决方案和处理过程;- 故障的修复情况;- 故障后的改进措施。
2. 故障概述故障时间:20XX年XX月XX日XX时XX分故障地点:基站XXXX故障影响范围:影响了周边半径XXX米内的用户通信2.1 故障现象- 用户在通信过程中频繁掉线;- 通话质量不稳定,时有杂音和断音;- 数据传输速度明显降低。
3. 故障原因分析经过初步调查与分析,我们得出了以下故障的可能原因:- 设备故障:基站设备出现硬件故障或软件异常;- 信号干扰:周边环境中存在干扰源,如建筑物、高压线等;- 传输线路故障:基站与核心网之间的传输线路出现断裂或其他故障。
4. 解决方案和处理过程4.1 解决方案根据故障现象和原因分析,我们制定了以下解决方案:- 检查并修复基站设备故障;- 对周边环境进行干扰源排查和干扰消除;- 检查并修复传输线路故障。
4.2 处理过程- 第一步:联系维护人员前往现场,进行现场勘查和设备故障检查;- 第二步:进行干扰源排查,消除发现的干扰源;- 第三步:检查传输线路,测试其连通性,并修复发现的故障。
5. 故障修复情况5.1 修复时间故障修复时间:20XX年XX月XX日XX时XX分5.2 修复情况经过相关处理措施的实施和检查,故障已经得到修复,修复情况如下:- 基站设备故障已修复,设备正常运行;- 干扰源已被排除,周边环境对基站通信无干扰;- 传输线路故障已修复,传输线路正常通畅。
6. 故障后改进措施为了减少类似故障的再次发生和进一步提高基站运行的稳定性,我们计划采取以下改进措施:- 加强基站设备巡检和维护,及时发现和修复潜在故障;- 加强监测和干扰源排查,定期检查周边环境的干扰情况;- 定期检查和维护传输线路,确保其正常运行和通畅。
铁塔故障处理情况汇报
铁塔故障处理情况汇报近期,我公司铁塔设备出现了一些故障情况,特此进行汇报并提出处理方案,以确保设备正常运行和通信质量。
首先,我们对铁塔设备进行了全面的巡检和测试,发现了以下故障情况:1. 部分铁塔设备出现了电源供应不稳定的情况,导致设备断电或者工作不正常。
2. 部分天线出现了信号接收不良的情况,影响了通信质量。
3. 部分铁塔设备出现了机械故障,需要进行维修和更换。
针对以上故障情况,我们已经采取了以下处理方案:1. 对于电源供应不稳定的情况,我们已经加强了设备的维护和检修工作,确保电源供应的稳定性,避免设备断电或者工作异常。
2. 对于信号接收不良的天线,我们已经对其进行了调整和优化,确保信号的稳定接收,提高通信质量。
3. 对于出现机械故障的设备,我们已经安排了专业的维修人员进行维护和更换,以确保设备的正常运行。
在处理故障的同时,我们还对铁塔设备进行了全面的升级和改造,以提高设备的性能和稳定性。
我们已经更新了部分设备的软件和硬件,确保设备的正常运行和通信质量。
此外,我们还对铁塔设备进行了定期的巡检和维护工作,确保设备的正常运行和通信质量。
我们将继续加强对铁塔设备的管理和维护工作,确保设备的正常运行和通信质量。
在未来的工作中,我们将继续加强对铁塔设备的管理和维护工作,确保设备的正常运行和通信质量。
我们将密切关注设备的运行情况,及时发现并处理故障,确保通信网络的正常运行和通信质量。
总之,我们将继续加强对铁塔设备的管理和维护工作,确保设备的正常运行和通信质量。
我们将不断改进工作方法,提高工作效率,确保通信网络的正常运行和通信质量。
感谢各位的支持和配合!。
广播电视发射机故障分析、处理及维护
明:①6P15管接触不良;②有地方虚焊;③小盒插件接触 不良。
处理:既然正常了,就维持播音,注意观察,待下班 关机后再进行处理。下班关机后安以上三点排查,发现是
从图1-1-1-2中的曲线可以看出,当低二级正常时,电 6P15阴极电阻接地点虚焊,重新焊接后恢复正常。
子管的工作点为Q点,Iao=30mA,当一只管碰极后,工作点变 为Q´点,Iao´´=120mA,使好管工作点变为Qeg´´=-120V,所以 Iao´´=0V被截止。
输出,高末无栅流,阴流也没有,高前级无栅流,阴流极
现 象 : 加 低 压 后 或 者 播 音 中 碰 极 管 阴 流 表 打 到 头 小,见宽放级无阴流,经拍打机箱振动,恢复正常。
(≥100mA),另外半边的阴流表从正常时的30mA变为0,调
分析:由于6P15阴极电阻虚焊,故电子管无直流通道,
幅度加不足,声音失真严重,与碰极管同侧的低末级阴流 所以,无阴流,无输出。这使得高前级、高末级均无激励,
表不随调幅摆动。用示波器检测已调波形为单边调幅波。 故发射机无载波功率,也无声音。经拍打振动后正常,说
分析:在正常工作时两只电子管的阴流均为IKO=30mA, 偏压Eg=-60V。当一只管碰极后Eg´变为0,所以IKO´>100mA, 使得好管的偏压变为Eg´´=-120V,所以板流截止。电子管板 极特性曲线如图1-1-1-2
随调幅摆动,用示波器观察调幅波形只有一半调幅。其原 理图如图1-1-1-1所示
分析:电子管碰极后栅偏压Eg从-17V变为0V,故碰极 管的阴流从30mA增大到160mA左右,由于碰极管无输出,故 同侧的低末级阴流不随调幅摆动,发射机只有单边调幅, 且调幅不能加大。
由于碰极管的阴流在公共阴极自偏压电阻Rk=220Ω上 产生偏压为Eg´=160mA×220=35.2V,即推挽另一侧的电子管 栅偏压从-17V变到-35.2V,故阴流从30mA变为8mA左右。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某电视台故障处理报告 1. 故障现象 某电视台备播系统存储设备扩容过程中产生瞬时网络风暴,导致重大播出事故,采用应急处理后网络恢复正常,电视台领导责令查找网络风暴产生原因。
2. 基础网络环境
1.2. 分析方案 1. 分析目标 查找备播系统内部产生瞬时网络风暴的原因。 2. 分析思路 第一步:先检查备播网络环境中是否存在干扰因素:如病毒、网络配置不当导致网络环路; 第二步:如果没有干扰因素,则需要重现存储扩容操作过程,查找是否因操作异常导致网络风暴出现; 工具软件:利用科来协议分析仪进行精确定位;
1.3. 排除环境干扰 1. 定位是否为病毒引起 1) 病毒特征分析 根据上面的现象,能够出现这种网络风暴的病毒一般情况是蠕虫或者攻击类的病毒,该病毒有如下几种特征:
2) 蠕虫类病毒 网络层:同大量的主机会话,大多是发包,每个会话流量很少; 连接层:连接很多,大多是发出的TCP SYN包,大部分没有响应或被拒绝; 总体流量:发包远大于收包数量
3) arp病毒 Arp扫描病毒:发送大量arp请求,扫描本网段内的mac地址,消耗交换机资源; Arp欺骗攻击:通过主动发送大量的arp响应实现地址欺骗,从而获取其它主机通讯信息,
4) 结合现场环境情况分析 网络中的计算机设备被感染该类病毒后会扫描所有网段内的设备,根据故障现象描述,单台被感染的计算机设备扫描网络的流量不会这么大,除非备播系统内部很多的计算机设备被感染,而且是在同一个时间进行这样的操作,否则不会导致备播系统内部4台交换机的指示灯全部狂闪。 根据了解系统升级前后运行状态均正常,但是需要查看是否有隐含该类病毒的情况,即是否个别计算机设备存在这类现象,只是数据量比较小,交换机表现不明显;另外根据故障现象,产生网络风暴应该主要是广播风暴,因此通过抓取广播数据包能够检查是否存在该类现象;
2. 确认病毒的方法 部署协议分析仪(笔记本电脑安装科来软件): 监控对象:在每台交换机上镜像所有端口流量到协议分析仪端口 科来软件抓包结果:
1) 分析软件诊断界面中没有出现频率很高的扫描行为; 2) 诊断界面 出现很多IP地址冲突192.168.0.128 ,经过了解,该IP在所有的计算机上都存在,是HP服务器默认管理IP,经过了解对网络无任何影响,业务系统中也没有使用该网段; 少量arp扫描信息,172.27.112.36、172.27.112.6,经过了解这2个IP扫描属于正常业务情况,这2个服务器正在查找几个业务服务器,而这些服务器已经关机;
3. 结果判定 备播系统内正常情况下无异常流量; 4. 定位网络配置 根据上面备播系统网络拓扑图和实际的交换机配置,网络设备物理连接基本为单链路连接,网络设备为2层配置,但是和全台网互联为3层连接,因此初步排查备播交换机网络设备的配置不会存在网络路由环路,但是需要进一步验证是否受全台网核心交换机的影响。 网络路由环路原理: 同一个数据包在路由器间循环传输最终丢掉; 由于路由实际上是不可达的,IP包的TTL值在传输过程中断减小直至1; 路由器在丢掉数据包时会向源地址发送ICMP数据包; 网络物理环路原理: 同一个数据包在2台设备间无限循环传输,不丢弃; 循环广播报文形成广播风暴(广播报文死循环),导致整个网络阻塞; 部署协议分析仪(笔记本电脑安装科来软件): 监控对象:镜像备播系统内1台服务器访问通信信息到协议分析仪端口 验证思路: 看数据包解码中3个参数:IP ID、TTL、ICMP是否同时出现,并且3个参数的特征如下: IP ID:如果PID相同的tcp/udp数据包则表示同一个数据包 TTL:即同一个数据包的TTL为第一个值逐渐减1,到最后TTL为1; 检查是否有ICMP协议返回给该服务器; 科来分析仪抓包结果: 诊断界面:只有诊断界面中出现很多IP地址冲突192.168.0.128,; 出现很多IP地址冲突192.168.0.128,前面已经介绍过对网络无任何影响;没有异常报警; 少量arp扫描信息,172.27.112.36、172.27.112.6,经过了解这2个IP扫描属于正常业务情况,这2个服务器正在查找几个业务服务器,而这些服务器已经关机; 数据包解码界面:3个参数没有上面的特征 分析结果:没有网络路由环路和物理环路产生;
5. 环境干扰分析总结 根据前面对病毒、网络配置的分析结果,网络中的设备无明显大量发包情况,现场网络环境正常,无任何干扰因素。
1.4. 重现故障 思路:根据前面环境干扰分析总结结果,网络环境正常,而网络风暴是瞬时出现,怀疑是操作过程中操作不当导致,因此让存储扩容人员详细讲解和重现扩容当天的操作过程和线缆连接过程,看是否出现故障现象,并通过科来协议分析仪来详细分析和定位。
1. 恢复连接存储1的B控制器的数据端口 说明: 存储控制器上有2个RJ45类型的端口,其中1个端口为数据访问端口,另外1个端口为存储固件升级专用管理口。
1) 交换机 备播系统4台交换机没有出现网络风暴现象; 2) 科来协议 监控对象:交换机上连接存储1的B控制器的数据端口 抓包时间:15分钟; 概要界面:广播流量所占比例很低; 诊断界面:没有异常报警信息; 矩阵界面:矩阵连接数量正常,未见明显异常会话连接; Tcp会话/udp会话/IP会话界面:均正常连接,未见发包数量很多的会话;
2. 连接存储1的B控制器的固件专用管理端口 根据存储扩容人员回忆,操作过程中A控制器的数据口能够连通,但是B控制器的数据口不通,怀疑是端口插错了,于是直接将不通的线缆拔下来插到另外1个端口上,然后去做其它的业务操作,之后便出现了交换机所有指示灯全部狂闪的现象(实际情况是该操作人员把2个控制器标记给记颠倒了)。 根据其提供的信息我们按照其操作过程演示了一遍:
1) 第一次:网线1连接A控制器的数据口,网线2连接B控制器的固件管理口 现象:网线1能够连通,网线2连接后不能ping通172.27.112.201; 交换机现象:备播系统4台交换机没有出现网络风暴现象; 部署协议分析仪(笔记本电脑安装科来软件): 监控对象:镜像交换机连接B控制器的固件管理口的通信信息到协议分析仪端口 抓包分析结果: 抓包时间:15分钟; 诊断界面:没有异常报警信息; 概要界面:广播流量所占比例很低; 矩阵界面:矩阵连接数量正常,未见明显异常会话连接; Tcp会话/udp会话/IP会话界面:均正常连接;
2) 第二次:网线1连接A控制器固件管理口,网线2连接B控制器固件管理口 交换机现象:备播系统4台交换机立刻出现网络风暴现象; 部署协议分析仪(笔记本电脑安装科来软件): 监控对象:镜像交换机连接B控制器的固件管理口的通信信息到协议分析仪端口 抓包分析结果: 抓包时间:持续; 诊断界面:网卡2连通后立刻出现arp请求风暴,并且数量不断增加,源IP为2台服务器IP; 矩阵界面:矩阵连接数量正常,未见明显异常会话连接; 数据包解码:主机172.27.112.36 和172.27.112.6发送arp请求的数据包非常频繁;访问的目标IP 比较固定,经过了解这些IP是业务工作站和数据库的IP,只是当时这些设备关机了; 处理:将连接B控制器固件管理口网线2拔掉后,网络立刻恢复正常;
3) 第三次:将有问题的2台服务器网卡断网,并重新将网线2连接B控制器固件管理口 网线连通后没过多久,又再次出现下列现象; 交换机现象:备播系统4台交换机立刻出现网络风暴现象; 部署协议分析仪(笔记本电脑安装科来软件): 监控对象:镜像交换机连接B控制器的固件管理口的通信信息到协议分析仪端口 抓包分析结果: 抓包时间:持续抓包; 诊断界面:再次出现arp请求风暴,并且数量不断增加,源IP为其它服务器IP; 处理:将连接B控制器固件管理口网线2拔掉后,网络又立刻恢复正常; 至此找到该故障现象,出现交换机网络风暴是人为操作不当导致:网线应该连接到控制器数据口,但是被错误的连接到控制器的固件管理端口上,经过与存储扩容操作人员确认,确实有这种情况;
1.5. 深入分析与结论 1. 存储控制器 第一:2个存储控制器的固件专用管理口实际上为1个物理端口,可能是控制器板卡内部部件将这2个固件的管理端口连通,经过与厂商工程师了解得到确认; 第二:由于2个存储控制器的固件专用管理口为1个端口,因此同时连接2个控制器的固件管理口会直接将交换机2和交换机3物理连通,导致交换机物理环路;
2. 交换机被物理环路的表现特征 向广播地址x.x.x.255发送的数据包频率很高,在毫秒级; 向广播地址x.x.x.255发送的数据包的IP ID号相同、TTL值不变; 发生物理环路会出现arp请求风暴报警,即网络中同时会伴随大量的arp请求数据包出现,不能找到目标MAC的arp请求数据包被交换机重复转发,造成死循环,最终导致arp请求风暴出现;同时如果将出现arp请求风暴的设备断网,那么会陆续有其它设备接连出现请求风暴报警; 3. 交换机配置 经过检查交换机上的生成树spanning-tree协议没有启用,在交换机存在物理环路的情况下没有阻塞其中1条链路,从而导致数据包被重复转发。
1.6. 故障解决 交换机上启用生成树spanning-tree协议:4台H3C 5600交换机:stp enable 验证:再将2个存储控制器的固件专用管理口同时连接,没有网络风暴现象出现。
1.7. 案例自评 1. 故障简单,但是处理过程中重现该故障具有一定的操作难度; 2. 在没有原始数据包的情况下,查找产生瞬时网络风暴思路处理过程清晰; 物理环路特征总结:IP ID相同、TTL值相同、伴随arp请求风暴报警;