参考第3章故障定位的基本思路与方法

合集下载

电路中的故障诊断与故障定位技术

电路中的故障诊断与故障定位技术

电路中的故障诊断与故障定位技术电路的正常运行对于许多设备和系统来说至关重要。

然而,在电路中发生故障是难以避免的。

故障可能会导致电路的停止运行,或者带来其他不利影响。

因此,故障诊断和故障定位技术在电路维护和修复中起着重要作用。

本文将介绍一些常见的电路故障诊断和故障定位技术。

一、常见故障类型在电路中,常见的故障类型包括短路、断路、开路等。

短路是指电路中两个或多个节点之间的电阻几乎为零,导致电流过大。

断路是指电路中出现中断,导致电流无法流通。

开路是指电源与负载之间的连接断开,导致电流无法正确传输。

了解故障类型是故障诊断和故障定位的第一步。

二、故障诊断方法1. 相似性诊断法相似性诊断法是一种常用的故障诊断方法。

它基于相似原理,通过将已知的故障与未知的故障进行比较,找出相似之处,从而确定未知故障。

例如,在一个电路中发现了短路故障。

通过检查其他相似电路的工作情况,可以判断该电路中的短路故障位置。

2. 分割法分割法是一种逐步缩小故障范围的方法。

首先将整个电路分成几个部分,然后对每个部分进行测试,找出故障所在的部分,再进一步细分,逐步查找故障点,最终确定故障位置。

3. 瞬态故障分析法瞬态故障分析法是一种通过瞬态响应来确定故障的方法。

当电路发生故障时,会产生特定的瞬态响应。

通过对瞬态响应进行分析,可以识别故障类型和位置。

三、故障定位技术1. 电路板测试技术电路板测试技术是一种常用的故障定位技术。

通过对电路板上的各个元件进行测试,可以确定故障所在的位置。

常见的电路板测试技术包括X射线检测、红外检测、电子显微镜等。

2. 线路追踪技术线路追踪技术是一种通过追踪信号路径来确定故障位置的方法。

通过在电路中注入信号,并使用相应的探测设备,可以找到信号中断或损坏的位置,从而确定故障点。

3. 热成像技术热成像技术是一种通过检测电路中异常温度来确定故障位置的方法。

当电路中发生故障时,通常会导致局部温度异常。

通过使用红外热像仪等设备,可以检测出温度异常的区域,从而定位问题所在。

电力系统故障定位

电力系统故障定位

电力系统故障定位电力系统是现代社会不可或缺的基础设施,为各行各业提供了稳定可靠的电力供应。

然而,由于各种原因,电力系统中的故障难免会发生。

故障的及时定位和排除对于保障电力系统的安全运行至关重要。

本文将介绍电力系统故障定位的相关技术和方法。

一、故障定位的重要性及难点在电力系统中,故障可能导致电力中断、设备损坏甚至事故发生。

因此,及时准确地定位故障,对于恢复供电、保障设备安全以及提高电力系统的可靠性都具有重要意义。

然而,由于电力系统的复杂性和范围广泛性,故障定位一直是一个具有挑战性的任务。

二、故障定位的方法1. 传统故障定位方法传统故障定位方法主要包括故障指示器、剩余电流定位、电压法定位等。

故障指示器通过检测电力设备的运行状态来指示故障位置;剩余电流定位是利用输电线路中的剩余电流技术来确定故障位置;电压法定位是通过分析故障前后的电压波形来定位故障。

这些方法在一定程度上具有一定的定位准确性,但受限于技术和设备的限制,无法满足现代电力系统对于快速高精度故障定位的需求。

2. 基于传感器的故障定位方法随着传感器技术的发展,基于传感器的故障定位方法逐渐受到关注。

这些方法通过将传感器安装在电力系统关键位置,实时监测输电线路或设备的电流、电压等参数,从而实现对故障位置的准确定位。

其中,红外热像技术、光纤传感技术和超声波传感技术都是目前较为常用的传感器技术。

它们可以通过无线传输数据的方式与监测系统相连,实现对于故障位置的准确定位,并及时报警。

3. 基于数据分析的故障定位方法近年来,随着大数据和人工智能技术的发展,基于数据分析的故障定位方法也备受关注。

这些方法通过对大量实时采集的电力系统数据进行深入分析和处理,利用机器学习等算法来预测和定位故障位置。

这种方法不仅能够提高故障定位的准确性和效率,还能够提取更多的故障特征,为系统运行和设备维护提供更多的参考依据。

三、故障定位的挑战及前景尽管故障定位技术取得了一定的进展,但仍然存在一些挑战。

故障定位与排查方法

故障定位与排查方法

故障定位与排查方法故障在我们日常生活和工作中是不可避免的。

当我们遇到设备或系统故障时,准确地找出问题所在并对其进行排查是至关重要的。

本文将介绍一些常用的故障定位与排查方法,帮助读者更好地处理故障情况。

一、故障定位故障定位是指确定问题出现的具体位置或原因。

在故障排查之前,我们首先需要精确定位故障,以确保后续的排查工作能够有的放矢。

1. 观察法观察法是最简单且最常见的故障定位方法之一。

通过仔细观察故障现象,我们可以初步推测问题可能出现的地方。

比如,当我们使用电脑时突然黑屏,可能是电源或显示器的问题。

通过观察和排除一些常见问题,我们可以缩小故障范围,为后续的排查提供依据。

2. 分区法分区法是指将问题所在的范围进行细分,逐步缩小故障范围的方法。

比如,当我们的网络无法连接时,我们可以先确定是本地网络还是外部网络的问题,再在本地网络中分析是路由器、交换机还是电脑的故障。

通过逐层分区,我们可以快速找到问题所在。

3. 替换法替换法是通过替换一些可能有问题的部件或设备,来判断故障是否仍然存在的方法。

例如,当打印机无法正常工作时,我们可以替换墨盒或打印头来判断是不是这些配件的故障。

通过逐一替换,我们可以找到问题的根源。

二、故障排查故障排查是在确定故障位置后,针对具体的问题进行诊断和解决的过程。

下面将介绍一些常用的故障排查方法,供读者参考。

1. 五步排查法五步排查法是一种系统化的故障排查方法。

它包括以下五个步骤:(1)准备阶段:收集相关信息,了解故障的背景和现象。

(2)定位阶段:确定故障的具体位置。

(3)分析阶段:分析故障原因,找出可能的解决方案。

(4)解决阶段:采取相应措施,修复故障。

(5)预防阶段:总结经验教训,制定预防措施,以避免类似故障再次发生。

通过五步排查法,我们能够有条不紊地排查故障,并有效解决问题。

2. 试错法试错法是通过逐步尝试,排除不可能的原因,最终找到故障所在的方法。

比如,当电脑无法启动时,我们可以逐个排除电源线、开关、硬盘等可能的问题,直到发现并解决故障。

通信故障处理的基本思路与方法

通信故障处理的基本思路与方法

通信故障处理的基本思路与方法一、故障定位和排查1.审查与分析故障现象:首先要对故障的表现进行审查和分析,包括故障出现的时间、地点和具体现象等。

可以通过询问用户、查看系统日志和故障报告等方式获取相关信息。

2.确定故障范围:根据故障现象的描述和初步分析,确定故障发生的范围,是通信设备出现故障还是通信链路出现问题,还是其他相关因素造成的。

3.故障判断与排查:根据故障现象和故障范围,进行一系列排查工作,通过逐个排除可能的故障原因,追踪问题的根源。

可以通过使用故障排除指南,检查设备的硬件和软件状态,以及使用网络分析仪等工具进行故障排查。

4.数据收集和分析:对故障发生期间的数据进行收集和分析,包括设备状态、链路负载、传输参数和通信加密日志等。

通过分析数据可以找出规律和异常,根据这些数据来进一步确定故障原因。

尽可能地缩小故障范围,在每个子系统和模块上进行故障排查,逐步缩小故障范围,直到找到具体的故障点和故障原因为止。

二、故障处理方法1.重启或恢复设备:在一些故障情况下,可以通过简单地重启设备或恢复出厂设置的方式来解决问题。

这种方法适用于一些临时性的故障或系统配置错误的情况。

2.修改配置文件或参数:根据故障的具体情况,对设备的配置文件或参数进行修改,以修复故障。

这可以包括调整设备的参数、修改设备的路由表、更换设备的认证方式等。

3.更换设备或部件:如果经过排查后发现设备或部件的硬件损坏导致故障,就需要及时更换故障设备或部件,以恢复正常的通信服务。

在更换设备或部件时,需要确保新设备的兼容性和稳定性。

4.调整网络拓扑或链路路径:如果故障涉及到通信链路,可以通过调整网络拓扑或链路路径的方式来解决问题。

例如,可以对链路进行负载均衡配置、调整链路的传输速率、增加链路的冗余备份等。

5.更新软件版本或补丁:如果故障是由软件配置错误或软件漏洞引起的,可以尝试通过升级软件版本或安装相应的补丁来修复故障。

6.寻求厂商支持或外部专家协助:在遇到复杂或无法解决的故障时,可以寻求设备厂商的技术支持或请专业的外部专家提供协助。

浅析故障定位思路及方法

浅析故障定位思路及方法

浅析故障定位思路及方法设备经过工程安装人员的安装和调试后,都能正常稳定地运行。

但有时由于多方面的原因,比如受系统外部环境的影响、部分元器件的老化、损坏、维护过程中的误操作等,都可能导致设备进入非正常的状态。

此时,就需要维护人员对设备故障进行正确分析、定位和排除,使系统迅速恢复正常。

标签:故障定位思路原则方法0 引言俗话说:传输无小事。

传输设备的维护人员都能深切的体会到这句话的含义,尤其在发生大通道故障时,每个人都可能头脑发晕,越是急于恢复,越是不得要领。

要排除故障,就要对症下药,先准确定位故障,以下是我在日常处理故障中的工作总结。

1 排除故障的一般思路机房维护人员维护工作中,不免会遇见设备出现故障,在处理故障时,应该遵循一“查看”、二“询问”、三“思考”、四“动手”的基本原则。

1.1 查看首先查看出现故障的现象,即查看设备的哪一部分出现故障,有何告警产生,严重程度如何,造成多大危害等,才能透过现象看本质。

1.2 询问观察完现象后,应询问各阶段现场人员,是何原因造成了故障,比如是否有人拔插光缆、修改数据、删除了文件、更换了电路板、误操作等,或者现场是否停电、雷击等。

1.3 思考问明情况后,通过现象、原因等,根据自己的知识作思考、分析,判断何种原因可能引起该种故障,做出较为精确的判断。

1.4 动手根据前面三个步骤找出故障点,通过修改数据、更换电路板及芯片等手段解决、排除故障。

2 故障定位的基本思路2.1 外部原因外部原因主要包括:供电电源故障,如设备掉电、供电电压过低等;交换机故障;光纤故障,如光纤性能劣化、损耗过大,或光纤损断,光纤接头接触不良;中间电缆脱落、损坏或接触不良;设备接地不良;设备周围环境恶劣,如温度、湿度不合要求等。

2.2 操作不当此类问题一般都是因为维护人员对产品了解不够深入所导致。

对设备的一些细节性的性能特点及注意事项,对新老设备的一些特点和差别以及新旧版本的一些特点和差别不是非常清楚的情况下,就贸然操作,往往就会产生一些问题。

故障定位和缺陷管理的技巧

故障定位和缺陷管理的技巧

故障定位和缺陷管理的技巧在软件开发和系统维护过程中,故障定位和缺陷管理是非常重要的环节。

它们帮助开发人员和维护人员快速、准确地定位和修复软件中的问题,提高系统的可靠性和稳定性。

下面我们将介绍一些故障定位和缺陷管理的技巧。

1. 确定问题当收到用户的反馈或发现系统异常时,我们需要准确地确定问题所在。

这需要细致地分析问题的现象和表现,并且与用户进行有效的沟通。

通过仔细观察和收集问题相关的信息,比如错误报告、日志文件或用户的操作步骤,我们可以确保所定位的问题是准确的,从而更好地解决。

2. 分析问题一旦问题被定位,我们需要对其进行彻底的分析。

通过仔细观察代码和系统的行为,我们可以找到问题产生的原因。

这可能需要使用调试工具、日志分析工具或性能分析工具,以便更好地理解软件的运行过程,并找到问题的根源。

在分析问题时,注意细节非常重要,有时一个简单的错误可能导致系统崩溃或功能失效。

3. 修复问题在理解问题的根源后,我们可以开始修复问题。

我们需要制定一个合理的修复计划,确定修复问题的优先级和时程。

根据分析结果进行代码修改、配置调整或数据库维护。

修复后,我们需要进行严格的测试,确保问题已经得到解决,并且不会引入新的问题。

4. 记录和追踪问题一个好的缺陷管理系统是故障定位和缺陷管理的关键。

每当发现一个问题,我们都应该及时记录,并进行适当的分类和优先级划分。

在记录问题时,包括问题的描述、定位过程、修复情况和测试结果等相关信息。

这不仅有助于快速回顾和查阅问题,还可以为未来的修复工作提供参考。

5. 持续改进在故障定位和缺陷管理过程中,持续改进是非常重要的。

我们应该总结经验教训,分析问题出现的原因和流程中的瓶颈,并提出相应的改进措施。

例如,加强代码审查、加强自动化测试、提高用户反馈机制等等。

持续改进可以有效地提高问题定位和解决的效率和质量。

总结起来,故障定位和缺陷管理是软件开发和系统维护过程中的重要环节。

通过准确地确定问题、深入分析问题、专注修复问题、记录和追踪问题以及持续改进,我们可以提高系统的可靠性和稳定性,为用户提供更好的用户体验。

智能光通信技术-故障定位基本思路和方法

3故障定位基本思路和方法 关于本章本章介绍处理常见故障的基本思路和方法。

3.1 故障定位的基本原本节介绍故障定位的基本原则。

则3.2 故障判断与定位的常用方本节介绍故障判断与定位的常用方法。

法3.1 故障定位的基本原则 本节介绍故障定位的基本原则。

故障定位关键是:将故障点准确地定位到单站。

故障定位的一般原则可总结为:先外部,后内部;先网络,后网元;先高级,后低级;先多波,后单波;先双向,后单向;先共性,后个别。

先定位外部,后定位内部在进行系统的故障定位时,应该首先排除外部设备的问题。

这些外部设备问题包括光纤、光缆、客户设备和电源等问题。

先定位网络,后定位网元传输设备出现故障时,有时不会只是一个单站出现告警信号,而是在很多单站同时会上报告警。

这时我们就需要通过分析和判断缩小导致故障的范围,快速、准确地定位出是哪个站的问题。

先分析高级别告警,后分析低级别告警在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。

先分析多波信号告警,后分析单波信号告警在分析告警时,应先分析是多个波道都有问题还是仅单波道信号有问题。

多波道信号同时出现故障,问题通常在合波部分,处理了合波部分的故障后,单波道信号告警通常就随之消除了。

先分析双向信号告警,后分析单向信号告警在分析告警时,若“本站收、对端站发”的方向有告警,需要先检查“对端站收、本站发”的方向是否有类似的故障现象,若双方向都有告警需要先分析处理。

先分析共性告警,后分析个别告警在分析告警时,应先分析是个别问题还是共性问题,确定问题的影响范围。

需要确定是一个单板出问题,还是多个单板出现类似问题;对多光口单板,是一个光口有误码还是多个或所有光口都有误码。

3.2 故障判断与定位的常用方法 本节介绍故障判断与定位的常用方法。

对于一般性的硬件故障,一般采用“①分析,②环回,③换板”的方法:当故障发生时,首先通过对信号流向、告警事件和性能数据进行分析,初步判断故障点范围。

故障诊断中的故障定位方法应用教程

故障诊断中的故障定位方法应用教程故障诊断是各个行业中必不可少的一项技术工作,它在保障设备正常运行和提高工作效率方面起着重要的作用。

在故障诊断的过程中,故障定位是其中一个至关重要的环节。

准确、快速地定位故障,不仅可以节约时间和成本,还能避免进一步的损失。

本文将介绍几种常用的故障定位方法,帮助读者掌握故障诊断中的故障定位技巧。

首先,我们来介绍一种最常用的故障定位方法,即“逐渐排除法”。

这种方法适用于那些无法明确故障原因的情况。

首先,我们需要将可能引发故障的各个部分逐一排除,直到确定故障发生的具体位置。

具体操作时,我们可以根据设备的工作原理和相关知识,通过断开、更换、调整等方式逐步缩小故障范围。

例如,当设备无法启动时,我们可以先检查电源是否断电,再逐一检查连接线、开关、保险丝等元件是否正常。

通过逐渐排除法,我们可以快速定位故障的位置,并及时采取相应的修复措施。

其次,我们来介绍“分步法”。

分步法适用于复杂的故障场景,其中故障因素较多,需要逐步分析和定位。

首先,我们需要进行故障模式分析,对可能的故障原因进行推测和整理。

然后,通过逐步分步的方式,分析每个故障原因的可能性和影响程度,确定主要的故障原因以及可能的解决办法。

最后,我们可以根据实际情况和相关数据进行验证,并逐步排除可能的故障原因,最终找出真正的故障根源。

通过分步法,我们可以系统性地分析和定位故障,提高故障修复的准确性和效率。

除了以上介绍的两种常见的故障定位方法,还有其他一些辅助手段可以帮助我们更好地进行故障定位。

例如,我们可以利用数据记录和分析工具来获取设备运行过程中的各种数据,并通过分析这些数据来判断故障发生的具体原因。

此外,我们可以借助设备自带的故障诊断功能,通过设备本身的报警信息和故障代码来定位故障。

一些高级设备甚至可以通过远程监测和远程控制技术来辅助故障定位,提高定位准确性和效率。

在实际的故障定位过程中,我们还需要注意一些注意事项,以确保定位的准确性和可靠性。

故障定位与问题排查

故障定位与问题排查在现代科技发达的时代,各种电子设备已经成为我们日常生活的必需品。

然而,由于不可避免的原因,这些电子设备有时会出现故障和问题。

对于使用者来说,关键是能准确定位并解决这些问题。

本文旨在介绍故障定位与问题排查的方法和步骤。

一、故障定位的重要性故障定位是解决问题的第一步,准确的故障定位将为后续的问题排查提供方向。

不仅可以节省时间和精力,还可以减少维修成本。

因此,在遇到电子设备故障时,及时准确地进行故障定位尤为重要。

二、故障定位方法1.观察法观察法是最简单直观的故障定位方法。

通过观察设备的工作状态、指示灯、显示屏等,可以初步判断故障所在。

例如,当某个指示灯不亮时,可能是电源问题或灯泡损坏。

2.测试仪器法测试仪器法是一种更准确的故障定位方法。

使用各种测试仪器如万用表、示波器等,可以对设备进行电压、电流等方面的测试,帮助判断故障发生的位置。

3.模块替换法模块替换法是指通过替换可能故障的模块或零件,逐个排除故障点。

例如,当音响设备没有声音时,可以尝试更换扬声器、音频线等,来确定故障点。

三、问题排查步骤1.问题描述首先需要准确描述问题的出现时间、情况和特点。

例如,在何时何地,设备出现了什么样的问题。

2.问题定位根据故障定位的结果,确定问题出现的具体位置。

例如,问题可能出现在硬件部分、软件部分或是连接线路等。

3.问题重现尽可能准确地重现问题的发生,这样有助于问题的进一步排查。

例如,重复同样的操作步骤,观察问题是否能够复现。

4.原因分析根据问题重现的结果,分析问题产生的原因。

例如,可能是设备的某个部件损坏、软件设置错误等。

5.问题解决在明确了问题产生的原因后,针对性地采取措施来解决问题。

可以是更换故障部件、重新配置软件等。

6.问题预防在解决问题的同时,也要思考如何避免类似问题的再次发生。

可以通过加强设备维护、定期检查等手段进行问题预防。

四、注意事项1.安全第一在进行故障定位和问题排查时,要注意设备是否带电,避免触电或其他事故的发生。

位的基本思路和一般故障的处理方法


距离较远,因此首先将故障精确地定位到某个网元是极其重要和关键的,这样可以避免徒劳地在网元间来 回奔走。 故障定位到网元后,接下来的工作就是通过分析数据、检查硬件和更换(倒换)单板等操作手段来排 除故障。 (2)故障定位的原则 故障定位遵循故障分界,故障定点,故障定板的思路;坚持从高端到低端、从物理层到传输层的原则。
收、发两根光纤互换。若互换后,光板R—LOS告警消失,就说明确实光纤接反。 “替换法”的优势就是简单,对维护人员要求不高。是比较实用的方法。但该方法对备件有要求,且 操作起来没有其它方法方便。 (4)配置数据分析法 在某些特殊的情况下,如外界环境条件的突然改变,或由于误操作,可能会导致设备的配置数据(网 元数据和单板数据)遭到破坏或改变,导致业务中断等故障的发生。此时,故障定位到网元单站后,可通 过查询、分析设备当前的配置数据。对于网管误操作,还可以通过查看网管的用户操作日志来进行确认。 “配置数据分析法”适用于故障定位到网元后.故障的进一步分析,该方法可以查清真正的故障原因。 但该方法定位故障的时间相对较长,且对维护人员的要求非常高。一般只有对设备非常熟悉、且经验非常 丰富的的维护人员才能使用。 (5)更改配置法 “更改配置法”所更改的配置内容可以包括:时隙配置、板位配置、单板参数配置等。因此“更改配 置法”适用于故障定位到单站后,排除由于配置错误导致的故障。 如怀疑支路板的某些通道或某一块支路板有问题,可以更改时隙配置将业务下到另外的通道或另一块 支路板,若怀疑某个槽位有问题,可通过更改板位配置进行排除;若怀疑某一个VC4有问题可以将时隙调 整到另一个VC4。 在升级扩容改造中,若怀疑新的配置有错,可以重新下发原来的配置来定位是否配置问题。 但需要注意的儿我们通过更改时隙配置并不能将故障确切地定位到是哪块单板的问题(线路板、交叉 板、支路板、还是后背板问题)。此时,需进一步通过“替换法”进行故障定位。因此该方法适用于没有备 板的情况下,初步定位故障类型,并使用其他业务通道或板位暂时恢复业务。 由于“更改配置法”操作起来比较复杂,对维护人员的要求较高。因此除非在没有备板的情况下,用 于临时恢复业务。或用于定位指针调整问题外,一般使用不多。此外在使用该方法前。应保存好原有配置, 同时对所进行的步骤予以详细记录,以便于故障定位。 (6)仪表测试法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3章故障定位的基本思路与方法本章介绍常见故障的基本处理思路和方法。

包括:●对维护人员的要求●故障定位的基本原则●故障判断与定位的常用方法●故障处理的过程示例3.1 对维护人员的要求快速定位和及时排除光传送系统的故障,对维护人员的业务技能、操作规范等都有很高要求。

维护人员应做到以下应知应会。

3.1.1 专业技能1. 熟练掌握SDH的基本原理参见《光同步数字传送网》主编:韦乐平人民邮电出版社。

2. 熟练掌握传输系统告警信号流及告警产生的机理参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。

3. 熟练掌握以下常见告警信号的处理(1)线路告警●R_LOS●R_LOF●R_OOF●AU_AIS●AU_LOP●MS_AIS●MS_RDI●B1_EXC●B2_EXC●HP_LOM●HP_SLM●HP_TIM●HP_UNEQ(2)支路告警●TU_AIS●TU_LOP●T_ALOS●P_LOS●EXT_LOS●UP_E1_AIS●LP_RDI●LP_SLM●LP_TIM●LP_UNEQ●B3_EXC(3)保护倒换告警●PS(4)时钟告警●LTI●SYNC_C_LOS●SYN_BAD(5)设备告警●POWER_FAIL●FAN_FAIL●BD_STATUS告警信号的处理方法,参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。

4. 熟练掌握传输设备和网管的基本操作参见网管操作手册和网管的联机帮助。

5. 熟练掌握传输常用仪表的基本操作传输设备在维护中常用的仪表包括:2M误码仪、光功率计、SDH分析仪、示波器、万用表等,使用方法参见各仪表的使用手册。

3.1.2 工程组网信息●熟悉组网情况。

●熟悉业务配置。

●熟悉设备运行状况。

●熟悉工程文档,并作好工程文档的维护工作。

3.1.3 故障现场数据的采集与保存●采集并保存设备的告警及性能事件。

●采集并保存各网元及单板的配置数据。

●采集并保存各网元及单板的运行状态数据。

●采集并保存网管的操作日志。

3.2 故障定位的基本原则故障定位关键是:将故障点准确地定位到单站。

故障定位的一般原则可总结为四句话:先外部,后传输;先网络,后网元;先高速,后低速;先高级,后低级。

故障定位的一般原则可总结如下:●先定位外部,后定位传输。

在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源问题等。

●先定位网络,后定位网元。

在定位故障时,首先要尽可能准确地定位出是哪个站的问题。

●先高速部分,后低速部分。

从告警信号流中可以看出,高速信号的告警常常会引起低速信号的告警;因此在故障定位时,应先排除高速部分的故障。

●先分析高级别告警,后分析低级别告警。

在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。

3.3 故障判断与定位的常用方法故障定位的常用方法可简单地总结为:“一分析,二环回,三换板”。

当故障发生时,首先通过对告警、性能事件、业务流向的分析,初步判断故障点范围。

然后,通过逐段环回,排除外部故障或将故障定位到单个网元,以至单板。

最后,更换引起故障的单板,排除故障。

对于较复杂的故障,需要综合使用表3-1所示的方法进行故障定位和处理。

表3-1 复杂故障的定位和处理3.3.1 告警、性能分析法SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。

因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。

获取告警和性能事件信息的方式有以下两种:●通过网管查询传输系统当前或历史发生的告警和性能事件数据。

●通过传输设备机柜和单板的运行灯、告警灯的状态,了解设备当前的运行状况。

1. 通过网管获取告警信息,进行故障定位通过网管获取故障信息,定位故障的特点是:●全面:能够获取全网设备的故障信息。

●准确:能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值。

●如果告警、性能事件太多,可能会面临无从着手分析的困难。

●完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出问题,通过该途径获取故障信息的能力将大大降低,甚至于完全失去。

下面通过举例,对告警、性能数据分析法给予说明。

在如图3-1所示的链形组网中,网管计算机设在NE1站。

图3-1 链形组网图故障现象:NE1站和NE4站间的E1业务中断,从NE1站无法登录NE4站,且NE3站东向光板有MS_RDI告警和HP_RDI告警,NE1站与NE4站间的业务所对应的E1通道有LP_RDI告警。

分析判断:通过分析告警,可知NE4站没有正确接收到NE3站发出的信号,而NE3站能正确接收到NE4站发出的信号。

可能的故障原因包括:●NE3站东向光板发送信号有问题。

●光缆线路问题(包括光纤和光纤接头)。

●NE4站光板的接收信号问题。

故障定位:借助于网管软件,可以通过修改业务配置、人工插入告警等方法,对故障进行定位。

例如,若我们怀疑图3-1中NE2站与NE3站间光纤接反(即NE2站的东向光接口板误接NE3站的东向光接口板),则可以通过网管在NE2站东向光接口板人工插入HP_RDI,然后通过网管观察NE3站告警上报情况:●若是西向光接口板上报HP_RDI告警,则说明NE2站的东向发送端接的是NE3站的西向接收端,光纤连接正确。

●若是NE3站的东向光接口板上报了HP_RDI告警,则说明NE2站东向发送端接到了NE3站的东向接收端,光纤接反,需要纠正。

注意:通过网管获取告警或性能信息时,应注意保证网络中各网元的当前网元运行时间设置正确,倘若网元时间设置错误,将会导致告警、性能信息上报错误或根本不上报。

在维护过程中,对某网元重下配置后,应特别注意将该网元的网元时间设为当前时间,否则网元会工作在缺省时间里,而缺省时间并不是当前时间。

2. 通过设备上的指示灯获取告警信息,进行故障定位OptiX OSN 3500/2500/1500 设备上有不同颜色的运行和告警指示灯,这些指示灯的状态,反映出设备当前的运行状况或存在告警的级别。

机柜顶部指示灯的状态及含义参见《OptiX OSN 3500/2500/1500智能光传输系统设备手册》。

OptiX OSN 3500/2500/1500单板一般都有4个指示灯,其含义参见《OptiXOSN 3500/2500/1500智能光传输系统设备手册》。

3. 两种获取故障信息途径的比较从上面的介绍可以看出,通过网管与通过观察设备指示灯这两个途径获取设备故障信息,各有其优点。

因此,在实际的故障定位过程中,这两种手段要结合起来使用。

排除故障时,需要网管中心的维护人员与各站的设备维护人员共同参与,一般由网管中心的维护人员协调指挥,各站的设备维护人员密切配合,统一行动。

两种途径的比较如表3-2所示。

表3-2 通过网管和指示灯获取故障信息途径的比较3.3.2 环回法1. 概述环回法是SDH传输设备定位故障最常用、最行之有效的一种方法。

该方法最大的一个特色就是定位故障,可以不依赖于对大量告警及性能数据的深入分析。

作为一名SDH传输设备维护人员,应熟练掌握。

警告:环回操作可能会影响正常的业务,建议在业务量小的时候使用。

环回操作分为软件、硬件两种,这两种方式各有所长:●硬件环回相对于软件环回而言环回更为彻底,但它操作不是很方便,需要到设备现场才能进行操作;另外,光接口在硬件环回时要避免接收光功率过载。

●软件环回虽然操作方便,但它定位故障的范围和位置不如硬件环回准确。

比如,在单站测试时,若通过光口的软件内环回,业务测试正常,并不能确定该光板没有问题;但若通过尾纤将光口自环后,业务测试正常,则可确定该光板是好的。

2. OptiX OSN 3500/2500/1500 对软件环回操作的支持OptiX光传输系统的软件环回操作及应用特点如表3-3所示。

表3-3 OptiX光传输系统软件环回操作及应用由于支路板环回、线路板环回可将故障定位到单站,同时可初步定位支路板、线路板是否存在故障,因此在实际中使用最多,要求维护人员熟练掌握。

交叉时钟板环回可用于初步定位单站故障是线路侧故障、支路侧故障还是交叉故障,同时还可以定位出是哪一侧的线路板故障。

由于交叉时钟板环回操作起来比较复杂,一般很少使用。

窍门:实现交叉时钟板环回最简单的方式就是通过网管配置一个线路板或支路板的环回业务。

当然,环回前先要作好业务备份工作,以便恢复业务时使用。

3. 环回法的使用在进行环回操作前,需确定对哪个通道、哪个时隙环回?应该在哪些位置环回?应该使用哪种环回——外环回,还是内环回?这可分四个步骤进行。

窍门:对于同时出问题的业务,一般都具有一定的相关性,因此只要恢复其中的一个业务,其他的业务常常能自动得到恢复。

另外,采样简化的思路,也常常使得故障的分析、处理显得更加清晰、简单。

尤其是在出故障的业务比较复杂的情况下,采样简化的方法更加显得行之有效,甚至是故障定位思路的出发点或突破口。

4. 环回法实际应用举例环回法实际应用案例参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册故障处理分册》第1章的“1.2.8 环回举例”。

5. 环回法小结环回法不需要花费过多的时间去分析告警或性能事件,而可以将故障较快地定位到单站乃至单板。

方法操作简单,维护人员较容易掌握。

但是,假若所环回的通道内有其他正常的业务,环回法必然会导致正常业务的暂时中断,这是该方法最大的一个缺点。

因此,一般只有出现业务中断等重大事故时,才使用环回法进行故障排除。

3.3.3 替换法1. 概述替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。

这里的物件,可以是一段线缆、一个设备或一块单板。

2. 替换法的使用替换法既适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;也适用于故障定位到单站后,用于排除单站内单板的问题。

3. 替换法实际应用举例如图3-1的示例中,如果怀疑NE3站发与NE4站收之间的光纤有问题,则可将NE3站与NE4站间收、发两根光纤互换。

若互换后,NE3站东向光板的收有R_LOS告警,则说明是光纤的问题;若互换后,故障现象与原来一样,则说明光纤没有问题,而是光板的问题。

此时,可以进一步使用替换法,分别替换NE3站东向光板和NE4站西向光板,来定位到底是哪块光板的问题。

如果支路板某个2M通道有T_ALOS告警,我们怀疑是交换机或中继线的问题,则可与其他正常通道互换一下。

若互换后T_ALOS告警发生了转移,则说明是外部中继电缆或交换机的问题;若互换后故障现象不变,则可能是传输的问题。

相关文档
最新文档