OptiX OSN1500设备对接故障定位与排除
OptiX OSN1500以太网故障定位与排除

OptiX OSN1500以太网故障定位与排除一.检查是否存在SDH故障处理以太网故障时,首先要排除SDH故障。
1.背景信息处理以太网故障时,首先要在T2000上查询告警,并要覆盖到SDH侧和以太网侧。
如果是SDH侧告警,按SDH 故障进行处理。
2.操作步骤1)在T2000主视图的网元图标上单击右键,选择“当前告警浏览”。
查看是否有导致业务中断或劣化的告警。
2)判断告警类型,如果是SDH侧告警,进行SDH故障处理操作。
二.判断是否存在异常性能事件处理以太网故障时,在T2000中进行RMON性能分析,可知业务是否异常。
1.操作步骤1)在网元图标上单击右键,选择“网元管理器”。
2)选中以太网单板,在“功能树”中选择“性能 > RMON性能”。
3)点击“告警组”,单击“查询”,弹出“操作结果”的对话框,单击“关闭”。
4)查看告警名称。
如果出现的告警名称较多,需要重点关注以下几个:1)如果有“FCSErrors”的告警名称,说明CRC校验错。
2)首先检查端口工作模式是否匹配,不能一端为全双工,一端为半双工。
3)其次是网线质量是否较差。
4)最后可定位为网口是否存在硬件故障。
如果有“AlignmentErrors”的告警名称,说明对齐错误。
1)首先检查是否存在业务碰撞的现象,如果端口的实际工作模式是半双工,建议全部调整到全双工模式。
2)检查对端设备是否故障,如果存在故障,建议更换故障的部件。
如果有“DropEvent”的告警名称,说明硬件异常导致丢包。
1)先硬复位单板。
2)如果丢包现象持续,则更换单板。
三.检查最大传输包长MTU是否过小如果单板设置的MTU值小于设备的实际传输包长,将导致业务劣化。
1.操作步骤1)通过仪表测试查出网络最大的MTU。
2)如果单板设置的MTU比测试的值要小,重新设置单板上的MTU。
四.检查是否存在丢包现象通过PING测试,检查业务是否存在丢包现象。
1.操作步骤1)在T2000上配置一条以太网业务。
OptiX OSN1500复用段保护倒换故障原因及定位方法

OptiX OSN1500复用段保护倒换故障原因及定位方法一.常见故障原因保护倒换故障的发生原因,可以是外部原因、数据配置或者设备原因。
保护倒换故障,是指在全网正常状态下突然发生不明原因的倒换,或者在应该发生保护倒换时,全网未进入保护倒换状态,或进入保护倒换后,全网或部分业务发生中断的情况。
复用段保护倒换的常见故障现象是如表1所示,可分为外部原因、数据配置原因以及设备故障原因三大类。
复用段保护倒换故障可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。
所以要根据具体的情况,采用基本的故障定位方法逐个分析。
表1 复用段保护倒换故障的常见原因故障类别故障原因外部原因光纤连接错误倒换协议异常人为插入了R_LOS、MS_AIS告警数据配置全网业务配置不正确复用段参数配置不正确设备原因线路板故障交叉板故障母板故障二.常用定位方法复用段保护倒换故障常用两种方法定位:环回法;配置数据分析法三.故障定位步骤复用段故障定位需要遵循一定的流程进行。
复用段故障定位流程如图1所示。
图1复用段故障定位流程1.检查复用段参数、状态对复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。
对复用段保护环,日常维护时应注意检查环上各个网元的节点参数设置是否正确,协议是否已启动,各个网元的协议状态是否为正常状态。
2.按照链型网,逐段环回定位故障如果APS协议的状态正常,但业务仍然不通,可以通过分析业务中断时的业务流向,将复用段环当作一条链来进行故障定位。
这种方法定位故障起来比较简单,可以迅速定位出故障点。
将复用段环当作一条链之后,可以用逐段环回的方法来定位故障。
这里逐段环回时APS协议仍保持启动状态,逐段环回的手段和前面讲述的有所区别:因为倒换发生后业务可能不但要经过主用通道,还要经过备用通道,因此我们环回的VC-4可能既有主用通道的VC-4,也有备用通道的VC-4,视业务经过的路径而定。
OptiX OSN1500业务中断故障原因及处理方法

OptiX OSN1500业务中断故障原因及定位方法导致故障的常见原因包括外部原因、数据配置、设备硬件、误码、指针调整、设备对接和保护倒换等。
表1业务中断问题的常见原因故障类别故障原因外部原因电源异常光纤、电缆、接头异常交换或其它接入设备异常环境(温度、湿度)异常接地异常、雷击数据配置配置错误误操作运行过程中的软件问题设备硬件单板失效或性能劣化误码误码过多导致业务中断指针调整指针调整过大导致业务中断设备对接对接设备失配或设置不正确导致业务不通保护倒换保护倒换功能异常导致业务中断一.常用定位方法OptiX OSN设备常用的故障定位方法有告警分析法、逐段环回法和替换法。
告警分析法发生业务中断故障时,设备通常会有告警指示。
通过分析这些告警,可以将故障定位到较细、较准确的程度。
逐段环回法如果通过观察告警事件一时无法定位故障点时,则可使用环回法进行处理。
替换法二.故障定位步骤业务中断类故障处理步骤如下。
业务中断的故障点定位过程,见图1所示。
图1 业务中断故障处理流程1.检查有无设备告警发生业务中断故障时,首先检查是否有以下设备告警:POWER_FAIL(电源故障);FAN_FAIL(风扇故障) ;BD_STATUS (单板不在位);NO_BD_SOFT(单板无软件)这些告警指示设备或单板有故障,应当首先排除这些故障。
2.检查保护倒换是否正常对于保护组网,应检查业务中断是否由于保护倒换失败引起的。
保护倒换失败的故障现象通常表现为:1)SNCP保护组网,在业务中断的站点,无SNCP倒换性能事件上报。
2)复用段保护组网,有任一网元没有上报PS告警,或有任一网元上报了APS_FAIL告警。
3.检查各站登录是否正常若某站登录不上,且该站相邻站点的线路上有R_LOS等紧急告警,则可能是该站电源故障或与该站相连的光纤或线路板故障。
4.其它故障原因的定位对于无配置错误,无R_LOS、R_LOF、TU_AIS等告警,有误码或指针调整的业务中断故障,请参考本手册的第5章、第6章内容来定位、排除故障。
第8章 设备对接故障处理

设备在进行线路对接时,如果对接设备的开销字节J1、C2设置不一致,将有HP_TIM(高阶通道追踪字节失配)、HP_SLM(信号标记失配)告警;在产生HP_TIM或HP_SLM时,如果设备下插AIS告警,将导致业务中断,对接失败。
在缺省情况下,OptiX OSN 3500/2500/1500设备的线路板检测到接收的J1、C2字节和其应收值不一致时,一般不会下插AIS。即HP_TIM、HP_SLM告警不影响业务,可以在网管上将告警屏蔽。消除HP_TIM、HP_SLM告警需要统一设置双方设备的J1、C2字节。
如果屏蔽层接地不好,会由于两个地(BGND、PGND)之间存在电位差和交流干扰,影响信号对接时的波形,导致对接不成功。
4. 120端口的接地
对于120平衡端口的2M业务,因为是差分方式传送(采用双绞线进行传输),一般不会存在因为接地原因而导致对接不成功的情况。
8.1.2高阶通道开销C2、J1
与设备对接有关的高阶通道开销主要是C2和J1。
2. DDF接地
当传输设备通过数字配线架(DDF)和其他设备相连时,请检查数字配线架是否已接保护地(PGND)。
3. 75同轴端口的接地
75非平衡式同轴端口的外导体(即屏蔽层)常规的接地方法是发端连接PGND,收端连接PGND或悬空。可用万用表测试同轴端口的屏蔽层与设备PGND之间的电压,就可以大致判断出同轴端口屏蔽层的接地方式。
串行口的定义如表8-3所示。
表8-3接口引脚分配
前视图
端子号
信号
描述
1
RS-422T+
RS-422发送数据差分正端
2
RS-422T-
RS-422发送数据差分负端
OSN1500对端设备端口丢包处理方法

OSN1500对端设备端口丢包处理方法OSN1500对端设备端口丢包导致以太网端口业务中断的可能原因如下:对应现象1:对接设备端口业务中断,且在自协商的一端上报Link_ERR。
原因1:两端端口工作模式不一致。
查询对接端口的工作模式。
如果两端工作模式不一致,则重新设置两端端口工作模式为自协商模式。
保持对接设备两端端口工作模式一致。
原因2:光纤连接错误或断纤。
检查光纤连接是否正确,如果连接错误,则重新正确连接光纤。
如果断纤,则更换新的光纤。
原因3:光模块硬件故障。
检查光模块硬件是否发生故障。
如果光模块硬件故障,则更换新的光模块。
对应现象2:华为OSN1500本端或对端设备的线路侧存在R_LOS告警。
原因1:线路侧故障。
查询两端设备告警。
如果本端或对端设备的线路上存在R_LOS告警,则该段线路故障。
重新正确连接光纤,更换光模块和光纤。
查看业务是否恢复正常,若未恢复,转其他原因。
本端或对端设备的线路上不存在R_LOS告警,转其他原因。
对应现象3:华为OSN1500设备网管无任何告警上报,与对接设备进行Ping 操作时有丢包现象。
原因1:对接设备故障。
(1)在本端站和对端站配置EPL业务,查看进行ping操作时是否有丢包现象。
如果有丢包现象,则继续下一步,如果无丢包现象,则转其他原因。
(2)断开本端站与对端站之间的连接,建立本端站到第三方站点的连接,并配置EPL业务。
重新进行ping操作,如果此时无丢包现象,则判断对端站的计算机感染病毒。
如果此时仍有丢包现象,则判断本端站的计算机感染病毒。
(3)更换感染病毒的计算机后,重新建立本端站与对端站的连接,查看是否还有Link_ERR告警上报。
如果仍然上报Link_ERR告警,则进行相应处理。
(4)检查现场连接的设备,发现接入站点的交换机下游设备有异常。
更换交换机的下游设备,查看业务是否恢复正常。
如果恢复正常,则故障处理结束。
OptiX OSN1500复用段保护倒换故障定位与排除

OptiX OSN1500复用段保护倒换故障定位与排除一.检查并分析外部原因在处理故障时,首先应该检查设备外部的情况。
1)是否人为停止了APS协议,错误设置了强制倒换,人为插入了MS_AIS、MS_RDI告警。
2)是否供电系统出现了问题,如电源故障,蓄电池故障等。
在排除外部原因后,如果故障仍然存在,可采用其他方法进行故障定位。
二.检查APS协议和复用段参数在排除了外部原因后,如果故障仍然存在,需要检查APS协议和复用段参数。
1.保护倒换协议正常启动,但保护倒换不成功检查复用段协议是判断故障时必须进行的步骤。
通过网管对各个网元的当前的状态进行查询,若整个网络中有两个相邻网元的状态为“倒换态”(S),而其他网元均为“穿通态”(P),则说明APS协议正常启动。
若各网元的状态正确,APS正常启动,但业务仍然中断,首先可以考虑通过网管重新启动协议;如果重新启停协议后,业务仍然中断,则须考虑是否是单板存在问题,这时可以按一般的业务中断故障进行处理。
2.保护倒换协议异常,保护倒换不成功APS协议异常通常有两种现象:APS协议不能正常启动/停止;部分/全部网元的站点状态异常。
APS协议异常,会引起K字节的穿通和上报出现问题,从而导致保护倒换不成功。
此时可以先检查各网元的复用段参数是否配置正确,是否有的网元的复用段参数丢失;如果参数设置没有异常,可以检查光板和交叉板是否工作正常。
参数设置时需要注意:逆时针方向、主环方向逆时针方向为主环方向。
将网元上相邻光板的左边板位称为西向,右边板位称为东向。
逆时针组环要求环上各节点的东向板位光板与下游站西向板位的光板相连,西向板位的光板与上游站网元东向板位的光板相连。
复用段环的数据设定复用段参数包括:复用段节点号、等待恢复时间。
复用段参数设置必须准确,否则可能导致复用段倒换失败。
复用段节点号环上复用段节点号,节点号小于16。
建议从“0”开始,按主环方向逐站递增。
等待恢复时间一般设置为600秒。
OSN1500单板光功率异常解决方法

OSN1500单板光功率异常解决方法
若OSN1500业务板的光功率发生异常将导致误码产生和帧丢失,还可能导致业务中断。
其产生的可能原因及处理方法如下:
现象1:收发光的光功率值异常。
原因:华为OSN1500设备硬件故障。
处理方法:检查光纤是否发生故障。
如果光纤故障,更换故障光纤,查看收发光的光功率值是否恢复正常。
检查可插拔光模块是否发生故障。
如果可插拔光模块故障,更换故障光模块,查看收发光的光功率值是否恢复正常。
如果恢复正常,则故障处理结束。
检查光衰是否发生故障。
如果光衰故障,更换光衰,查看收发光的光功率值是否恢复正常。
检查华为OSN1500设备单板是否发生故障。
如果单板故障,硬复位或直接插拔故障单板,查看单板是否正常开工,若未开工,请选取单板参数与故障单板完全相同的备板,更换单板。
若正常开工,则故障处理结束。
对应现象2:无法通过华为OSN1500设备网管查询单板的光功率信息,也不能查询单板制造信息中的光模块参数信息,且无相关告警和性能事件上报。
原因1:光模块问题导致无法查询性能。
更换光模块,再次查看是否可以通过华为OSN500设备网管查询单板的光功率信息,且光功率值是否在正常范围内。
如果可以通过网管查询单板的光功率信息,且光功率值在正常范围内,SDH设备故障处理结束。
现象3:单板激光器开、关操作失败。
原因:版本不配套。
处理方法:升级单板软件,保证单板软件与主机软件版本匹配。
查看单板激光器开、关操作是否恢复正常,如果仍然操作失败,转其他原因。
OptiX OSN1500时钟保护倒换故障定位与排除

OptiX OSN1500时钟保护倒换故障定位与排除一.检查全网的光纤连接关系
当时钟保护失败时,应检查全网中各个网元的光纤连接关系是否正确,是否与时钟源的设置相匹配
二.分析网元时钟优先级
当时钟保护失败时,需要检查全网中各个网元的时钟优先级配置是否正确。
由于时钟保护倒换涉及到全网时钟配置方式,因此在进行故障分析时,应结合时钟倒换协议,分析各个网元的时钟跟踪方式是否正确,是否出现由于优先级配置错误,导致网元时钟跟踪混乱
三.查询时钟子网的设置
当时钟保护失败时,在网管上,需要进一步查询相关网元的时钟保护倒换协议是否予以正常启动。
由于各个网元的时钟参数设置正确,并不能保证时钟保护子网正常工作。
需要在网管上,查询各个网元是否已经正确添加到相应的时钟保护子网中,此时网元的时钟保护倒换协议才启动。
并且,由于只有在时钟保护协议启动后,网元才可依靠接收到的S1字节信息来判断时钟的质量。
四.查询外接时钟源时钟信号是否正常输出
当时钟保护失败时,有时需要查询外接时钟源时钟信号是否正常输出。
首先,确认外接时钟源输出的时钟信号质量和SSM信息的时隙位置。
其次,判断相应的外接时钟是否携带有SSMB信息,因为只有配置有SSMB信息的时钟源,设备才能够提取相应的时钟信息。
然后,确认相应的“sa”字节是否设置正确,设备是否能够通过相应的字节提取出相应的时钟。
五.排除故障
按照不同的故障原因,制订相应的故障解决方案,即可排除故障。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
OptiX OSN1500设备对接故障定位与排除
一.检查业务配置
业务配置错误会导致设备对接故障。
查询、分析对接设备的配置数据,包括:物理设备参数、逻辑设备参数、支路板参数、时钟参数、复用段倒换参数等。
可采用配置数据分析法和更改配置法,保证配置数据的正确性。
另外,如果支路或线路设置了环回,必然会造成业务不通。
可在网管上检查并解除环回。
二.检查物理连接
光纤、电缆连接不正确也可导致设备对接故障。
检查对接设备之间的电缆、光纤连接是否正确;防止电缆的漏焊、虚焊、接触不良,特别是要防止电缆的混线。
说明:所谓混线,举个例子说明,如图1所示。
交换的2M端口A接到了传输设备的2M端口B上,而交换的
2M端口B接到了传输设备的2M端口A上。
这种情况下,在网管上看不到有T_ALOS告警上报,因为该告警只是对接收端口中是否有信号输入进行检测,而对该信号的正确性不作检测。
图1 2M信号对接
三.检查光功率或接地
对于光接口的线路对接,要检查光功率是否在正常的范围内。
使用仪表测试对接设备的光功率,并参考工程资料和《OptiX OSN1500智能光传输系统产品描述》,确认光功率是否满足要求。
检查对接设备的接口板是否匹配,包括光模块类型、接收灵敏度、发光功率等。
必要时,可以测试接口的抖动、频偏是否满足指标要求。
检查对接时的光纤类型是否匹配。
单模光纤和多模光纤不可混用。
四.检查接地
对于电接口的对接,需要检查双方设备和线缆的接地和共地情况。
使用仪表测试BGND、PGND的接地电阻值是否符合指标要求,DDF是否按要求接地;检查双方设备的75欧姆同轴接口屏蔽层的接地方式是否一致,接地是否良好。
排除接地故障的最好方法是使用示波器检查对接信号的波形是否变形、失真。
也可以使用万用表测试:将对接设备间的信号连接线全部断开,用万用表测量OptiX OSN 1500的收、发端同轴电缆屏蔽层间的电平,然后测量对接设备侧的收、发端同轴电缆屏蔽层间的电平。
两次测量的电位差都应小于20mV。
如果有较大的电位差,则应引起重视,判断是否是因为该原因而导致业务的对接不成功。
五.检查电缆距离和信号衰减
当采用电缆对接时,中继电缆距离过长有时会导致业务对接失败,表现为业务不通或者开通的业务经常出现中断。
75欧姆的2M中继信号的最大传送距离为300米,75欧姆的34M/45M中继信号最大传送距离为140米(需要加均衡)。
中继距离过长会因阻抗不匹配、受到干扰、对端设备可靠性等原因而导致接口波形产生失真,特别是当干扰变大时更加容易出现业务中断。
可以采用仪表检查对接信号的波形是否变形、失真。
六.检查对接信号的结构
SDH信号对接时,需要检查对接双方设备的时隙排列、开销、指针以及保护组网的兼容性。
1.时隙排列
SDH信号对接时,应检查VC-4映射结构中对应到支路板通道上的时隙排列顺序。
2.开销和指针
SDH信号对接时,检查对接设备的开销和指针是否一致,包括:J0、J1、C2、H1、H2。
因信号结构不匹配引起的对接失败,通常伴随有相应的告警,如J0_MM、HP_TIM、HP_SLM、AU_LOP、HP_RDI。
开销字节的定义不一致,需要修改其中一方设备的开销定义。
OptiX OSN1500的J0、J1、C2字节可以在网管中修改其定义;H1、H2字节不可修改。
3.保护组网时的对接
复用段保护功能在不同厂家的传输设备间是不兼容的。
因此,通常情况下,不同厂家的复用段保护功能不能进行对接。
子网连接保护功能由于不涉及保护协议,不同厂家的设备通常可以相互兼容。
七.检查网络的时钟同步
设备对接后,不仅要求SDH传输网内的时钟保持同步,而且对接后形成的网络也应保证时钟同步。
时钟不同步在SDH线路对接和PDH支路对接的故障现象是不同的。
1.SDH线路对接时的时钟同步
OptiX传输网内时钟是否同步,可以通过指针调整性能事件反映。
如果有大量的指针调整事件,或出现误码告警,则很可能是OptiX OSN 1500本身存在问题,可参见指针调整故障处理排除该问题后再作其它处理。
如果传输设备运行正常,应检查对接设备的时钟处理性能是否正常。
2.PDH支路对接时的时钟同步
OptiX OSN 1500与其它设备在PDH支路对接时,如果时钟不同步,在OptiX OSN 1500上通常不会有告警和性能事件出现,在PDH设备上则会有误码或业务时断时续的现象。
3.时钟不同步的处理
全网时钟不同步,不一定是传输设备本身有问题,可能是全网的时钟同步规划不合理。
比如说交换设备跟踪一个时钟基准源,传输设备又跟踪另一个时钟基准源,造成两个网络的时钟有一定的偏差。
这时,首先要确保OptiX OSN 1500组成的传输网内时钟同步。
如果还有问题,可以适当地调整全网的时钟同步方案,使全网时钟同步;比如使主站的交换设备和OptiX OSN 1500都跟踪高精度的BITS时钟信号,以提高系统的传输性能。
一般情况下,在传输网络内,中心站网元采用内置时钟源,其他网元跟踪此基准源,即可满足传输的同步要求,和大部分交换、移动设备对接都正常。
常用解决方法:更改配置法。
说明:要注意PDH设备和SDH设备传输时钟信号的差异:由于PDH设备的复用结构采用比特间插方式,对所传输的时钟信号基本上无损伤;而SDH设备由于引入指针调整技术,对所传输的时钟信号不可避免的引入了抖动和漂移,产生相位差异。
因此,通过SDH设备2M通道传送的时钟信号质量理论上劣于通过PDH传送的时钟信号质量。
所以建议不要通过OptiX OSN1500的支路口来传送2M时钟信号。
可以使用OptiX OSN1500的时钟输入输出端口来传送时钟。
八.根据需要,更换单板
若定位为单板故障,则可通过更换单板的方法确认。
在采用逐段环回等方法将故障点定位到某块单板后,可以采用更换单板的方法,确认故障点。