维护经验:网管安全告警处理案例
告警系统故障处理情况汇报

报警系统故障处理情况汇报【故障现象】使用机房内的可视监控服务器PING终端可视对讲设备时,初次PING终端设备时的第一个PING包会丢。
(监控服务器IP=192.168.0.154,终端可视对讲设备IP=192.168.10.41)使用可视监控服务器PING小高层终端设备(监控服务器—交换机—OLT—ONU—交换机—终端设备)与使用可视监控服务器PING别墅区终端设备(监控服务器—交换机—OLT—ONU—终端设备)均出现“初次PING终端设备时的第一个PING包会丢”现象。
在初次PING过之后短时间内再次PING终端设备时,则PING包正常,不会出现丢包现象。
【原因分析】在第一次PING可视对讲终端设备时,第一个包通过ARP广播寻找设备的MAC地址,由ONU获取到LAN口下挂设备的MAC后,并不会再向上发REPLY。
由于以前可视对讲厂商并未说明PING包的第一个包丢失会影响其报警系统的使用:该报警系统与服务器之间在正常情况下是不会建立联系的,只有在突发情况下终端设备才会向服务器发送报警信息;此时如果因学习MAC造成第一个包丢失时,服务器将不会接受后续的报警包。
因此,我司的EPON设备仍按照出厂的默认配置,ONU的LAN口设置了MAC地址学习功能。
【处理办法】根据可视对讲设备维护人员提出的需求,现场将学习LAN口下挂设备的MAC地址功能关闭,确保所有PING包过程不会丢包。
在网管上的配置操作如下:在ONU列表中,选取所要修改的ONU,右键—配置—端口MAC地址个数限制。
按照下图方式将“MAC地址限制个数”修改为“0”即可。
修改前修改后(红色所框为需要修改地方)修改后,前往小高层验证报警功能是否正常:所去用户家以前一直无法使用报警功能,修改上述配置参数后,报警功能可以正常使用。
附:监控系统组网结构:小高层处组网结构别墅处组网结构。
应用华为Optix iManager T2000传输网管系统分析告警实例

箜 塑
型至垦! 塑Q! 堕旦
竺 里 Q 堡堕旦 笪墨堑坌堑堂篁壅
此 功能 提 供 了对 2Mbts级 别 的设 备 端 口连 i /
具体 配 置 , 以及对 网元 设备 各 种属 性 的管理 。华 为
Opi i n grT 0 0 传 输 网 管 系 统 提供 了 网 络 t Ma a e 2 0 x
《 ) 有灵 活 的网络 寻址结 构 ; 2具
系 统 管 理 指 华 为 O t Ma ae 2 0 传 pi i n g rT 0 0 x 输 网管 系统对 自身 属性 祀资 源 的管理 , 主要 包括 数 据库 备 份 和恢 复 管 理 、各 类 日志 转储 和清 除 管 理
等。 () 2 网络拓 扑 管理
同步 数 字 系 列 (D 网络 中 的 网 管 系 统 , 确 保 S H) 在 S H 网络 正常 运行 的过 程 中扮演 着 十分 重 要 的角 D
色 。S H 网络 网管 系统 一般 具有 如下 特点 : D
理 、 置管 理 、 障管理 、 能管理 和安全 管 理六 个 配 故 性
( ) 有 全面 的网络 配置 、 能 监视 等功 能 。 3具 性
因此 ,D 网络 中的 网管 系 统对 于 S H 网络 S H D
作 毒 疑 食 .
网络 拓扑 管理 主要 是 提供 网络 映射 和控 制 , 协
调 网管 系统管 辖 区域所 有 的拓 扑对 象 , 以及 通 过 网
馘 氏16) 孥 (7 9 ̄
管 系统 的管 理 功 能 可分 为 系 统 管 理 、网络 拓 扑 管
管 系统 为传 输设 备 所 产生 的不 同误 码 告 警级 别 进 行 分 析及有 关控 制误码 劣 化 的方 法 。
网管查看及告警问题处理

3
网管问题介绍
网管硬件问题: 网管软件的载体为服务器、硬盘等。对于此类硬件问题,第一要点 就是配置文件的备份及保护,这是恢复网管运行的首要条件。如果 日常维护的备份工作做的好,比如经常定期将配置文件做拷贝备份 的话就无此担忧了。
网管软件问题分类: 功能性问题:网管提供的基本功能,如告警、性能查询等 业务问题:和电路业务相关的问题 对于网管软件类问题,应重点关注操作方法,即问题是否能够通过 一定的操作步骤复现。
网元断链告警处理案例

网元断链告警处理案例第一篇:网元断链告警处理案例⌝网元断链告警处理案例1.故障现象描述"在双模站点开通过程中,部分站点在初期会有断链情况。
告警显示“网元断链告警(198099803)”这样的话,后台就无法监控到断链站点的状态。
2.故障分析排查思路1、2、3、只有个别基站在所属网管服务器上面断链,可以排查网管服务器故障;大批基站集中断链,可以排除基站本身硬件、供电故障;如果个别站点在正常运行,排除基站无硬件、供电故障后,出现断链,一般为传输问题,需要联系移动传输室来联合排查定位;3.传输网络结构介绍" LTE基站OMC维护网络从IP传输网络架构来看,可分为3段,依次是:基站------基站网关------网管服务器网关------网管服务器。
整个传输网络结构如下图所示:4.网元断链故障处理流程从网管服务器ping基站IP是否ping通?是否从网管服务器ping 基站网关IP地址说明整个传输链路正常,排除了传输故障,需要检查网管配置数据、基站配置数据是否正常。
是否ping通?是说明基站网关到网管服务器之间的传输正常;基站与基站网关之间故障否从网管服务器与网管网关互ping检查基站硬件、数据配置是否正常否是否ping通?联系传输,保证基站VLAN、IP与传输配置一致是检查网管、网管对应网关及中间传输是否正常基站网关与网管网关之间故障,属传输内部故障,由传输处理基站与基站网关之间互ping,互相检查5.故障排查总结通过上述的排查总结如下:1、首先确认BBU设备是否运行正常,站点传输设备是否正常,基站供电系统是否正常。
2、然后检查下站点的配置数据,确保站点配置无误,可能由于传输割接导致站点断链。
网管配置参数如下图所示:网元中配置的OMC操作维护地址:基站传输网络→IP传输→IP层配置中的OMC操作维护地址:基站传输网络→IP传输→OMC链路服务器地址:3、关于ping命令,有两种使用情况:a)从后台ping前台基站的话:直接在网管服务器上:ping ip地址。
olp告警处理

OLP网管故障分析及处理●告警分析及处理•事件分析及处理•通讯故障告警(一)➢首先确认该设备的IP、子网掩码和网关是否设置正确,是否属于合理的网段内并无IP冲突;➢点击开始\运行,输入ping IP地址,看是否连接正常;若PING的通设备IP,则:➢检查设备主控盘的端口号是否设置为9000;➢若组网方式为DCN,与局方确定DCN交换机是否将9000端口号屏蔽了;➢若同时有几台单机版网管在监控设备可能会造成数据冲击,流量过大造成通讯故障,关闭其余的网管再观察;➢依次重启主控(开关电源)、相关的网络硬件;通讯故障告警(二)若PING不通设备IP,则➢在Windows命令行环境下,PING该设备的网关地址看是否连接正常,若PING不通网关地址,让局方检查站点与网管中心的网络情况;➢若PING的通网关地址,则在本地机房用笔记本通过一根好网线直接连接OLP主控,看是否能够PING通并能通过网管观察,若不通则重启主控盘或将主控盘更改为另一个IP,还是不通则可能是主控盘的硬件故障;➢若含有HUB插盘,通过HUB来PING设备,此时主控盘和HUB插盘的网口灯应均为橙色,若不通则更换HUB端口或重启HUB,还是不通则可能是HUB盘的硬件故障;通讯故障告警(三)➢把主控盘的网线拔下接至笔记本,并将笔记本IP设成与主控盘一样,再从网管中心PING此IP;➢检查主控盘与DCN交换机(协转或光纤收发器)之间所有的网线是否正常并确定网线类型(两个HUB插盘之间用交叉网线,与DCN交换机连接通常用直通网线,其余情况均可用直通网线),重点检查连接主控盘那端网线水晶头是否做好,试着插拔一下网线或重新做一根或用力按住网线与主控盘连接处再PING,确定XPort与水晶头是否匹配;通讯故障告警(四)➢在交换机上找一个空余的网口与电脑相连,看是否能否PING 通,若不通则让局方检查交换机的工作情况,有条件的话可以重启交换机;➢在运行时常出现通信告警,而重启主控盘能恢复正常,更换主控盘再进行观察,若还会出现此现象可以让局方检查一下DCN 情况,是因为DCN网络中传送的数据包有可能对主控盘有冲击,从而造成其经常死机;通讯故障告警(五)若组网方式是2M,则➢确定协转右边的三个白色按钮没有被按下,且背面的拨码开关调至75Ω;➢确定网线已连接正确,若直接与主控盘连接,则用直通网线接至协转交叉网口,若与HUB插盘连接,则用直通网线接至协转平行网口;➢若LOS告警,检查2M线是否完好或是否连接正确,重启协转后仍有告警则让局方检查2M线路;➢若AIS告警,重启协转后仍有告警则让局方检查传输数据是否做的正确;➢若不能恢复正常则可能是协转的硬件问题;通讯故障告警(六)若组网方式是冗余光纤,则➢确定本地和对端的光纤收发器后面的三个拨码开关应均为出厂设置(自动协商开启、100M、全双工);➢确定网线已连接正确,无论与主控盘还是HUB插盘连接,均使用直通网线;➢若IN口指示灯不亮,检查跳线是否完好或是否连接正确;➢重启后仍不能恢复正常则可能是光纤收发器的硬件问题。
中兴皖通网管常见告警分析

中兴皖通网管常见告警分析ZXWT-A80常见告警分析在设备安装维护工作中会遇到很多告警,对告警的有效分析是解决问题的关键。
要找到问题的根源,首先要从告警产生的原因着手,查清问题后运用有效的处理方法排除故障。
以下针对ZXWT-A80传输设备的一些常见告警,给出产生原因及处理方法,在以后工作中可以作为同事们的参考。
1、R-LOS告警告警名称:R-LOS Loss of signal 接收线路侧信号丢失告警级别:紧急告警原因:1)断纤;2)线路衰耗过大或光功率过载;3)对端站发送部分故障线路发送失效;4)对端站交叉板故障或不在位处理方法:1)一般是光纤断、光纤衰耗太大、接收光功率过载、单板故障等原因;2)检查光缆是否完好,光接头是否接触良好,清洁光缆连接器;3)如果接收光功率过载,加入衰耗器;4)如果是单板故障,更换单板。
2、R-LOF告警告警名称:R-LOF loss of frame接收线路侧帧丢失告警级别:紧急告警原因:1)接收信号衰减过大;2)对端站发送信号无帧结构;3)本板接收方向故障处理方法:1)一般是光纤衰耗太大,检查光纤是否完好;2)检查光纤接头接触是否良好,清洁光纤接头;3)检查对端站发送信号的帧结构;4)如果是单板故障,则更换单板。
3、R-OOF告警告警名称:R-OOF Out of frame接收线路侧帧失步告警级别:紧急告警原因:1)接收信号衰减过大;2)传输过程误码过大;3)对端站发送部分故障;4)本站接收方向故障处理方法:1)一般是光纤衰耗太大、接收光功率过载、单板故障等原因;2)检查光缆是否完好,光接头是否接触良好,清洁光缆连接器;3)检查对端站发送部分4)如果是单板故障,更换单板4、MS-AIS告警告警名称:MS-AIS Multiplex section alarm indication复用段告警指示告警级别:主要告警原因:1)对端站发送MS-AIS信号;2)对端站时钟板故障;3)本板接收部分故障处理方法:1)检查对端站线路板是否有问题,可通过复位或更换单板来检查告警是否消失;2)检查本站线路板,同样可通过复位或更换单板的方法来检查告警是否消失。
日常维护告警处理-优质课件

SDH板常见告警及维护
SDH板TF告警:激光器发送失效 SDH板红灯3次/秒
1、R-LOS 接收侧光信号丢失,危急告警: 判断故障源:①光纤故障(断);②上游站SDH板发送故障; ③下游站SDH板接收模块,光口污染(损),用酒精擦,光接 口未接好等,造成信号丢失。 检测方法:自环法、光功率测试法。 2、R-LOF 接收帧丢失,危急告警 判断故障原因:①光纤故障(误码过大);②上游SDH板发送 故障;③下游站SDH板接收故障 检测方法:自环法、光功率测试法。
SDH板常见告警及维护
HP-SLM:
C2字节失配,由所配置业务通道装载级别不一致,通 过查寻ห้องสมุดไป่ตู้以更改。
HP-LOM:
H4字节,按4个基帧字节排列。 原因:①业务配置不当
②单板版本不匹配
GTC板的告警维护PS
复用段保护环下,业务级别,是在 VC4下,特点:
SCC板启动协议 SL1或SL4板处理相应K1、K2字节 GTC板执行保护动作一般是光路上的 保护,靠相应字节K1、K2的检测
SDH板常见告警及维护
MS-AIS、AU-AIS
AIS告警信号都是全“1”码 RLOS,RLOF,ROOF,告警都是最高级别的,说明业务已 中断,发现它们都会向下插入告警。 全“1”码,由高端危急告警下插。 AU-AIS还与业务配置错误有关。(红灯:2次/秒)
HP-TIM
由J1字节失配造成,通过网管登录看J1是否一致
ETN灯闪烁时,表示该主控单元SCC板管理的网元 设备与网管操作系统终端之间正在传送数据。
电力监控系统网络安全典型告警案例汇编

电力监控系统网络安全典型告警案例汇编国家电力调度控制中心2018年3月前言近年来国际上相继爆发了乌克兰大面积停电、勒索病毒肆虐等网络安全事件,电力监控系统作为关键信息基础设施,已成为国家间“网络战”首选攻击目标,安全形势严峻。
为全面加强网络空间的安全监管,各级调度机构依托内网安全监视平台(网络安全管理平台)开展网络安全运行监视工作,但目前平台中存在的大量无效告警,严重影响了网络安全运行监视的效率,亟需开展告警治理工作。
为有效指导各单位开展告警治理,国调中心组织浙江、江苏、宁夏公司以及北京科东、南瑞信通等单位梳理分析100余篇告警分析报告,编制形成《电力监控系统网络安全典型告警案例汇编》。
本汇编分为清朗、有序、安全三篇,共计28个典型告警案例,旨在指导各级调控机构、变电站和电厂等单位的网络安全运行管理人员和运维检修人员全面清理网络空间中垃圾软件、程序不良行为和无效网络连接,合理配置网络结构参数、安全防护策略,规范现场作业的操作行为,及时发现并处置网络安全风险及事件,全面营造清朗有序安全的电力监控系统网络空间。
目录第一篇清朗篇 (1)案例一、远动机未关闭SNTP服务导致异常访问 (2)案例二、远动机未关闭mDNS服务导致异常访问 (3)案例三、远动机未关闭DNS服务导致异常访问 (4)案例四、远动机未关闭NetBIOS服务导致异常访问 (5)案例五、计划工作站未关闭DHCP服务导致异常访问 (7)案例六、光功率预测服务器未关闭SSDP服务导致异常访问 (8)案例七、输入法软件自动更新导致异常访问 (9)案例八、故录装置防病毒软件自动更新导致异常访问 (11)案例九、电量终端Ping本地路由器网关导致异常访问 (12)案例十、电量主站前置机远程管理功能未关闭导致异常访问 (13)第二篇有序篇 (15)案例十一、EMS系统业务通道参数配置错误导致异常访问 (16)案例十二、纵向装置策略配置错误导致EMS正常业务访问被拦截 (17)案例十三、纵向装置策略漏配导致日志报文被拦截 (18)案例十四、保信子站存在默认路由导致局域网报文窜入数据网 (19)案例十五、保信子站网络结构不规范导致局域网报文窜入数据网 (20)案例十六、保信子站网络结构不规范导致数据网双接入网窜网互联 (22)案例十七、远动机硬件设计缺陷导致报文串网传输 (24)案例十八、故障录播装置硬件设计缺陷导致报文串网传输 (25)案例十九、PMU装置设计缺陷导致报文串网传输 (27)案例二十、纵向装置内外网口网线反接导致正常业务访问被拦截 (29)案例二十一、纵向装置报“证书不存在”告警 (30)案例二十二、纵向装置报“隧道没有配置”告警 (31)案例二十三、纵向装置报“验证签名错误”告警 (32)案例二十四、纵向装置报“私钥解密错误”告警 (33)第三篇安全篇 (34)案例二十五、远动机感染病毒导致异常访问 (35)案例二十六、外部设备违规接入导致异常访问 (36)案例二十七、外部设备接入导致违规外联 (37)案例二十八、内部交换机违规接入互联网 (38)第一篇清朗篇清朗,是指网络空间中的应用服务是必需的,网络连接是清晰必要的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网元安全告警处理案例
近日,我传输中心技术人员在更换华为公司Optix155H型设备主控板时,遇到网元频繁上报SCB-ALM告警的问题。
我们通过查找资料、咨询华为客服热线等方式,及时将该问题解决。
现将本次处理过程总结如下。
一、现象描述
我公司传输本地网一网元F2口传输环境监控信息,该F2通道出现故障,需要更换主控板进行处理。
我们将设备的主控板由SS42SCB更换为SS43SCB单板,更换完成后,发现该网元频繁上报SCB-ALM告警,闪报状态,但不影响业务。
该网元单板配置如下:3-SP1D,9-X42,11-OI2D, 15-STG ,17-SCC,18-OHP2。
二、原因分析
SCB-ALM告警是网元安全告警,是由于网管登陆网元引起的。
该网元不断闪报安全告警,表明一直有一网管试图登陆该网元,但不能成功登陆。
这种情况,应该是网元用户设置问题或是网管侧数据设置引起的。
三、处理过程
1、通过NES网管查询网元用户,发现该网元用户只有一个:们首先排除传输侧问题:重新检查各处2M线的制作情况,没有发现问题。
在远端进行PDH 设备支路环回,近端PDH侧挂PCM2M误码表进行测试,测试结果显示没有任何误码。
传输侧问题基本可以排除。
排除路由器问题:公安边防接入系统原使用另一家电信运营商的传输路由,割接前一直没有丢包现象。
通过测试路由器设备,没有发现问题。
故障定位在V.35介质转换器上。
本次使用的V.35转换器是北京瑞斯康达公司的RC903-V35FE1型转换器。
我们以前没有接触到该型号设备,通过查看设备说明书和咨询厂家,我们初步判断问题出在该转换器的设置开关上。
调整V.35设备的时钟方式,将近端和远端V.35转换器设备由出厂默认的主时钟方式(内时钟)改为从时钟方式(跟踪E1时钟),观察丢包现象,丢包现象依然存在。
调整TX、RX的CLK相位关系,将近端和远端V.35转换器设备由正向改为反向,丢包现象消失。
我们又尝试了其它几种TX、RX的CLK相位设置方式,我们发现近端和远端V.35转换器的TX、RX-CLK相位关系不是绝对的,有一端设为正
向,另一端设为反向,也没有丢包现象;而对哈尔滨总队的两端转换器,都是出厂的默认设置-正向,也没有丢包现象。
所以,TX、RX的CLK相位关系,在调测时应该视设备情况而定,灵活运用。
双鸭山联通史克虎
2004年9月23日。