动力环境监控系统及其故障分析与处理doucin
监控系统故障的解决方法(综合了十多年的系统范围经验)

监控系统故障的解决方法(一)在一个监控系统进入调试阶段、试运行阶段以及交付使用后,有可能出现这样那样的故障现象,如:不能正常运行、系统达不到设计要求的技术指标、整体性能和质量不理想,亦即一些“软毛病”。
这些问题对于一个监控工程项目来说,特别是对于一个复杂的、大型的监控工程项目来说,是在所难免的。
1. 电源的不正确引发的设备故障。
电源不正确大致有如下几种可能:供电线路或供电电压不正确、功率不够(或某一路供电线路的线径不够,降压过大等)、供电系统的传输线路出现短路、断路、瞬间过压等。
特别是因供电错误或瞬间过压导致设备损坏的情况进有发生。
因此,在系统调试中,供电之前,一定要认真严格地进行核对与检查,绝不应掉以轻心。
2. 由于某些设备(如带三可变镜头的摄像机及云台)的连结有很多条,若处理不好,特别是与设备相接的线路处理不好,就会出现断路、短路、线间绝缘不良、误接线等导致设备的损坏、性能下降的问题。
在这种情况下,应根据故障现象冷静地进行分析,判断在若干条线路上是由于哪些线路的连接有问题才产生那种故障现象。
这样就会把出现问题的范围缩小了。
特别值得指出的是,带云台的摄像机由于全方位的运动,时间长了,导致连线的脱落、挣断是常见的。
因此,要特别注意这种情况的设备与各种线路的连接应符合长时间运转的要求。
3. 设备或部件本身的质量问题。
从理论上说,各种设备和部件都有可能发生质量问题。
但从经验上看,纯属产品本身的质量问题,多发生在解码器、电动云台、传输部件等设备上。
值得指出的是,某些设备从整体上讲质量上可能没有出现不能使用的问题,但从某些技术指标上却达不到产品说明书上给出的指标。
因此必须对所选的产品进行必要的抽样检测。
当确属产品质量问题,最好的办法是更换该产品,而不应自行拆卸修理。
除此之外,最常见的由于对设备调整不当产生的问题。
比如摄像机后截距的调整是个要求非常细致和精确的工作,如不认真调整,就会出现聚焦不好或在三可变镜头的各种操作时发生散焦等问题。
动力源监控箱故障处理

动力源监控箱故障处理作者:段沄来源:《学校教育研究》2017年第22期【关键词】动力源开关电源【内容摘要】某晚接班时间,微波机房DUM-48/50B动力源系统红灯告警,监控箱上各按键均无反应,经检查确定为监控箱故障,对播出无影响。
随后我们对其进行了维修,发现系开关电源内部TL3845P芯片损坏引起,找到与其性能一致的TL3845P芯片替换后,系统恢复正常。
一、故障现象1月22日18时30分,微波机房DUM-48/50B动力源系统红灯告警,按动监控箱控制面板上各按键均无反应,显示屏黑屏,四个DZY-48/50B电源模块黄灯报警,但各路微波信号源传输正常。
二、处理过程经检测发现四个48V电源模块虽告警,但显示的输出电压、电流数据均正常,测量电池组输出总电压也正常。
在微波总站的指导下,通知各机房切换备用信号源后,我们重启了动力源系统,故障依旧存在。
随后我们切断了动力源系统电源,打开后柜门,取下控制箱,此时用48V蓄电池组对其供电,万用表测量控制箱开关电源输入数据,发现输入即为额定需要的直流48V,由此确定为监控箱故障。
由于临近重要播出时段,且微波信号未受影响,我们决定先断开监控箱,等总站寄来新监控箱,重要播出期后再更换。
此时重新开机,通知各机房切回主信号源,并要求值班员加强巡机,时刻注意四个49V电源整流显示的输出电压、电流数据。
2月14日,收到总站寄来的监控箱,我们利用周二停机检修的时间,取下监控箱,首先更换了监控箱的开关电源,安装完好后开机,监控箱显示的各项数据均正常,告警解除,系统恢复运转。
重要播出期结束后,我们将损坏的电源块安装到备用监控箱中,通以48V直流电,测量得监控箱内输入电压正常,+9V、+5V、+12V、-15V四路输出均无电压,初步断定故障出在电源公共部分。
用万用表顺着线路走向逐步检查,发现电路在芯片TL3845P后断开。
开关电源大致可分为两部分,即为开关变压器的初级部分和次级部分,集成块TL3845P属于初级部分,它本身有震荡、取样、稳压、比较等多种功能,因此我们怀疑为TL3845P集成块内部故障。
关于动力环境监控系统问题的思考和探索

般 的环 境 监控 系统 由以下 部分 组成 。 1 机房 温度 湿度 监控 。 ) 2) 机房 空调 控制 监控 。
一
4 一般动力控 系统 采 用 工 业 组 态 软件 平 台 ,功 能 丰 富 、性 能稳 定 、软 件 界 面生 动 、美 观 ,组 态灵 活 ,方便 扩 充 与升 级 。及 时对 各 个档 案 馆进 行 温湿 度 信 号 ( 漏水 报 警 、电源 故 障报 警 等信 号 ) 行 采集 、显示 、数据 存 储 、打 印等 。实 时显 示 温湿 进
一
5) 机房 市 电检 测 ( P 电压 ) US 。
6)机房 漏水监 控 。
7) 机房 非法进 入监 控 。 8) 计算 机服 务器 断 电数 据保 护 。 系统 可精 确监 测 温 湿度 等 环境 参数 ,广 泛应 用 于 医药 流通 、
制 造 业 、物 流运 输 等领 域 与场 所 ,大 大提 高 的用 户 的生 产 管 理水 平 。系统 基础 功 能包 括 :实时 监控 数据 显 示 、超 线 报警 、实 时记 录监 控数 据 和报 警 数据 、实时 曲线 图 、历史 数 据查 询 打 印 、 自动 生 成 历 史 曲线 图 、历 史 数 据 导 出 、数 据 自动 备 份 、系 统 运 行 日 志 、多国语 言选 择 、用 户权 限管 理 。 3 动力环境监控系统在图书馆等领域 的运用 档 案 馆 、图书馆 、博 物 馆 等作 为 资料 、图 书 、文 物等 物 品 的 保 存 、集 散 或 展示 的场 所 ,其所 处 的位 置非 常 重要 。以 档案 馆 为 例 ,馆 内温 湿度 变 化是 影 响档 案 材料 老 化变 质 的 主要 原 因 ,科学 合 理 的温 度 环境 是 做好 档 案保 存 的关 键 。适 当 的温 湿 度 能有 效 阻 止 档 案霉腐 菌 的生长 繁殖 ,确保 档案 资料 的长期 保存 。 根据 相关 数 据 ,多 数 蛀虫 和 霉菌 的 生存 温 度在 1 ℃以 』 ,低 0 二 于这 个温 度 ,害 虫 即丧失 活 动 能力 和停 止繁 殖 ,而 湿度 在6 %R 5 H 以 下 ,多数 霉 菌 就不 能正 常发 育 。 因此 将 温 度 控 制 在 1 ℃ ,湿 8 度应 控 制在 5 %R 一 5 H 间 ,这样 可 以抑 制 害虫 、霉菌 的生 0 H 6%R 之 长 繁 殖 ,有 利 于 书 画 纸 张 的 保 养 。 倘若 将 相 对湿 度 较 长 时 间 在 4 %R 以下 ,纸 张 又会 因 干燥 而脆 裂 ,造成 物理 性 朽坏 。所 以 , 5 H 保 持相 对湿 度 5% ~ 5 H以及 1 ℃ 一1 ℃的温 湿 度环 境 ,是 对 0 6 %R 0 8 书 画保存 的一 个严格 要求 。 我们 可 以采 用 两种 方 案 :方 案 一 、实现 对 馆 内 温湿 度进 行 全 面 监 测 。方 案 二 、实 现 对 馆 内温 湿 度 进 行 监 测 和 控 制 ,如 对 风 机 、空 调 、除湿 机 、报 警器 等 进行 调 节控 制 。除 温 湿度 监 测 外 , 可 增加 对 馆 内 的烟雾 报 警 、漏 水报 警 监测 、短信 报 警功 能 、电话 拨 号报警 等功 能 。 在 该 领域 主要 通 过J J0 B C 6 0 智能 温湿 度 测控 仪 与J J0 S C 10 温湿 度 变送 器作 为 现场 温湿 度测 量 与控制 的核 心部 分 ,J J0 S 责现 C 10负 场温湿度测量 , C 60 智能测控仪实现温湿度测量显示 、数字通 J J0B 讯 、 自动 化 控制 ( 如控 制 风机 、空调 、加湿 机 、除湿 机 等 )等功 能 。此外 可 增加 现 场声 光 报警 ,当测 量 值达 到报 警 条 件 时 ,实现 自动 报 警 。 ( 备注 说 明 :本 方案 中对于 只需 采 集 温湿 度 数值 而 不 需 要进 行 控制 的地 方可 采用J J0B 能巡 检仪 ,它可 同时 接 收多 C5 0 智 组温湿度信号。所有智能仪表在具体应用时会根据需要 ,被集成 安 装 到专用 的仪 表柜 内进行 统 一管理 。 )
动环监控日常故障及处理方法

【解决办法】:将所有监控采样线去掉,看水浸油机是否会恢复正常,若不能恢复, 则证明监控板坏,需更换DCD8020V1.0。若能回复正常,则表明8020板子无问题, 某根线出现短路。逐一排查。
第二章传感器一般故障及误告的处理方法
误告、异常处理:
【故障现象】:传感器故障(红外、温湿度、烟感、水浸)通信中断 【原因分析】:先检查该站的8020环境采集设备的其它通道的设备是否正常。 再在 基础数据配置(BCT)终端查看,是否配置正确。如从软件上查不出原 因。可以 通过TCP/UDP对该智能设备打数据,观察数据是否上传。若设备无数据 上传,或上 传不正确。可下站检查 【解决方法】:发现软件上配置错,重新配置设置。到站上检查时,先查看传感 器 外观是否有毁坏、连线是否有误是否有短路或断路现象、再查看传感器所接入的通 道与设计应该接是通道是否相符、线序是否正常。以上问题均不存在时需更换新的 传感器。
第三章 智能电表故障及处理方法
智能电表故障及处理方法:
【故障现象】:电表监控脱机,电表工作指示灯亮 【原因分析】:6010串口坏,通讯线坏 【解决办法】:观察电表电能指示灯是否正常,若电能指示灯正常,检查电表通 讯 线,若通讯线无问题,将电表通讯5口改6口,待中心重新加载数据,看监控是否可 恢复。若能恢复正常,则证明是SED6010的5口坏,同时中心注明电表用的是6口。如 果电表的6口被占用,则只能更换SED6010了。如果6口也坏了, 又没带6010,可以 通过RS485转232将电表通过232传输
系统维护概括
第一章Байду номын сангаас
基站传感器型号极其安装位置
第二章
传感器一般故障及误告的处理方法
第三章
动力环境介绍。

目录
动力环境监控系统介绍
1
动力环境监控功能介绍
2
动力环境监控产品介绍
3
系统概述
动力环境监控系统针对各种通信机房的设备特点和工作环境,对机房内的 交流配电设备、蓄电池组、UPS、发电机、空调、交换设备等智能、非智能设备 以及温湿度、烟雾、地水、门禁、安防等环境量实现“遥测、遥信、遥控、遥 调”等功能。 本监控系统充分利用了通讯传输设备所能提供的各种传输信道资 源,不但可以成功实现多级网管,使局站无人职守成为现实,而且高效率的使 用信道资源,为用户节约了大量的信道资源投入和运行维护投入,降低了用户 运营成本;监控中心软件可实现中文图形化人机界面的操作,界面更友好,功 能更强大,可实现对所有局站的全参数、全方位的监控,大大提高了用户的维 护管理效率。
灵活的配置管理功能
系统维护管理人员在一定权 限下,通过监控界面能方便 的实现对监控对象(设备及 设备类型)、区域、局站等 的增加、修改和删除的管理, 所有配置操作动态生效。 系统可对告警阈值、存储阈 值等参数进行远程配置和修 改。 系统可设置自定义告 警和告警关联 协议编辑和 界面编辑功能,强化了系统 的易用性、和兼容性
数据采集层
实现温湿度、烟感、门磁、水浸等传感器数据 采集;智能设备、UPS、智能电表、智能空调 等数据采集、红外报警数据。
UPS 交换传输设备 环境传感器
交直流变送器 智能电量仪 蓄电池 发电`机
目录
动力环境监控系统介绍
1
动力环境监控功能介绍
2
动力环境监控产品介绍
3
系统功能
直观的实时监控功能 完善的告警管理功能 灵活的配置管理功能 可靠的安全管理功能 丰富的维护管理功能
监控功能:实时监测内容
03 动环监控常见故障及处理要求

动环监控故障处理及要求1.设备本身故障:A.先在监控设备上的DC48接线端子上测有无DC48V,如无则检查直流线是否接好?是否有断路现象。
如还无电压则测量开关电源上的空开两端是否有电源,观察空开是否关闭;B.检查监控主板上的保险管(0.5A)是否熔断:直流电源线是否接反;主板线路有无被高压击断的痕迹。
C.若加不上保险则检查有无短路之处,若没有则应更换主板。
2.交流断电告警指三相交流电源断电,有以下原因造成:交流停电;交流传感器线断;交流传感器未给信号;设备不能上传信号。
排除方法:应检查交流传感器到告警箱的线是否接对或有没有断线,FSU至BTS的引线是否接对或是否断线;如以上都没问题,应更换主板。
3.开关电源设备故障指开关电源设备本身故障,有以下原因造成:开关电源设备本身故障;设备不能上传信号。
排除方法:应检查开关电源到告警箱的线是否接对或有没有断线或其模式是否选对,FSU到BTS的引线是否接对或是否断线;如以上都没问题,则应更换主板。
4.空调故障告警指空调本身故障,有以下原因造成:空调本身故障;设备不能上传信号;排除方法;应检查空调到告警箱的线是否接对或有内有断线或其模式是否选对,FSU到BTS的引线是否接对或是否断线;如以上都没问题,则应更换主板。
5.处理地水告警:先检查地水是否为误告警,主要有几点:首先看地上是否真的有水,再看水禁探头有无氧化或短路现象,若有就更换水禁探头;其次在看房子是否真的漏水。
若以上两种情况皆无,那就需更换主板。
完毕之后必须保证告警准确上传并与机房进行核对.否则扣除绩效5分。
6.处理烟雾告警:先检查烟雾是否有告警,若有先在监控主板上按下烟雾清除按钮,看烟雾能否正常消除。
若不能正常消除则要更换烟雾探头。
测试烟雾探头好坏可以这样做,点上一只烟对准烟雾探头吹烟,看烟雾探头上的红灯是否点亮,若亮则烟雾探头是好的,否则烟雾探头是坏的需更换。
烟雾探头的连接线必须认清正负极。
完毕之后必须保证告警准确上传并与机房进行核对.否则扣除绩效5分。
关于动力环境监控运行情况简单总结

关于动力环境监控运行情况简单总结 5 6 0 0 1 )
摘要: 动 力及 环境 集 中监控 系统 可以 实现对 分布 的 各个 独立 的 电源 系统 、 空调 系统 和 系统 内的各 个动 力 系统设备 、 机 房环 境进 行监 测和 控 制, 集 中监控供 电 系统 的应用 , 实现 了通信局 站 的少人或 无人值 守, 提 高供 电 系统 、 空调 系统 的可靠性 和通信 设备 的安全性 。 关键 词 : 动 力环 境 智 能单元 监控 单 元 软 件 硬件 中图分类 号: T P 2 7 3 文献标识码 : A 文章 编号 : 1 0 0 7 — 9 4 1 6 ( 2 0 1 3 ) 0 4 — 0 0 3 7 — 0 1
邯郸市与邯郸县所有模块局动力与环境监控系统一共有三套 系统 , 巨方动力 与环 境监 控系统 、 爱默 生PS MS 监 控系统 、 洲 际 WI N1 . 0 系统 。
用户管理有 系统管理员 、 系统 操作 员、 一般用户 。 2 . 3业务 管理 实时采集电池放 电、 故障记录 、 用户操作记录 、 实时数据记录等
1 . 4常 见 的 故 障 处 理
具有配置软件 , 根据配置软件设置告警条件 、 屏蔽功能, 量化数 据, 等功。
2 . 5常 见 故 障 处 理
( 1 ) 当监控通知智 能单元 中断 时, 到达现场 , 发现DH2 0 0 0 监控 单元上与智能通信指示状 态正常 , 智能单元同D H2 0 0 0 监控指示状 态也正常 , 仔细查看 , 发现智 能单元面板上一个按键被卡住, 没有弹 起, 将 按键恢复正常 , 询 问监控 中心故障恢复 。 ( 2 ) 巨方监控 不仅 能 监控动力环境量 , 集 中还有一个功能那就是用智能卡进行开 门, 当 巨方监控 中机房 中的监控 单元DH2 0 0 0 故 障更换时 , 存在两个小 问 题, 一个智能 单元 的协议需要 更换 , 另一个就 是所有 打开 此机房 门 的维护 人员的 门禁卡的信息 需要 监控 中心重新刷新 。 ( 3 ) N刚维护 巨方 监 控 时 , 经常 收到 监 控 中心 通 知 的某 机 房 的通 讯 闪 断 , 传 输 测 试为机房侧 的2 M问题 , 现场到达机房 , 打开通 讯模 块发现2 M端子 工程 队在施工 时没有将 金属屏蔽线用金属外套卡死 , 造成2 M线屏 蔽 接 触 不 良。 ( 4 ) 巨方监控爱默生组 合电源时 , 协议 正常 , 但 是 只 能 监控组合 电源的直流 电压 , 其它信号一概采集不到。 当出现直流 电 压低故 障时 , 只能到现场查看是什么 原因造成 的。
动力环境监控系统及其故障分析与处理doucin

动力环境监控系统及其故障分析与处理d o u c i n标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]动力环境监控系统及其故障分析与处理摘要本文首先对动力环境监控系统架构进行描述,着重阐述在实际运用中的组网传输方式,定义监控的对象;然后以实际的案例分析为基础,探讨如何运用不同的方法去解决故障问题。
关键词动力环境监控、故障案例分析、处理方法随着移动通信事业的飞速发展,对通信机房的电源动力和环境指标的要求不断完善,通信电源和空调的作用越来越重要,对通信机房动力环境集中监控系统的要求亦愈发严格。
良好的机房动力环境监控系统不仅可以及时上传代表机房动力指标和环境质量的各类数据,反映实时的告警信息,更可以方便维护人员进行后续故障排查处理并对特定的数据信息进行有效分析。
既可以达到对突发事件的及时响应,也能指导今后的实际工作。
通信机房在动力环境监控方面的根本需求和特点是需要首先掌握的,这是开展工作的前提条件。
而工作的目的则是及时解决问题并在今后的工作中作为理论依据加以分析研究。
1.监控对象从维护人员的视角出发,对监控对象的特性可以基本分为三类:按用途分类、按电特性分类、按性能分类。
按用途分类可以分为通信动力系统监控和通信环境系统监控。
其中通信动力系统包括高压配电、低压配电、开关电源、交流稳压器、UPS、整流器和蓄电池组等动力设备,通信环境系统包括机房用精密空调、门禁系统、温湿度、红外、烟雾、水浸、动态图像等环境量。
按电特性分类又可以分为两部分,除了按电量和非电量区分,也能按数字量和模拟量区分。
对于非电量,需要经过特定的传感器将非电物理量转换成适合采集设备的电信号,然后接入数据采集设备;对于电量,则通过变送器将其转换为适合采集设备输入范围的电信号。
而信号量与模拟量的区别在于,模拟量是随着时间轴连续变化的,数字量是时间和信号均为间断的,仅由“0”和“1”两种状态表示的。
按性能分类可以分为智能设备和非智能设备。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动力环境监控系统及其故障分析与处理摘要本文首先对动力环境监控系统架构进行描述,着重阐述在实际运用中的组网传输方式,定义监控的对象;然后以实际的案例分析为基础,探讨如何运用不同的方法去解决故障问题。
关键词动力环境监控、故障案例分析、处理方法随着移动通信事业的飞速发展,对通信机房的电源动力和环境指标的要求不断完善,通信电源和空调的作用越来越重要,对通信机房动力环境集中监控系统的要求亦愈发严格。
良好的机房动力环境监控系统不仅可以及时上传代表机房动力指标和环境质量的各类数据,反映实时的告警信息,更可以方便维护人员进行后续故障排查处理并对特定的数据信息进行有效分析。
既可以达到对突发事件的及时响应,也能指导今后的实际工作。
通信机房在动力环境监控方面的根本需求和特点是需要首先掌握的,这是开展工作的前提条件。
而工作的目的则是及时解决问题并在今后的工作中作为理论依据加以分析研究。
1.监控对象从维护人员的视角出发,对监控对象的特性可以基本分为三类:按用途分类、按电特性分类、按性能分类。
按用途分类可以分为通信动力系统监控和通信环境系统监控。
其中通信动力系统包括高压配电、低压配电、开关电源、交流稳压器、UPS、整流器和蓄电池组等动力设备,通信环境系统包括机房用精密空调、门禁系统、温湿度、红外、烟雾、水浸、动态图像等环境量。
按电特性分类又可以分为两部分,除了按电量和非电量区分,也能按数字量和模拟量区分。
对于非电量,需要经过特定的传感器将非电物理量转换成适合采集设备的电信号,然后接入数据采集设备;对于电量,则通过变送器将其转换为适合采集设备输入范围的电信号。
而信号量与模拟量的区别在于,模拟量是随着时间轴连续变化的,数字量是时间和信号均为间断的,仅由“0”和“1”两种状态表示的。
按性能分类可以分为智能设备和非智能设备。
非智能设备没有数据采集和处理的能力,需要通过采集器采集数据再接入监控系统。
智能设备本身具有一定数量的传感器和变送器,可以进行数据采集和处理,通过其智能设备协议规范,由智能接口直接与监控系统进行通信。
一般在实际应用中,选择以下四种性质的参数进行监控:遥测量(AI)、遥调量(AO)、遥信量(DI)、遥控量(DO)。
对于监控系统,AI/AO代表模拟信号的输入/输出,DI/DO代表数字信号的输入/输出。
在通信机房里,动力环境监控的实体对象有:高/低压配电、交流配电屏、整流屏、直流配电屏、蓄电池组、逆变器、UPS、精密空调、环境指标、门禁系统、动态图像等。
2.传输方式动力环境监控系统的传输资源比较丰富,可以根据实际情况采用不同的传输介质和组网方法。
在实际应用中,主要使用了2M资源和数字公务通道。
2M资源又称为E1线路,是基于公司现有传输设备,诸如SDH提供。
2M线路将一个2048kbps的比特流分成32个64kbps的通道,每个通道就是1个时隙,由0到31编号,其中的0时隙作为交换机之间同步用,其余的时隙则用来承载其他业务。
利用时隙分接复用设备可以将2M(E1)线路按照不同的时隙分成若干通道提供给多个设备使用,这大大提高了数据传输的能力。
数字公务通道提供V.11接口/标准的RS232接口/RS422接口,可以直接使用。
3.组网方式动环监控系统采用E1接入设备的2M组网方式,由图1所示。
图1 监控组网方式这种方式的主要优点在于传输可靠,若有监控动态图像传输的话,其传输实时图像的效果比较好(实时图像对带宽的要求比较高,模拟图像数字化后大约有100M,经过压缩可以达到384K~2M之间)。
在端局,我们使用了前置机下挂不同总线,进而在每条总线下连接MISU,EISU,BMU,HVBMU等,对机房的动力环境进行全面监控。
前置机系统作为网管系统数据采集的核心,集中管理采集模块,前置机的工作方式是以总线为单位扫描数据,每条数据扫描总线可以并行独立地工作。
根据端局的物理位置,可以进行优化处理,比如一台前置机可以接入一个较大的区域里所有的采集分析设备。
通过SDH/PDH线路进行传输,将端局的监控参数体现在业务台并存储于数据库服务器内。
通过业务台,工作人员就可以方便查询到整个系统的详细情况。
监控系统的及时数据上传,告警准确反映,报表查询统计,动态图像管理等都可以在监控业务台直观地展现。
4.故障处理及案例分析客观地说,设备在运行过程中出现故障和告警是难以避免的,尤其是突发性的故障。
维护人员除了需要规范完成日常和周期性的例行维护之外,还必须掌握对于突发性故障和告警的维护处理办法。
这就要求在业务技能方面和操作规范方面都有较强的能力,这样就可以做到尽快消除故障和隐患,以便用最短的时间恢复设备的稳定运行,保障机房动力环境指标。
故障处理的基本方法是将造成故障可能的原因汇总,在一个大集合内分解成若干小的子集,把复杂问题一步一步简单化,排查定位后采取适当的方法解决故障,流程如图2所示。
图2 故障处理流程遵循以上的故障处理流程,根据不同的问题采用具体的方案,就可以快速准确地判断故障原因,找出故障点,最后解决故障问题。
下面根据不同案例的分析,进行初步的探讨。
4.1逐步排除法故障产生的原因十分复杂,但是,在统计学上分析,各种因素同时作用并导致设备发生故障的概率是很小的,而设备故障成因在某一具体时刻具有单一性。
因此,在处理实际故障告警时,利用逐步排除法可以大大缩小故障范围,加快故障定位。
案例1:动环监控显示某汇接机房出现B相电压欠压告警。
工作人员赶到现场后,发现HC6000表所示B相电压为200V。
由于机房其他设备均运行正常,并且实测三相供电电压正常,所以怀疑是HC6000表出现故障。
现场使用万用表测量表内端点的电压情况,实测数据显示B相电压为200V,与监控系统数据一致,故排除是由HC6000表故障造成。
用万用表测量为HC6000表供电端三相电压,显示正常。
排除总闸到一次侧之间线路有问题。
继续测量二次端,发现B相电压为200V,则断定故障点在二次侧。
再仔细观察,发现二次侧的线路被进线管压迫,可能造成线路端子虚接。
将端子紧固之后,HC6000表B 相电压恢复正常,故障处理完毕。
4.2替换法在监控系统中,不管采取什么样的组网方式和使用多么复杂的设备,我们都可以将各个组成部分单独处理。
当设备出现故障或告警的时候,模块化的组织结构可以让工作人员很便利地更换故障部件,快速解决故障问题。
只要有多余的正常备件,工作人员就可以用之替换怀疑有故障的模块,如果问题得以解决,则说明是模块确实产生故障。
案例2:动环监控显示某汇接机房门禁无法正确上传开关门数据。
工作人员现场测试,发现开关门和门禁电源均正常,怀疑门禁控制器上传数据出现故障。
现场更换一套新的门禁控制器,所有监控量恢复正常。
案例3:动环监控显示某通信枢纽交换机房MISU数据无法正常上传。
工作人员到达现场后,测试出MISU-S板件电源模块故障。
更换一套新的MISU-S集成电路板,检查核对地址拨码,连接各走线后上电运行。
将PC连接MISU-P板读数据正常,电源模块温度正常,MISU恢复正常运行。
4.3对比法在整个监控系统中,受控设备的种类很多,但是每一种类的设备数量也是很多的,所以可将故障设备与正常设备之间做全面的对比,从数据配置到实际安装进行比较,然后分析解决故障。
案例4:动环监控显示某通信枢纽电力机房1#温湿度传感器高温告警。
工作人员到达现场,用温湿度测量仪进行测量,机房温湿度指标合格,说明故障原因是1#温湿度传感器造成。
查看数据配置,对比机房内同样类型的2#温湿度传感器配置,发现这两个温湿度传感器均为电流型,但是1#在配置选项上设置为电压型,更改后温度显示正常。
4.4解析法监控系统中,主控设备与受控设备之间的信息传递依靠两者之间透明的通信协议,在有些情况下,机房设备制造商的协议无法准确区分不同的告警量,所以工作人员必须在故障发生的时候通过经验和搜集到的信息做出合理的判断,将一个混合的信息解析为一个单一的信息,准确定位故障点和故障原因。
案例5:动环监控显示某通信枢纽IT机房3#精密空调2#压缩机高压告警。
工作人员现场检查该精密空调2#压缩机两侧吸排气压力,发现压力值并不高,反而出现压力值偏低,首先可以排除真正的高压告警。
进一步测试压缩机温度,确定吸气温度过高。
联系厂家工程师后,确认在该品牌精密空调,压力信号和温度信号是串联的,统称为高压告警,所以实际上这是一个温度过高告警。
那这是为什么造成的呢?因为在精密空调制冷过程中,如果制冷剂偏少,可能会造成压力降低,这时在压缩机吸气口的温度就会相应上升,所以会产生此处的高温告警。
工作人员仔细检查精密空调制冷环路,发现在回气口处针阀形变产生制冷剂泄漏。
更换新的针阀后充入适量的制冷剂,系统重新恢复正常,设备运行稳定。
4.5理论指导法在监控系统的安装调试过程中,由于系统纷繁复杂,难免会出现小的疏漏,并可能导致在工作中出现各种不准确的监控数据,严重的甚至产生误告警。
如果出现这样的情况,工作人员应当及时记录案例,寻求合理的解决方案,在理论上建立正确的体系,便于指导以后的工作。
案例6:动环监控系统显示某通信枢纽IDC机房1#温度数据与其他温度数据相差过大,不具有代表性。
现场勘察后,发现1#温湿度传感器安装位置不合理,处于设备散热出风口正对位置,更换合理的安装点后数据能正确代表机房环境量。
通过理论分析得知,温湿度传感器的安装应当尽量避免设备出风口,精密空调出风口和风路死角等位置,这样才能获得一个稳定的具有代表性的温湿度数据。
同样的道理,机房水浸传感器应当避免处于布线沟道的最下方而受到潮气的干扰产生告警。
在集中监控系统中,在数据库的支持下,工作人员可以方便地对设备运行情况进行汇总和统计,在报表业务台上可以得到清晰的周期报表和曲线图。
这使得我们可以在宏观上随时掌握整个系统的运行状况,因而在查询周期内发生的变化也可以得到直观的反映,甚至可以在故障和告警发生之前就及时发现问题,防范险情于未然。
5.总结在环境能源问题十分突出的今天,中国移动天津公司积极响应国家号召,在各个方面采取措施节能减排,采用动力环境集中化监控的根本目的是为了提高设备的维护管理质量,降低系统设备维护成本,提高整体工作效率,实现节约人力成本和能源消耗。
我们需要深入监控系统的系统架构,在宏观的组网与分配和微观的设备信号采集点都要有足够的理解,依靠所掌握的大量信息分析故障告警,优化监控中存在的各种问题。
实际工作中遇到的问题千变万化,只有不断丰富知识,积累经验,总结教训,才能在维护中合理解决故障告警,保障通信设备和环境指标正常稳定。