DMHS-H自动转报系统硬件故障分析
浅析自动转报系统主备双机工作原理

浅析自动转报系统主备双机工作原理发布时间:2022-03-14T01:39:24.733Z 来源:《科技新时代》2022年1期作者:周垚[导读] 为适应中国民航快速发展的需要,使现有转报技术更进一步, DMHS 航空电报和信息交换系统根据中国民航业务要求设计,遵循国际民航组织附件十(I C A O A N N E X 1 0)标准及国际航空电信协会S I T A 电报处理程序(Operating Procedures for Message Handling)标准,创造出一个功能强大的AFTN 与SITA 电报和数据自动交换的通信系统,采用存储/ 转发方式,无须人工干预,完全由计算机处理。
它提供各种报文格式的兼容,可以方便地同国内外各种标准转报系统相连,并充分利用现代化的软件技术,提供保证航空信息完整性的双机容错处理。
它采用通用的操作系统及数据库,易于升级及移植。
DMHS 航空电报和信息交换系统可靠性高、操作简单、方便灵活、自动化程度高、便于测试、可升级。
单位:中国民用航空华北地区空中交通管理局内蒙古分局邮编:010010摘要:为适应中国民航快速发展的需要,使现有转报技术更进一步, DMHS 航空电报和信息交换系统根据中国民航业务要求设计,遵循国际民航组织附件十(I C A O A N N E X 1 0)标准及国际航空电信协会S I T A 电报处理程序(Operating Procedures for Message Handling)标准,创造出一个功能强大的AFTN 与SITA 电报和数据自动交换的通信系统,采用存储/ 转发方式,无须人工干预,完全由计算机处理。
它提供各种报文格式的兼容,可以方便地同国内外各种标准转报系统相连,并充分利用现代化的软件技术,提供保证航空信息完整性的双机容错处理。
它采用通用的操作系统及数据库,易于升级及移植。
DMHS 航空电报和信息交换系统可靠性高、操作简单、方便灵活、自动化程度高、便于测试、可升级。
浅谈DCS系统故障及隐患

浅谈DCS系统故障及隐患随着工业自动化水平的不断提高,分散控制系统(DCS)在工业生产中扮演着越来越重要的角色。
DCS系统的稳定运行对于工业生产的正常进行至关重要。
随着系统的使用时间的增加,系统故障和隐患也随之而来。
本文将围绕DCS系统故障及隐患展开讨论,探讨如何有效地预防和应对这些问题。
DCS系统故障的种类繁多,主要包括硬件故障、软件故障、通信故障以及人为因素等。
首先我们来谈谈硬件故障。
硬件故障是指DCS系统在使用过程中出现的硬件部件损坏或失效的情况。
这些硬件部件包括CPU、I/O模块、电源模块、通讯模块等。
通常,硬件故障是由于长期使用或者恶劣的工作环境所导致的。
其次是软件故障,软件故障是指DCS系统中软件模块出现异常或者崩溃的情况。
这种故障通常是由于软件程序设计不当、版本更新不及时等原因引起的。
再者是通信故障,通信故障是指DCS系统中各个节点之间无法正常通信的情况。
最后是人为因素,人为因素是指人为操作不当或者疏忽大意所导致的故障。
针对这些故障种类,我们可以采取一些有效的预防和应对措施。
对于硬件故障,我们应该定期对系统中的硬件设备进行检测和维护,及时更换老化部件,提高系统的稳定性和可靠性。
对于软件故障,我们应严格按照制定的程序进行软件的升级和维护,及时修复软件中的bug,避免出现不必要的故障。
对于通信故障,我们需要确保系统中各个节点之间的通信设备正常运行,采用双重通信链路设计,确保通信的稳定性。
对于人为因素,我们应该加强对操作人员的培训和考核,提高其对系统的操作技能和责任意识,减少人为因素导致的故障发生。
除了以上提到的故障类型外,DCS系统还存在一些隐患问题,这些隐患问题可能并不会直接导致系统的故障,但是一旦暴露出来就可能对系统的稳定性和安全性造成严重影响。
系统的安全防护漏洞、系统的抗干扰能力等。
系统的安全防护漏洞可能会导致系统遭受网络攻击,系统的抗干扰能力不足可能导致系统在恶劣环境下无法正常工作。
DCS硬件故障分析与处理

DCS硬件故障分析与处理作者:余丽娟来源:《科技视界》 2014年第10期余丽娟(新疆石河子职业技术学院,新疆石河子 832000)为提高生产效率和企业整体效益,近些年,我国各地企业,尤其是电厂、化工厂都开始采用DCS集散控制系统对工业生产过程进行实时监控。
由于生产装置的特点是连续化大生产,对自动化控制水平的要求较高,因而对DCS硬件的完好率要求非常严,一旦发生硬件故障便要求DCS维护人员迅速判断故障点,并及时排除。
然而,要排除DCS硬件故障难度很大,原因之一是厂家不提供DCS系统完整的电路图;原因之二是即使知道某个模块发生故障,也绝不允许在生产周期内在线进行检修。
而DCS模块离线后会失去供电回路和信号回路,很难检测和寻找出损坏的元件。
现针对这些困难,结合经验以一些常见的DCS硬件故障为例进行探讨。
硬件故障相对于软件故障来说能较为直观地发现,维修的基本方法就是更换模块。
根据故障指示灯和故障现象判断故障模块是检修的关键,盲目的更换会带来不必要的损失。
1 IO模块COM灯闪烁的故障处理首先,检查有没有不工作的模块,如果电源灯都不亮,应将其拔下再观察;接下来,判断模块本身有没有问题。
将模块插入到别的站,观察是否有同样的问题发生,如果没有发现问题,则基本说明该模块正常。
如果离线的模块没有问题,可采用按一定的顺序拔模块,直至模块通信正常,再重点检查最后一个拔下来的模块。
如果是模块在本站其他位置通信正常,而只是在特定的位置不好,则说明和模块的底座、地址和通信信号质量问题有关。
最后,判断地址有没有重复的。
数清楚此站设备组态中一共组了多少个模块,再数清楚此站目前一共插入了多少个模块,再看清楚上位机的设备状态图共有多少个会模块在线,如果数据一致,则说明正常,如果数据不一致,则说明有模块使用的地址不对。
2从机error灯闪烁的故障处理对于主机error灯闪烁表示没有符号表,或者在运行过程中检测到符号丢失或被破坏,对于该类问题,一般可以通过codesys登录到主控后点击“在线”,“下载启动工程和符号表”或者重新做一次完整的增量下装。
DCS故障处理总结

DCS故障处理总结DCS(分布式控制系统)是一种广泛应用于工业生产过程中的自动化控制系统,用于监测和控制生产过程中的各种设备和参数。
然而,在使用过程中,DCS系统也会遇到各种故障,需要及时处理。
本文将总结一些常见的DCS故障及其处理方法,希望对读者有所帮助。
一、DCS系统故障分类1. 硬件故障:包括主机故障、I/O模块故障、通信模块故障等;2. 软件故障:包括DCS系统软件故障、数据库故障等;3. 通信故障:包括网络通信故障、PLC与DCS通信故障等。
二、DCS系统故障处理方法1. 硬件故障处理硬件故障是DCS系统故障中比较常见的一种,需要及时处理才能保证生产系统的正常运行。
(1)主机故障处理主机故障通常是因为硬件老化、供电异常、风扇故障等原因造成的。
处理方法包括:- 检查主机供电是否正常,确认电压、电流是否符合要求;- 检查风扇是否正常运转,否则需要更换;- 如果以上方法都不能解决问题,可能需要更换主机。
(2)I/O模块故障处理I/O模块故障通常是因为硬件老化、灰尘、湿气等原因造成的。
处理方法包括:- 清洁I/O模块及接口处的灰尘,确保良好的接触;- 检查电缆连接是否正常,如有需要进行更换;- 如果以上方法都不能解决问题,可能需要更换I/O模块。
(3)通信模块故障处理通信模块故障通常是因为网络故障、电源故障等原因造成的。
处理方法包括:- 检查通信模块与网络的连接是否正常;- 检查通信模块的电源供电是否正常;- 如果以上方法都不能解决问题,可能需要更换通信模块。
2. 软件故障处理软件故障是DCS系统故障中比较复杂的一种,需要有一定的技术经验和专业知识才能进行处理。
(1)DCS系统软件故障处理DCS系统软件故障通常是因为程序错误、配置错误、数据库错误等原因造成的。
处理方法包括:- 根据错误提示信息进行初步判断,查找错误原因;- 检查程序配置是否正确,如有需要进行修改;- 检查数据库是否正常,如有需要进行修复。
DCS系统常见故障分析

DCS系统常见故障分析DCS(分散控制系统)是一种广泛应用于工业自动化领域的控制系统,其功能包括数据采集、控制、监控和调度等。
由于DCS系统的复杂性,故障难免会发生。
下面将介绍DCS 系统常见的故障,并分析其原因和解决方法。
一、通信故障:通信故障是DCS系统中最常见的故障之一。
通信故障的原因很多,包括网络故障、通信协议错误、通信设备故障等。
解决通信故障的方法一般包括检查网络连接状态、检查通信设备的工作状态、检查通信协议设置是否正确等。
二、硬件故障:硬件故障也是DCS系统中常见的故障之一。
硬件故障的原因可以是电路板损坏、电源故障、存储设备故障等。
解决硬件故障的方法一般包括更换损坏的硬件设备、修复损坏的电路板、更换电源等。
三、软件故障:软件故障是DCS系统中比较常见的故障之一。
软件故障的原因包括编程错误、软件版本不匹配等。
解决软件故障的方法一般包括检查编程代码是否正确、升级软件版本等。
四、数据丢失:数据丢失是DCS系统中一种非常严重的故障。
数据丢失的原因可以是硬件故障、软件故障、病毒攻击等。
解决数据丢失的方法一般包括恢复备份数据、修复损坏的存储设备、增强系统的安全性等。
六、人为操作错误:人为操作错误也是DCS系统中常见的故障之一。
人为操作错误的原因包括操作不当、误操作等。
解决人为操作错误的方法一般包括加强培训、设置权限管理等。
DCS系统常见的故障有通信故障、硬件故障、软件故障、数据丢失、电力故障、人为操作错误等。
对于以上故障,解决方法一般包括检查网络连接状态、检查通信设备的工作状态、更换损坏的硬件设备、检查编程代码是否正确、恢复备份数据等。
为了预防故障的发生,还需要加强系统的维护和管理,并提供培训,提高操作人员的操作技能。
通过DMHS转报系统进程日志判别系统状态

通过DMHS转报系统进程日志判别系统状态
钱锋
【期刊名称】《电脑知识与技术》
【年(卷),期】2017(013)029
【摘要】当前全民航大范围使用北京航管科技DMHS系列转报系统,DMHS转报系统的核心软件-DMHS进程拥有各自的LOG日志以记录转报系统的运行状态.在转报系统故障处理与日常运维时,及时查看分析相应DMHS进程的LOG日志对故障进行准确定位,判断系统当前的运行状态,有利于值班人员做出相应处理,及时采取应急措施,合理实施通报流程,周期性分析转报系统的运行状态并进行相应维护,对于转报系统故障及系统状态的判别具有实际意义,提高转报系统故障处理与日常运维的水平.
【总页数】3页(P262-264)
【作者】钱锋
【作者单位】民航华东地区空中交通管理局网络中心,上海200335
【正文语种】中文
【中图分类】TP311
【相关文献】
1.如何维护DMHS-M自动转报系统 [J], 李惠玲;
2.分布式DMHS转报系统探究 [J], 殷国恒
3.自动转报DMHS-H系统远程维护探析 [J], 李岩
4.浅谈DMHS-H自动转报系统及维护中的几则案例 [J], 张鑫
5.DMHS-M型自动转报系统维护与维修实例 [J], 侯海坤
因版权原因,仅展示原文概要,查看原文内容请购买。
DMHS-M型自动转报系统维护与维修实例

DMHS-M型自动转报系统维护与维修实例
侯海坤
【期刊名称】《通讯世界》
【年(卷),期】2018(025)012
【摘要】自动转报系统用于全国各机场之间的电报传输,传递管制、气象、情报、航空公司、省局等重要部门的电报是机场的信息枢纽,更是空中交通管制部门传递航班动态信息的主要手段,在维护空中交通秩序、保证民用航空安全和飞行正常中起着重要作用.近年来,民航高速发展,随着航班量的不断增加,安全问题日益凸显,管制部门对自动转报系统的依赖程度也越来越高,所以自动转报系统的正常通信是实现空管安全、飞行安全的重要基础[1].民航内蒙古空管分局使用的是DMHS-M型64路自动转报系统,本文从这套自动转报系统硬件、软件、日常维护和现存问题等几方面谈一些维护心得.
【总页数】2页(P247-248)
【作者】侯海坤
【作者单位】民航内蒙古空管分局呼和浩特市白塔机场,010070
【正文语种】中文
【中图分类】V351.3
【相关文献】
1.如何维护DMHS-M自动转报系统 [J], 李惠玲;
2.如何维护DMHS-M自动转报系统 [J], 李惠玲
3.OEC 7900 C臂机维修实例及三级维护保养方案 [J], 王非
4.中波广播发射台设备维护、维修、改造实例 [J], 尹雪雯
5.UPS不间断电源的维护及维修实例 [J], 农俏梅
因版权原因,仅展示原文概要,查看原文内容请购买。
DCS系统常见故障分析

DCS系统常见故障分析DCS(分散控制系统)是一种先进的自动化控制系统,广泛应用于工业制造、发电、化学等领域。
然而,由于各种原因,DCS系统有时也会出现故障。
在此,我们将着重介绍DCS 系统的常见故障及其原因分析。
一、硬件故障1. 电源故障DCS系统需要稳定的电源供应,当系统电源出现问题时,整个系统都会崩溃。
电源故障原因可能是设备本身问题、电源设备配置问题或者供电环境的一些因素等。
2. 风扇故障风扇故障是DCS系统硬件故障的常见原因之一。
如果散热风扇无法正常运转,易导致设备过热,甚至损坏设备。
3. 外设故障与DCS系统相关的外设包括打印机、通信设备、存储设备等。
这些外设的故障会影响到DCS系统的正常工作。
4. 信号缆线故障信号缆线的质量对DCS系统的正常运行至关重要,一旦线路遭受损坏或接线不准确,在数据传输方面就会产生各种问题。
例如,它可能导致数据的失真或延迟。
1. 系统死机当DCS系统操作失常时,可能会导致系统死机。
当发生这种情况时,系统将无法响应电脑输入并显示错误信息,导致整个控制系统失效。
2. 通讯中断DCS系统中的通讯中断是指控制器无法与其他设备或系统通信。
通讯不良的原因可能包括设备配置错误、网络不稳定或通讯协议不兼容等。
3. 数据错误DCS系统的计算完全依赖于数据的准确性。
数据错误可能导致系统出错并影响整个控制过程。
例如,可能会导致过程控制方案失败,对产品质量产生影响。
三、人为因素1. 操作失误DCS系统中的操作失误是指由于人为操作不当而导致的故障。
例如,当操作员在更改设置参数时,如果参数值设置错误,可能会导致控制器处理错误的数据,从而导致操作失误。
2. 声音和各种视觉提示的忽略人员可能忽略警报和画面提示,从而导致某些关键数据暴露在控制系统之外。
这样会影响整个工艺过程的稳定性和安全性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DMHS-H自动转报系统硬件故障分析
引言
民航自动转报系统是民航系统最重要的通信基础设施之一,主要承担飞行
情报、管制、气象、机场和航空公司等单位与飞行有关的信息交换。
自动转报业
务覆盖民航所有机场,各单位通过自动转报系统交互当地的实时天气状况、领航
计划、飞机起降等信息,以报文的方式提供给空管、机场和航空公司,作为飞行
的参考数据。
目前民航空管系统大部分使用民航空管技术装备发展有限公司生产
的DMHS-H自动转报系统。
本文通过分析处理近年来该系统发生的硬件故障,并
提出相关建议,以供同行参考。
关键词:转报系统,GPS,信道,报文
一、DMHS-H自动转报系统的硬件结构简介
DMHS-H自动转报系统(下面简称转报系统)硬件由主机服务器系统、通信设
备和外围设备组成(见图1)。
主机服务器系统包括主机、磁盘阵列。
通信设备
包括智能集中器、智能程控同步单元、智能程控异步单元、MODEM、交换机组成。
外围设备包括GPS、电平转换器、IP终端、管理终端等。
图1 自动转报系统硬件组成
转报系统采用双机双网的结构。
这种结构使得转报系统不仅主备用服务器具
有双机热备功能,在智能集中器、交换设备、外围设备和网络结构上同样具有冗
余热备份功能。
这种“双机双网”技术可以有效避免系统出现单点故障,特别是
切换时刻,这种备份结构能够实现主备机或两个网络的无缝切换。
二、硬件故障分析及处理
近年来,转报系统出现过一些硬件故障。
由于系统采用双机双网结构,大部
分故障不会影响系统正常运行,但是有些硬件问题仍然直接影响了系统正常性,
因此相关运维人员需要了解及警醒。
1.GPS时钟源跳变造成转报系统GPS同步进程失效
故障现象:转报主备机后台时间与GPS时间相差1分钟,系统后台时间未能
自动修正。
原因分析:转报系统后台时间与GPS授时是通过DMHS_GPS进程进行同步,
为规避自动转报主备机与异步单元、前置机等设备的10s超时告警机制,设备厂
家在该进程自动校正的时间门限值为(3-8)s,超过此门限值后不再同步GPS授
时源的时钟,导致主备机后台时间不再自动修正,需人工调整配置进行时钟校正。
处置方法:
1)先进行转报系统备机的时钟校正。
1 进入转报系统备机后台,查看GPS进程目录内容;
2 查询GPS同步进程号:ps–ef|grep gps
3 停止DMHS_GPS进程:#kill -9 XXX(XXX表示进程号)
4 打开GPS_CONF文件,将该配置文件中MAX_GAP XXX值修改为大于目前差
异的秒数,并保存该配置;
5 重启DMHS_GPS进程:#./DMHS_GPS(Linux系统)
6 查看进程启动日志文件,检查进程启动是否成功:
#cd /log
#vim DMHS_GPS.XXXX(XXXX代表操作当天日期,Linux系统)
7 查看进程记录日志文件,检查进程同步GPS时钟是否生效
#cd /log
#tail timer.log
8 查看转报系统时间是否与GPS时间一致:#date
9 转报系统时间校正后,将GPS_CONF配置文件中MAX_GAP参数修改回8,
并按照上述2、3、4、5步骤重启DMHS_GPS进程。
2)在完成系统备机时钟校正工作后,对系统主机的时钟校正操作,操作与备
机校正时钟步骤一致。
建议:由于自动转报所承载的报文中涵盖对时效性要求较高的报文类型,如AIDC电报、气象电报等,GPS授时校正对于自动转报系统转发报文的日时组的正
确性较为重要,因此,建议维护单位应建立对GPS时钟源校对、GPS时钟同步进
程的定期检查机制以及操作指南,以防止GPS时钟源跳变造成GPS时钟同步进程
与GPS时钟源同步时钟策略失效的隐患。
另外转报监控系统中未能主动对其进行告警提示,仅在系统后台日志中作记录,丧失了第一时间发现并校正自动转报系统服务器时钟的时机。
建议设备厂家
改进告警功能,提供主动告警的功能设置,以提高故障发现、处置的及时性。
2.主用服务器1#硬盘故障导致系统不能正常处理报文
故障现象:系统前台卡死,前置机监测重要系统路信道的屏幕收报正常滚动,系统软硬件均无告警,但系统不能正常处理报文。
处置方法:
1)初步判断为该系统异常,快速将业务切换到备用系统,确保业务正常性。
2)故障系统进行排故,出现非常见情况:
1 用命令重启主用服务器,无效;
2 将主用服务器断电5分钟后重启,可正常开机,但本地1#硬盘红灯告警;
3 进入主用服务器后台,执行双机命令:#./dmhs_afs,未启动成功;用命
令关闭转报软件:#./dmhs_stop,再执行双机命令,开启转报软件,系统恢复正常。
4 更换主用服务器本地1#硬盘,系统保持正常运行。
原因分析:
1)主用服务器本地1#硬盘故障时,Raid1失效,导致主用服务器的文件系统
被锁,因此备用服务器检测到主用服务器故障并开始接管主机角色时,由于主用
服务器未能完全释放系统资源,造成主、备机自动切换异常,进而引起此系统不
能正常处理报文。
2)主用服务器硬件故障导致的文件系统被锁,也造成管理终端的连接没有响应,故系统无法将告警信息推送至管理终端进行告警提示。
3)此硬件原因导致转报业务失效,主、备机切换异常的问题,因后台不能及
时向管理终端推送告警信息,只能依靠人工操作时被发现。
建议:
1)在出现主用系统不能正常处理报文时,应快速启用备用系统,可有效缩短
业务中断时间。
如果没有备用系统,则通过断电及重启故障服务器的方法,可快
速恢复系统的功能。
2)日常巡视时应采用操作监控软件等手段,以及时发现系统隐蔽性高的故障。
3)协同厂家对转报应用软件增加保护性措施、完善检测和告警机制。
3.自动转报系统异步单元故障
故障现象:超级终端上出现100.100.100.231异步单元断线告警信息。
处置方法:
1)检查该异步单元另一个网口工作情况,正常,表明业务不受影响。
2)分析及排查该网口故障原因:
1 断线告警信息在时间上没有规律,先排查网线是否正常,接口连接是否松动。
2 查看转报低速操作进程日志,发现如果转报机10秒没有收到异步单元的信息,就会发出内部告警信息,10秒以上仍旧没有收到信息,就会在日志中写入网口超时的信息。
3 分析交换机的工作日志,发现对应的交换机接口出现down,又快速up的信息。
4 通过以上分析,判定该异步单元低速网口故障所致。
3)更换异步单元。
建议:
1)涉及异步单元故障时,第一时间确认相关用户的业务是否受到影响。
如果业务有受到影响,则以快速恢复业务为原则,采用相应措施如主备系统切换、修改信道、更换异步单元等。
2)异步单元用户正常的情况下,更换异步单元应选择用户报量较小时进行。
三、结语
转报系统是民航空管最重要的通信基础设施之一,系统正常与否直接影响航班正常性。
因此作为维护人员,只有不断提高对转报系统的维护保障能力,提升维护效率,才能更好为民航安全飞行提供有力可靠的保障。
参考文献:
【1】《DMHS用户使用手册》,北京航管科技有限公司
【2】《DMHS超级终端软件使用手册》,北京航管科技有限公司【3】杨静.转报系统异步用户的接法分析.硅谷.2013年13期。