硬件可靠性及提高
电子行业中存在的产品可靠性问题及改进建议

电子行业中存在的产品可靠性问题及改进建议一、引言在现代社会,电子产品已经渗透到我们的生活和工作的方方面面。
从智能手机到家用电器,从医疗设备到交通工具,几乎所有领域都离不开电子技术和产品。
然而,随着电子行业快速发展,产品可靠性成为该行业亟待解决的一个重要问题。
本文将介绍电子行业中存在的产品可靠性问题,并提出改进建议。
二、电子产品可靠性问题分析1.设计缺陷造成的故障许多电子产品故障是由于设计缺陷引起的。
例如,在某些智能手机中,常见的问题是屏幕断裂或自动死机。
这些问题可能源自于设计师对材料选用和结构强度没有进行全面评估和测试。
2.制造过程中的不良品质控制生产过程中存在质量控制不严格或者设备老化等因素导致出现产品故障。
这种情况在许多廉价电子设备中尤为突出,因为生产成本往往被抑得非常低,从而牺牲了质量控制环节。
3.物理或环境损坏电子产品在使用过程中容易受到物理冲击、湿度、温度等环境因素的影响而出现故障。
这些损坏通常是不可预测的,但可以通过设计更耐用的外壳和更好的防尘、防水措施来降低发生的可能性。
三、改进产品可靠性的建议1.加强质量管理体系电子行业应该加强对质量管理体系的重视,建立完善的质量保证和质量控制流程。
公司应该确保所有员工都了解和遵守这些流程,并且进行持续改进以提高产品质量可靠性。
2.优化设计与测试过程设计师应该积极参与产品测试,并将其反馈融入到后续设计中。
同时,通过使用先进的仿真软件和设备测试技术,可以更全面地评估产品在各种场景下的性能和可靠性。
3.扩大硬件寿命周期评估为了确保电子产品长期可靠运行,必须对关键组件和芯片进行寿命周期评估。
如果发现某些部件存在问题,应尽早替换或升级,以避免可能的故障。
4.提高包装和运输质量在电子产品的包装和运输过程中,许多损坏是可以避免的。
因此,应该加强对运输中的冲击、震动和温度变化等因素的控制,并使用更耐用的包装材料来保护产品。
5.加强售后服务和用户培训为了及时应对可能出现的问题,电子产品公司应建立完善的售后服务体系,并向用户提供准确有效的技术支持。
计算机硬件系统的可靠性评估与可维护性设计

计算机硬件系统的可靠性评估与可维护性设计计算机硬件系统是现代社会中必不可少的一部分,其对于各行各业的运作起着至关重要的作用。
因此,确保计算机硬件系统的可靠性和可维护性显得尤为重要。
本文将探讨计算机硬件系统的可靠性评估和可维护性设计。
一、可靠性评估计算机硬件系统的可靠性评估是指通过分析和测试来评估系统发生故障的概率和时间。
这可以帮助我们评估系统的健壮性,从而提前采取措施来预防故障的发生。
1.1 硬件故障率评估硬件故障率评估是可靠性评估的一个重要指标。
它可以通过统计故障发生的频率和持续时间,来计算整个系统的故障率。
评估硬件故障率时,可以基于历史数据和实际测试来进行。
1.2 可用性评估可用性评估是指计算机硬件系统在正常工作状态下的可用程度。
可用性评估可以帮助我们了解系统的稳定性和工作效率。
通过对系统的硬件组件进行定期检查和测试,我们可以提前预防故障,并保持系统的持续可用性。
二、可维护性设计可维护性设计是指在计算机硬件系统的设计过程中,考虑到系统的可维护性和易维护性。
通过合理的设计,我们可以降低系统的维护成本,并提高维护效率。
2.1 模块化设计模块化设计是可维护性设计的重要手段之一。
通过将硬件系统划分为多个独立的模块,可以使每个模块都能够独立进行维护和更新。
这样,在出现故障时,只需替换或修复相应的模块,而不需要整体更换整个系统。
2.2 标准化接口在硬件系统的设计过程中,使用标准化接口是推动可维护性的关键因素之一。
通过使用标准化接口,可以简化系统维护的过程。
因为标准化接口具有普遍性和通用性,所以在维护和更新系统时可以更加方便和快捷。
2.3 易检测性在硬件系统的设计中,考虑到系统的易检测性也是非常重要的。
通过在系统中内置自我诊断和故障检测机制,可以帮助我们更快地检测到潜在的故障,并采取相应的措施进行修复。
三、经济性和环境性因素除了可靠性评估和可维护性设计外,经济性和环境性因素也需要在计算机硬件系统中考虑到。
硬件系统的可靠性设计:探讨硬件系统的可靠性设计原则、方法和实践

硬件系统的可靠性设计:探讨硬件系统的可靠性设计原则、方法和实践引言在现代科技发展的浪潮中,硬件系统的可靠性设计成为了一个至关重要的议题。
作为计算机、通信和其他信息技术领域的基础,硬件系统的可靠性直接关系到现代社会的安全、稳定与发展。
本文将探讨硬件系统的可靠性设计的原则、方法和实践,希望能为读者提供一些有用的参考。
硬件系统可靠性设计的原则原则1:冗余性设计冗余性设计是提高硬件系统可靠性的重要原则之一。
冗余性设计通过增加硬件系统中的冗余部件或路径来实现系统的冗余,使得当某个部件或路径发生故障时,系统可以继续正常运行。
例如,在服务器集群中,可以通过增加多个服务器来实现冗余性。
冗余性设计可以提高系统的容错能力,降低发生故障的风险。
原则2:动态测试和监测动态测试和监测是评估硬件系统可靠性的重要手段之一。
通过对硬件系统运行过程中的各种情况进行动态测试和监测,可以及时发现并修复可能存在的问题,有效提高系统的可靠性。
例如,在网络设备中,可以通过实时监测流量、延迟等指标来判断设备是否正常工作。
动态测试和监测可以帮助我们及时发现潜在的问题,并采取相应的措施,避免故障的发生。
原则3:优化设计和工艺优化设计和工艺是提高硬件系统可靠性的重要手段之一。
通过优化硬件系统的设计和工艺,可以提高系统的稳定性和可靠性。
例如,在芯片设计中,可以采用更先进的工艺和更合理的布局,来提高芯片的性能和可靠性。
优化设计和工艺可以降低系统的故障率,提高系统的可靠性。
原则4:合理布局和规划合理布局和规划是提高硬件系统可靠性的重要原则之一。
通过合理布局和规划系统的硬件组成部分,可以降低故障的发生率,提高系统的可靠性。
例如,在数据中心中,可以将服务器和网络设备按照一定的规划方式进行布局,避免因为部件放置不当导致的故障。
合理布局和规划可以降低硬件系统的故障风险,提高系统的可靠性。
硬件系统可靠性设计的方法方法1:MTBF分析MTBF(Mean Time Between Failures)分析是一种常用的硬件系统可靠性设计方法。
硬件设计中的可靠性分析与优化

硬件设计中的可靠性分析与优化在当今科技快速发展的时代,硬件设计已经成为了许多行业的核心。
从个人设备到复杂的大型系统,都需要稳定可靠的硬件来保障其功能的正常运作。
然而,在实际的环境中,硬件设备往往会因为种种原因出现故障,对于这种情况,可靠性分析与优化便成为了一个非常重要的课题。
本文将会从多个角度来探讨硬件设计中的可靠性分析与优化问题。
一、可靠性定义首先,我们需要明确可靠性的概念。
一般而言,可靠性是指某个系统或装置在特定的条件下一定时间内执行其规定的功能的能力。
通常,可靠性也指某个系统或装置在不间断运行一定时间后继续正常运行的概率。
而这个概率反映了硬件设计中的可靠性问题。
为了提高硬件设备的可靠性,我们需要在设计时从多个方面进行考虑。
二、可靠性的影响因素可靠性不是天然存在的,它是受到许多因素影响的。
下面就来简单列举一些主要的影响因素:1、硬件质量:这是影响可靠性的主要因素之一。
如果硬件质量过低,则难以保证硬件设备可靠性的稳定性。
2、工艺流程:在生产过程中,如果控制不严格,存在大量的流程重叠、数据不准确等问题,都可能会影响到硬件设备的可靠性。
3、环境影响:硬件设备需要在特定的环境下工作,因此环境对于硬件设备的影响也非常显著。
例如温度、湿度、气压等对于硬件设备的影响都十分明显。
4、使用情况:硬件设备在使用的时候,可能会受到一些外力的干扰,例如过电压、过电流、电磁干扰等问题。
上述是硬件设计中比较常见的可靠性影响因素,我们在设计时需要重点考虑这些因素,才能提高硬件设备的可靠性。
三、如何进行可靠性分析在设计过程中,需要对硬件设备进行可靠性分析。
可靠性分析阶段通常分为以下三个步骤:1、寿命分析:通过寿命分析,我们可以了解硬件设备的寿命期限,预测设备可能的故障原因,并给出相应的解决方案。
这是硬件设备可靠性分析中十分重要的环节之一。
2、模型分析:该环节是通过对硬件设备的模型进行分析,预测模型出现的问题,同时提供应对策略。
简述计算机控制系统的基本要求

简述计算机控制系统的基本要求计算机控制系统是指由计算机控制和管理的一种自动化控制系统,它通过对物理过程的感知和控制,实现工业生产和自动化操作。
在现代工业中,计算机控制系统已经成为了不可或缺的一部分,起到了提高生产效率、降低生产成本、提高产品质量和可靠性等重要作用。
要使计算机控制系统能够正常运行和满足实际需求,就需要具备一定的基本要求。
接下来将从以下四个方面进行简述。
一、稳定性要求计算机控制系统的稳定性是指系统的输出在输入和各种干扰作用下保持一定的稳定性和可靠性。
稳定性要求可以通过以下几个方面进行保证:1.输入稳定性:输入信号应当稳定且无干扰,以确保计算机系统可以准确捕获和处理输入信号。
2.输出稳定性:控制系统的输出应当具有可靠性和稳定性,以确保系统的控制效果达到预期。
3.系统响应稳定性:系统的响应速度应当稳定,不能出现过度反应或迟滞现象,以确保系统可以快速、准确地进行响应和控制。
4.抗干扰能力:系统应当具备一定的抗干扰能力,可以抵御来自外界的各种干扰信号,并保持系统的稳定性和正常运行。
二、速度要求计算机控制系统的速度要求主要包括实时性和响应速度等方面。
实时性是指系统对输入信号的响应速度应当满足实际应用需求,特别是在需要快速控制和响应的场景下。
计算机控制系统的实时性要求可以通过以下几个方面进行保证:1.硬件性能:计算机系统的硬件配置应当满足实时需求,包括处理器的主频、存储器容量和带宽等。
2.软件算法优化:系统的软件算法应当经过优化,提高系统的运行效率和速度,保证实时性能的达到。
3.通信速度:计算机控制系统中的通信速度也是影响实时性能的一个关键因素,合理选择和配置通信设备可以提高通信速度。
三、可靠性要求计算机控制系统的可靠性是指系统能够稳定、准确地工作,不出现故障和错误。
保证计算机控制系统的可靠性可以从以下几个方面进行考虑:1.硬件可靠性:选用高质量的硬件设备,减少硬件故障的概率,提高系统的可靠性。
如何利用软硬件一体化技术提高网络可靠性

网络可靠性是现代社会中不可或缺的一项技术要求。
随着互联网的快速发展,网络可靠性的重要性日益凸显。
而软硬件一体化技术作为提高网络可靠性的一种有效手段,已经成为当今科技领域的热门话题。
本文将从网络可靠性的定义、软硬件一体化技术的优势、实施软硬件一体化技术的具体步骤、案例讨论以及未来发展方向等几个方面进行论述。
一、网络可靠性的定义网络可靠性是指在网络通信过程中,网络系统能够持续稳定地提供服务的能力。
网络可靠性的高低直接关系到用户的体验和数据的安全。
在网络世界中,信息的传输往往伴随着各种潜在的风险,如网络攻击、硬件故障等。
因此,提高网络可靠性是保障信息安全的重要措施之一。
二、软硬件一体化技术的优势软硬件一体化技术是指将软件和硬件相结合,形成一种紧密耦合的关系,从而实现更高的性能和可靠性。
与传统的纯软件解决方案相比,软硬件一体化技术具有以下优势:1.高性能:软硬件一体化技术可以充分利用硬件的计算能力,提升系统的处理速度和并发能力,从而加快数据处理效率。
2.高稳定性:软硬件一体化技术的硬件部分能够通过硬件冗余、故障检测等机制,实现对硬件故障的自动修复或容错处理,从而提高系统的可靠性和稳定性。
3.低功耗:软硬件一体化技术能够避免冗余的软件处理,通过优化硬件设计和算法,减少能耗,提高能源利用效率。
三、实施软硬件一体化技术的具体步骤实施软硬件一体化技术需要经历以下几个关键步骤:1.需求分析:明确系统所需的功能和性能要求,确定软硬件一体化技术的应用领域和范围。
2.硬件设计:设计硬件的电路和结构,选用适合的材料和技术手段,提供稳定可靠的硬件基础。
3.软件开发:编写软件代码,实现与硬件无缝配合的功能和处理逻辑,保证软硬件之间的相互协同。
4.集成测试:进行软硬件一体化系统的整体测试,验证系统的可靠性和性能,排除潜在的问题和风险。
四、案例讨论目前,软硬件一体化技术已经在许多领域得到成功应用。
以智能手机为例,由于其需求量大、性能要求高的特点,软硬件一体化技术在智能手机的设计中发挥了重要作用。
硬件解决方案

硬件解决方案
《硬件解决方案:提升效率与可靠性》
在现代商业环境中,硬件解决方案扮演着至关重要的角色。
无论是大型企业还是小型创业公司,都需要具备高效、可靠的硬件设备来支持他们的业务运作。
从服务器到网络设备、从工作站到打印机,硬件设备的性能和稳定性直接关系到企业的运营效率和可靠性。
在选择硬件解决方案时,企业需要考虑多方面的因素。
首先是性能,硬件设备的处理能力和存储能力直接关系到其在实际应用中的表现。
其次是可靠性,企业不能承担硬件设备频繁故障和维修的成本和影响。
还有成本效益、扩展性和兼容性等方面也需要考虑。
在现代企业中,高性能的服务器和存储设备是至关重要的。
企业需要通过这些设备来支持大数据处理、云计算、虚拟化等关键业务。
此外,网络设备也是非常关键的一环,企业需要稳定可靠的网络来保证日常办公和业务流转的顺畅。
另外,工作站和打印机等办公设备也需要具备高效能力和可靠性,来支持员工的日常工作。
在解决硬件方面的问题时,企业可以考虑与专业的硬件解决方案提供商合作。
这些提供商能够根据企业的实际需求,提供定制的硬件解决方案。
他们可以根据企业的规模、行业、业务需求等方面,提供恰当的硬件设备和配套服务。
这样能够最大程度地提升企业的运营效率和可靠性,降低硬件设备的维护成本
和风险。
总之,在当今快速变化的商业环境中,硬件解决方案是企业的关键保障,也是提升运营效率和可靠性的利器。
企业需要认真选择合适的硬件解决方案提供商,以确保自己的硬件设备能够满足实际需求,并帮助企业取得更大的商业成功。
提高控制器硬件可靠性的技术研究

背景1.随着汽车电动化和智能化的发展,车辆的控制器面临着严峻的质量挑战。
根据电路可靠性专业机构研究数据表明,产品在设计前期充分考虑可靠性设计可极大地提高控制器硬件质量。
2.当前各大零部件供应商在可靠性技术开发方面的能力参差不齐,整车厂应从提高硬件质量、提升品牌出发,研究一种可行方法提升控制器的硬件可靠性。
本文对于控制器的硬件可靠性开发提出一些规划和建议。
一、控制器硬件可靠性概念可靠性是描述系统长期稳定、正常运行能力的一个通用概念,也是产品质量在时间方面的特征表示。
系统的可靠性是由多种因素决定的,影响系统可靠、安全运行的主要因素来自于系统内部和外部的各种电气干扰,以及系统结构设计、硬件设计、软件设计、安装、制造工艺和外部环境条件等。
其中硬件设计的可靠性工程是保证器件在产品的整个生命周期中可靠工作的系统工程,通过保证使用可靠的器件和可靠的使用器件,避免失效或降低失效的风险,来保证产品的质量和可靠性。
二、控制器硬件可靠性现状当前可靠性工程能力水平大致划分为5个层级,从低到高分别为意识阶段、基础阶段、提升阶段、体系阶段、优化阶段,具体如下:意识阶段·产品质量受个别人的能力或办事方法影响,易产生较大波动;·产品开发质量不可预测,主要依赖功能测试,老化筛选;·质量问题频发,缺乏准确的质量数据;·认识到可靠性的重要,但不知道从哪方面着手改进可靠性;·担心任何提高可靠性的行为会带来成本上升。
基础阶段·意识到可靠性必须改进,寻求外部资源获得帮助;·开始尝试改进,重视积累可靠性技术方法;·能简单度量部分环节质量数据,主要关心并改善内部质量数据;·能小范围改善质量,但无法控制整体风险;·产品可靠性没有定义或明确的保障措施;·开发周期和成本不受控,可靠性可能存在过度设计。
提升阶段·全面发展可靠性过程数据收集系统,特别关注客户现场可靠性数据;·开始建立并积累物料、设计、测试、生产、失效分析等技术平台的基本能力;·产品可靠性有所提升,但是总体效率不高;·在开发阶段定义可靠性指标,产品生命周期可靠性数据和开发前期期望有差距;·产品开发周期不完全受控,质量要求和开发周期互相牵制;·开始关注失效根因分析,开始开展设计仿真工作,开始启动流程保证。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
硬件可靠性及提高
一般来说,系统总是由多个子系统组成,而子系统又是由更小的子系统组成,直到细分到电阻器、电容器、电感、晶体管、集成电路、机械零件等小元件的复杂组合,其中任何一个元件发生故障都会成为系统出现故障的原因。
因此,硬件可靠性设计在保证元器件可靠性的基础上,既要考虑单一控制单元的可靠性设计,更要考虑整个控制系统的可靠性设计。
1.影响硬件可靠性的因素
(1)元件失效。
元件失效有三种:一是元件本身的缺陷,如硅裂、漏气等;二是加工过程、环境条件的变化加速了元件、组件的失效;三是工艺问题,如焊接不牢、筛选不严等。
(2)设计不当。
在计算机控制系统中,许多元器件发生的故障并不是元件本身的问题,而是系统设计不合理或元器件使用不当所造成。
在设计过程中,如何正确使用各种型号的元器件或集成电路,是提高硬件可靠性不可忽视的重要因素。
(1)电气性能:元器件的电气性能是指元器件所能承受的电压、电流、电容、功率等的能力,在使用时要注意元器件的电气性能,不能超限使用。
(2)环境条件:计算机控制系统的工作环境有时相当恶劣,由于环境因素的影响,不少系统的实验室试验情况虽然良好,但安装到现场并长期运行就频出故障。
其原因是多方面的,包括温度、干扰、电源、现场空气等对硬件的影响。
因此,设计系统时,应考虑环境条件对硬件参数的影响,元件设备须经老化试验处理。
(3)组装工艺:在硬件设计中,组装工艺直接影响硬件系统的可靠性。
由于工艺原因引起的故障很难定位排除,一个焊点的虚焊或似接非接很可能导致整个系统在工作过程中不时地出现工作不正常现象。
另外,设计印制电路板时应考虑元器件的布局、引线的走向、引线的分类排序等。
2.提高硬件可靠性的一般方法
在计算机控制系统的整体设计中,如何提高系统硬件的可靠性是整个系统设计的关键,系统硬件设计时常需采用必要的可靠性措施:
(1)电路设计。
据统计,影响计算机控制系统可靠性的因素约45%来自系统设计。
为了保证系统的可靠性,在对其电路设计时应考虑最极端的情况。
各种电子元器件的特性不可能是一个恒定值,总是在其额定(典型)参数的某个范围内;同时,电源、电压也有一个波动范围。
最坏的设计方法是考虑所有元件的公差,并取其最不利的数值核算电路每一个规定的特性。
如果这一组参数值能保证电路正常工作,那么在公差范围内的其他所有元件值都能使电路可靠地工作。
在设计应用系统电路时,还要根据元器件的失效特征及其使用场所采取相应的措施,对容易产生短路的部件以串联方式复制,对容易产生开路的部分以并联方式复制。
(2)元器件选择。
在确定元器件参数之后,还要确定元器件的型号,这主要取决于电路所允许的公差范围。
由于制造工艺所限,有些元器件参数的公差范围可能较大,如电容器电容量等。
另外,元件或器件的额定工作条件包括多个方面(如电流、电压、频率、机械参数以及环境温度等),设计时要考虑参数裕量,并在运行时尽量保证接近元器件的设计工作温度。
(3)结构设计。
结构可靠性设计是硬件可靠性设计的最后阶段。
结构设计时,首先应注意元器件及部件的安装方式,其次是控制系统工作环境的条件(如通风、除湿、防尘等)。
(4)噪声抑制。
噪声对模拟电路的影响会直接影响系统精度,噪声对数字电路也会造成误动作。
因此,在工程设计中必须采用噪声抑制和屏蔽措施。
对于模拟应用系统,可在电源端增加一些低通滤波电路来抑制由电源引入的干扰;对于数字系统,通常采用滤波器和接地系统;同时,在整体结构布局时应注意元器件的位置和信号线的走向。
对于电磁干扰、电场干扰可采用电磁屏蔽、静电屏蔽来隔离噪声,也可采用接地、去耦电容等措施来减少噪声的影响。
(5)冗余设计。
硬件冗余设计可以在元件级、子系统级或系统级上进行,必然增加硬件和成本。
因此,设计时应仔细权衡采用硬件冗余的利弊关系。
在计算机控制系统中,主要采用控制单元冗余和控制系统冗余来提高系统硬件可靠性。
3. 单元可靠性设计
控制与接口单元是指能独立完成某些测控功能的功能模块,其可靠性设计主要包括微处理器系统的冗余设计、输入输出通道干扰的抑制、电源系统干扰的抑制、控制单元运行状态的监视等。
(1)I/O通道干扰的抑制
模拟量输入通道常态干扰的频率通常高于被测信号的频率,因此可考虑采用滤波网络对模拟量输入信号进行滤波。
可采用各种形式的金属屏蔽层做好信号传送线路的屏蔽工作,将信号线与外界电磁场有效地隔离开来;在系统既有模拟电路又有数字电路时,数字地与模拟地要分开,最后只在一点相连,以防相互干扰。
I/O通道一般应采用光电耦合器进行电气隔离,既可避免构成地环路,还可有效地抑制噪声。
另外,在输入输出通道上应采用一定的过压保护电路。
(2)电源系统干扰的抑制
同一电源网路上有较多大功率设备时,在控制单元与供电电源之间可加入三相隔离变压器,以防止电网干扰侵入控制系统。
在整机的电源线入口处,可通过增加电源滤波器来防止其他电子设备与本系统之间产生相互干扰。
在机内独立的印刷板上应安装小型电源滤波器,以防止板与板之间的相互干扰。
由于开关电源具有较强的抗工频电压波动和频率波动能力,同时能隔离从电源线进入的传导干扰,适当场合可选用开关电源。
必要时,系统输入输出通道和其他设备可考虑采用独立的供电电源,实行电源分组供电。
另外,逻辑电路板上的直流电源线和接地线要注意合理布线。
(3)控制单元运行状态监视
可使用看门狗定时器(WDT)监视控制单元的运行状态。
WDT的输出直接连到CPU的中断请求端或控制单元的复位端,WDT的每次“定时到”溢出脉
冲信号均能引起CPU的中断或复位。
WDT受CPU控制,可对其重新设置时间常数或刷新。
定时器重新开始计时,只要程序正常运行就不会产生定时中断或系统复位。
一旦程序执行出错或发生程序乱飞、死机现象,看门狗定时器就会产生溢出脉冲信号,引起定时中断或复位,从而使控制单元重新启动或进入中断服务程序进行纠错处理。
(4)控制单元的掉电保护
对付电网瞬间断电或电压突然下降的有效方法就是掉电保护,对计算机测控系统可外加不间断电源(UPS),对测控系统中的控制单元可增加掉电保护电路,并慎重设计。
掉电信号由硬件电路检测,加到控制单元CPU的外部中断输入端。
软件中断将掉电中断规定为高级中断,使控制单元CPU能及时对掉电做出反应。
在掉电中断子程序中,首先进行现场保护,保存当时重要的状态参数。
当电源恢复正常时,CPU重新复位,恢复现场并继续未完成的工作。
(5)控制单元冗余设计
常用的控制单元冗余设计包括热备份并联冗余和冷备份并联冗余,两者都是以增加成倍的硬件投资来换取系统硬件的可靠性。
(1)热备份并联冗余是将若干功能相同的控制单元并联运行,同步执行相同的处理程序,当并联系统中至少有一个控制单元工作正常时,整个系统即维持正常工作。
为了提高控制单元的可靠性和经济性,常采用双机热备份并联方式。
对受控系统而言,双机热备份并联方式只是其中一个控制单元完成测控任务,另一个控制单元处于并行工作的待命状态。
但两个控制单元同步执行同样的程序,一旦自检系统发现主控单元有故障时,则待命状态的备控单元自动切换上去,代替主控单元使系统继续正常运行。
在设计双机热备份系统时,要解决以下两个主要问题:
1)双机同步。
双机同步一般是以事件作为同步令牌,其中事件可由设计者定义。
如系统的工作过程为:输入接口采集由传感器送来的数据,在CPU内
将采集到的数据和设定值进行比较、处理,最后得到本次的控制量输出。
那么,事件可划分为数据采集和数据处理两个事件。
当应用系统启动时,两机同时执行第一事件,即采集状态数据。
当第一事件完成后,再将两结果进行比较,如果相同则继续第二事件;若有错误,则主控单元自动切换,用备控单元代替主控单元。
只要主控单元工作正常,则备控单元一直处于待命状态。
当事件进行数据处理时,若超出精度范围,则认为其中一个数据可能有错误,这时可以让双机重新转到本事件的首地址再执行一遍。
若仍有差错,则再转到故障检测程序。
这种软件回卷方法可以消除某些偶然性因素的影响。
2)故障检测。
可以利用两机各自的自检程序分别进行自检,找出发生故障的控制单元。
如果故障机是主控单元,则可进行自动切换,使程序继续执行下一个事件。
为了能及时切换,可以根据任务的特点多设置一些事件,使得双机同步校验次数增多。
所谓切换是指通过输入输出接口相互交换双机状态,一旦某控制单元出错,另一控制单元就可及时知道。
当备控单元发现主控单元有故障时,就可以发出控制信号,使主控单元自动退出控制,备控单元代替主控单元使系统继续正常运行。
(2)冷备份并联冗余设计中,备份的控制单元平时不加电工作,只在发现主控单元出故障时才用其代替主控单元。
冷备份的控制单元在硬件结构、软件实现上都与主控单元完全一样,各种联机设备都安置到位,处于接通电源即可投入正常工作的冷备份状态。
冷备份并联系统中的冷热切换可以用人工操作转换,也可以自动切换。
在设计成自动切换时,主控单元必须设置各路(或关键几路)报警信号。
若发现超限现象,则及时输出切换信号去触发冷备份系统的电源触点,使备份单元投入正常运行。