系统可靠性设计论

系统可靠性设计论
系统可靠性设计论

课程大作业

2015~2016学年第2 学期

题目大功率风电机用变桨驱动器的可靠性分析

所在院系机械工程学院

课程名称系统可靠性设计分析

课程编号00212744

学生姓名张峰学号20152173

专业班级机械工程1502班

任课教师李永华职称教授

卷面成绩

大功率风电机用变桨驱动器的可靠性分析

摘要:大功率风力发电机用变桨距驱动器是风力发电系统的关键部件之一,其承载能力、机械性能及无维修寿命的可靠性是影响整个风力发电机系统正常工作的关键因素。如今可靠性已经成为国内外各研究机构和学者所致力研究的重点和热点。努力提高产品质量的可靠性,不仅能够防止或者减少故障或事故的发生,而且可以节约开发成本、降低维修维护费用和其他由于产品可靠性不高而产生的额外费用。建立了大功率风力发电机用变桨距驱动器系统的可靠性模型,分析了大功率风力发电机用变桨距驱动器故障原因和典型故障模式。以大功率风力发电机用变桨距驱动器不能正常工作作为顶事件建立故障树,并进行分析。对大功率风力发电机用变桨距驱动器的系统进行了可靠性分配和可靠性预计。

关键词:FMECA分析故障树分析风电机可靠性分析

目录

1.绪论 (3)

2. 大功率风电机用变桨驱动器系统可靠性模型的建立 (3)

3.大功率风电机用变桨驱动器的FMECA分析 (4)

3.1故障分析的基本程序 (4)

3.2大功率风电机用变桨距驱动器FMECA工作表单 (4)

3.3大功率风电机用变桨距驱动器危害度矩阵图分析 (7)

4.大功率风电机用变桨距驱动器的FTA分析 (8)

4.1故障树的建模 (8)

4.2故障树的分析 (9)

5.系统可靠性预计 (11)

6.系统可靠性分配 (12)

7.结论 (14)

参考文献: (15)

1.绪论

风力发电机是直接将风能转化为电能的设备,随着风能这一新能源的快速崛起和发展,风力发电机的生产、制造、使用和研发改进也得到了飞速的发展。变桨距驱动器是风力发电系统的关键部件, 是实现叶轮对风控制的核心部件,直接影响整个机组的性能和风能利用效率。当自然界风速有变化时,它可以适当调节安装在风电机轮毂上的叶片的桨距角,既能有效减少风速大幅度急剧变化时对风电机的强力冲击,又能吸收接近额定功率的能量。风电变桨驱动器由于工作环境十分恶劣,且安装在距地面几十米甚至上百米的狭小机舱内,维护不便,对变桨驱动器的可靠性分析,具有十分重要的现实意义。

大功率风电机变桨驱动采用二级摆线针轮行星减速器,它主要由电机输入轴、中间轴、输出轴、摆线轮、针轮、柱销、转臂轴承、针齿壳等主要构件组成。

2. 大功率风电机用变桨驱动器系统可靠性模型的建立

可靠性模型是指为预计或估算产品的可靠性建立的可靠性框图和数学模型。建立系统可靠性模型的目的是用于定量分配、估算和评估产品的可靠性。

在机械传动系统可靠性设计中,整个系统的可靠度一般是先通过综合计算各组成零件的可靠度来实现的。在进行可靠度计算时,将系统考虑为串联系统,则系统中每一组成零件失效均会导致整个系统失效,即各组成零件的可靠度的连乘积就是系统的可靠度。

∏=n

i s R R 1

式中,s R 为系统的可靠度,i R 为零件i 的可靠度。

大功率风电机用变桨距驱动器传动系统属于串联系统,各零件间存在相关性,对各零部件在相互独立的情况下进行可靠度计算。在系统分析中,关键零部件对传动系统可靠性有较大影响。系统传动可靠度计算的主要关键部件包括:电机输入轴轴承、电机输入轴、中间轴轴承、中间轴、输出轴轴承、输出轴、两级转臂轴承、两级减速装置的摆线轮和密闭装置。可靠性框图如图1所示:

图1大功率风电机用变桨距驱动器减速器系统可靠性框图

3.大功率风电机用变桨驱动器的FMECA分析

对大功率风电机用变桨距驱动器系统进行FMECA分析,就是分析大功率风电机用变桨距驱动器产品中每一潜在的故障模式并确定其对产品产生的影响,以及把每一个潜在的故障模式按它严重程度进行分类。其最终目的是分析大功率风电机用变桨距驱动器的薄弱环节,找出其潜在弱点,采取相应措施以提高大功率风电机用变桨距驱动器产品的可靠性。

对大功率风电机用变桨距驱动器的FMECA分析要从故障信息出发,从故障的最小单元到上一级单元直至最高单元导致的故障影响。功率风电机用变桨距驱动器系统上的故障率较高的部件,对摆线轮、转臂轴承、柱销、柱销套、润滑泵、紧固螺栓、传动轴、密封件等进行分析,发现其主要的失效模式有:失效、磨损、胶合、老化、堵塞、异常磨损等。

3.1故障分析的基本程序

(l)现场调研:主要收集大功率风电机用变桨距驱动器的背景数据和使用条件;在现场进行故障收集,如拍照等;;研究出现故障件的残骸;

(2)分析并找出出现故障的原因:对出现故障的零件进行分析;通过理论计算分析、模拟实验等方法和手段确定出现故障的原因;

(3)分析结论:对每一个故障零件分析的结果进行总结,然后进一步分析和归纳形成结论。

FMECA的流程图如图2所示:

图2 FMECA流程图

3.2大功率风电机用变桨距驱动器FMECA工作表单

为了划分不同故障模式产生最终影响的严重程度,在进行故障影响分析之前,一般需要对最终影响后果等级进行预定义,从而对系统中各故障按其严重程度进行分级。按严酷度划分为如表1所示,按故障率划分为如表2所示。

表1 严酷度等级表

表2 故障率等级表

根据严酷度类别和故障模式的概率等级综合考虑,危害度分为4级。大功率风电机用变桨距减速器系统的FMECA工作表单见表3。

表3大功率风电机用变桨距减速器系统的FMECA工作表单

3.3大功率风电机用变桨距驱动器危害度矩阵图分析

常用的危害性分析方法包括风险优先数法和危害性矩阵法,选择危害性矩阵法对大功率风电机用变桨距驱动器进行分析。

危害性矩阵法是用来确定和比较每一故障模式的危害程度,进而为确定改进措施的先后顺序提供依据。具体方式为绘制矩阵图,矩阵图的横坐标用严酷度类别表示,纵坐标用产品危害度或故障模式发生概率等级表示。从原点开始,所记录的故障模式分布点沿着对角线方向距离原点越远,其危害性越大,越需尽快采取

改进措施。大功率风电机用变桨距驱动器各零件危害度矩阵图如图3所示。

A

B

C

D

E

I

II

III

IV

图3大功率风电机用变桨距减速器危害度矩阵

从矩阵图上可以明显看出,危害度最大的零件是:电机输入轴、转臂轴承、滚动轴承、摆线轮、中间轴、输出轴;其次是针齿销、偏心套等。另外,由于各个系统元素具有不同的功能并且对整个系统可靠性起的作用也不尽相同。所以,没有必要将系统的所有因素同等看待。因此,有些元素对系统的传动性影响不大。这里主要考虑传动系统的可靠度计算,因此对影响系统传动性不大的元素在计算时暂不予考虑。

4.大功率风电机用变桨距驱动器的FTA分析

故障树分析以系统所不希望发生的事件( 故障事件) 作为分析的目标,先找出导致这一事件( 顶事件) 发生的可能的原因和直接因素,然后,把这些因素和原因作为第二级事件,再接着找出第二级事件发生的因素和可能的原因,按照此顺序,逐级找下去,直到查到最原始的原因,用相应符号代表这些事件,再用事件相应的逻辑门符号把底事件、中间事件和顶事件联系起来成倒立的树形图,成为故障树,用来表示顶事件与下属的子系统或者元器件的逻辑关系。

4.1故障树的建模

根据故障树的分析,我们可以得出影响大功率风电机用变桨距驱动器系统及子系统可靠性的关键零部件,从而提高关键零部件的可靠性,以达到提高系统可靠性的目的。以“大功率风电机用变桨距减速器不能正常工作”为顶事件建立故障树,如图4所示

图4大功率风电机用变桨距减速器不能正常工作的故障树图

大功率风电机用变桨距减速器不能正常工作故障树各事件的解释如表4所示。

表4故障树各事件说明表

4.2故障树的分析

4.2.1定性分析

故障树的定性分析目的是寻找顶事件的原因事件及原因事件的组合(最小割集),发现潜在的故障,发现设计的薄弱环节,以便改进设计、指导故障诊断,改进使用和维修方案。

大功率风电机用变桨距减速器不能正常工作故障树的最小割集为{X1}{X2}{X3}……{X15},当割集中的事件发生时则会导致顶事件即减速器不能

正常工作,如果系统某一故障模式发生了,则一定是该系统中与其对应的某一个最小割集中的全部底事件全部发生了。进行维修时,如果只修复某个故障部件,虽然能够使系统恢复功能,但其可靠性水平还远未恢复。根据最小割集的概念,只有修复同一最小割集中的所有部件故障,才能恢复系统可靠性、安全性设计水平。

4.2.2定量分析

故障树的定量分析要假设底事件之间相互独立,元、部件和系统只有正常和故障两种状态。用CAFTA故障树系统分析软件对大功率风电机用变桨距驱动器的故障树进行可靠性模拟分析,通过模拟分析可得到系统顶事件的失效分布情况和底事件在系统中的重要度。找出影响大功率风电机用变桨距减速器系统及子系统可靠性的关键件,提高系统可靠性分析精度。

大功率风电机用变桨距减速器系统无维修寿命为20年,故可靠性模拟参数设定为:系统模拟次数为1000次、有效失效时间上限为175200小时、有效失效时间下限为0。分析处理的结果数据如表5-7所示。

表5失效概率模拟结果(底事件) 表6失效模式模拟结果

表7重要度模拟结果

通过失效概率模拟分析报告可以看出转臂轴承、润滑泵原动机故障、油泵故障和密闭失效发生的概率比较大,所以转臂轴承、润滑泵原动机故障、油泵故障和密闭失效为大功率风电机用变桨距驱动器的薄弱环节。同时润滑泵原动机故障、油泵故障会导致大功率风电机用变桨距驱动器的温度过高;密闭失效会导致大功率风电机用变桨距驱动器漏油。

5.系统可靠性预计

大功率风电机用变桨距驱动器系统可靠性预计是在方案设计阶段为了评估大功率风电机用变桨距驱动器在给定条件下的可靠性而进行的工作。它根据大功率风电机用变桨距驱动器系统、部件、零件的功能及其有关资料,推测大功率风电机用变桨距驱动器将具有的可靠度。其目的主要是为了发现薄弱环节。大功率风电机用变桨距驱动器可靠性预计的数据也可以用来作为大功率风电机用变桨距驱动器可靠性再分配的依据。

根据FMECA和FTA分析得到的相关故障率数据,采用数学模型法对初步设计阶段时大功率风电机用变桨距驱动器减速器系统的各零件的可靠性指标进行可靠性预计。具体过程是建立系统的可靠性逻辑框图及可靠性数学模型,跟据己知条件求出大功率风电机用变桨距驱动器系统的可靠度。

由于转臂轴承、滚动轴承和密闭装置是标准化零件在计算中可不考虑。主要是确定电机输入轴、中间轴、输出轴和两极摆线轮的可靠度。然后根据串联系统可靠度的计算方法算得传动系统的可靠度。具体可靠性框图如图5

图5 关键零件可靠性框图

组成大功率风电机用变桨距驱动器减速器系统关键零件的可靠度如表8所示。

表8关键零件的可靠度

根据串联系统可靠度的计算方法来计算预计大功率风电机用变桨距驱动器系统的可靠度。设A 表示系统正常工作的事件,i A 表示第i 个分系统正常工作的事件。 假如系统中各分系统是相互独立的,则

∏==n

i i s A R 1

预计大功率风电机用变桨距驱动器减速器系统的可靠度为:

∏==n

i i s A R 1=93.149%?95.235%?97.783%?98.321%?99.256%=84.652%

根据串联系统的可靠度计算公式算得大功率风电机用变桨距驱动器传动系统的可靠度为84.652%。同时通过公式可见,具有串联系统逻辑图的串联系统,其可靠度与功能关系呈串联的单元的数量及单元的可靠度有关。随着单元数量的增加和单元可靠度减小,串联系统的可靠度将越来减小。由于没有考虑到传动系统各单元的相关性,所以预计可靠度很可能与真实数据会有一定差距。

6.系统可靠性分配

可靠性分配是为了将大功率风电机用变桨距驱动器系统可靠性的定量要求分配到规定的产品层次。通过分配使整体和部分的可靠性定量要求协调一致。它是一个由整体到局部,由上到下的分解过程。可靠性分配的本质是一个工程决策过程,是一个综合权衡优化的问题。通过分配,把责任落实到相应层次产品的设计人员身上。合理的指标分配方案,可以使大功率风电机用变桨距驱动器系统经济

有效地达到规定的可靠性目标。

已知串联系统各单元的可靠度预测值为*1R ,*2

R ……*

n R 则系统的可靠度预测值为: ∏==n

i i s

R R 1

**

如果设计出的可靠度不能满足实际要求即*s S R R <,那么就需要按规定的值

s R 进行改进单元的可靠度作再分配计算。先将各单元的可靠度预测值由小到大

的次序排列,则有 *

*1**2*1n m m R R R R R <<<<<<+

令 021R R R R m ====

推导得: *

111*0*++=

?

?

??????=<∏m m

n m i i s m R R R R R

则单元可靠度的再分配可按下式进行:

m

n m i i s m R R R R R 11*21????

?

???????====∏+= *

*11,,n n m m R R R R ==++

对于大功率风电机用变桨距减速器的传动系统关键零件的可靠度预测值由小到大的顺序排列见表9。

表9关键零件的可靠度预测值顺序表

若规定大功率风电机用变桨距减速器的传动系统的可靠度为=s R 90%,根据等最少工作量法进行可靠度再分配。此时大功率风电机用变桨距减速器的传动系统各

关键件的可靠度为 021R R R R m ==== ,而大于0R 的*

*2*1,n m m R R R ++仍然不

变。代入公式求得K 值如下表10

表10参数计算表

从表中可以看出当K=2时, 0R <*

1+m R ,所以通过最少工作量法进行可靠度再分配

后得到大功率风电机用变桨距减速器的传动系统各关键件再分配的可靠度值如表11所示。

表11关键零件的可靠度再分配表

由此可见,提高一级摆线轮和输入轴的可靠度就可以提高大功率风电机用变桨距减速器整个传动系统的可靠度。

7.结论

通过对大功率风力发电机用变桨距驱动减速器故障原因和典型故障模式分析,列出该减速器的FMECA 工作表单并画出危害度矩阵图。利用故障树分析法,以大功率风力发电机用变桨距驱动减速器不能正常工作作为顶事件建立故障树,并进行分析,找出了减速器的薄弱环节及影响大功率风力发电机用变桨距驱动减速器正常工作的主要因素。通过模拟分析报告可以得出转臂轴承、一级减速装置的摆线轮、和密闭失效为大功率风电机用变桨距驱动器的薄弱环节。对大功率风力发电机用变桨距驱动减速器传动系统进行了可靠性预测和可靠性再分配。

参考文献:

[1]郭洪亮.大功率风电机用变桨距驱动器可靠性关键技术研究[D].大连交通大学.2011

[2]何卫东,郭洪亮,李永华.大功率风电机用变桨距减速器的故障树分析[J].大连交通大学学报,2011,32(6):53-57

[3]何卫东,李力行,关天民.摆线针轮减速机的逻辑诊断与故障树分析[J].大连铁道学院学报, 1994,(6)

[4]王晓伟.风电机组齿轮箱故障模式与影响分析[D].华北电力大学.2014

[5]惠晶,顾鑫,杨元侃.兆瓦级风力发电机组电动变桨距系统.电机与控制应用,2007,34(11): 48-60

[6]刘惟信.机械可靠性设计[M].北京:清华大学出版, 1996

[7]孙志礼,陈良玉.实用机械可靠性设计理论与方法.北京:科学出版社.2003

[8]杨明明.大型风电机组故障模式统计分析及故障诊断[D].华北电力大学.2009

[9]陈雪峰,李继猛,程航.风力发电机状态监测和故障诊断技术的研究与进展[J].机械工程学报,2011,47(9):45-52

[10]甘传付.基于FMECA、FTA的故障诊断和故障预报[J].系统工程与电子技术,2002,24(11):126-130

[11]孙惢.风力发电机传动系统可靠性分析方法研究[D].东北大学.2011

[12]胡聪芳.2MW风电机组变桨减速器可靠性分析[J].机械科学与技术,2012,31(12):53-57

[13]杨洋.兆瓦级风电机组变桨减速器动态特性及可靠性分析[D].湘潭大学.2010

可靠性设计的主要内容

可靠性设计的主要内容 1、研究产品的故障物理和故障模型 搜集、分析与掌握该类产品在使用过程中零件材料的老化、损伤和故障失效等(均为受许多复杂随机因素影响的随机过程)的有关数据及材料的初始性能(强度、冲击韧性等)对其平均值的偏离数据,揭示影响老化、损伤这一复杂物理化学过程最本质的因素,追寻故障的真正原因。研究以时间函数形式表达的材料老化、损伤的规律,从而较确切的估计产品在使用条件下的状态和寿命。用统计分析的方法使故障(失效)机理模型化,建立计算用的可靠度模型或故障模型,为可靠性设计奠定物理数学基础,故障模型的建立,往往以可靠性试验结果为依据。 2、确定产品的可靠性指标及其等级 选取何种可靠性指标取决于产品的类型、设计要求以及习惯和方便性等。而产品可靠性指标的等级或量值,则应依据设计要求或已有的试验,使用和修理的统计数据、设计经验、产品的重要程度、技术发展趋势及市场需求等来确定。例如,对于汽车,可选用可靠度、首次故障里程、平局故障间隔里程等作为可靠性指标,对于工程机械则常采用有效度。 3、合理分配产品的可靠性指标值

将确定的产品可靠性指标的量值合理分配给零部件,以确定每个零部件的可靠性指标值,后者与该零部件的功能、重要性、复杂程度、体积、重量、设计要求与经验、已有的可靠性数据及费用等有关,这些构成对可靠性指标值的约束条件。采用优化设计方法将产品(系统、设备)的可靠性指标值分配给各个零部件,以求得最大经济效益下的各零部件可靠性指标值最合理的匹配。 4、以规定的可靠性指标值为依据对零件进行可靠性设计 即把规定的可靠性指标值直接设计到零件中去,使它们能够保证可靠性指标值的实现。

系统可靠性设计与分析

可靠性设计与分析作业 学号:071130123 姓名:向正平一、指数分布的概率密度函数、分布函数、可靠度函数曲线 (1)程序语言 t=(0:0.01:20); Array m=[0.3,0.6,0.9]; linecolor=['r','b','y']; for i=1:length(m); f=m(i)*exp(-m(i)*t); F=1-exp(-m(i)*t); R=exp(-m(i)*t); color=linecolor(i); subplot(3,1,1); title('指数函数概率密度函数曲线'); plot(t,f,color); hold on subplot(3,1,2); title('指数函数分布函数函数曲线'); plot(t,F,color); hold on subplot(3,1,3); title('指数指数分布可靠度函数曲线 plot(t,R,color); hold on end (3)指数分布的分析 在可靠性理论中,指数分布是最基本、最常用的分布,适合于失效率为常数 的情况。指数分布不但在电子元器件偶然失效期普遍使用,而且在复杂系统和整 机方面以及机械技术的可靠性领域也得到使用。 有图像可以看出失效率函数密度f(t)随着时间的增加不断下降,而失效率随 着时间的增加在不断的上升,可靠度也在随着时间的增加不断地下降,从图线的 颜色可以看出,随着m的增加失效率密度函数下降越快,而可靠度的随m的增加 而不断的增加,则失效率随m的增加减小越快。 在工程运用中,如果某零件符合指数分布,那么可以适当增加m的值,使零 件的可靠度会提升,增加可靠性。 二、正态分布的概率密度函数、分布函数、可靠性函数、失效率函数曲线 (1)程序语言 t=-10:0.01:10; m=[3,6,9]; n=[1,2,3]; linecolor=['r','b','y'];

通用的可靠性设计分析方法

通用的可靠性设计分析方法 1.识别任务剖面、寿命剖面和环境剖面 在明确产品的可靠性定性定量要求以前,首先要识别产品的任务剖面、寿命剖面和环境剖面。 (1)任务剖面“剖面”一词是英语profile的直译,其含义是对所发生的事件、过程、状态、功能及所处环境的描述。显然,事件、状态、功能及所处环境都与时间有关,因此,这种描述事实上是一种时序的描述。 任务剖面的定义为:产品在完成规定任务这段时间内所经历的事件和环境的时序描述。它包括任务成功或致命故障的判断准则。 对于完成一种或多种任务的产品,均应制定一种或多种任务剖面。任务剖面一般应包括:1)产品的工作状态; 2)维修方案; 3)产品工作的时间与程序; 4)产品所处环境(外加有诱发的)时间与程序。 任务剖面在产品指标论证时就应提出,它是设计人员能设计出满足使用要求的产品的最基本的信息。任务剖面必须建立在有效的数据的基础上。 图1表示了一个典型的任务剖面。 (2)寿命剖面寿命剖面的定义为:产品从制造到寿命终结或退出使用这段时间内所经历的全部事件和环境的时序描述。寿命剖面包括任务剖面。 寿命剖面说明产品在整个寿命期经历的事件,如:装卸、运输、储存、检修、维修、任务剖面等以及每个事件的持续时间、顺序、环境和工作方式。 寿命剖面同样是建立产品技术要求不可缺少的信息。 图2表示了寿命剖面所经历的事件。

(3)环境剖面环境剖面是任务剖面的一个组成部分。它是对产品的使用或生存有影响的环境特性,如温度、湿度、压力、盐雾、辐射、砂尘以及振动冲击、噪声、电磁干扰等及其强度的时序说明。 产品的工作时间与程序所对应的环境时间与程序不尽相同。环境剖面也是寿命剖面和任务剖面的一个组成部分。 2.明确可靠性定性定量要求 明确产品的可靠性要求是新产品开发过程中首先要做的一件事。产品的可靠性要求是进行可靠性设计分析的最重要的依据。 可靠性要求可以分为两大类:第一类是定性要求,即用一种非量化的形式来设计、分析以评估和保证产品的可靠性;第二类是定量要求,即规定产品的可靠性指标和相应的验证方法。 可靠性定性要求通常以要求开展的一系列定性设计分析工作项目表达。常用的可靠性定性设计工作项目见表1。

可靠性设计的基本概念与方法

4.6 可靠性设计的基本概念与方法 一、结构可靠性设计概念 1.可靠性含义 可靠性是指一个产品在规定条件下和规定时间内完成规定功能的能力;而一个工业产品(包括像飞机这样的航空飞行器产品)由于内部元件中固有的不确定因素以及产品构成的复杂程度使得对所执行规定功能的完成情况及其产品的失效时间(寿命)往往具有很大的随机性,因此,可靠性的度量就具有明显的随机特征。一个产品在规定条件下和规定时间内规定功能的概率就称为该产品的可靠度。作为飞机结构的可靠性问题,从定义上讲可以理解为:“结构在规定的使用载荷/环境作用下及规定的时间内,为防止各种失效或有碍正常工作功能的损伤,应保持其必要的强刚度、抗疲劳断裂以及耐久性能力。”可靠度则应是这种能力的概率度量,当然具体的内容是相当广泛的。例如,结构元件或结构系统的静强度可靠性是指结构元件或结构系统的强度大于工作应力的概率,结构安全寿命的可靠性是指结构的裂纹形成寿命小于使用寿命的概率;结构的损伤容限可靠性则一方面指结构剩余强度大于工作应力的概率,另一方面指结构在规定的未修使用期间内,裂纹扩展小于裂纹容限的概率.可靠性的概率度量除可靠度外,还可有其他的度量方法或指标,如结构的失效概率F(c),指结构在‘时刻之前破坏的概率;失效率^(().指在‘时刻以前未发生破坏的条件下,在‘时刻的条件破坏概率密度;平均无故障时间MTTF(MeanTimeToFailure),指从开始使用到发生故障的工作时间的期望值。除此而外,还有可靠性指标、可靠寿命、中位寿命,对可修复结构还有维修度与有效度等许多可靠性度量方法。 2..结构可靠性设计的基本过程与特点 设计一个具有规定可靠性水平的结构产品,其内容是相当丰富的,应当贯穿于产品的预研、分析、设计、制造、装配试验、使用和管理等整个过程和各个方面。从研究及学科划分上可大致分为三个方面。 (1)可靠性数学。主要研究可靠性的定量描述方法。概率论、数理统计,随机过程等是它的重要基础。 (2)可靠性物理。研究元件、系统失效的机理,物理成固和物理模型。不同研究对象的失效机理不同,因此不同学科领域内可靠性物理研究的方法和理论基础也不同. (3)可靠性工程。它包含了产品的可靠性分析、预测与评估、可靠性设计、可靠性管理、可靠性生产、可靠性维修、可靠性试验、可靠性数据的收集处理和交换等.从产品的设计到产品退役的整个过程中,每一步骤都可包含于可靠性工程之中。 由此我们可以看出,结构可靠性设计仅是可靠性工程的其中一个环节,当然也是重要的环节,从内容上讲,它包括了结构可靠性分析、结构可靠性设计和结构可靠性试验三大部分。结构可靠性分析的过程大致分为三个阶段。 一是搜集与结构有关的随机变量的观测或试验资料,并对这些资料用概率统计的方法进行分析,确定其分布概率及有关统计量,以作为可靠度和失效概率计算的依据。

浅谈软件系统可靠性

浅谈软件系统可靠性 1 概述 近年来,随着计算机在军用与民用产品上的应用日益增多,软件缺陷所引发的产品故障,甚至灾难性事故也越来越严重,软件故障已成为高新技术产品发展的瓶颈。在这种情况下,一旦计算机系统发生故障,则其效益就会大幅度地消减,甚至完全丧失,从而使社会生产和经济活动陷入不可收拾的混乱状态。因此可以说,计算机系统的高可靠性是实现信息化社会的关键。 计算机系统硬件可靠性方面已有六十余年的发展历史,冗余技术、差错控制、故障自动检测、容错技术和避错技术等可靠性设计技术已经成熟。相比之下,软件可靠性的研究只有三十几年的发展历史,加上软件生产基本上仍处于作坊式的手工制作,其提高软件可靠性的技术与管理措施还处于十分不完善的状况。20 世纪70 年代末至80 年代初,软件可靠性的研究集中于对软件可靠性模型进行比较和选择。90 年代以来,软件可靠性研究工作进展较快,主要集中在软件可靠性设计、软件可靠性测试与管理以及软件可靠性数据的收集这三个方面。 2 软件可靠性的基本概念 2.1 软件可靠性的定义 1983年,美国IEEE计算机学会软件工程技术委员会对软件可靠性的定义如下: a)在规定的条件下,在规定的时间内,软件不引起系统失效的概率,该概率是系统输入和系统使用的函数,也是软件中存在的错误的函数;系统输入将确定是否会遇到已存在的错误。 b)在规定的时间周期内,在所述条件下程序执行所要求的功能的能力。 软件可靠性定义中提到的“规定的条件”和“规定的时间”,在工程中有重要的意义。 定义中的“时间”有3种度量。第一种是日历时间,指日常生活中使用的日、周、月和年等计时单元;第二种是时钟时间,指从程序运行开始到运行结束所用的时、分、秒;第三种是执行时间,指计算机在执行程序时实际占用的CPU 时间。 定义中所指的“条件”,是指环境条件,包括了与程序存储、运行有关的计算机及其操作系统。 2.2 影响软件可靠性的主要因素 软件可靠性表明了一个程序按照用户的需求和设计的目标,执行其功能的正确程度。这要求一个可靠的程序应是正确的、完整的、一致的和健壮的。软件可靠性的决定因素是与输入数据有关的软件差错,正是因为软件中的差错引起了软件故障,使软件不能满足需求。影响软件可靠性的因素主要包括: 1、软件开发的支持环境; 2、软件的开发方法;

软件可靠性技术发展与趋势分析

软件可靠性技术发展及趋势分析 1引言 1)概念 软件可靠性指软件在规定的条件下、规定的时间内完成规定的功能的能力。 安全性是指避免危险条件发生,保证己方人员、设施、财产、环境等免于遭受灾难事故或重大损失。安全性指的是系统安全性。一个单独的软件本身并不存在安全性问题。只有当软件与硬件相互作用可能导致人员的生命危险、或系统崩溃、或造成不可接受的资源损失时,才涉及到软件安全性问题。由于操作人员的错误、硬件故障、接口问题、软件错误或系统设计缺陷等很多原因都可能影响系统整体功能的执行,导致系统进入危险的状态,故系统安全性工作自顶至下涉及到系统的各个层次和各个环节,而软件安全性工作是系统安全性工作中的关键环节之一。 因此,软件可靠性技术解决的是如何减少软件失效的问题,而软件安全性解决的是如何避免或减少与软件相关的危险条件的发生。二者涉及的范畴有交又,但不完全相同。软件产生失效的前提是软件存在设计缺陷,但只有外部输入导致软件执行到有缺陷的路径时才会产生失效。因此,软件可靠性关注全部与软件失效相关的设计缺陷,以及导致缺陷发生的外部条件。由于只有部分软件失效可能导致系统进

入危险状态,故软件安全性只关注可能导致危险条件发生的失效。以及与该类失效相关的设计缺陷和外部输入条件。 硬件的失效,操作人员的错误等也可能影响软件的正常运行,从而导致系统进入危险的状态,因此软件安全性设计时必须对这种危险情况进行分析,井在设计时加以考虑。而软件可靠性仅针对系统要求和约束进行设计,考虑常规的容错需求,井不需要进行专门的危险分析。在复杂的系统运行条件下,有时软件、硬件均未失效,但软硬件的交互 作用在某种特殊条件下仍会导致系统进入危险的状态,这种情况是软件安全性设计考虑的重点之一,但软件可靠性并不考虑这类情况。2)技术发展背景 计算机应用范围快速扩展导致研制系统的复杂性越来越高。软硬件密切耦合,且软件的规模,复杂度及其在整个系统中的功能比重急剧上升,由最初的20%左右激增到80%以上。伴随着硬件可靠性的提高,软件的可靠性与安全性问题日益突出。 在军事、航空航天、医疗等领域,核心控制软件的失效可能造成巨大的损失甚至威胁人的生命。1985年6月至1987年1月,Therac-25治疗机发生6起超大剂量辐射事故,其中3起导致病人死亡。1991年海湾战争。爱国者导弹在拦截飞毛腿导弹中几次拦截失败,其直接原因为软件系统未能及时消除计时累计误差。1996年阿里亚娜5型运载火箭由于控制软件数据转换溢出起飞40秒后爆炸,造成经济损

硬件系统可靠性设计规范

硬件系统可靠性设计规范 一、概论 可靠性的定义:产品或系统在规定条件下和规定时间内完成规定功能的能力 可靠性及抗干扰设计是硬件设计必不可少的一部分,它包括芯片、器件选择、去耦滤波、印刷电路板布线、通道隔离等。有完善的抗干扰措施,是保证系统精度、工作正常和不产生错误的必要条件。设备可靠性设计规范的一个核心思想是监控过程,而不是监控结果。 二、可靠性设计方法 1、元器件:构成系统的基本部件,作为设计与使用者,主要是保证所选用的元器件的质量或可靠性指标满足设计的要求 2、降额设计:使电子元器件的工作应力适当低于其规定的额定值,从而达到降低基本故障率,保证系统可靠性的目的。幅度的大小可分为一、二、三级降额,一级降额((实际承受应力)/(器件额定应力) < 50%的降额),建议使用二级降额设计方法,一级降额<70% 3、冗余设计:也称为容错技术或故障掩盖技术,它是通过增加完成同一功能的并联或备用单元(包括硬件单元或软件单元)数目来提高系统可靠性的一种设计方法,实现方法主要包括:硬件冗余;软件冗余;信息冗余;时间冗余等 4、电磁兼容设计:系统在电磁环境中运行的适应性,即在电磁环境下能保持完成规定功能的能力。电磁兼容性设计的目的是使系统既不受外部电磁干扰的影响,也不对其它电子设备产生电磁干扰。硬件措施主要有滤波技术、去耦电路、屏蔽技术、接地技术等;软件措施主要有数字滤波、软件冗余、程序运行监视及故障自动恢复技术等 5、故障自动检测及诊断 6、软件可靠性设计:为了提高软件的可靠性,应尽量将软件规范化、标准化、模块化 7、失效保险技术 8、热设计 9、EMC设计:电磁兼容(EMC)包括电磁干扰(EMI)和电磁敏感度(EMS)两个方面 三、可靠性设计准则

软件可靠性和安全性设计指南

软件可靠性和安全性设计指南 (仅供内部使用) 文档作者:_______________ 日期:___/___/___ 开发/测试经理:_______________ 日期:___/___/___ 产品经理: _______________ 日期:___/___/___ 管理办:_______________ 日期:___/___/___ 请在这里输入公司名称 版权所有不得复制

软件可靠性和安全性设计指南 1 范围 1 .1主题内容 [此处加入主题内容] 1 .2适用范围 [此处加入适用范围] 2 引用标准 GBxxxx 信息处理——数据流程图、程序流程图、系统流程图、程序网络图和系统资源图的文件编制符号及约定。 GB/Txxx 软件工程术语 GB/Txxxxxx 计算机软件质量保证计划规范 GB/T xxxxx 计算机软件配置管理计划规范 GB/T xxxxx 信息处理——程序构造及其表示的约定 GJBxxxx 系统安全性通用大纲 GJBxxxxx 系统电磁兼容性要求 GBxxxx 电能质量标准大纲 GBxxxxx 电能质量标准术语 3 定义 [此处加入定义] 3 .1失效容限 [此处加入失效容限] 3 .2扇入 [此处加入扇入] 3 .3扇出 [此处加入扇出] 3 .4安全关键信息 [此处加入安全关键信息] 3 .5安全关键功能 [此处加入安全关键功能]

3 .6软件安全性 [此处加入软件安全性] 4 设计准则和要求 4 .1对计算机应用系统设计的有关要求 4 .1.1 硬件软件功能的分配原则 [此处加入硬件软件功能的分配原则] 4 .1.2 硬件软件可靠性指标的分配原则[此处加入硬件软件可靠性指标的分配原则] 4 .1.3 容错设计 [此处加入容错设计] 4 .1.4 安全关键功能的人工确认 [此处加入安全关键功能的人工确认] 4 .1. 5 设计安全性内核 [此处加入设计安全性内核] 4 .1.6 记录系统故障 [此处加入记录系统故障] 4 .1.7 禁止回避检测出的不安全状态[此处加入禁止回避检测出的不安全状态] 4 .1.8 安全性关键软件的标识原则 [此处加入安全性关键软件的标识原则] 4 .1.9 分离安全关键功能 [此处加入分离安全关键功能] 4 .2对硬件设计的有关要求 [此处加入对硬件设计的有关要求] 4 .3软件需求分析 4 .3.1 一般要求 [此处加入一般要求] 4 .3.2 功能需求 [此处加入功能需求] 4.3.2.1输入 [此处加入输入] 4.3.2.2处理 [此处加入处理] 4.3.2.3输出 [此处加入输出]

北京航空航天大学系统可靠性设计分析期末试卷a

1.判断题(共20分,每题2分,答错倒扣1分) (1)()系统可靠性与维修性决定了系统的可用性和可信性。 (2)()为简化故障树,可将逻辑门之间的中间事件省略。 (3)()在系统寿命周期的各阶段中,可靠性指标是不变的。 (4)()如果规定的系统故障率指标是每单位时间0.16,考虑分配余量,可以按每单位时间0.2 进行可靠性分配。 (5)()MTBF和MFHBF都是基本可靠性参数。 (6)()电子元器件的质量等级愈高,并不一定表示其可靠性愈高。 (7)()事件树的后果事件指由于初因事件及其后续事件的发生或不发生所导致的不良结果。 (8)()对于大多数武器装备,其寿命周期费用中的使用保障费用要比研制和生产费用高。 (9)()所有产品的故障率随时间的变化规律,都要经过浴盆曲线的早期故障阶段、偶然故障 阶段和耗损故障阶段。 (10)()各种产品的可靠度函数曲线随时间的增加都呈下降趋势。 2.填空题(共20分,每空2分) (1)MFHBF的中文含义为。 (2)平均故障前时间MTTF与可靠度R(t)之间的关系式是。 (3)与电子、电器设备构成的系统相比,机械产品可靠性特点一是寿命不服从分 布,二是零部件程度低。 (4)在系统所处的特定条件下,出现的未预期到的通路称为。 (5)最坏情况容差分析法中,当网络函数在工作点附近可微且变化较小、容差分析精度要求不 高、设计参数变化范围较小时,可采用;当网络函数在工作点可微且变化较大,或容差分析精度要求较高,或设计参数变化范围较大时,可采用。 (6)一般地,二维危害性矩阵图的横坐标为严酷度类别,纵坐标根据情况可选下列三项之一: 、 或。

3.简要描述故障树“三早”简化技术的内容。(10分)

嵌入式软件可靠性设计规范checklist

嵌入式软件可靠性设计规范汇总

43.高级报警显示:红色,1.4Hz~ 2.8Hz,信占比率20%~60%开 44.中级报警显示:黄色,0.4Hz~0.8Hz,信占比率20%~60%开 45.低级报警显示:蓝绿色或者黄色,常开,信占比率100% 46. 高优先级和中优先级的报警上、下限设置值,一旦超出可能引起较严重后果的非合理报警数值区域时,均需加单独的对话弹出框予以提醒操作者 47. 默认的报警预置不允许修改,并提供让用户能恢复到出厂默认报警设置的操作途径 48.做报警日志记录,为以后的故障分析、维修检查或商业纠纷提供依据 与硬件接口的软件49. 数据传输接口的硬件性能限制了数据传输速率的提高,在确定波特率前,要确认硬件所能承受的最高传输率,光耦、485、232、CAN、传输线上有防护 器件(TVS或压敏电阻)的端口 50.硬件端口读进来的数据必须加值域范围的判断 51.硬件端口读取数据,必须加可控时间或次数的有限次限制 52.A/D的位数比前端放大电路的精度要求略高即可,并通过数学计算验证 53. 对运动部件的控制,正向运动突然转向反向运动时,必须控制先正向减速到0,然后再反向加速的控制方式 54. 运动部件停机后、再快速启动的工作控制方式是不允许的。须停机、开机、delay延时、再启动执行机构,以确保执行机构先释放原来运动状态的惯性,然后再从静态下启动 55. 运动部件都有过渡过程特性,软件驱动时的上升沿和下降沿的过渡特性会 直接影响到硬件的安全和执行效果 56. 板卡启动时,先initMCU、然后Delay、然后initIO,以确保各芯片的上电 电源都已经稳定下来再启动工作 57. 对采集自有可能受到干扰的模拟端口输入的数字量数据,一定要加上、下 限、Δ/Δt、规律性干扰的滤波措施三个方面的容错性机制 58. 对数字端口传输数据可以连续传输两遍,以防范随机性偶发干扰,实时性要求较高的,可以连续传三遍,2:1判定 59. 模块之间的数据通信联络,用周期性读取的方式、或请求-应答的方式传送 数据,一旦超出周期性时间要求,或未应答,则判定硬件失效,需有软件的

浅析计算机软件可靠性设计

浅析计算机软件可靠性设计 摘要:本文介绍了软件可靠性设计的基本概念,软件故障产生的机理,软件质量的可靠性参数,并且着重介绍了软件可靠性设计方法。 随着科学技术的不断进步,软件可靠性成为我们关注的一个问题,软件系统规模越做越大越复杂,其可靠性越来越难保证。应用本身对系统运行的可靠性要求越来越高,在一些关键的应用领域,如航空、航天等,其可靠性要求尤为重要,在银行等服务性行业,其软件系统的可靠性也直接关系到自身的声誉和生存发展竞争能力。特别是软件可靠性比硬件可靠性更难保证,会严重影响整个系统的可靠性。在许多项目开发过程中,对可靠性没有提出明确的要求,开发商(部门)也不在可靠性方面花更多的精力,往往只注重速度、结果的正确性和用户界面的友好性等,而忽略了可靠性。在投入使用后才发现大量可靠性问题,增加了维护困难和工作量,严重时只有束之高阁,无法投入实际使用。本文仅就软件可靠性工程在软件开发过程中的应用谈谈自己的认识。 1.软件可靠性设计的基本概念 1.1 软件及软件故障。软件(也称程序)本质上是一种把一组离散输入变成一组离散输出的工具,它由一组编码语句组成,这些语句的功能基本上是以下功能之一:(1)计算一个表达式并将其结果

存储在单元里;(2)决定下一步要执行哪个语句;(3)进行输入/输出控制。 的整个寿命周期的。软件的寿命周期,是指从软件任务的提出一直到它完成使命,因陈旧而被废弃为止的整个时间历程,这个寿命周 期包括了提出要求/规格说明、设计、实现、检验、维护等五个阶段,前四个阶段为开发期,维护阶段为使用期。 1.2 软件可靠性。关于软件可靠性的定义是什么。较多的人认为软件的可靠性与“概率统计的可靠性”的概念密切相关,软件的可靠性是软件在规定的条件下、规定的时间周期内执行所要求功能的能力。软件的可靠度是软件在规定的条件下、规定的时间内不引起系统故障的概率,该概率是系统输入与系统使用的函数。 2.软件质量的可靠性参数 2.1 系统平均不工作间隔时间(mtbsd或mtbd)。设d为软件正常工作总时间,d为系统由于软件故障而停止工作的次数,则定义tbsd=tv/(d+1)。式中,tbsd—mtbsd;tv—软件正常工作总时间(h);d—系统由于软件故障而停止工作的次数。mtbsd反映了系统的稳定性。 2.2 系统不工作次数(一定时期内)。由于软件故障而停止工作,必须由操作者介入再启动才能继续工作的次数。 2.3 可用度a。设tv为软件正常工作总时间,td为由于软件故

人机系统可靠性设计基本原则(设备改善遵循的原则)

人机系统可靠性设计基本原则 1.系统的整体可靠性原则 从人机系统的整体可靠性出发,合理确定人与机器的功能分配,从而设计出经济可靠的人机系统。 一般情况下,机器的可靠性高于人的可靠性,实现生产的机械化和自动化,就可将人从机器的危险点和危险环境中解脱出来,从根本上提高了人机系统可靠性。 2.高可靠性组成单元要素原则 系统要采用经过检验的、高可靠性单元要素来进行设计。 3.具有安全系数的设计原则 由于负荷条件和环境因素随时间而变化,所以可靠性也是随时间变化的函数,并且随时间的增加,可靠性在降低。因此,设计的可靠性和有关参数应具有一定的安全系数。 4.高可靠性方式原则 为提高可靠性,宜采用冗余设计、故障安全装置、自动保险装置等高可靠度结构组合方式。 (1)、系统“自动保险”装置。自动保险,就是即使是外行不懂业务的人或不熟练的人进行操作,也能保证安全,不受伤害或不出故障。 这是机器设备设计和装置设计的根本性指导思想,是本质安全化追求的目标。要通过不断完善结构,尽可能地接近这个目标。 (2)、系统“故障安全”结构。故障安全,就是即使个别零部件

发生故障或失效,系统性能不变,仍能可靠工作。 系统安全常常是以正常的准确的完成规定功能为前提。可是,由于组成零件产生故障而引起误动作,常常导致重大事故发生。为达到功能准确性,采用保险结构方法可保证系统的可靠性。 从系统控制的功能方面来看,故障安全结构有以下几种: ①消极被动式。组成单元发生故障时,机器变为停止状态。 ②积极主动式。组成单元发生故障时,机器一面报警,一面还能短时运转。 ③运行操作式。即使组成单元发生故障,机器也能运行到下次的定期检查。 通常在产业系统中,大多为消极被动式结构。 5.标准化原则 为减少故障环节,应尽可能简化结构,尽可能采用标准化结构和方式。 6.高维修度原则 为便于检修故障,且在发生故障时易于快速修复,同时为考虑经济性和备用方便,应采用零件标准化、部件通用化、设备系列化的产品。 7.事先进行试验和进行评价的原则 对于缺乏实践考验和实用经验的材料和方法,必须事先进行试验和科学评价,然后再根据其可靠性和安全性而选用。

嵌入式软件可靠性设计

嵌入式软件可靠性设计培训 嵌入式软件既是电子系统的核心,也是硬件系统的有效补充,需要具备防错、判错、纠错、容错的功能,具备了这些功能,就能保证系统可靠性要求在软件分系统设计中的实现。但是软件可靠性又不同于硬件电路,它不会随时间的推移而降低,并且其可靠性保障全部在设计过程中实现。因此软件工程的工作也是软件可靠性所要关注的内容。 为此,我协会决定组织召开《嵌入式软件可靠性设计》讲座,本讲座主要从嵌入式软件的系统设计、需求分析、接口、模块、变量控制、软件测试、安全性分析、硬件匹配设计等设计规范进行总结和分析,深层次探讨嵌入式软件的可靠性设计技巧。现具体事宜通知如下: 【主办单位】中国电子标准协会培训中心 【协办单位】深圳市威硕企业管理咨询有限公司 课程提纲:课程大纲以根据学员要求,上课时会有所调整,具体以报到时的讲义为准。 1.概述和定义 2.计算机系统设计准则:2.1、一般要求;2.2、硬件与软件功能的分配原则;2.3、硬件与软件可靠性指标的分配原则;2.4、安全关键功能的人工确认;2.5、安全性内核;2.6、自动记录系统故障;2.7、禁止回避检测出的不安全状态;2.8、保密性设计;2.9、容错设计

3.硬件设计:3.1、硬件选用;3.2、总线检测;3.3、加电检测;3.4、电源失效的安全措施;3.5、主控计算机失效的安全措施;3.6、反馈回路传感器失效的防护措施3.7、电磁干扰的防护措施;3.8、维修互锁措施 4.软件需求分析 5.软件危险分析 6.安全关键功能设计 7.冗余设计准则:7.1、指令冗余设计;7.2、软件陷阱与软件拦截技术;7.3、软件冗余 8.接口设计准则:8.1、硬件接口要求;8.2、硬件接口的软件设计;8.3、人机界面设计;8.4、报警设计;8.5、软件接口设计 9.软件健壮性设计准则:9.1、电源失效防护;9.2、加电检测;9.3、电磁干扰; 9.4、系统不稳定;9.5、接口故障9.6、干扰信号9.7、错误操作;9.8、监控定时器的设计9.9、异常保护设计 10. 简化设计准则:10.1、单入和单出;10.2、模块的独立性;10.3、模块的扇入扇出;10.4、模块耦合方式;10.5、模块内聚顺方式;10.6、其他特殊考虑 11.余量设计:11.1、资源分配及余量要求11.2、时序安排的余量要求 12. 数据要求:12.1、数据需求;12.2、属性控制;12.3、数值运算范围控制;12.4、合理性检查 13. 防错程序设计准则:13.1、参数化;13.2、公用数据和公共变量;13.3、标志;13.4、文件;13.5、非授权存取的限制13.6、无意指令跳转的处理;13.7、程序检测点的设置13.8、寻址模式的选用;13.9、数据区隔离;13.10、安全关键信息的要求;13.11、信息存储要求;13.12、算法选择要求 14. 编程要求:14.1、语言要求;14.2、汇编语言编程限制14.3、高级语言的编程限制;14.4、圈复杂度指数(McCabe)14.5、软件单元的规模;14.6、命名要

给水管网系统建模及其可靠性分析报告

给水管网系统建模及其可靠性分析 摘要 给水管网系统是一个拓扑结构复杂、规模庞大、用水变化随机性强、运行控制为多目标的网络系统。管网建模是仿真给水管网系统动态工况的最有效的方法,是为模拟管网系统建立数学模型的过程。模拟容主要是图形模拟、状态模拟和参数模拟。而建立模型并不是一蹴而就的,要不断的开发、更新和完善。在管网优化设计的四个方面中,保证给水系统可靠性是给水设计的主要容之一。随着现代科学技术的快速发展,可靠性工程理论日益受到广泛重视。 关键词:给水管网系统建模;管网优化设计:管网系统可靠性 一、引言 我国各城市的市政公用输配系统(供水、供气)是城市重要的基础设施之一,也是城市建设和可持续性发展的制约因素,这些工程网络在系统规划上有许多方面存在着共性。 对给水管网系统进行建模,一方面对于大量复杂、繁琐的问题能够取得快速、准确的计算结果,大大提高了工作效率,使得以前很少或者不可能进行的大型工程量计算问题和多方案比较问题得以顺利解决。另一方面,可以对输配系统的工作状态(水力、水质)进行比较准确的模拟仿真,尤其当系统中有较完善的设施时,更可以对系统的实时工况进行在线模拟,这样不仅可为系统的优化运行、调度提供很好的基础条件,为系统的改扩建提供可靠的依据,也为给水管网水质预测和安全输配提供支持。 对给水管网系统建模完成后应注意管网的优化设计,包括四个方面:水压、水量的保证性;水质的安全性;可靠性和经济性。随着现代科学技术的快速发展,作为系统工程之一的可靠性工程理论日益受到广泛重视。在近代,各种工程系统、构筑物设计时,已经开始应用可靠性的数学理论。可靠性和其他技术经济指标一样,成为评价系统优劣的主要指标。可靠性问题之所以得到重视,是因为系统、构筑物、设备相互有关,任一部分损坏可能导致整个系统的故障,而整个系统的故障,例如给水系统发生故障,将对社会和人民生活带来损害。而故障的发生多数为随机事件,一般无法预料和预防,因此给水系统可靠性具有概率的性质。在生活节奏日益加快的今天,确保给水管网系统的正常运行具有十分重要的意义。

软件可靠性设计与分析

软件可靠性分析与设计 软件可靠性分析与设计 软件可靠性分析与设计的原因?软件在使用中发生失效(不可靠会导致任务的失败,甚至导致灾难性的后果。因此,应在软件设计过程中,对可能发生的失效进行分析,采取必要的措施避免将引起失效的缺陷引入软件,为失效纠正措施的制定提供依据,同时为避免类似问题的发生提供借鉴。 ?这些工作将会大大提高使用中软件的可靠 性,减少由于软件失效带来的各种损失。 Myers 设计原则 Myers 专家提出了在可靠性设计中必须遵循的两个原则: ?控制程序的复杂程度

–使系统中的各个模块具有最大的独立性 –使程序具有合理的层次结构 –当模块或单元之间的相互作用无法避免时,务必使其联系尽量简单, 以防止在模块和单元之间产生未知的边际效应 ?是与用户保持紧密联系 软件可靠性设计 ?软件可靠性设计的实质是在常规的软件设计中,应用各种必须的 方法和技术,使程序设计在兼顾用户的各种需求时, 全面满足软件的可靠性要求。 ?软件的可靠性设计应和软件的常规设计紧密地结合,贯穿于常规 设计过程的始终。?这里所指的设计是广义的设计, 它包括了从需求分析开始, 直至实现的全过程。 软件可靠性设计的四种类型

软件避错设计 ?避错设计是使软件产品在设计过程中,不发生错误或少发生错误的一种设计方法。的设计原则是控制和减少程序的复杂性。 ?体现了以预防为主的思想,软件可靠性设计的首要方法 ?各个阶段都要进行避错 ?从开发方法、工具等多处着手 –避免需求错误 ?深入研究用户的需求(用户申明的和未申明的 ?用户早期介入, 如采用原型技术 –选择好的开发方法

?结构化方法:包括分析、设计、实现 ?面向对象的方法:包括分析、设计、实现 ?基于部件的开发方法(COMPONENT BASED ?快速原型法 软件避错设计准则 ? (1模块化与模块独立 –假设函数C(X定义了问题X 的复杂性, 函数E(X定义了求解问题X 需要花费的工作量(按时间计,对于问题P1和问题P2, 如果C(P1>C(P2,则有 E(P1> E(P2。 –人类求解问题的实践同时又揭示了另一个有趣的性质:(P1+P2>C(P1 +C(P2 –由上面三个式子可得:E(P1+ P2> E(P1+E(P2?这个结论导致所谓的“分治法” ----将一个复杂问题分割成若干个可管理的小问题后更易于求解,模块化正是以此为据。 ?模块的独立程序可以由两个定性标准度量,这两个标准分别称为内聚和耦合。耦合衡量不同模块彼此间互相依赖的紧密程度。内聚衡量一个模块内部各个元素彼此结合的紧密程度。 软件避错设计准则 ? (2抽象和逐步求精 –抽象是抽出事物的本质特性而暂时不考虑它们的细节 ?举例

系统的可靠性设计 和 数据容灾与备份

论系统可靠性设计 摘要:随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障会造成巨大的经济损失和社会影响。本人有幸作为项目负责人之一参与了某大学二期网络的建设,并负责了校园网络可靠性的设计和实施。该校园网主要分为行政办公大楼,教学楼群,实验楼群,图书馆,信息中心和网络中心机房6个主要区域。本文主要从电缆级别,通信线路,服务器,网络管理,网络中心系统等方面介绍如何建立高可靠性的应用网络系统,以满足实际需求。 正文: 随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障的产生会造成巨大的经济损失和社会影响。2007年7月到2008年7月,作为××公司的一名技术骨干,本人参与了××大学二期网络的建设,全程参与了整个网络可靠性的规划设实施,以下是项目在可靠性方面所采取的方案。 第一级容错,网络电缆。无论是光纤,同轴电缆,双绞线还是组合布线,都可能出现各种 各样的故障。首先由于选用的电缆电气指标达不到要求,造成信号衰减过度,引起网络故障;其二,电缆接插头虚接,松落;其三电缆线受到外界老化,朽蚀,机械等原因损坏。若损坏的电缆只是连接在一个独立的设备,则定位和修复容易,而如果是连接多个网络设备的电缆线路或主干电缆线路损坏,则很难定位及修复。本方案在主干线路和其他重要支路上布置双线甚至多线,当主线断路时,自动切换到辅线工作。为了考虑降低电缆线路同时损坏的可能,电缆布置在不同的路途上。(250) 第二级容错,冗余拓扑。首先,本方案采用了三层的网络拓扑结构,并在分布层和核心 层的交换机之间使用冗余路径,防止网络因单点故障而无法运行,以此提升网络拓扑的可靠性。然而,对网络中的交换机和路由器添加多余路径会在网络中引入需要动态管理的通信环路,处理不当将产生不必要的广播风暴,造成网络瘫痪。所以必须启用生成树协议STP。STP 会特地阻塞可能导致环路的冗余路径,以确保网络中所有目的地之间只有一条逻辑路径。一旦网络出现故障,STP会重新计算路径,将必要的端口解除阻塞,使冗余路径进入活动状态。其次,采用端口聚合技术。端口聚合可将多物理连接当成一个单一的逻辑连接来处理。它允许两个交换器之间通过多个端口并行连接同时传输数据以提供更高的带宽,更大的吞吐量和可恢复性技术。一般来说,两个普通的连接器连接的最大带宽取决于媒介的传输速度(比如100BAST-TX为200M),而是用Trunk技术可以将4个200M的端口捆绑后成为一个高达800M的连接。这一技术的优点是以较低的成本通过捆绑多端口提高带宽,从而消除网络访问中的瓶颈。另外,Trunk还具有自动带宽平衡,即使Trunk只有一个连接存在时,仍然会工作,提供了网络的可靠性。(520) 第三级容错,设备冗余。 首先,该网络采用了双核心拓扑结构。核心层采用两台CISCO C6500交换机,两者之间使用双千兆光纤互联,利用链路聚合技术,在两台核心交换机之间扩大通信吞吐量,提高可靠性,实现复杂均衡的冗余连接。当一条交换机出现故障或核心交换机与汇聚层交换机之间的某条链路出现故障,系统会自动将通信业务快速切换到另一台正常的交换机上,从而实现系统的可靠性。(170) 其次,DNS服务器冗余配置。该校园网里有自己的DNS服务器,服务器采用两台,一台主DNS服务器,一台辅助DNS服务器。这样可以实现DNS服务器的容错,也就是当一天DNS

论文-嵌入式系统软件可靠性分析

嵌入式系统软件可靠性分析 曾真,T201089946,武汉数字工程研究所产品研发部 摘要: 随着越来越多的领域使用软件和微处理器控制各种嵌入式设备,对日益复杂的嵌入式系统进行快速有效的测试愈加显得重要。本文旨在对嵌入式系统的软件可靠性进行更深入全面的了解,首先简要介绍嵌入式系统软件可靠性的定义及特点,然后介绍嵌入式系统软件测试的发展现状,接着对如何提高嵌入式软件可靠性进行一定程度的探讨,并详细地介绍了嵌入式软件测试关键技术和测试结构,最后对嵌入式软件可靠性分析的研究情况进行总结。 关键词: 嵌入式、软件可靠性、软件测试、测试策略、插桩技术 1.嵌入式系统可靠性概述 根据IEEE(国际电机工程师协会)的定义,嵌入式系统是“控制、监视或者辅助装置、机器和设备运行的装置”。从中可以看出嵌入式系统是软件和硬件的综合体,还可以涵盖机械等附属装置。硬件系统是软件运行的基础,其质量差别比较直观,通过外观观测和仪器测试,对其质量和性能可以做出较为客观的评估。而软件系统包含研发人员对系统需求的理解、对硬件系统掌握程度、实践经验及编程能力等多方面影响因素,因此难以对软件可靠性进行评估。 嵌入式系统安全性的失效可能会导致灾难性的后果,即使是非安全性系统,由于大批量生产也会导致严重的经济损失。这就要求对嵌入式系统,包括嵌入式软件进行严格的测试、确认和验证。随着越来越多的领域使用软件和微处理器控制各种嵌入式设备,对日益复杂的嵌入式软件进行快速有效的测试愈加显得重要。 2.嵌入式软件可靠性特点 2.1实时性对嵌入式软件可靠性的影响 实时软件与其他软件不同,它的正确性不仅由功能和行为决定,还依赖于其时间特性。如 1

单片机系统可靠性设计

单片机系统可靠性设计 单片机是典型的嵌入式微控制器,由运算器,控制器,存储器,输入输出设备等构成,相当于一个微型的计算机。下面是小编为你带来的单片机系统可靠性设计,欢迎阅读。 在单片机系统的设计中,为了提升系通过运行的安全性与可靠性,需要针对其硬件系统和软件系统实施可靠性设计,这样才能满足使用需求。本文将针对单片机系统,分别从软件和硬件两个方面来阐述可靠性设计,具有一定的借鉴意义。 单片机系统可靠性设计 随着科学技术的不断进步,人们对于单片机系统的设计也更加关注,不断研究出新的技术,来提升单片机系统运行的可靠性。但是其可靠性与用户需求依然存在着一定的差距,亟需对其进行完善,提升可靠性。 正确设计软件 1.认真设计 对于单片机系统每部分的硬件地址,要清楚明确,对于汇编语言指令以及机器状态影响要了解和掌握,对于CPU内部的RAM功能要划分正确,仔细认真编写单片机系统软件。同时,在编写中,应用软件工程做法,保证程序的透明易懂,提升可维护性和可读性。 2.合理安排中断 按照系统的具体特点,对于工段优先级和中断功能进行

合理的安排,保护和恢复中断现场,防止发生中断冲突。 3.模块化结构 按照系统功能,可以将软件划分为多个模块,保证变成具有清楚的思路,便于调试和阅读,不易出错。 提升可靠性具体措施 1.设计合理的软件陷阱 在运行软件的过程中,有可能会出现失控的情况,例如,受到干扰,或者程序飞逸到非程序区。所以,在重要程序段、程序断裂点、非程序区以及向量区,可以埋设陷阱,从而及时捕捉飞逸程序。 2.指令冗余技术的应用 在不对实时性造成影响的情况下,反复执行同一指令,应用三选二方式实施判定,可以消除一些偶然的干扰,从而提升可靠性。 指令的应用 在进行单片机的地面测井仪的研制时,在对编好程序进行仿真运行时能够通过,但是写入指令时却无法运行,这是就可以将发生问题的字节用NOP代替,从而正常运行。 4.软件消抖方式 在按键操作中经常会发生意外的抖动,为了有效消抖,在处理程序内,可以通过延时再判,保证人机对话运行的可靠性。

软件可靠性和安全性设计报告

数字音频信息系统(AudioMIS) 软件可靠性和安全性设计报告 作者:AudioMIS 项目开发小组 完成日期:2005年9月1日 签收人: 签收日期: 修改情况记录:

软件可靠性和安全性设计报告 (1) 1 范围 (1) 1.1主要内容 (1) 1.2适用范围 (1) 2 引用标准 (1) 3 定义 (2) 3.1扇入 (2) 3.2扇出 (2) 3.3可靠性 (2) 3.4软件可靠性 (2) 3.5M C C ABE指数 (2) 4 设计准则和要求 (3) 4.1对计算机应用系统设计的有关要求 (3) 4.1.1 硬件软件功能的分配原则 (3) 4.1.2 硬件软件可靠性指标的分配原则 (3) 4.1.3 容错设计 (3) 4.1.4 安全关键功能的人工确认 (3) 4.1.5 记录系统故障 (3) 4.1.7 禁止回避检测出的不安全状态 (4) 4.1.9 分离安全关键功能 (4) 4.2软件需求分析 (4) 4.2.1 一般要求 (4) 4.2.2 功能需求 (4) 4.2.3 性能需求 (5) 4.2.3.1 精度 (5) 4.2.3.2 容量 (5) 4.2.3.3 时间特性 (5) 4.2.3.4 灵活性 (5) 4.2.4 接口需求 (6) 4.2.4.1 与外部设备的接口 (6) 4.2.4.2 与其他系统的接口 (6) 4.2.4.3 人机接口 (7) 4.2.5 数据需求 (7) 4.2.6 环境需求 (7) 4.2.6.1 硬件 (7) 4.2.6.2 软件 (7) 4.2.7 软件可靠性和安全性需求 (8) 4.2.8 其他需求 (8) 4.2.8.1 数据库 (8) 4.2.8.2 操作 (8) 4.3软件设计 (8) 4.3.1 一般要求 (8)

相关文档
最新文档