正态分布及其应用

在日常工作生活中我们经常遇到一种目前应用最为普遍的连续概率分布:正态分布.它在数学概率学、统计学的研究上或是在对实际问题的处理中都有着非常高的应用价值.研究正态分布的特性并利用正态分布的性质来处理有关连续型随机变量的问题不仅可以减少人们的工作量,而且极大程度的提高了人们生活的便捷性.通过查阅大量文献,简单地介绍正态分布的概念及其性质,并列举正态分布在医学研究、工业生产、教育评价、仪器测量以及日常生活等方面的应用实例,分析正态分布在这些领域的主要应用形式,总结出正态分布在这些领域的主要应用价值和未来的应用方向,为探索正态分布更加广泛的应用前景提供参考.
正态分布的研究与应用经历了一个漫长且艰辛的过程,它最开始由数学家狄美孚(De Moivre)发现引入与提出,随后高斯(Gauss)证明了误差服从正态分布理论并将其应用于自然科学的研究中,接着拉普拉斯进行了中心极限定理的证明,进一步完善了观测误差论,随后凯特莱又对正态曲线进行了拓展,高尔顿对正态分布进行了创新[1].
19世纪起,以马尔可夫和切比雪夫为代表的数学家通过引入随机变量的盖帘,建立了随机变量的独立性和非独立性的标准,提出了收敛到正态分布的充要条件.进入20世纪,在哥赛特,费歇尔等人研究得出了小样本理论之后,正态分布在数理统计中的重要性得到了进一步加强.在20世纪后,由于科学技术的进一步发展,统计学研究工作者得到的实验数据更加的精准,实验结果也更贴近现实,统计分析出的研究结论也获得了大众的广泛认同
在我们周围存在着许许多多的随机变量,它们大多数都是服从或近似服从正态分布的.例如,工厂加工某动车零件的使用寿命、一定条件下生长的马铃薯单位面积产量、一个地区成年男性的身高、某地区年降雨量、测量某零件直径的误差、一个学校的学生考试成绩、人类寿命的分布等等.在数理统计里用以进行统计或推断的很多统计量,无论原分布是什么,当样本容量充分大时,这些量都能近似服从正态分布.由此可见,研究正态分布具有非常重要的实际意义,把正态分布应用于生产生活,可以极大程度的提高人类工作生活的便捷性.现目前人们对正态分布的研究已告一段落,但对于正态分布的应用各行业参差不齐,正态分布极高的应用价值还有待我们深入发掘.在前人的基础上了解正态分布的性质,把正态分布更为广泛和深入的应用到生产生活的各个方面,思考正态分布更多应用的可能,才能让正态分布绽放出更加夺目的光彩.
2文献综述
2.1 国内外研究现状
在参考文献[1]中,陈希孺先生对

正态分布的起源和发展做了系统的介绍.文献[2~6]、[8]中系统的讲解了正态分布的相关概念并对其相关定理进行了证明,并给出了一部分例题供大家学习研究.在文献[7]、[9~16]中,国内外不同的研究者都对正态分布的应用性进行了研究,并从不同角度对正态分布在某几个领域的应用做了详细阐述,并附以实例说明.
2.2 国内外研究现状评价
总的来说,对于正态分布的研究,是很多数学家耗费心血才有了今天的成果,在理论研究上要再取得突破性进展已经很难了.文献[2~6]、[8]已经对正态分布的研究结果充分的展示出来.但是就目前为止,关于介绍正态分布应用在不同领域上的文献还有所欠缺.正态分布的应用仍具有极大的发展前景与研究意义,探索正态分布应用的更多可能性是极具价值的.文献[7]、[9~16]都对正态分布的应用从不同领域进行了分析和呈现,能够引发读者对正态分布应用性的思考.但是目前还缺乏能够完整的对正态分布的应用领域进行分类,对正态分布未来应用前景的探索的文献.
2.3 提出问题
在正态分布的研究方面目前已经很难有所进展,但是在正态分布的应用上还有待我们继续发掘.对正态分布在不同领域内的应用进行归纳总结,并探索正态分布在各领域的发展前景.使正态分布能够在工作生活中得到更为广泛的应用,这就是本文所要研究的问题.
3 正态分布的相关知识
3.1 正态分布的概念
若连续型随机变量 的概率密度为:
(3.1.1)
其中 为常数( ),则称随机变量 服从参数为 的正态分布,记为 [2].因为高斯在探究天文学中最先应用了正态分布,并研究了正态分布的性质,所以它又被称为高斯分布.
把正态分布密度函数 建立在坐标轴上得到如图1所示的钟状曲线,这条曲线被称作“正态分布密度函数曲线”,简称“正态曲线” [3].
3.2 正态曲线的特性
对式(3.1.1)求导得,
(3.2.1)
令 ,则有 ,即当 时, 有极大值
对式(3.2.1)求导得,
(3.2.2)
令 ,则有 ,即曲线在 处有两个拐点.
表1 正态曲线特性









正 正 正 0 负 负 负
正 0 负 负 负 0 正

??

?
?
?
曲线 凹 拐点 凸 极大值 凸 拐点 凹
由上可知正态曲线的特性如下:
(1) 曲线关于 对称,对于任意 有 .
(2) 在 时取到最大值 .正态曲线从最高点 开始向两侧持续降低,形成像钟一样两端低缓,中部突出的图形.因此, 离 越远, 的值越小.也就是离对称轴越远的位置,随机变量 落在上面的可能就越低.
(3) 在对称轴的两边 处正态曲线有拐点, 的取值范围为整个 轴,当 时,曲线以 轴为渐进线[4].
3.3 参数 ? 和 ? 的意义
正态分布有两个参数,分

别是 和 , 和 的取值确定后,正态曲线的位置和形状就不在发生改变.若保持 不变,只调整 的大小,图形将顺着 轴向左或向右移动,形状不会发现变化(如图2所示),可见正态曲线 所在的位置由位置参数 决定.如果固定 ,只调整 的值,则图形在 轴上的位置不发生变化,只有形状会发生变化,因为最大值 ,所以 的值越小则图形越陡峭, 的值越大则图形越平缓,正态分布的概率密度曲线 的形状(高矮胖瘦)完全由形状参数 决定(如图3所示).

从图像上可以看出, 是拐点所在位置的横坐标, 是对称轴所在位置,在数理统计中, 是标准差, 的大小反映了观测值的分散程度, 是正态分布的数学期望(均值), 表明了观测值的集中趋势[5].
3.4 标准正态分布
称 的正态分布为标准正态分布,将 代入式(3.1.1)有:
(3.4.1)
式(3.4.1)为标准正态分布的密度函数,服从标准正态分布的随机变量 [3].
在概率论中,随机变量的分布函数 等于密度函数 在无穷区间 上的广义积分,于是标准正态分布的分布函数 为:
= (3.4.2)
改变 的取值,由式(3.4.2)能够获得与之相对应的 的数值,整理后就有了下面的“标准正态分布函数数值表”(简称“标准正态分布表”).

式(3.4.2)的几何意义是在区间 内正态曲线与 轴之间所围曲边梯形的面积,如图4所示,

图4
这也是将“正态分布表”称作“正态概率曲线下的面积”的道理.
由于密度函数 可以在整个 轴上取值,由密度函数性质得:
即:曲线与 轴所围面积为l[6].
3σ准则: 当X~N(0,1)时,由标准正态分布表可以得,


.
因为X的取值99.7%以上都集中在 内,只有0.3%的概率落在这个区间以外,但是落在 以外这种情况发生的可能性很低(被称为小概率事件),可以忽略不计,所以我们可以认为正态分布的随机变量X的取值落在 内基本上是可以肯定的事.
4 正态分布的应用
4.1 正态分布在医学中的应用
在医学研究上,人类和其他生物的许多生理生化指标(如同一年龄男性的身高、健康成人的红细胞数等)、测量的误差等,都是呈正态分布或近似正态分布的.即使有许多非正态分布的资料,当所采集的数据量足够大时,也可以看作是满足正态分布的情况来进行计算.正态分布在医学领域的应用主要有下面的这三种情况:
1.估计频数分布.
例1:在医学上规定低体重儿是出生时体重低于2500g的婴儿,如果在一次调查中发现2018年某地区婴儿出生时体重均数是3200g,标准差是350g,请估计这个地方2018年低体重儿所占的比例是多少?

查表得,
即从 到2500的比例为2.28%,所以估计这个地方2018年低体重儿所占比例为2.28%.
2.制定医学参考值范围.
例2: 通过统计测量得到某一个地区健康成年男

性体内红细胞的均数为 ,标准差为 ,请你估计该地健康成年男性体内红细胞数的95%参考值范围.
下限:
上限:
该地成年男子红细胞数的95%参考值范围为: .
3.质量控制
为了控制实验时产生的误差,使实验结果更加精确,实验室在进行质量控制时,一般情况都是以 作为警戒限,以 作为控制限( 是均数,s是标准差).
随着现代科学技术和信息技术的不断提高,正态分布越来越广泛的参与到现代医学的临床与研究当中,并且正态分布还将为新的医学研究继续服务,探索正态分布在医学应用上的更多可能,进行大胆的猜想,严谨的论证,或许能够把正态分布的应用推到更宽广的地方.
4.2 正态分布在工业生产中的应用
正态分布在工业生产中的应用也是极为的普遍,无论是在产品的质检方面还是误差控制上都功不可没.尤其是现代制造业广泛的应用机器代替传统手工业的生产,大量自动化的设备被应用在工业生产中,这里面一些技术环节和算法方面都离不开正态分布的帮助.
例3:在汽车生产中,对某一零件的尺寸的合格率进行检查.
假设汽车某一零件的随机取样尺寸如下,单位mm
163.879 164.066 166.248 164.888 168.714 165.388 165.959
165.509 165.722 166.420 164.871 165.825 168.154 165.885
167.586 162.394 163.414 167.886 162.790 161.673 163.257
165.526 164.798 164.744 164.014 165.023 164.565 160.200
163.500 165.313 168.969 166.042 168.069 165.461 162.838
162.716 164.375 163.723 164.260 163.745 165.453 168.245
165.570 164.066 165.235 166.530 163.820 163.925 160.990
166.870 164.523 161.080 167.901 163.081 164.398 163.880
165.105 168.181 166.724 166.270 164.932 164.696 163.401
166.082 164.666 165.018 166.246 162.139 162.842 167.378
该组数据的基本参数
N=100 μ=165.1 σ=1.895
该组数据的正态分布曲线如图5
绿色范围为(159.415,170.785],即(μ+3σ,μ-3σ].
由图5可以此,可认为该零件的尺寸为合格.
例4:某车间需要生产一些轴,其直径服从正态分布,已知这批轴的平均直径 =l0 ,标准差 =0.015 ,规定直径在(10±0.03) 范围内为合格品.
求:
(1)不合格品的概率;
(2)合格品的概率.
解: 设这批轴的直径为 ,由题意可知 , 和 为不合格品.
(1)

(2)
,
不合格品的概率为4.55%,合格品的概率为95.45%.
正态分布在工业生产中极大程度的减少了劳动量,节约了生产的时间和成本.但随着5G的商用,工业生产将从自动化朝着信息化发展,正态分布将在这个过程中扮演着重要的地位.利用正态分布的相关性质帮助企业实现向信息化的转变,这里面隐藏着对正态分布应用的很多可能.
4.3 正态分布在教育测量中的应用
正态分布应用于教育测量开始于19世纪末,在英国优生学家高尔顿(Galton)、美国心

理学家韦克斯勒(Wchsler)等测量学先驱的宣传和带动下,正态分布律在各种教育及心理测量中逐渐推广起来[7].
在教育测量中也经常应用到正态分布的相关性质,经统计分析(学生数量≥30)93%的考试成绩分布情况是满足正态分布“中间多,两边少,左右基本对称”的特点,因此参加测验学生的测验结果ξ可以近似地用正态分布 来描述.然后通过样本(参与测验的学生)对总体(全体学生)的某些特征(均值、方差等)进行推理判断,这已经是教育研究中一种较为普遍的方法,同时也是正态分布在教育教学中应用最为典型的案例.用统计学的相关知识确定学生考试成绩的均数、方差以及正态分布曲线等,可以有效的发现和分析学生对知识的掌握情况,帮助教师调整教学策略,完善教学.
例5:某班级对学生进行一次数学模拟考试,决定从中挑选14%的人参加数学竞赛.由以往经验和概率论相关知识可知考试成绩成正态分布,考试结果平均分数为80分,标准差为14分,问学生至少考多少分才能得参加数学竞赛?
解: 设至少考 分才能参加数学竞赛,由题意:

.
反查正态分布表得:


(分)
即学生至少得95分才能参加数学竞赛.
例6:设有1000人参加考试,考试成绩近似服从正态分布,且90分以上有36人,60分以下有115人,如果按分数从高到底依次录取250人,问考试成绩为80分能否被录取[8]?
解:设考试成绩服从正态分布 ,其分布函数为 ,则

其中 为标准正态分布函数,满足 .
根据90分以上和60分以下的人数比例,分别有


反查标准正态分布表得:

联立解得 ,故 .
记最低录取分数为 ,根据录取人数比例,有

反查标准正态分布表得

故最低录取分数 =78.7,考试成绩为80分能够被录取.
正态分布在教育测量中能够有效的帮助筛选一定比例的人数,可以帮助评析一份试卷的信度、效度、区分度,可以用来统计学生成绩各区间段的人数等等,在计算机媒体的帮助下,人们能够更方便地应用正态分布来进行教育测量,而随着信息化时代的到来,在教育测量与评价中又怎么可能缺少正态分布这个重要角色呢?
4.4 正态分布在仪器测量中的应用
正态分布虽然在其他领域的测量中也起到了不可忽视的关键作用,但它单独在仪器测量领域更发挥了重要价值,对于测量工作者来说,掌握正态分布的性质能帮助他们更好的完成本职工作.
例7:用测量仪器测量(5.26±d) 这一尺寸.测量值的平均数是5.26 ,标准差为0.02 ,测量值服从正态分布.为了保证测量值95%处于公差范围中,求d值.
解:由题意可知要求概率为0.95的尺寸范围.设测得的值为随机变量 ,则 .由题意得

反查正态分布表得:

故有
.
例8:用仪

相关文档
最新文档