概率论论文-浅谈中心极限定理
浅谈中心极限定理
摘要:中心极限定理的产生具有一定的客观背景,最常见的是林德伯格-莱维中心极限定理和棣莫弗-拉普拉斯中心极限定理。它们表明了当n 充分大时,方差存在的n 个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。本文讨论了中心极限定理的内涵及其在生活实践中的应用。
关键词:中心极限定理;正态分布;生活中的应用。
引言:在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹
射击的落点与目标的偏差等。同时许多观察表明,若一个随机变量是由大量相关独立的随机因素的综合影响所构成的,而其中每一个随机因素的单独作用是微小的,则这样的随机变量通常是服从或近似服从正态分布。这种现象就是中心极限定理产生的客观背景。
在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。王勇老师讲到中心极限定理时,曾非常激动地说这个定理一被提出便震惊了全世界,而且重复了数遍。由此足以见得中心极限定理的重要性。
目前我们研究的是独立同分布条件下的中心极限定理:
林德伯格-莱维中心极限定理:设
{}n X 是独立同分布的随机变量序列,且
)(,)(2>==σμi i X Var X E 存在,若记
n
n X
Y n
i i
n σμ
-=
∑=1
则对任意实数y ,有
{}?
∞
--∞
→=Φ=≤y
t n n t y y Y P .d e π21)(lim 2
2
这个中心极限定理是由林德伯格和莱维分别独立的在1920年获得的,定理告诉我们,
对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。只有当n 充分大时,
n
Y 才近似服从标准正态分布)1,0(N ,而当n 较小时,此种
近似不能保证。也就是说,在n 充分大时,可用)1,0(N 近似计算与n
Y 有关事件的概率,而
n 较小时,此种计算的近似程度是得不到保障的。当
)
1,0(~N Y n 时,则有
)
,
(~),,(~2
2
1
n N X n n N X
n
i i
σμσμ∑=。
现如今旅游、汽车等行业越来越受欢迎。在这些行业中就会用得到中心极限定理。 例如,某汽车销售点每天出售的汽车服从参数为λ=2的泊松分布,若一年365天都经
营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700辆以上汽车的概率。[1]
解:设
i ξ为第i 天出售的汽车的数量,则36521......ξξξξ+++=为一年的总销量,由
2)()(==i i Var E ξξ,知=)(ξE 365×2=730
利用中心极限定理得
P(ξ>700)=1-P(ξ≤700)≈1—
)730730
700(
-Φ=1-Φ(一1.11)=0.8665
在理论中,我们也可用它来解决一些比较抽象的问题,比如下面的极限求解问题。 例如,利用中心极限定理证明:
21
!lim 0
=∑=-∞→n
k k n
n k n e [1] 证明:设{
k ξ}独立同分布且k ξ~P(1),k=1,2…….
则a=
()
k E ξ=l ,2
σ=
()
k Var ξ=1
∵由泊松分布的可加性知
∑=n
k k
1
ξ
~P(n)
∴n
n k k n k n i i n k k e
k n k P n P -====∑∑∑∑=??? ??==??? ??≤0011
!ξξ 又∵由中心极限定理知:
()?
??
???≤-=??? ??≤-=??? ??≤∑∑∑===010111
k n k n k k n k k P n P n P ξξξ ()()00111Φ→??????≤-=∑=n k k n P ξ
()∞→=
n 21
∴
21!lim 0=∑=-∞→n
k k n
n k n e 如果在林德伯格-勒维中心极限定理中,
n
X 服从二项分布,就可以得到以下的定理。
棣莫弗-拉普拉斯中心极限定理:设n 重伯努利试验中,事件A 在每次试验中出现的概
率为p (0
S 为n 次试验中事件A 出现的次数,且记
npq
np S Y n n -=
*,则对任意
实数y ,有
dt
e
y y Y P y
t
n n ?
∞
--
∞
→==≤2
*
2
21
)()(lim π
φ。
它表明,n 充分大时,
npq
np S Y n n -=
*分布近似服从与标准正态分布,常称为“二项分
布收敛于正态分布”,正态分布是二项分布的极限分布,当n 充分大时,我们可以利用该定理的结论来计算二项分布的概率。
棣莫弗-拉普拉斯中心极限定理的应用也很广泛,例如:假设某校要建新校区,里面有学生5000人,只有一个开水房。由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。假设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务处遇到的问题是:
(1)未新装水龙头前,拥挤的概率是多少?
(2)至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?[2]
解:(1)设同一时刻,5000个学生中占用水龙头的人数为X ,则)01.0,5000(~B X 拥挤的概率是:
∑=-?
??? ??=≤≤-=>=45
0k 500099.001.05000-145)(0 P 145)P(p k
k k ξξ
由棣莫弗一拉普拉斯中心极限定理,n=5000,p=0.01,q=0.99,
04.7,50==npq np
故
2389.0)1.7()71.0()04.750
0()04.75045(
)450(=---=---=≤≤φφφφξP
即拥挤的概率为
7611.02389.01)45(=-=>ξP
(2)欲求m ,使得95.0)0(≥≤≤m P ξ,则由棣莫弗一拉普拉斯中心极限定理可知,
95.0)04.750
0()04.750(
≥---φφm
由于
0)09.7()04.750
0(
≈-=-φφ
即
95.0)04.750
(
≥-m φ
查表得645
.104
.750
≥-m
即6.61≥m
故需装62个水龙头,才能以95%以上的概率保证不拥挤。
保险与我们的生活息息相关。中心极限定理在保险行业方面也有很大应用。
例如,某保险公司有2500个人参加保险,每人每年付1200元保险费,在一年内一个人死亡的概率为0.002,死亡时其家属可向保险公司领得20万元。问:(1)保险公司亏本的概率有多大?(2)保险公司一年的利润不少于1010万元,200万元的概率各为多大? [3]
分析:首先,我们先设一年内死亡的人数为随机变量X ,保险公司亏本的概率为P 。因为题中人和人之间是独立的,而且死亡的概率都一样为0.002,因此比较容易看出,此题中的X 是服从二项分布的,我们也可用二项分布的方法把p 具体地求出来,但要想求出
()k
k k k X P -???? ??==2500)998.0(002.02500绝非易事,更何况还要算上几千个呢?为此我们不
妨用中心极限定理来求解它。
解:设X 为一年内死亡的人数,则)002.0,2500(~B X ,5=np ,99.1)1(=-p np (1)由棣莫弗一拉普拉斯中心极限定理知
P(亏本)=(4.48)-1)4.99
5-15(-115)P(X -115) X ( P 300)(20X P φφ=≈≤=>=>
=1-0.99993=0.00007
所以,保险公司亏本的概率为0.00007,几乎为0。 (2)由棣莫弗一拉普拉斯中心极限定理知
P(利润100≥)98.0)99.4510(
)10()10020300(=-≈≤=≥-=φX P X P
P(利润200≥)5.0)99
.455()5()20020300(=-≈≤=≥-=φX P X P
以上结果说明,保险公司几乎不可能亏本.不过,关键之处是对死亡率的估计必须正确,
如果所估计的死亡率比实际低,甚至低得多,那么,情况就会不同。
结论
中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明,只要样本容量足够地大,得自未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。
参考文献:
[1]杜伟娟,于文娟。中心极限定理及其初步应用[J] 内蒙古电大学刊,2007 [2]孔祥凤,中心极限定理在管理中的应用[J] 西安邮电学院应用数理系,2009
[3]孙蓓,中心极限定理及其在若干实际问题中的应用[D] 河南:开封基础教育研究室,2012
(注:可编辑下载,若有不当之处,请指正,谢谢!)