实验十三 二项分布的计算与中心极限定.
第二节-中心极限定理要点

定理的应用:对于独立的随机变量序列 X n,不管
Xi (i 1, 2, , n) 服从什么分布,只要它们是同分布,
且有有限的数学期望和方差,那么,当n充分大时,这
n
些随机变量之和 X i 近似地服从正态分布 N n, n 2 i 1
从演示不难看到中心极限定理的客观背景
f
g
h
例:20个0-1分布的和的分布
k 1
概率论中有关论证独立随机变量的和的极限分布 是正态分布的一系列定理称为中心极限定理。
独立同分布的中心极限定理
设随机变量X1,X2,…,Xn相互独立,服从同一分
布,且有有限的数学期望 和方差 2 ,则随机变量
n
Xi n
Yn i1 n 的分布函数 Fn (x) 满足如下极限式
lim n
lim
n
P
i 1
n
x
(
x);
这一讲我们介绍了中心极限定理 中心极限定理是概率论中最著名的结果 之一,它不仅提供了计算独立随机变量之和 的近似概率的简单方法,而且有助于解释为 什么很多自然群体的经验频率呈现出钟形曲 线这一值得注意的事实.
在后面的课程中,我们还将经常用到中心 极限定理.
1
x t2
e 2 dt
2
即对任意的 a < b,
lim P a Yn np b
n
np(1 p)
1
b t2
e 2 dt
2 a
Y n ~ N (np , np(1-p)) (近似)
正态分布的概率密度的图形
x
二项分布的随机变量可看作许多相互独立
的0-1分布的随机变量之和, 下面是当x-
(1) 至少命中180发炮弹的概率; (2) 命中的炮弹数不到200发的概率.
中心极限定理

概率论与数理统计第四章正态分布§13 中心极限定理暨南大学电气信息学院苏保河主讲第四章正态分布§13 中心极限定理主要内容一、林德伯格—莱维中心极限定理二、棣莫弗—拉普拉斯中心极限定理三、李雅普诺夫中心极限定理暨南大学电气信息学院苏保河主讲例1炮火轰击敌方防御工事100 次, 每次轰击命中的炮弹数服从同一分布, 其数学期望为2, 均方差为1.5. 若各次轰击命中的炮弹数是相互独立的, 求100 次轰击(1)至少命中180发炮弹的概率;(2)命中的炮弹数不到200发的概率.一、林德伯格—莱维中心极限定理解设X k 表示第k 次轰击命中的炮弹数,2()2,() 1.5,1,,100,k k E X D X k ==="相互独立,12100,,,X X X "苏保河主讲设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理, 例1 解(续1)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则2()200,()15,E X D X ==~(200,225).X N 近似地有{180}P X ≥1((180200)/15)Φ≈−−(1.33)Φ=(1)至少命中180发炮弹的概率;1( 1.33)Φ=−−0.9082.=1{180}P X =−<设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理,例1 解(续2)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则()200,()225,E X D X ==2~(200,15).X N 近似地有(2)命中的炮弹数不到200发的概率.{0200}P X ≤<((200200)/15)((0200)/15)ΦΦ≈−−−(0)(13.33)ΦΦ=−−0.5000.=例2检验员逐个检查某产品, 每查一个需用10秒钟. 但有的产品需重复检查一次,再用去10 秒钟. 若产品需重复检查的概率为0.5, 求检验员在8 小时内检查的产品多于1900 个的概率.解在8 小时内检查的产品多于1900 个,即检查1900 个产品所用时间小于8 小时.设X为检查1900 个产品所用的时间(秒),设Xk 为检查第k个产品所用的时间(单位为秒), k= 1, 2, …, 1900.苏保河主讲例3某车间有200 台车床独立地工作,开工率为0.6, 开工时每台耗电为r 千瓦.问供电所至少要供给这个车间多少电力,才能以99.9% 的概率保证这个车间不会因供电不足而影响生产?解设至少要供给该车间a千瓦的电力, X为开工的车床台数, 则X~ B(200, 0.6),由棣莫弗—拉普拉斯中心极限定理,X~ N(120, 48) (近似),欲求a, 使{0}99.9%.P rX a≤≤=苏保河主讲李雅普诺夫中心极限定理的意义如果随机变量X 可以看成许多相的总和,互独立的起微小作用的因素Xk则X 服从或近似服从正态分布.苏保河主讲苏保河主讲1. 离散型随机变量的数学期望第三章内容小结定义1设X 是离散型随机变量, 其分布律是P {X = x k } = p k (k = 1, 2, …),如果收敛, 定义X 的数学期望1||k k k x p ∞=∑1()k k k E X x p ∞==∑一、数学期望2. 连续型随机变量的数学期望定义2设X 是连续型随机变量,()()d E X x f x x∞−∞=∫收敛, 定义X 的数学期望||()d x f x x ∞−∞∫其密度函数为f (x ), 如果苏保河主讲4. 数学期望的性质1.设C 是常数, 则E (C ) = C .4.设X , Y 独立, 则E (XY ) = E (X )E (Y ).2.若k 是常数, 则E (kX ) = kE (X ).3.E (X 1 + X 2) =E (X 1) + E (X 2).条件: X 1,X 2, …, X n 相互独立.11()().n n i i i i i i E C X C E X ===∑∑推广:11()().n n i i i i E X E X ===∏∏推广:苏保河主讲3. 方差的性质1)设a 是常数, 则D (a ) = 0.2)若a 是常数, 则D (aX ) = a 2D (X ).4)若X 1 与X 2相互独立, 则D (X 1±X 2) = D (X 1) + D (X 2).推广:若X 1, X 2, …, X n 相互独立, 则11[](),n ni i i i D X D X ===∑∑211[]().n n i i i i i i D C X C D X ===∑∑3)若a , b 是常数, 则D (aX + b ) = a 2D (X ).苏保河主讲4. 协方差的定义定义对于二维随机变量(X, Y),称E{[X-E(X)][Y-E(Y)]} 为X与Y 的协方差, 记为Cov(X, Y), 即Cov(X, Y) = E{[X-E(X)][Y-E(Y)]}.5. 协方差的计算公式Cov(X,Y)=E(XY)–E(X)E(Y)推论: 若X 与Y 独立, 则Cov(X,Y) = 0.苏保河主讲6. 协方差的性质(1)Cov(X,Y)=Cov(Y,X)(2)Cov(aX,bY)=ab Cov(X,Y), a,b是常数(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)苏保河主讲若X 1, X 2, …, X n 两两独立, 则D (X +Y ) = D (X )+D (Y )+2Cov(X , Y )7. 随机变量和的方差与协方差的关系11()().n ni i i i D X D X ===∑∑11()()2Cov(,)n ni i i j i i i j D X D X X X ==<=+∑∑∑苏保河主讲9. 相关系数的性质2)|| 1.XY ρ≤0,XY ρ=1) X 和Y 独立时但其逆不真.定义对于随机变量X , 如果E (X k )( k = 1, 2, …) 存在, 则称它为X 的k 阶原点矩或k 阶矩.10. 矩和中心矩如果E {[X -E (X )]k } ( k = 1, 2, …) 存在, 则称它为X 的k 阶中心矩.苏保河主讲三、切比雪夫不等式与大数定理1. 马尔科夫不等式2. 切比雪夫不等式3. 切比雪夫大数定理4. 独立同分布下的大数定理5. 伯努利大数定理苏保河主讲用X 表示n 重伯努利试验中事件A 出现(成功)的次数, 其分布律称r.v. X 服从参数为n 和p 的二项分布, 注当n = 1 时, 称X 服从参数为p 的伯努利分布,或0-1 分布.1. 二项分布{}(1),k k n k n P X k C p p −==−0,1,,k n ="记作X ~ B (n , p ).苏保河主讲四、几个重要的随机变量苏保河主讲(),()(1).E X np D X np p ==−如果X ~ B (n , p ),结论:{}(1),k k n k n P X k C p p −==−0,1,,,k n ="2. 超几何分布定义将N个元素分为2 类, M个属于第一类, N-M个属于第二类, 从中按不放回抽样随机取n个元素. 令X表示这n 个元素中第一类元素的个数, 则称X服从超几何分布, 记为X h n N M~(,,)苏保河主讲。
中心极限定理的内涵和应用

中心极限定理的涵和应用在概率论与数理统计中,中心极限定理是非常重要的一节容,而且是概率论与数理统计之间承前启后的一个重要纽带。
中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。
故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍了中心极限定理的涵及其在生活实践中的应用。
一、独立同分布下的中心极限定理及其应用在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来研究一下在独立同分布条件下的中心极限定理,即如下的定理1:定理l (林德伯格-勒维中心极限定理)设{}n X 是独立同分布的随机变量序列,且0)(,)(2>==σμi i X Var X E 存在,若记nn XY ni in σμ-=∑=1则对任意实数y ,有{}⎰∞--∞→=Φ=≤yt n n t y y Y P .d e π21)(lim 22(1) 证明:为证明(1)式,只须证}{n Y 的分布函数列弱收敛于标准正态分布。
由定理可知:只须证}{n Y 的特征函数列收敛于标准正态分布的特征函数。
为此,设μ-n X 的特征函数为)(t ϕ,则n Y 的特征函数为nY n t t n ⎥⎦⎤⎢⎣⎡=)()(σϕϕ又因为E(μ-n X )=0,Var(μ-n X )=2σ,所以有()0ϕ'=0,2)0(σϕ-=''。
于是,特征函数)(t ϕ有展开式)(211)(2)0()0()0()(22222t o t t o t t +-=+''+'+=σϕϕϕϕ从而有=⎥⎦⎤⎢⎣⎡+-=+∞→+∞→nn Y n n t o nt t n )(21lim )(lim 22ϕ22t e -而22t e-正是N(0,1)分布的特征函数,定理得证。
这个中心极限定理是由林德贝格和勒维分别独立的在1920年获得的,定理告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。
《二项分布》知识点整理【DOC可编辑范文】

《二项分布》知识点整理二项分布的定义二项分布即重复n次的伯努力试验。
在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验二:超几何分布在产品质量的不放回抽检中,若N件产品中有件次品,抽检n件时所得次品数X=,则P此时我们称随机变量X服从超几何分布)超几何分布的模型是不放回抽样)超几何分布中的参数是,N,n上述超几何分布记作X~H。
二项分布:一般地,在n次独立重复的试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则=0,1,2,…n,此时称随机变量X服从二项分布,记作X~B,并记。
独立重复试验:独立重复试验的意义:做n次试验,如果它们是完全同样的一个试验的重复,且它们相互独立,那么这类试验叫做独立重复试验.一般地,在n次独立重复试验中,设事件A发生的次数为X,在每件试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生次的概率为此时称随机变量X服从二项分布,记作并称p为成功概率.独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的.独立重复试验概率公式的特点:是n次独立重复试验中某事件A恰好发生次的概率.其中,n是重复试验的次数,p是一次试验中某事件A发生的概率,是在n次独立重复试验中事件A恰好发生的次数,需要弄清公式中n,p,的意义,才能正确运用公式.二项分布的判断与应用:二项分布,实际是对n次独立重复试验从概率分布的角度作出的阐述,判断二项分布,关键是看某一事件是否是进行n次独立重复试验,且每次试验只有两种结果,如果不满足这两个条件,随机变量就不服从二项分布.当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果时,我们可以把它看作独立重复试验,利用二项分布求其分布列.求独立重复试验的概率:在n次独立重复试验中,“在相同条件下”等价于各次试验的结果不会受其他试验的影响,即…,n)是第i次试验的结果.独立重复试验是相互独立事件的特例,只要有“恰好”“恰有”字样的用独立重复试验的概率公式计算更简单,要弄清n,p,的意义。
中心极限定理

1 n P{0.09 ≤ ∑Xk ≤ 0.11 } n k=1
欲使 即 查表得
n 2Φ( ) −1 ≥ 0.95 30 n Φ( ) ≥ 0.975 30 即至少应取球3458次 即至少应取球 次 才能使“ 出现的频 才能使“0”出现的频 n ≥ 1.96 率在 率在0.09-0.11之间的 之间的 30 概率至少是0.95. 概率至少是
现在我们就来研究独立随机变量之和所 特有的规律性问题. 特有的规律性问题 无限增大时, 当n无限增大时,这个和的极限分布是 无限增大时 什么呢? 什么呢? 在什么条件下极限分布会是正态的呢? 在什么条件下极限分布会是正态的呢?
由于无穷个随机变量之和可能趋于∞, 由于无穷个随机变量之和可能趋于 , 故我们不研究n个随机变量之和本身而考虑 故我们不研究 个随机变量之和本身而考虑 它的标准化的随机变量
于是 P(X≤N)= P(0≤X≤N)
N −120 −120 ≈ Φ( ) − Φ( ) 48 48 N −120 ≈ Φ( ) 48
N −120 )≥0.999, 查正态分布函数表得 由 Φ( , 48 Φ(3.1) = 0.999 N −120 故 ≥ 3.1, 48
从中解得N≥141.5, 从中解得
千瓦, (由于每台车床在开工时需电力1千瓦, 由于每台车床在开工时需电力 千瓦 N台工作所需电力即 千瓦 ) 台工作所需电力即N千瓦 台工作所需电力即 千瓦.)
由德莫佛-拉普拉斯极限定理 由德莫佛 拉普拉斯极限定理
X − np 近似N(0,1), 近似 np(1− p)
这里 np=120, np(1-p)=48
定理1(独立同分布下的中心极限定理) 定理 (独立同分布下的中心极限定理) 设X1,X2, …是独立同分布的随机 是独立同分布的随机 变量序列, 变量序列,且E(Xi)=µ ,D(Xi)= σ 2 , i=1,2,…,则 ,
斯特林公式证明二项分布中心极值

斯特林公式证明二项分布中心极值好的,以下是为您生成的关于“斯特林公式证明二项分布中心极值”的文章:咱先来说说啥是二项分布哈。
想象一下,你扔硬币,正面朝上算成功,反面朝上算失败。
你扔了 n 次,成功的次数 X 就服从一个叫二项分布的家伙。
这二项分布啊,在概率统计里可重要啦。
那斯特林公式又是啥呢?它能帮咱们把一个很大的阶乘给近似地算出来。
咱们来看看怎么用斯特林公式证明二项分布的中心极值。
先把二项分布的概率质量函数写出来:P(X = k) = C(n, k) * p^k * (1 - p)^(n - k) 。
这里的 C(n, k) 就是从 n 个里面选 k 个的组合数。
咱来分析分析这个式子。
当 n 很大的时候,直接算 C(n, k) 可太费劲啦。
这时候斯特林公式就派上用场啦。
斯特林公式说 n! 约等于√(2πn) * (n / e)^n 。
咱把 C(n, k) 用阶乘展开:C(n, k) = n! / (k! * (n - k)!) 。
然后把斯特林公式带进去,一通化简,就能发现一些有趣的东西。
我记得有一次给学生讲这个的时候,有个小家伙瞪着大眼睛,一脸迷茫地问我:“老师,这一堆公式到底有啥用啊?”我笑着跟他说:“就好比你要去一个很远的地方,这些公式就是你的交通工具,能让你更快更准地到达目的地。
”经过一番推导,咱们能发现,当 k 接近 np 时,P(X = k) 取得最大值。
这就是二项分布的中心极值。
比如说,一个班级里有 50 个学生参加考试,及格的概率是 0.8。
那及格的人数大概就在 50 * 0.8 = 40 左右的时候最多。
再深入想想,这在实际生活里用处可大啦。
比如调查某种疾病的发病率,或者估计产品的合格率。
总之,通过斯特林公式证明二项分布的中心极值,让咱们对概率的世界有了更深刻的理解,能更好地解决各种实际问题。
就像有了一把神奇的钥匙,能打开很多未知的大门。
希望大家都能掌握这个有趣又有用的知识,在数学的海洋里畅游得更欢快!。
二项分布计算公式

二项分布计算公式二项分布是概率论中一种常见的离散概率分布,用于描述在n次独立重复的伯努利试验中,发生其中一事件的次数的概率分布。
该概率分布的计算公式如下:P(X=k)=C(n,k)*p^k*(1-p)^(n-k)其中,P(X=k)表示事件发生k次的概率;C(n,k)表示从n次试验中选择k次成功的组合数;p表示每次试验成功的概率;n表示试验的总次数。
接下来,我们将详细解释二项分布的计算公式。
首先,我们来解释组合数C(n,k)的含义。
组合数C(n,k)表示从n个元素中选择k个元素的组合数。
它的计算公式为:C(n,k)=n!/(k!*(n-k)!)其中,n!表示n的阶乘,即n!=n*(n-1)*(n-2)*...*2*1;k!表示k的阶乘,即k!=k*(k-1)*(k-2)*...*2*1;(n-k)!表示(n-k)的阶乘。
例如,从5个元素中选择2个元素的组合数为:C(5,2)=5!/(2!*(5-2)!)=5!/(2!*3!)=(5*4)/(2*1)=10计算得到的组合数10表示从5个元素中选择2个元素的组合数有10种可能。
其次,我们来解释p^k和(1-p)^(n-k)的含义。
p^k表示每次试验成功的概率为p,且连续k次试验均成功的概率。
(1-p)^(n-k)表示每次试验失败的概率为1-p,且连续(n-k)次试验均失败的概率。
例如,物体的制造过程中,每次试验成功的概率为0.2,总共进行了5次试验。
那么,连续2次试验成功的概率为:p^k=0.2^2=0.04连续3次试验失败的概率为:(1-p)^(n-k)=(1-0.2)^(5-2)=0.8^3=0.512最后,我们来解释P(X=k)的含义。
P(X=k)表示在n次独立重复的伯努利试验中,发生其中一事件恰好k次的概率。
它的计算公式为:P(X=k)=C(n,k)*p^k*(1-p)^(n-k)例如,其中一种病在地区的发生率为0.1,随机选择100个人进行检测。
二项分布的极限分布是正态分布证明

二项分布是概率论中的一个重要分布,它描述了在n次独立重复的伯努利试验中成功次数的概率分布。
在实际应用中,很多事件可以看作是伯努利试验的重复,因此二项分布在实际问题中有着广泛的应用。
而在许多情况下,当伯努利试验的次数n较大时,二项分布的极限分布会近似地服从于正态分布。
本文将就二项分布的极限分布是正态分布进行证明和推导。
1. 二项分布的定义我们先来了解一下二项分布的定义。
设有一独立重复进行n次的伯努利试验,每次试验成功的概率为p,失败的概率为q=1-p。
在这种情况下,试验成功的次数X服从二项分布,其概率质量函数为:P(X=k)=C(n, k)p^kq^(n-k), k=0, 1, 2, ..., n。
其中C(n, k)表示从n个不同元素中取出k个元素的组合数,其具体定义为:C(n, k)=n!/(k!(n-k)!)。
2. 二项分布的均值和方差二项分布的均值和方差为:E(X)=np,Var(X)=npq。
当n较大时,二项分布的极限分布会近似地服从于正态分布。
下面我们将对此进行证明。
3. 二项分布的极限分布是正态分布的证明当n较大时,二项分布的极限分布可以使用中心极限定理进行证明。
中心极限定理指出,当独立同分布的随机变量的个数足够多时,它们的和的分布近似地服从于正态分布。
对于二项分布来说,试验成功的次数X可以看作是n次独立重复的伯努利试验的和,因此当n较大时,X的分布近似地服从于正态分布。
为了具体地证明二项分布的极限分布是正态分布,我们令Y=(X-np)/sqrt(npq),则有:E(Y)=0,Var(Y)=1。
根据中心极限定理,当n较大时,Y的分布近似地服从于标准正态分布。
将Y的定义代入可得:Y=(X-np)/sqrt(npq),则有:X=np+sqrt(npq)Y。
由于Y近似地服从于标准正态分布,因此X近似地服从于均值为np,方差为npq的正态分布。
4. 证明总结当独立同分布的随机变量的个数足够多时,其极限分布近似地服从于正态分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验十三二项分布的计算与中心极限定[实验目的]1.研究用Poisson逼近与正态逼近进行二项分布近似计算的条件2.检验中心极限定理§1 引言二项分布在概率论中占有很重要的地位。
N次Bernoulli实验中正好出现K次成功的概率有下式给出b k;n,p C n k p k1p n k,k=0,1,2,……..n.二项分布的值有现成的表可查,这种表对不同的n及p给出了b(k;n.p)的数值。
在实际应用中。
通常可用二项的Poisson逼近与正态逼近来进行二项分布的近似计算。
在本实验中,,我们来具体地研究在什么条件下,可用Poisson逼近与正态逼近来进行二项分布的近似计算。
在概率论中,中心极限定理是一个很重要的内容,在本实验中,我们用随即模拟的方法来检验一个重要的中心极限定理——Liderberg-Levi中心极限定理。
§2 实验内容与练习1.1二项分布的Poisson逼近用Mathematica软件可以比较方便地求出二项分布的数值。
例如n=20;p=0,1;Table[Binomial[n,k]*p^k*(1-p)(n-k),{k,0,20}]给出了b(k;20,0.1)(k=0,1,2,…..,20)的值。
联系 1 用Mathematica软件给出了b(k;20,0.1),b(k;20,0.3)与 b (k;20,0.5)(k=0,1,2,…..,20)的值。
我们可用Mathematica软件画出上述数据的散点图,下面的语句给出了b(k;20.0.1)的(连线)散点图(图13。
1):LISTpOLT[table[Binomi al[20,k]*0.1^k*0.9^(20-k),{k,0,20}],PlotJoined->True]图13.1 b(k;20,0.1)b k;n,p C n k p k1p n k (k=1,1,2,……,20)的散点图练习2绘出b(l;20,0.3)与b(k;20,0.5)(k=0,1,2,…,20)的散点图根据下面的定理,二项分布可用Poisson分布来进行近似计算。
定理13。
1 在Bernoulli实验中,以P n 代表事件A在试验中出现的概率,它与试验总数有关.如果np n→→λ,则当n→∞时,b k;n,pkke。
由定理13,1在n很大,p很小,而λ=np大小适中时,有b k;n.pc kn p k1p n kkke练习 3 用Poisson逼近给出b(k;100,0.01)(k=0,1,2,….,100)与b(k;1000,0.001)(k=0,1,2,…,1000)的近似值,并与它们的精确值比较,表13,1二项分布的Poisson逼近表13。
1给出了b(k;100.0.01)(k=0,1,2,…10)(表中即位b1(k)与b(k;1000,0.001)(k=0,1,2,,,,..10)(记为b2(k)的Poisson逼近的近似值记为p9k)与它们的精确值的比较,其中r1(k)=/b1(k)-p9k)/,r2(k)=/b2(k)-p(k)/从表13。
1可以看出,用Poisson分布来计算b(k;1000,0.001)比b(k;100,0.01)的效果好得多,我们可以画出它们的散点图(图13。
2)来观察近似计算的效果,下面的程序给出了b(k;20,0.1)的Clear n,k,l,p,b;b k_.n_.p_:Binomial n,k p^k l p^n p;l 2.0;n20;p l n;t1Table k,N b k,n,p,k,0,20;g1ListPlot t1,PlotJoined True,PlotStyle GrayLevel0.2,Thicknes0.001,PlotRange0.20,0,0.3pas k_,n_,p_:l^k k Exp1;t2Table k,N pas k,n,p,k,0,20;g2listPlot t2,PlotJoined true,PlotStyle GrayLevel0.1,Dashing0.002,Thickness0.01,PlotRange0,20,0,0.3;Show g1,g2;近似计算的精确值的比较图13。
2b(k;20,0.1)的Poisson近似计算的精确值的比较练习4绘出b(k;100,0.01)与b(k;1000,0.001)的近似计算与精确计算的散点图。
那么n,p,λ。
到底取何值时,我们可以用Poisson分布来近似计算二项分布的值呢?我们可以用误差来作为衡量标准评价缉私的效果若n与p给定,则b(k;n,p)与其Piosson逼近的误差是的k函数;根据上式可以定义二项分布的Poisson逼近的误差定义13。
2若n,p给定,我们定义二项分布b(k;n,p)(k=0,1,……p)的Poisson逼近的误差为;差通过简单的程序运算我们可以求得;p100,0.01=1.85*10-3 p1000,0.001=1.84*10-4练习5通过编程求出在n=10,100,1000与10000,λ=0.1,1与10时,二项分布的Poisson 逼近的误差,填入表13,2;你能从中发现什么规律那?在一定条件下我们可以认为,若绝对误差p<=10-3,则可以接受近似计算结果在λ=1时,若n=100,p=0.01,则p100,0.01=1.85 10-3>10-3,不能接受计算结果,即此时不能用Poisson逼近来缉私计算二项分布的值,若n=1000,p=0.001,则p1000,0.001=1.84 10-4<10-3,此时可用Poisson逼近来缉私计算二项分布的值,对λ=1,我们可以用编程求出n=2,3,…..1000的对应的Poisson二项分布的逼近的误差,图13。
3就是误差的散点图。
在λ=1时,要使绝对误差p>=10-3,必须n>=185练习6在λ=0.1,0.5,2.0,5.0,10.0时,n取何值,可使绝对误差p<=10-3?图13。
3Poisson逼近的误差(λ=1)练习7 若误差标准该为p<=10-4或其它的数据,研究上面对应的问题,练习8 对于n,p,λ到底取何值时,可以用Poisson分布来近似计算二项分布的值,你有什么结论?2.2 二项分布的正态逼近2.1节中讨论了用Poisson逼近来近似计算二项分布的问题。
在实际应用中,我们还可以用正态逼近来近似计算二项分布。
计算的根据是局部极限定理,在n-> 时,有C n k p k q k 1npqexp12k npnpq21.图13.4b(k;20,0.1)的正态逼近近似计算与精确的比较图13。
4是b(k;20,0.1)的正态逼近的近似值与精确的比较的散点图。
图 13。
5用另一种方式更直观地显示出逼近的效果。
图13。
5中,阶梯函数给出概率C n k p k q n-k,而曲线则给出对应的正态分布密度函数。
其Mathematica程序如下:n20;p0.1;q1p;tab Table Binomial n,k p^k1p^n k,k,0.20;f k_:Graphics GrayLevel0.5,Rectangle k0.5,0,k0.5,tab k1;g1Table f k,k,0,20;h x_:1Sqrt2Pi n p qExp x p Sqrt n p q^2 2.0;g2Plot h x,x, 2.0,15,PlotRange2,15,0,0.3;Show g1,g2,PlotRange2,15,0,0.3,Axes True由于n的取值比较小,我们可以看出,近似的效果不是很好。
练习9用正态逼近给出b(k;100,0.01)(k=0,1,2,…,100)与b(k;1000,0.001)(k=0,1,2,…,1000)的近似值,与它们的精确值作比较。
做出近似计算与精确计算的散点图。
练习10做出b(k;100,0.01)与b(k;1000,0.001)的阶梯函数与对应的正态分布密度函=数曲线,观察其效果。
若n与p给定,我们也可以定义二项分布b(k;n,p) (k=0,1,2,…,n)的正态逼近的误差为:N n,,p=maxN n,p(k)=max|C n k p k q n-k-(1/npq) (1/2)exp(-(1/2)[(k-np)/npq]^2)是、式中q=1-p.练习11 若分别取0.1,0.5,1.0,2.0,5.0,10.0,n取何值时,可使绝对误差N<=10^-3?练习12 n ,p取何值时,可以用正态逼近来近似计算二项分布的值。
练习13 比较二项分布的Poisson逼近与正态逼近的优劣。
2.3 中心极限定理的验证1.正态分布的假设检验在实际应用中,有许多随机数据都可以看作来自于正态分布。
那么,如何检验一批数据是否来自于正态分布呢?按照国家标准,我们采用D检验来判断随机数据的正态性。
下面通过一个例子介绍D检验的过程。
例下面是某种刀具生产的合格零件个数(已用Mathematica语句的形式给出),判断它们是否满足正态分布:t={459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,653,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581,62,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217,715,310,851,}解(1)将100个数据按非减次序排列:X(1)<=X( 2)〈=…<=X( 100)(2)计算统计量(其中n=100,X是数据样本的均值):(3)计算统计量; Y=02998598.0)28209479.0(Dn(4)给定检验水平α =0.05,查表得临界值Zα/2,; =-2.54及Z1-α/2 =1.31.(5)若 Zα/2<Y<Z1-α/2.,则接受正态分布假设,否则拒绝正态分布假设。
经计算得Y=-1.2933,显然-2 .54<-1.2933<1.31,接受正态分布假设.D检验的Mathematica程序如下:F[ata1]:=Module[{z1=-0.54,z2=1.31,dada=Sort[dada1]},N=Length[dada];Mean=Sum[dada[[k]],{k,1,n}]/n;D1=Sum[(k-(n+1)/2)*dada[[k]],{k,1,n}];D2=(Sqrt[n])^Sqrt[Sum[(dada[[k]]-mean)^2,{k,1,n}]];D=d1/d1;Y=Sqrt[n]*(d-0.28209479)/0.02998598;Result=If[z1<y<z2,1,0];Return[result]];F[t]运行该程序(运行程序前已将题给数据t输入),得f[t]的结果为1,表示通过正态检验。