证明引入随机变量伯努利定理41贝努里大数定理

合集下载

大数定律

大数定律

百科名片大数定律概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。

概率论中讨论随机变量序列的算术平均值向常数收敛的定律。

概率论与数理统计学的基本定律之一。

又称弱大数理论。

主要含义大数定律(law of large numbers),是一种描述当试验次数很大时所呈现的概率性质的定律。

有些随机事件无规律可循,但不少却是有规律的,这些“有规律的随机事件”数学家伯努利在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。

确切的说大数定律是以确切的数学形式表达了大量重复出现的随机现象的统计规律性,即频率的稳定性和平均结果的稳定性,并讨论了它们成立的条件。

[1]通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。

比如,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们上抛硬币的次数足够多后,达到上万次甚至几十万几百万次以后,我们就会发现,硬币每一面向上的次数约占总次数的二分之一。

这种情况下,偶然中包含着必然。

必然的规律与特性在大量的样本中得以体现。

简单地说,大数定理就是“当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率”。

发展历史1733年,德莫佛—拉普拉斯在分布的极限定理方面走出了根本性的一步,证明了二项分布的极限分布是正态分布。

拉普拉斯改进了他的证明并把二项分布推广为更一般的分布。

1900年,李雅普诺夫进一步推广了他们的结论,并创立了特征函数法。

这类分布极限问题是当时概率论研究的中心问题,卜里耶为之命名“中心极限定理”。

20世纪初,主要探讨使中心极限定理成立的最广泛的条件,二三十年代的林德贝尔格条件和费勒条件是独立随机变量序列情形下的显著进展。

伯努利是第一个研究这一问题的数学家,他于1713年首先提出后人称之为“大数定律”的极限定理。

举例说明例如,在重复投掷一枚硬币的随机试验中,观测投掷n次硬币中出现正面的次数。

伯努利大数定律

伯努利大数定律
伯努利大数定律证明引入随机变量定理伯努利大数定理显然根据定理一有关于伯努利定理的说明故而当n很大时事件发生的频率与概率有较大偏差的可能性很小
伯努利大数定律
定理(伯努利大数定理)
设 nA 是 n 次独立重复试验中事件 A 发生 的次 数 , p 是事件 A 在每次试验中发生的概 率, 则对于任 意正数 0 , 有 nA nA lim P p 1 或 lim P p 0. n n n n
证明 引入随机变量
0, 若在第k 次试验中 A 不发生, Xk 1, 若在第k 次试验中 A 发生, k 1, 2,.
显然
nA X 1 X 2 X n ,
因为 X 1 , X 2 ,, X n ,是相互独立的, 且X k 服从以 p 为参数的 (0 1) 分布,
关于伯努利定理的说明:
nA 伯努利定理表明事件发 生的频率 依概率收 n 敛于事件的概率 p, 它以严格的数学, 事件发生的频率与概率有较 大偏差的可能性很小. 在实际应用中, 当试验次数 很大时, 便可以用事件发生的频率来代替事件的概 率.
所以 E ( X k ) p, D( X k ) p(1 p), k 1, 2,.
根据定理一有
1 lim P ( X 1 X 2 X n ) p 1, n n 即 nA lim P p 1. n n

第五章 大数定律讲稿

第五章  大数定律讲稿

第五章 大数定律和中心极限定理㈠ 考试内容 切比雪夫不等式,切比雪夫(Chebyshev )大数定律 伯努利(Bernoulli )大数定律 棣莫弗-拉普拉斯(De Moivre-Laplace )定理 列维-林德伯格(Levy-Lindberg )定理㈡ 考试要求1、了解切比雪夫不等式,了解切比雪夫大数定律、伯努利大数定律成立的条件及结论.2、了解棣莫弗-拉普拉斯定理(二项分布以正态分布为极限分布)和列维-林德伯格定理(独立同分布随机变量序列的中心极限定理)一、切贝谢夫不等式 定理(切贝谢夫不等式):对任一随机变量X ,具有数学期望μ=EX 和方差2σ=DX (2σ有限),则对任意给定的正数ε,恒有{}22εσεμ≤≥-X p (4.1)在连续型随机变量的场合,不等式的左端概率是密度曲线下两个尾部面积之和(如图). 不等式表明,这两个尾部概率之和的上界与方差2σ成正比,与μ-X 下界的平方成反比. 若(4.1)式中的ε取为标准差的倍数σk ,则不等式可写为 {}21kk X p ≤≥-σμ由不等式可见,不管随机变量是何种分布,随机变量的取值与其数学期望之间的距离超过k 倍的标准差的概率,不大于21k. 例如当3=k 时,{}913≤≥-σμX p当X 为正态分布时,{}1003.03<=≥-σμX p证明:设X 的分布密度函数为)(x f ,则{}⎰≥-=≥-εμεμX dx x f X p )(由于在该区域上22)(εμ≥-x 即1)(22≥-εμx ,上式右边可以被放大为⎰≥--εμεμX dx x f x )()(22即{}⎰≥--≤≥-εμεμεμX dx x f x X p )()(2222222)()(1εσεμε==-≤⎰∞+∞-DXdx x f x 例1 每日来数学教研室答疑的学生数X 是一个随机变量,其分布未知,但知其期望值为20(人),标准差为4(人),试估计每日来教研室答疑的学生数在12至28人之间的概率?解:分布未知,不能精确计算{}2812<<X p ,用切贝谢夫不等式来估计它.{})820(2812<-=<<X p X p )820(1≥--=X p420==σμ、,即{})2(12812σμ≥--=<<X p X p 43411=-≥ 即每天来数学教研室答疑的学生在12到28之间的概率不小于0.75.定理 (切贝谢夫大数定律):设 ,,,,n X X X 21是相互独立、具有相同的数学期望μ和方差2σ(2σ有限)的随机变量序列,设∑==ni i n X n X 11,则对任意的0>ε都有:{}1lim =<-∞→εμn n X p证明:由2σμ==i i DX EX ,和∑==ni i n X n X 11知:μ=n X E ,nX D n 2σ=由切贝谢夫不等式,对任意0>ε,有:{}2εεnn n X D X E X p≤≥- 即 {}nX pn 22εσεμ≤≥- 对立事件 {}nX p n 221εσεμ-≥<- 取极限得: {}1lim =<-∞→εμn n X p例 4 设 ,,,,n X X X 21都是均值42==i i DX EX ,方差的正态分布,前n 个i X 的平均∑==ni i n X n X 11,试估计{}5.02<-n X p.解:在切贝谢夫不等式中取5.0=ε,nnX D X E n n 422====σμ,,得到: {}nX pn 25.0415.02-≥<- 100=n 时 {}84.0415.02=-≥<-nX p1000=n 时 {}984.0250415.02=-≥<-n X pn =10000时 {}9984.02500415.02=-≥<-nX p 我们看到,这个概率与n 有关,随着n 的增大,n X 越来越集中分布在均值μ附近.定理 (贝努里Bernouli 大数定律):设k 是n 重贝努里试验中事件A 发生的次数,设事件A 发生的概率为p ,则对任意的0>ε都有1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n k p n证明:设贝努里试验为0-1分布,第i 次试验为i X{}p X p i ==1 , {}p X p i -==10 n i ,,, 21= n 次试验中A 发生k 次,则n X X X k +++= 21故频率的数学期望和方差分别为:np p DX DX n n k D p EX EX n n k E n n )1()(1)()(1)(121-=++==++= 由切贝谢夫不等式np p p n k p 2)1(εε-≤⎭⎬⎫⎩⎨⎧≥-对立事件n p p p n k p 2)1(1εε--≥⎭⎬⎫⎩⎨⎧<- 因此有: 1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n k p n 例3 一枚均匀的硬币,每次抛掷出现正面的概率为0.5.若把这枚硬币抛掷n 次,当n 较小时,正面出现的频率nk 与5.0=p 的偏差,有时很大,有时很小,并不稳定;当n 比较大时,它们偏差较大的概率一定会很小.若取01.0=ε,即偏差大于0.01的概率为n n n k p 41001.05.05.001.05.042=⨯⨯≤⎭⎬⎫⎩⎨⎧≥-只有当n 很大时才能保证这个概率n4104很小,当∞→n 时这个概率趋于零,即当n 很大时,可以用频率来估计概率. 中心极限定理定理(独立同分布的中心极限定理称林德贝格—列维中心极限定理):设}{n X 是独立同分布随机变量序列,2σμ==i i DX EX ,(2σ有限且不为零),则前n 个随机变量之和∑==+++=ni i n n X X X X Y 121的分布函数将随∞→n 而收敛于正态分布)(n n DY EY N ,,其中2σμn DY n EY n n ==,, 即)10(.~,N n n Y da n σμ-定理(德莫佛—拉普拉斯De Moivre-Laplace 定理)积分极限定理:设),(~p n B Y n 是二项分布序列,)1(p np DY np EY n n -==,,则有:)()1(l i m y y p np np Y p n n Φ=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--∞→其中)(y Φ为标准正态分布)10(,N 的分布函数.例1 (1)一个复杂的系统由100个相互独立起作用的部件组成,在整个运行期间每个部件损坏的概率为0.10. 为了使整个系统起作用,至少必须保证85个部件正常工作,求整个系统起作用的概率.(2)一个复杂系统由n 个相互独立起作用的部件组成. 每个部件的可靠性(即部件正常工作的概率)为0.90,且必须至少有80%的部件正常工作才能使整个系统工作,求n 至少为多少时才能使系统的可靠性不低于0.975.解:(1)每个部件能否正常工作可以看作是一次贝努里试验. 由各部件的独立性,100个部件可以看作为100=n 的重复试验. 1.09.0,9.02⨯==σμ, 则)1,0(~1.09.01009.0100.100N Y da ⨯⨯⨯- 而能够正常工作的概率为{}{}85}100{10085100100100<-≤=≤≤Y p Y p Y p952.039085390100=⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=(2)设需要n 个部件,欲使{}975.08.0≥≤≤n Y n p n则⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ=⎭⎬⎫⎩⎨⎧⨯⨯≤⨯⨯-≤⨯⨯-331.09.01.01.09.09.01.09.01.0n n n n n n Y n n p n975.0132≥-⎪⎪⎭⎫⎝⎛Φ=n , 即 9875.03≥⎪⎪⎭⎫⎝⎛Φn 得 46=n 例2(保险索赔问题)某保险公司经多年的资料统计表明,在索赔户中被盗索赔户占20%,在随意抽查的100家索赔户中被盗的索赔户数为随机变量X . (1)写出X 的概率分布;(2)利用中心极限定理,求被盗的索赔户数不少于14户且不多于30户的概率的近似值. 解:(1)据题意,可知100家索赔户中被盗的索赔户数X 服从二项分布,其参数2.0,100==p n ,即)2.0,100(~B X ,且{}k k kC k X p -⨯⨯==1001008.02.0,100,,2,1 =k(2)由202.0100=⨯=np ,48.02.0100)1(=⨯⨯=-p np得 {}⎭⎬⎫⎩⎨⎧≤-≤-=≤≤5.2205.13014X p X p 927.01933.0994.01)5.1()5.2(=-+=-+=ΦΦ 例3例16(01数4)(8分)(货物装载问题)一生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱平均重50千克,标准差为5千克,若用载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱才能保障汽车不超载的概率大于0.977. (977.0)2(=Φ). 解:设),2,1(n i X i =是装运的第i 箱货物的重量(单位:千克),可以将n X X X ,,,21 视为独立同分布随机变量,而n 箱的总重量n n X X X T +++= 21 是独立同分布随机变量之和. 由条件知n DT n ET DX EX n n i i 5,50,5,50====根据列维-林德伯格中心极限定理,n T 近似服从)25,50(n n N 分布,则每车的装箱数n 取决于条件: )2(977.01010005505000550}5000{ΦΦ=>⎪⎪⎭⎫⎝⎛-≈⎭⎬⎫⎩⎨⎧-≤-=≤n n n n n n T p T p n n由此可见2101000>-nn,从而0199.98<n ,即知每车最多可以装98箱. 例1(棣莫佛-拉普拉斯定理) 设某种电气元件不能承受超负荷试验的概率为0.05.现在对100个这样的元件进行超负荷试验,以X 表示不能承受试验而烧毁的元件数,则根据中心极限定理{}≈≤≤105X P .分析 不能承受试验而烧毁的元件数X ~),(p n B .根据棣莫佛-拉普拉斯定理,X 近似服从正态分布),(npq np N ,其中n =100,p =0.05,q =0.95.因此{}.4890.0)0()29.2(29.275.45075.451075.450105105=-≈⎭⎬⎫⎩⎨⎧≤-≤=⎭⎬⎫⎩⎨⎧-≤-≤=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-≤-=≤≤ΦΦX X npq np npq np X npq np X P P P P例2(棣莫佛-拉普拉斯定理)设试验成功的概率p =20%,现在将试验独立地重复进行100次,则试验成功的次数介于16和32次之间的概率Q ≈ .分析 以n ν表示100次独立重复试验成功的次数,则)20.0100(~ B n ,ν,且 4)1(20=-===p np np n n ννD E ,.因此试验成功的次数介于16和32次之间的概率{}[][],84.08413.019987.0)1(1)3()1()3(42032420420163216=--=--=--≈⎭⎬⎫⎩⎨⎧-≤-≤-=≤≤=ΦΦΦΦννn n Q P P其中)(u Φ是标准正态分布函数.例3(棣莫佛-拉普拉斯定理) 将一枚均匀对称的硬币接连掷10000次,则正面恰好出现5000次的概率≈α .分析 正面出现的次数ν)5.010000(~ ,B ,2500,5000==ννD E .根据局部定理,有008.02502}5000{≈=≈==ππννα1D 1P .〖选择题〗例4(02数4)(中心极限定理) 设随机变量n X X X ,,,21 相互独立,n n X X X S +++= 21,则根据列维-林德伯格中心极限定理,当n 充分大时n S 近似服从正态分布,只要n X X X ,,,21 [ C ] (A) 有相同期望和方差; (B) 服从同一离散型分布; (C) 服从同一指数分布; (D) 服从同一连续型分布.分析 应选(C ).列维-林德伯格中心极限定理的条件是:随机变量n X X X ,,,21 相互独立同分布, 并且其数学期望和方差存在.由于有相同的数学期望未必有相同分布,可见(A)不满足定理条件.满足(B)和(D)的随机变量i X 的数学期望或方差未必存在,故(B)和(D)也不满足定理条件.于是,只有(C)成立(指数分布的数学期望和方差都存在).例5(大数定律)下列命题正确的是 [ C ](A) 由辛钦大数定律可以得出切比雪夫大数定律.(B) 由切比雪夫大数定律可以得出辛钦大数定律. (C) 由切比雪夫大数定律可得出伯努利大数定律.(D) 由伯努利大数定律可得出切比雪夫大数定律.分析 应选(C ).切比雪夫大数定律的条件是:随机变量 ,,,,21n X X X 两两独立,并且存在常数C ,使),,,2,1( n i C X i =≤D ;这样的常数C 对于选项(C )存在.伯努利大数定律可以表述为:假设随机变量 ,,,,21n X X X 独立同服从参数为p 的0-1分布,则p X E =;对于服从参数为p 的0-1分布随机变量 ,,,,21n X X X ,显然),,,2,1(41)1( n i p p X i =≤-=D .从而满足服从切比雪夫大数定律的条件.此外,(A ),(B )和(D )显然不成立. 〖计算题〗例6(棣莫佛-拉普拉斯定理) 设n ν是n 次伯努利试验成功的次数,p (0<p <1)是每次试验成功的概率,n f n n ν=是n 次独立重复试验成功的频率,设n 次独立重复试验中,成功的频率f n 对概率p 的绝对偏差不小于Δ的概率{}α∆=≥-p f n P .利用中心极限定理,(1) 根据∆和n 求α的近似值; (2) 根据α和n 估计∆的近似值; (3) 根据α∆和估计n .解 变量n ν服从参数为),(p n 的二项分布.记p q -=1,则由(5.7)知,当n 充分大时n ν近似服从正态分布),(npq np N .因此,近似地有{}{},,~ u U pq n npq np p n p f N npqnp U n n n n n α∆ν∆ν∆να=≥≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥-=⎭⎬⎫⎩⎨⎧≥-=≥--P P P P )1,0(~其中U 是服从)1,0(N 的随机变量,而αu 是)1,0(N 水平双侧分位数(附表2).故(1) 已知n 和∆,求α.利用附表1(附表1).例如,若(5.12)式左侧等于1.96,则05.0≈α.亦可由下式求α的近似值.有. pq n pq n U pq n npq np n ⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛-=⎭⎬⎫⎩⎨⎧<-≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥-=∆Φ∆∆να121P P 进而由)1,0(N 分布函数)(x Φ的数值表(附表1)最后求出α的值.(2) 已知n 和α,求∆.由(*)和41≤pq ,可见nu n pqu 2αα∆≤≈; (3) 已知α和∆,求n .由(5.12)和pq ≤1/4,可见2⎪⎭⎫ ⎝⎛≈∆αu pq n 或 2241⎪⎭⎫ ⎝⎛≥⎪⎭⎫⎝⎛≥∆∆ααu pq u n .例7(棣莫佛-拉普拉斯定理) 假设某单位交换台有n 部分机,k 条外线,每部分机呼叫外线的概率为p .利用中心极限定理,解下列问题:(1) 设n =200,k =30,p =0.12,求每部分机呼叫外线时能及时得到满足的概率α的近似值.(2) 设n =200,p =0.12,问为使每部分机呼叫外线时能及时得到满足的概率α≥95%,至少需要设置多少条外线?(3) k =30,p =0.12,问为使每部分机呼叫外线时能及时得到满足的概率α≥95%,最多可以容纳多少部分机?解 设n ν——n 部分机中同时呼叫外线的分机数,k ——外线条数,则n ν服从参数为(n , p )的二项分布,=np 24,npq =21.12.当n 充分大时,根据棣莫佛-拉普拉斯中心极限定理,近似地)1,0(~ N npqnp U n n -=ν.(1) 设n =200,k =30,p =0.12,每部分机呼叫外线时能及时得到满足的概率{}().npq np n n 9049.031.112.21243012.21243030≈=⎪⎪⎭⎫ ⎝⎛-≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-=≤=ΦΦνναP P (2) 设n =200,p =0.12,k ——至少需要设置的外线条数,则{}.,; 31.5624 k 1.6449k k k npq np k n n ≈+⨯≥≥-≥⎪⎪⎭⎫ ⎝⎛-≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-=≤=12.216449.112.212495.012.212412.2124ΦνναP P即至少需要设置32外线.(3) 设k =30,p =0.12,且每部分机呼叫外线时能及时得到满足的概率≥α95%.由{}95.01056.012.0301056.012.03030≥⎪⎪⎭⎫ ⎝⎛-≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-=≤=n n n n npqnp n n ΦνναP P ,6449.11056.012.030≥-nn.09004857.70144.06449.11056.012.0302=+-≥-n n nn,,它有两个实根:3310431,7972.18821==n n ;经验证33104312=n 为增根,由此得n ≈188.797,即最多可以容纳188部分机.例8(列维-林德伯格定理) 某保险公司接受了10000电动自行车的保险,每辆每年的保费为12元.若车丢失,则车主得赔偿1000元.假设车的丢失率为0.006,对于此项业务,试利用中心极限定理,求保险公司:(1) 亏损的概率α;(2) 一年获利润不少于40000元的概率β; (3) 一年获利润不少于60000元的概率γ.解 设X 为需要赔偿的车主人数,则需要赔偿的金额为X Y 1.0=(万元);保费总收入C =12万元.易见,随机变量X 服从参数为(n ,p )的二项分布,其中 n =10000,p =0.006;60==np X E ,)1(p np X -=D =59.64.由棣莫佛-拉普拉斯定理知,随机变量X 近似服从正态分布)64.59,60(N ;随机变量Y 近似服从正态分布)5964.0,6(N .(1) 保险公司亏损的概率{}0)77.7(177.75964.065964.06125964.0612≈-=⎭⎬⎫⎩⎨⎧>-=⎭⎬⎫⎩⎨⎧->-=>=ΦαY Y Y P P P . (2) 保险公司一年获利润不少于4万元的概率{}{}.9952.0)59.2(5964.0685964.068412=≈⎭⎬⎫⎩⎨⎧-≤-=≤=≥-=ΦβY Y Y P P P (3) 保险公司一年获利润不少于6万元的概率{}{}.5.0)0(05964.066612=≈⎭⎬⎫⎩⎨⎧≤-=≤=≥-=ΦγY Y Y P P P例9(棣莫佛-拉普拉斯定理) 假设伯努利试验成功的概率为5%.利用中心极限定理估计,进行多少次试验才能以概率80%使成功的次数不少于5次.解 设n 是所需试验的次数,每次试验成功的概率p =0.05.以n ν表示n 次伯努利试验成功的次数,则),(~p n B n ν,npq np n n ==ννD E ,,其中p q -=1;由棣莫佛-拉普拉斯定理,知对于充分大的n ,随机变量n ν近似服从正态分布),(npq np N .查)1,0(N 分位数表,可见()()8416.018416.080.0--==ΦΦ.因此{}().8416.01)1(51)1(5)1(5.080.0--=⎪⎪⎭⎫ ⎝⎛---≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--≥--=≥=ΦΦννp np np p np np p np np n n P P.,),(025)8416.010()1(8416.058416.0)1(522222≈++--≈--≈--n n p p np np p np np将05.0=p 代入上列方程,的关于n 的一元二次方程:0255354.00025.02≈+-n n ,其根为79.6837.14521==n n ,.经验证79.682=n 为增根,舍去2n ,取37.1451461=>=n n .于是,至少需要进行146次试验才能以概率80%保障成功的次数不少于5次.例10(列维-林德伯格定理) 生产线组装每件产品的时间服从指数分布.统计资料表明,每件产品的平均组装时间为10分钟.假设各件产品的组装时间互不影响.试利用中心极限定理,(1) 求组装100件产品需要15到20小时的概率Q ;(2) 求以概率0.95在16个小时内最多可以组装产品的件数. 解 以)100,,2,1( =i X i 表示第i 件产品的组装时间.由条件知)100,,2,1( =i X i 独立同服从指数分布.由指数分布的数字特征和条件“每件产品的平均组装时间为10分钟”,可见10=i X E ;由于i X 服从指数分布,可见()2210==i i X X E D .(1) 因为n =100充分大,故由列维-林德伯格定理,知100件产品组装的时间10021X X X T n +++= 近似服从()21010010100⨯⨯ N ,,因此{}.Φ ΦT T Q n n 8156.0)8413.01(9973.0)1()2(21010010100112009002=--=--≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤⨯⨯-≤-=≤≤=P P (2) 16小时即960分钟.需要求满足{}95.0960=≤n T P 的n .由列维-林德伯格定理,知当n 充分大时,n n X X X T +++= 21近似服从()n n N 21010,,故由{},n n n n n n T T .n n ⎪⎪⎭⎫⎝⎛-≈⎭⎬⎫⎩⎨⎧-≤-=≤=101096010109601010960950ΦP P 可见95.0)645.1(≈ Φ.因此645.11010960≈-nn. (*)由此得关于n 的一元二次方程09606025.1947010022≈+-n n ,其解为53.11318.8121≈≈n n ,,其中53.1132≈n 不满足式(*),因此53.1132≈n 为增根,故应舍去.于是,以概率0.95在16个小时内最多可以组装81~82件产品.例11(列维-林德伯格定理) 将n 个观测数据相加时,首先对小数部分按“四舍五入”舍去小数位后化为整数.试利用中心极限定理估计,(1) 试当n =1500时求舍位误差之和的绝对值大于15的概率;(2) 估计数据个数n 满足何条件时,以不小于90%的概率,使舍位误差之和的绝对值小于10的数据个数n .解 设)1500,,2,1( =i X i 是第i 个数据的舍位误差;由条件可以认为)1500,,2,1( =i X i 独立且都在区间]5.05.0[ ,-上服从均匀分布,从而12/10==i i X X D E ,.记 n n X X X S +++= 21为n 个数据的舍位误差之和,则12/0n S S n n ==D E ,.根据列维-林德伯格中心极限定理,当n 充分大时n S 近似服从)12/0(n N ,.记)(x Φ为)1,0(N 分布函数.(1) 由于12n S n近似服从标准正态分布,可见{}. S S S 1802.02)]34.1(1[34.112/150012/15001512/150015150015001500=⨯-≈⎭⎬⎫⎩⎨⎧>=⎭⎬⎫⎩⎨⎧>=>ΦP P P (2) 数据个数n 应满足条件:{}.n n S S n n 90.012/1012/10=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤=≤P P由于12n S n近似服从)1,0(N ,可见51.44312106449.112/102≈⎪⎪⎭⎫ ⎝⎛≈ n ,. 于是,当n >443时,才能使误差之和的绝对值小于10的概率不小于90%.例12(棣莫佛-拉普拉斯定理) 利用列维-林德伯格定理,证明棣莫佛-拉普拉斯定理. 证明 设随机变量n X X X ,,,21 相互独立,同服从0-1分布;,,,,,npq S np S X X X S n i pq X p X n n n n i i ==+++====D E D E 21),,2,1(其中p q -=1. n X X X ,,,21 满足列维-林德伯格定理的条件:n X X X ,,,21 独立同分布且数学期望和方差存在,当n 充分大时近似地n n X X X S +++= 21~),(npq np N .例13(切比雪夫不等式) 设事件A 出现的概率为=p 0.5,试利用切比雪夫不等式,估计在1000次独立重复试验中事件A 出现的次数在450到550次之间的概率α.解 设n ν是1000次独立重复试验中事件A 出现的次数,则,),,2505.010005005.010005.01000(~2=⨯==⨯=X X B n D E ν由用切比雪夫不等式,知{}{}.9.050250150|550|5504502=-≥≤-=≤≤=n n νναP P 例15(01数4)(3分)设随机变量X ,Y 的数学期望都有是2,方差分别为1和4,而相关系数为0.5,则根据切贝雪夫不等式{}≤≥-6Y X P (121)。

贝努力与大数定律

贝努力与大数定律

贝努力近代科学史上,最著名的科学家家族可能要算伯努利家族了。

伯努利家庭是瑞士的一个曾产生过11位科学家的家族。

其中著名的有雅可比·伯努利、雅可比的弟弟约翰·伯努利、约翰的次子丹尼尔·伯努利等。

雅格布·伯努利(Jakob Bernoulli,1654-1705)是伯努利家族中重要的一员,卓越的数学家。

青年时曾学习神学,1676年开始到荷兰、德国、法国旅行,对数学有了深入的研究。

回国后于1687年到1705年在巴塞尔大学任教。

此后在数学方面取得了许多重大研究成果。

雅可比同莱布尼兹共同协作,对于微积分的发展做出了出色的贡献,为常微分方程的积分法奠定了充分的理论基础。

在研究曲线问题时他提出了一系列的概念,如对数螺线、双纽线、悬链线等。

他继承和深入地研究并发展了微积分学,创立了变分法,提出并部分地解决了等同问题及捷线问题。

雅可比还是概率论的早期研究者。

许多概率论方面的术语都是以他的名字命名的。

对于物理学方面的研究,雅可比也有一定贡献。

约翰·伯努利(Johann Bernoulli,1667-1748)青年时曾经商,后研究数学和医学。

曾在巴黎留学,1695年任荷兰格罗宁根大学教授;1705年任巴塞尔大学教授;1699年被选为法国科学院院士;1712年被选为英国皇家学会会员。

他还是彼得堡科学院和柏林科学院的名誉院士。

约翰·伯努利也是变分法的重要创始人之一。

他提出的关于捷线问题对变分学的发展起到了重要的推动作用。

1696年约翰提出捷线问题后开始钻研几何问题,并取得了巨大成功。

约翰在物理学发展中同样做出了出色贡献。

他所发现的虚功原理对物理学的发展产生了重大的推动作用。

这一原理也称虚位移原理,是约翰于1717年发现的。

它的发现对于分析力学的发展具有重要理论价值丹尼尔·伯努利(Daniel Bernoulli,1700-1782)由于受到家庭的影响,从小对自然科学的各个领域有着极大兴趣。

第五章 大数定律

第五章 大数定律

二、基本定理
定理4(独立同分布的林德贝尔格-勒维(Lindeberg -Levy)中心极限定理)设X1,X2,…,Xn,…是相 互独立,且服从同一分布的随机变量序列,并具有数 学期望和方差:
EX i , DX i 2 0, i 1,2,
则对任意的x有
n X i n i 1 lim P n x n
即 Yn中每一被加项对总和的影响都很微小,但 它们迭加的和却以标准正态分布作为极限。
例1有100个电子器件,它们的使用寿命X1,X2,…, X100 均服从参数为=0.05(h-1)的指数分布,其使用情 况为:第一个损坏第二个立即使用,第二个损坏第三
个立即使用等等。令X表示这100个电子器件使用的总
意思?
这与高等数学中的极限概念是否有联系?本章将 从理论上讨论这一问题。
二、基本定理
首先,我们引进依概率收敛的概念。
定义 设X1,X2,…,Xn,…是一个随机变量序列,a
是一个常数,若对任意的正数,有
n
lim P{| X n a | } 1

n
lim P{| X n a | } 0
解得
x 21.23
取最接近的整数 x=22,即总机至少应配备22 条外线,才能有95%以上的把握保证各个分机在 使用外线时不必等候。
伯努利大数定律说明了当n很大时事件发生的频率会非常接近概率而这里的辛钦大数定律则表明当n很大时随机变量x在n次观察中的算术平均值也会接近它的期望值即52一问题的引入二基本定理在第二章介绍正态分布时曾经特别强调了它在概率论与数理统计中的地位与作用为什么会有许多随机变量遵循正态分布
第五章 大数定律与中心极限定理

伯努利Bernoulli大数定律

伯努利Bernoulli大数定律


lim P
n
1 n
n k 1
Xk



1
定理的意义
具有相同数学期望和方差的独立 r.v.序列 的算术平均值依概率收敛于数学期望.
当 n 足够大时, 算术平均值几乎是一常数.
数学 期望
可被
算术 均值
近似代替
二、中心极限定理
定 林德伯格-列维中心极限定理 理 (Lindeberg-levi) 一 [ 独立同分布的中心极限定理 ]
1 6

k

5 6
6000k


0.959036
用Poisson分布近似计算
取 = 1000
P X 1 0.01
6000 6

P940 X 1060
1059 1000k e1000
k 941
k!
0.937934
例: 设每次试验中,事件 A 发生的概率为 0.75, 试用 Chebyshev 不等式估计, n 多大 时, 才能在 n 次独立重复试验中, 事件 A 出 现的频率在0.74 ~ 0.76 之间的概率大于 0.90?

E(Yn
)




1
2

pq n


lim
n
P

n
n

p


0
伯努利(Bernoulli)大数定律的意义
在概率的统计定义中, 事件 A 发生的频率
n n“稳定于”事件A在一次试验中发生
的概率是指:
频率 n
n

p
有较大偏差

伯努利大数定律表达式

伯努利大数定律表达式

伯努利大数定律表达式
伯努利大数定律是概率论中的一个重要定律,它是由美国数学家贝尔法兹伯努利提出的,是指当一个随机实验重复N次,其结果出现某一特定结果的概率是收敛于某一常数的过程。

这条定律可以用来研究概率的变化趋势,也可以用来推导概率的预测结果。

伯努利大数定律的具体表达式为:在N次独立重复的实验中,实验结果为某一特定结果的概率收敛于某一常数P,其公式为:P=lim(n→∞)Pn,其中Pn代表n次实验中出现特定结果的概率。

伯努利大数定律也可以用来计算一系列试验中期望出现的次数,假设N次试验中期望出现特定结果的次数为Np,那么Np的概率就可以由伯努利大数定律来计算,公式为:Np=N×P。

伯努利大数定律在现代概率论中具有重要的意义,它既可以用来推导概率的变化趋势,也可以用来计算一系列试验中期望出现的次数,它是概率论中重要的理论基础。

概率论 大数定律

概率论 大数定律

当 n 很大时, 随机变量 X1, X2 , , Xn 的算术平

1 n
n k 1
X
k
接近于数学期望
E(X1) E(X2) E(Xk ) ,
(这个接近是概率意义下的接近)
即在定理条件下, n个随机变量的算术平均, 当n 无限增加时, 几乎变成一个常数.
某某公司安全监查处
某某公司
定理一的另一种叙述:
某某公司安全监查处
某某公司
定理二(伯努利大数定理)
伯努利
设 nA 是 n 次独立重复试验中事件A 发生 的次数, p 是事件 A 在每次试验中发生的概率,
则对于任意正数 0, 有
lim
n
P
nA n
p
1

lim
n
P
nA n
p
0.
证明 引入随机变量
0, 若在第k 次试验中 A 不发生,
Xk
某某公司
二、基本定理
定理一(契比雪夫定理的特殊情况) 契比雪夫
设随机变量 X1, X2 , , Xn , 相互独立,
且具有相同的数学期望和方差:E( Xk ) ,
D( Xk ) 2 (k 1, 2, ), 作前 n 个随机变量
的算术平均
X
1 n
n k 1
Xk,
则对于任意正
数 有
lim P{|
lim
n
P
1 n
(
X1
X2
Xn)
p
1,

lim
n
P
nA n
p
1.
某某公司安全监查处
某某公司
关于伯努利定理的说明: 伯努利定理表明事件发生的频率 nA 依概 n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

说明每一个随机变量都有数学期望,
检验是否具有有限方差?
n2 (na)2 0 (na)2
P 1 1 1 1
2n2
n2 2n2

E
(
2 n
)

2(na )2

1 2n2

a2
Dn En2 (En )2 a2 ,
说明离散型随机变量有有限方差,
故满足契比雪夫定理的条件.
例2 设随机变量 1,2, ,n , 独立同分布, 且 Ek 0, Dk 2, k 1, 2, , 证明对任 意正数 有
lim
n
P

1 n
n
k 2
k 1

2




1.

解 因为 1,2, ,n , 是相互独立的,
所以 12 ,22 , ,n2 , 也是相互 立的,
由 Ek 0,
由辛钦定理知
得 Ek 2 D
对于任意正数




0

lim
n
P

A
n

p




1.
证明 引入随机变量
0, 若在第k次试验中A不发生,
k 1, 若在第k次试验中A发生, k 1, 2, .
显然 A 1 2 n
因为 1,2, ,n , 是相互独立的,
且k服从以 p 为参数的 (0 1) 分布,
定理4.4(辛钦大数定律)
辛钦资料
设随机变量 1, 2, , n服, 从独立同
分布且期望为
Ek (k 1, 2, ),
则对于任意正数
,
有lim n
P

1 n
n
k
k 1





0.

关于辛钦定理的说明:
(1) 与定理4.2相比, 不要求方差存在;
(2) 贝努利定理是辛钦定理的特殊情况.
研究大量的随机现象,常常采用极限 形式,由此导致对极限定理进行研究. 极 限定理的内容很广泛,其中最重要的有两 种:
大数定律 与 中心极限定理
下面我们先介绍大数定律
大数定律的客观背景 大量的随机现象中平均结果的稳定性
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
……
思考:频率是概率的反映,随着观察的次数增加, 频率将会“逐渐稳定”或“靠近”到概率,“逐渐 稳定”或“靠近”到概率是什么?
大数定律的定义
定义4.1设 1,2 , ,n , 是随机变量序列, 令
Yn

1 n
n
i
i 1
如果存在一个常数序列 a1, a2 , , an , ,
对任意的 0, 恒有
lim
n
P{| Yn

an
|
}

0
则称随机变量序列{ n }服从大数定律.
{|
1 n
n i 1
三、典型例题
例1 设随机变量 1,2 , ,n , 相互独立,
n na 0 na
分布律如下:
1
11
P 2n2 1 n2 2n2
问是否满足契比雪夫定理 ?
解 独立性依题意可知, 检验是否具有数学期望?
En
1
1
1
na 2n2 0 (1 n2 ) na 2n2 0,

i 1
n2 2
.
n
n
D(i ) Di npq.
i 1
i 1
从而P(
n
n

p
)
npq
n2 2
0, n

关于贝努里定理的说明:
贝努里定理表明事件发生的频率 A 依概
n 率收敛于事件的概率p, 它以严格的数学形式 表达了频率的稳定性.
故而当n很大时, 事件发生的频率与概率有 较大偏差的可能性很小. 在实际应用中, 当试验 次数很大时, 便可以用事件发生的频率来代替 事件的概率.
0.

证明 因为{n}两两不相关,故
D

1 n
n i1
i


1 n2
n i1
D(i
)

C n
由契贝晓夫不等式可得
n
0

P

1 n
n i1
k

1 n
n
Ek
i1




D(
1 n
i1
2
i
)

C
n 2
,
在上式中令n ,则
P
k

1 n
n i 1
Ek
| }是一个随机事件,
等式表明, 当n 时这个事件的概率趋
于0,即对于任意正数 , 当n充分大时,
不等式 |
1 n
n
k
i 1

1 n
n i 1
Ek
|
成立的概率很小.
定理4.2(契贝晓夫大数定理)
两不相关,
n p n np
n
n
n
n
i E(i )
i1
i 1
n
二、基本定理
定理4.1(贝努里大数定理)
伯努利
设 A 是 n 次独立 重复试验中 事件A 发 生
的次数, p 是事件 A 在每次试验中发生的概率,
则对于任意正数 0, 有
lim
n
P

A
n

p

第四章
大数定理与 中心极限定理
4.1 大数定律
一、问题引入 二、基本定理 三、典型例题 四、小结
一、问题的引入
概率论与数理统计是研究随机现象统计 规律性的学科. 随机现象的规律性只有在相 同的条件下进行大量重复试验时才会呈现出 来. 也就是说,要从随机现象中去寻求必然 的法则,应该研究大量随机现象.
且都具有有限的方差, 并有公共的上界
D1 C, D2 C, , Dn C, ,
则对于任意正数 有
lim P{|
n
1 n
n
k
i 1
1 n
n i 1
Ek
| } 1

lim
P

n
1 n
n
k
i 1

1 n
n i 1
Ek




所以 Ek p,
Dk

p(1
p)

1, 4
k 1, 2,
n
n
于是 n
p
n np

i E( i )
i 1
i 1
n
n
n
由契比晓夫不等式得
P


n
n

p





P(
n
i
i 1

n
E(
i 1
i )

n ).
由独立性知道
n
D(i )

1 n
n
k
i 1

1 n
n i 1
Ek




0.

[证毕]
关于定理4.2的说明:
当 n 很大时, 随机变量 1, 2, ,n 的算术平
均 1 n
n i 1
k 接近于它们的数学期望的算术平均
值 1 n
n i 1
Ek
(这个接近是概率意义下的接近)
即在定理条件下, n个随机变量的算术平均, 当n 无限增加时, 几乎变成一个常数.
相关文档
最新文档