概率论大数定律与中心极限定理
中心极限定理 大数定律

中心极限定理与大数定律介绍中心极限定理(Central Limit Theorem)和大数定律(Law of Large Numbers)是概率论中两个重要而基础的定理。
它们在统计学和各个领域的实际应用中起着至关重要的作用。
本文将深入探讨这两个定理的概念、应用和相关证明。
中心极限定理定义中心极限定理是概率论中的一个重要定理,它说明了在特定条件下,一组随机变量的均值的分布会趋近于正态分布。
具体来说,对于任意独立同分布的随机变量的和,当样本容量足够大时,其均值的分布将会接近于正态分布。
证明中心极限定理的证明可以通过多种方法进行推导,其中最为经典的方法是使用特征函数的技巧。
通过对特征函数的逐步展开和极限取证,可以得出中心极限定理的结论。
应用中心极限定理在实际应用中有着广泛的应用。
以下是中心极限定理的几个重要应用:1.抽样分布的近似计算:通过中心极限定理,可以对抽样分布进行近似计算,从而推断总体参数。
2.假设检验:在统计学中,中心极限定理广泛应用于假设检验问题中。
通过对样本均值进行正态分布近似,可以进行对总体均值的假设检验。
3.建立置信区间:中心极限定理可用于建立置信区间。
通过计算样本均值的区间估计,确定总体均值的信心水平。
大数定律定义大数定律是概率论中的另一个重要定理,它说明了当独立同分布的随机变量重复进行实验时,其平均值会收敛于数学期望。
换句话说,随着实验次数的增加,样本均值会趋近于总体均值。
证明大数定律的证明有多种方法,其中最为著名的是切比雪夫不等式和辛钦大数定律。
不同的证明方法都有其特点和适用范围,但最终都能得出大数定律的结论。
应用大数定律在实际应用中也有着广泛的应用。
以下是大数定律的几个重要应用:1.统计估计:大数定律可用于建立统计估计方法,如最大似然估计和矩估计。
2.贝叶斯推断:大数定律在贝叶斯推断中起着重要的作用。
通过重复实验,可以逐渐更新对参数的先验分布,得到后验分布。
3.经济学和金融学:大数定律在经济学和金融学中有广泛的应用。
概率论中的大数定律与中心极限定理

概率论中的大数定律与中心极限定理概率论是数学中的重要分支,研究随机现象的规律性。
在概率论中,大数定律和中心极限定理是两个基本定理,它们对于理解和应用概率论具有重要意义。
一、大数定律大数定律是概率论中的一项重要成果,它研究的是随机事件重复进行时,随着试验次数的增加,事件的频率趋于稳定的现象。
大数定律的核心思想是:随机事件的频率会趋于其概率。
大数定律有多种形式,其中最著名的是弱大数定律和强大数定律。
弱大数定律指出,当随机事件重复进行时,事件的频率会接近其概率,但不一定完全相等。
而强大数定律则更加严格,它指出,当随机事件重复进行时,事件的频率几乎必定会趋于其概率。
大数定律的应用非常广泛。
例如,在赌场中,赌徒们常常利用大数定律来制定自己的投注策略。
他们相信,通过多次下注,最终能够获得稳定的胜率。
另外,在统计学中,大数定律也是重要的理论基础。
通过对大量样本的观察,我们可以得出对总体的推断。
二、中心极限定理中心极限定理是概率论中的另一个重要定理,它研究的是随机变量的和的分布趋于正态分布的现象。
中心极限定理的核心思想是:随机变量的和趋于正态分布的程度与随机变量的分布无关,只与样本容量有关。
中心极限定理有多种形式,其中最著名的是中心极限定理的拉普拉斯形式和莫尔根-拉普拉斯形式。
中心极限定理的拉普拉斯形式适用于二项分布和泊松分布,而莫尔根-拉普拉斯形式适用于任意分布。
中心极限定理的应用广泛而深入。
在实际生活中,我们常常遇到一些随机现象,如测量误差、人口统计等。
通过应用中心极限定理,我们可以对这些随机现象进行更准确的分析和预测。
三、大数定律与中心极限定理的关系大数定律和中心极限定理是概率论中两个相互关联的定理。
它们都是研究随机现象的规律性,但侧重点不同。
大数定律研究的是随机事件的频率趋于稳定的现象,它关注的是事件本身的概率。
而中心极限定理研究的是随机变量的和的分布趋于正态分布的现象,它关注的是随机变量的分布。
大数定律和中心极限定理的关系可以从两个方面来理解。
大数定律和中心极限定理

大数定律和中心极限定理1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。
所以,第5次正面的机会只有1/32,而不是1/2。
以上混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,既(11111)---- 1/32,(1111)1 ---- 1/2。
3 中心极限定理3.1 大数定律和中心极限定理的关系:上面通过赌徒谬误介绍了概率论中的大数定律。
大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”。
但大数定律并未涉及概率之分布问题。
此外大数定律说明了在一定条件下,当系统的个体足够多时,系统的算数平均值会集中在期望位置。
从这个角度,中心极限定理包含了大数定律。
因为中心极限定理在于揭示系统在期望附近的统计性质,即“以何种方式”集中在期望。
总的来说就是——大数定律反映的是频率->概率(或者认为广义的期望);而中心极限定理反映的是——在整体结果下,结果内部发生各种情况下的一个概率分布情况。
3.2 那什么是中心极限定理?中心极限定理指的是分别适用于不同条件的一组定理,但基本可以用一句通俗的话来概括它们:大量相互独立的随机变量,其求和后的平均值以正态分布(即钟形曲线)为极限。
Eg:以二项分布为例进行解释(抛硬币)对于抛n次硬币,出现正面k次的一个分布情况,如下:但是对于二项分布不一定是对对称的,除了受抛的次数n影响,还受对应的概率p的影响3.3 晋级再后来,中心极限定理的条件逐渐从二项分布推广到独立同分布随机序列,以及不同分布的随机序列。
大数定律和中心极限定理课件

中心极限定理可以帮助我们在不确定 的情况下做出决策。例如,通过模拟 大量可能的结果并计算其分布,可以 评估不同决策的风险和收益。
04
大数定律与中心极限定理的 关联与区别
关联性分析
大数定律和中心极限定理都是概率论中 的重要定理,它们在某些方面存在关联。
大数定律描述了在大量独立重复试验中, 大数定律是中心极限定理的一种特例, 某一事件的相对频率趋于该事件的概率, 当随机变量数量趋于无穷时,中心极限
而中心极限定理则说明无论独立随机变 定理可以看作是大数定律的一种推广。 量的分布是什么,它们的和或积的分布
都趋于正态分布。
差异性分析
大数定律和中心极限定理在适用范围和表现形式 上存在差异。
大数定律的结论是相对频率趋于概率,而中心极 限定理的结论是随机变量和的分布趋于正态分布。
大数定律适用于大量独立重复试验中某一事件的 相对频率,而中心极限定理则适用于独立随机变 量的和或积的分布。
02
中心极限定理
定义
• 中心极限定理:在大量独立同分布的随机变量下,这些随机变 量的平均值的分布趋近于正态分布,即无论这些随机变量的分 布是什么,只要样本量足够大,其平均值的分布都将呈现出正 态分布的特征。
适用范 围
中心极限定理适用于大量独立同分布的随机变量,这些随 机变量的分布可以是离散的也可以是连续的。
在金融领域,中心极限定理也被广泛应用。例如,股票价格的波动可以看作是大 量投资者决策的独立同分布的随机变量,因此股票价格的平均值(即指数)的分 布也呈现出正态分布的特征。
03
大数定律与中心极限定理的 应用
在统计学中的应用
样本均值和总体均值的近似
大数定律表明,当样本量足够大时,样本均值趋近于总体均值,这为统计学中的参数估计提供了基础。
概率论中的大数定律与中心极限定理

概率论中的大数定律与中心极限定理概率论是数学中的一个重要分支,研究随机现象的规律性。
在概率论中,大数定律和中心极限定理是两个基本而又重要的概念。
本文将详细探讨这两个定律,并阐述它们在概率论中的应用。
一、大数定律大数定律是概率论中最为基本的定律之一。
它描述了在独立重复试验的条件下,随着试验次数的增加,随机事件的频率会趋于稳定,即其概率的长期平均值会趋于事件的真实概率。
大数定律可以分为弱大数定律和强大数定律两种形式。
弱大数定律是指在概率分布具有一定条件时,频率收敛到概率的几乎必然成立。
也就是说,如果一个事件发生的概率为p,那么当试验次数增加时,该事件发生的频率会趋于p。
这种定律的典型应用是频率稳定的硬币投掷问题。
当试验次数趋于无穷大时,正面朝上的频率会收敛于0.5,即硬币的正反面概率相等。
强大数定律是指在一般条件下,频率收敛到概率的几乎必然成立。
它比弱大数定律更为强大,可以涵盖更广泛的情况。
例如,当试验次数无限大时,独立同分布随机变量的均值收敛于其数学期望。
这种定律对于实际问题的应用更为广泛,可以用于解释一系列现象,如赌博、股票市场等。
二、中心极限定理中心极限定理是概率论中最为重要的定理之一。
它描述了当独立同分布随机变量的和的样本容量足够大时,这个和的分布会趋近于正态分布。
中心极限定理包括三种形式:李雅普诺夫定理、林德贝格-列维定理和棣莫弗-拉普拉斯定理。
李雅普诺夫定理是中心极限定理的一种形式,描述了独立随机变量和的分布趋近于正态分布的条件。
它要求随机变量具有有限的方差,并且样本容量足够大。
在实际应用中,李雅普诺夫定理可以用于描述大量相互独立事件的和的分布。
林德贝格-列维定理是中心极限定理的另一种形式,描述了独立同分布随机变量和的分布趋近于正态分布的条件。
与李雅普诺夫定理相比,林德贝格-列维定理的条件更为宽松,不再要求有限的方差。
这使得林德贝格-列维定理在实际应用中更为通用。
棣莫弗-拉普拉斯定理是中心极限定理的一种特殊情况,适用于二项分布。
大数定律与中心极限定理总结

大数定律与中心极限定理总结大数定律与中心极限定理是概率论与数理统计中的两个重要定理,用于描述随机变量序列的性质。
下面我将分别对这两个定理进行总结,并给出相关的参考内容。
一、大数定律大数定律是概率论中的一个基本定理,描述了随机变量序列的极限性质。
大数定律可以分为弱大数定律和强大数定律两种。
1. 弱大数定律弱大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值收敛于某个常数,那么这个序列就满足弱大数定律。
弱大数定律的代表是辛钦大数定律。
具体来说,如果一个随机变量序列X1, X2, ..., Xn,其中Xi是相互独立、同样分布的随机变量序列,它们的均值为μ,方差为σ^2。
那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1这意味着当样本数量趋向于无穷大时,样本均值的概率逼近于1,即样本均值趋近于总体均值μ。
2. 强大数定律强大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值以概率1收敛于某个常数,那么这个序列就满足强大数定律。
强大数定律的代表是伯努利大数定律和切比雪夫大数定律。
伯努利大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其中每个随机变量取值为0或1,概率为p或1-p,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - p| ≤ ε ) = 1切比雪夫大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其具有相同的均值μ和方差σ^2,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1以上的大数定律说明了随机变量序列的均值具有稳定的性质,当样本数量足够大时,样本均值可以准确地反映总体均值。
二、中心极限定理中心极限定理是概率论与数理统计中的一个基本定理,描述了独立随机变量和的分布的极限性质。
大数定律与中心极限定理公式

大数定律与中心极限定理公式
大数定律和中心极限定理是概率论和统计学中的重要概念,它们描述了在大量重复实验或观察中随机变量的性质。
大数定律是指当试验次数趋于无穷时,随机变量的相对频率趋于其概率。
具体来说,如果一个随机变量序列{ξn, n ∈ N} 的期望存在且等于某个常数ξ,那么对于任意小的正数ε,当 n 趋于无穷时,P( ξn - ξ ≥ ε ) 趋于 0。
中心极限定理则是指无论随机变量 X1, X2,..., Xn 的分布是什么,只要 n 足
够大,那么它们的和 X1 + X2 + ... + Xn 除以 n 的标准化形式就会近似地
服从标准正态分布 N(0, 1)。
也就是说,对于任意x ∈ R,有limn→∞
P(∣∑i=1nxi−nμ∣≤xσn)=Φ(x)\lim_{n \to \infty}
P(\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} \leq x) =
\Phi(x)limn→∞P(∣∣∑i=1nxi−nμ∣∣≤xnσ2)=Φ(x),其中μ 是 X1, X2,...,
Xn 的期望,σ^2 是它们的方差,Φ(x)是标准正态分布 N(0, 1) 的分布函数。
这两个定理在统计学中有着广泛的应用,例如在样本均值的分布、样本比例的分布、回归分析等方面都有重要的应用。
考研概率论复习-大数定律和中心极限定理

大数定律和中心极限定理一.车贝雪夫不等式若随机变量X 的数学期望EX 和方差DX 存在,则对于任意给定的0>ε,必有 2)(εεDX EX X P ≤≥- 或21)(εεDXEX X P -><-二.大数定律1. 辛钦大数定律设 ,,,,21n X X X 为一列互相独立的随机变量,服从相同的分布,μ=i EX ,2σ=i DX ,),2,1( =i ,则对于任意正数ε,有1}|1{|lim 1=<-∑=∞→εμni i n X n P 2. 贝努利大数定律设n u 是n 次独立重复试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则对于任意给定的0>ε,必有1}|{|lim =<-∞→εp nu P n n 三.中心极限定理1. Levy-Lindeberg 中心极限定理:设 ,,,,21n X X X 为独立同分布的随机变量序列,若μ=i EX ,2σ=i DX ,),2,1( =i ,则当n 充分大时,∑=ni i X 1近似服从正态分布),(2σμn n N , 即lim )n i n X n P x μ→∞-≤=∑du e xu ⎰∞--2221π。
2. 德莫佛尔-拉普拉斯极限定理:在贝努利试验中,若事件A 发生的概率为p 又设X 为n 次独立重复试验中事件A 发生的频数,则当n 充分大时,X 近似服从正态分布),(npq np N 。
例1:某保险公司有10000个同一年龄的人参加人寿保险,在一年里这些人的死亡率为1‰,参加保险的人在一年的头一天交付保险费10元,死亡时,家属可以从保险公司领取元2000抚恤金求(1) 险公司一年中获利不小于40000元的概率。
(2) 保险公司亏本的概率。
(9993.0)163.3(,1)3271.6(=Φ=Φ,9993.0)164.3(,1)654.12(=Φ=Φ)解:一年中死亡的人数为X ,则X ~)001.0,10000(B(1) 保险公司一年中获利不小于40000元的概率}30{≤=X P }3271.6999.0001.01000010{≤⨯⨯-=X P)3271.6(Φ=1=。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
‘、第五章 大数定律与中心极限定理第一节 大数定律在第一章中我们已经指出,人们经过长期实践认识到,虽然个别随机事件在某次试验中可能发生也可能不发生,但是在大量重复试验中却呈现明显的规律性,即随着试验次数的增大,一个随机事件发生的频率在某一固定值附近摆动.这就是所谓的频率具有稳定性.同时,人们通过实践发现大量测量值的算术平均值也具有稳定性.而这些稳定性如何从理论上给以证明就是本节介绍的大数定律所要回答的问题.在引入大数定律之前,我们先证一个重要的不等式——契比雪夫(Chebyshev )不等式. 设随机变量X 存在有限方差D (X ),则有对任意ε>0,P {|X -E (X )|≥ε}≤2)(εX D .(5.1)证 如果X 是连续型随机变量,设X 的概率密度为f (x ),则有P {|X -E (X )|≥ε}=⎰⎰≥-≥--≤εεε)(22)()()()(X E x X E x x x f X E x x x f d d ≤[].)()()(1222⎰+∞∞-=-εεX D x x f X E x d 请读者自己证明X 是离散型随机变量的情况.契比雪夫不等式也可表示成P {|X -E (X )|<ε}≥1-2)(εX D . 5.2)这个不等式给出了在随机变量X 的分布未知的情况下事件{|X -E (X )|<ε}的概率的下限估计,例如,在契比雪夫不等式中,令ε=3)(X D ,4)(X D 分别可得到P {|X -E (X )|<3)(X D }≥0.8889,P {|X -E (X )|<4)(X D }≥0.9375.例5.1 设X 是掷一颗骰子所出现的点数,若给定ε=1,2,实际计算P {|X -E (X )|≥ε},并验证契比雪夫不等式成立.解 因为X 的概率函数是P {X =k }=1/6(k =1,2,…,6),所以E (X )=7/2, D (X )=35/12,P {|X -7/2|≥1=P {X =1}+P {X =2}+P {X =5}+P {X =6}=2/3;P {|X -7/2|}≥2}=P {X =1}+P {X =6}=1/3.ε=1:2)(εX D =35/12>2/3, ε=2:2)(εX D =1/4×35/12=35/48>1/3.可见契比雪夫不等式成立.例5.2 设电站供电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开、关时间彼此独立,估计夜晚同时开着的灯数在6800与7200之间的概率.解 设X 表示在夜晚同时开着的灯的数目,它服从参数为n =10000,p =0.7的二项分布.若要准确计算,应该用贝努里公式:P {6800<X <7200}=∑=-⨯⨯7199680110000100003.07.0k k k k C .如果用契比雪夫不等式估计: E (X )=np =10000×0.7=7000,D (X )=npq =10000×0.7×0.3=2100,P {6800<X <7200}=P {|X -7000|<200}≥1-22002100≈0.95. 可见,虽然有10000盏灯,但是只要有供应7200盏灯的电力就能够以相当大的概率保证够用.事实上,契比雪夫不等式的估计只说明概率大于0.95,后面将具体求出这个概率约为0.99999.契比雪夫不等式在理论上具有重大意义,但估计的精确度不高.契比雪夫不等式作为一个理论工具,在大数定律证明中,可使证明非常简洁.定义5.1 设Y 1,Y 2,…,Y n ,…是一个随机变量序列,a 是一个常数,若对于任意正数ε有{}1lim =<-∞→εa YP n n ,则称序列Y 1,Y 2,…,Y n ,…依概率收敛于a ,记为Y n P a .定理5.1(契比雪夫(Chebyshev )大数定律) 设X 1,X 2,…是相互独立的随机变量序列,各有数学期望E (X1),E (X2),…及方差D (X 1),D (X 2),…,并且对于所有i =1,2,…都有D (X i )<l ,其中l 是与i 无关的常数,则对任给ε>0,有1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i ni i i n X E n X n P . (5.3) 证因X 1,X 2,…相互独立,所以n l nl n X D n X n D n i i n i i =⋅<=⎪⎭⎫ ⎝⎛∑∑==21211)(11. 又因,)(1111∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E n X n E 由(5.2)式,对于任意ε>0,有2111)(11εεn l X E n X n P n i i n i i -≥⎭⎬⎫⎩⎨⎧<-∑∑==, 但是任何事件的概率都不超过1,即1)(111112≤⎭⎬⎫⎩⎨⎧<-≤-∑∑==εεni i n i i X E n X n P n l,因此1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i ni i i n X E n X n P . 契比雪夫大数定律说明:在定理的条件下,当n 充分大时,n 个独立随机变量的平均数这个随机变量的离散程度是很小的.这意味,经过算术平均以后得到的随机变量n Xn i i∑=1将比较密的聚集在它的数学期望n X E ni i ∑=1)(的附近,它与数学期望之差依概率收敛到0.定理5.2(契比雪夫大数定律的特殊情况) 设随机变量X 1,X 2,…,X n ,…相互独立,且具有相同的数学期望和方差:E (X k )=μ,D (X k )=σ2(k =1,2,…).作前n 个随机变量的算术平均∑==nk k n X n Y 11则对于任意正数ε有 {}1lim =<-∞→εμn n Y P . (5.4)定理5.3(贝努里(Bernoulli )大数定律) 设n A 是n 次独立重复试验中事件A 发生的次数.p 是事件A 在每次试验中发生的概率,则对于任意正数ε>0,有1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n , (5.5) 或 0lim =⎭⎬⎫⎩⎨⎧≥-∞→εp n n P A n . 证 引入随机变量X k =⎩⎨⎧=,,2,1,1,0 k ,A k ,A k 发生次试验中若在第不发生次试验中若在第, 显然 n A =∑=n k k X1.因为X k 只依赖于第k 次试验,而各次试验是独立的.于是X 1,X 2,…,是相互独立的;又因为X k 服从(0-1)分布,故有E (X k )=p , D (X k )=p (1-p ), k =1,2,….由定理5.2有111lim n i n k P X p n ε→∞=⎧⎫-<=⎨⎬⎩⎭∑, 即 1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n .贝努里大数定律告诉我们,事件A 发生的频率nn A 依概率收敛于事件A 发生的概率p ,因此,本定律从理论上证明了大量重复独立试验中,事件A 发生的频率具有稳定性,正因为这种稳定性,概率的概念才有实际意义.贝努里大数定律还提供了通过试验来确定事件的概率的方法,即既然频率nn A 与概率p 有较大偏差的可能性很小,于是我们就可以通过做试验确定某事件发生的频率,并把它作为相应概率的估计.因此,在实际应用中,如果试验的次数很大时,就可以用事件发生的频率代替事件发生的概率.定理5.2中要求随机变量X k (k =1,2,…,n )的方差存在.但在随机变量服从同一分布的场合,并不需要这一要求,我们有以下定理.定理5.4(辛钦(Khinchin )大数定律)设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望E (X k )=μ (k =1,2,…),则对于任意正数ε,有111lim n i n k P X n με→∞=⎧⎫-<=⎨⎬⎩⎭∑. (5.6) 显然,贝努里大数定律是辛钦大数定律的特殊情况,辛钦大数定律在实际中应用很广泛. 这一定律使算术平均值的法则有了理论根据.如要测定某一物理量a ,在不变的条件下重复测量n 次,得观测值X 1,X 2,…,X n ,求得实测值的算术平均值∑=ni i X n 11,根据此定理,当n 足够大时,取∑=ni i X n 11作为a 的近似值,可以认为所发生的误差是很小的,所以实用上往往用某物体的某一指标值的一系列实测值的算术平均值来作为该指标值的近似值.第二节 中心极限定理在客观实际中有许多随机变量,它们是由大量相互独立的偶然因素的综合影响所形成的,而每一个因素在总的影响中所起的作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景.概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理(Central limit theorem),现介绍几个常用的中心极限定理.定理5.5(独立同分布的中心极限定理) 设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望和方差E (X k )=μ,D (X k )=σ2≠0(k =1,2,…).则随机变量σμn n X X D X E X Y n k k n k k n k k n k k n -=⎪⎭⎫ ⎝⎛-=∑∑∑∑====1111)( 的分布函数F n (x )对于任意x 满足⎰∑∞--=∞→∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n k k n n n t x n n X P x F .21lim )(lim 212d e πσμ (5.7) 从定理5.5的结论可知,当n 充分大时,近似地有Y n =21σμn n X nk k -∑=~N (0,1).或者说,当n 充分大时,近似地有 ().,~21σμn n N Xn k k ∑=(5.8) 如果用X 1,X 2,…,X n 表示相互独立的各随机因素.假定它们都服从相同的分布(不论服从什么分布),且都有有限的期望与方差(每个因素的影响有一定限度).则(5.8)式说明,作为总和∑=n k k X1这个随机变量,当n 充分大时,便近似地服从正态分布.例5.3 一个螺丝钉重量是一个随机变量,期望值是1两,标准差是0.1两.求一盒(100个)同型号螺丝钉的重量超过10.2斤的概率.解 设一盒重量为X ,盒中第i 个螺丝钉的重量为X i (i =1,2,…,100).X 1,X 2,…,X 100相互独立,E (X i )=1,)(i X D =0.1,则有X =∑=1001i i X,且E (X )=100·E (X i )=100(两),)(i X D =1(两).根据定理5.5,有P {X >102}=}2100{111001021100≤--=⎭⎬⎫⎩⎨⎧->-X P X P ≈1-Φ(2)=1-0.977250=0.022750.例5.4 对敌人的防御地进行100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其期望值是2,方差是1.69.求在100次轰炸中有180颗到220颗炸弹命中目标的概率. 解令第i 次轰炸命中目标的炸弹数为X i ,100次轰炸中命中目标炸弹数X =∑=1001i i X,应用定理5.5,X 渐近服从正态分布,期望值为200,方差为169,标准差为13.所以P {180≤X ≤220}=P {|X -200|≤20}=⎭⎬⎫⎩⎨⎧≤-132013200X P ≈2Φ(1.54)-1=0.87644.定理5.6(李雅普诺夫(Liapunov )定理) 设随机变量X 1,X 2,…相互独立,它们具有数学期望和方差:E (X k )=μk , D (X k )=σk 2≠0 (k =1,2,…). 记∑==n k k n B 122σ,若存在正数δ,使得当n →∞时,{}∑=++→-n k k k n X E B 12201δδμ,则随机变量 Z n =n nk k nk k n k k n k n k k k B X X D X E X∑∑∑∑∑=====-=-11111)()(μ的分布函数F n (x )对于任意x ,满足⎰∑∑∞--==∞←∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n n k k n k k n n n t x B X P x F d e π211221lim )(lim μ. (5.9) 这个定理说明,随机变量Z n =n n k kn k kB X ∑∑==-11μ当n 很大时,近似地服从正态分布N (0,1).因此,当n 很大时,∑∑==+=nk k n n n k k Z B X11μ 近似地服从正态分布⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这表明无论随机变量X k (k =1,2,…)具有怎样的分布,只要满足定理条件,则它们的和∑=n k k X1当n 很大时,就近似地服从正态分布.而在许多实际问题中,所考虑的随机变量往往可以表示为多个独立的随机变量之和,因而它们常常近似服从正态分布.这就是为什么正态随机变量在概率论与数理统计中占有重要地位的主要原因.在数理统计中我们将看到,中心极限定理是大样本统计推断的理论基础.下面介绍另一个中心极限定理.定理5.7 设随机变量X 服从参数为n ,p (0<p <1)的二项分布,则(1) (拉普拉斯(Laplace)定理) 局部极限定理:当n →∞时P {X =k }≈⎪⎪⎭⎫ ⎝⎛-=--npq np k npq npq npq np k ϕ1212)(2e π, (5.10)其中p +q =1,k =0,1,2,…,n ,2221)(x x -=e πϕ. (2) (德莫佛-拉普拉斯(De MoivreLaplace)定理) 积分极限定理:对于任意的x ,恒有 ⎰∞--∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--x t n t x p np np X P d e π2221)1(lim . (5.11) 这个定理表明,二项分布以正态分布为极限.当n 充分大时,我们可以利用上两式来计算二项分布的概率.例5.5 10部机器独立工作,每部停机的概率为0.2,求3部机器同时停机的概率. 解 10部机器中同时停机的数目X 服从二项分布,n =10,p =0.2,np =2,npq ≈1.265.(1) 直接计算:P {X =3}=310C ×0.23×0.87≈0.2013;(2) 若用局部极限定理近似计算:P {X =3}=)79.0(265.11265.123265.111ϕϕϕ=⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-npq np k npq =0.2308. (2)的计算结果与(1)相差较大,这是因为n 不够大.例5.6 应用定理5.7计算§5.1中例5.2的概率.解np =7000,npq ≈45.83.P {6800<X <7200}=P {|X -7000|<200} =1)36.4(236.483.457000-=⎭⎬⎫⎩⎨⎧<-ΦX P =0.99999.例5.7 产品为废品的概率为p =0.005,求10000件产品中废品数不大于70的概率. 解 10000件产品中的废品数X 服从二项分布,n =10000,p =0.005,np =50,npq ≈7.053.P {X ≤70}=)84.2(053.75070ΦΦ=⎪⎭⎫ ⎝⎛- =0.9977. 正态分布和泊松分布虽然都是二项分布的极限分布,但后者以n →∞,同时p →0,np →λ为条件,而前者则只要求n →∞这一条件.一般说来,对于n 很大,p (或q )很小的二项分布(n p ≤5)用正态分布来近似计算不如用泊松分布计算精确.例5.8 每颗炮弹命中飞机的概率为0.01,求500发炮弹中命中5发的概率.解 500发炮弹中命中飞机的炮弹数目X 服从二项分布,n =500,p =0.01,np =5,npq ≈2.2.下面用三种方法计算并加以比较:(1) 用二项分布公式计算:P {X =5}=5500C ×0.015×0.99495=0.17635.(2) 用泊松公式计算,直接查表可得:np =λ=5,k =5,P 5(5)≈0.175467.(3) 用拉普拉斯局部极限定理计算:P {X =5}=⎪⎪⎭⎫ ⎝⎛-npq np npq 51ϕ≈0.1793. 可见后者不如前者精确.小 结本章介绍了契比雪夫不等式、四个大数定律和三个中心极限定理.契比雪夫不等式给出了随机变量X 的分布未知,只知道E (X )和D (X )的情况下,对事件{|X -E (X )|≤ε}概率的下限估计.人们在长期实践中认识到频率具有稳定性,即当试验次数增大时,频率稳定在一个数的附近.这一事实显示了可以用一个数来表征事件发生的可能性的大小.这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,因而频率的稳定性是概率定义的客观基础.贝努里大数定律则以严密的数学形式论证了频率的稳定性.中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布.这一事实阐明了正态分布的重要性.中心极限定理也揭示了为什么在实际应用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉.另一方面,它提供了独立同分布随机变量之和∑=n k k X1(其中X k 的方差存在)的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在应用上是有效和重要的.中心极限定理的内容包含极限,因而称它为极限定理是很自然的.又因为它在统计中的重要性,称它为中心极限定理,这是Polya 在1920年取的名字.本章要求读者理解大数定律和中心极限定理的概率意义,并要求会使用中心极限定理估算有关事件的概率.重要术语及主题契比雪夫不等式 依概率收敛契比雪夫大数定律及特殊情况 贝努里大数定律辛钦大数定律 独立同分布中心极限定律李雅普诺夫中心极限定理 德莫佛拉普拉斯中心极限定理.习 题 五1. 一颗骰子连续掷4次,点数总和记为X .估计P {10<X <18}.2. 假设一条生产线生产的产品合格率是0.8.要使一批产品的合格率达到在76%与84%之间的概率不小于90%,问这批产品至少要生产多少件?3. 某车间有同型号机床200部,每部机床开动的概率为0.7,假定各机床开动与否互不影响,开动时每部机床消耗电能15个单位.问至少供应多少单位电能才可以95%的概率保证不致因供电不足而影响生产.4. 一加法器同时收到20个噪声电压V k (k =1,2,…,20),设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布.记V =∑=201k k V,求P {V >105}的近似值.5. 有一批建筑房屋用的木柱,其中80%的长度不小于3m.现从这批木柱中随机地取出100根,问其中至少有30根短于3m 的概率是多少?6. 某药厂断言,该厂生产的某种药品对于医治一种疑难的血液病的治愈率为0.8.医院检验员任意抽查100个服用此药品的病人,如果其中多于75人治愈,就接受这一断言,否则就拒绝这一断言.(1) 若实际上此药品对这种疾病的治愈率是0.8,问接受这一断言的概率是多少?(2) 若实际上此药品对这种疾病的治愈率是0.7,问接受这一断言的概率是多少?7. 用Laplace 中心极限定理近似计算从一批废品率为0.05的产品中,任取1000件,其中有20件废品的概率.8. 设有30个电子器件.它们的使用寿命T 1,…,T 30服从参数λ=0.1[单位:(小时)-1]的指数分布,其使用情况是第一个损坏第二个立即使用,以此类推.令T 为30个器件使用的总计时间,求T 超过350小时的概率.9. 上题中的电子器件若每件为a 元,那么在年计划中一年至少需多少元才能以95%的概率保证够用(假定一年有306个工作日,每个工作日为8小时).10. 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05,0.8,0.15.若学校共有400名学生,设各学生参加会议的家长数相与独立,且服从同一分布.(1) 求参加会议的家长数X 超过450的概率?(2) 求有1名家长来参加会议的学生数不多于340的概率.11. 设男孩出生率为0.515,求在10000个新生婴儿中女孩不少于男孩的概率?12. 设有1000个人独立行动,每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计,在一次行动中:(1)至少有多少个人能够进入?(2)至多有多少人能够进入?13. 在一定保险公司里有10000人参加保险,每人每年付12元保险费,在一年内一个人死亡的概率为0.006,死亡者其家属可向保险公司领得1000元赔偿费.求:(1) 保险公司没有利润的概率为多大;(2) 保险公司一年的利润不少于60000元的概率为多大?14. 设随机变量X 和Y 的数学期望都是2,方差分别为1和4,而相关系数为0.5试根据契比雪夫不等式给出P {|X -Y |≥6}的估计. (2001研考)15. 某保险公司多年统计资料表明,在索赔户中,被盗索赔户占20%,以X 表示在随机抽查的100个索赔户中,因被盗向保险公司索赔的户数.(1) 写出X 的概率分布;(2) 利用中心极限定理,求被盗索赔户不少于14户且不多于30户的概率近似值.(1988研考)16. 一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱平均重50千克,标准差为5千克,若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977. (2001研考)。