第五章中心极限定理(2)
第五章 大数定律与中心极限定理

中心极限定理
独立随机变量和
设 {Xn} 为独立随机变量序列,记其和为
Yn = ∑Xi
i=1 n
讨论独立随机变量和的极限分布, 指出极限分布为正态分布.
13 July 2011
湖南大学
第五章 大数定律与中心极限定理
第18页 18页
独立同分布下的中心极限定理
林德贝格—勒维中心极限定理 设 {Xn} 为独立同分布随机变量序列,数学期 望为µ, 方差为 σ2>0,则当 n 充分大时,有
解: 设 X 表示命中的炮弹数, 则 X ~ b(500, 0.01)
(1) P( X = 5) = C ×0.015 ×0.99495 =0.17635
5 500
(2) 应用正态逼近: P(X=5) = P(4.5 < X < 5.5) = 0.1742
13 July 2011
5.5 − 5 4.5 − 5 ≈ Φ −Φ 4.95 4.95
第五章 大数定律与中心极限定理
第25页 25页
三、给定 y 和概率,求 n
例7 用调查对象中的收看比例 k/n 作为某电视节
目的收视率 p 的估计。 要有 90% 的把握,使k/n与p 的差异不大于0.05,问至少要调查多少对象?
解:用 Yn表示n 个调查对象中收看此节目的人数,则
P ( Yn / n − p < 0.05) ≈ 2Φ 0.05 n / p(1 − p) − 1 ≥ 0.90
湖南大学
湖南大学
第五章 大数定律与中心极限定理
第16页 16页
X 例 设 1, X2 ,L, Xn是独 立同 布 分 的随 变量 它们 机 , 都服 从 [a, b]上的 [ 均匀 布 f (x)是 a, b]上 连 函 , 分 , 的 续 数 证明 :
(完整版)大数定律和中心极限定理

第五章 大数定律和中心极限定理一、内容提要(一)切贝谢夫不等式 1. 切贝谢夫不等式的内容设随机变量X 具有有限的数学期望E (X )和方差D (X ),则对任何正数ε,下列不等式成立。
(){}()(){}().1,22εεεεX D X E X P X D X E X P -≤-≤≥-2. 切贝谢夫不等式的意义(1)只要知道随机变量X 的数学期望和方差(不须知道分布律),利用切贝谢夫不等式,就能够对事件(){}ε≥-X E X 的概率做出估计,这是它的最大优点,今后在理论推导及实际应用中都常用到切贝谢夫不等式。
(2)不足之处为要计算(){}ε≥-X E X P 的值时,切贝谢夫不等式就无能为力,只有知道分布密度或分布函数才能解决。
另外,利用本不等式估值时精确性也不够。
(3)当X 的方差D (X )越小时,(){}ε≥-X E X P 的值也越小,表明X 与E (X )有较大“偏差”的可能性也较小,显示出D (X )确是刻画X 与E (X )偏差程度的一个量。
(二)依概率收敛如果对于任何ε>0,事件{}ε a X n -的概率当n →∞时,趋于1,即{}1lim =-∞→ε a X P n n ,则称随机变量序列X 1,X 2,…,X n ,…当n →∞时依概率收敛于α。
(三)大数定律 1. 大数定律的内容(1)大数定律的一般提法若X 1,X 2,…,X n ,…是随机变量序列,如果存在一个常数序列α1,…,αn ,…,对任意ε>0,恒有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i n i n a X n P , 则称序列{X n }服从大数定律(或大数法则)。
(2)切贝谢夫大数定律设随机变量X 1,X 2,…,X n ,…相互独立,分别有数学期望E(X i )和方差D(X i ),且它们的方差有公共上界C ,即()().,,,2,1, n i C X D i =≤则对于任意的ε>0,恒有()111lim 11=⎭⎬⎫⎩⎨⎧-∑∑==∞→ε n i ni i i n X E n X n P 。
概率论与数理统计 中心极限定理

每个部件的称量误差相互独立,试求机床重量的总误差的
绝对值不超过 10 kg 的概率。
作业: 第115页,习题5-2,A组:2.
则
n
近似
Xi ~ N (n, n 2 ) 或
i 1
即对任意的 x,有
n
X i n 近似
i 1
~ N (0,1)
n
Hale Waihona Puke nlimP
i 1
n
X i n n
x ( x)
例 5.2.1 为了测定一台机床的质量,把它分解成 75 个部件来称量。
第五章 中心极限定理
中心极限定理解决的问题:
n
大量的随机变量的和 X i 的近似分布是什么? i 1
结论
n
一定条件下, X i 近似服从正态分布。 i 1
一 独立同分布中心极限定理(列维-林德贝格)
设随机变量序列 X1, X 2, , X n , 独立同分布,且数学
期望和方差存在:E(Xi ) , D(Xi ) 2 (i 1,2, , n)
第5章§2中心极限定理

n
的分布函数 F (对任意 满足 x) x
n
X k n k 1 lim Fn ( x) lim P x n n n
n
x
1 e 2
t2 2
dt Φ ( x )
第五章 大数定律与中心极限定理
§2
, 对于均值为 方差
中心极限定理
4/11
(n 1, 2, )
则
k 1
k 1
x F对任意 若 Z 的分布函数 满足 n ( x) n n nN (0,1) {Z n }的极限分布是否为 Xk k k 1 k 1 一般地,答案是否定的 ! lim Fn ( x) lim P n n n 2 k 取 X n 0 (n 2, 3, ), 则 k 1
O
拉普拉斯
1
2
3
4
5
6
7
8
9
10 11
k
第五章 大数定律与中心极限定理
§2
中心极限定理
7/11
高尔顿( Francis Galton,18221911) 英国人类 学家和气象学家
共15层小钉
-8 -7 -6 -5 -4 -3 -2 -1 O 1 2 3 4 5 6 7 8
x
记 则
Xk
1, 1,
t2 X1 1 1 Z (n Φ 1,( 2, ) n e 2 dt x) 2 1 x
E ( Z n ) 0, D( Zn ) 1 (n 1, 2, ) 部分和标准化 r.v
x
除非 服从正态分布,否则结论就不真 . X 1 n} X 则称 { 服从中心极限定理 第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理

X X i N(n,n ) N(200,169),所以,
2
100
P{180 X 220} P{1.54 X 200 1.54}
若要准确计算,应该用贝努里公式:
P 6800 X 7200
7199 k 6801
k C10000 0.7k 0.310000k
如果用切比雪夫不等式估计: E (X) np 10000 0.7 7000, D (X) npq 10000 0.7 0.3 2100, 2100 P 6800 X 7200 P X 7000 200 1 2 0.95. 200
二、4个大数定律(P117定义5.1-P120) 教学——我教你学或你教我学. 内容:1.大数定律的条件与结论; 2. 4个大数定律的关系. 了解:4大数定律的结论
定义5.1(P117)
上一页
下一页
返回
1.陪学定理5.1“切比雪夫大数定律”(P118)
相互独立
X
limP{| X E( X ) | } 1
第五章 大数定律与中心极限定理
第一节 第二节 大数定律 中心极限定理
大数定律主要含义: 在随机事件的大量重复出现中,往往呈现几乎 必然的规律,这个规律就是大数定律。通俗地说, 这个定理就是,在试验不变的条件下,重复试验多 次,随机事件的频率近似于它的概率。比如,我们 向上抛一枚硬币,硬币落下后哪一面朝上本来是偶 然的,但当我们上抛硬币的次数足够多后,达到上 万次甚至几十万几百万次以后,我们就会发现,硬 币每一面向上的次数约占总次数的二分之一。偶然 中包含着必然。 简单地说,大数定律就是“当试验次数足够多时,事 件发生的频率无穷接近于该事件发生的概率。
概率与数理统计 第五章-2-中心极限定理

14 14
2
/ 10
1
P
X
n 14 0.2
0
1 (0) 0.5.
例2 计算机在进行数字计算时,遵从四 舍五入原则。为简单计,现在对小数点后面
第一位进行舍入运算,则舍入误差X可以认 为服从[-0.5 , 0.5]上的均匀分布。若独立进 行了100次数字计算,求平均误差落在区间
3 20
在这里,我们只介绍其中两个最基本 的结论。
1. 当n无限增大时,独立同分布随机变量“之 和”的极限分布是正态分布;
2. 当n 很大时,二项分布可用正态分布近似。
为方便,我们研究 n 个随机变量之和标 准化的随机变量
n
n
Xk E( Xk )
Yn k 1
k 1 n
D( Xk )
k 1
的极限分布。
(3) (3) 0.9973
2. 二项分布的极限分布
定理2.2 (棣莫佛——拉普拉斯定理):
设随机变量X1, X2, …, Xn, … 相互独立,
并且都 服从参数为 p 的两点分布(0<p<1) ,则
对任意 x∈(-∞,+∞),有 E(Xi ) p.
n
lim
P
i 1
Xi
np
x
n
i1
i1
lim
P
i
1
Xi
n
x
x
1
-t2
e 2 dt
(x) ,
n n
- 2
其中Φ(x)是标准正态分布N(0, 1)的分布函数。
n
lim
P
i 1
Xi
n
x
x
n n-1Fra bibliotek- t2
5-2 中心极限定理

t2 − 2
定理表明, 很大, 是一个定值时( 定理表明,当n很大,0<p<1是一个定值时(或 很大 是一个定值时 者说, 也不太小时),二项变量 者说,np(1-p)也不太小时),二项变量 ηn 的分布 也不太小时),二项 近似为正态分布 N(np,np(1-p)). 即
ηn ~ N(np, np(1 − p))
求满足 P(X≤x)≥0.999
千瓦, (由于每台车床在开工时需电力1千瓦,x 由于每台车床在开工时需电力 千瓦 台工作所需电力即x千瓦 千瓦.) 台工作所需电力即 千瓦 )
由棣莫佛-拉普拉斯极限定理 由棣莫佛 拉普拉斯极限定理
X − np 近似N(0,1), 近似 np(1− p)
这里 np=120, np(1-p)=48
从中解得x≥141.5, 从中解得
即所求 x=142.(千瓦 千瓦) 千瓦
也就是说, 应供应142 千瓦电力就能以 也就是说 应供应 99.9%的概率保证该车间不会因供电不 的概率保证该车间不会因供电不 足而影响生产. 足而影响生产
对于一个学生而言, 例4 对于一个学生而言 来参加家长会的家长人 数是一个随机变量. 设一个学生无家长、 名家长 名家长、 数是一个随机变量 设一个学生无家长、1名家长、 2名家长来参加会议的概率分别为 名家长来参加会议的概率分别为0.05,0.8,0.15. 名家长来参加会议的概率分别为 , , 若学校共有400名学生 设各学生参加会议的家长 名学生, 若学校共有 名学生 数相互独立, 且服从同一分布. 数相互独立 且服从同一分布 (1) 求参加会议的 超过450的概率 (2) 求有 名家长来参加 的概率; 求有1名家长来参加 家长数 X 超过 的概率 会议的学生数不多于340的概率 的概率. 会议的学生数不多于 的概率 解 (1) 以 X k ( k = 1, 2,⋯, 400) 记
数学概率-姜-5章-2-中心极限定理

1
h
2 3 x
例:20个0-1分布的和的分布
几个(0,1)上均匀分布的和的分布 X1 ~f(x)
X1 +X2~g(x)
X1 +X2+X3~ h(x)
概率论
大量相互独立的随机变量,其均值(或者和) 的分布以正态分布为极限。意思就是当满足某些 条件的时候,比如Sample Size比较大,采样次数 趋于无穷大的时候,就越接近正态分布。而这个 定理amazing的地方在于,无论是什么分布的随机 变量,都满足这个定理。
例3 对于一个学生而言, 来参加家长会的家长人数 是一个随机变量, 设一个学生无家长、1名家长、 2名家长来参加会议的概率分别为 0.05, 0.8, 0.15. 若学校共有 400 名学生, 设各学生参加会议的家长 数相互独立,且服从同一分布.
概率论
(1)求参加会议的家长数X 超过450的概率; (2)求有1名家长来参加会议的学生数不多340的概率.
t2 2
近似地
定理表明,当n很大时,ηn
~ N np, np(1 p) .
概率论
证
由第四章知识知可将ηn分解成为n个相互独立、
服从同一(0 1)分布的诸随机变量 X 1 , X 2 , X n之和, n 即有 ηn X k
k 1
其中X k ( k 1, 2,, n)的分布律为 P X k i p i (1 p )1 i , i 0,1 由于E ( X k ) p, D( X k ) p(1 p) k 1,2,, n),
概率论
自从高斯指出测量误差服从正态 分布之后,人们发现,正态分布在 自然界中极为常见.
高斯
如果一个随机变量是由大量相互独立的随机因 素的综合影响所造成,而每一个别因素对这种综合 影响中所起的作用不大. 则这种随机变量一般都服 从或近似服从正态分布. 现在我们就来研究独立随机变量之和所特有 的规律性问题. 当n无限增大时,这个和的极限分布是什么呢?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
林德贝格定理—勒维 (i.i.d下中心极限定理)强调
X1,X2,…,X n,…为独立同分布序列,期望μ ,方差 σ 2>0, 那么当n充分大时,
X 近似服从 N (n , n
所以
i 1 i
n
2
)
X
i 1
n
i
n
近似服从 N (0,1)
n
n
注 意
lim { i 1
X
n
16
• 进一步的研究表明:Liapunov中心极限定理还 不是这类问题的最一般结果。历史上,人们在 长达两个世纪的时间里,曾专注于所谓“独立 和的分布函数向正态分布收敛的最普遍条件”, 以至于有关这部分问题的研究成了那个时期概 率论研究的中心课题,中心极限定理便是因此 而得名。 • 现在,这个问题可以说从某种意义上讲已经得 到了最后的解决。1922年,Lindeberg提出了一 个充分条件(Lindeberg条件);1935年, Feller进一步指出,在某种情形下,这个条件也 是必要的,这样就明确了向正态分布收敛的充 要条件。但本书中我们不展开相关问题的具体 讨论。
i 1 n
显然这种估计方法太保守, 我们可以考虑用概率论的方法重新进行估计。 因为: 0.5 105 E z i 0 , D z i 3
10
此时可以假定 z i 相互独立,且 n 10000较大, 所以应用 Lindeberg -Levy 中心极限定理有: n z i n n i 1 P z i k n P k k n i 1
x
e
t2 2
dt 恒成立,
4
n n X i ~ N E X i , D X i , i 1 i 1 i 1 所以,概率论中论证随机变量和的极限分布是 正态分布的一系列定理统称为中心极限定理; (2)中心极限定理的结论描述的总是分布函数序列 Fn ( x) PYn x收敛于标准正态分布的情况; (3)不同的中心极限定理研究了分布函数序列 Fn ( x) PYn x不同的收敛条件。
n
5
几个常见的中心极限定理。
定理 5.3.1 设随机变量 X 1 , X 2 , , X n , 相互独立, 服从同一分布,且具有数学期望和方差: E ( X k ) , D( X k ) 2 0 , (k 1,2, ) ,
n X k E X k k 1 k 1 记 Yn n D X k k 1 则恒成立
n
lim P n x
1 2
x
e
t2 2
dt
19
这个定理便是 Bernoulli 试验场合下的中心极限定理。 关于这一古典结果在各种场合下的推广, 构成了我们所研究的一系列中心极限定理。
上述定理的结果表明:二项分布的极限分布是正态分布。 因此,当 n 充分大时,若随机变量 n A ~ B(n, p) , 则近似地有: n A ~ N np, np(1 p) , 于是我们可以利用正态分布近似地计算形如 Pa n A b 的概率。 事实上,若记 np , np(1 p) 2 ,则有 Pa n A b
3
12
例.用机器包装味精,每袋味精净重为随机变量,期望值为100
克,标准差为10克,一箱内装200袋味精,求一箱味精净重大 于20500克的概率?
解: 设一箱味精净重为X,箱中第i袋味精净重为Xi,(i=1,2,…,200)
则 且 X1,X2,…,X200独立同分布, EXi=100, DXi=102=100,
X Xi
i 1
200
由独立同分布的中心极限定理得:
X近似服从正态分布,且EX=∑EXi=200EXi=20000, DX=200DXi=20000, 所求为P(X>20500)= 1-P(X≤20500)
1 (
故
20500 20000 20000
) 1 ( 3.54 )
n
X
k 1
n
k
n
n
,
2 定理 5.3.1 称为林德贝格——勒维(Lindeberg-Levy) 中心极限定理,也称为独立同分布的中心极限定理。 证明略。
n
lim PYn x
1
x
e
t2 2
dt
(5.3.1)
6
• Lindeberg-Levy中心极限定理有着非常广 泛的应用。在实际问题中,只要足够大, 便可以把独立同分布的随机变量之和当 作是正态随机变量来处理。 • 这种做法在数理统计中使用得非常普遍, 当处理大样本问题时,它将作为一个非 常重要的工具。
X
i 1
n
i
D ( X i )
i 1
2 , B n k2 , k 1
n
若存在 0 ,使得当 n 时, 1 n 2 E X k k 0 ,则恒成立 2 Bn k 1
x
2 定理 5.3.2 称为李雅普诺夫(Liapunov)中心极限定理。 证明略。
b
a
e
2 2
d
20
在这里,顺便澄清一个概念。在前面章节的讨论中, 我们曾学习过二项分布的泊松逼近。 当时,泊松分布虽然是作为二项分布的极限分布而引入的, n 但极限过程是: np , n 而现在所说的“二项分布的极限分布是正态分布” n 这一结论涉及的极限过程是: p是常数 。
15
定理含义分析
• 从理论上揭示了正态分布的形成机制:如果某一 个量的变化是由大量微小的、相互独立的随机因 素综合作用的结果,而且这些随机因素中没有任 何一个是起主导作用的,那么,这个量就是一个 服从正态分布的随机变量,至少它近似地服从正 态分布。这种机制在经济问题中是常见的,当我 们对一些经济问题进行定量分析时,往往假定在 主要因素的影响之外,其它各种因素的影响可以 用一个服从正态分布的随机变量来表示,其根据 即在于此。
k
1 2
k
e
x2 2
dx (k ) (k ) 2 (k ) 1
11
题解续
当 k 3 时有: P 0.866 103 99.7% 即我们能以 99.7%的概率断言:
1 0.866 10 。这个结果只是前面上限估计的 。 60 • 历史上,误差分析是概率论的重要生长点之一。19世纪 初,德国数学家Gauss正是在研究测量误差时引进了正 态分布并发展了具有广泛应用的最小二乘法,至今这仍 是概率论与生产实际具有广泛联系的领域之一。
上节主要内容回顾 1.大数定律的含义。 2.引理 3.定理 5.2.1 4.定理5.2.2 5.定理5.2.3 6.定理应用
1
§5.3 中心极限定理
• 自从德国数学家Gauss指出测量误差服从正态分 布之后,人们发现,正态分布在自然界中极为常 见。例如炮弹的弹着点服从正态分布,人的许多 生理特征诸如身高、体重等也服从正态分布。 • 观察表明,如果一个量是由大量相互独立的随机 因素综合作用的结果,而每一个随机因素在总的 结果中所起的作用又非常微小。 • 则这个量通常都服从或近似服从正态分布。由此 产生了有关中心极限定理的研究。
17
定理5.3.3
定理 5.3.3 若 n A 是随机变量序列,且 n A ~ B(n, p) , n A np ,则恒成立 (n 1,2,) ,记 n np(1 p)
n
2 定理 5.3.3 称为德莫佛 拉普拉斯 (De Moivre-Laplace)中心极限定理。
9
解 记 S xi , T y i ,
i 1 i 1 n
n
n
则 S T x i y i xi y i z i
i 1 i 1 i 1 i 1
n
n
n
就是我们要估计的总误差。
若以传统的方法估计:因为 z i 0.5 10 5 , 所以得: i z i n 0.5 105 0.05 ,
lim P n x
1
x
e
t2 2
dt
(5.3.3)
18
证 因为 n A ~ B(n, p) ,所以 n A 表示 n 重 Bernoulli 试验中事件 A 出现的次数。定义
1, 第k次试验出现A Xk 0, 否则 则有 n A X 1 X 2 X n 。由于 X 1 , X 2 ,, X n , 相互独立,
n
lim PZ n x
1
e
t2 2
dt
(5.3.2)
14
上述定理表明:在相当广泛的情形下, 无论随机变量 X k 服从怎样的分布, 只要 n 充分大,那么它们的和 就近似地服从正态分布。 这就是为什么正态分布是 实际问题中最常见的一种分布, 以及为什么正态分布在概率论中 占有非常重要地位的一个基本原因;
P k 1 a np np(1 p ) 1 2 n A np np(1 p ) e
x2 2
k2 np(1 p ) b np 1 2
t 2
k 2 k1
k2
k1
dx
都服从 0 1 分布,且有 E X k p, D X k p(1 p) , ( ) 因为 n n n X k E X k X k n n np k 1 k 1 k 1 A Yn n n np(1 p) n D X k k 1 所以应用 Lindeberg-levy 中心极限定理有: