数理统计5.1大数定律

合集下载

概率论与数理统计 第五章

概率论与数理统计 第五章

Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列

n
i =1
Xi −
∑ E(X
i =1
n
i
)

n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0

14级--GZ《概率与统计》_第12讲_5.1大数定律_5.2中心极限定理

14级--GZ《概率与统计》_第12讲_5.1大数定律_5.2中心极限定理

§2 中心极限定理
5.2 中心极限定理
简介
中心极限定理是研究在什么条件下,独立随机变 量序列部分和的极限分布为正态分布的一系列定理 的总称。 在自然界与生产中,一些现象受到许多相互独立 的随机因素的影响,如果每个因素所产生的影响都 很微小时,总的影响可以看作是服从正态分布的。 中心极限定理就是从数学上证明了这一现象 。 它是近两个世纪概率论研究的中心问题,因此这 些定理称为中心极限定理。
P(120000 aX 60000 ) 0.9,即 P( X
由棣莫弗 - 拉普拉斯定理知,
60000 ) 0.9. a
60000 X 60 60000 a 60 P( X ) P( ) 0 . 9. a 60 9.4% 60 9.4%
5.2 中心极限定理
定理1:独立同分布中心极限定理 (变形)
P( k 1
n
X
n
k
n
当n 时 x) ( x)
n
k
X
式中
k 1
n
n
X n n 1 X X
分子分母同时除以n n k 1

k
X 近似 ~ N (0,1) 故: n

X ~ N (,
为什么会有这种规律性?这是由于大量试验过程中,随
机因素相互抵消、相互补偿的结果。
用极限方法来研究大量独立(包括微弱相关)随机试验
的规律性的一系列定律称为大数定律。
5.1 大数定律
弱大数定理(辛钦大数定理)
设随机变量序列 X1, X2, … 独立同分布,具有有限的 数学期望 E(Xk)=μ, k=1, 2, …,则对任给 ε >0 ,有
棣莫弗 – 拉普拉斯定理 (针对二项分布)

第五章大数定律及中心极限定理

第五章大数定律及中心极限定理

k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n

k 1
Xk

nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分

lim P n
1 n
n k 1
Xk
m

1.

大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E

1 n
n k 1
Xk

lim
n
P

1 n
(X1

X2

Xn)
p




1,

lim
n
P

nA n

p





1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m

概率论与数理统计 第五章 大数定律与中心极限定理

概率论与数理统计 第五章 大数定律与中心极限定理
nA 一种提法是: “当 n 足够大时,频率 n 与概率 p 有较大偏差
的概率很小” ,用数学语言表达,就是要证明: 0 ,有
nA nA lim P p 0 lim P p 1 n ,或 n n . n
另一种提法是:研究随机变量 n A 的分布的极限行为,即讨 论分布函数
nA lim P p 0 lim P n n 或 n
nA p 1 . n
证 引入
1 , 第i次试验中事件A发生 Xi ,i 1 , 2 , , n , 0 , 第i次试验中事件A不发生
下面我们进一步来讨论贝努利试验.若记 n A 为 n 次贝努利试
nA 验中事件 A 发生的次数, 则事件 A 发生的频率为 n . 所谓 “频 率的稳定性” ,无非是指当试验次数 n 无限增大(即 n )时,
nA 频率 n 无限接近于某个固定常数.这个固定的常数就是“事 件 A 在一次试验中发生的的概率 p” . nA 由此可见,讨论频率 n 的极限行为,是理解概率论中最基本
2019年1月14日星期一
11 / 102
§5.1
大数定律
作为预备知识,我们先明确随机变量序列收敛的
相关概念,同时给出一个重要的不等式,它是以下理 论证明所用的主要工具之一.
定 义 1.1 设 a 是常数,对于随机变量序列 ,如果 0 ,有
X1 , X 2 ,
, Xn ,
lim P
n
个常数,即在这个常数的附近摆动,这就是所谓的“频
率稳定性”.但对这一点,至今为止我们尚未给予理论 上的说明.另外,在第二章我们给出了二项分布的泊松 逼近,那么更一般的近似计算方案又是怎样呢?

第五章 大数定律与中心极限定理 《概率论》PPT课件

第五章  大数定律与中心极限定理  《概率论》PPT课件

概率论与数理统计
§5.2 中心极限定理
2)中 心极限 定理表明,若 随 机 变 量 序 列
X 1 , X 2 , , X n 独立同分布,且它们的数学期
望及方差存在,则当n充分大时,其和的分布,
n
即 X k 都近似服从正态分布. (注意:不一定是 k 1
标准正态分布)
3)中心定理还表明:无论每一个随机变量 X k ,
概率论与数理统计
§5.1 大数定律
定理1(Chebyshev切比雪夫大数定律)
假设{ Xn}是两两不相关的随机
变量序列,EXn , DXn , n 1,2, 存在,
其方差一致有界,即 D(Xi) ≤L,
i=1,2, …, 则对任意的ε>0,
lim P{|
n
1 n
n i1
Xi
1 n
n i1
E(Xi ) | } 1.
概率论与数理统计
§5.2 中心极限定理
现在我们就来研究独立随机变量之和所 特有的规律性问题.
在概率论中,习惯于把和的分布 收敛于正态分布这一类定理都叫做中心 极限定理.
下面给出的独立同分布随机变量序 列的中心极限定理, 也称列维——林德 伯格(Levy-Lindberg)定理.
概率论与数理统计
§5.2 中心极限定理
大量的随机现象平均结果的稳定性
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
概率论与数理统计
§5.1 大数定律
一、大数定律
阐明大量的随机现象平均结果的稳定性的一系
列定理统称为大数定律。
定义1 如果对于任意 0, 当n趋向无穷时,事件
" Xn X " 的概率收敛到1,即

第五章 数理统计 大数定律与中心极限定理

第五章 数理统计 大数定律与中心极限定理

) 0.999
查正态分布函数表得
(3.1) 0.999

N 120 48
≥ 3.1,
从中解得N≥141.5,
即所求N=142.
也就是说, 应供应142 千瓦电力就能以99.9%的 概率保证该车间不会因供电不足而影响生产.
例3 对于一个学生而言,来参加家长会的家长人数
是一个随机变量,设一个学生无家长、 1名家长、名 2 家长来参加会议的概率分别为0.05、.8、.15.若学校 0 0 共有 400名学生,设各学生参加会议的家长数相互 独立,且服从同一分布.
lim P n X np np 1 p x 1 2

x

t
2

e
2
dt x
证明:设 则
第i次试验事件A发生 第i次试验事件A不发生
由中心极限定理,结论得证
当 n 充分大时,二项分布 X ~ B n , p 可近似地用正态分布N np , np 1 p 来代替。
由于无穷个随机变量之和可能趋于∞,故我们 不研究n个随机变量之和本身而考虑它的标准化的随 n 机变量. 即考虑随机变量X k ( k 1,n)的和 X k
k 1
讨论Yn的极限分布是否为标准 正态分布
在概率论中,习惯于把和的分布收敛于正态分 布这一类定理都叫做中心极限定理.
5.2
中心极限定理 标准化随机变量

意思是:当
时,Xn落在
内的概率越来越大.
a

意思是:
,当
几个常用的大数定律
定理5-2 切比雪夫大数定律

设{Xi, i=1,2,...}为独立的随机变量序列, 且存在数学期望、方差 E X n nDBiblioteka X n2 nDX

概率论与数理统计5.1大数定律

概率论与数理统计5.1大数定律


1 n lim P X i ò 1. n n i 1
证明超本课程范围,略,详见魏宗舒的教材。 定律的含义:观测量X在相同的条件下重复观测n 次,当n充分大时,“观测值的算术平均值接近 于期望”是一大概率事件。 以任意大的把握用观测值 1 n 的算术平均值近似期望。 xi 依概率收敛于 n i 1 1 n 即n充分大时, x xi n i 1 9
2
n
1.
6
说明大量随机试验的平均具有稳定性.
2). 一般情形 定理 设随机变量列 { X n }相互独立,且均具有 数学期望, 且方差有界,即 D( X n ) C, n 1, 2,..., 则 ò 0, 有 1 n 1 n lim P X i E ( X i ) ò 1. n n i 1 n i 1
成立,则称 X n 服从大数定律。
随机变量列前若干项的算术平均依概率收敛于某 数列。
4
切比雪夫(Chebyshev)不等式
设随机变量X具有有限数学期望EX和方差DX,则 对于任意正数
,如下不等式成立。
DX
P X EX

2
——切比雪夫不等式
5
2. 切比雪夫定理
1). 特殊情形 定理5.1 设随机变量列 { X n }相互独立,且具有相 同的数学期望和方差, E( X n ) , D( X n ) 2 , n 1, 2,...,
A发生的频率代替概率的理论依据.
前面介绍的大数定律要求各随机变量方差存在。
8
于 ò 0, 有
4. 辛钦大数定律(样本平均数稳定性) 定理 设随机变量X1,X2,…,Xn,„相互独

概率论与数理统计 第五章

概率论与数理统计 第五章

贝努里定理. 它的叙述如下:设是n次重复独立 对于任意给定的ε>0,有
lim P{| nA p | } 1
n
n
lim P{| nA p | } 1
n
n
其中nA/n是频率,p是概率,即次数多
时事件发生的频率收敛于概率.表示频率的稳定性.
定理3
lim P{|
n
1 n
n i 1
Xi
| } 1
数理统计的方法属于归纳法,由大量的资料作依据,而不
是从根据某种事实进行假设,按一定的逻辑推理得到的.例
如统计学家通过大量观察资料得出吸烟和肺癌有关,吸烟
者得肺癌的人比不吸烟的多好几倍.因此得到这个结论.
数理统计的应用范围很广泛.在政府部门要求有关的资
料给政府制定政策提供参考.由局部推断整体,学生的假期
第五章 大 数 定 律 与 中 心 极 限 定 律
§ 5.1大 数 定 律
定理1(切比雪夫定理) 设X1,X2,...,Xn,...是相互独立的随机变
量序列若存在常数C,使得D(Xi)≤C. (i=1,2,...n),则对任意给
定的ε>0,有
lim P{|
n
1 n
n i 1
[Xi
E( X i )] |
7200 6800 2
200 1
D 2
1
2100 2002
0.95
可见虽有10000盏灯,只要电力供应7200盏灯即有相当大的保 证率切贝谢夫不等式对这类问题的计算有较大价值,但它的精度 不高.为此我们研究下面的内容.
2021/9/5
10
§ 5.2 中 心 极 限 定 理
在随机变量的一切可能性的分布律中,正态分布占有特殊的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则 g( Xn , Yn ) P g(a, b).
三、基本定理
定理5.2的推论 切比雪夫大数定律
切比雪夫定理的特殊情况
设随机变量 X1, X 2 , , X n , 相互独立,
且具有相同的数学期望和方差:E( Xk ) ,
D( X k ) 2 (k 1, 2, ), 作前 n 个随机变量
p)

1
1 n2
np(1 0.012
p)
0.90
解得
n
p(1 0.1
p) 0.012
0.75 0.25 0.1 0.012
18750
所以至少应做18750次试验.
• 例3:在供暖的季节,住房的平均温度为20度, 标准差为2度,试估计住房温度与平均温度的 偏差的绝对值小于4度的概率的下界.

22 1 P{| X 20 | 4} 42 4
P{| X 20 | 4}
1 P{| X 20 | 4}
1 1 3 44
【练习】若某班某次考试的平均分为80分,标准差为10, 试估计及格率至少为多少?
解:用随机变量X表示学生成绩,则数学期望E(X) = 80,方差D(X) = 100,所以
P{60 X 100} P{60 < X < 100}
这两个例 子说明:
在大量随机现象中,不仅看到了随机事件的频率 具有稳定性,而且还看到大量测量值的平均结果也 具有稳定性。这种稳定性就是本章所要讨论的大数 定律的客观背景。
大数定律以确切的数学形式表达了这种规律性,并 论证了它成立的条件,即从理论上阐述了这种大量的、 在一定条件下的、重复的随机现象呈现的规律性即稳 定性.
第一节 大数定律
一、问题的引入 二、基本定理 三、典型例题 四、小结
一、问题的引入
例1 掷一颗均匀的正六面体的骰子,出现一点的概率 是1/6,在掷的次数比较少时,出现一点的频率可能与 1/6相差得很大.但是在掷的次数很多时,出现一点的 频率接近1/6几乎是必然的. 例2 测量一个长度a,一次测量的结果不见得就等于 a,量了若干次,其算术平均值仍不见得等于a,但当测 量的次数很多时,算术平均值接近于a几乎是必然的.
从切比雪夫不等式还可以看出, 对于给定的 >0, 当方 差越小时,事件{|X-E(X)|≥}发生的概率也越小,即X的
取值越集中在E(X)附近.这进一步说明方差确实是一个 描述随机变量与其期望值离散程度的一个变量.
当D(X)已知时,切比雪夫不等式给出了X与E(X)的偏
差小于 的概率的估计值.
做题时如何选取?
定理5.1 契比雪夫不等式
定理 设随机变量 X 具有数学期望 E(X ) μ,
方差 D( X ) σ2,则对于任意正数ε, 不等式
P{
X
μ
ε}
σ2 ε2
成立.
P{|
X
E( X ) | } 1
D( X )
2
证明 取连续型随机变量的情况来证明. 设 X 的概率密度为 f ( x),则有
P{ X μ ε}
的算术平均
数 有
X
1 n
n k 1
Xk,
则对于任意正
lim P{|
n
X
|
}
lim
n
P
1 n
n k 1
X
k
Байду номын сангаас
1.
证明
E
1 n
n k 1
Xk
1 n
n k 1
E(Xk )
1 n
n
,
D
1 n
n k 1
= P{|X – 80| < 20}
所以及格率至少为75%.
1
100 (20)2
0.75
75%
练习 设电站供电网有10000盏电灯,夜晚每盏灯开灯的 概率均为0.7,假定灯的开、关是相互立的,使用切贝 雪夫不等式估计夜晚同时开着的灯数在6800到7200盏之 间的概率。
解 令X表示在夜晚同时开着的灯数目,则X服从 n=10000,p=0.7的二项分布,这时
解: 设需做n次试验,其中成功的次数为X,
则X~B(n,p),E(X) = np,D(X) = np(1 – p)。
因为
根据契比P谢{0夫.74不等Xn式应0有.76}
P{|
X n
0.75 |
0.01}
X
1
P{0.74
X n
0.76} 1
D( ) n
0.012
1
n2
np(1 0.012
E(X ) np 7000, D(X ) npq 2100.
由切贝雪夫不等式可得:
P{6800 X 7200}
P{| X 7000 | 200} 1 2100 0.95. 2002
二、依概率收敛的概念
定义: 若存在常数a,使对于任何
0, 有
lim
n
P{
Xn
a
}
1
则称随机变量序列{Xn}依概率收敛于a
f (x)d x
xμ ε
x μ2
xμ ε
ε2
f (x)d x
1 ε2
(
x
μ)2
f
(
x)d
x
1 ε2
σ2.

P{
X
μ
ε}
σ2 ε2
.
P{
X
μ
ε}
σ2 ε2
σ2 P{ X μ ε} 1 ε2 .
切比雪夫不等式的用途: (1)证明大数定律; (2)估计事件的概率或区间内取值的下界。
切比雪夫不等式只利用随机变量的数学期望及方差就 可对的概率分布进行估计。
例1 已知正常男性成人血液中 ,每一毫升白细胞 数平均是7300,均方差是700 . 利用切比雪夫不等 式估计每毫升白细胞数在5200~9400之间的概率 .
解:设每毫升白细胞数为X 依题意,E(X)=7300,D(X)=7002
所求为 P(5200 X 9400)
P(5200 X 9400) = P(-2100 X-E(X) 2100)
记: Xn Pa
如 Xn P a 意思是:当 n 时,Xn落在
(a , a ) 内的概率越来越大. n0, n n0
Xn
lim
n
P{
Xn
a
}
1
而 Xn a
a a a
意思是: 0, n0 ,当 n n0
Xn a
lim
n
Xn
a
依概率收敛序列的性质:
设 Xn Pa, Yn Pb, 又设函数 g( x, y) 在点(a,b) 连续,
= P{ |X-E(X)| 2100}
由切比雪夫不等式
P{ |X-E(X)| 2100}
D( X ) 1 (2100)2
1 ( 700 )2 1 1 8
2100
99
即估计每毫升白细胞数在5200~9400之间的概率不 小于8/9 .
【例5-2】已知n重伯努利试验中参数p = 0.75,问至少应 做多少次试验,才能使试验成功的频率在0.74和0.76之 间的概率不低于0.90?
相关文档
最新文档