三大抽样分布及常用统计量的分布.
概率论与数理统计第六章统计量,样本及抽样分布

(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
统计学 统计量及其抽样分布

定义:设随机变量X1,X2,…Xn相互独立,且Xi
服从标准正态分布N(0,1),则它们的平方和 n
X
2 i
服从自由度为n的c2分布。
i 1
c2分布主要适用于拟合优度的检验、独立性检 验以及对总体方差的估计和检验。
卡尔·皮尔逊(Karl Pearson)是英国著名的统 计学家、生物统计学家、 应用数学家,又是名副其 实的历史学家、科学哲学 家、伦理学家、民俗学家 、人类学家、宗教学家、 优生学家、弹性和工程问 题专家、头骨测量学家, 也是精力充沛的社会活动 教育改革家、社会主义 家、律师、自由思想者、 者、妇女解放的鼓吹者、 婚姻和性问题的研究者, 亦是受欢迎的教师、编 辑、文学作品和人物传 记的作者.
即
(n 1)s 2 ~ c 2 (n 1) 2
6.7.2 两个样本方差比的分布
1. 两 个 总 体 都 为 正 态 分 布 , 即 X1~N(μ1 ,σ12) , X2~N(μ2 ,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为 (n1-1),分母自由度为(n2-1) 的F分布,即
复抽样条件下,共有42=16个样本。所有样本的 结果如下表
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1 1,2 1,3 1,4
2
2,1 2,2 2,3 2,4
3
3,1 3,2 3,3 3,4
4
4,1 4,2 4,3 4,4
计算出各样本的均值,如下表。并给出样 本均值的抽样分布
n
x
三大抽样分布(1)概率论与数理统计习题 概率论与数理统计)

x2 x2
~ F (1,1)
4. 正态总体的样本均值与样本方差的分布
正态总体 N ( , 2 ) 的样本均值和样本方差
有以下两个重要定理.
定理一
设 X1, X 2, , X n 是来自正态总体N (, 2 )
的样本, X 是样本均值, 则有
(1) X ~ N (, 2 / n).即 X ~ N (0,1)
样本, X , S 2 分别是样本均值和样本方差, 则有
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
2
~ 2(n 1),
且两者独立, 由 t 分布的定义知
X (n 1)S 2 ~ t(n 1). / n 2(n 1)
n
2
πn
1
n 2
1
t2 n
n1 2
,
t
t 分布的概率密度曲线如图
显然图形是关于
t 0对称的.
当 n 充分大时, 其
图形类似于标准正
态变量概率密度的
图形. 因为lim h(t)
1
t2
e 2,
n
2π
所以当 n 足够大时 t 分布近似于 N (0,1) 分布,
1,
因为 1 F
~ F (n2 , n1 ),
所以
P
1 F
F1
(n2
,
n1
)
1
,
比较后得
F1
(n2 ,
概率论与数理统计 7.2 数理统计中的三大分布

7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
统计学考研复习指导常考分布与抽样理论梳理

统计学考研复习指导常考分布与抽样理论梳理统计学是考研复习中的一门重要科目,而分布与抽样理论是统计学中的基础知识之一。
掌握分布与抽样理论对于考研复习非常重要,因此本文将对常考的分布与抽样理论进行梳理。
以下是各个分布与抽样理论的详细内容。
1. 正态分布正态分布是统计学中最常用的概率分布之一,也被称为高斯分布。
它具有许多特性,例如其形状对称、均值、方差决定了整个分布的特征等。
正态分布在统计学中的应用广泛,例如用于描述实际数据的分布情况、进行假设检验等。
2. t分布t分布是用于小样本情况下的概率分布。
在实际应用中,由于通常无法获得大样本数据,因此需要使用t分布进行统计推断。
t分布与正态分布有一定的关联,其形状与自由度有关。
在考研复习中,需要了解t分布的特性、应用以及与正态分布的关系。
3. 卡方分布卡方分布是用于分析分类数据的概率分布,常用于检验两个变量之间的独立性。
卡方分布的形状与自由度有关,自由度越大,分布越接近正态分布。
在考研复习中,需要掌握卡方分布的性质、应用以及与正态分布的关系。
4. F分布F分布是用于分析方差比较的概率分布,常用于方差分析等统计方法。
F分布的形状与两个自由度参数有关,具有右偏分布且不对称的特点。
在考研复习中,需要了解F分布的特性、应用以及与正态分布、卡方分布的关系。
5. 抽样与抽样分布抽样是指从总体中选取样本的过程,而抽样分布是指统计量在不同样本中的分布情况。
了解抽样与抽样分布非常重要,因为统计推断是建立在样本上的,而不是在总体上。
在考研复习中,需要掌握不同抽样方法的特点、抽样分布的基本概念以及与统计推断的应用。
总结:通过对常考的分布与抽样理论进行梳理,我们可以更好地理解统计学考研复习中的重要内容。
掌握分布与抽样理论,对于进行统计分析、假设检验以及进行统计推断非常重要。
在考研复习过程中,建议系统学习各个分布的特性、应用以及与其他分布的关系,同时理解抽样与抽样分布的基本概念和应用方法。
概率论 常用统计分布

由中心极限定理得
n
lim P {
n
2 n n
2n
x}
x
lim P{ i 1
n
2 X i n
n
x}
1 2
t2 e 2 dt
即 2分布的极限分布是正态 分布,也即当 n
很大时,
2 n n
2n
2 服从N (0,1), 进而 n N ( n,2n).
Y12
Y22
~ 2 ( 2)
则C1 1 2 , C2 1 4 .
2. t 分布 历史上,正态分布由于其广泛的应用背景 和良好的性质,曾一度被看作是“万能分布”, 在这样的背景下,十九世纪初英国一位年轻 的酿酒化学技师Cosset. WS, 他在酒厂从事试验 数据分析工作,对数据误差有着大量感性的认 识,我们知道在总体均值和方差已知情况下, 样本均值的分布将随样本量 增大而接近正态分布,
n
x
1 2
e dt .
t2
2
2 证 由假设和定义5.6, n X i2 , 其中X 1 , X 2 ,, X n i 1
2 2 2 独立且每个X i ~ N (0,1),因而X1 , X2 ,, X n 独立同分布,
且
E( X i2 ) 1, D( X i2 ) 2 (i 1,2,, n)
(3) T的数字特征
E (T ) 0,
n D(T ) n2
( n 2).
例3 设总体X和Y相互独立, 且都服从N(0,9)
X 1 , X 2 ,, X 9和Y1 ,Y2 ,,Y9来自总体X ,Y的样本,
求统计量T的分布,其中
T Xi /
4.3抽样分布

(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
统计量及其分布ppt课件

图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
~ (n 1)
2
(4.1)
与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
X~N( , 2)的样本,则
(X i ) i 1
n
2
2
~ (n)
2
2分布的上侧分位点
定义2:设 2~ 2 (n), 对于给定的正数 (0 1 ) ,称
2 1 n X X i ~ N , n i 1 n
——分布
2
定义
设总体 X ~ N 0,1 , X1, X 2 ,..., X n 是 X
2 服从自 Xn
2 的一个样本, 则称统计量 2 X12 X 2
由度为n的 2 分布,记作 2 ~ 2 (n) 自由度是指独立随机变量的个数, df
X n X T ~ t(n 1) 2 S n (n 1)S (n 1) 2
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则统计量
由定义3得
别是来自正态总体N(1 ,2)和N(2 ,2)的样本,且 它们相互独立,则统计量
定理5 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分
例如,当n=21,=0.05时,由附表3(P254)可查得,
(21) 32.67
2 0.05
即 P
(21) 32.67 0.05.
2
定义3
二、t分布 设随机变量X~N(0,1),Y~ 2(n) ,
且X与Y相互独立,则称统计量 记作 服从自由度为n的t分布, t分布的概率密度函数为
定理1 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
的样本,则
(X i ) i 1
n
2
证明 由已知,有
2
~ (n)
2
Xi~N( , 2)且X1,X2,…,Xn相互独立,
则
Xi X i 相互独立, ~ N(0,1)且各
n
由定义1 :得
Xi i 1
T X Y n T ~t(n).
n1 2
其图形如图5-6所示(P106), 其形状类似标准正态分布 的概率密度的图形. 当n较大时, t分布近似于标准正态分布.
( n 1) 2 2 (1 t ) f(t) n n ( n) 2
, ( t )
定理4
证
X T ~t(n-1) S/ n 由于 X 与S 2相互独立,且 2 (n 1)S X 2 ~ (n 1) U ~ N(0,1), 2 n
n=1 n=4 n=10 x
图5-4
其图形随自由度的 不同而有所改变.
0 1 3 5 7 9 11 13 15 17
性质1: 2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
性质2: 2分布的可加性
设
2 1
~ (n1), ~ (n2), 且 ,
2
2
(X i ) i 1
n
2
2
~ (n).
2
定理3 :
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n (2)
(4.1)式的自由度为什么是 n- 1 ? n
从表面上看,
n
2 i 1 i
(n 1)S 2
t-分布的密度函数的图形相似于标准正态分布的密 度函数.当n较大时, t分布近似于标准正态分布.
F分布
与相互独立,则称随机变量 F X n1 定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且
Y n2
服从第一自由度为n1,第二自由度为n2的F分布, 记作
F~F(n1,n2).
(n1) n1 ~ F n1, n2 2 (n2) n2
但当n>45时,如无详细表格可查,可以用标准 正态分布代替t分布查t(n)的值. n>45. 即 t(n)≈u , 一般的t分布临界值表中,详列至n=30,当
n>30就用标准正态分布N(0, 1)来近似.
与相互独立,则称随机变量 F X n1
三、F分布 定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且
Y n2
服从第一自由度为n1,第二自由度为n2的F分布, 记作
F~F(n1,n2).
概率密度函数
n1 n1 n2 1 Ay 2 (1 n1 y) 2 , y 0 f(y) n2 y0 0, n1 n2 ( ) n n1 2 其中 A ( 1 ) 2 , 其图形见图5-9.(P108) n1 n2 n2 ( )( ) 2 2
2 2 2 2 2 1
2 2 相互独立,
则
~ (n1 n2)
2 1 2 2 2
性质3:设 2~ 2 (n),则对任意实数 x有 n 1 lim P x n 2 2n
2
x
e dt
t2 2
这个性质说明当 n很大时,自由度为 n的 2分布近似 于正态分布 N(n,2n) .
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
(X X ) 是n个正态随机变量 Xi X 的平方和,
n i i 1 i
但实际上它们不是独立的,它们之间有一种线性约束关系:
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
(X X ) X nX =0
f(y )
其中f(y)是F分布的概率密度.
O 图5-7
F(n1, n2) x
F 分布的上侧分位点 F(n1, n2)的值可由F 分布表查得. 附表5、6、7(P258~P266 )分 =0.1、 =0.05、 =0.01给出了F分布的上分位数.
查表时应先找到相应的值的表.
当时n1=2, n2=18时,有 F
满足条件
P (n)
2 2 2 2
2
( n )
f ( x)dx
的点 (n)为 (n)分布的上侧分位点。
其几何意义见图5-5所示.
f(x )
2 (n) x
其中f(x)是 2-分布的概率密度. O
图5-5 2 (n)的值只与有关. 显然,在自由度n取定以后,
第四节 三大抽样分布及常用统计量的分布
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
t 分布 F分布
2分布
数理统计的三大分布(都是连续型). 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、
t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单 随机样本,试问下列统计量各服从什么分布? 3
X1 X 2 (1) ; (2) 2 2 X3 X4
n 1X1
i 2
n
; (3)
其几何意义如图5-8所示.
(5.12)
f(t)
的数t/2(n)为t分布的双侧分位点。
/2 - t/2(n)
/2
O t/2(n) 图5-8
t
在附表4 (P256)中给出了t分布的临界值表. 例如,当n=15,=0.05时,查t分布表得,
t0.05(15)=1.753 t0.05/2(15)= 2.131 其中t0.05/2(15)由P{t(15)≥t0.025(15)}=0.025查得.
2 (卡方)——分布
定义1:设总体X ~ N 0,1 , X1, X 2 ,..., X n 是X 的一
2 2 2 个样本,则统计量 X1 X 2 2 Xn
的概率密度函数为
n x 1 1 2 2 x e x 0 n 2 n f ( x ) 2 ( ) 2 x0 0
n
n个相互独立的标准正态分布之平方和
服从自由度为n的 2 分布
2(n) , 设随机变量 X ~ N (0 , 1) , Y ~ 定义5.4
t—分布
且X与Y相互独立,则称统计量 T
X Y n
记作T 服从自由度为n的t分布或学生氏分布,
~t(n).
N 0,1 ~ t(n) 2 (n) n
t 分布的上侧分位点 对于给定的 (0< <1),称满足条件 P T t(n) f(t)dt
t(n)
的点t(n)为t分布的上分位点。 其几何意义见图5-7.
f(t)
O 图5-7
t(n) t
由于t分布的对称性,称满足条件
t 分布的双侧分位点
P T t 2(n)
X Y (1 2) T ~ t(n1 n2 2) Sn 1 1 n1 n2
其中Sn
(5.10)
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差.
n1 n2 2
2 (n2 1)S2
,
X Y ( 1 2 ) 证明:由例知 ~N(0,1 )
0.01(2,
18)= 6.01
在附表5、6、7中所列的值都比较小,当 较大 时,可用下面公式 F1(n1, n2)
1 F(n2, n1) 1 1 例如, F0.99(18, 2) ≈0.166 F0.01(2,18) 6.01