正态总体的抽样分布
抽样方法用样本估计总体及正态分布

64 0.4
8.为了解学生身高情况,某校以10%的比例对全校 700名学生按性别进行分层抽样调查,测得身高情况 的统计图如下:
(1)估计该校男生的人数;
(2)估计该校学生身高在170~185cm之间的概 率;
5.对于每个个体所取不同数值较少的总体,常用条 形图表示其样本分布,而对于每个个体所取不同数 值较多或可以在实数区间内取值的总体,常用频率 分布直方图表示其分布.
6.在用样本的频率分布估计总体分布时,要清楚以 下概念:频率分布折线图,总体密度曲线,茎叶图.
用样本的数字特征估计总体的数字特征,要理解以下 概念:
(3)从样本中身高在165~180cm之间的女生中 任选2人,求至少有1人身高在170~180cm之 间的概率.
C
m=n
6.一个总体中的1000个个体编号为0,1,2,…, 999,并依次将其分为10个小组,组号为0,1,2, …,9,要用系统抽样方法抽取一个容量为10的 样本,规定如果在第0组随机抽取的号码为x,那 么依次错位地得到后面各组的号码,即第k组中 抽取的号码的后两位数为x+33k的后两位数.当 x=24时,所抽样本的第5个号码是 456 .
抽样方法用样本估计总体及 正态分布
【学习目标】
1.了解简单随机抽样,系统抽样和分层抽样的方法, 会画频率分布直方图和茎叶图.
2.了解用样本估计总体的思想,会用样本的频率分布 估计总体分布,会用样本的基本数字特征估计总体的 基本数字特征;初步体会样本频率分布和数字特征的 随机性.
3.了解正态分布曲线的特点及曲线表示的意义.
【点评】高考中关于直方图及其应用的考查大有 加强的趋势,因此既要会作相关统计数据的直方 图,又要会观察直方图,提升识图能力,同时还 要加强与概率问题的综合.
正态总体的抽样分布

2π −∞
−
3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3
∞
x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n
(α
)
∞
=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+
⎝
m n
正态总体的常用抽样分布

特点
卡方分布在正态分布两侧有更多的面 积,即其尾部比正态分布更重。随着 自由度n的增加,卡方分布趋近于正 态分布。
04
抽样分布的应用
参数估计
1 2
参数估计
通过抽样分布,我们可以估计总体参数,如均值 和方差。常用的估计方法有矩估计和最大似然估 计。
置信区间
基于抽样分布,我们可以构建总体参数的置信区 间,从而对总体参数进行区间估计。
03
样本方差的数学期望等于总体方差,其方差随 着样本量的增加而减小。
样本偏度与峰度
样本偏度是总体偏度的无偏估计,用于衡量数据的对称性。 样本峰度是总体峰度的无偏估计,用于衡量数据分布的尖锐程度。 在正态分布中,偏度和峰度均为0,但在非正态分布中,偏度和峰度可能不为0。
03
其他常用抽样分布
t分布
中心极限定理
中心极限定理的基本思想
中心极限定理表明,无论总体分布是什么类型,只要样本量足够大,从该总体中随机抽取的样本均值将趋近于正 态分布。这意味着我们可以利用正态分布的性质来分析和推断样本均值。
中心极限定理的应用
中心极限定理在统计学中具有广泛的应用价值。例如,在制定置信区间、假设检验和回归分析等统计方法时,都 需要利用中心极限定理来处理样本数据和推断总体参数。因此,正确理解和应用中心极限定理对于统计推断的准 确性和可靠性至关重要。
THANKS
样本量大小的影响
样本量大小
样本量的大小对抽样分布的形状和稳 定性有显著影响。随着样本量增加, 抽样分布的形状逐渐接近正态分布, 且分布的离散程度逐渐减小。
样本量与精度
样本量越大,估计的精度越高,即估 计的参数值越接近真实值。因此,在 制定抽样计划时,应充分考虑样本量 的大小,以确保估计的精度满足要求。
正态总体下的四大分布

《概率论与数理统计》第六章样本及抽样分布(2)正态总体下的四大分布:正态分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数).1,0(~/N nx udefσμ-例:设总体ξ~212(1,2),,,n N ξξξ 且是取自ξ的样本,则(D )A)1(0,1)2N ξ-B)1(0,1)4N ξ-C)()1(0,1)2N ξ-D)(0,1)N ξt 分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~/--n t ns x tdefμ其中t(n-1)表示自由度为n-1的t 分布。
分布2χ设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~)1(222--n S n wdefχσ其中)1(2-n χ表示自由度为n-1的2χ分布例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____.例.对于给定的正数α,10<<α,设αu ,)(2n αχ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α分位数,则下面结论中不正确...的是(B )(A)αα--=1u u (B))()(221n n ααχχ-=-(C))()(1n t n t αα--=(D)),(1),(12211n n F αα=-2、设X 、Y 相互独立,且都服从标准正态分布,则Z =2Y X 服从______t(1)_____分布(同时要写出分布的参数).3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量242141......ηηξξ++++=U 服从的分布为)4(t 。
第3节 正态总体下的抽样分布定理

(4) X和S2相互独立.
数理统计
n取不同值时 (n 1)S 2 的分布
2
数理统计
n取不同值时样本均值 X 的分布
数理统计
推论 设X1,X2,…,Xn是取自正态总体 N (, 2 )
的样本, 则有
X和S2 分别为样本均值和样本方差,
X ~ t(n 1)
Sn
X ~ N (0,1), / n
证
(1)
由定理2,
X
~
N (1
,
2 1
n1
),
Y
~
N (2
,
2 2
n2
),
且 X 与Y 相互独立,由正态分布的可加性,可得
X
Y
~
N (1
2
,
2 1
n1
2 2
)
.
n2
标准化,即得
U ( X Y ) (1 2 ) ~ N (0,1) .
2 1
2 2
n1 n2
10
数理统计
(2) 由定理2,
(n1
数理统计
第三节 正态总体下的抽样 分布定理
数理统计
定理1 设总体 X 的均值和方差均存在,EX ,
DX 2 ,对样本 ( X1, X2 ,, Xn ) 及其样本均值 X 和样本
方差 S2 ,
有 E(X) ,
2
D( X )
,
E(S2) 2
.
n
证 X1, X 2 ,, X n 相互独立,且与总体 X 同分布,故有
8
定理3
设两个正态总体 X
~
N
(
1
,
2 1
)
,Y
~
4.3抽样分布

(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
16几个常用的抽样分布与抽样分布定理

(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
正态总体下的抽样分布

中心极限定理是抽样分布的理论基础, 它表明无论总体分布是什么,只要样 本量足够大,样本均值的分布近似正 态分布。
样本均值的性质
无偏性
样本均值的数学期望等于总体均值, 即$text{E}(bar{x}) = mu$。
最小方差性
在所有可能的样本统计量中,样本均 值具有最小的方差,即 $text{Var}(bar{x}) = frac{sigma^2}{n}$。
数学表达式
正态分布的数学表达式为$f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$,其中$mu$是均值, $sigma$是标准差。
抽样分布的概念
抽样分布
抽样分布描述的是从某一总体中随机 抽取一定数量的样本后,这些样本统 计量(如均值、方差等)的分布情况。
大样本下样本方差的分布
卡方分布
在大样本下,样本方差通常呈现卡方分布。
方差的无偏估计
在大样本下,样本方差是总体方差的无偏估计。
方差的同方差性
在大样本下,来自不同总体的样本方差通常具有同方差性,即它们具有相同的 方差。
04
小样本下的抽样分布
小样本的定义
小样本是指从总体中随机抽取的样本 量较小,通常在30个样本以下。
THANKS
感谢观看
正态分布的性质
Байду номын сангаас01
02
03
集中性
正态分布的曲线关于均值 所在直线对称,数据值主 要集中在均值附近。
均匀性
正态分布的曲线在均值两 侧均匀下降,且下降速度 逐渐减缓。
平坦性
正态分布的曲线在均值的 两侧逐渐接近水平线,表 现出平坦的趋势。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
则
定理3
(两总体样本均值差的分布)
2 2
且 设 X ~ N (1 , ),Y ~ N (2 , ),
X 与Y 独立,
X1,X2,…,
X n1
2 2
是取自X的样本, Y1,Y2,…,
Yn2 是
取自Y的样本, 均值, S 2
i 1 i 1 n
i 1 n
i 1
E( X )
4
x
4
1 2
e
x2 2
dx
x
x
1
3
1 2
e
x2 2
de
x2 2
3
2
1 2
e
x2 2
3 x dx 3
2
(3) 应用中心极限定理可得,若 X ~ 2 (n)
N ( , 2 ) 的样本,
则有
N 取不同值时样本均值
X 的分布
X ~ N ( ,
2
n
)
关于
( n 1) S 2
2
~ 2 ( n 1)的简要说明
( n 1) S 2
2
=
1
( X i X )2 2
i 1
n
从以上两式子看出,仅 和X 不同
但是,第一个式子,X i自由,第二式
设 X: 1. 2. 若 X~N(0,1),则 X1,X2,…,Xn
四大统计量
两个正态总体
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1
则
(2)
当σ12 =σ22 =σ2时,
(3)
请回答: 设X1,X2,X3,X4是总体N(0,1)的样本,则:
则服从自由度为 n-1 的 t 分布的随机变量是
.
练习
设总体X的密度函数为 | x |, | x | <1 f ( x) 其他 0, X1 ,X 2 , Xn为取自X的一个样本:求
(1)E (X),D(X) (2)E(S 2 )
练习
设总体X~N(0,1),样本X 1 , X 2 , X 6 令Y=(X1 +X 2 +X 3 )2 (X 4 +X 5 +X 6 )2 求常数C,使cY ~ 分布
正态总体的抽样分布
一、样本均值分布 定理 设总体 是X的样本。
样本均值
(标准化)
二、 1.定义:
分布 设随机变量 相互独立,都服从
标准正态分布N(0,1), 则称统计量:
所服从的分布为自由度为 n 的
分布. 记为
注:
自由度是指*右端所含独立的随机变量的个数。
分布的密度函数为
其中伽玛函数
通过积分
2
并确定其参数
练习
设随机变量X~F(m , m ), 证明 p{ X 1} p{ X 1} 0.5
练习
设随机变量X和Y都服从标准正态分布,则 (A)X+Y服从正态分布 (B)X 2 +Y 2服从 2分布 (C)X ,Y 服从 分布
2 2 2
(D) X /Y 都服从F分布
2 2
[( n 1) 2] x2 f ( x; n) (1 ) n (n 2) n
n 1 2
t(n) 的概率密度为 n 1 [( n 1) 2] x2 2 f ( x; n) (1 ) n (n 2) n
2. 性质 (1)具有自由度为 n 的 t 分布的随机变量 T 的 数学期望和方差为:
2
(2) X 和 S 相互独立.
2
取不同值时 的分布
例题分析Βιβλιοθήκη 定理 3设(与样本均值和样本方差有关
的一个分布) 的样本,
X1, X2 ,…, Xn 是取自正态总体
分别为样本均值和样本方差, 则有
且它们独立。 则由t-分布的定义:
当
4. 两个正态总体
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1
问题
设 则
相互独立, 都服从正态分布
为什么?
例2 设总体X~N(0,0.32), n =10,求
解 ∵ X/0.3~N(0,1),
∴
三、t 分布
1. 定义: 设 X~N(0,1) , Y~
2
(n)
, 且X与Y
相互独立, 则称变量 所服从的分布为自由度为 n的 t 分布. T的密度函数为: 记为T~t(n).
1
X 和Y
分别是这两个样本的样本
和S
分别是这两个样本的样本方差,
则有
X Y ( 1 2 )
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 3
(两总体样本方差比的分布)
2 设 X ~ N ( 1 , 12 ), Y ~ N (2 , 2 ), X与Y独立, 且
2 2
则称统计量
服从自由度为n1及 n2 的F分布,
n1称为第一自由度,
n2称为第二自由度,
记作 F ~F (n1,n2).
若X ~ F (n1,n2), X的概率密度为
( ) n1 n1 ( n2 )( n2 x ) n1 n2 f ( x; n1 , n2 ) ( 2 ) ( 2 ) 0
(X
i 1
n
i
X )=0
无形中多了一个条件,减少了一个自由度 故为 2 ( n 1)
定理 2
(样本方差的分布)
设 X1, X2, … , Xn 是取自正态总体 N ( , 2 ) 的样本,
X 和 S2
分别为样本均值和样本方差,
则有
(1)
( n 1) S 2
N
2
~ ( n 1)
i=1
n
(d) S 2 =
1
(X i -X)2 ~ 2 (n) 2
i=1
n
请回答:设总体X~N(μ,σ2),X1,X2,…,X8为
一个样本,则(
(1)
)成立。
~ t (8) (2) ~ t (7)
(3)
~ t (7)
(4)
~ t (8)
请回答:设 是样本均值,记
是来自正态总体N(μ ,σ 2)的样本,
练习
设总体X~N( , ),样本X 1 , X 2 , Xn来自X
2
样本n取多大时,有 (1)E(|X- | ) 0.1
2
(2)P(|X- | 0.1) 0.95
(3)
F 分布的分位点 称满足条件
对于给定的正数
的点
为
分布的上
分位点。
关于 F 分布分位点的重要结论
表中所给的
当
都是很小的数,如0.01,0.05等
较大时,如0.95,
表中查不出,可由以上结论
休息片刻
四、几个重要的抽样分布定理 定理 1 设 (样本均值的分布)
X1,X2,…,Xn 是取自正态总体
n1 n2 2
n1 1 2
1 x
n1 n2
n1 n2 2
x0
x0
2. 性质 (1) 由定义可见,
1 Y n2 ~ F( n2, n1) F X n1 (2) X的数学期望为: n2 E( X ) 若 n2 > 2 n2 2
即它的数学期望并不依赖于第一自由度n1.
来定义.
2—分布的密度函数曲线
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
2. 2分布的性质
由 分布的定义,不难得到:
(2) 设
则 这个性质叫 分布的可加性.
且X1 , X2相互独立,
( ) E n, D 2n 2
2 2
证:EX i 0, DX i 1,
2 i 4 i 2 2 i n
X i ~ N (0,1)
n
EX 1,
2 i
DX EX ( EX ) 3 1 2, i 1, 2, n
所以 E 2 E ( X i2 ) EX i2 n.
D 2 D( X i2 ) DX i2 2n.
E( T ) = 0;
D( T ) = n / ( n - 2 ) ,
对 n > 2
(2)t 分布的密度函数关于 x = 0 对称,且
Lim f ( x; n) 0
x
当n充分大时,其图形类似于标准正态分布密度
函数的图形.
很大.
不难看到,当n充分大时,
t 分布近似
N (0,1)分布. 但对于较小的n, t分布与N (0,1)分布相差
则当n充分大时,
X n 2n
的分布近似正态分布 N (0,1).
(4)
分布的分位点
称满足条件的点 分布的上 分位点.
对于给定的正数 为
P443
分布表供查阅。
例 即 对于给定的 的点 为
称满足条件
分布的“上 百分位点”
上侧
分位点。
分布的下侧 当 下侧 双侧 时 分位点 分位点
分位点。 双侧
分位点。
例题分析 设X1,X2,X3,X4是总体
例题分析
Z
Y1 Y2 2(Y1 Y2 ) / 2 S 2S 2 /2 2