第六章抽样分布
合集下载
统计学第6章统计量及其抽样分布

整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
第6章-统计量及其抽样分布

2、计算出每个样本的统计量值; 3、将来自不同样本的不同统计量值分组排列,把
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
第六章 统计量及其抽样分布

样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
概率论 第六章 样本及抽样分布

函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
概率论与数理统计第六章样本及抽样分析

则 Y1 Y2 ~ 2 (n1 n2 )
期望与方差:E(Y) = n, D(Y) = 2n
X1, X2,……, Xn 来自标准正态总体 X 的样本,那么
Y (X1 X2 )2 (X3 X4 )2 (X5 X6 )2
是否服从卡方分布?若 kY ~ χ2( n ),求 k,n
第六章 样本及抽样分析
… 19.675 2… 21.026 23.337 26.217 28.299
… 22.362 24.736 27.688 29.819
… 23.685 26.119 29.141 30.319
…
…
…
…
…
…
…
…
…
…
查表练习: 求下列各式中的 C 值
1. Y ~ 2(24), P(Y C ) 0.1 2. Y ~ 2(40), P(Y C ) 0.95
样本可看成 n 维随机变量(X1, X 2 ,, X n), 则有 P( x1, x2 ,, xn ) = P( x1)P( x2 ) P( xn )
或 f ( x1, x2 ,, xn ) = f ( x1) f ( x2 ) f ( xn )
身高总体
178.4 161.5 174.9 182.7 171.0 165.3 172.8 182.1 180.2 176.8 181.7 175.7 177.3 180.0 179.4 177.0 181.3 176.5 176.0 175.7 168.1 184.6 169.1 177.8 175.1 161.8 174.3 176.0 163.7 176.8 177.3 175.3 180.2 176.8 181.9 178.4 181.5 177.6 179.9 178.2 174.7 176.0 175.7 180.3 166.2 177.2 171.9 182.9 176.8 179.5 167.0 174.8 182.7 174.9 178.1 179.9 175.4 184.4 175.1 179.4 173.2 176.1 177.6 180.5 164.3 170.5 177.5 168.3 173.0 176.8 173.9 180.7 166.5 180.0 165.6 179.4 182.2 176.3 177.4 183.4 167.9 176.1 177.4 183.4 176.9 168.0 179.0 178.8 173.1 173.2 162.2 179.9 178.2 183.0 174.0 180.8 173.1 173.2 176.8 171.1 169.0 178.3 171.6 181.2 167.6 161.1 166.0 190.2 180.3 166.2 174.9 175.8 176.5 164.2 173.0 176.8 170.5 180.5 177.3 175.3 163.7 176.8 171.1 168.5 171.2 170.2 177.1 169.4 175.7 177.3 183.2 168.6 175.1 179.4 169.1 169.9 168.5 180.2 174.9 171.0 171.0 168.8 177.7 168.6 176.6 175.9 176.8 179.5 174.3 176.0
期望与方差:E(Y) = n, D(Y) = 2n
X1, X2,……, Xn 来自标准正态总体 X 的样本,那么
Y (X1 X2 )2 (X3 X4 )2 (X5 X6 )2
是否服从卡方分布?若 kY ~ χ2( n ),求 k,n
第六章 样本及抽样分析
… 19.675 2… 21.026 23.337 26.217 28.299
… 22.362 24.736 27.688 29.819
… 23.685 26.119 29.141 30.319
…
…
…
…
…
…
…
…
…
…
查表练习: 求下列各式中的 C 值
1. Y ~ 2(24), P(Y C ) 0.1 2. Y ~ 2(40), P(Y C ) 0.95
样本可看成 n 维随机变量(X1, X 2 ,, X n), 则有 P( x1, x2 ,, xn ) = P( x1)P( x2 ) P( xn )
或 f ( x1, x2 ,, xn ) = f ( x1) f ( x2 ) f ( xn )
身高总体
178.4 161.5 174.9 182.7 171.0 165.3 172.8 182.1 180.2 176.8 181.7 175.7 177.3 180.0 179.4 177.0 181.3 176.5 176.0 175.7 168.1 184.6 169.1 177.8 175.1 161.8 174.3 176.0 163.7 176.8 177.3 175.3 180.2 176.8 181.9 178.4 181.5 177.6 179.9 178.2 174.7 176.0 175.7 180.3 166.2 177.2 171.9 182.9 176.8 179.5 167.0 174.8 182.7 174.9 178.1 179.9 175.4 184.4 175.1 179.4 173.2 176.1 177.6 180.5 164.3 170.5 177.5 168.3 173.0 176.8 173.9 180.7 166.5 180.0 165.6 179.4 182.2 176.3 177.4 183.4 167.9 176.1 177.4 183.4 176.9 168.0 179.0 178.8 173.1 173.2 162.2 179.9 178.2 183.0 174.0 180.8 173.1 173.2 176.8 171.1 169.0 178.3 171.6 181.2 167.6 161.1 166.0 190.2 180.3 166.2 174.9 175.8 176.5 164.2 173.0 176.8 170.5 180.5 177.3 175.3 163.7 176.8 171.1 168.5 171.2 170.2 177.1 169.4 175.7 177.3 183.2 168.6 175.1 179.4 169.1 169.9 168.5 180.2 174.9 171.0 171.0 168.8 177.7 168.6 176.6 175.9 176.8 179.5 174.3 176.0
第六章样本及抽样分布

n
(
Xi
)2
,
i 1
max{ X i }
1i n
为什么要求统计量不含任何未知参数
试验前 g(X1, X2 ,是, 随Xn机) 变量 试验后 g(X1, X2 ,是, 具Xn体) 的数值
与均值和方差 有什么不同?
X
1
n
n
i 1
Xi
为什么不是
1 n
(下章说明)
S2
1
n1
n
(Xi
i 1
X
)2
S
S2
6, 故Q0.75
Q3
1 2
(123
132)
127.5
Min 102, Max 150,作出箱线图如图所示
102 113.5 120
120 150
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
箱线图适合比较两个或两个以上数据集的性质
一 直方图
为了研究总体分布的性质,人们通过实验得到许 多观测值,一般来说这些数据实杂乱无章的,为了利 用它们进行统计分析,将这些数据加以整理,还借助 于表格或图形对它们加以描述。
例1:下面列出了84个伊特拉斯坎(Etruscan)人男子的 头颅的最大宽度(mm),现在来画这些数据的“频率直 方图”
1 2 3 4 5 6 7 8 9 10 11
76 90 97 71 70 93 86 83 78 85 81 65 95 51 74 78 63 91 82 75 71 55 93 81 76 88 66 79 83 92 78 86 78 74 87 85 69 90 80 77 84 91 74 70 68 75 70 84 73 60 76 81 88 68 75 70 73 92 65 78 87 90 70 66 79 68 55 91 68 73 84 81 70 69 94 62 71 85 78 81 95 70 67 82 72 80 81 77
概率论第六章样本及抽样分布

2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 n2 Y = ∑Yi n2 i=1
1 n1 1 n2 2 ( Xi − X )2 S2 = (Yi − Y )2 S12 = ∑ ∑ n1 −1 i=1 n2 −1 i=1
第三节 抽样分布定理
定理7 定理 :设两独立总体X~N(µ1,σ12),
Y~N(µ2,σ22) ,则统计量
X − Y ~ N ( µ1 − µ 2 ,
(1) X ~ N ( µ ,
…
,Xn 为来自任意总体X的一个容量
为n的样本,若E(X)=µ,D(X)=σ2>0存在,当n较大时,
σ2
n
)
X −µ (2) ~ N (0 ,1) S/ n
第三节 抽样分布定理
2.两个总体的统计量的分布 2.两个总体的统计量的分布
1 n1 X = ∑ Xi n1 i=1
1、是样本的函数 、 2、不含未知的总体参数 、不含未知的总体参数. 抽样分布就是样本统计量的分布
样本 X1,X2,…Xn
判断下列是否为统计量
X1 + X 2 + L + X n 1 n X= = ∑ Xi n n i =1
1 n S = ( X i − X )2 ∑ n − 1 i =1
2
X (1) ,K , X ( n )
σ
2
n
, ES 2 = σ 2 .
第三节 抽样分布定理
定理2 定理 :设总体 X
N (µ ,
σ 2 ) ,X1,
…
,Xn 为
来自总体X的一个容量为n的样本,则
(1)
X ~ N (µ ,
σ2
n
)
(2)
X −µ ~ N (0,1) σ/ n
第三节 抽样分布定理
定理3: 定理 :设总体X~N(µ,σ2),X1…Xn 为来自总体
n →∞
第二节 统计量及其分布
F- (3) F-分布
X / n1 X ~ χ (n1 ), Y ~ χ (n2 ), X , Y 独立,称r.v. F = Y / n2
2 2
所服从的分布为自由度是(n1 , n2 )的 F − 分布 记作F ~ F (n1 , n2 ). n1称为第一自由度,n2为第二自由度
第二节 统计量及其分布
α
2 χα
对于给定的α (0 < α < 1),称满足条件:
2 P{χ 2 > χ α ( n )} = α
2 的点χα ( n)为χ 2 ( n)分布的上α 分位点((1-α )分位点) 1 2 当n充分大时,χ α ( n ) ≈ ( zα + 2n − 1 ) 2 2 zα 是标准正态分布的上α分位点。
T2 服从均值和方差都为2的正态分布,而统计量
T3
服从均值为1,方差为1/ n 的正态分布。
第二节 统计量及其分布
三种常见分布
(1) χ 2 −分 布
χ 2分布的定义
X 1 ,L , X n 为独立同分布于标准总体总体N(0,1)的随机变量 列,则称随机变量:
χ 2 = X 12 + L + X n2
第二节 统计量及其分布
t(2) t-分布
X X ~ N (0,1), Y ~ χ (n), X , Y 独立,则称r.v.T = Y /n 所服从的分布为自由度是n的 t − 分布,记作T ~ t (n).
2
第二节 统计量及其分布
t分布的三个要点:
分子是标准正态随机变量
分母是自由度为n的卡方随机变量 分母是自由度为 的卡方随机变量
新随机变量服从 自由度为n 自由度为n的t分 布
分子分母相互独立, 分子分母相互独立,且满足构造公式
t分布的图像
基本性质: 基本性质 f(t)关于t=0 t=0(纵轴)对称。 (1) f(t) t=0 f(t)的极限为N(0,1) N(0, (2) f(t) N(0 1)的密度函数
第二节 统计量及其分布
…
,Xn 为来自
X −µ ~ t (n − 1) S/ n
设 X 1 ,L X n来自于总体X的样本,E ( X ) = µ , D( X ) = σ 2 >0 则当n很大时 (1) X ~ N ( µ ,
σ2
n
)
X −µ (2) ~ N (0 ,1) S/ n
第三节 抽样分布定理
定理6: 定理 :设X1, 近似地有
第二节 统计量及其分布
χ 分布的性质:
2
2、
E χ = n, D χ = 2 n
2 2
证: X i ~ N (0,1), EX i = 0, DX i = 1, EX i2 = 1
DX i2 = EX i4 − ( EX i2 ) 2 = 3 − 1 = 2, i = 1,2, L n
所以:
E χ = E (∑ X ) = ∑ EX = n.
m0.5
X 1 ,K , X n
T = ∑ ( X i − µ )2
i =1 n
X1 + X 2
Z= X − µ0
σ
统计量的主要类型
样本矩统计量 分位数统计量 其他统计量 顺ห้องสมุดไป่ตู้统计量
例5.1.总体 X 服从两点分布,其分布律如下
P ( X = 1) = p
P ( X = 0) = 1 − p = q
说明:设
χ =
2 1
∑X
i =1
n1
2 i
,χ =
2 2
∑Y
j =1
n2
2 j
χ12,χ 22 独立,则:
独立,由卡方分布的定义
X i , Y j , i = 1, 2,L n1 , j = 1, 2,L n2
n1 n2
2 χ12 + χ 2 = ∑ X i2 + ∑ Y j2 i =1 j =1
χ 2 (n1 + n2 )
E (T1 ) = E ( X 1 ) = 1
D(T1 ) = D( X 1 ) = 1
E (T2 ) = E ( X 1 ) + E ( X 2 ) = 2 D(T2 ) = D( X 1 ) + D( X 2 ) = 2 1 D (T3 ) = D( X ) = E (T3 ) = E ( X ) = 1 n 统计量 T1 服从均值和方差都为1的正态分布,这和总体的分布相同
总体和样本的关系
数理统计中, 数理统计中,样本和总体具有相同的分布
取值1 取值 概率0.2 概率 取值2: 取值 : 概率0.4 概率 • 分布总体 总体各个值的概 率可以认为是有相应比重的个 体取该值。 • 随机样本 由于每一个体都 有均等被抽中的概率,因而样 本取总体各个值的概率即样本 分布与总体分布相同。
X的一个容量为n的样本,记
Y= 1
n
σ2
( X i − µ )2 ∑
i =1
则:
Y
χ 2 ( n)
第三节 抽样分布定理
定理4: 定理 :设总体X~N(µ,σ2),X1,
总体X的一个容量为n的样本,则
…
,Xn 为来自
第三节 抽样分布定理
定理5: 定理 :设总体X~N(µ,σ2),X1,
总体X的一个容量为n的样本,则
第三节 抽样分布定理
一个总体的统计量的分布
1 n X = ∑ Xi, n i =1
1 n S2 = ( X i − X )2 ∑ n − 1 i =1
定理1: 定理 :设总体X有E(X)=µ,D(X)=σ* σ , X 1,
…
,Xn 为来自总体X的一个容量为n的样本,则
E( X ) = µ,
D( X ) =
若 F ~ F(n1, n2 ), 则 1/ F ~ F(n2, n1).
对于给定的α (0 < α < 1),称满足条件: P{F > Fα ( n1 , n 2 )} = α
的点Fα (n1 , n2 )为F 分布的上α 分位点
α
Fα ( n1 , n2 )
结 :F −α (n1, n2 ) = 1/ F (n2 , n1) 论 1 α
从总体中抽样容量为n的样本,构造统计量 n
n
T = ∑ Xi
i =1
求此统计量的抽样分布。
解:由于样本是独立的,
X i服从两点分布,统计量 T 为随机变量,其取值是0到
n 之间的所有整数,其分布恰好是二项分布,其分布律为:
P (T = k ) = C p q
k n k n−k
k = 0,1, 2,..., n
对于给定的α (0 < α < 1),称满足条件: P{t > tα ( n )} = α
α
t1−α (n)
tα (n)
的点tα (n)为t分布的上α 分位点 。
当n > 45时,tα ( n ) ≈ zα .
由概率密度的对称性知 :t1−α ( n ) = −tα ( n )
第二节 统计量及其分布
2 i =1 2 i i =1
n
n
n
2 i
Dχ 2 = D (
∑
i =1
n
X i2 ) =
∑
i =1
DX i2 = 2n.
χ2(n)分布实质上就是参数为n/2,1/2的Γ分布, 即χ2(n)的密度函数为
n x −1 − 1 n/2 x2 e 2 , x > 0 f ( x) = 2 Γ ( n / 2) 0, x≤0
第二节 统计量及其分布
F分布的三个要点:
分子是自由度为n 分子是自由度为 1的卡方随机变量
分母是自由度为n 分母是自由度为 2的卡方随机变量
新随机变量服从 第一自由度为n 第一自由度为n1 第二自由度为n 第二自由度为n2 的F分布