三大抽样分布课件
合集下载
统计学(8)抽样分布ppt课件

23
三、两个样本方差比的抽样分 布
1. 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本, Y1,Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为(n1-1), 分母自由度为(n2-1) F分布,即
第八章 抽样分布
ppt课件完整
1
• 统计方法
描述统计
推断统计
参数估计
假设检验
ppt课件完整
2
所谓统计推断,就是根据概率论所揭示的随机变 量的一般规律性,利用抽样调查所获得的样本信息, 对总体的某些性质或数量特征进行推断。
参数估计
统计推断 假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
21
一、两个样本均值之差的抽样分 布
1. 两个总体都为正态分布,即 X1 ~N(1,12,) X2 ~N(2,22)
2. 两个样本均值之差 X1 X2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E(X1X2)12
•
方差为各自的方差之和
2
2
2 X1X2
1
2
n n 1
2
ppt课件完整
X
n
ppt课件完整
15
二、样本比例的抽样分 布
比例:
1. 比例:指总体(或样本)中具有某种属性的单位与 全部单位总数之比。
• 例1:不同性别的人与全部人数之比
• 例2:合格品与全部产品总数之比
三大抽样分布课件

在方差分析中,t分布用于检验 各个组之间的均值是否存在显著
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
《抽样和抽样分布》课件

《抽样和抽样分布》ppt课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
抽样与抽样分布.pptx

参数估计也就是用样本统计量去估计总体的 参数。比如,用样本均值估计总体均值估计 总体均值,用样本方差估计总体方差,用样 本比例估计总体比例等。
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
抽样与抽样分布 ppt课件

可以按自然区域或行政区域进行分层,使抽样的组织 和实施都比较方便
分层抽样的样本分布在各个层内,从而使样本在总体 中的分布比较均匀
如果分层抽样做得好,便可以提高估计的精度
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
调查的实施 缺点是估计的精度较差
多阶段抽样
(multi-stage sampling)
1. 先抽取群,但并不是调查群内的所有单位,而是再 进行一步抽样,从选中的群中抽取出若干个单位进 行调查
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为n样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
分层抽样的样本分布在各个层内,从而使样本在总体 中的分布比较均匀
如果分层抽样做得好,便可以提高估计的精度
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
调查的实施 缺点是估计的精度较差
多阶段抽样
(multi-stage sampling)
1. 先抽取群,但并不是调查群内的所有单位,而是再 进行一步抽样,从选中的群中抽取出若干个单位进 行调查
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为n样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
§5.4三大抽样分布

所以 Y ( y1 ,, yn )T 的各分量相互独立.
n 1 由于 x y1 , ( n 1) s 2 yi2 . x与s 2相互独立. n i 2
1 n 1 21 1 A 3 2 1 n( n 1)
n
( n 1) s 2 yi2,
i2
yi N (0, ), i 2,3, , n.
2
y2 ,, yn相互独立.
( n 1)
2
yi 2 s ~ (n 1). i 2
n
2
2
15
定理2:设( X 1 , X 2 ,, X n )是来自正态总体N ( , )的
1 n 1 21 1 3 2 1 n( n 1)
1 n 0
1 3 2 1 n( n 1)
0 0 1 n( n 1) 1 n
14
(3)
( n 1)
2
s 2 ~ 2 ( n 1).
2 i 1 2 i 2 1 2 2 n 2 n
服从自由度为n的 2分布, 记作 2 ~ 2 (n) . 注:服从 2分布的随机变量取值非负,其密度函数为 n x 1 1 x2 e 2 , x 0 n 2 n 2 ( x; n) 2 ( ) Γ ( s ) x s1e x dx , s 0, 2 0 0, x0
4
n=4
2 分布的性质:
n=6 n=10
1、随n的增大,其偏度越来越小。
2、 2分布表——P425 附表三
2
即是分布函数数值表.
2
n 1 3、 分布是Ga分布的特例,即有 ( n) Ga( , ) . 2 2 4、 2分布具有可加性:
统计学--抽样与抽样分布 ppt课件

1 n
n i 1
xi ,
S2
1 n 1
n i 1
( xi
x )2
n
1
1
n i 1
xi 2
nx
2
,
S
1 n 1
n i 1
( xi
x)2 .
ppt课件
11
抽样方法
ppt课件
12
概率抽样
(pro概b率ab抽il样ity也s叫am随机pl抽in样g),是指按随机原则抽取样本。
ppt课件
14
简单随机抽样
(simple random sampling)
1. 从总体N个单位(元素)中随机地抽取n个单位作为 样本,使得总体中每一个元素都有相同的机会(概 率)被抽中
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
随机原则,就是排除主观意识的干扰,使总体每一个单位都有 一定的概率被抽选为样本单位,每个单位能否入选是随机的。
特点
能有效地避免主观选样带来的倾向性误差(系统偏差), 使样本资料能够用于估计和推断总体的数量特征,而且 这种估计和推断得以建立在概率论和数理统计的科学理 论之上
可以计算和控制抽样误差,说明估计的可靠程度。
(1) 样本均值 :
X
1 n
n i 1
Xi,
(2)
样本方差:
S2
1 n 1
n i 1
(Xi
X )2
1 n 1
5.4 三大抽样分布

特别,若12 =22 ,则 F=sx2/sy2 F(m1,n1)
18 July 2014
第五章 统计量及其分布
第27页
推论5.4.4
在推论5.4.3的记号下,设 12 =22 = 2 ,
2 x 2 y 2 i 1 i 1 m n
18 July 2014
第五章 统计量及其分布
第15页
其密度函数为(推导过程见P273):
1 [(n 1) 2] y 2 n2 p( y ) (1 ) , y n (n 2) n
t 分布的密度函数的图象是一个关于纵轴对称 的分布,与标准正态分布的密度函数形状类似, 只是峰比标准正态分布低一些尾部的概率比标 准正态分布的大一些。
• 当自由度较大 (如n30) 时, t 分布可以用 正态分布 N(0,1)近似。
18 July 2014
第五章 统计量及其分布
第18页
当随机变量t t(n) 时,称满足 P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数. 分位数 t1(n) 可以从附表4中查到。 譬如 n=10,=0.05,那么从附表4上查得 t10.05(10) = t0.95(10)=1.812 . 由于 t 分布的密度函数关于0 对称, 故其分位数 间有如下关系 t(n1)= t1(n1)
A (aij ) 定义如下:
1 a1 j , j 1, 2, n , n,
18 July 2014
1 k ( k 1) , j k k 1 akj , jk, k ( k 1) 0, jk
k 2
第五章 统计量及其分布
n
(3) (n1) s2/2 2(n1)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n x)2 yi2 y12 yi2
i 1
i 1
这证明了结论(1)
由于
yi ~ N 0, 2
yi
~ N (0,1)
(n
1) s2
2
n ( yi
i2
)2
~
2(n
1)
这证明了结论(3)
推论5.4.1 在定理5.4.1的记号下,有 t
n(x ) ~ t(n 1)
s
证明 由定理5.4.1(2)可以推出
E ( X )
Var( X ) 2I
1
取一个n维正交矩阵A,其第一行的每一个元素均为 n ,如
1 n
1
21
A
1
32
1
n(n 1)
1
n 1
2 1 1
32 1
n(n 1)
1
n
1 n
0
0
1 32
0
1
n(n 1)
n 1
n(n
1)
令Y=AX,则由多维正态分布的性质知Y仍服从n维正态分布,
s
2 y
/
2 1
/
2 2
~
F(m 1, n 1)
特别,若
2 1
2 2
,则
F
s
2 x
/
s
2 y
~
F(m 1, n
1)
证明: 由两样本独立可知,
s
2 x
与
s
2 y
相互独立且
(m
1)s
2 x
~
2 (m 1)
2 1
(n
1)
s
2 y
~
2 (n 1)
2 2
由F分布定义可知F~F(m-1,n-1)
推论5.4.3
F n, m
1
F1 m, n
例5.4.1 若取m=10,n=5, =0.05,那么从附表5上查得
F10,05 10,5 F0.9510,5 4.74
由F n, m
1
F1 m, n
F0.0510,5
1
F0.95 5,10
1 3.33
0.3
5.4.3 t 分布
▪ 定义5.4.3 设随机变量X1与X2 独立且 X1 ~ N0,1,X 2 ~ 2 n
则称 t X1 的分布为自由度为n的t分布,记为 t ~ tn
X2 /n
问题:如何确定 t 的分布?
由标准正态密度函数的对称性知,X1与
X
有相同分布,
1
从而t与-t有相同分布。
P(0 t y) P(0 t y) P( y t 0)
P(0 t y) 1 P(t2 y2)
2
由于t 2
于是F0.95(4,10) 3.48即是自由度为(4,10)的 F分布的0.95分位数
问题:当比较大(1 比较小)的时候,如何确定分位数?
有F分布的构造知,若F~F(m,n),则有1/F~ F(n,m),故对给定
0 1
P
1 F
F
n,
m
P F
F
1
n,
m
,
P F
F
1
n,
m
1
PF F1 m,n 1
§5.4 三大抽样分布
▪ 本次课教学目的: 掌握三大抽样分布的构造性定义并熟悉一些重要结论
▪ 重点难点: 三大抽样分布的构造及其抽样分布 一些重要结论
▪ 教学基本内容及其时间分配 三大抽样分布的构造性定义——————30分钟 定理及其三个推论以及证明——————70分钟
根据本节课的特点所采取的教学方法和手段: 启发式讲授,图文结合加深对三大分布的印象
x
y
N
(1
2 , (
1 m
1 n
)
2
)
(x - y) - (1 2 ) ~ N (0,1). 1 1
mn
由定理5.4.1知,
(m 1)sx2
2
~
2 (m 1)
(n
1)
s
2 y
2
~
2 (n 1)
独立,
2分布可加性
(m
n
2
2)sw2
(m
1)sx2
(n
1)
s
2 y
2
~
2(m n 2)
又x y与sw2 相互独立,根据t分布的定义即可得到(5.4.8).
X2
第二步,我们导出 F
n
Z
的密度函数
m
首先,我们导出 Z X1 的密度函数
X2
m
12
X1
~
2(m)
p1( x1)
2
m
m
x1 2
1e
x1 2
,
2
n
1 2
X2
~
2(n)
p2 ( x2 )
2
n
x2
e n 1
2
x2 2
,
2
x1 0 x2 0
Z的密度函数为
pZ (z)
▪ 思考题及作业题: 三大抽样分布之间的内在关系是什么?
▪ 作业题:P277 必做:1,2,5,11,13
选做:8,12
在推论5.4.2的记号下,设
2 1
2 2
2
,并记
m
n
s
2 w
(m
1)s
2 x
(n
1)
s
2 y
mn2
(xi
i 1
x)2 (yi
i 1
mn2
y)2
则
(x y) (1 2 ) ~ t(m n 2)
sw
1 1 mn
(5.4.8)
证明 由 x ~ N 1, 2 / m , y ~ N (2, 2 / n) x 与 y 独立
x ~ N (0,1) / n
(5.4.5)
将5.4.4 左端改写为 n(x ) s
x / n (n 1) s2 / 2
n 1
(5.4.6)
由于分子是标准正态变量,分母的根号里是自由度为n-1 的t变量除以它的自由度,且分子与分母相互独立,由t分布定 义可知,t~t(n-1),推论证完。
推论5.4.2 设 x1, , xm 是来自N(1,12 )的样本,y1, , yn 是来自
N
(
2,
2 2
)
的样本且此两样本相互独立,记
s
2 x
1 m 1
m i 1
(xi
x
)
2
,
s
2 y
1 n 1
n
( yi
i 1
y)2 ,
其中 x
1 m
m i 1
xi ,
y
则有
F
s
2 x
定理5.4.1 设 x1, , xn 是来自正态总体 N(, 2 ) 的样本,其样本
均值和样本方差分别为
则有
(1) 与x
x
1 n
n i 1
xi
和
s 2相互独立;
s 2
1 n 1
n
(xi
i 1
x)2
(2) x ~ N (, 2 n ) (3)(n 1) s 2 ~ 2 (n 1)
2
证明 记 X (x1, , x,n )T则有
x2 p1 zx2 p2
0
做变换令u
x2 dx2
x2 1 z
2
m 1
z2
m
n
2
mn 2
2 2
x e dx
mn 1 22
x2 1z
2
2
0
m n
于是
pz
z
m 1
z2
1
z
mn 2
m n
u
mn 2
1eu
du
0
2
2 2
m
2
n
m1
z2
1
z
mn 2
m n
2 2
分位数 t1 (n) 可以从附表4中查到。譬如n=10,a=0.05, 那么从附表4 上查到
t10.05 (10) t0.95 (10) 1.812
由于t分布的密度函数关于0对称,故其分位数间有如下关系
譬如
t (n) t1 (n)
t0.05 (10) t0.95 (10) 1.812
。
5.4.4 一些重要结论
2(10)
5.4.2 F分布
定义5.4.2 设 X1 ~ 2 m, X 2 ~ 2 n, X1 与X 2 独立,则称
F= X1 m 的分布是自由度为m与n的F分布,记为 X2 n
F ~ Fm,n
其中m称为分子自由度,n称为分母自由度.
问题:如何确定 F 的分布?
首先,我们导出 Z X1 的密度函数
n 40 n 10
n4 n 1
若F ~ F(m, n),对给定的 (0 1),称满足
PF F1 m, n 1
的F1 (m, n)是自由度为m与n的F分布的1 分位数.
F (4,10)
PF F1 m,n 1
给定 0.05, m 4, n 10,查表知
PF (4,10) 3.48 0.95
X12
X
2 2
/
n
~
F (1, n)
所以在上式两边同时关于y求导得t分布的密度函数为:
pt ( y)
ypF ( y2 )
(1
n
)(
1
)
1 2
2n
(1)( n )
(
y
2
)
1 2
1
(1
1 n