均值向量和协方差阵的检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-4-1
1.协方差阵相等的情形
F检验
设 X( ) ( X 1 , X 2 ,, X p )' ( 1,, n1 )为来自p元正 态总体 N p ( 1 , ) 的容量为 n1 的样本, Y( ) (Y 1 , Y 2 ,, Yp )' ( 1,, n2 )是来自p元正态总体 N p ( 2 , ) 容量为 n2 的样 本,且两样本之间相互独立,n1 p , n2 p假定两总体 协方差阵相等,但未知,现对假设
第二章 均值向量和协方差阵的检验
•§2.1 •§2.2 均值向量的检验 协方差阵的检验
•§2.3 有关检验的上机实现
第二章 均值向量和协方差阵的检验
2
以 做检验。
第二章 均值向量和协方差阵的检验
§2.1
均值向量的检验
§2.1.1 §2.1.2 §2.1.3 §2.1.4
一个指标检验的回顾 多元均值检验 两总体均值的比较 多总体均值的检验
Χ2检验(卡方检验)
类似于(2.3)的统计量(注意(2.3)的形式)是
n( x 0 ) ( x 0 )
2 0
(2.5)
2
0 遵从自由度为 可以证明,在假设 H 0为真时,统计量 2 p的 分布;事实上由§1.5 1 X ~ N p (0, ), n 知当H 0: 0成立时,由多元统计分布的性质4,有
2014-4-1
§2.1.3
两总体均值的比较
在许多实际问题中,往往要比较两个总体之间的 平均水平有无差异。例如,两所大学新生录取成绩是 否有明显差异;研究职工工资总额的构成情况,若按 国民经济行业分组,就是例如要研究工业与建筑业这 两个行业之间,是否有明显的不同之处;同理,可按 工业领导关系(中央、省、市、县属工业)分组;也 可按工业行业分组。组与组之间的工资总额构成有无 显著差异,本质上就是两个总体的均值向量是否相等, 这类问题,通常也称为两样本问题。两总体均值比较 的问题,又可分为两总体协方差阵相等与两总体协方 差阵不等两种情形。
ˆ 1 ( X Y) 成 因为T 2的值与总体均值的马氏距离 ( X Y)'Σ 正比例,此值愈大,说明两总体的均值很接近的可能性就愈小, 因而拒绝域可以取为F 值较大的右侧区域,即当给定显著性水 平 的值时,若
F Fp,n1 n2 p1 ( )
时,拒绝 H 0 ,否则没有足够理由拒绝H 0。
2 ' '
T2检验(hotelling检验)
L ,类似于式(2.3) (n 1)

T n( x 0 ) Σ ( x 0 ) n(n 1)( x 0 ) L ( x 0 )
1
可以证明,统计量遵从参数为p,n-1,,的 T 2 分布, 即 T 2 Tp2,n1 。统计量 T 2实际上也是样本均值 X与已知均值 向量 0之间的马氏距离再乘以n(n-1),这个值越大,μ与 0 相等的可能性就越小。
( f p 1) 2 ( )T ~ Fp, f p1 f p
f p 1 2 T 近似遵从第一自由度为 fp
p 、第二自由度为
(2.14)
当min( n1 , n2 ) 时, T 2近似于2 p
2014-4-1
§2.1.4
多总体均值的检验
在许多实际问题中,我们要研究的总体往往 不止两个。例如,要对全国的工业行业的生产经 营状况做一比较时,一个行业可以看成一个总体, 此时要研究的总体就达几十甚至几百个之多。这 类问题的研究就需要多元方差分析的知识。多元 方差分析是一元方差分析的直接推广,为了易于 理解多元方差分析的方法,我们先回顾一元的方 差分析。
2 ( x x ) 当 2 未知时, 用S 2 i 作为 2的估计, 用统计量 i 1 ( n 1) x 0 t n (2.2) S n
样本正态,方差未知, ), T检验 | t |tn1 ( / 2用
tn1 ( / 2)为tn1的上 / 2分为点。
2014-4-1
2 / 1 (X Y) / S (X Y)

(2.13)
Lx n1 ( n1 1)
式中, X , Y , Lx 和Ly 的统计含义与前相同,再令 S*
f
1
n2 ( n2 1)
Ly
4 Lx / 1 1 (n n ) ( X Y) S ( )S ( X Y) T n1 1
2014-4-1
由§1.5,将 T 2统计量乘上一个适当的常数后,便成为 F 统计量,也可用F分布表获得零假设的拒绝域。即
n p 2 { T Fp ,n p ( )} (n 1) p (2.8)
2 T02 的合理性及推证见参考文献[3] 关于 T、 在实际工作中,一元检验与多元检验可以联合使用, 多元的检验具有概括和全面考察的特点,而一元的检验 容易发现各指标之间的关系和差异,能帮助我们找出存 在差异的侧重面,提供了更多的统计分析信息。
2 n( x 0 ) ( x 0 ) p ( ) 2 0 ' 1


时,便拒绝零假设 H 0,说明均值μ不等于 0 ,其中 p ( )是 2 自由度为P的 分布的分为点。即
2
2 2 P{ 0 p ( )}
2014-4-1
(ⅱ)协方差阵Σ未知 此时Σ的无偏估计是 的统计量是: 1
t 2 n( x 0 )( S 2 ) 1 ( x 0 )
(2.3)

2014-4-1
§2.1.2
多元均值检验
2014-4-1


2014-4-1
X ( ) ( X 1 ,, X p )'

2014-4-1
(ⅰ)协方差阵Σ已知
2 0 ' 1
r
1 n k (k) 式中X k X j 是第k个组的均值 n k j1 1 r n k (k) X k X j , 是总均值, n n1 n r . k 1 j1 n 2014-4-1
当假设为真的,F统计量遵从自由度为(r 1 ) ( , n r) 的分布,记为F ~ F ,零假设的拒绝域为: r 1, n r FF () r 1, n r
用类似于一元方差分析的办法,前面所述的三个平方和变成了 矩阵,形式如下:
B SS ( TR ) n k ( X k X )( X k X ) /
k 1 r nk
E SSE ( X(jk ) X k )( X (j k ) X k ) /
(1) X1 , , X(1) n1 ~ N p (μ1 , Σ)

(r ) X1 , , X(nrr ) ~ N p (μ r , Σ)
样本{X(jk ) , k 1, , r; j 1, , nk }相互独立,要检验的假设就是
2014-4-1
H 0 : 1 r , H1 : 至少存在i j ,使得i j (2.15)
H 0 : 1 r , H1 : 至少存在i j, 使得i j
2014-4-1
这个检验的统计量与下列平方和密切相关
组间平方和 : SS(TR) n k (X K X) 2 ;
k 1 2 组内平方和 : SSE (X (k) X ) ; j k k 1 j1 2 总平方和 : SST (X (k) X ) ; j k k 1 j1 r nk r nk
2014-4-1
T 2的值有变大的趋势,所以 因而,在备择假设成立时, 拒绝域可取为 T 2值较大的右侧部分。因此,当给定显著性 水平后,由样本的数值可立即算出 T 2 值,当
T 2 T p2,n1 ( )
时,便拒绝零假设H 0。
(2.7)
Tp2,n1 ( ) T 2分布的5%及1%的分位点已列成专表,由网上下载, 为 Tp2,n1 的上 分位点。
H 0 : 0 , 0
(2.9)
进行检验。与前面类似的统计量的形式是:
2014-4-1
T2
n1n2 ˆ 1 ( X Y ) (X Y) / Σ n1 n2
(2.10)
1 n1 1 n2 其中 X xi , Y yi ; n1 , n2 是样本容量; n1 i 1 n2 i 1 ( Lx Ly ) , 是协方差阵的估计量; (n1 n2 2)
n1 p, n2 p.假定两总体协方差阵不相等,我们 考虑对假设(2.9)作检验。这是著名Behrens— Fisher问题。长期以来,统计学家用许多方法试 图解决这个问题。当 Σ 1与 Σ 2相差较大时, T 2统计 量的形式是:
2014-4-1
Ly Lx T ( X Y) ( ) 1 ( X Y) n1 (n1 1) n2 (n2 1)
3 1 2 1 1 2 3 2 2 1 2
2
Ly 4 / 1 1 ( n n ) ( X Y) S S ( X Y ) T (n2 1)
2014-4-1
当假设(2.9)的 H 0成立时,可以证明(见文献[3])
f p 1的F分布,即
Lx ( xi x)( xi x) , Ly ( yi y )( yi y ) ' , 是两个总体的
' i 1 i 1
n1


n2


样本离差阵.
2014-4-1
当假设H 0 : 1 2 成立时, T 2 ~ Tp2,n1 n2 2 , 从而 n1 n2 p 1 2 T ~ Fp ,n1 n2 p 1 (2.11) (n1 n2 2) p n1 n2 p 1 2 * T F 有变大的趋势, 当备择假设H1 : 1 2 成立时, (n1 n2 2) p
2014-4-1
(2.12)
2.协方差阵不相等情形
F检验
设从两个总体 N p (1 , 1 ) 和 N p ( 2 , 2 ) ,分别抽 X( ) ( X 1 , X 2 ,, X p )' 取容量为 n1 和 n2的两个样本,
( 1,, n1 ) ,Y( ) (Y 1 , Y 2 ,, Yp )' ( 1,, n2 )
2014-4-1
2
2
(1) 2 X 1(1) , , X n ~ N ( , ) 1 1 (2) 2 X 1(2) , , X n ~ N ( , ) 2 2

(r ) 2 X 1( r ) , , X n ~ N ( , ) r r
假设r个总体的方差相等,要检验的假设就是
1 1 ' 1 ( X 0 ) ( ) ( X 0 ) n ( X 0 ) ( X 0 ) ~ 2 ( p) n '
2014-4-1
2 统计量 0 实质上是样本均值 X 与已知平均水平 0之间的 马氏距离的 μ 与 相等的可能性就越小, 0 n 倍,这个值越大, 02 有变大的趋势,所以拒绝域 因而,在备择假设 H1成立时, 2 0 值较大的右侧部分。式中 应取为 是样本均值, X n 是样本 容量。 2 当给定显著性水平 后,由样本值可以算出 0 的值,当
§2.1.1 一个指标检验的回顾
样本正态,方差已知, 用U检验也叫Z检验
u x 0

源自文库
n
(2.1)
1 n 其中x xi为样本均值。 n i 1 当假设成立时, 统计量u服从正态分布u ~ N (0,1), 从而拒绝域为 | u |ua / 2 , ua / 2为N (0,1)的上a / 2分位点
相关文档
最新文档