第三章 多元正态整体统计推断

合集下载

多元正态总体的统计推断.

多元正态总体的统计推断.

0z

0z
条件 检验条件量 H0、H1
n1p1≥5 n1q1≥5n2
u

p2≥5
n2q2≥5

p1 p2

pq pq n1 n2
(1) H0:P1=P2 H1:P1 ≠P2 (2) H0: P1 ≤P2
H1:P1 > P2



p

n1
p1
n2
p2
n1 n2
(3) H0:P1 ≥P2 H1:P1 <P2
总体参数
的值是多大?
推断估计
抽样分布
参数估计
统计量
随机原则
假设检验
检验未知参数
的值是 0 吗
一、参数估计
参数估计分为点估计和区间估计两种。
点估计:用某一具体的值去估计某一未知参数
区间估计:给出未知参数在一定把握程度 (概率或置信度下的取值区间,也称为置信 区间。
对总体的未知参数 作区间估计,就是要给出
确定α,就确定了临界点c。 1、随机抽样:样本均值
2、 X 标准化:
3、确定α值
4、查概率表,知临界值 | Z |
2
5、计算Z值,作出判断
检验步骤
1
建立总体假设 H0,H1
2
抽样得到样
3
选择统计量
4
根据具体决策
本观察值
确定H0为真 时的抽样分布
要求确定α
6
计算检验统
5
确定分布上的临
计量的数值
7
第四章 多元正态总体的统计推断
第一节 一元正态总体的统计推断
推断统计: 利用样本统计量对总体某些性质或数 量特征进行推断。

多元正态分布

多元正态分布

2
2
2
np ln 2 n ln | | 1 tr(1S) n (X )'1(X ))
2
2
2
2
np ln 2 n ln | | 1 tr(1S)
2
2
2
仅当 X时等号成立
ln L( X ,) np ln 2 n ln | | 1 tr(1S)
exp

(x2 2)2
2
2 22

三、正态分布数据的变换
若一批多元数据不满足正态分布时,一般要对数据进行正态变换。 一般来说常采用幂变换,如果想使值变小可以采用变换:
11
x1, ln x, x 4 , x 2
如果想使值变大,则采用变换: x2, x3
不管使用哪种幂变换,还应该对变换后的数据的正态性做检验 (如Q-Q图方法)
则称统计量 T 2 nX S 1X 的分布为非中心的Hotelling T2 分布,记为 T 2 ~ T 2 ( p, n, ) ,当 μ 0 时称为中心
的Hotelling T2分布。记为 T 2 ~ T 2 ( p, n)。 一元t分布:
设总体 X ~ N (, 2 ) X1, X n 是一组样本 ,则统计量
X1
Y
Yp

Apm
X
m


μ
称为m维正态随机变量,记为 Y ~ Np(μ,) 其中 AA 但是 AA 的分解一般不是唯一的。
定其义中3t为:实若向随量机,向则量称X的X服特从征p函元数正为态:分布(t。) 特exp征it函μ 数12 t定t义的优
第一章多元正态分布及其参数估计

经济学统计多元正态分布统计推断

经济学统计多元正态分布统计推断
12.7 12.3 9.8 8.4 10.1 7.1 8.2 10.9 11.2 9.4
例3.1的数学模型就是:x (x1, x2 , x3 )' 服从N(,) 要根据20个样品做复合检验:
1 4
H0
:
2
3
50 10
,
1 4
H1
:
2
3
Байду номын сангаас
50 10
一般的,我们考虑p维正态分布均值等于常数 的检验问题:X1, X 2 , , X n 为取自维正态总体 N p (1, ) 的一个样本,要检验:
上的 / 2 分位点。
这里我们应该注意到,(3.3)式可以表示为
t2 n( X )2 n( X )(S 2 )1( X )
S2
(3.4)
对于多元变量而言,可以将 t 分布推广为下面将要介绍的
Hotelling T 2 分布。
定义 3.1 设 X ~ N p ( μ , Σ ) ,S ~ Wp (n, Σ ) 且 X 与 S 相互独立, n p ,则称统计量 T 2 nX S-1X 的
分 布 为 非 中 心 HotellingT2 分 布 , 记 为
T 2 ~ T 2 ( p, n, μ) 。当 μ 0 时,称 T 2 服从(中心) Hotelling T 2 分布。记为T 2 ( p, n) 。
由于这一统计量的分布首先由 Harold Hotelling 提出
来的,故称为 Hotelling T 2 分布,值得指出的是,我
钾含量x3
9.3 8.0 10.9 12.0 9.7 7.9 14.0 7.6 8.5 11.3
排汗量x1
3.9 4.5 3.5 4.5 1.5 8.5 4.5 6.5 4.1 5.5

第3章统计实验(多元正态总体检验)

第3章统计实验(多元正态总体检验)

实验零多元正态总体检验(均值向量检验)1.实验目的:本实验讨论利用多元正态总体检验中的均值向量检验方法去判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。

通过该实验,能够起到如下的效果:(1) 理解多元正态总体检验中的均值向量检验方法的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用多元正态总体检验中的均值向量检验方法,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现多元正态总体检验中的均值向量检验方法的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。

2.知识准备:多元正态总体检验中的均值向量检验是从判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。

其思想和步骤是:1.假设“需判断的总体均值等于预先判断的向量(单正态总体检验)”或“需判断的两个总体的均值相等(双正态总体检验)”;2.在该假设下,构造适当的统计量并给出其分布;3.根据观测数据算出其统计量的值;4.根据预先确定的检验水平查阅相应的分布表确定临界值和拒绝域;5.根据结果判断接受或拒绝原假设,得出结论。

(具体见书【1】第三章)3.实验内容:一、单正态总体检验:人出汗多少与人体内钠、钾含量有一定关系。

今测20名健康成年女性出汗多少(X1)、钠含量(X2)、钾含量(X3),其数据如下表1:表1 健康成年女性出汗情况的基本数据序号X1 X2 X3 序号X1 X2 X31 3.7 48.5 9.3 11 3.9 36.9 12.72 5.7 65.1 8 12 4.5 58.8 12.33 3.8 47.2 10.9 13 3.5 27.8 9.84 3.2 53.2 12 14 4.5 40.2 8.45 3.1 55.5 9.7 15 1.5 13.5 10.16 4.6 36.1 7.9 16 8.5 56.4 7.17 2.4 24.8 14 17 4.5 71.6 8.28 7.2 33.1 7.6 18 6.5 52.8 10.99 6.7 47.4 8.5 19 4.1 44.1 11.210 5.4 54.1 11.3 20 5.5 40.9 9.4利用多元正态总体检验中的单正态均值向量检验方法判断“(X1,X2,X3)的均值是否等于(4,50,10)”【1】(假设总体服从正态分布,分别取检验水平为0.05、0.01)。

多元统计分析-第三章多元正态分布

多元统计分析-第三章多元正态分布

多元统计分析-第三章多元正态分布第三章多元正态分布多元正态分布是⼀元正态分布在多元情形下的直接推⼴,⼀元正态分布在统计学理论和应⽤⽅⾯有着⼗分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。

多元分析中的许多理论都是建⽴在多元正态分布基础上的,要学好多元统计分析,⾸先要熟悉多元正态分布及其性质。

第⼀节⼀元统计分析中的有关概念多元统计分析涉及到的都是随机向量或多个随机向量放在⼀起组成的随机矩阵,学习多元统计分析,⾸先要对随机向量和随机矩阵有所把握,为了学习的⽅便,先对⼀元统计分析中的有关概念和性质加以复习,并在此基础上推⼴给出多元统计分析中相应的概念和性质。

⼀、随机变量及概率分布函数(⼀)随机变量随机变量是随机事件的数量表现,可⽤X 、Y 等表⽰。

随机变量X 有两个特点:⼀是取值的随机性,即事先不能够确定X 取哪个数值;⼆是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。

(⼆)随机变量的概率分布函数随机变量X 的概率分布函数,简称为分布函数,其定义为:)()(x X P x F ≤=随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。

1、离散型随机变量的概率分布若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。

设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…,记为k k p x X P ==)(( ,2,1=k )称k k p x XP ==)(( ,2,1=k )为离散型随机变量X 的概率分布。

离散型随机变量的概率分布具有两个性质:(1)0≥k p , ,2,1=k(2)11=∑∞=k kp2、连续型随机变量的概率分布若随机变量X 的分布函数可以表⽰为dt t f x F x∞-=)()(对⼀切R x ∈都成⽴,则称X 为连续型随机变量,称)(x f 为X 的概率分布密度函数,简称为概率密度或密度函数。

R语言版应用多元统计分析多元正态总体的假设检验

R语言版应用多元统计分析多元正态总体的假设检验

应用多元统计分析第3章 多元正态总体的假设检验- 1-•在一元正态总体 中,关于参数 的假设检验涉及到一个总体和多个总体情况,推广到多元正态总体 ,关于参数 的假设检验问题也涉及一个总体和多个总体情况。

本章我们只讨论关于均值向量 的假设检验问题。

•在多元统计中,用于检验 的抽样分布有维希特(Wishart)分布、霍特林(Hotelling)分布和威尔克斯(Wilks)分布,它们都是由来自多元正态总体 的样本构成的统计量。

在第2章中,我们已经讨论了维希特分布的定义和性质,本章我们讨论后两个统计量的分布。

霍特林 分布在一元统计中,若 ,且 相互独立,则或等价地下面把 的分布推广到多元正态总体。

定义3.1 设 , ,其中 ,且 与 相互独立。

则称统计量 为 统计量,其分布称为自由度为n的霍特林 分布,记为分布的性质性质1 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,则性质2 分布与F分布的关系为:若 则分布的性质性质3 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,记则性质4 分布只与n,p有关,而与 无关。

威尔克斯 分布定义3.2 设 ,称协方差阵 的行列式 为的广义方差。

若 是来自总体 的随机样本,A为样本离差阵,则称或 为样本广义方差。

定义3.3设 ,这里 ,且 与 独立,则称广义方差比为 统计量,其分布称为威尔克斯 分布,记为 。

当p=1时, 分布正是一元统计中参数为 的贝塔分布,即。

分布的性质性质1当 时,若 ,则当 时,若 ,则当p=1时,当p=2时,若 ,则当 时有下列极限分布其中 。

下面是 分布的两个有用性质。

性质6 若 ,则存在 , 且 之间相互独立,使得性质7 若 则单总体均值向量的假设检验设总体为 , 为来自该总体的随机样本。

欲检验下列假设:其中 为已知常数向量。

1. 当 已知时均值向量的假设检验此时于是有若检验统计量取为则当原假设 成立时, 。

多元统计分析第三章课件

多元统计分析第三章课件

( X 0 ) t n S
2 n ( X ) 2 1 t2 n ( X ) ( S ) ( X ) 2 S 对于多元变量而言,可以将 t 分布推广为下面将要介绍的 2 Hotelling T 分布。
定义
设 X ~ N p (μ , Σ , ) S ~ Wp ( n, Σ 且 ) X 与S
2 -1
相互独立,n p , 则称统计量 T nX S X 的分布 为非中心 HotellingT2 分布,记为 T 2 ~ T 2 ( p, n, μ) 。 当 μ 0 时,称 T 服从(中心) Hotelling T 分布。
2 2
记为 T 2 ( p, n) 。 由于这一统计量的分布首先由 Harold Hotelling 提出 来的,故称为 Hotelling T 分布,值得指出的是,我 国著名统计学家许宝禄先生在 1938 年用不同方法也
n ai μ ai X T aiSai
n 1

当k很小时,联合T2置信区间 aix T aiSai n ai μ ai X T aiSai
n , i 1, 2,, k
的置信度一般会明显地大于1−α,因而上述区间会显得过宽, 即精确度明显偏低。这时,考虑采用庞弗伦尼(Bonferroni) 联合置信区间(p177):
第三章 多元正态总体的统计推断
§3.1 引言 §3.2 单个总体均值的推断
§3.3 单个总体均值分量间结构关系的检验
§3.4 两个总体均值的比较推断 §3.5 两个总体均值分量间结构关系的检验 §3.6 多个总体均值的比较检验(多元方差分析) §3.7 协方差阵的检验
§3.1 引言
在单一变量的统计分析中,已经给出了正态总体N ( , 2) 的均值和方差2的各种检验。对于多变量

多元统计分析:第三章 多元正态总体参数的假设检验(补充)

多元统计分析:第三章   多元正态总体参数的假设检验(补充)
18
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定理 若 X ~ N p (0, Σ ) , S ~ Wp (n, Σ ) 且 X 与 S 相互独 立,令T 2 nXS1X ,则
n p 1T 2 ~ F( p, n p 1) np
在我们后面所介绍的检验问题中,经常会用到这一性质。
幻灯片 9 二、均值向量的检验
设 X1,X2, ⋯ ,Xn 是取自总体 X~Np (μ, Σ)的一个样本,这里Σ>0,n>p,欲检验
(n 1) p 1T 2 ~ F ( p, n p) (n 1) p
在处理实际问题时,单一变量的检验和多变量检验可以联合使用,多元 的检验具有概括和全面考察的特点,而一元的检验容易发现各变量之间 的关系和差异,能给人们提供更多的统计分析信息。
幻灯片 13
例 1 对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量得样本数据如表
幻灯片 1 第三章 多元正态总体的统计推断 §3.1 引言 §3.2 单个总体均值的推断 §3.3 单个总体均值分量间结构关系的检验 §3.4 两个总体均值的比较推断 §3.5 两个总体均值分量间结构关系的检验 §3.6 多个总体均值的比较检验(多元方差分析) §3.7 协方差阵的检验 幻灯片 2 §3.1 引言
替 Σ ,因 (n 1)S1 是 Σ1 的无偏估计量,而样本离差阵
n
S (X(a) X)(X(a) X) ~ Wp (n 1, Σ) a 1
n(X μ0) ~ Np (0, Σ)
由定义知
T 2 (n 1)[ n(X μ0)S1 n(X μ0)] ~ T 2( p, n p) 再根据 Hotelling T 2 分布的性质,所以
H0:μ=μ0,H1:μ≠μ0
1.Σ已知
检验统计量为:
拒绝规则为:若
,则拒绝 H0
T02 n X μ0 Σ 1 X μ0
T p 2
2
0
幻灯片 10
这里要对统计量的选取做一些解释,为什么该统计量服从
2 ( p) 分布。根据二次型分布定理知道,若 X ~ N p (0, Σ ) , 则 X Σ 1X ~ 2 ( p) 。显然,
n p
pn 1
T
2
F
p, n
p
1
P
n
X μ S 1

T2
1
幻灯片 16 μ的置信度为 1−α的置信区域为
当 p=1 时,它是一个区间;当 p=2 时,它是一个椭圆,这时可将其在坐标平面上画出; 当 p=3 时,它是一个椭球;当 p>3 时,它是一个超椭球;它们均以 为中心。 同置信区间与假设检验的关系一样,置信区域与假设检验之间也有着同样的密切关系。一 般来说,μ0 包含在上述置信区域内,当且仅当原假设 H0:μ=μ0 在显著性水平α下被接 受。因此,可以通过构造的置信区域的方法来进行假设检验。
P
aX T aSa
n aμ aX T aSa
n
1
a
aX T aSa n aμ aX T aSa n
k
P
ai X T
aiSai
i1
幻灯片 18
当 k 很小时,联合 T2 置信区间
n aiμ ai X T aiSai
n
1
的置信度一般会明显地大于 1−α,因而上述区间会显得过宽,即精确度明显偏低。这时, 考虑采用庞弗伦尼(Bonferroni)联合置信区间(p177):
4.3107 14.6210 8.9464
S 1
23.138481
14.6210 8.9464
59.7900 37.3760
3357.5.3973660
T 2 n X μ0 S1 X μ0 6 70.0741 420.445
查表得 F0.01(3,3)=29.5,于是
它的置信度至少为 1−α。 若 tα/2k(n−1)≤Tα ,则邦弗伦尼区间比 T2 区间要窄,这时宜采用前者作为联合置信区 间;反之,若 tα/2k(n−1)>Tα,则邦弗伦尼区间比 T2 区间宽,宜采用后者作为联合置信 区间。 当 k=p 时,邦弗伦尼区间要比 T2 区间窄。故在求μ的所有 p 个分量μ1, μ2,⋯, μp 的联 合置信区间时,应采用邦弗伦尼区间。
幻灯片 14
78
60.6
16.5
76
58.1
12.5
92
63.2
14.5
81
59.0
14.0
81
60.8
15.5
84
59.5
14.0
82.0
8.0
31.600 8.040 0.500
X
60.2
,
X
μ0
2.2
,
S
8.040
3.172
1.310
14.5
1.5
0.500 1.310 1.900
96.1429 103.1429
S 1
0.0436 0.0406
μ的 0.90 置信区域为:
0.0406
0.0475
幻灯片 20

0.0436×(μ1−72.5)2−0.0812×(μ1−72.5)(μ2−79)
+0.0475×(μ2−79)2≤1.009
这是一个椭圆区域。μ1 和μ2 的 0.90 联合 T2 置信区间为
μ
:
n
X μ S1

T2
X 幻灯片 17
四、联合置信区间
即 以 1−α的概率对一切 a∈Rp 成立,称它为一切线性组合{a′μ,a∈Rp}的置信度为 1−
α的联合置信区间(simultaneous confidence intervals)。 对 k 个线性组合{ai′μ,i=1,2,⋯ ,k},有
故在显著性水平α=0.01 下,拒绝原假设 H0,即认为农村与城市的 2 周岁男婴上
述三个指标的均值有显著差异(p=0.002)。
T 2 0.01
35 3
F0.01
3, 3
147.5
幻灯片 15
三、置信区域
T 2 n X μ S1 X μ
n p
pn 1
T
2
~
F
p, n
p
P
称之为霍特林(Hotelling)T2 统计量。
当 H0 为真时,
服从 F(p,n−p) ,对给定的显著性水平α,拒绝规
则为:

,则拒绝 H0.
其中

T 2 n X μ0 S1 X μ0
n p
pn 1
T
2
T 2 T2
T2
pn 1
n p
F
p,
n
p
幻灯片 12
这里需要解释的是,当 Σ 未知时,自然想到要用样本协差阵 1 S 取代 n 1
T02 n( X μ0 )Σ 1( X μ0 ) n ( X μ0 )Σ 1 n ( X μ0 )Y Σ 1Y
其中,Y n(X μ0) ~ Np (0, ) ,因此, T02 n( X 0 )Σ 1( X μ0 ) ~ 2 ( p) 。
幻灯片 11
2. Σ未知 检验统计量为:
1 所示。根据以往资料该地区城市 2 岁男婴的这三个指标的均值μ0=(90,58,16)′,现欲在
多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。这是假设检验问题:
H0:μ=μ0,H1:μ≠μ0
表 1 某地区农村男婴的体格测量数据
编号
身高(cm)
胸围(cm)
上半臂围(cm)
1 2 3 4 5 6
72.5 2.3646 112.5714 / 8 1 72.5 2.3646 112.5714 / 8 79 2.3646 103.1429 / 8 2 79 2.3646 103.1429 / 8
幻灯片 22
B A 图 1 置信椭圆和联合置信区间 幻灯片 23 利用置信区域进行假设检验 在例 2 中,如果在 α=0.10 下对假设

61.84≤μ1≤83.16,
68.80≤μ2≤89.20
这两个区间分别正是椭圆在μ1 轴和μ2 轴上的投影。
8
72.5
1
,
792Biblioteka 0.0436 0.0406
0.0406 0.0475
72.5 1 79 2
8.073
72.5 2.841 112.5714 / 8 1 72.5 2.841 112.5714 / 8
N (0,1) 的上 / 2 分位点。
幻灯片 6
当 2 未知时,用
S 2
1 n 1
n i 1
(Xi
X )2
作为 2 的估计量,用统计量:
t (X 0) n S
来做检验。当假设成立时,统计量 t 服从自由度为 n 1的 t 分布,
从而否定域为| t | t /2 (n 1) ,t /2 (n 1) 为自由度为 n 1的 t 分布
aix T aiSai n aiμ ai X T aiSai n , i 1, 2, , k
aix t /2k n 1 aiSai n aiμ ai X t /2k n 1 aiSai n
i 1, 2, , k
幻灯片 19 例 2 为评估某职业培训中心的教学效果,随机抽取 8 名受训者,进行甲和乙两个项目的 测试,其数据列于表 2。假定 X=(X1,X2)′服从二元正态分布。
上的 / 2 分位点。
这里我们应该注意到,(3.3)式可以表示为
t2
n(X )2 S2
n( X
)(S 2 )1( X
)
对于多元变量而言,可以将 t 分布推广为下面将要介绍的
HotellingT 2 分布。
幻灯片 7
定义 设 X ~ N p (μ ,Σ ,) S ~ Wp (n ,Σ 且) X 与 S 相互独立,n p ,则称统计量T 2 nX S - X1 的分布 为非中心 HotellingT2 分布,记为T 2 ~ T 2 ( p, n, μ) 。 当 μ 0 时,称 T 2 服从(中心)Hotelling T 2 分布。 记为T 2 ( p, n) 。
相关文档
最新文档