应用多元统计分析课后习题答案详解北大高惠璇(第三章部分习题解答)

合集下载

多元统计分析课后练习答案

多元统计分析课后练习答案

多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。

当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

应用多元统计分析课后答案 .doc

应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

应用多元统计分析课后习题答案高惠璇部分习题解答(00004)市公开课金奖市赛课一等奖课件

应用多元统计分析课后习题答案高惠璇部分习题解答(00004)市公开课金奖市赛课一等奖课件
2( 2 )2
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量分子为
L(aˆ0
, ˆ 0 2
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
第5页
5
第四章 回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )
第18页 18
第四章 回归分析
第19页 19
第四章 回归分析
等号成立 C(ˆ ) 0 (CC)1C • C(ˆ ) 0 ˆ.
第20页 20
第四章 回归分析
第21页 21
第四章 回归分析
第22页 22
第四章 回归分析
见附录P394定理7.2(7.5)式
第23页 23
第四章 回归分析
证实:(1)预计向量为 Yˆ Cˆ C(CC)1CY HY

1 n
n i 1
yˆi
1 n
1n

1 n
1n
HY
1 n
(H1n )Y
1 n
1n
Y
y.
(因1n C张成的空间,这里有H1n 1n )
(2) 因 n ( yi y)( yˆi yˆ ) n ( yi yˆi yˆi y)( yˆi y)
0
ln
L
2
n
2
2
1
2( 2 )2
(Y

应用多元统计分析课后题答案

应用多元统计分析课后题答案


c) c)2
2( x1

a)( x2

c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)


2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)


Σ

故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

应用多元统计分析_课后答案

应用多元统计分析_课后答案

图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350

15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−

最新应用多元统计分析课后习题答案高惠璇PPT课件

最新应用多元统计分析课后习题答案高惠璇PPT课件
X2~N(0,1).
(2) 考虑随机变量Y= X1-X2 ,显然有
YX 1X2 0 X 1X 1,当 估计
P{Y0}P{X11或 X11} P{X11}P{X11} (X1~N(0,1)) 2(1)0.317 04
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
31
第三章 多元正态总体参数的检验
证明 记rk(A)=r.
若r=n,由AB=O,知B= On×n,于是 X′AX与X′BX
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
32
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
P{X1x}(x) 17
第二章 多元正态分布及参数的估计
当-1≤x≤1时,
P{X2 x}P{X2 1}P{1X2 x} P{X1 1}P{xX1 1} P{X1 1}P{1X1 x} P{X1 x}(x)
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面. (2) 当p=2且
比较上下式相应的系数,可得:
1
2 2
2
1 2

应用多元统计分析课后习题答案高惠璇习题解答PPT学习教案

应用多元统计分析课后习题答案高惠璇习题解答PPT学习教案

)
D(L1) pq
D(L)
(k p,q)
设第L+1步从类间距离矩阵D(L)
D(L) ij
出发,
第19页/共38页
20
第六章 聚类分析

D(L) rk
D ( L 1) pq
DL
(k p, q)
D(L) ij
D ( L 1) ij
DL
(i, j r, p, q)
故第L+1步的并类距离:
DL1 min(Di(jL) ) DL,
Dr2k
np nr
Dp2k
nq nr
Dq2k
npnq nr2
Dp2q
解一: 利用
X (r) 1 nr
np X ( p) nq X (q)
如果样品间的距离定义为欧氏距离,则有
Dr2k ( X (k ) X (r) )'( X (k ) X (r) )
n
p
nr
nq
X (k) np nr

di*j
cdij
cd ji
d
* ji
, 对一切i, j;Biblioteka 第2页/共38页3
第六章 聚类分析
③ di*j cdij c(dik dkj ) cdik cdkj
di*k
d
* kj
, 对一切i,
k,
j.
故d*=ad是一个距离.
(3) 设d为一个距离,c>0为常数,显然有


第3页/共38页
4
1)
p
q
1
2
1
2
11
故可变法具有单调性。
对于离差平方和法,因
0, p

(完整版)多元统计分析课后练习答案

(完整版)多元统计分析课后练习答案

第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。

当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3-3
(记
1 2

1 2
)
10
1
第三章 多元正态总体参数的检验
由“1.结论6”知ξ与η相互独立
1 2 1 2 1 2 1 2

CD O A B O AB O
11
第三章 多元正态总体参数的检验
3-4 试证明Wishart分布的性质(4)和T2分布的性质(5).
C [CAx C ]1 C ( X ) n(n 1)( X )
n(n 1)( X ) Ax 1 ( X ) Ty
16
第三章 多元正态总体参数的检验
对单个p维正态总体Np(μ,Σ)均值向量的检验问题, 试用似然比原理导出检验H0:μ=μ0(Σ=Σ0已知)的似然比 统计量及分布. P66当Σ=Σ 已知μ的检验
第三章 多元正态总体参数的检验
Ay (Y( i ) Y )(Y(i ) Y )
i 1 n i 1
Y CX d , n
记y C d
C[ ( X ( i ) X )( X (i ) X )]C CAx C
Ay 1 (Y y ) T n(n 1)(Y y ) 2 y
3-7 设总体X~Np(μ,Σ) (Σ>0), X(α) (α=1,…,n)(n>p)为来自p
1 0 , 0 1( p 1) p 则上面的假设等价于H0:Cμ=0p-1,H1:Cμ≠ 0p-1 0 0
1 C 1
试求检验H0 的似然比统计量和分布.
Ax 1 ( X ) T n(n 1)( X ) 2 ~ T ( p, n 1). 2 x

其中C是pp非退化常数矩阵,d是p1常向量。 则 Y ~ N (C d , CC) (i 1,2,...,n)
(i ) p
15
Y(i ) CX (i ) d (i 1,..., n)

12
第三章 多元正态总体参数的检验
证明: 设 1 1 X (()) r X (()) ~ N r (0, 11 ), X ( ) ( 2 ) X p r , 则 X ( 2 ) ~ N (0, ), ( ) p r 22 ( )
记 X xij X (1) | X (2) , 则 n p nr n( p r )
(n 1)n(CX r )CAC (CX r ).
1
A ( X (i ) X )( X (i ) X ).
i 1
n
22
第三章 多元正态总体参数的检验
维正态总体X的样本,样本均值为X,样本离差阵为A.记μ= (μ1,…,μp)′.为检验H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不 相等.令 1 1 0 0
1
当Σ12 =O 时,对α=1,2,…,n,
独立.故有W11与W22相互独立.
X 与X
(1) ( )
( 2) 相互 ( )
14
第三章 多元正态总体参数的检验
性质5 在非退化的线性变换下,T2统计量保持不 变. 证明:设X(α) (α=1,…,n) 是来自p元总体 Np(μ,Σ)的随机样本, X和Ax分别表示正态总体X 的样本均值向量和离差阵,则由性质1有
性质4 分块Wishart矩阵的分布:设X(α) ~ Np(0,Σ) (α =1,…,n)相互独立,其中
又已知随机矩阵
W11 W X ( ) X ( ) W21 1
n
11 12 r 21 22 p r W12 r p r ~ Wp (n, ) W22
3-5
(n>p)为来自p维正态总体X的样本.似然比统计量为
解:总体X~Np(μ ,Σ 0)(Σ 0>0),设X(α)(α =1,…,n)
0
max L( 0 , 0 ) max L( , 0 )
0
1 1 n 1 分子 exp ( X ( ) 0 )0 ( X ( ) 0 ) n/2 | 20 | 2 1
其中
T (n 1)n(CX )[CAC ] CX
2 1
~ T (n 1, p 1).(H 0下)
2
(注意:3-6中的k在这里为p-1)
24
第三章 多元正态总体参数的检验
3-8 假定人体尺寸有这样的一般规律:身高(X1),胸围
(X2)和上半臂围(X3)的平均尺寸比例是6∶4∶1.假设 X (α)(α=1,…,n)为来自总体X=(X1,X2,X3)′的随机样本.并 设X~N3(μ,Σ),试利用表3.5中男婴这一组数据检验三 个尺寸(变量)是否符合这一规律(写出假设H0,并导出检 验统计量). 解:检验三个尺寸(变量)是否符合这一规律的问题 可提成假设检验问题.因为
3
第三章 多元正态总体参数的检验
其中非中心参数为

4
第三章 多元正态总体参数的检验
3-2 设X~Nn(μ,σ2In), A,B为n阶对称阵. 若AB =0 ,证明X′AX与X′BX相互独立.

证明的思路:记rk(A)=r. 因A为n阶对称阵,存在正交阵Γ,使得 Γ ′AΓ=diag(λ1,…,λr 0,..,0) 令Y=Γ′X,则Y~Nn(Γ′μ,σ2In),
Yr 1 X BX Y Γ BΓΓ Y HY (Yr 1 ,, Yn ) H 22 Yn
i 1
r
由于Y1,…,Yr ,Yr+1 ,…,Yn相互独立,故 X′AX与X′BX相互独立.
9
第三章 多元正态总体参数的检验
设X~Np(μ,Σ),Σ>0,A和B为p阶对称阵, 试证明 (X-μ)′A(X-μ)与(X-μ)′B(X-μ)相互独立 ΣAΣBΣ=0p×p.

r
由AB=O可得DrH11=O , DrH12=O . 因Dr为满秩阵,故有H11=Or×r,H12=Or×(n-r) . 由于H为对称阵,所以H21=O(n-r)×r .于是
8
第三章 多元正态总体参数的检验
H Γ BΓ
令Y=Γ′X,则Y~ Nn(Γ′μ,σ2In), 且
AX ( ΓY ) AΓΓ Y Γ AΓΓ iYi 2 X
应用多元统计分析
第三章习题解答
第三章
多元正态总体参数的假设检验
3-1 设X~Nn(μ,σ2In), A为对称幂等 阵,且rk(A)=r(r≤n),证明
证明 因A为对称幂等阵,而对称幂等阵的
特征值非0即1,且只有r个非0特征值,即存在正 交阵Γ(其列向量ri为相应特征向量),使
2
第三章 多元正态总体参数的检验

1 1 1 exp tr[0 A ] n/2 | 20 | 2
18
第三章 多元正态总体参数的检验
max L( 0 , 0 ) max L( , 0 )
1 1 1 1 exptr[ 0 A] tr[ 0 ( A n( X 0 )( X 0 )] 2 2 n 1 exp tr[( X 0 )0 ( X 0 )] 2 n 1 exp ( X 0 )0 ( X 0 ) 2
因 X ~ N ( , 1 ), p 0 0 n
H 0下
n ( X 0 ) ~ N p (0, 0 )
H 0下
所以由§3“一﹑2.的结论1”可知
2 ln ~ ( p).
2
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
X~Np(μ ,Σ )(Σ >0),X(α)(α =1,…,n)(n>p)为 来自p维正态总体X的样本,记μ =(μ 1,…,μ p)′.C 为k×p常数(k<p),rank(C)=k,r为已知k维向量.试给出 检验H0:Cμ =r的检验统计量及分布.
解: H 0 : 1 2 p , H1 : 1 , 2 ,, p 至少有一对不相等.
23
第三章 多元正态总体参数的检验
H 0 : C 0, H1 : C 0,
利用3-6的结果知,检验H0的似然比统计量及分 布为: H 下
n ( p 1) 2 0 F T ~ F ( p 1, n p 1), (n 1)( p 1)
X (1) X (1) W X X X (2) X (1) X (1) X (2) W11 W12 W W , X (2) X (2) 21 22

W11 X (1) X (1), W22 X (2) X (2)
13
第三章 多元正态总体参数的检验
19
1 1 1 1 exptr[ 0 A] tr[ 0 A0 ] 2 2
0

第三章 多元正态总体参数的检验
n 01 ( X 0 ) ln ( X 0 ) 2
2 ln n( X 0 )01 ( X 0 ) def
X AX ( ΓY ) AΓΓ Y Γ AΓΓ iYi 2 且
i 1
5
r
第三章 多元正态总体参数的检验
又因为 X′BX=Y′Γ′BΓ Y= Y′HY 其中H=Γ′BΓ 。如果能够证明X′BX 可表示为Yr+1,…,Yn的函数,即H只是右 下子块为非0的矩阵。 则X′AX 与X′BX相互独立。
n 1 1 1 exp tr[0 ( X ( ) 0 )( X ( ) 0 )] n/2 | 20 | 1 2
17
第三章 多元正态总体参数的检验
相关文档
最新文档