应用多元统计分析课后习题答案详解北大高惠璇(第八章习题解答)

应用多元统计分析课后习题答案高惠璇共174页文档

(2)证明(X1 , X2 ) 不是二元正态分布.
证明(1):任给x,当x≤-1时
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章多元正态分布及参数的估计
2-17 设X～Np(μ ,Σ ),Σ ＞0,X的密度函数记为 f(x;μ ,Σ ).(1)任给a＞0,试证明概率密度等高面
5
第二章多元正态分布及参数的估计
2-3 设X(1)和X(2) 均为p维随机向量,已知
XX X((1 2))~N2p ((1 2)), 1 2 1 2,
其中μ(i) (i＝1，2)为p维向量,Σi (i＝1，2)为p阶矩阵，
(1) 试证明X(1) +X(2)和X(1) -X(2) 相互独立. (2) 试求X(1) +X(2) 和X(1) -X(2) 的分布.
故X1 +X2 和X1 - X2相互独立.
3
第二章多元正态分布及参数的估计
或者记
Y Y Y 1 2 X X 1 1 X X2 2 1 1 1 1 X X 1 2 CX
则 Y ~ N 2 (C ,C C )
e e dx 2
2
2 1e 2 1 e dx 1 2(x1 28x1 1)6
1 2(x2x17)2 2

1(
1 e2
x14)2
2
X1~N(4,1).
类似地有

应用多元统计分析答案详解汇总_高惠璇[1]

1 2 ( 2 x1 22 x1 65 ) 2
e
1 2 ( x2 2 x1 x2 14 x2 ) 2
dx2
1 e 2
1 2 ( 2 x1 22 x1 65 ) 2

e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
比较上下式相应的系数,可得:
1 2 1 12 2 2 2 12 1 1 2 1 2 2 2 22 1 2 1 2 2 2 2 2 1 2 1 2 1 14 2 2 2 2 2 1 2 1 2 1 2 1 2
x1 y2 (2)第二次配方.由于 x2 y1 y2
14
第二章
2 1 2 2 2 1 2 1 2 2
多元正态分布及参数的估计
2 x x 2 x1 x2 22 x1 14 x2 65 y y 22 y2 14( y1 y2 ) 65 y 14 y1 49 y 8 y2 16 ( y1 7) ( y2 4)
由定理2.3.1可知X1 +X2 和X1 - X2相互独立.
4
第二章
(2) 因
多元正态分布及参数的估计
1 2 2 2(1 ) 0 X1 X 2 ~ N2 , Y 2(1 ) 0 X1 X 2 1 2
O 2(1 2 ) O 2(1 2 )
由定理2.3.1可知X(1) +X(2)和X(1) -X(2) 相互独立.
7
第二章
(2) 因
(1) (2)

应用多元统计分析课后答案

第二章2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数，而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布，其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布，写出其联合分布。

解：设12()X X '的均值向量为()12μμ'=μ，协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭，则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤，2c x d ≤≤。

求（1）随机变量1X 和2X 的边缘密度函数、均值和方差；（2）随机变量1X 和2X 的协方差和相关系数；（3）判断1X 和2X 是否相互独立。

（1）解：随机变量1X 和2X 的边缘密度函数、均值和方差；112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd cc d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布，则均值为2b a +，方差为()212b a -。

应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数，而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布，其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布，写出其联合分布。

解：设12()X X '的均值向量为()12μμ'=μ，协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭，则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤，2c x d ≤≤。

求（1）随机变量1X 和2X 的边缘密度函数、均值和方差；（2）随机变量1X 和2X 的协方差和相关系数；（3）判断1X 和2X 是否相互独立。

（1）解：随机变量1X 和2X 的边缘密度函数、均值和方差；112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布，则均值为2b a+，方差为()212b a -。

北大多元统计分析答案

第二章多元正态分布及参数的估计2-1 解：利用性质2, 得二维随机向量Y~N 2(μy ,∑y )，其中：3112121312211,().y y A d A I A AA μμ∑⎛⎫⎛⎫⎛⎫=+=+= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭-⎛⎫''=== ⎪-⎝⎭2-2 (1)证明：记Y 1＝ X 1 +X 2 ＝(1,1) X , Y 2＝ X 1－X 2＝ (1,﹣1) X ，利用性质2可知Y 1 , Y 2 为正态随机变量. 又()()212111111011Cov(,)Y Y ∑σρρ⎛⎫⎛⎫==++= ⎪ ⎪--⎝⎭⎝⎭故X 1 +X 2和X 1－X 2相互独立.另证：记112121221111Y X X X Y CX Y X X X +⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎝⎭，则2~(,),Y N C C C μ∑'因222111111111111112101111021()()Y ΣC C ρ∑σρρρρσσρρρ⎛⎫⎛⎫⎛⎫'== ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭+++⎛⎫⎛⎫⎛⎫== ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭故由定理2.3.1可得X 1 +X 2和X 1－X 2相互独立.（2）解：因为1212221212210021()~,()X X Y N X X μμρσμμρ⎛⎫+++⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭ 所以22121212122121~(,()),~(,()).X X N X X N μμσρμμσρ+++---2-3 (1)证明：令121122()()()()()()pp pp I I X X X Y CX I I X X X ⎛⎫⎛⎫⎛⎫+=== ⎪ ⎪ ⎪⎪--⎝⎭⎝⎭⎝⎭，则2~(,)p Y N C C C μ∑'. 因为1221121212211212D()22D()()()pp pp p p pp pp pp I I I I Y C X C I I I I I I I I O O ∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑⎛⎫⎛⎫⎛⎫'==⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎛⎫++⎛⎫= ⎪⎪ ⎪---⎝⎭⎝⎭+⎛⎫= ⎪-⎝⎭由定理2.3.1可知X (1) +X (2)和X (1) -X (2) 相互独立. （2）解：因为121212212121222()()()()()()()()()~,()p O X X Y N O X X ∑∑μμ∑∑μμ⎛⎫+⎛⎫⎛⎫⎛⎫++= ⎪ ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭，所以12121212121222()()()()()()()()~(,()),~(,()).p p X X N X X N μμ∑∑μμ∑∑+++---2-6 解：（1）记B =(3,-1,1), 由性质2得，~(,')Y BX N B B B μ=∑.123121113(3,2,1)313,'(3,2,1)132291122132(13,9).B B B Y X X X N μ⎛⎫⎛⎫⎛⎫⎪ ⎪⎪=--=∑=--= ⎪ ⎪⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭∴=-+ (2)令1132'X Y X a X ⎡⎤=-⎢⎥⎣⎦, 显然31,X Y 均服从正态分布, 故要使它们相互独立，只需()31,0COV X Y =即可. 又因()313311223313123212,(,)(,)(,)(,)22COV X Y COV X X a X a X COV X X a COV X X a COV X X a a =--=--=-- ∴1222a a +=，故当(1,0.5)a =时满足条件. 2-9 解：(1)1/1/1/1/1/1/1/1/1/21/2001/41/21/61/ '1/61/62/601/402/61/1/1/1/3/1/003/1000010000100001AA⎡⎤⎡⎤⎢⎥⎢⎥--⎢⎥⎢⎥=⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎢--⎣⎣⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦∴A是正交矩阵.(2)①由Y=AX知，11/1/1/1/2Y X X⎡==⎣，且()442211'()'()'''i ii iY Y Y AX AX X AA X X X X=======∑∑，所以()444222221211444222221114214842()4.i i ii i ii i ii i iiiY X Y X XX X X X X X XX X========-=-=-+=-+=-∑∑∑∑∑∑∑②由2444(,)X N Iμσ1，Y=AX知：2444(,')Y N A AI Aμσ1.而22244''AI A AA Iσσσ==，故由定理2.3.1的推论2知1234,,,Y Y Y Y相互独立.③由②知1234,,,Y Y Y Y均服从正态分布，且方差均为2σ，又41/1/1/1/121/1/0010101/1/2/0101/1/1/3/Aμμμ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎣⎦⎣⎦-⎣1所以221~(2,),~(0,)(2,3,4).iY N Y N iμσσ=2-11解：设221212121211(,)exp(22221465)22f x x x x x x x xπ⎧⎫=-++--+⎨⎬⎩⎭2222211121122122222121[()2()()()]2(1)x x x xσμσσρμμσμσσρ⎧⎫=-----+-⎨⎬-⎩⎭比较上下式相应的系数,可得:1222112212122221121222212211212121122222214265σσσσρσσμσρσσμμσρσσμμσμσρσσμμ⎧=⎪=⎪⎪=⎪-=⎨⎪-+=-⎪⎪-+=-⎪+-=⎩解得：121211/43σσρμμ=⎧⎪=⎪⎪⎨=-⎪=⎪⎪=⎩，所以2111222122411,312μσρσσμμρσσσ-⎛⎫⎛⎫⎛⎫⎛⎫==∑==⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭. 2-13解：(1)[]()()'(')'(')'ΣE X EX X EX E XX EXEX E XXμμ=--=-=-(')'.E XXΣμμ∴=+(2)()()()(')tr'tr'tr'E X AX E X AX E AXX E AXX===⎡⎤⎡⎤⎣⎦⎣⎦()()tr'tr'tr()tr(')tr()tr(')tr()'.AE XX AΣAΣAΣA AΣA Aμμμμμμμμ==+=+⎡⎤⎡⎤⎣⎦⎣⎦=+=+(3)∵22'2'1tr()=tr()()=trp p p p p p pΣA I I Ip pσσσ⎛⎫⎡⎤--⎪⎢⎥⎣⎦⎝⎭1111()()()2222'2'22 tr tr tr tr(1) p p p p p pI I p p pp p pσσσσσσσ⎛⎫=-=-=-=-⎪⎝⎭1111，又'2'''11'()'()()()p p p p p p p p p p pA a I a ap pμμ=-=-11111111112''=()=0p p p ppap-1111，∴2(')()'(1)E X AX tr ΣA A p μμσ=+=-.2-18解：(1)()()1111()()().n n n ni i i i i i i i i i E Z E c X c EX c c μμμ=========∑∑∑∑(2)∵Z 为p 维正态随机向量的线性组合，故Z 也为正态随机向量，又 22()()111()()()'nnni i i i i i i i D Z D c X c DX c Σc c Σ=======∑∑∑，结合(1)知 ~(,')p Z N c c Σμ(3)∵22221212()1n nc c c c c c nn++++++≥=，且Σ为非负定矩阵 ∴对任意p 维向量0x ≠，有2111111''()'()'''''0,n n n i i x c c Σ-Σx x c c Σ-Σx c c -x Σx c -x Σx n n n n n =⎛⎫⎛⎫⎛⎫⎛⎫===≥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭∑11即1n c n=1 时，Z 的协方差阵在非负定意义下达到极小.第三章多元正态总体参数的假设检验3-1解：因为A 对称幂等阵，而对称幂等阵的特征值非0即1，且只有r 个非0特征值，即存在正交阵Γ（其列向量i r 为相应特征向量），使⎥⎦⎤⎢⎣⎡=ΓΓ'000t I A ，记),,(1n r r =Γ，令X Y Y Y n Γ'=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡= 1（即Y X Γ=），则),(),(~22n nn n I N I N Y σμσμΓ'=ΓΓ'Γ'， ∑==⎥⎦⎤⎢⎣⎡'=ΓΓ'''ti it YY I Y Y A Y AX X 122222100011~1σσσσ，因为),,2,1)(,(~2r i r N Y i i ='σμ，且相互独立，所以∑=='=ti ir X YAX X 12222),(~11δσσξ，其中非中心参数为121112221111()[)][,,]tt i t t t i t r r rr rr r r r δμμμμμσσσ='⎡⎤⎢⎥''''==++=⎢⎥'⎢⎥⎣⎦∑（μμσμμσA I t '=Γ'⎥⎦⎤⎢⎣⎡Γ'=22100013-2解：记()rank A r =.① 若n r =，由O AB =，知n n O B ⨯=，于是AX X '与BX X '相互独立； ② 若0=r 时，则0=A ，则两个二次型也是独立的. ③以下设0r n <<.因A 为n 阶对称阵，存在正交阵Γ，使得100',000rr r D ΓA Γ=D λλ⎡⎤⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦其中0λ≠为A 的特征值1(,,)i r =.于是,r r D D A=ΓΓ'AB ΓΓ'B ΓΓ'⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦000000，令11122122,nnH H H =Γ'B ΓH H ⨯⎡⎤⎢⎥⎣⎦其中11H 为r 阶方阵, 由于111211122122rr r H H D D H D H AB =ΓΓ'ΓΓ'H H ⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦000000，故11120,0r r D H D H ==. 又因r D 为满秩阵，故有1112()0,0r r r n r H H ⨯⨯-==. 由于H 为对称阵，所以21()0n r r H -⨯=.于是 2200,0H =Γ'B ΓH ⎡⎤=⎢⎥⎣⎦ 令H X Γ'=，则2~(,)n n Y N I μσΓ'，且21'()rr i i i D X AX Y A Y Y A Y Y Y Y ξλ=⎡⎤'''''==ΓΓ=ΓΓ==⎢⎥⎣⎦∑000， 112222000ηΓΓΓ(,,)r r n n Y X BX Y B Y Y Y Y H H Y ++⎡⎤⎡⎤⎢⎥''''====⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦，由于11,,,,,r r n Y Y Y Y +相互独立，故AX X '与BX X '相互独立..3-11解：这是两总体均值向量的检验问题. 检验统计量取为(p =3,n =6,m =9):021~(,1)(2)H n m p F T F p n m p n m p+--=+--+-下其中2112(2)()()()nmT n m X Y A A X Y n m-'=+--+-+故检验统计量为1121()()()n m p nmF X Y A A X Y p n m-+--'=⨯-+-+用观测数据代入计算可得: 25.3117,1.4982,T F == 显著性概率值 0.26930.05p α=>= 故H 0相容.第五章判别分析5-1 解：由题意，其错判概率为1111211P μμμμΦΦσσ()*()*(|)[()]()--=-+ 12121121212112111μσμσμσμσμμσσσσΦΦσσ()()[()]()（）（）（）（）-+---+=-+(1)(2)(2)(1)2112[1()]()μμμμσσσσ--=-Φ+Φ-+),()(21)1()2(12)1()2(σσμμσσμμ+-Φ+--Φ= )]()(1[1)2|1(1)1(*1)1(*σμμσμμ-Φ+-Φ--=P)()(2)2(2112212)2(121221σμσσσμσμσμσσσμσμ-++Φ----Φ=）（）（）（）（ )()(21)2()1(12)2()1(σσμμσσμμ+-Φ---Φ= )](1[)(121)1()2(12)1()2(\σσμμσσμμ+-Φ----Φ-= ).()(12)1()2(21)1()2(σσμμσσμμ--Φ-+-Φ= 5-2 解：由题意（1）样品x 与三个总体21,G G 和3G 的马氏距离分别为 ,15.0)25.2()()(22212121=-=-=σμx x d ,5625.12)05.2()()(22222222=-=-=σμx x d,25.01)35.2()()(22232323=-=-=σμx x d 显然，{})()(),(),(min 23232221x d x d x d x d =，则3G x ∈，即样品5.2=x 应判归总体3G .（2）样品x 与三个总体21,G G 和3G 的贝叶斯距离分别为 ,3863.0)3863.1(1)ln()()(212121-=-+=+=σx d x D ,9488.24ln 5625.1)ln()()(222222=+=+=σx d x D ,25.01ln 25.0)ln()()(232323=+=+=σx d x D显然，{})()(),(),(min 21232221x D x D x D x D =，则1G x ∈，即样品5.2=x 应判归总体1G .5-4解：(1)可取121812207385123275537A -⎛⎫⎛⎫⎛⎫=∑+∑=+= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭(组内)()(1)(2)(1)(2)1020100100()()10,101525100100B μμμμ-⎛⎫⎛⎫'=--=--= ⎪ ⎪-⎝⎭⎝⎭(组间) 类似于例5.3.1的解法, A -1B 的特征根就等于2(1)(2)1(1)(2)3751016500()()(10,10) 4.70675381013811381d A μμμμ---⎛⎫⎛⎫'=--=--== ⎪⎪--⎝⎭⎝⎭取1(1)(2)321()33a A d μμ-⎛⎫=-= ⎪⎝⎭，则1a Aa '=，且a 满足：2().Ba Aa d λλ==判别效率：() 4.7067a Baa a Aaλ'∆==='， Fisher 线性判别函数为：12()33)u X a X X X '==+ 判别准则为*1*2()()X G u X u X G u X u⎧∈>⎨∈≤⎩判当判当，阈值为(1)(2)*21124.2964u u u σσσσ+==-+，其中 ()21118123217862432,330.87591232338976589765a a σ⎛⎫⎛⎫'=∑=== ⎪⎪⎝⎭⎝⎭ ()2222073211114132,330.124175338976589765a a σ-⎛⎫⎛⎫'=∑=== ⎪⎪-⎝⎭⎝⎭(1)(1)10 2.720215ua μ⎛⎫'====- ⎪⎝⎭(2)(2)20 4.889725ua μ⎛⎫'====- ⎪⎝⎭故(1)(2)uu >.当(1)2020X ⎛⎫= ⎪⎝⎭时，(1)20() 4.339020u X ⎛⎫==- ⎪⎝⎭ 因*(1)() 4.3390u X u =-<，∴判(1)2X G ∈. 当(1)1520X ⎛⎫= ⎪⎝⎭时，(2)15() 3.805020u X ⎛⎫==- ⎪⎝⎭因*(2)() 3.8050u X u =->，∴判(2)1.X G ∈ (2) )(10)(75)1|2()()2|1()()()()()1(1)1(2)1(11)1(22)1(2)1(1)1(X f X f L X f q L X f q X h X h X W ===(2)'1(2)(1)'1(1)(1)2(1)(1)2(1)1511exp{()()()()}222X X X X μμμμ--=--∑-+-∑- )25202020(32121218)25202020(21exp{5.71'⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡-=- ,19229.75)}15102020(32121218)15102020(211'>=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡+- )(10)(75)1|2()()2|1()()()()()2(1)2(2)2(11)2(22)2(2)2(1)2(X f X f L X f q L X f q X h X h X W ===(2)'1(2)(1)'1(1)(2)2(2)(2)2(2)1511e x p {()()()()}222X X X X μμμμ--=--∑-+-∑- )25202015(32121218)25202015(21exp{5.71'⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡-=- ,15.7)}15102015(32121218)15102015(211'>=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡+- 故,2)1(G X ∈ )2()2(G X ∈.(3)122'1112010181220101812()()ln ||()()ln 2015123220151232D x d x Σ-⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤=+=--+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦122'22220202072020207()()ln ||()()ln 202575202575D x d x Σ---⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤=+=--+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦212212exp(0.5())(1|)0.7306exp(0.5())exp(0.5())D x P x D x D x -==-+-, 222212exp(0.5())(2|)0.2694exp(0.5())exp(0.5())D x P x D x D x -==-+-. 5-5 解：2()()()()a d a d a d a a Sa a Sa ''''∆==''(1)(2)(1)(2)def 1()()a X X X X a a Baa Sa a Saλ'''--==≤''111,S B a λλ-=其中为的最大特征值且仅当对应的特征向量时等号成立. 又1(1)(2)(1)(2)12(1)(2)1(1)(2)()()()()S B X X X X S D X X S X X ---''=--=--,与有相同的特征值. 故21D λ=；以下验证a 就是D 2对应的一个特征向量：11(1)(2)(1)(2)1(1)(2)1(1)(2)22()()()().S Ba S X X X X S X X S X X D D a ----'=---=-∙=1(1)(2)2(),().a S X X a D -=-∆=故当取时比值达最大值5-6 解：记(1)(2)(),()()W X X a μμμ'-=-是X 的线性函数，21111,()~(,),X G W X N νσ∈当时且(1)(1)(2)1(1)(2)122(1)(2)1(1)(2)1(())()()()21[()()]2E W X a d d νμμμμμμμμμμ--''==-=-∑-'==-∑-其中21(1)(2)11(1)(2)2(())[()]()()()D W X D a X a D X a a ad σμμμμμμ--'''==-=-=∑'=-∑∑∑-=11111()0(2|1){()0|}{}W X P P W X X G P ννσσ--∴=≤∈=≤2111{/}()1().222P U d d d d =≤-=Φ-=-Φ其中11()~(0,1).W X U N νσ-=2(2)2222122221,()~(,),(),2X G W X N a d d νσνμμσ'∈=-=-=当时且222222()0(1|2){()0|}{}11{/}1().22W X P P W X X G P P U d d d ννσσ--∴=>∈=>=>=-Φ其中22()~(0,1).W X U N νσ-=第六章聚类分析6-2证明：设变量X i 和X j 是二值变量，它们的n 次观测值记为x ti , x tj (t =1,…,n ). x ti , x tj 的值为0 or 1.由二值变量的列联表（表6.5）可知：变量X i 取值1的观测次数为a +b,取值0的观测次数为c +d ;变量X i 和X j 取值均为1的观测次数为a,取值均为0的观测次数为d .利用两定量变量相关系数的公式：()()ntii tj j ij xx x x r --=∑又11()()11[()()][()()()]n nti i tj j ti tj i j t t a b a cx x x x x x nx x a n n n an a b a c a a b c d a b a c n nad bc n==++--=-=-=-++=+++-++-=∑∑222211()()1[()]()()n nti i ti i t t a b x x x nx a b n n a b n a b a b c d n n==+⎛⎫-=-=+- ⎪⎝⎭+=-+=++∑∑222211()()1[()]()()nntj j tj j t t a c x x x nx a c n n a c n a c a c b d n n==+⎛⎫-=-=+- ⎪⎝⎭+=-+=++∑∑故二值变量的相关系数为：()()(7)ntii tj j ij xx x x C --==∑利用两定量变量夹角余弦的公式：cos nti tjij x xα=∑其中1,nti tj t x x a ==∑2211,n ntitj t t x a b x a c ===+=+∑∑故有(9)c o s )i j i jc α==. 6-3解：用最长距离法:① 合并{X (1),X (4)}=CL4,并类距离 D 1=1.(2)(3)(2)(5)0903********X XD X CL ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭② 合并{X (2),X (5)}=CL3,并类距离 D 2=3.③ 合并{CL3,CL4}=CL2,并类距离 D 3=8. ④ 所有样品合并为一类CL1,并类距离 D 4=10. 最长距离法的谱系聚类图如下:用类平均聚类法：① 合并{X (1),X (4)}=CL4,并类距离 D 1=1.② 合并{X (2),X (5)}=CL3,并类距离 D 2=3.③ 合并{CL3,CL4}=CL2,并类距离 D 3=(165/4)1/2. ④ 所有样品合并为一类CL1,并类距离 D 4=(121/2)1/2. 类平均法的谱系聚类图如下:(3)(3)010049803X D CL CL ⎛⎫ ⎪= ⎪⎪⎝⎭(3)(4)01002X DCL ⎛⎫= ⎪⎝⎭(2)2(3)(2)22(5)0903506513610004222X X D X CL ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭(3)(3)01362041062165403X D CL CL ⎛⎫ ⎪= ⎪⎪⎝⎭(3)(4)0121202X D CL ⎛⎫= ⎪⎝⎭6-6解：按中间距离法, 取β=-1/4,将B 和C 合并为一类后,并类距离D 1=1,而A 与新类G r ={B,C}的类间平方距离为222211()0.5(1.1 1.1)0.251 1.10.250.8524Ar AB AC BC D D D D =+-=⨯+-⨯=-=当把A 与{B ，C}并为一类时，并类距离210.9221D D ==<= 故中间距离法不具有单调性。

多元应用统计第八章答案

多元应用统计第八章答案1、对某高中一年级男生38人进行体力测试（共7项指标）及运动能力测试（共5项指标），试对两组指标做典型相关分析。

体力测试指标：x1-反复横向跳（次），x 2-纵跳（cm），x 3-臂力（kg），x 4-握力（kg），x 5-台阶试验（指数），x 6-立定体前屈（cm），x 7-俯卧上体后仰（cm）。

运动能力测试指标: x8-50米跑（秒），x 9-跳远（cm），x 10-投球（m），x11-引体向上（次），x12-耐力跑（秒）。

矩阵Run MATRIX procedure:一、两组变量间的相关系数Correlations for Set-1X1 X2 X3 X4 X5 X6 X7X1 1.0000 .2701 .1643 -.0286 .2463 .0722 -.1664X2 .2701 1.0000 .2694 .0406 -.0670 .3463 .2709X3 .1643 .2694 1.0000 .3190 -.2427 .1931 -.0176X4 -.0286 .0406 .3190 1.0000 -.0370 .0524 .2035X5 .2463 -.0670 -.2427 -.0370 1.0000 .0517 .3231X6 .0722 .3463 .1931 .0524 .0517 1.0000 .2813X7 -.1664 .2709 -.0176 .2035 .3231 .2813 1.0000Correlations for Set-2X8 X9 X10 X11 X12X8 1.0000 -.4429 -.2647 -.4629 .0777X9 -.4429 1.0000 .4989 .6067 -.4744X10 -.2647 .4989 1.0000 .3562 -.5285X11 -.4629 .6067 .3562 1.0000 -.4369X12 .0777 -.4744 -.5285 -.4369 1.0000Correlations Between Set-1 and Set-2X8 X9 X10 X11 X12X1 -.4005 .3609 .4116 .2797 -.4709X2 -.3900 .5584 .3977 .4511 -.0488X3 -.3026 .5590 .5538 .3215 -.4802X4 -.2834 .2711 -.0414 .2470 -.1007X5 -.4295 -.1843 -.0116 .1415 -.0132X6 -.0800 .2596 .3310 .2359 -.2939X7 -.2568 .1501 .0388 .0841 .1923首先给出的是Correlations for Set-1、Correlations for Set-2为两组变量的内部各自相关矩阵。

应用多元统计分析课后题答案

c) c)2
2( x1

a)( x2

c)]
其中 a x1 b ， c x2 d 。求（1）随机变量 X1 和 X 2 的边缘密度函数、均值和方差；（2）随机变量 X1 和 X 2 的协方差和相关系数；（3）判断 X1 和 X 2 是否相互独立。
（1）解：随机变量 X1 和 X 2 的边缘密度函数、均值和方差；
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)

。
2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)

Σ
。
故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本，试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

应用多元统计分析课后答案

应用多元统计分析课后答案第二章2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数，而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布，其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布，写出其联合分布。

解：设12()X X '的均值向量为()12μμ'=μ，协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭，则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤，2c x d ≤≤。

求（1）随机变量1X 和2X 的边缘密度函数、均值和方差；（2）随机变量1X 和2X 的协方差和相关系数；（3）判断1X 和2X 是否相互独立。

（1）解：随机变量1X 和2X 的边缘密度函数、均值和方差；112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布，则均值为2b a +，方差为()212b a -。