应用多元统计分析试题及答案.doc

合集下载

多元统计分析期末试题及答案

多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析课后答案_暴强整理

应用多元统计分析课后答案_暴强整理

第二章2.1 试述多元联合分布和边缘分布之间的关系。

设X =(X 1,X 2,⋯X p )′是p 维随机向量,称由它的q (<p )个分量组成的子向量X(i)=(X i1,X i2,⋯X iq )′的分布为X 的边缘分布,相对地把X 的分布称为联合分布。

当X 的分布函数为F (x 1,x 2,⋯x p )时,X (1)的分布函数即边缘分布函数为F (x 1,x 2,⋯x p )=P(X 1≤x 1,⋯X q ≤x q ,X q+1≤∞,⋯X p ≤∞) = F (x 1,x 2,⋯x q ,∞,⋯∞)当X 有分布密度f (x 1,x 2,⋯x p )则X (1)也有分布密度,即边缘密度函数为:f (x 1,x 2,⋯x q )=∫⋯+∞−∞∫f (x 1,x 2,⋯x p )dx q+1⋯d +∞−∞x p 2.2 设随机向量X =(X 1,X 2)′服从二元正态分布,写出其联合分布密度函数和X 1,X 2各自的边缘密度函数。

联合分布密度函数12πσ1σ2(1−ρ2)1/2exp{−12(1−ρ2)[(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+f (x 1,x 2)=(x 2−μ2)2σ22]} , x 1>0,x 2>00 , 其他(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22=(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22+ρ2(x 1−μ1)2σ12−ρ2(x 1−μ1)2σ12=[ρ(x 1−μ1)σ1−(x 2−μ2)σ2]2+(1−ρ2)(x 1−μ1)2σ12所以指数部分变为−12{[11√1−ρ2σ1−22√1−ρ2σ2]2+(x 1−μ1)2σ12}令t=22√1−ρ2σ2−11√1−ρ2σ1 ∴dt =√1−ρ2σ22∴f (x 1)=∫f (x 1,x 2)+∞−∞dx 2=12πσ1σ2(1−ρ2)1/2exp{−(x 1−μ1)22σ12∫exp(+∞−∞−12t 2√1−ρ22dt =√2πσexp[−(x 1−μ1)22σ12] √2πσexp[−(x 1−μ1)22σ12] , x 1>0f (x 1)=0 ,其他 同理, √2πσ2exp[−(x 2−μ2)22σ22] , x 2>0f (x 2)=0 ,其他2.3 已知随机向量X =(X 1,X 2)′的联合分布密度函数为f (x 1,x 2)=2[(d−c )(x 1−a )+(b−a )(x 2−c )−2(x 1−a)(x 2−c)(b−a)2(d−c)2,其中,a ≤x 1≤b,c ≤x 2≤d 。

厦门大学《应用多元统计分析》试题A答案

厦门大学《应用多元统计分析》试题A答案
多元统计分析 试卷A(答案)
一、判断题 1. 正确
( ) 证明: ∀c = c1, c2 ,"cp ,
∑∑ c′∑c =
cic jσ ij
ji
= ∑∑cic j [E(Xi − E(Xi ))(Xj − E(Xj ))]
ji
= E⎢⎡∑c j (Xi − E(Xi ))∑ci (Xj − (E Xj ))⎥⎤
=
(n
−1)[
(n −1) p
n(X − μ0 )′S−1
n(X − μ0 )]
八、
( ) ( ) 在典型相关分析中 X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p


X
(2)
=
X 1(2 ) ,
X
(2
2
)
"
X
(2
q
)


两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使
计算共因子的方差贡献得:
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795;
g 32
=
0.3572 ,分别为公共因子
F1, F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
三、解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
−00.7.6439749⎟⎟⎞⎜⎜⎜⎛ 1.9633 − 0.1772⎟⎠⎜⎜⎝ 0.4479 ⎟⎞ − 0.3812⎟ − 0.1059⎟⎠

多元统计分析期末试题及答案

多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析(B卷)

应用多元统计分析(B卷)

⎪⎪⎪⎭⎫ ⎝⎛=1623294344Σ---应用多元统计分析(B )卷一、判断题(10道小题,共计10分)1.对任意的随机向量Tp X X X X ),,,(21 =来说,其协方差矩阵∑是对称矩阵,并且总是半正定的。

2.对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。

3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。

欧氏距离是马氏距离的一种特例。

4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。

5.快速(动态)聚类分析中,分类的个数是确定的,不可改变。

6.因子分析模型中公共因子i F 是互不相关、不可测的变量,并且()1i Var F =。

7.因子载荷矩阵经过旋转后,变量i X 的共同度2i h 不变。

8.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。

9.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。

10.典型相关分析中,分别求出两组变量的第一主成分,两个第一主成分即构成第一对典型相关变量。

二、填空题(5道小题,共计12分)1.(2分)主成分分析时选取____________________表示原始变量信息的多少,并且主要基于____________________矩阵进行主成分分析。

2.(2分)因子分析把每个原始变量分解为两部分因素:一部分为,另一部分为__________________。

3.(2分)相应分析的主要目的是寻求列联表____________________和____________________的基本分析特征和它们的最优联立表示。

4.(3分)设随机向量),,(321'=X X X X ,且协差阵则其相关阵为。

5.(3分)设有两个正态总体21,G G ,已知:,4223,32)2(,52)1(21⎪⎪⎭⎫⎝⎛=∑=∑⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=μμ求出G 1G 2间的马氏距离。

多元统计分析期末试题及答案

多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析课后题答案

应用多元统计分析课后题答案


c) c)2
2( x1

a)( x2

c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)


2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)


Σ

故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

多元统计复习题_附答案.docx

多元统计复习题_附答案.docx

复习题原文:, 复习题I4.2试述判别分析的实质............................ 8-4.3简述距离判别法的基本思想和方法• ............... &4.4简述贝叶斯判别法的基本思想和方法.............. %4.5简述费希尔判别法的基本思想和方法..............10.4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同 ............................................. 11“4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.下表是这十种品牌饮料的销售价格〈元)和顾客对各种饮料的口味评分、信任度评分的平均数.12。

5.1判别分析和聚类分析有何区别?................ 18.答案:4.2试述判别分析的实质。

4.3简述距离判别法的基本思想和方法。

4.4简述贝叶斯判别法的基本思想和方法。

4.5简述费希尔判别法的基本思想和方法。

4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。

4. 2试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。

设Rl, R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为RP,则称Ri,R2-R P^R P的一个划分。

判别分析问题实质上就是在某种意义上,以最优的性质对P维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。

4. 3简述距离判别法的基本思想和方法。

答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。

其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一•类。

①两个总体的距离判别问题设有协方差矩阵E相等的两个总体G和Q,其均值分别是卬和#2,对于一个新的样品X,要判断它来自哪个总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、填空题:
1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.
2、回归参数显着性检验是检验解释变量对被解释变量的影响是否着.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分
析分为Q型聚类和R型聚类。

4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和
它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若x( ): N P( ,),=1,2,3 .n且相互独立,则样本均值向量x 服从的分布
为 _ x ~N(μ,Σ /n)_ 。

二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关
系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取
相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选
出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素 A 包含 r 个水平,因素 B 包含 c 个水平。

对这两组因素作随机抽样调
查,得到一个 rc 的二维列联表,记为。

要寻求列联表列因素 A 和行因素 B 的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素 A 和因素 B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情
况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,
从而得到因素 A、 B 的联系。

3、简述费希尔判别法的基本思想。

从 k 个总体中抽取具有 p 个指标的样品观测数据,借助方差分析的思想构造一个
线性判别函数
系数:
确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样
品的 p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和 H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定
域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受) 。

协差阵的检验
检验
Σ Σ0
np / 2
H 0:Σ I p
exp
1
tr S S n / 2
e
2
n
1
* n / 2
np/ 2
H 0: Σ Σ0 I p
* e
exp
tr S
S
n
2
检验 Σ1 Σ2 L Σk H 0: Σ1
Σ2
L Σk
k
n i /2
n /2
k
k n np /2
S i n i
pn i
/ 2
统计量
S
i 1
i 1
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别请举例说明。

设 d ij 表示样品 X i 与 X j 之间距离,用 D ij 表示类 G i 与 G j 之间的距离。

(1) . 最短距离法
D
ij
X i min
d
ij
G i , X j G j
D kr
X i min
d ij
min{ D kp , D kq }
G k , X j G r
(2)最长距离法
D
pq
max
d
ij
X i G p , X j G q
D
kr
X i max
G r d
ij
max{ D kp , D kq }
G k , X j
(3)中间距离法
D kr 2
1
D kp
2
1
D kq 2 D pq 2
2
2
其中
(4)重心法
D pq2 ( X p X q ) ( X p X q ) X r 1
(n p X p n q X q ) n r
D kr2 n p n q n p n q
D pq2
D kp2 D kq2 2
n r n r n r
(5)类平均法
2 1 2 2 1 2n
p 2 n q 2
D
pq
n p n q X i
d
ij
D
kr n
k
n
r
X
i
G
k
X
j
G
r
d
ij
D
kp
n r
D
kq G p X j G j n r
(6)可变类平均法
D kr2 (1 )( n
p D kp2
n
q D kq2 ) D
pq
2 n r n r
其中是可变的且<1 (7)可变法
D kr21
(D kp2 D kq2 ) D pq2 其中是可变的且 <1 2
(8)离差平方和法
n t
S t ( X it X t ) ( X it X t ) t 1
D kr2 n k n p
D kp2
n k n q
n k D pq2 n r n k n r
D kq2
n k n r n k
7、比较主成分分析与因子分析的异同点。

相同点:①两种分析方法都是一种降维、简化数据的技术。

②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。

因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。

因子分析也可以说成是主成分分析的逆问题。

如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。

而因子分析是从显在变量去提炼潜在因子的过程。

此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。

9、进行相应分析时在对因素 A和因素 B进行相应分析之前没有必要进行独立性检验为什么
有必要,如果因素 A和因素 B独立,则没有必要进行相应分析;如果因素 A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。

相关文档
最新文档