多元统计分析模拟试题

多元统计分析模拟试题（两套：每套含填空、判断各二十道）

A卷

1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步

判别法。

2)Q型聚类分析是对样品的分类，R型聚类分析是对变量_的分类。

3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。

4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极

大似然法

5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析

6)分组数据的Logistic回归存在异方差性，需要采用加权最小二乘估计

7)误差项的路径系数可由多元回归的决定系数算出，他们之间的关系为

8)最短距离法适用于条形的类，最长距离法适用于椭圆形的类。

9)。

10)主成分分析是利用降维的思想，在损失很少的信息前提下，把多个指标转化

为几个综合指标的多元统计方法。

11)在进行主成分分析时，我们认为所取的m（m

分的累积贡献率达到85%以上比较合适。

12)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大

化

13)是随机变量，并且有，那么服从（卡方）分布。

14)在对数线性模型中，要先将概率取对数，再分解处理，公式：

15)将每个原始变量分解为两部分因素，一部分是由所有变量共同具有的少数几

个公共因子组成的，另一部分是每个变量独自具有的因素，即特殊因子

16)判别分析的最基本要求是分组类型在两组之上，每组案例的规模必须至少一

个以上，解释变量必须是可测量的

17)当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计

分析方法

18)多元正态分布是一元正态分布的推广

19)多元分析的主要理论都是建立在多元正态总体基础上的，多元正态分布是多

元分析的基础

20)￥

21)因子分析中，把变量表示成各因子的线性组合，而主成分分析中，把主成分

表示成各变量的线性组合。

22)统计距离包括欧氏距离和马氏距离两类

1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相

关程度。（√）（p147）

2)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法。

（×）（p24）

3)判别分析其被解释变量为属性变量，解释变量是度量变量。（√）（p90）

4)Logistic回归对于自变量有要求，度量变量或者非度量变量都不可以进行回

归。（×）(p220)

5)在系统聚类过程中，聚合系数越大，合并的两类差异越小。（×）(P59)

6)spss只能对单变量进行正态性检验。（√）

7)Logistic回归中的估计参数（反应优势比率的变化，如果是

正的，它的反对数值（指数）一定小于1。（228）

8)密度函数可以是负的。（×）(p3)

9)￥

10)计算典型函数推导的典型权重有较小的不稳定性。（×）（p205）

11)10、对应分析可以用图形的方式提示变量之间的关系，同时也可以给出具体

的统计量来度量这种相关关系，使研究者在作用对应分析时得到主观性较强

的结论。（×）（p179）12)多元检验具有概括和全面考察的特点，容易发现各指标之间的关系和差异。

（×）p25

13)名义尺度的指标用一些类来表示，这些类之间有等级关系，但没有数量关

系。（×）p43

14)k-均值法是一种非谱系聚类法（√）p44

15)一般而言，不同聚类方法的结果不完全相同（√）p6

16)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的

（√）p90

17)非谱系聚类法是把变量聚集成k个类的集合。（×）p64

18)主成分的数目大大少于原始变量的数目。（√）p114

19) 因子分析只能用于研究变量之间的相关关系。（×）p143

20) %

21) 聚类分析中的分类方法中，系统聚类法和分解法相似（相反）。（×）P43

22) 聚类分析的目的就是把相似的研究对象归类。（√）P42

B 卷

一、填空题

1. 因子分析中因子载荷系数的统计意义是第i 个变量与第j 个公因子的相关系数；(

2. 类平均法的两种形式为组间联结法和组内联结法（P56)

3. 设3~(,),i 1,2,10.i x x μ∑=???则10

)~i i W x μ==-∑3(10)W ∑， (p5)

4.聚类分析根据实际的需要可能有两个方向，一是对样品，一是对指标聚类。（P43）

5. 模糊聚类分析方法中对原始数据进行变换，变换方法通常有标准化变换，极差变换，对数变换（p63）

()2

212121212

~(,),(,),(,),,1

X N X x x x x x x ρμμμμσ

∑==∑=+-6、设其中则Cov(,)=0

7.非谱系聚类法是把样品聚集成K 个类的集合。（P64）

》

8.因子分析的基本思想是根据相关性大小把原始变量分组，使得同组

内的变量之间相关性较高，而不同组间的相关性较低。（P142）

9.两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形。（P25）

10.因子旋转分为正交旋转和斜交旋转。（P150）

11. Q 型聚类是指对样品进行聚类，R 型聚类是指对指标（变量）进行聚类。（42页）

12. 一元回归的数学模型是： y =β0+β1x +ε，多元回归的数学模型是：_y =β0+β1x 1+β2x 2+ βp x p +ε_。

13. 变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. （43页）

14. 判别分析是判别样品所属类型的一种统计方法，常用的判别方法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法。（80页） 15若12112~(,),,~(,),0,p p p W n n W n A A ∑≥∑∑>，且A 1和A 2相互独立，则112~A

A A +12p n n Λ（,,）

. 。（19页）

16. 对应分析是将R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。（170页）

…

17. 典型相关分析是研究两组变量之间相关分析的一种多元统计方法。（194页）

18. 判别分析适用于被解释变量是非度量变量的情形。

19. 主成分分析是利用降维的思想，在损失很少信息的前提下，把多

个指标转化为几个综合指标的多元统计方法。（113页）

20. 设i x ，1,2,16i =???是来自多元正态总体(,)p N μ∑，X 和A 分别为正

态总体(,)p N μ∑的样本均值和样本离差阵，则

2115[4(X )][4(X )]T A μμ-'=--二、判断题

1、对于任何随机向量X='21)X ...,X X p ，，（来说，其协方差阵∑都是对称

阵，同时总是非负定的。 ( T ) P5

2、能够体现各个变量在变差大小上的不同，以及有时存在的相关性

还要求距离与各变量所用的单位无关，这种距离是欧式距离。( F )P7

3、最长距离法中，选择最小的距离作为新类与其他类之间的距离，然后将类间距离最小的两类进行合并，一直合并到只有一类为止。 ( F )P55

4、当总体21G G 和为正态总体且协方差相等时，选用马氏距离。( T )P90

5、进行主成分分析的目的之一是减少变量的个数，所以一般不会去p 个主成分，而是取m(m

;

6、第k 个主成分k Y 与原始变量i X 的相关系数ρ（k Y ，i X ）称为因

子负荷量。( T )P120

7、 F=’），，（m 21F ......,F F （m

=0，协方差矩阵cov(F)=I,即向量F 的各分量不是相互独立的。（F ）P145

8、每个典型函数都包括一对变量，通常一个代表自变量，另一个代

表因变量。（T）P202

9、分组数据的Logistic回归不仅适用于大样本的分组数据，对小样本的未分组数据也适用。（F）P232

10、一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达，就称这个为参数可识别。（T）P264

11、随机向量的协方差阵一定是对称的半正定阵。（T）P5

12、标准化随机变量的协方差阵与原变量的相关系数相同。（T）P5

13、对应分析反应的是列变量与行变量的交叉关系。（F ）P170

14、若一个随机向量的任何边缘分布均为正态，则它是多元正态分布。（T）p10

15、特征函数描述空间的元素之间是否有关联，而隶属度描述了元素之间的关联是多少。（T）p62

16、非谱系聚类法是把变量聚集成K个类的集合。（F）p64

17、在对因素A和因素B进行对应分析之前没有必要进行独立性检验。（T）p173

18、系统聚类法中的“离差平方和法”的基本思想来源于如果类分得正确，同类样品的离差平方和应该较小，类与类之间的离差平方和应该较大。（T）p57

19、距离判别法对总体的分布没有特定的要求。（T）p90

20、Wilks统计量可以化成T2统计量但是化不成F统计量。（F）p18