期末试卷应用多元统计分析A卷
期末试卷应用多元统计分析A卷

浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷注意事项:1、本试卷满分100分.2、考试时间 120分钟.一、填空题(每空3分,共30分)1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.3. 总体方差未知的情况下,采用总体方差用 来进行估计.4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫⎝⎛=∑200031014,则1X 与2X (是否独立).5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫⎪∑=- ⎪ ⎪-⎝⎭,则1X 的期望1()E X = ,12(,)Cov X X = ,13(,)X X ρ= .7. 因子分析中因子载荷系数ij a 的统计意义是: .学院: 专业班级: 姓名: 学号:装 订 线 内 不 要 答 题二、简答题(每小题9分,共18分)2.什么是相应分析?它与因子分析有何关系?三、实验题(每空4分,共32分)1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:根据分析结果给出三个分类各自贝叶斯判别函数:(1) ; (2);(3) ;(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对数据进行分析结果如下:根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .特征根和方差贡献率表表6.5 因子载荷阵3.四、操作题(共18分)为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。
多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计考题A卷

1.6
5.2
800
5
0.9
4.2
813
6
1.7
3.8
812
7
2.1
1.1
862
8
2.5
4.5
765
9
2.0
2.7
820
五、(15分)
设有5个产品,每个只测量了一个指标,得数据如下:1,2,4.5,6,8试用欧式距离和最短距离法将它们进行分类,并画出系统聚类图。
六、(15分)
设 与 有相关关系,其8组观测数据见下表。
4.设 来自于A1,A2,…Ag总体,按贝叶斯准则建立多总体判别模型即是要求,其 k=1,2,…,g。
5.聚类分析分Q型和R型聚类,当需要研究变量与变量之间关系时,一般使用,常用统计量作为分类依据。
二、(10分)
设 是 维随机向量, , ,其中 为非零向量,
证明:
三、(10分)
设有 组样本观测值数据
其中, 表示第 次试验或第 个样本关于变量 的观测值,证明:
四、(15分)
某钻探区钻了9口探井,下表列出了这9口井的横坐标 、纵坐标 以及某含油层顶面的海拔高程 。含油层海拔高度的单位是米。试求其一次趋势面方程。
序号
横坐标,
纵坐标,
海拔高程,
1
0.6
1.7
873
2
1.4
6.2
793
3
0.3
6.1
870
序号
1
38
47.5
23
66.0
2
41
21.3
17
43.0
3
34
36.5
21
36.0
4
多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析A卷试题

4.R型因子分析是指对_____________进行分析,Q型因子分析是指对_____________进行分析。
得分
二、简述(10分×2)
1.比较主成分分析与因子分析的异同点。
2.简述聚类分析的基本思想
3)写出因子得分函数
4)解释因子的含义,并进行适当分析
3.250
54.159
54.159
2
1.255
20.910
75.069
1.255
20.910
75.069
3
.732
12.204
87.272
4
.465
7.748
95.021
5
.235
3.916
98.937
6
.064
1.063
100.000
提取方法:主成份分析。
成份得分系数矩阵
成份
1
2
体重
-.242
.342
得分
一、填空(2分×15)
1.常见的统计图有___________,___________,___________,___________以及___________。
2.系统聚类分析方法有___________,___________,___________,___________,___________和___________。
腰围
-.265
.285
脉搏
.127
-.461
单杠
.239
.244
仰卧起坐
.270
.238
跳高
多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
(完整word版)多元统计分析期末试卷

一、(本大题共2小题,每题5分,共10分)1、设),(~3∑μN X ,其中⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑-==221231111,)'1,3,2(,)',,(321μX X X X ,试求32123X X X +-的分布。
2、设三个总体321,G G G 和的分布分别为:)1,3()2,0(),5.0,2(222N N N 和。
试按马氏距离判别准则判别x =2.5应判归哪一类?二、(本题10分)设'1233(,,)~(,)X X X X N μ=∑,其中)10(111,)',,(321<<⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑=ρρρρρρρμμμμ,1342A ⎛⎫= ⎪⎝⎭,14d ⎛⎫= ⎪⎝⎭ (1) 试求(1)AX d +的分布,(1)12()'X X X =(2) 试求3X 的分布。
三、(本题10分)已知5个样品的观测值为:1,4,5,7,11.试用按类平均法对5个样品进行分类。
四、(本题10分)设有两个正态总体21G G 和,已知(m=2)⎥⎦⎤⎢⎣⎡=∑=∑⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=32121218,2520,151021)1()1(μμ ,先验概率21q q =,而,10)12(=L 75)21(=L 。
试问按贝叶斯判别准则样品⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=2015,2020)2()1(X X 各应判归哪一类?五、(本题10分)假定人体尺寸有这样的一般规律:身高(1X ),胸围(2X )和上半臂围(3X )的平均尺寸比例是6:4:1。
假定),,1()(n X =αα为来自总体)',,(321X X X X =的随机样本,并设),(~3∑μN X 。
试利用下表中数据来检验其身高、胸围和上半臂围这三个尺寸是否符合这一规律。
(94.6)4,2(,05.005.0==F α)六、(本题10分)设随机变量)',,(321X X X X =的协方差阵为⎪⎪⎪⎭⎫⎝⎛--=∑200052021,试求X 的主成分及主成分对变量i X 的贡献率)3,2,1(=i i ν。
多元统计期末考试题及答案

多元统计期末考试题及答案一、选择题(每题2分,共20分)1. 在多元线性回归中,如果一个变量的系数为0,这意味着什么?A. 该变量对因变量没有影响B. 该变量与因变量完全相关C. 该变量与因变量无关D. 该变量是多余的2. 主成分分析(PCA)的主要目的是什么?A. 减少数据的维度B. 增加数据的维度C. 找到数据的均值D. 找到数据的中位数3. 以下哪个不是聚类分析的优点?A. 可以揭示数据的内在结构B. 可以用于分类C. 可以减少数据的维度D. 可以找到数据的异常值4. 在因子分析中,如果一个因子的方差贡献率很低,这通常意味着什么?A. 该因子对数据的解释能力很强B. 该因子对数据的解释能力很弱C. 该因子是多余的D. 该因子是重要的5. 以下哪个是多元统计分析中常用的距离度量?A. 欧氏距离B. 曼哈顿距离C. 切比雪夫距离D. 所有以上选项二、简答题(每题10分,共30分)6. 解释什么是多元线性回归,并简述其在实际问题中的应用。
7. 描述主成分分析(PCA)的基本原理,并举例说明其在数据分析中的作用。
8. 简述聚类分析的过程,并讨论其在商业数据分析中的应用。
三、计算题(每题25分,共50分)9. 假设有以下数据集,包含两个变量X和Y,以及它们的观测值:| 观测 | X | Y |||||| 1 | 2 | 3 || 2 | 3 | 4 || 3 | 4 | 5 || 4 | 5 | 6 |请计算X和Y的协方差,并解释其意义。
10. 给定以下数据集,进行聚类分析,并解释聚类结果:| 观测 | 变量1 | 变量2 |||-|-|| 1 | 1.5 | 2.5 || 2 | 2.0 | 3.0 || 3 | 3.5 | 4.5 || 4 | 4.0 | 5.0 |多元统计期末考试题答案一、选择题1. A2. A3. C4. B5. D二、简答题6. 多元线性回归是一种统计方法,用于分析两个或两个以上的自变量(解释变量)与一个因变量之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)
课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷
注意事项:1、本试卷满分100分.
2、考试时间 120分钟.
一、填空题(每空3分,共30分)
1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.
2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.
3. 总体方差未知的情况下,采用总体方差用 来进行估计.
4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪
⎭
⎫
⎝⎛=∑200031014,则1X 与2X (是否独立).
5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .
6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫
⎪
∑=- ⎪ ⎪-⎝⎭
,
则1X 的期望1()E X = ,12(,)Cov X X = ,
13(,)X X ρ= .
7. 因子分析中因子载荷系数ij a 的统计意义是: .
学院: 专业班级: 姓名: 学号:
装 订 线 内 不 要 答 题
二、简答题(每小题9分,共18分)
2.什么是相应分析?它与因子分析有何关系?
三、实验题(每空4分,共32分)
1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平
销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:
根据分析结果给出三个分类各自贝叶斯判别函数:
(1) ; (2)
;
(3) ;
(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.
2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对
数据进行分析结果如下:
根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;
(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .
特征根和方差贡献率表
表6.5 因子载荷阵
3.四、操作题(共18分)
为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。
(1)写出判别分析的基本思想(5分)
2)在刚进入判别分析界面时,请完成以下操作(填空)(8分):
将选入Grouping Variable框中,并点击Define Range,在跳出的界面中Minimum框中填写,在Maximum框中填写;将选入Independents框中。
(每空2分,共4×2=8分)
(3)最后输出的Descriminant Scores列在上表的第7列,请在表的最后1列的最后2行空格处填上序号11-12样品的预测分类号,并说明其中的原因(5分)。
答:
1.检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,
11. 试用最短距离法或重心法进行聚类分析.
2.设有两个二元总体1G 和2G ,从中分别抽取样本计算得到 (1)
51X
⎛⎫
= ⎪⎝⎭
,(2)32X ⎛⎫= ⎪-⎝⎭,
5.8 2.1ˆ 2.17.6p ⎛⎫∑= ⎪
⎝⎭
,假设12∑=∑,试用距离判别法建立判别函数和判别规则. 样品X =(6,0)’应属于哪个总体?
1.系统聚类分析的方法很多,其中的五种分别为最长距离法、最短距离法、重心法、类平均法、离差平方和法。
2. 因子分析可以分为确定因子载荷、因子旋转、计算因子得分三个步骤。
3. 变量的类型按尺度划分有
1. 为了研究7种植物A 、B 、C 、D 、E 、F 、G 的分布规律,根据资料做类型划分。
已知各植物两两间距离矩阵如下:
D = ⎥⎥⎥
⎥⎥
⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢
⎢⎢⎢⎣⎡04381721
14
0311********
652310
01924130
2212
110G F E D C B A G F
E D C
B A
试用系统聚类法(类与类采用最短距离法)进行聚类分析:(1)写出从7类最后聚成1类的详细
过程(10分);(2)画出系统聚类图(5分)。
2
2121212121~(,),(,),(,),,
1X N X x x x x x x ρμμμμσρ
⎛⎫
∑==∑=
⎪⎝⎭
+-1、设其中则Cov(,)=____.
10
31
2~(,),1,,10,()()_________i i i i X N i W X X μμμ='
∑=--∑、设则=服从。
()1
2
34
433,4
92,
3216___________________
X x x x R -⎛⎫ ⎪'==-- ⎪
⎪-⎝⎭
=∑、设随机向量且协方差矩阵则它的相关矩阵
4、
_,
12332313116421(,,)~(,),(1,0,2),441,
2142X x x x N x x x x x μμ-⎛⎫
⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭
-⎛⎫
+ ⎪⎝⎭、设其中试判断与是否独立?
12124122411362190.5,(21),(12)35q q C e C e Bayes X μμ⎛⎫⎛⎫⎛⎫==∑=∑=∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭====⎛⎫
= ⎪⎝⎭12、设已知有两正态总体G 与G ,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?
(),
123设X=x x x 的相关系数矩阵通过因子分析分解为
211X h =
的共性方差111
X σ
=
的方差21X g =1公因子f 对的贡献
1212111221225(,),(,),100
000010.950()00.95
100
00100T T X X X X Y Y X Z Y Z ⎛⎫
=== ⎪⎝⎭
⎛⎫ ⎪
∑∑⎡⎤ ⎪=∑==⎢⎥ ⎪∑∑⎣⎦ ⎪
⎝⎭、设为标准化向量,令且其协方差阵
V ,求其第一对典型相关变量和它们的典型相关系数?。