多元统计分析试题(A卷)

合集下载

多元统计分析及R语言建模考试试卷

多元统计分析及R语言建模考试试卷

多元统计分析及R 语言建模考试试卷一、简答题(共5小题,每小题6分,共30分)(1)多元正态分布检验(2)多元方差-协方差分析(3)聚类分析(4)判别分析(5)主成分分析(6)因子分析(7)对应分析(8)典型相关性分析( 9)定性数据建模分析(10)路径分析(又称多重回归、联立方程)(11)结构方程模型(12)联合分析(13)多变量图表示法(14)多维标度法2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。

简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。

例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。

例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。

复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。

复相关系数为R0.12…n的取值范围为0≤R0.12…n≤1。

复相关系数值愈大,变量间的关系愈密切。

典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。

它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

3. 试说明主成分分析和因子分析不同点和相同之处。

主成分分析和因子分析的相同之处1.都可以降维、分析多个变量的基本结构2.因子分析是主成分分析的进一步推广。

主成分分析可被视为一种固定效应的因子分析,是因子分析的特列3.都是利用变量之间的相关性将它们进行分类4.主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

多元统计试题及答案

多元统计试题及答案
1从拟合角度考虑,可以采用修正的复相关系数达到最大的准则。
准则1:修正的复相关系数 达到最大。因为:
从这个关系式容易看出, 达到最大时, 达到最小。
2从预测的角度考虑,可以采用预测平方和达到最小的准则以及 准则
准则2:预测平方和 达到最小
准则3:( 准则):定义 统计量为 要求选择 小,且 小的回归方程。
检验假设
根据 分布的定义,有 ,这里 ,对于给定的显著性水平,当 时,我们拒绝 ,反之就接受 ,在SPSS软件的输出结果中,可以直接从P值看出检验结果,那么我们拒绝的P值区间是多少呢?
⑶统计性的依据是什么?给出一个回归分析方程如何作显著性检验?
统计性的依据方差分析
对于多元线性回归作显著性检验就是要看自变量 从整体上对随机变量y是否有明显的影响,即检验假设
如果 被接受,则表明y与 之间不存在线性关系,为了说明如何进行检验,我们要首先建立方差分析表.
在进行显著性的检验中,我们可以用F统计量来检验回归方程的显著性,也可以用P值法做检验.F统计量是:
当 为真时, ,给定显著性水平α,查F分布表得临界值 ,计算F的观测值,若 ,则接受 ,即认为在显著性水平α之下,认为y与 之间线性关系不显著.
试用最长距离法对这六个样品进行聚类,并画出谱系图。(10分)
解答:首先将6个样品的各自看成一类,即:
Gi=(i),i=1,2,3,4,5,6
将相关系数矩阵记为R0,则:
从这个矩阵可以看出,G1,G2的相关性最大,因此将G1,G2在水平0.92上合成一个新类G7={1,2},计算G7与G3,G4,G5,G6之间的最长距离,得到:
2.3聚类分析
⑴系统聚类的基本思想:
先将待聚类的n个样品(或者变量)各自看成一类,公有n类,然后按照事先选定的方法计算每两类之间的聚类统计,即某种距离(或者相似系数),将关系最密切的两类并为一类,其余不变,既得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或者相似系数),再将关系最密切的两类并为一类,其余不变,即得到n-2类;如此继续下去,每次重复都减少一类,直到最后所有的样品(或者变量)归为一类为止.

多元统计分析试题及答案

多元统计分析试题及答案
_0.872_____
X 1的共性方差h12 =
X 1的方差σ
11
= ___1 注(0.128+0.872)___,
公因子f1对X的贡献g12 = 1.743
备注(0.934^2+(-0.417)^2+0.835^2)__。
5、 设 X i , i = 1,⋯ ,16是 来 自 多 元 正 态 总 体 N p ( µ , Σ ), X 和 A分 别 为 正 态 总 体 N p ( µ , Σ ) 的 样 本 均 值 和 样 本 离 差 矩 阵 ,则 T 2 = 15[4( X − µ )]′ A − 1[4( X − µ )] ~ ___________ 。
2、假设检验问题:H 0 : µ = µ0,H1 : µ ≠ µ0 ⎛ −8.0 ⎞ 经计算可得:X − µ0 = ⎜ 2.2 ⎟ , ⎜ ⎟ ⎜ −1.5 ⎟ ⎝ ⎠ ⎛ 4.3107 −14.6210 8.9464 ⎞ −1 −1 ⎜ S = (23.13848) −14.6210 3.172 −37.3760 ⎟ ⎜ ⎟ ⎜ 8.9464 −37.3760 35.5936 ⎟ ⎝ ⎠ 构造检验统计量:T 2 = n( X − µ0 )′S −1 ( X − µ0 ) = 6 × 70.0741 = 420.445 由题目已知F0.01 (3,3) = 29.5,由是 3× 5 F0.01 (3,3) = 147.5 3 所以在显著性水平α = 0.01下,拒绝原设 H 0
⎛ 16 −4 2 ⎞ 1、设X = ( x1 , x2 , x3 ) ~ N 3 ( µ , Σ), 其中µ = (1,0, − 2)′, Σ = ⎜ −4 4 −1⎟ , ⎜ ⎟ ⎜ 2 −1 4 ⎟ ⎝ ⎠ ⎛x −x ⎞ 试判断x1 + 2 x3与 ⎜ 2 3 ⎟ 是否独立? ⎝ x1 ⎠

《多元统计分析》课程考试试题

《多元统计分析》课程考试试题

《多元统计分析》课程考试试题学年第 学期 班级 时量:100分钟 总分100分考试形式 开卷一、(本大题共2小题,每题n 分,共22分)-i 1 r1 .设 X 〜N"Z ),其中 X = (X],X2,X3)% = (2,—3,1)',,= 1 32 ,试求1 2 2 3X1 —2Xz + X3的分布。

2 .设三个总体QG 和G3的分布分别为:A^(2A52),m22)W (3J 2)o 试按马氏距离判 别准那么判别产2. 5应判归哪一类?二、(此题 12 分)设 X=(X],X2,X3)其中1 P 4 二(从,42,〃3)',2= P 1 P P (1)试求AX ⑴+ d 的分布,x ⑴=(X1 x 2y (2)试求X3的分布。

三、(此题12分)5个样品的观测值为:1, 4, 5, 7, 11 ,试用按类平均法对5个样品 进行分类。

四、(此题12分)设有两个正态总体G1和G2,(m=2)小 F1O1 小「20]「18 12].〃⑴=]5'〃 = 25 2=1= 12 32 ,先验概率4 =%,而〃2|1) = 10,「201「⑸ 〃12) = 75。

试问按贝叶斯判别准那么样品X (1)=,X0)= 各应判归哪一类?(1)20⑵20五、(此题12分)设随机变量X=(X],X2,X3)'的协方差阵为,1-2 0、£= -2 5 0〔。

2)试求X 的主成分及主成分对变量X,的贡献率匕.(,= 1,2,3)。

六、(此题30分)设标准化变量X1,X2,X3的协方差阵为1.00 0.63 0.45(\ A = 14 (\ A = 14 3、2)R= 0.63 1.00 0.350.45 0.35 1.00协方差阵的特征值和特征向量分别为4 = 1.9633,4 = (0.6250,0.5932,0.5075)'4=0.6795,。

=(一°・2186「0.4911,0.8432)'4 = 0.3672 4 = (0.7494 -0.6379 -0.1772)'(1)取公共因子个数m=l时,求因子模型的主成分解,并计算误差平方和。

多元统计分析试题及答案

多元统计分析试题及答案

多元统计分析试题及答案华南农业⼤学期末试卷(A 卷)2006学年第2学期考试科⽬:多元统计分析考试类型:(闭卷)考试时间:120 分钟⼀、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρµµµµσρ∑==∑=+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiii XN i W XXµµµ='∑=--∑ 、设则=服从。

()1234433,492,3216___________________X x x x R -?? ?'==-- ? ?-?=∑、设随机向量且协⽅差矩阵则它的相关矩阵________________。

(),123设X=xx x 的相关系数矩阵通过因⼦分析分解为211X h =的共性⽅差111X σ=的⽅差21X g =1公因⼦f 对的贡献121330.9340.1280.9340.4170.8351100.4170.8940.027 0.8940.44730.8350.4470.1032013R ?-?-=-=-+5,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N TX A X µµµµ-=∑∑'=-- 、设是来⾃多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

⼆、计算题(5×11=50)12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x µµ-??'=∑=-∑=-- --??+、设其中试判断与是否独⽴?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.62103.17237.14.5X S µ--'=-?? ?==-- ? 0、对某地区农村的名周岁男婴的⾝⾼、胸围、上半臂围进⾏测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

多元统计分析期末试题及答案

多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析试题及答案

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

多元统计分析

多元统计分析多元统计分析习题集(⼀)⼀、填空题1.若()(,),(1,2,,)p X N n αµα∑= 且相互独⽴,则样本均值向量X 服从的分布是____________________。

2.变量的类型按尺度划分为___________、____________、_____________。

3.判别分析是判别样品_____________的⼀种⽅法,常⽤的判别⽅法有_____________、_____________、_____________、_____________。

4.Q 型聚类是指对_____________进⾏聚类,R 型聚类指对_____________进⾏聚类。

5.设样品12(,,,),(1,2,,)i i i ip X X X X i n '== ,总体(,)p X N µ∑ ,对样品进⾏分类常⽤的距离有____________________、____________________、____________________。

6.因⼦分析中因⼦载荷系数ij a 的统计意义是_________________________________。

7.主成分分析中的因⼦负荷ij a 的统计意义是________________________________。

8.对应分析是将__________________和__________________结合起来进⾏的统计分析⽅法。

9.典型相关分析是研究__________________________的⼀种多元统计分析⽅法。

⼆、计算题 1.设3(,)X N µ∑ ,其中410130002?? ?∑= ? ??,问1X 与2X 是否独⽴?12(,)X X '与3X 是否独⽴?为什么?2.设抽了5个样品,每个样品只测了⼀个指标,它们分别是1,2,4.5,6,8。

若样品间采⽤绝对值距离,试⽤最长距离法对其进⾏分类,要求给出聚类图。

多元统计分析试卷

一.填空题(每空2分,共30分)1.若--------(看不清)且相互独立,则样本均值向量X 2服从的分布为_______2.聚类分析是判别样品所属类型的一种统计方法,常用的聚类分析方法有距离判别法、Fisher 判别法、Bavers 判别法、逐步判别法。

3.主成份同因子分析之间的差异在于方差,_____。

4.设样本-------,总体-----,对样本进行分类常用的工具有:马氏距离--=_______,相关系数_______,它们之间的关系如何_______。

5.因子分析中的因子载荷系数共性方差的统计意义是_______。

6.典型相关分析是研究两组变量之间_______的一种多元统计方法。

7.刻画两个变量之间相关程度的通过统计指标是_______。

8.数据标准化对因子分析的结构分解有什么影响_______。

二.计算题(每小题12分,共60分)1.设三维随机变量-----,其中⎪⎪⎪⎭⎫ ⎝⎛=∑210140005,问1X 与2X 是否独立?---和1X 是否独立?为什么?2.设抽了五个样品,每个样品只测了一个指标,它们分别是1 1 2 3 5 4 5,若样本间采用欧式,试用平均距离法对其进行分类,要求给出聚类图。

3.设变量321,,X X X 的相关阵为⎪⎪⎪⎭⎫ ⎝⎛=00.135.045.035.000.163.045.063.000.1R ,R 的特征值和单位化特征向量分别为T T T l l l 18.0,64.0,75.0,37.03,84.0,49.0,22.0,68.0,51.0,59.0,63.0,96.122211--==--====λλλ(1)取公共因子个数为2,求因子载荷矩阵A 。

(2)计算变量共同度—及公共因子2F 的方差贡献,并说明其统计意义。

4.设三元总体X 的协方差阵为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑841,从∑出发,求总体主成份321,,F F F ,求前两个主成份的累计贡献率。

应用多元统计分析试题及答案

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B 的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。

3、简述费希尔判别法的基本思想。

从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

广西科技大学 2013 — 2014 学年第 2 学期课程考核试题 考核课程 多元统计分析 ( A 卷)考核班级 统计101、102班 学生数 114 印数 120 考核方式 闭卷 考核时间 120 分钟
一、填空题(每空3分,共15分) 1、设
2~(,)
X N μ∑,其中
12(,)X x x '
=,
12(,)μμμ'
=,
2
11ρσρ
⎛⎫
∑=
⎪⎝⎭
,则
1212ov(,)C x x x x +-= 。

2、设A 和B 为常数矩阵,ov(,)C x y =∑,则ov(,)C Ax By = 。

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

根据分类对象的不同,聚类分析分为 聚类和 聚类。

4、因子分析中,因子载荷矩阵A 中元素ij
a 的统计意义
是 。

5、为研究两组变量12,,,p
x x x L 和
12,,,q
y y y L 之间的相关关系,一般采用
方法。

二、简述题(每小题10分,共20分) 1、简述系统聚类法的基本思想。

2、简述主成分分析和因子分析的基本思想,并比较二者的异同点。

三、(10分)设随机向量X 的协方差矩阵为
1643()442329V X -⎛⎫

=-- ⎪ ⎪-⎝⎭
求其相关系数矩阵R 。

四、(15分)设3121~(,),110X N A μ-⎛⎫
∑=
⎪-⎝⎭
,其中
()1642111,441214μ-⎛⎫

=-∑=-- ⎪ ⎪-⎝⎭

求Y AX =的分布.
五、(15分)已知两个总体1π,2π的概率密度分别为1()f x 和2()f x ,且总体的先验概率分布为120.6,0.4p p ==,误判损失为(1|2)12c =个单位, (2|1)4c =个单位。

(1) 建立最小平均误判代价()判别规则;
(2) 设有一新样品0x 满足1020()0.36,()0.24f x f x ==,判定0x 的归属问题。

六、(10分)设三元总体123(,,)X
x x x '= 的协方差矩阵为
4121932325⎛⎫

∑=- ⎪ ⎪-⎝⎭
试求总体的主成分以及各主成分的贡献率。

七、(15分)某学校体检中获得的30位学生身体的四项指标,数据见下表。

对数据做主成分分析,利用软件运行,得到如下输出结果:
试根据输出结果,完成以下问题:
(1)写出前两个主成分,并说明前两个主成分的累计贡献率;(2)对所取的前两个主成分给出合理的解释。

相关文档
最新文档