多元统计分析模拟考题及答案
应用多元统计分析试题及答案(1)

应用多元统计分析试题及答案(1)多元统计分析是现代统计学中不可或缺的一部分,它是用于对不同数据进行相关分析的高级统计方法。
对于需要进行多因素分析的问题,多元统计分析是必须掌握的技能。
以下是一些应用多元统计分析的试题及答案。
试题1:假设你要进行一项研究,以评估学生在学期末考试成绩与他们的就业情况之间是否存在关联。
你将分析什么类型的多元统计分析?答案:此问题需要进行一种二元多元回归分析。
此方法可以用于探索学期末考试成绩和就业情况之间的相关性。
通过回归分析,我们可以计算出两个变量之间的相关系数以及建立一个数学模型来预测就业成功与否的可能性。
试题2:你是一家旅游公司的行销经理,你想了解你们的财务状况、品牌信誉和市场定位之间的关系。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要进行一种因子分析。
因子分析是一种常用的多元统计技术,可用于探索大量变量之间的共性或相似性。
因此,行销经理可以使用因子分析来探究这三个因素之间的关系,以帮助公司更好地了解市场需求、推广策略和产品定位。
试题3:你是一名医学研究员,你需要研究新型药物的效果以及它是否与特定人群的特征相关。
哪种多元统计分析可用于研究?答案:这个问题需要使用一种路径分析方法。
路径分析是一种分层回归分析技术,可用于探索变量间的直接和间接影响关系。
因此,研究人员可以使用路径分析来研究新型药物的效果以及与特定人群特征的相关性,以便更好地理解治疗效果的影响因素。
试题4:你是一名市场分析师,你需要研究不同年龄、性别和教育水平的人群之间的消费习惯。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要使用一种聚类分析方法。
聚类分析是一种将成为节点的相似对象分组的过程。
因此,市场分析师可以使用聚类分析来将相似的人群以及他们的共同消费习惯分成几个类别,以便更好地了解不同年龄、性别和教育水平背景下的人群之间的消费习惯和偏好。
结论:多元统计分析是一种有用的技术,可以用于探索大量不同变量之间的关系,对于需要分析多个变量之间关系的问题,多元统计分析是必须学习的基本技能。
多元统计分析模拟考题及答案

一、判断题( 对 )112(,,,)p X X X X '=的协差阵一定是对称的半正定阵( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。
( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。
( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。
( 错)5),(~),,,(21∑'=μp p N X X X X ,,X S 分别是样本均值和样本离差阵,则,SX n分别是,μ∑的无偏估计。
( 对)6),(~),,,(21∑'=μp p N X X X X ,X 作为样本均值μ的估计,是无偏的、有效的、一致的。
( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。
( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等价。
(对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。
二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵.2、设∑是总体1(,,)m X X X =的协方差阵,∑的特征根(1,,)i i m λ=与相应的单位正交化特征向量12(,,,)i i i im a a a α=,则第一主成分的表达式是11111221m my a X a X a X =+++,方差为1λ。
3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别为:'112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- '221.024(0.9544,0.0984,0.2695,0.0824)U λ==-'330.049(0.2516,0.7733,0.5589,0.1624)U λ==--'440.007(0.0612,0.2519,0.5513,0.7930)U λ==--,则其第二个主成分的表达式是212340.95440.09840.26950.0824y X X X X =-++,方差为1.0244. 若),(~)(∑μαp N X ,(n ,,2,1 =α)且相互独立,则样本均值向量X 服从的分布是(,)p N nμ∑.5.设(,),1,2,,16i p X N i μ∑=,X 和A 分别是正态总体的样本均值和样本离差阵,则2115[4()][4()]T X A X μμ-'=--服从 215(15,)(,)16p T p F p n p p--或6设3(,),1,2,,10i X N i μ∑=,则101()()i i i W X X μμ='=--∑服从3(10,)W ∑7.设随机向量123(,,)X X X X '=,且协差阵4434923216-⎛⎫ ⎪∑=-- ⎪ ⎪-⎝⎭,则其相关矩阵R =231382113631186⎛⎫-⎪ ⎪ ⎪-- ⎪ ⎪ ⎪- ⎪⎝⎭8. 设122(,)(,),X X X N μ=∑,其中212(,),ρμμμσρ⎛⎫=∑=⎪⎝⎭11,则1212,)X X X X +-=Cov(09设X,Y 是来自均值向量为μ,协差阵为∑的总体G 的两个样品,则X ,Y 间的马氏平方距离2(,)d X Y =1()()X Y X Y -'-∑-10设X,Y 是来自均值向量为μ,协差阵为∑的总体G 的两个样品,则X 与总体G 的马氏平方距离2(,)d X G =1()()X X μμ-'-∑-11设随机向量123(,,)X X X X '=的相关系数矩阵通过因子分析分解为121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭则1X 的共性方差21h = 0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。
多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析模拟试题

多元统计分析模拟试题Tomorrow Will Be Better, February 3, 2021多元统计分析模拟试题两套:每套含填空、判断各二十道A卷1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法;2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类;3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分;4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异方差性 ,需要采用加权最小二乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为P e=√1−R28)最短距离法适用于条形的类,最长距离法适用于椭圆形的类;9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综合指标的多元统计方法;10)在进行主成分分析时,我们认为所取的mm<p,p为所有的主成分个主成分的累积贡献率达到85%以上比较合适;11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大化12)y1是随机变量,并且有y1~N(0,1),那么y12服从卡方分布;13)在对数线性模型中,要先将概率取对数,再分解处理,公式:ηij=lnp ij=lnp i+,i,j=1,2lnp.j+ln p ijp j p i14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上,解释变量必须是可测量的16)当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计分析方法17)多元正态分布是一元正态分布的推广18)多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础19)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各变量的线性组合;20)统计距离包括欧氏距离和马氏距离两类1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度;√ p1472)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法;×p243)判别分析其被解释变量为属性变量,解释变量是度量变量;√p904)Logistic回归对于自变量有要求,度量变量或者非度量变量都不可以进行回归;× p2205)在系统聚类过程中,聚合系数越大,合并的两类差异越小;× P596)spss只能对单变量进行正态性检验; √7)Logistic回归中的估计参数b0,b1,b2,… ,b n)反应优势比率的变化,如果b i是正的,它的反对数值指数一定小于1; 2288)密度函数可以是负的;× p39)计算典型函数推导的典型权重有较小的不稳定性; × p20510)10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出具体的统计量来度量这种相关关系,使研究者在作用对应分析时得到主观性较强的结论;×p17911)多元检验具有概括和全面考察的特点,容易发现各指标之间的关系和差异;×p2512)名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关系;×p4313) k-均值法是一种非谱系聚类法√p4414)一般而言,不同聚类方法的结果不完全相同√p615)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的√p9016)非谱系聚类法是把变量聚集成k个类的集合;×p6417)主成分的数目大大少于原始变量的数目;√p11418)因子分析只能用于研究变量之间的相关关系;×p14319)聚类分析中的分类方法中,系统聚类法和分解法相似相反;×P4320)聚类分析的目的就是把相似的研究对象归类;√P42B卷一、填空题1. 因子分析中因子载荷系数a ij 的统计意义是第i 个变量与第j 个公因子的相关系数;P 146)2. 类平均法的两种形式为组间联结法和组内联结法 P563. 设3~(,),i 1,2,10.i x x μ∑=⋅⋅⋅则101()~i i W x μ==-∑3(10)W ∑, p54.聚类分析根据实际的需要可能有两个方向,一是对样品,一是对指标聚类;P435. 模糊聚类分析方法中对原始数据进行变换,变换方法通常有标准化变换,极差变换,对数变换 p63()1~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ∑==∑=+-6、设其中则Cov(,)=07.非谱系聚类法是把样品聚集成K 个类的集合;P648.因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组间的相关性较低;P1429.两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形;P2510.因子旋转分为正交旋转和斜交旋转;P15011.Q 型聚类是指对样品进行聚类,R 型聚类是指对指标变量进行聚类;42页12. 一元回归的数学模型是: y =β0+β1x +ε,多元回归的数学模型是:_y =β0+β1x 1+β2x 2+ βp x p +ε_;13.变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. 43页 14. 判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法;80页15若12112~(,),,~(,),0,p p p W n n W n A A ∑≥∑∑>,且A 1和A 2相互独立,则112~AA A+12p n n Λ(,,). ;19页16. 对应分析是将R 型因子分析和Q 型因子分析结合起来进行的统计分析方法;170页17. 典型相关分析是研究两组变量之间相关分析的一种多元统计方法;194页18.判别分析适用于被解释变量是非度量变量的情形; 19. 主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法;113页20. 设i x ,1,2,16i =⋅⋅⋅是来自多元正态总体(,)p N μ∑,X 和A 分别为正态总体(,)p N μ∑的样本均值和样本离差阵,则2115[4(X )][4(X )]~T A μμ-'=--2(15P)T ,二、判断题1、 对于任何随机向量X='21)X ...,X X p ,,(来说,其协方差阵∑都是对称阵,同时总是非负定的; T P52、 能够体现各个变量在变差大小上的不同,以及有时存在的相关性还要求距离与各变量所用的单位无关,这种距离是欧式距离; F P73、 最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止; F P554、 当总体21G G 和为正态总体且协方差相等时,选用马氏距离; T P905、 进行主成分分析的目的之一是减少变量的个数,所以一般不会去p 个主成分,而是取mm<p 个主成分; T P1196、 第k 个主成分k Y 与原始变量i X 的相关系数 k Y ,i X 称为因子负荷量;T P1207、 F=’),,(m 21F ......,F F m<p 是不可观测的变量,其均值向量EF=0,协方差矩阵covF=I,即向量F 的各分量不是相互独立的; F P1458、 每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量;T P2029、 分组数据的Logistic 回归不仅适用于大样本的分组数据,对小样本的未分组数据也适用;F P23210、 一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达,就称这个为参数可识别; T P26411、 随机向量 的协方差阵一定是对称的半正定阵;T P512、 标准化随机变量的协方差阵与原变量的相关系数相同; T P513、 对应分析反应的是列变量与行变量的交叉关系; F P17014、 若一个随机向量的任何边缘分布均为正态,则它是多元正态分布;T p1015、特征函数描述空间的元素之间是否有关联,而隶属度描述了元素之间的关联是多少; T p6216、非谱系聚类法是把变量聚集成K个类的集合; F p6417、在对因素A和因素B进行对应分析之前没有必要进行独立性检验; Tp17318、系统聚类法中的“离差平方和法”的基本思想来源于如果类分得正确,同类样品的离差平方和应该较小,类与类之间的离差平方和应该较大;T p5719、距离判别法对总体的分布没有特定的要求; T p9020、 Wilks统计量可以化成T2统计量但是化不成F统计量; F p18。
多元统计分析期末试题及标准答案

多元统计分析期末试题及答案————————————————————————————————作者:————————————————————————————————日期:22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑L 、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末试题及答案

⎛11、设X ~N 2(μ,∑),其中X =(x 1,x 2),μ=(μ1,μ2),∑=σ2⎝ρ则Cov(x 1+x 2,x 1-x 2)=____.ρ⎫1⎪⎭,2、设Xi~N 3(μ,∑),i =1,服从_________。
,10,则W=∑(X i-μ)(X i-μ)'i =110⎛4x 3)',且协方差矩阵∑= -43⎝-43⎫9-2⎪,⎪-216⎪⎭3、设随机向量X =(x1x2则它的相关矩阵R =___________________4、设X=(x1⎛1- 3 -11R = 3 2 0 ⎝31x2x3)的相关系数矩阵通过因子分析分解为,2⎫3⎪⎛0.9340⎫⎛0.128⎫⎪0.934-0.4170.835⎛⎫ ⎪ ⎪0⎪= -0.4170.894⎪ +0.027⎪⎪⎪00.8940.447⎭ ⎝ ⎪ 0.103⎪⎪⎝0.8350.447⎭⎝⎭⎪1⎪⎭X 1的共性方差h 12=__________ __________,X 1,的方差σ11=________________。
公因子f 1对X 的贡献g 12=5、设X i,i =1,,16是来自多元正态总体N p(μ,∑),X 和A 分别为正态总体N p(μ,∑)的样本均值和样本离差矩阵,则T 2=15[4(X -μ)]'A -1[4(X -μ)]~___________。
⎛16-42⎫1、设X =(x 1,x 2,x 3)~N 3(μ,∑),其中μ=(1,0,-2)',∑= -44-1⎪,⎪ 2-14⎪⎝⎭⎛x 2-x 3⎫试判断x 1+2x 3与 ⎪是否独立?x ⎝1⎭2、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值μ0=(90,58,16)',现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
、判断题(对)1X (兀公2丄,X p)的协差阵一定是对称的半正定阵(对)2标准化随机向量的协差阵与原变量的相关系数阵相同。
(对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。
(对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。
(错)5X (X-X2,,X p) ~ N p( , ),X,S分别是样本均值和样本离S差阵,则X,—分别是,的无偏估计。
n(对)6X (X「X2, ,X p) ~ N p( , ),X作为样本均值的估计,是无偏的、有效的、一致的。
(错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化(对)8因子载荷阵A (a j)中的a ij表示第i个变量在第j个公因子上的相对重要性。
(对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。
(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。
二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵.2、设是总体X (X」,X m)的协方差阵,的特征根i(i 1,L ,m)与相应的单位正交化特征向量i (盼无丄,a m),则第一主成分的表达式是y1 Q1X1 812X2 L QmX m 方差为1。
3设是总体X (X1,X2,X3, X4)的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U;(0.1485, 0.5735, 0.5577, 0.5814)2 1.024 U2(0.9544, 0.0984,0.2695,0.0824)3 0.049 U3(0.2516,0.7733, 0.5589, 0.1624)0.007U4 ( 0.0612,0.2519,0.5513, 0.7930),则其第二个主成分的表达式是41 1 32 13y 2 0.9544X 1 0.0984X 2 0.2695X 3 0.0824X 4,方差为 1.0244-若X ()~N p ( , ) , ( 1,2, ,n )且相互独立,则样本均值向量 X 服从的分布是N p (,—).n5.设X i : N p ( , ),i 1,2,L ,16,X 和A 分别是正态总体的样本均值和样本离差阵,则 T 2 15[4(X)] A 1[4(X)]服从_T 2(15,p)或: F(p,n p)16 p6设X i 10:N a (,),i1,2丄,10,则 W(X i)(X i)服从 W 3(10,)i 14 4 37.设随机向量X(X 1 ,X 2,X a ),且协差阵4 92 ,则其相关矩阵32 1612 3R =382 1 1 363 1 1862 1 8. 设X (X 1 ,X 2): :2(,),,其中(1,2),2,则1Cov(X 1 X 2,X 1 X 2)0_9设X,Y 是来自均值向量为,协差阵为 的总体G 的两个样品,则 X ,Y 间的马氏平2 1方距离 d (X,Y) (X Y) (X Y) 10设X,Y 是来自均值向量为 ,协差阵为的总体G 的两个样品,则 X 与总体G 的马氏平方距离d 2(X,G) =(X)1(X )11设随机向量X (X 1,X 2,X 3)的相关系数矩阵通过因子分析分解为0.934 0 0.1280.934 0.417 0.8350.417 0.894 0.0270 0.894 0.4470.835 0.447 0.1031 1 32 132则X i 的共性方差hi0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。
_ 2标准化变量 X1的方差为 1 公因子fl 对X 的贡献g 10.9342+0.4172+0.8352=1.74312.对应分析是将 Q 型因子分析 和R 型因子分析 结合起来进行的统计分析方法13典型相关分析是研究两组变量间 相关关系 的一种多元统计方法14.聚类分析中,Q 型聚类是指对 样本进行聚类,R 型聚类是指对 指标 进行聚类。
15Spss for windows 中主成 分分析 由 Data Reduction->Factor Analysis 过程实现。
16 设U k ,V k 是第 k 对典型变量则D (UQ 1, D (V k ) 1 (k 1,2,L ,r )Cov(U i ,U j ) 0,Cov(V i ,W) 0 (i j) (i j,i 1,2,L ,r)(i j)(j r)17.在多维标度分析中,当 D 是欧几里得距离阵时, X 是D 的一个构图 三、简答题(答案见平时习题)1简述多元统计的主要内容与方法(10分)可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、2(n ) 与威沙特分布W p ( n,) (1分)、t 分布与Hoteli ng T 2分布(1分)、F 分布 与威尔克斯分布(p,门1山2)( 1分))、抽样分布定理、参数估计和假设检验、 统计方法(2分)2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同3请阐述系统聚类法、K 均值聚类法、有序样品聚类法的基本思想和方法,比较其异同 4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应 用四、计算题设三维随机向X : N 3( ,213)2 0 ,13 01 0 0 0 1 0 ,A 0 0 10.5 1 0.5 ,d0.50.5,求Y AX d 的分布Cov(UiM )解:正态分布的线性组合仍为正态,故只需求E(Y) E(AX d) AEX d1DY D(AX d) ADXA1 所以 Y : N 3(E(Y), D(Y)) 另解:Y AX d0^X 1 X 2 0.5X 3 10.5X 1 O.5X 3 21 1 11 3 2,求1 2 2Y 3X 1 2X 2 X 3的分布解:正态分布的任意线性组合仍正态,故 丫的分布是一维正态分布,只需求 E(Y) 3E(XJ 2E(X 2)E(X 3)13D(Y) 32E(X 1) 22E(X 2) E(X 3) 2Cov(3X 1,2 X 2) 2Cov(3X 1,X 3) 2Cov(X 3,2X 2) 9 故Y : N(13,9)3设有两个二元总体°』和匕,从中分别抽取样本计算得到和判别规则。
样品X=(6,0)'应属于哪个总体?.貳匚厲.好J") 已酬 4解:门1= ⑴,比= I - 2丿,匚=2叫二打仗-对二仗--肝)i(x - p) = (&D )-(4.0.5) =〔2,0.5)0.5 0.5 2 131 0 0 11 10.50.5E(0.5X 1 X 2 0.5X 31) 2E( 0.5X 1 0.5X 3 2) 1D(0.5X 1 X 2 0.5X 3 1) 3D( 0.5X 10.5X 3 2) 1COV(0.5X 1 X 2 0.5X 3 1, 0.5X 1 0.5X 3 2)1故Y : N 3(E(Y), D(Y))2.设三维随机向量X : N 3(,),已知 5.8 2.121 7.6假设热二血,试用距离判别法建立判别函数-11 I 7.6 -2.1J3967(-2,15 A j即样品X 属于总体G 1利用SPSS 得到的Bayes 判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判 断新样品(x1,x2,x3 )属于哪类?Classification Function Coefficientsgroup12 3 x1 -11.689 -10.707 -2.194 x212.29713.3614.960W =(20 5)-' 24.47.6- 2A-2.15.84设已知有两个正态总体 G 1,G 2,且1:,而其先验概率分别为 q 1 q 20.5,误判的代价 L(2 |1) e 4,L(1|2)试用贝叶斯判别法确定样本X3属于哪个总体?5解:由 Bayes 判别知, W(x)f,x) f 2(x)exp[( x_) 1( 12)]其中.q 2C(1|2) dqQ(2|1)W(x) WX 1 X 2属于 2)G2总体5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,表1 Bayes判别函数系数解:根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.1。
表中每一列表示样本判入相应类的Bayes判别函数系数。
由此可建立判别函数如下:Group1:Y1 81.843 11.689X1 12.297X2 16.761X3Group2:Y2 94.536 10.707X1 13.361X2 17.086X3Group3:Y3 17.449 2.194X1 4.960X2 6.447X3将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。
比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。
6.对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根和对应的标准正交特征向量为1 2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)1(1) 取公因子个数为2,求因子载荷阵(2) 用F1F2表示选取的公因子,1, 2为特殊因子,写出因子模型,说明因子载荷阵中元素a ij的统计意义7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量X1,X2,X3,X4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:1 2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)1.024 U2(0.9544, 0.0984,0.2695,0.0824)20.049 U3(0.2516,0.7733, 0.5589, 0.1624)30.007U4(0.0612,0.2519,0.5513, 0.7930)4若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡 献率解:选取主成分的一般原则是特征值大于 1 或累积贡献率达到 80%以上。