13级信息与计算《多元统计分析》练习题

合集下载

多元统计分析课后练习答案

多元统计分析课后练习答案

多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进⾏标准化处理?数据的标准化是将数据按⽐例缩放,使之落⼊⼀个⼩的特定区间。

在某些⽐较和评价的指标处理中经常会⽤到,去除数据的单位限制,将其转化为⽆量纲的纯数值,便于不同单位或量级的指标能够进⾏⽐较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧⽒距离与马⽒距离的优缺点是什么?欧⽒距离也称欧⼏⾥得度量、欧⼏⾥得度量,是⼀个通常采⽤的距离定义,它是在m 维空间中两个点之间的真实距离。

在⼆维和三维空间中的欧⽒距离的就是两点之间的距离。

缺点:就⼤部分统计问题⽽⾔,欧⽒距离是不能令⼈满意的。

每个坐标对欧⽒距离的贡献是同等的。

当坐标表⽰测量值时,它们往往带有⼤⼩不等的随机波动,在这种情况下,合理的⽅法是对坐标加权,使变化较⼤的坐标⽐变化较⼩的坐标有较⼩的权系数,这就产⽣了各种距离。

当各个分量为不同性质的量时,“距离”的⼤⼩与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这⼀点有时不能满⾜实际要求。

没有考虑到总体变异对距离远近的影响。

马⽒距离表⽰数据的协⽅差距离。

为两个服从同⼀分布并且其协⽅差矩阵为Σ的随机变量与的差异程度:如果协⽅差矩阵为单位矩阵,那么马⽒距离就简化为欧⽒距离,如果协⽅差矩阵为对⾓阵,则其也可称为正规化的欧⽒距离。

优点:它不受量纲的影响,两点之间的马⽒距离与原始数据的测量单位⽆关。

由标准化数据和中⼼化数据计算出的⼆点之间的马⽒距离相同。

马⽒距离还可以排除变量之间的相关性的⼲扰。

缺点:夸⼤了变化微⼩的变量的作⽤。

受协⽅差矩阵不稳定的影响,马⽒距离并不总是能顺利计算出。

3、当变量X1和X2⽅向上的变差相等,且与互相独⽴时,采⽤欧⽒距离与统计距离是否⼀致?统计距离区别于欧式距离,此距离要依赖样本的⽅差和协⽅差,能够体现各变量在变差⼤⼩上的不同,以及优势存在的相关性,还要求距离与各变量所⽤的单位⽆关。

如果各变量之间相互独⽴,即观测变量的协⽅差矩阵是对⾓矩阵, 则马⽒距离就退化为⽤各个观测指标的标准差的倒数作为权数的加权欧⽒距离。

(完整版)多元统计复习题附答案

(完整版)多元统计复习题附答案

复习题原文:答案:4.2 试述判别分析的实质。

4.3 简述距离判别法的基本思想和方法。

4.4 简述贝叶斯判别法的基本思想和方法。

4.5 简述费希尔判别法的基本思想和方法。

4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。

4.2 试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。

设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为R p,则称R1,R2⋯R p为R p的一个划分。

判别分析问题实质上就是在某种意义上,以最优的性质对p维空间R p构造一个“划分”,这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。

其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。

①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是μ1和μ2,对于一个新的样品X,要判断它来自哪个总体。

计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则X∈G1,D2(X,G1)≤ D2(X,G2)X ∈G 2 ,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为X ∈G 1 ,W(X)≥0 X ∈G 2 ,W(X)<0②多个总体的判别问题。

多元统计分析期末试题及答案

多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

多元统计分析模拟试题

多元统计分析模拟试题

多元统计分析模拟试题Tomorrow Will Be Better, February 3, 2021多元统计分析模拟试题两套:每套含填空、判断各二十道A卷1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法;2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类;3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分;4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异方差性 ,需要采用加权最小二乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为P e=√1−R28)最短距离法适用于条形的类,最长距离法适用于椭圆形的类;9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综合指标的多元统计方法;10)在进行主成分分析时,我们认为所取的mm<p,p为所有的主成分个主成分的累积贡献率达到85%以上比较合适;11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大化12)y1是随机变量,并且有y1~N(0,1),那么y12服从卡方分布;13)在对数线性模型中,要先将概率取对数,再分解处理,公式:ηij=lnp ij=lnp i+,i,j=1,2lnp.j+ln p ijp j p i14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上,解释变量必须是可测量的16)当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计分析方法17)多元正态分布是一元正态分布的推广18)多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础19)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各变量的线性组合;20)统计距离包括欧氏距离和马氏距离两类1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度;√ p1472)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法;×p243)判别分析其被解释变量为属性变量,解释变量是度量变量;√p904)Logistic回归对于自变量有要求,度量变量或者非度量变量都不可以进行回归;× p2205)在系统聚类过程中,聚合系数越大,合并的两类差异越小;× P596)spss只能对单变量进行正态性检验; √7)Logistic回归中的估计参数b0,b1,b2,… ,b n)反应优势比率的变化,如果b i是正的,它的反对数值指数一定小于1; 2288)密度函数可以是负的;× p39)计算典型函数推导的典型权重有较小的不稳定性; × p20510)10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出具体的统计量来度量这种相关关系,使研究者在作用对应分析时得到主观性较强的结论;×p17911)多元检验具有概括和全面考察的特点,容易发现各指标之间的关系和差异;×p2512)名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关系;×p4313) k-均值法是一种非谱系聚类法√p4414)一般而言,不同聚类方法的结果不完全相同√p615)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的√p9016)非谱系聚类法是把变量聚集成k个类的集合;×p6417)主成分的数目大大少于原始变量的数目;√p11418)因子分析只能用于研究变量之间的相关关系;×p14319)聚类分析中的分类方法中,系统聚类法和分解法相似相反;×P4320)聚类分析的目的就是把相似的研究对象归类;√P42B卷一、填空题1. 因子分析中因子载荷系数a ij 的统计意义是第i 个变量与第j 个公因子的相关系数;P 146)2. 类平均法的两种形式为组间联结法和组内联结法 P563. 设3~(,),i 1,2,10.i x x μ∑=⋅⋅⋅则101()~i i W x μ==-∑3(10)W ∑, p54.聚类分析根据实际的需要可能有两个方向,一是对样品,一是对指标聚类;P435. 模糊聚类分析方法中对原始数据进行变换,变换方法通常有标准化变换,极差变换,对数变换 p63()1~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ∑==∑=+-6、设其中则Cov(,)=07.非谱系聚类法是把样品聚集成K 个类的集合;P648.因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组间的相关性较低;P1429.两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形;P2510.因子旋转分为正交旋转和斜交旋转;P15011.Q 型聚类是指对样品进行聚类,R 型聚类是指对指标变量进行聚类;42页12. 一元回归的数学模型是: y =β0+β1x +ε,多元回归的数学模型是:_y =β0+β1x 1+β2x 2+ βp x p +ε_;13.变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. 43页 14. 判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法;80页15若12112~(,),,~(,),0,p p p W n n W n A A ∑≥∑∑>,且A 1和A 2相互独立,则112~AA A+12p n n Λ(,,). ;19页16. 对应分析是将R 型因子分析和Q 型因子分析结合起来进行的统计分析方法;170页17. 典型相关分析是研究两组变量之间相关分析的一种多元统计方法;194页18.判别分析适用于被解释变量是非度量变量的情形; 19. 主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法;113页20. 设i x ,1,2,16i =⋅⋅⋅是来自多元正态总体(,)p N μ∑,X 和A 分别为正态总体(,)p N μ∑的样本均值和样本离差阵,则2115[4(X )][4(X )]~T A μμ-'=--2(15P)T ,二、判断题1、 对于任何随机向量X='21)X ...,X X p ,,(来说,其协方差阵∑都是对称阵,同时总是非负定的; T P52、 能够体现各个变量在变差大小上的不同,以及有时存在的相关性还要求距离与各变量所用的单位无关,这种距离是欧式距离; F P73、 最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止; F P554、 当总体21G G 和为正态总体且协方差相等时,选用马氏距离; T P905、 进行主成分分析的目的之一是减少变量的个数,所以一般不会去p 个主成分,而是取mm<p 个主成分; T P1196、 第k 个主成分k Y 与原始变量i X 的相关系数 k Y ,i X 称为因子负荷量;T P1207、 F=’),,(m 21F ......,F F m<p 是不可观测的变量,其均值向量EF=0,协方差矩阵covF=I,即向量F 的各分量不是相互独立的; F P1458、 每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量;T P2029、 分组数据的Logistic 回归不仅适用于大样本的分组数据,对小样本的未分组数据也适用;F P23210、 一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达,就称这个为参数可识别; T P26411、 随机向量 的协方差阵一定是对称的半正定阵;T P512、 标准化随机变量的协方差阵与原变量的相关系数相同; T P513、 对应分析反应的是列变量与行变量的交叉关系; F P17014、 若一个随机向量的任何边缘分布均为正态,则它是多元正态分布;T p1015、特征函数描述空间的元素之间是否有关联,而隶属度描述了元素之间的关联是多少; T p6216、非谱系聚类法是把变量聚集成K个类的集合; F p6417、在对因素A和因素B进行对应分析之前没有必要进行独立性检验; Tp17318、系统聚类法中的“离差平方和法”的基本思想来源于如果类分得正确,同类样品的离差平方和应该较小,类与类之间的离差平方和应该较大;T p5719、距离判别法对总体的分布没有特定的要求; T p9020、 Wilks统计量可以化成T2统计量但是化不成F统计量; F p18。

多元统计分析基础练习题参考答案

多元统计分析基础练习题参考答案

注意:基本格式和前面罗老师的要求一致,这是统计分析的基本格式。

表格最好用三线表,不用也行,但基本格式要规范,不能把软件里的表格直接copy 过来!下面参考答案,大家主要看一下,要如何分析数据,格式上,我没太多时间规范排版,很多直接从软件中copy 过来的,这不规范!不要学!求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(0.05α=)。

(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。

(7)求人均GDP 为5000元时,人均消费水平95%的置信区间和预测区间。

解:(1)可能存在线性关系。

(2)相关系数:有很强的线性关系。

(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

表1 回归系数模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。

人均GDP对人均消费的影响达到99.6%。

(5)F 检验:734.6930.30950002278.693y =+⨯=(元)。

多元统计复习题及答案

多元统计复习题及答案

填空题:1、费希尔(Fisher)判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上。

2、因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。

3、K均值聚类分析的基本思想是将每一个样品分配给最接近业壶些直的类中。

4、对应分析是将R型因子分析Q型因子分析结合起来进行的统计分析方法。

5、总体方差未知的情况下,采用样本方差代替总体方差的方法进行计算。

6、主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转7、设X、N2 ( U , N),其中X=(》1,》2),号),则CovQq +》2,*1 - *2)= _0__8、判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判另U法、Bayes判另U法、逐步判另U法9 多元正态分布的任何边缘分布为正态分布10、应用多元统计分析方法用于解决多指标问题,聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为Q型聚类和R型聚类。

11、总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为(P )和(n-p-1),其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。

12、系统聚类分析方法有最短距离法、最长距离法、中间距离法、重心法、类平均统和可变类平均法。

13、典型相关分析是研究两组变量之间相关关系的一种多元统计方法14、因子分析中因子载荷系数叫,•的统计意义是:(第i个变量与第j个公因子的相关系数)15、相应分析的特点是研究的变量是定性的16、公共因子方差与特殊因子方差之和为o17、设Z 是总体X=(X”…,乂皿)的协方差阵,X 的特征根人。

=1,2,..・田)与对应的单位正交化特征向量% =(%,%2,,则第一主成分的表达式=% ]X| + %2、2 + ・•• + /mX"],方差为2]18、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示19聚类分析一是分析如何对样品或变量进行量化分类的问题。

多元统计期末考试试题

多元统计期末考试试题

多元统计期末考试试题一、选择题(每题2分,共20分)1. 以下哪项不是多元统计分析中常用的数据预处理方法?- A. 标准化- B. 归一化- C. 特征选择- D. 数据清洗2. 多元回归分析中,当自变量之间存在高度相关性时,我们通常称之为:- A. 多重共线性- B. 正态性- C. 同方差性- D. 独立性3. 以下哪项不是主成分分析(PCA)的目的?- A. 降维- B. 特征选择- C. 变量解释- D. 增加数据的维度4. 聚类分析中,若要衡量聚类效果,常用的指标不包括:- A. 轮廓系数- B. 熵- C. 戴维斯-库尔丁指数- D. 距离方差5. 因子分析中,因子载荷矩阵的元素表示:- A. 观测变量的均值- B. 因子的方差- C. 观测变量与因子之间的关系- D. 因子之间的相关性二、简答题(每题10分,共30分)1. 请简述多元线性回归分析的基本假设,并说明违反这些假设可能带来的问题。

2. 描述主成分分析(PCA)的基本步骤,并说明其在数据降维中的应用。

3. 聚类分析与分类分析有何不同?请举例说明。

三、计算题(每题25分,共50分)1. 假设有一组数据,包含三个变量X1、X2和Y,数据如下:| X1 | X2 | Y ||-|-|-|| 1 | 2 | 3 || 2 | 4 | 6 || 3 | 6 | 9 || 4 | 8 | 12 |请计算多元线性回归模型的参数,并检验模型的显著性。

2. 给定以下数据集,进行K-means聚类分析,选择K=3,并计算聚类中心。

| 变量1 | 变量2 | 变量3 ||--|-|-|| 1.2 | 2.3 | 3.4 || 1.5 | 2.5 | 3.6 || 4.1 | 5.2 | 6.3 || 4.4 | 5.6 | 6.8 || 7.1 | 8.2 | 9.3 || 7.4 | 8.6 | 9.9 |四、论述题(每题30分,共30分)1. 论述因子分析与主成分分析的异同,并讨论它们在实际应用中可能遇到的问题及解决方案。

多元统计期末考试题及答案

多元统计期末考试题及答案

多元统计期末考试题及答案一、选择题(每题2分,共20分)1. 在多元线性回归中,如果一个变量的系数为0,这意味着什么?A. 该变量对因变量没有影响B. 该变量与因变量完全相关C. 该变量与因变量无关D. 该变量是多余的2. 主成分分析(PCA)的主要目的是什么?A. 减少数据的维度B. 增加数据的维度C. 找到数据的均值D. 找到数据的中位数3. 以下哪个不是聚类分析的优点?A. 可以揭示数据的内在结构B. 可以用于分类C. 可以减少数据的维度D. 可以找到数据的异常值4. 在因子分析中,如果一个因子的方差贡献率很低,这通常意味着什么?A. 该因子对数据的解释能力很强B. 该因子对数据的解释能力很弱C. 该因子是多余的D. 该因子是重要的5. 以下哪个是多元统计分析中常用的距离度量?A. 欧氏距离B. 曼哈顿距离C. 切比雪夫距离D. 所有以上选项二、简答题(每题10分,共30分)6. 解释什么是多元线性回归,并简述其在实际问题中的应用。

7. 描述主成分分析(PCA)的基本原理,并举例说明其在数据分析中的作用。

8. 简述聚类分析的过程,并讨论其在商业数据分析中的应用。

三、计算题(每题25分,共50分)9. 假设有以下数据集,包含两个变量X和Y,以及它们的观测值:| 观测 | X | Y |||||| 1 | 2 | 3 || 2 | 3 | 4 || 3 | 4 | 5 || 4 | 5 | 6 |请计算X和Y的协方差,并解释其意义。

10. 给定以下数据集,进行聚类分析,并解释聚类结果:| 观测 | 变量1 | 变量2 |||-|-|| 1 | 1.5 | 2.5 || 2 | 2.0 | 3.0 || 3 | 3.5 | 4.5 || 4 | 4.0 | 5.0 |多元统计期末考试题答案一、选择题1. A2. A3. C4. B5. D二、简答题6. 多元线性回归是一种统计方法,用于分析两个或两个以上的自变量(解释变量)与一个因变量之间的关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2013级信息与计算《多元统计分析》练习题
1.已知12x X x ⎛⎫= ⎪⎝⎭的密度函数为()221212121211(,)exp 2222146522f x x x x x x x x π⎧⎫=-++--+⎨⎬⎩⎭
试求X 的均值向量和协方差阵。

2.1233231311642(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫
⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭
-⎛⎫+ ⎪⎝⎭
设其中试判断与是否独立?
3.设(),p X N μ∑,p p A ⨯为对称阵,试证明
(1)()E XX μμ''=∑+ (2)()()E X AX tr A A μμ''=∑+
(2) 设,A B 为矩阵,证明:
cov(,)cov(,)AX BY A X Y B '= ()()D A X A D X A
'= 4.已知 123(,,)X x x x '=的协方差阵为:
5
232
30302⎛⎫ ⎪∑= ⎪ ⎪⎝⎭
求(1)123var(2)x x x -+(2)设1122123y ,x x y x x x =+=++求12cov(y ,y ) 5. 123(,,)X x x x '=的协方差阵为:
的协方差阵为:30424394024060⎛⎫ ⎪∑= ⎪ ⎪⎝⎭
求(1)控制一个变量其余两个变量之间的偏相关系数,
(2)1x 对23(,)x x '的全相关系数。

6.设随机向量有密度函数 223122212()2(,)(2)()x
y f x y x y e π---+=+,
证明:相关系数(,)0x y ρ=,但,x y 不独立
7.设有总体(),p X N μ∑,设()1(,,)i i i p X x x '=,(1,2,,)i n =为元正态总体的简单随机样本,试求,μ∑的极大似然估计。

8.设()()1,,q X x x ααα=,1,,N α=是来自参数为'1(,,)q B b b =及n 的多项式分布的随机样本,试求B 的极大似然估计量。

9.人的出汗多少与人体内钠和钾的含量有一定关系,今测量了20名健康成年女性的出汗量()钠的含量和钾的含量,由样本值计算得
(4.64,45.4,9.965)X =及样本离差阵的逆阵
10.030850.001160.013580.001160.000310.000080.013580.000080.02115L --⎛⎫ ⎪=- ⎪ ⎪⎝⎭
试检验00:(4,50,10)H μμ==。

10.设抽取六个样品,每个样品只测了两个指标,它们是
{}{}{}{}{}{}1,1.5,0.5,1,1.2,1.7,2,0,3,5,2.5,2.0 试用最短距离法和最长距离法对六个样品进行聚类(定义样品之间距离采用绝对距离);要求:(1)写出聚类过程(2)画出树形图 (3)写出聚类为两类的聚类结果。

11.下面是5个样品两两之间的距离阵
(0)0406901710063580D ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭
试用最长距离法作系统聚类,并作出谱系聚类图。

12. 设三个总体123,,G G G 的分布分别为:222(2,(0.5)),(0,2),(3,1)N N N 试问样品 2.5x =应判为哪一类?
(1)、按距离判别
(2)、按Bayes 判别准则(12313q q q ===,1(|)0
i j L j i i j
≠⎧=⎨=⎩) 13.设随机向量123(,,)T X X X X = 的协方差阵为
5
000
21012⎛⎫ ⎪∑= ⎪ ⎪⎝⎭
试求:(1)累计贡献率的主成分。

(2)各主成分的方差
(3)各主成分之间的相关系数
14.设随机向量123(,,)T X X X X =的协方差阵为(0)∑∑≥ ,设随机向量123(,,)T Y Y Y Y =的协方差阵为2I σ∑+ ,其中20σ> 为常数,I 为单位阵,证明P X '是X 的主成分的充要条件是P Y '是Y 主成分,其中P 是正交阵。

15.设随机向量()12344,,,(,)T X X X X X N μ=∑
1
1,0111ρρρρρρρρρρρρρ∑=<≤⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭
(1) 试从Σ出发求X 的第一总体主成分;
(2) 试问当 取多大时才能使第一主成分的贡献率达95%以上。

16.设()'123X x x x =的相关系数矩阵通过因子分析分解为
121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫
- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪ ⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝
⎭则1X 的共性方差=________,1X 的方差11σ=______________,第一公因子1F 对X 的贡献=_______________。

17.设标准化后随机向量123(,,)T X X X X =的协方差阵为10001130131⎛⎫ ⎪∑= ⎪ ⎪⎝⎭
使用主成分法进行因子分析,并计算(1)累计贡献率75%≥ 的公因子,写出因子模型;(2)每个公因子的方差贡献;()各个变量与公因子的协方差。

18.设标准化后随机向量123(,,)T X X X X =的
协方差阵为10.630R 0.6310.350.450.351⎛⎫ ⎪= ⎪ ⎪⎝⎭
ρ
R 的特征值和相应地正则化特征向量分别为: 1122331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572,(0.7494,0.6379,0.1772)l l l λλλ'
=='==--'
==--
求(1)用主成分法计算因子载荷阵,并建立因子模型
(2)计算各公因子的方差贡献,并说明其含义。

19.掌握各个实验的输出结果的正确解读和分析。

相关文档
最新文档