厦门大学《应用多元统计分析》试题B
厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

思考与练习2.1 试述多元联合分布和边缘分布之间的关系。
2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。
2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为:()()()()()()()()()121122222,d c x a b a x c x a x c f x x b a d c −−+−−−−−2⎡⎤⎣⎦=−−其中,。
求:12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。
⑵ 随机变量1X 和2X 的协方差和相关系数。
⑶ 判断1X 和2X 是否相互独立。
2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。
2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号目前工资 (美元)受教育年限(年)初始工资 (美元)工作经验(月)11 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。
2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1~(,p N nX μΣ)。
2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。
2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。
厦门大学统计学试卷B(含答案及评分标准)

统计学试卷B (含答案及评分标准)10分。
(将唯一正确答案的序号写在括号内)1.产品质量的检查应该采用( )。
A.重点调查的方法;B.典型调查的方法;C.普查的方法;D.抽样检验的方法;2.我国的统计调查方法体系中,作为“主体”的是( )A.经常性抽样调查;B.必要的统计报表;C.重点调查及估计推算等;D.周期性普查;3.某商场销售额2004年与2003年相比为120%,同期价格水平下降2%,则该商场销售量指数为( )A.133%; B.122.4%; C.122%; D.118%;4.在具有报告期实际商品流转额和几种商品价格的个体指数资料的条件下,要确定价格的平均变动,应该使用( )指数。
A.综合;B.加权算术平均;C.加权调和平均;D.可变构成;5.复相关系数的取值区间为:( )A. 11≤≤-R ;B. 1≤≤∞-R ;C.10≤≤R ;D.∞≤≤-R 1;6.在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量( )。
A.扩大为原来的4倍B. 扩大为原来的2倍C.缩小为原来的二分之一D. 缩小为原来的四分之一7.在长期趋势分析中,如果被研究现象的各年逐期增长量大致相同,则该现象可拟合( )模型。
A.直线; B.二次曲线; C.指数曲线; D.双曲线;8.随着收入水平的提高,下列指标中呈下降趋势的有:( )A.恩格尔系数;B.基尼系数;C.全员劳动生产率;D.投资率9.下列指标中,反映分布离散程度的指标有:( )A.几何平均数;B.决定系数;C.变异系数;D.回归系数;10.在其他条件相同的前提下:不重复抽样误差( )A. 大于重复抽样误差;B. 小于重复抽样误差C. 等于重复抽样误差;D. 与重复抽样误差何者更大无法判定二、多项选择题每小题2分共10分(正确答案包含1至5项,请将正确答案的序号写在1. 常见的离散型分布有:()A.正态分布B.二项分布C.t分布D.F 分布E.卡方分布2.下列定理中,哪两个属于统计推断的数理基础()。
多元统计分析期末试题及答案

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
厦门大学 应用多元统计分析 试题B

厦门大学应用多元统计分析试题B厦门大学[应用多元统计分析]试题B厦门大学《多元统计分析》试卷B经济学院计统系级本科生一、判断并改错(每题3分)1. 距离判别是Bayes判别的一种特例。
()2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和应该较小,不同类样品之间的离差平方和应该较大。
()3. 在对因素A和因素B进行相应分析之前没有必要进行独立性检验。
()4. 相应分析反应的是列变量和行变量的交叉关系。
()5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。
()二、(12%)设X(1),K,X(n)是来自Np(μ,Σ)的随机样本,ci≥0(i=1,L,n),∑ci=1,令Z=∑ciX(i)。
试证明:1)Z是μ的无偏估计量;2)Z~Np(μ,c'cΣ),其中c=(c1,L,cn)'。
三、简述题(第1题6分,第2题8分,第3题6分,第4题6分) 1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
2. 比较主成分分析与因子分析的异同点。
3. 简述相应分析的基本思想。
4. 简述典型相关分析的基本思想。
四、计算题(第1题10分,第2题15分,第3题10分,第4题10分) 1. 设有两个正态总体G1和G2,已知:⎡10⎡⎡20⎡⎡1812⎡⎡20−7⎡,μ(1)=⎡⎡,μ(2)=⎡⎡,Σ1=⎡Σ=⎡2⎡⎡, 1525123275−⎡⎡⎡⎡⎡⎡⎡⎡⎡20⎡试用距离判别法判断:样品:X=⎡⎡,应归属于哪一类?⎡20⎡2.下面是5个样品两两间的距离矩阵⎡⎡0⎡(0)⎡ D90⎡7100⎡试用最长距离法作系统聚类,并画出谱系聚类图。
⎡0⎡4⎡=⎡6⎡⎡1⎡⎡6⎡3. 设三元总体X的协方差阵为Σ=⎡ρσ2⎡0⎡ρσ2σ2ρσ20⎡⎡ρσ2⎡,试求总体主成4. 设标准化变量X1,X2,X3的协差阵(即相关阵)为⎡1.000.630.45⎡⎡, R=⎡0.631.000.35⎡⎡⎡⎡0.450.351.00⎡⎡R的特征值和相应的正则化特征向量分别为:λ1=1.9633,λ2=0.6795,λ3=0.3572,l1=(0.6250,0.5932,0.5075)'l2=(−0.2186,−0.4911,0.8432)'l3=(0.7494,−0.6379,−0.1772)'1)计算因子载荷矩阵A,并建立因子模型; 2)计算公因子Fj的方差贡献g2 j(j=1,2,3),并说明其统计意义。
研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

≠
μ0 ; (α
=
0.05) 。
3.5 测量 30 名初生到 3 周岁婴幼儿的身高( x1 )和体重( x2 )数据如
下表所示,其中男女各 15 名。假定这两组都服从正态总体且协方差阵相等,
试在显著性水平α = 0.05 下检验男女婴幼儿的这两项指标是否有差异。
编号 1
男
x1
x2
54
3
女
x1
x2
54
1 LF HF 3.71 1.76 3.63 3.17 4.49 4.08 5.70 4.78 4.96 3.39 5.83 4.02 5.22 5.08 4.15 2.39
2 LF HF 3.96 2.47 3.64 3.19 4.86 4.12 5.72 5.44 5.14 3.88 5.64 4.06 5.03 4.99 4.15 2.08
2 LF HF 4.29 3.03 4.69 4.77 5.28 4.41 5.05 3.28 4.94 3.56 4.54 3.28 4.26 3.11 5.56 5.36
3 LF HF 4.77 3.57 4.58 3.04 5.37 4.79 4.65 2.86 4.68 3.97 4.61 4.40 5.27 3.88 5.55 5.00
时各小时的低频心电频谱值(LF)、高频心电频谱值(HF),资料见下表。试
分析这两个指标的各次重复测定均值向量是否有显著差异(α = 0.05 )。
3
1 LF HF 4.66 2.89 4.54 4.65 5.91 4.53 4.95 3.31 5.51 3.78 4.22 2.61 4.61 3.10 5.08 4.38
1
4
4
1
2
厦门大学《应用多元统计分析》习题第09章 典型相关分析

思考与练习9.1 什么是典型相关分析?简述其基本思想。
9.2 什么是典型变量?它具有哪些性质?9.3 试析一组变量的典型变量与其主成分的联系与区别。
9.4 简述典型相关分析中载荷分析的内容及作用。
9.5 简述典型相关分析中冗余分析的内容及作用。
9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变量分别为()i a X ′、()i b Y ′,典型相关系数为i λ,(1,,)i p =L 。
令*X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ××阶非奇异阵,、分别为p 维、q 维随机向量,试证明l m1⑴ **X Y 、的第i 对典型变量为1()i C a X −*′、1()i D b Y −*′。
⑵ 1()*i C a X −′与1()*i D b Y −′的典型相关系数为i λ。
9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为10.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成绩如下表:闭卷 开卷 闭卷 开卷力学 物理 代数分析统计力学物理代数分析 统计 1X 2X 3X 4X5X1X 2X3X 4X5X77 82 676781637880708175 73 7166815572637068 63 63 6570635361726473 51 67 6565685970686256 62 60 5862706472606245 52 64 6063545567596244 50 50 6455636563585637 31 55 6057766064565440 44 69 5353534269615545 62 46 6157453149626362 44 61 5262454941614964 12 58 6163674953496247 54 49 5647535453465944 44 56 5561361844505781 46 52 6550353245495764 30 69 5052454649535937 40 27 5461613142485468 36 59 51455156405654 5 46 56 5749324542555640 42 60 5449334063535425 23 55 5953444848495137 41 63 4946344652534140试对闭卷( 21X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∑ 二、(12%)设 X(1) ,K, X(n) 是来自 N p (μ, Σ) 的随机样本,ci ≥ 0(i = 1,L, n), ci = 1, i=0
n
∑ 令 Z = ciX(i) 。试证明: i=0
1) Z 是 μ 的无偏估计量;
2) Z ~ N p (μ,c'cΣ) ,其中 c = (c1,L, cn )' 。
1. 设有两个正态总体 G1 和 G2 ,已知:
μ(1)
=
⎡10 ⎢⎣15
⎤ ⎥⎦
,
μ
(
2)
=
⎡20⎤ ⎢⎣25⎥⎦ ,
Σ1
=
⎛18 ⎜⎝12
12 ⎞
32
⎟, ⎠
Σ2
=
⎛ 20
⎜ ⎝
−7
−7 ⎞
5
⎟, ⎠
试用距离判别法判断:样品:
X
=
⎡20⎤ ⎢⎣20⎥⎦
,应归属于哪一类?
1
2.下面是 5 个样品两两间的距离矩阵
厦门大学《多元统计分析》试卷 B
经济学院计统系
级 专业
本科生
一、判断并改错(每题 3 分) 1. 距离判别是 Bayes 判别的一种特例。( ) 2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和
应该较小,不同类样品之间的离差平方和应该较大。( ) 3. 在对因素 A 和因素 B 进行相应分析之前没有必要进行独立性检验。( ) 4. 相应分析反应的是列变量和行变量的交叉关系。( ) 5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。( )
(0 < ρ ≤ ห้องสมุดไป่ตู้ 2) 。
4. 设标准化变量 X1, X 2 , X3 的协差阵(即相关阵)为
⎡1.00 0.63 0.45⎤ R = ⎢⎢0.63 1.00 0.35⎥⎥ ,
⎢⎣0.45 0.35 1.00⎥⎦
R 的特征值和相应的正则化特征向量分别为:
λ1 = 1.9633, λ2 = 0.6795, λ3 = 0.3572, 要求:
三、简述题(第 1 题 6 分,第 2 题 8 分,第 3 题 6 分,第 4 题 6 分)
1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
2. 比较主成分分析与因子分析的异同点。
3. 简述相应分析的基本思想。
4. 简述典型相关分析的基本思想。
四、计算题(第 1 题 10 分,第 2 题 15 分,第 3 题 10 分,第 4 题 10 分)
⎡0
⎤
⎢⎢4 0
⎥ ⎥
D(0) = ⎢6 9 0
⎥
⎢⎢1 7 10 0
⎥ ⎥
⎢⎣6 3 5 8 0⎥⎦
试用最长距离法作系统聚类,并画出谱系聚类图。
⎡ σ 2 ρσ 2 0 ⎤
3. 设 三 元 总 体 X 的 协 方 差 阵 为 Σ = ⎢⎢ρσ 2
σ2
ρσ
2⎥ ⎥
,试求总体主成分
⎢⎣ 0 ρσ 2 σ 2 ⎥⎦
l1 = (0.6250, 0.5932, 0.5075)' l2 = (−0.2186, −0.4911, 0.8432)' l3 = (0.7494, −0.6379, −0.1772)'
1)计算因子载荷矩阵 A ,并建立因子模型;
2)计算公因子
Fj
的方差贡献
g
2 j
(
j
=
1,
2,
3)
,并说明其统计意义。
2