西南交通大学研究生数理统计与多元统计考试 试题答案
数理统计学考试题及答案

数理统计学考试题及答案一、单项选择题(每题3分,共30分)1. 下列哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 假设检验中,若原假设为H0:μ=μ0,备择假设为H1:μ≠μ0,则该检验属于:A. 单尾检验B. 双尾检验C. 左尾检验D. 右尾检验答案:B3. 以下哪个分布是描述二项分布的?A. 正态分布B. t分布C. F分布D. 泊松分布答案:A4. 以下哪个选项是描述数据离散程度的统计量?A. 众数B. 中位数C. 极差D. 均值答案:C5. 以下哪个选项是描述数据分布形态的统计量?A. 偏度B. 方差C. 标准差D. 均值答案:A6. 以下哪个选项是描述数据分布集中趋势的统计量?A. 偏度B. 峰度C. 众数D. 标准差答案:C7. 以下哪个选项是描述数据分布离散程度的统计量?A. 偏度B. 峰度C. 标准差D. 均值答案:C8. 以下哪个选项是描述数据分布形态的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C9. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 均值D. 偏度答案:C10. 以下哪个选项是描述数据分布离散程度的统计量?A. 均值B. 众数C. 方差D. 偏度答案:C二、多项选择题(每题4分,共20分)1. 以下哪些统计量可以用来描述数据的集中趋势?A. 均值B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差C. 标准差D. 均值答案:ABC3. 以下哪些统计量可以用来描述数据的分布形态?A. 偏度B. 峰度C. 均值D. 方差答案:AB4. 以下哪些分布是描述连续型随机变量的?A. 正态分布B. 泊松分布C. 二项分布D. t分布答案:AD5. 以下哪些检验是用于检验总体均值的?A. t检验B. 方差分析C. 卡方检验D. F检验答案:A三、计算题(每题10分,共50分)1. 给定一组数据:2, 4, 6, 8, 10,求其平均数和标准差。
(完整版)多元统计复习题附答案

复习题原文:答案:4.2 试述判别分析的实质。
4.3 简述距离判别法的基本思想和方法。
4.4 简述贝叶斯判别法的基本思想和方法。
4.5 简述费希尔判别法的基本思想和方法。
4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
4.2 试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为R p,则称R1,R2⋯R p为R p的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对p维空间R p构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是μ1和μ2,对于一个新的样品X,要判断它来自哪个总体。
计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则X∈G1,D2(X,G1)≤ D2(X,G2)X ∈G 2 ,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为X ∈G 1 ,W(X)≥0 X ∈G 2 ,W(X)<0②多个总体的判别问题。
西南交通大学研究生数理统计与多元统计考试 试题答案

西南交通大学研究生2016-2017 学年第(1)学期考试试卷答案课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 1、设总体X (0,1)N :,12n ,,,X X X L 是来自正态的简单随机样本,其中ξ=,321241)3i i n ii nX X η==-=∑∑(试推断统计量ξ和η的分布。
解:=(1)X t n ξ=-:(5分)32321122441)33(3-3)-3ii i i nniii i XnX F n XXn ====-=~∑∑∑∑(,()(5分)2、设某种元件的使用寿命X 的概率密度为()1(;)0x ex f x x μθμθθμ--⎧≥⎪=⎨⎪<⎩其中00θμ>>,为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数,μθ的极大似然估计量;(2) 试求参数,μθ的矩估计量.解:1121()1(,,,)1(,,),ni i n nx i i ni L X X X f x ex μθθμθμμθ=--=∑==>∏L 极大似然函数为:(2分)1211ln (,,,)ln (),nn ii i L X X X n x x θμθμμθ==--->∑L (1分)21ln (,)1(),nii i L n x x μθμμθθθ=∂-=+->∂∑(2分)ln (,)0,i L nx θμμμθ∂=>>∂(2分)12(1)(2)(),,...,:...n x x x x x x ≤≤≤的顺序统计值为(1)1ˆmin i i nX X μ≤≤==,()X θ∧1=X-,(2分) 1()x uEX xf x dx xedx μθθμθ--+∞+∞-∞===+⎰⎰(2分)22221()2()x uEX x f x dx x edxμθθμθθμ--+∞+∞-∞===++⎰⎰(2分)1222121211212()ˆˆn ii X X n X θθθθθθθθ=⎧+=⎪⎨++=⎪⎩⎧=⎪⎪⎨⎪=⎪⎩∑解方程得矩估计为:-(2分)3.抛一枚硬币,设正面向上的概率为θ,提出如下假设: 0113::24H H θθ==如果检验规则为:将该硬币抛掷5次,若正面向上的次数多余3次,则拒绝0H 。
多元统计复习题及答案

填空题:1、费希尔(Fisher)判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上。
2、因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。
3、K均值聚类分析的基本思想是将每一个样品分配给最接近业壶些直的类中。
4、对应分析是将R型因子分析Q型因子分析结合起来进行的统计分析方法。
5、总体方差未知的情况下,采用样本方差代替总体方差的方法进行计算。
6、主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转7、设X、N2 ( U , N),其中X=(》1,》2),号),则CovQq +》2,*1 - *2)= _0__8、判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判另U法、Bayes判另U法、逐步判另U法9 多元正态分布的任何边缘分布为正态分布10、应用多元统计分析方法用于解决多指标问题,聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为Q型聚类和R型聚类。
11、总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为(P )和(n-p-1),其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。
12、系统聚类分析方法有最短距离法、最长距离法、中间距离法、重心法、类平均统和可变类平均法。
13、典型相关分析是研究两组变量之间相关关系的一种多元统计方法14、因子分析中因子载荷系数叫,•的统计意义是:(第i个变量与第j个公因子的相关系数)15、相应分析的特点是研究的变量是定性的16、公共因子方差与特殊因子方差之和为o17、设Z 是总体X=(X”…,乂皿)的协方差阵,X 的特征根人。
=1,2,..・田)与对应的单位正交化特征向量% =(%,%2,,则第一主成分的表达式=% ]X| + %2、2 + ・•• + /mX"],方差为2]18、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示19聚类分析一是分析如何对样品或变量进行量化分类的问题。
多元统计分析期末试题及答案

4、 __________, __________, ________________。
(1) 试从Σ出发求X 的第一总体主成分;(2) 试问当 取多大时才能使第一主成分的贡献率达95%以上。
1、0 2、W 3(10,∑) 3、211342113611146R ⎛⎫-⎪ ⎪ ⎪=-- ⎪ ⎪ ⎪- ⎪⎝⎭4、0.872 1 1.7435、T 2(15,p )或(15p/(16-p))F (p ,n-p )一、填空题:1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论和方法.2、回归参数显着性检验是检验 解释变量 对 被解释变量 的影响是否着.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q 型 聚类和 R 型 聚类。
4、相应分析的主要目的是寻求列联表 行因素A 和 列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为 公共因子 ,另一部分为 特殊因子 。
6、若()(,),P x N αμα∑=1,2,3….n 且相互独立,则样本均值向量x 服从的分布为_x ~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
ρ(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A 和B ,其中因素A 包含r 个水平,因素B 包含c 个水平。
对这两组因素作随机抽样调查,得到一个rc 的二维列联表,记为 。
西南交通大学 数理统计考试题

西南交通大学研究生2015-2016 学年第(1)学期考试试卷课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 题号 一 二 三 四 五 六 七 八 总成绩 得分阅卷教师签字:1.设129,,,XX X L 是来自正态总体X 的简单随机样本,其中1161()6Y X X =++L ,27891()3Y X X X =++,922271()2i i S X Y ==−∑,12)Y Y Z S−=试推断统计量Z 的分布。
(10分)解:因为129,,,X X X L 相互独立且服从正态分布2(,)N μσ,则有26111~(,)66i i Y X N σμ==∑,29271~(,)33i i Y X N σμ==∑----------------------------------(2分)且相互独立, 22212~(0,)(0,)632Y Y N N σσσ−+=,~(0,1)N -----------------------------(3分)又因2S 为样本方差,所以由定理得 2222~(2)S χσ,---------------------------------(2分)且2S 与1Y 与2Y 相互独立,故与12Y Y −也是相互独立的,于是由t 分布定义知12)~(2)Y Y Z t S −==---------------------------------(3分)即统计量Z 服从自由度为2的t 分布。
2. 设某种元件的使用寿命X的概率密度为2()2(;)0x e x f x x θθθθ−−⎧>=⎨≤⎩其中0θ>为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数θ的极大似然估计量ˆθ极;(2)求极大似然估计 ˆθ极的方差。
(15分)解:(1)由X 的概率密度函数,得似然函数112()112()22()(;)2=22(1,2,,)i nni i i i n nx i i i x x n nni L f x e eex i n θθθθθθ==−−==−−−+==∑∑=>=∏∏L ---------------------------------(2分)取对数得:1ln ()ln 222(1,2,,)ni i i L n x n x i n θθθ==−+>=∑L ---------------------------------(2分)再对θ求导得:ln ()20(1,2,,)i d L n x i n d θθθ=>>=L ---------------------------------(1分)即()L θ是单调增加的,虽然θ越大则()L θ越大,但θ必须满足条件(1,2,,)i x i n θ<=L所以当取θ为12,,,n x x x L 中最小值(1)x 时,()L θ取得满足条件的最大值,所以θ的最大似然估计值为(1)12ˆmin{,,,}nx x x x θ==L ---------------------------------(2分) (2)2()1()0x e x F x x θθθ−−⎧−≥=⎨<⎩---------------------------------(1分) 2()(1)1()1(1())0n x ne x F x F x x θθθ−−⎧−≥=−−=⎨<⎩---------------------------------(1分) 2()(1)(1)()2()0n x dF x ne x f x dxx θθθ−−⎧≥==⎨<⎩--------------------------------(1分)2()(1)122n x EX x ne dx nθθθ+∞−−==+∫--------------------------------(2分)22()2(1)1[]22n x E X x ne dx nθθθθ+∞−−==++∫--------------------------------(2分)22(1)(1)(1)2(21)11[][][]4n D X E X EX n n nθ−=−=+−------------------------------(1分)3. 假设0.50,1.25,0.80,2.00是来自总体X 的简单随机样本值,已知ln Y X =服从正态分布(,1)N μ。
研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
多元统计复习题附答案

复习题原文:答案:4.2 试述判别分析的实质。
4.3 简述距离判别法的基本思想和方法。
4.4 简述贝叶斯判别法的基本思想和方法。
4.5 简述费希尔判别法的基本思想和方法。
4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
4.2 试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ 2,对于一个新的样品X ,要判断它来自哪个总体。
计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),则X ,D2(X ,G 1)D 2(X ,G 2)X ,D2(X ,G 1)> D 2(X ,G 2,具体分析,2212(,)(,)D G D G -X X111122111111111222111211122()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为X ,W(X)X ,W(X)<0②多个总体的判别问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西南交通大学研究生2016-2017 学年第(1)学期考试试卷答案
课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 1、设总体X (0,1)N :,12n ,,,X X X L 是来自正态的简单随机样本,其中
ξ=
,3
2
1
2
4
1)3i i n i
i n
X X η==-=∑∑(试推断统计量ξ和η的分布。
解:
=
(1)
X t n ξ=
-:(5分)
3
23
2
1
1
224
4
1)33
(3-3)-3i
i i i n
n
i
i
i i X
n
X F n X
X
n ====-=
~∑∑∑∑(,()
(5分)
2、设某种元件的使用寿命X 的概率密度为
()
1(;)0x e
x f x x μθμθθ
μ
--⎧≥⎪=⎨⎪<⎩
其中00θμ>>,为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数,μθ的极大似然估计量;(2) 试求参数,μθ的矩估计量.
解:
1
121
()
1(,,,)1
(,,),
n
i i n n
x i i n
i L X X X f x e
x μθ
θμθμμ
θ
=-
-=∑==
>∏L 极大似然函数为:(2分)
121
1
ln (,,,)ln (),
n
n i
i i L X X X n x x θμθμμθ
==--
->∑L (1分)
21ln (,)1(),
n
i
i i L n x x μθμμθθθ=∂-=+->∂∑(2分)
ln (,)0,
i L n
x θμμμθ
∂=>>∂(2分)
12(1)(2)(),,...,:...n x x x x x x ≤≤≤的顺序统计值为
(1)1ˆmin i i n
X X μ
≤≤==,()X θ∧
1=X-,(2分) 1
()x u
EX xf x dx xe
dx μ
θ
θμθ
--
+∞
+∞
-∞
===+⎰
⎰
(2分)
2
2
2
21
()2()
x u
EX x f x dx x e
dx
μ
θ
θ
μθθμ--
+∞
+∞
-∞
===++⎰
⎰
(2分)
1222121211212()ˆˆn i
i X X n X θθθθθθθθ=⎧+=⎪
⎨++=⎪⎩⎧=⎪⎪⎨
⎪=⎪⎩
∑解方程得矩估计为:
-(2
分)
3.抛一枚硬币,设正面向上的概率为θ,提出如下假设: 011
3::2
4
H H θθ=
=
如果检验规则为:将该硬币抛掷5次,若正面向上的次数多余3次,则拒绝0H 。
(1)求该检验犯第一类错误的概率。
(2)求该检验犯第二类错误的概率。
(3)在硬币抛掷次数不变的情况下,为使检验的显著性水平0.05α=,应如何修改检验规则。
解:
(1)44
55
516(3|)=C (1)22
P X θθθθ>=-+= (2)5114
5223332553(3|)=(1)C (1)
4C (1)C (1)
P X θθθθθθθθ≤=-+--+-
1144455513(|)=C (1)C (1)0.052
m m m P X m θθθθθθ++->=-+-+=L ()
4. (15分)为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据,得出以下结果:
(1) 估计截距0β和斜率系数1β及其标准误,并进行t 检验;(2)回归直线未解
释的价格变差部分是多少?(3)对0β和1β分别建立95%的置信区间。
解:(1)
;
12
ˆ74.1+2.0615.9
ˆ=
13.42
102
yy xx l l n βσ
-⨯=≈--
2ˆyy xx S l b l =-剩,2ˆˆxx xy S b l bl ==回
22
2
1ˆ[],ˆ,xx xx
x Da
n l Db l σσ=+=
2
ˆ[2
a t n α±-()
2
ˆ2
b t n α±-(()
5.简要回答下列问题:1、判别分析和聚类分析有何区别?
2、在单因素方差分析中,进行总变量平方和分解的目的和意义是什么?
22
31,58,147,112,410.5,
i i i i i i x y x y x y =====∑∑∑∑∑()()14710 3.1 5.832.8
xy
i i i i l
x x y y x y nx y =--=-=-⨯⨯=-∑∑2
222()11210 3.115.9
xx i i l x x x nx =-=-=-⨯=∑∑2
222()410.510 5.874.1
yy i i l y y y ny =-=-=-⨯=∑∑32.8ˆˆˆ2.06, 5.8 2.06 3.112.1915.9xy xx l b a
y bx l -==≈-=-≈+⨯≈
6.从协方差阵相同的两个二元正态总体中,各自抽取了容量1230,25n n ==的样
本,算的_
_
_^127.2 6.0 1.040.68,2.3 3.10.680.58x x ⎛⎫⎛⎫⎛⎫==∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭。
现取一个样本 6.42.9x ⎛⎫
= ⎪⎝⎭
,
试用距离判别法判别x 的归属。
从协方差阵相同的两个二元正态总体中,根据过去收集的资料样本,已估计出
_
_
_^122422,6223x x ⎛⎫⎛⎫⎛⎫==∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭。
现取一个样本35x ⎛⎫
= ⎪⎝⎭
, 试用距离判别法判别x 的归属。
7. (13分)设12344
(,,,)~(0,)T X X X X X N =∑,其协方差矩阵为 1
11
1ρ
ρρρρ
ρρρρρ
ρ
ρ
⎛⎫ ⎪
⎪∑= ⎪
⎪⎝⎭
其中01ρ<≤ (1) 试从Σ出发求X 的第一总体主成分;
(2) 试问当ρ取多大时才能使第一主成分的贡献率达95%以上。
8. (10分)表中给出了五个样品两两间的距离,根据系统聚类法
(1)按最短距离法,第一步如何聚类?第二步如何聚类?聚类时的距离分别 是多少?(2)按最长距离法,第一步如何聚类?第二步如何聚类?
121341123114013,
11
111011111
1222
2111222x x x x Z X X X λρρρρλρρ
λρρρλρρρρλλλλρ
λρ
ρρρλρρλρ
ρλρρρρλλ--------==+--------===-----⎛⎫⎛⎫ ⎪
⎪---- ⎪
⎪= ⎪---- ⎪ ⎪
⎪----⎝⎭⎝⎭'⎛⎫
⎪⎝⎭
=++1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分4
1
11
2
1395%4
0.9541
0.9333
X λρ
λλλλρ++=
≥+++⨯-≥
≈234
(2)第一个主成分的贡献率为
得。