应用多元统计分析第六章习题解答

合集下载

多元统计分析课件第六章-判别分析例题与操作过程可修改文字

多元统计分析课件第六章-判别分析例题与操作过程可修改文字

.
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调 出判别分析主界面,将左边的变量列表中的“group”变量选 入分组变量中,将—变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判 别分析。
1
5
50.06 23.03 2.83 23.74 112.52 63.3
1
6
33.24 6.24 1.18 22.9 160.01 65.4
2
7
32.22 4.22 1.06 20.7 124.7 68.7
2
8
41.15 10.08 2.32 32.84 172.06 65.85
2
9
53.04 25.74 4.06 34.87 152.03 63.5
由此表可知,两个Fisher判别函数分别为:
y1 74.99 1.861X1 1.656X 2 0.877 X3 0.798X 4 0.098X 5 1.579X 6 y2 29.482 0.867X1 1.155X 2 0.356X 3 0.089X 4 0.054X 5 0.69 X 6
判别分析例题
例1:设有两个正态总体 G1 和 G2 ,已知:
(1)
ห้องสมุดไป่ตู้
10 15
(2)
20 25
18 12 1=12 32
20 7
2
=
7
5
试用距离判别法判断:样品:
X
20 20
,应归属于哪一类
判别分析例题 解:比较X到两个总体的马氏距离的大小
所以X属于正态总体 G1
例2:

(完整版)应用多元统计分析课后答案_朱建平版

(完整版)应用多元统计分析课后答案_朱建平版

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

应用多元统计分析课后习题答案详解北大PPT文档共40页

应用多元统计分析课后习题答案详解北大PPT文档共40页

6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡 北大
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道 理。— —爱·科 克
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克

多元统计分析课后练习答案

多元统计分析课后练习答案

第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。

当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

(完整word版)应用多元统计分析习题解答主成分分析

(完整word版)应用多元统计分析习题解答主成分分析

主成分分析6.1 试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。

当第一个组合不能提取止。

这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。

以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”6.3 简述主成分分析中累积贡献率的具体含义。

答:主成分分析把p 个原始变量12,,,p X X X 的总方差()tr Σ分解成了p 个相互独立的变量p 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。

这里我们()m p <个主成分,则称11pmm kkk k ψλλ===∑∑ 为主成分1,,m Y Y 的累计贡献率,累计贡献率表明1,,m Y Y 综合12,,,p X X X 的能力。

通常取m ,使得累计贡献率达到一个较高的百分数(如85%以上)。

答:这个说法是正确的。

即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。

从协方差矩阵出发的,其结果受变量单位的影响。

主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。

实际表明,这种差异有时很大。

我6.6 已知X =()’的协差阵为 试进行主成分分析。

解:=0计算得当时,同理,计算得时,易知相互正交单位化向量得,,综上所述,第一主成分为第二主成分为第三主成分为6.7 设X=()’的协方差阵(p为, 0<p<1证明:为最大特征根,其对应的主成分为。

证明:==,为最大特征根当时,=所以,6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。

应用多元统计分析课后答案 .doc

应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

应用多元统计分析_课后答案

应用多元统计分析_课后答案

图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350

15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−

最新应用多元统计分析课后习题答案高惠璇PPT课件

最新应用多元统计分析课后习题答案高惠璇PPT课件
X2~N(0,1).
(2) 考虑随机变量Y= X1-X2 ,显然有
YX 1X2 0 X 1X 1,当 估计
P{Y0}P{X11或 X11} P{X11}P{X11} (X1~N(0,1)) 2(1)0.317 04
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
31
第三章 多元正态总体参数的检验
证明 记rk(A)=r.
若r=n,由AB=O,知B= On×n,于是 X′AX与X′BX
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
32
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
P{X1x}(x) 17
第二章 多元正态分布及参数的估计
当-1≤x≤1时,
P{X2 x}P{X2 1}P{1X2 x} P{X1 1}P{xX1 1} P{X1 1}P{1X1 x} P{X1 x}(x)
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面. (2) 当p=2且
比较上下式相应的系数,可得:
1
2 2
2
1 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故d*=ad是一个距离. (3) 设d为一个距离,c>0为常数,显然有

di*j
dij dij c
0,且仅当 X(i)
X( j)时di*j
0;

di*j
dij dij c
dji dji c
d*ji,对一切 i, j;
4
第六章 聚类分析

d
* ij
d ij dij c
1 1 c / dij
(4)设d(1)和d(2)是距离 ,令d* d(1) •d(2).
d*虽满足2前 个条件 ,但不一定满足三式 角. 不
下面用反例来d说 *不明 一定是距 . 离
设di(j1)
di(j2)
X(i)
X(j)
(m1),则di*j
X(i)
X(j)
2
.
当X(i) 0,X(j) 1,X(k) 0.5时,di*j 1,di*k14,dk*j14. 显然不d满 i*j d足 i*kdk*.j
D(0) D(1) 604
0 9
0
16
7 3
10 5
0 8
0
① 合并{X(1),X(4)}=CL4,并类距离 D1=1.
0
D(2)
92 32
65
2
0 52 136
2
0 100
2பைடு நூலகம்
X(2) X(3) 0CX(L54)
14
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
t1
xi)2
n
t1
xt2i
nxi2
abnab2 n
(ab)[n(ab)]1(ab)(cd)
n
n
8
第六章 聚类分析
n
(xtj
t1
xj)2
n
t1
xt2j
nx2j
acnac2 n
(ac)[n(ac)]1(ac)(bd)
n
n
故二值变量的相关系数为:
n
Cij(7)
(xtixi)x(tjxj)
t1
应用多元统计分析
第六章部分习题解答
第六章 聚类分析
6-1 证明下列结论:
(1) 两个距离的和所组成的函数仍是距离;
(2) 一个正常数乘上一个距离所组成的函数
仍是距离;
(3)设d为一个距离,c>0为常数,则 d * d
仍是一个距离;
d c
(4) 两个距离的乘积所组成的函数不一定是
距离;
证明 :(1)设d(1)和d(2)为距,离 令dd(1) d(2).
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
n
(xti xi)(xtj xj )
rij
t1 n
n
(xti xi)2
(xtj xj )2
t1
t1
7
第六章 聚类分析
n
(xti
t1
xi)(xtj
n
xj)
t1
xtixtj
nxixj
anabac nn
1[an(ab)(ac)]1[a(abcd)(ab)(ac)]
n
n
adbc n
n (xti
并类距离 D1=1.
D(2)
7903
0 5 10
0 8
X X
(2) (3)
0
X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0CCXL(L334)
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100 0CX(3L2)
6
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余
弦为(6.2.3)式.
证明:设变量Xi和Xj是二值变量,它们的n次观测值记 为xti, xtj (t=1,…,n). xti, xtj 的值或为0,或为1.由二值变 量的列联表(表6.5)可知:变量Xi取值1的观测次数 为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的 观测次数为a,取值均为0的观测次数为d 等等。利用两 定量变量相关系数的公式:
以下来验 d满证足作为距离所 3个要条求 .件
2
第六章 聚类分析
① dij di(j1) di(j2) 0,且仅X当(i) X(j)时dij 0; ② dij di(j1) di(j2) d(j1i) d(j2i) dji,对一i切 , j; ③ dij di(j1) di(j2) di(k1) dk(1j) di(k2) dk(2j)
D(3)
110306622
0 1654
0C CX(3LL34)
③ 合并{CL3,CL4}=CL2,并类距离 D3=(165/4)1/2.
D(4) 10221 0C X(3L2)
④ 所有样品合并为一类CL1,并类距离 D4=(121/2)1/2.
15
第六章 聚类分析
类平均法的谱系聚类图如下:
Name of Observation or Cluster
1
1 c /(dik
dkj)
dik d kj
d ik
dkj
dik d kj c dik d kj c dik d kj c
dik d kj dik c d kj c
(因dik 0, d kj 0)
d
* ik
d
* kj
对一切 i, k, j.
故d*是一个距离.
5
第六章 聚类分析
t1
t1
故有 ci(j9)co ijs(ab a )a (c) (6.2.3)
10
第六章 聚类分析
6-3 下面是5个样品两两间的距离阵
0
D(0) D(1) 64
0 9
0
16
7 3
10 5
0 8
0
试用最长距离法、类平均法作系统聚类,并画出谱系
聚类图.
解:用最长距离法:
① 合并{X(1),X(4)}=CL4,
dik dkj,对一i切 ,k, j.
(2) 设d是距离,a >0为正常数.令d*=ad,显然有
① di*jcidj0,且仅 X(i)当 X(j)时 di*j0; ② di*jcidjcdjid*ji,对一 i,j;切
3
第六章 聚类分析
③ di*jcdijc(dikdk)j cdikcdk j
di*kdk*,j对一i,k切 , j.
④ 所有样品合并为一类CL1,并类距离 D4=10.
12
第六章 聚类分析
最长距离法的谱系聚类图如下:
Name of Observation or Cluster
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
7
8
9
10
Maximum Distance Between Clusters
13
第六章 聚类分析
用类平均法:
a dbc
n
n
(xtixi)2 (xtjxj)2
(ab)c(d) (ac)b(d)
t1
t1
(6.2.2)
9
第六章 聚类分析
利用两定量变量夹角余弦的公式:
n
xti xtj
其中
cosij
t 1
n
xt2i
t 1
n
xt2j
t 1
n
n
n
xti xtj a, xt2iab, xt2jac
t 1
相关文档
最新文档