应用多元统计分析课后答案 第八章

合集下载

应用多元统计分析答案详解汇总_高惠璇[1]

应用多元统计分析答案详解汇总_高惠璇[1]
1 2 ( 2 x1 22 x1 65 ) 2
e
1 2 ( x2 2 x1 x2 14 x2 ) 2
dx2
1 e 2
1 2 ( 2 x1 22 x1 65 ) 2

e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
比较上下式相应的系数,可得:
1 2 1 12 2 2 2 12 1 1 2 1 2 2 2 22 1 2 1 2 2 2 2 2 1 2 1 2 1 14 2 2 2 2 2 1 2 1 2 1 2 1 2
x1 y2 (2)第二次配方.由于 x2 y1 y2
14
第二章
2 1 2 2 2 1 2 1 2 2
多元正态分布及参数的估计
2 x x 2 x1 x2 22 x1 14 x2 65 y y 22 y2 14( y1 y2 ) 65 y 14 y1 49 y 8 y2 16 ( y1 7) ( y2 4)
由定理2.3.1可知X1 +X2 和X1 - X2相互独立.
4
第二章
(2) 因
多元正态分布及参数的估计
1 2 2 2(1 ) 0 X1 X 2 ~ N2 , Y 2(1 ) 0 X1 X 2 1 2
O 2(1 2 ) O 2(1 2 )
由定理2.3.1可知X(1) +X(2)和X(1) -X(2) 相 互独立.
7
第二章
(2) 因
(1) (2)

多元应用统计第八章答案

多元应用统计第八章答案

多元应用统计第八章答案1、对某高中一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标),试对两组指标做典型相关分析。

体力测试指标:x1-反复横向跳(次),x 2-纵跳(cm),x 3-臂力(kg),x 4-握力(kg),x 5-台阶试验(指数),x 6-立定体前屈(cm),x 7-俯卧上体后仰(cm)。

运动能力测试指标: x8-50米跑(秒),x 9-跳远(cm),x 10-投球(m),x11-引体向上(次),x12-耐力跑(秒)。

矩阵Run MATRIX procedure:一、两组变量间的相关系数Correlations for Set-1X1 X2 X3 X4 X5 X6 X7X1 1.0000 .2701 .1643 -.0286 .2463 .0722 -.1664X2 .2701 1.0000 .2694 .0406 -.0670 .3463 .2709X3 .1643 .2694 1.0000 .3190 -.2427 .1931 -.0176X4 -.0286 .0406 .3190 1.0000 -.0370 .0524 .2035X5 .2463 -.0670 -.2427 -.0370 1.0000 .0517 .3231X6 .0722 .3463 .1931 .0524 .0517 1.0000 .2813X7 -.1664 .2709 -.0176 .2035 .3231 .2813 1.0000Correlations for Set-2X8 X9 X10 X11 X12X8 1.0000 -.4429 -.2647 -.4629 .0777X9 -.4429 1.0000 .4989 .6067 -.4744X10 -.2647 .4989 1.0000 .3562 -.5285X11 -.4629 .6067 .3562 1.0000 -.4369X12 .0777 -.4744 -.5285 -.4369 1.0000Correlations Between Set-1 and Set-2X8 X9 X10 X11 X12X1 -.4005 .3609 .4116 .2797 -.4709X2 -.3900 .5584 .3977 .4511 -.0488X3 -.3026 .5590 .5538 .3215 -.4802X4 -.2834 .2711 -.0414 .2470 -.1007X5 -.4295 -.1843 -.0116 .1415 -.0132X6 -.0800 .2596 .3310 .2359 -.2939X7 -.2568 .1501 .0388 .0841 .1923首先给出的是Correlations for Set-1、Correlations for Set-2为两组变量的内部各自相关矩阵。

《应用多元分析》第三版(第八章 因子分析)

《应用多元分析》第三版(第八章 因子分析)
Σ=A*A*′+D
因此,因子载荷矩阵A不是惟一的,在实际应用中常常利用
这一点,通过因子的旋转(见稍后的§8.4),使得新的因子
有更好的实际意义。
三、因子载荷矩阵的统计意义

1.A的元素aij
m
2
2
h

a
❖ 2.A的行元素平方和 i
ij
j 1
p
2
2
g

a
❖ 3.A的列元素平方和 j
ij
i 1
❖ 二、正交因子模型的性质
❖ 三、因子载荷矩阵的统计意义
一、数学模型

设有p维可观测的随机向量 x ( x1 , x2 , , x p ),其均值
为 μ ( 1 , 2 , , p ),协差阵为Σ=(σij)。因子分析的
一般模型为
x1 1 a11 f1 a12 f 2 a1m f m 1
有什么实际意义的,故实践中m也不应选得过小。
2.模型不受单位的影响

将x的单位作变化,通常是作一变换x*=Cx,这里
C=diag(c1,c2,⋯,cp),ci>0,i=1,2,⋯,p,于是
x*=C μ+CAf+C ε
令μ*=C μ,A*=CA,ε*=C ε,则有
x*=μ*+A*f+ε*
这个模型能满足类似于前述因子模型的假定,即
x a f a f a f
2
2
21 1
22 2
2m m
2


x p p a p1 f1 a p 2 f 2
a pm fm p
其中f1, f2, ⋯, fm为公共因子,ε1, ε2, ⋯, εp为特殊因子,

应用多元统计分析课后题答案

应用多元统计分析课后题答案


c) c)2
2( x1

a)( x2

c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)


2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)


Σ

故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

多元统计分析方法(兰州商学院,傅德印)第八章 典型相关分析(f)

多元统计分析方法(兰州商学院,傅德印)第八章  典型相关分析(f)

第八章 典型相关分析在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。

典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。

第一节 典型相关的基本原理(一)典型相关分析的基本思想 典型相关分析方法(canonical correlation analysis)最早源于荷泰林(H ,Hotelling)于1936年在《生物统计》期刊上发表的一篇论文《两组变式之间的关系》。

他所提出的方法经过多年的应用及发展,逐渐达到完善,在70年代臻于成熟。

由于典型相关分析涉及较大量的矩阵计算,其方法的应用在早期曾受到相当的限制。

但随着当代计算机技术及其软件的迅速发展,弥补了应用典型相关分析中的困难,因此它的应用开始走向普及化。

典型相关分析是研究两组变量之间相关关系的一种统计分析方法。

为了研究两组变量1X ,2X ,…,p X 和1Y , 2Y ,…,q Y 之间的相关关系,采用类似于主成分分析的方法,在两组变量中,分别选取若干有代表性的变量组成有代表性的综合指标,通过研究这两组综合指标之间的相关关系,来代替这两组变量间的相关关系,这些综合指标称为典型变量。

(二)典型相关分析的数学描述设有两随机变量组=X (1X ,2X ,…,)'pX 和=Y (1Y , 2Y ,…,qY )',不妨设p ≤q 。

对于X ,Y ,不妨设第一组变量的均值和协方差为矩阵为 ()X E =1μ Cov ()X =∑11第二组变量的均值和协方差为矩阵为()Y E =2μ Cov ()Y =∑22第一组与第二组变量的协方差为矩阵为Cov ()Y X ,=∑12= ∑21'于是,对于矩阵 Z = ⎥⎦⎤⎢⎣⎡Y X 有 (9—1—1) 均值向量 μ=E ()Z =E ()()⎥⎦⎤⎢⎣⎡Y E X E =⎥⎦⎤⎢⎣⎡21μμ (9—1—2)协方差矩阵()()∑+⨯+q p q p =E ()μ-Z ()'-μZ=()()()()()()()()⎥⎥⎦⎤⎢⎢⎣⎡'--'--'--'--22122111μμμμμμμμY Y E X Y E Y X E X X E =()()()()⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡∑∑∑∑⨯⨯⨯⨯q q p q qp p p 22211211要研究两组变量1X ,2X ,…,p X 和1Y , 2Y ,…,q Y 之间的相关关系,首先分别作两组变量的线性组合,即p p X a X a X a U +++= 2211=X a 'V =q q Y b Y b Y b +++ 2211=Y b '()'=p a a a a ,,,21 ,()'=q b b b b ,,,21 分别为任意非零常系数向量,则可得,Var ()U =a 'Cov ()a X = a '∑11a Var ()V =b 'Cov ()b Y = b '∑22bCov ()V U ,=a 'Cov ()Y X ,b = a '∑12b则称U 与V 为典型变量,它们之间的相关系数ρ称为典型相关系,即ρ=Corr ()V U ,=bb a a b a ∑∑∑'''221112典型相关分析研究的问题是,如何选取典型变量的最优线性组合。

(完整版)多元统计分析课后练习答案

(完整版)多元统计分析课后练习答案

第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。

当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

应用多元统计分析课后的答案解析_朱建平版

应用多元统计分析课后的答案解析_朱建平版

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

应用多元分析第八章 因子分析

应用多元分析第八章   因子分析

1.00 0.32 0.33 0.18 0.00
1.00 0.24 1.00 0.34 0.24 1.00 -0.02 0.17 -0.00 1.00
例8.1.2 为了评价即将进大学的高中生的学习能力, 抽了200名高中生进行问卷调查,共50个问题。素 有这些问题可以归结为阅读理解、数学水平和艺 术素养三个方面。 例8.1.3 公司老板对48名应聘者进行面试,并给出 他们在15个方面的得分,这15个方面是:申请书 的形式(x1)、外貌(x2)、专业能力(x3)、讨人喜欢 (x4)、自信心(x5)、精明(x6)、诚实(x7)、推销能力 (x8)、经验(x9)、积极性(x10)、抱负(x11)、理解能 力(x12)、潜力(x13)、交际能力(x14)、适应性(x15)。 通过因子分析,这15个方面可归结为应聘者的外露 能力、讨人喜欢的程度、经验、专业能 i i 1,,10.
j 1
4
十项全能运动员得分相关矩阵
X1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 1.00 0.59 0.35 0.34 0.63 0.40 0.28 0.20 0.11 -0.77
X2
X3
X4
X5
X6
X7


i 1
i
i 1
一、主成分法:
1 n 1 n x xi , S ( xi x )( xi x ) ' n i 1 n 1 i 1
ˆ ˆ 1、求出S的特征值1 p 0, 相应的正交单位特征向量
ˆ ti , i 1, , p。
2、估计:




data examp733(type=corr); input x1-x8; cards; 1.000 . . . . . . . 0.923 1.000 . . . . . . 0.841 0.851 1.000 . . . . . 0.756 0.807 0.870 1.000 . . . . 0.700 0.775 0.835 0.918 1.000 . . . 0.619 0.695 0.779 0.864 0.928 1.000 . . 0.633 0.697 0.787 0.869 0.935 0.975 1.000 . 0.520 0.596 0.705 0.806 0.866 0.932 0.943 1.000 ; proc factor data=examp733(type=corr); var x1-x8; proc factor data=examp733(type=corr) n=2; var x1-x8; run;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

j m 1


p
2 j
tr (BB BB) tr (BB BB) tr[( E D)( E D)] tr[ E E E D DE DD] Q(m) 0 0 ( i2 ) 2
p i 1 p
所以
Q(m)
17
第八章 因子分析
(3) 主成分分析是将主成分表示为原变量的线 性组合,而因子分析是将原始变量表示为公因子 和特殊因子的线性组合,用假设的公因子来“解 释”相关阵的内部依赖关系. 这两种分析方法又有一定的联系.当估计方法 采用主成分法,因子载荷阵A与主成分的系数相 差一个倍数;因子得分与主成分得分也仅相差一 个常数.这种情况下可把因子分析看成主成分分 析的推广和发展. 这两种方法都是降维的统计方法,它们都可用 来对样品或变量进行分类.
i 1 j 1 2 ij
p
p
j m 1
(
2 j i 1p来自2 2 i)
j m 1
,
2 j
16
p
第八章 因子分析
8-5 试比较主成分分析和因子分析的相同之处
与不同点. 因子分析与主成分分析的不同点有: (1) 主成分分析不能作为一个模型来描述,它只 是通常的变量变换,而因子分析需要构造因子模型; (2) 主成分分析中主成分的个数和变量个数p相 同,它是将一组具有相关关系的变量变换为一组互 不相关的变量(注意应用主成分分析解决实际问题 时,一般只选取前m(m<p)个主成分),而因子分析的 目的是要用尽可能少的公共因子,以便构造一个结 构简单的因子模型;
6
第八章 因子分析
2 故 Q(1) ij 2 (0.09792 0.1727 2 0.24112 ) i 1 j 1 3 3
0.1951
(2) 取公因子个数m 2时, 求因子模型的主成分解, 并计算误差平方和Q(2).
解 : m 2的因子模型的主成分解为 : 0.8757 0.1802 0.8312 0.4048 , A ( 1 l1 , 2 l2 ) 0.7111 0.6950
( D AA) 1 D 1 D 1 A( I m AD 1 A) 1 AD 1 A( D AA) 1 ( I m AD 1 A) 1 AD 1 I m A( D AA) 1 A ( I m AD 1 A) 1 (3)
D D AB AD 1 B221 AD
1 1 1 221 1
D AB 1 B221
1
1 221

B AB
1 11 2 1 11 2
B A 1 I m AB112 A
1 11 2
解 : m 1的因子模型的主成分解为 : 0 0.8757 0.2331 0 A ( 1 l1 ) 0.8312 , D 0 0.3091 0 0.7111 0 0 0.4943
5
第八章 因子分析
记 E1 R ( AA D) 1 0.63 0.45 1 0.7279 0.6227 1 0.35 1 0.5911 1 1 0 0.0979 0.1727 0 0.2411 0
(2)
由第三式和第二式即得 I m ( I m AD 1 A) 1 A( D AA) 1 A
( I m AD 1 A) 1 AD 1 A (1)
13
第八章 因子分析
8-4 证明公因子个数为m的主成分解,其误差平方
和Q(m)满足以下不等式
2 Q(m) ij i 1 j 1 p p j m 1
2j ,
p
其中E=S-(AA′+D)=(εij),A,D是因子模型的主成分估计.
解:设样本协差阵S有以下谱分解式:
S i li li i li li
i 1 i 1
p
m
其中1 2 p 0 为S的特征值,li为相应的 标准特征向量。 14
12
由逆矩阵的对应块相等,即得:
第八章 因子分析
B
1 112
D D AB B
1 221 1 1 11 2
1
1
1 221
D 1 B11 A
21 22
AB
1 11 2
AD B
1 221
I m AB
A B
B
把B22·和B11·式代入以上各式,可得: 1 2
1
D A p B m A Im
B112 D AA,
11
利用附录中分块求逆的二个公式(4.1)和(4.2)有:
第八章 因子分析
D A B B B 21 A Im
1 11 1
B 22 B
12 1
7
第八章 因子分析
0 0 0.2007 D 0 0.1452 0 0 0 0.01131 则m 2的正交因子模型为 X 1 0.8757 F1 0.1802 F2 1 X 2 0.8312 F1 0.4048 F2 2 X 3 0.7111F1 0.6950 F2 3
i m 1
l l
i i i
p
第八章 因子分析
设A,D是因子模型的主成分估计,即
A

1 l1 m lm ,

若记 B

m 1 lm 1 p l p , 有
A AA BB S ( A | B ) B


D diag(BB)
1 0.63 0.45 ( AA D) D) E2 R ( AA 1 0.35 1
8
第八章 因子分析
1 0.8008 0.4975 AA D 1 0.3097 1 0 0.1708 0.0475 E2 0 0.0403 0
故 m 1的正交因子模型为 X 1 0.9 F1 1 X 2 0.7 F1 2 X 3 0.5F1 3
特殊因子ε=(ε1, ε2,…,εp)'的协差阵D为:
0.19 0 0 D 0 0.51 0 0 0 0.75
4
第八章 因子分析
8 2 已知8 1中R的特征值和特征向量为 1 1.9633 l1 (0.6250 ,0.5932 ,0.5075 ), 2 0.6795 l2 (0.2186 ,0.4911,0.8432 ), 3 0.3672 l3 (0.7494 ,0.6379 ,0.1772 ). (1) 取公因子个数m 1时, 求因子模型的主成分解, 并计算误差平方和Q(1).
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
应用多元统计分析
第八章习题解答
第八章 因子分析
2
第八章 因子分析
a 1
2 11 2 1
a 1
2 21 2 2
a21 0.63 7 7 , a21 a31 a31 0.45 5 5 7 a31 a31 0.35, 5 0.35 5 2 a31 0.25 7 a31 0.5, a21 0.7, a11 0.9,
2 11 2 21 2 3 2 31
a 1
2 31 2 3
a11a21 0.63 a11a31 0.45 a31a21 0.35
2 1 2 2
1 a 1 0.81 0.19, 1 a 0.51, 1 a 0.75
3
第八章 因子分析
18
2 2 3
10
j m 1 2 2 1 2
(
2 j i 1 2 2 2 2
p
p
2 2 i
)
j m 1
,
2 j
p
第八章 因子分析
8-3 验证下列矩阵关系式(A为p×m阵) (1) ( I AD 1 A) 1 AD 1 A I ( I AD 1 A) 1 ;
E S ( AA D) BB D, 即BB E D.
15
第八章 因子分析
m 1 lm 1 m 1 0 BB ( m 1 lm 1 , , p l p ) 0 p l p p
Q(2) 2 (0.1708 0.0475 0.0403 )
i 1 j 1 2 ij 2 2 2 3 3

0.06611
9
第八章 因子分析
或者利用习题8-4的结果:
Q(m)
i 1 j 1 2 2 2 3 2 2 ij p p
Q(1) ( ) [( ) ( ) ( ) ] 0.6795 0.3672 [0.2331 0.3091 2 0.4943 2 ] 0.5966 0.3943 0.2023 2 2 Q(2) 3 [( 12 ) 2 ( 2 ) 2 ( 32 ) 2 ] 2 2 2 2 0.3672 [0.2007 0.1452 0.01131 ] 0.1348 0.06149 0.07331 (3) 试求误差平方和Q(m)<0.1的主成分解. 因Q(2)=0.07331<0.1,故m=2的主成分解满足要求.
相关文档
最新文档