应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答)

合集下载

应用多元统计分析课后习题答案高惠璇第四章部分习题解答

应用多元统计分析课后习题答案高惠璇第四章部分习题解答


4
第四章 回归分析

L(a0 , 2 ) 2 2 L(a0 , ) 2 [( y1 a0 ) ( y2 a0 ) 3( y3 3a0 ) 0 a0 2
可得
令 ln L(a ˆ0 , 2 ) 3 1 2 ˆ [( y a ) ] 0 1 0 2 2 2 2 2 2( ) drf 可得 ˆ 2 1 2 ˆ0 ) 2 ( y2 a ˆ0 ) 2 ( y3 3a ˆ0 ) 2 ˆ0 ( y1 a
1
经验证:① B-A是对称幂等阵; ② rank(B-A)=tr(B-A)=2-1=1;
25 80 35 1 256 112 330 49
8
第四章 回归分析
③ A(B-A)=O3×3 .由第三章§3.1的结论6知
Y AY与Y ( B A)Y相互独立;也就是 ˆ ˆ 与 ˆ 相互独立.
ˆi y ˆ ) ( yi y )( y i 1
n n n i 1 i 1 2
R
2
2 2 ˆ ˆ ( y y ) ( y y ) i i

2 ˆi y ) ( y i 1
n n n i 1 i 1
2
2 2 ˆ ˆ ( y y ) ( y y ) i i
(因 1n C张成的空间 , 这里有H1n 1n )
n n i 1 i 1
(2) 因 ( yi y )( y ˆi y ˆ ) ( yi y ˆi y ˆ i y )( y ˆi y )
ˆ i )( y ˆi y ) ( y ˆi y )2 ( yi y

(完整word版)应用多元统计分析习题解答主成分分析

(完整word版)应用多元统计分析习题解答主成分分析

主成分分析6.1 试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。

当第一个组合不能提取止。

这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。

以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”6.3 简述主成分分析中累积贡献率的具体含义。

答:主成分分析把p 个原始变量12,,,p X X X 的总方差()tr Σ分解成了p 个相互独立的变量p 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。

这里我们()m p <个主成分,则称11pmm kkk k ψλλ===∑∑ 为主成分1,,m Y Y 的累计贡献率,累计贡献率表明1,,m Y Y 综合12,,,p X X X 的能力。

通常取m ,使得累计贡献率达到一个较高的百分数(如85%以上)。

答:这个说法是正确的。

即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。

从协方差矩阵出发的,其结果受变量单位的影响。

主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。

实际表明,这种差异有时很大。

我6.6 已知X =()’的协差阵为 试进行主成分分析。

解:=0计算得当时,同理,计算得时,易知相互正交单位化向量得,,综上所述,第一主成分为第二主成分为第三主成分为6.7 设X=()’的协方差阵(p为, 0<p<1证明:为最大特征根,其对应的主成分为。

证明:==,为最大特征根当时,=所以,6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。

应用多元统计分析习题解答_判别分析

应用多元统计分析习题解答_判别分析

应用多元统计分析习题解答_判别分析第四章判别分析4.1 简述欧几里得距离与马氏距离的区别和联系。

答:设p维欧几里得空间中的两点X=和Y=。

则欧几里得距离为。

欧几里得距离的局限有①在多元数据分析中,其度量不合理。

②会受到实际问题中量纲的影响。

设X,Y是来自均值向量为,协方差为的总体G中的p维样本。

则马氏距离为D(X,Y)=。

当即单位阵时,D(X,Y)==即欧几里得距离。

因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。

4.2 试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。

设R1,R2,…,Rk是p维空间R p 的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。

判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划分”,这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。

其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。

①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ 2,对于一个新的样品X ,要判断它来自哪个总体。

计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),则X,D 2(X ,G 1)D 2(X ,G 2)X,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ记()()W '=-X αX μ 则判别规则为X,W(X)X,W(X)<0②多个总体的判别问题。

应用多元统计分析课后答案 .doc

应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

应用多元统计分析 北大版 第四章

应用多元统计分析 北大版 第四章
b=(C′C)-1C′Y = BY 是β的最小二乘估计(其中B= (C′C)-1C′).
参数向量β的最小二乘估计β=^b正好是m+1阶 的线性方程组
C′Cβ=C′Y 的解.常称以上方程组为正规方程.
预测向量为 Y^=C b=HY,
其中H= C(C′C)-1C′称为“帽子”矩阵。
13
北大数学学院
第四章 §4.1 经典多元线性回归



c(1) c(2)
,
1 xn1 xnm
n
c(n)

C


c(1) c(2)
,

c(n)
n
Q( ) [ yt (0 1xt1 m xtm )]2 [ yt c(t) ]2
于显著性水平α),依统计思想,小概率 事件在一次实践中一般不会发生。如果
发生小概率事件,将否定前提假定H0.
29
第四章 §4.1 经典多元线性北大回数学归学院
正规方程的等价形式及U的计算公式
回归模型(4.1.1)可以改写为
(4.1.7)
它与原模型(4.1.1)没有本质差别,只不过是
模型(4.1.7)的特点是对观测数据 (yt, xt1, xt2,. . , xtm ) (t=1,2,…,n) 做了中心化处理.下面将说明在(4.1.7)下得 到的正规方程的形式.
而R称为复相关系数。 22
第四章 §4.1 经典多元线北性大数回学学归院
回归方程的显著性检验—定理4.1.3
定理4.1.3 在模型(4.1.3)下有
23
第四章 §4.1 经典多元线北性大数回学学归院
回归方程的显著性检验

应用多元统计分析课后题答案

应用多元统计分析课后题答案


c) c)2
2( x1

a)( x2

c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)


2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)


Σ

故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

应用多元统计分析课后习题答案高惠璇第四章部分习题解答市公开课获奖课件省名师示范课获奖课件

应用多元统计分析课后习题答案高惠璇第四章部分习题解答市公开课获奖课件省名师示范课获奖课件

0
2
)
3 2

2
)
3 2
ˆ 2 ˆ 0 2
3
2
V
3 2
下列来讨论与V等价旳统计量分布:
ˆ 2
1 3
( y1
aˆ)2
( y2
2aˆ
bˆ)2
( y3

2bˆ)2
1 3
( y1
yˆ1 ) 2
( y2
yˆ2 )2
( y3
yˆ3 )2
1 3
(Y
Xˆ )(Y
Xˆ )
1Y 3
(I3
X
(
X
X
)1
Q(β)=(Y-Cβ) '(Y-Cβ) . 试证明β^=(C'C)-1C'Y是在下列四种意义下达最小:
(1) trQ(β^)≤trQ(β) (2) Q(β^)≤Q(β) (3) |Q(β^)|≤|Q(β)|
(4) ch1(Q(β^))≤ch1(Q(β)),其中ch1(A)表达A
旳最大特征值. 以上β是(m+1)×p旳任意矩阵.
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量旳分子为
L(aˆ0

2 0
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
5
第四章 回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )

最新应用多元统计分析课后习题答案高惠璇PPT课件

最新应用多元统计分析课后习题答案高惠璇PPT课件
X2~N(0,1).
(2) 考虑随机变量Y= X1-X2 ,显然有
YX 1X2 0 X 1X 1,当 估计
P{Y0}P{X11或 X11} P{X11}P{X11} (X1~N(0,1)) 2(1)0.317 04
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
31
第三章 多元正态总体参数的检验
证明 记rk(A)=r.
若r=n,由AB=O,知B= On×n,于是 X′AX与X′BX
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
32
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
P{X1x}(x) 17
第二章 多元正态分布及参数的估计
当-1≤x≤1时,
P{X2 x}P{X2 1}P{1X2 x} P{X1 1}P{xX1 1} P{X1 1}P{1X1 x} P{X1 x}(x)
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面. (2) 当p=2且
比较上下式相应的系数,可得:
1
2 2
2
1 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

)
4
第四章 回归分析

∂L(a0 , σ 2 ) 2 2 = L(a0 , σ ) − 2 [−( y1 − a0 ) − ( y2 − a0 ) − 3( y3 − 3a0 ) = 0 ∂a0 2σ
可得
令 ∂ ln L(a0 , σ 2 ) ˆ 3 1 ˆ0 ) 2 + L] = 0 =− 2 + [( y1 − a 2 2 2 ∂σ 2σ 2(σ ) drf 可得 ˆ 2 1 ˆ ˆ ˆ ˆ σ = [( y1 − a0 ) 2 + ( y2 − a0 ) 2 + ( y3 − 3a0 ) 2 ] = σ 02
[ 3
]
1 ˆ1 ) 2 + ( y2 − y2 ) 2 + ( y3 − y3 ) 2 ˆ ˆ = ( y1 − y 3 1 ˆ )′(Y − Xβ ) = 1 Y ′( I − X ( X ′X ) −1 X ′)Y ˆ = (Y − Xβ 3 3 3 1 = Y ′AY , 且 rank ( A ) = tr ( A ) = 3 − 2 = 1 3
解:用矩阵表示以上模型 用矩阵表示以上模型: 用矩阵表示以上模型
y1 1 0 ε 1 def a Y = y2 = 2 − 1 b + ε 2 = Xβ + ε 1 2 ε y3 3
−1

i =1 i =1
14
第四章 回归分析
上式第一项为: 上式第一项为
ˆ ˆ ˆ ˆ ( yi − yi )( yi − y ) = (Y − Y )′(Y − y1n ) ∑
i =1 n
ˆ ˆ ˆ ˆ ˆ ˆ = (Y − Cβ )′(Cβ − y1n ) = Y ′Cβ − β ′C ′Cβ − y (Y − Y )′1n ˆ ˆ = Y ′Cβ − (′C ′Y )Cβ − 0 = 0
ˆ ˆ ∑ ( yi − y )( yi − y ) i =1
n n n 2 i =1 i =1 2
R2 =
ˆi − y )2 ∑ ( yi − y ) × ∑ ( y ˆ
=
2 ˆ ∑ ( yi − y ) i =1
n n n 2 i =1 i =1
2
ˆi − y )2 ∑ ( yi − y ) × ∑ ( y ˆ
σ
~ χ (1)
2
[
]
7
第四章 回归分析
1 1 ˆ0 )′(Y − Za0 ) = Y ′( I 3 − Z ( Z ′Z ) −1 Z ′)Y ˆ = (Y − Za 3 3 1 = Y ′BY 3
2 0 2
Байду номын сангаас
1 考虑 σ − σ = Y ′( B − A)Y ˆ ˆ 3 −1
B − A = X ( X ′X ) X ′ − Z ( Z ′Z ) Z ′
,
15
第四章 回归分析 n
所以
R =
2
ˆi − y )2 ∑(y
∑(y
i =1
i =1 n
i
− y)
2
U = . l yy
(3) 残差平方和 为 残差平方和Q为
ˆ Q( β ) = l yy − U = l yy − l yy R 2 = (1 − R )l yy = (1 − R )∑ ( yi − y ) .
[
]
ˆ, σ 2 ) = (2π ) (σ 2 ) ˆ ˆ L ( a, b ˆ
L ( a0 , σ ) =
2

3 2

3 2
成立时,样本的似然函数为 当H0:a=b=a0成立时 样本的似然函数为
3 exp[− ]. 2
(
1 2 2 2 exp − 2 [( y1 − a0 ) + ( y2 − a0 ) + ( y3 − 3a0 ) ] 3 2σ 2πσ 2 1
2 2 2 i =1 n
16
第四章 回归分析
在多对多的多元线性回归模型中, 4-7 在多对多的多元线性回归模型中,给定 Yn×p,Xn×m,且rank( )= ,C=(1n|X).则 rank(X)= )=m,C=(1 ).则 ). ×
Y ′AY与Y ′( B − A)Y相互独立; 也就是 ˆ ˆ ˆ σ − σ 与σ 相互独立.
2 0 2 2
由第三章§3.1的结论 知(H0:a=b成立时 的结论4知 成立时) 由第三章§ 的结论 成立时
Y ′( B − A)Y
2
σ σ ˆ2 ˆ 3(σ 0 − σ 2 ) Y ′( B − A)Y 2 = ∴ ~ χ (1) 2 2 σ σ
i =1 n
( yi − y ) 2 ; ∑
i =1 n
n
ˆ = ()残差平方和Q(β) (1 − R 2 )∑ ( yi − y ) 2 . 3
i =1
13
第四章 回归分析
ˆ 证明:(1)估计向量为 Y = Cβ = C (C ′C ) −1 C ′Y = HY 估计向量为 ˆ 证明 1 n 1 ˆ 1 1 ˆ ˆ y = ∑ yi = 1′n Y = 1′n HY = ( H 1n )′Y n i =1 n n n 1 = 1′n Y = y. n
3 2 −2
ˆ (σ )
2

3 2
3 σ2 ˆ = 2 =V 2 σ ˆ0
3 2
以下来讨论与V等价的统计量分布 以下来讨论与 等价的统计量分布: 等价的统计量分布 1 2 ˆ ˆ ˆ ˆ ˆ ˆ σ = ( y1 − a) 2 + ( y2 − 2a + b) 2 + ( y3 − a − 2b) 2
3 似然比统计量的分子为
2
1 ˆ a0 = ( y1 + y2 + 3 y3 ) 11
ˆ ˆ ˆ L(a0 , σ 0 ) = (2π ) (σ 0 )

3 2
3 − 2 2
3 exp[− ]. 2
5
第四章 回归分析
似然比统计量为
2
ˆ ˆ L(a0 , σ 0 ) (σ 0 ) ˆ λ= = 2 ˆ ˆ ˆ L ( a, b, σ )
否定域为
{λ ≤ λα } ⇐⇒ {V ≤ Vα } ⇐⇒ {ξ ≥ fα }
10
第四章 回归分析
4-2 在多元线性回归模型 在多元线性回归模型(4.1.3)中(p=1),试求出参数 中 , 向量β和 的最大似然估计. 向量 和σ2的最大似然估计
模型(4.1.3)为 Y = Cβ + ε 解:模型 模型 为 样本的似然函数为
ε ~ N (0, σ 2 I ), n n
− n 2
1 L( β , σ ) = (2π ) (σ ) exp − 2 (Y − Cβ )′(Y − Cβ ) 2σ n n − − 1 2 2 2 2 ln L( β , σ ) = ln(2π ) + ln(σ ) − 2 (Y − Cβ )′(Y − Cβ ) 2σ n n − − 1 2 2 2 = ln(2π ) + ln(σ ) − 2 (Y ′Y − 2Y ′Cβ − β ′C ′Cβ ) 2σ
2
~ χ (1, δ ),因δ =
2
1
( Za0 )′( B − A) Za0 = 0
9
第四章 回归分析
所以
Y ′AY = ~ F (1,1) ξ= 2 2 ˆ ˆ σ0 −σ Y ′( B − A)Y ˆ σ
2
3 2
ˆ2 σ V ξ 因λ = V , V = 2 , 故ξ = 或V = , ˆ σ0 1−V −V 1+ ξ
1 0 1 2 1 y1 ˆ y ˆ = a = ( X ′X ) −1 X ′Y = 1 2 1 2 − 1 β ˆ 0 − 1 2 0 − 1 2 2 1 2 y b 3
2
第四章 回归分析
1 ( y + 2 y 2 + y3 ) −1 y1 + 2 y2 + y3 6 1 = 6 0 0 5 = 1 − y 2 + 2 y3 ( − y 2 + 2 y3 ) 5 (2) 试导出检验 0:a=b的似然比统计量,并指出当假 试导出检验H 的似然比统计量, 的似然比统计量 设成立时,这个统计量的分布是什么? 设成立时,这个统计量的分布是什么
(因1n ∈ C张成的空间, 这里有H 1n = 1n )
n n i =1 i =1 n n
(2) 因 ∑ ( yi − y )( yi − y ) = ∑ ( yi − yi + yi − y )( yi − y ) ˆ ˆ ˆ ˆ ˆ
ˆ ˆ ˆ = ∑ ( yi − yi )( yi − y ) + ∑ ( yi − y ) 2
−1
1 25 80 − 35 = 256 − 112 330 49
经验证:① 是对称幂等阵; 经验证 ① B-A是对称幂等阵 是对称幂等阵 ② rank(B-A)=tr(B-A)=2-1=1;
8
第四章 回归分析
由第三章§ 的结论 的结论6知 ③ A(B-A)=O3×3 .由第三章§3.1的结论 知 × 由第三章
)
3
3 1 ∂ ln L 2 令 ˆ =− 2 + [( y1 − a) + L] = 0 2 2 2 ∂σ 2σ 2(σ )
1 ˆ 可得 σ = ( y1 − a) 2 + ( y2 − 2a + b) 2 + ( y3 − a − 2b) 2 ˆ ˆ ˆ ˆ ˆ 3 似然比统计量的分母为
相关文档
最新文档