第二章 多元正态分布及参数的估计汇总

合集下载

第二章多元正态分布

第二章多元正态分布

第二章多元正态分布(一)教学目的通过本章的学习,要求对多元分布的基本概念有所了解,掌握多元正态分布数字特征及其参数估计,尤其是多元正态分布的假设检验。

(二)基本要求要求了解多元分布的基本概念,掌握多元正态分布的参数估计和假设检验。

(三)教学要点1、多维随机向量的边缘密度、条件分布、数字特征2、多元正态分布数字特征及其参数估计3、三个常用的抽样分布4、正态分布总体均值向量的检验(四)教学时数3课时(五)教学内容1、多元分布的基本概念2、多元正态分布数字特征及其参数估计3、三个常用的抽样分布及多元正态分布的假设检验第一节多元分布的基本概念多元统计分析主要方法是建立在多元正态分布的假设之上的。

而多元正态分布又是多元分布中应用最广泛的一种.为此,在介绍多元统计分析方法之前,首先有必要介绍多元正态分布的有关内容.另外,多元统计分析涉及到的都是随机向量或着将多个随机向量放在一起组成的随机矩阵。

为此,学习多元正态分布还需要首先从随机向量的基本概念开始。

多元统计分析,简称多元分析,是指当总体的分布是多维(多元)概率分布时,处理该类总体的数理统计理论和方法的总称,是统计学中的一个重要的分支学科。

早在19世纪就出现了处理二维正态总体的一些方法,但系统地处理多维概率分布总体的统计分析问题,则开始于20世纪。

人们常把1928年维希特(Wishart)分布的导出作为多元分析成为一个独立学科的标志。

20世纪30年代,R。

A。

费希尔、H。

霍特林、许宝騄以及S.N。

罗伊等人做出了一系列奠基性的工作,使多元统计分析在理论上得到了迅速的进展。

20世纪40年代,多元分析在心理、教育、生物等方面获得了一些应用。

由于应用时常需要大量的计算,加上第二次世界大战的影响,使其发展停滞了相当长的时间。

50年代中期,随着电子计算机的发展和普及,它在地质、气象、标准化、生物、图像处理、经济分析等许多领域得到了广泛的应用,也促进了理论的发展。

一、随机向量我们知道,所谓随机变量通俗理解就是“其值随机会而定”的变量.比如,在某厂大批产品中随机地抽取出100个,其中所含废品数X 就是一个随机变量。

应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答) (2).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答) (2).ppt

4 3
u1u2
1
2
exp[
1 2
(2u12
u22
2u1u2 )]du1du2
1
2
u12
u1e 2
1
2
u2e
1 2
(
u2
u1
)
2
du2
du1
1
2
u12
u1e 2
1
2
(u2
u1
)e
1 2
(u2
u1
)
2
du2
u1
e
1 2
(
u2
u1
)
2
du2
du1
1
2
u e
2
u12 2
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
X
X X
(1) (2)
~
N
2
p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,

第二章 多元正态分布的参数估计

第二章 多元正态分布的参数估计

第二章多元正态分布的参数估计1.随机向量:将p个随机变量的整体称作p维随机向量,记为同时对p个指标(变量)进行了n次观测,这p个指标为,常用向量表示对同一个体观测的p个变量注:横看表示为第a个样品的观测值,记为竖看表示为对第j个变量的n次观测值,记为上表可用矩阵表示为(1)离散型随机向量:设是p维随机向量,若存在有限个或可列个p 维数向量,记,,满足,则X为离散型随机向量,为X的概率分布(2)连续型随机变量:设,若存在一个非负函数,使得对一切x均有,则X为连续型随机变量,为分布密度函数其中,应满足条件:i.ii.2.多元分布:设是p维随机向量,它的多元分布函数定义为,记为。

其中表示p维欧氏空间3.边缘(或边际)分布:设是p维随机向量,由它的q(<p)个分量组成的子向量的分布为X的边缘分布假定正好是X的前q个分量,其中p-q个分量为,则,相应的取值也分为了两部分。

当X的分布函数为时,的分布函数即边缘分布函数为;当X有分布密度时,则的边缘密度函数为注:相互独立——p个随机变量的联合分布等于各自的边缘分布的乘积4.随机向量的均值向量/数学期望:设,若存在且有限,则称为X的均值(向量)或数学期望,有时也把分别记为,即,容易得到均值(向量)有以下性质:其中,X和Y为随机向量,A和B为大小适合运算的常数矩阵5.随机变量的方差或协差阵:设,称为X的方差或协差阵,有时候把D(X)简记为,简记为,从而有随机变量X和Y的协差阵为当X=Y时,即为D(X)注:独立一定不相关,不相关不一定独立当A和B为常数矩阵时,协差阵有如下性质:注:对任何随机向量来说,其协差阵都是对称阵,大多情况下是正定的6.相关系数:若的协差阵存在,且每个分量的方差大于0,则称随机向量X的相关阵为,为的相关系数。

7.指标的标准化处理:,令,有,则即标准化数据的协差阵=原指标的相关阵8.多元正态分布:X服从p元正态分布,也称X为p维正态随机分布,简称9.多元样本的数字特征样本资料可以用矩阵表示为(1)样本均值向量:(2)样本离差阵:(3)样本协差阵:(4)样本相关阵:其中,10.①②③④11.的性质①②③12.维希特(Wishart)分布设且相互独立,则由组成的随机矩阵:的分布称为非中心Wishart分布,记为。

第二章多元正态分布的参数估计

第二章多元正态分布的参数估计

就是剔除了 X2 Xk1, , X p 得(线性)影响之后,Xi和
Xj之间得协方差。
给定X2时Xi 和Xj得偏相关系数(partial correlation
coefficient)定义为: ij k1, , p
ij k1, , p
,
ii k1, , p jj k1, , p
其中 Σ11 2 ij k1, , p 。
μ12
μ1
Σ12
Σ
1 22
x2 μ2
Σ112
Σ11
Σ12
Σ
1 22
Σ
21
μ1·2和Σ11·2分别就是条件数学期望和条件协方差矩
阵,Σ11·2通常称为偏协方差矩阵。
这一性质表明,对于多元正态变量,其子向量得条件分布仍
就是(多元)正态得。
例5 设X~N3(μ, Σ),其中
1
16 4 2
μ
0 2
μ(1) μ(2)
11 Σ 21
31
12 22 32
13 23 33
Σ11
Σ
21
Σ12
22

X (1)
X1
X
2
~
N2 ( μ(1) ,
Σ11)
其中
μ (1)
1
2
Σ11
11 21
12
22
在此我们应该注意到,如果 X ( X1, X 2 , , X p ) 服从 p
aX
(0,1,
0)
X
2
X2
~
N (aμ, aΣa)
X3
1

(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22

应用多元统计分析课后习题答案高惠璇第二章部分习题解答学习资料

应用多元统计分析课后习题答案高惠璇第二章部分习题解答学习资料

1 2 [y ( 1 7 )2 (y 2 4 )2]
g(y1,y2)
设函数 g(y1, y2) 是随机向量Y的密度函数.
15
第二章 多元正态分布及参数的估计
(3) 随机向量
YYY12~N274,
I2
(4) 由于 XX X121011Y Y12CY
1 0 1 1 7 4 3 4 , 1 0 1 1 I2 1 0 1 1 1 1 2 1
e e d x e 2
2
1 2 (x 1 7 )2
9
第二章 多元正态分布及参数的估计
1 1 2(2x1 22x2 16 5 x1 2 1x4 14)91 2(x2x17)2
e e dx 2
2
2 1e 2 1 e dx 1 2(x1 28x1 1)6
1 2(x2x17)2 2
1(
1 e2
(22)(22)0
可得Σ的特征值 1 2 (1 )2 , 2 (1 ).
22
第二章 多元正态分布及参数的估计
λi (i=1,2)对应的特征向量为 1
1
l1
2 1 2
l1
2 1 2
由(1)可得椭圆方程为 2(1y 1 2)b22(1y 2 2)b21
其 b 2 中 2 la n ( 2 ) [ | |1 /2 ] 2 l2 n2 [ 1 2 a ]
解二:比较系数法 设 f(x 1,x2)2 1ex 1 2 p (2 x 1 2x2 2 2 x 1x2 2x 1 2 1x2 4 6) 5
2 1 2 11 2ex 2 p 1 2 2 2 1 (1 2)[2 2(x 1 1)2 2 1 2(x 1 1)x (2 2) 1 2(x2 2)2]

第二章 多元正态分布及参数的估计

第二章   多元正态分布及参数的估计

27
北大数学学院
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的定义与基本性质—简单例子
y BxB


0 0 1
1 0 0
100 110
1 2 0
003 100
0 0 1
1 0 0



1 0 1
2 0 1
003 100
2
北大数学学院
第二章 多元正态分布及参数的估计
目录
§2.1 随机向量 §2.2 多元正态分布的定义与
基本性质
§2.3 条件分布和独立性 §2.4 随机矩阵的正态分布 §2.5 多元正态分布的参数估计
3
北大数学学院
第二章 多元正态分布及参数的估计
§2.1 随 机 向
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例2.1.1
f (x1, x2
()X1,X212)的e联 12合( x12密 x22度) [1函数x为1 x2e

1 2
(
x12

x22
)
]
我们从后面将给出的正态随机向量的联合密
度函数的形式可知, (X1,X2)不是二元正态随机向 量.但通过计算边缘分布可得出:
本节有关随机向量的一些概念(联合分布, 边缘分布,条件分布,独立性;X的均值向量,X 的协差阵和相关阵,X与Y的协差阵)要求大家 自已复习.
三﹑ 均值向量和协方差阵的性质 (1) 设X,Y为随机向量,A,B为常数阵,则
E(AX)=A·E(X) E(AXB)=A·E(X)·B
6

应用多元统计分析课后习题答案高惠璇(第二章部分习题解答

应用多元统计分析课后习题答案高惠璇(第二章部分习题解答

2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
注意:由D(X)≥0,可知 (Σ1-Σ2) ≥0.
8
第二章 多元正态分布及参数的估计
2-11 已知X=(X1,X2)′的密度函数为
f
( x1 ,
x2 )
1
2
exp
1 2
(2 x12
x22
2 x1 x2
22 x1
14 x2
65)
试求X的均值和协方差阵.
解一:求边缘分布及Cov(X1,X2)=σ12
应用多元统计分析
第二章部分习题解答
第二章 多元正态分布及参数的估计
2-1 设3维随机向量X~N3(μ,2I3),已知
002,
A
0.5 0.5
1 0
00.5.5, d 12.
试求Y=AX+d的分布.
解:利用性质2,即得二维随机向量Y~N2(y,y),
其中:
2
第二章 多元正态分布及参数的估计
2-2 设X=(X1,X2)′~N2(μ,Σ),其中

多元正态分布及参数估计

多元正态分布及参数估计

2019/11/6
应用统计方法
22
2、性质 1) 设为常数,则 E (a X )a(E X ); 2)设 A,B,C 分别为常数矩阵,则
E ( A C X ) A E ( X B ) B C
3)设 X 1,X 2, ,X n为 n个同阶矩阵,则
E ( X 1 X 2 X n ) E X 1 E X 2 E X n
对一切 x、y成立,则称 x和 y相互独立。
2、设 x和 y是两个连续随机向量, x和 y相互
独立,当且仅当
f(x|y)fx(x)或 F (x ,y ) F x(x )F y(y )
对一切
2019/11/6
x
、y
成立。 应用统计方法
19
3、设 x1,x2, ,xn是 n个随机向量,若
F ( x 1 , x 2 , , x m ) F 1 ( x 1 ) F 2 ( x 2 ) F m ( x m ) mn
2019/11/6
应用统计方法
23
二、协方差矩阵
1、定义:设 x (x 1 ,x2, ,xp)和 y (y 1 ,y2, ,y q)分 别为 p维和 q维随机向量,则其协方差矩阵为
Exx2 1 E E ((xx1 2))y1E(y1)
y2E(y2) yqE(yq)
降的右连续函数;
2019/11/6
应用统计方法
4
② 分布函数的取值范围为[0,1],即
0F(a1,a2, ,ap)1
③ 分布函数当变量取值为无穷大时,函数值收敛到1,即
F(,, ,)1
2019/11/6
应用统计方法
5
二、两个常用的离散多元分布
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参
数的估计问题.
目录
§2.1 随机向量
§2.2 多元正态分布的定义与基本性质
§2.3 条件分布和独立性
§2.4 多元正态分布的参数估计
§2.1 随机向量
本课程所讨论的是多变量总体.把 p 个随机变量放在一起得 X=(X1,X2,…,Xp)′为一个 p 维随机向量,如果同时对 p 维总体进行一 次观测,得一个样品为 p 维数据.常把 n 个样品排成一个 n×p 矩阵, 称为样本资料阵.
E(AX)=A·E(X), E(AXB)=A·E(X)·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若 X,Y 相互独立,则 COV(X,Y)=O;反之不成立. 若 COV(X,Y)=O,我们称 X 与 Y 不相关.故有: 两随机向量若相互独立,则必不相关;
O
O
.
p
若 Σ ≥ 0( 非 负 定 ), 必 有 p × q 矩 阵 1 使 得 Σ= 11 ′
1
其中 A1 1
O
O
q
( q p ).
这里记Γ=(Γ1 | Γ2) , Γ1 为 p×q 列正交阵(p ≥ q).并设:
i 0(i 1,, q), q1 0,, p 0.
§2.2 多元正态分布的定义
§2.2 多元正态分布的性质 1
在一元统计中,若 X ~ N(u, 2 ), 则 X 的特征函数为
(t)
E (e itX
)
exp itu
1 2
t 2
2 .
(t ) E (eitX )
1
2
e e itx
(
x ) 2 2
2
dx
u ( x ) /
1
2
e e it (u )
u2 2
du
eit
定义 2.2.1 设 U=(U1 ,…,Uq)′为随机向量, U1 ,…,Uq 相互独立 且同 N(0,1)分布;设μ为 p 维常数向量,A 为 p×q 常数矩阵,则称 X=AU + μ的分布为 p 维正态分布,或称 X 为 p 维正态随机向量,记 为 X ~ Np(μ, AA′)。
简单地说,称 q 个相互独立的标准正态随机变量的一些线性组合 构成的随机向量的分布为多元正态分布。
0
L•L
0
1
'•
p
0
0
'
p
1
其中 L
O
O , L L , 故 L 0 .
p
1
当矩阵Σ>0(正定)时,矩阵 L 也称为Σ的平方根矩阵,记为 2 .
当 矩 阵 Σ >0( 正 定 ) 时 , 必 有 p × p 非 退 化 矩 阵 A 使 得
Σ=AA′
1
其中 A
函数为ΦX(t)= E(eitX)= E(eit (AU+μ) )
exp(it ) E(eit AU )
令 t′A=s′=( s1 ,… sq )
exp(it ) E(ei ( s1U1 sqU q ) ) exp(it ) E(eis1U1 eisqU q )
(因U1 ,…, Uq相互独立,乘积的期望等于期望的乘积)
exp(it ) E(eis1U1 ) E(eisqU q )
exp( it )
q j 1
exp(
1 2
s
2 j
)
exp( it ) exp[
1 2
( s12
s
2 q
)]
exp( it 1 s s ) exp( it 1 t A At )
2
2
§2.2 多元正态分布的第二种定义
在一元统计中,若 U~N(0,1),则 U 的任意线性变换 X=σU+μ~ N(μ, 2 )。利用这一性质,可以从标准正态分布来定义一般正态分 布:若 U~N(0,1),则称 X =σU+μ的分布为一般正态分布,记为 X ~ N(μ, 2 )。
此定义中,不必要求σ>0,当σ退化为 0 时仍有意义。把这种新 的定义方式推广到多元情况,可得出多元正态分布的第一种定义。ຫໍສະໝຸດ 两随机向量若不相关,则未必相互独立.
(3) 随机向量 X=(X1,X2,…,Xp)′的协差阵 D(X)= 是对称非负
定阵.即 =´ , ´ ≥0 ( 为任给的 p 维常量).
(4) Σ=L2 ,其中 L 为非负定阵.
由于Σ≥0(非负定),利用线性代数中实对称阵的对角化定理,存
在正交阵Γ,使
1
性质 1 设 U= (U1 ,…,Uq)′为随机向量, U1 , …,Uq 相互
独立且同 N(0,1)分布;令 X=μ+AU,则 X 的特征函数为
X (t )
exp[
i t
1 t A A t ]. 2
这里 t=( t1 ,…, t p ), 故ΦX(t)为 p 元函数.
性质 1 的证明:
根据随机向量特征函数的定义和性质,经计算即可得出 X 的特征
第二章 多元正态分布及参数的估计
在多元统计分析中,多元正态分布占有相当重要的地位.这是因
为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分
布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此
外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的
统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体
1
2
1 [u 2 2itu (it ) 2 (it ) 2 ]
e 2
du
e it
1
2
1 ( u it ) 2
1 ( it ) 2
e 2
e2
du
exp[it 1 t 2 2 ]
2
exp[it 1 t 2 2 ]
2
1
1 (u it )2
e2
du
2
当 X~N(0,1)时,φ(t)=exp[-t 2 /2].
记Σ=AA′,则有以下定义。
X
x11
x21
x12
x22
x1 p
x2 p
def
X (1)
X (2)
xn1 xn2 xnp X (n)
=(X1,X2,…,Xp)
其中 X(i)( i=1,…,n)是来自 p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放 在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布, 独立性;X 的均值向量,X 的协差阵和相关阵,X 与 Y 的协差阵)要求大 家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设 X,Y 为随机向量,A,B 为常数阵,则
相关文档
最新文档