【学习课件】第二章--多元正态分布及其抽样分布

合集下载

第二章 多元正态分布及其抽样分布

第二章  多元正态分布及其抽样分布
1 2
Σ Σ11 Σ22
f ( x1 , x2 , , x p ) ( 2 )
(2 )
p 2
p 2
1 Σ22
1 exp[ (x μ)Σ 1 (x μ)] 2
1 2
Σ11
1 2
Σ22
1 (x1 μ1 ) Σ 1 11 exp[ (x1 μ1 ) (x2 μ 2 ) ] 1 2 Σ22 (x2 μ 2 )
n
六、x ~ N p (μ, Σ) ,则(x - μ)Σ-1 (x - μ) ~ 2 ( p)分布。

y Σ (x μ) Var(y ) Var[ Σ (x μ)] Σ Var(x μ)Σ
1 2 1 2 1 2

1 2
Σ ΣΣ Ι
2 y是p维标准正态分布,故yy服从( p)分布。
服从p维正态分布,且均值向量为
E ( x ) ( Ex1 , Ex 2 , , Ex p ) ( 1 , 2 , , p )
x的协方差矩阵为
Var (x) E(x )(x )
E AuuA
AE uu A
AIA
AA Σx
系数,定义为
ij.k 1,, p
ij.k 1,, p ii.k 1,, p jj .k 1,, p
它度量了在值 xk 1 ,, xp给定的条件下,xi 与 x j ( i, j k )相关性的强弱。
例 设X~N6( ,),其协方差矩阵为,计算偏相 关系数。
7.033 2.168 3.540 4.981 2.874 30.530
为 x 2 给定的条件下 x1 数学期望。

多元统计分析第二章 多元正态分布

多元统计分析第二章 多元正态分布

第2章 多元正态分布多元正态分析是一元正态分布向多元的自然推广。

多元正态分布是多元分析的基础,多元分析的许多理论都是建立在多元正态总体基础上的。

虽然实际的数据不一定恰好是多元正态的,但是正态分布常常是真实的总体分布的一种有效的近似。

所以研究多元正态分布在理论上或实际上都有重大意义。

限于篇幅,本章仅简介多元正态简单理论,细节可参看王学民(2004),张尧庭(2002),余锦华(2005),Richard (2003),朱道元(1999)等。

现实世界的许多问题都可以纳入正态理论的范围内,正态分布可以作为许多统计量的近似的抽样分布。

2.1随机向量2.1.1随机向量定义2.1.1:称每个分量都是随机变量的向量为随机向量。

类似地,所有元素都是随机变量的矩阵称为随机矩阵。

设()1,,p X X X '= 是1p ⨯随机向量,其概率分布函数定义为:(){}111,,,,p p p F x x P X x X x =≤≤ ,1,,p x x 为任意实数多元分布函数()1,,p F x x 有如下性质: (1)()10,,1p F x x ≤≤ ;(2)()1,,p F x x 是每个变量,1,2,,i x i p = 的非降右连续函数; (3)(),,1F ∞∞= ;(4)()()()211,,,,,,,0p p F x x F x x F x -∞=-∞==-∞= 。

多元分布和一元分布一样也分为离散型和连续型。

连续型随机向量()1,,pX X X '= 的分布函数可以表示为 : ()()1111,,,,px x p p p F x x f t t dt dt -∞-∞=⎰⎰,()1,,pp x x R ∈ (2.1)称()1,,p f x x 是()1,,p X X X '= 的多元联合概率密度,简称多元概率密度或多元密度。

多元概率密度()1,,p f x x 有以下性质: (1)()1,,p f x x 非负; (2)()11,,1p p f x x dx dx ∞∞-∞-∞=⎰⎰ ;(3)()()111,,,,p p p nF x x f x x x x ∂=∂∂2.1.2边缘分布、条件分布和独立性 边缘分布设()1,,p X X X '= 是p 维连续型随机向量,由其q 个分量组成的向量()1X (不妨设()()11,,q X X X '= )的分布称为的边缘分布,其边缘概率密度为:()()()1111,,,,X q p q p f x x f x x dx dx ∞∞+-∞-∞=⎰⎰ (2.2)条件分布设()1,,p X X X '= 是p 维连续型随机向量,()()11,,q X X X '= ,()()()()2112,,,,,0q p X q p X X X f x x ++'=> ,在给定()2X 的条件下,()1X 的条件概率密度函数为:()()()()21111,,,,,,,,p q q p X q p f x x f x x x x f x x ++=(2.3)独立性设()1,,n X X 是连续型随机向量,则1,,n X X 相互独立当且仅当()()()111,,n n X X n f x x f x f x = 对任意1,,n x x 成立。

第二章 多元正态分布 《应用多元统计分析》 ppt课件

第二章 多元正态分布 《应用多元统计分析》 ppt课件
写字母表示; 随机变量用大写字母表示,其实现值用小写字母表示。
1
一、随机向量
在理论上,对多维随机向量的研究和对一维随机 变量的研究思路是类似的,通过分布及其特征进 行刻画。不同的是,可能要考虑变量之间的相关 关系。
在统计应用上,对多维随机向量的研究和对一维 随机变量的研究思路也是一样的,要通过样本资 料来推断总体。
19
二、多元正态分布的数字特征
若 X ~ Np μ, Σ ,则 E(X) μ,D(X) Σ ,即 μ 恰好是
多维随机向量 X的均值向量, Σ 恰好是多维随机 向量 X 的协差阵。其中,
1
μ
2

p
11 12
Σ
21
22
p1 p2
1p
2
p
pp
20
三、多元正态分布的参数估计
若 X 的联合分布密度为 f (x1, x2 , , xp ),则 X(1) 的边缘 密度函数为:
f (x1, x2 , , xq )
f (x1, x2 ,
, xq , xq1,
, xp )dtq1
dt,p (2.3)
多维随机向量的独立性。若 p个随机变量
X1, X 2 ,, X p的联合分布密度等于各自边缘分布的 乘积,则称 X1, X 2 ,, X p是互相独立的。
1
x)(x( )
x)
n
(x1 x1)2
1
1 n
n
(x1 x1)(x 2 x2 )
1
n
(x 2 x2 )2
1
n
x 2
1
n
x
p
1
n
( x 1
x1)(x p
xp

生物统计学课件-3正态分布和抽样分布

生物统计学课件-3正态分布和抽样分布

近似性
当样本量足够大时,样本 统计量近似服从正态分布。
抽样分布在生物学中的应用
01
实验设计
在生物学实验中,常常需要从总体中随机抽取一定数量的样本进行实验,
以评估实验结果的可重复性和可靠性。抽样分布理论为实验设计提供了
理论基础。
02
数据处理和分析
在生物学数据分析和统计推断中,常常需要利用样本统计量来估计总体
生物统计学课件-3正态分布 和抽样分布
目录
• 正态分布 • 抽样分布 • 正态分布与抽样分布的关系 • 实例分析
01
正态分布
正态分布的定义
正态分布是一种连续概率分布,其概率密度函数呈钟形,对称轴为均值所在直线。
在正态分布中,数据点在均值附近最为集中,向两侧逐渐减少,形成钟形曲线。
正态分布是自然界和人类社会中最为常见的分布形态之一,许多随机变量都服从或 近似服从正态分布。
02
抽样分布
抽样分布的定义
01
02
03
抽样分布
描述样本统计量(如样本 均值、样本方差等)的概 率分布。
样本统计量
从总体中随机抽取的样本 所计算出的各种统计指标, 如样本均值、样本方差等。
总体
研究对象全体个体的集合。
抽样分布的性质
独立性
样本统计量之间相互独立。
随机性
样本统计量的取值具有随 机性。
中心极限定理
在大量独立随机抽样的前提下,不论总体分布如何,样本均值的分布趋近于正态分布。
样本均值的方差与总体方差的关系
样本均值的方差随着样本量的增加而趋近于总体方差的1/n,其中n为样本量。
正态分布与抽样分布的区别
定义不同
正态分布是对总体特征的描述,而抽样分布是对样本统计 量的描述。

2多元正态分布

2多元正态分布
证:只要验证满足密度函数两个条件即可
(1)显然,当 x1 0, x2 0 时有 f (x1, x2 ) 0
(2)
e(x1x2 )dx1dx2
e(x1x2 )dx1dx2
00
e( x1 x2
)dx1
dx2
0 0
ex2 dx2
ex2
0
1
0
定义 4 设 X ( X1, X 2 , , X p ) 是 p 维随机向量,称由 它 的 q( p) 个 分 量 组 成 的 子 向 量
定义 1 将 p 个随机变量 X1, X 2 , , X p 的整体称为 p 维随机
向量,记为 X ( X1, X 2 , , X p ) 。
在对随机向量的研究仍然限于讨论离散型和连续型两类随机 向量。
先回顾一下一元统计中分布函数和密度函数的定义。
设 X 是一个随机变量,称 F(x) P(X x) 为 X 的概率分布
互独立易推得 Cov(X ,Y ) 0 ,即 X 和Y 不相关;但反过
来,当 X 和Y 不相关时,一般不能推知它们独立。
当 A 、B 为常数矩阵时,由定义可以推出协方差阵有如下
性质:
(1)对于常数向量 a ,有 D( X a) D( X )
(2) D(AX ) AD(X )A AΣA
(3) Cov(AX, BY ) ACov(X,Y )B
f
( x1 ,
x2 )
1
21 2 (1
2 )1/ 2
exp
1
2(1 2 )
(
x1
1)2
2 1
2
( x1
1 )( x2 1 2
2 )
( x2
2
2 2
)2Leabharlann 对于 0 ,那么 X1 与 X 2 是相互独立的;若 0 ,则 X1 与

多元统计分析:第二章 多元正态分布及ppt课件

多元统计分析:第二章   多元正态分布及ppt课件
§2.2 多元正态分布的性质3
性质3 若X~Np(μ,Σ),E(X)=μ,D(X)=Σ. 证明 因Σ≥0,Σ可分解为:Σ=AA′,
则由定义2.2.1可知
X =d AU+μ (A为p×q实矩阵)
其中U=(U1,…,Uq)′,且U1,…,Uq相互独立同 N(0,1)分布,故有
E(U )=0, D(U )=Iq .
Z=BX+d d= B(AU+μ)+d
= (BA)U+(Bμ+d) 由定义2.2.1可知
Z ~Ns(Bμ+d, (BA)(BA)),
Z ~Ns(Bμ+d, BΣB). (这里Σ=AA).
ppt精选版
21
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2
推论
分为
设X=
X(1) X(2)
r p-r
§2.2
在一元统计中,若U~N(0,1),则U的任意 线性变换X=σU+μ~N(μ,σ2)。利用这一性质, 可以从标准正态分布来定义一般正态分布:
若U~N(0,1),则称X =σU+μ的分布为 一般正态分布,记为X ~N(μ, σ2 )。
此定义中,不必要求σ>0,当σ退化为0时仍 有意义。把这种新的定义方式推广到多元情况
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
X=(X1,X2,…,Xp)′ 为一个p维随机向量,如果同时对p维 总体进行一次观测,得一个样品为 p 维数据.常把n个样品排成一个n×p矩 阵,称为样本资料阵.
ppt精选版
4
第二章 多元正态分布及参数的估计
§2.1 随 机 向
X xx1211
其L 中

多元统计分析多元正态分布

多元统计分析多元正态分布

为X的方差或协方差矩阵
D(X) 或∑
X,Y的协方差矩阵
定义7
设X=( X1,…,Xp )´Y=( Y1,…,Yp )´称
Cov(X,Y)=E(X-E(X))(Y-E(Y))´
Cov(X1, Y1) Cov(X1, Y2) … Cov(X1, Yp)
= Cov(X2, Y1) Cov(X2, Y2) … Cov(X2, Yp)
合并距离最近的两类为一新类 计算新类与当前各类的距离。再合并、计算, 直至只有一类为止
画聚类图,解释
类与类之间的距离
1.最短距离法(single linkage) 2.最长距离法(complete linkage) 3.中间距离法(median method) 4.重心法(centroid method) 5.类平均法(average linkage) 6.可变类平均法(flexible-beta method) 7.可变法 8.离差平方和法(Ward's minimumvariance method)
(2)相似系数
研究样品间的关系常用距离,研究指标( 变量)间的关系常用相似系数。 相似系数常用的有:夹角余弦与相关系数
2、对指标(变量)分类(R型)
相似系数的定义
夹角余弦(Cosine)
相似矩阵
变量间相似矩阵
相关系数
ij
( x x )( x x )
1 i i j j n
Vij=
样本相关矩阵定义
R=(rij)p×p
rij =
3、 µ 和∑的估计及性质
最大似然法求出µ 和∑的估计量为
估计量的性质
1、 ,
,
是μ的无偏估计量
不是Σ的无偏估计量

【学习课件】第二章--多元正态分布及其抽样分布

【学习课件】第二章--多元正态分布及其抽样分布

12
第二节 多元正态分布的性质
一、多元正态分布的特征函数
(t) exp(it 1 tt)
2
二、x是一个服从p维正态分布,当且仅当它的任何 线性函数 ax 服从一元正态分布N p (μ, Σ)。
三、 X服从 p 维正态分布,则 y Cx b ,其中C为 r p 常数矩阵,b为 r 维的常数向量,则
2.939
19.532
4.069
4.525
27.363
2021/7/9
29
7.033 2.168 3.540 1.681 1.276
4.981 2.874 1.276 1.161
11.2
11 1221221
30.530 4.638 5.864
3.107 1.851
3.860
Σ
1 22
Σ21是x
2的条件下x1的条件协条件协方差。
2021/7/9
25
十二、偏相关系数
矩阵Σ11.2称为条件协方差矩阵,它的元素用 ij.k1,, p
表示。是当 x2 给定的条件下,xi

x

j
i,
j k )的偏相关
系数,定义为
ij.k 1,, p
ij.k 1,, p ii.k 1,, p jj.k 1,, p
1
y Σ 2 (x μ)
1
Var(y) Var[Σ 2 (x μ)]
1
1
Σ 2Var(x μ)Σ 2
1
1
Σ 2ΣΣ 2 Ι
y是p维标准正态分布,故yy服从(2 p)分布。
2021/7/9
16
七、将 x, ,作如下的分块:
11 21
12 k 22 k p
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ppt课件
9
其密度函数为
J(u x) A 1 AA 1 2
f (x1, x2 , , xp )
(2 ) p 2 exp[ 1 (x μ) A1 A1(x μ)] | J |
2
(2 ) p 2 Σ 1 2 exp[ 1 (x μ)Σ1(x μ)]
2
ppt课件
10
值得注意
设随机向量 u ~ Nq (0, I ) ,μ是常数向量,A 是一
则 u (u1,u2 ,,u p ) 密度函数为
f (x1, x2 , , xp )
n
i1
1
2
exp( 1 2
xi2 )
(2 ) p
ppt课件
2 exp( 1 2
p i1
xi2 )
3
ui i 1,2,, p
其中的
u (u1, u2 ,, u p )
均值为 E(u) (Eu1,Eu2, ,Eup ) 0
个 p*q的常数矩阵,则 x Au 服从正态分布,记 为 x ~ Np ( , ) ,其中 AA( p * p)
若 rank (A) p( p q),则Σ-1存在,x Au 是非退化 p元正态分布;
若 rank (A) p( p q),则Σ1不存在,x Au 是退化 p元正态分布,不存在密度函数。
第二节 多元正态分布的性质
一、多元正态分布的特征函数
(t) exp(it 1 tt)
2
二、x是一个服从p维正态分布,当且仅当它的任何 线性函数 ax 服从一元正态分布N p (μ, Σ)。
三、 X服从 p 维正态分布,则 y Cx b ,其中C为 r p 常数矩阵,b为 r 维的常数向量,则
Σ1
Σ1 11
Σ
1 22
f
(
x1,
x2
,,
x
p
)
(2
)
p
2
1 2
exp[
1 2
(x
μ)Σ
1
(x
μ)]
(2 ) p 2 Σ11 1 2 Σ22 1 2
exp[
1 2
(x1
μ1)
(x2 μ2 )
Σ1 11
ppt课件
Σ1 22
(x1 (x2
μ1) μ2)
]
18
(2 ) p 2 Σ11 1 2 Σ22 1 2
ppt课件
11
1 0
例:设随机向量 u ~ N 2 (0, I ) ,x Au ,A 0 1 ,则 x 的分布是
退化的三元正态分布。
1 1
1 0
1 0 1
Σ AA 0 1
1 1
1 0
0 1
1 1
0 1
1 1
1 2
1 0 1
Σ 0
1
1
1 1
10
21
1 211 0
1
1 1 2
ppt课件
12
矩阵,u (u1,u2 ,,u p ) 服从 p 维标准正态分布,则
x Au
服从p维正态分布,且均值向量为
E (x) (Ex1, Ex2 ,, Ex p ) (1, 2 ,, p )
ppt课件
8
x的协方差矩阵为
Var(x) E(x )(x )
EAuuA
AEuuA
AIA AA Σx
ppt课件
4
协方差矩阵为
u12 u1u2 u1u p
Var
(u)
E(uu)
E
u
2u1
u
2 2
u
2u
p
u pu1 u pu2
u
2 p
1
1
I
1
ppt课件
5
二、一般的正态分布
设随机向量 x (x1, x2 ,, x p ) ,若其的密度函数为
f (x1, x2, , xp )
1
y Σ 2 (x μ)
1
Var(y) Var[Σ 2 (x μ)]
1
1
Σ 2Var(x μ)Σ 2
1
1
Σ 2ΣΣ 2 Ι
y是p维标准正态分布,故yy服从(2 p)分布。
ppt课件
16
七、将 x, ,作如下的分块:
11 21
12 k 22 k p
1 2
p
k
k
x
x1 x2
p
k
k
子 x1, x2 向量相互独立,当且仅当 12 0。 证:必要性

x1和 x 2相互独立 Σ12 E[(x1 μ1 )( x2 μ2 )]
Σ12 E(x1 μ1 )E( x2 μ2 )]
Σ12 0
ppt课件
17
充分性 Σ12 0
Σ1
Σ1 11 0
0
Σ
1 22
Σ Σ11 Σ22
(x1 1)(xp p )
(x2 2 )(xp p )
(xp
)(x1
1 )
(xp p )(x2 2 )
(xp p)2
称 x (x1, x2 ,, x p ) 服从均值为E(X),协方差为的正态分布。
ppt课件
7
三、一般的p维正态和p维标准正态的关系 设 x Au ,其中 A 是一个 p 阶非退化
exp[
1 2
(x1
μ1)Σ111
(x2
μ2
)Σ221
(x1 (x2
μ1)
μ2
)
]
(2 ) p 2 Σ11 1 2 Σ22 1 2
exp[ 1 2
(x1
μ1)Σ111(x1
μ1)
(x2
μ
2

1 22
(
x2
(2 ) p 2 Σ 1 2 exp[ 1 (x - μ)Σ-1(x - μ)]
2
xi
ppt课件
6
其中 x (x1, x2 ,, x p ) 的均值为E (x) (1, 2 ,, p )
协方差为
(x1 1)2
E (x2
2 )(x1
2
)
(x1 1)(x2 2 ) (x2 2 )2
ppt课件
14
五、设 x1, x2 ,, xn , xi ~ N p (i , i ) i, 1,2,, n 相互独立, 且,则对任意 n 个常数 k1,, kn ,有
n
kixi
~
N
p
(
n
i
,
n
ki2
i
).
i 1
i1 i1
ppt课件
15
六、x ~ N p (μ, Σ) ,则(x - μ)Σ-1(x - μ) ~ 2 ( p)分布。
y
~
Nr
(C
b, CC) ppt课件
13
Байду номын сангаас
四、设 x ~ N p (,) ,则 x 的任何子向量也服从多元正态 分布,其均值为 的相应子向量,协方差为 的相应子矩 阵。
x x1 k μ μ1 k
x2 p k
μ2 p k
Σ Σ11 Σ12 k Σ21 Σ22 p k
第二章 多元正态分布及其抽样分布
ppt课件
1
第一节 第二节 第三节 第四节
内容
多元正态分布的定义 多元正态的性质 多元正态参数的极大似然估计 多元正态的样本分布
ppt课件
2
第一节 多元正态分布的定义
一、标准多元正态分布
设随机向量 u (u1,u2 ,,u p ) 其分量独立同分布于 N (0,1)
相关文档
最新文档