协方差和相关系数的计算.ppt
合集下载
第13讲 协方差与相关系数 太原理工大学工程硕士概率论与数理统计

22
[例] 已知 解
X 服从 0, 2π
上的均匀分布,求 E ( X 2 ), E (sin X )
X 的概率密度
1 , 0 ≤ x ≤ 2π, f ( x) 2 π 其他, 0,
E( X 2 )
1 2 x f ( x)dx 2π
2π 0
3 2 2 π 1 x 4 π x 2 dx 2π 3 0 3
则: 2 X Y ~ N (0,25)
( 2) D(2 X Y ) 4 DX DY 2 2COV ( X , Y ) 1 25 - 4 XY DX DY 25 4 2 3 13 2
则: 2 X Y ~ N (0,13)
20
小结
本讲首先介绍二维随机向量 (X,Y) 的分量 X与Y 的协方差及相关系数的概念、性质和计 算;然后介绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、k+m 阶混合原点矩、k+m 阶混 合中心矩),n 维随机向量的协方差阵的概念、 性质和计算;最后简单介绍了n 元正态分布 的概念和三条重要性质。
则(Y1,Y2, …, Yk)'服从k 元正态分布。
这一性质称为正态变量的线性变换不变性。
17
(3) 设(X1,X2, …,Xn)服从n元正态分布,则 “X1, X2, …, Xn 相互独立” 等价于 “X1,X2, …,Xn两两不相关”。
18
例2 设X和Y相互独立,且X~N(1, 2), Y~N(0, 1)。 求 Z = 2X-Y+3 的概率密度。 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立,
c22 E{[ X 2 E ( X 2 )]2 } c11 c12 排成一个2×2矩阵 , c 21 c 22
概率论与数理统计-协方差和相关系数01

相关系数刻划了X和 间 线性相关”的程度. =相关系数刻划了 和Y间“线性相关”的程度
=
9
证: 对任意的 对任意的a,b,令 令
刻画了Y与 刻画了 与a+bX的偏离程度 的偏离程度 e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y)
要使 与 的某个线性函数 最为接近 就是要找a,b使得误差 最为接近 就是要找 数 要使Y与X的某个线性函数a+bX最为接近,就是要找 使得误差 视为关于a,b的二元函数 视为关于 的二元函数,求驻点: 平方e值最 值最小 平方 值最小. 将e视为关于 的二元函数,求驻点: 字 特 征 解得
X与Y不相关 只说明 与Y之间没有线性关系,但可以有 与 不相关 只说明X与 之间没有线性关系 不相关,只说明 之间没有线性关系, 非线性关系; 非线性关系; 而X与Y独立是指 独立是指X,Y之间既无线性关系, 之间既无线性关系, 与 独立是指 之间既无线性关系 也无非线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。 独立”必然不相关,但反之不然。 不相关 但是,对于二维正态分布,独立与不相关等价。 但是,对于二维正态分布,独立与不相关等价。 与不相关等价 2 若二维r.v ( X , Y ) ~ N ( µ 1 , µ 2 ; σ 12 , σ 2 ; ρ ) 即:若二维 则X与Y相互独立 与 相互独立
D(X)=p (1-p ) D(X)=np(1-p) D(X)=
E(X) = µ
a +b E(X) = 2 1 E(X) =
D(X)= σ
λ
2
(b − a)2 D(X)= 12
(5) 切比雪夫不等式 =
=
9
证: 对任意的 对任意的a,b,令 令
刻画了Y与 刻画了 与a+bX的偏离程度 的偏离程度 e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y)
要使 与 的某个线性函数 最为接近 就是要找a,b使得误差 最为接近 就是要找 数 要使Y与X的某个线性函数a+bX最为接近,就是要找 使得误差 视为关于a,b的二元函数 视为关于 的二元函数,求驻点: 平方e值最 值最小 平方 值最小. 将e视为关于 的二元函数,求驻点: 字 特 征 解得
X与Y不相关 只说明 与Y之间没有线性关系,但可以有 与 不相关 只说明X与 之间没有线性关系 不相关,只说明 之间没有线性关系, 非线性关系; 非线性关系; 而X与Y独立是指 独立是指X,Y之间既无线性关系, 之间既无线性关系, 与 独立是指 之间既无线性关系 也无非线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。 独立”必然不相关,但反之不然。 不相关 但是,对于二维正态分布,独立与不相关等价。 但是,对于二维正态分布,独立与不相关等价。 与不相关等价 2 若二维r.v ( X , Y ) ~ N ( µ 1 , µ 2 ; σ 12 , σ 2 ; ρ ) 即:若二维 则X与Y相互独立 与 相互独立
D(X)=p (1-p ) D(X)=np(1-p) D(X)=
E(X) = µ
a +b E(X) = 2 1 E(X) =
D(X)= σ
λ
2
(b − a)2 D(X)= 12
(5) 切比雪夫不等式 =
第14讲 协方差与相关系数

X 和 Y 独立时 X 和 Y 不相关, 反之不一定成立。 但对下述情形,独立与不相关是一回事: 若(X, Y )服从二维正态分布,则
X 与Y 独立的充分必要条件是X与Y不相关。 参见P70-例3.6.3: X与Y独立 XY=0
练习2 1) X ~ U (0,1), Y X 2 , 求 XY
2 1 x2 1 2 dy = 1 x -1 x 1 1 x2 f X ( x) 0, 其他 1 2 E( X ) x 1 x2 d y 0
1
E ( XY )
1
x 2 y 2 1 1 1
( xy/ ) dxdy
期望、方差、协方差的性质对比
期望
E(c)=C E(aX)=aE(X), E(X+Y) =E(X)+E(Y) 当X与Y独立时 E(XY)=E(X)E(Y)
方差
D(c)=0 D(aX)=a2D(X),
协方差
Cov(c,X)=0
Cov(aX,bY) =abCov(X,Y) D(X+Y)=D(X)+ Cov(X+Y,Z) D(Y)+2Cov(X,Y) =Cov(X,Z) +Cov(Y,Z)
y 1
1 y 2 1 y 2
xdx dy
1 0 dy 0.
所以,Cov(X, Y)= E(XY)-E(X) E(Y) = 0 . 此外,Var(X) > 0, Var(Y) > 0 . 所以,XY = 0,即 X 与 Y 不相关。 但是,在第三章已计算过: X与Y不独立。
第十四讲 协方差与相关系数
前面我们介绍了随机变量的数学期望 和方差,对于多维随机变量,反映分量之 间关系的数字特征中,最重要的,就是本 讲要讨论的 协方差和相关系数
概率论与数理统计课件 协方差与相关系数

试求二维正态随机变量的边缘概率密度 .
p( x, y)
1
e 1 2(1 ρ2
)
(
x
μ1 σ12
)2
2
ρ(
x
μ1 )( σ1σ2
y
μ2
)
(
y
μ2 σ22
)2
2πσ1σ2 1 ρ2
pX (x) pY ( y)
1
e ,
(
x μ1 2 σ12
)2
2πσ1 1
e
(
y μ2 2σ22
)2
1
2πσ1σ2
1 ρ2
( x μ1 )( y μ2 )
e e d y d x.
(
x μ1 2σ12
)2
1 2(1
ρ2
)
y
μ2 σ2
ρ
x
μ1 σ1
2
令t
1 1
ρ2
y
μ2 σ2
ρ
x
μ1 σ1
,
u x μ1 , σ1
2019/4/24
4-3—协方差和相关系数
3 .不相关与相互独立的关系
相互独立 不相关
2019/4/24
4-3—协方差和相关系数
10
例1 设 ( X ,Y ) 在圆域 x2 y2 1 上服从均匀分布, (1)问X与Y是否独立? (2)求相关系数
例2 X ~N(0,1),Y X 2, 证明X与Y不相关且不独立
解:E( XY ) E( XX 2 ) x3 ( x)dx 0 Cov( X ,Y ) E( XY ) E( X )E(Y ) 0 故X与Y不相关
2019/4/24
4-3—协方差和相关系数
概率论教学课件第四章4.4协方差与相关系数

1
一、协方差
对于二维随机变量(X,Y),讨论描述X与Y之间相互 依赖关系的数字特征.
X与Y相互独立 E[(X EX )(Y EY )] 0
或者:E[(X EX )(Y EY )] 0 X与Y一定不相互独立
定义1. 若E[(X EX )(Y EY )]存在, 则称E[(X EX )(Y EY )]为X与Y的协方差.
(连续型).
-
3
或者用以下公式计算
Cov(X , Y ) E(XY ) EX EY
Cov (X , Y ) E[(X EX )(Y EY )]
E(XY XEY YEX EXEY ) E(XY ) EX EY EX EY EX EY E(XY ) EX EY
4
定义2* 设 DX 0 , DY 0,称X,Y的标准化随机变量
X , Y 的协方差 Cov ( X , Y ) 为X与Y的相关系数.
记 为 XY , 即
XY Cov( X , Y ) E( X Y ) EX EY E( X Y )
E[( X EX )(Y EY )] Cov( X ,Y ) .
其逆命题不真!
注:若Cov X,Y 0,即E XY EXEY,则X与Y不相互独立.
4. D(X Y ) DX DY 2Cov(X , Y ).
5
例4.14 设二维随机变量(X,Y )的联合分布列为
XY 0 1 pi 0 0.2 0.3 0.5 1 0.5 0 0.5
p j 0.7 0.3
1 R
2
R
dx
R
R2 x2
xydy
R2 x2
0,
Cov(X , Y ) E(XY ) EXEY 0 00 0 .
8
Cov(X , Y ) E(XY ) EXEY 0 .
一、协方差
对于二维随机变量(X,Y),讨论描述X与Y之间相互 依赖关系的数字特征.
X与Y相互独立 E[(X EX )(Y EY )] 0
或者:E[(X EX )(Y EY )] 0 X与Y一定不相互独立
定义1. 若E[(X EX )(Y EY )]存在, 则称E[(X EX )(Y EY )]为X与Y的协方差.
(连续型).
-
3
或者用以下公式计算
Cov(X , Y ) E(XY ) EX EY
Cov (X , Y ) E[(X EX )(Y EY )]
E(XY XEY YEX EXEY ) E(XY ) EX EY EX EY EX EY E(XY ) EX EY
4
定义2* 设 DX 0 , DY 0,称X,Y的标准化随机变量
X , Y 的协方差 Cov ( X , Y ) 为X与Y的相关系数.
记 为 XY , 即
XY Cov( X , Y ) E( X Y ) EX EY E( X Y )
E[( X EX )(Y EY )] Cov( X ,Y ) .
其逆命题不真!
注:若Cov X,Y 0,即E XY EXEY,则X与Y不相互独立.
4. D(X Y ) DX DY 2Cov(X , Y ).
5
例4.14 设二维随机变量(X,Y )的联合分布列为
XY 0 1 pi 0 0.2 0.3 0.5 1 0.5 0 0.5
p j 0.7 0.3
1 R
2
R
dx
R
R2 x2
xydy
R2 x2
0,
Cov(X , Y ) E(XY ) EXEY 0 00 0 .
8
Cov(X , Y ) E(XY ) EXEY 0 .
随机变量的协方差和相关系数

协方差的大小在一定程度上反映了X和Y相互间 的关系,但它还受X与Y本身度量单位的影响.
为了克服这一缺点,对协方差进行标准化,这 就引入了相关系数 .
二、相关系数
定义: 设D(X)>0, D(Y)>0, 称
XY
cov(X,Y) D(X)D(Y)
为随机变量 X 和 Y 的相关系数 .
在不致引起混淆时,记 XY 为 .
注: X Y 反应了X与Y的线性关系密切程度;X与Y不相关
表明两者没有线性关系,但不等于说没有其他关系。
独立与不相关的关系: 若 X 与 Y 独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立.
但可以证明对下述情形,独立与不相关等价
若(X,Y)服从二维正态分布,则
X与Y独立 X与Y不相关
注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
六、例题讲解
1、设 X ~ N (,2 )Y ,~ N (,2 ),X 且 , Y 相 设 互
试Z求 1XY和 Z2XY的相关 (其系 中 , 数
是不全为零的常数)。
1、解 D (X)D (Y)2
D ( Z 1 ) D ( X Y ) 2 D ( X ) 2 D ( Y ) ( 2 2 ) 2 D ( Z 2 ) D ( X Y ) 2 D ( X ) 2 D ( Y ) ( 2 2 ) 2
随机变量的协方差和相关系数
第三节 随机变量的协方差和相关系数
协方差
协方差矩阵 相关系数矩阵 原点矩、中心矩
前面我们介绍了随机变量的数学期望和方差, 对于二维随机变量(X,Y),我们除了讨论X与Y 的数学期望和方差以外,还要讨论描述X和Y之间 关系的数字特征,这就是本讲要讨论的
协方差和相关系数
协方差和相关系数的计算

当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y E(Y ) t0 ( X E( X ))) 1
时,等式成立—Cauchy-Schwarz不等式.
证明 令
g(t) E[(Y E(Y )) t( X E( X ))]2 D(Y ) 2t cov( X ,Y ) t 2D( X )
若D (X) > 0, D (Y) > 0 ,称
E ( X E( X ))(Y E(Y ) cov( X ,Y ) D( X ) D(Y ) D( X ) D(Y )
为X,Y 的相关系数,记为
XY
cov( X ,Y ) D( X ) D(Y )
事实上, XY cov( X ,Y ).
D[(Y E(Y )) t0 ( X E( X ))] 0 P[(Y E(Y )) t0 ( X E( X )) 0] 1 P[(Y E(Y )) t0 ( X E( X )) 0] 1 即 P[(Y E(Y )) t0 ( X E( X ))] 1
即Y 与X 有线性关系的概率等于1,这种线性关 系为
对任何实数 t ,g (t) 0
4 cov 2 ( X ,Y ) 4D( X )D(Y ) 0
即 | cov( X ,Y ) |2 D( X )D(Y )
等号成立
g (t) 0 有两个相等的实零点
t0
cov( X ,Y D(X )
)
g(t0 ) 0 即
D(Y ) D(X )
E[(Y E(Y )) t0 ( X E( X ))]2 0 又显然 E[(Y E(Y )) t0 ( X E( X ))] 0
解 cov(U ,V ) E(UV ) E(U )E(V ) a2E( X 2 ) b2E(Y 2 )
P(Y E(Y ) t0 ( X E( X ))) 1
时,等式成立—Cauchy-Schwarz不等式.
证明 令
g(t) E[(Y E(Y )) t( X E( X ))]2 D(Y ) 2t cov( X ,Y ) t 2D( X )
若D (X) > 0, D (Y) > 0 ,称
E ( X E( X ))(Y E(Y ) cov( X ,Y ) D( X ) D(Y ) D( X ) D(Y )
为X,Y 的相关系数,记为
XY
cov( X ,Y ) D( X ) D(Y )
事实上, XY cov( X ,Y ).
D[(Y E(Y )) t0 ( X E( X ))] 0 P[(Y E(Y )) t0 ( X E( X )) 0] 1 P[(Y E(Y )) t0 ( X E( X )) 0] 1 即 P[(Y E(Y )) t0 ( X E( X ))] 1
即Y 与X 有线性关系的概率等于1,这种线性关 系为
对任何实数 t ,g (t) 0
4 cov 2 ( X ,Y ) 4D( X )D(Y ) 0
即 | cov( X ,Y ) |2 D( X )D(Y )
等号成立
g (t) 0 有两个相等的实零点
t0
cov( X ,Y D(X )
)
g(t0 ) 0 即
D(Y ) D(X )
E[(Y E(Y )) t0 ( X E( X ))]2 0 又显然 E[(Y E(Y )) t0 ( X E( X ))] 0
解 cov(U ,V ) E(UV ) E(U )E(V ) a2E( X 2 ) b2E(Y 2 )
随机变量的协方差和相关系数

cov(X,Y)=E[X-EX][Y-EY]=EXY-EXEY
1) 当(X,Y)是离散型随机变量时,
cov( X , Y ) ( xi EX )( y j EY ) pij量时,
cov( X , Y )
( x EX )( y EY ) f ( x, y)dxdy.
存在,称它为X的k阶中心矩. 注:均值 E(X)是X一阶原点矩, 方差D(X)是X的二阶中心矩.
设 X 和 Y 是随机变量,若
E( X Y )
k
l
k,l=1,2,… 存在,
称它为 X 和 Y 的 k+l 阶混合原点矩.
若 E{[ X E ( X )]k [Y E (Y )]l } 存在, 称它为X 和 Y 的 k+l 阶混合中心矩. 注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
例1 设X~N(0,1), Y=X2, 求X和Y的相关系数。
4. 若 XY 0 ,则称X和Y(线性)不相关。
定理:若随机变量X与Y的数学期望和方差都存 在,且均不为零,则下列四个命题等价: (1) XY 0 ; (2)cov(X ,Y) = 0;
(3)E(XY)=EXEY;
(4)D(X ±Y)=DX+DY。
n2
为(X1,X2, …,Xn) 的相关系数矩阵。
由于 i i
cov( X i , X i ) 1, D( X i ) D( X i )
故相关系数矩阵的主对角元素均为1.
五、 原点矩和中心矩
定义 设X和Y是随机变量,若
E ( X k ), k 1,2, 存在,称它为X的k阶原点矩,简称 k阶矩. 若 E{[ X E ( X )]k }, k 2,3,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即Y 与X 有线性关系的概率等于 1,这种线性关 系为
P??Y ? E(Y) ? ? X ? E( X) ?? ? 1
? D(Y)
D(X) ?
相关系数的性质
? | ? XY |? 1
? | ? XY |? 1 Cauchy-Schwarz 不等式的等号成
若 ? XY ? 0, 称 X,Y不相关.
无量纲 的量
协方差和相关系数的计算
—— 利用函数的期望或方差计算协方差
? cov(X,Y) ? E( XY) ? E( X)E(Y) ? ? 1 ?D(X ? Y) ? D( X) ? D(Y)?
2
? 若(X,Y)为离散型,
??
cov(X,Y) ? ?? (xi ? E( X))( yj ? E(Y))pij i?1 j?1
故
? UV
?
a2 a2
? ?
b2 b2
继续讨论: a,b 取何值时, U,V 不相关?
此时,U,V 是否独立?
协方差和相关系数的性质
协方差的性质
? cov( X ,Y ) ? cov(Y , X ) ? E(XY ) ? E( X )E(Y ) ? cov(aX ,bY) ? ab cov(X,Y) ? cov(X ? Y, Z) ? cov(X, Z) ? cov(Y, Z) ? cov(X, X) ? D( X) ? | cov(X,Y) |2? D( X)D(Y)
协方差和相关系数的定义
定义 称 E?( X ? E(X))(Y ? E(Y))?为X,Y的
协方差.记为 cov(X,Y) ? E?(X? E(X))(Y? E(Y))?.
称
? ?
D(X)
cov( X ,Y) ??
?cov(X,Y) D(Y) ?
为(X,Y)的协方差矩阵 .
可以证明协方差矩阵为半正定矩阵.
XY 1 0 P pq
E(X) ? p, E(Y) ? p, D(X) ? pq, D(Y) ? pq, E(XY) ? p, D(XY) ? pq,
cov(X,Y) ? pq, ? XY ? 1
例2 设 ( X ,Y ) ~ N ( ? 1,? 12,?2,? 22,?), 求 ? XY.
解
?? ??
相互独立
X,Y 不相关.
例3 设 X,Y 相互独立,且都服从 N (0,? 2), U = aX + bY ,V= aX - bY,a,b为常数,且都不为零, 求? UV .
解 cov(U ,V) ? E(UV) ? E(U )E(V) ? a 2E( X 2 ) ? b2E(Y2 )
? ?aE (X) ? bE(Y)?a?E ( X) ? bE(Y)?
由 E( X) ? E(Y) ? 0,
E(X2) ? ? 2
D( X) ? D(Y) ? ? 2
E(Y2) ? ? 2
cov(U ,V) ? (a 2 ? b2)? 2
而 D(U ) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
D(V) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
? 若(X,Y)为连续型,
? ? cov(X,Y) ? ?? ?? (x ? E(X))(y ? E(Y)) f (x, y)dxdy. ?? ??
例1 已知 X,Y的联合分布为:
pij X
Y
1
0
1
p
0
0
0
q
求 cov (X,Y),?XY.
解
0 < p <1 p+q= 1
X 10 P pq
Y 10 P pq
??
??
t(?
Байду номын сангаас
t
?
?
u)e
dudt u2
2(1? ?
2)?12t2
2? 1? ?2 ?? ??
? ? ? ? 1? 2?
e du t e dt u2
? ? ? 2(1? ? 2 )
??
2
?
1 t
2
2
2? 1? ? 2 ??
??
? ? 1? 2?
? XY ? ?
若 ( X,Y ) ~ N (? 1,? 12,? 2,? 22,?),则X,Y
对任何实数 t ,g(t) ? 0
4cov2 (X,Y) ? 4D(X)D(Y) ? 0
即 | cov(X,Y) |2 ? D( X)D(Y)
等号成立
g(t) ? 0 有两个相等的实零点
t0
?
cov( X,Y) D( X)
?
??? ?
g(t0 ) ? 0 即
D(Y) ?? D(X) ?
E[(Y ? E(Y)) ? t0( X ? E( X))]2 ? 0 又显然 E[(Y ? E(Y)) ? t0 ( X ? E( X))] ? 0
D[(Y ? E(Y)) ? t0( X ? E( X))] ? 0 P[(Y ? E(Y)) ? t0( X ? E( X)) ? 0] ? 1 P[(Y ? E(Y)) ? t0 ( X ? E( X)) ? 0] ? 1 即 P[(Y ? E(Y)) ? t0( X ? E( X))] ? 1
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y ? E(Y) ? t0 ( X ? E( X))) ? 1
时,等式成立 —Cauchy-Schwarz 不等式.
证明 令
g(t) ? E[(Y ? E(Y)) ? t(X ? E(X))]2 ? D(Y) ? 2t cov(X,Y) ? t 2D( X)
§3.3.1 协方差和相关系数
问题 对于二维随机变量 (X ,Y):
已知联合分布
边缘分布
这说明对于二维随机变量,除了每个随机变量各 自的概率特性以外,相互之间可能还有某种联系 .问 题是用一个什么样的数去反映这种联系 .
数 E(( X ? E( X))(Y ? E(Y))) 反映了随机变量 X ,
Y 之间的某种关系.
若D (X) > 0, D (Y) > 0 ,称
E??( X ? E( X))(Y ? E(Y) ?? ? ? D( X) D(Y) ?
为X,Y 的相关系数 ,记为
cov( X,Y) D( X) D(Y)
? XY ?
cov( X , Y) D ( X ) D (Y)
事实上,? XY ? cov( X? ,Y? ).
? ? cov(X,Y) ? ?? ?? (x ? ?1)(y ? ? 2) f (x, y)dxdy
令x??1? s
?1
? ? y??2?t
?2
?
? 1? 2
2? 1? ?2
ste dsdt ?? ??
?
1 2(1? ? 2
(s? )
?
t)2?
1t 2
2
?? ??
? ? 令s?? t?u ?
?1? 2
P??Y ? E(Y) ? ? X ? E( X) ?? ? 1
? D(Y)
D(X) ?
相关系数的性质
? | ? XY |? 1
? | ? XY |? 1 Cauchy-Schwarz 不等式的等号成
若 ? XY ? 0, 称 X,Y不相关.
无量纲 的量
协方差和相关系数的计算
—— 利用函数的期望或方差计算协方差
? cov(X,Y) ? E( XY) ? E( X)E(Y) ? ? 1 ?D(X ? Y) ? D( X) ? D(Y)?
2
? 若(X,Y)为离散型,
??
cov(X,Y) ? ?? (xi ? E( X))( yj ? E(Y))pij i?1 j?1
故
? UV
?
a2 a2
? ?
b2 b2
继续讨论: a,b 取何值时, U,V 不相关?
此时,U,V 是否独立?
协方差和相关系数的性质
协方差的性质
? cov( X ,Y ) ? cov(Y , X ) ? E(XY ) ? E( X )E(Y ) ? cov(aX ,bY) ? ab cov(X,Y) ? cov(X ? Y, Z) ? cov(X, Z) ? cov(Y, Z) ? cov(X, X) ? D( X) ? | cov(X,Y) |2? D( X)D(Y)
协方差和相关系数的定义
定义 称 E?( X ? E(X))(Y ? E(Y))?为X,Y的
协方差.记为 cov(X,Y) ? E?(X? E(X))(Y? E(Y))?.
称
? ?
D(X)
cov( X ,Y) ??
?cov(X,Y) D(Y) ?
为(X,Y)的协方差矩阵 .
可以证明协方差矩阵为半正定矩阵.
XY 1 0 P pq
E(X) ? p, E(Y) ? p, D(X) ? pq, D(Y) ? pq, E(XY) ? p, D(XY) ? pq,
cov(X,Y) ? pq, ? XY ? 1
例2 设 ( X ,Y ) ~ N ( ? 1,? 12,?2,? 22,?), 求 ? XY.
解
?? ??
相互独立
X,Y 不相关.
例3 设 X,Y 相互独立,且都服从 N (0,? 2), U = aX + bY ,V= aX - bY,a,b为常数,且都不为零, 求? UV .
解 cov(U ,V) ? E(UV) ? E(U )E(V) ? a 2E( X 2 ) ? b2E(Y2 )
? ?aE (X) ? bE(Y)?a?E ( X) ? bE(Y)?
由 E( X) ? E(Y) ? 0,
E(X2) ? ? 2
D( X) ? D(Y) ? ? 2
E(Y2) ? ? 2
cov(U ,V) ? (a 2 ? b2)? 2
而 D(U ) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
D(V) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
? 若(X,Y)为连续型,
? ? cov(X,Y) ? ?? ?? (x ? E(X))(y ? E(Y)) f (x, y)dxdy. ?? ??
例1 已知 X,Y的联合分布为:
pij X
Y
1
0
1
p
0
0
0
q
求 cov (X,Y),?XY.
解
0 < p <1 p+q= 1
X 10 P pq
Y 10 P pq
??
??
t(?
Байду номын сангаас
t
?
?
u)e
dudt u2
2(1? ?
2)?12t2
2? 1? ?2 ?? ??
? ? ? ? 1? 2?
e du t e dt u2
? ? ? 2(1? ? 2 )
??
2
?
1 t
2
2
2? 1? ? 2 ??
??
? ? 1? 2?
? XY ? ?
若 ( X,Y ) ~ N (? 1,? 12,? 2,? 22,?),则X,Y
对任何实数 t ,g(t) ? 0
4cov2 (X,Y) ? 4D(X)D(Y) ? 0
即 | cov(X,Y) |2 ? D( X)D(Y)
等号成立
g(t) ? 0 有两个相等的实零点
t0
?
cov( X,Y) D( X)
?
??? ?
g(t0 ) ? 0 即
D(Y) ?? D(X) ?
E[(Y ? E(Y)) ? t0( X ? E( X))]2 ? 0 又显然 E[(Y ? E(Y)) ? t0 ( X ? E( X))] ? 0
D[(Y ? E(Y)) ? t0( X ? E( X))] ? 0 P[(Y ? E(Y)) ? t0( X ? E( X)) ? 0] ? 1 P[(Y ? E(Y)) ? t0 ( X ? E( X)) ? 0] ? 1 即 P[(Y ? E(Y)) ? t0( X ? E( X))] ? 1
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y ? E(Y) ? t0 ( X ? E( X))) ? 1
时,等式成立 —Cauchy-Schwarz 不等式.
证明 令
g(t) ? E[(Y ? E(Y)) ? t(X ? E(X))]2 ? D(Y) ? 2t cov(X,Y) ? t 2D( X)
§3.3.1 协方差和相关系数
问题 对于二维随机变量 (X ,Y):
已知联合分布
边缘分布
这说明对于二维随机变量,除了每个随机变量各 自的概率特性以外,相互之间可能还有某种联系 .问 题是用一个什么样的数去反映这种联系 .
数 E(( X ? E( X))(Y ? E(Y))) 反映了随机变量 X ,
Y 之间的某种关系.
若D (X) > 0, D (Y) > 0 ,称
E??( X ? E( X))(Y ? E(Y) ?? ? ? D( X) D(Y) ?
为X,Y 的相关系数 ,记为
cov( X,Y) D( X) D(Y)
? XY ?
cov( X , Y) D ( X ) D (Y)
事实上,? XY ? cov( X? ,Y? ).
? ? cov(X,Y) ? ?? ?? (x ? ?1)(y ? ? 2) f (x, y)dxdy
令x??1? s
?1
? ? y??2?t
?2
?
? 1? 2
2? 1? ?2
ste dsdt ?? ??
?
1 2(1? ? 2
(s? )
?
t)2?
1t 2
2
?? ??
? ? 令s?? t?u ?
?1? 2