概率论与数理统计:协方差和相关系数

合集下载

第13讲 协方差与相关系数 太原理工大学工程硕士概率论与数理统计

第13讲 协方差与相关系数  太原理工大学工程硕士概率论与数理统计

22
[例] 已知 解
X 服从 0, 2π
上的均匀分布,求 E ( X 2 ), E (sin X )
X 的概率密度
1 , 0 ≤ x ≤ 2π, f ( x) 2 π 其他, 0,
E( X 2 )



1 2 x f ( x)dx 2π

2π 0
3 2 2 π 1 x 4 π x 2 dx 2π 3 0 3
则: 2 X Y ~ N (0,25)
( 2) D(2 X Y ) 4 DX DY 2 2COV ( X , Y ) 1 25 - 4 XY DX DY 25 4 2 3 13 2
则: 2 X Y ~ N (0,13)
20
小结
本讲首先介绍二维随机向量 (X,Y) 的分量 X与Y 的协方差及相关系数的概念、性质和计 算;然后介绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、k+m 阶混合原点矩、k+m 阶混 合中心矩),n 维随机向量的协方差阵的概念、 性质和计算;最后简单介绍了n 元正态分布 的概念和三条重要性质。
则(Y1,Y2, …, Yk)'服从k 元正态分布。
这一性质称为正态变量的线性变换不变性。
17
(3) 设(X1,X2, …,Xn)服从n元正态分布,则 “X1, X2, …, Xn 相互独立” 等价于 “X1,X2, …,Xn两两不相关”。
18
例2 设X和Y相互独立,且X~N(1, 2), Y~N(0, 1)。 求 Z = 2X-Y+3 的概率密度。 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立,
c22 E{[ X 2 E ( X 2 )]2 } c11 c12 排成一个2×2矩阵 , c 21 c 22

概率论与数理统计-协方差和相关系数01

概率论与数理统计-协方差和相关系数01
相关系数刻划了X和 间 线性相关”的程度. =相关系数刻划了 和Y间“线性相关”的程度
=
9
证: 对任意的 对任意的a,b,令 令
刻画了Y与 刻画了 与a+bX的偏离程度 的偏离程度 e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y)
要使 与 的某个线性函数 最为接近 就是要找a,b使得误差 最为接近 就是要找 数 要使Y与X的某个线性函数a+bX最为接近,就是要找 使得误差 视为关于a,b的二元函数 视为关于 的二元函数,求驻点: 平方e值最 值最小 平方 值最小. 将e视为关于 的二元函数,求驻点: 字 特 征 解得
X与Y不相关 只说明 与Y之间没有线性关系,但可以有 与 不相关 只说明X与 之间没有线性关系 不相关,只说明 之间没有线性关系, 非线性关系; 非线性关系; 而X与Y独立是指 独立是指X,Y之间既无线性关系, 之间既无线性关系, 与 独立是指 之间既无线性关系 也无非线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。 独立”必然不相关,但反之不然。 不相关 但是,对于二维正态分布,独立与不相关等价。 但是,对于二维正态分布,独立与不相关等价。 与不相关等价 2 若二维r.v ( X , Y ) ~ N ( µ 1 , µ 2 ; σ 12 , σ 2 ; ρ ) 即:若二维 则X与Y相互独立 与 相互独立
D(X)=p (1-p ) D(X)=np(1-p) D(X)=
E(X) = µ
a +b E(X) = 2 1 E(X) =
D(X)= σ
λ
2
(b − a)2 D(X)= 12
(5) 切比雪夫不等式 =

概率论与数理统计 5.3 协方差与相关系数

概率论与数理统计 5.3 协方差与相关系数
存在,称它为X的k阶中心矩
概率论
均值 EX是X一阶原点矩,方差DX是X的二阶
中心矩。
四、课堂练习
概率论
1、设随机变量(X,Y)具有概率密度
f (x, y) 81(x y) 0 x 2,0 y 2
0
其它
求E(X ), E(Y ),Cov(X ,Y ), D(X Y )。
2、设X ~ N(, 2),Y ~ N(, 2),且设X,Y相互独立 试求Z1 X Y和Z2 X Y的相关系数(其中,
Cov(aX b,cY d ) acCov( X ,Y ); Cov(aX bY ,cX dY ) acDX bdDY (ad bc)Cov( X ,Y ).
(6) D(XY) = DX+ D Y 2 Cov(X, Y) .
一般地, D(aXbY) =a 2DX + b2DY 2 abCov(X, Y).
1
1
dx
1 x 8xydy 8
0
x
15
EY
yf ( x, y)dxdy
o
1x
1
dx
1 y 8xydy 4
0
x
5
EXY
xyf ( x, y)dxdy
1
dx
0
1 xy 8xydy 4
x
9
Cov( X ,Y ) EXYEXEY 4
225
类似地,EX 2
1
X与Y不独立.
EX EY EXY 0, Cov( X ,Y ) 0, XY 0,
X与Y不相关.
例6 设 X 的分布律为
X 1 0 1 P 13 13 13
Y X 2, 求 XY , 并讨论 X 与Y 的独立性. 解 EX 0, EY EX 2 2 3, E( XY ) EX 3 0,

概率论与数理统计课件 协方差与相关系数

概率论与数理统计课件 协方差与相关系数

试求二维正态随机变量的边缘概率密度 .
p( x, y)
1
e 1 2(1 ρ2
)
(
x
μ1 σ12
)2
2
ρ(
x
μ1 )( σ1σ2
y
μ2
)
(
y
μ2 σ22
)2
2πσ1σ2 1 ρ2
pX (x) pY ( y)
1
e ,
(
x μ1 2 σ12
)2
2πσ1 1
e
(
y μ2 2σ22
)2
1
2πσ1σ2
1 ρ2
( x μ1 )( y μ2 )
e e d y d x.
(
x μ1 2σ12
)2
1 2(1
ρ2
)
y
μ2 σ2
ρ
x
μ1 σ1
2
令t
1 1
ρ2
y
μ2 σ2
ρ
x
μ1 σ1
,
u x μ1 , σ1
2019/4/24
4-3—协方差和相关系数
3 .不相关与相互独立的关系
相互独立 不相关
2019/4/24
4-3—协方差和相关系数
10
例1 设 ( X ,Y ) 在圆域 x2 y2 1 上服从均匀分布, (1)问X与Y是否独立? (2)求相关系数
例2 X ~N(0,1),Y X 2, 证明X与Y不相关且不独立
解:E( XY ) E( XX 2 ) x3 ( x)dx 0 Cov( X ,Y ) E( XY ) E( X )E(Y ) 0 故X与Y不相关
2019/4/24
4-3—协方差和相关系数

概率论与数理统计复习4-5章

概率论与数理统计复习4-5章
+∞
∑ g ( x ) p 绝对收敛,则Y的期望为 ∞
k =1 k k
∑ g(x
k =1
k
) pk
(2) 设X是连续型随机变量,概率密度为 f ( x) , 如果积分 ∫−∞ g ( x) f ( x)dx 绝对收敛,则Y的期望为
E (Y ) = E[ g ( X )] = ∫ g ( x ) f ( x )dx
例 设X的概率分布律为
X −1
0 12
1
2
p 1 3 1 6 1 6 1 12 1 4
试求Y=-X+1及 Z = X 2 的期望和方差。 X -1 0 1/2 解 由于 P 1/3 1/6 1/6 Y =-X+1 2 1 1/2 Z = X2 1 0 1/4
1 1 1 1 1 1 2 E (Y ) = ( −1) ⋅ + 0 ⋅ + ⋅ + 1⋅ + 2 ⋅ = 4 12 2 6 6 3 3
2 2
D( Z ) = E ( Z 2 ) + [ E ( Z )]2 = 2.23264
1 + x − 1 < x < 0 例 设随机变量X的概率密度为 f ( x ) = 1 − x 0 ≤ x < 1 1)求D(X), 2)求 D ( X 2 )
解 (1) E ( X ) = ∫ x(1 + x)dx + ∫ x(1 − x)dx
第四章 随机变量的数字特征
离散型随机变量的数学期望 连续型随机变量的数学期望 数学期望的性质及随机变量函数的期望 方差及其性质
4.1数学期望 数学期望
数学期望——描述随机变量取值的平均特征 数学期望——描述随机变量取值的平均特征 一、离散型随机变量的数学期望 定义 设离散型随机变量X的概率分布为

关于协方差、相关系数与相关性的关系

关于协方差、相关系数与相关性的关系

在实际中,人们为什么总是用(线性)相关系数 XY ,而不是用协方差 CovX ,Y 来判断两个随机变量
X 与Y 的线性相关程度呢?关于这个问题,只要我们注意 CovX ,Y EX EX Y EY 与
XY
CovX DX
,Y DY
的单位,就不难发现:
XY
是一个无量纲的量,用它来描述
X
于是 XY 是一个可以用来表征 X ,Y 之间线性关系紧密程度的量,当 XY 较大时,我们通常说 X ,Y
线性相关的程度较好;当 XY 较小时,我们通常说 X ,Y 线性相关的程度较差;当 XY 0 时,称 X ,
Y 不相关(实际上,按照严格的线性相关的定义,只有在 XY 1时,X 与Y 才是线性相关的, XY 1
概率论与数理统计
关于协方差、相关系数与相关性的关系
前言
z
y x
(概率论与数理统计(茆诗松),Page 147)
高等学校教科书中,关于协方差、相关系数的概念,都是直接给出定义,再由定义导出几个基本
性质,然后是一些关于相关系数的计算或相关性的判断,至于定义这两个量的根据是什么,为什么它
们就是衡量随机变量 X ,Y 的线性相关程度的两把尺子?代数学与概率论中两个变量存在线性关系的
---------------------------------------------------------------------------------------------------------------------------------
Reproduction Forbidden
时二者是线性无关的,不过为了研究 XY 的不同取值下, X ,Y 的关系,我们分为严格线性相关和线 性相关(一定程度)来讨论。)(注意:这里指的是线性不相关,但它们还会存在其他的相关关系,否 则如果什么关系都不存在,那就是 X ,Y 相互独立的情况了。)

概率论与数理统计(第三版)第三章4协方差与相关系数-PPT精品文档

概率论与数理统计(第三版)第三章4协方差与相关系数-PPT精品文档

o 3 X , Y 不相关 E ( XY ) E ( X ) E ( Y ).
3. 相关系数的性质
是一个用来表征 X ,Y之间线性关系紧密 XY
程度的量 .
1 . 1 ρ XY
a , b使 1 的充要条件是 :存在常数 2 ρ XY
P { Y a bX } 1 .
0.3 0.7
0 . 3 0 0 . 7 1 0 . 7
0 . 6 1 0 . 4 2 1 . 4
0 . 9 50 . 7 1 . 4 0.03
c o v (,) X Y E X Y E X E Y
三、 相关系数的意义
1 . 当 ρ 表明 X,Y的线性关系联 XY 较大时
例1 已知 (X,Y)的分布律求Cov(X,Y)
x 0 1 y 1 2 0.15 0.15 0.45 0.25
解: c o v (,) X Y E X Y E X E Y
EX ( Y ) 0 .9 5
x 0 1
EX ( ) EY ( )
y 1 0.15 0.45 0.6
2 0.15 0.25 0.4
3.设X和Y是随机变量,若
E(XkYL)
k, L=1,2,…
存在,
称它为X和Y的k+L阶混合(原点)矩.
k L 4.若 E {[ X E ( X )] [ Y E ( Y )] } 存在,
称它为X和Y的k+L阶混合中心矩.
二、协方差与相关系数的概念及性质
1. 问题的提出
若随机变量 X 和 Y 相ቤተ መጻሕፍቲ ባይዱ独立 ,那么
3 Cov( X X , Y ) Cov( X , Y ) Co X , Y ). 1 2 1 2

概率论与数理统计协方差和相关系数

概率论与数理统计协方差和相关系数

X -1 0 1
pk 3/8 2/8 3/8
Y -1 0 1
pk 3/8 2/8 3/8
E( X ) (1) 3 0 2 1 3 0 同理 E(Y ) 0
8
8
8
1
②说明E(:XY虽)然 Cov(Xx,iYy)=j p0i,j 但1
i,i1
P{ X
1P{ X0 8 0}
10,Y101} P{8Y 0} 8
=相关系数刻划了X和Y间“线性相关”的程度.
=
2021/4/4
8
8
皮肌炎图片——皮肌炎的症状表现

• 皮肌炎是一种引起皮肤、肌肉、

心、肺、肾等多脏器严重损害的, 全身性疾病,而且不少患者同时
伴有恶性肿瘤。它的1症状表现如 特 下:
• 1、早期皮肌炎患者,还往往伴 征 有全身不适症状,如-全身肌肉酸
=ቤተ መጻሕፍቲ ባይዱ
2021/4/4
3
3
§3 协方差和相关系数 Covariance and
correlation coefficient
2021/4/4
4
一、协方差
1、定对于义向: 量设X(和X,YY,)是期一望随和机方向差量只,反称映E{了[X变-E(量X)各][Y自-E(的Y)情]} 况,没有
相互之间的关系。 若X、Y相互独立, E{[X-E(X)][Y-E(Y)]}=0, 因此为EX{[与X-YE的(X)协][Y方-E差(Y,)记]} 作在C一ov定(程X,度Y上)反,映即了X与Y之间的关系,称为X 与Y的协方差。 Cov(X,Y)= E{[X-E(X)][Y-E(Y)]}
② 若 E X E( X ) k 存在,则称之为X的 k阶中心矩
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

协方差和相关系数
对二维随机变量),(Y X ,我们除了讨论X 与Y 的期望和方差之外,还
需讨论X 与Y 之间相互关系的数字特征,本节主要讨论这方面的数字特征。

§ 协方差和相关系数 协方差的定义与性质
定义 设(,)X Y 是二维随机变量.若{[()][()]}E X E X Y E Y --存在,则称它为随
机变量
X 与Y 的协方差,记为Cov(,)X Y ,即
Cov(,){[()][()]}X Y E X E X Y E Y =--.
常用下面的式子计算协方差
Cov(,){[()][()]}X Y E X E X Y E Y =--()()()E XY E X E Y =-.
注:(1)X 与Y 的协方差),(Y X Cov 实质上是二维随机变量X 与Y 的函数
)]([()]([(Y E Y X E X -⋅-的期望,它是一个常数。

(2)当),(Y X 为二维离散型随机变量时,其分布律为
}{),2,1,,2,1(,, =====j i y Y x X P P j i ij ,则
ij i i j
i P Y E y X E x Y X Cov )]()][([),(1
1
--=
∑∑∞=∞
=;
(3)当),(Y X 为二维连续型随机变量时,),(y x f 为),(Y X 的联合概率密度函数,则dxdy y x f Y E y X E x Y X Cov ),())(())((),(--=
⎰⎰
+∞∞-+∞

-。

(4)利用期望的性质可得到协方差有下列计算公式:
)()()(),(Y E X E XY E Y X Cov -=
证明:
)
()()( )()()()()()()( )]
()()()([ )]
())(([(),(Y E X E XY E Y E X E Y E X E Y E X E XY E Y E X E Y XE Y X E XY E Y E Y X E X E Y X Cov -=+--=+--=--=
此公式是计算协方差的重要公式,特别地取Y X =时,有
)()]())(([(),(X D X E X X E X E X X Cov =--=,易见,方差是协方差的特例,协
方差是方差的推广。

例4.39 已知),(Y X 的联合分布律为
求),(Y X Cov 。

解:X 的边缘分布:
Y 的边缘分布:
8.08.012.00)(2
1=⨯+⨯==

=∑i i
i p x X E ,
1.01.019.00)(21
=⨯+⨯==

=∑j i
i p y Y E ,
0118.0011.0101.000)(21
2
1
=⨯⨯+⨯⨯+⨯⨯+⨯⨯==
∑∑==ij i j j
i p y x XY E 08.01.08.00)()()(),(-=⨯-=-=Y E X E XY E Y X Cov 一般讲,)()
()(Y E X E XY E ≠ 例4.40 已知二维随机变量),(Y X 的分布律为
求Cov(,)X Y .
解 易知,
X
的分布律为
{0}0.4P X ==, {1}0.25P X ==, {2}0.35P X ==.
Y 的分布律为
{1}0.5P Y =-=, {0}0.3P Y ==, {2}0.2P Y ==.
因而 ()00.410.2520.350.95E X =⨯+⨯+⨯=,
()(1)0.500.320.20.1E Y =-⨯+⨯+⨯=- ()0(1)0.15000.25020E XY =⨯-⨯+⨯⨯+⨯⨯1(1)0.15100.05+⨯-⨯+⨯⨯+120.05⨯⨯
2(1)0.2200220.15+⨯-⨯+⨯⨯+⨯⨯0.15=.
于是 Cov(,)()()()X Y E XY E X E Y =-0.150.95(0.1)0.245=-⨯-=.
例4.41 设二维随机变量(,)X Y 的概率密度为
01,01,
(,)0x y x y f x y +≤≤≤≤⎧=⎨
⎩,,
其他, 求 Cov(,)X Y . 解 因为
11
00
()(,)d d ()d d E X x f x y x y x x y x y +∞
+∞
-∞
-∞
=⋅=⋅+⎰



1
017
()d 212
x x x =+=⎰, 11
00
()(,)d d ()d d E Y y f x y x y y x y x y +∞+∞
-∞
-∞
=
⋅=⋅+⎰⎰


1017()d 212
y y y =+=⎰
11
001()(,)d d ()d d 3
E XY xyf x y x y xy x y x y +∞
+∞
-∞
-∞
==⋅+=



⎰ 所以
Cov(,)()()()X Y E XY E X E Y =-.1441
12712731-=⨯-
=
例4.42 设),(Y X 服从在D 上的均匀分布,其中D 由X 轴、Y 轴及1=+y x 所围成,
求X 与Y 的协方差 ),(Y X Cov 。

解:∵D 的面积为2
1
=
S ⎩
⎨⎧∈=∴其他,0),(,2),(D
y x y x f
3
1)22(2)(10
2
1010=-==
⎰⎰⎰-dx x x xdydx X E x
3
1
)1(2)(1021010=-==⎰⎰⎰-dx x ydydx Y E x
12
1
)2()1(2)(1
322
1
1010
=
+-=-==
⎰⎰⎰⎰
-dx x x x dx x x xydydx XY E x
, 36
1
3131121)()()(),(=
⨯-=
-=Y E X E XY E Y X Cov 协方差的性质: 性质1 Cov(,)
Cov(,)X Y Y X =.
性质2
2
Cov(,){[()]}()X X E X E X D X =-=
.
性质3 Cov(,)
Cov(,)aX bY ab X Y =,其中,a b 为任意常数.
性质4 Cov(,)0c X =, c 为任意常数.
性质5 Cov()Cov(,)Cov(,)X Y Z X Z Y Z +=+,. 性质6 ()()()2Cov(,)D X
Y D X D Y X Y ±=+±.
例 4.43设随机变量
X ~)5.0,
12(B ,Y ~)1,0(N ,1),(-=Y X Cov ,求134++=Y X V 与Y X W 42+-=的方差与协方差。

解:3)5.01(5.012)1()(,65.012)(=-⨯⨯=-==⨯==p np X D np X E
1)(,0)(2====σμX D Y E
33),(24)(9)(16)134()(=++=++=Y X Cov Y D X D Y X D V D
44),(16)(16)(4)42()(=-+=+-=Y X Cov Y D X D Y X D W D
22
)(12),(6),(16)(8 )
42,134(),(-=+-+-=+-++=Y D X Y Cov Y X Cov X D Y X Y X Cov W V Cov。

相关文档
最新文档