4.3协方差及相关系数及其性质

合集下载

协方差与相关系数公式详解了解变量之间的关联程度

协方差与相关系数公式详解了解变量之间的关联程度

协方差与相关系数公式详解了解变量之间的关联程度协方差与相关系数公式详解:了解变量之间的关联程度在统计学中,协方差和相关系数是了解变量之间关联程度的重要指标。

它们能够帮助我们判断两个或多个变量之间的关系以及它们对彼此的影响程度。

本文将详细解释协方差和相关系数的公式以及如何使用它们来进行分析。

一、协方差协方差用于衡量两个变量的总体误差。

它的公式如下:协方差= Σ[(Xi- X均) * (Yi - Y均)] / N其中,Xi和Yi是样本的观测值,X均和Y均是样本的均值,N是样本量。

协方差具有以下几个性质:1. 如果两个变量的协方差大于0,则它们正相关;如果协方差小于0,则它们负相关;如果协方差等于0,则它们不相关。

2. 协方差的绝对值大小不能反映出变量之间的强度和方向。

3. 协方差受到变量单位的影响,不便于比较不同数据集之间的关联程度。

二、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向,它可以消除变量单位的影响。

最常用的是皮尔逊相关系数,其计算公式如下:相关系数 = 协方差 / (X标准差 * Y标准差)其中,X标准差和Y标准差分别是X和Y的标准差。

相关系数取值范围在-1到1之间,具有以下特点:1. 相关系数为1时,表示两个变量完全正相关,即存在着线性关系。

2. 相关系数为-1时,表示两个变量完全负相关,即一个变量的增加与另一个变量的减小呈线性关系。

3. 相关系数接近0时,表示两个变量之间关系较弱,接近随机关系。

4. 若相关系数为0,表示两个变量之间不存在线性关系。

通过计算相关系数,我们可以了解到变量之间关联程度的强弱。

然而,需要注意的是相关系数只能衡量线性关系,若变量之间存在非线性关系,则相关系数可能无法准确刻画它们之间的关系。

三、协方差和相关系数的应用协方差和相关系数广泛应用于金融学、经济学、社会科学等领域。

它们能够提供关于变量之间关系的重要信息,有助于数据分析和决策制定。

在金融领域,协方差和相关系数可用于评估资产之间的风险和收益关系。

协方差与相关系数 PPT

协方差与相关系数 PPT

D(V ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 17
所以
Cov(U ,V ) Cov(2X Y , 2X Y )
Cov(2X , 2X ) Cov(2X ,Y ) Cov(Y , 2X ) Cov(Y ,Y )
所以D(t0X*-Y*)=0,由方差得性质知它等价于 P{t0X*-Y* =0}=1,即P{Y=aX+b}=1
其中a=t0σ(Y)/σ(X),b=E(Y)- t0 E(X) σ(Y)/σ(X)、
• 性质3:若X与Y相互独立,则ρXY=0、 证明 若X与Y相互独立,则E(XY)=E(X)E(Y), 又 Cov(X,Y)= E(XY)-E(X)E(Y),所以
协方差与相关系数
一、协方差得概念及性质 二、相关系数得概念及性质 三、协方差得关系式
§1 协方差
• 定义:设二维随机向量(X,Y)得数学期望 (E(X),E(Y))存在,若E[(X-E(X))(Y-E(Y))]存在,则称 它为随机变量X与Y得协方差,记为Cov(X,Y),即
Cov(X,Y)= E[(X-E(X))(Y-E(Y))] • 协方差有计算公式
9 , XY
1 3
,设
U
2X
Y

V 2X Y , 求 UV .

Cov( X ,Y ) XY
D( X ) D(Y ) 1 3
49 2
D(U ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 33
E( X ) (1) 0.15 1 0.35 0.20

大学数学概率篇之随机变量的数字特征——协方差与相关系数概要

大学数学概率篇之随机变量的数字特征——协方差与相关系数概要
e L(X)=a0+b0X 2 a 2 bE ( X ) 2 E ( Y ) 0 a e 2bE ( X 2 ) 2 E ( XY ) 2aE ( X ) 0 b
解得
Cov( X ,Y ) b0 D( X )
a0 E (Y ) b0 E ( X )
特别地, 当 X与 Y 独立时,有 cov( X ,Y ) 0. 完
二、协方差的性质 1. 协方差的基本性质
(1) cov( X , X ) D( X ); (2) cov( X ,Y ) cov(Y , X ); (3) cov( aX , bY ) ab cov( X ,Y ), 其中 a , b 是 常数; (4) cov(C , X ) 0, C 为任意常数; (5) cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); (6) 当 X 与 Y 相互独立, 则 cov( X ,Y ) 0.
X 与 Y 不相关.
例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, 不难求得,
Cov(X,Y)=0,
(请课下自行验证)
因而 =0, 即X和Y不相关 .
但Y与X有严格的函数关系,
即X和Y不独立 .
性质3. 若 D( X ) 0, D(Y ) 0, 则
XY 1
i 1 i 1 n n 1 i j n
cov( X , X
i
j
);
② 若 X 1 , X 2 ,, X n 两两独立, 则有
D( X i ) D( X i );
i 1 i 1
n
n
③ 可以证明: 若 X ,Y 的方差存在,则协方差

第四章 第三节 协方差与相关系数

第四章 第三节 协方差与相关系数

§4.3 协方差与相关系数还需要讨论X 与Y 之间相互关系的数字特征.本节我们讨论关于这方面的问题.1. 协方差及其性质定义4.3.1 对于二维随机变量(,)X Y ,称()()EX E X Y E Y --为,X Y 的协方差.记作cov (,)X Y 。

即cov (,)()()X Y E X EX Y EY =--.cov 2(,)()()()X X E X EX X EX E X EX DX =--=-=.当(,)X Y 为离散型时,有cov 11(,)()()ij ij i j X Y xEX y EY p ∞∞===--∑∑.当(,)X Y 为连续型时,有cov (,)()()(,)X Y x EX y EY p x y dxdy ∞∞-∞∞=--⎰⎰.计算协方差时,还常用公式cov (,)()()X Y EXY EX EY =-协方差等于乘积的期望减去期望的乘积例4. 3.1 已知二维随机变量(,)X Y 的联合分布如表 4.3.1所示.试求cov (,).X Y .表4.3.1解 先求边缘分布,并记入表4.3.1中,.然后求数学期望与协方差.11523,222EX =⨯+⨯= 1111(4)(1)140,4444EY =-⨯+-⨯+⨯+⨯= 又 []12(4)243(1)310,4EXY =⨯-+⨯+⨯-+⨯=故 cov (,)()()0.X Y EXY EX EY =-=例4.3.2 已知二维随机变量(,)X Y 服从二维正态分布N (ρσσμμ,,,,222121). 求cov (,).X Y解 由例3.2.3知,221122(,),(,),XN Y N μσμσ故1,EX μ= 2.EY μ=于是,协方差为cov (,)X Y 12()()()()E X EX Y EY E X Y μμ=--=--=()()()()dxdyey x y y x x ⎰⎰∞∞-∞∞-⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛-+---⎪⎪⎭⎫ ⎝⎛------22221212112)1(2121221121σμσσμμρσμρμμρσπσ.引入变换u x =-11σμ,v y =-22σμ.于是 cov (,)X Y2222222122(1)u uv v v v uvedudv ρρρρ⎡⎤--++-∞∞⎣⎦--∞-∞⎰⎰=()()[]dudv uvev v u ⎰⎰∞∞-∞∞--+----2221)1(2122112ρρρρπσσ()2222(1)2u v v vedv uedu ρρ--∞∞---∞-∞⎧⎫⎪⎬⎪⎭,()222(1)2u v v vedv du ρρ--∞∞---∞-∞⎧⎫⎪⎪=⎨⎬⎪⎪⎩⎭⎰⎰上式大括号中的积分恰好是服从正态分布2(,1)N v ρρ-的随机变量的数学期望,cov (,)X Y =dv ev v ⎰∞∞--222122πσρσ =12ρσσ. ,X Y ρρ=协方差的性质(1)cov(,)cov(,),X Y Y X =(2) cov 1122((),())a X b a Y b ++=12a a cov (,)X Y , (3)cov 12(,)X X Y +=cov 1(,)X Y +cov 2(,)X Y . (4) ()2cov(,),D X Y DX DY X Y ±=+±并且当X 与Y 相互独立时,cov (,)0.X Y = 2. 相关系数及其性质定义4.3.2 对于二维随机变量(,)X Y ,如果0,0,DX DY ≠≠.则称,X Y ρ=为随机变量X 与Y 的相关系数.相关系数的性质 (1)1.XY ρ≤(2)1XY ρ=的充要条件是{} 1.P Y aX b =+=其中,a b 为常数,且0.a ≠一般地,当|XY ρ|的值越来越大而接近于1时,表明X 与Y 的线性关系程度越密切. 反之,当|XY ρ|的值越来越小而接近于0时,表明X 与Y 的线性关系程度很微弱.特别地当XY ρ=0时, 称X 与Y 不相关.若X 与Y 相互独立,则cov(,)0,X Y =于是0,XY ρ=即X 与Y 不相关。

43 协方差和相关系数精品PPT课件

43  协方差和相关系数精品PPT课件

4
12
45
XY
1 12 0.968 1 4 12 45
2) E( X ) 0, E( XY ) 0
XY 0
XY
0.968
:有96.8%的线性相似度,即在[0,1]之间,
y=x2与某条直线y=ax+b的图像差别不大。
XY 0 :根本就没有线性相关性,但有其他相关性。
三. 矩
XY
COV ( X ,Y ) 1 D( X )D(Y ) 2
例6 1) X ~ U (0,1),Y X 2 ,求 XY
2)X ~ U (1,1),Y X 2 ,求 XY
解1)
E( X ) 1 , E(Y ) 1 , E( XY ) 1 , D( X ) 1 , D(Y ) 4
2
3
解 DX 3, DY 1,
D(V ) 16D( X ) 9D(Y ) 24Cov( X ,Y ) 33, D(W ) 4D( X ) 16D(Y ) 16Cov( X ,Y ) 44,
Cov(V ,W ) Cov(4X 3Y 1,2X 4Y ) 8D( X ) 16Cov( X ,Y ) 6Cov(Y , X ) 12D(Y ) 22.
)
1 0
x 0
x
2dy
dx
2 3
D(X )
1 0
x 0
x2
2dy
dx
4 9
1 18
x=y D 1
E(Y
)
1 0
x 0
y
2dy
dx
1 3
D(Y )
1 x
0 0
y2
2dy
dx
1 9
1 18
E(XY )

§4.3 协方差、相关系数与矩

§4.3 协方差、相关系数与矩

第4章
§4.3 协方差、相关系数与矩
第10页
4.3.2 独立性与不相关性
定义4.3.2 当 XY = 0 时,称 X 和 Y不相关. 不相关 独立 但也有例外 例如二维正态分布,独立与不相关等价
“独立” 必然导致 “不相关”, 而“不相关”不一定导致 “独立”
第4章
§4.3 协方差、相关系数与矩
(3)Cov(X1+X2, Y) = Cov(X1,Y) + Cov(X2,Y)
第4章 §4.3 协方差、相关系数与矩 例1 设二维随机变量的联合分布律为 X 0 1 Y 0 q 0 1 0 p 其中p+q=1,求相关系数XY. 解 由(X,Y)的联合分布律,可得X与Y的边缘分布律为
X P 0 q 1 p Y P 0 q
注 (1)若 X与Y独立,则Cov(X, Y)=0 (2)D(X±Y) = D(X) + D(Y)±2Cov(X, Y)
第4章
§4.3 协方差、相关系数与矩
第5页
4. 协方差的性质 (1)Cov(X, Y) = Cov(Y, X) (2)Cov(aX, bY) = abCov(X, Y), a,b 为常数
第4章
§4.3 协方差、相关系数与矩
第7页
例2 设二维(X,Y)随机变量的密度函数为
1 cos( x y ), 0 x , y 0 f ( x, y ) 2 2 2 0, 其它 求 cov( X , Y )
1 2 0 解 因为 E ( X ) x cos( x y)dxdy 0.7854, 2 0 -2 4
E (Y ) / 4,
0 1 2 E ( XY ) xy cos( x y)dxdy 1 0.5708, 2 0 2 2

概率论与数理统计协方差和相关系数

概率论与数理统计协方差和相关系数

X -1 0 1
pk 3/8 2/8 3/8
Y -1 0 1
pk 3/8 2/8 3/8
E( X ) (1) 3 0 2 1 3 0 同理 E(Y ) 0
8
8
8
1
②说明E(:XY虽)然 Cov(Xx,iYy)=j p0i,j 但1
i,i1
P{ X
1P{ X0 8 0}
10,Y101} P{8Y 0} 8
=相关系数刻划了X和Y间“线性相关”的程度.
=
2021/4/4
8
8
皮肌炎图片——皮肌炎的症状表现

• 皮肌炎是一种引起皮肤、肌肉、

心、肺、肾等多脏器严重损害的, 全身性疾病,而且不少患者同时
伴有恶性肿瘤。它的1症状表现如 特 下:
• 1、早期皮肌炎患者,还往往伴 征 有全身不适症状,如-全身肌肉酸
=ቤተ መጻሕፍቲ ባይዱ
2021/4/4
3
3
§3 协方差和相关系数 Covariance and
correlation coefficient
2021/4/4
4
一、协方差
1、定对于义向: 量设X(和X,YY,)是期一望随和机方向差量只,反称映E{了[X变-E(量X)各][Y自-E(的Y)情]} 况,没有
相互之间的关系。 若X、Y相互独立, E{[X-E(X)][Y-E(Y)]}=0, 因此为EX{[与X-YE的(X)协][Y方-E差(Y,)记]} 作在C一ov定(程X,度Y上)反,映即了X与Y之间的关系,称为X 与Y的协方差。 Cov(X,Y)= E{[X-E(X)][Y-E(Y)]}
② 若 E X E( X ) k 存在,则称之为X的 k阶中心矩

4-3协方差

4-3协方差
2 = (1 − ρ XY ) DY = min E[Y − ( a + bX )]2
= DY + DX ⋅
COV 2 ( X , Y )
− 2COV ( X , Y ) ⋅
COV ( X , Y ) DX

2 m E Y −(a+bX)] = (1− ρX )D in [ Y Y a,b
2
a ,b
= EY + b EX + a − 2aEY − 2bEXY + 2abEX 达到最小。 求a,b 使 e 达到最小。 ,
2 2 2 2
∂e Y X ∂a = 2a + 2bEX − 2 EY = 0 ⇒a = E −bE 令: ∂ e = 2bEX 2 − 2 EXY + 2aEX = 0 ∂b
协方差与相关系数
(
)
可以证明: 可以证明:X,Y相互独立的充要条件是 相互独立的充要条件是 已证: 已证:
fX ( x) = 1 2π σ 1 e
( x − µ1 ) 2 − 2 2σ 1
ρXY = ρ = 0
e
( y− µ 2 ) 2 − 2 2σ 2
, fY ( y ) =
1 2π σ 2
2 2 则:EX = µ1 , DX = σ 1 , EY = µ 2 , DY = σ 2 ,
a,b ,b
COV ( X ,Y ) ; ⇒ b0 = DX
= E (Y − EY + EX
COV ( X , Y ) COV ( X , Y ) 2 −X⋅ ) DX DX
COV ( X , Y ) 2 ) = E ((Y − EY ) − ( X − EX ) ⋅ DX
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3. 协方差的计算公式 法1.若 ( X ,Y ) 为离散型,已知pij
cov( X , Y ) [ xi E ( X )][ y j E (Y )]pij
i 1 j 1
若 ( X ,Y ) 为连续型,已知f(x,y)
cov( X , Y )



C 11 写为矩阵的形式: C 21
C 12 , C 22
称为随机变量(X1,X2)的协方差矩阵。
(2)推广 定义 设X=(X1,X2,…,Xn) 为n维随机向量,并记 μi=E(Xi), C ij Cov( X i , X j ) i , j 1,2,, n
[ x E ( X )][ y E (Y )] f ( x, y)dxdy
法2.
4. 性质
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y );
( 2) D( X Y ) D( X ) D(Y ) 2 Cov( X ,Y ).
(1) Cov( X ,Y ) Cov(Y , X );
1. 定义
量 E { [ X E ( X ) ][Y E (Y ) ] } 称为随机变量 X C ov( X , Y ) E { [ X E ( X )][Y E (Y )]} . 与 Y 的协方差. 记为 Cov( X , Y ) , 即
若D (X ) > 0, D (Y ) > 0 ,称 Cov( X , Y ) ρ XY D ( X ) D (Y )
j 1 i 1 j 1 i 1 n n n n
E{ti [ X i E ( X i )] t j [ X j E ( X j )]}
j 1 i 1
n
n
n
E{ ti [ X i E ( X i )] t j [ X j E ( X j )]}
j 1 i 1
即 | Cov( X , Y ) | D( X ) D(Y )
所以|ρXY|≦1。
(2) ρ XY 1 的充要条件是存在常数 a, b 使 P{Y aX b} 1.
(2)证: 由柯西一许瓦兹不等式中等号成立( ρ XY 1 ) 充要条件知 存在常数 a 使 P{Y E (Y ) a( X E ( X ))} 1.
解 cov( X , Y ) ( x 1 )( y 2 ) f ( x, y )dxdy
x 1 1 y 2 2

s t
1 2
2 1 2



ste
1 2 (s t ) t 2 2 2 (1 )
为随机变量 X 与 Y 的相关系数.
无量纲 的量
若 XY 0, 称 X ,Y 不相关.
2. 说明
若随机变量 X 和 Y 相互独立 Cov( X ,Y ) E{[ X E ( X )][Y E (Y )]} E[ X E ( X )]E[Y E (Y )] 0.
不相关
4. 相关系数的性质
(1) ρ XY 1.
(2) ρ XY 1 的充要条件是 : 存在常数 a, b 使 P{Y aX b} 1.
(1)证: 由柯西一许瓦兹不等式知
[ E ( XY )]2 E ( X 2 ) E (Y 2 )
所以 | E[( X E ( X ))(Y E (Y ))] | E[( X E ( X )) 2 ] E[(Y E (Y )) 2 ]
4.3协方差与相关系数
一、基本概念 二、n 维正态变量的性质
问题的提出
对于二维随机变量(X ,Y ):
已知联合分布
边缘分布
对二维随机变量,除每个随机变量各自的 概率特性外, 相互之间还有某种联系,问题是用 一个怎样的数去反映这种联系.
若随机变量 X 和 Y 相互独立, 那么
D( X Y ) D( X ) D(Y ).
若随机变量 X 和 Y 不相互独立
D( X Y ) ?
D( X Y ) E ( X Y )2 [ E ( X Y )]2
D( X ) D(Y ) 2 E{[ X E ( X )][Y E (Y )]}.
协方差
反映了随机变量 X , Y 之间的某种关系
一 .协方差和相关系数的定义
1 1 1 D( X ) D(Y ) ρXY D( X ) D(Y ) 1 4 2 3. 9 4 3
已知随机变量 X , Y 分别服从 N (1,32 ) , N (0,42 ) , ρXY 1 2 , 设 Z X 3 Y 2 .
(1) 求 Z 的数学期望和方差.(2) 求 X 与 Z 的相关系数.
2 D( X ) 12 , D(Y ) 2 , Cov( X , Y ) 1 2
所以(X,Y)的均值为μ=(μ1,μ2) (X,Y)协方差矩阵为
12 1 2
1 2 2 2
3. 协方差矩阵的性质
(1)协方差矩阵对角线上的元素Cii为Xi的方差即Cii=D(Xi) i=1,2,…,n;
将 a0 , b0 代入 e E[(Y (a bX ))2 ] 中, 得 min e min E[(Y ( a bX )) 2 ]
a ,b a ,b
E[(Y (a0 b0 X ))2 ]
2 (1 ρXY ) D(Y ).
2. 相关系数的意义
当 ρXY 较大时 e 较小, 表明 X , Y 的线性关系联 系较紧密.
(2)协方差矩阵C为对称矩阵,即Cij=Cji ,i,j=1,2,…,n;
(3)C为非负定矩阵,即对于任意实向量t=(t1,t2,…,tn), 有tCt≥0; 证:性质(1),(2)显然,只证(3)
t Ct C ij t i t j t i E {[ X i E ( X i )][ X j E ( X j )]}t j
du t e
dt
1 2
于是 XY
Cov( X ,Y ) . D( X ) D(Y )
结论
二维正态分布密度函数 , 参数 ρ 代表了X (1) 中 与 Y 的相关系数;
) 二维正态随机变量 X 与 Y 相关系数为零等 (2 价于 X 与 Y 相互独立.
( 2) Cov( aX , bY ) ab Cov( X ,Y ) , a , b 为常数;
( 3) Cov( X 1 X 2 ,Y ) Cov( X 1 ,Y ) Cov( X 2 ,Y ).
例1
已知 X ,Y 的联合分布为
Y
pij X
1
0
1 p 0 1 0 p q
0 0 q
0 < p <1 p+q=1
二、相关系数的意义
1. 问题的提出
问 a , b 应如何选择, 可使 a bX最接近 Y ? 接近的程度又应如何来衡量 ?
设 e E[(Y (a bX ))2 ]
则 e 可用来衡量 a bX 近似表达 Y 的好坏程度. 当 e 的值越小, 表示 a bX 与 Y 的近似程度越好. 确定 a , b 的值, 使 e 达到最小.
1 0 p q
求cov (X ,Y )
XY

X
Y
P
XY P
1
p
0
q
P
E ( X ) p, E (Y ) p, D( X ) pq, D(Y ) pq, E ( XY ) p,
cov( X , Y ) pq,
XY 1
2 例2 设 ( X ,Y ) ~ N ( μ1 , μ2 , σ12 , σ 2 , ρ) ,求XY
三.协方差矩阵
(1).二维随机向量的协方差矩阵 二维随机变量(X1,X2)有四个二阶中心矩(设他们存在), 分别记为
C11 E{[ X 1 E ( X 1 )]2 } , C12 E{[ X 1 E ( X 1 )][ X 2 E ( X 2 )]}
C21 E{[ X 2 E ( X 2 )][ X 1 E ( X 1 )]} , C22 E{[ X 2 E ( X 2 )]2 }
即X ,Y 相互独立
X ,Y 不相关
已知随机变量 X , Y 分别服从 N (1,3 ) , N (0,4 ) , 例3 ρXY 1 2 , 设 Z X 3 Y 2 .
(1) 求 Z 的数学期望和方差 2) 求 X 与 Z 的相关系数. .(
2
2

(1)由E ( X ) 1, D( X ) 9, E (Y ) 0, D(Y ) 16.
e E[(Y (a bX )) ]
2
E (Y 2 ) b 2 E ( X 2 ) a 2 2bE ( XY ) 2abE ( X ) 2aE (Y ).
将 e 分别关于 a ,b 求偏导数, 并令它们等于零, 得 e a 2a 2bE ( X ) 2 E (Y ) 0, e 2bE ( X 2 ) 2 E ( XY ) 2aE ( X ) 0. b Cov( X ,Y ) Cov( X ,Y ) 解得 b0 , a0 E (Y ) E ( X ) . D( X ) D( X )
当 ρXY 较小时, X ,Y 线性相关的程度较差 .
当 ρ XY 0 时, 称 X 和 Y 不相关.
3. 注意
(1) 不相关与相互独立的关系 相互独立 (2) 不相关的充要条件
1o 2o 3o X , Y 不相关 ρ XY 0; X , Y 不相关 Cov( X ,Y ) 0; X , Y 不相关 E ( XY ) E ( X ) E (Y ).
相关文档
最新文档