概率论 第十三讲 协方差与相关系数

合集下载

第13讲 协方差与相关系数 太原理工大学工程硕士概率论与数理统计

第13讲 协方差与相关系数  太原理工大学工程硕士概率论与数理统计

22
[例] 已知 解
X 服从 0, 2π
上的均匀分布,求 E ( X 2 ), E (sin X )
X 的概率密度
1 , 0 ≤ x ≤ 2π, f ( x) 2 π 其他, 0,
E( X 2 )



1 2 x f ( x)dx 2π

2π 0
3 2 2 π 1 x 4 π x 2 dx 2π 3 0 3
则: 2 X Y ~ N (0,25)
( 2) D(2 X Y ) 4 DX DY 2 2COV ( X , Y ) 1 25 - 4 XY DX DY 25 4 2 3 13 2
则: 2 X Y ~ N (0,13)
20
小结
本讲首先介绍二维随机向量 (X,Y) 的分量 X与Y 的协方差及相关系数的概念、性质和计 算;然后介绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、k+m 阶混合原点矩、k+m 阶混 合中心矩),n 维随机向量的协方差阵的概念、 性质和计算;最后简单介绍了n 元正态分布 的概念和三条重要性质。
则(Y1,Y2, …, Yk)'服从k 元正态分布。
这一性质称为正态变量的线性变换不变性。
17
(3) 设(X1,X2, …,Xn)服从n元正态分布,则 “X1, X2, …, Xn 相互独立” 等价于 “X1,X2, …,Xn两两不相关”。
18
例2 设X和Y相互独立,且X~N(1, 2), Y~N(0, 1)。 求 Z = 2X-Y+3 的概率密度。 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立,
c22 E{[ X 2 E ( X 2 )]2 } c11 c12 排成一个2×2矩阵 , c 21 c 22

协方差与相关系数公式详解了解变量之间的关联程度

协方差与相关系数公式详解了解变量之间的关联程度

协方差与相关系数公式详解了解变量之间的关联程度协方差与相关系数公式详解:了解变量之间的关联程度在统计学中,协方差和相关系数是了解变量之间关联程度的重要指标。

它们能够帮助我们判断两个或多个变量之间的关系以及它们对彼此的影响程度。

本文将详细解释协方差和相关系数的公式以及如何使用它们来进行分析。

一、协方差协方差用于衡量两个变量的总体误差。

它的公式如下:协方差= Σ[(Xi- X均) * (Yi - Y均)] / N其中,Xi和Yi是样本的观测值,X均和Y均是样本的均值,N是样本量。

协方差具有以下几个性质:1. 如果两个变量的协方差大于0,则它们正相关;如果协方差小于0,则它们负相关;如果协方差等于0,则它们不相关。

2. 协方差的绝对值大小不能反映出变量之间的强度和方向。

3. 协方差受到变量单位的影响,不便于比较不同数据集之间的关联程度。

二、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向,它可以消除变量单位的影响。

最常用的是皮尔逊相关系数,其计算公式如下:相关系数 = 协方差 / (X标准差 * Y标准差)其中,X标准差和Y标准差分别是X和Y的标准差。

相关系数取值范围在-1到1之间,具有以下特点:1. 相关系数为1时,表示两个变量完全正相关,即存在着线性关系。

2. 相关系数为-1时,表示两个变量完全负相关,即一个变量的增加与另一个变量的减小呈线性关系。

3. 相关系数接近0时,表示两个变量之间关系较弱,接近随机关系。

4. 若相关系数为0,表示两个变量之间不存在线性关系。

通过计算相关系数,我们可以了解到变量之间关联程度的强弱。

然而,需要注意的是相关系数只能衡量线性关系,若变量之间存在非线性关系,则相关系数可能无法准确刻画它们之间的关系。

三、协方差和相关系数的应用协方差和相关系数广泛应用于金融学、经济学、社会科学等领域。

它们能够提供关于变量之间关系的重要信息,有助于数据分析和决策制定。

在金融领域,协方差和相关系数可用于评估资产之间的风险和收益关系。

第13课次协方差和相关系数说课讲解

第13课次协方差和相关系数说课讲解

第13 课次协方
差和
相关系数
第13课次协方差和相关系数
教学分析
2.2相关系数的性质(10分钟)
相关系数 的性质
时间10分 钟
掌握相关系 数的性质。

尤其是着重 强调相关系 数来衡量线 性关系的强 弱。

例3设(X,Y)的分布律为
易知 E(X) 0, E(Y) 5/2, E(XY) 0,于是
1.| XY 1 1;
2.若X和Y相互独立,则XY 0.
3.若DX 0, DY 0,则| XY | 1当且仅当存在常数
a,b(a 0).使P{Y aX b} 1,而且当 a 0 时,
XY 1;当 a 0 时,XY 1 .
注:相关系数XY刻画了随机变量Y与X之间的
“线性相关”程度•
| XY |的值越接近1, 丫与X的线性相关程度越高
| XY I的值越近于0, 丫与丫的线性相关程度越弱当I XY I 1时,丫与X的变化可完全由X的线性函数给出.
当XY 0时,丫与X之间不是线性关系.。

协方差与相关系数

协方差与相关系数

其余均方误差
e
D(Y
)(1
2 XY
).
从这个侧面也
能说明 XY 越接近1,e 越小. 反之, XY 越近于0,
e 就越大, Y与X的 线性相关性越小.

例3 设 ( X ,Y ) 的分布律为
X
Y
2 1 1 2 P{Y yi }
1
0 1/4 1/4 0
1/ 2
4
1/4 0 0 1/4 1/2
D(Y
)[1
2 XY
],
D(Y
)1
[cov( X ,Y )]2 D( X )D(Y )
D(Y
)[1
2 XY
],
由于方差
D(Y
)
是正的,
故必有
1
2 XY
0,
所以
XY 1.
性质2. 若 X 和 Y 相互独立,则 XY 0;
注意到此时 cov( X ,Y ) 0, 易见结论成立.
注: X 与Y 相互独立

例4 设 服从 [ , ] 上的均匀分布, 且
X sin , Y cos
判断 X 与 Y 是否不相关, 是否独立.

由于
E( X )
1
2
sind 0,
E(Y
)
1
2
cosd 0,

E(
XY
)
1
2
sin cosd 0.
2
因此
E( XY ) E( X )E(Y ),
从而 X 与 Y 不相关. 但由于 X 与 Y 满足关系:

例2 设连续型随机变量 ( X ,Y ) 的密度函数为
f
(
x,

什么是协方差,什么是相关系数

什么是协方差,什么是相关系数

协⽅差就是投资组合中每种⾦融资产的可能收益与其期望收益之间的离差之积再乘以相应情况出现的概率后进⾏相加,所得总和就是该投资组合的协⽅差。

协⽅差的符号(正或负)可以反映出投资组合中两种资产之间不同的相互关系:如果协⽅差为正,那就表明投资组合中的两种资产的收益呈同向变动趋势,即在任何⼀种经济情况下同时上升或同时下降;如果协⽅差为负值,则反映出投资组合中两种资产的收益具有反向变动的关系,即在任何⼀种经济情况下,⼀种资产的收益上升另⼀种资产的收益就会下降。

如果协⽅差的值为零就表明两种⾦融资产的收益没有相关关系。

相关系数等于两种⾦融资产的协⽅差除以两种⾦融资产的标准差的乘积。

由于标准差总是正值,因此相关系数的符号取决于两个变量的协⽅差的符号。

如果相关系数为正,则表明两种资产的收益正相关;如果相关系数为负,说明两种资产的收益负相关;如果相关系数为零,说明两种资产的收益之间没有相关性。

更重要的是,可以证明相关系数总是介于-l和+1之间,这是由于协⽅差除以两个标准差乘积后使得计算结果标准化。

这有利于判断资产之间的相关性的⼤⼩。

相关系数和协方差的计算公式

相关系数和协方差的计算公式

相关系数和协方差的计算公式
相关系数和协方差是统计学中常用的两个概念,用于衡量两个变量之间的关联程度。

相关系数是一个介于-1到1之间的数值,用来衡量两个变量之间的线性关系强度和方向。

协方差则是一个描述两个变量之间关系的统计量。

相关系数的计算公式如下:
相关系数 = 协方差 / (变量1的标准差 * 变量2的标准差)
其中,协方差的计算公式如下:
协方差= Σ((变量1的值 - 变量1的均值) * (变量2的值 - 变量2的均值)) / 样本数
相关系数和协方差的计算公式可以帮助我们衡量两个变量之间的关联程度。

相关系数的取值范围为-1到1,当相关系数接近1时,表示两个变量之间存在强正相关关系;当相关系数接近-1时,表示两个变量之间存在强负相关关系;当相关系数接近0时,表示两个变量之间不存在线性关系。

协方差的取值范围为负无穷到正无穷,协方差的正负表示了两个变量之间的关系方向。

当协方差为正时,表示两个变量呈正相关关系;当协方差为负时,表示两个变量呈负相关关系;当协方差接近于0时,表示两个变量之间不存在线性关系。

通过计算相关系数和协方差,我们可以得出两个变量之间的关联程度。

这些概念和计算公式在统计学和数据分析中有着广泛的应用,可以帮助我们理解和解释变量之间的关系,从而做出更准确的预测和决策。

无论是在科学研究、经济分析还是市场营销等领域,相关系数和协方差都是非常重要的工具。

通过运用相关系数和协方差的计算公式,我们可以更好地理解数据背后的规律和趋势,从而做出更明智的决策。

协方差与相关系数深度剖析

协方差与相关系数深度剖析

协方差与相关系数深度剖析协方差和相关系数是统计学中常用的两个概念,用于衡量两个变量之间的关系。

在数据分析和金融领域中,协方差和相关系数被广泛应用于风险评估、投资组合优化、市场分析等方面。

本文将对协方差和相关系数进行深度剖析,探讨其定义、计算方法以及应用场景。

一、协方差1.1 定义协方差是衡量两个随机变量之间关系强度的统计量。

它描述了两个变量的变化趋势是否一致,以及变化幅度的大小。

协方差可以为正、负或零,分别表示正相关、负相关或无关。

1.2 计算方法设有两个随机变量X和Y,其样本容量为n。

则协方差的计算公式如下:其中,和分别表示第i个样本点的取值,和分别表示X和Y的样本均值。

1.3 解读协方差的数值大小表示了两个变量之间的关系强度。

当协方差为正时,表示两个变量呈正相关关系,即当一个变量增大时,另一个变量也增大;当协方差为负时,表示两个变量呈负相关关系,即当一个变量增大时,另一个变量减小;当协方差接近于零时,表示两个变量无关。

二、相关系数2.1 定义相关系数是衡量两个随机变量之间线性关系强度的统计量。

它是协方差除以两个变量的标准差的乘积,用于消除不同变量单位和尺度的影响。

相关系数的取值范围在-1到1之间,绝对值越接近1表示线性关系越强。

2.2 计算方法设有两个随机变量X和Y,其样本容量为n。

则相关系数的计算公式如下:其中,和分别表示X和Y的标准差。

2.3 解读相关系数的数值大小表示了两个变量之间线性关系的强度和方向。

当相关系数为1时,表示两个变量完全正相关,即存在着完全的线性关系;当相关系数为-1时,表示两个变量完全负相关,即存在着完全的线性反关系;当相关系数接近于0时,表示两个变量之间不存在线性关系。

三、协方差与相关系数的应用3.1 风险评估在金融领域中,协方差和相关系数被广泛应用于风险评估。

通过计算不同资产之间的协方差或相关系数,可以评估投资组合的风险水平。

如果两个资产之间的协方差或相关系数较大,则说明它们的价格波动趋势相似,投资组合的风险较高;反之,如果协方差或相关系数较小,则说明它们的价格波动趋势相对独立,投资组合的风险较低。

协方差与相关系数

协方差与相关系数
Cov(X,Y)= E(XY)-E(X)E(Y)
• 任意两个随机变量X与Y的和的方差为 D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
协方差的性质
1. C ov(X,X)D (X)
2. C o v(X ,Y ) C o v(Y ,X ) 3. C o v (a X ,b Y ) a b C o v ( Y ,X )a,b是常数
• 性质3:若X与Y相互独立,则ρXY=0.
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1.
证明 则
令 XXE(X) YYE(Y)
D (X)
D (Y)
X 2 Y(E{X [E D((X X))D ]Y([Y )E(Y)]} 2 )
(E {X [E (X )]Y [E (Y )]} 2 [ )E (X * Y *2 )] D (X ) D (Y )
XY
Co(vX,Y) 0 D(X) D(Y)
§2.2 相关系数的含义
• 考虑以X的线性函数a+bX来近似表示Y.以均方误差
e=E{[Y-(a+bX)]2}
=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)
来衡量以a+bX近似表达Y的好坏程度.e的值越小表示
a+bX与Y的近似程度越好.为此令
=E{[a(X-E(X))][b(Y-E(Y))]} =abE{[X-E(X)][Y-E(Y)]} =abCov(X,Y)
• 定理:Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) 证明 Cov(X+Y,Z)
=E{[(X+Y)-E(X+Y)][Z-E(Z)] = E{[(X-E(X))+(Y-E(Y))][Z-E(Z)]} = E{[X-E(X)][Z-E(Z)]
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P{| X − µ |< ε } ≥ 1 − σ / ε
证明: (只证 X 是连续型)
P{| X − µ |≥ ε } =
≤ 1

| x − |≥
∫ fε ( x )dx ≤ ∫ µ
ε ε
|x−µ|
2
|x − µ |≥ε
ε
2
f ( x )dx
ε
2
−∞
DX σ 2 (x − µ)2 f (x)dx = 2 = 2 ∫
∗ ∗
cov( X ,Y) < 0
P(Y = −X ) =1
∗ ∗
如例1中 X ,Y 的联合分布为 pij X 1 0 Y
1 0
已求得

p 0
0 q
则必有

0 < p <1 p+q=1
ρXY =1,
P( X = Y ) =1
其中 X ∗ = ( X − p) / pq, Y∗ = (Y − p) / pq .
Y=X Y = −X
X,Y 有线性关系
| ρXY |=1
若 α = π , 3π , 2 2
ρXY = 0 X,Y 不相关,
但 X,Y 不独立,
2 2
X,Y 没有线性关系,但有函数关系
X +Y =1
协方差和相关系数的性质 协方差的性质
cov( X ,Y) = cov(Y, X ) = E( XY) − E( X )E(Y)
第十三讲 协方差与相关系数
教学目的: 教学目的 1.矩的概念. 2 .协方差与相关系数 3切贝谢夫不等式 教学内容: 教学内容 第三章, § 3.6 ~ 3.7 。
一矩
定义
若 E ( X k ) 存在,称之为 X 的 k 阶原点矩。
若 E ( X − EX ) k 存 在 ,称 之 为 X 的 k 阶中 心 矩。

E( X ) = ∫−1 x
E( XY) =
1
2 1− x
2
π
= 0;
∫∫
x2 + y2 ≤1
1 xy dxdy = 0;
π
cov( X ,Y) = E( XY) = E( X )E(Y) = 0
[附录2]
几个重要的 r.v. 函数的数学ห้องสมุดไป่ตู้望
E( X ) E(| X | )
k k k
—— X 的 k 阶原点矩 —— X 的 k 阶绝对原点矩
E(( X − E( X )) ) —— X 的 k 阶中心矩 E(( X − E( X )) ) = D( X ) —— X 的 方差
2
E(( X − E( X )) (Y − E(Y)) ) —— X ,Y 的 k + l 阶混合中心矩 E(XY) —— X ,Y 的 二阶原点矩
k l
E( X Y ) —— X ,Y 的 k + l 阶混合原点矩

返回主目录
这个不等式给出了随机变量 X 的分布未知情 况下,事件{| X − µ |< ε } 的概率的一种估计方法。
例 如 : 在上 面 不等 式 中, 取 ε = 3σ , 4σ , 有 :
P{| X − µ |< 3σ } ≥ 0.8889 P{| X − µ |< 4σ } ≥ 0.9375
E( XY) = p,
cov( X ,Y) = pq, ρXY =1
例2设二维 r.v. (X ,Y ) 的 d.f. 为
1 x(1+ 3y2 ), 0 < x < 2,0 < y <1, f (x, y) = 4 0, 其 它
求 cov( X ,Y), R( X , Y ) 解 E( X ) = ∫−∞ ∫−∞ xf (x, y)dxdy
0.02的概率。
1 5 600 × × DX 6 6 = 0.4213 = P{ X - 100 ≤ 12} ≥ 1 − 2 = 1 − 144 12
X 1 X-100 P{ − ≤ 0.02} = P{ ≤ 0.02} 600 6 600
[附录1]
性质 4 的逆命题不成立,即
若E (X Y ) = E (X )E (Y ),X ,Y 不一定独立 反例 1 pij X -1 0 1 p• j Y 18 18 18 38 -1 0 18 18 28 0 1
2 2
1 , x2 + y2 ≤1, f (x, y) = π 0, 其 它
2 1− x2 , −1< x <1, f X (x) = π 0, 其 它 2 1− y2 , −1< y <1, fY ( y) = π 0, 其 它
f (x, y) ≠ f X (x) fY ( y)
= ∫ xy ⋅ dx∫
0
5 1 2 x(1+ 3y )dy = 6 4
cov( X ,Y) = E( XY) − E( X )E(Y) = 0,
R( X , Y ) = 0
1 E( X ) = ∫0 cos t ⋅ dt = 0, 2π 2π 1 E(Y) = ∫0 cos(t +α) ⋅ dt = 0, 2π
为X ,Y 的 相关系数,记为
ρXY =
cov( X ,Y) D( X ) D(Y)
无量纲 的量
ρXY = cov( X ∗,Y∗) 事实上,
若 ρXY = 0, 称 X ,Y 不相关.
协方差和相关系数的计算
cov( X ,Y) = E( XY) − E( X )E(Y)
为离散型, 若 ( X ,Y ) 为离散型,
Y − E(Y) X − E( X ) P =± =1 D( X ) D(Y)
完全类似地可以证明
E ( XY) ≤ E( X )E(Y )
2 2 2
当E(X 2) > 0, E(Y 2 ) > 0 时,当且仅当
P(Y = t0 X ) =1
时, 等式成立.
相关系数的性质
| ρXY |≤1 | ρXY |=1
∞ ∞ i=1 j =1
1 = ± (D( X ±Y) − D( X ) − D(Y)) 2
cov( X,Y) = ∑∑[xi − E( X )][ yj − E(Y)]pij
为连续型, 若 ( X ,Y ) 为连续型,
cov( X,Y) = ∫
+∞ +∞
−∞ −∞

[x − E( X )][ y − E(Y)] f (x, y)dxdy
返回主目录
1 例4假设一批种子的良种率为 6 ,从中任意选出600 粒,试用切比晓夫(Chebyshev)不等式估计:这 1 600粒种子中良种所占比例与 之差的绝对值不超过 6
1 解: 表示600粒种子中的良种数, 则 X ~ B(600, ). X 6 1 1 5
E(X) = 600 × , D(X) = 600 × × . 6 6 6 由切比晓夫不等式有
D[(Y − E(Y)) −t0 ( X − E(X ))] = 0
P[(Y − E(Y)) −t0 (X − E(X )) = 0] =1
P[(Y − E(Y)) −t0 ( X − E( X )) = 0] =1

P[(Y − E(Y)) = t0 ( X − E( X ))] =1
即 Y 与 X 有线性关系的概率等于1, 这种 线性关系为
pi•
18 38
18
18
38
28
38
XY P
-1
0
1
28
48
28
E( X ) = E(Y) = 0; E( XY) = E( X )E(Y)
E( XY) = 0;

1 P( X = −1,Y = −1) = 8 2 3 ≠ P( X = −1)P(Y = −1) = 8
} 反例2 反例2 ( X ,Y) ~ U(D), D ={(x, y) x + y ≤1
1 4 1 2 = ∫0 x ⋅ xdx∫0 (1+ 3y )dy = 3 4 +∞ +∞ E(Y) = ∫−∞ ∫−∞ yf (x, y)dxdy 5 21 1 2 = ∫0 xdx∫0 y(1+ 3y )dy = 8 4 2
+∞ +∞
E( XY) = ∫
2 0
+∞ −∞

1
+∞ −∞
xyf (x, y)dxdy
ρXY = 0
X , Y 不相关
cov( X ,Y) = 0 E( XY) = E( X )E(Y)
D( X ±Y) = D( X ) + D(Y)
X , Y 不相关
X ,Y 相互独立
三、切比晓夫不等式 定理:(切比晓夫不等式) (Chebyshev 不等式) 随机变量X有数学期望 E( X ) = µ, 方差D( X ) = σ对任意 , 2 ε >0, 不等式 P{| X − µ |≥ ε } ≤ σ 2 / ε 2 成立, 或 2 2
cov( X,Y) = E([X − E(X )][Y − E(Y)])

cov( X,Y) D( X ) D(Y) cov( X,Y)
为(X , Y )的协方差矩阵 可以证明 协方差矩阵 为 半正定矩阵
若D (X ) > 0, D (Y ) > 0 ,称
( X − E( X ))(Y − E(Y) cov( X ,Y) E = D( X ) D(Y) D( X ) D(Y)
对二维随机变量,除每个随机变量各自 的概率特性外, 相互之间可能还有某种联系 问题是用一个怎样的数去反映这种联系. 数 E([ X − E( X )][Y − E(Y)]) 反映了随机变量 X , Y 之间的某种关系
相关文档
最新文档