协方差和相关系数

合集下载

协方差与相关系数

协方差与相关系数

• 任意两个随机变量X与Y的和的方差为 D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
协方差的性质 1. 2. 3. 4.
Cov( X , X ) D( X )
Cov( X , Y ) Cov(Y , X )
Cov(aX , bY ) ab Cov(Y , X ) a,b是常数
XY
Cov( X , Y ) 0 D( X ) D(Y )
例:
已知 D( X ) 4 , D(Y ) 9 , XY
1 U 3 ,设
2X Y ,
V 2 X Y , 求 UV .
1 解 Cov( X , Y ) XY D( X ) D(Y ) 4 9 2 3
§2.1 相关系数的性质
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. • 性质2: |ρXY|=1 的充要条件是,存在常数a,b使得 P{Y=a+bX}=1. • 性质3:若X与Y相互独立,则ρXY=0.
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1.
证明


X E( X ) X D( X )
X与Y的分布律分别为
X
P
-1
0.15
0
0.5
1
0.35
Y P
0 0.4
1 0.6
E ( XY ) (1) 1 0.08 11 0.20 0.12
E ( X ) (1) 0.15 1 0.35 0.20
E (Y ) 1 0.6 0.6
于是
Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 0.12 0.20 0.6 0

协方差与相关系数

协方差与相关系数

其余均方误差
e
D(Y
)(1
2 XY
).
从这个侧面也
能说明 XY 越接近1,e 越小. 反之, XY 越近于0,
e 就越大, Y与X的 线性相关性越小.

例3 设 ( X ,Y ) 的分布律为
X
Y
2 1 1 2 P{Y yi }
1
0 1/4 1/4 0
1/ 2
4
1/4 0 0 1/4 1/2
D(Y
)[1
2 XY
],
D(Y
)1
[cov( X ,Y )]2 D( X )D(Y )
D(Y
)[1
2 XY
],
由于方差
D(Y
)
是正的,
故必有
1
2 XY
0,
所以
XY 1.
性质2. 若 X 和 Y 相互独立,则 XY 0;
注意到此时 cov( X ,Y ) 0, 易见结论成立.
注: X 与Y 相互独立

例4 设 服从 [ , ] 上的均匀分布, 且
X sin , Y cos
判断 X 与 Y 是否不相关, 是否独立.

由于
E( X )
1
2
sind 0,
E(Y
)
1
2
cosd 0,

E(
XY
)
1
2
sin cosd 0.
2
因此
E( XY ) E( X )E(Y ),
从而 X 与 Y 不相关. 但由于 X 与 Y 满足关系:

例2 设连续型随机变量 ( X ,Y ) 的密度函数为
f
(
x,

协方差与相关系数

协方差与相关系数

D( X + Y ) = ? D( X + Y ) = E ( X + Y )2 − [ E ( X + Y )]2
= D( X ) + D(Y ) + 2 E {[ X − E ( X )][Y − E (Y )]}.
协方差
(2) 定义
称 E{[ X − E ( X )][Y − E (Y )]} 为随机变量 X 与 Y 的协方差. 记为 Cov( X , Y ), 即 C ov( X , Y ) = E{[ X − E ( X )][Y − E (Y )]}. 称 ρXY = Cov( X , Y ) D( X ) ⋅ D(Y ) ( D( X ) ≠ 0, D(Y ) ≠ 0)
G
O
x
D(Y ) = D( X ) = 153 / 2800,
Cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400 = 0.0475,
Cov( ,Y ) X ρXY = = 0.87, D( X ) ⋅ D(Y )
D( X + Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ) = 0.2043.
a ,b
2 = E {[Y − (a0 + b0 X )]2 } = (1 − ρXY ) D(Y )
⇒ ρXY = 1.
(4) 不相关与相互独立的关系 若随机变量X, 相互独立 相互独立, 定理 若随机变量 ,Y相互独立, 则 ρ xy = 0 ,即X,Y不相关。 不相关。 , 不相关 不相关 注 1) 相互独立 如后面例2 如后面例2. 2) 不相关的充要条件
2) D( X +Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ).

协方差与相关系数

协方差与相关系数

= ρσ 1σ 2
ρ xy =
ρσ 1σ 2 = =ρ σ 1σ 2 D ( X ) D (Y )
Cov ( X , Y )
ρ=0, ,
从而说明二维正态分布随机变量X, 相互独立 从而说明二维正态分布随机变量 ,Y相互独立 相互独立与不相关是等价的. 即X,Y相互独立与不相关是等价的. , 相互独立与不相关是等价的
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
设二维( 例2 设二维(X,Y)随机变量的密度函数为
π π 1 cos( x + y ), 0 ≤ x ≤ , - ≤ y ≤ 0 f ( x, y ) =Y )
1 2 0 π 解 因为 E ( X ) = ∫ ∫ π x cos( x + y )dxdy = ≈ 0.7854, 2 0 -2 4 π 2 1 2 0 2 π π 2 D( X ) = ∫ ∫ π x cos( x + y)dxdy -[ E( X )] = + 2 ≈ 0.1876 2 0 -2 16 2 同理可得 E (Y ) ≈ 0.7854, D(Y ) ≈ 0.1876, 1 π 0 π 2 E ( XY ) = ∫ ∫ π xy × cos( x + y )dxdy1 ≈ -0.5708, 2 0 -2 2 cov( X , Y ) = E ( XY ) - E ( X ) E (Y )
2aE[Y E (Y )][ X E ( X )] + 2 E[Y E (Y )][ E (Y ) aE ( X ) b]
2 aE [ X E ( X )][ E (Y ) aE ( X ) b ]
= D(Y ) + a D( X ) + [ E (Y ) aE ( X ) b] 2a cov( X , Y )

相关系数和协方差的计算公式

相关系数和协方差的计算公式

相关系数和协方差的计算公式
相关系数和协方差是统计学中常用的两个概念,用于衡量两个变量之间的关联程度。

相关系数是一个介于-1到1之间的数值,用来衡量两个变量之间的线性关系强度和方向。

协方差则是一个描述两个变量之间关系的统计量。

相关系数的计算公式如下:
相关系数 = 协方差 / (变量1的标准差 * 变量2的标准差)
其中,协方差的计算公式如下:
协方差= Σ((变量1的值 - 变量1的均值) * (变量2的值 - 变量2的均值)) / 样本数
相关系数和协方差的计算公式可以帮助我们衡量两个变量之间的关联程度。

相关系数的取值范围为-1到1,当相关系数接近1时,表示两个变量之间存在强正相关关系;当相关系数接近-1时,表示两个变量之间存在强负相关关系;当相关系数接近0时,表示两个变量之间不存在线性关系。

协方差的取值范围为负无穷到正无穷,协方差的正负表示了两个变量之间的关系方向。

当协方差为正时,表示两个变量呈正相关关系;当协方差为负时,表示两个变量呈负相关关系;当协方差接近于0时,表示两个变量之间不存在线性关系。

通过计算相关系数和协方差,我们可以得出两个变量之间的关联程度。

这些概念和计算公式在统计学和数据分析中有着广泛的应用,可以帮助我们理解和解释变量之间的关系,从而做出更准确的预测和决策。

无论是在科学研究、经济分析还是市场营销等领域,相关系数和协方差都是非常重要的工具。

通过运用相关系数和协方差的计算公式,我们可以更好地理解数据背后的规律和趋势,从而做出更明智的决策。

相关系数协方差

相关系数协方差

相关系数协方差
相关系数和协方差是统计学中常用的两个概念,它们可以用来衡量两个变量之间的关系。

相关系数是用来衡量两个变量之间的线性关系的强度和方向,而协方差则是用来衡量两个变量之间的总体关系的强度和方向。

相关系数是一个介于-1和1之间的数字,它可以告诉我们两个变量之间的关系是正相关、负相关还是没有关系。

如果相关系数为1,则表示两个变量之间存在完全正相关的关系;如果相关系数为-1,则表示两个变量之间存在完全负相关的关系;如果相关系数为0,则表示两个变量之间没有线性关系。

协方差是一个数字,它可以告诉我们两个变量之间的总体关系的强度和方向。

如果协方差为正数,则表示两个变量之间存在正相关的关系;如果协方差为负数,则表示两个变量之间存在负相关的关系;如果协方差为0,则表示两个变量之间没有关系。

相关系数和协方差在统计学中有着广泛的应用。

例如,在金融领域中,相关系数和协方差可以用来衡量不同股票之间的关系,从而帮助投资者进行投资决策。

在医学领域中,相关系数和协方差可以用来研究不同因素之间的关系,从而帮助医生诊断疾病和制定治疗方案。

需要注意的是,相关系数和协方差只能用来衡量两个变量之间的关
系,而不能用来确定因果关系。

因此,在使用相关系数和协方差时,需要谨慎分析数据,避免得出错误的结论。

相关系数和协方差是统计学中非常重要的概念,它们可以帮助我们了解不同变量之间的关系,从而帮助我们做出更加准确的决策。

在实际应用中,我们需要根据具体情况选择合适的方法来分析数据,以便得出正确的结论。

协方差与相关系数

协方差与相关系数
f ( x , y ) = f X ( x ) fY ( y )
独立, 独立时, 简言之, 即 X 与 Y 独立,反之 X 与 Y 独立时,必有 ρ = 0 ,简言之, 对二元正态变量来说,不相关等价于独立。 对二元正态变量来说,不相关等价于独立。
例 设 ( X , Y ) 的分布密度为
1 π f ( x, y) = 0
= E[( X − E ( X ))(( aX + b ) − E ( aX + b ))]
= aE ( X − E ( X ))2 = aD( X )
ρ 2 XY
[cov( X , Y )] a 2 [ D( X )]2 = = 2 =1 2 D( X ) D(Y ) a [ D( X )]
相关程度的量, 相关系数 ρ XY 是 衡量 X 与 Y 之间线性 相关程度的量 ,
第三节 协方差与相关系数
一. 协方差
X 与 Y 的协方差记作 cov( X , Y ) ,定义为
cov( X , Y ) = E[( X − E ( X ))(Y − E (Y ))] = E ( XY ) − E ( X ) E (Y )
独立时, 当 X 与 Y 独立时,有
cov( X , Y ) = 0
ρ XY = 1, 时, X 与 Y 线性相关; ρ XY > 0 , Y 随 X 增大而增 线性相关;
增大而减小——负相关; ——负相关 大——正相关; XY < 0 , Y 随 X 增大而减小——负相关; ——正相关; 正相关 ρ , 之间毫无线性关系, 不相关, ρ XY = 0 , X 与 Y 之间毫无线性关系,称 X 与 Y 不相关 , 但可存在其它关系,例如二次关系: 但可存在其它关系,例如二次关系: Y = X 2 ( X ∼ N (0,1)) 设 ( X , Y ) ∼ N ( µ1 , µ2 , σ 12 , σ 12 , ρ ) 则 ρ XY = ρ 且当 ρ = 0 时,有

协方差和相关系数

协方差和相关系数

Y
c. 当(X, Y)服从二维正态分布时 , 逆命题亦成立
服从二维正态分布,求 和 的相关系数 的相关系数. 例1.设(X, Y)服从二维正态分布 求X和Y的相关系数 设 服从二维正态分布
解 : 前面在第三章的例子中 已经知道 ( X , Y )的边缘概 率密度为 ( x − µ1 )2 ( y − µ 2 )2 − − 2 1 1 2σ1 2σ 2 2 f X (x) = e ,f Y (y) = e , 2π σ 1 2π σ 2 - ∞ < x, y < +∞ ,
2
3 协方差的性质 协方差的性质:
10 Cov(X, Y)=Cov(Y, X); 20 Cov(X, C)=Cov(C, X)=0 30 Cov(a1X+b1, a2Y+b2)=a1a2Cov(X,Y), 其中 a1, a2, b1,b2是常数 是常数; 40 Cov(X1+X2, Y)=Cov(X1,Y)+Cov(X2, Y); 50 |Cov(X, Y)|2≤D(X)·D(Y); 60 若X, Y相互独立 则Cov(X, Y)=0. 相互独立, 相互独立
+∞ +∞ −∞ −∞
∫ [x − E ( X )][ y − E (Y )] f ( x , y )dxdy
(3) 常用公式 Cov(X, Y) = E [( X − E ( X ))(Y − E ( X ) )] = E ( XY ) − E ( X ) E (Y )
D( X ± Y ) = D( X ) + D(Y ) ± 2Cov(X, Y) 1 Cov(X, Y) = [D( X + Y ) − D( X ) − D(Y )] 2 1 Cov(X, Y) = [D( X ) + D(Y ) − D( X − Y )] 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二维随机变量的期望与方差
对于二维随机变量,如果存在,则
称为二维随机变量的数学期望。

1 、当( X ,Y ) 为二维离散型随机变量时
2 、当( X ,Y ) 为二维连续型随机变量时
例题 2.39 设,求。

与一维随机变量函数的期望一样,可求出二维随机变量函数的期望。

对二维离散型随机变量( X ,Y ) ,其函数的期望为
对二维连续型随机变量( X ,Y ) ,其函数的期望为
例题 2.40 设,求
2.41 设( X ,Y ) 服从区域A 上的均匀分布,其中A 为x 轴、y 轴及直线
围成的三角形区域,如图2-10 所示。

求函数的数学期望。

随机变量的数学期望和方差的三个重要性质:
1 、
推广:
2 、设X 与Y 相互独立,则
推广:设相互独立,则
3 、设X 与Y 相互独立,则
推广:设相互独立,则
仅对性质 3 就连续型随机变量加以证明
证明3
由于X 与Y 相互独立,所以与相互独立,利用性质 2 、知道
从而有,
可以证明:相互独立的随机变量其各自的函数间,仍然相互独立。

例题 2.42 某学校流行某种传染病,患者约占,为此学校决定对全校1000 名师生进
行抽血化验。

现有两个方案:①逐个化验;②按四个人一组分组,并把四个人抽到的血混合在一起化验,若发现有问题再对四个人逐个化验。

问那种方案好?
2.10.2 协方差与相关系数
分析协方差与相关系数反映随机变量各分量间的关系;结合上面性质 3 的证明,可以得到以下结论:
若X 与Y 相互独立,则
可以用来刻划X 与Y 之间的某种关系。

定义设( X ,Y ) 为二维随机变量,若
存在,则称它为随机变量X 与Y 的协方差,记作或,即
特别地
故方差,是协方差的特例。

计算协方差通常采用如下公式:
例题 2.43 设二维随机变量( X ,Y ) 的分布密度

定义若存在,且大于零,则称
为X 与Y 的相关系数,记作,即

若,则称X 与Y 不相关。

由上述讨论知,当X 与Y 相互独立时,协方差,从而。

即X 与Y 相互独立时,X 与Y 一定不相关。

但X 与Y 不相关时,X 与Y 未必独立。

例题 2.44 设,即X 的分布函数
又。

试证明X 与Y 不相关,也不相互独立。

上例说明,若,则与不相关。

但,说明Y 与X 间确实存在某种关
系。

实质上,所刻划的只是随机变量X 与Y 之间的线性相关程度。

若为随机变量X 与Y 之间的相关系数,则有
1 、
2 、的充要条件是:,其中a ,b 为常数,且a ≠ 0 。

从上述结论看出,的值域为[-1,1] ,当时,表明X 与Y 之间几乎成线性
相关关系:。

当时,X 与Y 不相关。

注意,这里所讲的不相关,仅指不线性相关,虽然不线性相关,可能有其它的(如二次函数)非线性的相关关系。

对于二维正态分布,我们已经证明了二维正态变量的两个分量X 与Y 独立的充要条件是。

还可以证明:恰好是两个正态分量X 与Y 的相关系数。

对于二维正态变量,X 与Y 相互独立与不相关是等价的。

2.10.3 矩协方差矩阵
定义设X 是随机变量,若

存在,则称为X 的k 阶原点矩,称为X 的k 阶中心矩。

矩是随机变量的重要数字特征,数学期望和方差是它们的特例。

当X 是离散型随机变量时

当X 是连续型随机变量时
例题 2.45 设,求。

定义设( X ,Y ) 为二维随机变量,若

存在,则分别称为二维随机变量( X ,Y ) 的阶混合原点矩和阶混合中心矩。

显然,协方差是( X ,Y ) 的二阶混合中心矩,简称为二阶中心矩。

若二维随机变量( X ,Y ) 的四个二阶中心矩都存在,分别记为
将它们排成矩阵形式
称为二维随机变量的协方差矩阵。

相关系数性质的证明
定理1.
证:因为对于、的标准化随机变量、有,所以
D()=D+D2=22=2(1)
即.
定理2当且仅当时,=1,且当b>0时,=1;当b<0时,=-1. 证:(1) 设,则,,
即当b>0时,=1;当b<0时,=-1.
(2) 设=1,由定理1的证明可知D()=2(1),
即当=1时,=2()=0;
当=-1时,D(+)=2(1+)=0,
时,D()==0
则当
即.
又由,得,即在概率为1的意义下,
当时,
所以,其中
定理3与独立时=0.
证:因为当与独立时,所以=0。

相关文档
最新文档