协方差与相关系数
协方差与相关系数公式详解了解变量之间的关联程度

协方差与相关系数公式详解了解变量之间的关联程度协方差与相关系数公式详解:了解变量之间的关联程度在统计学中,协方差和相关系数是了解变量之间关联程度的重要指标。
它们能够帮助我们判断两个或多个变量之间的关系以及它们对彼此的影响程度。
本文将详细解释协方差和相关系数的公式以及如何使用它们来进行分析。
一、协方差协方差用于衡量两个变量的总体误差。
它的公式如下:协方差= Σ[(Xi- X均) * (Yi - Y均)] / N其中,Xi和Yi是样本的观测值,X均和Y均是样本的均值,N是样本量。
协方差具有以下几个性质:1. 如果两个变量的协方差大于0,则它们正相关;如果协方差小于0,则它们负相关;如果协方差等于0,则它们不相关。
2. 协方差的绝对值大小不能反映出变量之间的强度和方向。
3. 协方差受到变量单位的影响,不便于比较不同数据集之间的关联程度。
二、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向,它可以消除变量单位的影响。
最常用的是皮尔逊相关系数,其计算公式如下:相关系数 = 协方差 / (X标准差 * Y标准差)其中,X标准差和Y标准差分别是X和Y的标准差。
相关系数取值范围在-1到1之间,具有以下特点:1. 相关系数为1时,表示两个变量完全正相关,即存在着线性关系。
2. 相关系数为-1时,表示两个变量完全负相关,即一个变量的增加与另一个变量的减小呈线性关系。
3. 相关系数接近0时,表示两个变量之间关系较弱,接近随机关系。
4. 若相关系数为0,表示两个变量之间不存在线性关系。
通过计算相关系数,我们可以了解到变量之间关联程度的强弱。
然而,需要注意的是相关系数只能衡量线性关系,若变量之间存在非线性关系,则相关系数可能无法准确刻画它们之间的关系。
三、协方差和相关系数的应用协方差和相关系数广泛应用于金融学、经济学、社会科学等领域。
它们能够提供关于变量之间关系的重要信息,有助于数据分析和决策制定。
在金融领域,协方差和相关系数可用于评估资产之间的风险和收益关系。
协方差与相关系数

其余均方误差
e
D(Y
)(1
2 XY
).
从这个侧面也
能说明 XY 越接近1,e 越小. 反之, XY 越近于0,
e 就越大, Y与X的 线性相关性越小.
完
例3 设 ( X ,Y ) 的分布律为
X
Y
2 1 1 2 P{Y yi }
1
0 1/4 1/4 0
1/ 2
4
1/4 0 0 1/4 1/2
D(Y
)[1
2 XY
],
D(Y
)1
[cov( X ,Y )]2 D( X )D(Y )
D(Y
)[1
2 XY
],
由于方差
D(Y
)
是正的,
故必有
1
2 XY
0,
所以
XY 1.
性质2. 若 X 和 Y 相互独立,则 XY 0;
注意到此时 cov( X ,Y ) 0, 易见结论成立.
注: X 与Y 相互独立
完
例4 设 服从 [ , ] 上的均匀分布, 且
X sin , Y cos
判断 X 与 Y 是否不相关, 是否独立.
解
由于
E( X )
1
2
sind 0,
E(Y
)
1
2
cosd 0,
而
E(
XY
)
1
2
sin cosd 0.
2
因此
E( XY ) E( X )E(Y ),
从而 X 与 Y 不相关. 但由于 X 与 Y 满足关系:
完
例2 设连续型随机变量 ( X ,Y ) 的密度函数为
f
(
x,
协方差与相关系数

D( X + Y ) = ? D( X + Y ) = E ( X + Y )2 − [ E ( X + Y )]2
= D( X ) + D(Y ) + 2 E {[ X − E ( X )][Y − E (Y )]}.
协方差
(2) 定义
称 E{[ X − E ( X )][Y − E (Y )]} 为随机变量 X 与 Y 的协方差. 记为 Cov( X , Y ), 即 C ov( X , Y ) = E{[ X − E ( X )][Y − E (Y )]}. 称 ρXY = Cov( X , Y ) D( X ) ⋅ D(Y ) ( D( X ) ≠ 0, D(Y ) ≠ 0)
G
O
x
D(Y ) = D( X ) = 153 / 2800,
Cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400 = 0.0475,
Cov( ,Y ) X ρXY = = 0.87, D( X ) ⋅ D(Y )
D( X + Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ) = 0.2043.
a ,b
2 = E {[Y − (a0 + b0 X )]2 } = (1 − ρXY ) D(Y )
⇒ ρXY = 1.
(4) 不相关与相互独立的关系 若随机变量X, 相互独立 相互独立, 定理 若随机变量 ,Y相互独立, 则 ρ xy = 0 ,即X,Y不相关。 不相关。 , 不相关 不相关 注 1) 相互独立 如后面例2 如后面例2. 2) 不相关的充要条件
2) D( X +Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ).
协方差与相关系数

= ρσ 1σ 2
ρ xy =
ρσ 1σ 2 = =ρ σ 1σ 2 D ( X ) D (Y )
Cov ( X , Y )
ρ=0, ,
从而说明二维正态分布随机变量X, 相互独立 从而说明二维正态分布随机变量 ,Y相互独立 相互独立与不相关是等价的. 即X,Y相互独立与不相关是等价的. , 相互独立与不相关是等价的
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
设二维( 例2 设二维(X,Y)随机变量的密度函数为
π π 1 cos( x + y ), 0 ≤ x ≤ , - ≤ y ≤ 0 f ( x, y ) =Y )
1 2 0 π 解 因为 E ( X ) = ∫ ∫ π x cos( x + y )dxdy = ≈ 0.7854, 2 0 -2 4 π 2 1 2 0 2 π π 2 D( X ) = ∫ ∫ π x cos( x + y)dxdy -[ E( X )] = + 2 ≈ 0.1876 2 0 -2 16 2 同理可得 E (Y ) ≈ 0.7854, D(Y ) ≈ 0.1876, 1 π 0 π 2 E ( XY ) = ∫ ∫ π xy × cos( x + y )dxdy1 ≈ -0.5708, 2 0 -2 2 cov( X , Y ) = E ( XY ) - E ( X ) E (Y )
2aE[Y E (Y )][ X E ( X )] + 2 E[Y E (Y )][ E (Y ) aE ( X ) b]
2 aE [ X E ( X )][ E (Y ) aE ( X ) b ]
= D(Y ) + a D( X ) + [ E (Y ) aE ( X ) b] 2a cov( X , Y )
协方差相关系数公式

协方差相关系数公式协方差和相关系数这两个概念,在咱们的数学学习中可有着相当重要的地位呢!先来说说协方差吧。
协方差呀,简单来讲就是衡量两个变量一起变化的程度。
比如说,有个班级进行了两次考试,一次是语文,一次是数学。
咱把每个同学的语文成绩和数学成绩看作两个变量,如果大部分同学语文成绩高的时候数学成绩也高,语文成绩低的时候数学成绩也低,那这两个变量的协方差就比较大,说明它们一起变化的趋势比较明显。
协方差的公式是:Cov(X,Y) = E[(X - E(X))(Y - E(Y))] 。
这看起来有点复杂,是吧?其实呀,就是先算出每个变量与它们各自平均值的差值,然后把这两个差值乘起来,最后求个平均值。
举个例子吧,咱们假设有五个同学,他们的语文成绩分别是 80、85、90、95、100 ,数学成绩分别是 70、75、80、85、90 。
先算出语文成绩的平均值是 90 ,数学成绩的平均值是 80 。
然后呢,第一个同学语文成绩与平均值的差值就是 80 - 90 = -10 ,数学成绩与平均值的差值就是 70 - 80 = -10 ,这两个差值乘起来就是 (-10)×(-10) = 100 。
按照这样的方法把五个同学的都算出来,再求个平均值,这就是协方差啦。
再说说相关系数。
相关系数呢,其实就是把协方差标准化了一下,这样能更方便地比较不同变量之间的关系强度。
相关系数的取值范围在 -1 到 1 之间。
如果相关系数是 1 ,那就说明两个变量完全正相关,比如身高和体重,一般来说长得高的人体重也会重一些;如果是 -1 ,就是完全负相关,比如价格和需求量,价格越高,需求量往往越低;要是 0 呢,就说明这两个变量没啥关系。
相关系数的公式是:ρ(X,Y) = Cov(X,Y) / (σ(X)σ(Y)) 。
这里面的σ 表示标准差,就是衡量变量分散程度的一个指标。
记得我之前教过一个学生,他一开始对协方差和相关系数那是一头雾水。
第3节协方差与相关系数

因为 DY * X * 2 2XY 0 ,
所以由方差性质,存在 C,使得
P Y * X* C 1,
即
P
Y
DY DXX
DY C EY
DY DX
EX
1
令a
DY D X 0,b C
DY E Y
X,Y
不相关.
例:设 ~ U , ,又 X sin ,Y cos ,试求 X 与 Y 间的相关系数.
解: EX sin 1 d 0, EY 1 cos d 0 ,
2
2
E XY
sin cos
1.定义:设(X,Y)为二维随机向量,若 D(X)>0,D(Y)>0,则称
COV
DX
X ,Y DY
为
X
与
Y
的相关系数,记为
XY
(或
),即
COV X ,Y
XY = DX DY
注:令 X*
X
EX DX
,Y*
Y
EY DY
,则 XY
COV X*,Y * .
协方差及相关系数
,X )
1 Cov(X 2
,Y )
1 3
D(
X
)
1 2
XY
D(X )
D(Y )
1 3
9
1 2
1 2
3
4
3
3
0
,
故 X 与 Z 的相关系数为 XZ
Cov( X ,Z) 0 . D(X ) D(Z)
(3)由 X ,Y 服从正态分布知 Z X Y 也服从正态分布,而两个正态随机变量相互独 32
立与不相关是等价的,所以由 XZ 0 即 X 与 Z 不相关,可推出 X 与 Z 相互独立.
概率论与数理统计
XY 1, 当 a 0 时.
(4-16)
1.3 随机变量的相关性
定义 4.6 随机变量 X 与Y 的相关系数为 XY ,若 XY 0 ,则称 X 与 Y 不相关,若 XY 0 ,则称 X 与Y 相关.
X与Y不相关
XY 0
Cov(X,Y)=0
E(XY)=E(X)E(Y)
D(X±Y)=D(X)+D(Y)
定义 4.5 设随机变量 X 与Y 的方差存在,且均不为零,则称
Cov(X ,Y ) D(X ) D(Y )
为 X 与Y 的相关系数,记作 XY ,或简记为 ,即
XY
Cov(X ,Y) E{[ X E(X)][Y E(Y)]} .
D(X ) D(Y )
D(X ) D(Y)
定理 4.3 若随机变量Y 是 X 的线性函数,即Y aX b (a 0) ,则 1, 当 a 0 时,
定理 4.5 设随机变量 (X ,Y ) 服从二维正态分布,则 X 与Y 不相关的充要条件是 X 与Y
相互独立.
1.3 随机变量的相关性
协方差和相关系数公式_相关系数与协方差的关系
·若Corr(X,Y)=1,则称X与Y完全正相关;若Corr(X,Y)=-1,则称X与Y完全,负相关。
·若0
2协方差与相关系数的一致性
从协方差与相关系数的定义和性质我们不难发现,协方差与相关系数都是反映X与Y相关程度的量。也就是说,他们有异曲同工之效。在刻画二维随机变量两个分量间相互关联程度时,他们保持了一致性。这一点我可以给出以下两个例子来说明。
设(X,Y)是一个二维随机变量,且Var(X)0,Var(Y)0.则称
Cov(X,Y)
(X)(Y)Cov(X,Y) Corr(X,Y)==σxσ y
为X与Y的(线性)相关系数。
利用施瓦茨不等式我们不难得到-1≤Corr(X,Y)≤1.也就是说相关系数是介于-1到1之间的,并且可以对它作以下几点说明:
Corr(X,Y)越接近1,则线性相关程度越高;Corr(X,Y)越接近0,则线性相关程度越低。而协方差则其比
值就不一定小,下面我们来看实例。
例三已知随机向量(X,Y)的联合密度函数为
8
3, 0
求X,Y的协方差及相关系数。
解:先计算两个边际密度函数,再分别计算E(X)、E(X2)、E(Y)、E(Y2)、Var(X)、Var(Y)及E(XY)。
·当Cov(X,Y)
·当Cov(X,Y)=0时,称X与Y不相关。
也就是说,协方差就是用来描述二维随机变量X与Y相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则Cov(X,Y)带有量纲(m·kg)。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义如下:
协方差和相关系数
§4.4 协方差和相关系数随机变量的数字特征,包括数学期望、方差、协方差和相关系数等。
协方差和相关系数是考虑两个随机变量之间的某种关系。
协方差的意义不太直观,它考察两个随机变量(随机向量)与各自均值之差的加权平均值,相关系数则是考虑两个随机变量取值之间的关系。
1. 协方差定义:对两个随机变量X 、Y ,称E X EX Y EY [()()]--为X 与Y 的协方差,记为Cov (X , Y ),即 C o vX Y E X EX Y EY (,)[()()]=-- 2. 相关系数定义:对两个随机变量X 、Y ,称C o vX YD X D Y (,)()()为X 与Y 的相关系数或标准协方差,记为ρXY ,即ρXY Cov X Y D X D Y =(,)()()3. 方差、协方差的运算性质(1) D X Y D X D Y Cov X Y ()()()(,)+=++2 (2) Cov X Y E XY E X E Y (,)()()()=-⋅ 推论:若随机变量X 、Y 独立,则 Cov X Y XY (,)==ρ0Problem :若Cov X Y XY (,)==ρ0,则X 、Y 是否独立? (3) Cov X Y Cov Y X (,)(,)= (4) Cov aX bY abCov X Y (,)(,)=(5) Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212+=+Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212-=-4. 相关系数的性质(1) 柯西-许瓦兹(Cauchy-Schwarz)不等式:对任意两个随机变量X 、Y ,若E X E Y ()()22<∞<∞ , ,则 (())()()E XY E X E Y 222≤⋅ 证明:对任意实数t ,有q t E X tY E X t E Y tE XY ()(())()()()=+=++≥222220 因此,二次方程q t ()=0的判别式 440222(())()()E XY E X E Y -⋅≤即(())()()E XY E X E Y 222≤⋅ 证毕。
协方差和相关系数公式
协方差和相关系数公式
协方差和相关系数是统计学中常用的两个概念,用于描述两个变量之间的关系。
它们可以帮助我们理解和分析数据的变化趋势,从而更好地进行决策和预测。
协方差是用来衡量两个变量之间的总体误差的指标。
当协方差为正值时,表示两个变量呈正相关关系,即当一个变量增加时,另一个变量也会增加;当协方差为负值时,表示两个变量呈负相关关系,即当一个变量增加时,另一个变量会减少;当协方差接近于零时,表示两个变量之间几乎没有线性关系。
然而,协方差的数值大小受到变量单位的影响,不便于比较不同数据集之间的相关性。
为了解决这个问题,引入了相关系数的概念。
相关系数是协方差除以两个变量的标准差的乘积,它的取值范围是-1到1。
当相关系数为1时,表示两个变量完全正相关;当相关系数为-1时,表示两个变量完全负相关;当相关系数接近于0时,表示两个变量之间几乎没有线性关系。
协方差和相关系数在实际应用中具有广泛的应用。
例如,在金融领域,我们可以使用协方差和相关系数来衡量不同股票之间的相关性,从而进行投资组合的优化;在市场营销领域,我们可以使用协方差和相关系数来分析产品销量和广告投入之间的关系,从而制定更有效的市场推广策略。
协方差和相关系数是统计学中重要的工具,可以帮助我们理解和分析数据之间的关系。
通过对它们的应用,我们可以提高决策的准确性和预测的精度,从而在各个领域取得更好的成果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性质2. 若 X和 Y相互独立,则 XY0;
注意到此时 co X ,Y v ) (0 ,易见结论成立.
注: X与Y 相互独立
X与 Y不相关.
例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, 不难求得,
Cov(X,Y)=0, (请课下自行验证)
因而 =0, 即X和Y不相关 .
因此
E ( X ) E Y ( X ) E ( Y ),
从而 X与 Y不相关. 但由于 X与 Y 满足关系:
X2Y21
所以 X与 Y 不独立.
完
例5 已知 X~N(1,32),Y~N(0,42),且 X与 Y
4/22,5
完
协方差的大小在一定程度上反映了X和Y 相互间的关系,但它还受X与Y本身度量单位 的影响. 例如:
Cov(kX, kY)=k2Cov(X,Y)
为避免随机变量本身度量单位不同而影响它们相互
关系的度量,可将每个随机变量标准化,即取
X X E (X ),Y YE (Y ),
D (X )
完
例4 设 服从 [,]上的均匀分布, 且
Xsin , Yco s
判断 X与 Y是否不相关, 是否独立.
解 由于 E (X )2 1 sid n 0 ,
E (Y )2 1 co d s0 ,
而
E (X ) Y 2 1 2 s ic n o d s0 .
特别地, 若 X与Y相互独立,则
D ( X Y ) D ( X ) D ( Y ).
注: ① 上述结果可推广至 n维情形:
n
n
D ( X i) D (X i) 2 co X i,v X j)(;
i 1
i 1
1 i j n
② 若 X1,X2, ,Xn两两独立, 则有
其余均方误差 eD (Y )1 (X 2)Y.从这个侧面也
能说明 XY 越接近1,e越小. 反之, XY 越近于0,
e就越大, Y与X的 线性相关性越小.
完
例3 设 (X,Y)的分布律为
X
Y
2 1 1 2 P{Yyi}
1
0 1/4 1/4 0 1/2
4 1/4 0 0 1/4 1/2
E { X [E ( X )Y ] E [ ( Y )]}
在一定程度上反映了随机变量 X与 Y之间的关系.
完
一、协方差的定义
定义 设 (X,Y)为二维随机向量,若
E { X [E ( X )Y ] E [ ( Y )存] 在,} 则称其为随机变量 X和 Y的协方差,记为 coX v,Y 即 cX , o Y ) E { v X [ E ( ( X ) Y ] E ( Y [ )]} 按定义,若 (X,Y)为离型随机向量,其概率分布为
近似 Y 的均方误差,则有下列结论: 若 D ( X ) 0 ,D ( Y ) 0 , 则
a 0 c X , Y o ) / D ( X ) v b 0 , E ( Y ( ) a 0 E ( X )
使均方误差达到最小.
e =E{[Y-(a+bX)]2 }
=E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X)
计算得
E ( X ) 0 ( 1 ) Y 0 . 1 0 0 0 . 2 0 2 0 1 ( 1 ) 0 . 3 1 0 0 . 5 1 2 0 . 1 2 ( 1 ) 0 . 1 2 0 5 0 2 2 0 . 1 0.
P { Y 2 } 0 .2 ,
P {X 0 } 0 .3 ,P {X 1 } 0 .4,P 5 {X 2 } 0 .2; P { Y 1 } 0 .5,P 5 {Y 0 } 0 .2,5 P { Y 2 } 0 .2 ,
E ( X ) 0 0 . 3 1 0 . 4 2 5 0 . 2 0.95 5, E ( Y ) ( 1 ) 0 . 5 0 0 . 5 2 2 0 . 5 2 0.1.5
特别地,当X与Y 独立时,有 co X ,Y v ) (0 .
完
二、协方差的性质 1. 协方差的基本性质
(1) co X ,X v ) D ( (X ); (2) co X ,Y ) v c(Y o ,X ) v;( (3) ca o ,b X v ) Y a ( cb X o ,Y )v 其,中( a,b 是
n
n
D(Xi)D(Xi);
i1
i1
③ 可以证明: 若X,Y的方差存在,则协方差 (X,Y) 一定存在且满足下列不等式:
cX o , Y ) E v [ X ( E ( X )Y ] E ( Y [ ) D (X ) D (Y).
完
例1 已知离散型随机向量 Y
(X,Y)的概率分布如右表, X
P { X x i, Y y i} p i( i j,j 1 , 2 , ),
则 cX o ,Y ) v [ x i ( E ( X )y ] j E [ ( Y )p ] i.j i ,j
若(X,Y)为连续型随机向量,其概率密度为 f(x,y),
coX v,Y () [x E (X )y ] [ E (Y )f] (x ,y )dx . 协方差计算的简化公式
E(Y)yY f(y)dy
1 0
y4y3dy4/5,
11
E (X)Y xy (x,fy)dxddyxxy8xydy
0x
4/9,
E(X)8/15, E(Y)4/5, E(XY)4/9, 从而 c X , Y o ) E ( X v ) E ( X Y ) E ( Y )
§4.3 协方差与相关系数
• 一、协方差的定义 • 二、协方差的性质 • 三、相关系数的定义 • 四、相关系数的性质 • 五、矩的概念与协方差矩阵 • 六、n维正态分布的概率密度与性质 • 七、小结
前面我们介绍了随机变量的数学期望 和方差,对于多维随机变量,反映分量之 间关系的数字特征中,最重要的,就是本 讲要讨论的
1 0 2
求 coX v,Y ().
0 0.1 0.2 0
1 0.3 0.05 0.1
解 容易求得 X的概率分 2 0 .15 0 0 .1
布为
P {X 0 } 0 .3 , P {X 1 } 0 .4,5
P {X 2 } 0 .2;5
Y的概率分布为
P { Y 1 } 0 .5,5P {Y 0 } 0 .2,5
XY 的值越接近于1,Y 与 X线性相关程度越高;
XY 的值越接近于0,Y 与 X线性相关程度越弱;
XY 1 时, Y与 X有严格线性关系;
XY0 时, Y与 X无线性关系;
这里注意:当 XY0时,只说明 Y与 X没有线性
关系. 并不能说明Y与X之间没有其它函数关系. 从而不能推出 Y与 X独立. 4. 设 e E {Y [ (a X b )2 } ]称,其为用 aX b来
常数;
(4) co C ,X v ) (0 , C为任意常数;
(5) cX 1 o X 2 , Y v ) c ( X 1 o , Y ) c v X 2 o , Y ( ) (6) 当 X与Y 相互独立,则 co X ,Y v ) (0 .
2. 随机变量和的方差与协方差的关系
D ( X Y ) D ( X ) D ( Y ) 2 cX , o Y ), v
协方差和相关系数
本节将要讨论的协方差是反映随机变量之间依赖 关系的一个数字特征.
在证明方差的性质时,已经知道, 当 X与 Y相互独 立时,有 E { X [ E ( X ) Y ] E ( Y [ ) ] 0 .} 反之则说明,当 E { X [ E ( X ) Y ] E ( Y [ ) ] 0 } 时,X与 Y 一定不相互独立,这说明量
数分别为:
4x(1x2), 0x1
fX(x)
0,
, 其它
4y3, 0y1
fY(y)
0,
,பைடு நூலகம்其它
4x(1x2), 0x1
fX(x)
0,
, 其它
4y3, 0y1
fY(y)
0,
, 其它
E(X) xX f(x)dx 01x4x(1x2)dx8/15,
- 2aE(Y)
这样求出的最佳逼近为
eae22baE(X 2b2)E(X2)E(X2EY()Y)2a0EL(X(X))=0a0+b0X
b
解得
b0
Cov(X,Y) D(X)
a0E (Y)b0E (X)
注: 我们可用均方误差 e来衡量以 aX b近似表 示 Y的好坏程度,e值越小表示 aX b与 Y的近 似程度越好,且知最佳的线性近似为a0Xb0, 而
D (Y )
并将 covX(,Y)作为 X与 Y之间相互关系的一种度
量,而
coX v,Y ()coX v,Y() ,
三、相关系数的定义
D (X)D (Y)
定义 设 (X,Y)为二维随机向量,D (X)0,
D (Y)0, 称
XY
covX(,Y) D(X)D(Y)
为随机变量 X和 Y 的相关系数,有时也记 XY为 .
但Y与X有严格的函数关系, 即X和Y不独立 .
性质3. 若 D ( X ) 0 ,D ( Y ) 0 ,则
XY 1
存在常数 a,b(a0),使
P { Y a X b } 1 , 即X和Y以概率1线性相关.
而且 a0时,XY1. 而且 a0时,XY1.