协方差和相关系数

合集下载

概率论与数理统计-协方差和相关系数01

概率论与数理统计-协方差和相关系数01
相关系数刻划了X和 间 线性相关”的程度. =相关系数刻划了 和Y间“线性相关”的程度
=
9
证: 对任意的 对任意的a,b,令 令
刻画了Y与 刻画了 与a+bX的偏离程度 的偏离程度 e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y)
要使 与 的某个线性函数 最为接近 就是要找a,b使得误差 最为接近 就是要找 数 要使Y与X的某个线性函数a+bX最为接近,就是要找 使得误差 视为关于a,b的二元函数 视为关于 的二元函数,求驻点: 平方e值最 值最小 平方 值最小. 将e视为关于 的二元函数,求驻点: 字 特 征 解得
X与Y不相关 只说明 与Y之间没有线性关系,但可以有 与 不相关 只说明X与 之间没有线性关系 不相关,只说明 之间没有线性关系, 非线性关系; 非线性关系; 而X与Y独立是指 独立是指X,Y之间既无线性关系, 之间既无线性关系, 与 独立是指 之间既无线性关系 也无非线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。 独立”必然不相关,但反之不然。 不相关 但是,对于二维正态分布,独立与不相关等价。 但是,对于二维正态分布,独立与不相关等价。 与不相关等价 2 若二维r.v ( X , Y ) ~ N ( µ 1 , µ 2 ; σ 12 , σ 2 ; ρ ) 即:若二维 则X与Y相互独立 与 相互独立
D(X)=p (1-p ) D(X)=np(1-p) D(X)=
E(X) = µ
a +b E(X) = 2 1 E(X) =
D(X)= σ
λ
2
(b − a)2 D(X)= 12
(5) 切比雪夫不等式 =

协方差公式性质证明过程_期望方差协方差及相关系数的基本运算

协方差公式性质证明过程_期望方差协方差及相关系数的基本运算

协方差公式性质证明过程_期望方差协方差及相关系数的基本运算期望(Expected Value)是概率论与数理统计中的重要概念之一,表示随机变量的平均值。

设X是一个随机变量,其概率密度函数为f(x),则X的期望定义为:E(X) = ∫xf(x)dx方差(Variance)是测量随机变量离其期望的平均距离的指标。

设X是一个随机变量,其期望为μ,则X的方差定义为:Var(X) = E((X-μ)²) = E(X²) - (E(X))²协方差(Covariance)衡量两个随机变量之间的线性相关性。

设X和Y为两个随机变量,其期望分别为μX和μY,则X和Y的协方差定义为:Cov(X, Y) = E((X-μX)(Y-μY)) = E(XY)-μXμY相关系数(Correlation Coefficient)是用来刻画两个随机变量之间相关关系的指标,它是协方差标准化的结果。

设X和Y为两个随机变量,其协方差为Cov(X, Y),则X和Y的相关系数定义为:ρ(X, Y) = Cov(X, Y) / (√(Var(X)) * √(Var(Y)))现在我们来证明协方差的一些性质。

性质1:Cov(X, X) = Var(X)证明:Cov(X, X) = E((X-μX)(X-μX)) = E((X-μX)²) = Var(X)性质2:Cov(X, Y) = Cov(Y, X)证明:Cov(X, Y) = E((X-μX)(Y-μY)) = E((Y-μY)(X-μX)) = Cov(Y, X)性质3:Cov(aX, Y) = aCov(X, Y),其中a为常数证明:Cov(aX, Y) = E((aX-μ(aX))(Y-μY)) = E(a(X-μX)(Y-μY)) =aE((X-μX)(Y-μY)) = aCov(X, Y)性质4:Cov(X, Y + Z) = Cov(X, Y) + Cov(X, Z)证明:Cov(X, Y + Z) = E((X-μX)(Y+Z-μ(Y+Z))) = E((X-μX)(Y-μY+Z-μZ))=E((X-μX)(Y-μY))+E((X-μX)(Z-μZ))= Cov(X, Y) + Cov(X, Z)性质5:Cov(aX + b, Y) = aCov(X, Y),其中a和b为常数证明:Cov(aX + b, Y) = E((aX + b - μ(aX + b))(Y-μY)) = aE((X-μX)(Y-μY)) = aCov(X, Y)性质6:Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)证明:Cov(X + Y, Z) = E(((X + Y)-μ(X + Y))(Z-μZ)) = E((X-μX)(Z-μZ) + (Y-μY)(Z-μZ))=E((X-μX)(Z-μZ))+E((Y-μY)(Z-μZ))= Cov(X, Z) + Cov(Y, Z)以上就是协方差的一些性质的证明过程。

大学数学概率篇之随机变量的数字特征——协方差与相关系数概要

大学数学概率篇之随机变量的数字特征——协方差与相关系数概要
e L(X)=a0+b0X 2 a 2 bE ( X ) 2 E ( Y ) 0 a e 2bE ( X 2 ) 2 E ( XY ) 2aE ( X ) 0 b
解得
Cov( X ,Y ) b0 D( X )
a0 E (Y ) b0 E ( X )
特别地, 当 X与 Y 独立时,有 cov( X ,Y ) 0. 完
二、协方差的性质 1. 协方差的基本性质
(1) cov( X , X ) D( X ); (2) cov( X ,Y ) cov(Y , X ); (3) cov( aX , bY ) ab cov( X ,Y ), 其中 a , b 是 常数; (4) cov(C , X ) 0, C 为任意常数; (5) cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); (6) 当 X 与 Y 相互独立, 则 cov( X ,Y ) 0.
X 与 Y 不相关.
例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, 不难求得,
Cov(X,Y)=0,
(请课下自行验证)
因而 =0, 即X和Y不相关 .
但Y与X有严格的函数关系,
即X和Y不独立 .
性质3. 若 D( X ) 0, D(Y ) 0, 则
XY 1
i 1 i 1 n n 1 i j n
cov( X , X
i
j
);
② 若 X 1 , X 2 ,, X n 两两独立, 则有
D( X i ) D( X i );
i 1 i 1
n
n
③ 可以证明: 若 X ,Y 的方差存在,则协方差

相关系数和协方差的关系

相关系数和协方差的关系

相关系数和协方差的关系
一、首先要明白这2个的定义
1、相关系数是协方差与两个投资方案投资收益标准差之积的比值,
其计算公式为:
相关系数总是在-1到+1之间的范围内变动,-1代表完全负相关,+1代表完全正相关,0则表示不相关。

2、协方差是一个用于测量投资组合中某一具体投资项目相对于另一投资项目风险的统计指标。

其计算公式为:
当协方差为正值时,表示两种资产的收益率呈同方向变动;协方差为负值时,表示两种资产的收益率呈反方向变动。

二、要辨清两者的关系
1、相关系数与协方差一定是在投资组合中出现的,只有组合才有相关系数和协方差。

单个资产是没有相关系数和协方差之说的。

2、相关系数和协方差的变动方向是一致的,相关系数的负的,协方差一定是负的。

3、(1)协方差表示两种证劵之间共同变动的程度:相关系数是变量之间相关程度的指标根据协方差的公式可知,协方差与相关系数的正负号相同,但是协方差是相关系数和两证券的标准差的乘积,所以协方差表示两种证劵之间共同变动的程度。

(2)相关系数是变量之间相关程度的指标,相关系数在0到1之间,表示两种报酬率的增长是同向的;相关系数在0到-1之间,表示两种报酬率的增长是反向的,所以说相关系数是变量之间相关程度的指标。

总体来说,两项资产收益率的协方差,反映的是收益率之间共同变动的程度;而相关系数反映的是两项资产的收益率之间相对运动的状态。

两项资产收益率的协方差等于两项资产的相关系数乘以各自的标准差。

协方差cov和相关系数的关系

协方差cov和相关系数的关系

协方差cov和相关系数的关系协方差(covariance)和相关系数(correlation coefficient)是统计学中常用的两个概念,用于衡量两个变量之间的关系。

虽然它们都可以用来描述两个变量之间的关联程度,但是它们之间存在一定的区别和联系。

协方差是用来衡量两个变量之间的总体关系的一个指标。

它的计算公式是两个变量的每个对应数据点的差值乘积的平均值。

协方差的值可以为正、负或零,正值表示两个变量呈正相关关系,负值表示两个变量呈负相关关系,零表示两个变量之间没有线性关系。

然而,协方差的值大小受到变量本身量纲的影响,使得不同变量之间的协方差难以直接比较。

为了解决这个问题,引入了相关系数。

相关系数是由协方差除以两个变量的标准差得到的。

相关系数的取值范围在-1到1之间,绝对值越接近1表示两个变量之间的关系越强,绝对值越接近0表示两个变量之间的关系越弱。

相关系数的绝对值等于1表示两个变量之间存在完全的线性关系,其中正值表示正相关,负值表示负相关。

相关系数为0表示两个变量之间没有线性关系,但并不意味着它们之间没有其他类型的关系。

协方差和相关系数之间的关系可以用一个简单的公式表示:相关系数等于协方差除以两个变量的标准差的乘积。

这意味着相关系数可以通过协方差来计算,同时还考虑了变量本身的标准差,使得相关系数更具有可比性。

协方差和相关系数的应用非常广泛。

在金融领域,协方差和相关系数可以用来衡量不同股票之间的关联程度,帮助投资者进行风险管理和资产配置。

在工程领域,协方差和相关系数可以用来分析不同变量之间的关系,帮助设计师优化产品设计。

在医学研究中,协方差和相关系数可以用来分析不同因素对疾病发生的影响,帮助医生制定预防和治疗策略。

需要注意的是,协方差和相关系数只能衡量两个变量之间的线性关系,不能反映非线性关系。

此外,相关系数只能描述两个变量之间的关系,不能确定因果关系。

因此,在应用中需要综合考虑其他因素,避免误导性的结论。

多元统计分析-协方差,相关系数

多元统计分析-协方差,相关系数

多元统计分析-协⽅差,相关系数协⽅差
协⽅差⽤来描述两个变量的相关性
若两个随机变量正相关则cov(x,y) > 0
负相关则cov(x,y)<0
不相关则cov(x,y) = 0
公式 cov(x,y) = E[(x-u x) *(y-u y)]
r xy = cov(x,y) / ( sqrt(cov(x,x)) * sqrt(cov(y,y)) )
就是求x - x的均值与 y-y的均值的乘积的期望
因为若两个向量正相关则对于多数的(x,y), (x-u x) *(y-u y) > 0, 其期望⾃然也就⼤于0
若两个向量负相关则对于多数的(x,y), (x-u x) *(y-u y) < 0, 其期望⾃然也就⼩于0
若两个向量完全不相关则(x-u x) *(y-u y) 有时⼤于0,有时⼩于0,其期望等于0
相关系数:
σ:⽅差
相关系数是消除了量刚(尺度)的协⽅差
⽐如X是均值为1000的随机变量 Y是均值为0的随机变量,先将其标准化处理再计算协⽅差就是相关系数 -1<=p<=1
相关系数为1表⽰完全正相关,为-1表⽰负相关,为0表⽰完全不相关
术语解释:
标准化:
对于均值为u,⽅程为a的正太分布随机变量X
可通过Y =(x-u)/a将其变为均值为0⽅差为1的正太分布随机变量Y。

金融计算中的协方差和相关系数计算方法

金融计算中的协方差和相关系数计算方法在金融领域中,协方差和相关系数是两个重要的统计量,用于衡量不同资产之间的关联性。

协方差和相关系数的计算方法对于投资组合的风险管理、资产配置和投资决策具有重要意义。

本文将介绍协方差和相关系数的计算方法,并探讨它们在金融计算中的应用。

协方差是衡量两个随机变量之间关系的统计量。

它描述了两个变量的变化趋势是否一致。

协方差的计算方法如下:1. 计算每个变量的平均值。

2. 将每个变量的观测值减去其平均值,得到离差。

3. 将两个变量的离差相乘,并求和。

4. 将上述结果除以观测值的个数减一,得到协方差。

协方差的计算公式为:cov(X, Y) = Σ((X - μX) * (Y - μY)) / (n - 1)其中,X和Y分别表示两个变量,μX和μY分别表示X和Y的平均值,n表示观测值的个数。

协方差的值可以为正、负或零。

当协方差为正时,表示两个变量呈正相关关系,即一个变量的增加伴随着另一个变量的增加;当协方差为负时,表示两个变量呈负相关关系,即一个变量的增加伴随着另一个变量的减少;当协方差为零时,表示两个变量之间没有线性关系。

然而,协方差的值无法直接比较不同变量之间的关联程度,因为它受到变量单位的影响。

为了解决这个问题,引入了相关系数作为衡量变量之间关联程度的统计量。

相关系数是协方差除以两个变量的标准差的乘积,其计算方法如下:1. 计算每个变量的标准差。

2. 将协方差除以两个变量的标准差的乘积。

相关系数的计算公式为:ρ(X, Y) = cov(X, Y) / (σX * σY)其中,ρ表示相关系数,cov表示协方差,σ表示标准差。

相关系数的取值范围在-1到1之间。

当相关系数为1时,表示两个变量呈完全正相关关系;当相关系数为-1时,表示两个变量呈完全负相关关系;当相关系数为0时,表示两个变量之间没有线性关系。

协方差和相关系数在金融计算中具有广泛的应用。

例如,在投资组合管理中,投资者可以通过计算不同资产之间的协方差和相关系数来评估它们之间的关联性,从而选择合适的资产组合,以实现风险分散和收益最大化。

协方差和相关系数的计算

当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y E(Y ) t0 ( X E( X ))) 1
时,等式成立—Cauchy-Schwarz不等式.
证明 令
g(t) E[(Y E(Y )) t( X E( X ))]2 D(Y ) 2t cov( X ,Y ) t 2D( X )
若D (X) > 0, D (Y) > 0 ,称
E ( X E( X ))(Y E(Y ) cov( X ,Y ) D( X ) D(Y ) D( X ) D(Y )
为X,Y 的相关系数,记为
XY
cov( X ,Y ) D( X ) D(Y )
事实上, XY cov( X ,Y ).
D[(Y E(Y )) t0 ( X E( X ))] 0 P[(Y E(Y )) t0 ( X E( X )) 0] 1 P[(Y E(Y )) t0 ( X E( X )) 0] 1 即 P[(Y E(Y )) t0 ( X E( X ))] 1
即Y 与X 有线性关系的概率等于1,这种线性关 系为
对任何实数 t ,g (t) 0
4 cov 2 ( X ,Y ) 4D( X )D(Y ) 0
即 | cov( X ,Y ) |2 D( X )D(Y )
等号成立
g (t) 0 有两个相等的实零点
t0
cov( X ,Y D(X )
)
g(t0 ) 0 即
D(Y ) D(X )
E[(Y E(Y )) t0 ( X E( X ))]2 0 又显然 E[(Y E(Y )) t0 ( X E( X ))] 0
解 cov(U ,V ) E(UV ) E(U )E(V ) a2E( X 2 ) b2E(Y 2 )

已知协方差矩阵求相关系数矩阵

已知协方差矩阵求相关系数矩阵协方差矩阵和相关系数矩阵都是用来描述多个随机变量之间的关系的重要工具。

协方差矩阵衡量的是随机变量之间的线性相关性,而相关系数矩阵则衡量的是随机变量之间的总体相关性。

协方差矩阵是一个对称矩阵,对角线上的元素是每个随机变量的方差,非对角线上的元素是两两随机变量之间的协方差。

协方差矩阵的计算公式如下:Cov(X,Y) = E[(X-μX)(Y-μY)]其中,X和Y是两个随机变量,μX和μY分别是X和Y的均值。

协方差矩阵的计算需要知道每个随机变量的均值和方差。

如果不知道这些值,可以通过样本数据来估计。

假设有n个样本,每个样本有m个随机变量,那么协方差矩阵的估计公式如下:Cov(X,Y) = Σ((X-μX)(Y-μY))/(n-1)其中,Σ表示求和运算。

相关系数矩阵是通过协方差矩阵来计算的。

相关系数矩阵的每个元素都是两两随机变量之间的相关系数。

相关系数是用来衡量两个随机变量之间的线性关系强度的,取值范围为-1到1。

相关系数为1表示两个随机变量完全正相关,为-1表示两个随机变量完全负相关,为0表示两个随机变量不相关。

相关系数的计算公式如下:ρ(X,Y) = Cov(X,Y)/(σX * σY)其中,ρ表示相关系数,Cov表示协方差,σ表示标准差。

相关系数矩阵的计算可以通过协方差矩阵和标准差来进行。

首先,通过协方差矩阵计算每个随机变量的标准差,然后使用标准差来计算相关系数。

相关系数矩阵具有以下性质:1. 相关系数矩阵是一个对称矩阵,对角线上的元素都是1。

2. 相关系数矩阵的每个元素的取值范围都在-1到1之间。

3. 相关系数矩阵的每个元素的绝对值越接近1,表示两个随机变量之间的线性关系越强。

在实际应用中,协方差矩阵和相关系数矩阵经常用于分析随机变量之间的关系。

例如,在金融领域中,可以使用协方差矩阵和相关系数矩阵来分析不同股票之间的相关性,以便构建投资组合。

在数据分析中,可以使用相关系数矩阵来筛选出与某个变量相关性较强的变量,从而进行特征选择。

相关系数 协方差 标准差

相关系数协方差标准差相关系数、协方差和标准差是统计学中常用的三个概念,它们在数据分析和研究中起着重要的作用。

本文将分别介绍这三个概念的定义、计算方法和实际应用,帮助读者更好地理解它们在统计学中的意义和作用。

相关系数是用来衡量两个变量之间线性关系密切程度的统计量。

它的取值范围在-1到1之间,当相关系数为1时,表示两个变量呈完全正相关,即一个变量的增加伴随着另一个变量的增加;当相关系数为-1时,表示两个变量呈完全负相关,即一个变量的增加伴随着另一个变量的减少;当相关系数为0时,表示两个变量之间没有线性关系。

相关系数的计算方法是利用协方差和两个变量的标准差来进行计算,通常采用皮尔逊相关系数公式进行计算。

相关系数的应用非常广泛,例如在金融领域中用来衡量不同证券之间的相关性,帮助投资者进行资产配置和风险控制。

协方差是衡量两个变量总体误差的统计量,它可以反映两个变量的变化趋势是否一致。

协方差的计算方法是两个变量对应数值的乘积的平均值减去两个变量的均值的乘积,其取值范围是负无穷到正无穷。

当协方差大于0时,表示两个变量呈正相关,即一个变量的增加伴随着另一个变量的增加;当协方差小于0时,表示两个变量呈负相关,即一个变量的增加伴随着另一个变量的减少;当协方差等于0时,表示两个变量之间没有线性关系。

协方差的应用也非常广泛,例如在经济学中用来衡量不同经济指标之间的关联程度,帮助分析经济走势和预测未来发展趋势。

标准差是衡量一个数据集合的离散程度的统计量,它可以反映数据的波动情况。

标准差的计算方法是将每个数据与平均值的差的平方求和后除以数据个数再开方,其取值范围大于等于0。

标准差越大,表示数据的波动越大;标准差越小,表示数据的波动越小。

标准差的应用也非常广泛,例如在财务管理中用来衡量投资组合的风险水平,帮助投资者进行风险控制和资产配置。

综上所述,相关系数、协方差和标准差是统计学中常用的三个概念,它们在数据分析和研究中有着重要的作用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ρ XY
Cov( X ,Y ) D( X ) D(Y )
称为随机变量 X 与 Y 的相关系数 .
3. 协方差的计算公式
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y ); ( 2) D( X Y ) D( X ) D(Y ) 2 Cov( X ,Y ).
协方差
2. 定义
( X , Y )是二维随机变量 ,量 E{[ X E ( X )][Y E (Y )]} 称为随机变量X 与 Y 的协方差. 记为 Cov( X , Y ), 或 XY ,即 C ov( X , Y ) E{[ X E ( X )][Y E (Y )]}.


1
解:E ( X )
x dx dy 0 2 1 - 1-x + 同理 E (Y ) ypY ( y )dy - yp ( x, y )dxdy 0
1-x 2

xp X ( x) dx




xp( x, y )dydx
2 2 σ1
, x ,
( y μ2 ) 2
2 2σ 2
2 σ 2
, y .
2 2 E ( X ) μ1 , E (Y ) μ2 , D( X ) σ1 , D(Y ) σ 2 .
而 Cov( X , Y ) ( x μ1 )( y μ2 ) p( x , y ) d x d y
证明 (1 ) Cov( X , Y ) E {[ X E ( X )][ Y E (Y )]}
E[ XY YE ( X ) XE (Y ) E ( X ) E (Y )]
E ( XY ) 2 E ( X ) E (Y ) E ( X ) E (Y ) E ( XY ) E ( X ) E (Y ).

E ( XY )





xyp( x, y ) dxdy 1 dx -
1
1-x 2 1-x
2
xy

dy 0

Cov ( X , Y ) E ( XY ) E ( X ) E (Y ) 0
1-x 2 1 + - 1-x2 dy, |x | 1 p ( x ) 而 X xp ( x, y )dy = - 0, 其它 2 1 x 2 , |x | 1 其它 0, 2 2 1 y , |y | 1 p ( x ) 同理可求 Y 其它 0,
σ 1σ 2 1 ρ ue 2 2 2 , 2 u2 2 u2 t 2 2 2
dtdu
ρσ1σ 2 2 故有 Cov( X ,Y ) ρσ 1 σ 2 .
d u te
t2 2
dt

e
1 2 σ 1σ 2 1 ρ
( x μ1 )2 2 2 σ1 2
( x μ1 )( y μ2 )
2


e
y μ2 1 x μ1 ρ σ1 2 ( 1 ρ 2 ) σ 2
d yd x
x μ1 1 y μ2 x μ1 , , u 令t ρ 2 σ1 σ1 1 ρ σ2
4. 协方差的性质
(1) Cov( X , X ) D( X ); (2) Cov( X , Y ) Cov(Y , X ); (3) Cov( aX , bY ) ab Cov( X , Y ) a, b为常数;
(4) Cov( X 1 X 2 , Y ) Cov( X 1, Y ) Cov( X 2 , Y ).
量 E {[ X E ( X )][Y E (Y )]} 称为随机变量 X 与 Y 的协方差 , 记为 Cov( X ,Y ), Cov ( X ,Y ) E {[ X E ( X )][Y E (Y )]} 称 XY 关系数 . Cov( X ,Y ) 为随机变量 X 与 Y 的相 D( X ) D(Y )
Cov( X ,Y ) 1 2 2 ( σ σ 1 ρ tu ρσ σ u )e 1 2 1 2 2 2 2 u t ρσ1σ 2 2 u e 2 d u e 2 d t 2
协方差的性质
1. Cov ( X ,Y ) Cov (Y , X ). 2. Cov( aX , bY ) abCov( X ,Y ). ( a , b 为常数 ) 3. Cov( X 1 X 2 ,Y ) Cov( X 1 ,Y ) Cov( X 2 ,Y ).
4. Cov( X , X ) = D( X ).
即X , Y 不相关. 则 XY 0,

p ( x, y ) p X ( x) pY ( y ),即X , Y 不相互独立.
2 2 例2 设( X ,Y ) ~ N ( μ1 , μ2 , σ 1 ,σ2 , ρ), 试求 X 与 Y 的
相关系数 . 解 由 p( x, y)
1 2σ1σ2 1 ρ
相关系数的意义
当 ρ XY 较大时 , 表明 X , Y 的线性关系较密切.
当 ρ XY 较小时, X , Y 线性相关的程度较差.
当 ρXY = 0 时,称 X 和 Y 不相关.
第4.3节
协方差及相关系数
一、协方差与相关系数的 概念及性质 二、相关系数的意义 三、协方差矩阵 四、小结
一、协方差与相关系数的概念及性质
1. 问题的提出
若随机变量 X 和 Y 相互独立 , 那么 D( X Y ) D( X ) D(Y ). 若随机变量 X 和 Y 不相互独立 D( X Y ) ? D( X Y ) E ( X Y )2 [ E ( X Y )]2 D( X ) D(Y ) 2 E {[ X E ( X )][Y E (Y )]}.
( 2) D( X Y ) E {[( X Y ) E ( X Y )]2 }
E {[( X E ( X )) (Y E (Y )]2 }
E {[ X E ( X )]2 } E {[Y E (Y )]2 } 2 E {[ X E ( X )][Y E (Y )]} D( X ) D(Y ) 2 Cov( X ,Y ).
2o 3o
40 X , Y 不相关 D( X Y ) D( X ) D(Y ). (2) 不相关与相互独立的关系
相互独立 不相关
例1 若X,Y的联合概率密度函数
试验证:X,Y不相,但不是相互独立的.
1 , x 2 y 2 1 p ( x, y ) 0, 其它
| XY | =1 D (Y bX )=0
由方差的性质(4) D (Y bX )=0 P{Y bX a} 1, 其中a E (Y bX )
ρXY 1 的充要条件是, 存在常数 a, b 使
P{Y a bX } 1.
二、相关系数的意义
1. 相关系数的意义
于是 XY
Cov( X ,Y ) . D( X ) D(Y )
结论 (1)二维正态分布密度函数 中, 参数 ρ 代表了 X
与 Y 的相关系数 ; ( 2)二维正态随机变量 X 与 Y 相关系数为零 等价于 X 与 Y 相互独立.
四、内容小结
协方差与相关系数的定义
2
exp
1 ( x μ1 )2 ( x μ1 )( y μ2 ) ( y μ2 )2 2ρ 2 2 2 σ1σ2 σ2 2(1 ρ ) σ1 2
pX ( x )
pY ( y ) 1
1 e 2 σ1
e


( x μ1 )
XY 当=b= 时 XX
2 XX 2 XY YY
2 XY D (Y bX ) = YY (1 ) XX YY
2 YY (1 XY )
由方差的非负性知, 2 1- XY 0, 即| XY | 1 2 (2)由D(Y bX ) YY (1 XY )知
当 ρXY 较大时 ,表明 X ,Y 的线性关系较密切.
当 ρXY 较小时 , X ,Y 线性相关的程度较差 .
定义:当ρ XY 0 时, 称 X 和 Y 不相关.
2. 注意
(1) 不相关的充要条件
1
o
X , Y 不相关 ρXY 0; X , Y 不相关 Cov( X ,Y ) 0; X , Y 不相关 E ( XY ) E ( X ) E (Y ).
5. 相关系数的性质
(1) ρXY 1. ( 2) ρXY 1 的充要条件是 , 存在常数 a , b 使 P {Y a bX } 1.
证明(1)对任意实数,有 D(Y X ) D(Y ) D( X ) 2Cov(Y , X )
D(Y ) 2 D( X ) 2 Cov(Y , X )
相关文档
最新文档