概率统计：数学期望、方差、协方差、相关系数、矩

合集下载

概率论与数理统计 --- 第四章{随机变量的数字特征} 第一节：数学期望

32 30 17 21 0 1 2 3 1.27 100 100 100 100
这个数能否作为 X的平均值呢？
若统计100天,
可以想象, 若另外统计100天, 车工小张不出废品, 这另外100天每天的平均废品数也不一定是1.27. 一般来说, 若统计n天 ,
(假定小张每天至多出三件废品)
又设飞机机翼受到的正压力W 是V 的函数 : W kV 2 ( k 0, 常数), 求W 的数学期望.
解: 由上面的公式
1 1 2 E (W ) kv f (v )dv kv dv ka a 3 0
2 2

a
例7 设二维连续型随机变量（X , Y）的概率密度为
A sin( x y ) 0 x , 0 y f ( x, y) 2 2 0 其它 (1)求系数A , ( 2)求E ( X ), E ( XY ).
x f ( x )x
i i i
i
阴影面积近似为
这正是:

f ( xi )xi

x f ( x )dx
的渐近和式.
小区间[xi, xi+1)
定义: 设X是连续型随机变量, 其密度函数为 f (x), 如果积分: xf ( x )dx
概率论

绝对收敛, 则称此积分值为X的数学期望, 即:
2. 设二维连续型随机变量 (X, Y) 的联合概率密度为 f (x, y), 则： E ( X )
E (Y )

xf X ( x )dx

yfY
( y )dy

xf ( x , y )dxdy,

《概率论与数理统计》(46学时)课程教学大纲

《概率论与数理统计》（46学时）课程教学大纲一、课程的基本情况课程中文名称：概率论与数理统计课程英文名称：Probability Theory and Mathematical Statistics课程编码：0702003课程类别：学科基础课课程性质：必修总学时：46 讲课学时：46 实验学时：0学分：2.5授课对象：本科相关专业前导课程：《高等数学》《线性代数》二、教学目的概率论与数理统计是研究随机现象统计规律性的数学学科，是理工科各专业的一门重要的学科基础课。

通过本课程的学习，使学生掌握概率论与数理统计的基本概念，了解它的基本理论和方法，从而使学生初步掌握处理随机现象的基本思想和方法，培养学生运用概率统计方法分析和解决实际问题的能力。

同时，也为一些后续课程的学习提供必要的基础。

三、教学基本要求第一章概率论的基本概念1.1 随机试验1.2 样本空间、随机事件1.3 频率与概率1.4 等可能概型（古典概型）1.5 条件概率1.6 独立性基本要求：1. 理解随机试验、样本空间、随机事件的概念并掌握事件的关系与运算2. 掌握概率的定义与基本性质3. 理解古典概型的概念，掌握古典概率的计算方法4. 理解条件概率的定义，熟练掌握乘法定理、全概率公式与贝叶斯公式并会灵活应用5. 理解事件独立性的概念，熟练掌握相互独立事件的性质及有关概率的计算重点与难点：1. 重点：随机事件；概率的基本性质及其应用；乘法定理、全概率公式与贝叶斯公式事件的独立性2. 难点：概率的公理化定义、条件概率概念的建立、全概率公式与贝叶斯公式的应用第二章随机变量及其分布2.1 随机变量2.2 离散型随机变量及其分布律2.3 随机变量的分布函数2.4 连续型随机变量及其概率密度2.5 随机变量的函数的分布基本要求：1. 理解随机变量的概念；掌握离散型随机变量和连续型随机变量的描述方法2. 掌握分布律、分布函数、概率密度函数的概念及性质；掌握由概率分布计算相关事件的概率的方法3. 熟练掌握二项分布、泊松（Poisson ）分布、正态分布、指数分布和均匀分布，特别是正态分布的性质并能灵活运用；熟练掌握伯努利概型概率的计算方法4. 熟练掌握一些简单的随机变量函数的概率分布的求法重点与难点：1. 重点：随机变量、分布律、密度函数和分布函数的概念；二项分布、均匀分布的概念和性质2. 难点：二项分布的推导及应用；随机变量函数的概率分布第三章多维随机变量及其分布 3.1 二维随机变量 3.2 边缘分布 3.3 条件分布3.4 相互独立的随机变量3.5 两个随机变量的函数的分布基本要求：1. 正确理解二维随机变量的定义，掌握二维随机变量的联合分布律、联合分布函数、联合概率密度函数及条件分布的概念2. 熟练掌握由联合分布求事件的概率，求边缘分布及条件分布的基本方法3. 理解随机变量独立性的概念，掌握随机变量独立性的判别方法4. 了解求二维随机变量函数分布的基本思路，会求,max{,},min{,}X Y X Y X Y 的分布重点与难点：1. 重点：由联合分布求概率，求边缘分布及条件分布的方法2. 难点：求离散型随机变量联合分布律的方法，条件密度的导出，随机变量函数的分布第四章随机变量的数字特征 4.1 数学期望 4.2 方差4.3 协方差及相关系数 4.4 矩、协方差矩阵基本要求：1. 掌握随机变量及随机变量函数的数学期望的计算公式，熟悉数学期望的性质并能灵活运用2. 掌握方差的概念和性质；熟悉二项分布、泊松分布、正态分布、指数分布和均匀分布的数学期望和方差；了解切比雪夫（Chebyshev ）不等式3. 掌握协方差和相关系数的定义和性质，并会灵活应用4. 掌握矩、协方差矩阵的定义重点与难点：1. 重点：数学期望、方差、相关系数与协方差的计算公式及性质2. 难点：随机变量函数的数学期望的计算，利用数学期望的性质计算数学期望，相关系数的含义第五章大数定律及中心极限定理5.1 大数定律5.2 中心极限定理基本要求：1. 掌握依概率收敛的概念及贝努利大数定律和契比雪夫大数定律2. 掌握独立同分布的中心极限定理和德莫佛－拉普拉斯(De Moivre-Laplace)极限定理3. 掌握应用中心极限定理计算有关事件的概率近似值的方法重点与难点：1. 重点：用中心极限定理计算概率的近似值的方法2. 难点：依概率收敛的概念第六章样本及抽样分布6.1 随机样本6.2 抽样分布基本要求：1. 理解总体、个体、样本容量、简单随机样本以及样本观察值的概念2. 理解统计量的概念；熟悉数理统计中最常用的统计量（如样本均值、样本方差）的计算方法及其分布χ-分布，t-分布，F-分布的定义并会查表计算3. 掌握24. 熟悉正态总体的某些常用统计量的分布并能运用这些统计量进行计算重点与难点：χ-分布, t-分布, F-分布的定义与分位点的查表；正态总体常用统计量的分布1. 重点：2χ-分布, t-分布, F-分布的定义与分位点的查表2. 难点：2第七章参数估计7.1 点估计7.3 估计量的评选标准7.4 区间估计7.5 正态总体均值与方差的区间估计7.7 单侧置信区间基本要求：1. 理解参数的点估计(矩估计、最大似然估计)的计算方法2. 掌握参数点估计的评选标准：无偏性，有效性和相合性3. 理解参数的区间估计的概念，熟悉对单个正态总体和两个正态总体的均值与方差进行区间估计的方法及步骤重点与难点：1. 重点：点估计的矩法、最大似然估计法；正态总体参数的区间估计2. 难点：最大似然估计法，两个正态总体的参数的区间估计四、课程内容与学时分配五、教材参考书教材：盛骤谢式千潘承毅《概率论与数理统计》（第三版）高等教育出版社2001. 参考书：[1] 茆诗松《概率论与数理统计教程》（第一版）高教出版社2004.[2] 王展青李寿贵《概率论与数理统计》（第一版）科学出版社2000.六、教学方式和考核方式1.教学方式：以课堂讲授为主，辅以答疑、课后作业。

概率统计第3章随机变量的数字特征1节

2020/9/21
3
1. 随机变量的数学期望
(1)设有n个数x1，x2，，xn ,那么这n个数的算术平均
x
x1
x2
n
xn
i
n 1
xi
1 n
(2)这n 个数有相同,，不妨设其中有 ni个取值为 xi，i 1,, k,
其均值应为 1
n
k
ni xi
i 1
k i 1
ni n
xi
以数值xi出现的频率为权重做加权平均
2020/9/21
12
(2)随机变量函数数学期望的计算方法1 (定义法): g(X)是随机变量, 按照数学期望的定义计算Eg(X). 关键: 由X的分布求出g(X)的分布. 难点: 一般g(X)形式比较复杂的, 很难求出其分布.
2020/9/21
13
方法2 (公式法):
定理设X是一个随机变量, Y g(X), 则
k1 k1
2020/9/21
17
(4) 若X与Y相互独立，E( X )与E(Y )存在，则E(XY ) E(X )E(Y ).
证：仅就连续随机变量情形
EXY xyf x, ydxdy
xy f X x f Y y dxdy
xf
X
x
dx
y fY y dy
2020/9/21
15
补充：函数
( ) x 1exdx 0
函数有下列结论：
(1) ( 1) ();
(2) Γ(n 1) n !; (3) (1) (2) 1, (1) .
2
0
y12e y1 dy1
(3) 2! 2
2020/9/21
16
二、数学期望的性质

概率论与数理统计第四章

DX=Var(X)= E(X EX )2 。 DX 称为标准差。
DX E( X EX )2 (xi EX )2 pi ，离散型。
i 1
DX (x EX )2 f (x)dx ，
连续型。
II)方差的性质
DX E( X EX )2
1) DX0，若 C 是常数，则 DC=0
2) D(CX ) C 2DX
n!
p k 1q nk
k 1
n(n 1)
p2
(k
n
1)!(n
k )!
(n
2)!
k1 (k 1)!(n k)!
p q k 2 n2(k 2) np
k2 (k 2)!(n 2 (k 2))!
n(n 1) p 2 ( p q) n2 np n 2 p 2 np 2 np
DX EX 2 (EX )2 n2 p2 n p2 np n2 p2 np(1 p) npq
第四章随机变量的数字特征
§1 数学期望与方差 §2 协方差、相关系数与矩
1、数学期望定义
(1) 离散型
设离散型随机变量 X 的分布律为： P{X xk } pk ， k 1,2, ，
若级数 xk pk 绝对收敛， i 1
则称级数 xk pk 的和为随机变量 X 的数学期望。 i 1
记为 EX，即 EX= xk pk 。 k 1
3) D(aX bY ) a2DX b2DY 2abE( X EX )(Y EY ) ，
a，b 是常数。若 X，Y 独立，则 D(aX bY ) a2DX b2DY
证：D(aX bY) E[aX bY E(aX bY)]2
E[a(X EX ) b(Y EY)]2
方法2：

概率论与数理统计课程教学大纲

概率论与数理统计课程教学大纲编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（概率论与数理统计课程教学大纲）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为概率论与数理统计课程教学大纲的全部内容。

《概率论与数理统计》课程教学大纲（2002年制定 2004年修订）课程编号：英文名:Probability Theory and Mathematical Statistics课程类别：学科基础课前置课:高等数学后置课：计量经济学、抽样调查、试验设计、贝叶斯统计、非参数估计、统计分析软件、时间序列分析、统计预测与决策、多元统计分析、风险理论学分：5学分课时：85课时修读对象：统计学专业学生主讲教师：杨益民等选定教材：盛骤等，概率论与数理统计,北京：高等教育出版社，2001年(第三版）课程概述：本课程是统计学专业的学科基础课,是研究随机现象统计规律性的一门数学课程，其理论及方法与数学其它分支、相互交叉、渗透，已经成为许多自然科学学科、社会与经济科学学科、管理学科重要的理论工具。

由于其具有很强的应用性,特别是随着统计应用软件的普及和完善，使其应用面几乎涵盖了自然科学和社会科学的所有领域。

本课程是统计专业学生打开统计之门的一把金钥匙,也是经济类各专业研究生招生考试的重要专业基础课。

本课程由概率论与数理统计两部分组成。

概率论部分侧重于理论探讨，介绍概率论的基本概念，建立一系列定理和公式，寻求解决统计和随机过程问题的方法。

其中包括随机事件和概率、随机变量及其分布、随机变量的数字特征、大数定律和中心极限定理等内容；数理统计部分则是以概率论作为理论基础，研究如何对试验结果进行统计推断。

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲英文名称：Probability and statistics课程代码：221101008课程类别：专业基础课课程性质：必修开课学期：第三学期总学时： 54学时总学分：3考核方式：闭卷先修课程：高等数学适用专业：经济学专业一、课程简介概率论与数理统计是经济学专业的一门专业基础课。

概率论与数理统计是研究不确定性现象的数量规律性的一门学科，是对随机现象进行定量分析的重要工具，它在现代科学技术中占有很重要的地位，是研究自然现象、处理现代工程技术、解决科研和生产实际问题的一种有力的数学工具，已被广泛应用于每一学科领域、工农业生产和经济管理部门中。

开设本课程的目的在于，通过本课程的学习，使学生初步掌握概率论与数理统计等方面的基础知识，了解它的基本理论与基本方法，培养学生的抽象思维能力、逻辑推理能力、数学建模与实践能力，注意培养学生的自学能力，注意理论联系实际，不断提高学生的综合素质以及运动所学知识解决实际问题的能力，同时使学生了解概率论与数理统计在经济方面的应用，具备概率思想分析实际随机问题的能力，为专业课程的学习打下基础。

学生在进入本课程学习之前，应学过高等数学课程，该课程的学习为本课程提供了必须的数学基础知识。

本课程学习结束后，学生可具备进一步学习相关课程的理论基础。

本课程总54学时，其中理论课47学时，习题课7学时，考核方式为闭卷考试，根据平时考勤成绩、习题作业成绩、阶段性单元检测成绩及闭卷期末考试成绩综合给予最终成绩评定。

二、课程目标及其对毕业要求的支撑目标1人文素养目标：教育学生认真学习马克思列宁主义、毛泽东思想、邓小平理论、“三个代表”、科学发展观和新时代中国特色社会主义的重要思想；忠诚党的教育事业和体育事业，培养学生互教互学、团结友爱、共同提高的集体主义精神；培养学生有严格组织纪律性，吃苦耐劳和勇敢顽强的意志品质。

目标2理论知识培养目标：使学生掌握概率论与数理统计的基本理论和基础知识，初步掌握处理随机事件的基本思想和方法。

概率论与数理统计第四章

)
(
)
(
)
,
(
Y
D
X
Dபைடு நூலகம்
Y
X
Cov
xy
=
r
=4[E(WV)]2-4E(W2)×E(V2)≤0
01
得到[E(WV)]2≤E(W2)×E(V2). →(8)式得到证明.
02
设W=X-E(X),V=Y-E(Y),那么
03
其判别式
由(9)式知, |ρ xy|=1 等价于 [E(WV)]2=E(W2)E(V2). 即 g(t)= E[tW-V)2] =t2E(W2)-2tE(WV)+E(V2) =0 (10) 由于 E[X-E(X)]=E(x)-E(X) =0, E[Y-E(Y)]=E(Y)-E(Y) =0.故 E(tW-V)=tE(W)-E(V)=tE[X-E(X)]-E[Y-E(Y)]=0 所以 D(tW-V)=E{[tW-V-E(tW-V)]2}=E[(tW-V)2]=0 (11) 由于数学期望为0,方差也为0,即(11)式成立的充分必要条件是 P{tW-V=0}=1
随机变量X的数学期望是随机变量的平均数.它是将随机变量 x及它所取的数和相应频率的乘积和.
=
(1)
)
2
3
(
)
(
-
=
ò
µ
µ
-
dx
x
x
E
j
x
可见均匀分布的数学期望为区间的中值.
例2 计算在区间[a,b]上服从均匀分布的随机变量的数学期望
泊松分布的数学期望和方差都等于参数λ.
其他
02
f(x)=
01
（4-6）
03
（4）指数分布

概率论与数理统计第4章随机变量的数字特征

解：
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形．
定理4.2 设Z是随机变量X，Y的函数Z = g(X，Y)， g是连续函数．
(1) 若(X，Y)是二维离散型随机变量，其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解：由于 P{ X k} k e ，k = 0，1，2，…，
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量，其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2)， 4 x 4.2，
0，
其它.
求pH值X的数学期望E(X).
解：
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

概率统计：数学期望、方差、协方差、相关系数、矩
摘要：最近在学习机器学习/数据挖掘的算法,在看一些paper的时候经常会遇到以前学过
的数学公式或者名词,又是总是想不起来,所以在此记录下自己的数学复习过程,方便后面查阅。

1：数学期望
数学期望是随机变量的重要特征之一,随机变量X的数学期望记为E(X),E(X)是X的算术平均的近似值,数学期望表示了X的平均值大小。

∙当X为离散型随机变量时,并且其分布律为P(X=x k) ＝pk ,其中k=1,2,…,n；
则数学期望（要求绝对收敛）.
∙当X为连续型随机变量时,设其概率密度为f(x),则数学期望为
（要求绝对收敛）.
2: 方差
数学期望给出了随机变量的平均大小,现实生活中我们还经常关心随机变量的取值在均值周
围的散布程度,而方差就是这样的一个数字特征。

设X是随机变量,并且E{[X-E(X)2]}存在,则称它为X的方差,记为D(X)。

∙当X为离散型时,D(x) = .
∙当X为连续型时,D(x) = .
方差的算术平方根为X的标准差。

另外,D(X) = E{[X-E(X)2]} 经过化解可得D(X) = E(X2) – [E(X)]2 .我们一般计算的时候常用这个式子。

3：协方差
对于二维的随机变量(X,Y)，我们还要讨论它们的相互关系,协方差就是一个这样的数字特征。

因为E{[X-E(X)][Y-E[Y]]} = E(XY) – E(X)E(Y).
又当X,Y相互独立的时候E(XY) = E(X)E(Y).这意味着若E{[X-E(X)][Y-E[Y]]} ≠ 0 ,则X与Y是存在一定关系的。

我们把E{[X-E(X)][Y-E[Y]]} 称为随机变量X与Y的协方差。

记为Cov(X,Y).
即：Cov(X,Y) = E{[X-E(X)][Y-E[Y]]}
4：相关系数
协方差在某种意义上是表示了两个随机变量间的关系,但是Cov(X,Y)的取值大小与X,Y的量纲有关,不方便分析,所以为了避免这一点,我们用X,Y的标准化随机变量来讨论。

我们称为随机变量X与Y的相关系数,记为(无量纲)。

其中为X,Y的协方差即Cov(X,Y),D(X),D(Y)分别是X,Y的方差且D(X)>0，
D(Y)>0。

关于相关系数，我们有下面的性质：
∙|| ≤ 1
∙|| = 1 的充要条件是X 与Y 以概率1 存在线性关系，即P{Y = a +bX} = 1, a,b是常数。

∙若 = 0,则说明X,Y不相关并且X与Y不存在线性关系。

∙若随机变量X,Y相互独立，则 = 0，即X,Y不相关。

注意：两个不相关的随机变量，不一定相互独立,有一特殊情况是,当随机变量X,Y服从二维正态分布的时候,独立与不相关等价。

∙不相关只能说明X与Y不存在线性关系。

∙独立说明X与Y既不存在线性关系,也不存在非线性关系。

5：矩
矩(moment)是最广泛的一种数字特征,常用的矩有两种：原点矩和中心矩。

原点矩：
对于正整数k，称随机变量X的k次幂的数学期望为X的k阶原点矩：
即E(X k) ,k=1,2,…n.
数学期望就是一阶原点矩。

中心矩：
对于正整数k，称随机变量X与E（X）差的k次幂的数学期望为X的k阶中心矩：即
E{X-E[X K]},K=1,2,…n.
方差就是二阶中心矩。

概率统计：数学期望、方差、协方差、相关系数、矩

概率论与数理统计 --- 第四章{随机变量的数字特征} 第一节：数学期望

《概率论与数理统计》(46学时)课程教学大纲

概率统计 第3章随机变量的数字特征1节

概率论与数理统计第四章

概率论与数理统计课程教学大纲

《概率论与数理统计》课程教学大纲

概率论与数理统计第四章

概率论与数理统计 第4章 随机变量的数字特征

概率统计第3章随机变量的数字特征1节

概率论与数理统计第4章随机变量的数字特征