第二章 随机向量
02多维随机向量

F(x1, x 2 ,
xn )
x1
xn
f
( y1,
y2 ,
, yn )dy1dy2
dyn.
这里的 f (x1, x2, , xn ) 称为联合密度函数,满足条件:
f (x1, x2, , xn ) 0,
f (x1, x2, , xn )dx1dx2
f1,2, ,k (x1, x2, , x k ) f (x1, x2, , xn )dxk1dxk2 dxn
如 果 F (x1, x 2 , xn ) 是 离 散 型 的 , 则
F (x1, x 2 , xk , , , ) 也是离散型的,其边缘
概率分布为
P( X1 x1, X 2 x2, , X k xk )
则称 X1, , X n 是相互独立的。
如果 Xi 的分布函数为Fi (x), 它们的联合分布函数为
F (x1, x 2 , xn ) ,则相互独立性等价于对一切 x1, x 2 , xn ,
成立
F (x1, x 2 , xn ) F1(x1)F2 (x2 ) Fn (xn ).
注意:在独立条件下,由随机变量的边缘分布可惟一确
( X ,Y ) ~ N ( μ1, μ2 ,σ12 ,σ22 , ρ)
9
二维正态分布的图形
10
二、边缘分布
设 F (x1, x 2 , xn ) 为 n 元分布函数,任意保留 k(0 k n)
个 xi , 例如 x1, x2 , xk ,而令其它的xj 都趋向于 ,即
lim F(x1, x 2 , xk ,, ,)
27
条件概率 链规则(Chain Rule)
第二章随机向量总结

fY ( y) f 2 ( y) f ( x, y)dx
事实上, (1)f1(x)≥0, (2) 若a<b,则
b
P{a<X<b}= P{a<X<b,-∞<Y<+∞}= dx f ( x, y )dy
返回
例2.1.2.设随机变量Y~N(0,1),令
0, | Y | 1
0, | Y | 2
X 1 1,
|Y
|
, 1
X
2
1,
| Y | 2
求(X1,X2)的联合概率分布。
解:(X1,X2)的取值数对为(0,0),(0,1),(1,0),(1,1),
P(X1=0,X2=0)=P(|Y|≥1,|Y|≥2) =P(|Y|≥2) =1-P(|Y|<2) =-2Φ(2)=0.0455
i
一般地,记: P(X=xi)
Pi .
P(Y=yj)
P. j
分布表如下:
返回
Y X
y1 y2 y j
p. i.
x1 p11 p12 p1 j p1. x2 p21 p22 p2 j p2.
xi pi1 pi2 pij pi.
返回
二维联合概率分布区域图: Y
2
1
P(X≤1,Y≤1}
-1
0
P{X≥0,Y≤1}
1
X
返回
3、边缘概率分布
(1) 定义:随机向量X=(X1,X2,…,Xn)中每一个Xi的分布,称为X关
于Xi的边缘分布。
(2) 边缘分布列 对于离散型随机向量(X,Y),分量X,Y的分布列称为边缘分布列。
多元统计进度表(2007-2008)

15
2
总复习
时数
教材
及主要参考书
理论课
习题课
实验课程设计
讲课时数
自学时数
理论课授课内容
作业量
课堂作业
课外作业
课内作业数
实验名称
1
1
2
1.1定义
1.2矩阵的运算
1.3行列式
1.4矩阵的逆
1.5矩阵的秩
《应用多元分析》上海财经大学出版社
作者王学民
2
1
2
1.6特征值和特征向量
1.7正定矩阵和非负定矩阵1.8特征值的极值问题
2007-2008学年第二学期
信息与计算科学专业(本科)多元统计分析进度表
序号
内容
备注
1
1.1定义1.2矩阵的运算1.3行列式
1.4矩阵的逆1.5矩阵的秩
第一章矩阵代数
2
1.6特征值和特征向量1.7正定矩阵和非负定矩阵1.8特征值的极值问题
3
2.1一元分布
第二章随机向量
4,5,6
2.2多元分布2.3矩2.4随机向量的变换
5.2一元线性回归分析
16
9
2
5.3一元非线性回归分析
17
9
2
5.4多元线性回归分析
18
10
2
6.1引言
6.2距离判别
19
10
11
4
6.3贝叶斯判别
20
11
2
6.4费希尔判别
21
12
2
7.1引言
7.2距离和相似系数
22
12
13
4
7.3系统聚类法
23
13
随机向量及其分布【概率论及数理统计PPT】

n 维随机向量及其分布 由于从二维推广到n 维一般无实质性的 困难,我们重点讨论二维随机变量 .
二、二维随机向量及其分布函数
设随机试验E的样本空间是Ω。 X=X()和Y=Y()是定义在Ω上的随机变 量,由它们构成的向量(X,Y),称为二维随机向 量。 二维随机向量(X,Y)的性质不仅与X及Y的 性质有关,而且还依赖于X和Y的相互关系,因 此必须把(X,Y)作为一个整体加以研究。 为此,首先引入二维随机向量(X,Y)的分 布函数的概念。
说明
由上面的几何解释,易见: 随机点(X,Y)落在矩形区域:
x1<x≤x2,y1<y≤y2 内的概率为:
P{x1<X≤x2 ,y1<Y≤y2} =F(x2,y2)-F(x2,y1)F(x1,y2)+F(x1,y1)
其中:
这里我们介绍了二维随机向量的概念、 二维随机向量的分布函数及其性质。
二维随机向量也分为离散型和连续型, 下面我们分别讨论它们。
求:(1)X,Y的边缘分布;
(2)X+Y的概率分布.
解:(1)由分析得:
X -1
0
1
P 0.25 0.4 0.35
Y
0
1
2
P 0.25 0.5 0.25
(2)X+Y的取值为-1,0,1,2,3,
X+Y -1 0 1 2 3
P(X+Y=-1)=P(X=-1,Y=0)=0.05
P 0.05 0.2 0.4 0.3 0.05
=1
称(X,Y)服从区域D上的均匀分布。
例6. 若(X,Y)~
试求:(1)常数 A;(2) P{ X<2, Y<1}; (3) P(X≤x,Y≤y); (4)P{(X,Y)∈D},其中D为 2x+3y≤6.
第二讲 随机向量

E ( x11 ) E ( x12 ) E ( x1q ) E ( x ) E ( x ) E ( x ) 21 22 2q E ( X) E ( x ) E ( x ) E ( x ) p1 p2 pq
特别当时 q 1 ,便可得到随机向量 x ( x1 , x2 ,, x p )
格单调,其反函数x=(y)有连续导数,则y的概率 密度函数为
f y ( y) f x ( ( y)) | ( y) |
其中y的取值范围与x的取值范围相对应。 例 函数 设随机变量x服从均匀分布U(0,1),即密度
1 f x ( x) 0 0 x 1 其他
求y ln x( 0)的密度函数。
特别:若 y Ax b,其中 A 为 p 阶可逆常数
矩阵,b 为 p 维常数向量,则
J (x y ) A 1 | A |1
的数学期望 E (x) ( E ( x1 ), E ( x2 ),, E ( x p ))
(三)随 ii
i 1 p
2、协方差阵的分解: E ( XX ) 3、total variance :
| 4、generalized variance : |
x1 y 1 x2 ( x1 , x2 ,, x p ) J y1 ( y1 , y2 ,, y p ) x p y1
x1 y2 x2 y2 x p y2
x1 y p x2 y p x p y p
(四)随机向量X和Y的(互)协方差阵
' 注:1、非对称: X ,Y Y , X
' 2、协方差阵的分解: X ,Y E( XY ) X Y
随机变量(向量)及其概率分布

Pa X b F (b) F (a) 例2.7 已知随机变量 X 的所有可能取值为0,1,2,取各值的 概率分别为0.4,0.3,0.3,试求随机变量的分布函数并作其
图像。 解:由题设随机变量的概率分布为 0 1 2 X pi 0.4 0.3 0.3 由分布函数的定义有 当 x 0 时, F ( x) P() 0; 当 0 x 1 时, F ( x) PX 0 0.4; 当1 x 2 时, F ( x) PX 0 PX 1 0.7; 当 x 2 时,F ( x) P() 1。 分布函数图像如图2.1所示
X pi
pk PX xk F ( xk ) F ( xk 0)
1 1/ 3
1 1/ 2
2 1/ 6
试求 P0 X 1.5 。 解:由随机变量 X 的分布列有
1 P0 X 1.5 PX 1 2
例2.9 设有一批产品20件,其中有3件次品,从中任意抽 取2件,用 X 表示抽取出2件产品中的次品数,求随机变量X 的分布律和“至少抽得一件次品”的概率。 解: X 的可能取值为 0,1,2。 于是,由古典概率有
国徽面在上面;有字面在上面 如果 X 1 表示国徽面在上面,X 0表示有字面在上面。 则试验结果的变量表示为: “国徽面在上面” X 1 ;“有字面在上面” X 0 特点:试验结果数量化了,试验结果与数建立了对应关 系。 1. Def 设随机试验 E 的样本空间为 ,如果对于每一个样本 点 ,均有唯一的实数X ( ) 与之对应,称X ( )为样本空 间 上的随机变量。 随机变量的三个特征: 1)它是一个变量; 2)它的取值随试验结果而改变; 3)随机变量在某一范围内取值,表示一个随机事件。 设 X 为一个随机变量,对于任意实数 x ,则集合X x是 随机事件,随着 x 变化,事件X x也会变化。 这说明该事 件是实变量 x的“函数”。
《应用多元分析》(第三版,前言、目录、参考文献)

前言多元统计分析是统计学中内容十分丰富、应用性极强的一个重要分支,它在自然科学、社会科学和经济学等各领域中得到了越来越广泛的应用,是一种非常重要和实用的多元数据处理方法。
本书此次又在第二版的基础上作了较大幅度的改写和扩充,使之更能适应当今统计教学的需要。
本教材主要是针对财经类院校的统计学和数理统计学专业的本科生而写的,也可作为其他各专业读者的多元统计分析教材或教学参考书。
整本书写得比较细致,便于自学,书中的绝大部分内容曾向上海财经大学统计学系的本科生和研究生分别讲授过十多届。
本教材有如下一些特点:(1)全书对数学基础知识的要求较低,只需读者掌握初步的微积分、线性代数和概率统计知识。
尽管如此,为便于非统计专业的读者也能顺利地阅读本书,书中前几个章节对矩阵代数及一元统计知识作了简单的回顾和介绍,其所述的预备知识内容对于本书的阅读基本上已足够了。
(2)本教材以简明和深入浅出的方式阐述了多元统计分析的基本概念、统计思想和数据处理方法,在充分考虑到适合财经院校学生使用的前提下进行了严谨的论述,有助于学生深刻地理解并掌握多元分析的基本思想方法。
(3)书中提供的许多例题和习题为读者展示了多元分析在社会科学和经济学等领域中的应用,每章的例题和习题安排侧重于对基本概念的理解和知识的实际应用,并不注重解题的数学技巧和难度。
为便于读者的学习(特别是自学),书后的附录一给出了习题参考答案及部分解答。
(4)本书与SAS软件紧密结合,在每一章后面都附有SAS的应用,这有利于将SAS软件更好地融入各章的内容中,使读者对多元分析的意义能够有贴切的体会,便于读者进入应用的领域。
全书共分十章。
第一章介绍了多元分析中常用的矩阵代数知识,这是全书的基础。
第二章至第四章介绍的基本上是一元统计推广到多元统计的内容,主要阐述了多元分布的基本概念和多元正态分布及其统计推断。
第五章至第十章是多元统计独有的内容,这部分内容具有很强的实用性,特别是介绍了各种降维技术,将原始的多个指标化为少数几个综合指标,便于对数据进行分析。
随机向量的特征函数

随机向量的特征函数
随机向量是由多个随机变量组成的向量。
在概率论和统计学中,随机向量是一个重要的研究对象。
特征函数是描述随机变量分布的一种方式,而随机向量的特征函数可以用来描述随机向量的分布。
随机向量的特征函数是一个多元复值函数,定义为所有分量的指数函数的乘积的期望值。
具体来说,如果随机向量X = (X1,
X2, ..., Xn),则其特征函数φ(t1, t2, ..., tn)定义为:φ(t1, t2, ..., tn) = E[exp(i(t1X1 + t2X2 + ... + tnXn))]
其中i是虚数单位。
特征函数的变量是一个n维向量(t1,
t2, ..., tn)。
随机向量的特征函数具有一些重要的性质。
首先,特征函数是复值函数,因此可以表示为实部和虚部的组合。
其次,特征函数具有唯一性,即如果两个随机向量的特征函数相同,则它们具有相同的分布。
此外,特征函数具有连续性和可微性等性质。
在实际应用中,随机向量的特征函数可以用来求解随机向量的矩、相关系数、协方差矩阵等统计量。
此外,特征函数还可以用于估计随机向量的分布,例如通过逆傅里叶变换将特征函数转换为概率密度函数。
总之,随机向量的特征函数是描述随机向量分布的一种常用工具,具有许多重要的性质和应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例2.3.3 Σ 0 x 的分量之间存在线性关系(以 概率1)。 在实际问题中,有时|Σ|=0,其原因是指标之间存在 着线性关系,如某一指标是其他一些指标的汇总值, 这在一般数据报表中是常出现的。我们通常可以通 过删去“多余”指标的办法来确保|Σ|≠0。因此,我 们总假定 Σ>0并不失一般性,这样可保证Σ−1存在, 从而可使数学问题得以简化。
随机向量 x ( x1, x2 , , x p )的数学期望
随机矩阵X的数学期望的性质
(1)设a为常数,则
E(aX)=aE(X) (2)设A,B,C为常数矩阵,则 E(AXB+C)=AE(X)B+C 特别地,对于随机向量x,有 E(Ax)=AE(x) (3)设X1,X2,⋯,Xn为n个同阶的随机矩阵,则 E(X1+X2+⋯+ Xn)=E(X1)+E(X2)+⋯+E(Xn)
协差阵的性质
(1)协差阵是非负定阵,即Σ≥0。 推论 若|Σ|≠0,则Σ>0。 (2)设A为常数矩阵,b为常数向量,则 V Ax b AV x A 当p=1时,上述等式就是我们熟知的如下等式: V ax b a 2V x
例2.3.2
x和y的协方差矩阵与y和x的协差阵互为转置关系,即有 Cov x, y Cov y , x 若Cov(x,y)=0,则称x和y不相关。 两个独立的随机向量必然不相关,但两个不相关的随机向量 未必独立。 x=y时的协差阵Cov(x,x)称为x的协差阵,记作V(x),即 V x E x E x x E x V x1 Cov x1 , x2 Cov x1 , x p Cov x2 , x1 V x2 Cov x2 , x p Cov x p , x1 Cov x p , x2 V xp V(x)亦记作Σ=(σij),其中σij=Cov(xi,xj)。
f1 ( x1, , xq )
f ( x1, , x p )d xq1
d xp
五、条件分布
设 x x1 ,
, x p 是p维连续型的随机向量,在给 定 x 2 xq 1 , , x p f 2 x 2 0 的条件下, x1 x1 , , xq 的条件密度定义为
, xp
f x1 ,
或表达为
, xq | xq 1 ,
f 2 xq 1 ,
f x1 ,
, xp
, xp
f x1 | x 2
f x
f 2 x 2
六、独立性
两个连续型随机向量的独立 f x, y f x x f y y n个连续型随机向量的独立 f x1 , , xn f1 x1 f n xn
i 1 j 1
n
m
(5)设k1,k2, ⋯,kn是n个常数,x1,x2, ⋯,xn是n个相互 独立的p维随机向量,则
n n 2 V ki xi ki V xi i 1 i 1
三、相关矩阵
随机变量x和y的相关系数定义为 Cov x, y x, y V x V y
x ( x1, x2 , , x p )和y ( y1, y2 , , yq ) 的相关阵定义为
x1 , y1 x1 , y2 x2 , y1 x2 , y2 x, y x p , y1 x p , y2 x2 , yq x p , yq
在实际应用中,若随机向量之间的取值互不影响, 则认为它们之间是相互独立的。
数字特征
一、数学期望(均值)
二、协方差矩阵 三、相关矩阵
一、数学期望(均值)
E x E x , E x , , E x 1 2 p 记为μ=(μ1,μ2,⋯,μp)′。 随机矩阵X=(xij)的数学期望 E x11 E x12 E x1q E x21 E x22 E x2 q E X E xij E x p1 E x p 2 E x pq
设随机向量x=(x1,x2,x3)′的数学期望和 协方差矩阵分别为
5 μ 2 和 7 4 1 2 Σ 1 9 3 2 3 25
令y1=2x1−x2+4x3, y2=x2−x3, y3=x1+3x2−2x3, 试求y=(y1,y2,y3)′的数学期望和协方差矩阵。
m n n m 推论 Cov xi , y j Cov xi , y j j 1 i 1 i 1 j 1 证明 (先证推论,再证性质(4))
m n Cov xi , y j j 1 i 1
E xi E xi y j E y j i 1 i 1 j 1 j 1 n m E xi E xi y j E y j i 1 j 1
三、多元概率密度函数
一元的情形:
F (a) f x d x,
a
多元的情形: a1 F (a1 , , a p )
f ( x1 ,
d F x f x dx
ap
f ( x1 ,
, x p )d x1 F ( x1 , , xp )
d xp
x1 x p 多元密度f (x1, ⋯,xp)的性质: (1) f ( x1 , , x p ) 0, 对一切实数x1 ,
Cov( x , y ) E [ x E( x )][ y E( y )]' x1 E( x1 ) E y1 E( y1 ), yq E( yq ) x p E( x p ) E [ x1 E( x1 )][ y1 E( y1 )] E [ x1 E( x1 )][ yq E( yq )] E [ x E( x )][ y E( y )] E [ x E( x )][ y E( y )] p p 1 1 p p q q cov( x1 , y1 ) cov( x1 , yq ) cov( x , y ) cov( x , y ) p 1 p q
x1 , yq
Hale Waihona Puke 若ρ(x,y)=0,则表明x和y不相关。 x=y时的相关阵ρ(x,x)称为x的相关阵,记作R=(ρij), 这里ρij=ρ(xi,xj), ρii=1。即 1 p 1 12 1 2 p 21 R 1 p1 p 2 R=(ρij)和Σ =(σij)之间有关系式: R=D−1ΣD−1 其中D diag 11 , 22 , , pp ;R和Σ的相应元 素之间的关系式为
随机向量
一、多元概率分布
一个向量,若它的分量都是随机变量,则称之为随 机向量。 随机变量x的分布函数:
F a P x a
随机向量 x x1 , x2 ,
, x p 的分布函数:
F a1, a2 , , a p P x1 a1, x2 a2 , , x p a p
ij
前述关系式即为
12 1 1 21 p1 p 2 1 11 0 0 1 p 2 p
1 0 0
ij ii jj
0 1
22
0
1
pp
12 11 21 22 p1 p 2
n n m m
Cov xi , y j
i 1 j 1
n
m
m n n m Cov Ai xi , B j y j Cov Ai xi , B j y j j 1 i 1 i 1 j 1
Ai Cov xi , y j Bj
1 p 2p pp
1
11
0
0 1
0 0
22
0
0
1
pp
标准化变换
在数据处理时,常常因各变量的单位不完全相同而 需要对每个变量作标准化变换,最常用的标准化变 换是令 xi i * xi , i 1,2, , p
(3)设A和B为常数矩阵,则
Cov Ax , By A Cov x , y B
(4)设 A1 , A2 ,
, An和B1, B2 , , Bm 为常数矩阵,则
m n n m Cov Ai xi , B j y j Ai Cov xi , y j Bj j 1 i 1 i 1 j 1
协差阵Σ既包含了x各分量的方差,也包含了每两个 分量之间的协方差。显然,Σ是一个对称矩阵。 例2.3.1 随机向量一分为二后,其协差阵分为四块: Cov x, y x V x V V y y Cov y, x 其中,对角线块为子向量的协差阵,非对角线块为 两个子向量之间的协差阵。熟悉这四块子矩阵的含 义很有益处。