随机变量的函数的分布
合集下载
随机变量函数的分布

二 、连续型随机变量函数的分布 2.分布函数法 一般地,若已知X的概率密度为 fX(x),求其函数 Y=g(X)的概率密度 fY(y)分两个步骤: 10 根据分布函数的定义求Y的分布函数FY(y); 20 由 fY(y) = F (y) 求出 fY (y)
例3 对一圆片直径进行测量, 其值在[5,6]上均匀分
定理 设X是一连续型随机变量,其密度函数f(x) , (-∞<x< +∞ ),又函数y = g(x)处处可导,且严格单 调,其反函数为x = h(y ),则Y = g(X)也是一连续型随 机变量,且密度函数为
h y f[ h ( y )], y f y Y , 其他 0
计算离散型随机变量函数的分布的方法: 首先将xi的取值代入函数关系,求出随机变量Y相应的取值
y g ( x )( i 1 , 2 , .) i i
如果yi(i=1,2,…)的值各不相等,则Y的概率分布为 Y P y1 p1 y2 p2 … … yi pi … …
如果 yi=g(xi)(i=1,2,…)中出现m(≥2)个相同的函数值,即存在
0 , y25 /4 F (y) * 25 /4y9 1, y9
F ( y ) P { Y y } P { X / 4 y }
2
P { X 4 y / }
4 y /
f ( x ) dx X
例3 对一圆片直径进行测量, 其值在[5,6]上均匀分
其中, m g ( in{ ), g ( )}, m g ( ax ), g ( )
注意 若f(x)在有限区间[a,b]外等于0,则只需设在[a,b] ( x ) 0 [ 或 g ( x ) 0 ]. 上有 g
随机变量函数的分布

此时,称Y服从自由度为1的χ2-分布。
变限函数求导公式:
b(x)
f
(t)dt
f b(x)b(x)
f a(x) a(x).
a(x)
例3:设r.v.X~U(0,1),求Y=eX的概率密度.
1, 0 x 1, 解:因r.v.X~U(0,1),故X的概率密度为:fX (x) 0, 其它.
如图, fX (x)的非零段将整个 x轴分为三部分:
(-∞,0),[0,1),[1,+ ∞); 从而,整个y轴相应地也被分为三 部分: (-∞,1),[1,e),[e,+ ∞).
因此,应就y分为上述三个区 间来求Y的分布函数.
(1) 当y<1时,再分为两种情形:
a) 当y≤0时,
FY (y) PY y P eX y
P() 0;
b) 当0< y<1时,
fY
(
y)
1 y
,
1 y e,
0, 其它.
注意:本题是重要题型,必须熟练掌握。
方法2 公式法(y=g(x)为单调可导函数)
定理:设连续型随机变量X的概率密度为
f X (x)( x )
函数g(x)处处可导且有恒有 g(x) 0(g(x) 0)
则Y=g(X)是连续型随机变量,且其概率密度为
◆如果Y各可能取值中存在多个值相等,则Y取该值的概 率为这些相等值对应的X取值的概率之和.
例如,当 yk g(xi ) g(x j ) g(xm ),
则由基本事件互斥性与概率可加性得:
PY yk P X xi P X xj P X xm
例1:设r.v.X的分布列为:
X
-1
012
P 0.2 0.3 0.1 0.4
随机变量的函数的分布

[a, b] 上的反函数. min{g(a), g(b)},
max{g(a), g(b)}
例5:X ~ N (, 2 ),则 Y aX b 也服从正态分布 (a 0)
(x)2
fX (x)
1
e 2 2
2
y ax b 是x的 单 调 函 数 , 它 的 反 函数 为x y b ,
§5 随机变量的函数的分布
设X 为一随机变量,y=g(x)为实函数,则Y=g(X)也 是随机变量
已知随机变量X 的分布,并且已知
Y gX ,要求随机变量Y 的分布.
一、离散型随机变量函数的分布列的求法
X为离散型,则g(X)也为离散型.
若yk g( xk ) g( x j ),
k j则 Y g(X)取 yk的概率为
P{Y g( X ) yk } P{X xk } P{X xJ } pk p j
例1:X
P
-1
0
1
2
0.2
0.3
0.1
0.4
求Y (X 1)2 1的分布律
解:X取-1,0,1,2时,Y分别取3,0,-1,0
P{Y 3} P{X 1} 0.2
P{Y 0} P{X 0} P{X 2} 0.3 0.4 0.7
U
(2) 对FY ( y)关于 y 求导,便得 Y 的概率密度 fY ( y) FY ( y)
x
例 2:
已知
f
X
(
x)
8
0
0 x4 o.w.
求 Y 2X 8 的概率密度
FY ( y) P{Y y} P{2X 8 y}
fY ( y) FY ( y)
f
X
(
y
§3.5 随机变量函数的分布

( ii ) 若Y = X 2 , 则有 1 fY ( y ) = [ f X ( y ) + f X ( − y )], y ∈ R(Y ). 2 y 这里a , b为常数 且a ≠ 0, R(Y )为Y的值域 .
证明 由于 R(Y ) = [0,+∞ ), 取 y ≥ 0, 有
FY ( y ) = P ( X ≤ y ) = P ( − y ≤ X ≤
2 2 ∑ ci X i ~ N ( ∑ ci µi , ∑ ci σ i ). n i =1 n i =1 n i =1
其中, 为常数. 其中 c1 , c2 ,⋯, cn为常数
3.5.2 二维随机变量函数的分布 一、一般方法 是二维连续型随机变量,其联合密 设 ( X ,Y )是二维连续型随机变量 其联合密 的函数, 度为 f ( x , y ).又设Z = g( X ,Y ) 是 ( X ,Y ) 的函数 又设 类似于一维,求 的密度的一般方法为 的密度的一般方法为: 类似于一维 求Z的密度的一般方法为 (i)确定 的值域 R(Z ); 确定Z的值域 确定 (ii)对任意 z ∈ R(Z ), 对任意 求出Z的分布函数 的分布函数; 求出 的分布函数;
f Z ( z ) = ∫− ∞ f ( x , z − x )dx,或 f Z ( z ) = ∫− ∞ f ( z − y , y )dy .
+∞ +∞
当 X与Y 独立时 则 与 独立时,则
f Z ( z ) = ∫− ∞ f X ( x ) fY ( z − x )dx,或 f Z ( z ) = ∫− ∞ f X ( z − y ) fY ( y )dy .
−1 −1
用上述定理求例3.5.1中Y的密度函数 例3.5.3 用上述定理求例 中 的密度函数
随机变量的分布函数

x < −1 , −1 ≤ x < 2, 2 ≤ x < 3, x ≥ 3.
-1 0 1 2 3
4
1
x
§3
随机变量的分布函数
1 1 1 P{X ≤ } = F( ) = , 2 2 4 3 5 5 3 3 1 1 P{ < X ≤ } = F( ) − F( ) = − = , 2 2 2 2 4 4 2
9
§3
随机变量的分布函数
用分布函数计算某些事件的概率
P{a ≤ X ≤ b} = P{X ≤ b}− P{X < a}
= F (b) − F (a − 0)
P{a < X < b} = P{X < b}− P{X ≤ a} P{a ≤ X < b} = P{X < b}− P{X < a}
= F (b − 0 ) − F (a − 0 )
设 F ( x) = P{ X ≤ x} 是随机变量 X 的分布函数,则 P{ X = a} = P{ X ≤ a} − P{ X < a} P{a < X ≤ b} = P{ X ≤ b} − P{ X ≤ a} P{ X < a} = F ( a − 0)
= F ( a ) − F ( a − 0) = F ( b) − F ( a )
随机变量的分布函数
1. 概 念
定义 设 X 是一个随机变量,x 是任意实数,函数
F(x) = P{X ≤ x}
称为 X 的分布函数.
X x 0 F(x) = P{X ≤ x} x2) ,有: : X
o
P{x1 < X ≤ x2} = P{X ≤ x2}− P{X ≤ x1} = F(x2 ) − F(x1).
随机变量的分布函数

x 0dt 0
x 0
-x
f(t)dt
0
-
f(t)dt
x
0
f(t)dt
0 x2
其中F((x)
-x
0
x 0
t 2
dt
x2 4
f(t)dt
0
-
f(t)dt
2
0
f(t)dt
x
2
f(t)dt
2 x
0
2t
02
dt
0
1
b
1 3
三. 离散型随机变量X的分布律为P{X xk} pk , k 1,2,3
离散型随机变量X的分布函数为F ( x) p{ X x}
pk P{X xk }
xk x
xk x
例3 :一个半径为2米的圆盘靶,设击中
靶上任意同心圆盘上的点的概率与该圆
盘面积成正比(即与击中点到圆心距离
§ 3 随机变量的分布函数
• 对于离散型随机变量X,可以将其所有可能的取值一一
列举出来,再分别求出每一个取值xk的概率pk
• 对于非离散型随机变量,其取值不能一一列举出来, 无法用分布律的方法来描绘。
• (1)它取任意值的概率都为0,即P(X=k)=0. • (2)我们更关心它在某一区间的概率, P{X k}
x
F () lim F ( x) 1
x
lim F ( x) F ( x0 )
x x0
例1: 随机变量X的分布律为
X -1
2
3
pk 1/4
1/2
1/4
求F ( x),及P{X 12}, P{23 X 52}, P{2 X 3}
解:当 x <-1 时,
随机变量函数的分布

,
0,
0 ey/2 1 其它
得
fY
(
y)
1 2
e
y
/
2
,
y0
0,
其它
即Y服从参数为1/2的指数分布.
例9
设随机变量 X ~ N , 2 ,Y eX,试求随机变量
Y 的密度函数 fY y.
解: 由题设,知 X 的密度函数为
f x
1
x2
e 2 2
x
2
因为函数 y ex 是严格增加的,它的反函数为
0,
其它.
整理得 Y =2X +8 的概率密度为:
fY
(
y
)
y8 32
,
8 y 16,
0,
其它.
解题思路总结
核心思想:{Y y}等价于{X ?}
解题过程:
⑴.先求Y g X 的分布函数
FY y PY y P g X y fX ( x)dx g( x) y
⑵.利用Y g X 的分布函数与密度函数之间的关系 求Y g X 的密度函数 fY y FY y
一、 离散型随机变量函数的概率分布
当X为离散型随机变量时, Y g X 也是离散型
随机变量。并且在 X 的分布列已知的情况下,求Y的
分布列是容易的。
X 1 0 1 2 3
例1 已知X的分布列为
Pk 0.2 0.1 0.1 0.3 0.3
求 Y X 1 Y X2
的分布列。
解 由Y 的分布列可列出
面积Y小于 等价于半径X<1/2
0
1
即事件{面积Y 1 }等价于事件{半径X 1}
4
2
所以 P{Y } P{ X 1} 1
随机变量的分布函数

A
sin
As
x
x
i nxx
2x
2
x
2A
2
2
2
A
2
求得
A
1 2
,于是f概x率 密度12 c函os数x
x
2
2
01
其它
f
x
1 2
cos
x
0
x
2
2
其它
利用分布函数与概率密度函数之间的积分关系,
F x x f t dt ,求分布函数 Fx
当 x 时, F x
x f t dt
=7/30+7/120
例 2.3.4 在一质量均匀的陀螺的圆周上均匀地刻上区间 (0,1]
上诸数字,旋转这陀螺,当它停下时,其圆周与桌面接触点的刻
度 X 是一个随机变量,求 X 的分布函数。
解 由陀螺刻度的均匀性,对于区间(0,1]内的任一子区间(a,b] 有 P( a<X≤b) =b-a. 因为,X可能取值为区间(0,1]上所有值, 所以,在求X的分布函数时,可将整个数轴分成三个区间来讨论.
x
0dt 0
2
当 x 时,
2
2
F x x f tdt
2 f (t)dt
x
f (t )dt
x
1 2
cos
tdt
1 sinx
2
1 2
2
2
f
第2.3节 随机变量的分布函数
一、分布函数
1. 定义:设X是任意一个随机变量,称函数 F(x)=P{X≤x}, -∞<x<+∞
为随机变量X的分布函数. 任意a<b, P(a<X≤b)=P(X≤b)-P(X≤a)=F(b)-F(a);
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
定义2.7.2
称 CV
Var( X ) 为 X 的变异系数. E(X )
作用: CV 是无量纲的量, 用于比较量纲不 同的两个随机变量的波动大小.
.
2.7.3 分位数
定义2.7.3 设 0 < p < 1, 若 xp 满足 P( X xp ) = F(xp) = p
则称 xp 为此分布 p - 分位数, 亦称 xp 为下侧 p - 分位数.
对称的,则中位数=均值.
.
统计中常用的 p - 分位数
(1) N(0, 1): Z , U
(2) 2(n):
2
(n
)
(3) t (n): t (n)
(4) F (n, m): F (n, m)
.
2.7.5 偏度系数
定义2.7.5 设 随机变量X的三阶矩存在,则称
1
E X E(X )3
E(
• 相同点:都是反映分布的形态特征. • 不同点:含义不同. 偏度刻画的是分布的对称性,峰度刻画的是
分布的峰峭性.
.
习题讲解
.
例1 从某大学到火车站途中有6个交通岗,假设在各个 交通岗是否遇到红灯相互独立,并且遇到红灯的概率都 是1/3。 (1)设X为汽车行驶途中遇到的红灯数,求X的分布律; (2)求汽车行驶途中至少遇到5次红灯的概率。
.
注意点
(1) 因为 X 小于等于 xp 的可能性为 p , 所以 X 大于 xp 的可能性为 1 p .
(2) 对离散分布不一定存在 p - 分位数.
(3)
P(X xp) F(xp)
xp p(x)dx
.
上侧 p -- 分位数
若记 xp 为上侧 p - 分位数,即 P(X xp ) = p
§2.6 随机变量函数的分布
问题:已知 X 的分布,求 Y = g(X) 的分布?
例如: Y1 = 4X +3; Y2 = |X|; Y3 = X2 .
.
2.6.1 离散随机变量函数的分布
➢ 当 X 为离散随机变量时, Y = g(X) 为离散随机变量. ➢ 将g(xi) 一一列出, 再将相等的值合并即可.
解 (1)由题意,X~B(6,1/3),故X的分布律为:
P(Xk)C 6 k 1 3 k 3 2 6k k0,1,.6 .., ( 2 )P ( X 5 ) P ( X 5 ) P ( X 6 )
C6513532.136
例2.6.4 设X的概率密度函数为
f
(
x)
2
x
2
,
0 x;
0, 其他.
求Y sin X的密度函数pY (y).
.
§2.7 分布的其它特征数
• 矩、变异系数、分位数、中位数
.
2.7.1 k 阶原点矩和中心矩
定义2.7.1
➢ k 阶原点矩:k = E(Xk) , k = 1, 2, ….
注意: 1 = E(X).
➢ k 阶中心矩:k = E[XE(X)]k , k = 1, 2, ….
注意: 2 = Var(X).
.
2.7.2 变异系数
方差(或标准差)反映了随机变量取值的 波动程度,但在比较两个随机变量大小时 会产生不合理的现象。 原因有二: (1)方差(或标准差)是有量纲的; (2)有一个相对性问题,取值较大的随机变量 的方差(或标准差)也允许大一些。
FY(y)=P{Yy}=P{g(X) y}; 3、由分布函数与密度函数的关系求得Y=g(X)的 概率密度。
.
均匀分布的有用结论
定理2.6.5 设 X ~ FX (x),若FX (x)为严格单调 增的连续函数,则Y = FX (X) ~ U(0, 1).
.
例2.6.3 设随机变量X~N(0,1) ,求随机变量 Y=X2的概率密度函数。
pY ( y)
pX [h( y)] | h( y) |
pX [ln
y]
1 y
1
y(1 ln 2 y)
由此得
pY ( y)
1 y(1 ln2
, y)
0,
y0 其它
.
正态变量的线性不变性
定理2.6.2 设 X ~N (, 2),则当a 0 时, Y = aX+b ~ N (a +b, a22).
.
2.6.2 .1 设 X ~ pX(x),取值范围为[c, d]; y = g(x) 是 x 的严格 单调函数,记 x = h(y) 为 y = g(x) 的反 函数, 且h(y)连续可导,则Y = g(X)的密度函数为:
pY
(
y)
pX
(h(
y)) 0,
p(x)
1
2
y
exp
(ln y)2 2 2
,
y 0.
.
伽玛分布的有用结论
定理2.6.4 设 X ~ Ga (, ),则当k > 0 时, Y = kX ~ Ga (, /k).
.
2. 分布函数法
步骤: 1、由X的取值范围确定Y =g(X)的取值范围; 2、由分布函数的定义求Y=g(X)的分布函数:
|
h
'(
y)
|,
a yb 其它
其中a min{g(c), g(d)},b max{g(c), g(d)}.
.
例2.6.1
设
X
~
pX
(x)
(1
1
x2)
,
求 Y =eX 的分布.
解: y = ex 单调可导, 反函数 x = h(y) = lny,
h( y) 1 , 所以当 y > 0 时,
y
X
EX
)2
3/2
3
3/2 2
为X的分布的 偏度系数,简称偏度.
正态分布N(,2)的偏度 1=0.
.
2.7.5 峰度系数
定义2.7.5 设 随机变量X的四阶矩存在,则称
2
EX
E ( X
E(X )4
EX
)2
2
3
4
2 2
3
为X的分布的 峰度系数,简称峰度.
正态分布N(,2)的峰度 2=0.
.
偏度与峰度
则 xp x1' p , x'p x1 p
.
2.7.4 中位数
定义2.7.4 称 p = 0.5 时的p 分位数 x0.5 为中位数. 中位数是反映随机变量位置的特征数,即
随机变量取值的中心.
.
中位数与均值
• 相同点:都是反映随机变量的位置特征. • 不同点:含义不同. 有时中位数比均值更能说明问题. 若分布是
由此得: 若 X ~N (, 2), 则 Y = (X )/ N(0, 1).
.
例2.6.2 (1) 设 X ~N (10, 22),求 Y = 3X+5 的分布; (2) 设 X ~N (0, 22),求 Y = -X 的分布.
.
对数正态分布
定理2.6.3 设 X ~N (, 2),则 Y = e X 的服从
定义2.7.2
称 CV
Var( X ) 为 X 的变异系数. E(X )
作用: CV 是无量纲的量, 用于比较量纲不 同的两个随机变量的波动大小.
.
2.7.3 分位数
定义2.7.3 设 0 < p < 1, 若 xp 满足 P( X xp ) = F(xp) = p
则称 xp 为此分布 p - 分位数, 亦称 xp 为下侧 p - 分位数.
对称的,则中位数=均值.
.
统计中常用的 p - 分位数
(1) N(0, 1): Z , U
(2) 2(n):
2
(n
)
(3) t (n): t (n)
(4) F (n, m): F (n, m)
.
2.7.5 偏度系数
定义2.7.5 设 随机变量X的三阶矩存在,则称
1
E X E(X )3
E(
• 相同点:都是反映分布的形态特征. • 不同点:含义不同. 偏度刻画的是分布的对称性,峰度刻画的是
分布的峰峭性.
.
习题讲解
.
例1 从某大学到火车站途中有6个交通岗,假设在各个 交通岗是否遇到红灯相互独立,并且遇到红灯的概率都 是1/3。 (1)设X为汽车行驶途中遇到的红灯数,求X的分布律; (2)求汽车行驶途中至少遇到5次红灯的概率。
.
注意点
(1) 因为 X 小于等于 xp 的可能性为 p , 所以 X 大于 xp 的可能性为 1 p .
(2) 对离散分布不一定存在 p - 分位数.
(3)
P(X xp) F(xp)
xp p(x)dx
.
上侧 p -- 分位数
若记 xp 为上侧 p - 分位数,即 P(X xp ) = p
§2.6 随机变量函数的分布
问题:已知 X 的分布,求 Y = g(X) 的分布?
例如: Y1 = 4X +3; Y2 = |X|; Y3 = X2 .
.
2.6.1 离散随机变量函数的分布
➢ 当 X 为离散随机变量时, Y = g(X) 为离散随机变量. ➢ 将g(xi) 一一列出, 再将相等的值合并即可.
解 (1)由题意,X~B(6,1/3),故X的分布律为:
P(Xk)C 6 k 1 3 k 3 2 6k k0,1,.6 .., ( 2 )P ( X 5 ) P ( X 5 ) P ( X 6 )
C6513532.136
例2.6.4 设X的概率密度函数为
f
(
x)
2
x
2
,
0 x;
0, 其他.
求Y sin X的密度函数pY (y).
.
§2.7 分布的其它特征数
• 矩、变异系数、分位数、中位数
.
2.7.1 k 阶原点矩和中心矩
定义2.7.1
➢ k 阶原点矩:k = E(Xk) , k = 1, 2, ….
注意: 1 = E(X).
➢ k 阶中心矩:k = E[XE(X)]k , k = 1, 2, ….
注意: 2 = Var(X).
.
2.7.2 变异系数
方差(或标准差)反映了随机变量取值的 波动程度,但在比较两个随机变量大小时 会产生不合理的现象。 原因有二: (1)方差(或标准差)是有量纲的; (2)有一个相对性问题,取值较大的随机变量 的方差(或标准差)也允许大一些。
FY(y)=P{Yy}=P{g(X) y}; 3、由分布函数与密度函数的关系求得Y=g(X)的 概率密度。
.
均匀分布的有用结论
定理2.6.5 设 X ~ FX (x),若FX (x)为严格单调 增的连续函数,则Y = FX (X) ~ U(0, 1).
.
例2.6.3 设随机变量X~N(0,1) ,求随机变量 Y=X2的概率密度函数。
pY ( y)
pX [h( y)] | h( y) |
pX [ln
y]
1 y
1
y(1 ln 2 y)
由此得
pY ( y)
1 y(1 ln2
, y)
0,
y0 其它
.
正态变量的线性不变性
定理2.6.2 设 X ~N (, 2),则当a 0 时, Y = aX+b ~ N (a +b, a22).
.
2.6.2 .1 设 X ~ pX(x),取值范围为[c, d]; y = g(x) 是 x 的严格 单调函数,记 x = h(y) 为 y = g(x) 的反 函数, 且h(y)连续可导,则Y = g(X)的密度函数为:
pY
(
y)
pX
(h(
y)) 0,
p(x)
1
2
y
exp
(ln y)2 2 2
,
y 0.
.
伽玛分布的有用结论
定理2.6.4 设 X ~ Ga (, ),则当k > 0 时, Y = kX ~ Ga (, /k).
.
2. 分布函数法
步骤: 1、由X的取值范围确定Y =g(X)的取值范围; 2、由分布函数的定义求Y=g(X)的分布函数:
|
h
'(
y)
|,
a yb 其它
其中a min{g(c), g(d)},b max{g(c), g(d)}.
.
例2.6.1
设
X
~
pX
(x)
(1
1
x2)
,
求 Y =eX 的分布.
解: y = ex 单调可导, 反函数 x = h(y) = lny,
h( y) 1 , 所以当 y > 0 时,
y
X
EX
)2
3/2
3
3/2 2
为X的分布的 偏度系数,简称偏度.
正态分布N(,2)的偏度 1=0.
.
2.7.5 峰度系数
定义2.7.5 设 随机变量X的四阶矩存在,则称
2
EX
E ( X
E(X )4
EX
)2
2
3
4
2 2
3
为X的分布的 峰度系数,简称峰度.
正态分布N(,2)的峰度 2=0.
.
偏度与峰度
则 xp x1' p , x'p x1 p
.
2.7.4 中位数
定义2.7.4 称 p = 0.5 时的p 分位数 x0.5 为中位数. 中位数是反映随机变量位置的特征数,即
随机变量取值的中心.
.
中位数与均值
• 相同点:都是反映随机变量的位置特征. • 不同点:含义不同. 有时中位数比均值更能说明问题. 若分布是
由此得: 若 X ~N (, 2), 则 Y = (X )/ N(0, 1).
.
例2.6.2 (1) 设 X ~N (10, 22),求 Y = 3X+5 的分布; (2) 设 X ~N (0, 22),求 Y = -X 的分布.
.
对数正态分布
定理2.6.3 设 X ~N (, 2),则 Y = e X 的服从