二维正态分布.
第14讲 二维正态分布 中心极限定理
教学目的:了解二维正态分布,理解独立同分布的中心极限定理和棣莫佛—拉普拉斯
定理。
教学重点:独立同分布的中心极限定理。
教学难点:应用独立同分布的中心极限定理解决实际问题。 教学学时:2学时 教学过程:
第四章 正态分布
§4.4 二维正态分布
定义 若二维连续随机变量),(Y X 的联合概率密度为
]
)()
)((2)([
)
1(212
2
2
2
2
2121
),(y y y
x y x x x y y x r x r y x e
r y x f σμσσμμσμσπσ-+
---
----=
( +∞<<∞-+∞<<∞-y x , )
则称),(Y X 服从二维正态分布,记作 ),,,,(~),(2
22r N Y X x y x σσμμ。其中y x μμ,,
1|| ,0 ,0<>>r y x σσ都是分布的参数。
),(y x f 满足概率密度的两条基本性质:
(1)0),(≥y x f 。 (2)?
?
+∞∞-+∞
∞
-=1),(dxdy y x f 。
下面我们来讨论二维正态分布的边缘分布问题。 随机变量X 的边缘概率密度为
??∞+∞--∞
+∞
--=
=
dy e
r
dy y x f x f y x u y x X )
,(2
121),()(σπσ
其中
])
())((2)([)1(21
),(22
222y
y y x y x x x y y x r x r y x u σμσσμμσμ-+-----=
222
2])
([
)
1(212)(x
x y
y
x x x r y r x σμσμσμ--
--+
-=
设
t x r y r
x
x y
y
=--
--])
([
1212
σμσμ,则有
?∞+∞--
--
=
dt e
e
x f t
x x
X x
x 2
2)(2
2
2
21
)(σμπσ2
22)(21x x x x
e
σμσπ--
=
由X 与Y 的对称性可求得Y 的边缘密度为
)(y f Y 2
22)(21y y y y
e
σμσπ--
=
由此可见,二维正态分布的两个边缘分布都是正态分布,并且可以知道
)(,)(),(),(Y D X D Y E X E y x y x ====σσμμ
下面我们可以看到参数r 为随机变量Y X ,的相关系数。
)
()()]}
()][({[)()(),cov(),(Y D X D Y E Y X E X E Y D X D Y X Y X R --=
=
??+∞∞-+∞
∞---=
dxdy y x f y x y x y
x ),())((1
μμσσ r =(定积分计算略)
注 由第三章的内容可知,若随机变量X 与Y 相互独立,则相关系数0),(=Y X R ;但是,当0),(=Y X R 时,X 与Y 却不一定相互独立。然而,在正态分布的情形下,当相关系数0),(==r Y X R 时,二维正态分布的联合概率密度可化为
])
()[212
2
2221),(y y x x y x y
x e y x f σμσμσπσ-+--=
2
22)(21x x x x
e
σμσπ--
=
.
2
22)(21y y y y
e
σμσπ--
=.)()(y f x f Y X
所以,若随机变量),(Y X 服从二维正态分布,则随机变量X 与Y 相互独立的充要条件是0=r 。
例1 若随机变量X 与Y 相互独立,都服从标准正态分布)1,0(N ,求随机变量 函数22Y X Z +=的概率密度。
解 由于X 与Y 都服从标准正态分布)1,0(N ,概率密度分别为
2
221)(x X e
x f -=
π,2
221)(y Y e
x f -
=
π
又随机变量X 与Y 相互独立,联合概率密度为
2
2221),(y x e y x f +-
=
π
由此得随机变量22Y X Z +=的分布函数
)()()(22z Y X P z Z P z F Z ≤+=≤=
当0≤z 时,显然有0)(=z F Z ;当0>z 时,有 dxdy e
z F z
y x y x Z ??≤++-
=
222
2221)(π
220
2
121
2z z
e
d e
d -
-
-==
??
ρρθππ
ρ
所以z 的分布函数为
???
??≤>-=-0
01)(2z z e
z F z Z 由此得z 的概率密度为
???
??≤>=-0
021)(2z z e
z f z
Z 注 若随机变量X 与Y 相互独立,都服从标准正态分布)1,0(N ,则随机变量函数22Y X Z +=的分布称为自由度为2的2χ分布。
§4.5 中心极限定理
中心极限定理是研究在适当的条件下独立随机变量的部分和∑=n
i i X 1
的分布收敛于
正态分布的问题。
定理1 (林德伯格(Lindeberg )—列维(Levy )中心极限定理)设相互独立的随机变量ΛΛ,,,,21n X X X 服从同一分布,且 μ=)(i X E ,ΛΛ,,,2,1,0)(2n i X D i =>=σ,则对于任意实数x ,有
?∑∞--=∞→=??
?
?
???
???????≤-x t n i i n dt e x n n X P 21221lim πσμ
定理的证明略,仅对定理的含义作一些说明。 设∑==n
i i n X Y 1,则有
∑∑=====n i n
i i i n n X E X E Y E 1
1
)()()(μ
∑∑=====n i n
i i i n n X D X D Y D 1
1
2)()()(σ
σσσn n Y n ==2)(
又设随机变量σ
μ
σn n X Y Y E Y Z n
i i n n n n ∑=-=
-=1
)
()
(,则n Z 的分布函数
=≤=)()(x Z P x F n Z )(1
x n n X P n
i i ≤-∑=σ
μ
趋于标准正态分布函数。
结论 设相互独立的随机变量n X X X ,,,21Λ服从同一分布,已知均值为μ,方差为
02
>σ,但分布函数未知。当n 充分大时,随机变量n X X X ,,,21Λ的和∑==n
i i n X Y 1
将近
似地服从正态分布),(2σμn n N 。
推论 设相互独立的随机变量n X X X ,,,21Λ服从同一分布,已知均值为μ,方差为
02
>σ,但分布函数未知。当n 充分大时,∑==n
i i X n X 1
1近似服从正态分布),(2
n N σμ。
由推论知,不论n X X X ,,,21Λ服从什么分布,只要它们相互独立且服从同一分布,则它们的平均数X ,当n 充分大时,总是近似地服从正态分布。
例2 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的。问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?
解 令),260,2,1( 0
1
Λ=??
?=k k k X K 个分机不用外线
第个分机要用外线
第,
26021,,,X X X Λ是260个相互独立的随机变量,且04.0)(=i X E 。26021X X X m +++=Λ表示同时使用外线的分机数,根据题意应确定最小的x 使%95}{≥ ?∞ --≈?? ? ???????--≤ --= dt e p p p x p p p m P x m P 22 21)1(260260) 1(260260}{π 查得95.09505.0)65.1(>=Φ,故取65.1=b 。于是有 61.1504.026096.004.026065.1260)1(260≈?+???=+-=p p p b x 也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。 例3 用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克, 一箱内装200袋味精。求一箱味精净重大于20500克的概率。 解 设一箱味精净重为X 克,箱中第k 袋味精的净重为k X 克,200,,2,1Λ=k 。则 20021,,,X X X Λ是相互独立的随机变量,且100)(,100)(==k k X D X E ,200,,2,1Λ=k 。 故 2100)(,20000)(,20000)()(20021===+++=X D X D X X X E X E Λ 因而有 }20500{1}20500{≤-=>X P X P 0002.0)54.3(12100500210020000 1=Φ-≈??????≤--=X P 定理2 (德莫佛(De Movire )—拉普拉斯(Laplace )中心极限定理)设在独立试验序列中,事件A 发生的概率为p )10(< ?∞--∞→=?? ????????≤--x t n n dt e x p np np Y P 22 21)1(lim π 证 随机变量i X 表示事件A 在第i 次试验中发生的次数),,2,1(ΛΛn i =,则这些随机变量相互独立,服从相同的“0-1”分布,且有ΛΛ,,,2,1),1()(,)(n i p p X D p X E i i =-==, 则∑==n i i n X Y 1。由定理1知 ?∑∞--=∞→∞→=??? ? ??? ???????≤--=?? ???? ? ? ??≤--x t n i i n n n dt e x p np np X P x p np np Y P 21221)1(lim )1(lim π 注 在n 次独立试验中,事件A 发生的次数),(~p n B Y n 。定理2说明:当n 充分大时,服从二项分布的随机变量n Y 将近似地服从正态分布。一般来说,当n 较大时,二项分布的概率计算非常复杂,这时我们可以用正态分布来近似地计算二项分布。计算 公式为 }) 1() 1() 1({ }{)1(21212 1 p np np n p np np m p np np n P n m n P p p C n n n k n k n k k n --≤ --≤ --=≤≤=-∑=- )) 1(( )) 1(( 12p np np n p np np n --Φ---Φ≈ 例4 设随机变量X 服从)8.0,100(B ,求}10080{≤≤X P 。 解 )) 1(100) 1() 1(80( }10080{p np np p np np X p np np P X P --≤ --≤ --=≤≤ ≈)2 .08.01008080( )2 .08.010080 100( ??-Φ-??-Φ 5.05.01)0()5(=-=Φ-Φ= 例5 某电站供应10000户居民用电,设在高峰时每户用电的概率为0.8,且各户用电量多少是相互独立的。求: (1) 同一时刻有8100户以上用电的概率。 (2) 若每户用电功率为100W ,则电站至少需要多少电功率才能保证以0.975的 概率供应居民用电? 解 (1)设随机变量n Y 表示在10000户中同时用电的用户,则),8.0,10000(~B Y n 于是402.08.010000)1(,80008.010000=??=-=?=p np np 。 所求概率为 )50) 1(5.2()100008100(≤--≤ =≤≤p np np Y P Y P n n ≈0062.09938.01)5.2()50(=-=Φ-Φ (2)若每户用电功率为100W ,则n Y 户用电功率为100n Y W 。设供电站功率为Q W,则由题意得 )408000 100/) 1(()100()100(-≤--=≤ =≤Q p np np Y P Q Y P Q Y P n n n ≈975.0)40 8000 100/( =-ΦQ 查表可知975.0)96.1(=Φ,故96.140 8000 100/=-Q ,807840=Q 。所以,电站供电功率 不应少于807.84kW 。 二维正态分布 一、设二维随机变量),(Y X 服从二维正态分布,已知0)()(==Y E X E ,16)(=X D , 25)(=Y D ,并且12),cov(=Y X ,求),(Y X 的联合概率密度. 解:已知0==y x μμ,416==x σ,525== y σ,5 3),cov(),(===y x Y X Y X r σσ.从而 2516)53(1122=-=-r ,5 412=-r . 进一步按公式])())((2)([)1(21222222121),(y y y x y x x x y y x r x r y x e r y x f σμσσμμσμσπσ-+-------= ,可得) ,(Y X 的联合概率密度为 )2550316((322522321),(y xy x e y x f +--=π . 二、设随机变量X 与Y 独立,并且)1,0(~N X ,)2,1(~2N Y .求随机变量3 2+-=Y X Z 的概率密度. 解:由题设,有 0)(=X E ,1)(=X D ,1)(=Y E ,4)(=Y D . 又根据关于数学期望的定理和方差的定理以及独立正态随机变量线性组合的分布,我们有 2)3()()(2)32()(=+-=+-=E Y E X E Y X E Z E . 8)3()()(4)32()(=++=+-=D Y D X D Y X D Z D . 且)8,2())(,)((~N Z D Z E N Z =,故随机变量32+-=Y X Z 的概率密度为 16)2(82)2(2 2 41 821 )(--?--==z z Z e e z f ππ )(+∞<<-∞z . 三、台机床分别加工生产轴与轴衬.设随机变量X (mm)表示轴的直径,随机变量Y (mm)表示 轴衬的内径,已知)3.0,50(~2N X ,)4.0,52(~2 N Y ,显然X 与Y 是独立的.如果轴 衬的内径与轴的直径之差在3~1(mm)之间,则轴与轴衬可以配套使用.求任取一轴与一轴 衬可以配套使用的概率. 解:由题设,知随机变量X 与Y 是独立的,且)3.0,50(~2N X ,)4.0,52(~2N Y .设X Y Z -=根据独立正态随机变量线性组合的分布,我们有 )5.0,2()3.0)1(4.0,50)1(52(~2222N N Z =?-+?-+. 根据题目假设,我们知道当31≤-=≤X Y Z 时,轴与轴衬可以配套使用.于是所求概率 为 1)2(2)2()2()25 .022()5.0235.025.021()31(-Φ=-Φ-Φ=≤-≤-=-≤-≤-=≤≤Z P Z P Z P 9544.019772.02=-?=. 四、100台车床彼此独立地工作着,每台车床的实际工作时间占全部工作时间的80%,求: (1) 任一时刻有70至86台车床在工作的概率; 关于二维正态分布的一个教学注记 众所周知,二维正态分布是概率论中非常重要的一种分布,其性质也是很重要的,但很多教材在讨论两个正态分布的联合分布是不是二维正态分布这个问题时,要么就是说得不是很清楚,要么就是没有给出例子,要么就是给出的例子比较复杂,其实只要注意到二维正态分布定义中的一个基本事实,这个问题就可以说得很清楚。 首先,给出二维正态分布的定义:如果二维随机变量(X,Y)的概率密度函数为: 其中μ1,μ2,σ1,σ2,ρ均为参数,且σ1>0,σ2>0,ρ<1,则称(X,Y)服从参数为μ1,μ2,σ1,σ2,ρ的二维正态分布,记作(X,Y)(μ1,μ2,σ1,σ2,ρ)。 经过讨论,发现如果(X,Y)服从二维正态分布,那么两个分量X,Y都服从一维正态分布,而且参数ρ就是两个分量X,Y的相关系数,它是不能等于1和-1的,也就是说(X,Y)服从二维正态分布的前提是:两个分量X,Y是正态分布,而且它们的相关系数不是1和-1。 如果二维随机变量(X,Y)的两个分量X,Y是同一正态分布,都是X,那么(X,Y)就不服从二维正态分布,因为两个分量的相关系数是1。这样我们就很容易解释,为什么两个分量是正态分布,但它们的联合分布不一定是正态分布。 另外,一些教材中往往给出二维正态分布的这样一个性质: 性质:若(X,Y)服从参数为μ1,μ2,σ1,σ2,ρ的二维正态分布,那么(aX+bY,cX+dY)服从二维正态分布。 我觉得这个性质是不严谨的,比如a=c=1,b=d=0这时(aX+bY,cX+dY)为(X,X),两个分量的相关系数为1,(X,X)就不服从二维正态分布。更一般的,如果a b c d=0,那么(aX+bY,cX+dY)的两个分量aX+bY和cX+dY成比例,其相关系数为1或-1,(aX+bY,cX+dY)就不服从二维正态分布。应该再加一个前提,就是行列式a b c d不等于0,就可以利用二维正态分布的定义证明(aX+bY,cX+dY)服从二维正态分布,这样就没有问题了。 二维连续随机变量(X,Y)的联合概率密度为: 2(,)21x y f x y r πσσ=-22222()()()()122(1)x y y x x y x y x y y x r r e μμμμσσσσ??----??--+-???? 记作(X ,Y )~()r N y x y x ,,,,σσμμ 下面我自己绘制一个(X ,Y )~()5.0,1,1,0,0N 的正态函数的图像(2013年1月8日) (,)23f x y π= 222x 3xy y e ??--+?? close all; clear clc x=-4:.1:4; y=x; [x y]=meshgrid(x,y); z=sqrt(3)/2/pi*exp(-2.*x.^2./3-2.*y.^2./3+x.*y); mesh(x,y,z) close all; clear clc x=-4:.1:4; y=x; [x y]=meshgrid(x,y); z=sqrt(3)/2/pi*exp(-2.*x.^2./3-2.*y.^2./3+x.*y); mesh(x,y,z) hold on; fill3([-4 -4 4 4],[0 0 0 0],[0.35 0 0 0.35],'r') surf(1:2,[1 1],[0 0;1 1]) ezmesh('100-x-y') ezplot('x=2') 高三数学图片 >> 二维正态分布的密度函数图像 资料名称:二维正态分布的密度函数图像 资料编号:100973 资源分类:图像素材 所属科目:数学 适用年级:高三 文件大小:12.55KB 文件类型:image/jpeg 资料简介:二维正态分布的密度函数图像正态分布,概率与统计, >> clf >> x=2; >> y=0; >> z=0; >> plot3(2,0,0,'m:p') 第14讲 二维正态分布 中心极限定理 教学目的:了解二维正态分布,理解独立同分布的中心极限定理和棣莫佛—拉普拉斯 定理。 教学重点:独立同分布的中心极限定理。 教学难点:应用独立同分布的中心极限定理解决实际问题。 教学学时:2学时 教学过程: 第四章 正态分布 §4.4 二维正态分布 定义 若二维连续随机变量),(Y X 的联合概率密度为 ] ) () )((2) ([) 1(212 2 2 2 2 2 121 ),(y y y x y x x x y y x r x r y x e r y x f σ μσ σμμσ μσπσ -+ --- ----= ( +∞<<∞-+∞<<∞-y x , ) 则称),(Y X 服从二维正态分布,记作 ),,,,(~),(222r N Y X x y x σσμμ。其中y x μμ,, 1|| ,0 ,0<>>r y x σ σ 都是分布的参数。 ),(y x f 满足概率密度的两条基本性质: (1)0),(≥y x f 。 (2)? ? +∞ ∞ -+∞ ∞ -=1),(dxdy y x f 。 下面我们来讨论二维正态分布的边缘分布问题。 随机变量X 的边缘概率密度为 ??∞+∞--∞ +∞--= =dy e r dy y x f x f y x u y x X ) ,(2 121 ),()(σ πσ 其中 ] )())((2) ([ ) 1(21),(2 2 2 2 2 y y y x y x x x y y x r x r y x u σμσσμμσμ-+-----= 2 2 22 ]) ([ )1(212)(x x y y x x x r y r x σμσ μσμ-- --+ -= 设 t x r y r x x y y =-- --]) ([ 121 2 σμσ μ,则有 ?∞ +∞-- -- = dt e e x f t x x X x x 2 2)(2 2 2 21 )(σμπσ 22 2)(21x x x x e σ μσ π-- = 由X 与Y 的对称性可求得Y 的边缘密度为 )(y f Y 22 2)(21y y y y e σ μσ π-- = 由此可见,二维正态分布的两个边缘分布都是正态分布,并且可以知道 )(,)(),(),(Y D X D Y E X E y x y x = = ==σ σμμ 下面我们可以看到参数r 为随机变量Y X ,的相关系数。 ) () ()]} ()][({[) ()(),cov(),(Y D X D Y E Y X E X E Y D X D Y X Y X R --= = ??+∞ ∞-+∞ ∞---= dxdy y x f y x y x y x ),())((1 μμσ σ r =(定积分计算略) 注 由第三章的内容可知,若随机变量X 与Y 相互独立,则相关系数0),(=Y X R ;但是,当0),(=Y X R 时,X 与Y 却不一定相互独立。然而,在正态分布的情形下,当相关系数0),(==r Y X R 时,二维正态分布的联合概率密度可化为 ] )() [2122 22 21),(y y x x y x y x e y x f σ μσμσ πσ-+--=二维正态分布
关于二维正态分布的一个教学注记
matlab如何绘制二维正态曲面
二维正态分布