第四章 几种重要的分布
第四章 几种重要的分布
在这一章,我们要介绍几种重要的分布 首先介绍离散型随机变量的分布
§4.1 常用的离散型随机变量的分布
一、退化分布
在所有分布中,最简单的分布是退化分布,即一个随机变量X 以概率1取一常数,即 ()1P X a ==
则称X 服从a 处的退化分布。
,0EX Ea a DX Da ====
二、0-1分布
前面我们学习了贝努力试验。对于贝努力试验,只有两个结果:成功或失败(A 和A ),如抛一枚银币(正、反);检查一件产品(合格、不合格);一次射击(命中、不命中),都可看做一个贝努力试验。 在一次试验中,设成功的概率为p ,()P A p =,()1P A p q =-=,不同的p 表示不同的贝努力试验。如检查一批产品中,)P (合格品=0.9,()P 不合格品=0.1。 用来描述贝努力试验的随机变量分布为0-1分布,0,1代表将试验的两个结果定义为0,1.即随机变量X 只可能取0,1两个值,它的分布律为
1()(1)
(0,1)i
i
P X i p p i -==-=
(0)(1)P X p ==- (1)P X p
== 称X
EX p
= (1)
D X p p =-
三、二项分布
由n 个相同的独立的贝努力试验组成的随机试验称为n 重贝努力试验。如抛硬币3次,检查7个产品,打100次靶等都属于多重贝努力试验。
1.定义:在n 重贝努力试验中,每次试验事件A 发生的概率都为(01)p p ≤≤,设
X
为n 次试验中事件A 发生的次数,则X 的可能取值为0,1,2,,n
()(1)
,0,1,,k
k
n k
n P X k C p p k n
-==-=
不难验证(1)()0P X k =≥ (2)0
()1
n
k P X
k ===∑
称随机变量X 服从参数为n 和p 的二项分布,记作~(,)
X B n p
()P X k =的值恰好是二项式
n
(px+q )展开式中第1k +项k x 的系数。因此我们称该分布为二项分布。
其中,当1n =时,1()(1)(0,1)i i P X i p p i -==-=称X 服从(0-1)两点分布 事件A至多出现m 次的概率是
m
k k n-k
n k=0
P{0m }=C P q
X ≤≤∑
事件A出现次数不小于λ不大于μ 的概率是
m
k k n-k
n k=l
P{l m }=C P q
X ≤≤∑
例 已知100个产品中有5个次品,现从中有放回地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率.
解: 因为这是有放回地取3次,因此这3 次试验的条件完全相同且独立,它是贝努里试验. 依题意,每次试验取到次品的概率为0.05. 设X 为所取的3个中的次品数,则~(3,0.05)X B
于是,所求概率为:22
3(2)(0.05)(0.95)0.007125P X C ===
例:一个袋子中装有N 个球,其中1N 个白球,2N 个黑球(12N N N +=),每次从中任取一个球,查看完颜色后再放回去,一共取了n 次,求取到白球数X 的分布。
解:由于是放回试验,每次取球为1次试验,n 次取球可视为n 重贝努力试验,每次取到白球的概率为1N p N
=
,故1~(,
)N X B n N
分布为
11()(
)(1)
,0,1,,k
k
n k
n N N P X k C k n N
N
-==-
=
贝努里概型对试验结果没有等可能的要求,但有下述要求: (1)每次试验条件相同;
(2)每次试验只考虑两个互逆结果A 或A ,()P A p =,()1P A p q =-=
(3)各次试验相互独立
简单的说:二项分布描述的是n 重贝努里试验中出现“成功”次数X 的概率分布.
例:某类灯泡使用时数在1000小时以上的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X 为三个灯泡在使用1000小时已坏的灯泡数 ~(3,0.8)
X B
33()(0.8)(0.2)
,k k k
P X k C -==
(1)(0)(1)0.104P X P X P X ≤==+==
把观察一个灯泡的使用时数看作一次试验,“使用到1000小时已坏”视为“成功”.每次试验, “成功”的概率为0.8
2.二项分布的期望和方差
期望:n
k 0
k k E(X)P{X }==
??
n-k
n
k
k 0k p (1-p)
k n C ==
?
n
k
n-k
k 0n !
k p (1
)
k !(n k )!p ==
?
-?
k-1(n-1)-(k-1)
n
k 1
np(n 1)!p q
(1)![(1)(1)]!
k n k =-=----?
k-1
(n-1)-(k-1)
n
k 1np(n 1)!p q
(1)![(1)(1)]!
k n k =-=----?
n
k-1(n-1)-k-1k 1(1)!
p q
(1)![(1)(1)]!
n np k n k =-=----?
()
1
11
(1)(1)
110
(1)
n k k n k n k np
C p
p --------==-?
1
p(p q )
p.n n n -=+=
方差:2
2
!()(1)
!()!
n
k n k
k n E X k
p p k n k -==
--∑1
!
(1)
(1)!()!n
k
n k
k kn p
p k n k -==
---∑
1(11)!
(1)(1)!()!
n
k
n k
k k n p p k n k -=-+=
---∑1(11)!
(1)
(1)!()!n
k
n k
k k n p
p k n k -=-+=
---∑
11(1)!
!
(1)
(1)
(1)!()!
(1)!()!n
n
k n k
k
n k
k k k n n p p p
p k n k k n k --==-=
-+
-----∑∑
2
1
!
!
(1)
(1)
(2)!()!
(1)!()!n
n
k n k
k
n k
k k n n p p p
p k n k k n k --===
-+
-----∑∑
21
2
21
12
1
00(1)(1)
(1)
n n l l n l
j j n j
n n l j n n C
p
p nC
p
p --+--+----===
--+
-∑∑
2
1
2
21
12
1
(1)(1)
(1)
n n l l n l
j j n j
n n l j n n C
p
p nC
p
p --+--+----===
--+
-∑∑
2
1
2
212
10
=(1)(1)
(1)
n n l l n l
j j n j
n n l j n n p
C
p p np C p p --------==--+-∑∑2
(1)n n p np =-+
222
()(1)(1)D n n p np n p np p ξ=-+-=-
3.二项分布最可能的值
二项分布中X 可以取值0,1,2,,n 。使概率()P X k =取最大值的k ,记作0k ,称0k 为二项分布的最可能值。 00
0P(=k )
1 (1)
P(=k -1)P(=k )
1 (2) P(=k +1)
ξξξξ?≥???
?
??≥?? 00P(=k )1P(=k -1)
ξξ≥
000
00
k
k
n k 0n k 1
k 1n k
1
n 0(n k 1)P
C P q =1C P
q
k q
----
+-+≥
00(n k 1)p k q -+≥ 00np k p p k q -+≥ 0 k n p p
∴≤+ 00P(=k )1P(=k +1)
ξξ≥
000000k k
n k 0n k 1
k 1
n k 1
n
0(k 1)q C P q =
1C
P
q
(n-k )p
-++--+≥
00(k 1)q (n-k )p +≥ 0 k n p p -1∴≥+ 0 np+p-1k np p ∴≤≤+
[]0np p np+p-1 np+p k =np+p +??∴?
??和当为整数时
其他
而且从二项分布的图形特点也可以看出来:对于固定n 及p ,当k 增加时 ,概率P(X=k) 先
是随之增加直至 达到最大值, 随后单调减少.
例:某批产品中有80%的一等品,对它们进行重复抽样检验,共取出4个样品,求其中一等品数ξ的最可能值,并用贝努里公式验证。 解 X 服从二项分布,~(4,0.8)X B
3.20.84np p +=+=是整数,所以0043k k ==和时0()P X k =为最大。即取出4个样品时,一等品个数最可能是3或4。 用贝努公式计算X 的分布律下
例:某人进行射击,命中率为0.02,射击400次,至少击中2次的概率。 解:由题意。设击中次数为X , ~(400,0.02)X B
400()(0.02)(0.98)
,0,1,2,,400k
k
k
P X k C k -===
400
1399
400(2)1(0)(1)10.98
0.020.98
0.9972P X P X P X C ≥=-=-==--?≈
可以看出计算量非常大。因此必须寻求近似方法。 说明:尽管每一次射击的命中率非常小,但如果射击的次数很大,命中目标的概率就非常大。
四、普哇松分布
在历史上普哇松分布是作为二项分布的近似函数,于1837年有法国数学家普哇松(Poisson )首次提出。 1.定义
如果随机变量X 的概率函数为 k
~{},0,1,2,... !
X P X k e
k k λ
λ
-==
=
其中 0λ> ,则称X 服从普哇松(Poisson) 分布。
利用级数k
k=0
=e k!
x
x
∞
∑
,k k
k=0
k=0
e
=e
=e
e =1k!
k!
λ
λ
λ
λ
λ
λ
∞
∞
---?∑
∑
近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一。
在实际中,许多随机现象服从或近似服从普哇松分布。像某电话交换台收到的电话呼叫数;到某机场降落的飞机数;一个售货员接待的顾客数;一台纺纱机的断头数;一匹布上的疵点个数;一本书中的错别字个数等等都可近似服从普哇松分布。由此普哇松分布总与计数过程有关,且在一定时间内,一定区域内或一定单位内的前提下进行的。
普哇松分布的方便之处在于其概率的计算可以利用普哇松分布表。查表练习。
2.普哇松定理:
在n 重贝努力试验中,事件A 在每次试验中发生的概率为n p (这里与n 有关),如果n →∞时,n np λ→(λ为常数),则对任意的k ,有
lim (;,)!
k
n n b k n p e
k λ
λ
-→∞
=
定理的条件意味着当 n 很大时,n np 必定很小. 因此,泊松定理表明,当 n 很大,p 很
小时有以下近似式:(1)!
k k
k
n k
n
e
C p p k λ
λ---≈
其中np λ=
在实际中,当20,0.05n p ≥≤时,该近似公式适用。当100,10n np ≥≤效果比较好,可通过查表进行计算。
如例题中可用普哇松分布来计算:400,0.02,8n p np ===
k
8
8
~{},
0,1,2,... 400 !
X P X k e k k -==
=
8
(0)P X e
-==,8(1)8P X e -==
(2)1(0)(1)0.997P X P X P X ≥=-=-==(查表计算)
可进行比较,与精确计算很接近,说明近似效果良好。
3.期望和方差的计算
期望k k 1
1();!
(k 1)!k k E X k
e
e
k λ
λ
λ
λ
λλ-∞
∞
--===
==-∑∑
方差:m
m 2
2
m 0
m 1
m ()m
m !
(m 1)!
e
E e
λ
λ
λ
λξ-∞
∞
-===
=
-∑∑
2
=λλ+
()D ξλ∴=
例1 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?
解:设该商品每月的销售数为X ,已知X 服从参数λ=5的泊松分布.
设商店在月底应进某种商品m 件,求满足()0.95P X m ≤≥的最小的m 。
5
5
()0.95!
k
m
k P X m e
k -=≤=
≥∑
通过查表可得
59
50.968,!
k k e k -=≈∑
58
50.932
!
k
k e k -=≈∑
因此,9m = 例:设某城市每年因交通事故死亡的人数服从普哇松分布,据统计在一年中交通事故死亡一人的概率是死亡两人概率的0.5倍,计算一年中因交通事故至少死亡3人的概率。 解:X 表示一年中因交通事故死亡的人数。由此X 服从参数λ的普哇松分布 k
~{},0,1,2,... !
X P X k e
k k λ
λ
-==
=
1(1)(2)2
P X P X ==
= 2
122
e
e
λ
λ
λ
λ--=
4λ=
(3)1(0)(1)(2)0.323323P X P X P X P X ≥=-=-=-==
五、几何分布
例:某射手连续向一目标射击,直到命中为止,已知他每发命中的概率为p ,求所需
射击发数X 的概率函数。
解:显然,X 的可能取值为1,2,
为计算()P X k =,设{}1,2,k A k k == 第发命中,
1(1)()P X P A p ===;12(2)()(1)P X P A A p p ===-;
2
123(3)()(1)P X P A A A p p ===-,
1
()(1)
,1,2,k P X k p p k -==-=
这就是所需射击发数X 的概率函数。
若随机变量的概率函数如上式,则称X 具有几何分布。
1.定义:在独立重复试验中,事件A 发生的概率为p ,设X 为直到A 发生为止所进行的试验的次数, (X 的可能取值为全体正整),
1
1
()(1)
,1,2,k k P X k pq
p p k --====-= 则称X 服从参数为p 的几何分布.
2.期望和方差
1
1
11
k k k k EX kq
p p kq
∞
∞
--===
=∑∑
令1
23
11
1234k k S kq
q q q ∞-==
=++++∑ 1
2
3
4
1
1
2
3
4
k k q S q k q q q q q ∞
-===
++++∑
2
11(1)11q S q q q
-=+++=
- 12
1S p
=
1EX p
=
同理验证 2
2
21q EX
p
p
=
+
2
q D X p
=
例:设X 服从几何分布,则对任何两个正整数,m n ,有 ()()P X m n X m P X n >+>=>
证明:1
1
()1m
k m
k m q
P X m q
p p
q q
∞
-=+>=
==-∑
()()()()
m n n
m
P X m n q
P X m n X m q P X n P X m q
+>+>+>=
=
==>>
该性质称为几何分布的无记忆性,指几何分布对过去的m 次失败的信息在后面的计算中被遗失了。
六、超几何分布
例1 某班有学生20名,其中有5名女同学,今从班上任选4名学生去参观展览,被选到的女同学数ξ是一个随机变量,求ξ的分布。 解 ξ可以取0,1,2,3,4这5个值,
k
4k
515
420
C C P(=k)=
(k=0,1,2,3,4)C ξ-
例:一个袋子中装有N 个球,其中1N 个白球,2N 个黑球(12N N N +=),从中不放回的取了n 个球,求取到白球数X 的分布。 解: 12
(),0,1,,k
n k
N N n N C C P X k k n C
-==
=
1.定义:设N 个元素分为两类,有1N 个属于第一类,2N 个属于第二类(12N N N +=)。从中按不重复抽样取n 个,令X 表示这n 个中第一(或二)类元素的个数,则X 的分布称为超几何分布。其概率函数是 12
(),
0,1,,k
n k
N N n
N C C P X k k n C
-==
=
当n N (即抽取个数远远小于总数N )每次抽取后,总体中1N p N
=改变很小,这
时 不放回抽样等同于放回抽样,即超几何分布可近似为二项分布。
1212k
n N N k k n n n
N N C C P(=k)=
C p q
C
k
k
X --+→
例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后, (1)恰有8粒发芽的概率;(2)不少于8粒发芽的概率。
解 设10粒种子中发芽的种子数目为X 。因10粒种子是由一大批种子中抽取的,这是一个N很大,n 相对于N很小的情况下的超几何分布问题,可用二项分布公式近似计算。
~(10,0.9)X B
8
8
2
10(1) P(X =8)=C 0.90.10.1937??≈
88299110
1010(2) P(X 8)=C 0.90.1C 0.90.10.9
0.9298≥??+??+≈
2.期望和方差
1N E =n
N
ξ 12N N N -n D =n
N
N N -1
ξ
§4.1 常用的连续型随机变量的分布
一、均匀分布
例:某办事员处理一份护照申请书,时间X (单位:分)是一连续型随机变量,若X 的概率密度有如下形式: ,46
()0,c x f x ≤≤?=??其他
这表明,办一份护照申请书的时间至少4分钟,至多6分钟,c 为待定常数。 解:由()f x 为X 的概率密度,则有 (1)()0f x ≥ 即0c ≥ (2)()1f x dx +∞-∞
=?
即6
4
1cdx =? 1
2
c =
见图形:
现求4-4.5,5-5.5间处理一份护照申请书的概率,即为图中这两个区间的面积
1(4 4.5)0.50.252
P X ≤≤=?
= 1
(55.5)
0.50.252
P X ≤≤=?=
由此,可知这两个概率相等。
从图中可看出,底边相等的矩形面积,即X 在两个相等区间上取值机会也相同,即体现了均匀的含义,且称这样的分布为均匀分布。
1.定义:一个随机变量X ,如果其概率密度函数为
1
,()0,a x b f x b a
?≤≤?
=-???
其他,称X 服从[],a b 上的均匀分布,记为~(,)X U a b 服从均匀分布的X ,具有一种等可能性,即它落入[],a b 中任意等长度的子区间的可能性相同,或者说它落入等长度区间内的概率相同,与区间位置无关。 即1()()c l c l c
c
l P c X c l f x dx dx b a
b a
++≤≤+=
=
=
--?
?
分布函数:0,(),1,x a
x a
F x a x b b a x b
?
-?=≤≤?-?>??
2.期望和方差 2
(),2
12
a b b a EX DX +-=
=
(学生练习证明)
3.应用和计算
均匀分布的应用如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差;
公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.
例1 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30, 7:45 等时刻有汽车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量, 试求他候车时间少于5 分钟的概率。 解:以7:00为起点0,以分为单位 依题意, X ~ U ( 0, 30 )
1
,030()30
0,x f x ?<
=???
其它
从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30等时刻有汽车到达汽车站,为使候车时间X 少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30 之间到达车站。所求概率为:
{1015}{2530}P X P X <<+<<15
3010
25
11130
30
3
dx dx =
+
=
?
?
即乘客候车时间少于5 分钟的概率是1/3。
二、指数分布 1.定义
若随机变量X 的概率密度为 0()0
x
e x
f x x λλ-?≥=?
,其中0λ>,则称X 服从参数为λ的指数分布.
易知+++-0
f()=e
=e
()=e
=10
x
x
x
x dx dx d x λλλλλ∞∞∞---∞
+∞-
--?
?
?
它的分布函数为
0 0F()=P(X )=1e 0x
x x x x λ-≤?≤?-≥?当时
当时
对任何实数a,b (0≤a
b
a
b
a b P(a =e =e e a x x dx λλλλλ------? 2.期望和方差 ()x E X x e dx λλ∞ -= ? x xde λ∞ -=-?0 x x xe e dx λλ∞ ∞--=-+?1 λ = 3.应用 指数分布常用来作为各种“寿命”分布的近似。如随机服务系统中的服务时间,某些消耗性产品(电子元件等)的寿命等等,都常被假定服从指数分布。 假若产品的失效率为λ,则产品在t( t>0) 时间失效的分布函数: t F(t)=P(X t)=1e λ-≤- 而产品的可靠度为:t R (t)=P(X >t)=1F(t)=e λ-- 例: 某元件寿命X 服从参数为λ(1λ- =1000)的指数分布。3个这样的元件使用1000小时后,都没有损坏的概率是多少? 解:参数为λ的指数分布的分布函数为 1000 F()=P()=1e x x X x - ≤- 1 P(X>1000)=1P(X 1000)=1F(1000)=e --≤- 各元件寿命相互独立,因此3个这样的元件使用1000小时都未损坏的概率为 3 13 3 [P(X 1000)]=[e ]=e 0.05--≈ 例 .电子元件的寿命ξ(年)服从参数为3的指数分布 (1)求该电子元件寿命超过2年的概率。 (2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少? 解:330()0 0, x e x x x ?-?>=? ≤? 3336 2 2 (1){2}33=,.x x x p X e dx e d x e e ∞ ∞ ----∞>= =--=-??+()2 { 3.5, 1.5} (2){ 3.5| 1.5}{ 1.5} p X X p X X p X >>>>= >36 3.531.5 33x x e dx e e dx ∞ --∞ -= =?? 由这个例子,可以看出()()P X a t X a P X t >+>=>这表明,已知寿命长于a 年,则再活t 年的概率与年龄无关,故又可将指数分布称为“永远年青”的分布。 实际应用与保险中。 三、正态分布 正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。它是由十九世纪前叶数学家高斯加以推广,所以也称为高斯分布。 许多事件问题中的变量,如年降雨量,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成年男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.即具有“中间大、两头小”的特点。 (一)正态分布的定义及图形特点 1.定义:如果连续型随机变量X 的概率密度为 2 2 ()2(),x x x μσ ?-- = -∞<<∞ 其中μ和2σ都是常数,μ任意,σ>0,则称X 服从参数为 μ和2σ的正态分布。 记作2~(,)X N μσ ()x ?所确定的曲线叫作正态曲线. 可以证明 2 2 ()21 1,x dx μσ -- ∞-∞ =? 证明思路:做变量替换x t μ σ -= 即证2 2 t I e dt ∞- -∞ = =? 先证2 2 2 2 2 t u I e dt e du ∞∞- - -∞ -∞ = ? ? 22 -(t )/2 --e 2u dtdu π∞∞ +∞∞ = =?? 转化为极坐标: cos sin t r u r θθ =?? =? 2 22 2 2r I d e rdr π θπ∞ -==? ? 2.图形特点: 正态分布的密度曲线是一条关于μ对称的钟形曲线,特点是“两头小,中间大,左右对称”。 1)对任意的h ,()()P h X P X h μμμμ-<≤=<≤+ 2)当xμ =时,()x ?取最大值 () ?μ= 3)x距μ越远,() f x值越小,这表明,对同样的长度区间,当区间离μ越远,x落在该区间上的概率越小 4)μ决定了图形的中心位置,σ决定了图形中峰的陡峭程度。 σ越大,曲线越平坦, σ越小,曲线越陡峻,。 3.分布函数 设2 ~(,) X Nμσ,它的分布函数为: 2 2 () 2 (), t x x e dt x μ σ - - -∞ Φ=-∞<<∞ 4.期望和方差 2 , EX D X μσ == (二)标准正态分布 0,1 μσ ==的正态分布称为标准正态分布. 其密度函数和分布函数常用 ()x ?和 ()x Φ表示 () x ?2 2 0(), x x x ?- = -∞<<∞ 2 2 0()t x x e dt - -∞ Φ= ? 记作~(0,1)X N 标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。 它的依据是下面的定理: 书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表. (1)0.8413,(1.64)0.9495,(0)0.5Φ=Φ=Φ= 表中给出0x >的概率值,当0x <,该如何查表? 由图形可知,00()1()x x Φ-=-Φ 00(1)1(1)10.84130.1587Φ-=-Φ=-= 例1:设~N(0,1),P( 1.96),P(-1.96),P( 1.96),P(-12)X X X X X ≤≤≤≤ 求(1) (2)()0.7019,()0.9242,()0.2981P X a P X b P X c ≤=<=≤=已知,求,,a b c 解:(1)0( 1.96)(1.96)0.975P X ≤=Φ= 00( 1.96)( 1.96)1(1.96)10.9750.025P X ≤-=Φ-=-Φ=-= 000( 1.96)( 1.96 1.96)(1.96)( 1.96)2(1.96)10.95P X P X ≤=-≤≤=Φ-Φ-=Φ-= 0000(12)(2)(1)(2)(1)10.8185P X -<≤=Φ-Φ-=Φ+Φ-= () x Φ 图2.7 正态分布曲线(2121σσμμ<<,) (2)查表得 0()0.7019,0.53 a a Φ== 000()()()()2()10.9242P X b P b X b b b b ≤=-≤≤=Φ-Φ-=Φ-= 0()0.9621, 1.78b b Φ== 000()1()0.2981,()0.7019c c c Φ=-Φ-=Φ-=0.53c =- 总结:若~(0,1)X N 00()()()P a X b b a <<=Φ-Φ 0()()2()1P X b P b X b b ≤=-≤≤=Φ- (三)一般正态分布与标准正态分布的关系 定理 如果22~N (,) ,~N (0,1)ξμση 其概率密度分别记为0()()x x ??及,分布函数分别记为0()()x x ΦΦ及 01 -(1) ()= x x μ??σ σ?? ??? 0-(2) ()= x x μσ?? ΦΦ ? ?? 证明:2 2()2(1) ()x x μσ ?--= 2 1211= x μσ-?? - ??? 01 -= x μ?σ σ?? ??? 01 - () x x μ??σ σ?? ∴= ??? (2) ()P()x x ξΦ= ≤2 2 (t )2-=t x d μσ -- ∞ ?t- y μ σ 令 = 2 -2 - x y dy μ σ - ∞ ? 0- = ( )x μ σ Φ 0 - ( )() x x μ σ ∴Φ=Φ 定理 :设2 ~(,)X N μσ,则~(0,1)X Y N μ σ -= 称随机变量函数(-) X μσ Y = 为标准化变换。 根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问 题. 证: F ()=P(Y )Y x x ≤ X -=P( )x μ σ ≤=P()X x σμ≤+=()x σμΦ+ 0-=( )x σμμ σ +Φ0=()x Φ 2 Y~N(0,1)∴ 例:2 ~N(8 , 0.5),P(81)P(10)X X X -≤ 求及 解:22 8 X ~N (8 , 0.5) ~N (0 , 1)0.5 X -∴ P(81)X - 8=P 20.5X ?-? ??? 0=2(2)1Φ-=20.97725-1=0.9545? P(X 10) 8108=P 0.50.5X --?? ??? 0=(4)Φ=0.999 968 33 例:2~N (,),P(5)=0.045,P(3)=0.618ξμσξξ≤-≤,μσ求及。 解:0-5P (-5)=( )=0.045μ ξσ-≤Φ 00-5-5( )=(-)μ μ σσ+ΦΦ05=1-( )=0.045 μ σ +Φ 05 ( )=1-0.0450.955μ σ +Φ得= 03P (30.618μ ξσ -?? ≤Φ ??? )== 5 1.730.3 μ σ μσ +???? -???== 0.84μσ?∴??== 总结:若2~(,),X N μσ~(0,1)X Y N μ σ-= ()P a X b <<( )a b P Y μ μ σ σ --=≤≤ 00( )( )b a μ μ σσ --=Φ-Φ (四)3σ准则 由标准正态分布的查表计算可以求得 当~(0,1)X N 0(1)2(1)10.6826P X ≤=Φ-= 0(2)2(2)10.9544P X ≤=Φ-=,0(3)2(3)10.9974P X ≤=Φ-= 这说明,X 的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%. 将上述结论推广到一般的正态分布,2 ~(,)Y N μσ时 (||)0.6826P Y μσ-≤= (||2) 0.954P Y μσ-≤= (||3)0.9974P Y μσ-≤= 可以认为,Y 的取值几乎全部集中[3,3]μσμσ-+区间内,这在统计学上称为3σ准则 例:公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子 身高2 ~(170,6)X N ,问车门高度应如何确定? 解: 设车门高度为h cm,按设计要求 ()0.01P X h ≥≤ 或()0.99P X h <> 下面我们来求满足上式的最小的h . 因为2~(170,6)X N , 170~(0,1)6 X N - 0170()( )0.996 h P X h -<=Φ≥,查表得0(2.33)0.99010.99Φ=> 所以 170 2.336 h -=,即170 2.336184h =+?= 设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01。 例:某重点大学招收研究生800人,按考试成绩从高分至低分依次录取。 设报考该大学的考生共3000人,且考试成绩服从正态分布,已知这些考生中成绩在600分以上的有200人,重点线(500分)以下的2075人,问该大学的实录线(即录取最低分)是多少? 分析 设学生考试成绩 X~N(2,μσ) ,首先应求出μ及2σ之值,然后根据录取人数占总人数的比例,再应用正态分布概率公式算出实录最低分。 解 设学生成绩X~N(2,μσ),由题设知应有 200(600)0.06673000 2075(500)0.6917 3000P X P X ? ≥==??? ?<==?? 从而得6005001()0.0667,( )0.6917μ μ ΦΦσ σ ---== 即600500( )0.9333 ( )0.6917 μ μ σ σ --Φ=Φ=以及 查表得 600 1.55000.5 μ σ μσ-?=???-?=?? 解之得 450100μσ=??=? 故知,X~N(2450,100) 又设该大学实录线为a ,由题设知: 800()0.26673000 P X a ≥= =即4501( )0.2667 100 a --Φ= 450 ( )0.7333100a -Φ=于是可得 查表得 450 0.623,100 a -=512.3.a =解之得 即是说该大学的实录线约为512分。 如果二维随机变量(,)X Y 的联合密度函数为 22 1122 222 1122 ()()()() 1 (,)[2]},, 2(1) x x y y p x y x y μμμμ ρ ρσσσσ ---- =--+-∞<<+∞ - 则称(,) X Y服从二维正态分布,记为22 1212 (,)~(,,,,). X Y Nμμσσρ其中五个参数的取值范 围分别是: 1212 ,;,0;1 1. μμσσρ -∞<<+∞>-<< 以后将指出: 12 , μμ分别是X与Y的均值,22 12 , σσ分别是X与Y的方差,ρ是X与Y的相关系数。 1、均匀分布(uniform) 定义:设连续型 随机变量X的分布函数为F(x)=(x-a)/(b-a),a≤x≤b 则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]. 若[x1,x2]是[a,b]的任一子区间,则P{x1≤x≤x2}=(x2-x1)/(b-a) 这表明X落在[a,b]的子区间内的概率只与子区间长度有关,而与子区间位置无关,因此X落在[a,b]的长度相等的子区间内的可能性是相等的,所谓的均匀指的就是这种等可能性. 在实际问题中,当我们无法区分在区间[a,b]内取值的随机变量X取不同值的可能性有何不同时,我们就可以假定X服从[a,b]上的均匀分布 若随机变量X的密度函数为 则称随机变量X服从区间[a,b]上的均匀分布。记作X~U(a,b). 均匀分布的分布函数为 图像如下图所示: 均匀分布的数学期望E(X)=1/(2*(b+a)),方差为D(X)=1/(12*(b-a)2)。 2、正态分布 如果连续型随机变量X的密度函数为 其中,-∞ 3.F分布 F分布定义为: 设X、Y为两个独立的随机变量,X服从自由度为k1的>2分布,Y服从自由度为k2的>2 分布,这2 个独立的>2分布被各自的自由度除以后的比率这一统计量的分布。即:上式F服从第一自由度为k1,第二自由度为k2的F分布 F分布的性质 1、它是一种非对称分布; 2、它有两个自由度,即n1 -1和n2-1,相应的分布记为F(n1 –1,n2-1),n1 –1通常称为分子自由度,n2-1通常称为分母自由度; 3、F分布是一个以自由度n1 –1和n2-1为参数的分布族,不同的自由度决定了F 分布的形状。 4、F分布的倒数性质:Fα,df1,df2=1/F1-α,df1,df2 密度函数表达式 概率论中几种常用的重要的分布 摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。其在实际中的应用。 关键词 1 一维随机变量分布 随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常 用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论. 随机事件是按试验结果而定出现与否的事件。它是一种“定性”类型的概念。为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。称这种变数为随机变数。本章内将讨论取实值的这种变数—— 一维随机变数。 定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P X x x =∈-∞=-∞ +∞. 这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。它是一个普通的函数。成这个函数为随机函数X 的分布函数。 有的随机函数X 可能取的值只有有限多个或可数多个。更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈= 称这样的随机变数为离散型随机变数。称它的分布为离散型分布。 【例1】下列诸随机变数都是离散型随机变数。 (1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。称这种随机变数的分布为退化分布。一个退化分布可以用一个常数a 来确定。 (2)X 可能取的值只有两个。确切地说,存在着两个常数a ,b ,使 ([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。如果([])P X b p ==,那 么,([])1P X a p ===-。因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。 特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。从而,一个零-壹分布可以用一个在区间(0,1)内的值p 来确定。 (3)X 可能取的值只有n 个:12,...,a a (这些值互不相同),且,取每个i a 值 第十二章几种主要的大众传播效果理论 第一节大众传播与环境认知——“议程设置”Agenda-setting ?美国传播学者M.E.麦库姆斯和D.L肖“议程设置”(the agenda-setting )理论 ?Agenda-setting: how to think what to think about ?一、“议程设置功能”理论的主要内容 ?1、假说的提出 ?M.E.麦库姆斯和唐纳德.L.肖研究了1968年总统竞选情况,具体分析了当地报纸及晚间新闻,其目的是探讨媒介在总统竞选 活动中对选民们判断什么是重要问题所起的作用,主要就公众 对特殊问题的注意力和对重要问题的判断力进行测定。 ?2、研究方法 ?(1)对选民进行抽样调查 ?(2)对8家传播媒介的同期报道进行内容分析 把内容分析与问卷调查的结果对比,发现媒介议题与选民议题非常一致,其相关系数在0.96以上。 ?3、“议程设置功能”理论的主要内容 ?1972在《舆论季刊》发表《大众传播的议程设置功能》 ?大众媒介具有一种突出报道什么问题就会引起大众特别重视什么问题的功能,这种功能是大众传播重要的社会效果之一。大 众传媒越是突出某个议题或某个事件就越会影响公众关心此议 题或事件。这就是媒介的“议程设置功能”。 ?“某些话题或争论的焦点,如果被大众媒介强调,它们在公众心目中的重要性、显著性也会随之增长” ?二、“议程设置功能”理论的特点 ?1、传播效果分为认知、态度和行动三个层面,议程设置功能假说着眼于这个过程的最初阶段即认知层面。 ?2、议程设置功能揭示的是作为整体的大众传播具有较长时间跨度的一系列报道活动所产生的中长期的、综合的、宏观的社会效果。 ?3、议程设置功能暗示了传播媒介是从事“环境再构成作业”的机构。 ?三、“议程设置功能”概念发展 ?1、“议程设置功能”的作用机制趋于明确化 ?知觉模式(0/1效果) ?显著性模式(0/1/2 效果) ?优先顺序模式(0/1/2/n 效果) ?2、对“议题”不同类型进行较为深入的研究 ?个人议题、谈话议题、公共议题 ?3、分析不同媒体“议程设置”的不同特点 ?四、受众属性对议程设置效果的影响 ?1、受众对各种议题的经验程度:经验越是间接受媒介的影响越大; 常用连续型分布性质汇总及其关系 1. 常用分布 1.1 正态分布 (1)若X 的密度函数和分布函数分别为 ()( )()22 222(), . ,. x t x p x x F x e dt x μσμσ-- -- -∞ = -∞<<+∞= -∞<<+∞ 则称X 服从正态分布,记作()2~,,X N μσ,其中参数,0.μσ-∞<<+∞> (2)背景:一个变量若是由大量微小的、独立的随机因素的叠加结果,则此变量一定是正态变量。测量误差就是由量具零点偏差、测量环境的影响、测量技术的影响、测量人员的心理影响等等随机因素叠加而成的,所以测量误差常认为服从正态分布。 (3)关于参数,μσ: μ是正态分布的的数学期望,即()E X μ=,称μ为正态分布的位置参 数。μ为正态分布的对称中心,在μ的左侧和()p x 下的面积为0.5;在 μ的右侧和()p x 下的面积也是0.5,所以μ也是正态分布的中位数。 2σ是正态分布的方差,即2().Var X σ=σ是正态分布的标准差,σ愈小,正态分布愈集中,σ愈大,正态分布愈分散。σ又称为是正态分布的的尺度参数。 (4)称0,1μσ==时的正态分布(0,1)N 为标准正态分布。记U 为标准正 态分布变量,()u ?和()u Φ为标准正态分布的密度函数和分布函数。 ()u ?和()u φ满足: ()()()(); 1. u u u u ??-=Φ-=-Φ (5)标准化变换: 若()2~,,X N μσ则()~0,1.X U N μ σ -= (6)若()2~,,X N μσ则对任意实数a 与b ,有 ()( ),()1( ),()( )( ),b P X b a P a X b a P a X b μ σ μ σμ μ σ σ -≤=Φ-<=-Φ--<≤=Φ-Φ 0.6826,1,()()()0.9545,2,.0.9973, 3.k P X k k k k k μσ=?? -<=Φ-Φ-==??=? (7)特征函数 22 ()exp{}.2 t t i t σ?μ=-(标准正态分布2()exp{}2t t ?=-) 1.2.均匀分布 (1)若X 的密度函数和分布函数分别为 1 ().0 a x b P x b a else ?<=-??? 0,, (),. 1, .x a x a F x a x b b a x b ?-? =≤-?≥?? 则称X 服从区间(,)a b 上的均匀分布,记作()~,.X U a b (2)背景:向区间(,)a b 随机投点,落点坐标X 一定服从均匀分布 (),.U a b (3)()2 (),().212 b a a b E X Var X -+== 一、常见数据类型 在正式的解释分布之前,我们先来看一看平时遇到的数据。数据可大致分为离散型数据和连续型数据。 离散型数据 离散型数据顾名思义就是只取几个特定的值。例如:当你掷骰子的时候,结果只有1,2,3,4,5,6,不会出现类似1.5,2.5。 连续型数据 在一个给定的范围内,连续型数据可以取任意值。这个范围可以是有限的或者是无穷的。例如:一个人的体重或者身高,可以取值54kg,54.4kg,54.33333kg等等都没有问题。 下面就开始介绍分布的类型。 二、分布类型 伯努利分布(Bernoulli Distribution) 首先从最简单的分布开始,伯努利分布实际上是一个听起来最容易理解的分布。伯努利分布一次实验有两个可能的结果,比如1代表success及0代表failure。随机变量X X一个取值为1并代表成功,成功概率为p p,一个取值为0表示失败,失败概率为q q或者说1?p1?p。 这里,概率分布函数为p x(1?p)1?x px(1?p)1?x,其中x∈(0,1)x∈(0,1),我们也可以写成如下形式: P(x)={1?p,p,x=0x=1P(x)={1?p,x=0p,x=1 成功和失败的概率没必要相同,也就是没必要都是0.5,但是这俩概率加和应该为1,比如可以是下面的图:几种重要的概率分布
概率论中几种常用重要分布
第十二章 几种主要的大众传播效果理论
常用连续型分布性质汇总及其关系
几种常见的分布