第3章 几种常见的概率分布律

合集下载

第三章几种常见的概率分布律解读

第三章几种常见的概率分布律解读
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。
(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1) (1) 2 (1)2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
P(2) C42 2 (1)42
** 由此类推到一般情形,在n此贝努利试验中, 共获得x次成功的概率是
P(x) Cnx x (1 )nx
概率
X的概率分布图为
二项分布
0.4
0.35
0.3
0.25
0.2 0.15
0.1
0.05
0
0
1
2
3
4
获得正面的次数x
注意:
0.5时,分布对称; 0.5时,分布偏斜:
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
• 平均数 E( X ) n
定义 n
证明: E( X ) P(x)x x0
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C42种:
ssff sfsf sffs fssf fsfs ffss
注意:C42是从四个位置选取两个位置的组合方式。
依据计算公式Cnx
n! x!(n
, x)!
C42
4! 2!2!
4 3 21=6 21 21
每种方式发生的概率为:

几种常见的概率分布率

几种常见的概率分布率

点数(x)
率(f)
μx P (x)= e –μ . x!
N × P (x)
0
57
0
P(0)=e-3.87 ×3.870/0!=0.0209 54.5072
1
203
203 P(0)=e-3.87 ×3.871/1!=0.0807 210.4656
2
283
766 P(0)=e-3.87 ×3.872/2!=0.1562 407.3696
3
525
1575 P(0)=e-3.87 ×3.873/3!=0.2015 525.5120
4
532
2128 P(0)=e-3.87 ×3.874/4!=0.1949 508.2992
5
408
2040 P(0)=e-3.87 ×3.875/5!=0.1509 393.5472
6
273
1638 P(0)=e-3.87 ×3.876/6!=0.0973 253.7584
几种常见的概率分布率
几种常见的概率分布率

几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
nk
x------在n次抽样中某一种类型的个体数.
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数.

几种常见的概率分布律

几种常见的概率分布律

的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16

ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为

ϕ
3
(1

ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。

概率分布函数

概率分布函数

第三章 几种重要的概率分布
例 4 一页书上印刷错误的个数 X 是一个离散型随机变量,它服从参数 为 的泊松分布,一本书共有 300 页,有 21 个印刷错误,求任取 1 页 书上没有印刷错误的概率。 21 7 解:由于 300 页中有 21 个印刷错误,从而平均每页有 个印刷
300 100 7 错误,即离散型随机变量 X 的数学期望 E ( X ) , 100 又由于离散型随机变量 X 服从参数为 的泊松分布,因此数学期望
由概率加法公式得:
n
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m m nm 且 b(m; n, p) Cn p q ( p q) n 1 n
概率 b(m; n, p) 实际上是二项式 ( p q) n 的展开式中的通项公式。
2 2
返回主目录
第三章 几种重要的概率分布
小结与提问: 本次课,我们介绍了贝努里概型与二项公式、二项分布。 二项分布是离散型随机变量的概率分布中的重要分布,我们 应掌握二项分布及其概率计算,能够将实际问题归结为贝努
里概型,然后用二项分布计算有关事件的概率、数学期望与
方差。。 课外作业:P150 习题三 3.01,3.02,3.03,3.04,3.05
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m 0
m 0
称为概率计算的二项公式。
返回主目录
第三章 几种重要的概率分布
二、二项分布
定义 如果随机变量 X 的概率分布为
i PX i C n p i q n i
(0 p 1, p q 1)

第三章第二次课 几种常见的理论分布

第三章第二次课 几种常见的理论分布

第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。

第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。

难点:二项分布的概率函数特征,正态分布的特征。

一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。

对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。

在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。

在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。

先取n =4,k =2来讨论。

在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。

由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。

4 第三章 几种常见的概率分布律

4 第三章 几种常见的概率分布律

φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y

(
y )2 2 2

2
24
F(y) 1
1 2

y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k

2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2

4. 第三章 几种常见的概率分布律

4. 第三章 几种常见的概率分布律

3.4 正态分布

两头少,中间多,两侧对称
正态分布曲线
μ
22

正态分布的密度函数和分布函数

对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2

x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n

将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15

于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n

即需要72代
0 n 0 n

概率论第三章

概率论第三章

若二维随机变量( 若二维随机变量(X,Y)具有概率密度 ) 1 1 x − µ1 2 f (x, y) = exp{− ) 2 [( 2 2(1− ρ ) σ1 2πσ1σ2 1− ρ x − µ1 y − µ2 y − µ2 2 )( ) +( ) ]} − 2ρ( 其中
µ1, µ2,σ1,σ2, ρ
3.1.2、二维随机变量的联合分布函数 、 维随机变量的联合 联合分布函数
二维随机变量( 二维随机变量(X,Y) ) ( X , Y )的联合分布函数 )的联合分布函数
一维随机变量X 一维随机变量 X的分布函数 的分布函数
F(x, y) = P(X≤ x,Y ≤ y) − ∞ < x, y < ∞
xi ≤3yj ≤2
求:F(3,2) = P(X≤ 3,Y ≤ 2) = ∑∑pij
1 1 1 1 = + 0+ 0+ + + 0 = 4 8 8 2
例2 设随机变量 Y ~ E (1) ,随机变量
0 , 若Y ≤ k ( k = 1,) 2 Xk = 1 , 若Y > k 的联合概率分布列。 求 X 1 和 X 2 的联合概率分布列。
第三章 多维随机变量及其分布
到现在为止, 到现在为止,我们只讨论了一维随机变量 及其分布. 及其分布. 但有些随机现象用一个随机变量来 描述还不够, 描述还不够,而需要用几个随机变量来描述 在打靶时, 在打靶时,命中点的位置是由一 对随机变量(两个坐标)来确定的. 对随机变量(两个坐标)来确定的. 飞机的重心在空 中的位置是由三个随 机变量(三个坐标) 机变量(三个坐标)来 确定的等等. 确定的等等.
1/ 4 x 1 1 解: (3)P( X < ,Y < ) = ∫0 [∫0 3xdy]dx 4 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k 0
m
3. P(x m) Pn (k m)
C
k n
p k q nk
(3-2)
kn0
4. P(x m) Pn (k m)
Cnk p k q nk
(3-3)
k m
m2
5. P(m1 x m2 ) pn (m1 k m2 )
C
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得 P(x k ) 0.5k e 0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布 是相当吻合的 , 进一步说明用波松分布描述单 位容积(或面积)中细菌数的分布是适宜的。
k n
p k q nk
k m1
(m1<m2) (3-4)
二项分布由n和p两个参数决定: 1. 当p值较小且n不大时,分布是偏倚的。但随
着n的增大 ,分布逐渐趋于对称; 2. 当 p 值 趋于 0.5 时 ,分布趋于对称; 3. 对于固定的n及p,当k增加时,Pn(k)先随之
增加并达到其极大值,以后又下降。
如【例3.6】中已判断畸形仔猪数服从波松 分布,并已算出样本平均数=0.51。将0.51代替 公式(3-10)中的λ得:
P( x k ) 0.51k e 0.51 (k=0, 1, 2, …)
k!
因为e-0.51=1.6653,所以畸形仔猪数各项的概 率为:
P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
四、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变
量之平均数μ、标准差σ与参数n、p有如下关系:
当试验结果以事件A发生次数k表示时
μ=np
(3-5)
σ= npq
(3-6)
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差 σ= np=q 5 0.2 0.8
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
4
P(x 4) 1 p(x k) 1 0.9999 0.0001
k 0
把上面各项概率乘以总观察窝数(n=200)即 得各项按波松分布的理论窝数。 波松分布与相 应的频率分布列于表3-2中。
=0.894(头)
3.2 波松分布
波松分布是一种可以用来描述和分析随机地发生 在单位空间或时间里的稀有事件的概率分布。要观察 到这类事件,样本含量 n 必须很大 。
在生物、医学研究中,服从波松分布的随机变量 是常见的。如,一定畜群中某种患病率很低的非传染 性疾病患病数或死亡数,畜群中遗传的畸形怪胎数, 每升饮水中大肠杆菌数,计数器小方格中血球数,单 位空间中某些野生动物或昆虫数等,都是服从波松分 布的。
此外 ,在n较大,np、nq 较接近时 ,二项分布
接近于正态分布;当n→∞时,二项分布的极限分 布是正态分布。
三、二项分布的概率计算及应用条件
【例3.1】 纯种白猪与纯种黑猪杂交,根据孟德尔遗 传理论 , 子二代中白猪与黑猪的比率为3∶1。求窝产 仔10头,有7头白猪的概率。
根据题意,n=10,p=3/4=0.75,q=1/4=0.25。设 10头仔猪中白色的为x头,则x为服从二项分布B(10, 0.75)的随机变量。于是窝产10头仔猪中有7头是白色的 概率为:
其中p>0,q>0,p+q=1,则称随机变量x服
从参数为n和p的二项分布 (binomial distribution),
记为 x~B(n, p)。
二项分布具有概率分布的一切性质,即:
1. P(x=k)= Pn(k) (k=0,1,…,n)
2. 二项分布的概率之和等于1,即
n
Cnk p k q nk (q p)n 1
P(x
7)
C170 0.75 7 0.253

10! 0.757 7!3!
0.2Байду номын сангаас3

0.2503
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗?
一、正态分布的定义及其特征
(一) 正态分布的定义 若连续型随机变量x的概率分布密度
函数为
(x)2
f (x)
1

e 2 2
2
(3-6)
其中μ为平均数,σ2为方差,则称随机变量x服从正态分布 (normal distribution), 记为x~N(μ,σ2)。相应的概率分布函数 为
F (x) 1
第三章 几种常见的概率分布律
3.1 二项分布 3.2 泊松分布 3.3 另外几种离散型概率分布 3.4 正态分布 3.5另外几种连续型概率分布 3.6 中心极限定理
3.1 二项分布
一、贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互 不影响,即每次试验结果出现的概率都不依赖于其它 各次试验的结果,则称这n次试验是独立的。
样本均数和方差S2计算结果如下:
x fk
n
=(120×0+62×1+15×2+2×3+1×4)/200=0.51
fk2 ( fk)2
S2
n
n 1
(120 02 6212 15 22 232 1 42 102 2) / 200
200 1
0.52
【例3.3】 仔猪黄痢病在常规治疗下死亡率为20 %,求5 头病猪治疗后死亡头数各可能值相应的概 率。
设5头病猪中死亡头数为x,则x服从二项分布 B(5, 0.2),其所有可能取值为0,1,…,5,按(3-1) 式计算概率,用分布列表示如下:
0 1 23 4 5
0.3277 0.4096 0.2048 0.0512 0.0064 0.0003
对于n次独立的试验,如果每次试验结果出现且
只出现对立事件A与 A 之一,在每次试验中出现A的 概率是常数p(0<p<1) ,因而出现对立事件 A 的概率是
1-p=q,则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离散 型随机变量,如孵n枚种蛋的出雏数、n头病畜 治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。
x =0.51,S2=0.52,这两个数是相当接近的,
因此可以认为畸形仔猪数服从波松分布。
λ是波松分布所依赖的唯一参数。λ值愈小分布 愈偏倚,随着λ的增大 ,分 布趋于对称(如下图所 示)。当λ= 20时分布接近于正态分布;当λ=50时, 可以认 为波松分布呈正态分布。 所以在实际工作中, 当λ≥20时就可以用正态分布来近似地处理波松分布 的问题。
2
( x )2
e x

2 2
dx

(3-7)
分布密度曲线如图所示。
(二) 正态分布的特征
平均数:
nK
N
方差:
2 nK(N K )( N n)
N 2 (N 1)
2. 负二项分布
负二项分布所要求的条件与二项分布是一样 的。不同的是负二项分布需要求出在第x次试 验时,发生第k次事件A的概率。或者说,在 x次试验中,共发生k次事件A,而且事件A的 第k次试验恰恰是在第x次试验发生的。
注意,二项分布的应用条件也是波松分布 的应用条件。
对于波松分布,当λ→∞时 ,波松分布以正 态分布为极限。在实际计算中, 当 λ≥20 (也 有人认为λ≥6)时,用波松分布中的λ代替正态分 布中的μ及σ2 ,即可由后者对前者进行近似计算。
3.3另外几种离散型概率分布
1、超几何分布 2、负二项分布
假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
p(x 0) C105 0.2000.8015 0.0352
同理,如果疫苗B完全无效,则15头家畜中最多有1头感染的 概率为:
p(x 1) C105 0.200.815 C115 0.210.814 0.1671
1ml水中的细菌数 0 1 2 >=3 合计
次数f
243 120 31 6 400
试分析饮用水中细菌数的分布是否服从波松 分布。若服从,按波松分布计算每毫升水中细菌 数的概率及理论次数并将頻率分布与波松分布作 直观比较。
x 经计算得每毫升水中平均细菌数 =0.500,
方差S2=0.496。两者很接近,故可认为每毫升水
波松分布重要的特征:
平均数和方差相等,都等于常数λ,即
μ=σ2=λ 【例3.5】 调查某种猪场闭锁育种群仔猪畸 形数,共记录200窝, 畸形仔猪数的分布情况 如表3-1所示。试判断畸形仔猪数是否服从波 松分布。
表3-1 畸形仔猪数统计分布
每窝畸形数k 0 1 2 3 >=4 合计
窝数f
120 62 15 2 1 200
p(
x)

C k 1 x 1
k
(1

)
xk
,
x k, k 1,...
3.4 正态分布
正态分布是一种很重要的连续型随机变量 的概率分布。生物现象中有许多变量是服从或 近似服从正态分布的。许多统计分析方法都是 以正态分布为基础的。此外,还有不少随机变 量的概率分布在一定条件下以正态分布为其极 限分布。因此在统计学中,正态分布无论在理 论研究上还是实际应用中 , 均占有重要的地 位。
相关文档
最新文档