第三章 概率与概率分布
合集下载
统计学第3章-概率、概率分布与抽样分布

3-15
互斥事件及其概率
(例题分析)
解:由于每一枚硬币出现正面或出现反面的概率 都是1/2,当抛掷的次数逐渐增大时,上面的4个 简单事件中每一事件发生的相对频数 (概率)将近 似等于 1/4 。因为仅当 H1T2 或 T1H2 发生时,才会 恰好有一枚硬币朝上的事件发生,而事件 H1T2 或 T1H2 又为互斥事件,两个事件中一个事件发 生或者另一个事件发生的概率便是 1/2(1/4+1/4) 。 因此,抛掷两枚硬币,恰好有一枚出现正面的概 率等于 H1T2 或 T1H2 发生的概率,也就是两种事 件中每个事件发生的概率之和
解:设 A = 某住户订阅了日报 B = 某个订阅了日报的住户订阅了晚报
依题意有:P(A)=0.75;P(B|A)=0.50
P(AB)=P(A)·P(B|A)=0.75×0.5=0.375
3-31
独立事件与乘法公式
(例题分析)
【例】从一个装有3个红球2个白球的盒子里摸球 (摸出后球不放回),求连续两次摸中红球的概率
3-17
互斥事件的加法规则
(例题分析)
【例】抛掷一颗骰子,并考察其结果。求出其点 数为1点或2点或3点或4点或5点或6点的概率
解:掷一颗骰子出现的点数(1,2,3,4,5,6)共有
6个互斥事件,而且每个事件出现的概率都为1/6 根据互斥事件的加法规则,得
P(1或2或3或4或5或6) P(1) P(2) P(3) P(4) P(5) P(6) 1 1 1 1 1 1 1 6 6 6 6 6 6
合计
从这200个配件中任取一个进行检查,求 (1) 取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率 (3) 取出一个为供应商甲的正品的概率 (4) 已知取出一个为供应商甲的配件,它是正品的概率
互斥事件及其概率
(例题分析)
解:由于每一枚硬币出现正面或出现反面的概率 都是1/2,当抛掷的次数逐渐增大时,上面的4个 简单事件中每一事件发生的相对频数 (概率)将近 似等于 1/4 。因为仅当 H1T2 或 T1H2 发生时,才会 恰好有一枚硬币朝上的事件发生,而事件 H1T2 或 T1H2 又为互斥事件,两个事件中一个事件发 生或者另一个事件发生的概率便是 1/2(1/4+1/4) 。 因此,抛掷两枚硬币,恰好有一枚出现正面的概 率等于 H1T2 或 T1H2 发生的概率,也就是两种事 件中每个事件发生的概率之和
解:设 A = 某住户订阅了日报 B = 某个订阅了日报的住户订阅了晚报
依题意有:P(A)=0.75;P(B|A)=0.50
P(AB)=P(A)·P(B|A)=0.75×0.5=0.375
3-31
独立事件与乘法公式
(例题分析)
【例】从一个装有3个红球2个白球的盒子里摸球 (摸出后球不放回),求连续两次摸中红球的概率
3-17
互斥事件的加法规则
(例题分析)
【例】抛掷一颗骰子,并考察其结果。求出其点 数为1点或2点或3点或4点或5点或6点的概率
解:掷一颗骰子出现的点数(1,2,3,4,5,6)共有
6个互斥事件,而且每个事件出现的概率都为1/6 根据互斥事件的加法规则,得
P(1或2或3或4或5或6) P(1) P(2) P(3) P(4) P(5) P(6) 1 1 1 1 1 1 1 6 6 6 6 6 6
合计
从这200个配件中任取一个进行检查,求 (1) 取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率 (3) 取出一个为供应商甲的正品的概率 (4) 已知取出一个为供应商甲的配件,它是正品的概率
概率论第三章 多维随机变量及其分布

1 3
概率论
y
y x
o
x
概率论
四、课堂练习
设随机变量(X,Y)的概率密度是
f
x,
y
k
6
x
y,
0,
0 x 2,2 y 4, 其它.
(1) 确定常数 k;
(2) 求概率 PX 1,Y 3 .
解 (1) 1 f x, ydxdy
R2
k
2 dx
46
0
2
x
y dy
k
2 dx
46
概率论
同理, Y的分布律为:
P{Y y j} pij ˆ p•j , j 1,2,, i1
分别称pi• (i 1, 2,), 和p• j , (j 1, 2,)为(X, Y)关于 X和关于Y的边缘分布律.
概率论
例1 把一枚均匀硬币抛掷三次,设X为三次 抛掷中正面出现的次数 ,而 Y 为正面出现次数与 反面出现次数之差的绝对值 , 求 (X ,Y) 的分布律 和边缘分布律.
也就是说,对于给定的
不同的 对应
不同的二维正态分布,但它们的边缘分布却都是一样的.
此例表明 由边缘分布一般不能确定联合分布.
概率论
五、小结
1. 在这一讲中,我们与一维情形相对照,介 绍了二维随机变量的边缘分布. 2. 请注意联合分布和边缘分布的关系: 由联合分布可以确定边缘分布; 但由边缘分布一般不能确定联合分布.
随机变量维(X,Y )的概率密度 , 或 称为随机变量 X 和 Y 的联合概 率密度.
概率论
一维随机变量X
连续型
F x x
f tdt
x
X的概率密度函数
f x x R
概率分布函数

第三章 几种重要的概率分布
例 4 一页书上印刷错误的个数 X 是一个离散型随机变量,它服从参数 为 的泊松分布,一本书共有 300 页,有 21 个印刷错误,求任取 1 页 书上没有印刷错误的概率。 21 7 解:由于 300 页中有 21 个印刷错误,从而平均每页有 个印刷
300 100 7 错误,即离散型随机变量 X 的数学期望 E ( X ) , 100 又由于离散型随机变量 X 服从参数为 的泊松分布,因此数学期望
由概率加法公式得:
n
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m m nm 且 b(m; n, p) Cn p q ( p q) n 1 n
概率 b(m; n, p) 实际上是二项式 ( p q) n 的展开式中的通项公式。
2 2
返回主目录
第三章 几种重要的概率分布
小结与提问: 本次课,我们介绍了贝努里概型与二项公式、二项分布。 二项分布是离散型随机变量的概率分布中的重要分布,我们 应掌握二项分布及其概率计算,能够将实际问题归结为贝努
里概型,然后用二项分布计算有关事件的概率、数学期望与
方差。。 课外作业:P150 习题三 3.01,3.02,3.03,3.04,3.05
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m 0
m 0
称为概率计算的二项公式。
返回主目录
第三章 几种重要的概率分布
二、二项分布
定义 如果随机变量 X 的概率分布为
i PX i C n p i q n i
(0 p 1, p q 1)
第3章 常用概率分布(田间试验与统计分析 四川农业大学)

P(“至少1粒种子出苗”) = P(x=1)+P(x=2)+…+P(x=6) = C610.6710.335 C62 0.6720.334 C66 0.6760.330 = 0.0157+0.0799+0.2162 +0.3292+0.2672+0.0905 = 0.9987
二项分布的应用条件:
在统计学上,把小概率事件在一次试验中 看成是实际不可能发生的事件称为小概率事件 实际不可能性原理,亦称为小概率原理(small probability principle)。
小概率事件实际不可能性原理是统计学上 进行假设检验(显著性检验)的基本依据。
第二节 概率分布
事件的概率表示了一次试验某一个结果发生的 可能性大小。
标准正态分布的概率密度函数及分布函数分别 记作ψ(u)和Φ(u)。
(u)
1
u2
e2
2
(u) 1
u 1u2
e 2 du
2
u~N(0,1)
对于任何一个服从正态分布N(μ,σ2)的随 机变量x,都可以通过标准化变换:
u x
将其变换为服从标准正态分布的随机变量u。
一、正态分布的定义及其特征
(一) 正态分布的定义 若连续型随机变 量 x 的概率分布密度函数为
其中μ为平均数,σ2为方差,则称随机变量 x 服从正 态分布(normal distribution) , 记为x~N(μ, σ2)。
相应的概率分布函数为:
F(x) 1
e dx x
(
x) 2 2
对于样本是取自连续型随机变量的情况,这 条函数曲线将是光滑的。这条曲线排除了抽样和 测量的误差,完全反映了水稻行产量的变动规律。 这条曲线叫概率分布密度曲线,相应的函数叫概 率分布密度函数 。
第三章 常用概率分布之正态分布

图4.13 离均差的绝对值≤1 , 2 和3 的概率值
随机变量x在区间( μ – kσ, μ + kσ )外取值的概率P ( x<μ – kσ ) + P( x>μ + kσ )为两尾概率,记为α P ( x<μ – kσ ) + P( x>μ + kσ )=α P ( x<μ – kσ ) = P( x>μ + kσ )=α/2 两尾分位数Uα
=0.0227
0.020
fN (x)
0.020
fN (x)
0.016
0.016
0.012
0.012
0.008
P( y 40) 0.9773
P( y 26) 0.2119
0.008
0.004
0.004
0.000 10 15 20 25 30 35 40 45
0.000 10 15 20 25 30 35 40 45
第三章
常用概率分布
第一节 事件与概率 第二节 概率分布 第三节 二项式分布 第四节 正态分布 第五节 样本平均数抽样分布与标准误 第六节 t分布,x2分布和F分布
第三章
常用概率分布
第一节 事件与概率 第二节 概率分布 第三节 二项式分布 第四节 正态分布 第五节 样本平均数抽样分布与标准误 第六节 t分布,x2分布和F分布
首先计算:
查附表2,当u=-0.8时,FN(26)=0.2119,说明这 一分布从-∞到26范围内的变量数占全部变量数的 21.19%,或者说,y≤26概率为0.2119. 同理可得: FN(40)=0.9773
所以:P(26<y≤40)=FN(40)-FN(26)=0.9773-0.2119
概率论第三章

若二维随机变量( 若二维随机变量(X,Y)具有概率密度 ) 1 1 x − µ1 2 f (x, y) = exp{− ) 2 [( 2 2(1− ρ ) σ1 2πσ1σ2 1− ρ x − µ1 y − µ2 y − µ2 2 )( ) +( ) ]} − 2ρ( 其中
µ1, µ2,σ1,σ2, ρ
3.1.2、二维随机变量的联合分布函数 、 维随机变量的联合 联合分布函数
二维随机变量( 二维随机变量(X,Y) ) ( X , Y )的联合分布函数 )的联合分布函数
一维随机变量X 一维随机变量 X的分布函数 的分布函数
F(x, y) = P(X≤ x,Y ≤ y) − ∞ < x, y < ∞
xi ≤3yj ≤2
求:F(3,2) = P(X≤ 3,Y ≤ 2) = ∑∑pij
1 1 1 1 = + 0+ 0+ + + 0 = 4 8 8 2
例2 设随机变量 Y ~ E (1) ,随机变量
0 , 若Y ≤ k ( k = 1,) 2 Xk = 1 , 若Y > k 的联合概率分布列。 求 X 1 和 X 2 的联合概率分布列。
第三章 多维随机变量及其分布
到现在为止, 到现在为止,我们只讨论了一维随机变量 及其分布. 及其分布. 但有些随机现象用一个随机变量来 描述还不够, 描述还不够,而需要用几个随机变量来描述 在打靶时, 在打靶时,命中点的位置是由一 对随机变量(两个坐标)来确定的. 对随机变量(两个坐标)来确定的. 飞机的重心在空 中的位置是由三个随 机变量(三个坐标) 机变量(三个坐标)来 确定的等等. 确定的等等.
1/ 4 x 1 1 解: (3)P( X < ,Y < ) = ∫0 [∫0 3xdy]dx 4 2
第三章 概率分布

f(0)
0.0039
0.0039
f(1)
0.0469
0.0508
f(2)
0.2109
0.2617
f(3)
0.4219
0.6836
f(4) 总和
0.3164 1.0000
1.0000
NP(x) 0.39 4.69 21.09 42.19 31.64 100.00
精品课件
例2:某批鸡种蛋的孵化率是0.90,今从该 批种蛋中每次任选5个进行孵化,试求孵出 小鸡的各种可能概率。
(2)当p值趋于0.5时,分布趋于对称。
精品课件
图4—9 n值不同的二项分布比较
图4—10 p值不同的二项分布比 较
精品课件
2、二项分布的参数 • 总体平均数(次数):
μx=np • 总体标准差(次数):
σx= npq
如例1,n=4, p=0.75,可求红花出现的株数为 4×0.75=3株,σ=(4×0.75×0.25)1/2=0.866株
在一般情况下,随机事件的概率p是不可能准确 得到的。通常以试验次数n充分大时随机事件A的 频率作为该随机事件概率的近似值。
即
P(A)=p≈m/n (n充分大)
精品课件
概率有如下基本性质:
1、对于任何事件A,有0≤P(A)≤1; 2、必然事件的概率为1,即P(U)=1; 3、不可能事件的概率为0,即P(V)=0。
精品课件
三、概率计算
(一)事件的相互关系 1、和事件
事件A和事件B至少有一件发生而构成的新 事件称为事件A和事件B的和事件,以A+ B表示。 2、积事件 事件A和事件B同时发生,以A·B表示
精品课件
3、互斥事件 事件A和事件B不能同时发生,A·B=V 如新生儿男为A,女为B
第三章 概率分布

第二节 概率分布
概率:一次试验某一个结果发生的可能性大小 概率分布:试验的全部可能结果及各种可能结果发生 的概率
一、随机变量 随机试验的所有可能结果中,若对于每一种可能结果 都有唯一的实数x与之对应,则称x为随机试验的随 机变量。
【例4.3】 对100头病畜用某种药物进行治疗,其可能 结果是“0头治愈”、 “1头治愈”、“2头治愈”、 “…”、“100头治愈”。若用x表示治愈头数,则x的 取值为0、1、2、…、100。
【例4.4】 孵化一枚种蛋可能结果只有两种,即“ 孵出小鸡”与“未孵出小鸡”。 若用变量x表示试验 的两种结果,则可令x=0表示“未孵出小鸡”,x=1表 示“孵出小鸡”。
【例4.5】 测定某品种猪初生重,表示测定结果的 变量x所取的值为一个特定范围(a,b),如0.5―1.5kg,x 值可以是这个范围内的任何实数。
但在相同条件下进行大量重复试验时,其试验结
果却呈现出某种固有的特定的规律性——频率的稳定
性,通常称之为随机现象的统计规律性
概率
论与数理统计
(二)随机试验与随机事件
1、随机试验 通常我们把根据某一研究目的 ,在一定条件下对 自然现象所进行的观察或试验统称为随机试验。
随机试验满足下述三个特性
(1)可重复性:试验可以在相同条件下多次重复进行; (2)结果多样性:每次试验的可能结果不止一个,并且事先 知道会有哪些可能的结果; (3)未知性:每次试验总是恰好出现这些可能结果中的一个, 但在一次试验之前却不能肯定这次试验会出现哪一个结果。
一类随机现象或不确定性现象:事前不可预言其 结果的,即在保持条件不变的情况下,重复进行观察, 其结果未必相同。即在个别试验中其结果呈现偶然性、 不确定性现象。例
随机现象特点:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p(x)=X的概率函数=P(X=x) 则4粒种子有两粒发芽的概率为:
P(2)
P(x)= C 42p2 q4-2=6×0.92×0.12=0.0486
现已求出某事件发生的概率,若试验N次, 则该事件发生的理论次数为: 理论次数=NP(x) 二项分布的概率累积函数为: F (x) = ΣP(x)=1
二项分布的两个条件:
C43p3q1 C44p4q0
0.2109
0.4219 0.3164 1.000
0.2617
A1 A2 A3 A4 A1 A2 A3 A4
A1 A2 A3 A4 A1 A2 A 3 A4
A1 A2 A 3 A4 A1 A2 A3 A4
又由于以上各种方式中,任何二种方式
都是互不相容的,按概率的加法法则,在4 粒
种子中正好有2粒种子发芽的概率为:
P4(2) = P( A1 A2 A3 A4) + P( A1 A2 A3 A4 ) + …
m m P(A) = p=lim n n
n ∝
在一般情况下,随机事件的概率P是不可能准 确得到的。通常以试验次数n充分大时,随机 事件A的频率作为该随机事件概率的近似值。
任何事件
必然事件 不可能事件 随机事件
0≤P(A)≤1 P(U)=1
P(V)=0 0<P(A)<1
第二部分
概率的计算
(一)事件的相互关系
如果多个事件A1、A2、A3、…、An 彼此独立, 则称之为独立事件群。
如播种两粒玉米,它们的发芽
6
完全事件系
如果多个事件A1、A2、A3、…、An两两互斥, 且每次试验结果必然发生其一,则称事件A1、 A2、A3、…、An为完全事件系。 完全事件系的和事件概率为1,任何一个事 件发生的概率为1/n。即: P(A1+A2+…+An)=1
定理: 若事件A与B互斥,则 P(A+B)=P(A)+P(B)
推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
推理2 P(A)=1-P(A) 推理3 完全事件系的和事件的概率为1。
2 独立事件乘法定理 例:播种玉米,种子的发芽率为90%,每穴两粒,则: A:第一粒种子发芽,P (A) = 0.9, P(A) = 0.1 B:第二粒种子发芽,P (B) = 0.9, P( B ) = 0.1 求: C:两粒种子均发芽 D:一粒种子发芽 E:两粒种子均不发芽 C:两粒种子均发芽, C = AB,P(C) = P(A) P(B) = 0.81 D:一粒种子发芽:D= AB + AB,P(D)=0.9*0.1+ 0.1*0.9=0.18 E:两粒种子均不发芽:E= A B,P(E)=P(A)P(B)=0.1*0.1=0.01
第三章
概率与概率分布
第一节:概率基础知识
一、概率的概念 二、概率的计算 三、概率的分布
一、概率基本概念
(一)事件 定义:在一定条件下,某种事物出现与否 就称为是事件。
自然界和社会生活上发生的现象是各 种各样的,常见的有两类。
在一定条件下必然出现某种结果或必然不出现某种结果。
确定性事件
必然事件(U) (certain event)
Pi
i 1
=1
(二)连续型变量的概率分布
当试验资料为连续型变量,一般通过分组
整理成频率分布表。如果从总体中抽取样本的
容量n相当大,则频率分布就趋于稳定,我们将
它近似地看成总体概率分布。
频 率 密 度
0.25一
0.20一 0.15一 0.10一 0.05一
35 40 45 50 55 60 65 70 75 80 85 90
P(A) = p
抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲丰 K 皮尔逊 K 皮尔逊 投掷次数 4040 12000 24000 发生正面朝上的次数 2048 6019 12012 频率(m/n) 0.5069 0.5016 0.5005
随着实验次数的增多,正面朝上这个事件发生的频 率稳定接近0.5,我们称0.5作为这个事件的概率。
里试验,简称贝努里试验。
在贝努里试验中,独立将此试验重复n次,求在n 次试验中,一种结果A出现x次的概率P(x)是多少。 在种子发芽试验中,设事件A为“种子发芽”,则 A为“种子不发芽”。取4粒种子(n=4)来做试验,求
有2粒种子发芽(x=2)的概率。
在4次试验中,事件A发生2次的方式有以下 C 42种:
频率表明了事件频繁出现的程度,因而其稳定性说
明了随机事件发生的可能性大小,是其本身固有的 客观属性,提示了隐藏在随机现象中的规律性。
概 率
(三)概率(probability,P)
概率的统计定义:设在相同的条件下,进行大量重复试验, 若事件A的频率稳定地在某一确定值p的附近摆动,则称p 为事件A出现的概率。
表 观察4株出现红花的概率分布表 (p=0.75 q=1-p=0.25)
概率函数 Cnxpxqn-x P(x) P(0) P(1) C40p0q4 C41p1q3 0.0039 0.0469 F(x) 0.0039 0.0508 NP(x) 0.39 4.69
P(2)
P(3) P(4) 合计
C42p2q2
a
b
对于一个连续型随机变量x,取值于区间[a,b]内的概 率为函数f(x)从a到b的积分,即:
P(a x b) f ( x)dx
a
b
连续型随机变量的概率由概率分布密度函数所确定。
P( x ) f ( x)dx 1
概率密度函数f(x)曲线与x轴所围成的面积为1。
试验只有两个对立结果,记为A和
二 项 总 体
A,出现概率分别为p和q=1-p。
重复性:每次试验条件不变时,事件A出
现为恒定概率p;
独立性:任何一次试验中事件A的出现与
其余各次试验结果无关。
(二)二项分布的计算
例:豌豆F1为红花和白花,杂交后F2红花:白花=3:1 F1
F2
3:1
若每次观察4株,共观察100次,问红花为0、 1、理: 事件A和事件B为独立事件,则事件A与事 件B同时发生的概率为各自概率的乘积。 P(AB)=P(A)P(B)
推理:A1、A2、…An彼此独立,则
P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)
三、概率分布 (一)离散型变量的概率分布
要了解离散型随机变量x的统计规律,必须知道 它的一切可能值xi及取每种可能值的概率pi。
概率(P)
x1
p1
x2
p2
x3
p3
x4
p4
……..
…….
xn
pn
P (x=xi) = pi, i=1,2,3…
设离散型变量x的所有一切可能值xi(i=1,2,3…),
取相应值的概率为pi,则P (x=xi)称为离散型随机变
量x的概率函数。
离散型变量的概率分布的特点
1≥ Pi≥ 0
(i=1,2,…)
2 积事件
事件A和事件B中同时发生而构成的新事件称 为事件A和事件B的积事件,记作A•B。
n个事件的积,可表示为A1 • A2 • … • An
如调查田间病害发生情况,棉铃虫发生为事件A, 黄萎病发生为B,则棉铃虫与黄萎病同时发生的新 事件为A和B的积事件
3 互斥事件(互不相容事件)
事件A和事件B不能同时发生,则称这两个事 件A和B互不相容或互斥。
如,抽取一位阿拉伯数字,抽取数字为0、1、2….8、9构成了 完全事件系
(二)概率的计算法则 1 互斥事件加法定理 例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。 P(A+B)=P(A)+P(B)=0.672+0.307=0.979 因为P(A)+P(B)+P (C) =1 P(A+B)=1-P(C)=1-0.021=0.979
图3.1 鲢鱼体长的频率分布图
直方图中同一组内的频率是相等的。
直方图中每一矩形的面积就表示该组的频率。
当n无限大时,频率转化为概率,频率密度也转化为概率
密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率 分布也就转化为概率分布了,此曲线为总体的概率密度曲线,
曲线函数f(x)称为概率密度函数。
例:
表 婴儿的性别情况表
性别(x) 概率(P) 0(男) 1(女) 0.517 0.483
此表列出了性别变量的取值及相应值的概率,揭示了观 察婴儿性别试验的统计规律。 用随机变量的可能取值及取相应值的概率来表示随机 试验的规律称为随机变量的分布律或概率函数。
表3-3 离散型变量的概率分布
变量(x)
对立事件
发芽
有芒
成活
无芒
死亡
生物个体
• 二项总体: 这种“非此即彼”的事件构成的 整体 • 二项分布: 二项总体的概率分布
一、二项分布
设有一随机试验,每次试验结果出现且只出现对立事 件A与 A之一,这两种结果是互不相容的,在每次试 验中出现A的概率是p(0<p<1),则出现对立事件 A的
概率是1-p=q,则称这一串重复的独立试验为n重贝努
对离散型变量x的一切可能值xi(i=1,2,3…), 及其对应的概率pi P (x=xi) = pi, i=1,2,3…
例:
表3-2某鱼群的年龄组成 年龄(x) 1 2 3 4 5 6 7
频率(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012
此表给出了该鱼群年龄构成的全部,我们称 之为该鱼群年龄的概率分布。