几种常见离散型变量的分布及其应用

合集下载

2.2离散型随机变量及其概率分布

2.2离散型随机变量及其概率分布

8
5
k
24
小结
离 散 型 随 机 变 量 的 分 布
二项分布 泊松分布
两点分布
两点分布
n1
二项分布
n 10, p 0.1, np
泊松分布
25
二项分布与 (0 1) 分布、泊松分布之间的 关系 .
二项分布是 (0 1) 分 布 的 推 广 , 对 于n 次 独 立重复伯努利试验 ,每 次 试 验 成 功 的 概 率 为 p, 设 , 1, 若 第 i 次 试 验 成 功 Xi ( i 1,2, , n) . 0, 若 第 i 次 试 验 失 败 它们都服从 (0 1) 分 布 并 且 相 互 独 立 , 那末 X X1 X 2 X n 服 从 二 项 分 布 , 参 数 为( n, p).
定义2 如果随机变量 X 只有两个可能取 值,其概率分布为
P{ X x1 } P , P{ X x2 } q 1 p(0 p 1, p q 1)
则称X服从 x1 , x2 处参数为p的两点分布. 特别,若X服从
x1 1, x 0 处参数为p的两点分布,即
p
k 1
5
k
1
1 a . 15
5
关于分布律的说明:
若已知一个离散型随机变量X的概率分布 X P x1 p1 x2 p2 ... ... xn ... pn ...
则可以求X所生成的任何事件的概率,特别地:
P{a X b} P{ { X xi }} pi
a xi b a xi b
26
以 n, p ( np ) 为参数的二项分布 ,当 n 时趋 于以 为参数的泊松分布 ,即

医学统计学课件:第六章 几种离散型变量的分布及其应用

医学统计学课件:第六章  几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数

概率论与数理统计 第二章 随机变量及其分布 第二节 离散型随机变量及其概率分布

概率论与数理统计 第二章 随机变量及其分布 第二节 离散型随机变量及其概率分布

以X记“第1人维护的20台中同一时刻发生故障的台 数”以Ai ( i 1,2,3,4)表示事件“第i人维护的20台中 ,
发生故障时不能及时维修”, 则知80台中发生故障
而不能及时维修的概率为
三、几种常见离散型随机变量的概率分布
P ( A1 A2 A3 A4 ) P ( A1 )
三、几种常见离散型随机变量的概率分布
3、独立重复试验与二项分布 (1)独立重复试验
三、几种常见离散型随机变量的概率分布
例5 某射手在一定条件下,独立地向目标连续射 击4次,如果每次击中目标的概率为0.8,求 ①恰好中三次的概率;②至少击中三次的概率。
三、几种常见离散型随机变量的概率分布
例5 某射手在一定条件下,独立地向目标连续射 击4次,如果每次击中目标的概率为0.8,求 ①恰好中三次的概率;②至少击中三次的概率。
三、几种常见离散型随机变量的概率分布
练习1 某类灯泡使用时数在1000小时以上 的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X为三个灯泡在使用10ห้องสมุดไป่ตู้0小时已坏的灯泡数 . 把观察一个灯泡的使用 时数看作一次试验, “使用到1000小时已坏” P{X 1} =P{X=0}+P{X=1} 视为事件A .每次试验, A )3+3(0.8)(0.2)2 =(0.2出现的概率为0.8
本例中,n=20,p=0.2, 所以,(n+1)p=4.2, 故k0=4。
三、几种常见离散型随机变量的概率分布
练习3 设有80台同类型设备,各台工作是相互独立 的发生故障的概率都是 0.01,且一台设备的故障能 由一个人处理. 考虑两种配备维修工人的方法 , 其 一是由四人维护,每人负责20台; 其二是由3人共同 维护台80.试比较这两种方法在设备发生故障时不 能及时维修的概率的大小. 解 按第一种方法

离散型随机变量及其分布函数_图文

离散型随机变量及其分布函数_图文

5.超几何分布
设X的分布律为
说明 超几何分布在关于废品率的计件检验中常用到.
三、内容小结
1.常见离散型随机变量的分布 两点分布 二项分布 泊松分布
几何分布 超几何分布
两点分布
二项分布
泊松分布
则 X 的取值范围为 (a, b) 内的任一值.
定义 说明
离散型随机变量的分布律也可表示为 或
例1 设一汽车在开往目的地的路上需经过四盏信号
灯.每盏灯以
的概率禁止汽车通过.以
表示汽车首次停下时已经过的信号灯盏数(信
号灯的工作是相互独立的),求 的分布律.
Байду номын сангаас
离散型随机变量的分布函数与其分布律之间的关系 :
也就是: 分布律
分布函数
二、常见离散型随机变量的概率分布
1.两点分布
设随机变量 X 只取0与1两个值 , 它的分布律为
则称 X 服从 (0-1) 分布或两点分布或伯努利分布.
说明
两点分布是最简单的一种分布,任何一个只有 两种可能结果的随机现象, 比如新生婴儿是男还是 女、明天是否下雨、种籽是否发芽等, 都属于两点 分布.
离散型随机变量及其分布函数_图文.ppt
一、离散型随机变量的分布函数
随机变量
离散型 非离散型
连续型 其它 (1)离散型 若随机变量所有可能的取值为有限个
或可列无穷个,则称其为离散型随机变量.
实例1 观察掷一个骰子出现的点数. 随机变量 X 的可能值是 : 1, 2, 3, 4, 5, 6.
实例2 若随机变量 X 记为 “连续射击, 直至命 中时的射击次数”, 则 X 的可能值是:
二十世纪初罗瑟福和盖克两位科学家在观察 与分析放射性物质放射出的 粒子个数的情况时, 他们做了2608 次观察(每次时间为7.5 秒),发现 放射性物质在规定的一段时间内, 其放射的粒子 数X 服从泊松分布.

离散型随机变量及其分布律

离散型随机变量及其分布律

λ
n! k n− k P{ X = k } = ( pn ) (1 − pn ) k!( n − k )!
n! λ 1 λ o(1) n− k k [ + o(1)] [1 − − ) = k ! ( n − k )! n n n n
[λ + o(1)]k λ o(1) n n( n − 1)⋯ ( n − k + 1) [1 − − ] = λ o(1) k k! n n k n [1 − − ] n n
的分布函数. 求随机变量 X 的分布函数 解
1 p{ X = 1} = p{ X = 0} = , 2


当x < 0时, 时
0
1
x
F ( x ) = P{ X ≤ x < 0} = P (φ ) = 0


0
当0 ≤ x < 1时,
1
x
1 F ( x ) = P { X ≤ x } = P { X = 0} = ; 2 当x ≥ 1时, 0, x < 0, F ( x ) = P{ X ≤ x } 1 = P{ X = 0}+ P{ X = 1} 得 F ( x ) = , 0 ≤ x < 1, 2 1 1 1, x ≥ 1. = + = 1. 2 2
( k −1 )
服从几何分布. 所以 X 服从几何分布
( k = 1,2,⋯)
首次成功” 说明 几何分布可作为描述某个试验 “首次成功” 的概率模型. 的概率模型
7.超几何分布 超几何分布
设X的分布律为 的分布律为
m n C M C N−−m M P{ X = m } = n CN
( m = 0,1,2,⋯ , min{ M , n})

第二节 离散性随机变量及其分布

第二节 离散性随机变量及其分布
X 0 0.1 1 0.6
。 。 。
1
2 0.3
解: F ( x )=P{ X x }
0, 0.1, = 0.7, 1, x0 0 x1 1 x 2 x2
1
Pk
F ( x)
0
2
x
0, 0.1 , F ( x )= 0.7 , 1,
k!
,
k =0,1,2, …,
0
解: 依据概率分布的性质: P{X =k}≥0,
P{ X k } 1
k 0

这里用到了幂级数 展开式
欲使上述函数为概率分布
a≥0
a
k 0

k
k!
e
ae 1

k!
k 0

k
从中解得
ae

3. 利用分布律求事件概率 离散型随机变量的分布律不仅给出了{X=xk }
x0 0, F ( x )=P{ X x }= x, 0 x 1 1, x1
1
x
0
1
用分布函数描述随机变量不如分布律直观, 对非离散型随机变量,是否有更直观的描述方法?
a
b
P{a X b} ?
的概率,而且通过它可以求事件{a X b}, a b 发生的概率。 由概率的有限可加性有
P{a X b}
a xk b

P{ X xk }
a xk b

pk
例2.3 设袋中有5只球,其中有2只白3只红。现从
中任取3只球(不放回),求抽得的白球数X为k的概
注:
1. 这里分布函数的定义对任何随机变量都适用。 2. 分布函数F(x)=P {Xx} 是一个普通的函数,它 的自变量是全体实数。掌握了X的分布函数就掌 握了X在(-∞, +∞)上的概率分布情况。

概率论-2-3 常见离散型随机变量的分布

概率论-2-3 常见离散型随机变量的分布
回顾: 随机变量的分类 随机变量
离散型 连续型
随机变量所取的可能值是有限多个或无限 可列个, 叫做离散型随机变量.
随机变量所取的可能值可以连续地充满某个 区间,叫做连续型随机变量.
引入分布的原因
以认识离散随机变量为例, 我们不仅 要知道 X 取哪些值,而且还要知道它 取这些值的概率各是多少,这就需要 分布的概念.有没有分布是区分一般 变量与随机变量的主要标志.
例 某服装商店经理根据以往经验估计每名顾客购买 服装的概率是0.25,在10个顾客中有3个及3个以上顾 客购买服装的概率是多少?最可能有几个顾客购买服 装?
解 设X 表示购买服装的顾客数目,
则 X ~ B(10,0.25),所以有 3 个及 3 个以上顾客购买服装的概率为
2
P{X 3} 1 P{X k} 2 k0 1 C1k0 (0.25)k (0.75)10k 0.4744 k 0
k 1, 2,
q 1 p
其中,0<p<1,则称X服从参数为p的几何分布,记做
X G( p).
几何分布可作为描述某个试验 “首次成功”的概率模型.
5、超几何分布
如果随机变量X的概率分布为
P{X
k}
CMk

Cnk N M
CNn
(k 0,1, , min(M , n))
其中N,M,n 均为自然数,则称随机变量X服从超几何分 布,记做 X H (M , N, n).

X
0
1
pk 1 p
p
则称 X 服从 0-1 分布或两点分布.
例 200件产品中,有190件合格品,10件不合格 品,现从中随机抽取一件,若规定
X

常见的离散型随机变量的分布

常见的离散型随机变量的分布

30台设备发生故障不能及时维修为事件 Ai

P( Ai )
P(Y
2)
k 2
e0.3 0.3k k!
0.0369 i 1,2,3
三个人各独立负责30台设备发生故障不能及时
维修为事件 A1 A2 A3 3
PA1 A2 A3 1 P( Ai )
i1
1 (1 0.0369)3 0.1067 0.013459
例1 独立射击5000次,每次的命中率为0.001, 求 (1) 最可能命中次数及相应的概率;
(2) 命中次数不少于2 次的概率.
解 (1) k = [( n + 1)p ] = [( 5000+ 1)0.001] = 5
P5000(5) C55000(0.001)5 (0.999)4995 0.1756
0 1 2 34 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000
P 0.273•
由图表可见 , 当 k 2或3 时, 分布取得最大值
P8(2) P8(3) 0.273 此时的 k 称为最可能成功次数
•••••••••
012345678
(1) 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01?
(2) 问3个人共同负责90台还是3个人各自独立负 责30台设备发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人,设 X 为90 台
设备中发生故障的台数,则 X ~ B( 90, 0.01)
90
P( X N ) C9k0 (0.01)k (0.99)Nk
k N 1
令 90 0.01 0.9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二项分布图形由参数n和π决定, 当π=0.5时,分布是对称的,见图6-1
图 6-1.
=0.5 时,不同 n 值下的二项分布
2、二项分布的图形特征
当π≠0.5时,分布是偏态的,但随着n的增大, 分布趋于对称。当n ~ ∞时,只要π不太靠近0 或1,二项分布则接近正态分布, 见图6-2。
图6-2
10! P(X 9) 0.609 (1 0.60)109 0.040311 9!(10 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P( X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
X k X k
X !(n X )!
对于双侧检验而言,由于要回答的是 “有无差别” ,即备择假设 H1:π π0 是否 成立,因此,所要计算的双侧检验概率 P 值 应为实际样本(记“阳性”次数为 k 次)出 现的概率与更背离无效假设的事件(记“阳 性”次数为 i 次,i k)出现的概率之和, 即
5.394
查u界值表(t界值表中 v为 ∞的一行)得单 侧 P<0.005 。按 а=0.05水准,拒绝H0, 接受H1,即新的治疗方法比常规疗法的效 果好。
(三)两样本率的比较 两样本率的比较,目的在于对相应的两总体率 进行统计推断。 设两样本率分别为p1和p2,当n1与n2均较大, 且p1 、1-p1 及p2 、1-p2 均不太小,如n1p1 、 n1(1-p1)及n2p2 、n2(1-p2)均大于5时,可利 用样本率的分布近似正态分布,以及独立的 两个正态变量之差也服从正态分布的性质, 采用正态近似法对两总体率作统计推断。
验中,下面两种情形的概率计算是不可少的。
(1)出现“阳性”的次数至多为k次的概 率为:
P(X k) P( X )
X 0
k
k
X 0
n! X (1 ) n X X !(n X )!
(2)出现“阳性”的次数至少为k次的概 率为 n n n! X n X P(X k) P( X ) (1 )
例 在某镇按人口的1/20随机抽取329人, 作血清登革热血凝抑制扩抗体反应检验,得 阳性率为8.81%,求此阳性率的抽样误差 Sp 及总体阳性率的95%可信区间。 本例n=329,p=8.81%,则其抽样误差为:
则其总体率的95%可信区间为:
(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分布 直接计算有关概率,对样本率与总体率的差 异进行有无统计学意义的比较。比较时,经 常遇到单侧检验,即“优”或“劣”的问题。 那么,在总体阳性率为π的n次独立重复试
如np和n(1-p)均大于5时,可利用样本率p的
分布近似正态分布来估计总体率的可信区间。
的1 可信区间为: ( p u 2 S p , p u 2 S p ) 如: 的95%可信区间为 的99%可信区间为
( p 1.96S p , p 1.96S p )
( p 2.58S p , p 2.58S p )
随机试验中某事件是否发生。如观察某药物
是否有效;观察某指标的化验结果是否为阳
性。这些试验的共同的特征是一次试验只有
两种独立的结果:事件发生或事件不发生,
这种试验称为Bernoulli试验(或成败试验)。
Bernoulli试验序列满足以下三个条件的 n
次试验构成的序列称为Bernoulli试验序列。
时若用样本资料计算样本率p=X/n作为π的估
计值,则
的估计为: p
例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,计算率的 抽样误差。
Sp
p(1 p) 0.55(1 0.55) 0.0497 n 100
2、二项分布的图形特征
X的标准差
若以率表示,
则样本率 p 的总体均数为
则样本率ቤተ መጻሕፍቲ ባይዱp 的总体方差为
p
2
(1 )
n
(1 )
n
则样本率 p 的总体标准差为
p
样本率的标准差也称为率的标准误,可用来
描述样本率的抽样误差,率的标准误越小,
则率的抽样误差就越小。
在一般情形下,总体率π往往并不知道。此
P P( X 9) P( X 0) P( X 1) P( X 2) P( X 10)
=0.040311+0.000104858+0.001572864+0.010617 +0.006046618 =0.058652 0.05<P<0.10,按 =0.05 水准,不拒绝 H0,尚不 能认为甲、乙两种药物的疗效不同。
二、二项分布的应用
(一)总体率的区间估计 1. 查表法 2. 正态近似法
二、二项分布的应用
1. 查表法 对于n ≤50的小样本资料,直接查附 表6百分率的95%或99%可信区间表,即可得 到其总体率的可信区间。 例6-2 在对13名输卵管结扎的育龄妇女经壶腹 部-壶腹部吻合术后,观察其受孕情况,发现 有6人受孕,据此资料估计该吻合术妇女受孕 率的95%可信区间。
=0.023257
按 α =0.05水准,拒绝H0,接受H1,即认为实施峡部 -峡部吻合术妇女的受孕率要高于壶腹部-壶腹部吻合 术。
例 6-5 已知某种非传染性疾病采用甲药治疗的 有效率为 0.60。今改乙药治疗该疾病患者 10 人,发 现 9 人有效。问甲、乙两种药物的疗效是否不同? 显然,这是双侧检验的问题。记乙药治疗该疾病 的有效率为π,其假设检验为 H0:π=0.60 H1:π 0.60 =0.05 本例 n=10,按π=0.60,实际样本阳性数 X =9 出现 的概率由公式(6-1)有
进行实验观察。结果见下表 满足Bernoulli试验序列三个条件: 一、二分类资料; 二、因每次实验条件不变,每只动物的死亡概率 是相同的; 三、每只动物的生与死不影响其它动物。
互不相容事件 独立事件的 的加法定理 乘法定理
构成Bernoulli试验序列的n次实验中,事件 A出现的次数X的概率分布为:
患者进行了新疗法的治疗,治愈117人。问新治
疗方法是否比常规疗法的效果好?
本例是单侧检验,记新治疗方法的治愈率为π,而 π0=0.45。其假设检验为 H0:π=0.45 H1:π>0.45
α =0.05
本例n=180,p=117/180=0.65
u
0.65 0.45 0.45(1 0.45) 180
染性疾病患者的治疗,可看作10次独
立的重复试验,其疗效分为有效与无
效,且每一名患者治疗有效的概率
(π=0.70)是恒定的。这样,10人中
发生有效的人数X~B(10,0.70)。
三) 二项分布的性质
1、二项分布的均数与方差
若X服从二项分布,它的概率 为π,样本例数为n,可简记为 X~B(N,)则: X的均数 n X的方差
二、二项分布的应用
n n 附表6只列出 X 的部分。当X 时,可先 2 2
按“阴性”数n-X查得总体阴性率的1-α可信
区间QL~QU,再用下面的公式转换成所需
的阳性率的 1-α可信区间。 PL=1-QU,
PU=1-QL
例6-2 在对13名输卵管结扎的育龄妇女经壶腹部-壶
腹部吻合术后,观察其受孕情况,发现有7人受孕,
P x
1
n x
n x

x
二项分布的累计概率(cumulative probability)
两种累计方式: 最多有k例阳性概率
最少有k例阳性的概率
例6.2 已知某地玉米的黄曲霉污染率近年为 1 10! 10 20%。若抽取10 个样品作检查, 0.81010.2 0.376 P x 1 P x P0 P1 0.8 1! 10 1! 0 求(1)污染样品数不超过一个的概率。 10 (2)污染样品数在8个以上的概率。 P x 8 P x P8 P9 P10 解: 8
第六章 几种常见离散型 变量的分布和应用
Distribution and Application of Discrete Data
宁夏医科大学公共卫生学院 流行病与卫生统计学系 主讲人 李吴萍 教授
第一节 二项分布
一、二项分布条件与性质(二分类变量) 一)、Bernoulli试验 在医学科研中,很多情况可归纳为观察
对这10名实施峡部-峡部吻合术的妇女,按 0.55的受孕率,若出现至少9人受孕的概 率大于0.05,则不拒绝H0 ;否则,拒绝 H0,接受H1。 本例n=10,π=0.55,k=9。按公式(6-12)
P(X 9) P( X )
X 9 10 10 X 9
10! 0.55 X (1 0.55)10 X X !(10 X )!
0.00007373 0.0000041 0.0000001 0.00007793 10! P8 0.810 8 0.28 0.00007373 8! 10 8 ! 10! P9 0.810 9 0.29 0.00000410 9! 10 9 ! P10 0.210 0.0000001
检验统计量u的计算公式为:
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
P P( X k ) P( X i )
i
,其中 i 满足
P( X i ) P( X k ) 。
例6-4 据报道,对输卵管结扎了的育龄妇女实 施壶腹部-壶腹部吻合术后,受孕率为0.55。 今对10名输卵管结扎了的育龄妇女实施峡部 -峡部吻合术,结果有9人受孕。问实施峡部峡部吻合术妇女的受孕率是否高于壶腹部壶腹部吻合术? 显然,这是单侧检验的问题,其假设检验为 H0:π=0.55 H1:π>0.55 =0.05
相关文档
最新文档