第四章常用概率分布
4.5 正态分布的应用

第四章 常用概率分布五、正态分布的应用正态分布的应用1. 确定医学参考值范围n参考值范围(reference range):指特定的“正常”人群的解 剖、生理、生化指标及组织代谢产物含量等数据中大多数 个体的取值所在的范围。
正态分布的应用 n制定参考值范围的步骤:1. 选择足够数量的正常人作为调查对象。
2. 样本含量足够大。
3. 确定取单侧还是取双侧正常值范围。
4. 选择适当的百分界限。
5. 选择适当的计算方法。
n估计医学参考值范围的方法:1. 正态近似法:适用于正态分布或近似正态分布的资料。
2. 百分位数法:适用于偏态分布资料。
过高异常 过高异常过低异常 过低异常例1 某地调查120名健康女性血红蛋白,直方图显示,其分 布近似于正态分布,得均数为117.4g/L ,标准差为10.2g/L , 试估计该地正常女性血红蛋白的95%医学参考值范围。
分析:正常人的血红蛋白过高过低均为异常,要制定双侧正 常值范围。
该指标的95%医学参考值范围为97.41~137.39(g/L )1.96117.4 1.9610.297.41~137.39X S ±=±´=例 1A 某年某市调查了200例正常成人血铅含量(μg/100g) 如下,试估计该市成人血铅含量的95%医学参考值范围。
分析:血铅的分布为偏峰分布,且血铅含量只以 过高为异常,要用百分位数法制定单侧上限。
( ) ( ) 95 5.%3820095%18938.7/100 7L x iP L n x f g gf m =+-å=+´-=正态分布的应用2. 质量控制图n控制图基本原理:如果某一波动仅仅由个体差异或随机测 量误差所致,那么观察结果服从正态分布。
2. 质量控制图控制图共有7条水平线,中心线位于总体均数μ处,警戒限位于处,控制限位于 处,此外还有2条位于 处。
如果总体均数和总体标准差未知,也可用样本估计值代 替,这时,7条水平线分别位于 、 、 和 处。
第四章 常见概率分布之二项分布和波松分布

样本均数和方差S2计算结果如下:
x =Σfk/n
=(120×0+62×1
+15×2+2×3+1×4)/200
=0.51
上一张 下一张 主 页 退 出
s2
fk 2 ( fk ) 2 / n
n 1 2 2 2 2 2 2 (120 0 62 1 15 2 2 3 1 4 102 ) / 200 200 1
即得各项按波松分布的理论窝数。 波松分布与
相应的频率分布列于表4—7中。
上一张 下一张 主 页 退 出
表4—4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊 松分布计算的概率相比较 ,发现畸形仔猪的频 率分布与 λ=0.51 的 波松分布是吻合得很好 的 。这进一步说明了畸形仔猪数是服从波松分 布的。
上一张 下一张 主 页 退 出
【例4.14】 为监测饮用水的污染情况, 现 检验某社区每毫升饮用水中细菌数 , 共得400 个记录如下:
0 1 p( x 1) C15 0.2 0 0.815 C15 0.210.814 0.1671
由计算可知 , 注射 A 疫苗无效的概率为 0.0352,比B疫苗无效的概率0.1671小得多。 因此,可以认为A疫苗是有效的,但不能认为B 疫苗也是有效的。
上一张 下一张 主 页
退 出
【例4.11】 仔猪黄痢病在常规治疗下死亡率 为20%,求5 头病猪治疗后死亡头数各可能值相 应的概率。 设5头病猪中死亡头数为x,则x服从二项分
作中,当 λ≥20时就可以用正态分布来近 似地处理波松分布的问题。
二、波松分布的概率计算
波松分布的概率计算,依赖于参数 λ的确定, 只要参数λ确定了 ,把k=0,1,2,… 代入 (4-23)式即可求得各项的概率。 但是在大多数 服从波松分布的实例中,分布参数λ往往是未知 的,只能从所观察的随机样本中计算出相应的样 本平均数作为 λ 的 估计值,将其代替(4-23) 式中的λ,计算出 k = 0,1,2,… 时的各项 概率。
第四章_常用概率分布(第7版)

150
3) P X 20
x 20
P( X x ) 1 P X x 0.4880
x 0
150
19
Poisson分布
1)Poisson分布的概念
Poisson分布可以看作是发生的概率(或未发生的概
率1-)很小,而观察例数n很大时的二项分布。除二项
100! 99 0.4 5 1 0.4 6.48 10 16 5!95! 100! 100 40 60 40 P(X 40) C 100 π 40 1 π 0.4 40 1 0.4 0.0812 40!60! 100! 100 80 20 80 P(X 80) C 100 π 80 1 π 0.4 80 1 0.4 2.86 10 16 80!20!
π 1 π 0.13 0.87 0.027 n 150
۩二项分布的的应用
累积概率计算
分三种情况:P(X≤x1); P(X≥x2); P(x1≤X≤x2)
若X~B(n,),上述三种累积概率的计算公式分别为:
k k P X x1 P X k C n 1 k 0 k 0 x1 x1 n k
100 5
二项分布的特征
we'll keep the fixed at 0.5, and vary the sample size n:
Cited from /boost_doc/libs/math/…/dists/binomial_dist.html
Poisson分布的概率函数图举例:
P(x) 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 14 16 18 20 22 x λ =1
(卫生统计学)第四章 常用概率分布

第二节 Poisson分布的概念与特征
一、Poisson分布概念与特征
若某一随机变量X的取值为0,1,2,…,且X=k 的概率为:
P(X k) k e
k!
记作 X~P( λ )
其中 自然数e≈2.7182; λ 是大于0的常数,称X服从以λ 为参数的Poisson分布。
Poisson分布主要用于描述在单位时间(空间)内稀有事件的发生数。例如:放 射性物质在单位时间内的放射次数、单位容积内充分摇匀的水中的细菌数、染色 体异变数等。
350 300 250 200
人数
150 100
50 0
109 111 113 115 117 119 121 123 125 127 129 131 133 135 137 139 141 143
不同参数µ和σ下的正态分布曲线
正态分布函数
1.Gauss函数 (Gauss, 1777~1855 德国人)
某地正常成人心率(次/分)的频率分布
频数 1 5 12 13 26 31
组段 75~ 80~ 85~ 90~ 95~ 100~105
频数 24 15 9 7 5 2
心率频数分布
35
30
25
20
人数
15
10
5
0
45
50
55
60
65
70
75
80
85
90
95 100~105
正态曲线
例4-10 某地1986年120名8岁男孩身高频数图
百分位数法
例4-13
282名正常人尿汞值(g/L)测量结果
尿汞值 0~ 8.0~
16.0~ 24.0~ 32.0~ 40~ 48.0~ 56.0~ 64.0~72.0
标准正态分布

P(|u|<u1==1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)
10
计算
已知u~N(0,1),试求:
(1) P(u<-1.64)=?
(2) P (u≥2.58)=?
(3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
(standard normal distribution)
(u )
(u )
1 2
1 2
e
u
e
u2 2
1 2 u 2
du
随机变量u服从标准正态分布,记作u~
N(0,1)
7
标准正态分布
对于任何一个服从正态分布N(μ,σ2)的随机
变量x,都可以通过标准化变换 u=(x-μ)/σ
P(|u|≥3)=1-0.9973=0.0027
P(|u|≥1.96)=1-0.95=0.05 P(|u|≥2.58)=1-0.99=0.01
14
由表4—2可见,实际频率与理论概率相当接近,说明126 头基础母羊体重资料的频率分布接近正态分布,从而可推 断基础母羊体重这一随机变量很可能是服从正态分布的
= 1, ..., n)为相互独 立,都服从标准正态分布,则定义: 2 i zi2 , i = 1, ..., n 变量2服从自由度等于n卡方分布(chi – square distribution)。
19
卡方分布曲线
图4-1 不同自由度下的2分布
图4-2 2分布的 上侧和下侧分位数 示意图
P(x<μ-1.96σ)=P(x>μ+1.96σ)=0.025
第四章常用概率分布学习指导(定)详解

第四章 常用概率分布[教学要求]了解:质量控制的意义、原理和方法 熟悉:三个常用概率分布的特征。
掌握:掌握三个常用概率分布的概念;二项分布及Poisson 分布的概率函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算。
[重点难点]第一节 二项分布一、二项分布的概念与特征基本概念:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。
二项分布的概率函数:Xn X X n C X P --=)1()(ππ二项分布的特征:二项分布图的形态取决于与n ,高峰在=n 处。
当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。
二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n 如果将出现阳性结果的频率记为 nX p =则p 的总体均数为 πμ=p 标准差为二、二项分布的应用二项分布出现阳性的次数至多为k 次的概率为np )1(ππσ-=∑∑==-==≤kX kX XX eX P k X P 0!)()(λλ出现阳性的次数至少为k 次的概率为第二节 Poisson 分布的概念与特征一、Poisson 分布的概念与特征基本概念:Poisson 分布可以看作是每个观察对象阳性结果的发生概率很小,而观察例数n 很大时的二项分布。
除二项分布的三个基本条件以外,Poisson 分布还要求 接近于0。
有些情况和n 都难以确定,只能以观察单位(时间、空间、面积等)内某种稀有事件的发生数X 来近似。
Poisson 分布的概率函数:式中,πλn =为Poisson 分布的总体均数,X 为观察单位内某稀有事件的发生次数,e 为自然对数的底,λ为常数,约等于2.71828。
Poisson 分布的特征Poisson 分布当总体均数λ值小于5时为偏峰,λ愈小分布愈偏,随着λ增大,分布趋向对称。
卫生统计学七版 第四章常用概率分布

该地健康女性血红蛋白的95%医学参考值范围在 137.39~97.41之间。
2、质量控制图 随机误差服从正态分布,而系统误差 则不服从正态分布。
例4 10
如果某地居民脑血管疾 病的患病率为 150/ 10万,
那么调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 有 多大?至少有 3人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 为0.809, 至少有3人患脑血管疾病的概率 为0.191 。
那么调查该地 1000 名居民中有2人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
2 1 . 5 P( X 2) e 1.5 0.251 2!
调查该地 1000 名居民中有2人患脑血管疾病的概率 为25.1%。
2、累积概率计算
稀有事件发生次数至多为k次的概率为:
2、累积概率计算 二项分布出现阳性次数最多为k次的概率:
二项分布出现阳性次数至少为k次的概率:
二项分布出现阳性次数至少为k次至至多为K次的概率(k<K):
n! P(k X K ) P( X ) X (1 ) n X k X k X !( n X )!
K K
(1) 百分位数法 适用范围:偏态分布的资料。
双侧界值:P 和P 2.5 97.5 单侧上界:P 95 单侧下界:P 5
(2) 正态分布法 适用范围:正态或近似正态分布的资料。
概率论与数理统计第四章_几种重要的分布

ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章常用概率分布
二项分布
二项分布的概念与特征 一个袋子里有5个乒乓球,其中2个黄球,
3个白球,我们进行摸球游戏,每一次摸到黄球 的概率是0.4,摸到白球的概率是0.6,这个实验 有三个特点:一是各次摸球是彼此独立的;二是 每次摸球只有二种可能的结果,或黄球或白球; 三是每次摸到黄球(或摸到白球)的概率是固定 的。具备这三点, n次中有X次摸到黄球(或白 球)的概率分布就是二项分布。
P(x≥1)=P(1)+P(2)+P(3)=0.288+0.43 2+0.216=1-P(0)=1- 0.064=0.936
也可以是P(x≥1)=1-P(0)=1- 0.064=0.936
第四章常用概率分布
二项分布
二项分布的特征 二项分布的图形特征
接近0.5时,图形是对称的;图4-1 离0.5愈远,对称性愈差,但随着n的增
大,分布趋于对称。图4-2
当n→∞时,只要不太靠近0或1, 当nP
和n(1-P)都大于5时,二项分布近似于正 态分布。
二项分布图形取决于与n,高峰=n处
第四章常用概率分布
二项分布
P(x)
0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
n=3,π=0.5
第四章常用概率分布
二项分布
例4-1 用针灸治疗头痛,假定结果不是有效 就是无效,每一例有效的概率为π,。某医 生用此方法治疗头痛患者5例,3例有效的 概率是多少? 因为每例有效的概率相同,且各例的治疗结 果彼此独立,5例患者中可以是其中的任意 3例有效
第四章常用概率分布
二项分布
医学研究中很多现象观察结果是以两 分类变量来表示的,如阳性与阴性、治愈 与未愈、生存与死亡等等。如果每个观察
二项分布
如果将出现阳性结果的频率记为
p X n
总体均数: p
标准差:
p
(1 )
n
第四章常用概率分布
二项分布
例4-4 研究者随机抽查某地150人,其中 有10人感染了钩虫,钩虫感染率为6.7%, 求此率的抽样误差。
p(1p) p(1p)
Sp
n1
n
0.06 (1 70.06 ) 7
P(x)
0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
n=10,π=0.5
图4-1 π=0.5时,不同n值对应的二项分布
第四章常用概率分布
二项分布
P(x)
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
出现阳性的次数至少为k次的概率为
n
n
P (X k ) P (X )
n !
X (1 )n X
X k
X kX !(n X )!
第四章常用概率分布
二项分布
例4-6 例4-5中某地钩虫感染率为13%, 随机抽查当地150人,其中至多有2名感染 钩虫的概率有多大?至少有2名感染钩虫的 概率有多大?至少有20名感染钩虫的概率 有多大?
Sp
0.022 0.0% 150
第四章常用概率分布
二项分布
二项分布的应用 (一)概率估计 例4-5 如果某地钩虫感染率为13%,随机
观察当地150人,其中有10人感染钩虫的 概率有多大? 从n=150,π=0.13的二项分布,由公式 (4-1)和(4-2)
第四章常用概率分布
二项分布
可以得出150人中有10人感染钩虫的概率 为
第四章常用概率分布
二项分布
根据公式(4-10)至多有2名感染钩虫的
2
2
概率为 P (X 2 )P (X )
n !
X ( 1 )n X
X 0
X 0X !(n X )!
8 .4 1 7 1 0 0 1 .8 1 0 8 0 2 .1 1 1 70
2.30 10 7
至少有2名感染钩虫的概率为
P (X 1)0 1!500 .113 00 .817 4 00 .005 1!(1 05 10 )0 !
第四章常用概率分布
二项分布
单侧累积概率计算
二项分布出现阳性的次数至多为k次的概率为
k
k
P (X k )P (X )
n !
X (1 )n X
X 0
X 0X !(n X )!
n=3,π =0.3
x
P(x)
0.5 0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x n=6,π =0.3
P(x)
0.5 0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x n=10,π =0.3
P (X 2 ) 1P 5 (X 0) 150 1!50 0 .1 X ( 1 3 0 .1 ) 13 5 X0
CX
3C
X 3
0
1
x
(1-)n-x 出现该结果概率
P(x)
0.60=1 0.4×0.4×0.4
0.064
1
3
0.6
0.4×0.4
0.288
2
3
0.6×0.6
0.4
0.432
3
1 0.6×0.6×0.
Hale Waihona Puke 0.4060.216
第四章常用概率分布
二项分布
由表4-1可知,各种可能结果出现的概率合计 为1,即P(X)=1(X=0,1,…,n)。因此, 如果欲求1例以上有效的概率可以是
P(x)
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n=20,π =0.3
x
图4-2 π=0.3时, 不同n值对应的二项分布
第四章常用概率分布
二项分布
二项分布的均数和标准差
总体均数: n
方差: 2 n(1)
标准差: n(1)
第四章常用概率分布
C n XX !(n n !X )!
第四章常用概率分布
二项分布
例4-2 临床上用针灸治疗某型头痛,有效的 概率为60%,现以该法治疗3例,其中两 例有效的概率是多大?
C 3 20.62(10.6)(32) 0.432
第四章常用概率分布
二项分布
表4-1 治疗3例可能的有效例数及其概率
有效人数 (x)
对象阳性结果的发生概率均为,阴性结果 的发生概率均为(1-);而且各个观察
对象的结果是相互独立的,那么,重复观 察n个人,发生阳性结果的次人数X的概率
分布为二项分布,记作B(X;n,π)。
第四章常用概率分布
二项分布
二项分布的概率函数P(X)可用公式(4-1) 来计算。
P ( X ) C n XX ( 1 ) n X