雷静《卫生统计学》第五章 常用概率分布
精选卫生统计学基本分布资料

X
F ( X ) f ( x)dx
概率密度函数 f(x):表示随机变量X在取值X附近单位长度 内的概率的大小。f (x)为分布函数F(x)的导数。
所以,对于连续型随机变量来说,要掌握其概率分布规律, 其关键是求出其概率密度函数。
Oct 20, 2009
解:因红细胞数过多过少均属异常,应估计双侧参考值范围:
下限为 x -1.96s=5.38-1.96×0.44=4.521012 L 上限为 x +1.96s=5.38+1.96×0.44=6.241012 L
该地正常成年男子红细胞数的 95%参考值范围可定为 4.526.24(1012 L),超 出此范围者则视为异常。
10, S X n
中心极限定理
若X i服从正态分布,则 X j 服从正态分
布;X j , X / n ;
若X i 不服从正态分布,n较大则 X j 服从
正 为态非分正布 态X; 分j 布 ;, X / n ;n较小,X j
Oct 20, 2009
标准误:估计抽样误差大小的指标
Oct 20, 2009
1、离散型随机变量 (discrete random variable)
随机变量X只能取有限个数值X1,X2,…, Xn或无限个可数数值X1,X2 …,Xn…,则 X定义为离散型随机变量。
当X=Xk ,概率为P(Xk)则有 P(X k ) 1
随机变量的概率分布
正常人:并非指机体任何器官、组织的形态 和机能都正常的人,而是指排除了影响所研 究指标的疾病和有关因素的人
Oct 20, 2009
步骤和原则
抽取足够大例数的正常人作为样本 (n>=100) 控制测量误差 确定是否需要分组确定参考值范围 决定取双侧还是取单侧 选定合适的百分界限 两种方法:正态分布法和百分位数法
统计学-第5章 概率与概率分布

5-6
统计学 (第四版)
1.
事件的概念
事件(event):随机试验的每一个可能结果(任何样本点 集合)
例如:掷一枚骰子出现的点数为3
2.
随机事件(random event):每次试验可能出现也可能不 出现的事件
例如:掷一枚骰子可能出现的点数
3.
必然事件(certain event):每次试验一定出现的事件,用 表示
条件概率的图示
事件A
事件B
一旦事件B发生
事件 AB及其 概率P (AB)
5 - 36
事件B及其 概率P (B)
统计学 (第四版)
概率的乘法公式
(multiplicative rule)
1. 用来计算两事件交的概率 2. 以条件概率的定义为基础 3. 设 A 、 B 为 两 个 事 件 , 若 P(B)>0 , 则 P(AB)=P(B)P(A|B),或P(AB)=P(A)P(B|A)
统计学 (第四版)
概率的古典定义
(例题分析)
解:(1)用A 表示“抽中的职工为男性”这一事件;A为 全公司男职工的集合;基本空间为全公司职工的集 合。则 全公司男性职工人数 8500 P( A) 0.68 全公司职工总人数 12500 (2) 用B 表示“抽中的职工为炼钢厂职工”;B为炼钢 厂 全体职工的集合;基本空间为全体职工的集合。则 炼钢厂职工人数 4800 P( B) 0.384 全公司职工总人数 12500
m P( A) p n
5 - 24
统计学 (第四版)
事件的概率
例如,投掷一枚硬币,出现正面和反面的频率, 随着投掷次数 n 的增大,出现正面和反面的频率 稳定在1/2左右
卫管卫法卫统教案教案:第五章常用概率分布2-2学时.doc

复习:二项分布及泊松分布的特征 第五章常用概率分布——正态分布及其应用一、正态分布的概念和特征止态分布又称Gauss 分布,是--种很重要的连续型分布1. 正态分布的图形已知正态分布的方程,即可绘其图形2. 正态分布的特征(1) 正态曲线在横轴上方、均数处最高(2) 以均数为中心,左右对称。
对称轴是? (3) 正态分布山两个参数决定,即均数和标准差。
均数为位置参数,标准差为变异参数。
当标准弟恒定时,均数越人,曲线沿横轴越向右移;反之则向左移。
当均数恒定时,标准差越大,数据越分散,曲线授高点越向下・•・(4) 正态曲线下的而积分布有一定的规律。
二、标准正态分布将止态分布的方程作如下变量变换u 二(x -口)/o 即将原正态分布曲线图的原点 移到U 的位置,横轴尺度以。
为单位,就可将正态分布变换为标准正态分布N ( 0, 1 ), u 称为标准正态变量或标准正态(离)差。
⑴10,多媒体演 示正态分布的形成频数分布逐渐接近正态分布示意图10'图示参数 变化与图 形的关系10'三、正态曲线下面积的分布规律:实际工作中,常需要了解止态曲线下横轴上某一区间的而积占・总而积的百分数,以便估计该区间的例数書总例数的百分数(频数分布)或观察值落在该区间的概率。
正态曲线下一定区间的而积可以通过附表1求得。
对于正态或近似正态分布的资料,已知均数和标准差,就町对其频数分布作出概率估计。
杳附表1标准正态分布曲线下左侧尾部面积,e (u)值注意:(1)当卩、。
和xD知时,先按U二(x-u) /。
求U值,再查附表1;当》、。
未知时,分别用兀和S來估计;(2)曲线下对称于0的区间,面积相等,.••附表1只列出(-□)值。
(3)曲线下横轴上的总面积为100%或1。
正态分布Illi线下有三个区间的面积应用较多,应熟记:①标准正态分布时区间(-1,1) 或正态分布时区间(u-10, u+lo)的而积占总面积的68.27%;②标准正态分布时区间(-1.96, 1.96)或正态分布时区间(U-1.96 0, y+1.96o )的面积占总面积的95%;③标准正态分布时区间(-2.58, 2. 58)或正态分布时区间(»-2.58。
研究生医学统计学概率分布

双侧:
x 1 . 96 S
x 1.64S (上限 )
单侧:
x 1.64S (下限)
2019/3/9
2) 百分位数法
⑴适用资料:适用于任意分布类型的资料, 主要用于偏态分布或分布类型不清楚的资 料。 ⑵计算: 以95%正常值范围为例 双侧: P2.5~P97.5
2019/3/9
标准正态分布 -1~1 -1.64~1.64 -1.96~1.96 -2.58~2.58
正态分布 面积或概率 68.27% μ±σ 90.00% μ±1.64σ 95.00% μ±1.96σ 99.00% μ±2.58σ
2019/3/9
3、标准正态分布表的使用
附表c1标准正态分布表p559
3.常用概率分布
Poisson分布
2019/3/9
3.1 正态分布
正态分布的图形
正态分布的特征
正态曲线下面积分布的规律
标准正态分布
正态分布的应用
2019/3/9
一、 正态分布曲线
(normal distribution curve)
1.正态分布的图形
2019/3/9
2019/3/9
2.用途
1.划分正常与异常的界限。如作诊断 指标。 2.反映某人群的某项指标的动态变化。 如某地不同时期发汞值的正常范围 可反映环境污染的变化或环境保护 的效果。
2019/3/9
3.确定医学参考值范围的方法
⑴确定一批样本含量足够大(n>100)的 “正常人”或动物作为研究对象。 “正常人”不是指机体任何器官、组织的 形态及机能都正常的人,而是指排除了影 响所研究指标的疾病和有关因素对所研究 指标的影响的同质人群。
卫生统计学-常用概率分布

例
题
例5-10 例5-8中,至多有2人患脑血管疾病的概率有多大? 至少有3人患脑血管疾病的概率有多大? 至多有2人患脑血管疾病的概率:
e 1.51.5 X P( X 2) P( X ) X! X 0 X 0
2 2
e 1.51.50 e 1.51.51 e 1.51.52 0.809 0! 1! 2!
Poisson分布有以下特性: (1)Poisson分布的总体均数与总体方差相等,均为λ。 (2)Poisson分布的观察结果有可加性。
当λ增大时, Poisson分布逐渐逼近正态分布。一般来 说λ≥20时, Poisson分布的资料可按正态分布处理。
当n很大,p很小,np=λ为一常数时,二项分布近似 Poisson分布,p越小,近似程度越好。
P(x) 0.4 0.3 0.2 0.1 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
P(x) 0.4 0.3 0.2 0.1 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
n=3, π =0.5
x
n=10, π =0.5
x
图5-1 π=0.5时,不同n值对应的二项分布
Poisson分布图
P(x) 0.4 0.3 0.2 0.1 0
0 2 4 6 8 10 12 14 16 18 20 22
P(x) 0.4 0.3 0.2 0.1 0
0 2 4 6 8 10 12 14 16 18 20 22
λ =1
x
λ =3
x
P(x) 0.4 0.3 0.2 0.1 0
0 2 4 6 8 10 12 14 16 18 20 22
P( X k )
常用概率分布

有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。
心理统计学——5 概率与概率分布

(3)不互斥事件可能是独立的,也可能是不独立的
①例1中,P(A)=30%,P(B)=20%, P(AB)=12%, A、B是不 互斥的,即相容的。而P(AB) ≠P(A)P(B),所以,A、B是不 独立的。 ②某人射击的命中率为90%,A1表示第一枪命中,A2表示 第二枪命中,A1A2表示两枪都命中,P(A1)=P(A2)=90%, P(A1 A2)=81%, P(A1 A2)= P(A1) P(A2)。这时A1、 A2是不 互斥的,也是独立的。
5.1.2 概率的性质与运算法则 1、概率的性质: (1)非负性。对任意事件A 0≤ P(A)≤1 (2)规范性。必然事件的概率为1,不可能事件的概 率为0。P(Ω)=1,P(φ)=0 (3)可加性。 若A,B互斥,则P(A∪B)=P(A)+P(B)
可推广到多个两两互斥的随机事件A1,A2,…, An P(A1 ∪ A2 ∪... ∪An)=P(A1)+P(A2)+…+P(An)
3、主观概率:主观法(Subjective method) 所谓主观概率是指对一些无法重复的试验,确定其结 果的概率只能根据以往的经验,人为确定这个事件的 概率。它是一个决策者根据本人掌握的信息对该事件 发生可能性的判断。 有些情况下试验结果既不是等可能发生的,也没有相 对频数的数据可用,这时要用主观法。 例5.4 国安队进行下一场足球比赛,获胜的概率有多少? 获胜、失利、平局不一定是等可能发生的。此外,对于 将要进行的比赛也没有相对频数的数据可用这时估计国 安队获胜的概率,必须对其进行主观评价。
如果A1,A2,…,An相互独立,则 P(A1A2…An)=P(A1)P(A2)…P(An) 例5.8 某工人同时看管三台机床,每单位时间(如30分钟)内机 床不需要看管的概率:甲机床0.9,乙机床0.8,丙机床0.85.若机床 是自动机床且独立工作,求(1)在30分钟内三台机床都不需要看 管的概率;(2)在30分钟内甲、乙机床不需要看管,而丙机床需 要看管的概率。 解:设A1、A2、A3为甲、乙、丙三台机床不需要看管的事件, 则A3为丙机床需要看管的事件。 (1)P( A1A2A3)=P(A1)P(A2)P(A3)=0.9×0.8 ×0.85=0.612; (2)P(A1A2A3)= P(A1)P(A2)P(A3)= 0.9×0.8 ×(1-0.85)=0.108
《卫生统计学》PPT课件:05 参数估计基础

(二)、总体概率的置信区间
总体概率的置信区间与样本含量n,阳性频率p的
大小有关,可根据n和p的大小选择以下两种方法。
1. 正态近似法
当样本含量足够大,且p和1-p不太小,则样本率
的分布近似正态分布。
公式为:
P
Z
2S P
,P
Z
2S P
P为样本率, 为率的标准误的估计值,
例5-7 用某种仪器检查已确诊的乳腺癌患者 94例,检出率为78.3%。估计该仪器乳腺癌总体检 出率的95%置信区间。 分析:本例样本例数较大,且样本率p不太小,可 用正态近似法:
通式:
tа/2,ν 是按自由度ν=n-1,由附表2查得的t值。
例5-3 已知某地27例健康成年男性血红蛋白量的均数
为
,标准差S=15g/L ,试问该地健康成年男
性血红蛋白量的95%和99%置信区间。
本例n=27,S=15
95%CI:
99%CI:
置信区间的两个要素
1. 准确度:反映置信度1-α的大小,即区间包
152.6~
1
153.2~
4
153.8~
4
154.4~
22
155.0~
25
155.6~
21
156.2~
17
156.8 ~
3
157.4 ~
2
158.0 ~
1
合计
100
152.9 153.5 154.1 154.7 155.3 155.9 156.5 157.1 157.7 158.3
(标准误的理论值)
个样本,样本均数 服从正态分布;即使是从偏态 总体中随机抽样,当n足够大时(如n>50), 也近 似正态分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精选ppt课件
13
泊松分布
➢ 泊松分布的概念与特征 ➢ 泊松分布的应用
精选ppt课件
14பைடு நூலகம்
Poisson分布的概念
➢ Poisson分布,用于研究单位时间、单位人 群、单位空间内,某罕见事件发生次数的概 率分布。是描述小概率事件出现规律性的一 种重要的离散型分布。
➢ 如某种细菌在单位容积空气或水中出现的情 况,某段时间特定人群中某种恶性肿瘤患者 的分布或出生缺陷的发病情况,放射性物质 在单位时间内的放射次数,单位空间某种昆 虫数的分布等等。
其中,X=0,1,2,…,k,…,n。
精选ppt课件
11
(2)最少有k例阳性的概率
P ( X k ) P ( k ) P ( k 1 ) P ( n ) 1 P ( X k 1 )
P63例5-2 P81 思考与练习4.5
精选ppt课件
12
小结
二项分布的特征 二项分布的均数和标准差 二项分布的正态近似条件
精选ppt课件
6
二项分布的特征
二项分布的图形及其正态近似性:
已知π和n,就能按公式计算X=0,1,…,n时
的P(X)值。以X为横坐标,以P(X)为纵坐 标作图,即可绘出二项分布的图形,如图5-1, 图 5-2;
二项分布的高峰在=n处。当接近0.5时,图 形是对称的;离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。
二项分布(binomial distribution)就是 对这类只具有两种互斥结果的离散型随机事 件的规律性进行描述的一种概率分布。
精选ppt课件
3
二项分布的概念
只有两种可能结果的随机试验,当成功的概率
(π)是恒定的,且各次试验相互独立,这种
试验在统计学上称为贝努里试验(Bernoulli
trial)。如果进行n 次贝努里试验,取得成功 次数为X(X=0,1,…,n)的概率可用下面的二项
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n=3,π =0.3
x
0 1 2 3 4 5 6 7 8 9 10 11 12 1
x
n=6,π =0.3
P(x)
P(x)
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
精选ppt课件
15
Poisson分布的概念
Poisson分布的应用条件:
➢ 事件发生的概率π不变
➢ 每个事件的发生是相互独立的
精选ppt课件
16
Poisson分布的特征
Poisson分布的概率函数:
P(X) e X X=1,2,3…
X!
意义:单位时间(单位人群、单位空间内,单位 容积)内,某罕见事件发生次数的概率分布
分布概率公式来描述:
精选ppt课件
4
二项分布的概念
二项分布的概率函数:
P (X)C nX X(1)nX
式中的n为独立试验的次数, π为成功的概率,(1-π)为失败的概率, X为在n次试验中出现成功的次数, 二项系数:表示在n次试验中出现X的各种组合情况。 该式含义为:含量为n的样本中,恰好有X例阳性的概率。
λ=1
x
P(x) 0.4
0.3
0.2
0.1
0
0 2 4 6 8 10 12 14 16 18 20 22
λ=3
x
精选ppt课件
18
P(x) 0.4
0.3
0.2
0.1
0
0 2 4 6 8 10 12 14 16 18 20 22
Poisson分布的特征由参数λ确定。
精选ppt课件
17
Poisson分布的特征
Poisson分布的图形:已知λ ,就可按公式计算得 出X= 0,1,2,…时的P(X)值,以X为横 坐标,以P(X)为纵坐标作图,即可绘出 Poisson分布的图形,如图5-3。
P(x) 0.4
0.3
0.2
0.1
0
0 2 4 6 8 10 12 14 16 18 20 22
P63例5-1、5-2
精选ppt课件
5
二项分布的概念
二项分布的应用条件:
各观察单位只能具有相互对立的一种结果(互斥 的两分类资料)
已知发生某一结果的概率为π,其对立结果的概 率为1-π,实际工作中要求π是从大量观察中获 得比较稳定的数值。
n次试验在相同条件下进行,且观察结果相互独 立。如要求疾病无传染性、无家族性等。
P(x)
P(x)
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n=3,π =0.3
精x选ppt课件
0 1 2 3 4 5 6 7 8 9 10 11 12 1
n=6,π =0.3
8
x
P(x)
P(x)
0.5
0.5
第五章 常用概率分布
二项分布 泊松分布 正态分布
精选ppt课件
1
二项分布及其应用
➢ 二项分布的概念与特征 ➢ 二项分布的应用
精选ppt课件
2
二项分布的概念
在医学领域中,有一些随机事件是只具有两 种互斥结果的离散型随机事件,称为二项分 类变量(dichotomous variable),如 对病人治疗结果的有效与无效,某种化验结 果的阳性与阴性,接触某传染源的感染与未 感染等。
0.1
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
n=10,π =0.3
x
n=20,π =0.3
二项分布的特征
二项分布的均数和标准差:
μ=nπ σ= n(1) (原理见P64例5-3) 用率表示时,即上式分别除以n,得
当n较大,nP和n(1-P)都大于5时,二项分布 近似于正态分布。
精选ppt课件
7
P(x)
P(x)
0.4
0.3
0.4
0.3
0.2
0.2
0.1
0.1
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 1 2 3 4 5 6 7 8 9 10 11
x
n=3,π=0.5
x
n=10,π=0.5
μp=π
σp= (1) n
sp= p(1 p) n
精选ppt课件
10
二项分布的应用
从阳性率为π的总体中随机抽取含量为n的样本,则 有:
概率估计:可计算恰好有X例阳性的概率
P (X)C nX X(1)nX
累积概率的计算: (1)最多有k例阳性的概率
P ( X k ) P ( 0 ) P ( 1 ) P ( k )