统计学Ch06 几种离散型变量的分布及其应用

合集下载

医学统计学课件:第六章 几种离散型变量的分布及其应用

医学统计学课件:第六章  几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数

06统计学第六章 几种离散型变量的分布及其应用

06统计学第六章  几种离散型变量的分布及其应用

(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
(1)出现“阳性”的次数至多为k次的概率为:
对于双侧检验而言, 对于双侧检验而言 , 由于要回答的是 有无差别” “有无差别 ” 即备择假设 H1:π ≠ π0 是否 , 成立,因此 ,所要计算的双侧检验概率 成立,因此,所要计算的双侧检验概率 P 值 应为实际样本( 阳性” 应为实际样本(记“阳性”次数为 k 次)出 现的概率与更背离无效假设的事件( 现的概率与更背离无效假设的事件(记“阳 出现的概率之和, 性”次数为 i 次,i ≠ k)出现的概率之和, 即
第一节 二项分布
二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性” 之一的n次独立 n 独立 独立重复试验(常常称为n重 n Bernoulli试验)中,当每次试验的“阳性” 概率保持不变时,出现“阳性”的次数X=0, 1,2,…,n的一种概率分布。
10! P ( X = 9) = 0.60 9 (1 − 0.60)10−9 = 0.040311 9!(10 − 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P ( X = i ) ≤ 0.040311 的 i(i ≠ 9)分别有:0、1、2、10。 分别有: 10。 因此, 因此 ,所要计算的双侧检验概率 P 值为
阳性数X
图 6-2.
π =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法

常见离散型随机变量的分布

常见离散型随机变量的分布

P(X
k)
C
k n
pk (1
p)nk
k 0,1, 2, ..., n
称X所服从的分布为二项分布. 记为 X~B(n,p)或X~b(n,p).
二项分布X的分布列表(q=1-p)
X0
1
k
n
P qn Cn1 pqn1
Cnk pk qnk
pn
说明:若X ~ B(n, p),则
二项分布 n 1 两点分布
28
EX E( X1 X 2 X n ) EX1 EX 2 EX n np DX D( X1 X 2 X n ) DX1 DX 2 DX n np(1 p) npq 注:利用方差和的性质时要注意相互独立的条件。
例2 设X表示 10次独立重复射击命中目标的次 数,每次射中目标的概率为0.4, 则X2的数学期 望E(X2)=( 18.4 )
k 0
k0 k !
e
k 1
k1 (k 1)!
ee
E(X )
D(X )
E( X 2 ) k 2P{X k} [k (k 1) k ] k e
k 0
k 0
k!
2e
k 2
E(X )
k2 (k 2)!
2ee 2
D( X ) E( X 2 ) [E( X )]2 2 2
P ( X 3 ) P ( A1 A2 A3 ) (1 p)2 p
所求射击次数X的概率分布为:
P ( X k ) (1 p )k1 p k 1, 2,
四、几何分布
在独立重复伯努利试验中,若成功率(事件A发 生的概率)为p,如果X为首次成功(事件A首次 发生)时的试验次数,X的分布列为
例4、设随机变量 X 服从参数为λ的泊松分布,且已知

常见的离散型随机变量的分布

常见的离散型随机变量的分布

30台设备发生故障不能及时维修为事件 Ai

P( Ai )
P(Y
2)
k 2
e0.3 0.3k k!
0.0369 i 1,2,3
三个人各独立负责30台设备发生故障不能及时
维修为事件 A1 A2 A3 3
PA1 A2 A3 1 P( Ai )
i1
1 (1 0.0369)3 0.1067 0.013459
例1 独立射击5000次,每次的命中率为0.001, 求 (1) 最可能命中次数及相应的概率;
(2) 命中次数不少于2 次的概率.
解 (1) k = [( n + 1)p ] = [( 5000+ 1)0.001] = 5
P5000(5) C55000(0.001)5 (0.999)4995 0.1756
0 1 2 34 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000
P 0.273•
由图表可见 , 当 k 2或3 时, 分布取得最大值
P8(2) P8(3) 0.273 此时的 k 称为最可能成功次数
•••••••••
012345678
(1) 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01?
(2) 问3个人共同负责90台还是3个人各自独立负 责30台设备发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人,设 X 为90 台
设备中发生故障的台数,则 X ~ B( 90, 0.01)
90
P( X N ) C9k0 (0.01)k (0.99)Nk
k N 1
令 90 0.01 0.9

第六章 几种离散型变量的分布及其应用(正式)

第六章  几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X

6卡方检验2002

6卡方检验2002

H0:1


,任两对比组的总体有效率相等
2
H1: 1


,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =

k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n

2 c

(a

b)(c

d )(a
2 c)(b

d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt


0.20012
P(7)
7! 7!(10
0.707(1 7)!

0.7 0)1 0 7

0.26683
P(8)
8! 8!(10
0.708(1 8)!

0.70)1 0 8

0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!

6第六章二项分布22

6第六章二项分布22

S p = p (1 p ) / n
率的标准误与样本率和样本大小的关系如何? 率的标准误与样本率和样本大小的关系如何? 率的标准误的用途: 率的标准误的用途: ①衡量率的抽样误差 ②衡量样本率的可靠性 ③估计数总体率的可信区间 率的假设检验. ④率的假设检验.
2.二项分布的图形 2.二项分布的图形 (1)π=0.5,对称分布; 0.5,对称分布;
一,二项分布的适用条件和性质 (一)二项分布的适用条件 1.两种结果相互对立; 1.两种结果相互对立 两种结果相互对立; 2.已知固定的π和 n; 2.已知固定的 已知固定的π 3.各次试验相互独立. 3.各次试验相互独立 各次试验相互独立.
(二)二项分布的性质 1.二项分布的均数和标准差 二项分布的均数和标准差 1.绝对数形式: 均数 绝对数形式: 绝对数形式
所有可能结果 生 生 生 生 生 死 生 死 生 死 生 生 生 死 死 死 生 死 死 死 生 死 死 死 合计 每组小白鼠的死亡和生存只数及其概率 每种结果的概率 死亡数 不同死亡数的概率 0.008 0 0.008 0.032 0.032 1 0.096 0.032 0.128 0.128 2 0.384 0.128 0.512 3 0.512 1.000 1.000 -
例6-1 某种药物治疗某种非传染性疾病的 有效率为0.70,无效率为 有效率为 ,无效率为0.30.今用该药治疗该疾 . 病患者10人 试分别计算这10人中有 人中有6人 病患者 人,试分别计算这 人中有 人,7人,8 人 人有效的概率. 人有效的概率.
10! 6 10 6 P (6) = 0.70 (1 0.70) = 0.20012 6!(10 6)! 10! 7 10 7 P (7) = 0.70 (1 0.70) = 0.26683 7!(10 7)! 10! 8 10 8 P (8) = 0.70 (1 0.70) = 0.23347 8!(10 8)!
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 二项分布
分类资料:分类个体数。最简单——分两类
总体:总个体数 N 某类个体数 M 非某类个体数 N M 总体率(构成比) M / N
统计推断:由样本信息推断
样本:含量:n
某类个体数 X 非某类个体数 n X
样本率(构成比) p X / n
X 0,1, 2,L , n
p 0 , 1 , 2 ,L , n nnn n
N(n,n (1 )) ,而相应的样本率p的分布也近 似 N( , p2) 正态分布。为此,当n较大、 p和1-p均不太小如np和n(1-p)均大于5时, 可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
的1可信区间为:
( p u 2S p , p u 2S p )
如: 的95%可信区间为 ( p 1.96Sp, p 1.96Sp ) 的99%可信区间为 ( p 2.58Sp, p 2.58Sp )
第六章
几种离散型变量的 分布及其应用
讲授内容: 第一节 二项分布 第二节 Poisson分布 第三节 负二项分布(不讲)
随机变量有连续型和离散型之分, 相应的概率分布就可分为连续型分布和 离散型分布。有关连续型分布如 u 分布、
t 分布和 F 分布等在前面的章节中已作
了介绍。本章介绍在医学中常用的三种 离散型分布:二项分布、Poisson 分布和 负二项分布。
75%)。
附表6只列出
X
n2的部分。当X
n 2
时,可先按“阴
性”数n-X查得总体阴性率的1 可信区间QL~QU,
再用下面的公式转换成所需的阳性率的 1可信
区间。 PL=1-QU, PU=1-QL
2. 正态近似法 根据数理统计学的中心极限 定理可得,当n较大、π不接近0也不接近1 时,二项分布B(n,π)近似正态分布
0.55+1.96×0.0497=0.6474
即该药物治疗有效率的 95%可信区间为(45.26%,
64.74% )。
(二)样本率与总体率的比较
1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
例6-2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术妇 女受孕率的95%可信区间。
本例n=13,X=6。查附表6,取0.05时,在n=13
(横行)与X=6(纵列)的交叉处数值为19~75,
即该吻合术妇女受孕率的95%可信区间为(19%
8!(10 8)!
一、二项分布的适用条件和性质
(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果
之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的
概率π固定不变;
3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出
规律:二项分布 二项式 1 n
展开的通项
P( X )
(
n X
)
X
(1
)nX
P( p)
式中
(
n X
)
n! X!(n
X
)!
且总有 P( X ) 1
二项分布有两个参数:
总体率
样本含量 n
记作:X~B(n,π)
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10 人,试分别计算这10人中有6人、7人、8人 有效的概率。
n=8
阳性数X
0 0 1 2 3 4 5 6 7 8 9 10
n=10
阳性数X
图 6-2. =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法
1. 查表法 对于n 50的小样本资料,直接
查附表6百分率的95%或99%可信区间表, 即可得到其总体率的可信区间。
总体均数为 n
总体方差为 2 n (1 )
总体标准差为 n (1 )
若以率表示,则样本率p的
总体均数为 p
总体方差为
2 p
(1 )
n
总体标准差为
p
(1 )
n
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率π往往并不知道。此 时若用样本资料计算样本率p=X/n作为π的 估计值,则 的p 估计为:
S p p(1 p) / n
2.二项分布的图形 对于二项分布而言,当 π=0.5时,分布是对称的,见图6-1;
图 6-1. =0.5 时,不同 n 值下的二项分布
当 0.5时,分布是偏态的,但随着n的增
大,分布趋于对称。当n 时,只要π不
太靠近0或1,二项分布则接近正态分布, 见图6-2。
P(X)
0.5 0.4 0.3 0.2 0.1
0
0
1
2
3
n=2
阳性数X
P(X)
0.4 0.3 0.2 0.1
0 0
12345
n=5
阳性数X
P(X)
0.3
0.3
0.2
0.2
P(X)
0.1
0.1
0
012345678
本 例 n=10 , π=0.70 , X=6 , 7 , 8 。 按 公 式 (6-1)计算相应的概率为
P(6) 10! 0.706 (1 0.70)106 0.20012 6!(11 0.70)107 0.26683
7!(10 7)!
P(8) 10! 0.708 (1 0.70)108 0.23347
例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估 计该药物治疗有效率的95%可信区间。
本例 n=100,p=55/100=0.55
Sp
p(1 pS)p 0.55(1 0.55) 0.0497
n
100
0.55-1.96×0.0497=0.4526
在上面的例6-1中,对这10名非传染 性疾病患者的治疗,可看作10次独立 的重复试验,其疗效分为有效与无效, 且每一名患者治疗有效的概率
(π=0.70)是恒定的。这样,10人 中发生有效的人数X~B(10,0.70)。
(二) 二项分布的性质
1. 二项分布的均数与标准差 在n次独立重 复试验中,出现“阳性”次数X的
相关文档
最新文档