第六章 几种离散型变量的分布及其应用(正式)
医学统计学课件:第六章 几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数
高考数学知识点精讲常见随机变量的分布类型

高考数学知识点精讲常见随机变量的分布类型高考数学知识点精讲:常见随机变量的分布类型在高考数学中,随机变量的分布类型是一个重要的知识点,理解和掌握这些分布类型对于解决概率相关的问题至关重要。
下面我们就来详细讲解一下常见的随机变量分布类型。
首先,我们来认识一下什么是随机变量。
简单来说,随机变量就是把随机试验的结果用数字表示出来。
比如说掷骰子,我们可以定义随机变量 X 为骰子掷出的点数,那么 X 可能取值 1、2、3、4、5、6。
常见的随机变量分布类型主要有以下几种:一、离散型随机变量的分布1、两点分布两点分布是最简单的一种离散型随机变量分布。
比如抛一枚硬币,正面朝上记为1,反面朝上记为0,那么这个随机变量就服从两点分布。
其概率分布为 P(X = 1) = p,P(X = 0) = 1 p ,其中 0 < p < 1 。
2、二项分布二项分布在实际生活中有很多应用。
比如进行n 次独立重复的试验,每次试验只有两种结果(成功或失败),成功的概率为 p ,失败的概率为 1 p 。
那么成功的次数 X 就服从二项分布,记为 X ~ B(n, p) 。
二项分布的概率公式为:P(X = k) = C(n, k) p^k (1 p)^(n k) ,其中 C(n, k) 表示从 n 个元素中选出 k 个元素的组合数。
举个例子,假设一批产品的次品率为 02,从这批产品中随机抽取10 个,那么抽到次品个数 X 就服从二项分布 B(10, 02) 。
3、超几何分布超几何分布与二项分布有点类似,但适用的场景略有不同。
超几何分布是从有限 N 个物件(其中包含 M 个指定种类的物件)中抽出 n 个物件,成功抽出指定种类物件的次数 X 就是超几何分布。
超几何分布的概率公式为:P(X = k) = C(M, k) C(N M, n k) /C(N, n) 。
比如说在一个有 50 个球,其中 20 个红球,30 个白球的盒子中,随机抽取 10 个球,红球的个数 X 就服从超几何分布。
第六章 几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
第六章 几种离散型变量的分布

累积概率函数:
P( X k )
k x n x
P( X
X 0 n x
k
k)
C (1 )
x 0
由上可知: n次Bernoulli试验中,事件A发生的次数K服从二项 分布。 n次Bernoulli试验有如下特点: A、各次试验结果相互独立; B、每次试验只有二种可能的结果; C、每次试验事件A发生的概率是固定的。
k n k
n k
0<π<1, K=0,1,2,……, n 则称随机变量X服从参数为n, π的二项分布, 记为X ~ B (n, π )或B(X; n, π )
例:临床用针灸治疗某型头痛,有效的概率 为60%,现以该法治疗3例,其中两例有效 的概率是多少?
例:据报道,有10%的人对某药有胃肠道反 应。为考察某厂的产品质量,现任选5人服 用此药。求:2个人有胃肠道反应的概率; 不多于2个人有胃肠道反应的概率。
假定符合一定条件的病人可视为相同的个体。若某药治愈概 率为60%,现用该药治疗10例病人,求治愈病人数的概率分布
X
Pi
样本率P=x/n
0
1
0.0001
0.0016
0.00%
10.00%
2
3 4 5 6 7 8 9 10
0.0106
0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060
>5 合计
12 96
12.5 100.0
96 ——
100.0 ——
对此资料我们可均数、标准差等数值特征指标来概括 资料的特点,均数、标准差可利用原始资料计算。
但更进一步的了解,需知道每一事件所对应的发生概率。
6卡方检验2002

H0:1
,任两对比组的总体有效率相等
2
H1: 1
,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =
k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n
2 c
(a
b)(c
d )(a
2 c)(b
d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05
医学统计学课件:第六章 几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 二项分布的发生数X均数与标准差
17
在 n 次独立重复试验中,出现“阳性”次数 X 的总体均数为
=n
X 的总体方差为
2=n (1-)
X 的总体标准差为
n 1
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
X 3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

0.20012
P(7)
7! 7!(10
0.707(1 7)!
0.7 0)1 0 7
0.26683
P(8)
8! 8!(10
0.708(1 8)!
0.70)1 0 8
0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!
几种离散型变量

u
p 0
0 (1 0 ) n
?
例 6-6
对某疾病采用常规治疗的治愈率为45%。
现随机抽取180名该疾病患者改用新的治疗方法 进行治疗,治愈117人。问新治疗方法是否比常 规疗法的效果好? 本例是单侧检验,记新治疗方法的治愈率为 π, 而π0=0.45。其假设检验为
H0:π=0.45
p
2
(1 )
n
(1 )
n
总体标准差为
p
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率 π 往往并不知道。 此时若用样本资料计算样本率 p=X/n作为π 的估计值,则 p 的=0.55
H1:π>0.55
ɑ =0.05
π=0.55
本例 n=10,π=0.55,k=9。按公式(6-12)有:
P(X 9) P ( X )
X 9 10 10 X 9
10! 0.55 X (1 0.55)10 X X !(10 X )!
=0.023257
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别差 异,今随机抽查了该职业人群男性 120 人和 女性 110 人,发现男性中有 36 人患有颈椎病, 女性中有22人患有颈椎病。试作统计推断。
二项函数 1 展开式的通项
n
n! P( X ) X (1 ) n X X 0,1, 2, , n X !( n X )!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
31
u
p 0 0 (1 0 ) / n 117 / 180 0.45 0.45 1 0.45) 180 ( / 5.394
u=5.394>u0.0005=3.2905 p<0.0005 结论:按=0.05水准,拒绝H0,接受H1, 认为新治疗方法比常规疗法效果好。
负二项分布
2
第一节 二 项 分 布
一、定义 二、适用条件
三、性质
四、二项分布的应用
3
第一节 二项分布
Binomial Distribution
4
Bernoulli试验
毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
特点:某结果发生(A)——结果不发生(非A) 这类只有两种互斥结果可能发生的单次随机 试验称为Bernoulli试验。
27
例5 已知某种非传染性疾病采用甲药治疗 的有效率为0.60。今改用乙药治疗该病患 者10人,发现9人有效。问甲乙两种药物 的疗效是否不同? H0: =0.60 H1: ≠0.60 =0.05
28
10! P( X 9 ) 0.609 (1 0.60)10 9 0.040311 9! (10 9)!
20
正态近似法
当n较大、p和1-p均不太小,如np和 n(1-p)均大于5时: (P - uα/2 Sp , P + uα/2 Sp )
21
例3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染 性疾病患者100人,发现55人有效,试据 此估计该药物治疗有效率的95%可信区间。 本例n=100,p=55/100=0.55
n=6,π=0.3的二项分布
0.3
0.2
p(X)
0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.3的二项分布
0.3
0.2
p(X)
0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13
n=20,π=0.3的二项分布
四、二项分布的应用
1. 总体率的区间估计 2. 样本率与总体率的比较 3. 两样本率的比较 4. 研究非遗传性疾病的家族集聚性
19
例2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术 妇女受孕率的95%可信区间。 本例n=13,X=6。查附表6,取0.05时, 在n=13(横行)与X=6(纵列)的交叉处 数值为19~75,即该吻合术妇女受孕率的 95%可信区间为(19%,75%)。
5
一、定义
二项分布(binomial distribution) 是指在 只会产生两种可能结果如“阳性”或“阴 性”之一的n次独立重复试验(常常称为n 重Bernoulli试验)中,当每次试验的“阳 性”概率保持不变时,出现“阳性”的次 数X=0,1,2, ,n的一种概率分布。 记为X~B (n, ), n为试验次数, 为 “阳性”概率。
33
例7 为研究某职业人群颈椎病发病的性别 差异,今随机抽查了该职业人群男性120 人和女性110人,发现男性中有36人患有 颈椎病,女性中有22人患有颈椎病。试作 统计推断。 记该职业人群颈椎病的患病率男性为π1, 女性为π2,其检验假设为 H0:π1=π2 H1:π1≠π2 34 =0.05
比实际样本更背离无效假设的样本,即满 足P(X=i)≤0.040311的 i (i≠k) 分别有:0、1、 2、10。 P=P(X=9)+P(X=0)+P(X=1)+P(X=2)+P(X=10) = 0.040311+0.000105+0.001573+0.010617 +0.006047=0.058653 结论:按=0.05水准,不拒绝H0,尚不能 认为甲乙两种药物的疗效不同。
x x0
n
11
三、性质
1.平均数 μ=nπ
μp=π(以率表示)
2.标准差
p n(1 ) (1 ) (以率表示) n
12
例1中出现“阳性”次数的均数与标准差
X x n 3 0 .8 2 . 4 X p 0 .8 S x n(1 ) 3 0.8(1 0.8) 0.6928 S p (1 ) / n 0.8 (1 0.8) / 3 0.2309
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布
0.5 0.4
p(X)
0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=3,π=0.3的二项分布
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
S p 0.55(1 0.55) / 100 0.0497
0.55±1.96×0.0497=0.4526,0.6474 即该药物治疗有效率的95%可信区间为 (45.26%,64.74% )。
22
2.样本率与总体率的比较 直接法(单侧检验) 若回答“差”或“低”的问题,需计算 出现“阳性”次数至多为K次的概率:
死 0.20.20.8=0.032
3 生 0.20.80.2=0.032 px 1 1 1 1 2 0.096
2
1
生 死 生
生 0.80.20.2=0.032 死 0.20.80.8=0.128 死 0.80.20.8=0.128 px 2 3 2 1 1 0.384 2 生 0.80.80.2=0.128 死 0.80.80.8=0.512 px 3 3 3 1 0 0.512 3
x 0,1,2, , n
C
x
n
也记作
n 学中二项式定理
n ( a b)
Cn a Cn a b Cn a
n
0
1
n 1
2
n 2
b Cn ab
2
n 1
n 1
Cn b n
n
Cn a n-xb x
25
10
10
结论: 按=0.05水准,拒绝H0,接受H1, 认为实施峡部-峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验)
回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 次 数为k次)出现的概率与更背离无效假设 的极端样本(“阳性”次数i≠k)出现的概 率之和。
n X n! X P( X k ) P( X ) (1 ) ! X 0 X 0 X! (n X) k k
若回答“优”或“高”的问题,需计算 出现“阳性”次数至少为K次的概率:
n X n! X P( X k ) P( X ) (1 ) ! Xk X k X! (n X ) 23 n n
例4 据报道,对输卵管结扎了的育龄妇女 实施壶腹部-壶腹部吻合术后,受孕率为 0.55。今对10名输卵管结扎了的育龄妇女 实施峡部-峡部吻合术,结果有9人受孕。 问实施峡部-峡部吻合术妇女的受孕率是否 高于壶腹部-壶腹部吻合术? H0: =0.55 H1: >0.55 =0.05
24
按0.55的受孕率,10名实施峡部-峡部吻合 术的妇女,出现至少9人受孕的概率:
5. 群检验
18
1.总体率的区间估计
查表法
对于n≤50小样本资料,直接查附表6“百分率 的可信区间”表。得总体率1-可信区间。
附表6中X最大为25,当X>n/2时,按“阴性” 数n-X查得总体阴性率的1-可信区间QL~ QU,再转换成阳性率的1-可信区间: PL=1-QU ,PU=1-QL。
32
3.两样本率的比较 当n1与n2均较大,p1、1-p1和p2、1-p2均不 太小,如n1 p1、 n1(1-p1)和n2 p2、 n2(1-p2) 均大于5时:
p1 p 2 u S p1 p 2
S p1 p 2 X1 X2 X1 X2 1 1 1 n1 n 2 n 1 n 2 n1 n 2
13
3.图形 =0.5时,二项分布对称。 ≠0.5时,二项分布偏态。 当n较大、p和1-p均不太小,如np和 n(1-p) 均大于5时,二项分布近似正态 分布。
14
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=3,π=0.5的二项分布
6
二、适用条件
1. 每次试验只会发生两种对立的结果之一, 两种互斥结果的概率之和恒等于1;
2. 每次试验产生某种结果(如“阳性”) 的概率π固定不变; 3. 各次试验是互相独立的,即任何一次试 验结果的出现不会影响其它试验结果出 现的概率。
7
例1
设小白鼠接受某种毒物一定剂量时,其死 亡率为80%, 对每只小白鼠来说,其死亡 概率为0.8,生存概率为0.2,若每组各用甲、 乙、丙三只小白鼠逐只做实验,观察每组 小白鼠的存亡情况,其可能发生的结果见 下表。
1
2
死 死
0