统计学课件Ch06几种离散型变量的分布及其应用
合集下载
离散型随机变量及其分布列 课件

X0
1 …m
P
C0MCNn--0M CnN
C1MCNn--1M CnN
…
CmMCnN--mM CNn
• 辨析感悟
• 1.离散型随机变量
• (1)抛掷均匀硬币一次,出现正面的次数是 随机变量.(√)
• (2)离散型随机变量的分布列中,随机变量 取各个值的概率之和可以小于1. (×)
• (3)离散型随机变量的各个可能值表示的事 件是彼此互斥的. (√)
• (2)求X的数学期望E(X).
解 (1)由题意得 X 取 3,4,5,6,
且 P(X=3)=CC3539=452,P(X=4)=CC14·C93 25=1201, P(X=5)=CC24·C93 15=154,P(X=6)=CC3439=211.
所以 X 的分布列为
X3 4 5 6
P
5 42
10 21
0
1
P 1-p p
• ,其中p=P(X=1)称为成功概率.
(2)超几何分布:在含有 M 件次品的 N 件产品中,任取 n 件,其
CkMCnN--kM 中恰有 X 件次品,则 P(X=k)= CnN ,k=0,1,2,…,m,
其中 m=min{M,n},且 n≤N,M≤N,n,M,N∈N*,称随机
变量 X 服从超几何分布.
• 从某自然保护区2013年全年每天的PM2.5 监测数据中随机地抽取10天的数据作为样本, 监测值频数如下表所示:
PM2.5 日均值( [25,3 (35,4 (45,5 (55,6 (65,7 (75,8 微克/立 5] 5] 5] 5] 5] 5]
方米)
频数 3 1 1 1 1 3
•(1)从这10天的PM2.5日均值监测数据中,随机抽出3天, 求恰有一天空气质量达到一级的概率;
离散型随机变量的分布列 课件

ξ=-1 有以下 6 种情况:(1,2),(1,3),(1,4),(2,3),(2,
4),(3,4),故 P(ξ=-1)=166=38;
ξ=1 有以下 2 种情况:(3,2),(4,3),故 P(ξ=1)=126=18,
所以随机变量 ξ 的分布列为
ξ -1 0 1
P
3 8
11 28
探究点 2 离散型随机变量的分布列的性质 设随机变量 X 的分布列 P(X=k5)=ak(k=1,2,3,4,
5). (1)求常数 a 的值; (2)求 P(X≥35); (3)求 P(110<X<170).
【解】 (1)由 P(X=k5)=ak,k=1,2,3,4,5 可知,
k=5 1P(X=k5)=k=5 1ak=a+2a+3a+4a+5a=1,
解得 a=115. (2)由(1)可知 P(X=k5)=1k5(k=1,2,3,4,5), 所以 P(X≥35)=P(X=35)+P(X=45)+P(X=1) =135+145+155=45.
探究点 3 两点分布与超几何分布 一个袋中装有 6 个形状大小完全相同的小球,其中红
球有 3 个,编号为 1,2,3;黑球有 2 个,编号为 1,2;白球 有 1 个,编号为 1.现从袋中一次随机抽取 3 个球. (1)求取出的 3 个球的颜色都不相同的概率. (2)记取得 1 号球的个数为随机变量 X,求随机变量 X 的分布列.
随机变量 X 的分布列为 P(X=k)=k(k+c 1),
k=1,2,3,4,c 为常数,则 P 23<X<52 的值为(
)
A.4
B.5
5
6
C.2
D.3
3
4
解析:选 B.由题意1×c 2+2×c 3+3×c 4+4×c 5=1, 即45c=1,c=54, 所以 P23<X<52 =P(X=1)+P(X=2) =54×1×1 2+2×1 3 =56.故选 B.
医学统计学课件:第六章 几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数
离散型随机变量及其分布函数_图文

5.超几何分布
设X的分布律为
说明 超几何分布在关于废品率的计件检验中常用到.
三、内容小结
1.常见离散型随机变量的分布 两点分布 二项分布 泊松分布
几何分布 超几何分布
两点分布
二项分布
泊松分布
则 X 的取值范围为 (a, b) 内的任一值.
定义 说明
离散型随机变量的分布律也可表示为 或
例1 设一汽车在开往目的地的路上需经过四盏信号
灯.每盏灯以
的概率禁止汽车通过.以
表示汽车首次停下时已经过的信号灯盏数(信
号灯的工作是相互独立的),求 的分布律.
Байду номын сангаас
离散型随机变量的分布函数与其分布律之间的关系 :
也就是: 分布律
分布函数
二、常见离散型随机变量的概率分布
1.两点分布
设随机变量 X 只取0与1两个值 , 它的分布律为
则称 X 服从 (0-1) 分布或两点分布或伯努利分布.
说明
两点分布是最简单的一种分布,任何一个只有 两种可能结果的随机现象, 比如新生婴儿是男还是 女、明天是否下雨、种籽是否发芽等, 都属于两点 分布.
离散型随机变量及其分布函数_图文.ppt
一、离散型随机变量的分布函数
随机变量
离散型 非离散型
连续型 其它 (1)离散型 若随机变量所有可能的取值为有限个
或可列无穷个,则称其为离散型随机变量.
实例1 观察掷一个骰子出现的点数. 随机变量 X 的可能值是 : 1, 2, 3, 4, 5, 6.
实例2 若随机变量 X 记为 “连续射击, 直至命 中时的射击次数”, 则 X 的可能值是:
二十世纪初罗瑟福和盖克两位科学家在观察 与分析放射性物质放射出的 粒子个数的情况时, 他们做了2608 次观察(每次时间为7.5 秒),发现 放射性物质在规定的一段时间内, 其放射的粒子 数X 服从泊松分布.
第六章 几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

0.20012
P(7)
7! 7!(10
0.707(1 7)!
0.7 0)1 0 7
0.26683
P(8)
8! 8!(10
0.708(1 8)!
0.70)1 0 8
0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!
6.几种离散型变量的分布及其应用

P( x) C (1 )
x n x
n x
,( x 1, 2, 3......n)
n! C 式中: x !( n x )!
x n
称二项系数。
一、二项分布的适用条件和性质
(一)二项分布的适用条件:
即分别发生两种结果的概率之和恒等于1。
1. 各观察单位只能具有互相对立的一种结果,属于二项分类资料;
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
( a b) C a b C a b C a b C a b
n k 0 n 1 n 1 1 n k n k n 0
C a b
2 n
2 n 2
...
C ab
n k
Bernoulli试验 毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
例:对13名输卵管结扎的育龄妇女经壶腹部-壶腹 部吻合术后,观察其受孕情况,发现有7人受孕, 请估计该吻合术妇女受孕率的95%可信区间。
未孕率的95%CI:
注意:X>n/2时应以n-X查表 此例:n=13, n- x=6 查表得95%CI为:19%~75%。
25%~81%
(二)正态近似法:
应用条件:当n较大、 np及n(1−p)均≥5
抓中三个黑球的概率: P(3)=0.5×0.5×0.5=0.12 5
抓中两黑一白的概率: P(2)=3×0.125=0.375
定理:在几个互不相容的事件 中,任一事件发生的概率等于 这几个事件的概率之和。
离散型变量的分布及其应用

【解】本例 n=13,X=6。查附表 6,取a=0.05 时,在
n=13(横行)与 X=6(纵列)的交叉处数值为 19–75,即该
吻合术妇女受孕率的 95%可信区间为(19%,75%)。
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.3 反查表求总体率的区间估计(P94)
23
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.4 正态近似法求总体率的区间估计(P94) 24
例 6-3 在观测一种药物对某种非传染性疾病的治疗效果 时,用该药治疗了此种非传染性疾病患者 100 人,发现 55 人有效,试据此估计该药物治疗有效率的 95%可信区间。 本例 n=100,X=55,经计算得 p=55/100=0.55,Sp=0.0497。
quant:发生数; n=实验次数; prob:发生率。
P(X=6)= PDF.BINOM(6, 10, 0.7).
When n is 1, this is the same as PDF.BERNOULLI.
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.55 例6-1 SPSS操作过程
n
且 P(X) 1。
X 0
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.4 二项系数的展开:杨辉三角
8
1
1次
11
2次
121
3次
1331
n 1, (1 )
X 1 X 0
4次 1 4 6 4 1 5次 1 5 10 10 5 1
n 2,( (1 ))2 2 2 (1 ) (1 )2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)出现“阳性”的次数至多为k次的概率为:
k
k
P(X k) P( X )
n!
X (1 ) n X
X 0
X 0 X !(n X )!
(2)出现“阳性”的次数至少为k次的概率为
n
n
P(X k) P( X )
n!
X (1 ) n X
X k
X k X !(n X )!
H0:π=0.55
H1:π>0.55
=0.05
对这10名实施峡部-峡部吻合术的妇女,按 0.55的受孕率,若出现至少9人受孕的概率 大于0.05,则不拒绝H0;否则,拒绝H0, 接受H1。
本例n=10,π=0.55,k=9。按公式(6-12) 有:
10
10
P(X 9) P(X )
0.55+1.96×0.0497=0.6474
即该药物治疗有效率的 95%可信区间为(45.26%,
64.74% )。
(二)样本率与总体率的比较
1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
P(X i) P(X k) 。
例6-4 据报道,对输卵管结扎了的育龄妇女实施 壶腹部-壶腹部吻合术后,受孕率为0.55。今对10 名输卵管结扎了的育龄妇女实施峡部-峡部吻合术, 结果有9人受孕。问实施峡部-峡部吻合术妇女的 受孕率是否高于壶腹部-壶腹部吻合术?
显然,这是单侧检验的问题,其假设检对某疾病采用常规治疗,其治愈率 为45%。现改用新的治疗方法,并随机抽 取180名该疾病患者进行了新疗法的治疗, 治愈117人。问新治疗方法是否比常规疗 法的效果好?
本例是单侧检验,记新治疗方法的治愈率 为π,而π0=0.45。其假设检验为
H0:π=0.45 H1:π>0.45
总体均数为 n
总体方差为 2 n (1 )
总体标准差为 n (1 )
若以率表示,则样本率p的
总体均数为 p
总体方差为
2 p
(1 )
n
总体标准差为
p
(1 )
n
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
规律:二项分布 二项式 1 n
展开的通项
P( X )
(
n X
)
X
(1
)nX
P( p)
式中
(
n X
)
n! X!(n
X
)!
且总有 P( X ) 1
二项分布有两个参数:
总体率
样本含量 n
记作:X~B(n,π)
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10 人,试分别计算这10人中有6人、7人、8人 有效的概率。
两样本率的比较,目的在于对相应的两总体率进 行统计推断。
设两样本率分别为p1和p2,当n1与n2均较大,且 p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1) 及n2p2、n2(1-p2)均大于5时,可利用样本率的分 布近似正态分布,以及独立的两个正态变量之差 也服从正态分布的性质,采用正态近似法对两总 体率作统计推断。
=0.05
本例n=180,p=117/180=0.65
u 0.65 0.45 5.394 0.45(1 0.45) 180
查u界值表(t界值表中 为 ∞的一行)得
单侧 接果好受。H1
,P 即0.新000的。5 治按疗а=方0.法05比水常准规,疗拒法绝H的0效,
(三)两样本率的比较
N(n,n (1 )) ,而相应的样本率p的分布也近 似 N( , p2) 正态分布。为此,当n较大、 p和1-p均不太小如np和n(1-p)均大于5时, 可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
的1可信区间为:
( p u 2S p , p u 2S p )
如: 的95%可信区间为 ( p 1.96Sp, p 1.96Sp ) 的99%可信区间为 ( p 2.58Sp, p 2.58Sp )
检验统计量u的计算公式为:
u p1 p2 S p1 p2
S p1 p2
X1 X 2 (1 X1 X 2 )( 1 1 )
n1 n2
n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别 差异,今随机抽查了该职业人群男性120人 和女性110人,发现男性中有36人患有颈椎 病,女性中有22人患有颈椎病。试作统计 推断。
8!(10 8)!
一、二项分布的适用条件和性质
(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果
之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的
概率π固定不变;
3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出
记 性为该π职2,业其人检群验颈假椎设病为的患病率男性为π1,女 H0:π1=π2
H1:π1≠π2
=0.05
本例 n1=120 , X1=36 , p1=X1/n1=36/120=0.30 ; n2=110,X2=22,p2=X2/n2=22/110=0.20
S p1 p2
36 22 (1 36 22 )( 1 1 ) =0.0573
例6-8 某研究者为研究某种非遗传性疾病 的家族集聚性,对一社区82户3口人的家庭 进行了该种疾病患病情况调查,所得数据 资料见表6-1中的第(1)、(2)栏。试分 析其家族集聚性。
例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估 计该药物治疗有效率的95%可信区间。
本例 n=100,p=55/100=0.55
Sp
p(1 pS)p 0.55(1 0.55) 0.0497
n
100
0.55-1.96×0.0497=0.4526
=0.058652
0.05<P<0.10,按 =0.05 水准,不拒绝 H0,尚不
能认为甲、乙两种药物的疗效不同。
2.正态近似法 当n较大、p和1-p均不太小, 如np和n(1-p)均大于5时,利用样本率的分 布近似正态分布的原理,可作样本率p与已 知总体率π0的比较。检验统计量u值的计算 公式为:
现 9 人有效。问甲、乙两种药物的疗效是否不同?
显然,这是双侧检验的问题。记乙药治疗该疾病
的有效率为π,其假设检验为
H0:π=0.60
H1:π 0.60
=0.05
本例 n=10,按π=0.60,实际样本阳性数 X =9 出现
的概率由公式(6-1)有
P( X
9)
10! 0.60 9 (1 0.60)109 9!(10 9)!
75%)。
附表6只列出
X
n2的部分。当X
n 2
时,可先按“阴
性”数n-X查得总体阴性率的1 可信区间QL~QU,
再用下面的公式转换成所需的阳性率的 1可信
区间。 PL=1-QU, PU=1-QL
2. 正态近似法 根据数理统计学的中心极限 定理可得,当n较大、π不接近0也不接近1 时,二项分布B(n,π)近似正态分布
本 例 n=10 , π=0.70 , X=6 , 7 , 8 。 按 公 式 (6-1)计算相应的概率为
P(6) 10! 0.706 (1 0.70)106 0.20012 6!(10 6)!
P(7) 10! 0.707 (1 0.70)107 0.26683
7!(10 7)!
P(8) 10! 0.708 (1 0.70)108 0.23347
0.040311
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足
P(X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
P P(X 9) P(X 0) P(X 1) P(X 2) P(X 10)
=0.040311+0.000104858+0.001572864+0.010617 +0.006046618
n=8
阳性数X
0 0 1 2 3 4 5 6 7 8 9 10
n=10
阳性数X
图 6-2. =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法
1. 查表法 对于n 50的小样本资料,直接
查附表6百分率的95%或99%可信区间表, 即可得到其总体率的可信区间。
第一节 二项分布
分类资料:分类个体数。最简单——分两类
总体:总个体数 N 某类个体数 M 非某类个体数 N M 总体率(构成比) M / N
统计推断:由样本信息推断
样本:含量:n
某类个体数 X 非某类个体数 n X
样本率(构成比) p X / n
X 0,1, 2, , n
p 0,1,2, ,n nnn n
对于双侧检验而言,由于要回答的是
“有无差别”,即备择假设 H1:π π0 是否
成立,因此,所要计算的双侧检验概率 P 值 应为实际样本(记“阳性”次数为 k 次)出
现的概率与更背离无效假设的事件(记“阳
性”次数为 i 次,i k)出现的概率之和,
即 P P(X k) P(X i) , 其 中 i 满 足 i
在上面的例6-1中,对这10名非传染 性疾病患者的治疗,可看作10次独立 的重复试验,其疗效分为有效与无效, 且每一名患者治疗有效的概率