超几何分布与二项分布的联系
超几何分布于二项分布的区别与联系

§超几何分布与二项分布的区别与联系1、二项分布:一般地,在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为()(1),0,1,2,...,.k k n k n P X k C p p k n -==-=此时称随机变量X 服从二项分布,记作X ~(,)n p ,并称p 为成功概率。
2.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则(),0,1,2,...,.k N K M N M n NC C P X k k m C --⋅=== 此时称随机变量X 服从超几何分布。
注意:超几何分布中必须同时满足两个条件:一是抽取的产品不再放回去; 二是产品数是有限个为N (总数较少).当这两个条件中任意一个发生改变,则不再是超几何分布.一、 当抽取的方式从无放回变为有放回,超几何分布变为二项分布【例1】从含有3件次品的10产品中有放回地逐次取,每次取一个,取3次,用X 表示次品数。
(1) 求X 的分布列;(2) 求()E X 和()D X二、 当产品总数N 很大时,超几何分布变为二项分布【例2】 从批量较大的产品中,随机取出10件产品进行质量检测,若这批产品的不合格率为0.05,随机变量ξ表示这10件产品中的不合格品数,求随机变量ξ的数学期望()E ξ【例3】根据我国相关法规则定,食品的含汞量不得超过1.00ppm,沿海某市对一种贝类海鲜产品进行抽样检查,抽出样本20个,测得含汞量(单位:ppm)数据如下表所示:(1)若从这20个产品中随机任取3个,求恰有一个含汞量超标的概率;(2)以此20个产品的样本数据来估计这批贝类海鲜产品的总体,若从这批数量很大的贝类海鲜产品中任选3个,记ξ表示抽到的产品含汞量超标的个数,求ξ的分布列及数学期望Eξ.()【例5】一条生产线上生产的产品按质量情况分为三类:A类、B类、C类。
超几何分布和二项分布

超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。
它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。
本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。
一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。
具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。
其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。
超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。
2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。
3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。
超几何分布在实际应用中有着广泛的应用。
例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。
二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。
具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。
其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。
二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。
2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。
超几何分布与二项分布的联系

超几何分布与二项分布的联系超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
课本对于超几何分布的定义是这样的:一般的,若一个随机变量的分布列为,其中,,则称服从超几何分布,记为。
其概率分布表为:对于二项分布的定义是这样的:若随机变量的分布列为,则称服从参数为的二项分布,记为。
其概率分布表为: 超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量的取值都从0连续变化到,对应概率和三个值密切相关.可见两种分布之间有着密切的联系.课本中对超几何分布的模型建立是这样的:若有N件产品,其中M件是废品,无返回地任意抽取n件,则其中恰有的废品件数X是服从超几何分布的。
而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有N件产品,其中M件是废品,有返回的任意抽取n件,则其中恰有的废品件数X是服从二项分布的。
在这里,两种分布的差别就在于“有”与“无”的差别,只要将概率模型中的“无”改为“有”,或将“有”改为“无”,就可以实现两种分布之间的转化。
“返回”和“不返回”就是两种分布转换的关键。
如在2.2节有这样一个例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率。
本题采用的解法是摸出球中的红球个数X服从超几何分布,但是如果将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球个数X将不再服从超几何分布,而是服从二项分布。
我们分别来计算两种分布所对应的概率: 这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说,下面我们对以上猜想作出证明:产品个数N无限大,设废品率为p,则, 以上的证明与我们的直观思想相吻合:在废品为确定数M的足够多的产品中,任意抽取n个(由于产品个数N无限多,无返回与有返回无区别,故可看作n次独立试验)中含有k个废品的概率当然服从二项分布。
超几何分布与二项分布的区别联系

件的概率: ⑴3 台都没有报警; (2)恰好有一台报警; (3)恰好有两台报警;
分析: 1.一个警报器对另一个警报器有干扰吗?
2.每一个警报器报警的概率一样吗?
3.属于几次独立重复实验?
返回
1.一个警报器对另一个警报器有干扰吗? 2.每一个警报器报警的概率一样吗? 3.属于几次独立重复实验?
(2)如以该次检查的结果作为该批次每件产品大肠菌群超标的概率,如 从该批次产品中任取2件,设随机变量η为大肠菌群超标的产品数量,求P(η =1)的值及随机变量η的数学期望.
规律总结:当提问中涉及'‘用样本数据来估计总体数
据”字样或有此意思表示的时候,就是二项分布,否则就不是。
返回
跟踪训练 1
1.(广东高考 17) 某食品厂为了检查一条自动包装流水线的生产情 况,随机抽取该流水线上的 40 件产品作为样本称出它们的重量(单 位:克),重量的分组区间为(490,495],(495,500],……,(510,515], 由此得到样本的频率分布直方图,如图 4 所示。 (1)根据频率分布直方图,求重量超过 505 克的产品数量。 (2)在上述抽取的 40 件产品中任取 2 件,设 Y 为重量超过 505 克 的产品数量, 求 Y 的分布列。 (3)从流水线上任取 5 件产品, 求恰有 2 件产品合格的重量超过 505 克的概率。
(1).C30 0.90 (0.1)3 0.001 (2).C31(0.9)1(0.1)2 0.027 (3).C32 (0.9)2 (0.1)1 0.243
返回
返回
探究一 某地工商局从某肉制品公司的一批数量较大的火腿肠产品中
抽取10件产品,检验发现其中有3件产品的大肠菌群超标. (1)如果在上述抽取的10件产品中任取2件,设随机变量ξ为
关于二项分布与超几何分布问题区别举例

关于“二项分布”与“超几何分布”问题举例概率问题是历年高考必考内容,也是高考试题研究的热点话题;因此,对于这部分内容,我们在备考复习中也投入了大量的精力,作了充分的准备;然而,在平时的练习和模考中,经常会发现学生的错误频频,准确地讲:对“二项分布”和“超几何分布”的概念模糊,判断不准,互相误用,导致错误;为此,本文对“二项分布”和“超几何分布”的概念和应用作出具体的剖析. 一.基本概念 1.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件⎨X=k ⎬发生的概率为:P(X=k)= nNkn MN k M C C C --⋅,k= 0,1,2,3,⋯⋯,m ;其中,m = min ⎨M,n ⎬,且n ≤ N , M ≤ N . n,M,N ∈ N *为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n ⋅ M N2.二项分布在n 次独立重复试验中,设事件A 发生的次数为X,在每次试验中,事件A 发生的概率为P ,那么在n 次独立重复试中,事件A 恰好发生k 次的概率为: P(X=k)= C n k p k (1-p)n-k (k=0,1,2,3,⋯,n),此时称随机变量X 服从二项分布. 记作:X ~ B(n,p),EX= np3.“二项分布”与“超几何分布”的联系与区别 (1)“二项分布”所满足的条件每次试验中,事件发生的概率是相同的;是一种放回抽样. 各次试验中的事件是相互独立的;●每次试验只有两种结果,事件要么发生,要么不发生;❍随机变量是这n次独立重复试验中事件发生的次数.(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;(3)“二项分布”和“超几何分布”是两种不同的分布,但其期望是相等的.几何分布”和“二项分布”的这种“巧合”,使得“超几何分布”期望的计算大简化.共同点:每次试验只有两种可能的结果:成功或失败。
二项分布和超几何分布

二项分布和超几何分布二项分布和超几何分布是统计学中比较常见的两个概率分布,它们都是很重要的知识点,被应用在许多领域,尤其是生物和药物研究等统计分析中。
在本文中,我们将对这两个概率分布进行介绍和比较,包括定义、性质、应用、关系以及如何求解这两个概率分布。
一、二项分布二项分布是一种偏态分布,也被称为二项概率分布,它以独立的事件进行描述,用来描述一个独立的试验或该试验的结果。
它形成了一种定义精确的概率模型,用来对实际问题进行分析、预测和解决。
二项分布中有两个参数,即n(试验次数)和p(每次试验成功的概率)。
假设有一个试验,该试验有n次,每次试验成功的概率为p,则最终成功的次数X服从二项分布:X~B(n,p)。
其性质如下:(1)二项分布的期望值E[X] = np。
(2)二项分布的方差 D[X]= npq=np(1-p)。
(3)当n趋于无穷大,p趋于某一定值时,此时X服从泊松分布。
(4)二项分布的n和p均大于0,当n=1时,二项分布即成为伯努利分布。
二项分布的应用非常广泛,常被应用在质量控制、生物学、总体调查中。
比如,在质量检验中,二项分布被应用在检验样本中不良品率检验;在生物学中,可以用二项分布研究DNA分子的突变率;在总体调查中,也可用二项分布来描述一个样本是否属于某一总体。
求解二项分布的方法:一般通过概率计算和抽样模拟的方法。
概率计算方法是对二项分布概率的精确计算,即在已知成功的概率p和试验次数n的情况下,可以精确算出在n次试验中成功m次出现的概率。
而抽样模拟方法是通过实际模拟事件,用实际上发生的次数来估计概率,为此可以用计算机模拟,从而统计概率出现的次数。
二、超几何分布超几何分布也称为无限取样分布,是一种古典的概率分布,用来描述一系列独立事件中指定类型的成功次数的分布情况。
它和二项分布很相似,但它的背后的模型是不同的。
超几何分布有三个参数,即n(试验次数)、N(总体样本数)和p(每次试验成功的概率)。
二项分布与超几何分布的区别与联系

谢谢
谢谢
例题解析
1、从含有 2 件优等品的 5 件产品中,随机抽取 2 件,求
抽取的 2 件产品中的优等品数 的分布列及其均值。
解: 可能的取值为 0,1,2,
P( i) C2i C32i
C52
(i 0, 1, 2) ,
的分布列为
012
P
3 10
3 5
1 10
均值
E( )
1
3 52 1 10源自4 5结论:在实际应用 时,只要N≥10n, 不放回抽取可以近 似看成是放回抽取, 可用二项分布近似 描述不合格品个数 , 即当超几何分布计 算非常困难时应考 虑用二项分布近似 代替。
练习:
[2009 广东理 17 题部分]对某城市一年(365 天)的空 气质量进行监测,发现一年中有 219 天空气质量为良或 轻度污染,求该城市某一周至少有 2 天的空气质量为轻 微污染的概率.
超几何分布一般地在含有m件次品的n件产品中任取n件其中恰有x件次品则事件xk发生的概率为服从参数为nmn的超几何分布1从含有2件优等品的5件产品中随机抽取2抽取的2件产品中的优等品数10均值2011广东理17部分从含有2件优等品的5件产品中随机抽取2件求抽取的2件产品中的优等品数的分布列及其均值
二项分布与超几何分布的区别与 联系
C1MCnN--1M CnN
…
CmMCnN--mM CnN
为超几何分布列,如果随机变量X的分布列为超几何 分布列,则称随机变量X服从超几何分布.
3、二项分布、超几何分布的均值、方差 (1)若 X~B(n,p),则 E(X)=np,D(X)=np(1-p). ※(2)若 X 服从参数为 N、M、n 的超几何分布, 则 E(X)=nNM.
超几何分布与二项分布的联系与区别

何 分 布 还是 二 项 分 布 , 生 对 这 两模 型 的定 义 不 能很 好 学 的理 解 . 遇 到 含 “ ” “ ” 一 取 或 摸 的题 型 , 认 为 是 超 几 何 就 分 布 , 加分 析 . 不 随便 滥 用公 式 。 实 上 . 事 超几 何 分 布 和二
, — k
个 随机 变 量 的 分 布 列 为 P( k : X= )
L
, 中 k 0 其 =,
球 , 些 球 除 颜 色外 完 全 相 同 , 次 从 中摸 出 5个 球 , 这 一 摸
到 4个 红 球 1个 白球 就是 一 等 奖 , 求获 一 等 奖 的概 率 。 本 题采 用 的解 法 是摸 出球 中 的 红 球个 数 服 从 超 几 何 分
项 分 布确 实 有着 密 切 的联 系 , 也 有 明显 的 区别 。 但
如 在 22节 有 这样 一 个 例题 : 三 ( ) 的联 欢会 上 . 高 1班
设计 了一项 游 戏 : 一 个 口袋 中装 有 1 在 0个 红 球 、0个 白 2
课 本 对 于超几 何分 布 的定 义 是这 样 的 : 一般 的 , 一 若
0 l 2 3 4 5
| P cc_ g ̄
C 嚣
C1 NI nM -
C 品 C
C1 - M M 1
C
对 于 二项 分 布 的定 义 是这 样 的 : 随机 变 量 的 分 若
布列 为, 中 ,< < ,+ = ,= ,, n 则 称 服从 参 数 其 0 p lp q l k l …, , 2 为 np 的二 项 分 布 , 为 X~ n P 。 概 率 分 布 表 为 : , 记 B( , ) 其
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超几何分布与二项分布的联系
超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
课本对于超几何分布的定义是这样的:一般的, 若一个随机变量 X 的分布列为( k n k M N M n N
C C P X k C --==, 其中 0,1,2, , k l = , min(, l n M =,则称 X 服从超几何分布,记为(, , X H n M N 。
其概率分布表为:
对于二项分布的定义是这样的:若随机变量 X 的分布列为 ( (1 k k n k n P X k C p p -==-, 则
称 X 服从参数为 , n p 的二项分布,记为 (, X B n p 。
其概率分布表为:
超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量 X 的取值都从 0连续变化到 l ,对应概率和 , , N n l 三个值密切相关 . 可见两种分布之间有着密切的联系 . 课本中对超几何分布的模型建立是这样的:若有 N 件产品, 其中 M 件是废品,无返回地任意抽取 n 件,则其中恰有的废品件数 X 是服从超几何分布的。
而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有 N 件产品,其中 M 件是废品,有返回的任意抽取 n 件,则其中恰有的废品件数 X 是服从二项分布的。
在这里,两种分布的差别就在于“ 有” 与“ 无” 的差别,只要将概率模型中的“ 无” 改为“ 有” ,或将“ 有” 改为“ 无” ,就可以实现两种分布之间的转化。
“ 返回” 和“ 不返回” 就是两种分布转换的关键。
如在 2.2节有这样一个例题:高三(1班的联欢会上设计了一项游戏:在一个口袋中装有 10个红球、 20个白球,这些球除颜色外完全相同,一次从中摸出 5个球,摸到4个红球 1个白球就是一等奖,求获一等奖的概率。
本题采用的解法是摸出球中的红球个数 X 服从超几何分布,但是如果将“ 一次从中摸出 5个球” 改为“ 摸出一球记下颜色,放回后再摸一球,反复 5次” ,则摸出球中的红球个数 X 将不再服从超几何分布,而是服从二项分布。
我们分别来计算两种分布所对应的概率:
这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了, 我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说 lim (1 k n k k k n k M N M n n N N
C C C p p C ---→+∞=-,下面我们对以上猜想作出证明: 产品个数 N 无限大,设废品率为 p ,则 lim N M p N
→+∞=,
以上的证明与我们的直观思想相吻合:在废品为确定数 M 的足够多的产品中,任意抽取 n 个(由于产品个数 N 无限多,无返回与有返回无区别,故可看作 n 次独立试验中含有 k 个废品的概率当然服从二项分布。
在这里,超几何分布转化为二项分布的条件是 (1 产品个数应无限多, 否则无返回地抽取 n 件产品是不能看作 n 次独立试验的 .(2 在产品个数 N 无限增加的过程中, 废品数应按相应的“ 比例” 增大,否则上述事实也是不成立的。
对于超几何分布的数学期望 ( M E X n N =⋅,二项分布的数学期望 ( E X np =,当我们将“ 不返回” 改为“ 返回” 时, M p N
=, 两种分布的数学期望相等, 方差之间没有相等关系。
超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?
事实上超几何分布的数学期望 ( M
E X n N =⋅, 方差 2( (
( (1 nM N n N M
D X N N --=-,
当
这两个极限值分别是二项分布的数学期望与方差。
需要指明的是这一性质并非只为超几何分布与二项分布之间所具有, 一般地, 如果随机变量依分布收敛于随机变量, 则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。
这样超几何分布与二项分布达到了统一。
一般说来, 有返回抽样与无返回抽样计算的概率是不同的, 特别在抽取对象数目不大时更是如此。
但当被抽取的对象数目较大时, 有返回抽样与无返回抽样所计算的概率相差不大, 人们在实际工作中常利用这一点, 把抽取对象数量较大时的无返回抽样 (例如破坏性试验发射炮弹;产品的寿命试验等 ,当作有返回来处理 .
那么,除了在有无“ 返回” 上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?
设想 N 件产品装在一个大袋中,其中 M 件为废品, 无返回地从中抽取 n 件, 那么其中废品件数 X 服从超几何分布。
现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个小袋,无返回地从中任取一件产品,则这样任取 n 件,其中废品件数 X 就不再服从超几何分布,而应服从的二项分布了。
事实上,我们把摸到正品袋中的产品看作“ 成功” ,摸到废品袋中的产品看作“ 失败” ,则“ 成功” 与“ 失败” 的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布去刻划其概率分布列
.
从这一点上讲,两种分布仅“ 一袋之隔” 。
将正品和废品隔离,则超几何分布将成为二项分布 .
超几何分布和二项分布这两种离散型随机变量的概率分布表面上看来风马牛不相及, 但通过以上的论证, 我们发现这两种分布可以通过有无“ 返回” ,隔离正品和
次品等方法来互相转换,抛开转换问题,也可把二项分布看作超几何分布的极限,它们的期望和方差之间也存在这种极限关系 .。