超几何分布与二项分布

合集下载

超几何分布和二项分布

超几何分布和二项分布

超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。

它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。

本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。

一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。

具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。

其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。

超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。

2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。

3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。

超几何分布在实际应用中有着广泛的应用。

例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。

二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。

具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。

其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。

二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。

2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。

二项分布与超几何分布的区别

二项分布与超几何分布的区别

(1)从中每次取出1个球然后放回,连续抽取三次,求取到红球 次数X的分布列和数学期望。 3k k k 解:由已知X~B(3,0.4), PX k C3 0.4 1 0.4 , (k 0,1,2,3)
X 所以,X的分布列为: p
0
1
2
3
27 54 36 8 E X 3 0.4 1.2 125 125 125 125
k n- k P(X=k)=Ck p (1 - p ) ,k=0,1,2,…,n. n
则称随机变量 X 服从参数为 n、p 的二项分布,记 作 X~B(n,p),并称 p 为成功概率.
2.超几何分布
一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其 中恰有 X 件次品,则事件{X=k}发生的概率为
E X 3 0.6 1.8
0
1
2
3
8 36 54 27 125 125 125 125
变式:(3)把(2)改为:若随机在样本不赞成高考改革的家长中 抽取3个,记这3个家长中是城镇户口的人数为Y,试求Y的分布列 及数学期望E(Y). k 3 k C15 C10 解:由已知Y服从超几何分布, PY k , (k 0,1,2,3) 3 C25 所以,Y的分布列为: Y
2018届南宁市摸底考试18题
摸底考试18题第(1)问
(2)用样本的频率估计概率,若随机在全省不赞成高考改革的家 长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分 布列及数学期望E(X). 用样本的频率估计概率应怎样理解? 概率定义:对于给定的随机事件A,如果随着试验次数的增加,事 件A发生的频率稳定在某个常数上,把这个常数记作P(A),称为 事件A的概率。 在样本中,不赞成高考改革的家长中是城镇户口的频率为0.6,因 此,估计全省从不赞成高考改革的家长中随机抽取1个,他是城镇 户口的概率为0.6,抽取3个,即进行3次独立重复试验,所以, X~(n,p)

二项分布与超几何分布 知识的上下位关系

二项分布与超几何分布 知识的上下位关系

二项分布与超几何分布知识的上下位关系二项分布与超几何分布是统计学中两种重要的概率分布类型,它们在描述事件发生的概率分布时起着重要作用。

本文将从简单介绍二项分布和超几何分布的概念开始,再深入探讨它们之间的上下位关系,以帮助读者更好地理解这两种概率分布。

一、二项分布的概念和特点1. 二项分布是描述了在n次独立重复的伯努利试验中成功次数的概率分布。

其中,每次试验只有两种可能的结果,记为成功和失败。

2. 二项分布的概率质量函数可以用数学公式P(X=k) = C(n, k) * p^k * (1-p)^(n-k)来表示,其中n表示试验的次数,p表示每次试验成功的概率。

3. 二项分布的期望值和方差分别为E(X) = np,Var(X) = np(1-p),当n较大时,二项分布可以近似为正态分布。

二、超几何分布的概念和特点1. 超几何分布描述了从有限大小N的总体中进行抽样后成功次数的概率分布。

与二项分布不同的是,超几何分布的抽样并非独立重复的。

2. 超几何分布的概率质量函数可以用数学公式P(X=k) = C(N, k) *C(N - n, n - k) / C(N, n)来表示,其中N表示总体中成功的个数,n 表示抽样的次数,k表示成功的次数。

3. 超几何分布的期望值和方差分别为E(X) = nN/N, Var(X) = nN(N-n)(N-n-1) / N^2(N-1),当N较大时,超几何分布也可以近似为正态分布。

三、二项分布与超几何分布的上下位关系1. 二项分布和超几何分布的关系在于都描述了成功次数的概率分布,但是二者的抽样方式不同,因此二项分布描述的是独立重复试验,而超几何分布描述的是有限总体中的抽样。

2. 当总体大小N固定,抽样次数n趋向于无穷大时,超几何分布近似于二项分布。

3. 当总体大小N趋向于无穷大时,超几何分布也可以近似为二项分布。

四、个人观点和理解在实际应用中,二项分布常用于描述独立重复试验的概率分布,如投掷硬币、赌博等;而超几何分布则常用于描述有限总体中的抽样分布,如抽样检验、质量抽检等。

二项分布和超几何分布

二项分布和超几何分布

二项分布和超几何分布二项分布和超几何分布是统计学中比较常见的两个概率分布,它们都是很重要的知识点,被应用在许多领域,尤其是生物和药物研究等统计分析中。

在本文中,我们将对这两个概率分布进行介绍和比较,包括定义、性质、应用、关系以及如何求解这两个概率分布。

一、二项分布二项分布是一种偏态分布,也被称为二项概率分布,它以独立的事件进行描述,用来描述一个独立的试验或该试验的结果。

它形成了一种定义精确的概率模型,用来对实际问题进行分析、预测和解决。

二项分布中有两个参数,即n(试验次数)和p(每次试验成功的概率)。

假设有一个试验,该试验有n次,每次试验成功的概率为p,则最终成功的次数X服从二项分布:X~B(n,p)。

其性质如下:(1)二项分布的期望值E[X] = np。

(2)二项分布的方差 D[X]= npq=np(1-p)。

(3)当n趋于无穷大,p趋于某一定值时,此时X服从泊松分布。

(4)二项分布的n和p均大于0,当n=1时,二项分布即成为伯努利分布。

二项分布的应用非常广泛,常被应用在质量控制、生物学、总体调查中。

比如,在质量检验中,二项分布被应用在检验样本中不良品率检验;在生物学中,可以用二项分布研究DNA分子的突变率;在总体调查中,也可用二项分布来描述一个样本是否属于某一总体。

求解二项分布的方法:一般通过概率计算和抽样模拟的方法。

概率计算方法是对二项分布概率的精确计算,即在已知成功的概率p和试验次数n的情况下,可以精确算出在n次试验中成功m次出现的概率。

而抽样模拟方法是通过实际模拟事件,用实际上发生的次数来估计概率,为此可以用计算机模拟,从而统计概率出现的次数。

二、超几何分布超几何分布也称为无限取样分布,是一种古典的概率分布,用来描述一系列独立事件中指定类型的成功次数的分布情况。

它和二项分布很相似,但它的背后的模型是不同的。

超几何分布有三个参数,即n(试验次数)、N(总体样本数)和p(每次试验成功的概率)。

超几何分布和二项分布的联系和区别

超几何分布和二项分布的联系和区别

超几何分布和二项分布的联系和区别开滦一中张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3 从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处!一、两者的定义是不同的教材中的定义:(一)超几何分布的定义在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)= C kMCC nNnN- k- M ,k 0 ,1, 2,, m,其中m=min{M,n}, 且n≤N,M ≤N,n,M,N ∈N,称随机变量X服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验,且各次试验试验的结果相互独立,称为n次独立重复试验,其中A(i=1,2,⋯,n)是第ⅰ次试验结果,则P(A1A2A3⋯An)=P(A 1)P(A2)P(A3) ⋯P(An)2)二项分布在n 次独立重复试验中,用X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为P,则P(X=k)= C k k np (1p )k并称P为成功概率。

1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)第1页共7 页= C kMCC nNnN- k- M ,k 0 ,1, 2,, m,二项分布:在n 次独立重复试验中,用X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为P,则P(X=k)= C k k np (1 p )k温馨提示:当题目中出现“用样本数据估计XXX 的总体数据”时,均为二项分布问题。

二项分布与超几何分布

二项分布与超几何分布

一、超几何分布设一批产品共有N 个,其中有M 个次品,现从中任取n 个(n N M ≤-),令X n =“取出的个产品中包含的次品数”则X 的分布列为(),(0,1,2,,min(,))k n kM N MnNC C P X k k M n C --===L 上述分布称为超几何分布,记作(,,)X h n N M :。

超几何分布的二项近似当n N =时,即抽取的个数n 远小于产品总数N 时,每次抽取后,总体中的不合格率p M N =改变甚微,所以可以把不放回抽样近似的看成是有放回抽样,这时,超几何分布可以用二项分布近似(1),k n k k k n k M N Mn nNC C M C p p p C N---≅-=其中 例1甲乙两人赌技相当,各出赌本500元,约定5局3胜,胜者得到这1000元钱。

现在因故在甲赢了一局的情况下终止比赛,试问该如何分配这1000元钱?解法一 合理的方案应该是按照“若把球打完,甲乙二人各自取胜的概率”的比例来分配奖金。

由于甲已经先胜了一局,所以,甲取胜的事件就是“在接下来的比赛中,第三次失败之前赢下两次”。

令X =“在接下来的比赛中,甲取得两次胜利所需要的局数”则 (2,0.5)X Nb :,于是()(5)P P X =<“甲赢乙”42()k P X k ===∑42122120.50.5k k k C---==⨯∑41120.5kk k C -==∑ 2340.520.530.5=+⨯+⨯1116=注:本题也可以采用求数学期望的方法,这时求分布列较麻烦二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫⎪⎝⎭,.3031464(0)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;21231412(2)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;3033141(3)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭.因此,X 的分布列为2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C CP Y C ===.因此,Y 的分布列为辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.例1 从装有3个红球、2个白球的袋中随机取出2个球,设其中有X个红球,则随机变量X的概率分布列为解析:由题意,得0232251(0)0.110C C P X C ====,1132236(1)0.610C C P X C ====,203223(2)0.3C C P X C ===(或(2)1(0)(1)10.10.60.3P X P X P X ==-=-==--=).故随机变量X的概率分布为点评:本题主要考查了组合、离散型随机变量分布列的知识、概率的计算及超几何分布列的求法.例2 在一次购物抽奖活动中,假设某10张券中有一等奖券1张,可获价值50元的奖品;有二等奖券3张,每张可获价值10元的奖品;其余6张没有奖.某顾客从此10张中任抽2张,求:(1)该顾客中奖的概率;(2)该顾客获得的奖品总价值X(元)的概率分布列.解析:(1)024*******11453C C P C =-=-=(或11204646210302453C C C C P C +===),即该顾客中奖的概率为23. (2)X 的所有可能值为:0,10,20,50,60(元),且02462101(0)3C C P X C ===,11362102(10)5C C P X C ===,232101(20)15C P X C ===,11162102(50)15C C P X C ===,11132101(60)15C C P X C ===.故X 的分布列为点评:本题以超几何分布为背景,主要考查了概率的计算、离散型随机变量分布列的求法及分析和解决实际问题的能力.。

超几何分布和二项分布的联系和区别

超几何分布和二项分布的联系和区别如何计算恰好有1件次品的概率?这道题目可以用超几何分布和二项分布两种方法来解决。

首先,我们可以使用超几何分布,因为这是一个不放回抽样问题。

根据题目条件,我们可以得到M=0.02n,N=n,n=3,k=1.代入超几何分布的公式,可以得到P(X=1)=0.111.其次,我们也可以使用二项分布,因为这是一个独立重复试验问题。

根据题目条件,我们可以得到n=3,p=0.02,k=1.代入二项分布的公式,可以得到P(X=1)=0.057.因此,两种方法得到的结果略有不同,但可以看出它们之间是有联系的。

二项分布可以看作是超几何分布的一种近似,当样本容量n很大时,二项分布的计算结果可以逼近超几何分布的计算结果。

在进行放回或不放回的方式抽取时,当产品总数分别为500、5000和时,恰好抽到1件次品的概率分别是多少?根据此问题,你对超几何分布与二项分布的关系有何认识?解析:在不放回的方式抽取中,每次抽取时都是从这n件产品中抽取,从而抽到次品的概率都为。

次品数X服从二项分布,恰好抽到1件次品的概率为1P(X=1)=C3×(1-2%)^2×(2%)^1≈0.057.在不放回的方式抽取中,抽到的次品数X是随机变量,X服从超几何分布,X的分布与产品的总数n有关,所以需要分3种情况分别计算。

①当n=500时,产品的总数为500件,其中次品的件数为500×2%=10,合格品的件数为490.从500件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C10×C×490×489÷3500×499×498≈0..②当n=5000时,产品的总数为5000件,其中次品的件数为5000×2%=100,合格品的件数为4900.从5000件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C100×Cxxxxxxx×4900×4899÷×4999×4998≈0.xxxxxx x。

二项分布和超几何分布

二项分布和超几何分布1. 引言二项分布和超几何分布是统计学中常见的两种离散概率分布。

它们在很多实际问题中都有应用,特别是在概率统计、质量控制、可靠性工程等领域。

本文将介绍二项分布和超几何分布的基本概念、性质和应用。

2. 二项分布2.1 定义:二项分布是指在n次独立重复试验中,成功的次数X 服从的概率分布。

每次试验都有相同的成功概率p,失败概率为1-p。

2.2 参数和符号:二项分布的参数为试验次数n和成功概率p。

用X~B(n,p)表示服从二项分布的随机变量X。

2.3 概率质量函数:二项分布的概率质量函数为P(X=k) = C(n,k) * p^k * (1-p)^(n-k),其中C(n,k)是组合数。

2.4 期望和方差:二项分布的期望E(X) = np,方差Var(X) =np(1-p)。

2.5 应用举例:二项分布常用于二元分类问题的建模和预测,例如投硬币的结果、产品合格率等。

3. 超几何分布3.1 定义:超几何分布是指在从有限总体中抽取固定大小的样本,统计成功的次数X服从的概率分布。

总体中有M个成功元素和N-M个失败元素。

3.2 参数和符号:超几何分布的参数为总体大小N、成功元素个数M和样本大小n。

用X~H(N,M,n)表示服从超几何分布的随机变量X。

3.3 概率质量函数:超几何分布的概率质量函数为P(X=k) =C(M,k) * C(N-M,n-k) / C(N,n),其中C(m,k)是组合数。

3.4 期望和方差:超几何分布的期望E(X) = nM/N,方差Var(X) = nM/N * (1-M/N) * (N-n)/(N-1)。

3.5 应用举例:超几何分布常用于抽样调查和质量抽检中,例如从一批产品中抽取部分样本进行检验。

4. 二项分布与超几何分布的比较4.1 性质对比:二项分布和超几何分布的相同之处在于都是离散概率分布,描述独立重复试验的结果。

不同之处在于二项分布适用于试验的抽样分布,即每次试验结果相互独立;而超几何分布适用于样本抽取过程,即每次抽取后总体元素的数量会改变。

超几何分布与二项分布的联系

超几何分布与二项分布的联系超几何分布和二项分布确实有着密切的联系,但也有明显的区别。

课本对于超几何分布的定义是这样的:一般的,若一个随机变量X 的分布列为C k C n -kP(X = k ) = M N M ,其中k = 0,1, 2— l ,l = min(n ,M ),则称X 服从超几何分布,记为C nNX □ H (n , M , N )。

其概率分布表为:对于二项分布的定义是这样的:若随机变量X 的分布列为P(X = k ) = C k p k (1- p)n -k ,则称X n服从参数为n , p 的二项分布,记为X □ B (n , p )。

其概率分布表为:超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然 不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量X 的取值都从0连 续变化到l ,对应概率和N ,n ,l 三个值密切相关.可见两种分布之间有着密切的联系.课本中对超几何分布的模型建立是这样的:若有N 件产品,其中M 件是废品,无返回地任意抽取n 件,则其中恰有 的废品件数X 是服从超几何分布的。

而对二项分布则使用比较容易理解的射击问题来建立模型。

若 将但超几何分布的概率模型改成:若有N 件产品,其中M 件是废品,有返回的任意抽取n 件,则其 中恰有的废品件数X 是服从二项分布的。

在这里,两种分布的差别就在于“有”与“无”的差别,只要 将概率模型中的“无”改为“有”,或将“有”改为“无”,就可以实现两种分布之间的转化。

“返回”和“不 返回”就是两种分布转换的关键。

如在2.2节有这样一个例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10 个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是 一等奖,求获一等奖的概率。

本题采用的解法是摸出球中的红球个数X 服从超几何分布,但是如果 将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球 个数X 将不再服从超几何分布,而是服从二项分布。

【数学】超几何分布与二项分布的区别与联系

二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。

在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。

一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。

其分布列为超几何分布列。

如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。

2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。

在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。

此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。

二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。

超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。

实质上,超几何分布是古典概型的一种特例。

二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。

这就是二者之间的区别。

本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。

解:(1)是不放回地抽取,X 服从超几何分布。

从10个球中任取2球的结果数为C 102,从10个球中任取2个,其中恰有k 个黑球的结果数为C 4k C 62-k,那么从10个球中任取2个,其中恰有k 个黑球的概率为P (X=k )=C 4k C 62-kC 102,k=0,1,2。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二项分布与超几何分布的区别与联系1.定义:(1)超几何分布:设有总数为N件的两类..物品,其中一类有M件,从所有物品中任取n件(n≤N),这n件中所含这类物品件数X是一个离散型随机变量,它取值为m时的概率为()m n mM N MnNC CP X mC --== (0≤m≤l,l为n和M中较小的一个),则称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X服从参数为N,M,n的超几何分布.(2)二项分布:若将事件A发生的次数设为X,发生的概率为p,不发生的概率q=1-p,那么在n次独立重复试验中,事件A恰好发生k次的概率是P(X=k)=C k n p k(1-p)n-k(k=0,1,2,…,n) ,于是得到X的分布列(q+p)n=C0n p0q n+C1n p1q n-1+…+C k n p k q n-k+…+C n n p n q0各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记做X~B(n,p).2.本质区别:(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题,也就是说二项分布中每个事件之间是相互独立的,而超几何分布不是;(2)超几何分布中的概率计算实质上是古典概型问题,二项分布中的概率计算实质上是相互独立事件的概率问题.温馨提示:(1)超几何分布需要知道总体的容量,也就是总体个数有限;而二项分布不需要知道总体容量,但需要知道“成功率”.(2)当题目中出现“用样本数据估计×××的总体数据”是均为二项分布;(3)二项分布与超几何分布两者之间存在着联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布.概率论中的二项分布与超几何分布都是古典概型。

【典例】某批n 件产品的次品率为2%,现从中任意地依次抽出3件进行检验,问: (1)当500,5000,50000n =时,分别以放回和不放回的方式抽取,恰好抽到1件次品的概率是多少?(2)根据(1)你对超几何分布与二项分布的关系有何认识?【解】(1)在放回的方式抽取中,每次抽取时都从这n 件产品中抽取,从而抽到品的概率都为0.02.可以把3次抽取看成是3次独立重复试验,这样抽到的次品数X ~(3,0.02)B ,恰好抽到1件次品的概率为1223(1)0.02(10.02)30.020.980057624=.P X C ==⨯⨯-⨯⨯≈在不放回的方式抽取中,抽到的次品数X 是随机变量,X 服从超几何分布,X 的分布与产品的总数n 有关,所以需要分3种情况计算:①500n =时,产品的总数为500件,其中次品的件数为500⨯2%=10,合格品的件数为490件。

从500件产品中抽出3件,其中恰好抽到1件次品的概率为1210490350049048910304904892(1)00578535004994985004994983==.C CP X C ⨯⨯⨯⨯⨯==≈⨯⨯⨯⨯!!; ②5000n =时,产品的总数为5000件,其中次品的件数为5000⨯2%=100,合格品的件数为4900件。

从5000件产品中抽出3件,其中恰好抽到1件次品的概率为;1210049003500049004899100300490048992(1)005774750004999499850004999499833==.CC P X C ⨯⨯⨯⨯⨯==≈⨯⨯⨯⨯!!!③50000n =时,产品的总数为50000件,其中次品的件数为50000⨯2%=1000,合格品的件数为49000件。

从50000件产品中抽出3件,其中恰好抽到1件次品的概率为;121000490003500004900048999100030049000489992(1)005762650000499904999850000499904999833==.CC P X C ⨯⨯⨯⨯⨯==≈⨯⨯⨯⨯!!!(2)根据(1)的计算结果可以看出,当产品的总数很大时,超几何分布近似为二项分布。

这是可以理解的,当产品的总数很大而抽出的产品较少时,每次抽出产品后,次品率近乎不变,这样就可以近似看成每次抽样的结果是相互独立的,抽出产品中的次品件数近似服从二项分布。

【说明】(1)n 次试验中,某一事件A 出现的次数X 可能服从超几何分布或二项分布。

当这n 次试验是独立重复实验时,X 服从二项分布;当这n 次试验是不放回摸球问题,事件A 为摸到某种特性(如某种颜色)的球时,X 服从超几何分布。

(2)在不放回n 次摸球试验中,摸到某种颜色的次数X 服从超几何分布,但是当袋子中的球的数目N 很大时,X 的分布列近似于二项分布,并且随着N 的增加,这种近似的精度也增加。

从以上分析可以看出两者之间的联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布. 【实战演练】1. 据统计,截至 2016 年底全国微信注册用户数量已经突破 9.27 亿,为调查大学生这个微信用户群体中每人拥有微信群的数量,现从某市大学生中随机抽取 100 位同学进行了抽样调查,结果如下:(1)求 a ,b ,c 的值及样本中微信群个数超过 12 的概率;(2)若从这 100 位同学中随机抽取 2 人,求这 2 人中恰有 1 人微信群个数超过 12 的概率;(3)以(1)中的频率作为概率,若从全市大学生中随机抽取 3 人,记 X 表示抽到的是微信群个数超过 12 的人数,求 X 的分布列和数学期望 E (X ).解:(1) 在 0 至 4 这一段,对应的频数为 15, 由已知得:15+40+25+a +5=100,解得 a =15, 所以 b =5100=0.05,c =15100=0.15, 样本中微信群个数超过 12 的概率 p =20100=15.(2) 记“2 人中恰有 1 人微信群个数超过 12”为事件 A , 则 P (A )=C 201C 801C 1002=3299,所以 2 人中恰有 1 人微信群个数超过 12 的概率为 3299.(3) 由题意知微信群个数超过 12 的概率为 P =15,X 的所有可能取值为 0,1,2,3,则 P (X =0)=C 30(1−15)3=64125, P (X =1)=C 31(15)(1−15)2=48125,P (X =2)=C 32(15)2(1−15)=12125, P (X =3)=C 33(15)3=1125,所以 X 的分布列为:E (X )=0×64125+1×48125+2×12125+3×1125=35.2. (2018年全国卷Ⅰ)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取 20 件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 p (0<p <1),且各件产品是否为不合格品相互独立. (1)记 20 件产品中恰有 2 件不合格品的概率为 f (p ),求 f (p ) 的最大值点 p 0. (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 p 0 作为 p 的值.已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X ,求 EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解:(1) 20 件产品中恰有 2 件不合格品的概率为 f (p )=C 202p 2(1−p )18. 因此fʹ(p )=C 202[2p (1−p )18−18p 2(1−p )17] =2C 202p (1−p )17(1−10p ). 令 fʹ(p )=0,得 p =0.1.当 p ∈(0,0.1) 时,fʹ(p )>0;当 p ∈(0.1,1) 时,fʹ(p )<0. 所以 f (p ) 的最大值点为 p 0=0.1. (2) 由(1)知,p =0.1.(i )令 Y 表示余下的 180 件产品中的不合格品件数,依题意知 Y ∼B (180,0.1),X =20×2+25Y ,即 X =40+25Y . 所以 EX =E (40+25Y )=40+25EY =490.(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为 400 元.3.寒假期间,我市某校学生会组织部分同学,用“10分制”随机调查“阳光花园”社区人们的幸福度.现从调查人群中随机抽取16名,如图所示的茎叶图记录了他们的幸福度分数(以小数点前的一位数字为茎,小数点后的一位数字为叶),若幸福度分数不低于8.5分,则称该人的幸福度为“幸福”.(1)求从这16人中随机抽取3人,至少有2人为“幸福”的概率;(2)以这16人的样本数据来估计整个社区的总体数据,若从该社区(人数很多)任选3人,记ξ表示抽到“幸福”的人数,求ξ的分布列及数学期望。

解:(1)由茎叶图可知,抽取的16人中“幸福”的人数有12人,其它的有4人。

记“从这16人中随机抽取3人,至少有2人为“幸福””为事件A.由题意得3214412316121()1140P A C C C C+=-=⨯ (2) 由茎叶图可知,任选1人,该人幸度为“幸福”的概率为34. ξ的可能取值为0,1,2,3,ξ~3(3,)4B39344E ξ=⨯= 【易错分析】第二问的选人问题是不放回抽样问题, 按照定义先考虑超几何分布,但是题目中又明确给出:“以这16人的样本数据来估计整个社区的总体数据,从该社区(人数很多)任选3人”,说明不是从16人中任选3人,而是从该社区(人数很多)任选3人,所以可以近似看作是3次独立重复试验,应该按照二项分布去求解,而不能按照超几何分布去处理.错解中的期望值与正解中的期望值相等,好多学生都觉得不可思议,怎么会出现相同的结果呢?其实这还是由于前面解释过的原因,超几何分布与二项分布是有联系的,看它们的期望公式:。

相关文档
最新文档