第三章第二次课 几种常见的理论分布

合集下载

《几种常见的分布》课件

《几种常见的分布》课件

性质
总结词
二项分布具有可加性、可分解性和独立性等性质。
详细描述
二项分布的可加性是指,如果两个独立的随机试验分别服从参数为n1和p1的B(n1,p1)和参数为n2和p2的 B(n2,p2),则这两个试验的和服从参数为n1+n2和p的B(n1+n2,p)。可分解性是指,如果一个随机试验服从参数 为n和p的B(n,p),则可以将其分解为若干个独立的伯努利试验的和。独立性是指,如果一个随机试验服从参数为 n和p的B(n,p),则可以将其分解为若干个独立的二项分布的和。
应用场景
总结词
二项分布在统计学、生物学、医学等领 域有广泛的应用。
VS
详细描述
在统计学中,二项分布在样本比例、成功 率等问题的研究中有着重要的应用。在生 物学中,二项分布可以用于描述生物种群 遗传学中的基因频率变化等问题。在医学 中,二项分布可以用于描述疾病的发病率 、流行病学中的病例数等问题。此外,二 项分布还在金融、保险等领域数,表示在一定区间内随机事件发生的可能性是恒 定的。
均匀分布的期望值和方差取决于区间的长度,而不是具体的取值。
应用场景
均匀分布在现实生活中广泛存在,如 测量误差、随机试验中的随机误差等 。
在概率论中,均匀分布是概率空间的 基本构成元素之一,用于描述随机变 量的取值范围和概率关系。
在统计学中,泊松分布常用于 计数数据分析和生存分析等领 域。
在计算机科学中,泊松分布在 算法设计和数据结构分析中有 广泛应用。
03
二项分布
定义
总结词
二项分布是一种离散概率分布,描述的是在n次独立重复的伯努利试验中成功 的次数。
详细描述
二项分布适用于描述那些只有两种可能结果的随机试验,例如抛硬币、射击等 。在n次独立重复的伯努利试验中,成功的次数服从参数为n和p的二项分布, 记作B(n,p)。

第3-4章 理论分布与抽样分布

第3-4章 理论分布与抽样分布

1.1二项分布
人们所感兴趣的事件是否发生: 食品检验中,抽到样品合格还是不合格;
预防接种:是否发生某病;
毒性试验:动物是否死亡。 对每一次实验,出现的结果只有两种情况,称为贝努利(Bernoulli) 试验。如所关心的事件A发生,称为“成功”,否则称为“失败”
公 式
P( A) p, P( A) q, p q 1
一般正态分布的计算
两尾(双侧)概率():随机变量x在平均 数加减不同倍数标准差区间之外取值的概率。
单尾概率:对应于两尾概率可以求得随机变量 x小于-k或大于+k的概率,记作/2。
例如:X在(-1.96, +1.96)之外取值 的两尾概率为0.05,而一尾概率为0.025。 例如:X在(-2.58, +2.58)之外取值 的两尾概率为0.01,而一尾概率为0.005。
l l 0
因此二项分布的均数为=np。
1.1.4.2 二项分布的方差(标准差)
设x~B(n,p),用2表示其方差。
2 =E(x )2 n
x 0
( x np)
2
C
x n
p (1 p )
x
n x
n(n 1) p 2 np (np) 2 np(1 p ) npq
正常生产线上单位时间生产的不合格产品数;
商店里单位时间内顾客数; 生物:每平方公里有多少植物。
1.2.1 泊松分布的定义及特点
1.2.1.1泊松分布的定义 若随机变量x(x=k)所有可能取值是非负 整数,且其概率分布为:
P( x k )
e
k

k!
式中:为大于零的常数;k=0,1,2, …,n;e是自然 对数的底数,即e=2.7182…则称随机变量x为服 从参数为的泊松分布,并记为x~p ()。

生物统计学 第三章 概率论

生物统计学 第三章 概率论

解: 经计算得每毫升水中平均细菌数为0.500,方差S2=0.496。两者很 接近,故可认为每毫升水中细菌数服从泊松分布。以0.500代替λ, 得 k
0.5 P( x k ) e 0.5 k!
从结果可以看出细菌数的频率分布与λ=0.5的泊松分布是相当吻合 的,进一步说明用泊松分布描述单位容积(或面积)中细菌数的分布 是适宜的。
将这种变量的所有可能取值及其对应的概率一一列 出所形成的分布,称为离散型随机变量的概率分 布:
变量xi 概率P(y=yi)
x1 x2 x3 … x n P1 P2 P3 …Pn
• 2、连续型随机变量
• 变量x的取值仅为一范围,且x在该范围 内取值时,其概率是确定的,这种类型 的变量称为连续型随机变量
2 3
即复合事件的概率必等于该事件出现的组合数目乘以
单个事件的概率;而这一复合事件的可能组合数目则相
当于从n(3)个物体中任取其x(2)个物体的组合数。数学上 的组合公式为:
n! C x!(n x)!
x n
(二)二项分布的概率函数
二项式中包含两项,这两项的概率为p、q,并且 p+q=1,可推知变量x的概率函数为:
• 3.对立事件的减法
• 若事件A的概率为P(A),那么其对立事件的
概率为:P( A )=1-P(A)
_
• 4.完全事件系的概率
• 例如上例,黄色种子和白色种子构成完全 事件系,其概率为1。
三. 概率分布
1、离散型随机变量
变量x的取值可用实数表示,且x取某一值时,其 概率是确定的,这种类型的变量称为离散型随机 变量。
• (2) • λ值愈小分布愈偏倚, 随着λ的增大,分布趋 于对称。 • 当λ= 20时分布接近于 正态分布 • 当λ=50时,可以认为泊 松分布呈正态分布 • 当 λ≥20时就可以用正 态分布来近似地处理泊 松分布的问题。

《几种常见的分布》课件

《几种常见的分布》课件
几种常见的分布
在统计学中,有几种常见的分布模型,包括均匀分布、正态分布、伯努利分 布、泊松分布和指数分布。本课件将详细介绍这些分布的定义、概率密度函 数、特点和示例。
均匀分布
定义
所有取值可能都有相同的概率。
特点
平均数和中位数相等。
概率密度函数
在取值范围内的每个值都有相等的概率。
示例
投掷均匀骰子,每个面的点数是等概率的。
2
布。
表示事件发生等待时间的概率分布。
3
特点
等待时间越长,概率越小。
参数含义
4
参数表示平均等待时间的倒数。5示例连续时间的电话呼叫间隔时间。结语
1 小结
不同的分布模型适用于不同的情况和问题。
2 相关资源
进一步学习更多关于概率分布的知识。
3 Q&A
回答观众的问题,进一步讨论。
正态分布
定义
连续型分布模型,以钟形曲线表示。
标准正态分布
均值为0,标准差为1的正态分布。
Z 分数
用于表示正态分布中的相对位置。
示例
人类身高和智力分布近似于正态分布。
伯努利分布
1
定义
二元分布,仅有两个可能结果。
概率密度函数
2
取值为0或1,表示事件发生成功或失败
的概率。
3
参数含义
概率函数中的参数表示事件成功的概率。
示例
4
抛硬币的结果为正或反。
泊松分布
定义
用于描述单位时间(或单位空间)上某个事件 发生次数的概率模型。
参数含义
参数表示在单位时间(或单位空间)内发生事 件的平均次数。
概率密度函数
描述事件发生次数的概率分布。

第三章 理论分布与抽样分布

第三章  理论分布与抽样分布

例如 为了确定抛掷一枚硬币出现正面朝上这个事件的 概率 ,历史上有人作过成千上万次抛掷硬币的试验。 在表3—1中列出了他们的试验记录。
表3-1 抛掷一枚硬币发生正面朝上的试验记录
从表3-1可看出,随着实验次数的增多,
正面朝上这个事件发生的频率越来越稳定地接 近0.5,我们就把0.5作为这个事件的概率。 在一般情况下,随机事件的概率p是不可 能准确得到的。通常以试验次数n充分大时随机
Pn (k ) C p q
k k k
nk
k=0,1,2…,n
(3-7)
若把(3-7)式与二项展开式
k ( q p ) n Cn p k q nk k 0 n
相比较就可以发现,在n重贝努利试验中, 事件A发生k次的概率恰好等于展开式中的 第k+1项,所以也把(3-7)式称作二项概 率公式 。
们会观察到各种各样的现象,把它们归纳起
来,大体上分为两大类:
必然现象:可预言其结果的,即在保持条件
不变的情况下,重复进行试验,其结果总是确 定的,必然发生的(或必然不发生)。这类现 象称为必然现象(inevitable phenomena)或确定性现象(definite phenomena)。
随机现象:另一类是事前不可预言其结果的,
P( x c)
c
c
f ( x) dx 0 (c为任意实数)
所以,对于连续型随机变量,仅研究其在某一个 区间内取值的概率,而不去讨论取某一个值(点)的 概率。
3、 随机变量值 在 -∞<x<+∞范围内,
所以
P( x ) f ( x)dx 1


(3-5)
中出现A的概率是常数p(0<p<1) , 因而出现对立 事件 A 的概率是1-p=q,则 称 这一串重复的独立试 验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。

湘教版高中数学选修2-2《几个常用的分布》教案2

湘教版高中数学选修2-2《几个常用的分布》教案2

几个常用的分布一、教学目标 (一)知识目标了解和掌握随机变量的超几何分布及其应用.通过训练,使学生进一步巩固两点分布、二项分布、超几何分布的了解,通过对比,找出它们的各自不同的特点.(二)情感目标通过本节的教学,使学生了解超几何分布在实际中的应用,激发学生学习数学的兴趣,提高学习数学的积极性.(三)能力目标培养学生分析问题和解决问题的能力;培养学生运用数学知识解决实际问题的能力.二、教学重点了解和掌握随机变量的超几何分布及其应用. 三、教学难点随机变量的超几何分布的定义.四、教学过程 (一)引入课题 1. 什么是两点分布?如果X 只取值0或1,概率分布是(1)P X p ==,(0)1P X p ==-,(0,1)p ∈, 就称X 服从两点分布,记作(1,)XB p .2.什么是二项分布?设某试验成功的概率为p ,(0,1)p ∈.将该试验独立重复n 次,用X 表示成功的次数,则X 的概率分布:()k k n knP X k C p q -==,k =0,1,…,n ,其中1q p =-,这时,我们称X 服从二项分布,记作(,)X B n p .(3)什么是超几何分布?使用第65页的例子. (二)传授新知教师:N 件产品中有M 件次品,从中随机抽取n 件,用X 表示n 件中的次品数,请问:X 的概率分布是什么?解析:从N 件产品中抽出n 件共有nN C 种不同的结果,这些结果是等可能的. n 件中有m 件次品和n m -件正品的组合数是m n mM N M C C --,于是()m n mM N MnN C C P X m C --==,m =0,1,…,n ,是X 的概率分布. 规定:对于m M >,0mMC =. 注意:这里的抽取是无放回抽取. 由以上的例子引出超几何分布的定义. 教师:超几何分布的定义: 如果随机变量X 有概率分布()m n mM N MnNC C P X m C --==,m =0,1,…,n , 就称X 服从超几何分布,记作(,,)X H N M n .教师:引导学生归纳总结两点分布、二项分布、超几何分布各自的特点,掌握它们之间的区别和联系:(1)两点分布主要是针对在一次试验中,试验的结果只有两种,即成功与不成功.它们是对立事件.试验成功时,随机变量X 取值为1,不成功时随机变量X 取值为0.(2)二项分布主要是针对n 次独立重复试验(贝努里试验)的.(3)超几何分布反映的事件是等可能性事件,引例是无放回抽取的试验,若为有放回抽取,那么就是独立重复试验的概率在计件抽样检验中的应用,抽得的次品数服从二项分布.(三)讲解例题例1.鱼塘中只有80条鲤鱼和20条草鱼,每条鱼被打捞的可能性相同.捞鱼者一网打捞上来4条鱼,计算:(1)其中有1条鲤鱼的概率;(2)其中有2条鲤鱼的概率;(3)其中有3条鲤鱼的概率;(4)4条都是鲤鱼的概率;分析:从100条鱼中打捞上来4条鱼,有4100C中不同的等可能结果,这是元素的总数.用X表示被打捞的4条鱼中的鲤鱼数.因为每条鱼被打捞的可能性相同,所以X服从超几何分布.即(100,80,4)X H.(1)1380204100(1)0.0233C CP XC===.(2)2280204100(2)0.1531C CP XC===.(3)3180204100(3)0.4191C CP XC===.(4)4080204100(4)0.4033C CP XC===.本题主要体现了超几何分布的概念及其应用.通过结论,我们可以看出打捞到多条鲤鱼的概率要大一些,原因是鲤鱼的数目多于草鱼的数目.例2.在某班的春节联欢活动中,组织了一次幸运抽奖活动.袋中装有18个除颜色外质地相同的小球,其中8个是红球,10个是白球.抽奖者从中一次抽出3个小球,抽出3个红球得一等奖,2个红球得二等奖,1个红球得三等奖,0个红球不得奖.分别计算得到一等奖、二等奖、三等奖的概率.分析:从18个小球中抽取3个时,有318C种不同种的等可能结果.用X表示抽到的红球数,则X服从超几何分布,即(18,8,3)X H,并且P(得一等奖)3081031856(3)0.0686816C CP XC=====.P (得二等奖)21810318280(2)0.3431816C C P X C =====. P (得三等奖)12810318360(1)0.4412816C C P X C =====. 从中看出,得三等奖的概率最大. 本题和例1一样,主要是体现了超几何分布的概念及其在实际中的应用.通过以上两个例子,进一步巩固超几何分布的概念,这对下节课有很大的帮助.例3.某人每次射击击中目标的概率是0.2,射击中每次射击的结果是相互独立的,求他在10次射击中击中目标的次数不超过5次的概率(精确到0.01).分析:设在这10次射击中击中目标的次数是X ,由于射击中每次射击的结果是相互独立的,10次射击就相当于进行10次的独立重复试验,因此X 服从二项分布,即(10,0.2)XB .(5)(0)(1)(5)P X P X P X P X ≤==+=++=010195551010100.80.80.20.80.2C C C =⨯+⨯⨯+⨯⨯0.99≈所以他在10次射击中击中目标的次数不超过5次的概率为0.99.本题主要是二项分布的概念的应用.通常情况下,在n 次独立重复试验中事件发生的次数符合二项分布,直接代入公式即可求得率.(四)技能训练1.一个袋子中有5个均匀的白球和3个均匀的黑球,现从中任取2个球,求:①取到的全是黑球的概率;②取到全为白球的概率;③取到一个白球一个黑球的概率;④取到至少一个白球的概率;⑤取到至多一个白球的概率;⑥取到两球同色的概率.学生:依题意取到的白球数X 服从超几何分布,即(8,5,2)X H ,基本事件的总数为28C ,所以①P (取到的全是黑球)23283(0)28C P X C ====;②P (取到的全是白球)2528105(2)2814C P X C =====;③P (取到一个白球一个黑球)11532815(1)28C C P X C ====④方法一:P (取到至少一个白球)15525(1)(2)281428P X P X ==+==+=方法二:P (取到至少一个白球)3251(0)12828P X =-==-=⑤P (取到至多一个白球)315189(0)(1)28282814P X P X ==+==+==⑥P (取到至多一个白球)3513(0)(2)281428P X P X ==+==+=. 2.种植某种树苗,成活率为0.9,现在种植这种树苗5棵,试求: ①全部成活的概率; ②全部死亡的概率; ③恰好成活4棵的概率; ④至少成活3棵的概率. 学生:设X 为5棵树苗中成活的棵数,则X 服从二项分布,即(5,0.9)XB .①P (全部成活)555(5)0.90.59049P X C ===⨯=; ②P (全部死亡) 155(0)0.10.00001P X C ===⨯=; ③P (恰好成活4棵)445(4)0.90.10.0.32805P X C ===⨯⨯=; ④方法一:P (至少成活3棵)3324455555(3)0.90.10.90.10.90.99144P X C C C =≥=⨯⨯+⨯⨯+⨯=方法二:P (至少成活3棵)1(2)1(0)(1)(2)P X P X P X P X =-≤=-=-=-=0511422355510.10.90.10.90.10.99144C C C =-⨯-⨯⨯-⨯⨯=5.课堂小结1.随机变量的两点分布、二项分布、超几何分布;2.请学生归纳两点分布、二项分布、超几何分布的区别和联系: (六)思维与拓展不少车站码头旅游点,常有这样的游戏,规则如下:有一端涂黑、红各10根的筷子,涂色的一端朝下放在不透明的盒子里,在一边的桌子上摆着一排扑克牌,依次为:黑十、黑九红一、黑八红二、黑七红三、黑六红四、黑五红五、黑四红六、黑三红七、黑二红八、黑一红九、红十.对应每组牌都有一个礼物,礼物的价值从两端依次降低,对应“黑五红五”的礼物是小佛像,摆局的人说:从盒子里任意抽出10根筷子,对应颜色的一组牌所对应的礼物就属于你;当你的礼物是小佛像时,请付五元钱把好运气买走;若是其余的礼物,一律不付钱就可把礼物拿走.不少行人或旅客见到两端的礼物很是喜欢,说反正不花钱就玩玩,就随意从盒子里抽出10根筷子,不曾想上来就抽出了五黑五红10根筷子,自然付五元钱买个“好运气”,接着再从中抽10根筷子,不料又“运气”临门,花了几十元钱后发现自己得到了几个不值钱的小礼物.这是为什么呢?为什么摆局的人敢于这样做呢?分析:设X为抽取10根筷子中的涂黑的筷子数,则(20,10,10)X H.则P(黑十) P=(红十)101010201(10)0.000005413184756CP XC=====;P(黑九红一) P=(黑一红九)9110101020100(9)0.0005413184756C CP XC=====;P(黑八红二) P=(黑二红八)82101010202025(8)0.01096184756C CP XC=====;P(黑七红三) P=(黑三红七)731010102014400(7)0.07794184756C CP XC=====;P(黑六红四) P=(黑四红六)641010102044100(6)0.2387184756C CP XC=====;P(黑五红五)5510101020(5)0.344C CP XC====.从以上抽到各组牌的概率知道,最常抽到的正中间的那组,也就是让人“好运气”的“黑五红五”,其次是其左右的“黑六红四”“黑四红六”,再次是“黑七红三”“黑三红七”.而摆局人让它们对应的礼物是很讲究的.若想得到两端的大礼,可能性非常小.五、布置作业补充题1.设一部机器在一天内发生故障的概率是0.2,机器发生故障时全天停止工作,那么这部机器在一周5个工作日里能正常工作4天或5天的概率是多少?。

003理论分布与抽样分布28

003理论分布与抽样分布28

生k次的概率恰好等于展开式中的第k+1项,所以也
把上式称作二项概率公式 。
2.2 二项分布的意义及性质
2.2.1 二项分布定义
设随机变量x所有可能取的值为零和正整数:
0,1,2,…,n,且有
Pn (k )
=
C
k n
p k q nk
k=0,1,2…,n
其中p>0,q>0,p+q=1,则称随机变量x服从
2.3 二项分布的概率计算
【例2.1】 纯种白猪与纯种黑猪杂交,根据孟德尔遗传理 论,子二代中白猪与黑猪的比率为3∶1。求窝产仔10 头,有7头白猪的概率。
解:根据题意,n=10,p=3/4=0.75,q=1/4=0.25。 设10头仔猪中白色的为x头,且x~B(10,0.75)
于是窝产10头仔猪中有7头是白色的概率为:
A1 A2 A 3 A4
A1
A2
A3
A4 p 2 q 42
2.1贝努力试验及其概率公式
又由于以上各种方式中,任何二种方式都是互 不相容的,按概率的加法法则,在4 次试验中, 事件A恰好发生2次的概率为
P4(2) = P(A1 A2 A3 A4) + P(A1 A2 A3 A4) + …+ P(A1 A2 A3 A4)
1.2离散型随机变量的概率分布
要了解离散型随机变量 x 的统计规律,就必须知道它 的一切可能值xi及取每种可能值的概率pi。
如果我们将离散型随机变量 x 的一切可能取值xi ( i=1, 2 , … ),及其对应的概率pi,记作 P(x=xi)=pi i=1,2,…
则称上式为离散型随机变量 x 的概率分布或分布。常 用分布列 (distribution series)来表示离散型随机变量:

第三章 概率分布

第三章 概率分布

f(0)
0.0039
0.0039
f(1)
0.0469
0.0508
f(2)
0.2109
0.2617
f(3)
0.4219
0.6836
f(4) 总和
0.3164 1.0000
1.0000
NP(x) 0.39 4.69 21.09 42.19 31.64 100.00
精品课件
例2:某批鸡种蛋的孵化率是0.90,今从该 批种蛋中每次任选5个进行孵化,试求孵出 小鸡的各种可能概率。
(2)当p值趋于0.5时,分布趋于对称。
精品课件
图4—9 n值不同的二项分布比较
图4—10 p值不同的二项分布比 较
精品课件
2、二项分布的参数 • 总体平均数(次数):
μx=np • 总体标准差(次数):
σx= npq
如例1,n=4, p=0.75,可求红花出现的株数为 4×0.75=3株,σ=(4×0.75×0.25)1/2=0.866株
在一般情况下,随机事件的概率p是不可能准确 得到的。通常以试验次数n充分大时随机事件A的 频率作为该随机事件概率的近似值。

P(A)=p≈m/n (n充分大)
精品课件
概率有如下基本性质:
1、对于任何事件A,有0≤P(A)≤1; 2、必然事件的概率为1,即P(U)=1; 3、不可能事件的概率为0,即P(V)=0。
精品课件
三、概率计算
(一)事件的相互关系 1、和事件
事件A和事件B至少有一件发生而构成的新 事件称为事件A和事件B的和事件,以A+ B表示。 2、积事件 事件A和事件B同时发生,以A·B表示
精品课件
3、互斥事件 事件A和事件B不能同时发生,A·B=V 如新生儿男为A,女为B
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。

第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。

难点:二项分布的概率函数特征,正态分布的特征。

一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。

对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。

在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。

在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。

先取n =4,k =2来讨论。

在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。

由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。

二)、二项分布的意义及性质二项分布定义如下:设随机变量x 所有可能取的值为零和正整数:0,1,2,…,n ,且有)(k P n =kn C kn kqp k =0,1,2…,n其中p >0,q >0,p+q=1,则称随机变量x 服从参数为n 和p 的二项分布 (binomial distribution ),记为 x ~B(n,p)。

显然,二项分布是一种离散型随机变量的概率分布。

参数n 称为离散参数, 只能取正整数;p 是连续参数,它能取0与1之间的任何数值(q 由p 确定,故不是另一个独立参数)。

二项分布由n 和p 两个参数决定:1、当p 值较小且n 不大时,分布是偏倚的。

但随着n 的增大 ,分布逐渐趋于对称,如图4—9 所示;2、当p 值趋于0.5时,分布趋于对称,如图4—10所示;3、对于固定的n 及p ,当k 增加时,P n (k )先随之增加并达到其极大值,以后又下降。

此外,在n 较大,np 、nq 较接近时,二项分布接近于正态分布;当n →∞时,二项分布的极限分布是正态分布。

三)、二项分布的概率计算及应用条件例:豌豆红花和白花杂交后, 在F2红花:白花=3:1,若每次观察4株,共观察100次,问得红花为0、1、2、3、4株的概率各为多少?表 观察4株出现红花的概率分布表 (p=0.75 q=1-p=0.25)概率函数 Cnxpxqn-x P(x) F(x) NP(x)P(0) C40p0q4 0.0039 0.0039 0.39 P(1) C41p1q3 0.0469 0.0508 4.69 P(2) C42p2q2 0.2109 0.2617 21.09 P(3) C43p3q1 0.4219 0.6836 42.19 P(4) C44p4q0 0.3164 1.000 31.64 合计 1.000 100例2:鸡蛋孵化率为,每次选5个进行孵化,试求孵出小鸡的各种可能概率,若做1000次试验,其理论次数分别为多少?孵化小鸡的概率分布表(p= 0.90 q=0.10)概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C50p0q5 0.00001 0.00001 0.01 P(1) C51p1q4 0.00045 0.00046 0.45 P(2) C52p2q3 0.0081 0.00856 8.1 P(3) C53p3q2 0.0729 0.08046 72.9 P(4) C54p4q1 0.32805 0.40951 328.05P(5) C55p5q0 0.59049 1.0000 590.49(二)样本容量的确定例:某小麦品种在田间出现自然变异的概率为0.0045, (1)调查100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?n=100, p=0.0045 P(x ≥2)=1- P(0)- P(1)=0.0751 P(0)=0.01n=1021(株)(三)二项分布的形状和参数二项分布的形状由n 和p 两个参数决定。

B(n,p)(1)当p 值较小且n 不大时,分布是偏倚的。

随n 的增大,分布趋于对称;(2)当p 值趋于0.5时,分布趋于对称。

nn p p C P )1()0(0-=(三)二项分布的形状和参数统计学证明,服从二项分布B(n,p)的随机变量所构成的总体的平均数μ 、标准差σ与n 、p 这两个参数有关。

μ=n p在二项分布中,事件A 发生的频率 x/n 称为二项成数,即百分数或频率。

则二项成数的平均数和标准差分别为:也称为二项总体百分数的标准误,当 p 未知时,常以样本百分数 来估计。

此时上式改写为: =又称为样本百分数标准误。

例:豌豆红花纯合基因型和白花纯合基因型杂交后,在F2代红花植株与白花植株出现的比例为3:1。

每次观察4株,n=4, 红花出现概率为p=3/4=0.75。

(1)红花出现的平均株数μ=n p = 3.0 (株)(2)标准差 =0.8660(株)二、泊 松 分 布泊松分布(Poisson distribution) 是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也是一种离散型随机变量的分布。

泊松分布是二项分布的一种特殊类型。

泊松分布的概率函数 可由二项分布概率函数推导出来 p(x)= Cnxpx(1-p)n-xλ为参数,λ = npx = 0,1,2,… μ=λσ2 =λ 泊松分布记为:P(λ ) P(λ )的形状由λ确定!) ( x e x P λ=-λ x )1 ( p np - =σ pp=μnpq /)(=PσpσpˆpSn q p /)ˆˆ(λ 较小时,泊松分布偏倚。

λ 增大时,泊松分布趋于对称。

λ 无限增大时,泊松分布接近正态分布。

1、对于小概率事件,可用泊松分布描述其概率分布。

2、二项分布当p<0.1和np<5时,可用泊松分布来近似。

显微镜检查某样本内结核菌的数目细菌数(x) 0 1 2 3 4 5 6 7 8 9 总计实际格子数 5 19 26 26 21 13 5 1 1 1 118P(x) 0.0506 0.1511 0.2253 0.2240 0.1671 0.0997 0.0496 0.0211 0.0079 0.0026 0.9990理论格子数 5.97 17.83 26.59 26.43 19.72 11.76 5.85 2.49 0.93 0.31 117.88例:某小麦品种在田间出现自然变异的概率为0.0045, (1)调查100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?!) ( x e x P λ=-λ xn=100, p=0.0045=0.6376=0.2869调查100株,获得两株或两株以上变异植株的概率为:P(x ≥2)=1- P(0)- P(1)=0.0755 至少应调查的株数n 应为:!) ( 1 e1 P 0.45 =- 0.451!) ( 0 e0 P 0.45 =-0.45 0!) ( x e x P λ=-λ x=0.01n=lg0.01/-plge=-2/-0.0045×0.43429=1023(株)三 正态分布正态分布是一种很重要的连续型随机变量的概率分布。

生物现象中有许多变量是服从或近似服从正态分布的,如家畜的体长、体重、产奶量、产毛量、血红蛋白含量、血糖含量等。

许多统计分析方法都是以正态分布为基础的。

此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。

因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。

一)、正态分布的定义及其特征(一) 正态分布的定义 若连续型随机变量x 的概率分布密度函数为222)(21)(σμπσ--=x ex f (3-16)其中μ为平均数,σ2为方差,则称随机变量x 服从正态分布(normal distribution ), 记为x ~N (μ,σ2)。

相应的概率分布函数为⎰∞---=xx dx ex F 222)(21)(σμπσ (3-17)分布密度曲线如图4—2所示。

(二) 正态分布的特征 由(4—6)式和图4—2可以看出正态分布具有以下几个重要特征:1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x =μ;2、f(x)在x =μ处达到极大,极大值πσμ21)(=f ;! ) ( 0e x P λ=-λ 03、f(x)是非负函数,以x 轴为渐近线,分布从-∞至+∞;4、曲线在x =μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞) 区间上是下凸的,在[μ-σ,μ+σ]区间内是上凸的;5、正态分布有两个参数,即平均数μ和标准差σ。

μ是位置参数,如图4—3所示。

当σ恒定时,μ愈大,则曲线沿x 轴愈向右移动;反之,μ愈小,曲线沿x 轴愈向左移动。

相关文档
最新文档