几种常见的概率分布律

合集下载

分布统计学

分布统计学
分布（Distribution）在统计学中是指将数据按照一定的规则进行
分组或分类，并计算每个分组或类别的频率或概率的过程。

通过分布，可以了解数据的集中趋势、离散程度、形状等特征。

以下是一些常见的分布类型及其特点：
1. 均匀分布（Uniform Distribution）：数据在某一区间内均匀分布，每个取值的概率相等。

2. 正态分布（Normal Distribution）：也称为高斯分布，数据呈
钟形曲线，均值为中心，两边逐渐减小，是许多自然现象和社会现象
的常见分布。

3. 指数分布（Exponential Distribution）：用于描述事件发生的时间间隔，如放射性衰变、电子元件的寿命等。

4. 泊松分布（Poisson Distribution）：用于描述在一定时间或空
间范围内事件发生的次数，如单位时间内电话通话次数、车站的乘客
到达人数等。

5. 二项分布（Binomial Distribution）：用于描述一系列独立重复
的二项实验中成功的次数，如掷硬币、掷骰子等。

6. 几何分布（Geometric Distribution）：用于描述在独立重复的
实验中，直到首次成功所需的试验次数。

7. 超几何分布（Hypergeometric Distribution）：用于描述从有限总体中进行有放回抽样时，抽到特定类别的样本个数的概率分布。

这些分布类型在不同的应用场景中具有重要的作用，通过了解和分析数据的分布特征，可以更好地理解数据的性质和规律，并进行统计推断和预测。

常见随机变量的分布函数

常见随机变量的分布函数在概率论和统计学中，随机变量是一个可以取得不同值的变量，其值是按照一定的概率分布规律出现的。

随机变量的分布函数描述了随机变量在不同取值上的概率。

下面是一些常见的随机变量及其分布函数：1. 伯努利分布（Bernoulli Distribution）：伯努利分布是最简单的离散随机变量分布之一、它只有两个可能的取值，例如0和1，成功和失败，正面和反面等。

伯努利分布的分布函数可以表示为：F(x)=1-p,x<0F(x) = 1-p+px, 0<= x < 1F(x)=1,x>=12. 二项分布（Binomial Distribution）：二项分布用于描述一系列独立重复实验中成功的次数。

成功和失败的概率分别为p和q=1-p。

二项分布的分布函数可以表示为：F(x)=Σ(从0到x)[C(n,i)*p^i*q^(n-i)],x为非负整数F(x)=Σ(从0到x)[(e^(-λ)*λ^i)/i!],x为非负整数4. 正态分布（Normal Distribution）：正态分布是连续型随机变量的常用分布，也被称为高斯分布。

它具有对称的钟形曲线，其分布函数不具有一个简单的数学表达式。

正态分布的参数是均值μ和标准差σ。

5. 均匀分布（Uniform Distribution）：均匀分布是最简单的连续型随机变量分布之一，它在一个给定的区间上的取值概率是均等的。

F(x)=(x-a)/(b-a),a<=x<=b6. 指数分布（Exponential Distribution）：指数分布用于描述连续时间的等待事件，例如到达一些交叉口的时间间隔。

指数分布的分布函数可以表示为：F(x)=1-e^(-λx),x>=07. 对数正态分布（Log-Normal Distribution）：对数正态分布是正态分布的指数函数，它使用对数尺度来处理正态分布不适用的情况，例如财富分布和人口增长。

生物统计学几种常见的概率分布律

非此即彼
随机试验有两种互不相容不同结果。重要条件： 1. 每次试验两个结果（互为对立事件），每一种结果在每次试验中都有恒定的概率； 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差当以比率表示时
偏斜度
了解
峭度
做题时请先写公式，代数字，出结果，描述结果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布（exponential distribution）
了解
Γ分布（gamma distribution）
了解
了解
随着p的增加， Γ分布愈来愈接近于正态分布。
§3.6 中心极限定理（Central Limit Theorem）假设被研究的随机变量X可以表示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大，而且每一个别的Xi对于X所起的作用又很小，则X可以被认为服从或近似地服从正态分布。
作业
P51
3.1, 3.2（算出各表现型概率即可）; 3.12, 3.18
正态分布的密度函数和分布函数正态分布（normal distribution）高斯分布（Gauss distribution）正态曲线（normal curve）连续型概率分布律两头少，中间多，两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章几种常见的概率分布律
2010.9

4 第三章几种常见的概率分布律

φ-事件A发生的概率（每次试验都是恒定的）
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中，每次抽一只，做放回式抽样，若抽样试验共进行10次，问其中包括0，1，2，3只雄性动物的概率是多少？包括 3只及3只以下的概率是多少？
1
e dz y

(
y )2 2 2

2
24
F(y) 1
1 2

y
25
正态分布的特性
当y=μ时，f(y)有最大值，正态分布曲线是以平均数为中心的分布。
当y不论向哪个方向远离μ时， f(y)的值都减小，但永远不会等于0，正态分布以y轴为渐近线， y的取值区间（-∞，+∞）。
36
标准正态分布的概率计算
如：设y服从标准正态分布，求概率 P(y>0.3) 。解：标准正态分布关于y=0对称，所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例：设y服从标准正态分布，求概率P(-1.83 <y <0.3) 。
解：即求标准正态分布曲线下在（-1.83，-0.30）范围内的面积
k,
k
1,
k

2,
...
20
第四节正态分布
第四节正态分布
正态分布：两头少，中间多，两侧对称。一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2

概率论中几种常用重要分布

概率论中几种常用的重要的分布摘要：本文主要探讨了概率论中的几种常用分布，的来源和他们中间的关系。

其在实际中的应用。

关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一，一维随机变量部分要介绍六中常用分布，即( 0 －1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布．下面我们将对这六种分布逐一地进行讨论．随机事件是按试验结果而定出现与否的事件。

它是一种“定性”类型的概念。

为了进一步研究有关随机试验的问题，还需引进一种“定量”类型的概念，即，根据试验结果而定取什么值（实值或向量值）的变数。

称这种变数为随机变数。

本章内将讨论取实值的这种变数—— 一维随机变数。

定义1.1 设X 为一个随机变数，令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。

它是一个普通的函数。

成这个函数为随机函数X 的分布函数。

有的随机函数X 可能取的值只有有限多个或可数多个。

更确切地说：存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。

称它的分布为离散型分布。

【例1】下列诸随机变数都是离散型随机变数。

（1）X 可能取的值只有一个，确切地说，存在着一个常数a ,使([])1P X a ==。

称这种随机变数的分布为退化分布。

一个退化分布可以用一个常数a 来确定。

（2）X 可能取的值只有两个。

确切地说，存在着两个常数a ，b ，使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。

如果([])P X b p ==，那么，([])1P X a p ===-。

因此，一个两点分布可以用两个不同的常数,a b 及一个在区间（0,1）内的值p 来确定。

特殊地，当,a b 依次为0,1时，称这两点分布为零-壹分布。

几种常见概率分布

• P(x=0)=0.510／(0!×1.6653)=0.6005
• P(x=1)=0.511／(1!×1.6653)=0.3063
• P(x=2)=0.512／(2!×1.6653)=0.0781
P(x=3)=0.513／(3!×1.6653)=0.0133
P(x=4)=0.514／(4!×1.6653)=0.0017
k=0Βιβλιοθήκη 项分布的性质Today: 2019/10/13
m
P(X ≤m) = Pn (k ≤m) =
C
k n
p
k
q
n
k
k=0
n
P(X ≥m) = Pn (k ≥m) = Ckn pkqn-k
k=m
P(m1 ≤X ≤m2 ) Pn (m1 ≤k ≤m2 )
m2
Cnk pk qn-k (m1 ≤m2 ) k m1
χ服从正态分布,记为χ～(µ,σ2).相应的概率分布函
数为
F(x) = 1
e x
－(x－μ) 2 2σ2
σ 2 π －∞
（二）特征正态分布密度曲线是以χ =µ
为对称轴的单峰、对称的悬钟形； f(x)在χ =µ处达到极大值,极大值为 f（μ）= 1
σ 2π
f(x)是非负数，以x轴为渐进线；
由计算可知，注射 A 疫苗无效的概率为 0.0352，比B疫苗无效的概率0.1671小得多。因此，可以认为A疫苗是有效的，但不能认为B 疫苗也是有效的。
Today: 2019/10/13
（二）应用条件（三个）
n个观察单位的观察结果互相独立; 各观察单位只具有互相对立的一种结果，如
阳性或阴性，生存或死亡等，属于二项分类资料。已知发生某一结果(如死亡) 的概率为p，其对立结果的概率则为1-P=q，实际中要求p 是从大量观察中获得的比较稳定的数值。

数的概率分布

数的概率分布概率分布是概率论中重要的概念之一，用于描述一个随机变量取值的可能性。

在数学和统计学领域里，数的概率分布研究了在特定情况下数值出现的概率。

本文将介绍数的概率分布的基本含义、常见的概率分布类型以及其在实际应用中的重要性。

一、概率分布的基本定义概率分布是随机变量的可能取值及其对应概率的描述。

随机变量可以是离散型变量或连续型变量。

离散型变量的取值有限且可数，如掷骰子的点数；连续型变量的取值为无限个且不可数，如人的身高。

概率分布描述了随机变量每个取值的概率。

二、常见的概率分布类型1. 离散型概率分布离散型概率分布用于描述随机变量为离散型的情况。

以下是几种常见的离散型概率分布：（1）伯努利分布伯努利分布是一种简单的离散型分布，常用于描述试验只有两个可能结果的情况，如硬币的正反面。

（2）二项分布二项分布是描述n次成功失败试验的离散型分布，例如n次掷硬币中正面朝上的次数。

（3）泊松分布泊松分布用于描述单位时间内随机事件发生的次数，如单位时间内电话呼叫次数、交通事故发生次数等。

2. 连续型概率分布连续型概率分布用于描述随机变量为连续型的情况。

以下是几种常见的连续型概率分布：（1）均匀分布均匀分布描述了在一个区间内随机取值时，每个取值的概率相等，如抛硬币的落点在一个平面上的坐标。

（2）正态分布正态分布是最常见的连续型概率分布之一，也称为高斯分布。

它以钟形曲线为特征，广泛应用于自然和社会科学领域，如身高、体重等。

（3）指数分布指数分布用于描述事件发生的时间间隔或等待时间，如设备故障发生的时间间隔、用户等待的响应时间等。

三、概率分布在实际应用中的重要性概率分布在实际应用中具有重要的作用，主要体现在以下几个方面：1. 预测和决策通过分析和建模某个事件或现象的概率分布，可以对未来可能的结果进行预测。

例如，在金融领域中，通过对股票收益率的概率分析，可以帮助投资者做出决策。

2. 风险评估概率分布可以用于评估风险。

在保险行业中，通过对保险索赔次数或大小的概率分析，可以估算保险公司的风险，并确定合理的保费。

分布律的表示形式

分布律的表示形式分布律是描述一个随机变量取值的概率分布的函数，它定义了每个可能取值的概率。

常见的分布律有离散分布律和连续分布律两种形式。

一、离散分布律离散分布律描述了离散型随机变量的概率分布情况。

离散分布律可以用概率质量函数（Probability Mass Function，PMF）来表示。

PMF给出了随机变量取不同值的概率。

以二项分布为例，二项分布是一种离散型的概率分布，描述了在一系列独立的伯努利试验中成功次数的概率分布情况。

二项分布的PMF可以表示为：P(X=k) = C(n,k) * p^k * (1-p)^(n-k)，其中X 为成功次数，k为取值，n为试验次数，p为成功的概率，C(n,k)表示组合数。

二项分布的分布律描述了在n次独立的伯努利试验中成功次数为k 的概率。

二、连续分布律连续分布律描述了连续型随机变量的概率分布情况。

连续分布律可以用概率密度函数（Probability Density Function，PDF）来表示。

PDF给出了随机变量在某个取值处的概率密度。

以正态分布为例，正态分布是一种连续型的概率分布，也被称为高斯分布。

正态分布的PDF可以表示为：f(x) = (1 / (σ * √(2π))) * exp(-(x-μ)^2 / (2σ^2))，其中x为随机变量的取值，μ为均值，σ为标准差。

正态分布的分布律描述了随机变量取某个值的概率密度。

三、其他常见分布律除了二项分布和正态分布，还有很多其他常见的分布律。

例如泊松分布、指数分布、伽马分布等。

泊松分布是一种描述单位时间或单位空间内随机事件发生次数的概率分布。

它的分布律可以表示为：P(X=k) = (λ^k / k!) * exp(-λ)，其中X为事件发生的次数，k为取值，λ为单位时间或单位空间内事件发生的平均次数。

指数分布是一种描述随机事件发生时间间隔的概率分布。

它的分布律可以表示为：f(x) = λ * exp(-λx)，其中x为时间间隔，λ为事件发生的速率。

d 几种常见的概率分布律

三、服从二项分布的随机变量的特征数
平均数： μ=nφ
方差： σ2=nφ(1-φ)
随着样本含量的增加，偏斜度和峭度趋向于0，二项分布逐渐接近于正态分布。
四、二项分布应用实例
例：3.2 例：3.3 例：3.4
【例3.4】
用棕色正常毛 (bbRR) 的家兔和黑色短毛 (BBrr)兔杂交，杂种F1为黑色正常毛长的家兔，F1雌、雄兔近亲交配，问最少需要多少只F2代的家兔，才能以99%的概率至少得到一只棕色短毛兔？
二、二项分布概率函数表达式：
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数（或样本含量） y=在n次试验中事件A出现的次数 φ=事件A发生的概率（每次试验都是恒定的） 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例：3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动物中随机抽取一只，记下性别后放回，再做第二次抽取。共做了10次抽样，计算抽中3只和3只以下雄性动物的概率。
（5）曲线和X坐标轴所夹的面积等于1。（6）正态分布表查出的φ(u)的值表示随机变量
U落入区间（-∞, u）的概率。（7）累积分布函数图形的特点是围绕点
（0, 0.5）对称。（8）正态分布的偏斜度γ1=0 ，峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解： n=10 y=3，2，1，0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2

常用概率分布间简介

其中 c 为常数，解方程（1）得
f ( ) c f ( )
f
(
)
k
e
1 2
c
2
，
k
为常数.
为使 f ( ) 为概率密度函数，
f
( )d
1，
即
k
e
1 2
c
2
dy
1
故必须 c 0 ，不妨令 c 1 （ 0 ），代入（2）解得 2
k 1 ， 2 Biblioteka 于是f ( ) 1
2
e2 2 ， R ，
2
这是均值为 0，方差为 2 的正态分布的概率密度函数.
.
X
~
N(0, 2)
,
则Y
X2
~
Ga(
1 2
,
1 2
2
)
.
（1）（2）
Ga( n , 1) 2(n) . 22
m
Xi ~ N(0,1) , i 1,2,,n 且相互独立 , 则 X
X
2 i
~
2(n) .
i 1
⒊ 相当误差（比率）的概率分布
m
设
Xi
~
N(0, 2 ) ，i
1,2,, m,m 1,,m n且相互独立，则
i 1
二、随机误差的概率分布
⒈ 高斯随机误差模型随机变量的高斯分解
可观测的指标
X
不可观测的随机干扰
指标的标准值(生产控制参数,理论均值)
原始测量误差的概率分布
由棣莫弗提出，高斯推证，拉普拉斯再证，原始测量误差的概率分布为：
~ N (0 , 2 )
高斯的推证要点如下：
设测量误差 X 的密度函数为 f ( ) ，由“最大后验概率”的原则得

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

的概率，其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个，隐性基因一个，该项的系数表示这样的组合共有四种。
它们是RRYy，RRyY，RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项，因此产生理论分布中“二项分布”这一名称。故该式称为二项分布的概率函数。
• 二项展开式，
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小； (2) 当P = 0.5时，无论 n 的大小，均为对称分布； (3) 当P ≠ 0.5，n 较小时为偏态分布，n 较大时逼近正态分布。
偏斜度和峭度与和的大小有关。
当 ϕ 相同时，随n增加，γ1 和 γ 2逐渐接近于0。或当n相同时， ϕ 越接近于0.5， γ1 和 γ 2 越接近于0。正态分布的 γ1 =0， γ 2 =0。所以，随样本数增加，二项分布渐接近于正态分布，特别是越接近于0.5附近时，这种接近来得更快。
近似法进行样本率与总体率，两个样本率比较的u检验。
若p接近0.5，n很大，二项概率分布趋于正态分布。
§3.2 泊松分布
3.2.1 泊松分布的概率函数
描述一定空间(长度、面积和体积)或时间间隔内点子散布状况的理想化模型. 是二项分布n很大而P很小时的特殊形式，是二分类资料在n次实验中发生x次某种结果的概率分布。
可以由
⎛7 ⎝⎜ 16
⎞n ⎠⎟
=
0.001
求出。因为F2代的分离比是7/16非B_R_对9/16 B_R_。
二项分布的应用
主要用于符合二项分布分类资料的区间估计和假设检验。
¾ 当总体率P接近0.5，阳性数x较小时，可直接计算二项分布的累计概率进行单侧的假设检验。 ¾ 当P = 0.5或n较大，nP及n(1-P)均大于等于5时，可用正态
显然，在10次试验中，抽到雄性动物的只数是一随机变量，记为X（其可能值为0, 1,…, 10）。现在要求X=3和X≤3 的概率。
先规定一组符号： n —— 试验次数（或样本含量）
—— 在次试验中事件出现的次数
ϕ —— 事件 A 发生的概率（每次试验是恒定的）
1− ϕ —— 事件 A 发生的概率
p ( x) —— X 的概率函数—— P ( X = x) F ( x) = P ( X ≤ x) = ∑ p ( xi )
• 如若不然，第一次抽到的是雄性，那么第二次抽到雄性的概率是49/99，而抽到雌性的概率是50/99。第一次试验的结果影响到第二次试验中各事件发生的概率。两次试验非独立（非放回式抽样）。
放回式抽样，适合于二项分布。非放回式抽样，适合于超几何分布。
用放回式抽样共进行10试验，问其中包括3只雄性动物的概率是多少？包括3只及3只以下的概率是多少？
p (mmmfffffff ) = ϕ3 (1− ϕ )7
显然，这不是抽中3只雄性动物的唯一方式，从10次抽样中抽到3只雄性动物
的组合数有 C130 。因此
p (3) = C130ϕ 3 (1− ϕ )7
对于任意n和x有通式
p ( x) = Cnxϕ x (1− ϕ )n−x , x = 0, 1, 2, ", n
P(x) = Cnx Px(1-P)n-x, x = 0,1,...,n。
• 例3.1 从雌雄各半的100只动物中做一抽样试验，每
次抽取一只，记录性别并放回，再做下一次抽取。这时，不论前一次抽取的动物性别如何，下一次抽取到雄性或雌性的概率仍为50/100。前一次试验结果并不影响到下一次试验中各种事件发生的概率。因此，这前后两次试验是独立的（放回式抽样）。
进行抽样，样本总和数 k (0≤k≤n))的概率分布。
P(k ) = Cnk pk qn−k
某实验中小白鼠染毒后死亡概率P，则生存概率为1-P 。对二只小白鼠（甲乙）进行实验的结果为：甲乙均死（P2）、甲死乙生（P(1-P)）、乙死甲生（(1-P)P）或甲乙均生（ (1-P)2），概率相加得
P2 + P(1-P) + (1-P)P + (1-P)2 = [P + (1-P)]2 依此类推，对n只小白鼠进行实验，所有可能结果的概率相加得
bbrr的家兔，只有ϕ n 项不含bbrr的家兔。因此，n值可以由ϕ n =1-0.99求
出。由
ϕn
=
⎛ 15 ⎜⎝ 16
⎞n ⎟⎠
=
0.01
得 n (lg15 − lg16) = lg 0.01, −0.02803n = −2.0000
所以 n=71.4
另外，以0.1%的风险至少得到一个黑色长毛兔（B_R_）所需F2代的数目。
系数分子分母同乘以 nx ，则：
p
(
x)
=
(1)
⎛⎜⎝1
−
1 n
⎞⎟⎠" ⎛⎜⎝1 −
x
−1 n
⎞ ⎟⎠
(
nϕ
)
(1−
x!
ϕ
)n−x
当时n → ∞ ，系数极限为1，且 nϕ = μ ，
p(x)
=
μx
x!
(1− ϕ )n−x
=
μx
x!
⎡⎢⎣(1
−
ϕ
)− 1 ϕ
⎤ −ϕ ( n− x ) ⎥⎦
p( x) = μx e−μ
第三章几种常见的概率分布律
概率计算比较复杂，生物统计中所用的概率计算主要利用变数的分布进行。
§3.1 二项分布
3.1.1 二项分布的概率函数
说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布
在生物学、医学领域，二项分布可以描述很多现象，是一种重要的理论
分布，在分类资料的统计推断中有非常广泛的应用。
应用基本情况：在一随机试验中，每次都有两种互不相容
的可能结果，如有效（事件A ）和无效（事件 A ）等。独立地将试验重复n次，求在n次试验中，一种结果出现x次的概率？
应用条件：每一种结果在每次试验中都有恒定的概率，试
验之间是独立的。
二项分布(binomial distribution)
二项分布是指在μ=p的二项总体中，以样本容量n
= 0.1718751
3.1.2 服从二项分布的随机变量的特征数
平均数 μ = nϕ 。当以比率表示时，μ = ϕ 。
方差 σ 2 = nϕ (1−ϕ ) 。当以比率表示时，σ 2 = ϕ (1−ϕ ) 。
n
偏斜度峭度
γ1 =
1− 2ϕ
nϕ (1−ϕ )
γ
2
=
nϕ
1
(1 − ϕ
)
−
6 n
二项分布的图形特征如下：
xi ≤ x
x
x
上例中，共做10次抽样，n=10，在10次抽样中，雄性出现3次，x=3，每次抽到雄性的概率是0.50。p (3)为10次抽样中抽中3只雄性动物的概率，F
(3)为10次抽样中，抽中3只和3只以下雄性动物的概率。根据以上给出
的 n ，和 ϕ 求出p (3)和F (3)。
假设前三次抽中的都是雄性（m），由于抽样间是独立的，每次抽到雄性动物的概率均为，抽到雌性（f）的概率均为。故
当 μ 很大时，γ1 和 γ 2 则接近于0，
这时的泊松分布近似正态分布。
泊松分布的应用
主要用于符合泊松分类资料率的区间估计和假设检验。
¾ 当µ≥20时，根据正态近似的原理，对总体均数进行95%的区间估计。 ¾ 通过直接计算Poisson分布的累计概率进行单侧假设检验。 ¾ 在符合正态近似条件时，也可用u检验进行样本率与总体率，两个样本率比较的假设检验。
n
= ∑p( x) x=0
• 因为 ϕ + (1−ϕ ) = 1 ，所以
•
n
∑
p
(
x)
=
⎡⎣ϕ
+
(1 − ϕ
)⎤⎦n
=1
x=0
• 根据二项分布的概率函数式，可以求出雄性动物出现各种只数的概率。如 x = 0, 1, 2, 3只的概率分别为：
p(0)
=
10!
0!(10 −
⎛
0)!⎜⎝
1 2
⎞0 ⎟⎠
和r基因出现的概率均为 (1−ϕ ) ，ϕ = 1−ϕ = 1 ，对于两对因子n=4。展
开二项式，
2
⎡⎣ϕ + (1−ϕ )⎤⎦4
= ϕ 4 + 4ϕ3 (1−ϕ ) + 6ϕ 2 (1−ϕ )2 + 4ϕ (1−ϕ )3 + (1− ϕ )4