几种常见的分布

合集下载

几种常见的分布

定义：
应用：假设检验。
2020/11/30
.
18
各种分布之间的关系
Gamma分布与指数分布、正态分布
当gamma分布的形状系数k为正整数时，gamma分布可看作k个独立的指数分布之和，当k趋向于较大数值时，分布近似于正态分布。
在Gamma分布中：k=n（正整数）时的gamma分布可以看作n个独立的k=1的 gamma分布（即指数分布）之和，按照中心极限定理，独立同分布随机变量之和趋于正态分布。
2020/11/30
.
7
六、Gamma分布
E[X]=
D[X]=
应用：用于描述随机变量X等到第K件事发生所需等候的时间。
2020/11/30
.
8
七、瑞利分布(Rayleigh distribution)
定义：当一个随机二维向量的两个分量呈独立的、有着相同的方差的正态分布时，这个向量的模呈瑞利分布。
2020/11/30
.
5
ห้องสมุดไป่ตู้
四、对数正态分布
定义：如果一个随机变量的对数服从正态分布，那么该随机变量服从对数正态分布。
应用：金融保险业、投资收益计算等。
2020/11/30
.
6
五、柯西分布(Cauchy distribution)
应用：主要应用于物理学中，它是描述受迫共振的微分方程的解。在光谱学中，它用来描述被共振或者其他机制加宽的谱线形状。
应用：在自然情况下，均匀分布极为罕见。在实际问题中，当我们无法区分在区间内取值的随机变量取不同值的可能性有何不同时，我们就可以假定随机变量服从区间上的均匀分布。
2020/11/30
.
4
三、指数分布(Exponential distribution)

6.2数理统计中几种常用的分布.

性质3. 设T～t(n),则:T ～F(1,n) .
2
证明:
由t分布定义 T
2
X Y /n
其中X∼N(0,1),Y～χ (n),且X与Y相互独立. 2 2 (1) / 1 X /1 2 F T 2 Y /n ( n) / n
且 2 (1)与 2 ( n)相互独立.
由F分布定义, ∴ F = T2～F(1,n) .
2
条件: 的点χ

P ( n)
2 2

2
( n )
f ( x)dx
2
(n)为χ 2(n)分布的上分位点.
χ (n)分布的上分位点图形如右图.
χ2(n)分布的上分位点可以查附表5.
2Hale Waihona Puke 13例1:求2 2 0 ( 10 ) ， )。 .05 0.1 (20
1.) 因为
P X z0.05 1 P X z0.05 1 0.05 0.95.
P X 1.64 0.9495.
P X 1.65 0.9505.
z0.05 1.64 1.65 1.645. 2
4
2.)
P X z0.005 1 PX z0.005 1 0.005 0.995.

i 1 n i 1
n
EX i2 n.
2 DX i
D D(

2n.
10
4.应用中心极限定理可得，若若 X ~ 2 (n) ，则当n充分大时， X n 2n 的分布近似正态分布N(0,1).
11
2 (n)
分布的密度函数的图形如右图.

16种常见概率分布概率密度函数、意义及其应用

目录1. 均匀分布 (1)2. 正态分布（高斯分布） (2)3. 指数分布 (2)4. Beta分布（：分布） (2)5. Gamm 分布 (3)6. 倒Gamm分布 (4)7. 威布尔分布（Weibull分布、韦伯分布、韦布尔分布） (5)8. Pareto 分布 (6)9. Cauchy分布（柯西分布、柯西-洛伦兹分布） (7)210. 分布（卡方分布） (7)8 11. t分布................................................9 12. F分布 ...............................................10 13. 二项分布............................................10 14. 泊松分布（Poisson 分布）.............................11 15. 对数正态分布........................................1. 均匀分布均匀分布X ~U（a,b）是无信息的，可作为无信息变量的先验分布。

2. 正态分布（高斯分布）当影响一个变量的因素众多，且影响微弱、都不占据主导地位时，这个变量很可能服从正态分布，记作X~N （」f 2）。

正态分布为方差已知的正态分布N （*2）的参数」的共轭先验分布。

1 空f （x ）： —— e 2-J2 兀 o'E(X)， Var(X) _ c 23. 指数分布指数分布X ~Exp （）是指要等到一个随机事件发生，需要经历多久时间。

其中，.0为尺度参数。

指数分布的无记忆性：Plx s t|X = P{X t}。

f （X ）二 y oiE(X) 一4. Beta 分布（一：分布）f （X ）二 E(X)Var(X)=(b-a)2 12Var(X)二1~2Beta 分布记为X 〜Be(a,b)，其中Beta(1,1)等于均匀分布，其概率密度函数可凸也可凹。

常见的数学分布

常见的数学分布
常见的数学分布
一. 离散分布
1. 伯努利分布
伯努利分布是研究单个成功/失败事件（二元变量）概率的基本
概率分布，只有两种结果，成功/失败，因此伯努利分布也称为二项
分布。

2. 贝叶斯分布
贝叶斯分布主要用于分析估计连续变量，它是基于贝叶斯概率理论，关于一个未知参数的不确定性状况，以后新的观测信号被观测后，这种参数的不确定性会发生变化。

3. 几何分布
几何分布是离散概率分布的一种，主要用于研究成功/失败事件
发生次数的概率分布，即最少要经历多少次失败才能够获得一次成功。

4. 泊松分布
泊松分布是一种离散概率分布，属于参数为λ的二项分布，也叫泊松二项分布，用来描述一段时间内事件发生次数的概率分布，是一种常用的概率分布。

二. 连续分布
1. 正态分布
正态分布是连续概率分布的一种，也叫高斯分布，是最常用的一类概率分布，可以用来描述不同变量的概率分布情况，它的曲线呈现
出钟形，最大值位于均值处。

2. 对数正态分布
对数正态分布又叫做极大似然估计分布，属于一种连续概率分布，可以用来描述变量值的概率分布情况，表现为对数公式，又称为对数正态分布。

3. t 分布
t 分布是一种特殊的正态分布，也叫做学生的 t 分布，它可以
用来描述变量值的概率分布情况，它的曲线呈现出椭圆形。

4. 卡方分布
卡方分布是一种连续概率分布，常用于统计学分析中，它可以用来描述自由度为 k 的某个统计量的概率分布，其图形呈现出单峰形状。

几种常见的概率分布

几种常见的概率分布一、离散型概率分布1. 二项分布n 次独立的贝努利实验，其实验结果的分布（一种结果出现x 次的概率是多少的分布）即为二项分布应用二项分布的重要条件是：每一种实验结果在每次实验中都有恒定的概率，各实验之间是重复独立的平均数： (Y)np X E μ==方差与标准差：2(1)X np P σ=- ;X σ=特例：（0-1）分布若随机变量X 的分布律为1(x k)p (1p)k k p -==- k=0,1；0<p<1,则称X 服从参数p 的（0-1）分布2. 泊松分布泊松分布是一种用来描述一定的空间与时间里稀有事件发生次数的概率分布泊松分布变量x 只取零与正整数：0、1、2…..其概率函数为：泊松分布的平均数：(x)E μμ==泊松分布的方差与标准差：2σμ= 、σ=3. 超几何分布P(X=k)=k n k M N M n NC C C -- 记X~（N ，M ，n ） P=M N期望：E(X)=np方差：D(X)=np(1-p)1N n N -- 适用范围：多次完全相同并且相互独立的重复试验，如果在有限总体中不重复抽样，抽样成功的次数X 的概率分布服从超几何分布，如福利彩票二、连续型概率分布1. 均匀分布若随机变量X 具有概率密度函数则称X 在区间（a ，b ）上服从均匀分布，记为X ~ U(a ，b) 在区间（a ，b ）上服从均匀分布的随机变量X 的分布函数为 2指数分布若随机变量X 具有概率密度函数,0(x)0,0x e x f x λλ-⎧≥=⎨<⎩ 其中0λ>是常数，则称X 服从以λ 为参数的指数分布，记作~()X E λ ，X 的分布函数为3.正态分布正态随机变量X 的概率密度函数的形式如下：式中，μ 为随机变量X 的均值；2δ 为随机变量X 的方差。

通常对具有均值μ，方差为2δ的正态概率分布，记为N （μ，2δ）。

于是有正态随机变量X~N （μ，2δ）。

数理统计中几种分布之间的关系

数理统计中有几种常见的概率分布，包括正态分布、泊松分布和指数分布。

这些分布在实际应用中有着重要的意义，它们之间的关系也是数理统计中的一个重要内容。

1. 正态分布正态分布是自然界和社会现象中最常见的分布之一，也被称为高斯分布。

它具有钟形曲线，呈现出中间高、两端低的特点。

正态分布有着许多重要的性质，比如均值和标准差能够完全描述一个正态分布。

在实际应用中，正态分布可以用来描述许多自然现象，比如身高、体重等。

另外，中心极限定理告诉我们，大量独立同分布的随机变量之和的分布趋于正态分布。

2. 泊松分布泊松分布是描述单位时间内随机事件发生次数的概率分布。

它适用于描述少量成功事件在长时间内发生的情况。

泊松分布的参数是平均发生率λ，它决定了事件发生的概率。

泊松分布在实际应用中被广泛运用，比如描述单位时间内接到的通信方式数、一段时间内发生的交通事故数等。

3. 指数分布指数分布是描述事件发生间隔时间的概率分布，它是泊松分布的补充。

指数分布的参数是事件发生率λ，它与泊松分布的参数相互关联。

指数分布常用来描述无记忆性的随机变量，比如设备的寿命、服务时间间隔等。

数理统计中，这三种分布之间存在着密切的联系。

正态分布和泊松分布在一定条件下可以近似互相转化。

当事件发生率λ趋向无穷大时，泊松分布将近似于正态分布。

而在一些特殊情况下，指数分布也可以退化为泊松分布。

这三种分布之间并不是孤立存在的，它们在一定条件下是相互联系、相互激发的。

在我的理解中，这三种概率分布之间的关系可以帮助我们更好地理解和应用概率统计的相关知识。

通过对它们之间关系的深入了解，我们可以更准确地选择合适的分布来描述实际问题，从而提高统计分析的准确性和实用性。

总结起来，正态分布、泊松分布和指数分布是数理统计中常见的概率分布，它们之间存在着密切的联系。

深入理解它们之间的关系有助于我们更好地应用统计学知识，提高数据分析的准确性和实用性。

希望通过本篇文章的阐述，能为读者带来一些启发和帮助。

几种常见的分布

服从正态分布 N (, 2 ) 的随机变量
X的概率密度是
f (x)
1
e ,
(
x )2 2 2
x
2
X的分布函数P(X≤x)是怎样的呢？
设X~ N (, 2 ) , X的分布函数是
F(x) 1
x
e

(
t )2 2 2
dt
,
x
2
对于连续型随机变量，一般是给出它的概率密度函数.
一、正态分布的定义
若r.v X的概率密度为
f (x)
1
e ,
(
x ) 2 2
2
x
2
其中和 2 都是常数，任意， >0，则称X服从参数为和 2的正态分布.
记作 X ~ N (, 2)
f (x)所确定的曲线叫作正态曲线.
P( X k) e k , k0,1,2, ,
k!
其中λ >0 是常数, 则称 X 服从参数为λ 的泊松分布, 记作X~P(λ ).
泊松分布的图形特点：X~P(λ )
二、二项分布与泊松分布
历史上，泊松分布是作为二项分布的近似，于1837年由法国数学家泊松引入的.
近数十年来，泊松分布日益显示其重要性, 成为概率论中最重要的几个分布之一.
f (x)
1
e ,
(
x )2 2 2
x
2
用求导的方法可以证明， x=μσ
为f (x)的两个拐点的横坐标.
这是高等数学的内容，如果忘记了，课下再复习一下.
根据对密度函数的分析，也可初步画出正态分布的概率密度曲线图.
用上海99年年降雨量的数据画出了频率直方图.

几种常见的分布

一、常见数据类型数据可大致分为离散我们先来看一看平时遇到的数据。

在正式的解释分布之前，型数据和连续型数据。

离散型数据结果只当你掷骰子的时候，离散型数据顾名思义就是只取几个特定的值。

例如：。

1,2,3,4,5,6，不会出现类似1.5,2.5有连续型数据这个范围可以是有限的或者是连续型数据可以取任意值。

在一个给定的范围内，等54kg,54.4kg,54.33333kg无穷的。

例如：一个人的体重或者身高，可以取值等都没有问题。

下面就开始介绍分布的类型。

二、分布类型）Bernoulli Distribution伯努利分布（首先从最简单的分布开始，伯努利分布实际上是一个听起来最容易理解的分布。

代表0failure1代表success及伯努利分布一次实验有两个可能的结果，比如pX表示失，一个取值为1并代表成功，成功概率为0随机变量pX一个取值为pq1?或者说1?p。

败，失败概率为q(0,1)∈xp(1?p)，我们(0,1)x这里，概率分布函数为px(1?p)1?x，其中∈xx1?也可以写成如下形式：x=0x=1pP(x)={1?p x=1，，，x=0p，P(x)={1?p，但是这俩概率加和应该0.5成功和失败的概率没必要相同，也就是没必要都是，比如可以是下面的图：为1.p(failure)=0.85p(success)=0.15p(failure)这个图就是p(success)=0.15，，=0.85。

服从伯努利下面说一下随机变量的期望，一个分布的期望就是这个分布的均值。

X X分布的随机变量的期望值就是：p)=p?(1?E(X)=1?p+0?(1?p)=pE(X)=1?p+0服从伯努利分布的随机变量的方差是：p)(1?=p?p=pV(X)=E(X)?[E(X)] V(X)=E(X2)?[E(X)]2=p?p2=p(1?p)222明天今天会不会去健身，还有许多伯努利分布的例子，比如说明天是否会下雨，乒乓球比赛是不是会赢。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、常见数据类型在正式的解释分布之前，我们先来看一看平时遇到的数据。

数据可大致分为离散型数据和连续型数据。

离散型数据离散型数据顾名思义就是只取几个特定的值。

例如：当你掷骰子的时候，结果只有1,2,3,4,5,6，不会出现类似1.5,2.5。

连续型数据在一个给定的范围内，连续型数据可以取任意值。

这个范围可以是有限的或者是无穷的。

例如：一个人的体重或者身高，可以取值54kg,54.4kg,54.33333kg等等都没有问题。

下面就开始介绍分布的类型。

二、分布类型伯努利分布（Bernoulli Distribution）首先从最简单的分布开始，伯努利分布实际上是一个听起来最容易理解的分布。

伯努利分布一次实验有两个可能的结果，比如1代表success及0代表failure。

随机变量X X一个取值为1并代表成功，成功概率为p p，一个取值为0表示失败，失败概率为q q或者说1−p1−p。

这里，概率分布函数为p x(1−p)1−x px(1−p)1−x，其中x∈(0,1)x∈(0,1)，我们也可以写成如下形式：P(x)={1−p，p，x=0x=1P(x)={1−p，x=0p，x=1成功和失败的概率没必要相同，也就是没必要都是0.5，但是这俩概率加和应该为1，比如可以是下面的图：这个图就是p(success)=0.15，p(failure)=0.85p(success)=0.15，p(failure) =0.85。

下面说一下随机变量的期望，一个分布的期望就是这个分布的均值。

服从伯努利分布的随机变量X X的期望值就是：E(X)=1∗p+0∗(1−p)=p E(X)=1∗p+0∗(1−p)=p服从伯努利分布的随机变量的方差是：V(X)=E(X2)−[E(X)]2=p−p2=p(1−p)V(X)=E(X2)−[E(X)]2=p−p2=p(1−p)还有许多伯努利分布的例子，比如说明天是否会下雨，今天会不会去健身，明天乒乓球比赛是不是会赢。

均匀分布（Uniform Distribution）当你掷骰子的时候，结果出现1到6中的任何一个，而任何一个结果出现的概率都是相同的，这就是均匀分布最原始的雏形。

你可能看出来了，与伯努利分布不同的是，这n n个出现的结果的概率都是相同的。

一个随机变量X X为均匀分布是指密度函数如下：f(x)=1b−a−∞<a≤b<∞f(x)=1b−a−∞<a≤b<∞下图为均匀分布的密度图的样子：咱们可以看出来均匀分布的密度图是个矩形，这也就是为啥均匀分布的昵称是矩形分布。

对于均匀分布来说a a和b b都是参数，分布的参数。

例子：假如花店每日销售的花束数量均匀分布，最多40只，最少10只。

我们来尝试计算每日卖花数量在15到30之间的概率。

由于随机变量所有可能发生的事件的概率和为1，并且卖花数量是均匀分布，所有在15到30之间的概率为(30−15)∗1(40−10)=0.5(30−15)∗1(40−10)=0.5。

类似的对于每日卖花数量大于20发生的概率就是1−(20−10)∗1(40−10)=231−(20−10)∗1(40−10)=23。

若随机变量X X服从均匀分布，那么它的均值和方差分别为：Mean->E(X)=(a+b)2E(X)=(a+b)2Variance->V(X)=(b−a)212V(X)=(b−a)212标准的均匀分布的密度参数为a=0a=0和b=0b=0，所以对于标准的均匀分布的密度函数为：f(x)={1，0，0≤x≤1otherwise f(x)={1，0≤x≤10，otherwise二项分布（Binomial Distribution）我们假定一个随机变量，比如X X，表示你赢得比赛的次数。

X X可能的值是什么？它可以是任何数字，赢得比赛的次数。

如果就两个可能的结果。

成功，失败。

因此，成功概率= 0.5，失败的概率可以容易地计算为：q=p−1=0.5q=p−1=0.5。

只有两种结果是可能的分布，如成功或失败，以及所有试验的成功和失败概率相同的情况称为二项分布。

发生结果的可能性不同时，前面的例子如果实验成功的概率是0.2，那么失败的概率可以很容易地计算出来，q=1−0.2=0.8q=1−0.2=0.8。

每次试验都是独立的，因为之前的结果并不决定或影响当前的结果。

只有两次重复n次的可能结果的实验称为二项式。

二项分布的参数是n n和p p，其中n n是试验的总数，p p是每个试验中成功的概率。

基于上述解释，二项分布的性质是：1. 每次实验独立2. 试验中只有两种可能的结果- 成功或失败。

3. 共进行了n n次相同的试验。

4. 所有试验的成功和失败的概率是相同的。

（试验是相同的。

）二项分布的数学表达式由下式给出：P(x)=n!(n−x)!x!p x q n−x P(x)=n!(n−x)!x!pxqn−x一个二项分布图，其中成功的概率不等于失败的概率长这样：成功概率与失败概率相等，长这样：二项分布均值和方差：Mean -> μ=n∗pμ=n∗pVariance -> Var(X)=n∗p∗q Var(X)=n∗p∗q正态分布（Normal Distribution）正态分布可以表示宇宙中大多数的事件发生情况。

如果任何分布具有以下特征，则称为正态分布：1. 均值、中位数、众数在一个分布中取相同的值；2. 分布曲线关于x=μx=μ对称；3. 曲线下面的面积总和为；4. 中心位置的左半边和右半边对应位置的概率取值相同。

正态分布与二项分布有很大的不同。

但是，如果试验次数接近无穷大，则形状将非常相似。

服从正态分布的随机变量X X的密度函数为：f(x)=12πσ−−−√e{−12(x−μσ)2}−∞<x<∞f(x)=12πσe{−12(x−μσ)2}−∞<x<∞服从均匀分布的随机变量X X的均值和方差，如下：Mean -> E(X)=μE(X)=μVariance -> Var(X)=σ2Var(X)=σ2这里μμ(mean)和σσ(standard deviation)是两个参数，随机变量X∼N(μ,σ)X ∼N(μ,σ)的不同取值的变化图如下：标准正态分布的均值为0，方差为1，密度图如下：f(x)=12π−−√e−x22∞<x<∞f(x)=12πe−x22∞<x<∞泊松分布（Poisson Distribution）假设你在一个呼叫中心工作，大概一天能接收到多少个电话？它可以是任何数字。

呼叫数量就可以用泊松分布建模，下面是别的例子：1. 每天在医院记录的紧急呼叫数量。

2. 每天在一个地区报告的盗窃数量。

3. 一小时内到达沙龙的客户数量。

4. 一个特定城市报告的自杀人数。

5. 书每页的打印错误数量。

泊松分布适用于事件发生在任意随机时间点或者空间的情况，其中我们的兴趣仅在于事件的发生次数。

当以下假设有效时，分布称为泊松分布：•任何成功的事件都不应该影响另一个成功事件的结果。

•在较短的时间间隔内成功的概率必须等于在较长的时间间隔内成功的概率。

•随着间隔变小，间隔内成功的概率接近零。

现在，如果任何分布满足上述假设，那么它是一个泊松分布。

泊松分布中使用的一些符号是：•λλ是事件发生的速率•t t是时间间隔的长度•X X是在时间间隔t t内事件发生的次数这里X X叫做泊松随机变量，同时X X的概率分布就叫做泊松分布。

我们用μμ表示时间t t内时间发生的平均次数也就是均值，所以μ=λ∗tμ=λ∗t。

服从泊松分布的随机变量X X的PMF为：P(X=x)=e−uμxx!x=0,1,2,......P(X=x)=e−uμxx!x=0,1,2,......均值μμ是分布的参数，μμ也被定义为在一个时间段内发生λλ次。

泊松分布图如下：下图显示了均值增加而导致的曲线移动：可以感觉到，随着平均值的增加，曲线向右移动。

服从泊松分布的随机变量X X的均值和方差：Mean -> E(X)=μE(X)=μVariance -> Var(X)=μVar(X)=μ指数分布（Exponential Distribution）我们再来考虑一下呼叫中心的例子。

想想通话间的时间间隔是多少？指数分布来解决我们的问题。

指数分布对呼叫之间的时间间隔建模。

其他例子：1. 两站地铁到达之间的时间长度2. 到达加油站的时间长度3. 空调的使用寿命指数分布广泛用于生存分析。

从机器的预期寿命到人的预期寿命，指数分布可用来传递这些结果。

随机变量X X服从指数分布，它的PDF 为：f(x)=λeλx,x≥0f(x)=λeλx,x≥0参数λ>0λ>0也叫做速率。

对于生存分析，λλ被称为设备在任何时间t t的故障率，假设它存活到t。

服从指数分布的随机变量X X的均值和方差：Mean -> E(X)=1λE(X)=1λVariance -> Var(X)=(1λ)2Var(X)=(1λ)2此外，速率越大，曲线越下降快，速率越低，曲线越平滑。

下图显示了这一点：为了简化计算，下面给出了一些公式。

P{X≤x}=1−e−λx P{X≤x}=1−e−λx对应于x x左边密度曲线下的面积。

P{X>x}=1−e−λx P{X>x}=1−e−λx对应于x x右侧密度曲线下的面积。

P{x1<X≤x2}=e−λx1−e−λx2P{x1<X≤x2}=e−λx1−e−λx2对应于x1x1和x2x2之间密度曲线下的面积。

三、分布之间的关系伯努利分布和二项分布1. 伯努利分布是二项分布的一个特例，只有一次试验。

2. 伯努利和二项分布只有两种可能的结果，即成功和失败。

泊松分布和二项分布泊松分布是二项分布的极限分布，条件如下：1. 试验次数足够多或者说n n -> ∞∞2. 每次试验成功的概率相同，无穷小或者p p ->03. np=λnp=λ，有限。

正态分布和二项分布& 正态分布和泊松分布正态分布是在以下条件下二项分布的另一种极限形式，条件如下：1. 试验次数无限大n n -> ∞∞2. p p和q q都不是无限小的。

正态分布也是参数λλ-> ∞∞的泊松分布的一个极限情况。

指数分布和泊松分布如果随机事件之间的时间遵循速率为λλ的指数分布，那么长度为t t的时间段内的事件总数遵循具有参数λtλt的泊松分布。

总结概率分布在许多领域都很普遍，即保险学，物理学，工程学，计算机科学甚至社会科学，其中心理学和医学学生广泛使用概率分布。

它有一个简单的应用程序和广泛的使用。

这篇文章强调了在日常生活中观察到的六个重要分布，并解释了它们的应用。

现在你将能够识别，关联和区分这些分布。