概率论中几种常用重要分布
概率论三大分布四大定理

概率论三大分布四大定理概率论是统计学的一个分支,它讨论和研究一些随机事件发生的概率。
它的研究对于进行统计分析和做出经验推断都非常重要。
概率论主要分为三大分布及四大定理。
首先来谈谈三大分布:正态分布、泊松分布和二项式分布。
正态分布又称高斯分布,是一种表征连续随机变量的概率分布,由其特殊的曲线形式,常可以清楚直观地反映出总体中随机变量分布的特点。
它具有平均值、标准差和期望值等参数,常用于描述一般性普适性状。
泊松分布也称为指数分布,这种分布可以用来描述一定时间内发生某类事件的次数。
它具有概率分布函数及期望值、方差等参数,主要应用于线性回归模型中,广泛应用于抽样检验、可靠性分析。
二项式分布是离散随机变量的概率分布,它可以描述试验重复完成某类事情的次数。
它反映的是一系列重复实验中成功次数的概率,具有概率函数及期望值、方差等参数,主要应用于网络设计中,广泛应用于效率分析及统计检验。
接下来让我们来谈谈四大定理:大数定律、中心极限定理、方差定理和期望定理。
大数定律规定,一系列的实验结果的均值越多越接近期望值,它解释了总体均值和样本均值的关系,是概率论中最重要的定理。
中心极限定理指出,在进行大量独立重复实验时,总体随机变量的分布接近正态分布,即随着实验次数的增加,实验结果越来越接近期望值。
方差定理规定,当做一系列实验时,总体方差应越来越小,而样本方差则越来越接近总体方差,这表明样本变量的方差可以代表总体方差。
期望定理定义了实验的期望值的关系,表明总体期望值可以由样本期望值准确估计。
概率论中的三大分布及四大定理是概率研究的基础知识,也是统计分析的基础。
掌握这些基本概念和定理,可以帮助我们理解和深入探讨更多有关概率和统计的主题,从而更好地应用于各种实际领域。
概率论常见的几种分布

概率论常见的几种分布常见的几种概率分布概率论是研究随机现象的数学理论,其中涉及到许多常见的概率分布。
概率分布描述了随机变量在不同取值上的概率分布情况。
本文将介绍几种常见的概率分布,包括均匀分布、正态分布、泊松分布和指数分布。
一、均匀分布均匀分布是最简单的概率分布之一,也被称为矩形分布。
在均匀分布中,随机变量在一定的取值范围内的概率是相等的。
例如,抛一枚公正的硬币,正面朝上和反面朝上的概率都是1/2。
均匀分布通常用于模拟随机数发生器的输出,或者在一定范围内随机选择一个数值。
二、正态分布正态分布是最重要的概率分布之一,也被称为高斯分布。
在正态分布中,随机变量在取值范围内的概率密度函数呈钟形曲线状。
正态分布具有许多重要的性质,例如均值、标准差等。
正态分布在自然界和社会科学中广泛应用,例如身高、体重、考试成绩等都符合正态分布。
三、泊松分布泊松分布描述了单位时间或空间内事件发生的次数的概率分布情况。
泊松分布的特点是,事件之间相互独立且平均发生率恒定。
泊松分布通常用于描述稀有事件的发生情况,例如单位时间内的电话呼叫次数、单位面积内的交通事故次数等。
四、指数分布指数分布描述了连续随机变量首次达到某一值的时间间隔的概率分布情况。
指数分布的特点是,事件之间相互独立且事件发生的概率与时间间隔成反比。
指数分布通常用于模拟随机事件的发生时间间隔,例如单位时间内的电话呼叫间隔、单位距离内的交通事故间隔等。
除了上述几种常见的概率分布外,还有许多其他概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种概率分布都有其特定的应用场景和数学性质,对于不同的问题可以选择适合的概率分布进行建模和分析。
总结起来,概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
这些分布在各自的领域有着广泛的应用,可以帮助我们理解和解决许多随机现象和问题。
对于研究概率论和统计学的人来说,熟悉这些常见的概率分布是非常重要的。
概率论里的分布

概率论里的分布概率论是研究随机事件发生的规律性和概率的一门学科。
在概率论中,分布是指随机变量在不同取值下对应的概率值。
分布可以分为离散型分布和连续型分布两种。
一、离散型分布离散型分布是指随机变量只能取有限个或者无限个离散值的情况下对应的概率分布。
常见的离散型分布包括:1. 伯努利分布:伯努利试验是指只有两种结果的试验,例如抛硬币正反面。
如果事件A发生,则记为1,否则记为0。
伯努利分布就是在这样的试验中,事件A发生的概率为p,不发生的概率为1-p。
2. 二项式分布:二项式试验是指进行n次独立重复实验,每次实验只有两种结果,成功和失败。
每次试验成功的概率为p,失败的概率为1-p。
在这样的试验中,在n次实验中恰好出现k次成功的概率就是二项式分布。
3. 泊松分布:泊松过程是指单位时间内某一事件发生次数服从泊松分布。
例如,在某个城市每小时发生的交通事故次数就可以用泊松分布来描述。
二、连续型分布连续型分布是指随机变量在某一区间内取值的情况下对应的概率分布。
常见的连续型分布包括:1. 均匀分布:均匀分布是指在一个区间内,每个点的概率密度相等。
例如,在[0,1]区间内随机选择一个实数的概率密度就是均匀分布。
2. 正态分布:正态分布也叫高斯分布,它是一种非常重要的概率分布。
正态分布具有钟形曲线,对称轴为均值。
很多自然现象都可以用正态分布来描述,例如人类身高、智商等。
3. 指数分布:指数过程是指在一段时间内某个事件发生的时间间隔服从指数分布。
例如,在某个工厂中设备损坏的时间间隔就可以用指数分布来描述。
以上仅列举了部分常见的离散型和连续型概率分布,还有很多其他类型的概率分布,例如负二项式、卡方、t、F等。
不同类型的概率分布有着不同的特点和应用场景,掌握它们对于理解概率论和统计学都是非常重要的。
概率论与数理统计中的三种重要分布

概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
概率论几种重要的分布

概率论几种重要的分布
概率论中有许多重要的分布,包括以下几种:
1. 正态分布(Normal Distribution):也称为高斯分布,是最常见的分布之一。
它具有钟形曲线,对称,以及均值和方差完全定义。
在许多实际应用中,自然界中许多现象都遵循正态分布。
2. 二项分布(Binomial Distribution):描述了在固定次数的独立重复试验中成功次数的概率分布。
每个试验有两个可能的结果,成功和失败,并且每次试验的成功概率保持不变。
3. 泊松分布(Poisson Distribution):用于描述稀有事件在固定时间或空间上的发生次数的概率分布。
它假设事件发生的概率相等,且事件之间是相互独立的。
4. 均匀分布(Uniform Distribution):也称为矩形分布,是一种概率分布,其中所有可能的结果的概率是相等的。
在定义了一个范围之后,均匀分布将这个范围内的概率均匀地分布。
5. 指数分布(Exponential Distribution):用于描述独立事件发生间隔的概率分布。
它假设事件是以恒定速率独立地发生的,即它具有无记忆性。
6. t分布(Student t-Distribution):用于小样本情况下的统计推断,当样本量较小时,t分布的尾部更加重,与正态分布相比,更容易出现极端值。
以上只是一些重要的分布,概率论还有很多其他的分布,根据实际应用的不同,可以选择合适的分布模型。
概率论中几种常用的重要的分布

伯努利试验、泊松过程、独立同分布生成的重要分布敖登(内蒙古大学数学科学学院2010级数理基地,01008104)摘要本文是一篇读书报告。
主要研究了伯努利试验与二项分布的关系,泊松过程生成泊松分布的过程和在泊松条件下的埃尔朗分布,正态分布的生成用到的独立同分布以及均匀分布生成任意分布的重要性质。
关键词:伯努利试验泊松分布独立同分布均匀分布的生成性Important in theory of probabilitydistribution of explorationAuthor:Ao DengTutor: Luo Cheng (School of Mathematical sciences ,Huhhot Inner Mongolia 01008104 )AbstractThis article mainly discusses the theory of several common distribution (0-1) distribution, binomial distribution, poisson distribution and uniform distribution, exponential distribution, normal distribution and normal distribution out three kinds of important distribution, distribution, distribution and the distribution of the source and the relationship among them and their application in actual.Key words: random variable; The discrete distribution ;Continuous distribution目录第一章伯努利试验生成二项分布 (4)第二章泊松过程生成泊松分布 (6)第三章独立同分布生成正态分布 (13)第四章均匀分布的生成性 (17)第五章几种重要分布的比较及应用 (19)小结 (22)致谢………………………………………………………………………………23. 参考文献…………………………………………………………………………24.第一章 伯努利试验生成二项分布考虑n 重伯努利实验中成功次数ξ.易见ξ的可能值为0,1,2,...,k n =.注意{}k ξ=当且仅当这n 次实验中恰有k 个成功A 与n k -个失败A .先考虑前k 次试验全成功而后n k -次试验全失败这一特殊情形.可得出现这种结果的概率{......}()...()()...()k n k k n k k n k p A A A A P A P A P A P A p q ---==个个个个注意所得结果仅与A 的个数k 有关,与A 出现在哪k 个位置上无关.再者,在这n次试验中选择k 次成功共有n k ⎛⎫⎪⎝⎭种方式,且各种方式两两不相容,故由可加性立得ξ的密度{}k n k n p k p q k ξ-⎛⎫== ⎪⎝⎭, 0,1,2,...,k n =一般地,任给定自然数n 及正数p ,(1)q p q +=,令0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑则(;,)0b k n p 且0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑()1n p q =+=称以{(;,)}b k n p 为密度的离散型分布为二项分布,记作(,)B n p .当1n =时的特例又称作伯努利分布.这是一个两点分布,其密度称阵为01 q p ⎛⎫⎪⎝⎭.上述推导表明,n 重伯努利试验的成功次数ξ服从参数为,n p 的二项分布(,)B n p .下面讨论二项分布的性质,对,考虑比值(;,)(1)(1)1(1;,)b k n p n k n p kb k n p kq kq-++-==+-易见,当(1)kn p +时,(;,)(1;,b k n p b k n p -:而当(1)kn p +时,(;,)(1;,b k n p b k n p -.这说明,对任何固定的参数n 与p ,(;,)b k n p 的值先随k的变大而上升,再随k 的变大而下降,于是必有最大值.如果(1)m n p =+是整数,则(;,)(1;,)b m n p b m n p =-同为(;,)b k n p 的最大值.如果(1)n p +不是整数,则(;,)b k n p 在[(1)]m n p =+处取到最大值(这里[]a 表示不超过a 的整数).我们称使(;,)b k n p 取到最大值的m 为二项分布随机变量的最可能值,或称为n 重伯努利试验的最可能成功次数。
概率论八大分布

概率论八大分布概率论是统计学的一个重要分支,它探究随机变量及其关联性,研究不同的现象的结果和概率分布之间的关系,提供量化的度量工具以确保实际应用的准确性。
概率论八大分布是概率论中应用最为广泛的几个分布,它们提供了研究各种随机现象的基础,影响了大量的现实问题的解决方案,其实质是根据大量试验获得的数据来拟合出不同类型的概率分布。
首先,概率论八大分布中首先涉及的是正态分布。
是一种最常见的概率分布,也称作高斯分布。
正态分布的图形可以表示为一个双峰的曲线,其特点是只有两个参数:均值μ和标准差σ,它可以用来描述平均值的概率密度分布情况,即随机变量的取值可能会靠近均值μ。
其次,另一个重要的概率分布是均匀分布。
均匀分布是一种两个参数(下限a和上限b)的概率分布,这两个参数分别代表了随机变量可能取值的范围,即该变量只能在a和b之间取值,其中每一个结果都有相同的概率。
第三,指数分布是另一种广泛使用的分布,它具有唯一的参数λ,该参数代表了随机变量的变化率。
指数分布的特性是,它可以用来衡量发生某种事件的时间间隔,以及研究受试者遭受某种不利影响的持续时间。
接下来,椭圆分布(又称偏态分布)是一种广泛应用的概率分布,它可以用来描述数据集中对称性差异。
椭圆分布有三个参数:均值μ、标准差σ和偏度γ,其中偏度γ决定了数据集中偏斜程度。
接着,卡方分布是一种常常用来拟合实验数据的分布,它用一个参数k来描述数据的分布形状。
卡方分布是一种双峰分布,它的参数k决定了其双峰形状陡峭程度。
此外,t-分布是一种密度比较大的分布,它是一种卡方分布的变种,但具有更大的连续性。
t-分布有两个参数,即自由度ν和不同的中心值μ,它主要用于检验两个样本之间的差异和单样本的参数估计。
接着,F-分布是t-分布的多变量拓展,如果两个样本是来自不同的总体,那么可以使用F-分布来检验这两个样本的差异。
F-分布的参数为两个自由度,即自由度1和自由度2,它最常用于在两个样本之间检验方差的差异。
概率论与数理统计期末复习重要知识点

概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布:(1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=⎰标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。
其在实际中的应用。
关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。
它是一种“定性”类型的概念。
为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。
称这种变数为随机变数。
本章内将讨论取实值的这种变数—— 一维随机变数。
定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。
它是一个普通的函数。
成这个函数为随机函数X 的分布函数。
有的随机函数X 可能取的值只有有限多个或可数多个。
更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。
称它的分布为离散型分布。
【例1】下列诸随机变数都是离散型随机变数。
(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。
称这种随机变数的分布为退化分布。
一个退化分布可以用一个常数a 来确定。
(2)X 可能取的值只有两个。
确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。
如果([])P X b p ==,那么,([])1P X a p ===-。
因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。
特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。
从而,一个零-壹分布可以用一个在区间(0,1)内的值p 来确定。
(3)X 可能取的值只有n 个:12,...,a a (这些值互不相同),且,取每个i a 值得概率都是1n ,称这种随机变数的分布为离散型均匀分布。
一个离散型均匀分布可以用一个正整数n 及n 个不同的常数12,...,a a 来确定。
定义1.2 若随机变量X 的概率分布为{0}1,{1}P X p P X p ==-== 其中01p ,则称X 服从参数为p 的(0-1)分布。
(0-1)分布是最简单的一种分布,它用于描述只有两个可能结果的试验。
例如,对新生婴儿的性别登记,观察机器是否正常工作,考察一件产品是否为合格品等,均可用(0-1)分布来描述。
定义1.3 若随机变量X 的概率分布为(){}(1),0,1,...,k kn k nX k C p p k n -==-= 其中1n ≥为正整数,01p ,则称X 服从参数为,n p 的二项分布,记作~(,)X B n p由二项分布的导出可知,该种分布用于描述n 重伯努利试验中发生的概率为 p .在研究某事件A 发生的概率时,我们对事件A 所在的试验进行独立重复观察,统计出事件A 发生的次数n μ。
这里n μ是一个随机变量,它就服从二项分布。
另外,一批种子能发芽的个数,一定人群中患某种疾病的人数,某时刻一个城市开着的灯的盏数都可以认为是服从二项分布的。
在二项分布中,如果1n =,那么只能取0或1,这是显然有01p p =-, 1p p =抛掷均匀硬币的例子中,随机变量η 的分布列为它就是(0-1)分布当2p =时的特例。
定义1.4 若随机变量X 的概率分布为{},0,1,2,...!kP X k e k k λλ-===其中0λ为常数,则称X 服从参数为λ的泊松分布,记作~()X P λ.泊松分布是作为二项分布的极限分布而引入的。
事实上,泊松定理表明,当n 很大时,p 很小,np 适中时,(,)B n p 分布就近似于()P λ分布,其中np λ=。
由二项分布描述的内容可知,泊松分布主要用于描述大量独立重复实验中稀有事件发生的次数,所谓稀有事件指概率很小的事件。
由此,纺织品上的疵点数,印刷品中的错字数,某时间段内电话交换台接到的呼叫次数,某时间段内公共汽车站等车的乘客人数等均可用泊松分布来描述。
定理 1.1 (泊松定理) 在n 重贝努力试验中,事件A 在一次实验中出现的概率为n p (与实验总数n 有关),如果当n →∞时,n np λ→(0λ常数),则有lim (;,),0,1,2,...!kn n b k n p e k k λλ-→∞==证明 记n n np λ=,则(;,)(1)kn k n n n n b k n p p p k -⎛⎫=- ⎪⎝⎭(1)...(1)1!kn kn n n n n k k n n λλ---+⎛⎫⎛⎫=- ⎪⎪⎝⎭⎝⎭12111...11!n kk n n k k n n n n λλ--⎛⎫⎛⎫⎛⎫⎛⎫=---- ⎪⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭对于任一固定的k ,显然有lim k k n n λλ→∞=lim 1lim 1nnnn kn knn n n n e n n λλλλλ---→∞→∞⎛⎫⎛⎫-=-= ⎪⎪⎝⎭⎝⎭还有11lim 1...11n k n n →∞-⎛⎫⎛⎫--= ⎪ ⎪⎝⎭⎝⎭从而lim (;,)!kn n b k n p e k λλ-→∞=对任意k (0,1,2,...k =)成立,定理得证。
2 连续性随机变量分布以上对离散型随机变量做了一些研究,下面将要研究另一类十分重要而且常见的随机变量——连续型随机变量定义2.1 若()ξω是随机变量,()F x 是它的分布函数,如果存在函数()p x ,使对任意的,有()()xF x p y dy -∞=⎰则称()ξω对连续型随机变量,相应的()F x 为连续型分布函数,同时称()p x 是()F x 的概率密度函数或简称为密度。
由分布函数的性质即可验证任一连续型分布的密度函数()p x 必具有下述性质:(1)()0p x ≥(2)()1p x dx ∞-∞=⎰定义2.2 若随机变量X 的概率分布为2()22(),(,(0))x a x a σϕσ--=都是常数为密度连续型分布,称这种分布为正态分布,记作2~(,)X N a σ 下面验证()x ϕ是一个密度函数。
因为这时为显然,此外还可以验证有22()2()1x x dx e dx μσϕ--∞∞-∞-∞==⎰为此,可令x y μσ-=,则222()22x y edx edy μσ--∞∞--∞-∞=这时有22222222221212y x y x y edy edx edye dxdyππ∞∞∞----∞-∞-∞+∞∞--∞-∞⎛⎫=⋅⎪⎪⎭=⎰⎰⎰⎰⎰现在作坐标变换cos sin x r y r θθ=⎧⎨=⎩这时,变换的雅可比式J r =,而 22221r r erdr e ∞--∞-∞=-=⎰所以有2222220011122y r edy e rdr d πθππ∞∞---∞⎛⎫⎛⎫==⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎰⎰⎰ 于是()1x dx ϕ∞-∞=⎰这说明给出的的确是一个密度函数,这个密度函数成为正态密度。
正态分布是德国数学家和天文学家棣莫弗于1733 年在求二项分布的渐进公式时得到的. 棣莫弗- 拉普拉斯中心极限定理表明正态分布是二项分布的极限分布. 正态分布2()N μσ,的密度函数曲线是钟型曲线,它的“钟型”特征与实际中很多随机变“中间大,两头小”的分布规律相吻合. 人的各种生理指标,一个班的一次考试成绩,测量的误差等均服从或近似服从正态分布.在许多实际问题中,遇到的随机变数是受到许多互不相干扰的随机因素的影响的,而每个个别因素的影响都不起决定性作用,且这些影响是可以叠加的。
例如,电灯泡的耐用时数(寿命)受到原料,工艺,保管条件等因素的随机变动的影响,而这些因素的波动在正常情况下是互不干扰的,且,每一个都不起决定性作用,又,可以认为是可以叠加的。
在概率论的极限理论中可以证明:具有上述特点的随机变数一般都可以认为服从正态分布。
二项分布,泊松分布和正态分布(或称高斯分布)时概率论中最重要的分布,在实际理论中有着广泛的应用。
本文从三中分布的区别与联系出发,采用实例计算及比较方法,以达到较准确选择合适的分布解决实际问题为目的,对三种分布进行进一步探讨。
一、三种分布的区别1.定义不同:以每个分布的定义为切入点,阐明定义特征。
二项分布B(n,p)、泊松分布P(λ)和正态分布N(μ,σ2)的分布规律分别由它们的参数确定,并且三种分布的数字特征均值及方差是用不同的参数来描述。
因此,区别参数的意义是深刻理解定义的关键。
2.随机变量的取值范围不同:二项分布的随机变量取值是有限个,泊松分布的随机变量取值是无穷可列,它们属于离散型的。
正态分布的随机变量取值无穷不可列,充满某一区间,属于连续型的。
3.适用的条件不同:二项分布用于描述只有“成功”与“失败”两种试验结果的数学模型。
例如:某个学生做n 道数学题,每道题的结果只有“对”与“错”,若每题做对的概率已知,则可利用二项分布求出做对k 道题的概率;泊松分布适用于描绘大量重复试验中稀有事件(飞机意外坠落、高楼突然倒塌等);正态分布用于一个随机变量由大量相互独立的偶然因素之和构成,每个因素所起的作用对总的来说很微小。
例如:某校2002级3000名学生的数学考试分数,受每个学生考分的影响,但每个学生的考试分数对总的分数影响不大,所以,考试分数服从正态分布。
二、三种分布之间的联系尽管三种分布有许多不同点,但它们之间还有着相互的联系。
在n 次贝努力试验中,二项分布的极限是泊松分布,我们可以用二项分布逼近泊松分布。
反之,也可以用泊松分布近似具有较大n 的二项分布,即若已知泊松分布P(λ),可用二项分布B(n,λ/n)去逼近它;若已知二项分布B(n,p),可用泊松分布P(λ)近似二项分布,其理论根据是近似公式:()(1)!k k kn k ne C p p λλκ---≈ (1)这里要求n 较大,p 较小,np λ=。
正态分布是二项分布的极限分布,当n 较大时,可用正态分布近似二项分布,其近似公式为:()(1)k k n k n C p p --≈(2)若~(,)n B n p η,则有12{}n P k k η≤≤≈Φ-Φ (3)从上面可以看到,泊松分布和正态分布都是二项分布的极限分布,在满足一定条件下都能近似二项分布。
在实际中,利用这种关系有时能够带来很多方便,从而简化计算。
三、三种分布在实际中的应用三种分布在实际中有广泛的应用。