概率分布间的关系研究
概率论中的二项分布与正态分布的关系

概率论是数学中一个非常重要的分支,研究的是随机事件发生的概率和规律。
而二项分布和正态分布是概率论中两个重要的概率分布,它们之间有着密切的关系。
首先,让我们来看一下二项分布。
二项分布是一种离散型概率分布,描述的是在一系列独立的伯努利试验中成功次数的概率分布。
在每次试验中,我们都有两种可能的结果,通常分别称为成功和失败。
成功的概率记为p,失败的概率记为q,且p+q=1。
而在进行n次独立的伯努利试验后,成功的次数的概率分布就是二项分布。
二项分布的概率质量函数为f(x) = C(n,x) * p^x * q^(n-x),其中C(n,x)是组合数,表示从n次试验中选择x次成功的组合数。
二项分布的期望值为E(x) = n * p,方差为Var(x) = n * p * q。
从这个公式我们可以看出,二项分布的期望值和方差与试验次数n以及成功的概率p有关。
接下来,我们来看一下正态分布。
正态分布是一种连续型概率分布,也被称为高斯分布。
正态分布在自然界中非常常见,例如身高、体重等连续型随机变量就可以用正态分布来描述。
正态分布的概率密度函数为f(x) = (1 / (sqrt(2*pi)sigma)) * exp(-(x-mu)^2 / (2sigma^2)),其中mu是均值,sigma是标准差。
正态分布的均值和方差分别就是mu和sigma的值。
正态分布具有对称性,曲线呈钟形,均值处的概率最高。
那么,二项分布和正态分布之间有何种关系呢?事实上,当试验次数n很大时,二项分布在逼近正态分布。
这是由于中心极限定理。
中心极限定理是概率论中一个非常重要的定理,它表明在一定条件下,独立随机变量之和的分布在试验次数足够大的情况下逼近于正态分布。
具体来说,对于n次独立的伯努利试验,成功的次数之和x满足二项分布B(n,p),当n足够大时,x的分布近似于参数为μ=np,标准差为σ=sqrt(npq)的正态分布N(μ,σ^2)。
这个关系可以通过计算来进行验证。
概率论中几种具有可加性的分布及其关系

目录摘要 (1)关键词 (1)Abstract (1)Key words (1)引言 (1)1 几种常见的具有可加性的分布 (1)1.1 二项分布 (2)1.2 泊松分布(Possion分布) (3)1.3 正态分布 (4)1.4 伽玛分布 (6)1.5 柯西分布 (7)1.6 卡方分布 (7)2 具有可加性的概率分布间的关系 (8)2.1 二项分布的泊松近似 (8)2.2 二项分布的正态近似 (9)2.3 正态分布与泊松分布间的关系 (10)2.4 正态分布与柯西分布、卡方分布及卡方分布与伽玛分布的关系 (11)3 小结 (12)参考文献 (12)致谢 (13)概率论中几种具有可加性的分布及其关系概率论中几种具有可加性的分布及其关系摘要 概率论与数理统计中概率分布的可加性是一个十分重要的内容.所谓分布的可加性指的是同一类分布的独立随机变量和的分布仍属于此类分布.结合其特点,这里给出了概率论中几种具有可加性的分布:二项分布,泊松分布,正态分布,柯西分布,卡方分布以及伽玛分布.文章讨论了各类分布的性质及其可加性的证明,这里给出了证明分布可加性的两种方法,即利用卷积公式和随机变量的特征函数.除此之外,文章就可加性分布之间的各种关系,如二项分布的泊松近似,棣莫佛-拉普拉斯中心极限定理等,进行了不同层次的讨论. 关键词 概率分布 可加性 相互独立 特征函数Several Kinds of Probability Dstribution and its Relationshipwith AdditiveAbstract Probability and mathematical statistics in the probability distribution of additivity is a very important content.The distribution of the so-called additivity refers to the distribution of the same kind of independent random variables and distribution are still belong to this kind of bined with its characteristics, here given several has additivity distribution in probability theory: the binomial distribution, poisson distribution and normal distribution and cauchy distribution, chi-square distribution and gamma distribution.Article discusses the nature of all kinds of distribution and its proof of additivity, additive of proof distribution are also given two methods, namely using convolution formula and characteristic function of a random variable. In addition, this paper the relationships between the additive property distribution, such as the binomial distribution of poisson approximation, Di mo - Laplace's central limit theorem, and so on,has carried on the different levels of discussion. Key Words probability distribution additivity property mutual independence characteristic function引言 概率论与数理统计是研究大量随机现象的统计规律性的学科,在概率论与数理统计中,有时候我们需要求一些随机变量的和的分布,在这些情形中,有一种求和类型比较特殊,即有限个相互独立且同分布的随机变量的和的分布类型不变,这一求和过程称为概率分布的“可加性”.概率分布中随机变量的可加性是一个相当重要的概念,本文给出了概率论中常见的六种具有可加性的分布,包括二项分布,泊松分布,正态分布,伽玛分布,柯西分布和卡方分布.文章最后讨论了几项分布之间的关系,如二项分布的泊松近似,正态近似等等.1 几种常见的具有可加性的分布在讨论概率分布的可加性之前,我们先来看一下卷积公式和随机变量的特征函数,首先来看卷积公式[1]:①离散场合的卷积公式 设离散型随机变量ξζ,彼此独立,且它们的分布列分别是n k a k P k ,1,0,)(⋅⋅⋅===ζ和.,,1,0,)(n k b k P k ⋅⋅⋅===ξ则ξζϑ+=的概率分布列可表示为.2,1,0,)()()(0⋅⋅⋅==-====-==∑∑k b a i k P i P k P i k ki i ki ξζϑ②连续场合的卷积公式 设连续型随机变量ξζ,彼此独立,且它们的密度函数分别是)(),(y f x f ξζ,则它们的和ξζϑ+=的密度函数如下.)()()(dx x z f x f f f z f -⋅=⋅=⎰+∞∞-ξζξζϑ )2(其证明如下:ξζϑ+=的分布函数是dxdy y f x f z f z F zy x )()()()(ξζϑξζ⎰⎰≤+=≤+={}dx x f dy y f xz )()(ζξ⎰⎰+∞∞--∞-=.)()(dx x f x z F ζξ-=⎰+∞∞-其中)(x F ζ为ζ的分布函数,对上式两端进行求导,则可得到ξζϑ+=的密度函数: .)()()(dx x z f x f f f z f -⋅=⋅=⎰+∞∞-ξζξζϑ 即证.在概率分布可加性的证明中,除了卷积公式,我们常用的证明方法还有利用随机变量的特征函数.下面我们来讨论一下这几种具有可加性的分布及其可加性证明的过程中卷积公式和特征函数的应用. 1.1 二项分布1.1.1 二项分布),(p n B 的概念如果记ζ为n 次伯努利试验中成功(记为事件A )的次数,则ζ的可能取值为0,1,2,……,n.记p 为事件A 发生的概率,则,)(p A p =(p A ),1p -=记为.q 即.1p q -=因n 次伯努利试验的基本结果可以记作 ѡ=(w 1,w 2,…ѡn ),w i 或为A 或为A ,这样的w 共有2n 个,这2n 个样本点w 组成了样本空间Ω.下求ζ的分布列,即求事件{ζk =}的概率.若某个样本点 ѡ=(w 1,w 2,…ѡn )∈{k =ζ},意味着w 1,w 2,…ѡn 中有k 个A ,k n -个A ,由独立性即可得:P (ζ).)1(k n k p p --=而事件{ζ=k }中这样的w 共有⎪⎭⎫⎝⎛n k 个,所以ζ的分布列为)(k P =ζ=⎪⎭⎫ ⎝⎛n k p k (1-p )kn -,.,1,0n k ⋅⋅⋅⋅⋅⋅=此分布即称为二项分布,记作),(~p n B ζ.且我们易验证其和恒为.1.也就是概率论中几种具有可加性的分布及其关系kn k nk n k p p -=-⎪⎭⎫ ⎝⎛∑)1(0=[]n p p )1(-+1=. n=1时,二项分布),(p n B 称为两点分布,有时也称之为10-分布. 二项分布的图像具有以下特点:①二项分布的图像形状取决于n 和p 的大小,随着p 的增加,分布图高峰逐渐右移. ②当5.0=p 时,图像是对称的. 1.1.2 二项分布的可加性定理 1.1.1设),,(~),,(~p m B p n B ξζ而且ξζ,相互独立,记,ξζϑ+=则有).,(~p m n B +ϑ证明 因,ξζϑ+=所以易知ϑ可以取m n +⋅⋅⋅2,1,0等1++m n 个值.根据卷积公式)1(,事件{}k =ϑ的概率可以表示为 )()()(0i k P i P k P ki -====∑=ξζϑi k m i k mi k i n i ki n i p p p p +----=-⎪⎭⎫ ⎝⎛⋅-⎪⎭⎫ ⎝⎛=∑)1()1(0.)1(0⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛-=-=-+∑m i k ki n i km n k p p 又因.0⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+-=∑m n k m i k ki n i 所以.,1,0,)1()(m n k p p k P k m n km n k +⋅⋅⋅=-⎪⎭⎫ ⎝⎛==-++ϑ也就是说,).,(~p m n B +ϑ即证! 1.2 泊松分布(Possion 分布)与二项分布一样,泊松分布也是一种离散分布,许多随机现象,特别是社会现象与物理学中的一些随机现象都服从于泊松分布.泊松分布可作为描述大量试验中稀有事件出现次数的概率分布的数学模型. 1.2.1 泊松分布的概率分布列泊松分布的概率分布如下所示: 2,1,0,!)(===-k e k k P kλλζ…,其中λ大于0,记作)(~λζP .对于泊松分布而言,它的参数λ即是期望又是它的方差:λλλλλλλλλλ==-==-+∞=---+∞=∑∑e e k eek kE k k k k11)!1(!)(.又因, λλλλλ-+∞=-+∞=∑∑-==e k kek kE k kkk 1022)!1(!)( =[]λλ-+∞=-+-∑e k k kk )!1(1)1(1=∑∑+∞=--+∞=---+-11222)!1()!2(k k k k k e k eλλλλλλ=λλ+2故ζ的方差为22))(()()(ζζζE E Var -==λλλλ=-+22 1.2.2泊松分布的可加性定理 1.2.1 设随机变量)(~),(~2211λζλζP P ,且21,ζζ相互独立,则).(~2121λλζζ++P 证明 此处⋅⋅⋅=====--,2,1,0,!)(,!)(212211k e k k P ek k P k k λλλζλζ根据卷积公式)1(,有 21)!(!)(2121λλλλζζ---=-⋅==+∑e i k ei k P i k ki iik i ki i k i k k e -=+-∑-=210)()!(!!!21λλλλ .,1,0,!)()(2121⋅⋅⋅=+=+-k e k k λλλλ 所以).(~)(2121λλζζ++P 即证!同样我们可以利用特征函数对其进行证明,此处不再赘述. 1.3 正态分布1.3.1 正态分布的定义[6]定义1.3 对于已经给定的两个常数μ和σ>0,定义函数222/)(,21)(σμσμπσ--=x e x p ),(+∞-∞∈x )1( 它含有两个参数μ和σ.显然的,)(,x p σμ取正值.我们称密度函数为)(,x p σμ的分布为正态分布,记作),(2σμN ,它的分布函数记为dt ex F xt ⎰∞---=222)(,21)(σμσμπσ ),(+∞-∞∈x正态分布的密度函数的图像是一条钟形曲线,中间高两边低,而且关于μ=x 对称,在此处)(,x p σμ取最大值.21πσ我们称μ为该正态分布的中心,在μ=x 附近取值的可能性比较大,在σμ±=x 处有拐点.若将μ固定,改变σ的取值,则σ越大,曲线峰顶越低,图像较为平坦;σ越小,曲线封顶越高,图像较为陡峭.因此正态密度函数的尺度由σ确定,故称σ为尺度参数.同样的,将σ固定,而去改变μ的值,会发现图像沿x 轴平移而并不改变形状,也就说明该函数的位置由μ决定,故称其为位置参数.当1,0==σμ时的正态分布称为标准正态分布,记作)1,0(N .它的密度函数记为)(u ϕ,分布函数记为)(u Φ.则有),(,21)(2/2+∞-∞∈=-u e u u πϕ概率论中几种具有可加性的分布及其关系),(,21)(2/2+∞-∞∈=Φ⎰∞--u dt e u ut π1.3.2 一般正态分布的标准化对于正态分布族{},0),,(;),(2>+∞-∞∈=℘σμσμN标准正态分布)1,0(N 只是其中一个成员.其实在应用中很少有随机变量恰好服从标准正态分布,可是一般正态分布均可以利用线性变换转变成标准正态分布.所以一切与正态变量有关的事件的概率均可通过标准正态分布分布求取.定理1.3.1 如果随机变量),(~σμN Y ,则)1,0(~/)(N Y X σμ-=,其中X 为标准正态变量.证明 记Y 与X 的分布函数分别为)(y F Y 和)(x F X ,易知).()()()(x F x Y P x Y P x X P x F Y X σμσμσμ+=+≤=⎩⎨⎧⎭⎬⎫≤-=≤=因为正态分布函数严格递增而且处处可导,所以如果记Y 和X 的密度函数分别是)(y p Y 和)(x p X ,会有,21)()()(2/2μπσσμσμ-=⋅+=+=e x p x F dx d x p Y Y X 由此即得,).1,0(~N Y X σμ-= 即证.对于标准正态随机变量),1,0(~N X X 的数学期望为,21)(2/2dx xe X E x ⎰+∞∞--=π因被积函数2/2)(x xe x h -=为奇函数,故上述积分值为0,也就是说.0)(=X E而对于一般正态变量),(~2σμN Y ,如果满足X Y σμ+=,由数学期望的线性性质则可得到.0)(μσμ=⨯+=Y E所以我们可以知道正态分布),(2σμN 的数学期望即为其参数μ. 因为dx e x X E X E X Var x ⎰+∞∞--=-=2/222221))(()()(π⎰+∞∞---=)(212/2x e xd π}{⎰+∞∞--∞+∞--+-=dx e xe x x 2/2/22|21π.1221212/2===⎰+∞∞--πππdx e x 且X Y σμ+=,由方差的性质.)()(2σσμ=+=x Var Y Var也就是说,正态分布的方差即是其另一个参数.2σ 1.3.3 正态分布的可加性定理1.3.2 设随机变量而且X 和Y 彼此独立,且),,(~),,(~222211σμσμN Y N X 则有).,(~222121σσμμ+++N Y X证明 知Y X ,服从于正态分布,且它们的密度函数分别是).2exp(),2exp(22222211tt i t t i Y X σμϕσμϕ-=-=又因Y X ,彼此独立,所以)()()(t t t Y X Y X ϕϕϕ=+.)()(exp 2222121⎥⎦⎤⎢⎣⎡+-+=t t i σσμμ这正是数学期望为,21μμ+方差为2221σσ+的正态分布的特征函数,即证!我们同样可以使用连续场合的卷积公式进行证明,详见文献[5],此处不再赘述. 1.4 伽玛分布在讨论伽玛分布之前,我们先来看一下伽玛函数:我们称dx e x x -+∞-⎰=Γ01)(αα )0(>α为伽玛函数,α为其参数.它的性质如下:①;)21(,1)1(π=Γ=Γ②).()1(αααΓ=+Γα取自然数n 的时候,有 !.)()1(n n n n =Γ=+Γ 1.4.1 伽玛分布的定义定义1.4 如果随机变量X 的密度函数为⎪⎩⎪⎨⎧<≥Γ=--,0,0;0,)()(1x x e x x p xλαααλ 就称作X 服从伽玛分布,记为),,(~λαGa X 且λα,的值均大于0.α为伽玛分布的形状参数,λ为其尺度参数.当10<<α时,)(x p 为严格单调递减的函数,在0=x 处取得奇异点;当1=α时,)(x p 亦严格单调减,且0=x 时有;)0(λ=p 当21≤<α时,)(x p 为单峰函数,先上凸然后下凸;当2>α时,先下凸再上凸,最后下凸.而且随着α的增大,)(x p 逐渐接近于正态分布的密度函数.1.4.2 伽玛分布的可加性定理 1.4.1 设随机变量),,(~),,(~21λαλαGa Y Ga X 且X 和Y 彼此独立,则).,(~21λαα++Ga Y X证明 知 ,)1()(,)1()(21ααλϕλϕ---=-=itt it t Y X且X 与Y 彼此独立,所以,)1()()()()(21ααλϕϕϕ+-+-==itt t t Y X Y X此即为)(21αα+Ga 的特征函数,根据惟一性定理则可知).,(~21λαα++Ga Y X 结论得证!概率论中几种具有可加性的分布及其关系如正态分布,对于伽玛分布,我们同样可以利用连续场合的卷积公式对其可加性进行证明,详见文献[5]; 1.5 柯西分布[4]1.5.1 柯西分布的密度函数柯西分布是几个常见的连续分布之一.它的密度函数为).,(,)(1),,(22+∞-∞∈-+=x x x p μλλπμλ0,1==μλ时的柯西分布密度函数称为标准柯西分布密度函数,即).,(,111)(2+∞-∞∈+=x xx p π 为方便起见,往后我们分别记这两类密度函数为),(μλp 和).1,0(p 对于柯西分布的数学期望和方差,因.)(1),,(22+∞=-+⋅=⎰⎰+∞∞-+∞∞-dx x x dx x p x μλλπμλ 所以dx x p x ),,(μλ⎰+∞∞-不收敛,故柯西分布的数学期望与方差均不存在.1.5.2 柯西分布的可加性定理 1.5.1 设随机变量),,(~),,(~2211μλμλp Y p X 且Y X ,彼此独立,则有).,(~2121μμλλ+++p Y X证明 因Y X ,均服从于柯西分布,且Y X ,的特征函数分别是 ,)(11tt i X e t λμϕ-=.)(22tt i Y et λμϕ-=又因Y X ,彼此独立,所以)()()(t t t Y X Y X ϕϕϕ⋅=+.)()(2121tt i e λλμμ+-+=这恰好就是参数为2121,μμλλ++的柯西分布的特征函数,所以).,(~2121μμλλ+++p Y X 即证! 1.6 卡方分布(2χ分布)1.6.1卡方分布(2χ分布)的定义及密度函数定义 1.6[7] 设n X X X ⋅⋅⋅,,21独立同分布与标准正态分布分布),1,0(N 则称222212nX X X +⋅⋅⋅++=χ所服从的分布为自由度为n 的卡方分布,记为).(~22n χχ 卡方分布的密度函数为⎪⎪⎩⎪⎪⎨⎧≤>Γ=--.0,0;0,)2(21)(1222x x x e nx p n x n1.6.2 卡方分布可加性卡方分布密度函数的图像是一个只取非负值的偏态图像.它的图像随着自由度的增加而逐渐趋于对称,当自由度∞→n 时,其图像趋于正态分布的图像.这也从另一个侧面告诉我们,卡方分布是由其自由度决定的,不同的自由度对应了不同的卡方分布.由1.6.1,我们可以知道卡方分布即伽玛分布的一个特例,所以由伽玛分布的可加性我们易知卡方分布亦满足可加性定理,即定理1.6.1[5]设),(~),(~22221n m χχχχ且2221,χχ彼此独立,则有).(~22221n m ++χχχ 证明 由卡方分布的定义,设,,22221222222121n m m m m X X X X X X ++++⋅⋅⋅++=+⋅⋅⋅++=χχ 且,,,2,1),1,0(~n m i N X i +⋅⋅⋅=j i X X ,彼此独立.则有,,22221222212221n m m m m X X X X X X ++++⋅⋅⋅++++⋅⋅⋅++=+χχ从从卡方分布的定义,因此).(~22221n m ++χχχ即证!2 具有可加性的概率分布间的关系2.1 二项分布的泊松近似[4]当n 的取值很大时,二项分布),(p n B 的计算是令人头疼的.这里介绍了泊松分布的一个十分有用的特性,我们可利用泊松分布作为二项分布的一种特殊近似,即二项分布的泊松近似.下面我们来看泊松定理,当n 取值较大,而p 取值偏小的情况下使用泊松定理,可大大减小二项分布的计算量.定理 2.1[8](Possion 定理) 在n 重伯努利试验中,记事件A 在每次试验中发生的概率为,n p 它与试验发生的次数n 有关,若当0>n 时,有,λ→n np 即,lim λ=+∞→n n np 则对任意给定的k (k 为非负整数),有.!)1(lim λλ--+∞→=-⎪⎭⎫ ⎝⎛e k p p kk n n kn n k n证明 设,n n np =λ则有,np nn λ=所以k n n k n k n kn n k n n k k n n n n p p ---+-⋅⋅⋅--=-⎪⎭⎫ ⎝⎛)1()(!)1()2)(1()1(λλ.)1(!)11()21)(11(k n n kn nk n k n n --⋅⋅--⋅⋅⋅--=λλ .)1()1(!)11()21)(11(k n n n kn nn k n k n n ---⋅⋅--⋅⋅⋅--=λλλ 由已知有,,lim λλ=+∞→n n 则对于给定的k 值,有;lim k kn n λλ=+∞→且+∞→n lim 1)11()21)(11(=--⋅⋅⋅--nk n n ; ;)1(lim )1(lim )(λλλλλ--⋅-+∞→+∞→=-=-e nnn nnnn nnn.1)1(lim =--+∞→k nn nλ所以有.!)1(lim λλ--+∞→=-⎪⎭⎫ ⎝⎛e k p p kk n n kn n k n 即证!因Possion 定理的条件之一为,lim λ=+∞→n n np 所以在二项分布的计算中,若n 值很大,p的值却很小,且λ=np 的大小适中时(一般认为当,1.0,100≤≥p n 且10≤=np λ时),二概率论中几种具有可加性的分布及其关系项分布),(p n B 可以使用参数为λ的泊松分布来做近似,即有,2,1,0,!)1(⋅⋅⋅=≈-⎪⎭⎫ ⎝⎛--k e k p p np kk n n kn n k λ此即为二项分布),(p n B 的泊松近似,而且n 的值应尽可能的大,这样计算结果才能更精确.二项分布),(p n B 的泊松近似经常被用于稀有事件(即每次试验中事件发生的概率很小)的研究中,大量实例表明,一般情况下概率1.0<p 时,泊松近似非常好用,甚至n 的取值不必很大. 2.2 二项分布的正态近似定理 2.2[7](棣莫佛-拉普拉斯(De Laplace Moivre -)极限定理) 设随机变量),(~p n B X (⋅⋅⋅=<<,2,1,0,10n p ),则对任意的实数x ,有()).(211lim 2/2x dt e x p np np X P x t n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--+∞→π 证明 因随机变量X 服从二项分布),(p n B ,所以X 可看做是n 个相互独立的且服从于同一参数p 的两点分布的随机变量n X X X ,,,21⋅⋅⋅的和,即,1∑==ni i X X 而且⋅⋅⋅⋅⋅⋅=-==,2,1),1()(,)(i p p X Var p X E i i 根据Levy Lindeberg -中心极限定理,有).(21)1(lim 2/12x dt e x p np np X P x t n i i n Φ==⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤--⎰∑∞--=+∞→π 定理得证! De Laplace Moivre -中心极限定理说明,n 相当大时,服从二项分布),(p n B 的随机变量X 的概率的计算服从正态分布))1(,(p np np N -的随机变量的计算.也就是说,二项分布可以用正态分布来近似计算.比如k n kn k p p k X P --⎪⎭⎫ ⎝⎛==)1()(,在n 比较大的时候的计算量时十分大的.根据De Laplace Moivre -中心极限定理,因 )1(np np npX --近似服从于标准正态分布,或者说是X 近似服从于))1(,(p np np N -分布,也就是说k n k nk p p k X P --⎪⎭⎫⎝⎛==)1()(≈.)1()1(1)1(21)1(2)(2⎪⎪⎭⎫ ⎝⎛---=----p np np k p np ep np p np np x ϕπ 对于,)1()(k n kb k a n k p p b X a P -≤≤-⎪⎭⎫ ⎝⎛=≤≤∑有))1()1()1(()(2121p np npa p np np X p np np a P a X a P --≤--≤--=≤≤ ))1(())1((12p np npa p np np a --Φ---Φ≈ )(* 我们只需查一下标准正态分布表,就可以求出我们需要的相当精确的值.但是,当p 较大或者较小时近似效果可能差一些,利用公式时p 的值最好满足9.01.0≤≤p .另外,因二项分布是离散分布,正态分布是连续分布,所以在我们实际的应用中,为减小误差, 常常使用≈≤≤)(21a X a P ))1(5.0())1(5.0(12p np npa p np np a --+Φ---+Φ来替换)(*式.2.3 正态分布与泊松分布之间的关系[9]由上面的定理2.1和定理2.2我们可以知道,二项分布),(p n B 可以用泊松分布来做近似,同样也可以用正态分布来近似.所以,从某个方面来说,泊松分布与正态分布也具有某种近似的关系,首先我们来看特征函数的连续性定理.定理 2.3.1[11] 分布函数列{})(x F n 弱收敛于分布函数)(x F 的充分必要条件是它的相应的特征函数列{})(t n ϕ收敛于)(x F 的特征函数).(t ϕ定理2.3.2[11] 设随机变量),(~λλP X 则有.21lim 22dt ex X P xt ⎰∞--∞→=⎪⎭⎫⎝⎛<-πλλλλ证明 知λX 服从泊松分布,则λX 的特征函数为.)()1(-=it e e t λλϕ所以λλμλλ-=X 的特征函数是.)(1t i e ti et λλλλψ-⎪⎪⎪⎭⎫ ⎝⎛-=对于任何一个,t 我们有.,1!212∞→⎪⎭⎫⎝⎛+-+=λλολλλt ite ti所以有.,212122∞→-→⎪⎭⎫⎝⎛⋅+-=-⎪⎪⎭⎫ ⎝⎛-λλολλλλt t t i eti因此对于任意的点列,∞→n λ有.)(lim 22t et n n -∞→=λλψ又知22t e-是标准正态分布)1,0(N 的特征函数,因此由连续性定理可以得到,.21lim 22dt ex X P xt n n nn ⎰∞--∞→=⎪⎪⎭⎫ ⎝⎛<-πλλλλ由n λ的任意性,所以有dt ex X P xt ⎰∞--∞→=⎪⎭⎫⎝⎛<-2221lim πλλλλ成立.我们来看泊松分布的正态逼近. 定理2.3.3[8] 对于任意的,21a a <有,21!lim2122/⎰∑-<<-+∞→=a a x k k dx ek e βαλλπλ其中.,21λλβλλα-=-=a a 其证明见文献[8].由前可知,),(p n B 的正态近似与泊松近似的条件是不同的,当p 的取值特别小时,哪怕n 的值不是太大,用泊松分布来近似二项分布也是可以的.但在这种情况下,用正态近似却是不合理的.我们可以想象,若p 值很小,但n 的值也不是太大,则np =λ的值概率论中几种具有可加性的分布及其关系肯定不会很大,而由定理2.3.1,我们可知,此时正态分布就不可能很好的进行泊松近似.2.4 正态分布与柯西分布、卡方分布及卡方分布与伽玛分布之间的关系 首先来看正态分布与柯西分布的关系.定理 2.4.1 设).1,0(~),1,0(~N Y N X 且X 与Y 独立同分布,记Y X Z /=,则)1,0(~N Z .证明 易知Z 的取值范围是),(+∞-∞,所以对于),(+∞-∞∈z ,我们利用商的公式,可以得到⎰⎰∞+∞+∞-⎭⎬⎫⎩⎨⎧+-==0222)1(exp 1)()()(dt z t t dt t t p zt p z p Y X Z π .)1(12z +=π 这正是1,0==μλ时的柯西分布的密度函数,所以结论得证!正态分布与卡方分布的关系如下:定理2.4.2 若随机变量),1,0(~N X 则).1(~22χX定理证明见文献[10].这说明了标准正态分布与自由度为1的卡方分布之间的关系.若().,2,1,1,0~n i N X i ⋅⋅⋅=且i X 彼此独立,记222212nX X X +⋅⋅⋅++=χ,根据卡方分布的定义,我们知2χ服从自由度为n 的卡方分布.对于伽玛分布,当其参数21,2==λαn 时即为自由度为n 的卡方分布,记为).()21,2(2n n Ga χ=3 小结文章第一部分我们讨论了六种具有可加性的分布以及它们的简单性质,上述分布的可加性均可利用卷积公式或者特征函数进行证明.正态分布是概率论中最重要的分布,一般地,如果某个数量指标受到大量随机因素影响,而每一因素起的作用很小,则这个数量指标就近似服从正态分布.在第二部分里研究了二项分布、正态分布与泊松分布的关系,从此处我们可以知道二项分布不仅可以用泊松分布近似,同样也可由正态分布来近似. 参考文献[1] 罗建华.卷积公式的应用注记[J].中南林业科技大学学报,2007年,第27卷,第1期:152页. [2] 李贤平,沈崇生,陈子毅.概率论与数理统计[M].上海:复旦大学出版社,2003.5:221-231. [3]唐玲,徐怀.复合泊松分布和泊松过程的可加性[J].安徽建筑工业学院学报,2007.05:83页. [4] 郭彦.对柯西分布性质的进一步讨论[J].淮阴工学院学报,2005.05:12页.[5] 茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.7:155-160; [6] 王梓坤.概率论基础及应用[M].北京:北京师范大学出版社,1996.3:61-64. [7] 宋立新.概率论与数理统计[M].北京:人民大学出版社,2003.9:176-177.[8]于洋.浅析二项分布、泊松分布和正态分布之间的关系[J].《企业科技与发展》,2008 年第20期:120页.[9]魏宗舒等.概率论与数理统计教程[M].北京:高等教育出版社,1983.10:208-211.[10]孟凡华.浅谈几种概率分布之间的相互关系[J].信阳农专学报,1992年第3卷第2期:63-65.[11]王淑云.特征函数及其应用[J].邯郸学院学报,2008年第18卷第3期:52-56.。
直方图与几率分布念

直方图的绘制方法
01
02
03
04
收集数据
首先需要收集要进行统计分析 的数据。
确定分组
将数据按照一定的规则分成若 干个组,每个组的范围称为一
个箱子或区间。
计算频数
统计每个组内数据值的数量或 出现次数。
绘制条形
模拟数据直方图分析
模拟数据生成
使用随机数生成器模拟一组年龄分布数据,模拟了1000个年龄在 18-60岁之间的人的身高数据。
直方图绘制
同样使用Excel或Python等工具绘制直方图,将身高分为若干个区 间,统计每个区间内的人数。
分析结果
通过直方图可以直观地看出身高的分布情况,发现身高的主要分布区 间和异常值,为后续的统计分析提供基础。
案例比较与讨论
比较分析
比较实际数据和模拟数据的直方图,分析它们的相似性和差异性。
讨论
探讨造成这种差异的原因,如数据来源、样本大小、数据质量等。同时,也可以讨论如何根据分析结果进行进一 步的统计分析或预测。
06
总结与展望
直方图与几率分布的重要意义
直观展示数据分布
直方图能够直观地展示 数据的分布情况,帮助 我们快速了解数据的集 中趋势、离散程度和异 常值。
04
直方图与几率分布的实际应用
在数据分析中的应用
数据可视化
直方图可以用于展示数据的分布情况,帮助分析 者直观地了解数据特征和变化趋势。
数据清洗
在数据分析之前,通过直方图可以初步判断数据 的异常值和缺失值,为数据清洗提供依据。
数据分组
直方图可以用于对数据进行分组,以便进一步分 析不同组别的数据特征和规律。
概率分布经验

概率分布是描述随机事件发生的可能性大小的数学工具。
在现实生活中,许多事件的发生都是随机的,而概率分布就是用来描述这种随机性的数学模型。
本文将从经验的角度出发,探讨概率分布的相关知识。
首先,我们要明确什么是概率分布。
简单来说,概率分布描述了一个随机试验所有可能结果及其对应的概率。
例如,投掷一枚硬币有正面和反面两种可能的结果,每面出现的概率是0.5。
这就是一个简单的概率分布。
其次,概率分布有多种类型。
最常见的有离散概率分布和连续概率分布。
离散概率分布描述的是可数的事件,如抛硬币、抽奖等。
连续概率分布则描述的是连续的事件,如人的身高、体重等。
在实践中,我们常常使用经验概率分布来描述随机试验的结果。
经验概率分布是基于大量重复试验的结果来估计的。
例如,我们可以多次抛硬币,记录正面和反面的出现次数,然后根据这些数据估计硬币正面和反面的真实概率。
此外,概率分布还有着广泛的应用。
在统计学中,概率分布是描述数据分布特性的重要工具。
在决策分析中,概率分布可以帮助我们评估不同方案的风险和不确定性。
在经济学中,概率分布用于描述市场行为、供需关系等经济现象的不确定性。
总之,概率分布作为数学中的一个概念,在描述随机事件、分析不确定性等方面具有广泛的应用价值。
通过深入了解概率分布的相关知识,我们可以更好地理解和分析现实生活中的各种现象,为我们的决策提供有力的支持。
两个相关的高斯分布 和的分布

一、概述在统计学和概率论中,高斯分布(又称正态分布)是一个非常重要且常见的概率分布。
它具有许多重要的数学性质,被广泛应用于自然科学、社会科学和工程领域。
在研究高斯分布的基础上,人们发现了两个相关的高斯分布和的分布的关系,这一关系对于深入理解高斯分布具有重要意义。
二、高斯分布的概念和特点高斯分布又称正态分布,是以数学家卡尔·费迪南德·高斯命名的概率分布。
其概率密度函数具有钟型曲线,均值为μ,标准差为σ,具有独特的对称性和稳定性。
高斯分布在统计学中具有重要应用,能够描述自然界中许多现象的分布规律,如身高、体重、温度等。
三、两个相关的高斯分布1. 独立高斯分布当两个变量X和Y的分布都是高斯分布,并且它们之间是独立的时候,它们的和Z=X+Y也是高斯分布。
具体来说,如果X服从均值为μ1,方差为σ1^2的高斯分布,Y服从均值为μ2,方差为σ2^2的高斯分布,那么Z=X+Y就服从均值为μ1+μ2,方差为σ1^2+σ2^2的高斯分布。
这个结论在实际应用中具有重要意义,例如在信号处理中,当两个信号相加时,如果信号的分布都是高斯分布,那么和信号的分布也是高斯分布,这为信号处理提供了重要的理论基础。
2. 相关高斯分布当两个变量X和Y的分布都是高斯分布,并且它们之间存在一定的相关关系时,它们的和Z=X+Y的分布不再是简单的高斯分布。
具体来说,如果X和Y之间的相关系数为ρ,均值分别为μ1和μ2,方差分别为σ1^2和σ2^2,那么Z=X+Y就服从均值为μ1+μ2,方差为σ1^2+σ2^2+2ρσ1σ2的分布。
这个结论揭示了在实际应用中,如果两个变量之间存在相关关系,它们的和的分布会受到相关系数ρ的影响,这对于数据分析和风险控制具有重要意义。
四、高斯分布和的分布的关系两个相关的高斯分布和的分布的关系是高斯分布理论中的一个重要课题。
在实际应用中,我们经常会遇到需要对多个高斯分布进行求和的情况,因此了解和的分布的特性对于概率分布的计算和应用具有重要意义。
概率与概率分布

第六章概率与概率分布推论统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础的。
通过概率论,可以知道在一定条件下,总体的各种抽样结果所具有的概率特性。
然后,推论统计依据这些概率特性,研究在发生了某种抽样结果的情况下总体参数是什么,或者对社会研究中提出的某种假设进行检定。
学习推论统计必须首先对概率论有所了解。
第一节概率论1.随机现象和随机事件概率是与随机现象相联系的一个概念。
所谓随机现象,是指事先不能精确预言其结果的现象。
随机现象具有非确定性,但内中也有一定的规律性。
例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发现妇女生男生女的可能性几乎一样大,都是0.5,这就是概率。
随机现象具有在一定条件下呈现多种可能结果的特性。
但由于到底出现哪种结果,却又无法事先预言。
因此,人们把随机现象的结果以及这些结果的集合体称作随机事件,简称事件。
当随机事件发生的可能性能用数量大小表示出来时,我们就得到了概率。
在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察)称之为随机试验。
随机试验必须符合以下三个条件:①它可以在相同条件下重复进行;②试验的所有结果事先已知;③每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。
随机试验的每一个可能的结果,称为基本事件(或称样本点);所有可能出现的基本事件的集合,称为样本空间,记为Ω。
随机事件(可记为A、B、C等)如果仅含样本空间中的一个样本点,该事件称为简单事件;随机事件如果含样本空间中的一个以上的样本点,该事件称为复合事件。
换言之,复合事件是样本空间Ω的某个子集。
随机事件有两种极端的情况:一种是必然会出现的结果,称为必然事件;另一种是不可能出现的结果,称为不可能事件。
从样本空间来看,必然事件是由其全部基本事件组成的,可记为S;不可能事件则不含任何基本事件,可记为Φ。
2.事件之间的关系客观事物之间总是存在着一定的关系,随机事件之间也不例外。
概率论中几种常用重要分布

概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。
其在实际中的应用。
关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。
它是一种“定性”类型的概念。
为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。
称这种变数为随机变数。
本章内将讨论取实值的这种变数—— 一维随机变数。
定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。
它是一个普通的函数。
成这个函数为随机函数X 的分布函数。
有的随机函数X 可能取的值只有有限多个或可数多个。
更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。
称它的分布为离散型分布。
【例1】下列诸随机变数都是离散型随机变数。
(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。
称这种随机变数的分布为退化分布。
一个退化分布可以用一个常数a 来确定。
(2)X 可能取的值只有两个。
确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。
如果([])P X b p ==,那么,([])1P X a p ===-。
因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。
特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。
数理统计中几种分布之间的关系

数理统计中有几种常见的概率分布,包括正态分布、泊松分布和指数分布。
这些分布在实际应用中有着重要的意义,它们之间的关系也是数理统计中的一个重要内容。
1. 正态分布正态分布是自然界和社会现象中最常见的分布之一,也被称为高斯分布。
它具有钟形曲线,呈现出中间高、两端低的特点。
正态分布有着许多重要的性质,比如均值和标准差能够完全描述一个正态分布。
在实际应用中,正态分布可以用来描述许多自然现象,比如身高、体重等。
另外,中心极限定理告诉我们,大量独立同分布的随机变量之和的分布趋于正态分布。
2. 泊松分布泊松分布是描述单位时间内随机事件发生次数的概率分布。
它适用于描述少量成功事件在长时间内发生的情况。
泊松分布的参数是平均发生率λ,它决定了事件发生的概率。
泊松分布在实际应用中被广泛运用,比如描述单位时间内接到的通信方式数、一段时间内发生的交通事故数等。
3. 指数分布指数分布是描述事件发生间隔时间的概率分布,它是泊松分布的补充。
指数分布的参数是事件发生率λ,它与泊松分布的参数相互关联。
指数分布常用来描述无记忆性的随机变量,比如设备的寿命、服务时间间隔等。
数理统计中,这三种分布之间存在着密切的联系。
正态分布和泊松分布在一定条件下可以近似互相转化。
当事件发生率λ趋向无穷大时,泊松分布将近似于正态分布。
而在一些特殊情况下,指数分布也可以退化为泊松分布。
这三种分布之间并不是孤立存在的,它们在一定条件下是相互联系、相互激发的。
在我的理解中,这三种概率分布之间的关系可以帮助我们更好地理解和应用概率统计的相关知识。
通过对它们之间关系的深入了解,我们可以更准确地选择合适的分布来描述实际问题,从而提高统计分析的准确性和实用性。
总结起来,正态分布、泊松分布和指数分布是数理统计中常见的概率分布,它们之间存在着密切的联系。
深入理解它们之间的关系有助于我们更好地应用统计学知识,提高数据分析的准确性和实用性。
希望通过本篇文章的阐述,能为读者带来一些启发和帮助。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
,x>0 (λ , α > 0为常数) ,x≤ 0
1
W (λ ,1) = e( λ )
⎧λe− λ x ⎩ 0 ,x>0 ,x≤0
设随机变量 X ~ W (λ ,1) ,则其 p.d . f .为: f ( x ) = ⎨ 此式正说明 X ~ e (λ ) , ∴ W (λ ,1) = e( λ ) 可见,指数分布乃是威布尔分布的特例。
(4) 麦克斯韦分布 → 瑞利分布 麦克斯韦 (Maxwell ) 分布的 p.d. f . 为:
2 − x2 ⎧ x2 α ⎪ 4 e f (x) = ⎨α 3 π ⎪ 0 ⎩
, x > 0(α > 0为参数) ,x≤0
瑞利分布的 p.d . f . 为:
2 ⎧ ⎪2λxe− λ x f (x) = ⎨ ⎪ ⎩ 0
−1 r k − r −r r k−r P{ X = k} = Ckr − = Ckk− = Crk+−(rk − r )−1 p r q k − r 1p q 1 p q
从而负二项分布的分布律可写成:
P{ X = x} = Crx+ x −1 p r q x ( r为正整数, p + q = 1, p , q > 0, x = 0,1, 2, ⋯)
说明:三角分布也正说明了并非所有的分布都具有可加性,均匀分布就是一个例外。
综上所述,得这几个分布之间的关系图如下:
辛普森分布 派生
无记忆性 特性
均匀分布
Y = −α ln X (α > 0)
1
Y = e −λX
指数分布 ⎯⎯ ⎯ ⎯ ⎯→ 威布尔分布
特例
Y = X2
2
Y = X α (α > 0 )
1
均匀分布→ 指数分布
命题:设随机变量 X ~ U (0,1) ,其概率密度为:
⎧1, 0 < x < 1 1 f ( x) = ⎨ ,则 Y = −α ln X ~ e( α )(α > 0) 0 , 其他 ⎩
解: 依题有:
FY ( y)
= P{Y ≤ y} = P{ −α ln X ≤ y} = P{ X ≥ e α } = ∫e −αy f ( x )dx = 1− e
= λ (θ − 1)(其中 lim p = 1)
r →∞
∴ lim p(θ ) = e
r →∞
λ (θ −1 )
而我们知道 e λ (θ −1 ) 是泊松分布的母函数,据唯一性定理知:在 r → ∞ ,且 时,负二项分布渐近泊松分布。 注:
rq → λ 为常数 p
唯一性定理:分布函数 F1 ( x ) 及 F2 ( x) 恒等的充分必要条件为它们的特征函数 ϕ1 ( x ) 及
,x>0 ,x≤ 0
(λ > 0为参数)
2
命题:设随机变量 证明:
X 服从参数为 α 的麦克斯韦分布,则 Y = αX2π 服从参数为 π 的瑞利分布。
FY ( y) = P{Y ≤ y}
= P{ αX2π ≤ y} = P{ X ≤ α πy } = FX (α πy ) ∴ f Y ( y) = FY′ ( y ) = f X (α πy ) ⋅ (α πy )′ =
麦克斯韦分布 ⎯⎯ ⎯→ 瑞利分布
α π
α =2
α =1
e(λ )分布
(图 2)
6
2、与负二项分布有关的一些分布
这一部分涉及的几个分布的简单关系图:
Γ分布 正态分布 ← 负二项分布 → 泊松分布 几何分布 → 指数分布
(图 3) (1)负二项分布渐近泊松分布
负二项分布 ⎯渐近 ⎯ ⎯→ 泊松分布( 条件:r → ∞ , 且
命题:设随机变量 X
~ e(λ ) ,其概率密度为:
2
⎧λ e − λ x f (x) = ⎨ ⎩ 0
,x > 0 ,x≤ 0
则 Y = e − λ X ~ U (0,1) 解:
1 FY ( y) = P{e − λX ≤ y} = P{ X ≥ − 1 λ ln y} = 1 − FX ( − λ ln y )
rq → λ为常数) p
证明: 负二项分布是一种等待时间的分布,它的分布律为:
−1 r k − r P{ X = k} = Ckr − (r 为正整数,p + q = 1, p, q > 0, k = r , r + 1,⋯) 1p q
X 服从负二项分布记作: X ~ NB( r , p)
将负二项分布律作一个等价变换有:
2
∀s , t ≥ 0, 有:
P{ X > s + t X > s} P{ X > s + t , X > s} P{ X > s} P{ X > s + t} = P{ X > s}
=
e − λ ( s+ t ) e−λs = e −λ t = P{ X > t }
=
所谓无记忆性,是说它忘记自己已经生活了 s 年,它再继续生活 t 年以上的概率与新生 儿能生活 t 年以上的概率一样。为此我们通常戏称指数分布是“永远年青”的分布。
σ 2 了。
指数分布的无记忆性 指数分布通常用来描述对某一事件发生的等待时间, 比如, 来客在公共汽车站等车的时 间,灯泡使用寿命(等待用坏的时间) ,电话交换台收到两次呼叫的时间间隔。在离散型分 布中,我们知道,几何分布用来描述伯努利试验中,直到某事件 A 发生为止共进行的试验 次数,如果将每次试验视为经历一个单位时间,那么直到事件 A 发生为止进行的试验次数 可视为直到 A 发生为止的等待时间(离散时间) 。在这个意义上,指数分布可视为离散型情 形的几何分布在连续型情形的推广。 虽然指数分布是威布尔分布的一个特例,但是它与几何分布类似,具有“无记忆性” 的 特性,而这是威布尔分布所没有的性质。 指数分布无记忆性的数学表示为:
2
Y = X α ~ W (λ , α )
1
1
命题:若 X ~ e (λ ) ,则 Y = X α ~ W (λ , α )(α > 0) 证明:
FY ( y) = P{Y ≤ y} = P{ X α ≤ y} = P{ X ≤ y α } = ∫ λe− λ x dx
0
1
yα
∴ f Y ( y) = FY′ ( y ) = λe − λ y ⋅ αy α −1 = λαy α −1 e −λ y ( y > 0)
二、关键词:分布、正态分布、复合、特征函数
三、关系研究 (一)关系分类研究 1、均匀、指数、威布尔、瑞利、麦克斯韦、辛普森这几个分布间关系
这一部分涉及的几个分布间关系的简单图如下:
辛普森分布 ← 均匀分布 ↔ 指数分布 ↔ 威布尔分布 → 瑞利分布 ← 麦克斯韦分布
(图 1) 下面一一进行论证: (1) 均匀分布 ↔ 指数分布
− x ⎧ ⎪ x2 e 2σ 2 若随机变量 X 的 p.d . f .为 f ( x ) = ⎨ σ ⎪ ⎩ 0 参数为 σ 的瑞利分布。
2
, x > 0(其中σ > 0为常数) ,称 X 服从 ,x ≤ 0
2 ⎧ ⎪2λxe−λ x , x > 0 设随机变量 Y ~ W ( λ, 2) ,则其 p.d . f .为: f ( y ) = ⎨ ⎪ ,x≤0 ⎩ 0 可见,随机变量 Y 服从参数为 λ 的瑞利分布,从而命题得证。
其实有以下一般结论: 若 y = G ( x ) 为单调、连续函数,不妨设 G ( x) 单增, x = G − 1 ( y) 为其反函数,又设
ξ ~ U ( 0,1) ,则 Y = G −1 (ξ ) ~ G′( y )
证明: 依题 Y ∈ (−∞ ,+∞) , FY ( y) = P{Y ≤ y} = P{G −1 (ξ ) ≤ y},而由已知 y = G ( x) 为单增 且连续的函数
对其求导得: f Y ( y ) = − f X (− 1 ln y )( − 1 ln y )′ = 1(其中 − λ1 ln y > 0即为0 < y < 1) λ λ
⎧1, 0 < y < 1 ∴ f Y ( y) = ⎨ 其他 ⎩0,
(2) 指数分布 ↔ 威布尔分布
α ⎧ ⎪λαx α −1e − λ x 威布尔分布 W (λ , α ) 的 p.d . f . 为: f ( x ) = ⎨ ⎪ 0 ⎩
4 (α π y ) 2
( α π y )2 α2 2
α3 π
e
−
⋅α 2
π y
= 2π y e −πy ( y > 0)
y ≤ 0 时, f Y ( y) = 0 ;
⎧2π y e −πy ∴ fY ( y ) = ⎨ 0 ⎩
令t =
,y >0 ,y≤ 0
y ,则有:
4
2 ⎧ ⎪2πte− πt fY ( y ) = ⎨ ⎪ ⎩ 0
概率分布间的关系研究
姓名:王斌 06 信息与计算科学 B1 班 专业: 专业:06 指导老师:史及民
一、摘要
随机变量的概率分布是概率论和数理统计教学中最基本的概念,也是随机变量研究的 终极目的。 众多概率分布彼此之间存在着这样那样的联系, 弄清楚这些分布之间的关系对学 习和应用概率论无疑是十分重要的。本文介绍了常见的几种概率分布,例如: χ 2、F、t、 正态 等之间的关系,也列举了一些不常见的分布,如超几何、威布尔等等之间的联系,并对文中 的某些关系进行严格的理论推导与证明,最后还给出了几个应用实例。
∴ P{G −1 (ξ ) ≤ y} = P{ξ ≤ G( y )} = ∫
G ( y)
0
dx = G ( y )