第八章其它常用常用统计分布

合集下载

常用统计分布

第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似第三节卡方分布(2χ分布)2χ分布的数学形式·2χ分布的性质、数学期望和方差· 样本方差的抽样分布第四节 F 分布F 分布的数学形式·F 分布的性质、数学期望和方差·F 分布的近似一、填空1．对于超几何分布，随着群体的规模逐渐增大，一般当Nn ≤（）时，可采用二项分布来近似。

2．泊松分布只有一个参数（），只要知道了这个参数的值，泊松分布就确定了。

3．卡方分布是一种（）型随机变量的概率分布，它是由（）分布派生出来的。

4．如果第一自由度1k 或第二自由度2k 的F 分布没有列在表中，但邻近的第一自由度或第二自由度的F 分布已列在表中，对于F α(1k ，2k )的值可以用（）插值法得到。

5．（）分布具有一定程度的反对称性。

6．（）分布主要用于列联表的检验。

7．（）分布用于解决连续体中的孤立事件。

8．2χ分布的图形随着自由度的增加而渐趋（）。

9．当群体规模逐渐增大，以致不回置抽样可以作为回置抽样来处理，这时（）可采用二项分布来近似。

10．（）事件是满足泊松分布的。

二、单项选择1．已知离散性随机变量x 服从参数为λ=2的泊松分布，则概率P （3；λ）＝（）。

A 4/3e 2B 3/3e 2C 4/3e 3D 3/3e 32．当群体的规模逐渐增大，以至于不回置抽样可以作为回置抽样来处理时，（）分布可以用二项分布来近似。

A t 分布B F 分布C 2χ分布 D 超几何分布3．研究连续体中的孤立事件发生次数的分布，如某时间段内电话机被呼叫的次数的概率分布，应选择（）。

A 二项分布B 超几何分布C 泊松分布D F 分布4．对于一个样本容量n 较大及成功事件概率p 较小的二项分布，都可以用（）来近似。

常用21个统计分布总结

Bernoulli ( p ) 伯努利分布说明与例：x 为伯努利试验的结果，当试验成功，则x=1，试验失败则x=0。

可以把伯努利试验理解为抛硬币，x=1为出现正面@ Binomial ( n, p ) 二项分布（图以p=,n=5为例）.说明与例：x是重复n 次的伯努利试验结果，即x=试验成功的次数，可以理解为抛n 次硬币，正面出现的次数。

P X x p | ()p x 1p ()1x ;x 01 , ; 0p 1EXp , Var Xp 1p ()M X t ()1p ()pe t 01xP X x n | p , ()n x ()p x1p ()nxx 012...n , , , , ; 0p 1EX np , Var X np 1p ()M x t ()pe t1p ()[]nMultinomial ( m, p 1, ..., p n ){多项分布图略（因为是联合分布的多维分布）说明与例：多项分布是二项分布的推广，二项分布结果只有两个，而多项分布结果可以有多个，比如仍骰子，x1表示n 次试验点数1出现的次数…x6表示点数6出现的次数。

Geometric ( p )—几何分布（图以p=为例）说明与例：得到一次成功而进行的伯努利试验次数n ，即前面失败了n-1次，第n 次成功。

比如x 可以理解为抛硬币，出现正面所抛的次数&f x 1...x n , , ()m !x 1!...x n !p 1x 1...p n xnm !i 1np i x ix i !ÕP X x p | ()p 1p ()x 1 ; x 12... , , ; 0p 1EX1p, Var X1pp 2M X t ()pe t11p ()et, t log 1p ()-！Hypergeometric 超几何分布!（以N=10,m=5，n=4为例）说明与例：已知N 个总体中有m 个不合格的产品，现在抽取n 个，出现不合格产品的数量。

常见的数学分布

常见的数学分布
常见的数学分布
一. 离散分布
1. 伯努利分布
伯努利分布是研究单个成功/失败事件（二元变量）概率的基本
概率分布，只有两种结果，成功/失败，因此伯努利分布也称为二项
分布。

2. 贝叶斯分布
贝叶斯分布主要用于分析估计连续变量，它是基于贝叶斯概率理论，关于一个未知参数的不确定性状况，以后新的观测信号被观测后，这种参数的不确定性会发生变化。

3. 几何分布
几何分布是离散概率分布的一种，主要用于研究成功/失败事件
发生次数的概率分布，即最少要经历多少次失败才能够获得一次成功。

4. 泊松分布
泊松分布是一种离散概率分布，属于参数为λ的二项分布，也叫泊松二项分布，用来描述一段时间内事件发生次数的概率分布，是一种常用的概率分布。

二. 连续分布
1. 正态分布
正态分布是连续概率分布的一种，也叫高斯分布，是最常用的一类概率分布，可以用来描述不同变量的概率分布情况，它的曲线呈现
出钟形，最大值位于均值处。

2. 对数正态分布
对数正态分布又叫做极大似然估计分布，属于一种连续概率分布，可以用来描述变量值的概率分布情况，表现为对数公式，又称为对数正态分布。

3. t 分布
t 分布是一种特殊的正态分布，也叫做学生的 t 分布，它可以
用来描述变量值的概率分布情况，它的曲线呈现出椭圆形。

4. 卡方分布
卡方分布是一种连续概率分布，常用于统计学分析中，它可以用来描述自由度为 k 的某个统计量的概率分布，其图形呈现出单峰形状。

概率论与数理统计常用的统计分布

n(
)2
X
)2
概率论与数理统计i 1
抽样分布定理最重要的总体： X ~ N (, 2 )
如何由样本 X1, X2,...X n 推断， 2 ？
分析：
对， 2 的推断是通过构造统计量实现的
（1）如何构造“好”的统计量 (X1, X2,...Xn ) （2） g(X1, X2,...Xn ) 服从什么分布？
概率论与数理统计
定理 1 设总体 X ~ N (, 2 ) ， X1, X2,...Xn 是取自 X 的一个样本， X 为该样本的样本均值，则有（1） X ~ N(, 2 / n) （2）U X ~ N (0,1)
/ n
概率论与数理统计
本,则
设 X1, X2 ,, Xn 是来自总体 X ~ N(, 2 ) 的样
❖要求由样本构造一个以较大的概率包含真实参数的一个范围或区间，这种带有概率的区间称为置信区间，通过构造一个置信区间对未知参数进行估计的方法
称为区间估计。
概率论与数理统计
设总体X的分布函数形式已知, 但它的一个或多个参数为未知, 借助于总体X的一个样本来估计总体未知参数的问题称为点估计问题.
Review
F
设 U ~ 2 (n1), V ~ 2 (n2 ) ,且 U ,V 相互独立,令
F
U /n1 V /n2
称 F 服从自由度为 (n1, n2) 的 F 分布，记为 F ~ F (n1, n2).
F(n1, n2 )的上侧分位点记为F (n1, n2 )
O
F (n1 , n2)
抽样分布的途径：（1）精确地求出抽样分布，并称相应的统
在参数估计问题中，假定总体分布形式已知，未知的仅仅是一个或几个参数.

常见统计分布及其特点

附录一常见分布汇总一、二项分布二项分布Binomial Distribution,即重复n次的伯努利试验Bernoulli Experiment,用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是;二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np;通常当n≧10,p≦时,就可以用泊松公式近似得计算;2、特点——期望和方差均为λ;3、应用固定速率出现的事物;——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ或称密度随机且独立地出现时,那么这个事件在单位时间面积或体积内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数Fx=x-a/b-a,a≤x≤b则称随机变量X服从a,b上的均匀分布,记为X~Ua,b;四、指数分布Exponential Distribution1、概念2、特点——无记忆性1这种分布表现为均值越小,分布偏斜的越厉害;2无记忆性当s,t≥0时有PT>s+t|T>t=PT>s 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等;3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布说明了正态分布的广泛存在,是统计分析的基础中心极限定理：设从均值为μ、方差为σ^2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布;3、特点——在总体的随机抽样中广泛存在;4、应用——正态分布是假设检验以及极大似然估计法ML的理论基础定理一：设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n——总体方差常常未知,用t分布较多六、χ2卡方分布与方差有关chi-square distribution1、概念若n个相互独立的随机变量ξ、ξ、……、ξn ,均服从标准正态分布也称独立同分布于标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布chi-squaredistribution,其中参数n称为注意假设随机干扰项呈正态分布;因此,卡方分布可以和RSS残差平方和联系起来;用RSS/δ2,所得的变量就是标准正态分布,就服从卡方分布;2、卡方分布的特点1分布的为自由度 n,记为 E = n;这个容易证明2分布的为2倍的自由度2n,记为 D = 2n;3如果互相独立,则：独立可加减服从分布,自由度；服从分布,自由度为3、图形特点4、应用定理二,设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n1正态分布以及卡方分布是F检验的基础;大量的检验用到了F检验：F检验、三大检验;七、t学生分布用样本方差s来标准化——Student'st-distribution1、概念适用于δ2未知理解把样本标准正态化的U变换前提是方差已知,但总体方差是未知的,所以用样本方差来代替总体方差;根据中心极限定理,抽样服从方差为总体方差除以n 的正态分布;由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布u变换指把变量转换为标准正态分布思考为什么样本方差比总体方差要小因为一个是总体方差,一个是样本均值的方差;不同2、特点1与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高；自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线;定理三：设X1,X2,X3.;;Xn 是来自正态总体N μ,δ2的样本,则有样本均值X~N μ,δ2/n,S 为样本方差）（μ1-n t ~n /S X 注意S 是样本方差;中心极限定理说的是样本均值的方差;八、F 分布F-distribution1、概念F 分布定义为：设X 、Y 为两个独立的随机变量,X 服从自由度为k1的卡方分布,Y 服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布2、特点1它是一种非对称分布；2它有两个自由度,即n1 -1和n2-1,相应的分布记为F n1 –1, n2-1, n1 –1通常称为分子自由度, n2-1通常称为分母自由度；3F 分布是一个以自由度和为参数的分布族,不同的自由度决定了F 分布的形状;4F 分布的性质：5残差平方和之比通常与F分布有关;九、逻辑分布logistic分类评定模型——最早应用最广的离散选择模型1、概念2、特点用作增长曲线并为二进制响应建模;在生物统计和经济领域使用;Logistic 分布由尺度和位置参数描述;Logistic 分布没有形状参数,也就是说其概率密度函数只有一个形状;下列图形显示了不同参数值对 Logistic 分布的效应;尺度参数的效应位置参数的效应Logistic 分布的形状与正态分布的形状相似,但 Logistic 分布的尾部更长;十、伽马分布1、概念——伽玛分布Gamma Distribution是统计学的一种连续概率函数;Gamma分布中的参数α称为形状参数shape parameter,β称为scale parameter;假设随机变量X为等到第α件事发生所需之等候时间, 密度函数为特征函数为伽马分布的可加性当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma数学表达式若随机变量X具有概率密度其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作Gα,β.九、extreme value distribution 极值分布十、DF分布与ADF分布——用于时间序列平稳性的单位根检验;八、pareto分布十、weibull分布。

概率论与数理统计：常用统计分布

0,
x 0, 其它.
F-分布的性质由F分布定义可得：
F
~
F(n1, n2 )
1 F
~
F(n2, n1)
五、F-分布与t分布的关系
定理3 若X～t(n)，则Y=X2～F(1,n)。
证明：X～t(n)，X的分布密度p(x)= n 1 2 nπ n 2
1
x2 n
n 1 2
Y=X2的分布函数F(y) =P{Y<y}=P{X<y}。当y≤0时，FY(y)=0，
② X 与 S2相互独立。
二、χ2-分布(卡方分布)
定义设X1，X2，…，Xn是来自标准正态总体 N(0,1)的样本,称统计量
2
X
2 1
X
2 2
X
2 n
服从自由度为n的 χ2-分布 ,记为 2 ~ 2( n ).
2 (n)-分布的概率密度为
f
(
y
)
2n /
1
2 (
n
/
2
)
y
n 1
2e
服从正态分布，且
i 1
i 1
一、正态分布
定理2 若（ X1, X 2 ,, X n ）是来自总体X ~ N(,2) 的一个
样本，X 为样本均值，则 (1) X ~ N (, 2 ) ，(由上述结论可知：X 的期望与 X 的期望相同，而 X
n
的方差却比 X 的方差小的多，即 X 的取值将更向集中.)
p(y)=0；当y>0时，FY(y) =P{-
，
y
y
n
n 2 1 n
Y=X的分布密度p(y)= 2，•
1 n
2 2
<X<

常用统计分布

X5

X6
~
N (0,4), 则
X3
X4
X5 4

X6
~
N (0,1)
且 X1 X 2 与 X3 X 4 X5 X6 相互独立
2
4
所以( X1 X 2 )2 ( X 3 X 4 X 5 X 6 )2 ~ 2 (2)
2
4
则C1 1 2 ,C2 1 4 .
F0.05 (30,14) 2.31 . 附表5-2
F分布的上分位点具有如下性质 :
证明
F1
( n1 ,
n2 )

F
1 (n2 ,
. n1 )
因为F ~ F (n1, n2 ),
所以 1 P{F F1 (n1 , n2 )}

P
1 F

F1
1 ( n1 ,
则1 F
~
F (n2 , n1 ).
(2)
E(F ) n2 , n2 2
(n2 2),
演示
D(F
)

2n22(n1 n2 2) n1(n2 2)2(n2 4)
,
(n2 4)
(3) 设F ~ F (n1, n2 ),则当n2 4时, 对任意x有
F E(F )
设 X 服从标准正态分布N (0,1), N (0,1) 的上
分位点 u 满足 P{ X u }
1
x2
e 2 dx
2π u
1 P{ X u } 1 (u )
即
(u ) 1 给定 ,由附表2可查得u的值.
u0.05 1.645,

几种常用统计量的分布

P{
χ2
χ
2 a
(n)
}
f
a2 (n)
x dx a
的点χa 2(n)称为 χ2 分布单侧分位点或双侧临界值，如图11-5 所示 .
图11-5
几种常用统计量的分布
定义4
设X ~ N ( ， 2 ) ，样本方差为S 2，则统计量χ2
(n
1)S 2
2
服从自由度为n
1
的χ 2分布，记作
χ2
n
/ n
几种常用统计量的分布
证明
X ~ N ( ， 2 ) ，( X1.，X 2 ，，X n )是来自总体 X 的样本，
X
~
N ( ， 2 )(i 1，2 ，
，n) ，其线性函数 X
1 n
n i 1
Xi
也服从正态分布，即
E X
E1 n
n i 1
Xi
1n E
n i1
Xi
1 n n
(
EX i i 1，2
n) ，
1 n
1
DX
D n
i 1
Xi
n2
n
D Xi
i 1
1 n2 2 (
n2
n
X1 ，X 2 ， X n相互独立) ，
则X ~ N ( ， 2 ) ，故 X ~ N (0 ，1) .
n
/ n
几种常用统计量的分布
例1
解
因为总体 X 服从正态分布N 5 ，9 ，所以 X 服从正态分布N (5 ，9 ) ，故
图11-2
几种常用统计量的分布
显然，f x随着n不同而不同，且f x为偶函数 . 当n 时，有
lim f x

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第三节 X2分布（卡方分布）
X2分布是一种连续型变量的概率分布，它是由正态分布派生出来的，主要用于列联表检验。 1、 X2分布的数学形式 2、 X2分布的性质 3、样本方差的抽样分布
第四节 F分布
F分布是连续型随机变量的另一种重要的小样本分布，它用来检验两个总体的方差是否相等，多个总体的均值是否相等。是方差分析和正交设计的理论基础。 1、 F分布的数学形式 2、 F分布的性质 3、关于F分布的近似
பைடு நூலகம்
第八章其它常用统计分布
第一节超几何分布
超几何分布是一种离散型随机变量的概率分布，适合小群体的研究。 1、超几何分布的数学形式 P（X=x）=H(x;N,N,K)=CKXCn-xn-k/CNn 2、超几何分布的数学期望与方差 3、关于超几何分布的近似
第二节泊松分布
泊松分布是由法国数学家泊松提出。适合于稀有事件的研究。 1、泊松分布的数学形式 2、泊松分布的性质 3、泊松分布的近似

第八章 其它常用常用统计分布

常用统计分布

常用21个统计分布总结

常见的数学分布

概率论与数理统计常用的统计分布

常见统计分布及其特点

概率论与数理统计：常用统计分布

常用统计分布

几种常用统计量的分布

第八章其它常用常用统计分布