常见统计分布及其特点

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【附录一】常见分布汇总

一、二项分布

二项分布(Binomial Distribution),即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果, 如果事件发生的概率就是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率就是。

二、泊松poisson分布

1、概念

当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧10,p≦0、1时,就可以用泊松公式近似得计算。

2、特点——期望与方差均为λ。

3、应用(固定速率出现的事物。)——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布

三、均匀分布uniform

设连续型随机变量X的分布函数F(x)=(x-a)/(b-a),a≤x≤b

则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]。

四、指数分布Exponential Distribution

1、概念

2、特点——无记忆性

(1)这种分布表现为均值越小,分布偏斜的越厉害。

(2)无记忆性

当s,t≥0时有P(T>s+t|T>t)=P(T>s) 即,如果T就是某一元件的寿命,已知元件使用了t 小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。

3、应用

在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果

五、正态分布Normal distribution

1、概念

2、中心极限定理与正态分布(说明了正态分布的广泛存在,就是统计分析的基础)

中心极限定理:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。

3、特点——在总体的随机抽样中广泛存在。

4、应用——正态分布就是假设检验以及极大似然估计法ML的理论基础

定理一:设X1,X2,X3、。。Xn就是来自正态总体N(μ,δ2)的样本,则有

样本均值X~N(μ,δ2/n)——总体方差常常未知,用t分布较多

六、χ2卡方分布(与方差有关)chi-square distribution

1、概念

若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分

布于标准正态分布),则这n个服从标准正态分布的随机变量的平方与构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),其中参数n称为自由度

【注意】假设随机干扰项呈正态分布。因此,卡方分布可以与RSS残差平方与联系起来。用RSS/δ2,所得的变量就就是标准正态分布,就服从卡方分布。

2、卡方分布的特点

(1)分布的均值为自由度 n,记为 E() = n。(这个容易证明)

(2)分布的方差为2倍的自由度(2n),记为 D() = 2n。

(3)如果互相独立,则:(独立可加减)

服从分布,自由度;

服从分布,自由度为

3、图形特点

4、应用

定理二,设X1,X2,X3、。。Xn就是来自正态总体N(μ,δ2)的样本,则有样本均值X~N(μ,δ2/n)

)(χδ1-n ~)1(2

2

2S n -

(1)正态分布以及卡方分布就是F 检验的基础。大量的检验用到了F 检验:F 检验、三大检

验。

七、t 学生分布(用样本方差s 来标准化)——Student's t-distribution 1、概念(适用于δ2未知) 【理解】把样本标准正态化的U 变换前提就是方差已知,但总体方差就是未知的,所以用样本方差来代替总体方差。根据中心极限定理,抽样服从方差为总体方差除以n 的正态分布。 由于在实际工作中,往往σ就是未知的,常用s 作为σ的估计值,为了与u 变换区别,称为t 变换,统计量t 值的分布称为t 分布(u 变换指把变量转换为标准正态分布)

【思考】为什么样本方差比总体方差要小?因为一个就是总体方差,一个就是样本均值的方差。不同 2、特点

1)与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线。

定理三:设X1,X2,X3、。。Xn 就是来自正态总体N(μ,δ2)的样本,则有 样本均值X~N(μ,δ2/n),S 为样本方差

(μ

1-n t ~n /S -X 【注意】S 就是样本方差。中心极限定理说的就是样本均值的

方差。

八、F 分布F-distribution 1、概念

F 分布定义为:设X 、Y 为两个独立的随机变量,X 服从自由度为k1的卡方分布,Y 服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布

2、特点

(1)它就是一种非对称分布;

(2)它有两个自由度,即n1 -1与n2-1,相应的分布记为F( n1 –1, n2-1), n1 –1通常称为分子自由度, n2-1通常称为分母自由度; (3)F 分布就是一个以自由度 与

为参数的分布族,不同的自由

度决定了F 分布的形状。

(4)F 分布的倒数性质:

(5)残差平方与之比通常与F 分布有关。

九、逻辑分布logistic(分类评定模型)——最早应用最广的离散选择模型 1、概念

t e t F -+=11)(

2)1()(t t e e t f --+= t

e t F t F -=-)(1)

(

2、特点

用作增长曲线并为二进制响应建模。在生物统计与经济领域使用。

Logistic 分布由尺度与位置参数描述。Logistic 分布没有形状参数,也就就是说其概率密度函数只有一个形状。

下列图形显示了不同参数值对 Logistic 分布的效应。 尺度参数的效应 位置参数的效应

相关文档
最新文档