拟合优度检验及其应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

拟合优度检验及其应用

辅修专业:经济学 12级法学1班 201210141419 刘金锋摘要:数理统计的两个主要形式就是参数估计和假设检验,在这里,我

们只介绍后者——假设检验,其中又只对假设检验中的拟合优度检验假设作介绍。假设检验根据样本分布族的数学形式已知与否,可分为参数假设检验和非参数假设检验,作为非参数假设检验之一的拟合优度检验,又是检验理论分布假设的重要方法。为了帮助我们更好了解拟合优度检验,本文将首先给我们介绍拟合优度检验的数学定义。其次,重点介绍时下讨论最多的两种

拟合优度方法——2

Pearsonχ检验和Kolmogorov Smirnov

-检验,并穿插具体实例解答来给我们直观的印象,帮助理解。最后,考虑到检验过程会很复杂,本文在最后一节讲述了这两种检验的软件实现,结合实例,编写运行程序。关键词:假设检验;非参数假设检验;拟合优度;2

Pearsonχ检验;

-检验

Kolmogorov Smirno

内容安排

1.拟合优度检验的提出

2.几种常用拟合优度检验介绍

2.1.2

Pearsonχ检验

2.1.1.理论分布完全已知情况

1.随机变量X是离散型

2.理论分布为确定分布

2.1.2.理论分布带有未知参数

2.2.Kolmogorov Smirnov

-检验

2.3.2

Pearsonχ检验与Kolmogorov Smirnov

-检验的比较

3.拟合优度检验实例分析

4.拟合优度检验的软件实现

4.1.2

Pearsonχ检验的软件实现

4.2.Kolmogorov Smirnov

-检验的软件实现

5.参考文献

1.拟合优度检验的提出[1]

假设检验问题就是通过从有关总体中抽取一定容量的样本,利用样本去检验总体分布是否具有某种特性。假设检验问题大致分为两大类:

(1)参数型假设检验:即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖于未知参数(或参数向量)θ,要检验的是有关未知参数的假设。例如,总体X ~N (α,2б), α未知,检验

0010::H a a H a a =↔≠ 或 0010::H a a H a a ≤↔>.

(2)非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如,检验一批数据是否来自某个已知的总体,就属于这类问题。

正如摘要所说,我们在本节只讨论非参数型假设检验问题,常用的非参数假设检验方法有:符号检验、符号秩和检验、秩和检验及Fisher 臵换检验和拟合优度检验。本文又只对拟合优度检验做深入介绍。

拟合优度检验问题的提法如下:设有一个一维或多维随机变量X ,令

1,,n X X …为总体X 中抽取的简单样本,F 是一已知的分布函数。要利用样本1,,n X X …检验假设

0:..H r v X 的分布为F ,

(1.1.1) 其中F 常称为理论分布。

导出这种假设检验的想法大致如下:设法提出一个反映实际数据1,,n X X …与理论分布F 偏差的量1(,,;)n D D X X F =…。如果D 较大,如D C ≥,则认为理论分布F 与数据1,,n X X …不符,因而否定0H 。然而这种“非此即彼”的提法常显得有点牵强。因为一般来说,理论和实际没有截然的符合或不符合。更恰当的提法是实际数据与理论分布符合的程度如何?因此通常对0H 的检验不是以“是”或“否”来回答,而是提供一个介于0和1之间的数字作为回答,即用此数作为符合程度的度量刻画。就具体样本算出D 之值,记为0d 。称下列的条件概率:

000()()p d P D d H =≥|

为在选定的偏离指标D 之下,样本与理论分布的拟合优度。0()p d 越接近1,表示样本与理论分布拟合的越好,因而原假设越可信。反之,它越接近0,则原假设0H 越不可信。如果它低到指定的水平α之下,则就要否定0H 了。

因此,在给定检验水平0<α<1后,根据拟合优度可以给出检验问题的一个检验如下:

当0()p d <α时否定0H ,当0()p d ≥α时接受0H 这种类型的检验称为拟合优度检验。

2.几种常用拟合优度检验介绍

2.1.2Pearson χ检验[1]

2.1.1.理论分布完全已知情况

1.随机变量X 是离散型

设1,,n X X …为从总体X 中抽取的简单样本,理论分布为

121

2

F:r r a a a p p p ⎛⎫ ⎪⎝⎭

其中12,,

,r p p p 已知,且1

1r

i i p ==∑,那么根据拟合优度检验的提法,我们所需检

验的问题就是

0:(),1,2,

,i i H P X a p i r ===

设样本1,,n X X …中等于i a 的个数记为,1,2,

,i v i r =。则i v 称为i a 的观察频数,显

然有1

r

i i v n ==∑,相应的i np 就称为i a 的理论频数(因为n i v /为1,,n X X …中取值为i

a 的频率,频率的极限是i p ,故当n 充分大时有n i v /≈i p ,因此极限情形的理论频

数为i np )。由此可见,我们可以用2

1()r

i i i i v C p n =-∑作为样本与理论分布偏差的一种

度量。在这里,.K Pearson 告诉我们,若取/i i C n p =,则在0H 成立条件下,

2

11

()(,

,;)r

i i n n n i i v np K K X X F np =-==∑ 的极限分布(当n →∞时)为21r -χ。因此有了如下定理:

定理 2.1.1 设n K =2

1

()r

i i i i v np np =-∑,则在0H 成立条件下,当样本容量

n →∞时有

相关文档
最新文档