拟合优度检验及其应用

拟合优度检验及其应用
拟合优度检验及其应用

拟合优度检验及其应用

辅修专业:经济学 12级法学1班 201210141419 刘金锋摘要:数理统计的两个主要形式就是参数估计和假设检验,在这里,我

们只介绍后者——假设检验,其中又只对假设检验中的拟合优度检验假设作介绍。假设检验根据样本分布族的数学形式已知与否,可分为参数假设检验和非参数假设检验,作为非参数假设检验之一的拟合优度检验,又是检验理论分布假设的重要方法。为了帮助我们更好了解拟合优度检验,本文将首先给我们介绍拟合优度检验的数学定义。其次,重点介绍时下讨论最多的两种

拟合优度方法——2

Pearsonχ检验和Kolmogorov Smirnov

-检验,并穿插具体实例解答来给我们直观的印象,帮助理解。最后,考虑到检验过程会很复杂,本文在最后一节讲述了这两种检验的软件实现,结合实例,编写运行程序。关键词:假设检验;非参数假设检验;拟合优度;2

Pearsonχ检验;

-检验

Kolmogorov Smirno

内容安排

1.拟合优度检验的提出

2.几种常用拟合优度检验介绍

2.1.2

Pearsonχ检验

2.1.1.理论分布完全已知情况

1.随机变量X是离散型

2.理论分布为确定分布

2.1.2.理论分布带有未知参数

2.2.Kolmogorov Smirnov

-检验

2.3.2

Pearsonχ检验与Kolmogorov Smirnov

-检验的比较

3.拟合优度检验实例分析

4.拟合优度检验的软件实现

4.1.2

Pearsonχ检验的软件实现

4.2.Kolmogorov Smirnov

-检验的软件实现

5.参考文献

1.拟合优度检验的提出[1]

假设检验问题就是通过从有关总体中抽取一定容量的样本,利用样本去检验总体分布是否具有某种特性。假设检验问题大致分为两大类:

(1)参数型假设检验:即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖于未知参数(或参数向量)θ,要检验的是有关未知参数的假设。例如,总体X ~N (α,2б), α未知,检验

0010::H a a H a a =?≠ 或 0010::H a a H a a ≤?>.

(2)非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如,检验一批数据是否来自某个已知的总体,就属于这类问题。

正如摘要所说,我们在本节只讨论非参数型假设检验问题,常用的非参数假设检验方法有:符号检验、符号秩和检验、秩和检验及Fisher 臵换检验和拟合优度检验。本文又只对拟合优度检验做深入介绍。

拟合优度检验问题的提法如下:设有一个一维或多维随机变量X ,令

1,,n X X …为总体X 中抽取的简单样本,F 是一已知的分布函数。要利用样本1,,n X X …检验假设

0:..H r v X 的分布为F ,

(1.1.1) 其中F 常称为理论分布。

导出这种假设检验的想法大致如下:设法提出一个反映实际数据1,,n X X …与理论分布F 偏差的量1(,,;)n D D X X F =…。如果D 较大,如D C ≥,则认为理论分布F 与数据1,,n X X …不符,因而否定0H 。然而这种“非此即彼”的提法常显得有点牵强。因为一般来说,理论和实际没有截然的符合或不符合。更恰当的提法是实际数据与理论分布符合的程度如何?因此通常对0H 的检验不是以“是”或“否”来回答,而是提供一个介于0和1之间的数字作为回答,即用此数作为符合程度的度量刻画。就具体样本算出D 之值,记为0d 。称下列的条件概率:

000()()p d P D d H =≥|

为在选定的偏离指标D 之下,样本与理论分布的拟合优度。0()p d 越接近1,表示样本与理论分布拟合的越好,因而原假设越可信。反之,它越接近0,则原假设0H 越不可信。如果它低到指定的水平α之下,则就要否定0H 了。

因此,在给定检验水平0<α<1后,根据拟合优度可以给出检验问题的一个检验如下:

当0()p d <α时否定0H ,当0()p d ≥α时接受0H 这种类型的检验称为拟合优度检验。

2.几种常用拟合优度检验介绍

2.1.2Pearson χ检验[1]

2.1.1.理论分布完全已知情况

1.随机变量X 是离散型

设1,,n X X …为从总体X 中抽取的简单样本,理论分布为

121

2

F:r r a a a p p p ?? ???

其中12,,

,r p p p 已知,且1

1r

i i p ==∑,那么根据拟合优度检验的提法,我们所需检

验的问题就是

0:(),1,2,

,i i H P X a p i r ===

设样本1,,n X X …中等于i a 的个数记为,1,2,

,i v i r =。则i v 称为i a 的观察频数,显

然有1

r

i i v n ==∑,相应的i np 就称为i a 的理论频数(因为n i v /为1,,n X X …中取值为i

a 的频率,频率的极限是i p ,故当n 充分大时有n i v /≈i p ,因此极限情形的理论频

数为i np )。由此可见,我们可以用2

1()r

i i i i v C p n =-∑作为样本与理论分布偏差的一种

度量。在这里,.K Pearson 告诉我们,若取/i i C n p =,则在0H 成立条件下,

2

11

()(,

,;)r

i i n n n i i v np K K X X F np =-==∑ 的极限分布(当n →∞时)为21r -χ。因此有了如下定理:

定理 2.1.1 设n K =2

1

()r

i i i i v np np =-∑,则在0H 成立条件下,当样本容量

n →∞时有

2

1n r K F -χ

即n K 的分布收敛于自由度为1r -的2χ分布。

按照这一定理,我们可以提出如下检验方法:当n 充分大时,统计量n K 的分布就是21r -χ。于是所需的检验就是

当21()n r K ->χ?时否定0H ,否则就接受0H

正如第一节中所说,对检验问题只给出一个“是”或“否”的结论,有显牵强,

常给出一个拟合优度,方法如下:

记0k 是用一组具体的样本算出的0k 值,计算概率

200010()()()n r p k P K k H P k -=≥|≈χ≥。其中2

1r -χ是自由度为

1r -的2χ变量。0()p k 就称为拟合优度,它是度量样本与理论分布偏离程度的量。若0()p k 较大,表明在0H 成立的前提条件下,出现统计量n K 大于等于0k 是有很大可能的,故可以认为样本数据与理论分布拟合较好。反之,若0()p k 较小,表明在0H 成立的前提条件下,产生0k 或大于0k 的偏差的可能性是很小的,这是个小概率时间,而我们一般认为在一次抽样中,小概率事件不应该发生,故可以认为样本与理论分布不

一致,拟合不好。

2.理论分布为确定分布

这一情形包括两种情形:理论分布为离散型随机变量但取可列个值,以及理论分布为连续分布。

设1,

,n X X 是从总体X 中抽取的简单样本,要检验

0:..H r v X 的分布为F

其中F 是一已知分布,思路是这样的:将实数轴(,)-∞+∞分成r 个子区间。那么

1,,n X X 的取值就只能在这r 个区间中取得。

故又可计算落入不同区间的观察频数i v 。则1

r

i i v n ==∑,而

i

v n

就是频率。这又类似于随机变量是离散型且取有限个不同值的情形,具体做法如下: 第一步,取1r -个常数11,

,r a a -(11,,r a a -的选取必须不能依赖于样本,即

必须事先定好),满足,将实轴(,)-∞+∞分成r (r 选取多大才合适呢,取决于n 大小,一种经验法则认为11,

,r a a -的选择应使理论频数i np 和观察频数(1,2,

,)i v i r =都不

小于

5)个子区间。

1121

21(,),

[

,),,[,),,

j j j r r I a I a a I a a I a -

-=-∞===+∞。

第二步,计算r 个事件在0

H 成立下的概率

1()()(),1,2,,j F j j j p P X I F a F a j r -=∈=-=,显然0()0,()1r F a F a =

=,则我们需要检验的问题转化为0:(),1,2,

,j j H P X I p j r ∈==。

第三步,求出1,,n X X 落入j I ,1,2,,j r =各个区间的观察频数i v 。计算检

验统计量

2

1()r

i i n i i

v np K np =-=∑ 之后的做法与离散型随机变量相同。

2.1.2. 2Pearson χ检验:理论分布带有未知参数的情况

此时要检验的假设是:..r v X 的分布属于一个确定的分布族{}(;)F x θ,令

1,,n X X 为从总体X 中抽取的简单样本,要检验假设

0:H 存在θ,使X 的分布为(;)F x θ

当然,这一假设的检验方法可以由前面一段所讨论的理论分布完全已知情形推广得到。在这里唯一不同的就是所表示出来的理论频数()i np θ是关于θ的未知量,故不能作为检验统计量。因此,要按某种方法将θ用样本1,

,n X X 估计出来,如

1(,,)n X X θθ∧

=是θ的估计值,用θ∧

代替()i np θ中的θ,则可得检验统计量

2

1

(())()()

r

i i n

n

i i v np K K np θθθ∧

*

*∧

=-==∑

Pearson 认为,在0H 成立条件下,则当n →∞时,n K *

的分布依然收敛于21r -χ。但Fisher 后来指出n K *的极限分布的自由度不是Pearson 所认为的1r -,而应是

1r s --(其中s 是未知参数个数,这里就是1s =)。

2.2.经验分布的Kolmogorov Smirnov -检验[2]

如2.1节所述,不管总体分布是什么类型,2Pearson χ检验都可以用,不过对于理论分布是连续型分布时,本小节介绍的Kolmogorov Smirnov -检验效果将更好些,这是因为2Pearson χ检验需要按某种方式分组,因此统计量之值依赖于把(,)-∞+∞分成r 个子区间的具体划分方法,包括r 的选择和区间的位臵。

设..r v X 的分布函数()F x 未知,1,

,n X X 为从F 中抽取的简单随机样本,

0()F x 为给定的某个分布函数,来研究下列检验问题:

00:()()H F x F x =

首先,从样本出发求出()F x 的经验分布函数如下:

1

()(1)0,(),

1,

n k k n

x X k F x X x X n x X +≤???

=<≤??≥?? 1,2,,1

k n =- 其中(1)(2)()n X X X ≤≤

≤是样本1,,n X X 的次序统计量,令检验统计量为

0()()n n x D Sup F x F x -∞<<+∞

=-

n D 常称为()n F x 与0()F x 之间的柯氏距离。我们易知如果0H 成立,则

(l i m 0)1n n P D →∞

=

=。换而言之,如果0H 成立,n 又较大,n D 倾向于小值。如果值

n D 较大,则倾向于否定0H 。其拟合优度的计算公式如下:有了具体样本之后,计算出n D 的具体值0D ,则概率

000()()n p D P D D H =≥|

就是在柯氏距离下,样本1,,n X X 与理论分布0()F x 的拟合优度。

2.3. 2Pearson χ检验与Kolmogorov Smirnov -检验的比较[1]

大体上可以这样说:在总体为一维且理论分布为完全已知的连续分布时,

Kolmogorov Smirnov -检验优于2χ检验。这是因为:1.2Pearson χ统计量之值依

赖于把(,)-∞+∞分成r 个区间的具体方法,包括r 的选择和区间的位臵,柯氏距离0()()n Sup F x F x -则没有这个依赖性。2.一般来说Kolmogorov Smirnov -方法鉴别力强,也就是说,在0F 不是总体X 的分布时,用Kolmogorov Smirnov -方法较容易发现。

另一方面,2Pearson χ检验也有它的优点:1.当总体是多维时,处理方法与一维一样,极限分布的形式也与维数无关;2.尤其重要的是:对于理论分布包含未知参数时,2χ检验容易处理,而Kolmogorov Smirnov -方法处理起来很难。

3.拟合优度检验实例分析

有一组随机数数据①

,但现在不清楚服从哪种分布,现在要求利用拟合优度检验判断这组数据是否服从Poisson 分布(0.05?=),数据如下表: 2 6 10 8 9 3 7 7 3 3 9 6 8 2 3 6 5 6 2 4 4 5 2 2 2 7 5 1 6 6 5 5 4 5 5 7 6 3 6 7 6 4 2 8 5 6 1 7 7 5 2 3 8 3 3 3 10 4 13 4 4 6 7 6 2 4 2 5 4 4 4 2 3 3 6 4 7 3 4 4 1 3 5 3 4 6 4 4 4 10 11 3 5 2 7 5 2 6 10 5

设这组数据是..r v X ,根据题目要求,我们所需要检验的假设为:

0:~H X Poisson 分布()P λ

(1)将上表数据整理得出各个数据出现的频数,列出下表: i a 1 2 3 4 5 6 7 8 9 10

11 13 i v

3 13 15 18

14 15 10 4 2 4

1

1

(2)计算出X ,用X 作为∧

λ的估计

① 通过R 软件的随机数功能生成,但不清楚是不是服从Poisson 分布了

132********

5100

X ∧

?+?+?+4?+5?14+6?15+7?10+8?4+9?2+10?4+11?1+13?λ==

=

则,当参数5∧

λ=λ=,我们可以分别计算出所有观察数i a 对应的概率i p ,利用公式n

i p e

n -λ

λ=!

1

5

150.03368973p e -==1!

2

5

250.08422434p e -==2!

3

5

350.1403739p e -==3!

4

5

450.1754674p e -==4!

5

5

550.1754674p e -==5!

6

5

650.1462228p e -==6!

7

5

750.1044449p e -==7!

8

5

850.06527804p e -==8!

9

5

950.03626558p e -==9!

10

5

1050.01813279p e -==10!

11

5

1150.008242177p e -==11!

13

5

1350.001320862p e -==13!

(3)至此,我们可以计算出检验统计量

2

1

(())()()

r

i i n

n

i i v np K K np ∧

**∧

=-λ=λ=λ∑

13.43746=

根据Fisher 的观点:2

10

~n K *χ 查2χ分布表①

得210(0.05)18.307χ=13.43746>即

2

00010()()(13.43746)0.10.05n p k P K k H P ***=≥|≈χ≥>>

所以接受0H ,即认为这组随机数服从Poisson 分布。

4.拟合优度检验的软件实现②

4.1.2Pearson χ检验的软件实现 同样以上一节的数据为例

1 2 3 4 5 6 7 8 9 10 11 12 13 3 13 15 18 14 15

10

4

2

4

1

1

现在我们运用流行的统计软件—R 软件来实现2Pearson χ检验。 (1)输入数据

X<-1:13;Y<-c(3,13,15,18,14,15,10,4,2,4,1,0,1) (2)计算理论分布

q<-ppois(X,mean(rep(X,Y)));n<-length(Y) p<-c()

p[1]<-q[1];p[n]<-1-q[n-1] for (i in 2:(n-1))

p[i]<-q[i]-q[i-1] (3)作检验

Chisq.test(Y,p=p)

①参见文献[3] 孙山泽.非参数统计讲义.北京大学出版社,2000.203页 ②具体涉及到的函数及程序使用,参见文献[2] 薛毅 陈立萍.统计建模与R 软件.清华大学出版社,2007.226页

4.2.Kolmogorov Smirnov

-检验的软件实现

考虑到Kolmogorov Smirnov

-检验分单样本和双样本检验两种,这里,我们仅仅介绍单样本检验的软件实现

试用Kolmogorov Smirnov

-检验方法检验此设备无故障工作时间的分布是否服从λ=1/1500的指数分布?

输入数据,调用ks.test()函数

X<-c(420,500,920,1380,1510,1650,1760,2100,2300,2350)

ks.test(X,"pexp",1/1500)

分布服从λ=1/1500的指数分布。

限于篇幅的原因,只就2

Pearsonχ检验和单样本的Kolmogorov Smirnov

-检验的软件实现作了简单举例说明,更多拟合优度检验方法的软件实现请参考文献[2]。至此,本文内容基本结束。

5.参考文献:

[1] 韦来生.数理统计.科学出版社,2008.

[2] 薛毅陈立萍.统计建模与R软件.清华大学出版社,2007.

[3] 孙山泽.非参数统计讲义.北京大学出版社2000

应用统计方法课件 2-1

第二章数理统计初步 基本概念 参数估计 假设检验

学习目的 数理统计的内容十分丰富,本章主要介绍它的基本概念、参数估计和假设检验。通过本章的学习应初步掌握用数理统计处理随机现象的基本思想和方法,提高运用数理统计方法分析和解决实际问题能力。

基本要求 1.理解总体、个体、简单随机样本和统计量的概念。 2.了解频率分布表、直方图的作法。 3.理解样本均值、样本方差的概念,掌握根据数据计算样本均值、样本方差的方法。 4.了解产生2χ变量、t变量、F变量的典型模式;理解2χ分布、t分布和F分布的分位数,会查相应的数值表。 5.了解正态总体的某些常用抽样分布,如正态总体样本产生的标准正态分布、2χ分布、t分布、F 分布等。

6.理解参数的点估计、估计量与估计值的概念。掌握矩估计法(一阶、二阶矩)与极大似然估计法。 7.了解无偏性、有效性和一致性(相合性)的概念,并会验证估计量的无偏性、有效性。 8.理解区间估计的概念,会求单个正态总体的均值和方差的置信区间,会求两个正态总体的均值差和方差比的置信区间。 9.理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能发生的两类错误。 10.了解单个和两个正态总体的均值和方差的假设检验。 11.了解总体分布假设的2 检验法,会应用该

重点 1.样本、统计量和估计量等概念的理解。2.矩估计法和极大似然估计法。 3.估计量的评选标准(无偏性、有效性)。4.正态总体的均值和方差的置信区间。 5.假设检验的基本思想方法、步骤及两类错误。 难点 1.统计量和估计量等概念的理解。 2.极大似然估计法的基本思想的理解。 3.统计量的分布及不同情况下临界值的确定。

《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第9章SPSS的线性回归分析 1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore和phy两门成绩体系散点图 步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。 接下来在SPSS输出查看器中,双击上图,打开图表编辑

在图表编辑器中,选择“元素”菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。但回归直线的拟合效果都不是很好。 2、请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。 线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。 3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量的影响显著、哪些不显著。 主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

拟合优度检验及其应用

拟合优度检验及其应用 辅修专业:经济学 12级法学1班 201210141419 刘金锋摘要:数理统计的两个主要形式就是参数估计和假设检验,在这里,我 们只介绍后者——假设检验,其中又只对假设检验中的拟合优度检验假设作介绍。假设检验根据样本分布族的数学形式已知与否,可分为参数假设检验和非参数假设检验,作为非参数假设检验之一的拟合优度检验,又是检验理论分布假设的重要方法。为了帮助我们更好了解拟合优度检验,本文将首先给我们介绍拟合优度检验的数学定义。其次,重点介绍时下讨论最多的两种 拟合优度方法——2 Pearsonχ检验和Kolmogorov Smirnov -检验,并穿插具体实例解答来给我们直观的印象,帮助理解。最后,考虑到检验过程会很复杂,本文在最后一节讲述了这两种检验的软件实现,结合实例,编写运行程序。关键词:假设检验;非参数假设检验;拟合优度;2 Pearsonχ检验; -检验 Kolmogorov Smirno 内容安排 1.拟合优度检验的提出 2.几种常用拟合优度检验介绍 2.1.2 Pearsonχ检验 2.1.1.理论分布完全已知情况 1.随机变量X是离散型 2.理论分布为确定分布 2.1.2.理论分布带有未知参数 2.2.Kolmogorov Smirnov -检验 2.3.2 Pearsonχ检验与Kolmogorov Smirnov -检验的比较 3.拟合优度检验实例分析 4.拟合优度检验的软件实现 4.1.2 Pearsonχ检验的软件实现 4.2.Kolmogorov Smirnov -检验的软件实现 5.参考文献

1.拟合优度检验的提出[1] 假设检验问题就是通过从有关总体中抽取一定容量的样本,利用样本去检验总体分布是否具有某种特性。假设检验问题大致分为两大类: (1)参数型假设检验:即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖于未知参数(或参数向量)θ,要检验的是有关未知参数的假设。例如,总体X ~N (α,2б), α未知,检验 0010::H a a H a a =?≠ 或 0010::H a a H a a ≤?>. (2)非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如,检验一批数据是否来自某个已知的总体,就属于这类问题。 正如摘要所说,我们在本节只讨论非参数型假设检验问题,常用的非参数假设检验方法有:符号检验、符号秩和检验、秩和检验及Fisher 臵换检验和拟合优度检验。本文又只对拟合优度检验做深入介绍。 拟合优度检验问题的提法如下:设有一个一维或多维随机变量X ,令 1,,n X X …为总体X 中抽取的简单样本,F 是一已知的分布函数。要利用样本1,,n X X …检验假设 0:..H r v X 的分布为F , (1.1.1) 其中F 常称为理论分布。 导出这种假设检验的想法大致如下:设法提出一个反映实际数据1,,n X X …与理论分布F 偏差的量1(,,;)n D D X X F =…。如果D 较大,如D C ≥,则认为理论分布F 与数据1,,n X X …不符,因而否定0H 。然而这种“非此即彼”的提法常显得有点牵强。因为一般来说,理论和实际没有截然的符合或不符合。更恰当的提法是实际数据与理论分布符合的程度如何?因此通常对0H 的检验不是以“是”或“否”来回答,而是提供一个介于0和1之间的数字作为回答,即用此数作为符合程度的度量刻画。就具体样本算出D 之值,记为0d 。称下列的条件概率: 000()()p d P D d H =≥| 为在选定的偏离指标D 之下,样本与理论分布的拟合优度。0()p d 越接近1,表示样本与理论分布拟合的越好,因而原假设越可信。反之,它越接近0,则原假设0H 越不可信。如果它低到指定的水平α之下,则就要否定0H 了。

运用SPSS建立多元线性回归模型并进行检验

计量经济学实验报告 一.实验目的: 1、学习和掌握用SPSS做变量间的相关系数矩阵; 2、掌握运用SPSS做多元线性回归的估计; 3、用残差分析检验是否存在异常值和强影响值 4、看懂SPSS估计的多元线性回归方程结果; 5、掌握逐步回归操作; 6、掌握如何估计标准化回归方程 7、根据输出结果书写方程、进行模型检验、解释系数意义和预测; 二.实验步骤: 1、根据所研究的问题提出因变量和自变量,搜集数据。 2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。 3、如果为线性关系,则建立多元线性回归方程并估计方程。 4、运用残差分析检验是否存在异常值点和强影响值点。 5、通过t检验进行逐步回归。 6、根据spss输出结果写出方程,对方程进行检验(拟合优度检验、F检验和t 检验)。 7、输出标准化回归结果,写出标准化回归方程。 8、如果通过检验,解释方程并应用(预测)。 三.实验要求: 研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。详细数据见表: (1)计算出y,x1,x2,x3的相关系数矩阵。 (2)求y关于x1,x2,x3的三元线性回归方程 (3)做残差分析看是否存在异常值。 (4)对所求方程拟合优度检验。 (5)对回归方程进行显著性检验。 (6)对每一个回归系数做显著性检验。 (7)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。 (8)求标准化回归方程。 (9)求当x1=75,x2=42,x3=3.1时y。并给出置性水平为99%的近似预测区间。(10)结合回归方程对问题进行一些基本分析。 四.绘制散点图或样本相关阵 相关性

拟合优度检验的例子

例1.为检验一颗骰子是否有假,重复做60次投掷,记录出现点数,得到如下的一张频数分布表 表4 :骰子的频数分布表 以水平05.0=α检验该骰子是否有假。 解: 记=X 投掷骰子出现的点子数,则X 只取62,1 等6个值,若骰子正常,则各个点数出现都是等可能的,因此可设零假设 6 1:6210===p p p H 其中()i X P p i ==,i =6,1 ,备选假设k H :至少有一61≠i p i (i =6,1 ),X 的取值分成6个子集:{},i i =6,1 。则 2χ统计量为 ()∑∑==-=? ?? ? ?? ?-=6 1 2612 210106 1606160l i l i n n χ 且在0H 下有渐近分布)5(2χ(注意零假设下没有未知参数)。 今计算其观察值

()()()()()()2.1410 1091010810101610 101710106101042 222 222 =-+-+-+ -+ -+-=χ 其p 值可以通过查自由度为5的2x 分布表得到, p ()014.02.1402≈>=H P χ 例2. 为考察儿童智力与营养有无关系,从某地区随机抽取n=950个儿童测试其智力及营养状态。为简单计,营养只取二个状态:好与不好,智力分1至4四个等级,得到如下一张24?的列联表 表5: 儿童智力与营养列联表 对于水平05.0=α,检验营养与儿童智力有无关系。 解: 设零假设0H :营养与智力无关,我们引入一些记号:令1=X , 表营养好,2=X 表营养不好,ij n 为i X =, j Y =的样本个数,.i n 为i X =的样本个数,j n .为j Y =的样本个数,4,3,2,1;2,1==j i 。又记 ()()()j Y P p i X P p j Y i X p p j i ij =======??, ,, 则0H 可等价地表示为

各模型尾部特征分析及拟合优度指标检验

尾部特征分析及拟合优度检验分析 根据前面研究的正态分布、Laplace分布以及广义双曲线(正态逆高斯)分布的各自特征,结合高斯核估计,我们可以利用程序工具绘制出各分布假设条件下的概率密度图与样本的经验密度图(高斯核)进行比较,更直观的观察各分布假设下对样本数据的拟合情况。 一尾部特征分析: 取纳斯达克3027个交易日数据为样本数据,分别绘制出几种分布对样本数据的拟合图以及拟合左尾图 几种分布对样本数据的拟合图(图-1) 几种分布对样本数据的拟合左尾图(图-2) 从图-1看出:Laplace分布和广义双曲线分布几乎和样本纳斯达克的经验密度图(非参数核估计)重合,尖峰、厚尾,图形拟合效果极好,而正态分布的拟合效果较差从图-2看出:Laplace分布和广义双曲线分布基本拟合了纳斯达克的左尾特征,相比高斯核曲线尾部,广义双曲线稍厚,Laplace分布稍薄,而正态分布比经验分布的尾部要薄的多,在正态假设下进行风险价值VaR的度量将大大低估风险。Q-Q图也证明了上面的观点:

正态(图-3) Laplace(图-4)广义双曲线(图-5) 从图中清楚的看出:样本数据对Laplace分布、广义双曲线分布假设下的Q-Q图几乎是一条直线,而正态分布呈明显的“S”型,拟合效果较差,由Q-Q理论知道,前两种分布均能很好的拟合样本数据。 二拟合优度指标分析 下面根据拟合优度检验理论,进一步量化各个分布的拟合指标。常用的检验分布拟合情况的指标,一般用表示样本经验分布F emp(x)与理论分布F tho(x)距离差异指标来衡量。一般常用有Anderson-Darling(ad)距离、FOF距离等等。 为了检验经验分布与理论分布的拟合程度,使用MonteCarlo模拟方法,分别对正态分布、Laplace分布和广义双曲线分布关于FOF距离,在1%、5%和10%的置信水平下模拟出临界值,用临界值来检验样本数据的拟合分布假设。以下是模拟步骤: 1 分别产生3027个符合正态分布、Laplace分布和广义双曲线分布的随机数,产生随机数时的参数为样本数据(纳斯达克)估计出的参数; 2 计算模拟出的随机数的经验分布函数值,理论分布函数值由样本数据估计出的参数决定,计算出一个FOF距离; 3 重复步骤1 2,重复1000组,分别得到1000个FOF距离; 4 将1000个距离降序排列,第1000*1% = 10个数值即为在1%置信区间下的拟合优度临界值,同里得到5%和10%置信水平下的临界值; 5 得到临界值后,然后用纳斯达克收益率数据计算出样本的FOF距离。若样本统计量

多元线性回归模型综合练习题

多元线性回归模型 一、内容提要 本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。 本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。 本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然 χ分布为检验统计原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的2 量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。 二、典型例题分析 例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为36 .0 . + = - 10+ 094 medu fedu .0 sibs edu210 131 .0 R2=0.214 式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

《统计学》练习题(2)答案

《统计学》练习题(2) 1.要检验全国多个地区贫困人口的比例是否一样,适合采用的检验方法是(C)。 A.正态分布检验B.t分布检验 C.2拟合优度检验D.2独立性检验 2.一个社会学者随机抽取3000个家庭,想研究文化程度的高低与离婚率的高低是否有关,适合采用的检验方法是(D)。 A.正态分布检验B.t分布检验 C.2拟合优度检验D.2独立性检验 3.2拟合优度检验主要用于判断(B)。 A.各类别的观察频数是否相等 B.各类别的观察频数与期望频数是否一致 C.各类别的期望频数是否相等 D.各类别的期望频数是否等于观察频数 4.2独立性检验主要用于判断(A)。 A.两个分类变量是否独立 B.两个分类变量各类别的观察频数是否相等 C.一个分类变量各类别的观察频数与期望频数是否相等 D.一个分类变量是否独立 5.对于两个分类变量的多个类别总共抽取200个样本。其中某个单元格所在行的合计频数为80,所在列的合计频数为60。该单元格的期望频数为(A)。 A.24 B.25 C.26 D.27 6.对于两个分类变量的多个类别总共抽取1000个样本。其中某个单元格所在行的合计频数为.200,所在列的合计频数为100。该单元格的期望频数为(B)。 A.10 B.20 C.30D.40 7.2拟合优度检验的原假设是( C)。 A.各类别的期望频数无显著差异 B.各类别的观察频数无显著差异 C.各类别的观察频数与期望频数无显著差异 D.各类别的观察频数与期望频数有显著差异

8.2独立性检验的原假设是(C)。 A.两个变量的期望频数相等B.两个变量的期望频数不相等 C.两个变量独立D.两个变量不独立 9.在使用2检验时,如果仅有两个单元格,单元格的最小期望频数不应小于(A)。 A.5 B.10 C.15 D.20 10.在使用2检验时,如果单元格在两个以上时,期望频数小于 5 的单元格不能超过总格数的(D)。 A.5﹪B.10﹪ C.15﹪D.20﹪ 11.系数的取值范围是(B)。 A.0<<1 B.0≤≤1 C.>0 D.<0 12.2独立性检验主要用于研究(A)。 A.两个分类变量的关系 B.两个数值型变量的关系 C.一个分类变量和一个数值型变量的关系 D.两个数值型变量的分布 13.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 男学生女学生合计 赞成45 42 87 反对105 78 183 合计150 120 270 这个表格是(B)。 A.4×4列联表B.2×2列联表 C.2×3列联表D.2×4列联表 14.根据第13题列联表计算的男女学生赞成上网收费的期望频数分别为(A)。 A.48和39 B.102和81 C.15和14D.25和19 15.根据第13题列联表计算的男女学生反对上网收费的期望频数分别为(B)。

拟合优度检验及其应用

拟合优度检验及其应用 许某某,数学与计算机科学学院 摘要:数理统计的两个主要形式就是参数估计和假设检验,在这里,我 们只介绍后者——假设检验,其中又只对假设检验中的拟合优度检验假设作 介绍。假设检验根据样本分布族的数学形式已知与否,可分为参数假设检验 和非参数假设检验,作为非参数假设检验之一的拟合优度检验,又是检验理 论分布假设的重要方法。为了帮助我们更好了解拟合优度检验,本文将首先 给我们介绍拟合优度检验的数学定义。其次,重点介绍时下讨论最多的两种 拟合优度方法——2 Pearsonχ检验和Kolmogorov Smirnov -检验,并穿插具体 实例解答来给我们直观的印象,帮助理解。最后,考虑到检验过程会很复杂, 本文在最后一节讲述了这两种检验的软件实现,结合实例,编写运行程序。 关键词:假设检验;非参数假设检验;拟合优度;2 Pearsonχ检验; -检验 K o l m o g o r o v S m i r n o Goodness-of-fit testing and its application Moumou_Xu, Mathematics and computer science institute Abstract:parameter estimation and hypothesis testing are the main contents of mathematical statistics, here, we only study the latter——hypothesis testing, our key point is goodness-of fit testing. As is known to us, according to whether the mathematical form of sample non-normal distribution is known or not, hypothesis testing contains parameters fake check and nonparameters fake check. Goodness-of fit testing, one of nonparameters fake check, is the important way to test theoretical distribution’hypothesis. To help us understand The goodness of fit better, first of all, this article will tell us the mathematical definition of The goodness of fit. Secondly, two methods, which are talked widely, would be introduced. They are 2 Pearsonχtesting and Kolmogorov Smirnov -testing. A special example will leave us direct impression and help us to manage the way. At last,because of the complex testing process,it is necessary to tell how to use the statistical software to solve the https://www.360docs.net/doc/795865670.html,bining with specific example,we get the program. Key words: hypothesis testing; nonparameters fake check ; goodness of fit; 2 Pearsonχtesting;Kolmogorov Smirnov -testing

非参数假设检验及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

数据分析及其应用软件习题

《数据分析及其应用软件》习题 姓名__ 学号_ _ _成绩 习题1:出钢时所用盛钢水的钢包,因钢水对耐火材料的侵蚀,容积不断增大 我们希望找出使用次数与增大的容积之间的关系,试验数据如下: 写出分析报告(内容包括以下四点) 1. 用双曲线1/y = a+b/x 作曲线拟合:(1)画出散点图, (2 )写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05) 2. 用指数曲线y = ae b/x 作曲线拟合: (1)画出散点图, (2)写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05) 3. 比较两种曲线后,写出较优的曲线回归方程. 4. 使用较优的曲线回归方程预测当使用次数为17次时钢包的容积增大多少? 习题2:1.研究货运总量Y (万吨)与工业总值1X (亿元)、农业总产值2 X (亿元)、居民非商品支出3X (亿元)的关系。数据见下表

(1)计算出 321,,,X X X Y 的相关系数矩阵; (2)求Y 关于321,,X X X 的三元线性回归方程; (3)对所求得的回归方程作拟合优度检验; (4)对回归方程做显著性检验; (5)对每一个回归系数做显著性检验; (6)如果有的回归系数没有通过显著性检验,将其剔除。 重新建立回归方程,再作回归方程的显著性检验和回归系数显著性 检验; (7)求出每一个回归系数的之置信水平为95%的置信区间; (8)求出标准化回归方程; (9)求当01X =75,02X =42,03X =3.1时的0Y 值,给定置信水平为99%, 用SPSS 软件计算精确置信区间,用手工计算近似预测区间; (10)结合回归方程对问题作一些基本分析。 习题3:为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3 类,指标及原始数据如下表。利用费歇线性判别函数,判定另外4个待判样品属于哪一类? 某地区人口死亡状况指标及原始数据表 组别 序 号 1X = 0岁组 死亡概率 2X =1岁组 死亡概率 3X = 1 0岁 组死亡概率 4X =55岁 组死亡概率 5X =80岁 组死亡概率 6X =平均 预期寿命 第一组 1 34.16 7.44 1.12 7.87 95.19 69.30 2 33.06 6.34 1.08 6.77 94.08 69.70 3 36.26 9.24 1.04 8.97 97.30 68.80 4 40.17 13.45 1.43 13.88 101.20 66.20 5 50.06 23.03 2.83 23.74 112.52 63.30 第二组 1 33.24 6.24 1.18 22.90 160.01 65.40 2 32.22 4.22 1.06 20.70 124.70 68.70

卡方拟合优度检验正态分布

某医生测得某校120名高三男生血红蛋白值(g/gL),其均数是X=14.5,标准差S=1.2,各组段值及频数表如下所示,拟推断该资料是否服从正态分布。 X(1)人数f(2) 11.0~ 1 11.5~ 1 12.0~ 3 12.5~ 8 13.0~ 12 13.5~ 15 14.0~ 19 14.5~ 23 15.0~ 12 15.5~ 12 16.0~ 9 16.5~ 3 17.0~ 2 合计120

X (1) 人数f (2) Z 值 Φ(Z i ) Φ(Z i ) T 2 ()A T T - 11.0~ 1 -2.92 0.0018 0.0062 0.528 - 11.5~ 1 -2.5 0.0062 0.0018 1.512 - 12.0~ 3 -2.08 0.0188 0.0475 3.444 0.043 12.5~ 8 -1.67 0.0475 0.1057 6.984 0.148 13.0~ 12 -1.25 0.1057 0.2033 11.712 0.007 13.5~ 15 -0.83 0.2033 0.3372 16.068 0.071 14.0~ 19 -0.42 0.3372 0.5 19.536 0.015 14.5~ 23 0.00 0.5 0.6628 19.536 0.614 15.0~ 12 0.42 0.6628 0.7967 16.068 1.030 15.5~ 12 0.83 0.7967 0.8944 11.724 0.006 16.0~ 9 1.25 0.8944 0.9525 6.972 0.590 16.5~ 3 1.67 0.9525 0.9812 3.444 0.000 17.0~ 2 2.08 0.9812 0.9938 1.512 - 合计 120 — — 2.524 2 2 () 2.524A T T c -= =? n =10-1-2=7

计量经济学习题及答案 )

计量经济学习题 一、名词解释 1、普通最小二乘法:为使被解释变量的估计值与观测值在总体上最为接近使Q= 最小,从而求出参数估计量的方法,即之。 2、总平方和、回归平方和、残差平方和的定义:TSS度量Y自身的差异程度,称为总平方和。TSS除以自由度n-1=因变量的方差,度量因变量自身的变化;RSS度量因变量Y 的拟合值自身的差异程度,称为回归平方和,RSS除以自由度(自变量个数-1)=回归方差,度量由自变量的变化引起的因变量变化部分;ESS度量实际值与拟合值之间的差异程度,称为残差平方和。RSS除以自由度(n-自变量个数-1)=残差(误差)方差,度量由非自变量的变化引起的因变量变化部分。 3、计量经济学:计量经济学是以经济理论为指导,以事实为依据,以数学和统计学为方法,以电脑技术为工具,从事经济关系与经济活动数量规律的研究,并以建立和应用经济计量模型为核心的一门经济学科。而且必须指出,这些经济计量模型是具有随机性特征的。 4、最小样本容量:即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限;即样本容量必须不少于模型中解释变量的数目(包扩常数项),即之。 5、序列相关性:模型的随机误差项违背了相互独立的基本假设的情况。 6、多重共线性:在线性回归模型中,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。 7、工具变量法:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。这种估计方法称为工具变量法。 8、时间序列数据:按照时间先后排列的统计数据。 9、截面数据:发生在同一时间截面上的调查数据。 10、相关系数:指两个以上的变量的样本观测值序列之间表现出来的随机数学关系。 11、异方差:对于线性回归模型提出了若干基本假设,其中包括随机误差项具有同方差;如果对于不同样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。 12、外生变量:外生变量是模型以外决定的变量,作为自变量影响内生变量,外生变量决定内生变量,其参数不是模型系统的元素。因此,外生变量本身

习题八假设检验答案

习题八 假设检验 一、填空题 1.设12,,...,n X X X 是来自正态总体的样本,其中参数2,μσ未知,则 检验假设0:0H μ=的t -t -检验使用统计量t 2.设12,,...,n X X X 是来自正态总体的样本,其中参数μ未知,2σ已知。要检验假设0μμ=应用 U 检验法,检验的统计量是 U =0H 成立时 该统计量服从N (0,1) 。 3.要使犯两类错误的概率同时减小,只有 增加样本容量 ; 4 . 设12,,...,n X X X 和12,,...,m Y Y Y 分别来自正态总体2~(,)X X X N μσ和2~(,)Y Y Y N μσ,两总体相互独立。 (1)当X σ和Y σ已知时,检验假设0:X Y H μμ=所用的统计量为 U =0H 成立时该统计量服从 N (0,1) 。 (2)若X σ和Y σ未知,但X Y σσ= ,检验假设0:X Y H μμ=所用的统计量 为 X Y T = ;当0H 成立时该统计量服从 (2)t m n +- 。 5.设12,,...,n X X X 是来自正态总体的样本,其中参数μ未知,要检验假设 22 00:H σσ=,应用 2χ 检验法,检验的统计量是 222 0(1)n S χσ-= ;当0H 成 立时,该统计量服从 2(1)n χ- 。 6.设12,,...,n X X X 和12,,...,m Y Y Y 分别来自正态总体2~(,)X X X N μσ和2~(,)Y Y Y N μσ,两总体相互独立。要检验假设220:X Y H σσ=,应用 F 检验法,检 验的统计量为 22X Y S F S = 。

计量经济学第3章例题

第3章例题 数据如下 Y X1 X2 137.16 1181.4 115.96 124.56 1375.7 133.35 107.91 1501.2 128.21 102.96 1700.6 124.85 125.24 2026.6 122.49 162.45 2577.4 129.86 217.43 3496.2 139.52 253.42 4283 140.44 251.07 4838.9 139.12 285.85 5160.3 133.35 327.26 5425.1 126.39 (1)根据经济理论和对实际情况的分析可知,城镇居民人均全年耐用消费品支出依赖于人均全年可支配收入X1和耐用消费品价格指数X2的变化。由Eview软件得出: 点击“views”下“representation”,结果如下: Estimation Command: ===================== LS Y C X1 X2

Estimation Equation: ===================== Y = C(1) + C(2)*X1 + C(3)*X2 Substituted Coefficients: ===================== Y = 158.5398355 + 0.04940379666*X1 - 0.911684216*X2 残差平方和为:Sum squared resid=3270.001 所以 22 3270.001 408.75011 8 i e n k σ∧= = =--∑ 从而可得回归标准差为 20.2176σ∧ == 由图可得回归标准差为 S .E .of regression=20.21757 点击“views ”下“actual 、fitted 、resides ”下的“actual 、fitted 、resides graph ”,结果如下: (2)经济意义检验 10.0494,β∧ =表示城镇居民全年人均耐用消费品支出随着可支配收入的增长而增加,并且介 于0和1之间,因此该回归系数的符号,大小都与经济理论和人们的经验期望值相符合; 20.9117β∧ =-。表示城镇居民全年人均耐用消费品支出随着耐用消费品价格指数的降低而

参数估计假设检验练习题

第三章 假设检验例子 例1:某糖厂用自动打包机装糖。已知每袋糖的重量(单位:千克)服从正态分布()2~,X N μσ。今随机抽查9袋,称出它们的重量并计算得到*48.5, 2.5x s ==。取显著性水平0.05α=。在下列两种情形下分别检验()01:50 :50H H μμ=≠ 22(1) 4 (2)σσ=未知 解: ()( )2*01220.975 12 ~,48.5, 2.5,9,0.05:50 :50(1) 4 (2)(1) 2.25 1.96 2.25 1.96X N x s n H H u u u αμσαμμσσ- =====≠======>糖的重量,现在已知显著性水平,在两种情形下检验:未知 解:计算检验统计量的观测值 临界值,因为,所以拒绝原假设 即不能认为糖的重量50的平均值是千克,即打包机工作不正常。 ()( )()()2*0120.97512 ~,48.5, 2.5,9,0.05:50 :50(2) 1.818 2.306 1.8 2.306X N x s n H H t t n t αμσαμμσ- =====≠===-==<糖的重量,现在已知显著性水平,在两种情形下检验:未知 解:计算检验统计量的观测值 临界值,因为,所以不能 拒绝原假设,即不能认为打包机工作不正常。 例2:在上题中,试在显著性水平0.1α=下检验()2201: 4 :4H H σσ=> () ()()()*2201*2 22 02210.948.5, 2.5,9,0.1: 4 :4112.5 1813.36212.513.362. x s n H H n s n αασσχσχχ-=====>-= =-==<显著性水平,解:计算检验统计量的观测值 临界值,因为,所以不能拒绝原假设,即不能认为打包机工作不正常 例3:监测站对某条河流每日的溶解氧(DO )质量浓度记录了30个数据,并由此算得 2.52, 2.05x s ==。已知这条河流的每日DO 质量浓度服从()2,N μσ,试在显著性水平0.05α=下检验()01: 2.7 : 2.7H H μμ=≠。

13 拟合优度检验

13 拟合优度检验 教学目标 ● Pearson 的思想 ● 2χ-分布的特征 ● 拟合优度检验(对一组观察频数与期望分布进行比较) ● 2χ-拟合检验法用于独立性检验(确定两种分类标准是否相关) 在前面的章节我们讨论的是间隔尺度或比率尺度的数据的检验问题. 我们对单总体均值和两总体均值进行假设检验. 对于这些检验, 我们假定其总体服从正态分布. 我们知道名义尺度数据是“级别最低”或最初级的数据. 对于这种度量类型的数据, 可以分成若干个类, 这些类是没有自然顺序的. 本讲将讨论适用于名义尺度数据的检验. 在数理统计学中, 这类检验属于非参数检验. 它所研究的是如何用子样去拟合母体的分布, 其方法主要 有2 χ-拟合检验法和Kolmogorov 检验法等. 本讲主要讨论的是2 χ-拟合检验法及其应用. 为此先主要讨论2 χ-拟合检验法的思想和步骤. 13.1 Pearson 的思想, 拟合优度检验 1938年, K. Pearson 的儿子---E. S. Pearson(他也是著名统计学家), 曾在一本关于他父亲的生平和工作的著作中, 提到K. Pearson 对统计的任务的看法是“To predict from past what will happen in the future”(从以往去预测将来会发生什么), 以及在19世纪与20世纪之交统计的当务之急是“What was needed was a method for translating observed data into a p redicative model”(需要的是一种方法, 以将观察数据转化为一个可用于预测的模型). Pearson 所谓“过去”指的是已有的观察数据, “将来”则是指未来观察的可能结果. 要做到由过去预测未来, 必须用一个统计模型, 确切地说, 就是一条分布(密度)曲线, 去拟合已有的数据, 然后用拟合的分布去计算在未来的观察中出现各种值的可能性大小. 为此, Pearson 提出了后来以他名字命名的曲线系, 希望在这个系统中, 找出一条曲线, 与已有的观测数据去拟合. 这样就需要处理以下两个问题: (1) 从曲线系中怎样去确定一条曲线; (2) 估量拟合的程度如何. 为了解决第(1)个问题, 引出了他的矩估计法. 关于他的第(2)个问题, Pearson 引进了2 χ-统计量. 问题: 设总体X 的分布函数为F 为未知, 1, ,n X X 为来自X 的样本, 如何利用据此样本 去检验假设: 00:()()H F x F x =(即检验假设: X 的分布函数为0()F x ). 其中0()F x 为已知函数. 即如果用分布函数0()F x 去拟合样本1, ,n X X , 则拟合的优良程度如何? 0F 常称为

计量经济学习题含答案

计量经济学习题含答案 第1章绪论 习题 一、单项选择题 1.把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为( B ) A. 横截面数据 B. 时间序列数据 C. 面板数据 D. 原始数据2.同一时间、不同单位按同一统计指标排列的观测数据称为( B ) A. 原始数据 B ?截面数据 C. 时间序列数据 D ?面板数据 3.用计量经济学研究问题可分为以下四个阶段( B ) A. 确定科学的理论依据、建立模型、模型修定、模型应用 B ?建立模型、估计参数、检验模型、经济预测 C?搜集数据、建立模型、估计参数、预测检验 D. 建立模型、模型修定、结构分析、模型应用 4.下列哪一个模型是计量经济模型( C ) A. 投入产出模型 B. 数学规划模型 C.包含随机变量的经济数学模型 D. 模糊数学模型 二、问答题 1.计量经济学的定义 2.计量经济学的研究目的 3.计量经济学的研究内容 1.答:计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学2.答:计量经济学的研究目的主要有三个: (1)结构分析。指应用计量经济模型对经济变量之间的关系作出定量的度量。 (2)预测未来。指应用已建立的计量经济模型求因变量未来一段时期的预测值。 (3)政策评价。指通过计量经济模型仿真各种政策的执行效果,对不同的政策进行比较和选择。 3.答:计量经济学在长期的发展过程中逐步形成了两个分支:理论计量经济学和应用计量经济学。 理论计量经济学主要研究计量经济学的理论和方法。应用计量经济学将计量经济学方法应用于经济理论的特殊分支,即应用理论计量经济

相关文档
最新文档