回归模型拟合精度分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用回归分析例库封面

一、案例背景

新中国50年来,我国的国民经济迅猛发展,综合国力显著增强。研究表明:截至2004年50多年来中国经济增长是不均衡的,经济增长模式是不同的,可分为几个阶段。

文章基于对53年来中国财政收入、农业增加值、工业增加值、社会消费总额等因素的研究,消除价格膨胀因素的影响,采用采用Cobb Dauglas 生产函数,分三个阶段分析了财政收入与其他因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释,结论符合中国实际。

二、数据介绍

新中国50年来,我国的国民经济迅猛发展,综合国力显著增强。研究表明:截至2004年50多年来中国经济增长是不均衡的,经济增长模式是不同的,可分为几个阶段。

文章基于对53年来中国财政收入、农业增加值、工业增加值、社会消费总额等因素的研究,消除价格膨胀因素的影响,采用采用Cobb Dauglas 生产函数,分三个阶段分析了财政收入与其他因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释,结论符合中国实际。

三、分析过程

经过对26个模型中标准残差、复相关系数、PRESS和AIC的对比,发现以下模型最优。

序号1952—1971年拟合回归方程标准残差复相关系数PRESS AIC

0.02360.99530.0171-86.3200 1Y 1.0930+0.3191X

1+0.3892X2

+0.0979X

3

0.02440.99530.0190-84.3425 2

Y 0.8637+0.3123X1+0.3836X2

+0.1007X +0.0262X

4

0.02320.99580.0206-86.3161 3

Y 2.1263+0.5359X1+0.4242X2

+0.0945X3-0.3879X5

4Y 1.5515+0.5289X

0.02390.99580.0228-84.499

1+0.4108X2

+0.1020X30.0721X4-0.4089X5

F 统计量的概率值都为0,说明每个回归方程中的自变量作为一个整体对因变量

Y 的影响是显著的。为了确定最优模型,将T 统计量的概率值比较如下

变量

Pr(>|t|)回归方程常数X

1

X

2

X

3

X

4

X

5

10.00010.00000.00000.0024

20.63420.00030.00000.01220.8983

30.02470.00860.00000.00300.2288

40.41010.01220.00000.01070.72520.2274

从表3可以看出,当显著性水平0.05时,只有第一个模型中所有的P 值都满足

Pr(>|t|)<0.05,说明这个模型中的每个自变量对因变量的影响显著。综合以上因素,我

们认为Y 关于因素X

1,X

2

,X

3

的回归模型是最优的,即1952年—1971年这20年间,影响

财政收入的主要因素是农业增加值、工业增加值和建筑业增加值。

4.2.21972—2004年最优回归模型

过程同上。经过对比,发现以下4个模型最优。

序号1972—2004年拟合回归方程标准残差复相关系数PRESS AIC

1Y 1.75330.4267X

1

0.4356X2 0.3500X5

0.01480.99970.0080-159.0938

2Y 1.51400.3940X 0.4279X

2

0.0432X3 0.3213X5

0.01460.99970.0082-158.8452

3Y 6.52120.2733X 0.3868X

2

0.4779X4 0.4421X5

0.01320.99980.0066-165.6161

4

Y 6.61300.2731X1 0.3866X2

0.0029X3 0.4855X4 0.4455X5

0.01340.99980.0071-163.6235

F 统计量的概率值都为0,T 统计量的概率值如表5所示。

变量

Pr(>|t|)回归方程常数X

1

X

2

X

3

X

4

X

5

10.00000.00000.00000.0001

20.00000.00000.00000.22690.0005

30.00050.00180.00000.00770.0000

40.00350.00220.00000.93870.01960.0080

当显著性水平0.05时,表5中第一个模型和第三个模型中所有的P值都满足

Pr(>|t|)<0.05,说明这两个回归方程中的每个自变量对因变量的影响显著。结合表4,

我们认为Y 关于因素X

1,X

2

,X

4

,X

5

的回归模型是最优的,即1972年—2004年这33年间,

影响财政收入的主要因素是农业增加值、工业增加值、人口数和社会消费总额。

两个总体分段拟合回归方程标准残差复相关系数PRESS AIC

1952—1971Y 1.0930+0.3191X1+0.3892X2

+0.0979X3

0.02360.99530.0171-86.3200

1972—2004Y 6.52120.2733X1 0.3868X2

0.4779X4 0.4421X5

0.01320.99980.0066-165.6161

四、结论

本文根据中国财政收入、农业增加值、工业增加值等因素增长趋势的特点,采用Cobb Dauglas生产函数,讨论了中国财政收入与社会各因素之间的关系。

比较表7中三个最优方程,可以看出在我国经济的不同发展阶段,影响财政收入的

因素以及各因素的权重有所不同,说明随着时代的发展,社会制度的变迁,影响财政收入的主要因素也会发生变化。

在1952—1961年的回归方程中,农业增加值、工业增加值和建筑业增加值对财政收入的影响较大,其中工业增加值的权重系数较大。这一时期,正值我国生产资料私有制的社会主义改造基本完成,1957年又完成了发展国民经济的第一个五年计划,开始进入全面建设社会主义的新时期。在1961—1981年的回归方程中,工业增加值、人口数和社

相关文档
最新文档