应用数理统计课外大作业范例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数理统计》

案例分析大作业(范例)

学号 姓名 专业 成绩

国家财政收入的多元线性回归模型

摘要:用Excel 求解Y 与X 之间的初步回归模型,得到初步回归直线方程

1234567

284870.009090.462080.031870.2860660.221980.002920.239963Y x x x x x x x =---+--+然后对此方程进行线性显著性检验和回归系数显著性检验。由20.999R =知Y 与

X 之间存在显著的线性,然而只有自变量27,x x 满足通过t 值检验,从而回归系数

13456,,,,x x x x x 与Y 之间没有显著的线性关系,说明自变量之间存在多重共线性关

系。采用MATLAB 逐步回归方法对数据进行处理,根据程序自动提示得到最优回归方程57733410.6606580.241802y x x ∧

=-+,此时20.997R =,3008F =。最后采用2010年的数据对此方程进行验证,得到结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。

一、问题提出

近年来,随着国家经济水平的飞速发展,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。

国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。

本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,社会商品零售总额,人口总数等。

二、数据描述

从《中国统计年鉴2010》查选数据,整理如表2-1所示:

表2-1.1990-2009年财政收入及其影响因素统计表

工业 (亿元)

农业 (亿元)

受灾面积(千公顷)

建筑业 (亿元)

人口 (万人)

社会商品零售总额(亿元)

国民生产总值(亿元)

财政收入 (亿元)

1990

18689.22 7662.1 38474 1345 114333 8300.1 18718.3 2937.1 1991 22088.68 8157 55472 1564.3 115823 9415.6 21826.2 3149.48 1992 27724.21 9084.7 51333 2174.4 117171 10993.7 26937.3 3483.37 1993 39693 10995.5 48829 3253.5 118517 14270.4 35260.0 4348.95 1994 51353.03 15750.5 55043 4653.3 119850 18622.9 48108.5 5218.1 1995 54946.86 20340.9 45821 5793.8 121121 23613.8 59810.5 6242.2 1996 62740.16 22353.7 46989 8282.2 122389 28360.2 70142.5 7407.99 1997 68352.68 23788.4 53429 9126.5 123626 31252.9 78060.8 8651.14 1998 67737.14 24541.9 50145 10062 124761 33378.1 83024.3 9875.95 1999 72707.04 24519.1 49981 11152.9 125786 35647.9 88479.2 11444.08 2000 85673.66 24915.8 54688 12497.6 126743 39105.7 98000.5 13395.23 2001 95448.98 26179.6 52215 15361.5 127627 43055.4 108068.2 16386.04 2002 110776.48 27390.8 47119.1 18527.1 128453 48135.9 119095.7 18903.64 2003 142271.22 29691.8 54506.3 23083.8 129227 52516.3 135174.0 21715.25 2004 201722.19 36239 37106.256 27745.3 129988 59501 159586.7 26396.47 2005 251619.5 39450.9 38818.225 34552.0 130756 67176.6 185808.6 31649.29 2006 316588.96 40810.8 41091.41 41557.1 131448 76410 217522.7 38760.2 2007 405177.13 48892.9 35972.23 51043.7 132129 89210 267763.7 51321.78 2008 130260.2 33702.0 56234.26 18743.2 132802 116032 316228.8 61330.35 2009 135239.9 35226.0 50223.51 22398.8 133474 14894 343464.7 68518.30

变量的假设如下表所示:

表2-2.自变量假设表

三、模型建立

(1)回归模型的建立:

多元回归模型

011223344556677i i i i i i i i i Y x x x x x x x ββββββββε=++++++++

相关文档
最新文档