对财政支出数据的回归分析

合集下载

中国财政收入数据的回归分析

中国财政收入数据的回归分析

中文题目:中国1978-2008年财政收入数据的回归分析外文题目:Regression analysis of China 1978-2008 fiscal revenue data毕业设计(论文)共69页(其中译文及原文共19页)图纸共0张完成日期:2013年6月答辩日期:2013年6月辽宁工程技术大学本科毕业设计(论文)学生诚信承诺保证书本人郑重承诺:《回归分析及其在财政收入预测中的应用》毕业设计(论文)的内容真实、可靠,系本人在胡行华指导教师的指导下,独立完成。

如果存在弄虚作假、抄袭的情况,本人承担全部责任。

学生签名:年月日辽宁工程技术大学本科毕业设计(论文)指导教师诚信承诺保证书本人郑重承诺:我已按学校相关规定对黄均铭同学的毕业设计(论文)的选题与内容进行了指导和审核,确认由该生独立完成。

如果存在弄虚作假、抄袭的情况,本人承担指导教师相关责任。

指导教师签名:年月日摘要财政收入是衡量一个地区和国家经济实力的重要标准,控制着国民经济的命脉, 对财政收入进行定量分析并对其做出比较准确的预测可以为相关部门或者企业制定发展规则,实施相关措施提供可靠的理论预测参考.科学、合理地预测财政收入,对于克服年度预算收支确定的随意性和盲目性,正确处理财政与经济的相互关系具有十分重要的意义.本文主要介绍了一元线性回归分析,多元线性回归分析和逐步回归法.通过多元线性回归分析和逐步回归法对国家财政收入进行建模,然后利用Matlab对其分析,找到能反映财政收入与各因素之间关系的最优回归方程.并且分析模型得出结论,并提出了提高财政收入质量的政策建议.关键词:线性回归分析;逐步回归;中国财政收入预测AbstractFiscal revenue is an important standard to measure a regional and national economic strength, it controls the lifeline of national economy, the quantitative analysis of the fiscal revenue and accurate forecasts on the development rules can provide a reliable theoretical prediction reference for the relevant departments or enterprises to formulate the developing plan. The scientific, rational prediction of fiscal revenue is very important to overcome the annual budget to the randomness and blindness, correctly handle the relationship between finance and economy.This paper mainly introduces the method of linear regression analysis, multivariate linear regression analysis and stepwise regression method. Modeling the national fiscal revenue by multiple linear regression analysis and stepwise regression method, and then use the MATLAB to analysis it, find the potimal equation that can reflect the relationship between the fiscal revenue and the factors. Analysis the model to draw conclusion, and provide policy recommendations to improve the quality of fiscal revenue.Key words:linear regression analysis;stepwise regression;China's fiscal revenue forecast目录摘要 ........................................................................................................................... I Abstract ..................................................................................................................... I I 前言 .. (1)1回归分析理论基础 (5)1.1一元线性回归分析 (5)1.1.1一元线性回归的总体模型 (5)1.1.2回归参数的最小二乘估计 (8)1.1.3回归方程的显著性检验 (9)1.2多元线性回归分析 (11)1.2.1高斯—马尔科夫假定 (11)1.2.2最小二乘估计量 (12)1.2.3 F检验 (16)1.2.4回归参数的显著性检验 (17)1.3逐步回归分析 (18)1.3.1逐步回归分析的主要思路 (18)1.3.2逐步回归分析的主要计算步骤 (18)2回归分析的Matlab实现 (20)2.1线性回归的Matlab数据处理 (20)2.1.1确定回归系数的点估计值 (20)2.1.2求回归系数的点估计和区间估计、并检验回归模型 (20)2.2逐步回归的Matlab数据处理 (22)3回归分析在财政收入预测中的运用 (28)3.1数据的采集 (28)3.2数据的处理 (28)3.3结果论证 (37)4结论与展望 (39)致谢 (41)参考文献 (42)附录A译文 (43)附录B原文 (51)附录C数据采集 (62)辽宁工程技术大学毕业设计(论文)前言(1)目的和意义财政收入是衡量一个地区和国家经济实力的重要标准,控制着国民经济的命脉, 对财政收入进行定量分析并对其做出比较准确的预测可以为相关部门或者企业制定发展规则,实施相关措施提供可靠的理论预测参考.科学、合理地预测财政收入,对于克服年度预算收支确定的随意性和盲目性,正确处理财政与经济的相互关系具有十分重要的意义.回归分析模型是众多预测方法中的一种,它是通过一组自变量来预测一个或多个因变量的数据分析方法.多元回归方法具有很强的实用性及有效性,在现今社会越来越多的领域得到广泛应用.逐步回归法是目前使用较为广泛的选择最优回归方程的方法.它的计算量较小,而且一般也能得到一个较合理的“最优”回归方程[1].本文深入探讨它的性质, 用于财政收入预测.(2)回归分析的发展回归分析最早是19世纪末期高尔顿(Sir Francis Galton)所发展.高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力进化问题,统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的.1855年,他发表了一篇“遗传的身高向平均数方向的回归”文章,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系.但是有趣的是:通过观察他注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高.换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会象父母身高那样极端化,其身高要比父母们的身高更接近平均身高.高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”(regression toward mediocrity).虽然这是一种特殊情况,与线形关系拟合的一般规则无关,但“线形回归”的术语仍被沿用下来.作为根据一种变量(父母身高)预测另一种变量(子女身高)的一般名称沿用至今,后被引用到对多种变量关系的描述[2].而关于父辈身高与子代身高的具体关系是如何的,高尔顿和他的学生K·Pearson通过观察了1078对夫妇,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量,结果发现两者近乎一条直线,其回归直线方程为黄均铭:回归分析及其在财政收入预测中的应用x y516.073.33ˆ+= 这种趋势及回归方程表明父母身高每增加一个单位时,其成年儿子的身高也平均增加0.516个单位[3].在1983年,伍德(S.Wold )和阿巴诺(C.Albano)等人首次提出偏最小二乘回归理论.在伍德教授的指导下,瑞典的Umea 大学有机化学系发表了许多有关偏最小二乘回归理论与应用的博士论文.他与他的合作者们还展开了广泛深入的理论探讨,并且开发了在Windows 下面运行的SMCA-P 数据分析软件,用以支持偏最小二乘回归计算和结果解释.因此,偏最小二乘回归首先在化工领域的到广泛的运用.早在1986年,郑钟光就将多元回归分析应用在矿石体重测定中,并用实践证明了这一方法具有较大的优越性[4].苑玉风应用多元回归分析和逐步回归分析,研究某种汽车发动机用球墨铸铁活塞环球化率的影响因素,并建立了相关关系[5].李金海在多元回归数学模型基础上,提出了多元回归方法的应用步骤[6].另外这一方法也被广泛的应用于预报各种气象参数,黄祖英用多元回归分析做暴雨的长期预报,虽然误差较大,但他们同时指出有待于因子本身作进一步的改进[7].林祖享,梁舜华运用多元回归方程,绘制出赤潮生物的变化趋势图,并预报是否可能发生赤潮[8].此外,多元回归分析方法也被越来越多的应用于预报各种自然灾害,王震宇等将这一方法用于滑坡预报,并用实例证明了能在一定程度上解决滑坡的预报问题.刘昌蓉等采用多元线性回归分析方法,建立地质灾害危险级别的评价模型,按照计算结果综合反映出的地质灾害活跃程度的高低,对该区域进行有效防治,从而有利于地质灾害的减轻减少.袁宇运用多元回归分析法,建立了化学污染面积,纵身与诸条件的关系,快速估算预测出突出性化学污染危害,并提前做出防范措施.多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支,是一种非常重要和实用的多元数据处理方法[9].六种经典的多元统计分析方法为:多元线性回归分析、主成分分析[10]、因子分析[11]、典型相关分析[12]、聚类分析、判别分析.回归分析方法是多元统计分析的各种方法中应用最广泛的一种[13].它是处理多个变量间相互依赖关系的一种数理统计方法,变量间的相互依赖关系在实际问题中是大量存在的,回归分析是研究这种相互依赖关系的有效数学方法.温忠麟在其所编的《心理与教育统计》一书中,对回归分析定义为:“用统计的方法研究变量y 和x 的不确定的共变关系”,“描述y 的均值与x 的关系的函数通常称为回归方程”,并通过讨论线性回归模型,从一个自变量到多个自变量的情形进行介绍如何建立回归方程,如何检验、评价和解释回归方程,如何利用回归方程进行预测等,具体从直线回辽宁工程技术大学毕业设计(论文)归、可线形化的曲线回归和多元回归分析三个方面进行阐述[14].张厚粲、徐建平在他们编著的《现代心理与教育统计学》一书中提到:回归分析是通过大量的观测数据,可以发现变量之间存在的统计规律性,并用一定的数学模型表示出来,这种用一定模型来表述变量相关关系的方法[15].回归分析不但适用于实验数据,还可以分析未作实验控制的观测数据或历史资料.作者主要简单介绍了简单回归分析模型以及如何拟合这一模型.在简单回归模型中ˆ=y+abx其中参数a,b分别表示截距与斜率,yˆ叫做因变量或被测变量,x叫做自变量或预测变量.因变量的观察值与预测值之间的差异叫做残差.运用最小二乘法和平均数可以建立这一模型.回归分析的主要目的是建立一种线性模型,然后通过这种模型进行分析和预测.张敏强在其主编的《教育与心理统计学》一书中认为统计学中的回归分析是借助于数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,其目的在于为不确定现象的研究提供更为科学、精细的手段,以应用于相关随机变量的鼓励、预测和控制[16].回归分析的三大部分是:①建立回归方程,依据专业知识调查所研究现象可能涉及到的变量的种类和个数,并且进行实验或调查以获取实际数据,然后结合以往的经验,对所获得数据进行分析研究,确定回归方程的函数形式.②检验和评价所建回归方程的有效性,检验方程有无使用价值,并找到评价回归方程有效性高低的统计指标来评价所建回归方程使用价值的高低.③利用所建回归方程进行预测和控制.这正是研究回归现象、进行回归分析的根本目的所在.利用回归方程进行控制,多见于自然科学研究领域,在教育和心理科学研究中,更多的是利用所建回归方程进行估计和预测.回归分析的描述:为了表示响应y是怎样和因子x相联系的,可以用一条回归直线ˆ去拟合.斜率b和截距a可以用最小二乘的简单公式来计算.实际的观测值必须=bxy+a假定是取自某一潜在总体的样本[17].对于这个总体,我们用希腊字母β表示真实回归直线的斜率,它就是用样本斜率b来估计的那个目标.如果抽样是随机的,那么b随着样本的不同围绕着其目标β以一个特定的标准误差近似正态地波动.由b的抽样分布,可以构造β概值.根据这两个结果中的任何一个,都可以检验假设β的置信区间,或计算0=黄均铭:回归分析及其在财政收入预测中的应用β.在非线性关系中,例如抛物线关系,可以利用简单的变换化为标准的多元回归来=拟合.也可以利用现有的统计软件来寻求一条比较合理的拟合曲线.有相关关系的两个变量,如果一个为自变量,另一个为因变量,因变量随自变量的变化而作程度不同的变化,这种近似确定性质的关系可以用数学方程式来表达,从中可以由自变量的值推算或预测因变量的估计值,这个过程称为回归分析[18].书中进一步介绍如何建立回归方程式,如何计算回归系数,如何估测和估计标准误差等方面进行详细介绍.茆诗松等编著的《回归分析及其试验设计》,是我目前找到的整本都是介绍回归分析的书.书中提到:回归分析是研究随机现象中变量之间关系的一种数理统计方法,它在工农业生产和科学实验中有着广泛的应用.书中通过生产中的实际问题,较详细地介绍了回归分析中的参数估计、统计检验和预报控制等问题.然后再阐述逐步回归及多项式回归分析方法,而且还介绍了如何回归的试验设计[19].回归设计在20世纪五十年代初,为了适应生产的发展,寻求最佳工艺和配方以及建立生产过程的数学模型等的需要而产生的,根据试验目的和数据分析来选择的每一个试验点在数据获取上含有最大的信息,从而减少试验次数,并使数据的统计分析具有一些较好的性质.发展到今天,回归设计的内容已相当丰富,有回归的正交设计,回归的旋转设计,回归的D-最优设计等.在这些设计的基础上,人们还进一步研究各种“最优设计”的标准,从而可以评定各种设计的好坏,以利于探索新的设计方案.(3)主要内容本文主要介绍一元回归分析,多元回归分析,逐步回归分析理论基础.并且从中国统计年鉴中选取1978-2008年这31年间中国财政收入为因变量,自变量为8个可能影响财政收入的因素,第一产业、工业、建筑业、交通运输和邮政业、批发和零售业、住宿和餐饮业、金融业、房地产业.通过多元线性回归分析和逐步回归法对中国财政收入进行建模,通过建立的模型对2009-2011年中国财政收入预测及分析,说明模型的合理性.1回归分析理论基础计算相关系数只能说明现象间相关关系的方向和程度,关系密切与否,但不能说明一个现象发生一定量的变化,另一个现象一般也会发生多大的变化.如销售收入每增加一万元时,销售利润一般会增加多少?施肥量增加一斤,一般地会增加多少产量?研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为回归分析.这是测定现象之间数量变化上的一般关系的数学方法.“回归”这个词的意思,就是指的变量之间的一般数量关系.根据现象之间相关关系的表现形式,配合一条直线或曲线,用这条直线或曲线来代表自变量和因变量相随变动的一般数量关系.也就是要建立并求解直线或曲线的数学方程式,从而求得变量间的一般关系值.回归有不同种类,按照自变量的个数分,有一元回归和多元回归.只有一个自变量的叫一元回归,有两个或两个以上自变量的叫多元回归;按照回归曲线的形态分,有线性(直线)回归和非线性(曲线)回归.实际分析时应根据客观现象的性质、特点、研究目的和任务选取回归分析的方法.可控变量称为自变量x ,而不可控变量(随机变量)称为因变量y .回归分析主要包括三方面内容:(1)提供建立有相关关系的变量之间的数学关系式(通常称为经验公式)的一般方法; (2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;(3)利用所得的经验公式进行预测和控制.1.1一元线性回归分析1.1.1一元线性回归的总体模型在回归分析与建模中,如果因变量与自变量之间的关系是线性关系,则称之为线性回归模型;否则,称之为非线性回归模型.一元线性回归模型就是描述两个变量之间相关关系的最简单的回归模型[20].对于具有线性相关关系的两个变量y 与x ,由于有随机因素干扰,两个变量的线性关系包括随机误差项ε,即:εββ++=x y 10 (1-1)在1-1式中,0β,1β为模型参数(或称回归系数).它是一元线性回归的理论模型.对它的理论讨论是研究其他更为复杂的回归模型的基础.一元线性回归分析的基本出发点是它对总体模型的假设.只有准确的理解一元线性回归的总体模型,才能真正把握它的工作原理与方法,在各种复杂的应用条件下能清晰自如的进行分析与处理.总体是指被研究对象的全体,在回归分析中提到的总体模型是指在客观世界中,被研究的数据全体所符合的真实模型.假设在总体数据中,影响因变量y 变化的系统因素完全可以由自变量x 以线性形式加以解释,也就是说,对所研究的全体数据,那个真实的总体模型可以表示成y 随x 线性变化的统计关系.如果对y 和x 分别进行n 次独立观测,得到以下n 对观测值n i x y i i ,,2,1),,( =这n 对观测值之间的关系符合模型n i x y i i i ,,2,1,10 =++=εββ (1-2)在1-2式中,i x 是自变量在第i 次观测时的取值,它是一个非随机变量,并且没有观测误差.对应于i x ,i y 是一个随机变量,它的随机性是由i ε造成的.而随机误差项i ε是一个随机变量,其均值为零,方差为2σ,对于不同的观测,当j i ≠时,i ε与j ε是互不相关的.在模型中,0β,1β被称为总体回归参数,0β是回归直线的截距,1β是回归直线的斜率.上述模型就是一元线性回归模型的总体模型.由它可以看出,当在第i 次观测中,x 的水平取i x 时,相应的i y 来自于一个概率分布,它的均值i i i i x x y 1010)()(ββεββ+=++E =E或者,可更准确的写为i i i x x y 10)(ββ+=E (1-3))(i i x y E 是i y 的条件期望值.式1-3说明了一个重要的统计概念:对于一个给定的i x ,虽然随机变量i y 的取值是未定的,i y 在其概率分布范围内都有可能取值,但是i y 的平均水平)(i i x y E 却与i x 有准确的线性关系.这就用数学的方式解释了我们在大量感性认识中所看到的所谓统计关系.i y 的随机性来自于随机误差项i ε.i y 的方差为2)Var(σ=i y这是因为210)Var()Var()Var(σεεββ==++=i i i i x y因此,无论自变量x 取何值,模型总假设y 的概率分布具有相等的方差2σ.在模型中,还假设误差项互不相关,即对不同观测j i ≠时,有0),Cov(=j i εε因此,任何一次观测的结果对其他各次观测的误差项都没有影响.因为误差项i ε与jε无不相关,所以,任意俩个观测值i y 与j y 也是互不相关的.在一个标准的一元线性回归模型中,还假设误差项i ε服从均值为零、方差为2σ的正太分布.因此,我们前面给出的i ε互不相关的假设变成了独立性的假设.随机误差项服从正态分布),0(2σN 的假设具有相当普遍的实用意义.因为误差项通常代表模型中被忽略的许多微小随机因素的影响.当这些微小因素数量众多,并且这些随机因素在一定程度上相互独立时,根据中心极限定理,代表所有这些因素的综合误差项i ε近似服从正态分布.再假设i ε服从正态分布),0(2σN 的情况下,i y 也是独立的正态随机变量,并且具有均值)(10i x ββ+和2σ方差,即),(~210σββi i x N y +图1-1给出了这个正态误差回归模型的示意图:对于任一给定的i i y x ,是一个随机变量,它服从正态分布,且方差是一个常量2σ,而条件均值)(i i x y E 与i x 呈线性关系.图1-1 正态误差回归模型示意图 Figure 1-1 normal error regression model diagram1.1.2回归参数的最小二乘估计如果在总体中y 与x 的统计关系符合一元线性的正态误差模型,即给定的i x ,有i i i x y εββ++=10如何求0β,1β呢?将估计的回归参数纪为00ˆb =β,11ˆb =β.对于给定的数据,对应于n x x ,,1 ,相应地,有n y y ,,1 .假定我们通过莫一方法,找到了0β与1β的估计值,则有线性估计方程n i x b b yi i ,,2,1,ˆ10 =+= 对于每个给定的i x ,这个估计方程有一个确定的i y ˆ与之对应.显而易见,i y ˆ往往不与实际i y 值相等,而是存在着偏差i ε,即)ˆ(i i i yy -=ε i ε有时也称为残差.一个好的回归方程应该能使估计值的偏差总的达到最小,所以,把问题归结为求估计参数10,b b ,使得min )()ˆ(12101212→--=-=∑∑∑===ni i i n i i i ni ix b b y yy ε所以,求解该最小值问题,就是对∑=ni i 12ε分别求关于10,b b 的偏导数,并令之为零,从而解出10,b b .这种方法称为最小二乘估计方法.即∑∑===---=∂∂ni i i ni i x b b y b 1100120)(2)(ε∑∑===---=∂∂ni i i i ni i x b b y x b 1101120)(2)(ε整理后,得下面的方程组⎪⎪⎩⎪⎪⎨⎧+=+=∑∑∑∑∑=====n i n i ni i i i i ni n i i i x b x by x x b nb y 1112101110由这个方程组解得估计值10,b b 为⎪⎪⎪⎩⎪⎪⎪⎨⎧-=---=∑∑==xb y b x x y y x x b ni ini i i 101211)())(( (1-4) 在1-4式中,y x ,分别是i x 与i y 的样本均值,即∑∑====ni i n i i y n y x n x 111,11.1.3回归方程的显著性检验由最小二乘法作出模型参数的估计,并非完成了回归方程的建立.容易理解,模型系数1β描述的是自变量x 每个单位量的变化对因变量y 的贡献.如果回归方程系数1ˆβ的值很小,可能是0)ˆ(11==ββE ,只是由于数据的随机性使得0ˆ1≠β,这意味着回归方程描述的因变量y 对自变量x 的依赖关系是“虚假”的[21].因此,对回归方程x y 10ββ+=的显著性检验,归结为对假设0:;0:1110≠=ββH H进行检验.假设0:10=βH 被拒绝,则回归显著,认为y 与x 存在线性关系,所求的线性回归方程有意义;否则回归不显著,y 与x 的关系不能用一元线性回归模型来描述,所得的回归方程也无意义.方程显著性可用方程的F 比值和复相关系数r 描述.复相关系数r 接近1较好,随着项数的引进多,r 会自动增加,容易形成假象.样本的预留检验,是用预留的样本值直观检验回归方程预报值的拟合精度.(1)F 检验法 当0H 成立时)2,1(~)2/(--=n F n Q UF e其中回归平方和为()∑=-=ni i y yU 12ˆ 故)2,1(1->-n F F α,拒绝0H ,否则就接受0H . (2)t 检验法 当0H 成立时)2(~ˆˆ1-=n t L T e xx σβ, 故)2(21->-n t T α,拒绝0H ,否则就接受0H ,其中∑∑==-=-=ni i n i i xx x n x x x L 12212)((3)r 检验法 记∑∑∑===----=n i ni ii ni i iy y x x y y x xr 11221)()())(( ,当α->1r r 时,拒绝0H ;否则就接受0H . 其中()()111121,2r n F n αα--=+--注意,F 检验是单侧检验,将显著水平全a 部配置在F 分布的右侧尾端,拒绝0H 的临界值偏小,对回归方程中自变量与因变量相关性的要求较低,作出“接受0H ”的结论较为慎重;t 检验室双侧检验,将显著性水平a 分别在t 分布双侧尾端各配置一半,因此自变量的引入门槛较高,作出“拒绝0H ”的结论较为慎重.1.2多元线性回归分析1.2.1高斯—马尔科夫假定在实际问题中,对于因变量y 的全面解释往往需要多个自变量的共同作用.例如,在研究某化学反应时,影响反应速度的因素不仅跟所使用的催化剂的用量有关,还与所加的温度有关.记y 为因变量,当有p 个自变量p x x x ,,,21 时,多元线性回归的理论模型为εβββ++++=p p x x y 110 (1-5)在1-5式中,ε是随机误差,它的期望值0)(=E ε.如果对y 和p x x x ,,,21 分别进行n 次独立观测,取得样本),,,(1ip i i x x y 后,可得到模型n i x x y i ip p i i ,,2,1,110 =++++=εβββ (1-6)在1-6式中ip p i ip p i i x x x x x x y βββ+++===E 11011),,(这里,p βββ,,,10 为回归参数.把这个模型写成矩阵形式,记1211)1(10)1(1221111121111⨯⨯++⨯⨯⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n n p p p n np n p p n n x x x x x x X y y y Y εεεεββββ 则用矩阵表示的多元线性回归模型为11)1()1(1⨯⨯++⨯⨯+=n p p n n X Y εβ (1-7)在1-7式中 Y ——观测值向量; β——参数向量; X ——常数矩阵; ε——随机误差向量.在关于总体的多元线性模型中,假定ε是独立正态随机变量组成的向量,并且有期望值0)(=E ε方差——协方差矩阵)Cov()'(2εσεε∆=E I简记为).0(~2I N σε上述假定被称为高斯—马尔科夫假定.在这一假定下,随机向量Y 有条件期望值βX X Y =E )(Y 的方差—协方差矩阵为I Y 2)Cov(σ=1.2.2最小二乘估计量首先,要估计总体参数T p ),,,(10ββββ =.记β的估计量为T p b b b B ),,,(10 =,因此,Y 的估计量为XB Y=ˆ 要求估计量Yˆ与原观测向量Y 的差异最小.记 YY e ˆ-= 采用最小二乘的计算方法,因此要使得min )ˆ()ˆ(2→--=Y Y YY e T XB X B Y Y XB Y XB Y e T T T T 2)()(2-=--=对2e 求偏导0222=+-=∂∂XB X Y X Be T T从而,得到方程。

2009年各省市国内生产总值和财政支出回归分析

2009年各省市国内生产总值和财政支出回归分析

2009年各省市国内生产总值和财政支出回归分析作者:荆长春来源:《北方经济》2010年第08期摘要:本文利用空间计量经济学模型的常系数空间滞后模型、空间误差模型,在内生经济增长模型下对2009年省级地方政府财政支出对各省国内生产总值用最小二乘法(OLS)进行回归分析的结果做了比较研究。

结论是具有空间经济联系的省市之间合作协同将会使所有省市的发展受益。

一个省市国内生产总值的增加会对周边所有省市产生带动作用,而地方财政支出的增加对周边省市影响不显著。

关键词:财政支出小二乘法一、研究背景随着财政体制改革的逐步深入,特别是1994年分税制改革与1995年财政部制定实施《过渡期财政转移支付办法》后,我国中央地方多级财政结构初步完善。

地方政府拥有了相对独立的一级财政,也有了本地经济与社会方面的诸多发展目标和各自的地方利益。

但是,由于分税制设计上存在缺陷,税收收入在中央地方之间的分配不够合理,各级政府事权与财权不相匹配。

财权向中央集中,事权则不断下放。

在以投资带动为主要特征的经济增长方式下,地方政府由于追求GDP产生过度的投资冲动,往往造成收入不能弥补支出。

当前,随着国际金融危机对世界经济的严重冲击,中国经济也开始陷入比较困难的境地。

金融动荡影响美欧口等发达国家的投资、消费、就业、居民收入,由于其消费和投资下降,从中国进口相应减少。

面对现状,政府制定出台了十大措施以及两年4万亿元的刺激经济方案。

中央政府希望通过财政支出拉动经济增长,保证8%的经济年增长率,增加就业,维持社会稳定。

二、数据与研究方法(一)数据本文涉及的变量是2009年全国除港澳台以外的31个省级行政单位的国内生产总值(GDP)与地方政府财政支出(GS)。

数据主要来自历年《中国统计年鉴》。

(二)研究方法本文进行数据分析和处理所使用的软件是GeoDAO.95-i和SPSS11.0。

三、结果分析(一)最小二乘(OLS)方法回归估计由于GeoDA0.95-i软件只能进行横截面分析,把2009年数据进行回归分析。

中国财政支出乘数的测算及其政策效应分析

中国财政支出乘数的测算及其政策效应分析

中国财政支出乘数的测算及其政策效应分析中国财政支出乘数的测算及其政策效应分析近年来,随着中国经济的快速发展和财政支出规模的不断扩大,中国财政支出乘数的测算及其对经济的政策效应引起了广泛关注。

财政支出乘数是指财政支出对于国内生产总值(GDP)变动的影响程度,是衡量财政政策对经济增长的影响的重要指标。

首先,测算中国财政支出乘数的方法有多种,包括传统乘数模型、结构向量自回归模型等。

其中,传统的乘数模型可通过以下公式进行测算:乘数 = 1 / (1 - MPC),其中MPC(边际消费倾向)为国民收入的每一增加单位所引发的消费支出的变化。

在中国,由于消费支出在国内生产总值中所占比例较高,因此MPC较高,进而导致财政支出乘数相对较大。

其次,中国财政支出乘数对经济的政策效应也具有一定特点。

一方面,财政支出乘数的增加会刺激经济的需求,推动GDP的增长。

在经济下行压力加大时,适当增加财政支出可以通过拉动有效需求而促进经济的回升。

另一方面,财政支出的乘数效应也受到一些因素的制约,例如民众对财政支出的预期、财政支出的结构与质量等。

如果财政支出的效果不如预期,民众对未来的消费预期不佳,那么财政支出的乘数效应可能会减弱。

进一步分析表明,中国财政支出乘数的政策效应也与财政政策的调控力度有关。

通过提高财政支出规模,政府可以加大对重点领域的投资力度,推动相关行业的发展,进而形成一定的经济增长效应。

此外,适当调整财政支出的结构也能够提高财政支出的乘数效应。

例如,在发展新能源、促进创新科技等领域适量增加财政支出,可以推动相关产业的发展,同时对未来经济增长也具有一定的拉动效果。

然而,需要注意的是,中国财政支出乘数的增长也带来了一些风险和问题。

例如,财政过度支出可能导致财政赤字的增加,从而增加了财政风险。

同时,如果财政支出过度依赖债务融资,可能导致债务风险的积累,给未来经济的可持续发展带来困难。

因此,政府在制定财政政策时,需要综合考虑财政支出的规模、结构和质量等因素,以充分发挥财政支出乘数的积极效应,同时避免可能带来的负面影响。

三大民生类公共支出影响因素灰色关联及回归分析

三大民生类公共支出影响因素灰色关联及回归分析

三大民生类公共支出影响因素灰色关联及回归分析内容摘要:基于灰色关联及回归分析方法,本文运用1999-2009年我国时间序列数据对政府卫生支出、预算内教育支出及社会保障支出三大民生类公共支出与国内生产总值、财政支出、城乡恩格尔系数等8个影响因素进行分析。

结果表明,财政支出、国内生产总值、城乡居民人均年收入是影响三大民生类公共支出的前四位重要因素。

因此本文认为,提高中央政府财政转移力度、提高城乡居民收入水平、缩小收入差距、加大教育支出力度等措施是关注和重视民生的必然举措。

关键词:民生公共支出影响因素关联度回归三大民生类公共服务支出影响因素在我国“十一五”规划中,民生领域的范围主要包括义务教育、公共卫生、社会保障、社会救助、促进就业、减少贫困、防灾减灾、公共安全、公共文化、基础科学与前沿技术以及社会公益性技术研究等领域。

本文主要分析传统意义上的、与多数民众息息相关的三类民生公共支出,包括教育、公共卫生、社会保障(包含社会保险、社会救助和社会福利)三大类。

依据马斯格雷夫(Richard A.Musgrave,1973)关于公共支出三阶段理论,本文认为影响三大民生类公共支出的因素主要有以下几方面:一是社会经济发展水平,它是民生类公共支出增长的基础,随着社会经济发展水平的提高,三大民生类公共支出一般也会随之增长,一般用国内生产总值GDP来度量。

二是财政规模,其规模可以衡量政府职能的大小,制约着三大民生类公共支出的规模,一般用财政支出来度量。

三是城乡人民生活状况,随着经济社会的发展,人民生活水平越高,大众普遍关心的教育、公共卫生、社会保障等问题凸显,要求政府更多地投入民生领域以满足民众的偏好。

该类因素一般可用城乡恩格尔系数来度量。

四是城乡人民收入状况,用城乡人均年收入来度量。

五是城市化进程,随着城市化进程的加速发展,它必然促使三大民生类公共支出不断提高。

城市化进程可用城市化率来度量。

六是总人口数,由于我国人口基数较大,人口数量也是影响三大民生类公共支出的重要因素。

湖北省财政收入与支出的回归分析

湖北省财政收入与支出的回归分析

明舭与 I 之间存在系统问题,异方差性
问题 存 在 。 当存 在 异方 差 时 . 用 加 权 最小 利 二 乘 法 消 除 异 方 差 D 第 四 , ≈关 检 验 。利 用 DW 检 验 法 , 自相

第 一 . 合 优 度 检 验 拟 合 优 度 检 验 用 拟 以 检 验 回归 方 程 对 样 本 观 测 值 的 拟 合 程
度定 样 决 系 R器 =器 , , 本 定 数z 1 义 = 一
对 经 济 增 长 的 贡 献 方 面 进 行 过 许 多 理 论 和 其 中 ,S 、 S S E 分 别 表 示 总 离 差 平 方 S T S R、S
实证 研 究 .而 缺 乏 对 财 政 收 入 与 财 政 支 出 和 、 归 平方 和 、 差平 方 和 。R 的 值 总 是 回 残 z 之 间 关 系 的研 究 。 本文 拟 运 用 一 元 线 性 回 在 0和 1 间 .在 样 本 容 量 数 n相 对 于解 之 归 分 析 方 法 .抽 取 了 1 5 0 4年 湖 北 省 释 变 量 个 数 较 大 时 . z 接 近 于 1时 . 9320 R 越 拟 财 政 收支 数 据 为样 本 .对 湖 北省 财政 收 入 合 优 度 越 好 . 性 回归 效 果 就 越 好 线 和 财 政 支 出之 间 的 长期 关 系进 行 线性 回 归 第 二 .回 归方 程 的显 著 性 检 验 ( 检


々 一 。 ∑
在 为∑ 2 z 认 与∑e _
日 日
近 似 相 等 时 ,误 差 序 列 s , :A, 自相 。 , s的 s
et et
_

分 析 研 究 .检 验 湖 北 省 财政 收入 与 财 政 支 出 之 间 的关 系 明确 财 政 收 入 与 财政 支 出

对我国财政收入和支出关系的再研究——基于EG两步法和误差修正模型分析

对我国财政收入和支出关系的再研究——基于EG两步法和误差修正模型分析
入 和 财 政 支 出之 间 的关 系 对 于如 何 调 整 财 政 失 衡 非 常 重
我 国 财 政 收 支 平 衡 上 经 常 处 于 财 政 赤 字 。 从 18 9 6年 至 20 0 5年 财 政 支 出 一 直 高 于 财 政 收 入 ,导 致 财 政 赤 字 。
要 。两 者 之 间 的关 系 产 生 几 种 假 说 ,一 种 是 财 政 收 入 与 财 政 支 出之 间 存 在 着 双 向 的 因果 关 系 , 为 “ 政 同步 性 称 财
年 期 间 占 G P 比重 一 直 不 超 过 五 分 之 一 .0 7年 以 后 D 20 收 人 和 支 出 占 G P的 比重 又 逐 渐 增 加 ( 图 2 。 D 见 )
随着我 国经济不 断发展 ,财政 收入和 财政 支出也在 不 断 增加 ,财政 收 入 从 15 9 3年 的 2 3 4亿 元 增 加 至 1. 2
支 出之 间 存在 长 期 均衡 关 系 , 当短 期 波 动偏 离长 期 均衡 时 , 差 修 正 项 将 以 04 3 9 误 .2 2 5的 力 度 作 反 向 调 整 , 非 均衡 状 将
态恢复到均衡 状 态。也就是说 , 即使在短期偏 离长期均衡 时, 也会 受到 一种 “ 引力约束” 使其 向长期 均衡 靠拢 。通过格
20 年和 2 0 06 0 7年财政 出现盈 余 , 分别盈余 6 7 . 4 23 7亿元
出超 过财 政盈余 ,再 次 出现财 政赤 字 。赤字 额分别 为
假说” 即财政收入的变化引起财政支出的变化 。 , 同时 , 财 和 1 0 2 5万亿 元 ;0 8年至 2 1 . 93 1 20 00年又 出现 了财 政支 政支出的变化 同样对财政收入的变化产生影响 ,财政支 出的决策不能脱离财政收入而单独制定 。一种是仅从财 1 1 . 亿元 、3 7亿元和 6 9 亿元 ( 101 3 79 4 5 见图 1 。 ) 财政收入 政收入 到财 政支 出单 向存 在 因果关 系 .则 称 之为 “ 收 和 财 政 支 出 占 G P的 比 重 也 在 不 断 地 发 生 变 化 .9 6 D 18

【原创】SPSS重庆市财政收入的回归分析报告论文附代码数据

【原创】SPSS重庆市财政收入的回归分析报告论文附代码数据

重庆市财政收入的回归分析摘要文章首先运用SPSS工具对2000-2010年我国GDP、财政收入与存款汇率和年份等数据进行回归分析,得出存款汇率与GDP和年份及财政收入的回归模型。

其次,分别建立逐步回归模型,得到最优回归模型结果。

关键词: GDP 财政收入经济指标回归分析逐步回归一、前言近年来,我国财政收入的增长却远远快于经济增长的速度,针对这一情况,本文通过对财政收入和中国GDP变化的计量经济分析,试追寻问题所在,并希望对改善我国财政和GDP的合理关系提供对策。

国内生产总值(GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。

而财政收入是政府部门的公共收入,是国民收入分配中用于保证政府行使其公共职能、实施公共政策以及提供公共服务的资金需求。

国内生产总值和财政收入是众多经济指标中的两个关键性指标,通过回归分析等研究手段,思考和研究这两个指标的相互关系,并正确把握,对于促进经济可持续健康发展,具有非常重要的意义。

国内生产总值(gross domestic product GDP)是按市场价格计算的国内生产总值的简称。

它是一个国家(地区)所有常住单位在一定时期内生产活动的最终成果。

20世纪90年代以前,资本主义世界各国主要侧重采用GNP和人均GNP。

但进入90年代后,96%的国家纷纷放弃GNP和人均GNP,而开始重点采用GDP和人均GDP来衡量经济增长快慢以及经济实力的强,一般将国民总收入GNI(Gross National Income),指一个国家或地区所有常住单位在一定时期内收入初次分配的最终结果)看作是GNP,各国(包括中国)也仅对外公布GDP与GNI数据。

美国经济学家萨缪尔森(Paul A Samuelson)认为,GDP是20世纪最伟大的发明之一。

他将GDP比做描述天气的卫星云图,能够提供经济状况的完整图像,能够帮助领导者判断经济是在萎缩还是在膨胀,是需要刺激还是需要控制,是处于严重衰退还是处于通胀威胁之中。

浅析运用多元线性回归模型分析影响税收收入的经济因素

浅析运用多元线性回归模型分析影响税收收入的经济因素

浅析运用多元线性回归模型分析影响税收收入的经济因素一、概述税收收入作为国家财政收入的重要组成部分,其变化情况与国家的经济状况密切相关。

为了探究影响税收收入的经济因素,本文将运用多元线性回归模型进行分析。

我们需要明确研究的问题。

影响税收变化的因素多种多样,为了找出对税收具有显著性影响的指标,我们将根据文献阅读和实际经济经验,选取国内生产总值(GDP)、财政支出、物价水平等因素作为模型的自变量,进行多因素计量分析。

近年来,我国税收的增长速度显著超过了GDP的增长速度,这一现象可能暗示着我国的经济政策体系、政府调控机制等方面存在一些问题。

对税收收入及其主要影响因素进行多元线性回归分析,有助于我们改善税收现状,并为完善税收政策和经济体制提供参考。

在建立计量经济模型时,我们将明确解释变量和被解释变量。

被解释变量为税收收入总额,而解释变量则包括国内生产总值(GDP)、财政支出、物价水平等。

通过建立模型,我们可以得出各个变量与税收收入之间的变动关系,从而为税收收入的预测和政策制定提供依据。

1. 税收收入在国家经济中的重要地位税收收入作为国家财政收入的主要来源之一,在国家经济中占据了举足轻重的地位。

它不仅关系到政府的财政状况和公共服务的提供,更是衡量一个国家经济发展水平和社会稳定程度的重要指标。

税收收入是国家实现宏观经济调控的重要工具。

政府通过调整税收政策,如改变税率、调整税目或实行税收优惠等,可以影响企业和个人的经济行为,进而调控宏观经济运行。

例如,降低企业所得税率可以激励企业增加投资,扩大生产规模,从而促进经济增长提高个人所得税起征点则可以增加居民的可支配收入,刺激消费需求,拉动内需增长。

税收收入对于保障社会公共服务和基础设施建设具有重要意义。

税收作为一种强制性的财政收入形式,能够确保政府有足够的资金用于提供公共教育、医疗、社会保障等公共服务,以及建设交通、水利、能源等基础设施。

这些服务和设施的建设和完善,不仅能够提高人民的生活质量,也是国家经济发展的重要支撑。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
121007301806669215877529272068578111406187795179360376919531837770782014701563760311218517
270466134682351404591732612550992957133355217828505251404184586002289459823530003004542543623
给定显著性水平α,若 ≥Fα(1,n-2),则首先将xj引入回归方程,为方便,设xj就是x1。
接下来因变量y分别与(x1,x2),(x1,x3),…,(x1,xm)建立m-1个
二元线性回归方程,对这m-1个回归方程中x2,x3,…,xm的回归系数进行
F检验,计算F值,记为 ,选其最大的记为:
若 ≥Fα(1,n-3),则接着将xj引入回归方程。
四、结语
在目前,经济发展较快,而国家财政支出进一步加大,那么在社会建设中确实存在这一些问题,比如医疗卫生,教育,基础设施建设等。
通过建立这样的一个回归模型,我们发现在经济快速增长的下,一些发面的发展已经滞后了,那么如果我们不改善这种情况,财政将会越来越困难,所以在当前我们必须加强教育,社会保障和基础设施的建设,然后我们才能创造一个良好的财政收支环境,以利于经济和社会发展。
总之,我们必须着眼未来,加强相关方面的建设,实现财政的良好循环。
附录:
程序;
datasty;
inputy x1-x12;
cards;
1959285719626642210016046163162957112188661113820932851450513354688199838312177368034611160451
(3后退法
取显著性水平a=0.1000.
变量剔除
由此回归子集的最优方程就是:
复决定系数是0.9910,c(p)是3.4128
(4前进法

我们可以看到依次引入了x4 x7 x10 x12,此时我们就能写出最优模型的回归方程:
复决定系数是0.9874.c(p)位10.4241.
以上就是用后退法,前进法选择了变量建立了模型,建立了相对最优的回归方程,但是这两种方法有一定的缺陷,后退法中一旦某个变量被剔除了,就再也不能回到模型中,这样可能使找到的模型不是最优的。前进法相反,一旦变量进入,就不会再被剔除,但是这个变量可能在某个模型中不再显著,这样的模型同样不是最优的。所以我们再运用逐步回归来筛选,建立一个最优模型。
(3)逐步回归法
逐步回归的基本思想是“有进有出”。具体做法是将变量一个一个引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后所得的回归子集是“最优”回归子集。
16471253234153120027868949286255723778832746522820051038442547367147874613675255181961862857
1137715918919743146891598523329232562812242511092914742741140264750936804268456079880165
(2)后退法
后退法与前进法相反,首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。设对m个回归系数进行F检验,记求得的F值为 ,选其最小者记为:
给定显著性水平α,若 ≤Fα(1,n-m-1),则首先将xj从回归方程中剔除,为方便,设xj就是xm。
接着对剩下的m-1个自变量重新建立回归方程,进行回归系数的显著性检验,像上面那样计算出 ,如果又有 ≤Fα(1,n-(m-1)-1),则剔除xj,重新建立y关于m-2个自变量的回归方程,依此下去,直至回归方程中所剩余的p个自变量的F检验值均大于临界值Fα(1,n-p-1),没有可剔除的自变量为止。这时,得到的回归方程就是最终确定的方程。
下面我们来做主成分回归;
结果如下:
以上我们看到三个主成分就能够反映91..88%的信息,所以我们取三个主成分就足够了。写出print1=0.422138x1+0.424429x4+0.30694x7+0.416599x8+0.30683x10+0.384503x11+0.332418x12,其他的表达式类似。
~N(β,σ2(X'X)-1)
记(X'X)-1=(cij)i,j=0,1,2,… ,p
构造t统计量
其中
4、逐步回归
(1)前进法
前进法的思想是变量由少到多,每次增加一个,直至没有可引入的变量为止。首先分别对因变量y建立m个一元线性回归方程,并分别计算这m个一元回归方程的m个回归系数的F检验值,记为 ,选其最大者记为:
X3公共安全
X4教育
X5科学技术
X6文化体育与传媒
X7社会保障与就业
X8医疗卫生
X9环境保护
X10城乡社区事务
X11农林水事务
X12交通运输
2、结果数据及分析
表一
以上是参数估计的结果,建立回归方程
(1方程的系数检验:
表二
方差分析的结果。P<0.05,证明高度显著,即变量全体x1-x12对y有显著影响,但是我们不能确定没一个变量x都对y有显著性。由表一中我们可以看出诸如x2,x3,x4,x5,等都没有通过检验 的t统计量 及相应的P值,得到,并不是每一个 单独的对因变量y都有显著性影响,这说明尽管回归方程通过了显著性检验,但也出现某些单个变量 对y并不显著的情况。
129711002245366310579565632512210162149292467128976978768327974072303313939705847811066574
应用回归分析论文
题目:影响财政支出因素的应用回归分析
姓名:孙天阳
学号:20112981
摘要
截取了中国国家统计局统计年鉴中的财政支出数据,主要是对影响财政支出的因素进行分析,因为,财政支出的情况也在一定程度上反映了我国当前时段内的经济和社会情况。
选取了各地区财政2008年的支出情况数据,对其做多元线性分析,建立回归模型,并通过对回归系数做显著性检验与逐步回归来分析数据。最后的结果就体现了各地财政支出与教育,国防,等的关系。
86772459590555631658481141698528653018012010571644191561097891850121385397141560761033
188166963176185258451367819376981921667429002327137261202379763556132496715189772892071485575
(5逐步回归
显著性水平a=0.05这里我们先后由六步选择得到了这个最优子集模型,回归方程为
复决定系数是0.9874.c(p)是10.4241.,最后发现vif都小于10,也都通过了显著性检验,所以这个模型是合理的。
(6)主成分分析和岭回归
以上结果我们可以得到选出的最优子集是x1 x4 x7 x8 x10 x11 x12.
3247492751686015322425288455926032915173667446231524114861169517953617904276159911721202886538
220857563724556500481996246453990286792863759314152231428690465183193949917741755942341720324
17652249301064640501112795131126012658932534623103120875987417066120015817637545695751360830
37785681629023177696393206470332691325155667154362834520114674708782832940192602510584041957778
228160934065896192801391862444026430438941461633023431454726758510135382220958594317272005786
1650276326580311065312564862841940230584252487281300395083840919485220217670063830691254733
21534348307650353771147583330636004902262994094699675839012481798217221114929333725132212826
118012231742481138607195041880346134116282109199855659517645606785374310733572929761598726
131501752234833230199075362349868176381271892218381171495964286310117631096934336037901507
1454573224339141590976447820640171536343162431915179598205796815170439916071774930871253567
表三
表三是样本相关阵的输出数据,x7等对y的贡献较大,而x2等比较小,所以我们需要剔除一些变量。
(2)异方差和自相关性检验
表四
我们可以看到其中的值都小于.05,所以不存在异方差性。
我们看到dw=1.951,故认为不存在自相关性,我们在上表中可以看到有些变量的方差扩大因子较大,vif超过了10,所以我们认为变量间可能存在着多重共线性,我们在后面将进行变量的选择来剔除那些共线性变量。
相关文档
最新文档