基于时间序列模型的我国第三产业及其结构的实证分析

基于时间序列模型的我国第三产业及其结构的实证分析
基于时间序列模型的我国第三产业及其结构的实证分析

基于时间序列模型的我国第三产业及其结构的实证分析山东经济学院焦娜、郝祥如、徐海梅

目录

一、问题的提出 (2)

二、研究现状及存在的问题 (3)

三、模型构建前的准备 (4)

(一)若干假设 (4)

(二)模型构建的理论基础 (4)

四、ARIMA模型的构建 (5)

(一)时序图 (5)

(二)差分运算及纯随机性检验 (6)

(三)确定差分后的模型结构 (7)

(四)显著性检验 (8)

(五)拟合模型的具体形式 (9)

五、残差自回归(Auto-Regressive)模型的构建 (9)

(一)建立延迟因变量回归模型 (9)

(二)逐步回归结果 (10)

(三)修正后的最终拟合模型 (10)

六、模型比较选择 (11)

七、第三产业及其结构分析结论与对策建议 (12)

参考文献 (14)

附录一: 第三产业产值及其比重..............................................-15- 附录二: 第三产业增加值构成. (16)

内容摘要:从1978改革开放到2009年的31年间,第三产业产值的平均增速超过10%,高于同期国内生产总值的平均增长速度,发展迅速的第三产业对全国经济发展和城市化建设的影响重大。我们根据1952年到2008年的第三产业的产值占国内生产总值的比重数据,通过具体数据运用综合分析建立了ARIMA 时间序列模型、基于延迟因变量的Auto-regressive 非平稳的时间序列模型,通过二个模型对数据拟合的优劣程度来选取研究第三产业占国内生产总值的比重的最优模型,分析了第三产业各行业的比重以及发展趋势。通过模型分析得出的结论是:我国自1952年以来,第三产业产值在国民生产总值中的比重波动较大。在1978年左右的一段时间,第三产业的比重达到低谷;但是在1984年之后情况好转且该比重逐年增加,这与改革开放政策实施后我国第三产业经济快速发展相吻合;且近年来第三产业在国民生产总值中的比重趋于稳定。并针对第三产业产值比重的变化趋势进而对第三产业各行业产值的比重分析,了解到我国的第三产业的产业结构有待优化,在大力发展第三产业的同时,要注重产业结构的调整,促进第三产业更好更快的发展。

模型在建立的过程中,运用了SAS9.1,Stata11.0等统计软件,用差分法提取确定性信息消除显著的增长趋势,参数的检验应用了非参数的t 检验方法,模型的显著性检验应用了LB(Ljung-Box)为统计量的检验方法。序列白噪声的检验引入了()n 2χ检验,而残差的自相关性检验以及异方差检验运用了D-W 检验以及Engle 提出的拉格朗日乘子检验。

关键词:第三产业 ARIMA 模型 Auto-regressive 模型 比重

一、 问题的提出

当前,我国人均GDP 已经超过2000美元,城市化率达到47%,正处在工业化加速向中后期推进的阶段,从国际经验看,这一阶段第三产业协同带动经济增长的作用日益增强,逐步成为现代产业体系的主体。然而从第三产业的总体供给看,总量明显不足,服务

水平低,竞争力不强;从第三产业内部结构看,传统服务业较为发达,现代服务业、新兴服务业、物流业明显落后;从第三产业产值占GDP的比重来看,近几年发展处于持平状态,第三产业产值比重有待于提高。2007年3月,国务院还出台了《关于加快发展服务业的若干意见》明确提出,到2010年力争使服务业增加值占国内生产总值的比重比2005年提高3个百分点;有条件的大中城市形成以服务经济为主的第三产业结构。在这样的背景下,加快发展服务业成为我国面临的一项重大而长期的战略任务,具有重大而深远的现实意义。尤其值得注意的是,多年来我国经济实现了持续快速增长,然而,产业结构不合理,经济发展方式粗放,资源环境制约加剧等问题依然存在,这些都是必须认真研究并需要切实加以解决的。所以对第三产业产值比重的发展研究是非常必要的。

在研究数据发展趋势和数据预测上的问题上时间序列模型是较优模型,而比较之前的论文在就第三产业比重预测这一方面大多选用一个模型,但单一的模型总具有局限性,所以在具体到确定的ARIMA模型、基于延迟变量的Auto-regressive非平稳的时间序列模型,再针对我国的实证数据,到底哪种模型更优是我们的研究方向,也是对之前数据分析的突破。同时,我们将第三产业各行业的产值比重和增长相对速度放在同一张图中进行直观的比较,进一步说明了第三产业产业结构不合理的现状。

二、研究现状及存在的问题

改革开放以来中国第三产业的发展分两个时期。第一个时期:1978~1991年,恢复性高速增长时期。其特点是:第三产业增长速度高,比重提高快,但结构改善不大,第三产业增长主要靠传统服务业的带动。第二个时期:1992~2006年,结构改善期。其特点是:第三产业增长速度放慢,比重基本稳定,结构明显改善,新兴产业和高附加值产业发展势头好。

改革开放以来中国第三产业的发展特征:一是第三产业在国民经济中所占比重(当年价)大幅度提高;二是第三产业迅速增长,增长速度呈现前期峰谷交替、后期平缓的态势;三是第三产业绝对发展水平迅速提高,与世界的差距正在缩小;四是第三产业内部结构演变,呈现明显的升级趋势;五是第三产业成为劳动力增长最快的产业;六是第三产业对GDP 增长的贡献率在曲折中上升,成为国民经济的第二推动力;七是现代服务业劳动生产率增长速度明显高于传统服务业;八是东中西部第三产业占比趋同,但发展水平差距在迅速拉大。

在推进第三产业市场化改革过程中,对一些细节性的问题尤其在先行的规制制度完善方面考虑欠周详。中国和发达国家相比,在第三产业市场化改革方面,相同之处体现在均

强调对自然垄断型服务企业进行产权变革、吸引民间资本注资。不同之处则体现在以下两方面:一是发达国家在对自然垄断型服务企业进行拆分时,强调竞争与效益兼顾的原则,而中国对竞争机制引入较为重视而对后者关注不足。从垄断改革实施的效果看,忽略效益产生了较严重的后果。二是发达国家往往先制定法律、法规,然后以此为依据推行市场化改革。而中国推进第三产业的市场化改革通常是“摸着石头过河”,没有一套成熟的管制体系,经常会出现一些意料之外的矛盾和困难,也使一些政策往往因缺乏法律法规支撑而导致力度不足。

三、 模型构建前的准备

(一) 若干假设

我们从近年来的经济发展趋势以及数据本身的性质作出了如下假设: 1我国第三产业产值比重的发展趋势能用ARMA(p ,q)或者是ARIMA (p ,d ,q )模型来拟合,可能其效果较好,但是不能较好的解释其经济意义。

2可以利用时间序列的分解定理:Wold 分解定理或者Cramer 分解定理对历年第三产业产值比重的数据进行确定性影响和随机性影响的分解。并对随机影响进行自相关检验以检验确定性影响是否提取充分。

在下面的分析中,我们分别对第三产业产值比重数据进行上述两种假设的建模,通过日本统计学家Akaike 于1973年提出的AIC 准则以及Schwartz 在1978年根据Bayes 理论提出的SBC 准则来评价所得出拟和模型的优劣,AIC 准则和SBC 准则的使用,能有效弥补根据自相关图和偏自相关图定阶的主观性,在所有通过检验的模型中使得AIC 或SBC 函数值达到最小的模型为相对最优模型。同时辅助用模型的拟合效果图以及预测结果的合理性来评价模型的优劣。

(二)模型构建的理论基础

在统计研究中,常用按时间顺序排列的一组随机变量 X X X t 21,来表示一个随机事件的时间序列,简记为{}T t X t ∈,或{}X t 。

自1952年以来第三产业每年的产值比重符合时间序列的定义,为了研究发现我国第三产业的发展规律、发展现状以及对未来发展趋势的预测,我们从时间序列分析的角度,运用时间序列分析方法进行统计建模。同时,不同模型的建立对时间序列的拟合与预测会有不同的效果,此处我们用二个不同的统计模型对我们所获得的数据进行分析建模。对一元时间序列分析常用的模型有如下二种:

1、 具有下述结构的模型称为求和自回归移动平均模型,简记为ARIMA(p ,d ,q)模型

()()()()()?????

s s t t t t t d ,0,0,,02

εεεσεεεφε

式中()p

p B B B φφφ---= 11为平稳可逆ARMA (p ,q )模型的自回归系数多项式;()q

q B B B θθΘ---= 11,为平稳可逆ARMA (p ,q )模型的移动平滑系数多项式。

2、残差自回归(Auto-Regressive )模型的构建思想是首先通过确定性因素分解法提取序列中主要的确定性信息:

t

t t t S T x ε++=

t T 为趋势效应拟合,t S 为季节效应拟合。而因素分解法对确定性信息的提取可能不够充分,需要进一步检验残差序列{}t ε的自相关性。

若检验结果显示自相关性不显著,说明上述确定性回归模型对信息的提取比较充分,可以停止分析了。若检验结果显示残差序列自相关性显著,这说明信息 提取不够充分,考虑建立残差序列拟合自回归模型:

()()()??

?

??≥?===+++=++=---1,0,,,02

11i a a Cov a Var a a S T x i t t t t t

p t p t t t

t t t σE εφεφεε 实践中对趋势效应的拟合常用如下两种模型:

(1) 残差自回归(Auto-Regressive )模型,自变量为时间t 的幂函数

t k

k t t t T εβββ++++= 10

(2) 残差自回归(Auto-Regressive )模型,自变量为历史观察值{}k t t t x x x --- ,,21。

t k t k t t x x T εβββ++++=-- 110

四、ARIMA 模型的构建

(一) 时序图

首先,对我国1952年以来的第三产业产值占国内总产值的比重画出时序图,如图1所示。

图1 第三产业占总产值的比重时序图

(二)差分运算及纯随机检验

由时序图可以看出,该序列是非平稳的,因此不能使用ARMA(p,q)模型来建模。又可以看出该序列蕴含着显著曲线趋势,我们可以用低阶(2或3阶)差分来提取曲线趋势的影响,来实现序列趋势的平稳,在实际操作中,二阶差分比较理想,得到二阶差分的时序图如图2所示。

图2 一阶差分后第三产业占总产值的比重时序图

可以看到二阶差分后序列在均值附近比较平稳的波动,比较充分的提取了原序列中蕴含的长期趋势,使得差分序序列不再呈现确定性趋势了。

序列平稳后,我们要对序列做纯随机性检验,检验结果如表1所示。

表1 白噪声检验结果

To Chi- Pr>

Lag Square DF ChiSq --------Autocorrelations---------------------

6 17.52 6 0.0075 -0.242 -0.312 -0.002 0.25

7 -0.204 -0.163

12 23.57 12 0.0233 0.115 0.196 0.025 -0.160 -0.074 0.073

我们取显著性水平为0.05,由于6阶、12阶延迟的p值小于分别为0.0075和0.0233,小于显著性水平,则可以拒绝该序列为随机的原假设,即该时间序列是非随机的,说明数据的继续研究是有意义的。

(三)确定差分后的模型结构

观察序列的自相关图(图3)以及偏自相关图(图4)来确定差分平稳后的模型的结构。

Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1

图3 序列自相关图

Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1

图4 偏自相关图

自相关图中绝大部分的自相关系数都在二倍标准差之内,进一步说明了二阶差分后第三产业产值占国民生产总值的比重序列平稳了。自相关图显示除了延迟2阶的自相关系数在2倍标准差范围之外,其余的自相关系数都在2倍标准差之内波动,根据自相关系数的这个特点可以判断该序列具有短期相关性,同时可以认为该序列自相关系数2阶截尾。

偏自相关图显示出序列有明显的拖尾性。综合自相关和偏自相关的性质,为拟合模型定阶为MA(2),即原始时间序列的模型为ARIMA(0,2,2)模型。

(四)显著性检验

模型确定后需要进行参数的估计以及参数的显著性检验,SAS运行得到的结果如表2所示。

表2 条件最小二乘估计

Parameter Estimate Standard Error t Value Approx Pr > |t| Lag

MU -0.01958 0.04663 -0.42 0.6763 0

MA1,1 0.48242 0.13320 3.62 0.0007 1

MA1,2 0.28748 0.13338 2.16 0.0358 2

结果显示常数项的p值为0.6765大于显著性水平(0.5),即MU不显著,其他参数得p 值均小于显著性水平(0.5),即均显著。则除去常数项,再次进行参数估计,结果如表3所示。

表3 条件最小二乘估计

Parameter Estimate Standard Error t Value Approx Pr > |t| Lag

MA1,1 0.47993 0.13216 3.63 0.0006 1

MA1,2 0.28603 0.13234 2.16 0.0352 2

显然,二个参数的p值很小,二个参数均显著。

整个模型的显著性检验,结果如表4所示。

表4 残差的自相关检验结果

To Lag Chi-Square DF Pr >Chi Sq --------------------Autocorrelations--------------------

6 4.71 4 0.3180 -0.014 -0.070 -0.008 0.188 -0.162 -0.096

12 10.17 10 0.4261 0.124 0.206 0.062 -0.113 -0.064 0.050

18 13.51 16 0.6351 0.071 -0.032 -0.057 0.098 0.149 -0.021

24 27.73 22 0.1848 -0.236 0.054 -0.030 -0.171 -0.197 0.156

可以看出延迟各阶LB统计量的P值显著大于0.05,所以该拟合模型显著立。

(五)拟合模型的具体形式 拟合模型的具体形式为:

Factor 1: 1 - 0.47993 B**(1) - 0.28603 B**(2) 即2

228603.047993.01B

B x t

t --=

或等价记为:

t

t t t t t x x x x x ε++--=----432128603.009213.067383.147993.2

利用拟合模型对序列t x 作5预测,结果如表5所示。

表5 ARIMA 模型的预测结果

Obs Forecast Std Error 95% Confidence 58 40.0642 1.3885 37.3428 42.78 59 40.2244 2.5264 35.2728 45.1760 60 40.3846 3.5092 33.5066 47.262 61 40.5447 4.4649 31.7937 49.2958 62 40.7049 5.4273 30.0676 51.3423

可以看出在未来五年内,第三产业的产值占国内生产总值的比重不会有太大的变化。

五、 残差自回归(Auto-Regressive )模型的构建

(一)建立延迟因变量回归模型 模型参数估计结果如表6所示。

表6 模型参数估计结果

Intercept 1 0.1823 0.9188 0.20 0.8435 Lag x 1 1.0010 0.0302 33.10 <.0001

由上表可以看出,在截距项的显著性检验中得p 值为0.8435不显著,所以去掉截距项对模型重新进行拟合。

表7 最小二乘估计结果

SSE 96.417743 DFE 55

MSE 1.75305 Root MSE 1.32403 SBC 193.373426 AIC 191.348074 Regress R-Square 0.9982 Total R-Square 0.9982 Durbin h 2.0145 Pr > h 0.0220

由于带有延迟因变量,所以该模型中残差自相关检验的输出结果是Durbin h 统计量。由上表可以看出Durbin h 统计量的分布函数值为2.0145,p 值为0.0220<0.05,表示该残差序列存在自相关性,需要对残差序列继续拟合自回归模型。

(二)逐步回归结果

通过建立残差序列自相关图可以得到残差是一阶自相关的,又进行逐步回归向后消除,结果如表8所示。显示除了延迟一阶的序列值显著自相关外,延迟其他阶数的均不具有显著的自相关性,延迟2到8阶的相关项均被消除。

表8 自回归消除不显著项过程 Lag Estimate T Value Pr>|t| 6 -0.028226 -0.18 0.8544 3 -0.044951 -0.30 0.7676 7 -0.090956 -0.67 0.5067 2 0.116159 0.86 0.3928 8 -0.161937 -1.24 0.2198 4 -0.193146 -1.45 0.1542 5

0.181332

1.38

0.1731

(三)修正后的最终拟合模型

收敛状况和极大似然估计结果如表9所示。

表9 极大似然估计结果

SSE 89.1065072 DFE 54 MSE 1.65012 Root MSE 1.28457 SBC 193.062555 AIC 189.011852 Regress R-Square 0.9968 Total R-Square 0.9983

回归系数估计结果如表10 所示。

表10 最终参数估计结果

Variable DF Estimate Error t Value Pr > |t| Lag x 1 1.0064 0.007774 129.47 <.0001

AR1 1 -0.2770 0.1313 -2.11 0.0396

我们可以得到最终的拟合模型为:

???

?+=+=--)

65012.1,0(,2770.00064.1~

,,11N x x d

i i t

t t t t t t εεμμμ

为了得到直观的拟合效果,做拟合效果图,如图5所示。

图5 第三产业模型拟合图

由上图可以我们可以看到观察值与拟合值的拟合效果非常好(星号为原观测值,曲线是拟合曲线)。

六、模型比较选择

对已建立的两个模型的AIC和SBC进行比较,以得到最优模型。比较结果如表11所示。

表11 模型比较

由上表综合比较AIC、SBC、标准差,可以看出Auto-regressive模型整体优于ARIMA模型,所以Auto-regressive模型更适合第三产业占GDP比重的研究。

通过对第三产业数据做时序图和拟合模型可以看出,我国第三产业的发展趋势并不是一成不变的,从1962~1982年间我国的第三产业比重不增反减,这与当时的历史背景有关。经过改革开放的产业调整,直到2000年,第三产业比重有了明显的增长。但好景持续的并不久,2001年之后第三产业的比重虽然也在增加,但发展缓慢,我国的第三产业发展还不完善,可待发展的空间很大,目前第三产业的发展速度与总GDP发展的速度相比还有点缓慢,所以加大第三产业比重还是当务之急。

通过已建立的模型对未来五年的第三产业比重做预测如表12所示。

表12 模型预测值

(*)代表Auto-regressive模型更适合第三产业产值的预测和拟合,在预测时更具有参考价值。

我们从上表中可以直观的看出第三产业的比重在最近一段时间并没有一个质的提高,我们可以通过分析第三产业各行业的比重来优化第三产业结构,促进第三产业的发展。

七、第三产业及其结构分析结论与对策建议

经过上述对各年第三产业占GDP比重的发展趋势的分析,我们发现在1978年改革开放之后第三产业所占的比重迅速增加,增长趋势越来越快。第三产业是国民经济的重要组成部分,其发展水平是衡量经济社会发展程度的重要标志。当前,我国正处于工业化的中期阶段,社会经济的发展正快速步入城市化、市场化、国际化的轨道。加快发展第三产业,提高第三产业在三大产业结构中的比重,是推进产业结构调整、实现经济增长方式根本转变的重要途径;是全面提升综合竞争力,提高国民经济整体素质和居民生活质量的有效途径;是促进经济健康、协调、可持续发展的必然选择;是促进国民经济又好又快发展的有效保证。所以我们对1978年之后第三产业各行业的发展情况做分析得到如图6所示。

整体上来说,餐饮业的产值在第三产业中所占比例5%~6%最少,且一直维持这种状态并没有改善;虽然目前我国房地产产业发展很热,但从数据上直观来看房地产产值在第三产业中的比重10%左右也比较低,但是其一直趋于上升的状态;金融业和交通仓储邮政业都位于中间位置占15%左右,只是交通仓储邮政业的比例再逐年下降,金融业近年来发展较快,只是发展起伏比较大;而批发零售业在我国第三产业产值中所占比例较高占到20%以上,但是在前期发展相对速度表较快,在接下来的几年,该行业产值占整个第三产业产值的比例虽逐渐减少,其他行业如公用事业、居民服务业、旅游业、信息咨询服务业和各类技术服务业,教育、文化、广播、电视、科学研究、卫生、体育和社会福利事业等行业的总和占第三产业总产值接近40%的比重,位居第一。其次,交通、仓邮政业和批发零售业的发展的相对速度波动性比较大,近年来基本趋于稳定。金融业和房地产业发展的相对

速度较快,餐饮业的相对发展速度基本没有变化,其他行业的发展速度波动也比较大。

图6 第三产业各行业的发展趋势比较图

在“十二五”期间乃至更长的一段时期,我国经济发展的重要任务就是转变发展方式、调整经济结构。因而加强和完善服务业统计是转变发展方式、调整经济结构的迫切需要。根据数据分析加上我国的实际情况,第三产业重点发展发展金融、物流两大生产性服务业,提升旅游餐饮娱乐传统优势服务业,培育发展商务和科技两大新兴服务业。

第三产业发展的政策建议:

(一) 加快发展金融服务业:从上述数据看我国的金融服务业仅占15%左右,发展空间依然很大,我们应大力引进国外知名的金融机构、积极发展保险业、大力发展资本市场、引导金融类机构为企业融资服务。

(二) 加快发展现代物流业:物流业是连接各大行业发展的基础,为加快其发展速度,我们要构建布局合理、综合竞争力强的现代物流服务体系,构建物流管理公共信息平台、实施产业互动、加大物流市场开放力度,培育大型物流企业,为协调各行业的发展搭建桥梁。

(三) 提升、发展旅游餐饮娱乐业:旅游餐饮作为服务业的传统产业在第三产业中的比重始终没有很大的增加,这是发展的漏洞。我们应该弥补发展中的不足,勇于创新,构建良好的旅游服务体系,发挥特色,细分旅游市场主题,共创旅游新形象;改善旅行社管理运作模式,提高旅行社的服务水平、服务质量、综合实力和竞争力,逐步与世界接轨;进

一步完善旅游交通;充分利用我国的的旅游资源,促进旅游产品的转型升级;加快星级酒店建设的步伐;引导餐饮业进行服务质量管理体系认证和食品卫生量化分级管理,促进我市餐饮业向规模化、规范化和标准化发展。

我们应该更重视新兴的服务业,提升商贸流通业,大力推进商业结构和业态结构调整,做大、做强商贸流通业;依托各地著名历史文化景点,开发历史与特色文化资源,使之成为具有地方特色、国内外知名的商业街或旅游商业圈;大力发展社区商业和农村商业;改造与提升中高级批发市场,建设具有提升产业竞争力和国际知名度的品牌专业批发市场。加快完善科技服务体系建设;大力构筑创意产业载体,鼓励国内外各类专业技术人员发挥专长创办创意企业;加大对知识产权的保护和专业技术人才的培育与引进力度,建立有效的知识产权保护机制和人才激励机制;积极引导商务服务企业,加快改革创新的步伐;支持和鼓励中介商务服务业的发展;加大开放力度,引进一批境外知名的中介机构,利用发达国家和地区的知识、信息资源,提高整体从业人员的专业素质,发展一批能承接国际业务的优秀中介机构;充分运用高新技术促进商务服务业的发展;鼓励商务服务企业应用信息技术,实现信息管理网络化,大力发展电子商务。

六参考文献

[1]国家统计局国民经济综合统计司. 新中国六十年统计资料汇编:国内生产总值[G]. 中

国统计出版社.

[2]王燕.应用时间序列分析[M].北京:中国人民大学出版社.2008.

[3]吕一清,何跃.基于灰色神经网络的第三产业发展趋势的预测模型(J).统计与决策,2011,328(4):157-159.

[4]李海伦.中国第三产业发展趋势分析及预测(J).经济月刊,2011,147(3):44-45.

附录一

第三产业产值及其比重

资料来源:《新中国六十年统计资料汇编》

附录二

第三产业增加值构成(%)

资料来源:2009年中国统计年鉴

应用时间序列分析习题答案解析整理

第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列 LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 解:1()0.7()()t t t E x E x E ε-=?+ 0)()7.01(=-t x E 0)(=t x E t t x ε=-)B 7.01( t t t B B B x εε)7.07.01()7.01(221Λ+++=-=- 229608.149 .011 )(εεσσ=-= t x Var 49.00212==ρφρ 022=φ 3.2 解:对于AR (2)模型: ?? ?=+=+==+=+=-3.05 .02110211212112011φρφρφρφρρφφρφρφρ 解得:???==15/115 /72 1φφ 3.3 解:根据该AR(2)模型的形式,易得:0)(=t x E 原模型可变为:t t t t x x x ε+-=--2115.08.0 2212122 ) 1)(1)(1(1)(σφφφφφφ-+--+-= t x Var 2) 15.08.01)(15.08.01)(15.01() 15.01(σ+++--+= =1.98232σ ?????=+==+==-=2209.04066.06957.0)1/(1221302112211ρφρφρρφρφρφφρ ?? ? ??=-====015.06957.033222111φφφρφ

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

平稳时间序列的模型

目录 摘要 (1) 第一章绪论 (2) 1.1 时间序列模型的发展及其作用 (2) 1.2 什么是时间序列模型 (2) 1.3 本文研究的主要方法和手段 (2) 1.4 本文主要研究思路及内容安排 (2) 第二章 ARMA模型 (4) 2.1 ARMA模型的基本原理 (4) 2.2 样本自协方差函数、自相关函数和偏相关函数 (4) 2.3 ARMA模型识别方法 (5) 2.4 模型参数估计 (6) 第三章实例分析 (7) 3.1 题目 (7) 3.2 问题分析 (7) 3.3 问题求解 (8) 3.3.1数据的观测 (8) 3.3.2数据处理 (8) 3.3.3求解自相关和偏相关函数 (8) 3.4 模型的识别及求解 (9) 3.5 结论 (11) 参考文献 (12) 附录 (12) 评阅书 (15)

《随机过程》课程设计任务书

摘要 ARMA模型是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。ARMA模型广泛应用在经济、工程等各个领域得益于其在具体预测方面的优势。在许多方面用该模型所作出的预测比其他传统经济计量方法更加精确。平稳时间序列模型主要有自回归模型(AR)、滑动平均模型(MA)和自回归滑动平均模型(ARMA)等,这些线性模型考虑因素较简单。自回归滑动平均模型(ARMA)计算简单,易于实时更新数据。 本文描述了ARMA模型的原理、自相关函数和偏相关函数的计算过程、模型的识别方法以及ARMA模型的计算过程。并给出一组平稳时间序列的数据,对数据进行分析和处理,求出自相关系数和偏相关,并利用MATLAB软件画出自相关系数和偏相关图形,有图可知它们都是拖尾的,因此可以确定是) ARMA模 p , (q 型。接下来就是确定) ARMA的阶数,本文采用了AIC准则确定模型的阶数, p , (q 在实际问题中,为使线性模型简单起见,通常p与q的数值被取得较小,却需都不为零。确定阶数后,就用我们学过的求解方法解出未知的参数,这样我们就得到了混合模型的表达式。 关键字:) ARMA模型,自相关函数,偏相关函数 p , (q

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 --c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2c λ=3c λ=-

时间序列分析资料报告——ARMA模型实验

基于ARMA模型的社会融资规模增长分析 ————ARMA模型实验

第一部分实验分析目的及方法 一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。 第二部分实验数据 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量 社会融资规模指一定时期(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。 本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。 第三部分 ARMA模型构建 3.1判断序列的平稳性 首先绘制出M的折线图,结果如下图:

图3.1 社会融资规模M曲线图 从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。 为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图3.2 lm曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图 表3.1 lm的自相关图 上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下: 表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

典型时间序列模型分析

实验1典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型: AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对 对上述三种模型进行统计特性分析,通过对2阶模型的仿真分析,探讨几种模型的适用范围, 并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有AR(2)模型, X( n)=-0.3X( n-1)-0.5X( n-2)+W( n) 其中:W(n)是零均值正态白噪声,方差为 4。 (1 )用MATLAB 模拟产生X(n)的500观测点的样本函数,并绘出波形 (2) 用产生的500个观测点估计X(n)的均值和方差 (3) 画出理论的功率谱 (4) 估计X(n)的相关函数和功率谱 【分析】给定二阶的 AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, 可以看出, FX w 完全由两个极点位置决定。 对于AR 模型的自相关函数,有下面的公式: \(0) 打⑴ 匚⑴… ^(0) ■ 1' G 2 W 0 JAP) 人9-1)… 凉0) _ 这称为Yule-Walker 方程,当相关长度大于 p 时,由递推式求出: r (r) + -1) + -■ + (7r - JJ )= 0 这样,就可以求出理论的 AR 模型的自相关序列。 H(z) 二 1 1 0.3z , P x w +W 1 1 a 才 a 2z^

1. 产生样本函数,并画出波形 2. 题目中的AR过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为 2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2阶AR过程 plot(x,'r'); ylabel('x(n)'); title(' 邹先雄——产生的AR随机序列'); grid on; 得到的输出序列波形为: 邹先雄——产生的AR随机序列 2. 估计均值和方差 可以首先计算出理论输出的均值和方差,得到m x =0 ,对于方差可以先求出理论自相 关输出,然后取零点的值。

时间序列分析基于R——习题答案

第一章习题答案 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 Au+ocorreliil. i ons Correlation -1 M 7 6 5 4 3 2 1 0 I ; 3 4 5 6 7 9 9 1 1.00000■Hi ■ K. B H,J B ik L L1■* J.1 jA1-.IM L L* rn^rp ■ i>i?iTwin H'iTiii M[lrp i,*nfr 'TirjlvTilT'1 iBrp O.7QOO0■ill. Ii ill ■ _.ill?L■ ill iL si ill .la11 ■ fall■ 1 ■ rpTirp Tp和阳申■丽轉■晒?|?卉(ft 0.41212■强:料榊<牌■ 0.14343'■讯榊* -.07078■ -.25758, WWHOHHf ■ -.375761 marks two 总t and&rd errors 2.2 (1) 非平稳,时序图如下 (2) - ( 3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

Ctorrelat ion LOOOOO n.A'7F1 0.72171 0.51252 Q,34982 0.24600 0.20309 0.?1021 0.26429 0.36433 0.49472 0.58456 0.60198 0.51841 Q ?菲晡 日 0.20671 0.0013& -,03243 -.02710 Q.01124 0,08275 0.17011 Autocorrel at ions raarka two standard errors 2.3 (1) 自相关系数为: 0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2 )平稳序列 (3) 白噪声序列 2.4 LB=4.83 , LB 统计量对应的分位点为 0.9634 , P 值为0.0363。显著性水平 :-=0.05,序列 不能视为纯随机序列。 2.5 (1) 时序图与样本自相关图如下 AuEocorreI ati ons 弗卅制iti 电卅栅冷卅樹 側樹 榊 惟 1 ■ liihCidi iliihQriHi il>LljU_nll Hnlidiili Hialli iT ,, T^,, T^s ?T* iTijTirr ,^T 1 IT * -i> ■> - ■ ■ *畑** ? ■ ■ 耶曲邯 ? ■ ■ ■ >|{和怦I {册卅KHi 笊出恸 mrpmrp 山!rpEHi erp . 卑*寧* a 1 *

时间序列分析及VAR模型

Lecture 6 6. Time series analysis: Multivariate models 6.1Learning outcomes ?Vector autoregression (VAR) ?Cointegration ?Vector error correction model (VECM) ?Application: pairs trading 6.2Vector autoregression (VAR)向量自回归 The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable? 传统的线性回归模型假设严格的外主性,误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。 We now relax bo什]assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR模型可以'"l作是在一般的自回归过程中加入时间序列。 Lefs look at a standard AR(p) process for hvo variables (y( and xj? (1)%= Ql + 琅]仇『一 +仏 (2)x t = a2 + - + £2t The next step is to allow that lagged values of xt can affect y( and vice versa. This means that we obtain a system of equations for two dependent variables(y(and xj?Both dependent variables are influenced by past realisations of y(and x t. By doing that, we violate strict exogeneity (see Lecture 2); however, we can use a more relaxed concept, namely weak exogeneity?As we use lagged values of bodi dependent variables, we can argue that these lagged values are known to us, as we observed them in the previous period? We call these variables predetermined? Predetermined (lagged) variables fulfil weak exogeneity in the sense that they have to be uncorrelated with the contemporaneoiis error term in t? We can still use OLS to estimate the following system of equations, which is called a VAR in reduced form. (3)+y 仇1化_丫+sr=i ^12 +£it (4)X t = a2+2X1021”—, + _i + f2t

时间序列分析——最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事! Long long ago,有多long估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。

好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。 2、统计时序分析 (1)频域分析方法 原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动 发展过程: 1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律 2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数 3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段 特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性 (2)时域分析方法

基于时间序列模型的中国GDP增长预测分析

第33卷 第178期2012年7月 财经理论与实践(双月刊) THE THEORY AND PRACTICE OF FINANCE AND ECONOMICS Vol.33 No.178 Jul. 2012 ·信息与统计· 基于时间序列模型的中国GDP增长预测分析 何新易 (南通大学商学院,江苏南通 226019)* 摘 要:作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,如果能够对GDP做出正确的预测,必然可以有效引导宏观经济健康发展,为高层管理部门提供决策依据。选用适合短期预测的ARIMA模型对中国1952~2010年的GDP进行计量建模分析,预测结果认为未来五年中国的经济增长仍将处于一个水平较高的上升通道。 关键词:时间序列模型;GDP;预测 中图分类号:F234 文献标识码: A 文章编号:1003-7217(2012)04-0096-04 一、引 言 作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,国内生产总值(Gross Domestic Product,GDP)对于判断经济态势运行、衡量经济综合实力、正确制定经济政策等诸多方面,以及在经济研究实际工作中,均起着不可替代的重要作用。 熊志斌(2011)深入分析了时间序列模型与神经网络(NN)模型的优势和劣势,按照两种模型的预测特性,在比较的基础之上,分别构建了ARIMA模型和NN模型,并根据一定算法对两种模型进行了集成。将GDP时间序列的数据结构,根据在非线性空间和线性空间的预测优势,进一步分解为线性非线性残差和自相关主体两部分,即首先用ARIMA分析技术构建线性主体模型,然后用NN模型估计非线性残差,再对序列的整个预测结果进行最终集成。仿真实证结果表明:与单一模型相比,集成模型的预测准确率显著提高,进行GDP预测当然使用集成模型更为有效[1]。桂文林和韩兆洲(2011)认为由于迄今为止,包括季度GDP在内的经季节调整之后的经济数据,中国政府尚未进行公布,不但无法进行国际之间的横向比较,也不利于监测中国宏观经济态势。本文运用1996年第1季度至2009年第4季度的中国实际GDP数据,构建了状态空间模型,使用卡尔曼滤波迭代算法对季节调整模型状态向量的 各分量,进行了最优平滑、预测和估计,并使用极大似然方法估计了超参数。经过对GDP的主要季节和趋势特征的分析,计算出了环比增长率指标来监测和分析经济走势,并与国际通用的TRAMO-SEATS季节调整模型进行了对比,以便鉴别趋势拐点,制定相关的经济政策[2]。高帆(2010)运用1952~2008年的上海GDP增长率数据,实证研究其内在变动机制,将GDP增长率分解为纯生产率效应、纯劳动投入效应、纯生产结构效应、纯劳动结构效应,并分析了这四种效应之间的交互影响。结果表明:在上海GDP增长率提高的四种效应之中,纯生产率效应起到了关键作用。上海GDP增长率自1978年改革开放之后,在整体上对纯生产率效应的依赖度趋于增强。在1978~1989年期间,纯劳动结构效应是GDP增长的主要因素,由于市场化改革的进一步加大,劳动力跨部门流转在很大程度上得以实现。在1990~2008年期间,纯生产率效应是GDP增长的主要因素,正是由于在此历史阶段,由于资本深化进一步加速,从而有效提高了部门劳动生产率。基于实证的研究结论,可以针对性地制定出今后上海市经济实现持续增长的若干宏观政策[3]。腾格尔和何跃(2010)利用中国季度GDP数据分别构建了ARIMA和ARCH模型,同时利用GMDH自组织方法尝试建模,经过Bon-ferroni-Dunn检验,表明与单一模型相比,组合模型的拟合能力更强。研究表明,基于GMDH组合的GDP模 *收稿日期: 2012-02-12 作者简介: 何新易(1966—),男,湖北武汉人,南通大学商学院副教授,经济学博士,研究方向:宏观国民经济问题、中国企业集团融资和投资。

基于时间序列序列分析优秀论文

梧州学院 论文题目基于时间序列分析梧州市财政 收入研究 系别数理系 专业信息与计算科学 班级 09信息与计算科学 学号 200901106034 学生姓名胡莲珍 指导老师覃桂江 完成时间

摘要 梧州市财政收入主要来源于基金收入,地方税收收入和非税收收入等几方面。近年来梧州市在自治区党委、自治区政府和市委的正确领导下,全市广大干部群众深入贯彻落实科学发展观,抢抓机遇,开拓进取,克难攻坚,使得全市经济连续几年快速发展,全市人民的生活水平也大幅度提高,但伴随着发展的同时也存在一些问题,本文主要通过研究分析梧州财政收入近几年的状况,根据采用时间序列分析中的一次简单滑动平均法研究分析梧州市财政收入和支出的情况,得到的结果是梧州市财政收入呈现下降状态,而财政支出却逐年上涨,这种状况将导致梧州市人民生活水平下降,影响梧州市各方面的发展。给予一些有益于梧州市财政发展的建议。本文首先介绍主要运用的时间序列分析的概念及其一次简单滑动平均法的方法,再用图表说明了梧州市财政近几年的财政收入和支出状况,然后建立模型,分析由时间序列分析方法得出的对2012年财政收入状况的预测结果,最后,鉴于提高梧州市财政收入的思想,给予了一些合理性建议,比如:积极实施工业强县战略,壮大工业主导财源;大力发展第三产业,强化地方财源建设;完善公共财政支出机制,着力构建和谐社会。 关键词:梧州市;财政收入;时间序列分析;建立模型;建议

Based onThe Time Series Analysis of Wuzhou city Finance Income Studies Abstract Wuzhou city, fiscal revenue mainly comes from fund income, local tax revenue and the tax revenue etc. Wuzhou city in recent years in the autonomous region party committee, the government of the autonomous region and the municipal party committee under the correct leadership, the cadres and masses thoroughly apply the scientific outlook on development, catch every opportunity, pioneering and enterprising, g hard, make the crucial economic rapid development for several years, the people's living standard has also increased significantly, but with the development at the same time, there are also some problems, this paper mainly through the research and analysis the condition of wuzhou fiscal revenue in recent years, according to the time series analysis of a simple moving average method research and analysis of financial income and expenditure wuzhou city, the result obtained is wuzhou city, fiscal revenue decline present condition, and fiscal spending is rising year by year, the situation will lead to wuzhou city, the people's living standards decline, influence all aspects of wuzhou city development. Give some Suggestions on the development of the financial benefit wuzhou city. This paper first introduces the main use of the time series analysis of the concept and a simple moving average method method, reoccupy chart illustrates the wuzhou city, in recent years the financial revenue and expenditure situation, then set a model, analysis the time series analysis method to draw 2012 fiscal income condition prediction results, finally, in view of wuzhou city, improve the financial income thoughts, give some advice, for instance: rationality vigorously implement the strategy of industrial county, strengthen the industry leading financial sources, A vigorous development of the third industry, and to strengthen the construction of local revenue;

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

Eviews时间序列分析实例.

Eviews时间序列分析实例 时间序列是市场预测中经常涉及的一类数据形式,本书第七章对它进行了比较详细的介绍。通过第七章的学习,读者了解了什么是时间序列,并接触到有关时间序列分析方法的原理和一些分析实例。本节的主要内容是说明如何使用Eviews软件进行分析。 一、指数平滑法实例 所谓指数平滑实际就是对历史数据的加权平均。它可以用于任何一种没有明显函数规律,但确实存在某种前后关联的时间序列的短期预测。由于其他很多分析方法都不具有这种特点,指数平滑法在时间序列预测中仍然占据着相当重要的位置。 (-)一次指数平滑 一次指数平滑又称单指数平滑。它最突出的优点是方法非常简单,甚至只要样本末期的平滑值,就可以得到预测结果。 一次指数平滑的特点是:能够跟踪数据变化。这一特点所有指数都具有。预测过程中添加最新的样本数据后,新数据应取代老数据的地位,老数据会逐渐居于次要的地位,直至被淘汰。这样,预测值总是反映最新的数据结构。 一次指数平滑有局限性。第一,预测值不能反映趋势变动、季节波动等有规律的变动;第二,这种方法多适用于短期预测,而不适合作中长期的预测;第三,由于预测值是历史数据的均值,因此与实际序列的变化相比有滞后现象。 指数平滑预测是否理想,很大程度上取决于平滑系数。Eviews提供两种确定指数平滑系数的方法:自动给定和人工确定。选择自动给定,系统将按照预测误差平方和最小原则自动确定系数。如果系数接近1,说明该序列近似纯随机序列,这时最新的观测值就是最理想的预测值。 出于预测的考虑,有时系统给定的系数不是很理想,用户需要自己指定平滑系数值。平滑系数取什么值比较合适呢?一般来说,如果序列变化比较平缓,平滑系数值应该比较小,比如小于0.l;如果序列变化比较剧烈,平滑系数值可以取得大一些,如0.3~0.5。若平滑系数值大于0.5才能跟上序列的变化,表明序列有很强的趋势,不能采用一次指数平滑进行预测。 [例1]某企业食盐销售量预测。现在拥有最近连续30个月份的历史资料(见表l),试预测下一月份销售量。 表1 某企业食盐销售量单位:吨 解:使用Eviews对数据进行分析,第一步是建立工作文件和录入数据。有关操作在本

平稳时间序列模型及其特征

第一章平稳时间序列模型及其特征 第一节模型类型及其表示 一、自回归模型(AR) 由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系。最简单的一种前后依存关系就是变量当前的取值主要与其前一时期的取值状况有关。用数学模型来描述这种关系就是如下的一阶自回归模型: X t=φX t-1+εt(2.1.1)常记作AR(1)。其中{X t}为零均值(即已中心化处理)平稳序列,φ为X t对X t-1的依赖程度,εt为随机扰动项序列(外部冲击)。 如果X t 与过去时期直到X t-p的取值相关,则需要使用包含X t- X t-p在内的p阶自回归模型来加以刻画。P阶自回归模型的一1 ,…… 般形式为: X t=φ1 X t-1+φ2 X t-2+…+φp X t-p+εt(2.1.2)为了简便运算和行文方便,我们引入滞后算子来简记模型。设B 为滞后算子,即BX t=X t-1, 则B(B k-1X t)=B k X t=X t-k B(C)=C(C为常数)。利用这些记号,(2.1.2)式可化为: X t=φ1BX t+φ2B2X t+φ3B3X t+……+φp B p X t+εt 从而有: (1-φ1B-φ2B2-……-φp B p)X t=εt 记算子多项式φ(B)=(1-φ1B-φ2B2-……-φp B P),则模型可以表

示成 φ(B)X t=εt (2.1.3) 例如,二阶自回归模型X t=0.7X t-1+0.3X t-2+0.3X t-3+εt可写成(1-0.7B-0.3B2)X t=εt 二、滑动平均模型(MA) 有时,序列X t的记忆是关于过去外部冲击值的记忆,在这种情况下,X t可以表示成过去冲击值和现在冲击值的线性组合,即 X t=εt-θ1εt-1-θ2εt-2-……-θqεt-q (2.1.4) 此模型常称为序列X t的滑动平均模型,记为MA(q),其中q为滑动平均的阶数,θ1,θ2…θq为参滑动平均的权数。相应的序列X t称为滑动平均序列。 使用滞后算子记号,(2.1.4)可写成 X t=(1-θ1B-θ2B2-……- θq B q)q t=θ(B)εt (2.1.5) 三、自回归滑动平均模型 如果序列{X t}的当前值不仅与自身的过去值有关,而且还与其以前进入系统的外部冲击存在一定依存关系,则在用模型刻画这种动态特征时,模型中既包括自身的滞后项,也包括过去的外部冲击,这种模型叫做自回归滑动平均模型,其一般结构为: X t=φ1X t-1+φ2X t-2+……+φp X t-p+εt-θ1εt-1-θ2εt-2-……-θqεt-q (2.1.6) 简记为ARMA(p, q)。利用滞后算子,此模型可写为 φ(B)X t=θ(B)εt(2.1.7)

基于时间序列模型与线性回归模型的历史数据预测

基于时间序列模型与线性回归模型的历史数据预测 摘要:本文通过具体案例,简要说明根据时间序列数据建立和相应经济理论建立线性回归模型的简要步骤及基本原则,并着重介绍了在模型建立和模型有效性检验过程中需要注意的三个主要问题,最后简单介绍了进行模型修正的相应方法。 一、引言 多元线性回归模型的一般形式为: Y=β0+β1X1+β2X2+…+βkXk+μi(k,i=1,2,…,n) 其中k为解释变量的数目,βk(k=1,2,…,n)称为回归系数,上式也被称为总体回归函数的随机表达式。 从统计意义上说,所谓时间序列模型就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。从数学意义上说,如果我们对某一过程中的某一个变量或一组变量X(t)进行观察测量,在一系列时刻t1,t2,…,tn(t为自变量,且t1

相关文档
最新文档