时间序列Stata

统计学第四版贾俊平人大_回归与时间序列stata

回归分析与时间序列一、一元线性回归 11.1 （1）编辑数据集，命名为linehuigui1.dat 输入命令scatter cost product,xlabel(#10, grid) ylabel(#10, grid)，得到如下散点图，可以看到，产量和生产费用是正线性相关的关系。（2）输入命令reg cost product，得到如下图：可得线性函数（product为自变量，cost为因变量）：y=0.4206832x+124.15,即β0=124.15，β1=0.4206832 （3）对相关系数的显著性进行检验，可输入命令pwcorr cost product, sig star(.05) print(.05)，得到下图：

可见，在α=0.05的显著性水平下，P=0.0000<α=0.05，故拒绝原假设，即产量和生产费用之间存在显著的正相关性。 11.2 （1）编辑数据集，命名为linehuigui2.dat 输入命令scatter fenshu time,xlabel(#4, grid) ylabel(#4, grid)，得到如下散点图，可以看到，分数和复习时间是正线性相关的关系。 2）输入命令cor fenshu time计算相关系数，得下图：可见，r=0.8621，可见分数和复习时间之间存在高度的正相关性。 11.3 （1）（2）对于线性回归方程y=10-0.5x，其中β0=10，表示回归直线的截距为10；β1=-0.5，表示x变化一单位引起y的变化为-0.5。（3）x=6时，E(y)=10-0.5*6=7。 11.4 （1），判定系数测度了回归直线对观测数据的拟合程度，即在分数的变差中，有90%可以由分数与复习时间之间的线性关系解释，或者说，在分数取值的变动中，

运用stata进行时间序列分析

运用stata进行时间序列分析 1 时间序列模型结构模型虽然有助于人们理解变量之间的影响关系，但模型的预测精度比较低。在一些大规模的联立方程中，情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测，因此随着Box and Jenkins(1984)等奠基性的研究，时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型，从平稳过程到非平稳过程，时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法，ARIMA模型、ARCH族模型、 VAR模型、VEC模型、单位根检验及协整检验等。一、基本命令 1.1时间序列数据的处理 1)声明时间序列：tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点：tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值：tsfill tsfill tsreport, report list list in 1/12 4)追加样本：tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum 2 5)应用：样本外预测： predict reg gnp96 L.gnp96 predict gnp_hat list in -10/-1 6)清除时间标识： tsset, clear tsset, clear 1.2变量的生成与处理 1)滞后项、超前项和差分项 help tsvarlist use gnp96.dta, clear tsset date gen Lgnp = L.gnp96 /*一阶滞后*/ gen L2gnp = L2.gnp96 gen Fgnp = F.gnp96 /*一阶超前*/ gen F2gnp = F2.gnp96 gen Dgnp = D.gnp96 /*一阶差分*/ gen D2gnp = D2.gnp96 list in 1/10 list in -10/-1 2)产生增长率变量：对数差分 gen lngnp = ln(gnp96) gen growth = D.lngnp gen growth2 = (gnp96-L.gnp96)/L.gnp96 gen diff = growth - growth2 /*表明对数差分和变量的增长率差别很小*/ list date gnp96 lngnp growth* diff in 1/10 1.3日期的处理日期的格式 help tsfmt 基本时点：整数数值，如 -3, -2, -1, 0, 1, 2, 3 .... 1960年1月1日，取值为 0； 3 显示格式：定义含义默认格式%td 日%tdDlCY %tw 周%twCY!ww %tm 月 %tmCY!mn %tq 季度 %tqCY!qq %th 半年 %thCY!hh %ty 年 %tyCY 1）使用tsset 命令指定显示格式 use B6_tsset.dta, clear tsset t, daily list use B6_tsset.dta, clear tsset t, weekly list 2)指定起始时点 cap drop month generate month = m(1990-1) + _n - 1 format month %tm list t month in 1/20 cap drop year gen year = y(1952) + _n - 1 format year %ty list t year in 1/20 3）自己设定不同的显示格式日期的显示格式 %d (%td) 定义如下： %[-][t]d<描述特定的显示格式> 具体项目释义： “<描述特定的显示格式>”中可包含如下字母或字符 c y m l n d j h q w _ . , ： - / ' !c C Y M L N D J W 定义如下： c an d C 世纪值(个位数不附加/附加0)

时间序列模型stata 基本命令汇总..

时间序列模型结构模型虽然有助于人们理解变量之间的影响关系，但模型的预测精度比较低。在一些大规模的联立方程中，情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测，因此随着Box and Jenkins(1984)等奠基性的研究，时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型，从平稳过程到非平稳过程，时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法，ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。一、基本命令 1.1时间序列数据的处理 1)声明时间序列：tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点：tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值：tsfill tsfill tsreport, report list list in 1/12 4)追加样本：tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum

Stata时间序列笔记

文档结尾是FAQ和var建模的15点注意事项【梳理概念】向量自回归(VAR, Vector Auto regression)常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。 VAR模型： VAR方法通过把系统中每一个内生变量，作为系统中所有内生变量的滞后值的函数来构造模型，从而回避了结构化模型的要求。 VAR模型对于相互联系的时间序列变量系统是有效的预测模型，同时，向疑自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响，而不存在同期影响关系，则适合建立VAR模型，因为VAR模型实际上是把当期关系隐含到了随机扰动项之中。协整： Engle和Granger (1987a)指岀两个或多个非平稳时间序列的线性组合可能是平稳的。假如这样一种平稳的或的线性组合存在，这些非平稳(有单位根)时间序列之间被认为是具有协整关系的。这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。 * 第六讲时间序列分析 *一一目录—— ? d?简介 *6」时间序列数据的处理 d ■平稳时间序列模型 * 6.2 ARIMA 模型 * 6.3 VAR 模型非平稳时间序列模型一近些年得到重视，发展很快 * 6.4非平稳时间序列简介 * 6.5单位根检验——检验非平稳 * 6.6协整分析一一非平稳序列的分析黑-自回归条件异方差模型 * 6.7 GARCH模型一一金融序列不同时点上序列的差界反映动态关系的时间数据顺序不可颠倒 cd d:\stata 10\ado\personal\Net_Course\B6_TimcS *时间序列数据的处理help time *声明时间序列:tsset命令 use gnp96.dta, clear list in 1/20

与时间序列相关的STATE命令及其统计量的解析

与时间序列相关的STATE命令及其统计量的解析与时间序列相关的STATA 命令及其统计量的解析残差U 序列相关： ①DW 统计量——针对一阶自相关的（高阶无效) STATA 命令： 1.先回归 2.直接输入dwstat 统计量如何看：查表②Q 统计量——针对高阶自相关correlogram-Q-statistics STATA 命令： 1．先回归reg 2．取出残差predict u,residual(不要忘记逗号) 3． wntestq u Q 统计量如何看：p 值越小（越接近0）Q 值越大——表示存在自相关具体自相关的阶数可以看自相关系数图和偏相关系数图：STATA 命令：自相关系数图： ac u( 残差) 或者窗口操作在Graphics ——Time-series graphs ——correlogram(ac) 偏相关系数图： pac u 或者窗口操作在Graphics——Time-series graphs—— (pac) 自相关与偏相关系数以及Q 统计量同时表示出来的方法： corrgram u 或者是窗口操作在 Statistics——Time-series——Graphs—— Autocorrelations&Partial autocorrelations ③LM 统计量——针对高阶自相关 STATA 命令： 1．先回归reg 2．直接输入命令 estate bgodfrey,lags(n) 或者窗口操作在 Statistics——Postestimation(倒数第二个)——Reports and Statistics(倒数第二个) ——在里面选择 Breush-Godfrey LM（当然你在里面还可以找到方差膨胀因子还有DW 统计量等常规统计量) LM 统计量如何看：P 值越小（越接近 0）表示越显著（显著拒绝原假设），存在序列相关具体是几阶序列相关，你可以把滞后期写为几，当然默认是 1，（通常的方法是先看图，上面说的自相关和偏相关图以及Q 值，然后再利用LM 肯定）。平稳时间序列存在自相关的问题的解决方案残差出现序列相关的补救措施：一阶自相关最近简单的方法是用AR(1)模型补救，就是在加一个残差的滞后项即可。高阶的自相关用AR(n)模型补救。 AR 模型的识别与最高阶数的确定：可以通过自相关系数来获得一些有关 AR(p) 模型的信息，如低阶 AR(p) 模型系数符号的信息。但是，对于自回归过程AR(p)，自相关系数并不能帮助我们确定 AR(p) 模型的阶数 p。所以，可以考虑使用偏自相关系数 k,k，以便更加全面的描述自相关过程AR(p)的统计特征。且对于一个AR(p) 模型， k,k 的最高阶数为p，也即AR(p) 模型的偏自相关系数是 p 阶截尾的。因此，可以通过识别AR(p)模型的偏

与时间序列相关的STATA-命令及其统计量的解析

与时间序列相关的STATA 命令及其统计量的解析残差U 序列相关： ①DW 统计量——针对一阶自相关的（高阶无效） STATA 命令： 1.先回归 2.直接输入dwstat 统计量如何看：查表 ②Q 统计量——针对高阶自相关correlogram-Q-statistics STATA 命令： 1．先回归reg 2．取出残差predict u,residual(不要忘记逗号) 3． wntestq u Q 统计量如何看：p 值越小（越接近0）Q 值越大——表示存在自相关具体自相关的阶数可以看自相关系数图和偏相关系数图： STATA 命令：自相关系数图: ac u( 残差) 或者窗口操作在 Graphics ——Time-series graphs —— correlogram(ac) 偏相关系数图: pac u 或者窗口操作在Graphics——Time-series graphs—— (pac) 自相关与偏相关系数以及Q 统计量同时表示出来的方法： corrgram u或者是窗口操作在 Statistics——Time-series——Graphs——Autocorrelations&Partial autocorrelations ③LM 统计量——针对高阶自相关 STATA 命令： 1．先回归reg 2．直接输入命令estate bgodfrey,lags(n) 或者窗口操作在 Statistics——Postestimation(倒数第二个)——Reports and Statistics(倒数第二个) ——在里面选择 Breush-Godfrey LM（当然你在里面还可以找到方差膨胀因子还有DW 统计量等常规统计量） LM 统计量如何看： P 值越小（越接近 0）表示越显著（显著拒绝原假设），存在序列相关具体是几阶序列相关，你可以把滞后期写为几，当然默认是 1，（通常的方法是先看图，上面说的自相关和偏相关图以及Q 值，然后再利用LM 肯定）。平稳时间序列存在自相关的问题的解决方案残差出现序列相关的补救措施： 1、一阶自相关 : 最近简单的方法是用AR(1)模型补救，就是在加一个残差的滞后项即可。 2、高阶的自相关: 用AR(n)模型补救。

时间序列分析STATA 第三课

第三课：ARMA/ARIMA建模及预测核心问题：1，前提：同方差，因此，不用考虑不同时刻变量的离散性； 2，建立的是变量分布的均值模型，也就是，随机变量分布的均值所在的位置 3，难点在于，时间序列数据建立模型并没有唯一性以quarterly.dta的数据来说明。这个数据是美国的季度GDP数据，数据从1947年一季度开始，到2012年一季度结束。研究对象，GDP，存在通货膨胀问题。所以要用GDP平减指数（GDP Deflator）进行矫正，这里是以2005年的美元作为基准的。所以考察变量是GDP2005，即以2005年的美元作为基准的各季度的GDP 真实值。一，一些基本符号： D L F 二，建立模型：前期准备：观察时序图相关命令：tsset, tsline/twoway

从图上可以看出，GDP2005值呈线性的向右上方倾斜，第一种方法：可以用确定性分析理的方法，使用研究变量对时间变量进行回归即：regress lrgdp date （采用的是最小二乘估计）然后对残差项进行White Noise 检验观察此图：特征大值跟大值，小值跟小值，这说明Residual 中存在着自相关信息。肯定不是White Noise 因此，从这里看出，确定性的方法比较直观，简单，但效果不好，弥补：对残差序列进行回归，建立AR 模型，这就是所谓的残差自回归模型。第二种方法 BOX-JENKINS 方法，也就是通常所说的ARMA(p,d) /ARIMA(p,d,d)建模（采用的是最大似然估计）。四大步骤：1、模型识别Identification ：决定p 和q 2、模型估计Estimation ：估计εσθφμ 个），（，个）（， q p 3、模型检验Diagnostic Checking 4、模型优化Parsimony