时间序列分析及VAR模型
VAR模型的原理及应用
VAR模型的原理及应用
1. 引言
VAR(Vector Autoregression)模型是一种常用的计量经济学模型,用于分析
多个相关时间序列变量之间的动态关系。VAR模型在宏观经济学、金融学、营销
研究等领域具有广泛的应用。本文将介绍VAR模型的原理以及其在实际应用中的
一些特点和注意事项。
2. VAR模型的原理
VAR模型是基于时间序列数据的统计模型,它假设各个时间序列变量之间存在互相影响的关系。VAR模型的核心思想是用当前变量的过去值和其他相关变量的
过去值来预测当前变量的值。具体来说,VAR模型可以表示为如下形式:$$ X_t = \\alpha_1X_{t-1} + \\alpha_2X_{t-2} + \\cdots + \\alpha_pX_{t-p} +
\\epsilon_t $$
其中,X t表示当前时间点的变量向量,$\\alpha_1, \\alpha_2, \\cdots,
\\alpha_p$是模型的参数,$X_{t-1}, X_{t-2}, \\cdots, X_{t-p}$表示过去几个时间点
的变量向量,$\\epsilon_t$表示误差项。
VAR模型的核心在于确定模型的参数和滞后阶数p。参数的估计可以使用最小
二乘法、极大似然法等方法。滞后阶数的选择可以通过信息准则(如赤池信息准则、贝叶斯信息准则)来确定,一般通过对比不同滞后阶数下模型的拟合优度。
3. VAR模型的应用
VAR模型具有广泛的应用场景,以下是一些常见的应用情况:
3.1 宏观经济学中的应用
对于宏观经济学研究来说,VAR模型可以用于分析不同经济指标之间的关系,
时间序列分析报告——VAR模型实验
基于VAR模型的我国房地产市场与汇率
波动的因果关系
————VAR模型实验
第一部分实验分析目的及方法
现选取人民币对美元汇率以及商品房房价作为变量构建VAR模型。对于不满足单位根检验的序列采取对数化或差分处理,使其成为平稳序列再进行模型的拟合。对于商品房房价这一变量,由于全国各省市差异较大,故此处采用全国房地产开发业综合景气指数这一变量。此外,为了消除春节假期不固定因素带来的影响,增强数据的可比性,按照国家统计制度,从2012年起,不单独对1月份统计数据进行调查,1-2月份数据一起调查,一起发布。所以国房景气指数p这一序列缺少每年一月份的相关数据,属于非随机、不可忽略缺失,在此采用平均值填充的方法,补足数据。
第二部分实验样本
2.1数据来源
数据来源于中经网统计数据库。具体数据见附录表。
2.2所选数据变量
由于我国于2005年7月实行第二次汇改,此次汇改以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度取代了过去人民币汇率长达10年的紧盯美元的固定汇率体制。故本实验拟选取2005年07月到2014年10月我国以月为单位的数据。,用以上两个变量来构建VAR模型,并利用该模型进行分析预测。
第四部分模型构建
4.1判断序列的平稳性
4.1.1汇率E序列
首先绘制出E的折线图,结果如下图:
图4.1 汇率E的曲线图
从图中可以看出,汇率E序列较强的趋势性,由此可以初步判断该序列是非平稳的。为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下:
图4.2 lm的曲线图
对数化后的趋势性减弱,但仍存在一定的趋势性,下面对lm进行一阶差分处理,去除趋势性,得到新变量dlm,观察dlm的曲线图。
基于时间序列var模型
基于时间序列var模型
时间序列分析是用来研究随时间变化而变化的数据的一种统计方法。而基于时间序列VAR模型是一种全面有效、广泛应用、具有计算简便、实用性强的时间序列分析方法。
一、什么是时间序列VAR模型
VAR,代表向量自回归(Vector AutoRegression),是一种多元时间序列预测模型,其特点是有两个或两个以上的时间序列变量互相引导,以及对自身滞后项进行解释。因此,VAR模型涵盖了自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)等传统时间序列分析方法。
具有向量、自回归解释和一个阶段的VAR模型被称作VAR(p)模型,其中“p”代表自回归项的数量,该模型的目标是确定因变量和自变量之间的关系。
二、如何构建时间序列VAR模型
1. 数据准备
数据应包含所需的时间序列,数据应保证几乎按相同的频率收集,例如每天、每月或每季度。这些数据还应该根据需要转换为百分比,对数或其他形式。
2. 模型识别
模型选择意味着选择一个适当的VAR模型来捕捉参与因果关系的变量之间的各种延迟关系。模型识别的过程中,我们需要评估模型的可信度,确定模型是否能够准确地描述数据的变化。这可以通过检查残差自相关函数和偏相关函数的图形来实现。
3. 估计VAR模型
VAR模型使用MLE似然估计量来计算每个自回归项的波动性。这使我们能够性质各异和随时间变化的数据和预测。
4. 模型检验
利用各种统计检验(如DW检验、JB检验、Ljung-Box检验、
GARCH等)来检验估计出来的VAR(p)模型是否正确和可靠。如果检验通过,我们就可以利用VAR模型进行预测及解释数据。
var模型原理与步骤
VAR模型(向量自回归模型)是一种用于预测和分析多个相关时间序列数据的统计模型。它通过将系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。
VAR模型的原理基于以下假设:
1. 所有时间序列都是平稳的,即具有稳定的均值和方差。
2. 各个时间序列之间存在长期均衡关系,可以通过模型进行捕捉和量化。
3. 这些时间序列之间存在一定的滞后相关性,即一个变量的过去值可以影响其自身的未来值,也可以影响其他变量的未来值。
VAR模型的建立步骤如下:
1. 确定要纳入模型的时间序列,并检验这些时间序列是否具有平稳性。如果时间序列不平稳,需要进行差分或取对数等转换使其平稳。
2. 根据AIC、SC、HQ等准则选择合适的滞后阶数。
3. 通过估计模型的参数来拟合模型,可以使用OLS、GLS、GMM 等估计方法。
4. 对模型进行检验,包括残差检验、异方差检验、自相关检验等,以确保模型的正确性和可靠性。
5. 利用拟合好的模型进行预测和分析。例如,可以使用模型来预测多个时间序列的未来值,或者分析一个时间序列与其他时间序列之间的动态关系。
需要注意的是,VAR模型只适用于分析平稳时间序列数据,对于非平稳时间序列数据,需要进行差分、对数转换等处理使其平稳后再进行分析。同时,VAR模型的假设和参数选择需要根据具体数据进行判断和选择,不同的模型适用于不同类型的数据和问题。
时间序列分析 向量自回归(VAR)模型
y1t y2t
=
c1 c2
+
11.1 21.1
12.1 22.1
y1,t 1 y2,t 1
+
u1t u2t
设Yt
=
y1t y2t
,C=
c1 c2
,
1
11.1 21.1
12.1 22.1
,
ut
u1t
u2t
则Yt c 1Yt1 ut
由此,含有N个变量滞后k期的VAR模型表示如下 :
VAR(k)模型都可以通过友矩阵变换改写成一个
VAR(1)模型
26
Yt A1 Yt -1 Ut (I - L A 1) Yt Ut Yt (I - L A 1)-1 Ut Ut A1Ut-1 A12Ut-2 A1sUt-s 因此,VAR(k )可以写成一个无限阶的向量MA()
Yts Uts A1Uts-1 A12Uts-2 A1sUt
方程 |1-I|=0的根描述模型的稳定性。VAR模 型稳定的条件是,特征方程|1-I|=0的根都要在 单位圆以内,或相反的特征方程|I–L1|=0的根都
要在单位圆以外。
15
4、K>1的VAR模型稳定性
• 对于k>1的k阶VAR模型可以通过友矩阵变换
(companion form),改写成1阶分块矩阵的 VAR模型形式。然后利用其特征方程的根判别稳 定性。 • 给出K阶VAR模型:
VAR建模方法的兴起与VAR模型概述分析
VAR建模方法的兴起与VAR模型概述分析VAR(Vector Autoregressive)是一种多变量时间序列建模方法,最
早由Sims(1980)提出,大大推动了宏观经济学中的时间序列分析。VAR
模型不仅可以用于描述变量之间的相互影响关系,还可以用于预测和政策
分析。本文将对VAR建模方法的兴起以及VAR模型的概述进行分析。
在传统的时间序列模型中,一般是通过将自变量解释变量作为外生变
量引入,将其他变量作为内生变量进行建模。然而,随着计量经济学理论
的发展,研究者们逐渐认识到,宏观经济变量之间存在着相互依赖关系,
而传统的时间序列模型无法捕捉到这种依赖关系。因此,VAR建模方法逐
渐兴起。
VAR模型的概述:
VAR模型是指一组内生变量之间的联合回归模型,其中每个内生变量
都可以通过其它内生变量的滞后值来解释。具体地说,VAR模型可以表示为:
yt = c + A1yt-1 + A2yt-2 + ... + Apyt-p + ut
其中,yt是一个k维向量,表示包含k个内生变量的观测值;c是一
个k维向量,表示常数项;A1,A2,...,Ap是k×k的矩阵,表示内生
变量的滞后系数;p是滞后阶数;ut是一个k维向量,表示误差项。
VAR模型的估计通常使用最小二乘法,也就是将误差项平方和最小化,以得到最优的矩阵系数。在此过程中,需要进行序列的平稳性检验,以确
保模型的稳定性。
VAR模型的优势在于可以捕捉到变量之间的时序关系和相互依赖关系,提供了一个更全面的视角来分析和预测变量的变化。此外,VAR模型还可
以应用于冲击传导分析、脉冲响应分析和方差分解等方法,以进一步研究
时间序列分析及VAR模型
Lecture 6
6. Time series analysis: Multivariate models
6.1Learning outcomes
•Vector autoregression (VAR)
•Cointegration
•Vector error correction model (VECM)
•Application: pairs trading
6.2Vector autoregression (VAR)向量自回归
The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable・
传统的线性回归模型假设严格的外主性,误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。
var的空间状态模型
var的空间状态模型
"var" 是指向“向量自回归”模型,它是一种用于描述时间序列数据的统计模型。在这个模型中,时间序列数据被假设为过去时间点的线性组合,其中每个时间点的值取决于前几个时间点的值以及一个随机误差项。具体来说,VAR 模型假设时间序列中的每个变量都是其他变量的线性组合,其中包括它自己的滞后值和其他变量的滞后值,以及一个误差项。这种模型可以用来分析变量之间的动态关系,特别是在经济学和金融学领域。
VAR 模型的空间状态模型是指将 VAR 模型表示为状态空间模型的形式。状态空间模型是一种描述动态系统的数学模型,其中系统的状态在不同时刻之间发生变化。将 VAR 模型表示为状态空间模型的形式可以带来一些优势,比如可以方便地进行参数估计、预测和模型诊断等操作。在这种表示下,VAR 模型可以被看作是一个动态系统,其中变量之间的关系可以用状态方程和观测方程来描述。
从统计角度来看,VAR 模型的空间状态模型可以帮助我们更好地理解和分析多变量时间序列数据之间的动态关系。通过将 VAR 模型表示为状态空间模型的形式,我们可以利用状态空间模型的理论和方法来进行模型推断和预测,从而更好地理解时间序列数据的动
态特性。这种方法也可以帮助我们更好地处理多变量时间序列数据的复杂性,提高我们对数据的建模能力和分析能力。
时间序列分析——VAR模型实验
基于VAR模型的我国房地产市场与汇率
波动的因果关系
————VAR模型实验
第一部分实验分析目的及方法
现选取人民币对美元汇率以及商品房房价作为变量构建VAR模型。对于不满足单位根检验的序列采取对数化或差分处理,使其成为平稳序列再进行模型的拟合。对于商品房房价这一变量,由于全国各省市差异较大,故此处采用全国房地产开发业综合景气指数这一变量。此外,为了消除春节假期不固定因素带来的影响,增强数据的可比性,按照国家统计制度,从2012年起,不单独对1月份统计数据进行调查,1-2月份数据一起调查,一起发布。所以国房景气指数p这一序列缺少每年一月份的相关数据,属于非随机、不可忽略缺失,在此采用平均值填充的方法,补足数据。
第二部分实验样本
2.1数据来源
数据来源于中经网统计数据库。具体数据见附录表。
2.2所选数据变量
由于我国于2005年7月实行第二次汇改,此次汇改以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度取代了过去人民币汇率长达10年的紧盯美元的固定汇率体制。故本实验拟选取2005年07月到2014年10月我国以月为单位的数据。,用以上两个变量来构建VAR模型,并利用该模型进行分析预测。
第四部分模型构建
4.1判断序列的平稳性
首先绘制出E的折线图,结果如下图:
图4.1 汇率E的曲线图
从图中可以看出,汇率E序列较强的趋势性,由此可以初步判断该序列是非平稳的。为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下:
图4.2 lm的曲线图
对数化后的趋势性减弱,但仍存在一定的趋势性,下面对lm进行一阶差分处理,去除趋势性,得到新变量dlm,观察dlm的曲线图。
var模型的主要原理及应用
var模型的主要原理及应用
4. 预测分析:VAR模型可以用于预测未来变量的走势。通过历史数据建立VAR模型,可以 利用模型的参数估计和滞后值来预测未来变量的值,提供决策者参考和预警。
总之,VAR模型通过自回归和向量的方式,可以分析多个变量之间的相互关系和影响,广 泛应用于经济学、金融学、政策分析和预测分析等领域。
var模型的主要原ห้องสมุดไป่ตู้及应用
应用: 1. 经济学:VAR模型在经济学领域广泛应用,用于研究宏观经济变量之间的相互影响,如 GDP、通货膨胀率、利率等。通过VAR模型,可以分析这些变量之间的长期和短期关系,预 测未来的经济走势。 2. 金融学:VAR模型可用于分析股票、汇率、利率等金融市场变量之间的相互关系。通过 VAR模型,可以研究不同变量之间的联动性,识别风险传染和市场冲击的传递机制,为金融 决策提供参考。 3. 政策分析:VAR模型可以用于评估政策变化对经济和市场的影响。通过构建VAR模型, 可以模拟不同政策变量对经济变量的影响程度和时效性,帮助政策制定者做出合理的决策。
var模型的主要原理及应用
VAR(Vector Autoregression)模型是一种多变量时间序列分析模型,主要用于分析多 个变量之间的相互关系和相互影响。其主要原理和应用如下:
主要原理: 1. 自回归(Autoregression):VAR模型基于自回归的概念,即每个变量的当前值可以 通过其过去时刻的值来预测。模型中的每个变量都可以被自身的滞后值和其他变量的滞后值 所解释。 2. 向量(Vector):VAR模型处理的是多个变量的联合行为,将这些变量构成一个向量 ,通过向量的方式来建模和分析。
时间序列作业VAR模型
一、案例分析的目的
按国际货币基金组织的划分口径可以把货币供给划分为:
M0 (现钞):是指流通于银行体系以外的现钞,即居民手中的现钞和企业单位的备用金,不包括商业银行的库存现金。
M1 (狭义货币):M0加上商业银行活期存款构成。
M2 (广义货币):由M1加上准货币构成。准货币由银行的定期存款、储蓄存款、外币存款以及各种短期信用工具如银行承兑汇票、短期国库券等构成。
我国参照国际货币基金组织的划分口径,把货币供给层次划分如下:
M0 =现金
M1 =M0 +活期存款
M2 = M1+城乡居民储蓄存款+定期存款+其他存款
M3=M2+商业票据+大额可转让定期存单
在这三个层次中,M0的流动性最强,M1次之,M2的流动性最差。M0与消费变动密切相关,是最活跃的货币;M1反映居民和企业资金松紧变化,是经济周期波动的先行指标,流动性仅次于M0;M2流动性偏弱,但反映的是社会总需求的变化和未来通货膨胀的压力状况,通常所说的货币供应量,主要指M2。
1. M1反映着经济中的现实购买力;M2不仅反映现实的购买力,还反映潜在的购买力。若M1增速较快,则消费和终端市场活跃;若M2增速较快,则投资和中间市场活跃。中央银行和各商业银行可以据此判定货币政策。M2过高而M1过低,表明投资过热、需求不旺,有危机风险;M1过高M2过低,表明需求强劲、投资不足,有涨价风险。
2. M1增加表示货币市场流通性增强,M2中包括了M1,因此,再排除M1变化因素后,M2的增减代表了储蓄的增加,货币流通性降低。
根据央行的数据,2009年9月份货币供应,M2余额58.5万亿,同比增长29.3%,比上年末加快11.5个百分点。M1余额20.2万亿元,增长29.5%,加快20.5个百分点。9月末M1与M2的同比与环比增速双双创出了新高。与此同时,M1的同比增速已经超越了M2的同比增速,这意味着整个经济领域的活跃度已被有效激活,储蓄开始活期化。
多变量时间序列分析与VAR模型的建模与解释
多变量时间序列分析与VAR模型的建模与
解释
多变量时间序列分析是指在多个变量之间存在相互关联和相互影响
的情况下,使用时间序列数据进行分析和预测的方法。VAR模型(Vector Autoregressive Model)是一种常用的多变量时间序列分析方法,可以用于建模和解释多个变量之间的相互关系。
一、多变量时间序列分析概述
多变量时间序列分析是基于时间序列数据的统计学方法,用于研究
多个变量之间的关系和变化趋势。在多变量时间序列中,每个变量的
值随时间变化,同时受到其他变量的影响。通过分析多变量时间序列
的特征和规律,可以揭示变量之间的相互作用和影响机制。
二、VAR模型的基本原理
VAR模型是一种用于分析多变量时间序列的统计模型,它建立了变量之间的线性关系,并用过去时期的观测值来预测当前时期的观测值。VAR模型的核心概念是自回归(Autoregression),即一个变量的当前
值与过去时期的值相关。VAR模型可表示为:
X_t = c + A1*X_(t-1) + A2*X_(t-2) + ... + Ap*X_(t-p) + ε_t
其中,X_t 是一个 k 维向量,表示 k 个变量在时间 t 的观测值;c 是常数向量;A1, A2, ..., Ap 是参数矩阵;ε_t 是一个 k 维误差项向量,表
示不可解释的随机波动。
三、VAR模型的建模步骤
1. 数据准备:收集包含多个变量的时间序列数据,确保数据的稳定
性和平稳性。
2. 模型阶数选择:通过选择适当的滞后阶数 p,确定模型的复杂度
和适应性。
3. 参数估计:利用最小二乘法或极大似然法,估计模型中的参数矩阵。
r语言 var模型
r语言 var模型
R语言VAR模型是一种多元时间序列分析方法,用于建模多个变量之间的动态关系。VAR 模型通过将每个变量的当前值与过去时间点的值进行线性组合来预测未来的值。
在R语言中,可以使用`vars`包来拟合VAR模型,并进行模型诊断、预测等操作。函数会输出拟合的VAR模型的结果,包括系数估计、标准误、p值等信息。
VAR模型在时间序列分析中是一种常用的方法,广泛应用于预测、冲击响应分析、脉冲响应分析等。
时间序列分析及VAR模型
Lecture 6
6. Time series analysis: Multivariate models
6.1 Learning outcomes
•
Vector autoregression (VAR) •
Cointegration •
Vector error correction model (VECM) • Application: pairs trading
6.2 Vector autoregression (VAR) 向量自回归
The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable.
传统的线性回归模型假设严格的外生性,误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。 We now relax both assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR 模型可以当作是在一般的自回归过程中加入时间序列。
VAR模型的适用范围:用于时间序列的情况
VAR模型的适用范围:用于时间序列的情况VAR模型的适用范围:用于时间序列的情况下各个变量之间的相互关系,对于随机扰动变量系统进行动态分析。一个VAR(p)模型的数学形式为: 这里是一个k维的内生变量,是一个d维的外生变量。,…,和B是待估计的系数矩阵。扰动向量。他们之间相互可以使同期的关系,但不与自己的滞后值相关及不与等式右边的变量相关。
等式的右边是内生变量的滞后值,减少了出现同期性的可能。由最小二乘法得到一致的估计。此时即使扰动项与同期性相关, OLS依然有效,原因是所有的方程式有相同的回归量,与GLS是等同的。实际上,由于任何序列相关都可以通过增加更多的滞后项而被调整,所有扰动项序列不相关的假设并不严格。
VAR模型稳定的条件:对于VAR(1),Yt = c + 1 Yt-1 + ut 模型稳定的条件是特征方程 |1- I |=0的根都在单位圆以内,或相反的特征方程|I–L1|= 0的根都要在单位圆以外。对于k>1的VAR(k)模型可以通过矩阵变换改写成分块矩阵的VAR(1)模型形式。Yt = C + A Yt -1 + Ut模型稳定的条件是特征方程 |A-I| =0的根都在单位圆以内,或其相反的特征方程 |I-LA|=0的全部根都在单位圆以外。
VAR模型应用的顺序:在使用VAR模型的过程中,遵循这样的步骤:
1、对解释变量的回归参数做相关的检验统计量。
2、分解解释变量的方差,方差分解的目的是找出每一个解释变量的方差中,其他解释变量所占解释比例。
3做脉冲响应函数,脉冲响应函数解释了变量是如何对各种冲击做出反映的。为了构建方差分解和脉冲响应函数,理论上,解释变量应该按照对被解释变量的重要性来排列。
如何利用统计学方法识别金融市场的非线性关系
如何利用统计学方法识别金融市场的非线性
关系
统计学是一门重要的学科,广泛应用于许多领域,包括金融市场的研究。在金融市场中,存在着许多非线性关系,这意味着传统的线性模型可能无法准确捕捉到市场的真实情况。本文将介绍如何利用统计学方法来识别金融市场的非线性关系,为投资者和研究者提供更准确的分析和预测。
一、非线性关系的概念和背景
非线性关系是指在自变量和因变量之间存在着非线性的关联关系。而线性关系是指自变量和因变量之间存在着直线关系,可以用线性方程来描述。在金融市场中,许多因素之间存在着复杂的相互作用,线性模型难以完全捕捉到这些关系,因此需要运用统计学方法来分析非线性关系。
二、非线性关系的识别方法
1. 时间序列分析
时间序列分析是研究一系列按时间顺序排列的数据,用以发现其中的规律和模式。对于金融市场的非线性关系识别,可以使用时间序列分析中的自相关函数(ACF)和偏自相关函数(PACF)来探索数据的自相关性和非线性性。这些函数可以帮助我们识别数据中是否存在着非线性关系。
2. 向量自回归模型(VAR)
向量自回归模型是一种常用的多变量时间序列建模方法,通常用于分析经济和金融数据。在金融市场中,我们可以利用VAR模型来分析多个金融变量之间的非线性关系。通过引入滞后项,VAR模型能够捕捉到变量之间的时序相关性和非线性关系。
3. 神经网络模型
神经网络模型是一种模仿人类神经系统的计算模型,具有强大的非线性拟合能力。在金融市场中,我们可以利用神经网络模型来识别非线性关系。通过输入大量的历史数据,神经网络可以学习数据中的非线性特征,从而捕捉到金融市场中隐藏的非线性关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Page |2
(4) ������������ = ������2 +
源自文库
������ ������ =1 ������21 ������ ������������−������
+
������ ������ =1 ������22 ������ ������������−������
+ ������2������
The beauty of this model is that we don’t need to predefine whether x or y are endogenous (the dependent variable). In fact, we can test whether x (y) is endogenous or exogenous using Granger causality tests. The idea of Granger causality is that past observations (lagged dependent variables) can influence current observations – but not vice versa. So the idea is rather simple: the past affects the present, and the present does not affect the past. STATA provides Granger causality tests after conducting a VAR analysis, which is based on testing the joint hypothesis that past realisations do not Granger cause the present realisation of the dependent variable. In many applications, VAR models make a lot of sense, as a clear direction of causality cannot be predefined. For instance, there is a substantial literature on the benefits of internationalisation (e.g. entering foreign market through cross-border M&A). There is evidence that multinationals outperform local peers due to the benefits of operating in many countries. At the same time, we know that high-performing companies are more likely to enter foreign markets due to their ownership specific advantages. This argument is based on the Resource-based View and the OLS framework developed by Dunning and Rugman (Reading School of International Business). The VAR model allows you to incorporate both effects: in fact you can test whether performance drives internationalisation or internationalisation drives performance. Before you start using a VAR model, you have to make sure that the time series are stationary. So the first step is to check whether the time series is stationary using Dickey-Fuller tests and KPSS tests. The second step is to specify the optimal lag length (p) of the model. This is done by comparing different model specifications using information criteria. Apart from using Akaike (AIC) and Bayesian Schwarz (BIC), the Hannan-Quinn (HQIC) is commonly used. Most applied econometricians favour the Hannan-Quinn (HQIC) criterion. STATA will help you to make a good choice. After specifying your model, you need to check stability conditions. The coefficient matrix of the reduced form VAR has to ensure that the iteration sequence converges to a long-term value. STATA will help you in checking stability. To be precise, you need to show that the eigenvalues of the coefficient matrix lie within the unit circle. The reason behind it can be only understood when you understand the method of diagonalizing a matrix. VAR models offer another nice feature: impulse response functions. VAR models capture the dynamics of two (or more) stationary time series; hence, we can assess the dynamic impact of a marginal change of one variable on another. The standard OLS regression provides coefficients, and coefficients refer to the partial impact of an explanatory variable on the dependent variable. In the case of VAR models, the relationship becomes dynamic, as a change of one variable (say x) in t can affect x and y in t+1. The impact on x and y in t+1 in turn affects x and y in t+2 and so on until the impact dies out. Impulse response functions are very useful in illustrating the short-term dynamics in a model.
Page |1
Lecture 6 6. Time series analysis: Multivariate models
6.1 Learning outcomes
Vector autoregression (VAR) Cointegration Vector error correction model (VECM) Application: pairs trading
6.2 Vector autoregression (VAR) 向量自回归
The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable. 传统的线性回归模型假设严格的外生性,误差项与可实现的独立变量之间没有序列相 关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。 We now relax both assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR 模型可以当作是在一般的自回归过程中加入时 间序列。 Let’s look at a standard AR(p) process for two variables (yt and xt). (1) ������������ = ������1 + (2) ������������ = ������2 +
������ ������ =1 ������11 ������ ������������−������
+
������ ������ =1 ������12 ������ ������������−������
+ ������1������
1
Dr Gerhard Kling, Quantitative Research Methods in Finance, University of Southampton
������ ������ =1 ������1 ������ ������������−������ ������ ������ =1 ������2 ������ ������������−������
+ ������1������ + ������2������
The next step is to allow that lagged values of xt can affect yt and vice versa. This means that we obtain a system of equations for two dependent variables (yt and xt). Both dependent variables are influenced by past realisations of yt and xt. By doing that, we violate strict exogeneity (see Lecture 2); however, we can use a more relaxed concept, namely weak exogeneity. As we use lagged values of both dependent variables, we can argue that these lagged values are known to us, as we observed them in the previous period. We call these variables predetermined. Predetermined (lagged) variables fulfil weak exogeneity in the sense that they have to be uncorrelated with the contemporaneous error term in t. We can still use OLS to estimate the following system of equations, which is called a VAR in reduced form. (3) ������������ = ������1 +