高频数据波动率预测论文
高频已实现波动率

汇报人:XX
目录
• 引言 • 波动率基本概念及理论 • 高频已实现波动率计算方法 • 高频已实现波动率实证分析 • 高频已实现波动率的应用研究 • 高频已实现波动率的挑战与展望
01
引言
背景与意义
01
02
03
金融市场核心问题
波动率是金融市场的核心 变量,对资产定价、风险 管理等方面具有重要意义 。
基于高频数据的交易策略开发
如何利用高频数据开发有效的交易策略,实现更高的投资收益和更 低的风险,是金融市场实践中的一个重要课题。
THANKS
感谢观看
通过比较不同市场、资产类别的已实现波 动率特征,发现其内在规律与差异。
探究影响因素
预测未来波动率
探究影响已实现波动率的因素,如市场微 观结构、信息流、投资者行为等。
基于历史数据,构建模型预测未来波动率 ,为风险管理、资产配置等提供指导。
02
波动率基本概念及理论
波动率定义及性质
波动率定义
波动率是衡量资产价格变动幅度的一个统计指标,通常用于描述资产价格的不 确定性和风险。
02
已实现波动率
基于高频数据计算得到的实际波动率。通过加总一段时间内的高频收益
率平方,可以得到该时间段的已实现波动率。
03
高频数据与已实现波动率关系
高频数据为已实现波动率的计算提供了基础,通过高频数据可以更加准
确地刻画资产价格的变动情况。同时,已实现波动率也是评估高频数据
质量的一个重要指标。
03
高频已实现波动率计算方法
实证结果与分析
波动率特征
根据描述性统计和可视化结果,总结波动率的基本特征和动态变化规 律。
波动率预测
含噪音高频数据动态整合估计波动率的方法

, ≈ [ 下[R nR ] ) r {余] 1 R 3) ERm, ] 一 ( ,7一 , g
1O 1
大 学
数 学
第 2 7卷
其 中[ ,] r r 表示 [ ,] rr 的估 计量 ,R, E R]
二 次变差 .
表示 在 [ , 时段 上 , 对所 有 观测 值 子格 取样 平 均下 的 0明 R
[ 中图分类号]O2 2 2 1.
[ 文献标识码]A
[ 文章编号]1 7 44 2 1 )40 0 —5 6 215 ( 0 10 —1 80
1 引
言
高频数 据指 日与 日内 的数据 , 主要 以小 时 、 分钟 或秒为 采集频 率 的 、 时间先后 顺 序排列 的数 据. 按 高
第 z 7卷 第 4期
21 0 1年 8月
大 学 数 学
COLIEGE ATHEM ATI M CS
Vo1 2 № . . 7, 4
Au 2 1 g. 0 1
含 噪音 高频 数 据 动 态整 合估 计 波 动率 的方 法
何 成 洁 , 杜 雪樵 , 叶绪 国。
( . 徽 奇 瑞 汽 车 销 售 有 限公 司 , 湖 2 1 0 ; 2 合 肥 工 业 大 学 数 学 学 院 , 肥 2 0 0 ; I安 芜 409 . 合 3 0 9
3凯里学院 理学院 , 州 凯里 561 ) . 贵 5 0 1
[ 摘
要 ] 时 间 域 和状 态 域 方 法 是 两 种 常 见 的非 参 数 估 计 方 法 . 者 主 要 使 用 的 是 最 近 的 历史 数据 , 后 前 而
( 8 )
() 9
() 证 明见 附录. 8的
中国股票市场波动率的高频估计与特性分析_黄后川

中国股票市场波动率的高频估计与特性分析*黄后川(南方基金管理公司 510200) 陈浪南(中山大学岭南学院与中山大学经济所 510275) 内容提要:本文旨在应用高频数据估计中国股市的已实现波动率。
我们发现股票指数与个股的高频交易数据中的微观摩擦影响正好相反,使用极高频的数据会大大增加个股的波动率估计值,相反却会大大降低指数的波动率估计值。
在计算各种频率的已实现波动率的基础上,本文构造了一种较为精确的估计波动率的方法,可以更好地平衡测量误差与微观结构误差。
基于已实现波动率,本文研究了中国股市波动率不对称性和长期记忆特性。
关键词:波动率 高频估计 特征* 本文是国家自然科学基金课题(79800010、70042005)、上交所2002年联合研究计划课题、教育部社科“十五”课题(01j b790026)及2002年厦门大学校级课题成果之一。
一、引言与先前该领域研究述评近二十年来,对波动率模型的研究已成为金融经济学领域研究的重要内容之一。
自Engle 于1982年提出ARCH 模型以来,经济学界已经发表了数千篇关于条件异方差或波动率的论文。
特别是最近十年,一些学者提出用高频分时数据估计波动率的方法,这种方法可以得到比较准确的波动率估计值,称为“已实现波动率”(Realized Volatility )。
以此为基础,众多学者在波动率的特性和预测两方面进行了更深入的研究,大大拓展了这个研究领域。
Andersen 、Bollerslev 、Diebold 、Ebens (1998,2001)等金融经济学家对这种高频估计方法以及“已实现波动率”的特性与预测进行了一系列研究,他们得出了如下几个主要结论(计算的波动率都是日波动率):(1)如果价格遵循普通的扩散过程,用此方法计算的已实现波动率,是无偏的。
而且,当高频数据的时间间隔趋近于0时,已实现波动率的测量误差也趋于0。
因此可以把已实现波动率当作一个观测值,它没有经典算法所带来的时间滞后。
基于HHT的高频数据波动率的估计

基于HHT的高频数据波动率的估计摘要:鉴于经济学与统计学的研究意义, 在经济学科和统计学科的高频率金融时间序列的分析研究已成为目前研究的热点问题,,高频率金融时间序列的产生中经过计算和研究存在着需要研究的不确定因素,因此对其波动性的估计与分形特征问题的研究对当前股票市场的涨幅和一段时间内的发展的规律,具有非常重要的意义。
即对金融资产的价格随时间的变化而变化的规律探索。
针对此问题高频数据波动率的估计变得越来越重要,结合数据进行实验,采用高频率数据的定义和性质特征,HHT方法、波动率、ARCH模型和SV模型,然后基于Hilbert-Huang 变换的高频率数据波动频率对研究的问题进行进一步估计。
关键词:高频数据波动率;SV模型;ARCH模型;Hilb1.1研究背景及意义1.1.1研究背景近年研究,根据经济学和统计学的研究发展,现在经济和统计界的热点问题之一是高频率金融时间序列的分析研究,即对金融资产的价格随时间的变化而变化的理论与实践的研究和探索。
不确定因素是高频率金融时间序列的产生中存在着需要研究的至关重要的问题,因此对国目前股票市场的结构和规律其波动性的估计与分形特征问题的研究对探究我具有非常重要的意义。
[1-3]。
上海证券交易所、深圳证券交易所自我国上世纪90年代初正式开业以来, 成千上万复杂的股票数据每天每小时每分钟每秒钟都会产生。
随着中国乃至世界的金融股票市场功能与规模伴随着经济发展的速度也不断扩大,高频数据研究分析其的作用变得越来越重要,且变得越来越具有研究意义。
由于近些年随着经济发展,投资股票和金融市场的人越来越多,因此,了解股票价格波动频率是怎么样的、波动范围大小是多少和波动率高低程度成为人们关注的重点。
随着老百姓参与股票市场人数一直在不间断的增加,高频数据在中国当前甚至未来的经济体系中的作用变得越来越重要,经目前各项研究发现股票价格起伏情况和波动规律已经成为中国目前影响社会经济中至关重要的因素,当然股票价格变化的程度和波动的大小也是衡量股票市场发展的重要指标和研究的重要问题。
基于高频数据的已实现波动率模型

02
高频数据概述
高频数据的定义与特点
高频数据定义
高频数据是指在短时间内(如秒、分钟、小时等)收集到的数据,其频率远 高于日度或月度数据。
高频数据特点
高频数据通常具有高分辨率、高时效性、高信息量等特点,能够揭示金融市 场的微观结构和动态变化。
高频数据在金融市场中的应用
01
02
03
交易策略
利用高频数据可以制定更 精确的交易策略,如套利 交易、做市等,从而提高 交易效率和降低风险。
06
参考文献
参考文献
参考文献1
波动率模型在金融领域的应用,作者姓名,出版年 份,期刊名称。
参考文献2
高频数据波动率建模研究,作者姓名,出版年份, 期刊名称。
参考文献3
已实现波动率模型比较研究,作者姓名,出版年份 ,期刊名称。
感谢您的观看
THANKS
研究不足与展望
已实现波动率模型在处理非线性和极端情况下的波动率时还存在一定的 局限性,需要进一步完善和改进。
高频数据的市场稳定性和数据质量对于已实现波动率模型的准确性和可 靠性具有重要影响,需要加强对于数据源和处理技术的研发和应用。
已实现波动率模型在与其他金融统计模型结合使用方面还有待进一步探 索和实践,以实现更全面和准确的金融市场分析和预测。
已实现波动率的计算
利用采集到的数据,采用适当的统计方法计算已实现波动率 。例如,可以采用平方价格变动或交易量的方法来计算已实 现波动率。
基于已实现波动率的模型构建思路
模型构建的基础
基于已实现波动率,通过引入 适当的随机过程或模型来描述 其动态特性,如波动率微笑、
波动率聚集等。
模型参数的估计
利用已实现波动率和价格数据, 采用适当的估计方法对模型的参 数进行估计。例如,可以采用最 大似然估计或矩估计等方法。
高频金融数据的波动性建模与预测方法研究

高频金融数据的波动性建模与预测方法研究提要:本文研究的主题是高频金融数据的波动性建模与预测方法。
文章通过引入波动率概念,介绍了常见的波动性计量模型,包括ARCH模型、GARCH模型等,并对它们的应用进行了分析和评价。
同时,文章还探讨了一些新兴的波动性模型和预测方法,如高频数据波动性预测、机器学习方法等。
通过这些研究,可以提高对金融市场的波动性了解,为投资决策提供参考。
一、引言高频金融数据是指时间尺度较小、更新频率较高的金融市场数据,如分钟级或秒级的价格数据。
研究高频金融数据的波动性建模与预测方法,对于理解金融市场的运行机制、制定投资策略具有重要意义。
二、波动性建模方法波动率是衡量金融市场价格波动程度的指标,建立准确的波动性模型可以帮助我们更好地预测金融市场的未来走势。
常见的波动性计量模型包括ARCH模型、GARCH模型等。
ARCH模型是基于平方收益率序列的自回归模型,它假设价格波动率与历史平方收益率相关。
这种模型通过考虑历史收益率的波动来预测未来的波动情况,具有一定的效果。
但是该模型忽略了平方收益率之间的波动因果关系,无法很好地捕捉到价格波动率的非线性特征。
GARCH模型是在ARCH模型的基础上引入了波动率的滞后项,反映了价格波动率的长期记忆特征。
GARCH模型通过考虑不同滞后期平方收益率对波动率的影响来建模,可以更准确地描述价格波动的特征。
但是GARCH模型也存在较多参数需要估计的问题,对参数的选择和估计较为敏感。
三、应用与评价波动性计量模型在金融市场研究中得到了广泛的应用,为投资者提供了重要的参考依据。
通过对模型参数的估计和模型的拟合优度评价,可以对金融市场的波动性进行有效预测。
然而,传统的波动性模型在处理高频金融数据时存在一定的问题。
首先,高频金融数据具有更快的波动速度和更短的相关性,常见的波动性计量模型往往不能很好地适应这种情况。
其次,高频数据的大量噪音与异常值使得传统模型具有一定的局限性。
高频金融数据分析中的波动率预测模型研究

高频金融数据分析中的波动率预测模型研究在金融市场中,波动性是衡量市场风险的重要指标之一。
准确预测金融市场的波动率对于投资者制定风险管理策略和决策具有重要意义。
然而,由于金融市场的复杂性和不确定性,波动率预测一直是金融领域研究的热点问题之一。
近年来,随着高频金融数据的广泛应用,有关波动率预测模型的研究也日益增多。
高频金融数据是指以秒或分钟为单位,相对于传统的日度或周度数据更加精细和频繁的数据。
高频数据的特点是信息含量更为丰富,更能反映市场的瞬时变化,因此对于波动率预测具有较高的准确性要求。
这种数据类型的出现为开发更有效的波动率预测模型提供了新的可能性。
在高频金融数据分析中,有多种波动率预测模型被广泛应用。
其中最常见的模型是ARCH(自回归条件异方差模型)和GARCH(广义自回归条件异方差模型)模型。
这两种模型都是基于时间序列的方法,旨在捕捉金融市场波动的长期和短期特征。
ARCH模型建立了波动率和历史波动率之间的关系,而GARCH模型则进一步加入了残差序列的信息,以提高预测能力。
除了传统的ARCH和GARCH模型,近年来还有一些新的波动率预测模型被提出。
例如,随机波动率模型(SV)通过引入随机波动率因子来描述金融市场的波动率变化。
而另一种被广泛研究的模型是波动率跳跃模型(SVJ),它不仅考虑了波动率的变化,还能捕捉到市场中的突发跳跃。
这些新兴的模型在解决普通波动率模型无法解释的异常情况方面具有优势。
在高频金融数据分析中,波动率预测模型的选择并不是一个简单的任务。
不同模型之间的性能比较需要根据具体数据和预测目标来进行。
一种常用的评估方法是计算模型的预测准确度。
对于已知波动率和模型预测值之间的比较,可以使用均方根误差(RMSE)和平均绝对误差(MAE)等指标来衡量模型的准确性。
另外,还可以使用交叉验证等方法来进行模型的选择和比较,以找到最适合的波动率预测模型。
除了模型选择的问题,高频金融数据分析中的波动率预测还面临一些挑战和困难。
高频已实现波动率

1
“已实现”波动率模型与GARCH和SV 类模型的比较
GARCH类模型和SV类模型多年来一直是波
动性估计常用的方法,但是扩展到多变量的 情况下, GARCH类模型和SV类模型由于 “维数灾难”问题,很难得到它们参数正确 的估计值。 “已实现”波动率无需建模,计算简便,可 以很好的应用于投资组合风险管理研究中, 因此已经成为学术界研究的新热点。
处理投资组合协方差的模型
DCC-GARCH模型
采用低频时间序列对多个资产收益的时变方差和协 方差建模的主要工具有多元GARCH模型和多元SV 模型,但是多元GARCH模型和多元SV模型的参数 估计由于“维数灾难”问题一直没有很好的解决。 DCC模型比较好的解决了多元GARCH的“维数灾 难”问题。
波动率估计的模型
波动率是投资组合的构建, 衍生产品定价以及金融风险管
理的关键变量, 对波动率的准确预测一直是现代金融学研 究的热点问题。 低频时间序列领域, 可以直接用GARCH 类模型和SV类模 型进行波动率估计。 而高频金融时间序列通常是指以天、小时、分钟甚至秒 为频率所采集的按时间先后顺序排列的金融类数据。 “已实现”波动率( realized volatility) 是针对高频时间序 列而开发的一种全新的波动率的测度方法。这种波动率 的度量方法中没有模型(model free) , 计算方便, 在金融研 究领域和实际操作领域都有很广阔的应用前景。
首先定义p(t)是金融资产的对数价格过程,投资于 该金融资产 时段上的对数收益率为: 其中, >0表示时间间隔。 当 =1时,
r (t , ) p(t ) p(t )
r (t , ) p(t 1) p(t )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高频数据波动率预测论文【摘要】金融市场的交易连续不断,其日内高频数据包含的信息也有一定的差别,除了考虑收盘价这一要素外,日内观测到的最高价、最低价、成交量等因素也要纳入对金融市场的分析中,这样可以获得比单独采用收盘价这一因素进行波动率研究更准确的研究结果。
一、引言随着科技进步尤其是电子计算机技术的发展,对高频数据的记录、收集、存储和操作的时间和金钱成本都大大下降,20实际90年代以来,高频数据的分析与建模得到了迅速的发展,并广泛运用与金融市场微观结构理论的实证研究中。
高频数据能精确到交易日日内分时收盘价,充分保证重要的市场信息不被丢失,使得基于高频数据估计的波动率包含更加丰富的波动信息。
高频波动率与低频波动率的特点不同,呈现出时间序列的负相关性、周期性U型日历效应和长记忆性等,而现有的基于低频数据的ARCH类或SV类模型并不能很好的描述这些统计特征。
对高频波动率的研究已经成为计量经济学领域的一个热点。
深入研究日内高频数据波动率的性质,选择合适的波动率预测模型和金融资产收益率分布来度量中国股票市场的风险,分析市场微观结构对高频波动率的影响,从而为金融机构和监管当局的风险监控提供一种有效的理论方法参考和政策建议具有重大意义。
本文通过选取沪深300指数5分钟交易数据,通过构建目前广泛用于高频数据分析的已实现波动率和已实现极差两个序列,通过R/S法计算Hurst指数,确定两个序列的长记忆性,进而对两者构建了长记忆性的ARFIMA模型,并用这一模型进行了波动率估计,再采用均方根误差和绝对平均误差两个指标对两个模型的预测结果进行了评价。
二、文献综述Engle(2000)为超高频数据或交易的建模应用提供了新的思路。
通过选取的52144条IBM股票的交易数据去为交易的时机建模并测量分析它对价格波动的影响,将ACD模型引入去估计到达比率的相关点过程,同时采用了半参数法去估计调和均数。
实证结果说明对于更长的持续期和更长的预期持续期,其波动会相应的更小。
Andersen (2001)等采用道琼斯工业指数中获取的日内高频交易数据对从已实现日股票收益波动率和相关系数进行研究,他们发现实现方差和协方差的非条件分布是高度右偏,然而实现对数标准差和相关系数却近似于高斯分布,已实现波动率与相关系数表现出了较强的短暂相关性,即所谓的长记忆性。
Andersen(2003)等构建了一个集高频日内数据测量、建模和每日预测和低频收益波动与收益分布的体系,大部分有关金融资产收益波动率、相关性和分布的建模与预测是基于多元ARCH 或者随机波动率模型的潜在限制性和复杂的参数,相比之下,使用由高频日内收益所计算得出的已实现波动率使得建模与预测允许采用传统时间序列方法。
在构造连续时间无套利价格理论与二次方差理论的基础上,他们提出了已实现波动率与条件协方差矩阵的关系。
通过德国马克兑美元和日元兑美元的10年以上的汇率数据的实证分析,他们发现简单的长记忆高斯向量回归对数日已实现波动率在预测上的表现优于许多ARCH类模型与更复杂的高频数据模型。
近年来,许多学者开拓了新的研究高频数据的思路,成果也不断涌现。
唐勇和张世英(2006)通过选取深圳成指的高频数据进行实证分析,通过对比已实现极差与已实现波动率这两个波动估计量,证明了实现极差在波动估计上优于已实现波动率。
此外,在高频数据的“日历效应”问题上,提出了加权已实现极差,并与实现极差作比较,证实了加权已实现极差在估计波动方面更为优秀,为在高频数据中将极差应用于估计波动率拓展了一个新的思路。
Sun(2009)等采用ARMA(1,1)-GARCH (1,1)模型这一参数模型,选取了德国DAX指数的高频数据并融入于列维过程去计算风险价值,并将运用这一方法计算所得的VaR和标准的非参数法计算所得的VaR进行对比,结果显示这一参数法获得了更好的结果。
Lu(2010)等分析了当2005年7月21日人民币再调整时相关货币兑美元的1分钟高频数据的变动,数据分析显示人民币再调整时汇率数据中存在一个大的跳跃,在这一跳跃之后,汇率的收益率存在着大的波动率,此外,外汇数据中一些大的跳跃伴随着这一跳跃发生。
Thanos和Owain(2010)提出了一种处理超高频金融市场数据中样本外预测的多维算法。
在数据统计分析中,对金融时间序列的统计特征采用稳健的平均绝对偏差法去分析,并提出将价位,价格波动和收益分布同时考虑进市场微观结构算法的原理中。
唐勇和刘微(2013)推导出了已实现极差多幂次变差族中最优的波动估计量,根据无偏性和有效性原则作了相应的加权处理,得出了加权估计量,将这些估计量与已实现GARCH相结合,并对此模型进行了拓展。
通过实证分析说明已实现极差四幂次变差是已实现极差多幂次变差族中最优的波动估计量,加权已实现极差四幂次变差能消除高频数据中的日内效应。
雷井生和林莎(2013)改进了统计套利策略,设计了一个新的统计套利策略并进行了实证分析,在新的策略下,运用不同频率数据进行套利统计,分析并得出了新的策略在套利统计上具有良好的绩效,并且样本内的盈利对于样本外的盈利预测性明显增强。
随着对金融高频数据研究的发展,由于高频数据本身所具有的特性如日历效应等,以及使得GARCH模型很难用于高频数据的分析,不同的学者提出与发展了新的适用于高频数据研究的成果,其中比较突出的成果要属已实现波动率和已实现极差这两个被广泛用于高频数据分析的研究成果。
三、方法简述已实现波动率(Realized volatility,简记为RV)由于其计算简便,无需进行模型参数估计(model-free),有助于研究多变量时间序列的波动特征。
同已实现波动率RV一样,已实现极差波动(Realized Range volatility,简记为RRV)也是具有无需模型(model free)和计算简便的波动率估计量,Parkinson(1980)提出了构造极差的表达式,在此基础上Christensen(2005)提出了已实现极差波动。
不同学者和研究人员经过理论和实证上的对比,认为已实现极差是比已实现波动率更为有效的波动率估计量。
下面分别对两者进行定义。
令Pclose(t,i)为日内观测的收盘价,R(t,i)=In(Pclose (t,i)-Pclose(t,i-1))Ht,i=■lnp■,L■=■lnp■,Sp■=H■-L■(t=1,2,,,T,i=1,2,,,N,j=1,2,,,N)上式中,T为研究天数,N为在[t-1,t]内等时间间隔的观测次数,Δ=■,为将[t-1,t]等分为N个时间段的某个小时间段的时间间隔,N取整数则已实现波动率定义为:RV=■R2(t,i),为日内对数收益率平方和的累加。
已实现极差定义为:RRVt=■■Sptj2,为日内最高价和最低价对数平方和的累加。
判定波动率序列是否具有长记忆性的方法主要有时域和频域两个两个方法,本文选择时域角度,以重标极差法(R/S)计算的Hurst 指数来度量波动率序列的长记忆性。
当H≤0.5时,序列{Xt}呈现短记忆性;当H>0.5时,序列{Xt}呈现长记忆性。
针对已实现波动序列{Xt}所具有的长记忆性,本文采用分整自回归移动平均模型(Autoregressive fractionally moving averagemodel,简称为ARFIMA(p,d,q)模型)对已实现类波动率序列进行建模分析。
ARFIMA(p,d,q)模型的具体形式为:φ(L)(1-L)d(Xt-μ)= θ(L)εt其中,μ为序列{Xt}的均值,εt~i.i.d(0,σ2s),φ(L)为P阶平稳回归算子,θ(L)为q阶可逆移动平均算子,它们的根都在单位圆外。
d为分数维滞后阶数,反映的是序列{Xt}的长记忆性。
ARFIMA(p,d,q)的特征主要在于用p+q个参数来刻画序列{Xt}的短记忆特性,用参数d来刻画{Xt}的长记忆特征。
对于ARFIMA(p,d,q)模型的参数估计,可以采用两步参数法:首先估计ARFIMA(p,d,q)模型中的分数维滞后阶数d,并对原序列取分数维差分,得到新的可用于估计的时间序列。
d确定好以后,ARFIMA模型可以当作ARMA模型进行估计,确定剩下的参数p和q。
由于参数d和Hurst指数满足:d=H-0.5,因此可以通过R/S法计算所得的Hurst指数确定参数d,再将模型当作ARMA模型,进行剩下的参数估计。
四、实证过程本文选择沪深300指数作为研究样本,样本选取的区间为2011年4月1日至2014年3月5日,选取的高频数据频率为5分钟的高频数据,数据来源于Wind资讯金融终端,在计算得到的已实现波动率RV和已实现极差RRV后,开始进行实证分析。
实证部分主要用matlab 软件进行。
下表为已实现波动率RRV和已实现极差的描述性统计:描述性统计结果从上表可以看出,无论是已实现波动率RV还是已实现极差RRV,都呈现出尖峰厚尾的特征,相应的JB统计量和括号内的P值都表明上述序列不服从正态分布,且根据偏度和峰度值来看,都呈现出右偏厚尾的特性。
下面对两个序列进行单位根检验,结果如下:单位根检验结果从上表的结果来看,RV和RRV两个序列检验的t统计量在99%的置信水平上都拒绝了原假设,其P值都是足够小的值,因此RV序列和RV序列都通过了检验,这两个序列都是平稳的。
下面对两个序列进行长记忆性检验,结果如下RV和RRV的长记忆性检验从上表可以看出,RV和RRV的Hurst指数0.5<h<1,相应的分数维滞后阶数0<d<0.5,说明这两个序列都呈现长记忆性,因此可以对这两个序列分别建立arfima模型。
< p="">RV序列的估计过程中,通过AIC和SC准则确定的(p,q)为(1,1),则所得到的RV-ARFIMA(1,0.264,1)的具体形式为:(1-0.064L)(1-L)0.264(RV-μ)=(1-0.95L)εt(1.466)(-66.643)RRV序列通过AIC和SC准则确定模型的(p,q)选择为(1,2),则得到的RRV-ARFIMA(1,0.467,2)的具体形式为:(1-0.62L)(1-L)0.467(RRV-μ)=(1-1.362L+0.4L2)εt (7.689)(-12.71609)(5.1173)括号内为相应参数的t统计量。
在构建完所有的模型后,我们对各模型进行波动率预测能力上的比较,比较的标准选择均方根误差(RMSE)和绝对平均误差(MAE)两个指标:RMSE=■■(MV-FV)■■MAE=■■(MV-FV)■其中,MV表示实际的波动率,FV表示模型预测的波动率。
设定预测期为100,就可以得到向前预测100期的预测值,再采用上述两个方法对波动率预测的结果进行评价,两个模型预测的评价结果如下:波动率预测评价对比RRV和RV序列构建的ARFIMA模型在波动率预测上的结果,我们可以发现无论从均方根误差还是绝对平均误差的角度,RRV序列的预测误差都小于RV序列的预测误差,这也从实证上印证了本文在理论上分析RV和RRV在波动率估计上的优劣区别。