基于函数型数据的上证指数预测

合集下载

基于ARIMA模型对上证指数的预测

基于ARIMA模型对上证指数的预测

基于ARIMA模型对上证指数的预测
白营闪
【期刊名称】《科学技术与工程》
【年(卷),期】2009(009)016
【摘要】股票价格涉及很多不确定因素,且各个因素之间的相关关系错综复杂, 因此要从理论上彻底弄清楚股市的变化机理十分困难.然而股市是一个运动的、特殊的系统, 它必然存在着规律.以上证综合指数为例,利用EVIEWS软件对其股票价格建立ARIMA模型,提出了股票价格序列的一步向前静态预测方法,用于股票价格序列的建模及股价短期预测,希望为企业和投资者在进行相关决策时提供有益的参考.【总页数】4页(P4885-4888)
【作者】白营闪
【作者单位】华南理工大学理学院,广州,510640
【正文语种】中文
【中图分类】F830.9
【相关文献】
1.基于ARIMA模型的上证指数预测实证分析 [J], 董小刚;李纯净
2.基于ARIMA模型对上证指数趋势的预测 [J], 李晓先
3.基于ARIMA模型对上证指数月度时间序列的分析和预测 [J], 崔远远;文忠桥
4.基于ARIMA模型的上证指数分析与预测的实证研究 [J], 张颖超;孙英隽
5.基于ARIMA模型对上证指数的分析与预测 [J], 邹志远
因版权原因,仅展示原文概要,查看原文内容请购买。

基于生存分析的上证指数连涨连跌天数研究

基于生存分析的上证指数连涨连跌天数研究

ISSN 1009-8984CN 22-1323/N长春工程学院学报(自然科学版)2020年第21卷第2期J.Changchun Inst.Tech.(Nat.Sci.Edi.),2020,Vol.21,No.2 26/28115-118doi:10.3969/j.issn.1009-8984.2020.02.026基于生存分析的上证指数连涨连跌天数研究收稿日期:2020-03-23基金项目:安徽省教育厅高校自然科学研究重点项目(KJ2019A1289)安徽省重大教学研究项目(2017jyxm0947)作者简介:黄飞(1989-),男(汉),安徽黄山人,硕士,讲师主要研究应用统计与风险决策。

黄 飞,孙怡川,陶明珠(安徽信息工程学院通识教育与外国语学院,安徽芜湖241000)摘 要:针对2005年6月6日—2010年5月12日的上证指数连涨连跌天数进行统计、分析和建模,发现连涨天数和连跌天数的频率直方图与几何分布趋势近似。

同时,对连涨连跌天数的生存函数估计、概率密度函数估计、危险率函数估计进行了研究。

研究表明当连涨连跌1~4d有一定的可能发生,当天数>4d时,再继续生存下去的概率都<0.1。

且当连涨天数t为1,2,...,5时,在连涨条件下的危险率基本稳定在0.4~0.5,表明无论上涨多少天,其下跌情况也基本稳定,而在t为6时,危险率函数降为0.3,说明在连涨5d后,不会再下跌的可能性非常小。

这有助于对股指涨跌的可能性作出估计,并进行相关的金融研究。

关键词:连涨;生存函数;概率密度函数;危险率函数中图分类号:O212文献标志码:A 文章编号:1009-8984(2020)02-0115-04 生存分析的应用非常广泛,可以用在很多不同的领域,分析不同实验条件下,研究对象“生存时间”的分布情况,从而了解实验条件对生存时间的影响。

该学科在产品的失效、失业人员第一次找到工作、了解某药物的疗效、某医疗仪器设备使用寿命等方面都有重要应用。

基于ARIMA模型对上证指数的预测

基于ARIMA模型对上证指数的预测

2009年 5月 4日收到
国家自然科学基金 (10771075)资助
作者简介 :白营闪 ( 1984—) ,男 ,硕士 ,研究方向 : 随机分析与金融工
程 。 E2mail: 281938200@ qq. com。
本较低 ,特别适用于表面上毫无规律可循的数据 。 因此 ,我们用时间序列分析中的 AR IMA 模型 [ 1, 2 ]来 对股票价格建立模型 。
其价格波动的因素多种多样 ,不仅与股票市场自身
体制因素有关 ,还与国家宏观经济政策 ,国民经济
发展方向等各种因素相关 。用此模型对大盘走势
进行短期预测 ,可为投资者提供投资决策的依据 。
参 考 文 献
图 5 AR IMA (1, 1, 1)的残差序列进行 Q 2检验的输出结果
2. 3 预测和分析 对于含有滞后因变量的预测 , EV iew s提供了两
但它只短期趋势预测方面有一定可行性对于长期趋势以及突然上涨或下跌就会表现i局限性预测的偏差就会比较大因为变幻莫测的股票市场影响其价格波动的因素多种多样不仅与股票市场自身体制因素有关还与国家宏观经济政策围民经济发展方向等各种因素相关
第 9卷 第 16期 2009年 8月
167121819 (2009) 1624885204
c为常数
;φ1
,
φ 2
,
…,
φ p

自回归模型

数;
p为自回






;
ε t
是均值为
0, 方差为
σ2 的白噪声序列 。
1. 1. 2 移动平均模型 MA ( q) q阶移动平均模型记作 MA ( q) , 满足下面的

基于优化GA属性约简的上证指数预测

基于优化GA属性约简的上证指数预测

基于优化GA属性约简的上证指数预测
严晓明
【期刊名称】《福建师范大学学报:自然科学版》
【年(卷),期】2011(27)5
【摘要】结合粗糙集的相关理论,优化了GA属性约简方法,针对上证指数预测的具体问题,对遗传算法的初始种群和适应度函数进行改进,将上证指数10年间数据的58个属性构成的训练集进行属性约简,并应用参数优化后的SVM分别以属性约简前后的数据集对开盘指数进行回归预测.仿真结果表明,用该算法进行属性约简后,原始数据集中冗余属性对预测结果的影响下降,预测精度提高,建模时间也相应的减少,得到了较好的结果.
【总页数】5页(P29-33)
【关键词】遗传算法;属性约简;上证指数;SVM
【作者】严晓明
【作者单位】福建师范大学数学与计算机科学学院
【正文语种】中文
【中图分类】TP183
【相关文献】
1.基于RS和GA结合的属性约简在设备诊断维护中的应用 [J], 袁楚明;胡广华;陈幼平;周祖德
2.基于GA-PSO的粗糙集属性约简算法 [J], 戴上平;刘素军;郑素菲
3.基于GA-PSO混合算法的最小属性约简 [J], 吕振中;薛惠锋;钟明;刘欢
4.基于小生境完全属性-值空间树的属性序约简优化算法 [J], 丁卫平;王建东;管致锦;施佺;陈森博
5.基于GAS模型的上证指数VaR预测研究 [J], 王杰;郑雨尧
因版权原因,仅展示原文概要,查看原文内容请购买。

基于ARIMA模型对上证指数月度时间序列的分析和预测

基于ARIMA模型对上证指数月度时间序列的分析和预测

基于ARIMA模型对上证指数月度时间序列的分析和预测崔远远;文忠桥【摘要】股票价格指数的影响因素错综复杂,现阶段影响我国股票价格的主要领域是银行储蓄、债券市场、期货市场、房地产,汇率等,从目前金融学发展的趋势和广大投资者对股票市场众多金融工具迫切的需求来看,通过建立恰当的时间序列模型可以达到对股票价格整体走势进行大致的预测的目的.本文选取了从2011年12月我国加入WTO至2014年7月以来的上证综合指数的月度数据,通过建立ARIMA 模型采用一步向前静态预测的方法对我国股市2014年8月的上证综合指数进行了预测,发现我国2014年前两个季度以来整体股市呈现上升的趋势.本文的创新之处在于对样本数据取了对数,从而消除了时间序列中的自相关和异方差,同时使得预测值接近实际值,效果良好,希望对广大股民提供借鉴参考.【期刊名称】《枣庄学院学报》【年(卷),期】2015(032)002【总页数】5页(P102-106)【关键词】ARIMA(自回归单整移动平均模型);上证综合指数;一步向前静态预测;B-J方法论【作者】崔远远;文忠桥【作者单位】安徽财经大学金融学院,安徽蚌埠233000;安徽财经大学金融学院,安徽蚌埠233000【正文语种】中文【中图分类】F832.5股票价格是国民经济运行的“晴雨表”,它的形成和波动受到国内外各种政治经济的影响,为了更好的研究股票市场的运行,我们可以借助于研究股票指数,股票指数是描述股票市场总的价格水平变化的指标,上证指数由上海证券交易所利用自己的业务知识和熟悉市场的优势编制而成,并且公开发布,具有一定的权威性.投资者据此就可以检验自己投资的效果,并用以预测股票市场的动向.同时,新闻界、公司老板乃至政界领导人等也以此为参考指标,来观察、预测社会政治、经济发展形势.由于股票价格变幻莫测,运用传统时间序列难以进行描述而且耗时耗力[1].因此我们可以采用ARIMA模型,它是一种精度较高的时序短期预测方法,通过该模型对上证综合指数进行研究,能够更本质的认识其结构与特征,以达到方差最小意义下的最优预测[2].1.1 ARIMA模型的理论内涵所谓ARIMA模型,是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.如果时间序列(1)则称该时间序列(p,q)阶的自回归移动平均模型,记为ARMA(p,q).金融时间序列中大多数都不平稳,我们通过一次或者多次差分的方法将其转变为平稳时间序列.如果序列{}经过d次差分后得到平稳时间序列,并运用了ARMA(p,q)过程对建立模型,则称为(p,d,q)阶自回归单整移动平均过程,简称ARIMA.1.2 运用B-J方法论对ARIMA进行建模步骤1.2.1 模型识别首先对模型进行平稳性检验,若不平稳则对其进行差分,差分n次则d=n,然后再根据观察已经平稳的序列的自相关图和偏自相关图并分析其拖尾及截尾情况,确定自回归阶数p和移动平均阶数q.1.2.2 模型估计当上述合适的d,p,q已经得到确认后,接下来运用OLS法或者极大似然估计法来进一步估计和移动平均系数.1.2.3 模型检验模型估计后应该对模型的适合性进行检验.为了判断残差序列是否随机,可以采用检验.若通过检验,则认可所估计的模型,否则则需要从第一步重新开始.同时为了更好地拟合数据则是在模型中增加滞后项,然后根据AIC和SC原则进行判断.本文以上证综合指数的月度收盘价格作为研究对象,选取了从2001年12月11日我国加入WTO至2014年7月14日的月度收盘价格(剔除了不交易的日期)共计152个数据,满足了股价指数研究大样本的需求,运用ARIMA模型建模,数据来源于大智慧网站下载后输入EVIEWS6.0实现建模分析[3].2.1 识别时间序列数据的平稳性为了消除或者减少时间序列中存在的自相关和异方差的情况,同时不影响模型分析结果,对所有的数据取对数.设2001年12月为第一个月度收盘价,2002年1月为第二个月度收盘价,依次类推,将上证指数第t个月度收盘价记为,图1为取对数后自2001年12月以来的月度数据趋势图.从图1可以粗略的看出,该时间序列明显不符合零均值同方差的假定,于是对其进行ADF检验.由图2可知,检验t统计量是-2.3389,大于显著性水平为10%的临界值,所以序列存在单位根,是非平稳的,于是对其进行一阶差分.将一阶差分后的序列定为,由图3可以看出因而确定d=1.2.2 根据一阶差分后平稳时间序列定阶B-J方法论认为可根据时间序列模型自相关函数和偏自相关函数图进行识别,建立相应的ARMA模型,若某序列的自相关函数(AC)和偏自相关函数(PAC)都是拖尾的,则可以把该序列设为ARMA(p,q)过程[4].下面我们来观测序列的自相关和偏自相关图:从图2我们可以清楚地看到自相关函数和偏自相关函数都是拖尾的,它们都从第二阶和第四阶开始大幅度下降.故可以设p=q=2或者p=q=4.经过比较可知,ARIMA (2,1,2)模型中的AR(1)项的系数估计值对应的概率0.1788在10%的显著性水平下无法通过检验,故舍去.而ARIMA(4,1,4)模型的参数在在1%的水平下完全显著,这恰好符合ARMA(p,q)过程的平稳条件.同时ARIMA(4,1,4)中的AIC=-2.2032<ARIMA (2,1,2)中的AIC=-2.1526,从而也符合ARIMA信息准则.综上可知,该模型最终设定为ARIMA(4,1,4).2.3 残差的检验接下来对该ARIMA(4,1,4)模型的残差序列进行白噪声检验,检验的检验标准包括Q统计量和检验对应的概率.检验结果如图3.从图3可以看出自相关(AC)系数的绝对值几乎都小于0.1,在零假设下,Q统计量服从分布,其中m是最大滞后期,因为样本容量n=152,可以令m=√152≈12,此时QStat=12.956,当p=q=4时,在显著性水平=0.1时,查分布表可知,(12-4-4)== 13.277>Q-Stat=12.956,则不能拒绝残差序列相互独立的原假设,检验通过,接受原假设,即残差序列是纯随机的白噪声过程.2.4 模型的拟合和预测本模型的预测就是根据时间序列历史数据,建立ARIMA模型对未来一段时间的数据进行预测,现在ARIMA建模方法之所以在各个领域得到广泛应用,很大程度是其在预测方面的成功,尤其是短期预测方面.本文采用一步向前静态预测,即每预测一次,用真实值代替实际值,加入到估计区间,再进行向前一步预测.由于本文使用的是月度数据截止到2014年7月,采用一步向前静态预测只能预测一期的值即8月的收盘价.由于本模型中对样本数据取了对数,为了更好的观察真实值和预测值的差距,通过科学计算器我们求出其原值:由表3可知,该模型拟合的绝对误差和绝对百分比误差较小,因此该模型的拟合结果较好,可以用来预测,且对8月份的预测较为准确,误差较小.3.1 模型的分析从上述的拟合和预测可以得出,ARIMA模型采用静态一步向前的方法可以较好的进行短期预测.从所建立的模型可以看出,上证指数在2014年4月至2014年8月以来虽然有涨有跌,但是总体呈现逐渐上升的趋势[6].这可能得益于以下几个方面的原因:首先,我国经济基本面依然较好.从消费方面看,对文化、教育、医疗、养老和旅游等服务类需求增长迅猛,网上购物等新兴业态的发展则有力地促进消费潜能的释放.从投资看,我国在城市轨道交通、环境治理、城市排水和农村基础设施等方面存在着极为迫切的需求.其次,外部环境趋于改善,今年以来,全球经济复苏在波动中逐步加强,美国经济的好转将对其他发达国家乃至全球经济产生较大带动作用,随着欧盟各个国家间加强交流合作,欧洲主权债务危机的不良影响正在逐步消除.再次,市场预期转好.今年以来,我国通胀压力持续缓解,价格总水平(CPI)处于调控目标3.5%以内,目前企业家信心普遍回升,投资意愿上升,采购活动加快.3.2 模型的展望尽管ARIMA模型在非平稳时间序列的预测方面有很好的表现,但是该模型仅仅在短期预测方面有一定的可行性,而对长期趋势就会表现出很大的局限性,预测的偏差较大,结果失真.并且该模型只是考虑了时间序列本身的特性,而忽视了其他更为复杂的外部因素的影响,所以难以对变化多端的股票市场的长期趋势进行精确地刻画.总体来说,该模型还是可以对大盘指数实现短期预测,进而为广大投资者提供投资决策的依据.【相关文献】[1]吴小强,吕文龙.股票价格指数的趋势预测——基于上证指数数据的时间序列分析[J].金融经济:下半月,2012 (10):80-82.[2]旷芸,梁宗经.基于ARIMA模型的标准普尔S&P500指数预测分析[J].现代商贸工业,2012,24(14):100-102.[3]刘云.ARIMA对我国上证指数的预测研究[J].现代商贸工业,2012,24(16):97-98. [4]严敏,胡志明.基于ARIMA模型对上证指数的实证分析[J].经营管理者,2013,21:076. [5]徐珍,李星野.小波ARMA模型和ARIMA模型对上证指数的预测效果探究[J].现代商业,2012(30):32-33.。

上证指数未来两年走势预测(基于傅里叶变换及周期推演)

上证指数未来两年走势预测(基于傅里叶变换及周期推演)

上证指数未来两年走势预测(基于傅里叶变换及周期推演)摘要:本文将上证指数时间序列差分后进行傅里叶变化,剔除噪声周期,挑选出五个主要周期。

将这五个周期按能量值加权后向未来推演,预测上证指数未来两年内走势。

这个预测的过程,没有用结果倒推参数、人为添加删除样本等行为。

为了体现本文研究结果的可验证性,本文采用2005年6月至2015年6月共512个周线数据作为研究样本,对2015年6月至2017年底的走势进行了推演。

推演显示2015年6月后将延续下跌走势至2015年7月底,2015年8月至2015年11月底会有一波反弹,然后继续下跌至2016年3月,2016年3月至2016年8月为震荡行情,2016年8月下旬开始讲有一波较大的行情涨至2017年1月,2017年1月至2017年4月经历一段回撤后市场将重拾升势,一路上行,至2017年底仍在上升途中。

截止目前,市场走势与本文预测基本一致,体现了本文在进行波段择时方面有一定的参考价值。

2011年6月本人曾采用类似方法进行过研究,在之后两年取得了较好的预测效果。

1.对股票市场周期现象的观察1.1股票市场周期的感性观察周期循环普遍存在于自然现象中。

夜晚过去就是白昼,太阳落山又会重返黑夜。

大海潮起潮落,行星运动。

季节的到来和更替。

在参与股票交易的过程中,我们也的确能隐约感觉到股票市场周期的存在。

市场仿佛总是在重复着四个阶段。

第一个阶段是低迷阶段。

行情持续屡创低价,此时投资意愿甚低,一般市场人士对于远景大多持悲观的看法,不论主力或中散户都是亏损累累。

做短线交易不易获利时,部分中散户暂时停止买卖,以待股市反弹时再予低价套现伏空;没有耐性的投资人在失望之余,纷纷认赔抛出手中的股票,退出市场观望。

罗伯特·亚雷曾将这一阶段描述为:“熊市的最后阶段是来自于价格合理股票的不合理下跌,任何人都急于求现,哪怕只是其中一小部分。

”第二阶段是上升阶段。

由于前段低迷期的长期盘跌已久,股价大多已经跌至不合理的低价,市场浮股亦已大为减少,随着抄底投资者的涌入,市场止跌上扬。

基于Copula函数的上证综指量价关系

基于Copula函数的上证综指量价关系

Finance金融视线 2012年10月123基于Copula函数的上证综指量价关系上海大学经济学院 黄应梅摘 要:资产价格与成交量间存在同时存在线性和非线性的相关关系。

本文对线性相关关系,运用VAR模型,建立上证指数和成交量间稳定的线性模型,研究了上证指数与成交量间的格兰杰因果关系,并对上证指数对数收益率和成交量对数变化率之间的线性关系给出定量分析结果。

对于二者之间的非线性、非对称关系,先根据核密度估计模拟出VAR模型中对数收益率和成交量对数变化率的残差分布函数,再利用Copula研究了两者之间的相依强度以及相依结构,定量描述了上海股市量增价升现象并对其成因进行了分析。

关键词:Copula函数 核密度估计 Granger因果关系 VAR 中图分类号:F722 文献标识码:A 文章编号:1005-5800(2012)10(c)-123-02在经典的资本市场一般均衡理论中,研究对象基本上都是证券收益率,且假设证券收益率服从正态分布。

经典金融理论没有考虑成交量与价格波动之间的相互关系,而资本市场中成交量与价格联动现象却频频出现,量价关系的研究成为证券市场技术分析的基石。

基于20世纪80年代以前的实证研究,Karpoff(1987)综述了美国资本市场(主要是股票市场)价量关系,总结了资产价格与成交量之间的关系: 不管是市场指数还是单项资产,成交量与价格水平变化程度正相关。

过去研究资本市场量价关系的方法大多基于Granger 因果关系和同期因果线性关系,基于VAR ,Arch ,Garch 或者分位数回归等统计计量方法,但针对证券收益率的非线性、非对称和厚尾的特性,这些方法都各有一定的局限性。

本文所应用的Copula 函数方法最早由Sklar(1959)提出,Copula 函数从概率的角度来反映变量间的相关性。

Copula 方法不仅可以有效描述随机变量间的相关程度,并且反映它们间的相关模式,描述它们的联合分布函数。

使用指数函数进行股票价格预测

使用指数函数进行股票价格预测

使用指数函数进行股票价格预测股票市场一直以来是新闻热点之一,股票的价格波动在一定程度上反映了市场的热点、经济形势和投资者的情绪。

投资者们都想知道股票将来的价格走势,于是预测股票价格成为一项重要的工作。

指数函数是一种非常常见的函数,它能够模拟股票价格的波动。

本文将介绍指数函数的原理和如何通过使用指数函数进行股票价格预测。

一、指数函数的原理指数函数的形式为y= a^x,其中a为常数,x为自变量。

指数函数的图像呈现出S形,当a>1时,y随着x的增大而增大,且增长速度逐渐加快。

当a<1时,y 随着x的增大而减小,且减小速度逐渐加快。

在股票市场中,股票价格的波动也呈现出这样的特点,即趋势由弱到强,然后由强到弱,最终趋势反转。

二、指数函数在股票价格预测中的应用在股票价格预测中,我们可以利用指数函数对历史价格进行拟合,然后根据拟合结果预测未来的价格。

这里介绍两种具体的应用方法。

方法一:通过指数函数预测短期价格趋势我们可以通过指数函数预测股票价格的短期趋势。

具体步骤如下:1. 选取一条历史价格曲线,将其拟合为指数函数。

拟合的过程可以使用Excel 中的趋势线功能来实现。

2. 根据拟合结果,确定当前价格的上限和下限。

3. 判断当前价格与上下限的位置关系,预测短期趋势。

若当前价格超出上限,则预测价格将下跌;若当前价格低于下限,则预测价格将上涨;若当前价格在上下限之间,则预测价格将继续波动。

方法二:通过指数函数预测长期价格趋势我们也可以通过指数函数预测股票价格的长期趋势。

具体步骤如下:1. 选取一段历史价格曲线,将其拟合为指数函数。

2. 利用拟合函数,预测未来价格的波动情况。

在预测过程中,需要考虑到市场的整体趋势、政策变化和公司的发展前景等因素,以获取更准确的预测结果。

3. 根据预测结果,制定投资策略。

若预测价格将上涨,则可以适当增加持股数量或继续持有;若预测价格将下跌,则可以适当减持股份或考虑卖出。

三、指数函数预测股票价格的局限性尽管指数函数在股票价格预测中具有一定的优势,但也存在一些局限性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(
t
)
)2
= dt
ξ=2 1
同样的,第 k 个主成分 fk 的求解就是在上式的最大化问题中添加约束条件 ∫ξkξk−m = 0(其中m= 1,⋅⋅⋅, k −1)
求得[6]。
函数型主成分的权重函数 ξ (s) 满足特征方程 ∫ v (s,t )ξ (t ) dt = λξ (s) ,其中 λ 为特征值。 记Vξ (s) = ∫ v (s,t )ξ (t )dt ,则Vξ (s) = λξ (s) 。 函数型主成分分析中数据 x (t ) 是函数的形式,样本的个数 N 决定了其协方差算子 V 的秩为 N −1 。
曲率可以用 D2 x (t ) 表示[4]。
2.1. 数据平滑
最简单的平滑方法为线性平滑,线性平滑法是指用离散观测值的线性组合去估计函数 xˆ (t ) ,线性平
滑可以衍生出平滑算子的许多性质,并且其运算速度较快,但是有时非线性平滑方法在不同的数据和同 一个数据的不同部分,结果会更优良,因而本文考虑基函数平滑法。基函数平滑法是将离散的观测数据 转化为相应函数的平滑方法,基函数能够保留待估函数的性质。它是用 K 个己知的基函数
Abstract
In the research of financial data, the functional data are often encountered. In this paper, the prediction model of functional principal components analysis is established to forecast the Shanghai Stock Index. Based on the principal component analysis theory and calculation method, the Shanghai Composite Index is forecasted by Matlab.
x(s)

x(t)
的协方差为
v (s,t ) ,则有
v ( s, t )
=
∑ 1 N
N −1 i=1
xi
(s) xi
(t)

函数型数据的第一主成分 f1 的求解为求下面有约束条件的最大化问题:
( ) ∑ max

1 N −1
N i=1
∫ξ (t ) xi (t ) dt
2
(6)

s.t.∫

采用基函数平滑方法时,常选用的基函数包括傅立叶基,B-Spline 基,多项式基,常数基等。对于
周期性的数据常采用傅里叶基,对于非周期性的数据通常用 B-Spline 基进行拟合[5]。在基函数 φk (t ) 确
定的情况下,系数向= 量 c (c1, c2 ,⋅⋅⋅, cK )′ 的一组取值唯一地确定一个函数。估计系数 ck 的最简单方法是最
Received: May 6th, 2016; accepted: May 27th, 2016; published: May 30th, 2016 Copyright © 2016 by author and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
=k 1=k 1
293
程丽娟
2.3. 函数型主成分预测模型
设随机过程 {X (t ) : t ∈[T1,T2 ]} 均方连续,且二次可积。设随机变量 X (t ) 是 X (t ) 的线性均方估计,则
{ } 有
E

X
(t
)

X
(t
)
2

=
inf
E

Z

X
(t
)
2

:
Z

Prediction for the Shanghai Stock Index Based on the Functional Data
Lijuan Cheng
School of Mathematics and Computation Science, Lingnan Normal University, Zhanjiang Guangdong
以获得估计函数。 上式中的第一项度量了曲线的拟合效果,第二项度量了曲线的平滑度。正的常数 λ 决定了拟合度与
( ) ( ) 平滑度之间的平衡,当 λ 较小时,惩罚项对 PENSSRλ x y 影响较小;当 λ 较大时,在 PENSSRλ x y 上
产生较大的粗糙惩罚。 λ 的值由广义交叉验证法确定。
本文主要建立函数型主成分分析的预测模型,分析函数型数据在上证指数预测中的应用,根据函数 型数据分析的原理及其求解主成分分析的方法,使用 Matlab 软件对上证指数进行预测。
2. 函数型数据分析
对于原始数据序= 列 y ( y1, y2 ,⋅⋅⋅, yn ) ,建立回归模型
( ) y=j x t j + ε j ,=j 1, 2,⋅⋅⋅, n
L2X
,其中 L2X 是希尔伯特空间 L2 (Ω) 的一个希尔伯特子空
( ) 间。 X (t ) 是 X (t ) 在子空间 L2X 上的正交投影,即 X (t ) − X (t ) ⊥ L2X ,从而有
E ( X (s) − X (s))( X (t) − X (t)) ( =E X (s) − X (s))( X (t) − X (t )) ,∀t ∈[T1,T2 ]
fi (t ) dt
(8)
其中,fi 称为主因子,它是对应于协方差函数 C (t, s) 的第 i 大特征值 λ 的正则化的特征函数,µ 是 {X (t )}
的均值函数[7]。
第 i 个主成分解释的方差(即方差的累积贡献率)为 Vi = λi V ,其中 V 是 {X (t )} 在区间 [T1,T2 ] 中的总
拟合,即使残差平方和最小。另一方面,如果得到的曲线波动很大或局部变化过大的话不希望拟合的太
好,即放弃一定程度的拟合度,达到较好的平滑度。因此,我们定义带惩罚的残差平方和为:
{ } ( ) ( ) PENSSRλ x= y ∑ y j − x t j 2 + λ × PEN2 ( x)
(4)
j
{ } ( ) 其中= , PEN2 ( x) ∫= D2 x (s) 2 ds D2 x 2 ,即为惩罚项, λ 称为平滑参数。通过最小化 PENSSRλ x y ,
因此其非零特征值的最大个数为 N −1 ,进而满足约束条件的主成分的最大个数为 N −1 。在实际观测中,
我们通常选取样本个数 N 与观测点的个数 T ,至少应该满足 N < T 2 。
函数型主成分的选取思想与多元主成分的选取相同,根据所研究问题的需要确定累积贡献率,选择
K
N −1
合适的 K 使得 ∑ λk ∑ λk 达到所确定的累积贡献率,一般要求累积贡献率不小于 85%。
(1)
( ) 其中, x t j 为原始数据序列的函数在 t j 时的取值,ε j 为噪声,表示观测数据中的扰动因素、误差或其它
外生因素[3]。在标准的统计模型中,通常假定 ε j 服从零均值有限方差的独立分布,且通常假定方差相等。 但在处理函数型数据时,可以放松这些假设条件,使模型更加符合现实中的问题。在函数型数据分析中, 首先要考虑到原始数据的选取问题,而原始数据的选取要通过抽样率来进行。原始数据在时间轴上的曲 率不同,通常曲率值大的地方,相应的数据分布比较密,因此在曲率大的地方应该选取较多的数据点,
(7)
设 ε 2 (s) 为 X (s) 在 s ∈T3,T4 的线性预测的均方误差,表示为= ε 2 (s)
E

X
(t
)

X
(t
)
2


分别提取两个区间的主成分,随机过程 {X (t )} 在 [T1,T2 ] 中第 i 个主成分定义为:
( ) = ξi
∫ T2
T1
X (t)− µ (t)
Advances in Applied Mathematics 应用数学进展, 2016, 5(2), 291-297 Published Online May 2016 in Hans. /journal/aam /10.12677/aam.2016.52037
文章引用: 程丽娟. 基于函数型数据的上证指数预测[J]. 应用数学进展, 2016, 5(2): 291-297. /10.12677/aam.2016.52037
程丽娟 指数进行预测。
关键词
函数型数据,主成分分析,预测
1. 引言
传统的数据分析中,获得的数据包括截面数据、时间序列数据以及面板数据,但是对这三种数据分 析时要依赖许多的假设条件,适用数据的类型具有一定的局限性,加拿大学者 J.O. Ramsay 在 1982 年首 次给出将泛函分析、拓扑学和统计学相结合的设想,提出“函数型数据”的概念以及函数型数据的分析 方法[1]。近年来,函数型数据分析广泛应用在医学、气象学、生物学等领域。金融数据间隔较短,可以 视为连续数据,即函数型数据,因而可以进行函数型数据分析[2]。
2.2. 函数型主成分分析
函数型数据主成分分析是将变量看作函数的形式,其样本的协方差矩阵也变为函数的形式,因此可以
{ } ( ) 避免出现高维的协方差矩阵。在函数数据下,观测矩阵为 x (t=) x1 (t ), x2 (t ),⋅ ⋅ ⋅, xN (t ) T t ∈ Τ= {1,⋅ ⋅ ⋅,T} ,
φk (t )(=k 1, 2,⋅⋅⋅, K ) 的线性组合得到函数 x (t ) 的估计 xˆ (t ) ,即
相关文档
最新文档