回归大作业-基于多元线性回归的期权价格预测模型

合集下载

基于多元线性回归的房价预测模型

基于多元线性回归的房价预测模型

基于多元线性回归的房价预测模型作者:李正蹊来源:《中国新通信》 2018年第23期一、引言1.1 研究背景中国部分城市房价行情表格[1]通过上表,我们可以看出在北京、广州等一线大城市房价是十分惊人的,这与其政治地位、经济水平等因素息息相关,而过高的房价又使得房价预测成为一项紧要任务。

1.2 研究综述很多学者都已经在房价预测这一方面取得卓越成效:例如: 丁凤老师的《房地产价格影响因素及预测研究》[2],高玉明、张仁津老师的《基于遗传算法和BP 神经网络的房价预测分析》[3]。

虽然结果的精确度十分高,可他们所用的方法都过于复杂,不利于人们直接应用。

本文利用多元线性回归的方法对房价进行预测,更为简洁地对房价进行预测。

1.3 研究成果通过多元线性回归的方法进行房价预测的灵感是源于日常生活,例如:距离学校越近的房子价格越高,处于交通中心的“天价”房子等显而易见的事。

如果将这些影响因素全面地考虑,应该就能对房价进行简单准确的预测。

所以作者选用多元线性回归的方法。

多元线性回归原理与一元线性回归相同,较为简单,可运算较为复杂,所以在应用时应借助统计软件,但总体而言多元线性回归相比于神经网络等方法要简单快捷得多。

二、模型综述2.1 多元线性回归2.1.1 名词介绍回归[4]:回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi) 和另一组(X1,X2,…,Xk) 变量之间关系的统计分析方法,又称多重回归分析。

通常Y1,Y2,…,Yi 是因变量,X1、X2,…,Xk是自变量。

回归分析是一种数学模型。

回归系数[5]:回归系数是和线性回归模型紧密相关的未知参数,通过线性模型的训练数据来获得。

在多元线性回归模型中有多个回归系数,它们表示自变量对因变量的影响力大小,所有的自变量通过回归系数共同产生因变量。

2.1.2 模型介绍[6]a. 多元回归模型与回归方程多元回归模型是描述因变量y 如何依赖于自变量X1、X2、X3…Xk 与y 的误项差ε 的方程,它的一般形式为:y= + + + +…+ + 0 1 1 2 2 3 3 k k β β x β x β x β x +ε其中0 1 2 3 k β 、β 、β 、β …β 是模型的参数,ε 为误差项,反映了非线性因素的影响。

基于多元线性回归分析的股价预测——以中信银行为例

基于多元线性回归分析的股价预测——以中信银行为例

基于多元线性回归分析的股价预测基于多元线性回归分析的股价预测 ————以中信银行为例以中信银行为例以中信银行为例2016年09月30日摘要摘要::首先建立股票价格的多元线性回归方程,使用EVIEWS 软件计算回归系数,对回归系数进行经济意义的检验和统计检验;然后利用计量经济学课程内容检验回归方程是否存在多重共线性、异方差性、自相关性等情况;接着对模型进行改进,得到的回归方程可决系数较大,并且满足多元线性回归方程的古典假定;最后将改进后的模型应用于目标预测日的开盘价预测,预测误差在可以接受的范围之内。

关键词关键词::多元线性回归,股价预测,EVIEWS股票市场被视作各国宏观经济的“晴雨表”,能够作为衡量一国经济实力的重要内容。

随着我国国民收入的不断提高,股票市场规模不断扩大。

在股票市场规模日益扩张的同时,其弊端也渐渐涌现出来,如相关制度不够健全,政策内容朝令夕改(以熔断机制为例,不到一周的时间被暂停);内幕交易时有发生,市场化程度不高、投机风气盛行等,导致股票价格剧烈波动,股民信心受挫纷纷退市。

因此,研究股票价格的影响因素,并且对股票价格进行预测是十分有必要的。

上市银行股价受到很多因素的影响,分析股价的影响因素,选取主要影响因素,采用多元线性回归分析方法,建立可靠的上市银行股价预测模型,提高模型预测精确度,为投资者提供有价值的建议。

一、影响上市银行股票价格的因素分析影响上市银行股票价格的因素分析 分析上市银行股票价格的影响因素是进行预测的基础,笔者主要从三个方面选取数据:以公司价值评估中的相对价值法为基础,选取影响企业价值的会计指标作为自变量;以衡量银行偿债、盈利、营运、发展能力的会计信息指标作为自变量;以公司规模、股本结构和每股经营活动所产生的现金流作为自变量;以上证指数作为自变量。

由于股票价格包括开盘价、买入价、卖出价、收盘价等价格,为了简化模型,选取开盘价格作为股票价格。

二、多元线性回归模型的建立多元线性回归模型的建立 (一)模型的设定模型的因变量选取中信银行公布季度报表的后一天的开盘价,因变量选取中信银行公布的季度报表中的每股收益、每股净资产、资产负债率、每股经营活动产生的现金流、总资产周转率、净利润增长率等会计指标,上证指数为公布日后一天的开盘价。

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测多元线性回归是一种基于多个自变量与一个因变量之间关系的模型,它可以用于对多个因素对于一个事件或现象的影响进行分析,常应用于股票的价格预测。

本文将详细讨论如何构建多元线性回归模型进行股价分析和预测。

一、多元线性回归模型的建立股价是由多种因素决定的,例如公司业绩、市场变化、国家政策等。

为了建立更准确的多元线性回归模型,我们需要选择合理的自变量,并对它们进行预处理。

一般来说,我们需要对自变量进行归一化处理和特征选择。

1.归一化处理采用归一化处理可以将不同自变量的尺度转化为统一的维度,避免某些自变量对结果的影响过大。

一般常用的归一化方法有:Min-Max 归一化和 Z-Score 归一化。

假设我们要对自变量 $x_{i}$ 进行 Min-Max 归一化,则操作步骤如下:$$ x_{i} = \frac{x_{i} - Min(x_{i})}{Max(x_{i}) - Min(x_{i})} $$其中,$Max(x_{i})$ 和 $Min(x_{i})$ 分别表示自变量 $x_{i}$ 在数据集中取到的最大值和最小值。

2.特征选择在实际建模中,我们可能需要面对大量的自变量,但是有的自变量可能对结果的影响并不大。

因此,在建立多元线性回归模型时,需要进行特征选择,选取与结果相关性高的自变量来构建模型。

常用的特征选择方法有:卡方检验、皮尔逊系数、互信息等。

二、模型的拟合与评估当我们确定好自变量后,就需要进行模型的拟合。

我们可以采用最小二乘法来估计模型参数,即$$ w = (X^TX)^{-1}X^TY $$其中,w 表示模型参数,X 表示包含所有自变量的设计矩阵,Y 表示目标变量。

为了评估模型的拟合效果,我们一般会使用 $R^2$ 值和 RMSE(均方根误差)来评价模型的拟合效果。

- $R^2$ 值其中,$y_i$ 表示实际值,$\hat{y_i}$ 表示预测值,$\bar{y}$ 表示 $y$ 的均值。

基于多元线性回归的市场需求预测模型

基于多元线性回归的市场需求预测模型

基于多元线性回归的市场需求预测模型市场需求预测一直是企业决策的重要环节,它的准确性直接影响着企业的销售额和利润。

基于多元线性回归的市场需求预测模型,是一种常用的数据分析方法,可以帮助企业了解市场需求,预测销售量,并提供决策依据。

多元线性回归是一种用于分析多个自变量对一个因变量的影响的统计方法,其核心思想是寻找一条线来描述多个自变量和因变量之间的关系。

对于市场需求预测而言,我们可以将销售量作为因变量,将各种潜在影响因素(如广告投入、产品特征、竞争对手销售量等)作为自变量,建立一个多元线性回归模型,从而预测市场需求量。

在构建多元线性回归模型之前,我们需要收集相关的数据。

这些数据包括历史销售量、广告投入、产品特征、竞争对手销售量等信息。

在收集数据时需要尽量确保数据的准确性和完整性,以提高预测模型的准确性。

在建立多元线性回归模型之前,还需要进行一些预处理步骤。

首先,我们需要对数据进行清洗,排除异常值和缺失值。

然后,对自变量进行标准化处理,以消除不同变量之间的量纲差异。

最后,我们可以使用相应的统计软件,如R、Python等,来进行模型的构建和分析。

构建多元线性回归模型的关键是选择合适的自变量。

在选择自变量时,我们可以根据经验和领域知识进行初步筛选,然后使用逐步回归或其他变量选择方法进行进一步选择。

选择自变量时要注意自变量之间的相关性,尽量选择与因变量有高度相关性的自变量。

在建立模型后,我们可以利用已有数据对模型进行验证和评估。

常用的评估指标包括决定系数(R^2)、均方根误差(RMSE)、平均绝对误差(MAE)等。

通过评估模型的准确性,我们可以判断模型的可靠性,并对模型进行必要的修正和改进。

一旦构建好的多元线性回归模型具有较高的预测准确性,我们就可以利用该模型进行市场需求预测。

预测的结果可以帮助企业制定合理的市场策略,调整产品定价,优化广告投入以及与竞争对手的竞争策略。

然而,多元线性回归模型也存在一些限制。

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测1. 引言1.1 研究背景随着现代科技的不断发展,金融市场的波动已成为社会经济中一个不可忽视的重要因素。

股市作为金融市场中最具代表性的一部分,其价格波动关乎着国民经济的发展和投资者的利益。

对股价进行分析及预测具有重要的现实意义。

股价分析及预测一直是金融领域中的重要课题,其对于投资者的决策具有重要的指导作用。

而基于多元线性回归的股价分析及预测方法,其能够通过多个自变量对股价进行较为准确的预测,为投资者提供更有效的参考依据。

通过对多元线性回归模型的搭建、数据的收集与处理、模型的验证与评估以及股价预测方法的探讨,可以更全面地了解股价波动的原因及规律,为投资者提供更准确的预测结果,帮助他们在金融市场中做出更明智的决策。

本研究将基于多元线性回归进行股价分析及预测,以期为金融市场的稳定发展提供一定的参考和帮助。

1.2 研究目的本研究的目的是通过基于多元线性回归的股价分析及预测,探讨股价波动的规律性,并寻找影响股价变动的关键因素。

具体目的包括:深入了解股价波动的特点,分析影响股价波动的因素,为投资者提供更准确的投资决策依据;建立多元线性回归模型,揭示不同因素之间的相互关系,从而更好地预测股价的走势;通过数据收集和处理,验证和评估模型的有效性和准确性,提高股价预测的精准度和可靠性。

希望通过本研究的实施,能够为股市投资者提供科学可靠的股价预测模型,帮助他们更好地把握市场走势,降低投资风险,实现更好的投资收益。

1.3 研究意义股价分析和预测在投资领域中具有重要的意义,对投资者和市场参与者具有指导作用。

基于多元线性回归的股价分析及预测能够帮助投资者更好地理解股价波动的规律,提高投资决策的准确性和效率。

通过建立多元线性回归模型,可以分析不同因素对股价的影响程度,找出影响股价波动的主要因素,为投资者提供科学的投资建议。

研究股价分析及预测的意义在于提高投资者的投资成功率和投资收益,降低投资风险,促进资本市场的健康发展。

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测作者:***来源:《科技经济市场》2020年第01期摘要:中国是世界上最大的发展中国家,中国股票市场的股票价格是序列相关的,这意味着股票的历史信息可以用来预测未来股价。

本文以沪深300指数为实例,以其成交金额、最低价、成交量、次日开盘、开盘价、收盘价、最高价为解释变量,以该股票的次日收盘价作为被解释变量建立多元线性回归模型,之后对模型进行异方差性检验和自相关性检验,最后运用模型对股价进行预测。

结果表明,股票的历史信息可以用来预测未来短时间内的股票价格。

关键词:多元线性回归;股价分析;自相关性检验1 现状沪深300指数是根据科学客观的原理,挑选出深圳和上海资本市场中最具代表性股票组成样本股,用以综合反映证券市场最具市场影响力的一批优质大盘企业的整体状况。

沪深300指数是能够反映深圳股市状态的优质股票。

自中国进入新时代以来,人民生活水平日益提高,个人可支配收入日益增多,股票成为人们日常理财方式,股票价格的变动也成了劳动人民关心的问题,也是国家关心和照顾的重点问题。

中国是世界上最大的发展中国家,股票市场也正在完善发展中,中国股票市场的股票价格是序列相关的,这意味着股票的历史信息可以用来预测未来股价。

2 多元线性回归模型在股价预测中的应用在实际生活中,股票的价格间存在一定的线性关系,本文将采用回归分析的方法,以沪深300指数和上证指数的次日开盘价、收盘价格、最高价格、最低价格、成交金额、开盘价格、成交量为自变量建立模型。

2.1 多元线性回归模型的建立本文使用沪深300指数2018年的历史数据,即以次日开盘价格、收盘价格、最高价格、最低价格、开盘价格、成交量、成交金额为自变量,以该股票的次日收盘价为因变量建立多元线性方程并进行求解预测。

本文所用数据来源于网易财经股票行情历史交易数据,选取沪深300指数2018年一整年的数据进行建模分析預测。

2.2 多元线性回归模型在沪深300指数中的预测研究将股票的历史数据输入SPSS软件中,运用SPSS进行数据处理得到模型R2值为0.989,调整R2值为0.988,Durbin-Watson值为2.011。

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测股市是一个充满不确定性的市场,股价的波动也常常让人捉摸不透。

然而,对于从事股票市场的投资者、财务分析师和决策者而言,对股价的预测和分析却是必不可少的工作。

而基于多元线性回归的股价分析及预测模型,成为了一种可行的工具。

多元线性回归是一种对多个自变量和一个因变量之间关系进行建模的方法。

在股价分析和预测中,可能会有多个影响股价的因素,如公司的盈利能力、行业走势、市场情况等等,这些因素都可以被看做自变量,股价则是因变量。

基于这些因素,我们可以建立一个多元线性回归模型来预测股价的变化。

首先需要收集一些相关数据,如公司的财务报表、行业的统计数据和市场的指标,然后进行数学处理,得到一个多元线性回归方程。

在得到一个多元线性回归方程之后,我们就可以根据模型对未来的股价进行预测。

需要注意的是,这种预测并不是完全准确的,因为股市本身就是一个充满不确定性的市场,股价受到的影响因素也是多种多样的。

1.数据的准确性和可靠性。

股价预测的结果,直接受到使用的数据的影响。

如果数据不准确或不可靠,模型建立的结果也将未必准确。

2.模型的合理性。

模型的建立需要合理,不应过于复杂或者过于简单,否则将影响模型的准确性。

同时,也需要注意模型中的自变量应有意义,最好能从业务理解上进行解释。

3.实时性。

股市变化极快,随时受到各种影响,因此使用基于多元线性回归的股价预测模型时,要保证尽可能实时、及时地更新数据和进行预测。

总之,基于多元线性回归的股价分析及预测模型是一种可行的工具。

在股价预测中,它可以提供一种参考,帮助投资者和决策者更好地了解股票市场的趋势和走向。

但需要注意,它并不是完美的,需要结合实际情况进行分析和判断。

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测

基于多元线性回归的股价分析及预测随着金融市场的不断发展和信息技术的不断进步,股价成为了人们经常关注的焦点。

股票投资者希望能够利用各种预测方法来分析股价,以获得更好的投资回报。

本文将基于多元线性回归的方法来分析和预测股价,并提出相应的建议。

首先,本文将介绍多元线性回归的基本原理。

多元线性回归是一种基于多个自变量来预测一个因变量的方法。

在股价预测中,自变量可以包括公司财务数据、行业数据、市场数据等多方面的因素。

因变量通常是股价。

多元线性回归的目标是建立一个预测模型,通过输入自变量的值,预测因变量的值。

其次,本文将详细介绍如何进行股价分析和预测。

首先要确定自变量,包括选取哪些财务数据、行业数据和市场数据,并进行数据采集和预处理。

接着,使用多元线性回归建立预测模型,通过观察模型的拟合情况和统计显著性等指标来确定模型的可信度和有效性。

最后,根据模型预测结果和市场趋势分析,制定相应的股票交易策略。

最后,本文将给出一些实用建议。

首先,要选择可靠的数据源和数据分析工具。

其次,由于股价的波动性很大,要注意数据的时间跨度和时间分布,以免误导分析。

此外,要注意多元线性回归模型中各自变量之间的相关性问题,以避免模型预测结果失真。

最后,要充分考虑市场趋势和股票投资风险,制定适当的交易计划。

总之,本文通过介绍多元线性回归的方法,详细讲解了如何进行股价分析和预测,并提供了一些实用建议。

然而,股票市场是个充满风险和变数的地方,不光要靠预测和分析,更要靠自己的判断和决策来获得最终的投资回报。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于多元线性回归的期权价格预测模型王某某(北京航空航天大学计算机学院北京100191)1摘要:期权是国际市场成熟、普遍的金融衍生品,是金融市场极为重要的金融工具。

2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权——上证50ETF期权,翻开了境内场内期权市场的新篇章。

50ETF期权上市以来,市场规模逐步扩大,其发展情况境外期权产品相同时期。

本文以此为研究背景,以“50ETF购12月”这支期权为研究对象,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。

本次研究以多元线性回归的全模型(模型1)为出发点,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。

进而通过主成分回归(模型4)和逐步回归(模型5)进行降维,结果表明因变量与解释变量之间存在强烈的线性相关关系,且主成分回归和逐步回归相比全模型有更好的预测能力。

关键词:期权价格多元线性回归50ETF 多重共线性因子分析一、引言期权(option)是依据合约形态划分的一种衍生品,指赋予其购买方在规定期限内按买卖双方约定的价格(即协议价格或行权价格)购买或者出售一定数量某种金融资产(即标的资产)的权利的合约。

期权购买方为了获得这个权利,必须支付给期权出售方一定的费用,称为权利金或期权价格错误!未找到引用源。

2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权——上证50ETF,翻开了境内场内期权市场的新篇章。

期权是与期货并列的基础衍生产品,是金融市场极为重要的金融工具之一。

自50ETF上市以来,市场规模逐步扩大。

2015年2月日均合约成交面值为亿元,12月就达到了亿元,增长了倍;2月日均合约成交量为万张,12月就达到了万张,增长了倍;2月权利金总成交额为亿元,12月就达到了亿元,增长了倍错误!未找到引用源。

我国股票市场有上亿的个人投资者,是一个较为典型的散户市场错误!未找到引用源。

相较于专业投资机构讲,散户缺乏时间,精力以及专业分析,投资具有很大的投机行为。

对于这些投资者来说,期权价格的变动则是他们最为关注的问题,其变化直接影响到自身的收益。

在实际情况中,影响股票价格的因素很多,涉及到金融政策、利率政策以及国际市场等因素,其作用机制也相当复杂错误!未找到引用源。

因此,对于期权价格预测的研究,则可以降低投资者的投资风险,及时调整投资结构,从而保障自身的收益。

本文选择“50ETF购12月(期权代码:)”这支期权作为研究对象,根据过去一个月内期权的交易数据,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持1作者简介:王某某,北京航空航天大学研究生。

仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。

下文由如下几部分构成:第二部分介绍了本次研究的数据集,包括数据来源、和数据字段;第三部分重点介绍了各个多元线性回归模型,包括全模型及异方差检验,残差的独立性检验、误差的正太分布检验和多种共线性检验,在第4小节和第5小节分别采用主成分回归和逐步回归对模型加以改善;第四部分运用第三部分建立的各个模型对期权价格进行了预测;第五部分对本文研究进行了总结并未来的研究加以展望。

二、数据说明本次研究的数据来源于Wind资讯金融终端,从上面获取了“50ETF购12月”这支期权自2016年10月24日至2016年11月24日(只包含工作日)共计24日的交易数据。

经过整理后得到最终的数据字段,见表1。

表 1 期权交易数据字段收盘价开盘价最高价最低价结算价成交额成交量持仓量涨停价跌停价期权交易数据见附录1。

三、建模1 符号说明各个变量及其符号说明见表2。

表 2 各个变量及其符号说明变量符号明日收盘价今日开盘价今日收盘价今日最高价今日最低价今日结算价今日成交额今日成交量今日持仓量今日涨停价今日跌停价2 解释变量与指标变量的散点图在建立模型之前,首先利用MATLAB绘制各个解释变量与指标变量(明日收盘价)之间的散点图,观察各个解释变量与指标变量之间的关系,散点图结果见图1。

图 1 各个解释变量与指标变量(明日收盘价)的散点图通过图一中的散点图可以看出,明日收盘价与今日收盘价、今日开盘价、今日最高价、今日最低价、今日结算价、今日持仓量、今日涨停价以及今日跌停价之间有较为明显的线性关系;而与今日成交额以及今日成交量之间的线性关系并不明显。

3 全模型通过散点图我们观察到指标变量与各个解释变量之间大致上为线性关系,所以考虑多元线性回归模型进行建模。

模型建立与求解首先建立各个解释变量与指标变量的全模型,即考虑如下模型:式中,,,…,,都是与解释变量无关的未知参数,其中,,…,称为回归系数。

在MATLAB中使用regress函数即可求解此多元线性回归模型,求解结果见表3.表 3 MATLAB求解全模型结果回归系数回归系数的估计值回归系数置信区间0 0 0= = < =从上表容易看出模型(1)成立,此时指标变量与解释变量满足的回归模型为:(模型1)在MATLAB中画出模型1的残差分布,见图2。

除第12个数据外其余残差的置信区间均包含零点,因此第12个点应当视为异常点,将其剔除后重新计算,得到模型2:图 2 模型1的残差分布(模型2)模型2的= ,= ,< ,= 。

但同时我们发现,各个回归系数的置信区间仍然均包含零点。

画出模型2的残差分布,发现又出现了异常点,按照上面的方法剔除异常点直至没有异常点产生。

最终一共去掉了5个异常点(分别是2,12,15,22以及23),最终得到模型3:(模型3)模型3的= ,= ,< ,< 。

可见模型2相当显著,各个回归系数的置信区间均不包含零点;但是去除的数据点有5个(总共23个),去除的异常点比较多,容易去除有用信息,所以我们只把模型3作为后期预测的一个对比模型,在之后的分析中,我们只考虑去除第12个异常点的数据。

接下来进行异方差检验,残差的独立性检验以及多重共线性检验。

异方差检验通过SPSS画出残差对预测值的散点图,见图3。

图 3 残差对预测值的散点图根据图3可以认为数据基本不存在异方差性,即认为随机误差具有相同的方差。

残差的独立性检验通过SPSS的Durbin-watson检验得到DW值为,模型2中解释变量数量k(包括常数项)为7,样本数量n 为22,查DW分布表得到相应的,。

由于,认为随机误差之间无自相关错误!未找到引用源。

误差的正态分布检验通过SPSS画出正态P-P图以及回归标准化残差频率分布直方图,见图4。

图 4 误差的正太分布检验图从上图可以认为误差服从均值为0的正态分布。

多重共线性检验多元线性回归模型的基本假设中要求设计矩阵X的列向量之间不存在密切的线性关系错误!未找到引用源。

,如果存在,就称它们之间存在多重共线性。

表 4 多重共线性诊断结果通过SPSS进行多重共线性诊断,结果如下表。

从上表可以看出绝大部分变量的VIF值远远大于10,说明严重存在多重共线性,针对多重共线性的问题,接下来用主成分分析加以处理。

4 主成分回归利用MATLAB对这个十个解释变量进行主成分分析,分析过程如下。

1)对原始数据进行标准化处理即每个元素的值减去该列的均值,然后除以这一列的方差。

2)计算相关系数矩阵R,结果见表表 5 解释变量的相关系数3)计算特征值和累计贡献率见表6表 6 各个解释变量的特征根和累计贡献率变量特征根累计贡献率%%%%%%%%%%可以看出,前两个特征根的累计贡献率就达到了90%以上,主成分分析效果很好。

下面选择前四个主成分(累计贡献率%)进行综合分析。

4)前四个特征根对应的特征向量见表7表7 前四个特征根对应的特征向量第1个特征向量第2个特征向量第3个特征向量第4个特征向量5)主成分回归模型求得的主成分回归模型如下:(模型4)5 逐步回归主成分回归求出的主成分是原始变量的线性组合,表示新的综合变量。

接下来使用逐步回归的方法来筛选变量。

在逐步回归中,决定一个变量时候有必要进入模型或者从模型中剔除时,常用的方法是偏F检验错误!未找到引用源。

,关于偏F检验这里不做赘述。

在MATLAB中使用stepwise函数进行逐步回归错误!未找到引用源。

,运行结果如图5求得的逐步回归模型如下:(模型5)四、预测接下来我们利用上面求得的模型来进行期权价格预测。

利用模型1、模型2、模型3、模型4和模型5分别预测了11月25日至12月10日的期权价格,11月25日至12月20日的真实期权以及预测结果如表8。

表8 各个模型的预测结果日期真实数据模型1 模型2 模型3 模型4 模型5 2016-11-252016-11-282016-11-292016-11-302016-12-012016-12-022016-12-052016-12-062016-12-072016-12-082016-12-092016-12-122016-12-132016-12-142016-12-152016-12-162016-12-192016-12-20各个模型的平均误差以及误差百分比见表9。

表9 各个模型预测结果评价真实数据模型1 模型2 模型3 模型4 模型5 平均误差平均误差百分比% % % % %从表8和表9可以看出,模型4(主成分回归)和模型5(逐步回归)的结果最好,而模型3由于去掉了较多的异常点反而导致预测结果不好。

接下来不考虑模型3,画出其余4个模型的预测结果与真实数据的折线图,见图6在图4中,横坐标表示数据的序号,分别与各个日期对应,其中前面24个数据来自训图 6 4个模型预测结果与真实数据的折线图练集,故而各个模型的预测结果与实际结果接近;后面的数据则来自测试集,可以看出各个模型的预测结果与实际数据存在一定差异,不过总体趋势与实际数据比较匹配。

其中模型4和模型5的预测结果最好。

五、结论本文从以期权今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,期权明日收盘价为指标变量,建立了多元线性回归模型1,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。

进而通过主成分回归(模型4)和逐步回归(模型5)进行降维,通过预测结果与真实数据的差异比较了各个模型的预测效果,结果表明主成分回归以及逐步回归相比全模型有更好的预测能力。

实际情况中,该期权的当日价格波动一般不会超过15%,而普遍真是情况是8%以内,可见模型4和模型5的预测效果并不理想,今后的研究可以在以下两个方面进行改进:①不断向模型加入得到的最新数据;②运用时间序列模型进行研究。

相关文档
最新文档