基于SPSS相关性和回归分析的股票投资算法研究_徐奔
SPSS在股票市场应用 第六章

6.11.1 多项分类Logistic回归分析的 功能与意义
• 我们经常会遇到因变量有多个取值而且无
大小顺序的情况比如职业、婚姻情况等等, 这时一般的线性回归分析无法准确的刻画 变量之间的因果关系,需要用其他的回归 分析方法来进行拟合模型。SPSS的多项分 类Logistic回归便是一种简便的处理该类因 变量问题的分析方法。
6.9.1 二阶段最小二乘回归分析的功 能与意义
• 普通最小二乘法有一个基本假设是自变量取值不
受因变量的影响。然而,在很多研究中往往存在 着内生自变量问题,如果继续采用普通最小二乘 法,就会严重影响回归参数的估计。SPSS的二阶 段最小二乘回归分析便是为解决这一问题而设计 的,其基本思路是:首先找出内生自变量,然后 根据预分析结果找出可以预测该自变量取值的回 归方程并得到自变量预测值,再将因变量对该自 变量的预测值进行回归,迂回解决内生自变量问 题。
6.1.1 简单相关分析的功能与意义
• SPSS的简单相关分析(Bivariate)是最简单也
是最常用的一种相关分析(Correlate)方 法,其基本功能是可以研究变量间的线性 相关程度并用适当的统计指标表示出来。
6.2.1 偏相关分析的功能与意义
• 很多情况下,需要进行相关分析的变量的
取值会同时受到其他变量的影响,这时候 就需要把其他变量控制住,然后输出控制 其他变量影响后的相关系数。SPSS的偏相 关分析(Partial)过程就是为解决这一问题而 设计的。
基于SPSS相关性和回归分析的股票投资算法研究_徐奔

中图分类号:TP399 文献标识码:A 文章编号:1009-3044(2015)18-0088-02
DOI:10.14004/ki.ckt.2015.1510 股市已成为掌控经济整体运行情况的重要参考,因此一直 都是经济领域研究的热点。但当前多专注于股价预测和各种 实证分析,缺乏对股市进行系统的分析和认知,难以从整体上 准确把握股市的结构特性。通过运用 SPSS 中强大便捷的相关 性分析和回归分析功能,对股票价格波动趋势进行研究,预测 出股票价格之间的函数关系,使之能在股票投资、预测中发挥 重要作用。
[6] 董跃武,黄凯东,勾学荣 . 遗传算法与试题库自动组卷[J]. 中国 远程教育,2002(8):15-45.
[7]李旌燕 . EXCEL 操作题自动出题和自动阅卷系统的设计与 实现[D]. 长沙: 中南大学, 2009.
本栏目责任编辑:谢媛媛
软件设计开发
89
[4] 陆旦前, 邱建林 . 基于 Office 对象库的多层结构的图表发布 [J]. 南通大学学报: 自然科学版, 2007, 5(4): 90-92.
[5] 于淑香, 徐汀荣 . 基于 COM 技术的 Office 自动评分系统的 设计与实现[J]. 沙洲职业工学院学报, 2007 (3): 1-3.
回归分析等。股票价格变化之间的相关性就是一种股票价格 的涨落是否会影响另一种股票价格的变动,即二者之间是否有 相互联系,是否存在相关性。其相关性可由相关系数值来确 定。由公式(1)可知股票相关系数 r ,股票价格χ 、y 的函数关系
,其中 ,为常数项, 为 y 对χ 回归系数。选择
两支同行业的相关股票,其价格呈正相关,同时投资两支呈正
图 2 模型汇总 b 从图 2 中可以看出模型的拟合度是 0.827,调整后的模型拟 合度是 0.825,说明“建行 Close”的情况都可用该模型解释,拟合 度相对较高。
基于SPSS软件实现大学生创业意愿影响因素的回归分析

基于SPSS软件实现大学生创业意愿影响因素的回归分析余秀萍;王妙田【摘要】基于大学生的问卷调查数据, 运用SPSS统计软件对影响大学生创业意愿的因素进行Logistic回归分析, 结果表明父母支持、对相关政策是否了解、是否具有冒险精神是影响大学生创业意愿的显著变量.根据研究结论提出增强大学生创业意愿的对策建议.%Based on the data taken from the questionnaires among the college students in Hebei prov-ince, by means of SPSS statistical software, the factors influencing college students'entrepreneur-ial intention are analyzed by Logistic regression analysis.It is proved that family support, whetheror not to understand relevant national policies and possess adventurous spirit are the significantvariables influencing college students'entrepreneurial intention.According to the results, sugges-tions of promoting college students'entrepreneurial intention are put forward.【期刊名称】《河北建筑工程学院学报》【年(卷),期】2018(036)004【总页数】4页(P126-129)【关键词】大学生;创业意愿;影响因素;Logistic回归分析;SPSS统计软件【作者】余秀萍;王妙田【作者单位】河北建筑工程学院数理系,河北张家口 075000;河北建筑工程学院信132,河北张家口 075000【正文语种】中文【中图分类】O23高等教育大众化为我国社会进步、经济发展、国民素质提高做出了重要贡献.但大学生数量的急剧增加却给就业问题带来了巨大冲击,“大学生失业”已不再是空虚概念.教育部2010年下发的《关于大力推进高等学校创新创业教育和大学生自主创业工作的意见》中,将创新创业的主体锁定为大学生.2012年十八大报告指出,要“加大创新创业人才培养支持力度,做好以高校毕业生为重点的青年就业工作”,作为其主体的大学生群体对创业的认知程度以及找到影响大学生创业意愿的关键影响因素,则成为提高当前大学生创业成功率首要解决的问题.笔者针对大学生创业意愿的影响因素,通过建立Logistic回归模型进行分析,希望为大学生做好创业准备、高校更好地开展创业教育和政府制定大学生创业扶持政策等提供科学可靠的理论依据.1 数据来源与研究方法1.1 数据来源本文通过调查问卷法收集数据.为保证问卷回收率和问卷的可靠性,以河北省石家庄、张家口和秦皇岛等地3所高校为样本总体,于2016年9-12月开展问卷调查,共随机发放调查问卷300份,回收问卷297份,有效问卷292份.有效回收率97.33%.1.2 研究方法以创业意愿为因变量,将创业意愿分为有和没有2个水平;把影响大学生创业意愿的因素分3类:个人因素、家庭因素和社会因素.其中个人因素包括性别、年纪、性格、专业、是否有冒险创新精神和是否很希望自己有一番成就6个变量;家庭因素包括家庭经济情况和父母态度是否支持2个变量;社会因素包括学校是否有相关的活动或者培训和学生对政府的相关优惠政策是否了解2个变量(见表1).本文首先就各个变量进行单因素二项Logistic回归分析,并对显著性变量进行共线性检验;最后进行多因素二项Logistic回归分析.所有分析过程在SPSS 20.0上完成. 表1 影响大学生创业意愿的Logistic回归分析的自变量解释及赋值表变量符号变量名称赋值Y是否有创业愿意否=0;是=1X1性别男=0;女=1X2年级大一=1;大二=2;大三=3;大四=4X3专业非理工类专业=0;理工类专业=1X4性格性格内向=0;性格外向=1X5家庭经济情况家庭贫困=0;家境富裕=1X6父母是否支持否=0;是=1X7是否有冒险创新精神否=0;是=1X8是否很希望自己有一番成就否=0;是=1X9学校是否有创业的相关活动否=0;是=1X10对政府的相关政策是否了解否=0;是=12 大学生创业影响因素的单因素Logistic回归分析根据收集的数据用SPSS 20.0统计软件对10个自变量分别进行单因素Logistic回归分析,给定显著水平0.05,分析结果显示:年级(P=0.004)、性格(P=0)、性别(P=0.002)、父母态度(P=0)、冒险创新精神(P=0)、自我期望(P=0.001)、对政策的了解(P=0)这七个因素对(P(Y=1)的影响都是显著的,可能是大学生创业意愿的相关影响因素.由于自变量数量仍然较多,需进一步进行筛选,并且这七个因素之间可能存在线性关系,所以对这七个因素进行共线性诊断.3 大学生创业影响因素的多因素Logistic回归分析3.1 因素间共线性诊断对单个显著的7个因素进行共线性诊断,结果如表2.表2 显著因素的共线性诊断系数a模型共线性统计量容差VIF1年级.9411.063性别.9181.090性格.9331.072态度.7271.375冒险精神.8361.196自我期望.9191.088政策.7851.275a.因变量:意愿如果容差<=0.1或者方差膨胀因子VIF>=10,则说明自变量之间存在严重共线情况.由表2可以看出7个自变量的容差均在0.7以上,VIF均远小于10.因此认为以上7个自变量之间无共线性存在,可直接进行多因素Logistic回归分析.3.2 多因素Logistic回归分析本文采用SPSS 20.0统计软件对参数进行估计和检验,因变量创业意愿(对照=没有)的回归,结果详见表3,表3 多因素Logistic回归分析结果方程中的变量BS.E.WalsdfSig.Exp(B)步骤1a 政策1.241.36911.3311.0013.459年级-.243.1442.8331.092.784性别-.154.363.1791.672.858性格.585.3582.4271.1191.747态度2.998.36069.4671.00020.044冒险精神.760.3744.1281.0422.138自我期望.255.397.4131.5201.291常量-2.019.55113.4361.000.133 a.在步骤1中输入的变量:政策、年级、性别、性格、态度、冒险精神、自我期望由表3中的Sig看出,影响大学生创业意愿的显著因素有3个:父母态度、对政策是否了解和冒险精神.进一步由SPSS 20.0得到3个变量参数的极大似然估计等如表4所示.表4 拟合结果方程中的变量BS.E.WalsdfSig.Exp(B)步骤1a态度3.176.35281.6021.00023.951冒险精神.881.3625.9271.0152.414政策1.151.35010.8521.0013.162常量-2.307.34444.9871.000.100a.在步骤1中输入的变量:态度、冒险精神、政策因此,多因素Logistic回归模型为通过表4中Exp(B)可以看出:父母持支持态度对有创业意愿的发生比是父母持反对态度的23.951倍;了解相关政策对有创业意愿的发生比是不了解政策的3.163倍;具有冒险创新精神对有创业意愿的发生比是没有冒险精神的2.414倍.即三者按影响大小排序为:父母态度(X6)、对政策是否了解(X10)、冒险创新精神(X7).进一步由分类表5可知,拟合出的模型的正判率为分类表中显示的86.6%,从构建模型的角度而言,拟合程度还是很高的.表5 分类表分类表a已观测已预测意愿没有有百分比校正步骤1意愿没有1111687.4有2314286.1总计百分比86.6a.切割值为.500由模型可知:父母支持、对政府相关政策较为了解并且自身具有冒险创新精神的大学生创业的意愿更强烈,创业成功的概率更大.例如假设一名大学生三个因素中仅有父母支持或仅对政府相关政策较为了解或仅自身具有冒险创新精神,则由回归方程知,该大学生有创业意愿的概率分别为0.705、0.239和0.194;而若父母支持、对政府相关政策较为了解并且自身具有冒险创新精神,则该大学生有创业意愿的概率为0.947.由前四组结果对比得到结果:父母态度的影响最为显著,对政府相关政策的了解次之,个人冒险精神位居第三.同时满足父母支持、对相关政策比较了解、自身有冒险创新精神三个条件的创业概率是三个都不满足的创业概率的10.5倍.4 基于结论的对策建议由结论可知:父母态度、对相关政策的了解、冒险创新精神是影响大学生创业意愿的关键因素,因此针对这三种因素,为提高大学生的创业意愿提出以下几点建议:(1)在校或者刚毕业的大学生的创业基金大部分来自于父母,所以在很大程度上可以认为父母的态度决定了创业的经济基础.此外中国“百善孝为先”的传统理念深入人心,大部分大学生是很看重并且尊重父母的意见和看法的.所以父母在条件允许的情况下,要尽可能做到支持子女的创业想法和实际行动.(2)政府为激励大学生创业,出台了一系列的优惠政策,对大学生创业的扶持力度很大.但大学生如果对相关政策不了解,就会望“创业”而却步.所以政府要善于通过各种方式、各种渠道对提出的鼓励大学生创业的相关优惠政策进行宣传,让大学生对政策更了解,认识更到位.(3)创业是有风险的,一个有冒险精神的人不仅不惧怕风险,反而更愿意去冒险,所以会对创业更感兴趣,创业的概率也会更大.对于大学生的冒险创新精神,高校在培养学生专业素养的同时,要营造积极竞争的氛围,要通过不同的方式来培养学生的冒险创新精神.参考文献【相关文献】[1]Dyer&Handler.Entrepreneurship and family business:Exploring theconnections[J].Entrepreneur-ship:Theory and Practice,1994,19(1):71~83[2]姜诗尧.新常态背景下大学生创业意愿影响因素实证研究[J].内江师范学院学报,2015,30(8):80~85[3]叶映华.大学生创业意向影响因素研究[J].教育研究,2009(4):73~77。
SPSS回归中的自相关问题

To illustrate these problems intuitively, we consider the simple linear regression model with time series data:
Yt = β0 + β1 X t + ε t
Here, Yt and Xt are observations for period t. Let us assume that the error terms εi are positively autocorrelated as follows:
z Error terms correlated over time are said to be autocorrelated or serially correlated.
Problems of Autocorrelation
1. The estimated regression coefficients are still unbiased, but they no longer have the minimum variance property and may be quite inefficient.
variable ut with mean 0 and variance 1, obtained from a
standard normal random
numbers generator. Suppose now that ε0 = 3.0; we obtain then:
Tab 13.1 Example of Positively Autocorrelated Error Terms.
(2)
ε t = ρεt−1 + ut
spss回归分析相关分析

相关分析 Correlations
对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要 有Pearson简单相关系数、Spearman等级相关系数和Kendall 相关系数等。 1.Pearson简单相关系数(适用于两个变量都是数值型的数据)
R
xy
( x x)( y y)
i 1 i i
Spearman相关等级系数用来度量定序变量间的线性相关系数。 该系数的设计思想与Pearson简单相关系数完全相同,只是应用的范 围不一样。 对数据没有严格的要求。
Kendall采用非参数检验方法用来度量定序变量的线性相关关系。 对数据分布没有严格要求,适用于有序(等级)变量之间的关联程度。 尝试把 收入分为等级 然后kendell
回归方程的方差分析
2 2 ˆ ˆ ( y y ) ( y y) ( y y ) 总离差平方和(SST ) 残差平方和(SSE) 回归平方和(SSR) 2
ˆ ˆ x ˆ ˆ x )2 ˆ 2( x x )2 ˆ y )2 ( (1)SSR分析: ( y 0 1 0 1 1
SSR占SST的比例,用判定系数 表示; 用来衡量回归方程对y的解释程度。
2 2 ˆ ˆ 对y的拟合效果好 R 越大 ( y y ) 越小 y 2 2 ˆ ˆ 对y的拟合效果差 R 越小 ( y y ) 越大 y
• 在给定样本中,SST不变,如果实际观测点离样本回归线越近,则 SSR在SST中占的比重越大,因此回归直线的拟合优度可用下面的 判定系数(可决系数)测度
利用相关系数进行变量间线性关系的分析通常需要 完成以下两个步骤: 1.计算样本相关系数r; 相关系数r的取值在-1---+1之间 r>0表示两变量存在正的线性相关关系;r<0表示 两变量存在负的线性相关关系 r=1表示两变量存在完全正相关;r=-1表示两 变量存在完全负相关;r=0表示两变量不相关 |r|>0.8表示两变量有较强的线性关系; |r|<0.3 表示两变量之间的线性关系较弱
用spss对股票价格指数收益率相关性进行分析

用spss对股票价格指数收益率相关性进行分析作者:刘喜梅来源:《中国高新技术企业》2013年第16期摘要:文章收集了4个主要股票市场的股票价格指数,利用spss软件和相关性分析,对股票价格指数收益率进行了相关分析。
关键词:股票价格指数;收益率;相关性;相关性分析中图分类号:F224 文献标识码:A 文章编号:1009-2374(2013)24-0159-021 研究的背景、目的、意义沪深股市是从一个地方股市发展而成为全国性的股市的,刚营业时上市的股票数量只有为数很少的几只,其规模很小,且上市的股票基本上都是上海和深圳的本地股。
而今,我国股市正从一个相对独立的市场逐渐地与全球股市相连接和相互影响,并且正在逐步地完善和发展,市场规模不断壮大。
并且徐龙炳、陆溶利用R/S方法分析了沪市收益率的非线性行为与相关系数。
对以后研究金融市场的相关性具有指导意义。
选取指数研究是因为投资者根据指数的升降,可以判断出股票价格的变动趋势,反映股市的动向,所有的股市几乎都是在股价变化的同时即时公布股价指数。
2 数据选取选取的数据为上海证券交易所综合指数、深圳证券交易所成份指数、道琼斯工业指数和纳斯达克综合指数的对数收益率。
3 各个市场实证分析3.1 上证综合指数年收益率平稳性、正态性检验在spss中定义变量,把收集到的上海证券交易所指数的年收益率数据输入,绘制出相应时间序列图和QQ图,见图1和图2。
从上证综合指数收益率时间数列图我们可以看出一些明显的特征:该图从2001~2006年,该股指收益率呈现调整上升的趋势;2006~2008年间突然大幅下跌,达到谷底,是12年间的最低点;2009年底大幅上涨到平均值以上;2010年至今趋于稳定。
从图2中可看出上证综合指数收益率数据大部分落在了斜线之外,分布于斜线两侧,这说明上证综合指数收益率不服从正态分布。
3.2 道琼斯工业指数年收益率平稳性、正态性检验在spss中定义变量,把收集到的道琼斯工业指数的年收益率数据输入,绘制出相应时间序列图和QQ图,见图3和图4。
第9章 spss的相关分析和线性回归分析PPT课件

r是相应的偏相关系数。n是观测个数,k是控 制变量的数目,n-k-2是自由度。 在SPSS的偏相关分析过程的输出中只给出偏相 关系数和假设成立的概率p值。
偏相关分析的操作
与简单相关分析操作类似,只不过菜单为
Analyze→Correlate→Partial
实例:利用数据相关回归分析(高校科研研 究).sav,分析发表立项课题数与论文数之间的 偏相关关系,其中投入高级职称的人数为控制变 量。
Pearson相关系数 Spearman 秩相关系数 Kendall t 相关系数
Pearson 相 关 系 数 ( Pearson’s correlation coefficient)又叫相 关系数或线性相关系数。它一般用
字母r表示。
r (xx)(yy) (xx)2 (yy)2
它是由两个变量的样本取值得到,这是一个描 述线性相关强度的量,取值于-1和1之间。当两 个变量有很强的线性相关时,相关系数接近于1 (正相关)或-1(负相关),而当两个变量不 那么线性相关时,相关系数就接近0。
Pearson 相 关 系 数 的 局 限 性 :
①要求变量服从正态分布 ②只能度量线性相关性,对于曲线相关等更为复杂的 情形,该相关系数的大小并不能代表相关性的强弱。 如果Pearson系数很低,只能说明两变量之间没有线 性关系,并不能说明两者之间没有相关关系。也就是 说,该指标只能度量线性相关性,而不是相关性。 (线性相关性隐含着相关性,而相关性并不隐含着线 性相关性)
这很难一概而论。但在计算机输出 中都有和这些相关度量相应的检验
和p-值;因此可以根据这些结果来
判断是否相关
简单相关分析菜单
画散点图
Graphs→Scatter 选择散点图的类型 根据所选择的散点图类型,单击Define对散点图作具体定
基于S-V-PSAL_混合模型的股票预测研究

Advances in Applied Mathematics 应用数学进展, 2023, 12(9), 3920-3932 Published Online September 2023 in Hans. https:///journal/aam https:///10.12677/aam.2023.129384基于S-V-PSAL 混合模型的股票预测研究孙钰华*,吕卫东#,杜潇鉴兰州交通大学数理学院,甘肃 兰州收稿日期:2023年8月9日;录用日期:2023年9月3日;发布日期:2023年9月11日摘要由于股票价格数据具有非平稳、非线性、复杂性高等特点,欲对其进行预测就存在一定的困难,提出了一种基于S-V-PSAL 混合模型的预测方法。
首先使用奇异谱分析(SSA)对股票历史数据进行一次分解,得到趋势项和噪声项。
对于较平稳的趋势项,使用支持向量回归(SVR)模型进行预测;对复杂度依旧很高的噪声项序列,利用变分模态分解(VMD)再次分解,并使用长短期记忆网络和注意力机制(ALSTM)对得到的模态函数(IMFs)和残差序列(res)进行预测。
最后将各预测结果重构得到最终结果。
文中使用亿纬锂能股票的历史数据对提出的模型进行检验,通过三种评价指标,可以表明提出的模型比其他对比模型得到的预测效果更好,有更高的准确性。
关键词股票价格预测,奇异谱分析,变分模态分解,支持向量回归,长短期记忆网络Research on Stock Prediction Based on S-V-PSAL Mixed ModelYuhua Sun *, Weidong Lyu #, Xiaojian DuSchool of Mathematics and Physics, Lanzhou Jiaotong University, Lanzhou GansuReceived: Aug. 9th , 2023; accepted: Sep. 3rd , 2023; published: Sep. 11th, 2023AbstractIt is difficult to forecast stock price data because of its non-stationary, nonlinear and complex characteristics. A prediction method based on S-V-PSAL mixed model is proposed. First, the his-torical stock data is decomposed by singular spectrum analysis (SSA), and the trend term and*第一作者。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[4] 陆旦前, 邱建林 . 基于 Office 对象库的多层结构的图表发布 [J]. 南通大学学报: 自然科学版, 2007, 5(4): 90-92.
[5] 于淑香, 徐汀荣 . 基于 COM 技术的 Office 自动评分系统的 设计与实现[J]. 沙洲职业工学院学报, 2007 (3): 1-3.
相关的股票,且价格可用函数关系表示。当某一时段股票甲的
价格χ 、股票乙的价格 y 不满足函数关系时,在以后的某一时刻
会回归到原有函数关系,则在这段时间内可对这两支股票进行
投资。分两种情况:
1)当
时,把 y 对应的股票卖掉,买进χ 对应的
股票,当股票χ 、股票 y 重新满足函数关系 盈利。
时则能
2)当
[2] 李强, 陈遵德 . 基于 XML 的 Microsoft Office 操作题自动评分 及题库建设的实现[J]. 顺德职业技术学院学报,2007,5(1):1-6.
[3] 安志红 . 基于 VB, VC 的试题库管理系统设计[J]. 辽宁师范 大学学报: 自然科学版, 2004, 27(1): 112-114.
[6] 董跃武,黄凯东,勾学荣 . 遗传算法与试题库自动组卷[J]. 中国 远程教育,2002(8):15-45.
[7]李旌燕 . EXCEL 操作题自动出题和自动阅卷系统的设计与 实现[D]. 长沙: 中南大学, 2009.
本栏目责任编辑:谢媛媛
软件设计开发
89
3.2 相关性分析
用 SPSS 进行相关性分析,判断分析农业银行和建设银行 每日收盘价之间是否具有相关性。在 SPSS 软件中点击“分 析”-“相关”-“双变量”,将“农行 Close”和“建行 Close”作为变 量,“相关系数”选“Pearson”,“显著性检验”选“双侧检验”,并选 “标记显著性相关”。得到如图 1 的结果:
基于 SPSS 相关性和回归分析的股票投资算法研究
徐奔
(浙江行政学院,浙江 杭州 311121)
摘 要:该文是将计算机和统计学的相关性分析、回归分析相结合,将其应用到股票市场的数据分析中,通过分析股价间的 相关性来进行投资策略的研究。该算法首先用 SPSS 对股票价格进行相关性分析,定量说明股票之间的相关性,并计算相 关系数,确定其相关性强弱,然后用 SPSS 进行线性回归分析,初步确定股票的函数关系,通过预测出的函数关系寻找出最 佳投资策略。
时,把 y 对应的股票买进,卖掉χ对应的
股票,当股票χ、股票 y 重新满足函数关系 利。
时则能盈
(1) 根据 数值大小,将不完全线性相关的密切程度分为四级:
3 实证分析
3.1 导入股票历史数据
为微弱相关;
为低度相关;
为中度相关;
为高度相关。
1.2 回归分析
回归分析是在掌握大量数据的基础上,利用数理统计方 法建立自变量与应变量之间的回归关系函数表达式。通常遵 循以下步骤:1)确定自变量和应变量。2)从样本数据出发,确 定变量间的数学关系式,并对回归方程各参数进行估计。3)对 回归方程进行各种统计检验。4)利用回归方程进行预测。
图 2 模型汇总 b 从图 2 中可以看出模型的拟合度是 0.827,调整后的模型拟 合度是 0.825,说明“建行 Close”的情况都可用该模型解释,拟合 度相对较高。
图 3 Anovab 从图 3 中可以看出,回归模型的方差分析表中 F 的统计量 为 407.667,P 为 0.000,模型显著。
图 4 系数 从图 4 中可以看出,回归系数常量为-0.110,回归系数为 1.695,对应 sig 为 0.000,具有显著性。
3.4 最终结论
1)通过相关性分析可知农行和建行两者股票价格相关系 数为 0.910,有高度相关性,且为正相关关系。
2)通过一元线性回归分析可知农行和建行股票价格回归 系数为-0.110,常数为 1.695。
回归分析等。股票价格变化之间的相关性就是一种股票价格 的涨落是否会影响另一种股票价格的变动,即二者之间是否有 相互联系,是否存在相关性。其相关性可由相关系数值来确 定。由公式(1)可知股票相关系数 r ,股票价格χ 、y 的函数关系
,其中 ,为常数项, 为 y 对χ 回归系数。选择
两支同行业的相关股票,其价格呈正相关,同时投资两支呈正
ISSN 1009-3044 CCoommppuutteerrKKnnoowwlleeddggeeaannddTTeecchhnnoollooggyy电电脑脑知知识识与与技技术术
Vol.11, No.18, June 2015
E-mail: xsjl@ http://第ww1w1.d卷nz第s.n1e8t.期cn (2015 年 6 月) Tel:+86-551-65690963 65690964
收稿日期:2015-03-15 作者简介:徐奔(1981—),男,浙江杭州人,工程师,硕士,主要研究方向为软件工程,算法研究。
88
软件设计开发
本栏目责任编辑:谢媛媛
第 11 卷第 18 期 (2015 年 6 月)
Computer Knowledge and Technology 电脑知识与技术
图 1 Pearson 相关性图 从图 1 中可以看出“Pearson”的相关性为 0.910,所以“农行 Close”和“建行 Close”两者相关系数为 0.910,属于正相关关 系。“显著性(双侧)”结果为 0.000,因 0.000 0.01,所以具备显著 性,可得出:二者具有正相关性,有很强的关联性。 3.3 回归分析 用 SPSS 进一步进行回归分析,构建一元线性方程。在 SPSS 软件中点击“分析”-“回归”-“线性”,以“农行 Close”为应 变量,“建行 Close”为自变量,并在“统计量”中设置“回归系数” 为“估计”,“残差”为“Durbin-Watson(U)”,并选“模型拟合度”, 得到如图 2 结果:
2 基于 SPSS 相关性分析的股票投资算法基本思路
股票投资分析主要通过统计分析方法来实现,常用的方法 有相对数、均值和方差、统计指数、时间序列分析、概率、相关与
用股票软件导出相关性较强的两支股票的历史数据,本文 以农业银行和建设银行两支股票为例进行研究,选取从 2015 年 1 月 1 日到 2015 年 6 月 1 日每日收盘价数据整理成 Excel 表 格并导入 SPSS 中。Excel 表中有 Date、农行收盘价(以下简称农 行 Close)、建行收盘价(以下简称建行 Close)、残差等字段。
3)根据算法的思路,设农行为 x,建行为 y,则函数关系为
,则 有 下 面 两 种 情 况 :
当 时,卖掉 y 股票,买进 x 股票,重新满
足
时盈利;反之,买进 y 股票,卖
掉 x 股票,重新满足方程时盈利。
4 结束语
基于相关性分析的商业软件产品还不多,大多数相关性分 析函数计算软件如 R/S+、SAS、MATLAB 等大都用于实验室研 究中,还没有广泛的商业应用,本文旨在让更多的人特别是金 融投资人士体会到相关性分析在股票投资方法研究方面的优 点,今后,研究多只股票之间的动态相关关系,包括时变模型以 及变结构模型,将会是研究的一个重点。
参考文献:
[1]葛毅 . 基于个股相关性的中国股市网络结构分析[D]. 上Байду номын сангаас:上 海交通大学,2009.
[2]郑娟 . 基于 Copula 函数股票相关性分析系统的设计与实现 [D]. 太原:太原科技大学,2012.
[3]蔡智澄,何立民 . 相关性分析原理在图书情报分析中的应用 [D]. 杭州:浙江工业大学,2006.
关键词:SPSS;相关性分析;回归分析;股票投资
中图分类号:TP399 文献标识码:A 文章编号:1009-3044(2015)18-0088-02
DOI:10.14004/ki.ckt.2015.1510 股市已成为掌控经济整体运行情况的重要参考,因此一直 都是经济领域研究的热点。但当前多专注于股价预测和各种 实证分析,缺乏对股市进行系统的分析和认知,难以从整体上 准确把握股市的结构特性。通过运用 SPSS 中强大便捷的相关 性分析和回归分析功能,对股票价格波动趋势进行研究,预测 出股票价格之间的函数关系,使之能在股票投资、预测中发挥 重要作用。
1 相关理论
1.1 相关性分析
相关性分析是通过样本数据,研究两变量间线性相关程度 的强弱,反映出两变量间趋同关系。通常须遵循以下步骤:1) 对变量间是否有相关关系做出定性判断。2)绘制散点图,通过 变量间散点密集程度和未来趋势来确定和反映变量间相关关 系 的 方 向 和 具 体 表 现 形 式 。 3)精 确 计 算 变 量 间 相 关 系 数 大 小。在实践中,最常用的是皮尔逊相关系数:
[4]张利,卢秀颖,吴华玉,郝胜志 . 基于粗糙集的启发式值约简 的改进算法[J]. 仪器仪表学报,2009,1(1):82-85.
[5]孙振宇 . 多元回归分析与 Logistic 回归分析的应用研究[D]. 南 京:南京信息工程大学,2008.
(上接第87页)
参考文献:
[1] 孙超, 徐全生 . 汇编语言程序设计题自动阅卷技术的研究与 实现[J]. 科技信息, 2007 (3).