毕业论文文献综述基于SPSS的多元回归分析模型选取的应用 之文献综述
论文写作中如何利用SPSS进行多元统计分析

论文写作中如何利用SPSS进行多元统计分析在当今大数据时代,统计分析成为了各个领域研究的重要工具。
而SPSS (Statistical Package for the Social Sciences)作为一款专业的统计分析软件,被广泛应用于学术研究中。
本文将从多元统计分析的角度出发,探讨如何在论文写作中充分利用SPSS进行数据分析。
一、数据准备在进行多元统计分析之前,首先需要准备好可靠的数据。
数据的质量和完整性对于分析结果的准确性至关重要。
在数据准备阶段,可以通过SPSS软件进行数据清洗、缺失值处理和异常值检测等操作,以确保数据的可靠性。
二、描述性统计分析在进行多元统计分析之前,了解数据的基本情况是必要的。
通过SPSS的描述性统计分析功能,可以获得数据的均值、标准差、最大值、最小值等统计指标。
此外,还可以通过绘制直方图、箱线图等图表来展示数据的分布情况,为后续的分析提供基础。
三、相关性分析相关性分析是多元统计分析的重要环节之一。
通过SPSS的相关性分析功能,可以计算各个变量之间的相关系数,从而了解它们之间的关系。
相关系数的取值范围为-1到1,当相关系数接近1时,表示两个变量呈正相关;当相关系数接近-1时,表示两个变量呈负相关;当相关系数接近0时,表示两个变量之间没有线性关系。
通过相关性分析,可以帮助研究者深入了解变量之间的相互作用,为后续的因果分析提供依据。
四、因素分析因素分析是一种常用的降维技术,可以将大量的变量转化为少数几个因素,从而简化数据分析的复杂度。
通过SPSS的因素分析功能,可以识别出主要的因素,并计算出各个变量对于每个因素的贡献度。
因素分析可以帮助研究者发现变量之间的内在联系,提取出潜在的因素,从而更好地理解研究对象。
五、聚类分析聚类分析是一种无监督学习的方法,可以将数据样本划分为不同的类别或群组。
通过SPSS的聚类分析功能,可以根据变量之间的相似性将样本进行分类,从而发现数据中的内在结构。
基于SPSS数据分析的影响旅游地区发展的主要因素分析

基于SPSS数据分析的影响旅游地区发展的主要因素分析一、本文概述随着全球旅游业的快速发展,旅游地区的发展问题越来越受到关注。
为了更好地理解旅游地区发展的影响因素,本文基于SPSS数据分析工具,对影响旅游地区发展的主要因素进行了深入探究。
通过收集和分析大量的实地数据,本文旨在揭示各因素对旅游地区发展的影响程度,从而为旅游地区的可持续发展提供科学依据。
在研究方法上,本文采用了SPSS数据分析工具,对收集到的数据进行了描述性统计、因子分析、回归分析等多种统计分析方法。
通过这些分析,本文不仅揭示了各因素对旅游地区发展的影响程度,还深入探讨了各因素之间的相互作用关系。
在研究内容上,本文首先界定了旅游地区发展的概念及其影响因素,然后构建了旅游地区发展影响因素的理论框架。
在此基础上,本文运用SPSS数据分析工具,对影响旅游地区发展的主要因素进行了实证分析。
本文根据实证分析结果,提出了促进旅游地区可持续发展的对策建议。
本文的研究对于深入理解旅游地区发展的影响因素,推动旅游地区的可持续发展具有重要的理论价值和现实意义。
本文的研究方法和分析结果也可为其他领域的研究提供有益的参考和借鉴。
二、文献综述旅游地区的发展受多种因素影响,这些因素包括但不限于自然资源、人文景观、经济条件、交通设施、政策扶持等。
随着旅游业的快速发展,对旅游地区发展的影响因素的研究也日益丰富。
本文将从国内外两个角度对相关文献进行综述,以期为本研究提供理论支持和参考依据。
在国内研究方面,众多学者对旅游地区发展的影响因素进行了深入探讨。
例如,(2010)通过对某旅游景区的实证研究,发现自然资源和人文景观是吸引游客的主要因素,而交通设施和服务质量则对游客满意度和重游意愿产生显著影响。
(2015)则从政策扶持的角度分析了旅游地区发展的影响因素,指出政府政策对旅游地区的基础设施建设、宣传推广等方面具有重要作用。
还有学者从市场需求、竞争态势、创新能力等方面对旅游地区发展的影响因素进行了系统分析(,2018)。
SPSS多元统计论文-回归分析

回归分析在商品的需求量分析中的运用摘要:本文结合多元统计分析理论中关于多元线性回归分析的应用,对商品需求量与商品价格和人均月收入的关系的线性方程进行探索研究。
回归分析的基本思想是描述若干个变量间的统计关系,以研究一个或多个自变量与因变量之间的内在联系。
而回归分析研究又包括线性回归和非线性回归。
本文就是运用线性回归来分析商品需求量和商品价格,人均月收入之间的关系的。
关键词:线性回归线性方程商品需求量一.引言随着我国经济的快速发展,人们的物质生活条件越来越好,各种各样的商品出现在人们的日常生活中。
随着人们收入水平的不断变化,随着商品价格的不断变化,人们对某种商品的需求量也不同。
如果生产的商品量大于商品的需求量,则会导致资源浪费,商品的价格下降;反之如果商品的生产量少于商品的需求量,则会导致商品供应不足,价格上涨。
以上两种情况都会对经济发展造成不利的影响。
因此,对商品需求量的预测是必要的。
那么,应该如何预测商品的需求量呢?为此,本文在参阅相关文献的基础上,根据东方财富网所提供的某地1996~2995年10年间对某品牌的手表需求量和商品价格,人均月收入的数据采用线性回归的方法进行回归分析,并对模型进行检验,预测。
二.经济理论分析、所涉及的经济变量(1)经济理论分析:1.需求:是指在各种不同价格水平下,消费者愿意且能够购买的商品或服务的数量;2.需求与价格之间存在这需求规律,即“在其它条件不变的条件下,一种商品的价格上升会引起该商品的需求量减少,价格下降会引起该商品的需求量增多”;由此我们引出需求的价格弹性的概念,它是指需求量对价格变动的反应程度,是需求量变化的百分比除以价格变化 的百分比,即公式:价格变动率需求量变得率需求的价格弹性系数=3.同理,需求与收入的关系可以用需求的收入弹性分析,它表示某一商品的需求量对收入变化的反应程度,即公式: 收入变动率需求量变得率需求的收入弹性系数=(2)变量的设定:在经济生活中,我们不难发现价格和收入水平的高低对商品需求量有着直接且密切的影响,故所建立的模型是一个回归模型!其中“商品价格”与“消费者平均收入”分别是自变量x1、x2,“商品需求量”是因变量y 。
实用回归分析论文(SPSS实验结果)

我国农民人均生活收入及消费支出分析学院:理学院班级:统计1001班姓名:***中国农民人均生活收入及消费支出简要分析论文摘要:通过本学期对实用回归分析课程的学习,对于一些实际问题作出以下分析。
实用回归分析中的方法在经济、管理、医学及心理学等方面的研究起着很重要的作用,在我国的国民经济问题中,增加农民收入是我国扩大内需与真正走向共同富裕的关键,通过运用SPSS软件分析方法对我国农民的收入及消费支出进行了各种细致分析, 以便能够更好地了解我国农村居民的收入结构和消费结构与消费行为等。
关键词:农民生活收入消费支出多元线性回归分析正文:一、农民人均生活收入及消费支出分析近年来,全国上下认真贯彻落实科学发展观,以农业增产、农民增收为目的,加大各项惠农政策措施落实力度,多措并举做好农村劳动力转移就业工作,克服金融危机和严重干旱等自然灾害带来的不利影响,使全市农村经济保持了稳定发展的良好态势,农民现金收入持续增长,生活消费水平继续提高。
我国是一个农业大国,至今仍有9亿农村人口,占全国人口总数的70%,农民是我国最大的群体,农村消费能力的提升直接关系到国民经济的全局。
从农村市场看,中国有近六成人口生活在农村。
农村城镇化的进程对经济增长的带动作用是非常明显的,世界上还没有哪个国家有规模如此巨大的城镇化。
农村居民的收入虽然低于城市居民,但是基数巨大,且农村人口的收入也在稳定增长。
随着经济的发展,我国农民的收入水平和消费水平的结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。
但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。
而且消费结构不合理,局限于食品类等生存基本需求品,消费在衣着装饰等方面的极少。
而影响农民消费水平的根本原因是农民的收入。
农民生活消费支出主要包括食品、衣着、医疗卫生、教育文化、家庭设备、交通等方面,本文只挑选了四种典型的消费支出作为代表来分析农村居民的消费结构。
实用回归分析论文

实用回归分析论文回归分析是一种广泛应用于研究和预测变量关系的统计方法。
它可以用来探索自变量与因变量之间的关系,并根据这些关系进行预测。
本篇论文旨在利用SPSS软件进行回归分析,并解释实验结果。
为了说明回归分析的实用性,本论文以一个假设为例进行讨论。
假设我们想研究其中一种健康饮食对人体血糖水平的影响。
我们能够搜集到500名参与者的相关数据,包括他们的饮食习惯和血糖水平。
在SPSS软件中,我们可以采用多元线性回归模型来探索自变量(饮食习惯)与因变量(血糖水平)之间的关系。
首先,我们需要将数据输入SPSS软件,并进行数据清洗和处理,确保数据的准确性和可靠性。
接下来,我们可以使用回归模型来进行实验结果的分析。
在SPSS软件中,我们可以选择"回归"选项,并指定因变量和自变量。
在这个示例中,我们将血糖水平作为因变量,饮食习惯作为自变量。
SPSS软件会给出回归模型的结果。
其中最重要的指标是相关系数和显著性水平。
相关系数用来衡量自变量与因变量之间的线性关系的强度,取值范围在-1到+1之间。
显著性水平可以告诉我们这个自变量对因变量的解释力是否显著。
通常,显著性水平小于0.05表示相关关系是显著的。
在这个案例中,回归分析的结果显示饮食习惯与血糖水平之间存在显著相关性(相关系数为0.4,显著性水平为0.01)。
这意味着饮食习惯对于解释血糖水平的变异有统计学意义。
我们可以通过这一结果来推测具体的饮食习惯与血糖水平之间的关系,进一步指导实际生活中的健康饮食选择。
此外,在SPSS软件中,我们还可以进行其他的回归分析,如逐步回归和多重回归。
这些方法可以帮助我们确定最佳的自变量组合,以及对因变量的解释力。
逐步回归可用于选择最有意义的自变量,而多重回归可以进一步探索多个自变量对因变量的解释力。
总结起来,回归分析是一种实用的统计方法,可以用来研究和预测变量之间的关系。
使用SPSS软件进行回归分析,可以对实验结果进行详细的解释和推断,从而指导实际生活中的决策和行动。
实用回归分析论文(SPSS实验结果)

实用回归分析论文(SPSS实验结果)由于没有具体的数据或研究题目,以下仅为回归分析论文的一般模板。
1. 研究背景和目的:介绍本次研究的背景和目的。
描述相关文献对该领域的研究情况,指出知识空白和研究的必要性。
例如:本研究旨在探讨X变量与Y变量之间的关系,并研究其他可能因素对此关系的影响。
回归分析被广泛应用于社会科学、经济学和医学等领域,但在某些情况下,该方法可能被错误地应用或解读。
因此,本研究旨在提供更多有关回归分析的实用性信息,以便更好地应用于实际研究中。
2. 变量选择和数据收集:介绍所选的独立变量、因变量以及可能的干扰因素。
描述数据收集的方法和样本的特点,阐述数据的统计学特征。
例如:本研究选择了X1、X2和X3作为独立变量,Y作为因变量。
在探究X和Y之间的关系时,本研究考虑了干扰因素A和B。
数据收集采用了问卷调查的方法,样本为100位大学生。
调查数据的统计学特征如下:均值、标准差、最大值和最小值。
3. 回归模型:描述所使用的回归模型及其假设。
根据假设,说明如何进行统计分析。
例如:本研究选择了多元线性回归模型。
假设独立变量与因变量之间存在线性关系,且同时考虑了干扰因素的影响。
在此假设下,通过进行多元线性回归分析,得出具体的回归方程。
使用SPSS软件进行统计分析,通过显著性检验和模型拟合程度来验证上述假设。
4. 实验结果:解释回归分析结果,如拟合程度、系数的显著性、变量的解释等。
根据结果,提供对研究目的的回答,对假说进行证明或推翻。
例如:本研究得到的回归方程为Y = a + b1*X1 + b2*X2 + b3*X3 +c1*A + c2*B。
通过F检验,得出回归模型的显著性水平P<0.01,表明回归模型解释了数据的一定程度。
通过系数显著性检验,得出X1、X3和B对Y变量具有显著影响,而其余变量影响不显著。
对于X1、X3和B,本研究解释了其对Y变量的具体贡献,分析了研究问题的深层含义。
5. 结论和建议:总结研究结论,说明其对实践和理论的贡献,并提出未来研究的方向。
多元线性回归方法应用文献综述

多元线性回归方法应用文献综述【摘要】为介绍多元线性回归分析法的应用,本文以我国民航客运量问题为例,具体的介绍了多元线性回归分析法的步骤,并介绍了如何应用岭估计以及主成分估计解决回归自变量间的复共线性问题。
【关键词】多元线性回归复共线性岭估计主成分估计应用实例在实际问题中,我们常遇到研究一个随机变量与多个随机变量之间的关系的问题,如高等教育学费的收费标准不仅与生均教育升本有关,其同时还受到国家及地方拨款,国内人均GDP以及居民消费水平等因素的影响。
而研究这种一个随机变量与多个随机变量之间的关系最常用的方法就是多元线性回归分析法,本文以研究民航客运量与国民收入总值、消费额、铁路客运量、民航航线里程及境外旅客人数之间的关系为例,具体介绍多元线性回归分析法的应用。
一、数据来源从国家统计年鉴中获取到1995-2010年民航客运量(y)、国民收入总值(x1)、消费金额(x2)、铁路承载量(x3)、民航航线距离(x4)、境外旅客人数(x5)的相关数据。
二、多元线性回归模型的一般形式三、应用实例下面以我国的民航客运量的问题为例,介绍多元线性分析法的具体应用。
(一)对民航客运量影响因素的多元回归分析(1)对回归系数的进行最小二乘估计。
利用MATLAB中的reg-(1)值的确定。
利用MATLAB编程计算出当在上变化时的不同取值及相应的残差平方和,并绘制成岭迹。
根据岭迹的变化趋势选择k值,使得各个回归系数的岭估计大体上稳定,并且各个回归系数岭估计值的符号比较合理。
同时还要考虑使得残差平方和不要上升的太多。
(2)岭估计回归方程的确定。
岭回归方程的R2=1.000,F=1024.800,P值=0.000,这表明回归方程高度显著,且方程的回归系数符合实际意义,因此岭回归方程合理。
四、小结多元回归分析方法可以广泛的应用于现实生活的很多问题中,但在应用中需要注意验证所得方程的回归系数是否与其实际意义相符合,若不相符合,则需要检验回归自变量之间的复共线性,解决复共线性问题的主要方法是对回归系数进行岭估计或者主成分估计,而这两种估计方法并不是都一定能解决复共线性问题,要根据具体情况具体分析。
多元统计分析spss分析论文

用聚类分析法分析细菌性食物中毒学号:1110110047姓名:何昌业摘要:探讨我国细菌性食物中毒的发生规律,为预防细菌性食物中毒的发生提供参考。
将收集的1994—2003年766起细菌性食物中毒案件的发生情况利用SPSS软件进行聚类分析,按其中毒发生情况将全部23种细菌中毒情况分为4类。
本文选取了细菌性食物中毒的报道起数、中毒人数、死亡人数的统计量作为研究数据。
各项数据均来自于万方数据搜索。
分析结果表明:细菌性食物中毒有其规律性,根据其内在的特点,采取相应的预防措施,将有助于预防其发生.关键词:食物中毒细菌性食物中毒聚类分析引言:随着生活水平的不断提高,我们的食物也越来越丰富,但随之食物中毒的情况也越来越多.其中细菌性食物中毒比较常见,对人们生活习惯影响较大。
因此,本文对1994—2003年766起细菌性食物中毒案件的具体情况进行聚类分析。
首先对引起细菌性食物中毒的细菌进行聚类,将全部细菌分为4类,然后对中毒人数、死亡人数、中毒原因等进行分析。
通过本文的分析研究,可以清楚地了解细菌性食物中毒的分布情况,以及发生中毒的原因,最终对细菌性食物中的预防起指导作用.2 聚类分析的原理与方法2.1主要思想及原理主要思想:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n—1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n—2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。
聚类分析的原理:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。
也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。
其中欧式距离在聚类分析中用得最广,它的表达式如下:其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于SPSS的多元回归分析模型选取的应用文献综述
重庆工商大学统计学 2010级统计2班殷婷
引言
随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活性也较强,计算量大且复杂.然而科学研究的深入,研究的对象也日益变得复杂,复杂系统的研究问题更是成为当今研究的热点. 为了更好的描述一个复杂的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会研究的一项重要课题.
基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对淘宝网的未来发展趋势进行非线性回归模型的研究以及案例二对于我国财政收入的进行变量选取研究,通过对1992年到2012年的人均国内生产总值,城镇居民家庭人均可支配收入,全社会固定投资,进出口总额,居民消费价格水平对我国财政收入的影响进行定量数据的研究. 通过对数据的选取,回归模型的确定以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法.
一、研究现状
在科学技术飞速发展的今天,统计学通过不断吸收和融合相关学科的新理论,开发应用新技术和新方法,拓展新的领域的同时不断深化和丰富了统计学传统领域的理论与方法. 在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求. 随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘. 从20世纪60年代开始,关于回归自变量的选择成为统计学中研究的热点问题,统计学家提出了许多回归选元的准则,并提出了许多行之有效的选元方法. 在应用回归分析去处理实际问题时,回归自变量选择是首先要解决的重要问题. 通常在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的
的一些因素作为自变量引进回归模型,把一些对因变量影响很小的,有些甚至是没有影响的自变量,不但使得计算量变大,估计和预测的精度也下降了. 此外,如果遗漏了某些重要变量,回归方程的效果肯定不好. SPSS软件作为当今国际上运用广泛的统计分析软件,其功能齐全带有各种特点,在各个领域内都得到了迅速普及,并成为各个行业提高管理水平、形成科学决策的重要手段. 然而,我国对于该软件的运用和理解始终处于早期应用阶段,无论是在功能的研究开发还是实际生活当中的运用都与西方发达国家相差甚远. 尤其是在管理决策方面,都因为没有进行深度分析而造成了浪费,要么就是利用SPSS软件进行简单分析而未进行深度开发,导致所得的信息有限、各信息间的关系不明确,最终导致管理者的判断出现偏差.
二、结论
SPSS 是世界上最早采用图形菜单驱动界面的统计软件,其最突出的特点就是操作界面极为友好,输出结果美观漂亮,是“统计产品与服务解决方案”软件.对于那些常见的统计方法,SPSS的命令语句、子命令及选择项的大部分都是由“对话框”的操作完成. 所以不需要花大量时间来记忆这些大量的命令、过程或选择项. 由以上SPSS的操作方法可以知道SPSS中有很多的统计方法,适合专业的统计人员对数据进行统计整理得出自己想要的结果. SPSS在得出的趋势线以及变量之间的线性关系,需要自己用一元线性回归的方法得出数据之间的系数,然后自己把方程写在趋势线旁边. 由两个案例分析中可以看出在对数据计算结果如果需要更精确一点,就需要通过对多元回归分析的操作方法进行对比可以知道,采用逐步回归分析的方法对数据进行处理,剔除没有通过检验的,对因变量影响不显著的.
由以上案例中可以看到,多元回归分析中变量的选择不能靠简单的自行筛选就可以,有时候对于一些变量的筛选都通过检验,并不能代表你在选择数据上有多高明,而是需要通过相关性分析,计算复相关系数和偏相关系数来了解你所选的变量之间的相关关系的大小,而变量之间存在线性关系和非线性关系需要通过散点图的观察来对变量之间关系进行判断. 在一些情况下,某些自变量的观测数据的获得代价十分贵,这些自变量可能对因变量的影响非常小,而我们把它引进了模型中,势必造成数据收集和模型的应用不必要的加大.所以在回归分析中,对进入模型的自变量作精心的选择是十分必要的. 所以我们在选择回归
模型时一定要注意.而本文可以让我们知道在多元回归分析中变量的选择中我们需要的是先选择模型,案例一我们是对于非线性回归模型转化为线性回归模型同时采用的是全模型进行分析,案例二我们用得则是选模型,及在变量的选取上我们应该如何去选择. 相关系数以及方差分析就是很好检验数据的方法,同时逐步回归时对数据进行剔除的一个很好方法. 从而可以看出所选的变量是否符合要求. 然后再通过回归分析,看数据之间的P值检验,是否通过P值检验,如果两个检验均通过,说明说选定的变量在多元回归分析中,自变量对因变量有显著性影响,从而确定影响程度的大小,最后在通过检验之后得到最优方程式,这就是自变量与因变量之间的关联方程式. 该方程式预测了我国淘宝注册人数,网络普及度和居民消费水平关于淘宝交易额的影响的预测方程式. 实验中通过对数据的检验可以看出其计算结果的误差系数较低.案例一在对变量的处理上也告诉我们在遇到变量之间不呈线性关系时的处理方法,因网络普及度和我国第二产业增加值与淘宝交易额之间呈现的是指数线性关系,所以在对变量进行使用时,我们采用的是其指数幂的方法把非线性回归模型转化为线性回归模型来进行研究,从而得到的自变量便与因变量之间呈线性关系. 从案例一可以看出,对变量处理前得到的回归模型没有变量处理后得到的回归模型的拟合度好. 进一步的告诉大家在对变量的选取和使用上一定要注意,对于可转化的非线性回归模型,最好采用其对应的方法把变量转换,这样才可以得出更有意义和更加价值的模型. 从案例分析二,我们还可以看到在选择变量时当存在为通过检验,或者变量之间的偏相关系数大于复相关系数时的处理方法,这里我们研究的是当自变量的P值检验或t值检验没通过是,对于变量选取的处理方法,本文采用了一个简单的SPSS 的操作方法,逐步回归分析,通过软件操作,逐步回归分析会通过逐步的对数据进行检验,把关联程度大的先检验,逐步进行最后直接剔除未通过检验的数据,在逐步回归之前我们也得到一个预测方程式,很显然,在解释变量未通过检验的情况下,所得到的预测方程式是完全没有意义,其在操作过程中更是方便简洁. 通过案例一和案例二的对比,便告诉大家在选取模型时,我们应该如何对模型进行选取. 而通过以上两个案例分析,我们可以看出,不能只靠肉眼的观察和直观的选择就对变量进行判断,需要通过一系列的检验方法对数据进行对比研究,而通过对偏相关系数的检验,我们便可以通过直观的方法看到系数之间的差距,偏相关系数本是检验变量之间相关关系的直观表达,如果偏相关系数过小,我们便可以把此变量剔除,案例二,在偏相关系数较小的情况
下,我们继续采用了回归分析和逐步回归分析对变量进行处理,通过回归分析可以看到,在偏相关系数较小的两个变量中在回归分析中也没有通过P值检验,而在逐步回归分析中,该变量也被剔除. 所以案例二很好的反映了在多元线性回归分析中如何对变量进行筛选,最后得出最优的方程式.
参考文献
[1]魏和清,罗良清.实用统计学[M]. 北京:中国财政经济出版社,2011.
[2]符啟勋.实用统计学[M]. 北京:国防工业出版社,2008.
[3]王正朋.实用统计学[M].北京:中国财政经济出版社,2008.
[4]薛薇.基于SPSS的数据分析[M].北京:对外经济贸易大学出版社,2007.
[5]冯力.统计学实验[M].大连:东北财经大学出版社,2012.
[6]陈珍珍.统计学[M].厦门:厦门大学出版社,2006.
[7]阮桂海.SPSS实用教程[M].北京:北京大学出版社.1999.
[8]阮桂海.数据统计与分析-SPSS应用教程[M].北京:北京大学出版社,2005.
[9]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2012.。