spss教程相关分析与回归模型的建立与分析
(整理)相关分析与回归分析SPSS实现

相关分析与回归分析一、试验目标与要求本试验项目的目的是学习并使用SPSS 软件进行相关分析和回归分析,具体包括:(1) 皮尔逊pearson 简单相关系数的计算与分析(2) 学会在SPSS 上实现一元及多元回归模型的计算与检验。
(3) 学会回归模型的散点图与样本方程图形。
(4) 学会对所计算结果进行统计分析说明。
(5) 要求试验前,了解回归分析的如下内容。
♦ 参数α、β的估计♦ 回归模型的检验方法:回归系数β的显著性检验(t -检验);回归方程显著性检验(F -检验)。
二、试验原理1.相关分析的统计学原理相关分析使用某个指标来表明现象之间相互依存关系的密切程度。
用来测度简单线性相关关系的系数是Pearson 简单相关系数。
2.回归分析的统计学原理相关关系不等于因果关系,要明确因果关系必须借助于回归分析。
回归分析是研究两个变量或多个变量之间因果关系的统计方法。
其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。
回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。
线性回归数学模型如下:i ik k i i i x x x y εββββ+++++= 22110在模型中,回归系数是未知的,可以在已有样本的基础上,使用最小二乘法对回归系数进行估计,得到如下的样本回归函数:iik k i i i e x x x y +++++=ββββˆˆˆˆ22110 回归模型中的参数估计出来之后,还必须对其进行检验。
如果通过检验发现模型有缺陷,则必须回到模型的设定阶段或参数估计阶段,重新选择被解释变量和解释变量及其函数形式,或者对数据进行加工整理之后再次估计参数。
回归模型的检验包括一级检验和二级检验。
一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。
SPSS的相关分析和线性回归分析

• 如果两变量的正相关性较强,它们秩的变化具有同步性,于
是
n
Di2
n
(Ui
Vi)2的值较小,r趋向于1;
• i1
i1
如果两变量的正相关性较弱,它们秩的变化不具有同步性,
于是
n
n
Di2 (Ui Vi)2
的值较大,r趋向于0;
• i1
i1
在小样本下,在零假设成立时, Spearman等级相关系数
用最小二乘法求解方程中的两个参数,得到:
1
(xi x)(yi y) (xi x)2
0 ybx
多元线性回归模型
多元线性回归方程: y=β0+β1x1+β2x2+.+βkxk
β1、β2、βk为偏回归系数。 β1表示在其他自变量保持不变的情况下,自变量x1变动
一个单位所引起的因变量y的平均变动。
析功能子命令Bivariate过程、Partial过程、 Distances过程,分别对应着相关分析、偏相关分析和相 似性测度(距离)的三个spss过程。
Bivariate过程用于进行两个或多个变量间的相关分 析,如为多个变量,给出两两相关的分析结果。
Partial过程,当进行相关分析的两个变量的取值都受 到其他变量的影响时,就可以利用偏相关分析对其他变量 进行控制,输出控制其他变量影响后的偏相关系数。
• 回归分析的一般步骤
确定回归方程中的解释变量(自变量)和被解释变量( 因变量) 确定回归方程 对回归方程进行各种检验 利用回归方程进行预测
8.4.2 线性回归模型 一元线性回归模型的数学模型:
y0 1x
其中x为自变量;y为因变量; 0 为截距,即
常量; 1 为回归系数,表明自变量对因变量的影
数据统计分析软件SPSS的应用(五)——相关分析与回归分析

数据统计分析软件SPSS的应用(五)——相关分析与回归分析数据统计分析软件SPSS的应用(五)——相关分析与回归分析数据统计分析软件SPSS是目前应用广泛且非常强大的数据分析工具之一。
在前几篇文章中,我们介绍了SPSS的基本操作和一些常用的统计方法。
本篇文章将继续介绍SPSS中的相关分析与回归分析,这些方法是数据分析中非常重要且常用的。
一、相关分析相关分析是一种用于确定变量之间关系的统计方法。
SPSS提供了多种相关分析方法,如皮尔逊相关、斯皮尔曼相关等。
在进行相关分析之前,我们首先需要收集相应的数据,并确保数据符合正态分布的假设。
下面以皮尔逊相关为例,介绍SPSS 中的相关分析的步骤。
1. 打开SPSS软件并导入数据。
可以通过菜单栏中的“File”选项来导入数据文件,或者使用快捷键“Ctrl + O”。
2. 准备相关分析的变量。
选择菜单栏中的“Analyze”选项,然后选择“Correlate”子菜单中的“Bivariate”。
在弹出的对话框中,选择要进行相关分析的变量,并将它们添加到相应的框中。
3. 进行相关分析。
点击“OK”按钮后,SPSS会自动计算所选变量之间的相关系数,并将结果输出到分析结果窗口。
4. 解读相关分析结果。
SPSS会给出相关系数的值以及显著性水平。
相关系数的取值范围为-1到1,其中-1表示完全负相关,1表示完全正相关,0表示没有相关关系。
显著性水平一般取0.05,如果相关系数的显著性水平低于设定的显著性水平,则可以认为两个变量之间存在相关关系。
二、回归分析回归分析是一种用于探索因果关系的统计方法,广泛应用于预测和解释变量之间的关系。
SPSS提供了多种回归分析方法,如简单线性回归、多元线性回归等。
下面以简单线性回归为例,介绍SPSS中的回归分析的步骤。
1. 打开SPSS软件并导入数据。
同样可以通过菜单栏中的“File”选项来导入数据文件,或者使用快捷键“Ctrl + O”。
2. 准备回归分析的变量。
薛薇,《SPSS统计分析方法及应用》第八章 相关分析和线性回归分析

以控制,进行偏相关分析。
偏相关分 析输出结 果;负的 弱相关
相关分析 输出结果 ;正强相 关
8.4.1
8.4.2
回归分析概述
线性回归模型
8.4.3
8.4.4 8.4.5 8.4.6
回归方程的统计检验
基本操作
其它操作
应用举例
线性回归分析的内容
能否找到一个线性组合来说明一组自变量和因变量
可解释x对Y的影响大小,还可 以对y进行预测与控制
目的是刻画变量间的相关 程度
8.2.1 8.2.2 8.2.3 8.2.4
散点图 相关系数 基本操作 应用举例
•
相关分析通过图形和数值两种方式,有效地揭示事物
之间相关关系的强弱程度和形式。
8.2.1 散点图 它将数据以点的的形式画在直角坐标系上,通过
Distances 过程用于对各样本点之间或各个变量之间 进行相似性分析,一般不单独使用,而作为聚类分
析和因子分析等的预分析。
1) 选择菜单Analyze Correlate Bivariate,出现 窗口:
2) 把要分析的变量选到变量Variables框。
3) 在相关系数Correlation Coefficents框中选择计算哪种
一元线性回归模型的数学模型:
y 0 1 x
其中x为自变量;y为因变量; 0 为截距,即常量;
1 为回归系数,表明自变量对因变量的影响程度。
用最小二乘法求解方程中的两个参数,得到
1
( x x )( y y ) (x x)
i i 2 i
0 y bx
spss教程第三章--相关分析与回归模型的建立与分析

第三章相关分析与回归模型的建立与分析相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。
相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。
◆本章主要内容:1、对变量之间的相关关系进行分析(Correlate)。
其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。
2、建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(Curve Estimation)。
◆数据条件:参与分析的变量数据是数值型变量或有序变量。
§3.1 相关分析在SPSS中,可以通过Analyze菜单进行相关分析(Correlate),Correlate菜单如图3.1所示。
图3.1Correlate 相关分析菜单§3.1.1 简单相关分析两个变量之间的相关关系称简单相关关系。
有两种方法可以反映简单相关关系。
一是通过散点图直观地显示变量之间关系,二是通过相关系数准确地反映两变量的关系程度。
§3.1.1.1 散点图SPSS软件的绘图命令集中在Graphs菜单。
下面通过例题来介绍具体操作方法。
例1:数据库SY-8中的变量X表示山东省人均国内生产总值,Y表示山东省城镇居民的消费额(资料来源:山东省2003年统计年鉴),现画出散点图来观察两个变量的关联程度。
具体操作步骤如下:首先打开数据SY-8,然后单击Graphs Scatter,打开Scatter plot散点图对话框,如图3.2所示。
然后选择需要的散点图,图中的四个选项依次是:Simple 简单散点图Matrix 矩阵散点图Overlay 重叠散点图3-D 三维散点图图3.2 散点图对话框如果只考虑两个变量,可选择简单的散点图Simple,然后点击Define,打开Simple Scatterplot 对话框,如图3.3所示。
相关分析和回归分析SPSS实现

相关分析与回归分析一、试验目标与要求本试验项目的目的是学习并使用SPSS软件进行相关分析与回归分析;具体包括:(1)皮尔逊pearson简单相关系数的计算与分析(2)学会在SPSS上实现一元及多元回归模型的计算与检验..(3)学会回归模型的散点图与样本方程图形..(4)学会对所计算结果进行统计分析说明..(5)要求试验前;了解回归分析的如下内容..参数α、β的估计回归模型的检验方法:回归系数β的显着性检验t-检验;回归方程显着性检验F-检验..二、试验原理1.相关分析的统计学原理相关分析使用某个指标来表明现象之间相互依存关系的密切程度..用来测度简单线性相关关系的系数是Pearson简单相关系数..2.回归分析的统计学原理相关关系不等于因果关系;要明确因果关系必须借助于回归分析..回归分析是研究两个变量或多个变量之间因果关系的统计方法..其基本思想是;在相关分析的基础上;对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定;确立一个合适的数据模型;以便从一个已知量推断另一个未知量..回归分析的主要任务就是根据样本数据估计参数;建立回归模型;对参数与模型进行检验与判断;并进行预测等..线性回归数学模型如下:在模型中;回归系数是未知的;可以在已有样本的基础上;使用最小二乘法对回归系数进行估计;得到如下的样本回归函数:回归模型中的参数估计出来之后;还必须对其进行检验..如果通过检验发现模型有缺陷;则必须回到模型的设定阶段或参数估计阶段;重新选择被解释变量与解释变量及其函数形式;或者对数据进行加工整理之后再次估计参数..回归模型的检验包括一级检验与二级检验..一级检验又叫统计学检验;它是利用统计学的抽样理论来检验样本回归方程的可靠性;具体又可以分为拟与优度评价与显着性检验;二级检验又称为经济计量学检验;它是对线性回归模型的假定条件能否得到满足进行检验;具体包括序列相关检验、异方差检验等..三、试验演示内容与步骤1.连续变量简单相关系数的计算与分析在上市公司财务分析中;常常利用资产收益率、净资产收益率、每股净收益与托宾Q值4个指标来衡量公司经营绩效..本试验利用SPSS对这4个指标的相关性进行检验..操作步骤与过程:打开数据文件“上市公司财务数据连续变量相关分析.sav”;依次选择“分析→相关→双变量”打开对话框如图;将待分析的4个指标移入右边的变量列表框内..其他均可选择默认项;单击ok提交系统运行..图5.1 Bivariate Correlations对话框结果分析:表给出了Pearson简单相关系数;相关检验t统计量对应的p值..相关系数右上角有两个星号表示相关系数在0.01的显着性水平下显着..从表中可以看出;每股收益、净资产收益率与总资产收益率3个指标之间的相关系数都在0.8以上;对应的p值都接近0;表示3个指标具有较强的正相关关系;而托宾Q值与其他3个变量之间的相关性较弱..表5.1 Pearson简单相关分析Correlations每股收益率净资产收益率资产收益率托宾Q值每股收益率PearsonCorrelation1.877.824-.073Sig.2-tailed..000.000.199N315315315315净资产收益率Pearson.8771.808-.001 CorrelationSig..000..000.983 2-tailedN315315315315资产收益率Pearson.824.8081.011 CorrelationSig..000.000..849 2-tailedN315315315315托宾Q值Pearson-.073-.001.0111 CorrelationSig..199.983.849.2-tailedN315315315315 Correlation is significant at the 0.01 level 2-tailed.2.一元线性回归分析实例分析:家庭住房支出与年收入的回归模型在这个例子里;考虑家庭年收入对住房支出的影响;建立的模型如下:其中;yi是住房支出;xi是年收入线性回归分析的基本步骤及结果分析:1绘制散点图打开数据文件;选择图形-旧对话框-散点/点状;如图5.2所示..图5.2 散点图对话框选择简单分布;单击定义;打开子对话框;选择X变量与Y变量;如图5.3所示..单击ok提交系统运行;结果见图5.4所示..图5.3 Simple Scatterplot 子对话框从图上可直观地看出住房支出与年收入之间存在线性相关关系..图5.4 散点图2简单相关分析选择分析—>相关—>双变量;打开对话框;将变量“住房支出”与“年收入”移入variables列表框;点击ok运行;结果如表5.2所示..表5.2 住房支出与年收入相关系数表CorrelationsCorrelation is significant at the 0.01 level 2-tailed.从表中可得到两变量之间的皮尔逊相关系数为0.966;双尾检验概率p值尾0.000<0.05;故变量之间显着相关..根据住房支出与年收入之间的散点图与相关分析显示;住房支出与年收入之间存在显着的正相关关系..在此前提下进一步进行回归分析;建立一元线性回归方程..3 线性回归分析步骤1:选择菜单“分析—>回归—>线性”;打开Linear Regression 对话框..将变量住房支出y移入Dependent列表框中;将年收入x移入Independents列表框中..在Method 框中选择Enter 选项;表示所选自变量全部进入回归模型..图5.5 Linear Regresssion对话框步骤2:单击Statistics按钮;如图在Statistics子对话框..该对话框中设置要输出的统计量..这里选中估计、模型拟合度复选框..图5.6 Statistics子对话框估计:输出有关回归系数的统计量;包括回归系数、回归系数的标准差、标准化的回归系数、t统计量及其对应的p值等..置信区间:输出每个回归系数的95%的置信度估计区间..协方差矩阵:输出解释变量的相关系数矩阵与协差阵..模型拟合度:输出可决系数、调整的可决系数、回归方程的标准误差、回归方程F检验的方差分析..步骤3:单击绘制按钮;在Plots子对话框中的标准化残差图选项栏中选中正态概率图复选框;以便对残差的正态性进行分析..图5.7 plots子对话框步骤4:单击保存按钮;在Save子对话框中残差选项栏中选中未标准化复选框;这样可以在数据文件中生成一个变量名尾res_1 的残差变量;以便对残差进行进一步分析..图5.8 Save子对话框其余保持Spss默认选项..在主对话框中单击ok按钮;执行线性回归命令;其结果如下:表5.3给出了回归模型的拟与优度R Square、调整的拟与优度Adjusted R Square、估计标准差Std. Error of the Estimate以及Durbin-Watson统计量..从结果来看;回归的可决系数与调整的可决系数分别为0.934与0.93;即住房支出的90%以上的变动都可以被该模型所解释;拟与优度较高..表5.4给出了回归模型的方差分析表;可以看到;F统计量为252.722;对应的p值为0;所以;拒绝模型整体不显着的原假设;即该模型的整体是显着的..表5.5给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显着性t检验..从表中可以看到无论是常数项还是解释变量x;其t统计量对应的p值都小于显着性水平0.05;因此;在0.05的显着性水平下都通过了t检验..变量x的回归系数为0.237;即年收入每增加1千美元;住房支出就增加0.237千美元..表5.3 回归模型拟与优度评价及Durbin-Watson检验结果Model Summaryba Predictors: Constant;年收入千美元b Dependent Variable:住房支出千美元表5.4 方差分析表ANOVAba Predictors: Constant; 年收入千美元b Dependent Variable: 住房支出千美元表5.5 回归系数估计及其显着性检验Coefficientsaa Dependent Variable: 住房支出千美元为了判断随机扰动项是否服从正态分布;观察图5.9所示的标准化残差的P-P图;可以发现;各观测的散点基本上都分布在对角线上;据此可以初步判断残差服从正态分布..为了判断随机扰动项是否存在异方差;根据被解释变量y与解释变量x的散点图;如图5.4所示;从图中可以看到;随着解释变量x的增大;被解释变量的波动幅度明显增大;说明随机扰动项可能存在比较严重的异方差问题;应该利用加权最小二乘法等方法对模型进行修正..图5.9 标准化残差的P-P图四、备择试验现有1987~2003年湖南省全社会固定资产投资总额NINV与GDP两个指标的年度数据;见下表..试研究全社会固定资产投资总额与GDP的数量关系;并建立全社会固定资产投资总额与GDP之间的线性回归方程..。
SPSS相关分析与回归分析专题课件

SPSS相关分析与回归分析专题课件
线性回归
相关分析 与
回归分析
回归分析一般步骤: •确定回归方程中的解释变量(自变量)和
被解释变量(因变量) •确定回归模型 •建立回归方程 •对回归方程进行各种检验 •利用回归方程进行预测
SPSS相关分析与回归分析专题课件
线性回归
线性回归模型
相关分析 与
回归分析
研究者把非确定性关系称为相关关系。
SPSS相关分析与回归分析专题课件
相关分析 与
回归分析
三.相关分析的特点和应用
相关关系是普遍存在的,函数关系仅是相关关系的特 例。 1.相关关系的类型
相关关系多种多样,归纳起来大致有以下6种: 强正相关关系,其特点是一变量X增加,导致另一变量
Y明显增加,说明X是影响Y的主要因素。 弱正相关关系,其特点是一变量X增加,导致另一变量
所以,相关分析的意义和目的在于: (1)在统计学中有理论与实践意义 (2)对相关关系的存在性给出判断
( 3 ) 对相关关系的强度给出度量和分析
SPSS相关分析与回归分析专题课件
相关分析 与
回归分析
二、相关分析的概念
变量之间的关系分为确定性关系和非确定性关系。 确定性关系:当一个变量值(自变量)确定后,另一个 变量值(因变量)也就完全确定了,确定性关系往往可以 表示成一个函数的形式,比如圆的面积和半径的关系: S=πr² 非确定性关系:给定了一个变量值后,另一个变量值可 以在一定范围内变化,例如家庭的消费支出和家庭收入的 关系。
回归分析
SPSS相关分析与回归分析专题课件
相关分析 与
回归分析
(1)案例处理摘要。“案例处理摘要”表格给出了数 据使用的基本情况。主要是对有无缺失值的统计信息, 可见本例的11个案例没有缺失,全部用于分析。 (2)近似矩阵。“近似矩阵”表格给出的是各变量之 间的相似矩阵,图中以线框标注了相关系数较大的几对 变量。它们在进一步的分析中应重点关注,或者直接对 其进行适当的预处理(例如变量约减)
心理统计SPSS-第七章 回归分析及回归方程的建立

内容 深度
4 3 3 4 5 4
题目 类型
4 5 3 1 2 2
7
8
-0.5
-0.4
2
2
2
3
5
4
17
18
0.3
0.5
4
5
3
4
1
4
9
10
-0.3
-0.3
3
3
2
3
2
5
19
200.81.0 Nhomakorabea4
5
5
5
3
2
多元线性回归分析的实例练习
调用教师机共享文档中的数据文件:“中学生心理因素与其
创造力”,然后完成以下处理任务:
1. 建立完全的回归方程,以实现从多个心理因素预测中学生创 造力。用调整后的判定系数评价回归方程的拟合优度如何?回
归方程显著性水平如何?各自变量回归系数的显著性水平如何?
2. 分别剔出影响力最小的1个自变量、2个自变量建立两个不同 的回归方程,比较它们的拟合优度。
第七章 回归分析及回归方程的建立
一、有趣的发现
F.Galton及其弟子K.Pearson研究了1078对夫妇及其一个成年儿 子的身高,以儿子身高作为纵坐标、夫妇平均身高为横坐标作散点 图,结果发现二者有近似的直线关系。经计算得到了如下方程:
可见:夫妇平均身高增加或减少一个单位 ,儿子的身高只增加 或减少 0.516个单位,就不像父辈身高那样分化,而是逐渐向平均身 高回归。于是Galton引进了“回归”(regression)一词。
SPSS过程演1
三、多元线性回归分析
在实际的调研中,常常需要用多个变量来预测某一因变量,这就 是多元线性回归分析。多元线性回归分析需要注意四点不同:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图 3.1 Correlate
相关分析菜单
§3.1.1 简单相关分析
两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系。 一是通过散点图直观地显示变量之间关系, 二是通过相关系数准确地反映两变量的关 系程度。
§3.1.1.1 散点图
SPSS软件的绘图命令集中在 Graphs菜单。下面通过例题来介绍具体操作方法。
Bivariate 打开 Bivariate
图 3.5 Bivariate : Correlation 两变量相关分析对话框
2、从左边的变量框中选择需要考察的两个变量进入 Variables 框内,从
Correlation Coefficients
栏内选择相关系数的种类,有 Pearson相关系数,
例 2:为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、 打火石销量作为影响因素, 得数据表 3.2 。试求火柴销售量与煤气户数的偏相关系数 .
表 3.2 火柴销量及影响因素表(见参考文献 {1} )
年份
68 69 70 71 72 73 74 75 76 77 78 79 80 81 82
Simple 简单散点图
Matrix 矩阵散点图
Overlay 重叠散点图
3-D 三维散点图
图 3.2 散点图对话框
如果只考虑两个变量, 可选择简单的散点图 Simple ,然后点击 Define ,打开 Simple Scatterplot 对话框 , 如图 3.3 所示。
图 3.3 Simple Scatterplot
对话框
选择变量分别进入 X 轴和 Y 轴,点击 OK后就可以得到散点图,见图 3.4。
从下面输出的人均国内生产总值与城镇居民消费额的散点图 出,两个变量之间有强正相关的线性关系。
3.4中可以粗略地看
8000
7000 6000
5000 4000
3ห้องสมุดไป่ตู้00
2000
城镇居民(元)
1000
0
0
2000
4000
Kendall ′ s一致性系数和 Spearman等级相关系数。 从检验栏内选择检验方式, 有双尾
检验和单尾检验两种。
3、单击 Options 按纽, 选择输出项和缺失值的处理方式。 本例中选择输出基本统 计描述,见图 3.6 所示。
图 3.6 Bivariate Correlation
:Options 对话框
4、单击 OK,可以得到相关分析的结果。 从表 3.1 (a)可以得到两个变量的基本统计描述,从表 (b) 中可以得到相关系数 及对相关系数的检验结果, 由于尾概率就小于 0.01 ,故说明两变量之间存在着显著的 线性相关性。
表 3.1 ( a)基本统计描述
Descriptive Statistics
(Bivariate )和偏相关分析( Partial )。 2、建立因变量和自变量之间回归模型 (Regression ),其中包括线性回归分析
(Linear )和曲线估计( Curve Estimation )。 数据条件 :参与分析的变量数据是数值型变量或有序变量。
§3.1 相关分析
在 SPSS中,可以通过 Analyze 菜单进行相关分析( Correlate ),Correlate 菜 单如图 3.1 所示。
Sig. (2-tailed)
.
人均国内生产总值(元)
N Pearson Correlation
25 .998(**)
Sig. (2-tailed)
.000
N
25
** Correlation is significant at the 0.01 level (2-tailed).
人均国内生产总值(元) .998(**) .000 25 1 . 25
火柴销售量 (万件) 23.69 24.1 22.74 17.84 18.27 20.29 22.61 26.71 31.19 30.5 29.63 29.69 29.25 31.05 32.28
6000
8000
人均 国内生产总值(元)
图 3.4 散点图
10000
12000
§3.1.1.2 简单相关分析操作
简单相关分析是指两个变量之间的相关分析, 主要是指对两变量之间的线性相关 程度作出定量分析。 仍然数据 SY-8为例,说明居民收入与某商品的销售量两变量的相 关分析过程,具体操作如下:
1、打开数据库 SY-8后,单击 Analyze Correlate 对话框,见图 3.5 所示。
从表 3.1 (b)中可以看到两个变量相关性分析的结果:相关系数是 0.998 ,相关 程度非常高,且假设检验的 P值远远地小于 0.05 ,可以认为居民收入与某产品的销量 存在线性正相关关系。
§3.1.2 偏相关分析
简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响 时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响, 不能真 实地反映二者之间的关系, 所以需要考察在其它因素的影响剔除后二者之间的相关程 度,即偏相关分析。
城镇居民消费额(元) 人均国内生产总值(元)
Mean
Std. Deviation
N
2582.2800
2335.96384
25
3689.8800
3701.50798
25
表 3.1 ( b)相关系数检验
Correlations
城镇居民消费额(元)
Pearson Correlation
城镇居民消费额(元) 1
例 1:数据库 SY-8中的变量 X表示山东省人均国内生产总值, Y表示山东省城镇居 民的消费额(资料来源:山东省 2003年统计年鉴),现画出散点图来观察两个变量的 关联程度。具体操作步骤如下:
首先打开数据 SY-8,然后单击 Graphs Scatter, 打开 Scatter plot 散点图对话 框,如图 3.2 所示。然后选择需要的散点图,图中的四个选项依次是:
第三章 相关分析与回归模型的建立与分析
相关分析和回归分析是统计分析方法中最重要内容之一, 是多元统计分析方法的 基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系, 在变量之间寻 求合适的函数关系式,特别是线性表达式。
本章主要内容: 1、对变量之间的相关关系进行分析( Correlate)。其中包括简单相关分析