第九章 相关分析与Correlate过程

合集下载

相关分析(Correlate)

相关分析(Correlate)

相关分析(Correlate)Correlation and dependenceIn statistics, correlation and dependence are any of a broad class of statistical relationships between two or more random variables or observed data values.Correlation is computed(用...计算)into what is known as the correlation coefficient(相关系数), which ranges between -1 and +1. Perfect positive correlation (a correlation co-efficient of +1) implies(意味着)that as one security(证券)moves, either up or down, the other security will move in lockstep(步伐一致的), in the same direction. Alternatively(同样的), perfect negative correlation means that if one security moves in either direction the security that is perfectly negatively correlated will move by an equal amount in the opposite(相反的)direction. If the correlation is 0, the movements of the securities are said to have no correlation; they are completely random(随意、胡乱).There are several correlation coefficients, often denoted(表示、指示)ρ or r, measuring(衡量、测量)the degree of correlation. The most common of these is the Pearson correlation coefficient, which is sensitive only to a linear(只进行两变量线性分析)relationship between two variables (which may exist even if one is a nonlinear function of the other).Other correlation coefficients have been developed to be more robust(有效的、稳健)than the Pearson correlation, or more sensitive to nonlinear relationships.Rank(等级)correlation coefficients, such as Spearman's rank correlation coefficient and Kendall's rank correlation coefficient (τ) measure the extent(范围)to which, as one variable increases, the other variable tends to increase, without requiring(需要、命令)that increase to be represented by a linear relationship. If, as the one variable(变量)increases(增加), the other decreases, the rank correlation coefficients will be negative. It is common to regard these rank correlation coefficients as alternatives to Pearson's coefficient, used either to reduce the amount of calculation or to make the coefficient less sensitive to non-normality in distributions(分布). However, this view has little mathematical basis, as rank correlation coefficients measure a different type of relationship than the Pearson product-moment correlation coefficient, and are best seen as measures of a different type of association, rather than as alternative measure of the population correlation coefficient.Common misconceptions(错误的想法)Correlation and causality(因果关系)The conventional(大会)dictum(声明)that "correlation does not imply causation" means that correlation cannot be used to infer a causal relationship between the variables.Correlation and linearityFour sets of data with the same correlation of 0.816The Pearson correlation coefficient indicates the strength of a linear relationship between two variables, but its value generally does not completely characterize their relationship. In particular, if the conditional mean of Y given X, denoted E(Y|X), is not linear in X, the correlation coefficient will not fully determine the form ofE(Y|X).The image on the right shows scatterplots(散点图)of Anscombe's quartet, a set of four different pairs of variables created by Francis Anscombe. The four y variables have the same mean (7.5), standard deviation (4.12), correlation (0.816) and regression line (y = 3 + 0.5x). However, as can be seen on the plots, the distribution of the variables is very different. The first one (top left) seems to be distributed normally, and corresponds to what one would expect when considering two variables correlated and following the assumption of normality. The second one (top right) is not distributed normally; while an obvious relationship between the two variables can be observed, it is not linear. In this case the Pearson correlation coefficient does not indicate that there is an exact functional relationship: only the extent to which that relationship can be approximated(大概)by a linear relationship. In the third case (bottom left), the linear relationship is perfect, except for one outlier which exerts enough influence to lower the correlation coefficient from 1 to0.816. Finally, the fourth example (bottom right) shows another example when one outlier(异常值)is enough to produce a high correlation coefficient, even though the relationship between the two variables is not linear.(离群值可降低、也可以增加数据的相关性。

相关与回归分析CorrelationandRegression

相关与回归分析CorrelationandRegression

相关系数计算表
可支配收入 (千元)x
18 25 45 60 62 75 88 92 98 99 662
消费支出 (千元)y
15 20 30 40 42 53 60 65 78 70 473
x2
Y2
xy
324 625 2025 3600 3844 5625 7744 8464 9801 9604 57656
按变量多少划分
单相关:一个变量对另一个变量的相关关系,称 为单相关。
复相关:当所研究的是一个变量对两个或两个以 上其他变量的相关关系时,称为复相关。如某种 商品的需求与其价格水平及人们收入水平之间的 相关关系就是一种复相关。
三、相关分析的内容
• (一)确定现象之间有无相关关系以及相关关 系的表现形式。
教学内容
• 1.相关与回归分析的 基本概念
• 2.简单线性相关与回 归分析
第一节 相关分析
函数关系与相关关系 相关关系的种类 相关分析与回归分析 相关表和相关图
年龄 脂肪
23 9.5
27
39
41
45
49
50
17.8 21.2 25.9 27.5 26.3 28.2
年龄 53
54 名5师6 出5高7 徒58 60
r=0 说明什么?
注意事项
①r值很小,说明X与Y之间没有线性相 关关系,但并不意味着X与Y之间没有 其它关系,如很强的非线性关系。
②直线相关系数一般只适用与测定变量 间的线性相关关系,若要衡量非线性相 关时,一般应采用相关指数R。
2. 相关系数的计算
• 积差法公式:
r
• 简捷公式:
(x x)( y y) (x x)2 ( y y)2

相关分析(Correlate)

相关分析(Correlate)

相关分析(Correlate)Correlation and dependenceIn statistics, correlation and dependence are any of a broad class of statistical relationships between two or more random variables or observed data values.Correlation is computed(用...计算)into what is known as the correlation coefficient(相关系数), which ranges between -1 and +1. Perfect positive correlation (a correlation co-efficient of +1) implies(意味着)that as one security(证券)moves, either up or down, the other security will move in lockstep(步伐一致的), in the same direction. Alternatively(同样的), perfect negative correlation means that if one security moves in either direction the security that is perfectly negatively correlated will move by an equal amount in the opposite(相反的)direction. If the correlation is 0, the movements of the securities are said to have no correlation; they are completely random(随意、胡乱).There are several correlation coefficients, often denoted(表示、指示)ρ or r, measuring(衡量、测量)the degree of correlation. The most common of these is the Pearson correlation coefficient, which is sensitive only to a linear(只进行两变量线性分析)relationship between two variables (which may exist even if one is a nonlinear function of the other).Other correlation coefficients have been developed to be more robust(有效的、稳健)than the Pearson correlation, or more sensitive to nonlinear relationships.Rank(等级)correlation coefficients, such as Spearman's rank correlation coefficient and Kendall's rank correlation coefficient (τ) measure the extent(范围)to which, as one variable increases, the other variable tends to increase, without requiring(需要、命令)that increase to be represented by a linear relationship. If, as the one variable(变量)increases(增加), the other decreases, the rank correlation coefficients will be negative. It is common to regard these rank correlation coefficients as alternatives to Pearson's coefficient, used either to reduce the amount of calculation or to make the coefficient less sensitive to non-normality in distributions(分布). However, this view has little mathematical basis, as rank correlation coefficients measure a different type of relationship than the Pearson product-moment correlation coefficient, and are best seen as measures of a different type of association, rather than as alternative measure of the population correlation coefficient.Common misconceptions(错误的想法)Correlation and causality(因果关系)The conventional(大会)dictum(声明)that "correlation does not imply causation" means that correlation cannot be used to infer a causal relationship between the variables.Correlation and linearityFour sets of data with the same correlation of 0.816The Pearson correlation coefficient indicates the strength of a linear relationship between two variables, but its value generally does not completely characterize their relationship. In particular, if the conditional mean of Y given X, denoted E(Y|X), is not linear in X, the correlation coefficient will not fully determine the form ofE(Y|X).The image on the right shows scatterplots(散点图)of Anscombe's quartet, a set of four different pairs of variables created by Francis Anscombe. The four y variables have the same mean (7.5), standard deviation (4.12), correlation (0.816) and regression line (y = 3 + 0.5x). However, as can be seen on the plots, the distribution of the variables is very different. The first one (top left) seems to be distributed normally, and corresponds to what one would expect when considering two variables correlated and following the assumption of normality. The second one (top right) is not distributed normally; while an obvious relationship between the two variables can be observed, it is not linear. In this case the Pearson correlation coefficient does not indicate that there is an exact functional relationship: only the extent to which that relationship can be approximated(大概)by a linear relationship. In the third case (bottom left), the linear relationship is perfect, except for one outlier which exerts enough influence to lower the correlation coefficient from 1 to0.816. Finally, the fourth example (bottom right) shows another example when one outlier(异常值)is enough to produce a high correlation coefficient, even though the relationship between the two variables is not linear.(离群值可降低、也可以增加数据的相关性。

相关分析和回归分析的实现过程

相关分析和回归分析的实现过程
2、设置参与回归分析的变量:回归分析的因 变量选入Dependent框,自变量选入 Independent (s)框,选择自变量的选入方 法是Method下拉框,具体有:
Enter(所有变量强行进入分析),Stepwise(逐步回 归法,综合向前选择法和向后剔除法),Remove (强制 剔除法),Backward (向后剔除法,所有变量进入然后 向后剔除没通过检验的变量),Forward (向前选择法, 选择最大相关系数的自变量进入模型)。
SPSS软件
File: 文件管理菜单 Edit: 编辑菜单,文本的选择拷贝等 View: 显示菜单,有关状况栏,工具条显示等 Data: 数据管理菜单 Transform: 数据转换处理,变量计算等 Analyze: 统计分析菜单 Graphs: 作图菜单
SPSS与Markway菜单对比
File Edit View Data Transform Analyze Graphs
Covariance Matrix –自变量相关系数阵和方 差、协方差阵
Model fit显示模型拟合过程中进入和退出的 变量及其模型拟合,R squared change 指
是否显示模型拟合过程中R2,F,P的改变情 况,Descriptives 输出例如均值、标准差等 变量描述;Part and Partial correlations显 示自变量之间的相关、部分相关和偏相关 系数;Collinearity diagnostics 输出共线性 诊断的统计量。其他一般采用默认项。
相关分析的Markway实现
1.统计分析相关分析皮尔逊相关
2.从选项表里选择变量到变量表,选择其他 相关选项点确定。
相关分析的Excel实现
1.选择:工具数据分析相关系数(若在 工具菜单找不到“数据分析”,可以先点 “加载宏”再选“分析工具库”)

相关分析(Correlation Analysis)

相关分析(Correlation Analysis)

Ordered &Multinomial Logit欲利用模型建立方式,讨论自变量对依变量的影响,而依变量为「有序多分」时,可以采用ordered logit model,当依变量为「无序多分」时,则是采用multinomial logit model。

一、Ordered Logit Model范例说明:欲探讨桃园民众对前县长朱立伦的满意程度(j12),依据过去相关学理探讨,自变量包括:「性别」(female)「省籍」(sengi4)、「过去施政绩效」(j09)、「未来发展预期」(j10)、「中央(同党)执政表现」(l02)、「政党认同」(campid3)等。

由于满意程度是有序多分的依变量型态(无反应将missing),故采用Ordered Logit Model。

. gen chu_sat=j12. replace chu_sat=. if chu_sat>4. recode chu_sat (1=4) (2=3) (3=2) (4=1). label define chu_sat 1 "very unsatisfied" 2 "unsatisfied" 3 "satisfied" 4 "very satisfied". label chu_sat chu_sat. label values chu_sat chu_sat. recode j09 (1=3) (3=2) (2=1) (96 97 98=.), gen(past). label define past 1 "worst" 2 "same" 3 "better". label values past past. recode j10 (1=3) (3=2) (2=1) (96 97 98=.), gen(future). label define future 1 "worst" 2 "same" 3 "better". label values future future. gen central_sat=l02. replace central_sat=. if central>4. recode central_sat (1=4) (2=3) (3=2) (4=1). label define central_sat 1 "very unsatisfied" 2 "unsatisfied" 3 "satisfied" 4 "very satisfied". label values central_sat central_satSTATA语法:ologit Y X1 X2 X3 [iw=var.]. ologit chu_sat female i.sengi4 past future central_sat i.campid3其它相关的次指令,或是Postestimation Analysis等相关指令,皆与Binary Logit Model 相同,请自行参阅及利用。

相关分析与回归分析方案

相关分析与回归分析方案
Y增加,但增加幅度不明显。 强负相关关系,其特点是X增加,导致Y明显减少,说
明X是影响Y的主要因素
相关分析 与
回归分析
弱负相关关系,其特点是变量X增加,导致Y减少,但 减少幅度不明显,说明X是Y的影响因素,但不是唯一 因素。
非线性相关关系,其特点是X、Y之间没有明显的线性 关系,却存在着某种非线性关系,说明X仍是影响Y的 因素。
3、具体判断相关是否显著,要看显著性水平
相关分析 与
回归分析
相关系数的计算
样本的相关系数一般用r表示,总体的相关系数一般用p表 示。
对于不同类型的变量,相关系数的计算公式不同。在相关 分析中,常用的相关系数有: Pearson简单相关系数:对定距连续变量的数据进行计算。 如测度收入和储蓄,身高和体重。 Spearman等级相关系数:用于度量定序变量间的线性相关 关系。如军队教员的军衔与职称。 Kendall r相关系数:用非参数检验方法来度量定序变量间 的线性相关关系。计算基于数据的秩。
(1)
最小二乘估计就是寻找参数β0 、β1、… βp的估计值β̂0 、β ̂ 1、… β ̂p,使式(1)达到极小。通过求极值原理(偏导为零) 和解方程组,可求得估计值,SPSS将自动完成。
线性回归
相关分析 与
回归分析
回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) 一元线性回归的拟合优度检验采用R2统计量,称为判定 系数或决定系数,数学定义为
线性回归
相关分析 与
回归分析
回归方程的统计检验 回归系数的显著性检验(t检验)
多元线性回归方程的回归系数显著性检验的零假设是βi=0, 检验采用t统计量,其数学定义为:
ti
ˆi ˆ

第九章双变量相关与回归分析

第九章双变量相关与回归分析

X Y X X Y Y XY
n
二、直线回归中的统计推断

回归方程的假设检验:有方差分析和t检验方法。 总体回归系数β的可信区间 利用回归方程进行估计和预测
例题
SPSS操作分析步骤如下
1、建立数据文件
•建立两个变量: X变量:年龄,数值型 Y变量:尿肌酸含量,数值型
2、统计分析
(1)散点图的制作
graph scatter simple
通过散点图可看出两个变量间不具有直线趋势而是有曲线趋势, 可通过曲线拟合方法来刻画两变量间数量上的依存关系。
(2)曲线拟合的菜单操作
analyze
regression
Curve estimation主对话框


适用于两变量间关系为非直线形式,可以通过曲线拟 合方法来刻画两变量间数量上的依存关系。 毒理学动物试验中动物死亡率与给药剂量的关系、细 菌繁殖与培养时间的关系等情况。
例题
SPSS操作分析步骤如下
1、建立数据文件
•建立两个变量: X变量:住院天数,数值型 Y变量:预后指数,数值型
第六章 双变量相关与回归分析

例如:为了研究微量元素锰在胆固醇合成中的作用, 探讨大鼠肝脏中胆固醇含量和锰含量之间是否存在直 线关系?这种关系为随着锰含量的增加,胆固醇的含 量是增加还是减少呢?——直线相关问题
第一节 直线相关



直线相关:又称简单相关,是研究两个变量间线性关 系的一种常用统计方法。 直线相关分析的是两变量之间是否存在直线相关关系, 以及相关的方向和程度。直线相关系数又称Pearson相 关系数,使描述两变量线性相关关系程度和方向的统 计量。 作直线相关分析要求资料服从双变量正态分布。对于 不符合双变量正态分布的资料,不能直接计算Pearson 相关系数,可用非参数统计方法,即计算Kendall相关 系数或Spearman相关系数。

第九章 相关分析与Correlate过程

第九章 相关分析与Correlate过程

3200
11
7300
4.1
2800
• 试对月平均家庭收入、离市中心距离和有三居室住宅月 租金三个变量进行相关分析。
§9.2 Correlate过程
• SPSS统计分析过程: 1、建立数据文件eg91.sav。 2、单击菜单“Analyze”中的“Correlate”的
“Bivariate”选项,弹出如P175,图7-1.
在该对话框中:
Correlation Coefficients:列出相关分析类型。 Pearson:为通常所指的相关系数(r)。 Kendell’s tau-b:为非参数资料的相关系数, Spearman:为非正态分布资料的相关系数。
若参与分析的变量是连续变量,选择Kendall’s tau-b或 Spearman相关,则系统自动对连续变量的值先求秩,再 计算其秩分数间的相关系数。
第九章 相关分析与Correlate过程
-教材第七章
§9.1 相关分析概念和方法
相关分析是研究变量间密切程度并用适当的统计
指标表示出来的一种常用统计方法。即是研究现象 之间是否存在某种依存关系,并对具体有依存关系 的现象探讨其相关方向以及相关程度,是研究随机 变量之间的相关关系的一种统计方法。
变量之间的关系归纳起来可分为两种类型:
• |r|>0.8:强相关;|r|<0.3:弱相关,可视为 不相关
• 注意:
–相关系数只是一个比率值,并不具备与相关 变量相同的测量单位。
–相关系数r受变量取值区间大小及样本数目的 影响较大,一般计算相关的成对数据的数目 不应少于30对。
–来自于不同群体且不同质的事物的相关系数 不能进行比较。
–对于不同类型的数据,计算相关系数的方法 也不相同。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
–单击菜单“Analyze”中的“Correlate”的 “Partial”选项,弹出如P180,图7-4.
§9.2 Correlate过程
• 偏相关分析结果表: • 类似见P183,表7-8,7-9. • 结果显示:在控制变量“有三居室的住宅月租金”的条
件下,变量“月平均家庭收入”与“离市中心距离”的 偏相关系数为0.614,其sig.=0.059>0.05,其结论与简 单相关系数不同。
在该对话框中:
Correlation Coefficients:列出相关分析类型。 Pearson:为通常所指的相关系数(r)。 Kendell’s tau-b:为非参数资料的相关系数, Spearman:为非正态分布资料的相关系数。
若参与分析的变量是连续变量,选择Kendall’s tau-b或 Spearman相关,则系统自动对连续变量的值先求秩,再 计算其秩分数间的相关系数。
§9.1.3 相关系数的分类
• 两个变量的相关系数的计算方法有:(P173,2)
– Pearson简单线性相关系数:是衡量两个定距变量(连续变 量)关系的线性关系。利用两组秩次测量两个变量间相关 程度。如:身高和体重、国民收入和居民储蓄存款等。
– Spearman等级相关系数:考察两个变量中至少一个为定序 变量时的相关关系,利用两组秩次测量两个变量间相关程 度。它适合有序数据或不满足正态分布假设的等间距数据 。如:学历与收入之间的关系。
– Options按钮:见图7-2
• Statistics:有两个统计量输出的选项。只有选择了Pearson相 关分析方法时才可选择。
– Means and standard deviations:要求计算并输出均值与标准差。 – Cross-product deviations and covariances:要求计算并输出叉积离差
§9.2.2 偏相关分析
• 偏相关分析:是指当两个变量同时与第三个 变量相关时,将第三个变量的影响剔除,只 分析另外两个变量之间相关程度的过程。。
• 偏相关分析的工具是计算偏相关系数r12. • 对于例9.1的数据进行偏相关分析。对“月平
均家庭收入”与“离市中心距离”的相关分 析。 • 其SPSS软件实现操作:
§9.1.2 描述相关关系的方法
• 相关关系的描述方法有:
–散点图:将数据以点的形式绘制在直角平面上,比较直观 ,可用来发现变量间的关系和可能的趋势。
• 散点图在进行相关分析时较为粗略。
–相关系数:以精确的相关系数体系变量间的线性关系程度 。
• 如果相关系数是根据总体全部数据计算的,称为总体相关系数,记 为ρ;
矩阵和协方差矩阵。
• Missing Values:缺失值处理方法。
§9.2 Correlate过程
• 该例中由于三个变量都是定量变量,故对它们 进行相关分析时,应计算Pearson简单相关系数 。
• 结果分析:
–类似于 P178,表7-3 描述统计结果表。
–类似于P178,表7-4 相关分析结果表。 三个Sig.值均小于所给定的显著性水平,从而可以得出两
9.2.3 距离分析
• 简单相关分析和偏相关分析都对所分析 的数据背景有一定程度的了解。
• 但在实际中有时会遇到:在分析前对数 据所代表的专业背景知识尚不充分,就 需要先对各个指标或者实例的差异性、 相似程度进行考察,先对数据有一个初 步了解,然后再根据结果考虑如何进行 深入分析。
9.2.3 距离分析
相关系数
相关系数r属于[-1,+1]。
• 若0<r≤1,表明变量之间存在正相关关系,即两个变
量的相随变动方向相同;
• 若-1≤rபைடு நூலகம்0,表明变量之间存在负相关关系,即两个变
量的相随变动方向相反。
• r=1:完全正相关;r=-1:完全负相关;这
两种情况说明变量之间存在函数关系。
• r=0:无线性关系,但不能排除变量之间存在 其他非线性关系的可能。
• 偏相关系数更能反映两个变量间的本质联系, 故常用于多元线性回归分析之中,以便分析自 变量的共线性是否排除。
§9.1.5 相关系数的检验
• 为了判断r对ρ的代表性大小,需要对相关系数 进行假设检验。
–(1)首先假设总体相关性为零,即H0为两总体无 显著的线性相关关系。
–(2)其次,计算相应的统计量,并得到对应的相 伴概率值Sig.,如果Sig.小于或等于指定的显著性 水平,则拒绝H0,认为两总体存在显著的线性相关 关系;否则,不能拒绝H0,以为两总体不存在显著 的线性相关关系。
2、Partial -- 偏相关分析,计算两个变量间在控制了其
他变量的影响下的相关关系,对相关系数也进行检验,检 验的零假设为:相关系数为0
3、Distance-- 相似性测度,对变量或观测量进行相似
性或不相似性测度
§9.2 简单相关分析的SPSS操作
• 例:在一项关于城市租房的研究中,调查了11个小区的 情况,资料如下表所示:
• 函数关系:一个变量的值能够在其他变量取值确定的 情况下,按某种函数关系唯一确定。如圆面积和圆半 径,销售量和销售额。
• 相关关系(统计关系):变量直接存在某种关系,但 一个变量的值不能由另一个变量的值唯一确定。如收 入和消费,身高和遗传。
相关关系不象函数关系那么直接,但普遍存在 ,且有强有弱。
相关分析的目的
• |r|>0.8:强相关;|r|<0.3:弱相关,可视为 不相关
• 注意:
–相关系数只是一个比率值,并不具备与相关 变量相同的测量单位。
–相关系数r受变量取值区间大小及样本数目的 影响较大,一般计算相关的成对数据的数目 不应少于30对。
–来自于不同群体且不同质的事物的相关系数 不能进行比较。
–对于不同类型的数据,计算相关系数的方法 也不相同。
3200
11
7300
4.1
2800
• 试对月平均家庭收入、离市中心距离和有三居室住宅月 租金三个变量进行相关分析。
§9.2 Correlate过程
• SPSS统计分析过程: 1、建立数据文件eg91.sav。 2、单击菜单“Analyze”中的“Correlate”的
“Bivariate”选项,弹出如P175,图7-1.
第九章 相关分析与Correlate过程
-教材第七章
§9.1 相关分析概念和方法
相关分析是研究变量间密切程度并用适当的统计
指标表示出来的一种常用统计方法。即是研究现象 之间是否存在某种依存关系,并对具体有依存关系 的现象探讨其相关方向以及相关程度,是研究随机 变量之间的相关关系的一种统计方法。
变量之间的关系归纳起来可分为两种类型:
• 相关分析的目的:通过具体的数量描述 ,呈现出研究变量之间相互关系的密切 程度及其变化规律,探求相互关系的研 究模式,以利于统计预测和推断,为作 出正确决策提供参考依据。
相关分析的作用(P172)
• 相关分析的作用是多方面的,具体概括 为:
– 1、判断变量之间有无联系。 – 2、确定选择相关关系的表现形式及相关分
– Kendall秩相关系数:与等级相关一样,考察两个变量中至 少一个为定序变量的相关关系。分析时考虑了结点(秩次 相同的)影响。
相关分析的类型
• 根据研究的目的不同,或变量的类型不 同,采用不同的相关分析方法。
• 常用的相关分析方法有: • 简单相关分析(Bivariate) • 偏相关分析(Partial) • 距离分析(Distances)
• 弱相关:变量间有关系但不明显。例,近年来我国耕 种面积与产量。
• 零相关:变量间不存在任何关系。例某班学生的学习 成绩与年龄。
§9.1.1 相关关系的分类
• 相关关系的分类:
– 从相关变量方向分:
• 正相关:变量变化的方向一致,即变量同时增加或减少。 • 负相关:变量变化的方向相反,即变量间一个增加,另一个却减少
• 距离相关分析是:对观测量之间或变量之间 相似或不相似的程度的一种测量。
• 距离相关分析可用于同一变量内部各个取值 间,以考察其相互接近程度;也可用于变量 间,以考察预测值对实际值的拟合优度。
• 距离相关分析的结果给出的不是常用的P值 ,而是各变量或记录之间的距离大小,以供 用户自行判断相似性。
距离相关分析根据统计量不同分为以下两种:
• 该图中可选择检验变量(Variables)、分 析类型(Compute Distances)、测度类型 (Measure)。
小区编号
月平均家庭收入/元
离市中心距离/km
有三居室的住宅月租金/元
1
3400
7.5
1500
2
3700
6.3
1600
3
3900
5.0
1800
4
4200
3.6
2200
5
4100
4.5
2000
6
4500
4.8
2050
7
4000
3.8
2300
8
5200
4.0
2500
9
6200
3.3
3000
10
6800
3.0
§9.2 Correlate过程
• 在Analyze+Correlate下的三个子菜单:
1、Bivariate--相关分析,计算指定的两个变量间的相关
关系,可选择Pearson相关、Spearman和Kendall 相关;同 时对相关系数进行检验,检验的零假设为:相关系数为0( 不相关)。给出相关系数为0的概率。
析方法。 – 3、把握相关关系的方向与密切程度。 – 4、预测变量间的变化、评价测量量具的信
度和效度及项目的区分度等。
§9.1.1 相关关系的分类
相关文档
最新文档