相关性分析

相关性分析
相关性分析

相关分析

【教学目的与要求】

通过本章的学习,使学生了解相关关系和相关分析基本概念,掌握相关分析理论。学生必须深刻领会相关关系的概念,弄清相关分析和回归分析之间的关系,掌握相关分析和回归分析的统计分析方法。

【重点和难点】

相关分析的概念

相关系数的含义与计算

回归方程的建立

回归系数的含义

【课堂讲授内容】

前述分析方法如综合分析法、动态分析法、因素分析法、抽样推断法均是对同一现象的数量特征进行描述和分析,而相关分析与之最大区别为相关分析侧重于两个现象之间的数量联系的研究,当然也不排除时间数列的自相关分析。相关分析有广义与狭义之分,广义的相关分析还包括回归分析,本章的相关分析是广义的概念。

第一节相关分析概述

一、变量关系的类型

在大量变量关系中,存在着两种不同的类型:函数关系和相关关系。

函数关系是指变量之间存在的一种完全确定的一一对应的关系,它是一种严格的确定性的关系。

相关关系是指两个变量或者若干变量之间存在着一种不完全确定的关系,它是一种非严格的确定性的关系。

两者之间的联系:

①由于人类的认知水平的限制,有些函数关系可能目前表现为相关关系。

②对具有相关关系的变量进行量上的测定需要借助于函数关系。

二、相关关系的种类

按照相关关系涉及的因素的多少,可分为单相关

复相关

按照相关关系的方向,可分为正相关

负相关

按照相关的表现形式,可分为直线相关

曲线相关

完全相关

完全不相关 不完全相关

三、相关分析的内容

对于相关关系的分析我们可以借助于若干分析指标(如相关系数或相关指数)对变量之间的密切程度进行测定,这种方法通常被称作相关分析 (狭义概念),广义的相关分析还包括回归分析。对于存在的相关关系的变量,运用相应的函数关系来根据给定的自变量,来估计因变量的值 ,这种统计分析方法通常称为回归分析。相关分析和回归分析都是对现象的之间相关关系的分析。广义相关分析包括的内容有:

确定变量之间是否存在相关关系及其表现形式

狭义相关分析

确定相关关系的密切程度

确定相关关系的数学表达式

回归分析

确定因变量估计值误差的程度

第二节 一元线性相关分析

一、 相关关系密切程度的测定

在判断相关关系密切程度之前,首先确定现象之间有无相关关系。确定方法有:一是根据自己的理论知识和实践经验综合分析判断;二是用相关图表进一步确定现象之间相关的方向和形式。在此基础上通过计算相关系数或相关指数来测定相关关系密切的程度。相关系数是用来说明直线相关的密切程度;相关指数则是用来判断曲线相关的密切程度。这是主要介绍相关系数的计算。

相关系数是用来分析判断直线相关的方向和程度的一种统计分析指标,其计算方法中最简单是最常用的为积差法,是用两个变量的协方差与两变量的标准差的乘积之比来计算的,计算公式如下:

σ

σσy

x

xy r 2

=

∑∑--∑--=

)

)(2

2

))((y y x x y y x x (1)

)()(2

2

2

2

y y x x y x xy -

?-?-=

(2)

2

2

2

2

)

()

(∑∑∑∑∑∑∑---

=

y y

n x x

n y x xy n (3)

上述三个公式均可以使用,由于(3)式是通常原始资料计算,所以较为准确,也较为常用。相关系数的取值范围是:-1≤r ≤+1 正的表示正相关,负的表示负相关。

利用相关系数判断相关关系的密切程度,通常认为:

相关系数的值

直线相关程度 r

=0 完全不相关 0 <

r

≤0.3

微弱相关 0.3 < r ≤0.5 低度相关 0.5 <

r ≤0.8 显著相关 0.8 <

r

≤1

高度相关 r

=1

完全相关

二、一元线性回归分析

回归分析是对具有相关关系的两个变量之间的数量变化的一般关系确定一个合适的数学表达式,以便进行估计和预测的统计方法。用一条回归直线来表明两个相关变量之间一般数学关系的方程式,成为简单直线回归方程。这种分析方法称为一元线性回归分析。

(一) 一元线性回归分析的特点

1. 在两个变量之间,必须根据研究目的具体确定哪个是自变量(x ),哪个是因变量(y )。

2. 没有明显因果关系的两个变量(x)与(y)可以求得两个方程——y 依x 的回归方程和x 依y 的回归方程.两个方程式相互独立的,不能相互替换。

3. 回归方程的主要作用在于给出自变量的数值来估计因变量的数值。一个回归方程只能做一种推算。

4.计算相关系数时, 要求相关的两个变量都是随机的变量;但是进行回归分析时,尽管两个变量也都是随机变量,但要求自变量是给定的,因变量是随机的。

(二) 一元线性回归模型与参数估计

直线方程的模型为:

bx

a y

c

+=

式中,y c 表示因变量的估计理论值;x 为自变量的实际值; a ,b 为待定参数。其几何意义是:a 是直线方程的截距,b 是斜率。其经济意义是:a 当x 等于0时, y 的估计值;b 是当x 每增加一个单位时,y 平均增加或减少的量,b 也叫回归系数。(与相关系数的关系)

求a ,b 两个参数的计算公式为:

2

2

)

(∑∑∑∑∑-

-=

x x n y x xy

n b

x b y a -=

2.一元线性回归方程的估计标准误差

估计标准误差是用来说明回归方程代表性大小的统计分析指标,是指示实际观察值和理论值的平均误差。其计算公式为:

2

)

(2

--=

∑n y y S c

yx

然而,估计标准误差根号内的分母部分不是n ,而是n-2,其表示估计回归线失去两个自由度,即样本数据的个数减去自变量的个数(m=1),再减1。在实际应用中,当n 很大时,一般是n ≥30时,计算估计标准误差时就用n 来代替n-2,则计算公式就成为:

n

c y y S

yx

∑-=

)

(2

简便公式为:

n

xy

b y a y

S yx

∑∑∑--=

2

第三节 多元线性相关分析*

一、多元线性相关的涵义

在统计中,研究一个变量与多个变量之间相关关系的理论和方法,称为多元相关分析;研究一个因变量和多各自变量的回归分析就是多元回归分析或复回归分析。多元回归可分为两个主要方面:一是线性回归;二是非线性回归。

多元线性回归模型 (一)多元线性回归模型

多元线性回归模型的一般表达式为:

i

im

m i i i i u x b x b x b x b b y ++++++= 3322110

式中,0b 表示截距,m b b b ,,,21 分别表示与个自变量相联系的斜率,i u 表示剩余残差项

或称作随机扰动项服从),0(~2σi

u 。

多元线性回归方程为:

m m c x b x b x b b y ++++= 22110

方程式中的参数0b ,m

b b b ,,,21

的求解方程式组为:

∑∑∑∑++++=m m x b x b x b nb y

22110

∑∑∑∑∑++++=m m x x b x x b x b x b y x 1212211101

∑∑∑∑∑++++=m m x x b x b x x b x b y

x 22

22121202

………………………

∑∑∑∑∑++++=2

22110m

m m m m m

x b x x b x x b x b y x

(二)二元线性回归模型

两个自变量(用

x 1

和x 2

表示)分别与因变量之间呈现线性相关时,可用二元线性回归模型来表示:

i

i i i u x b x b b y +++=22110

上式中,i u 表示剩余残差项或称作随机扰动项服从),0(~2σi u 。

二元线性回归方程:

22110x b x b b y c ++=

求解210

,,b b b 参数的方程组为:

∑∑∑++=

22110

x b x b nb y

∑∑∑∑++=

212211101

x x b x b x b y x

∑∑∑∑++=

2

2

21212

02x b x x b x b y x

多元线性回归方程的估计标准误差

在多元线性回归分析中,回归估计标准误差的计算同一元线性回归标准误差的计算方法相同。公式如

下:1

)

(2

---=

∑m n y y S c

yx

四、复相关系数和偏相关系数 (一) 复相关系数

复相关系数是指在具有多元相关关系的变量中,用来测定因变量y 与一组自变量x x

x x m

???3

2

1

间相关程度的指标。

复相关系数的计算公式为:

∑∑---

=2

2

123,)

()

(1y y y y r c

m

y

复相关系数的取值是介于-1和+1之间,和简单相关系数一样,也是用其绝对值的大小来判断相关的密切程度。

(二) 偏相关系数

偏相关系数是在多个变量中,当其他变量保持不变的情况下,测定任意两个变量之间的相关程度的指标。偏相关系数取值是介于-1和+1之间,和简单相关系数一样,也是用其数值的大小来判断相关的密切程度。

设有三个变量x x x 3

2

1

,,,如果在这三个变量中,剔除x 3

的影响,可计算x 1,x 2对 x 3

偏相关系

数,记作

r

3

,12,其计算公式为:

2

2

3

,12)

(1)

(132313

23

321x x x x x x x x x x r r r r r r ---=

如果在这三个变量中,剔除x 2

的影响,可计算x 1

、x 3

对 x 2

偏向关系数,记作r

2

,13,其计算公式

为:2

2

2

,13)

(1)(123212

32

131x x x x x x x x x x r r r r r r ---=

如果在这三个变量中,剔除x 1

的影响,可计算x 2

,x 3

对 x 1

偏向关系数,记作r

1

,23,其计算公式

为:2

2

1,23)

(1)

(113121

31

23

2x x x x x x x x x x r r r r r r ---=

【随堂练习】

1.抽取由10名大学生组成的随机样本,研究他们在高中与大学的英语成绩得出下表结果: 高考成绩(分)x 40

60

95

88

76

83

98

80

95

68

大学成绩(分)y

50

72

95

90

75

88

95

83

90

73

试用相关系数r 测定其相关程度。

2.下面是几家百货商店销售额和利润率的资料:

商店编号

每人月平均销售额(千

元) 利润率(%) 1 2 3 4 5 6 7 8 9 10 6 5 8 1 4 7 6 3 3 7 12.6 10.4 18.5 3.0 8.1 16.3 12.3 6.2 6.6 16.8 合计

50

——

要求:

变量关系

相关关系

函数关系

直线相关

曲线相关

相关程度高

直线回归方程

曲线回归方程

表达式

相关系数

相关指数 回归误差

分析回归方程的代表性

以纵轴表示利润率,横轴表示每人月平均销售额,画

出散点图,观察并说明两变量之间存在何种关系。

②计算每人月平均销售额与利润率之间的相关系数,并说明其相关的密切程度。

③求出利润率对每人月平均销售额的回归方程,解释方程式斜率的经济意义,并在散点图中绘制出回归直线。

④若商店每人月平均销售额2千元,试估计其利润率。

⑤计算估计标准误差。

相关性分析(相关系数)

相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值一般介于-1~1之间。相关系数不是等距度量值,而只是一个顺序数据。计算相关系数一般需大样本. 相关系数又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。 相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。 γ>0为正相关,γ<0为负相关。γ=0表示不相关; γ的绝对值越大,相关程度越高。 两个现象之间的相关程度,一般划分为四级: 如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。 相关系数的计算公式为<见参考资料>. 其中xi为自变量的标志值;i=1,2,…n;■为自变量的平均值, 为因变量数列的标志值;■为因变量数列的平均值。 为自变量数列的项数。对于单变量分组表的资料,相关系数的计算公式<见参考资料>. 其中fi为权数,即自变量每组的次数。在使用具有统计功能的电子计算机时,可以用一种简捷的方法计算相关系数,其公式<见参考资料>. 使用这种计算方法时,当计算机在输入x、y数据之后,可以直接得出n、■、∑xi、∑yi、∑■、∑xiy1、γ等数值,不必再列计算表。 简单相关系数: 又叫相关系数或线性相关系数。它一般用字母r 表示。它是用来度量定量变量间的线性相关关系。 复相关系数: 又叫多重相关系数

常用相关分析方法及其计算

二、常用相关分析方法及其计算 在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。 (一)积差相关系数 1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson )提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。 积差相关系数记作XY r ,其计算公式为 ∑∑∑===----= n i i n i i n i i i XY Y y X x Y y X x r 1 2 1 2 1 ) ()() )(( (2-20) 式中i x 、i y 、X 、Y 、n 的意义均同前所述。 若记X x x i -=,Y y y i -=,则(2-20)式成为 Y X XY S nS xy r ∑= (2-21) 式中n xy ∑称为协方差,n xy ∑的绝对值大小直观地反映了两列变量的一致性程 度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差 n xy ∑来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差 除,使之成为没有实际单位的标准分数,然后再求其协方差。即: ∑∑?= = )()(1Y X Y X XY S y S x n S nS xy r

Y X Z Z n ∑?= 1 (2-22) 这样,两列具有不同测两单位的变量的一致性就可以测量计算。 计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。 2. 积差相关系数的计算 利用公式 (2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算XY r 的公式。即: ∑∑∑∑∑∑∑---= 2 22 2 ) () (i i i i i i i i XY y y n x x n y x y x n r (2-23) (二)等级相关 在教育与心理研究实践中,只要条件许可,人们都乐于使用积差相关系数来度量两列变量之间的相关程度,但有时我们得到的数据不能满足积差相关系数的计算条件,此时就应使用其他相关系数。 等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据,或者得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。 1. 斯皮尔曼(Spearman)等级相关 斯皮尔曼等级相关系数用R r 表示,它适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。

相关性研究报告

课程名称 实验(实训)名称基于××大学大学生身体素质的相关性研究 班级姓名学号10 同组者 实验(实训)日期 11月30日完成日期 12月20日 本实验(实训)所用学时统计 预习 2 实验(实训) 2 报告 2 总计 6 评阅意见:成绩

一、问题提出 《全民健身计划纲要》指出:“科技发展,经济繁荣和社会进步,从根本上说取决于全民素质的提高。”大学生是体现国民体质的重要组成部分。 大学生学业任务重,脑力劳动比较多,许多学生专心于学业,忽略了身体锻炼。体质测试有助于敦促学生不断增强体质,促进身心全面发展。本次分析,主要以北京联合大学应用文理学院学生测试结果为分析内容,通过对身高,体重,肺活量,体能测试等成绩的相关性分析,了解大学生的体制现状,并探讨身高体重指数(BMI)与大学生体质健康标准测试指标之间的关系。针对大学身的营养膳食、运动习惯及学校教育等方面对大学生体质状况提出相应改善,为学校进一步搞好体育工作提供科学的参考依据。 二、问题分析 1.身高体重指数概念 身高体重指数(又称身体质量指数、体重指数,英文为Body Mass Index,简称BMI)是世界卫生组织于1900年公布的判断人体胖瘦程度的一项重要指标,主要用于比较急分析一个人的体重对于不同高度的人带来的健康影响,它是通过身高计算,不受性别影响,而且偏差较小,操作也比较简便,便于测量和应用。 身高体重指数(BMI),是体质测试中身高和体重的一个关系值,这个概念是由19世纪中叶比利时的凯特勒最先提出。它的定义如下: w=体重,单位:千克; h=身高,单位:米; 国际生命科学委员会中国办事处规定符合中国人的体制等级:低于15.6为营养不良;15.6-17.5之间为较轻体重;17.5-18.5之间为轻体重;18.5-24之间为正常体重,24-28之间为超重体重;28以上为肥胖,超过31为中度肥胖,超过34为重度肥胖。我国大学生已经步入成人阶段,属于成年人,可以把身高体重指数的标准范围确定为18.5-24。 2.影响大学生身高体重指数的因素 (1)遗传因素 遗传是延续生物生命特征基因符号传递的一种固有方式。英国牛津大 学马克.麦卡锡等研究人员在2007年4月的《科学》杂志上最先发表

【实验报告】SPSS相关分析实验报告

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。 (1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。

b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为 0.0000.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.0000.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.86650.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操作过程。 2、通过spss软件输出的数据结果并能够分析其相互之间的关系,并且解决实际问题。 3、充分理解了相关性分析的应用原理。

典型相关分析评价指标体系

典型相关分析如何评价指标体系 本节我们介绍典型相关分析如何评价指标体系。我们通过运用典型相关分析的方法对影响企业信息化成熟度关键因素的指标体系进行评价,以此来说明典型相关分析可以评价指标体系。 典型相关分析是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。为了研究两组变量的相关性,我们可以把两组变量的相关性转化为两个变量的相关性来考虑,即考察第一组变量的线性组合与第二组变量的线性组合的相关性。通过选择线性系数使线性化后的变量有最大的相关系数,形成第一对典型变量,依此可以形成第二对、第三对典型变量,并使各对典型变量之间互不相关,典型相关变量之间的简单相关系数称为典型相关系数。典型相关分析就是用典型相关系数衡量两组变量之间的相关性。 一、案例背景 信息化在提高企业竞争力中的重要作用是有目共睹的事实,为了提高企业信息化的效果,企业在其信息化的过程中应该抓住关键影响因素。从企业信息化角度,探求影响企业信息化成熟度关键因素,对于避免在信息化过程中人力、资金等方面的浪费,进而达到科学、稳步地提高本企业的核心竞争力的目的具有十分重要的现实意义。 二、数据的选取 1、企业信息化成熟度指标体系 根据实现企业信息化成熟度所需的基础条件、企业信息化过程和信息化对企业作用的体现,将企业信息化指标体系分为两个方面:企业信息化基础条件建设和企业信息系统应用水平(见图4-1)。 图4-1 2、企业信息化成熟度的影响因素 企业作为一个开放的系统,其信息化水平不可避免地要受到企业内、外部环境的影响(见

图4-2)。 图4-2 三、实例分析 把企业信息化成熟度指标体系和影响因素分别用以下两个向量表示: 在SAS软件中采用典型相关分析,得到10组典型相关,其中前3组(见表4-1)相关系数可以知道两组变量之间相关性显著,3组典型变量似然率卡方检验值小于0.0001,均通过显著性检验。第1对典型相关的相关百分比为0.2087,说明这对相关变量表示了20.87%的隐含信息,第2对典型相关的相关百分比为0.1793,说明这对相关变量表示了17.93%的隐含信息,前3对典型变量解释了56.10%的数据信息。

相关性分析

相关性分析 相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。 差时,他们的相关性就会受到削弱。 世界上的任何事物之间存在的关系无非三种: 1、函数关系,如时间和距离, 2、没有关系,如你老婆的头发颜色和目前的房价 3、相关关系,两者之间有一定的关系,但不是函数关系。这种密切程度可以用一个数值来表示,|1|表示相关关系达到了函数关系,从1到-1之间表示两者之间关系的密切程度,例如0.8。 相关分析用excel可以实现 说判定有些严格,其实就是观察一下各个指标的相关程度。一般来说相关性越是高,做主成分分析就越是成功。主成分分析是通过降低空间维度来体现所有变量的特征使得样本点分散程度极大,说得直观一点就是寻找多个变量的一个加权平均来反映所有变量的一个整体性特征。 评价相关性的方法就是相关系数,由于是多变量的判定,则引出相关系数矩阵。 评价主成分分析的关键不在于相关系数的情况,而在于贡献率,也就是根据主成分分析的原理,计算相关系数矩阵的特征值和特征向量。 相关系数越是高,计算出来的特征值差距就越大,贡献率等于前n个大的特征值除以全部特征值之和,贡献率越是大说明主成分分析的效果越好。反之,变量之间相关性越差。 举个例子来说,在二维平面内,我们的目的就是把它映射(加权)到一条直线上并使得他们分散的最开(方差最大)达到降低维度的目的,如果所有样本点都在一条直线上(也就是相关系数等于1或者-1),这样的效果是最好的。再假设样本点呈现两条垂直的形状(相关系数等于零),你要找到一条直线来做映射就很难了。 SPSS软件的特点 一、集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例。 二、统计功能囊括了《教育统计学》中所有的项目,包括常规的集中量数和差异量数、相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计 大数据并不是说它大,而是指其全面。它收集全方位的信息来交叉验证,应用在各个领域。比如银行,你可以去银行贷款,而银行可能会把钱借给你,为什么??因为在大数据时代,它可以通过一系列信息,通过交叉复现得知你很多东西,比如你的住址,是什么样的校区?

典型相关分析报告SPSS例析

典型相关分析 典型相关分析(Canonical correlation )又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关, 而不是 两个变量组个别变量之间的相关。 典型相关与主成分相关有类似, 不过主成分考虑的是一组变量,而典型相关考虑的是两 组变量间的关系,有学者将规则相关视为双管的主成分分析;因为它主要在寻找一组变量的 成分使之与另一组的成分具有最大的线性关系。 典型相关模型的基本假设: 两组变量间是线性关系, 每对典型变量之间是线性关系,每 个典型变量与本组变量之间也是线性关系;典型相关还要求各组内变量间不能有高度的复共 线性。典型相关两组变量地位相等,如有隐含的因果关系,可令一组为自变量,另一组为因 变量。 典型相关会找出一组变量的线性组合 * *= i i j j X a x Y b y 与,称为典型变量;以 使两个典型变量之间所能获得相关系数达到最大,这一相关系数称为典型相关系数。 i a 和j b 称为典型系数。如果对变量进行标准化后再进行上述操作,得到的是标准化的典型系数。 典型变量的性质 每个典型变量智慧与对应的另一组典型变量相关,而不与其他典型变量相关; 原来所有 变量的总方差通过典型变量而成为几个相互独立的维度。一个典型相关系数只是两个典型变 量之间的相关,不能代表两个变量组的相关;各对典型变量构成的多维典型相关, 共同代表 两组变量间的整体相关。 典型负荷系数和交叉负荷系数典型负荷系数也称结构相关系数, 指的是一个典型变量与本组所有变量的简单相关系数,

SPSS典型相关分析

SPSS数据统计分析与实践 第二十二章:典型相关分析 (Canonical Correlation) 主讲:周涛副教授 北京师范大学资源学院 教学网站:https://www.360docs.net/doc/de4280294.html,/Courses/SPSS

典型相关分析(Canonical Correlation)本章内容: 一、典型相关分析的基本思想 二、典型相关分析的数学描述 三、SPSS实例 四、小节

典型相关分析的基本思想 z典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 z简单相关系数;复相关系数;典型相关系数 z典型相关分析首先在每组变量中找出变量的线性组合,使其具有最大相关性; z然后再在每组变量中找出第二对线性组合,使其与第一对线性组合不相关,而第二对本身具有最大相关性; z如此继续下去,直到两组变量之间的相关性被提取完毕为止; z这些综合变量被称为典型变量(canonical variates);第I对典型变量间的相关系数则被称为第I 典型相关系数(一般来说,只需提取1~2对典型变量即可较为充分的概括样本信息)。

典型相关分析的目的 T q T p Y Y Y Y X X X X ),,,() ,,,(2121K K ==设两组分别为p 与q 维 (p ≤q)的变量X ,Y :设p + q 维随机向量协方差阵,????????=Y X Z ??? ?????ΣΣΣΣ=Σ222112 11其中Σ11是X 的协方差阵,Σ22是Y 的协方差阵,Σ12=ΣT 21是X ,Y 的协方差阵 典型相关分析用X 和Y 的线性组合U =a T X , V =b T Y 之间的相关来研究X 和Y 之间的相关性。其目的就是希望找到向量a 和b ,使ρ(U ,V )最大,从而找到替代原始变量的典型变量U 和V 。

SPSS相关分析报告案例讲解要点

相关分析 一、两个变量得相关分析:Bivariate 1.相关系数得含义 相关分析就是研究变量间密切程度得一种常用统计方法。相关系数就是描述相关关系强弱程度与方向得统计量,通常用r表示。 ①相关系数得取值范围在-1与+1之间,即:–1≤r≤1。 ②计算结果,若r为正,则表明两变量为正相关;若r为负,则表明两变量为负相关。 ③相关系数r得数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或–1,则表示两个现象完全直线性相关。如果=0,则表示两个现象完全不相关(不就是直线相关)。 ④,称为微弱相关、,称为低度相关、,称为显著(中度)相关、,称为高度相关 ⑤r值很小,说明X与Y之间没有线性相关关系,但并不意味着X与Y之间没有其它关系,如很强得非线性关系。 ⑥直线相关系数一般只适用与测定变量间得线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。 2.常用得简单相关系数 (1)皮尔逊(Pearson)相关系数 皮尔逊相关系数亦称积矩相关系数,1890年由英国统计学家卡尔?皮尔逊提出。定距变量之间得相关关系测量常用Pearson系数法。计算公式如下: (1) (1)式就是样本得相关系数。计算皮尔逊相关系数得数据要求:变量都就是服从正态分布,相互独立得连续数据;两个变量在散点图上有线性相关趋势;样本容量。 (2)斯皮尔曼(Spearman)等级相关系数 Spearman相关系数又称秩相关系数,就是用来测度两个定序数据之间得线性相关程度得指标。 当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间得关系密切程度。它就是根据数据得秩而不就是原始数据来计算相关系数得,其

环境监测中某些指标的相关性分析

环境监测中某些指标的相关性分析 安徽省环境监测中心站周世厥 一、水和废水测定中某些指标的相关性分析 1、化学需氧量(CODcr)与高锰酸盐指数(I Mn)、五日生化需氧量(BOD5)、总有机碳(TOC)的相关性分析: CODcr及I Mn、BOD5、TOC均是表征水中有机物污染的综合性指标,其中CODcr是指在一定条件下,经重铬酸钾氧化处理时,水样中的溶解性物质和悬浮物所消耗和重铬酸盐相对应的氧的质量浓度;I Mn是指在一定条件下,用高锰酸钾氧化水样中的某些有机物及无机还原性物质,由消耗的高锰酸钾量计算相当的氧量,由于许多有机物只能部分被氧化,且易挥发的有机物也不包含在测定值之内,所以它不能作为理论需氧量或总有机物含量的指标;BOD5是指在规定条件下水中有机物和无机物在生物氧化作用下所消耗的溶解氧(以质量浓度表示);TOC是指以碳的含量表示水体中有机物质总量的综合指标,由于用燃烧法测定,能将有机物全部氧化,因此它比BOD5、COD更能直接表示有机物的总量。根据以上各指标的定义,一般可用如下规律判断测试结果的合理性。即: 1.1 CODcr> I Mn I Mn=(0.2~0.7) CODcr; 1.2 CODcr> BOD5 BOD5=(0.2~0.8) CODcr; 1.3 CODcr> TOC TOC=(0.2~0.7) CODcr。 2、总氮(TN)与硝酸盐氮(NO3-N)、亚硝酸盐氮(NO2-N)、氨氮(NH3-N)凯氏氮(KN)的相关性分析: TN及NO3-N、NO2-N、NH3-N、KN表示不同的含氮化合物,均可用于表征环境中氮的污染状况。TN是指可溶性及悬浮颗粒中的含

SPSS相关分析实验报告精选

本科教学实验报告 (实验)课程名称:数据分析技术系列实验

实验报告 学生姓名: 一、实验室名称: 二、实验项目名称:相关分析 三、实验原理 相关关系是不完全确定的随机关系。在相关关系的情况下,当一个或几个相互联系的变量取一定值得时候,与之相应的另一变量的值虽然不确定,但它仍然按照某种规律在一定的范围内变化。 按照数据度量的尺度不同,相关分析的方法也不同,连续变量之间的相关性常用Pearson简单相关系数测定;定序变量的相关系数常用Spearman秩相关系数和Kendall 秩相关系数测定;定类变量的相关分析要使用列连表分析法。 四、实验目的 理解相关分析的基本原理,掌握在SPSS软件中相关分析的主要参数设置及其含义,掌握SPSS软件分析结果的含义及其分析。 五、实验内容及步骤 实验内容:以雇员表为例,共有474条数据,运用相关分析方法对变量间的相关关系进行分析。 1)分析性别与工资之间是否存在相关关系。 2)分析教育程度与工资之间是否存在相关关系。 实验要求:掌握相关分析方法的计算思路及其在SPSS环境下的操作方法,掌握输出结果的解释。 1.分析性别与工资之间是否存在相关关系。 分析:性别属于定类变量,是离散值,因使用卡方检验。 Step1.操作为Analyze\DescriptiveStatistics\Crosstabs Step2.将性别(Gender)和收入(CurrentSalary)分别移入Rows列表框和Columns 列表框。

Step3.单击Statistics按钮,在弹出的子对话框中选中默认的Chi-square,进行卡方检验。退回到主对话框,单击ok。 2.分析教育程度与工资之间是否存在相关关系。 分析:教育程度为定序变量,工资为连续变量,可使用Spearman和Kendall秩相关系数检验。 Step1.用散点图初步判断二变量的相关性,操作为Graphs/LegacyDialogs/Scatter,选择SimpleScatter,教育程度为自变量,工资为因变量,做散点图。 散点图结果如图示,二者存在线性相关关系。只有线性相关的关系确定后才能继续进行下一步分析。因此,在进行相关分析之前的预分析过程也是十分重要的。 Step2.两变量相关分析,操作为Analyze/Correlate/Bivariate,选择Kendall和Spearman 相关系数。 六、实验器材(设备、元器件): 计算机、打印机、硒鼓、碳粉、纸张 七、实验数据及结果分析 1.分析性别与工资之间是否存在相关关系。 卡方检验结果为 显着性水平为,即至少有%的把握认为性别和工资之间存在显着的相关系。

典型相关分析及其应用实例

摘要 典型相关分析是多元统计分析的一个重要研究课题.它是研究两组变量之间相关的一种统计分析方法,能够有效地揭示两组变量之间的相互线性依赖关系.它借助主成分分析降维的思想,用少数几对综合变量来反映两组变量间的线性相关性质.目前它已经在众多领域的相关分析和预测分析中得到广泛应用. 本文首先描述了典型相关分析的统计思想,定义了总体典型相关变量及典型 相关系数,并简要概述了它们的求解思路,然后深入对样本典型相关分析的几种算法做了比较全面的论述.根据典型相关分析的推理,归纳总结了它的一些重要性质并给出了证明,接着推导了典型相关系数的显著性检验.最后通过理论与实例分析两个层面论证了典型相关分析的应用于实际生活中的可行性与优越性. 【关键词】典型相关分析,样本典型相关,性质,实际应用 ABSTRACT The Canonical Correlation Analysis is an important studying topic of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual line dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis and forecasted analysis. This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up

可行性分析报告实施报告模板

一、系统可行性研究报告 完成人: 1.引言 1.1编写目的 说明可行性分析的必要性。 1.2 背景 简述项目的来源、现状,研发组织,要求,目标等。 1.2 术语定义 将该可行性分析中的术语、缩写词进行定义。 1.3 相关文档 当该文档变更时,可能对其他文档产生影响,受影响的文档叫相关文档,需将它们列出。 [1] …… [2] …… 2 现行系统调查 2.1 组织机构与业务围 2.1.1组织概况 2.1.2 各部门业务围及职能说明 2.2 组织信息处理流程 现行信息处理办法与流程,可用业务流程图表示。 2.3 现行系统存在问题 3 新系统概述 3.1 目标 3.2 新系统功能围及划分说明 划分子系统,画出系统总体结构图。

4 可行性综合评述 4.1 经济可行性 对需要的资金与其他资源进行估计,并分析可能的效益 4.2 技术可行性 分析现有技术能否解决系统问题 4.3 管理可行性(略) 5.案选择 5.1 首选案: 首先相关人员信息记录在相关人员管理系统中,。相关人员进书信息统计在进书管理系统中。而进书管理系统把进书数据传给统计管理系统统计分析。普通顾客购书可以通过销售管理系统,而销售管理系统则把购书信息反应给库存管理系统,库存管理系统通过分析判断信息,发货给顾客,并把发货信息传给统计管理系统,统计管理系统则统计,记录信息。最后相关人员通过查询统计系统则可以得到进书和销售信息。如果是会员,则会进入会员管理系统,会员管理系统则会发送打折等相关信息给销售管理系统,便会执行相关的程序。 5.2 可选案:其他与首选案差不不多,只是每个管理系统需要相关人员的手动操作和配合. 5.3 案对比:相对的来说,首选案突出了自动化管理的特色,适合时代飞速发展的今天。这样不但结束了很多繁杂的工作,带来了便和利益。而且还可以大大的减少员工的数量,减少开支,给公司带来了更多的效益。 6.项目进度计划 软件项目进度计划,是对项目的进度、人员工作分工以及资源需求所做的计划,此计划依据上述的估算和分析结果,进度计划采用甘特图表示(甘特图用PROJECT画),人员按功能结构分配。 二、需求规格说明书

spss相关分析实验报告

实验五相关分析实验报关费 一、实验目的: 学习利用spss对数据进行相关分析(积差相关、肯德尔等级相关)、偏相关分析。利用交叉表进行相关分析。 二、实验内容: 某班学生成绩表1如实验图表所示。 1.对该班物理成绩与数学成绩之间进行积差相关分析和肯德尔等级相关 分析。 2.在控制物理成绩不变的条件下,做数学成绩与英语成绩的相关分析(这 种情况下的相关分析称为偏相关分析)。 3.对该班物理成绩与数学成绩制作交叉表及进行其中的相关分析。 三、实验步骤: 1.选择分析→相关→双变量,弹出窗口,在对话框的变量列表中选变量 “数学成绩”、“物理成绩”,在相关系数列进行选择,本次实验选择 皮尔逊相关(积差相关)和肯德尔等级相关。单击选项,对描述统计 量进行选择,选择标准差和均值。单击确定,得出输出结果,对结果 进行分析解释。 2.选择分析→相关→偏相关,弹出窗口,在对话框的变量列表选变量“数 学成绩”、“英语成绩”,在控制列表选择要控制的变量“物理成绩” 以在控制物理成绩的影响下对变量数学成绩与英语成绩进行偏相关分 析;在“显著性检验”框中选双侧检验,单击确定,得出输出结果, 对结果进行分析解释。 3.选择分析→描述统计→交叉表,弹出窗口,对交叉表的行和列进行选 择,行选择为数学成绩,列选择为物理成绩。然后对统计量进行设置, 选择相关性,点击继续→确定,得出输出结果,对结果进行分析解释。 四、实验结果与分析:

表1

五、实验结果及其分析:

分析一:由实验结果可观察出,数学成绩与物理成绩的积差相关系数r=,肯德尔等级相关系数r=可知该班物理成绩和数学成绩之间存在显著相关。

数学建模__SPSS_典型相关分析

典型相关分析 在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。 典型相关分析计算步骤 (一)根据分析目的建立原始矩阵 原始数据矩阵 ?? ????????? ???nq n n np n n q p q p y y y x x x y y y x x x y y y x x x 2 1 2 1 222212221 1121111211 (二)对原始数据进行标准化变化并计算相关系数矩阵 R = ?? ? ? ??22211211 R R R R 其中11R ,22R 分别为第一组变量和第二组变量的相关系数阵,12R = 21 R '为第一组变量和第二组变量的相关系数 (三)求典型相关系数和典型变量 计算矩阵=A 111-R 12R 122-R 21R 以及矩阵=B 122-R 21R 1 11-R 12R 的特征值和特征向量,分 别得典型相关系数和典型变量。 (四)检验各典型相关系数的显著性 第五节 利用SPSS 进行典型相关分析 第一步,录入原始数据,如下表:X1 X2 X3 X4 X5 分别代表多孩率、综合节育率、初中及以上受教育程度的人口比例、人均国民收入和城镇人口比例。

1、点击“Files→New→Syntax”打开如下对话框。 2、输入调用命令程序及定义典型相关分析变量组的命令。如图

输入时要注意“Canonical correlation.sps”程序所在的根目录,注意变量组的格式和空格。 第三步,执行程序。用光标选择这些命令,使其图黑,再点击运行键,即可得到所有典型相关分析结果。

spss对数据进行相关性分析实验报告

管理统计实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p 值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。 三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。 (1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。

b.在spssd的菜单栏中选择点击Analyze correlate Bivariate,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。

从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为 0.000<0.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击Analyze correlate partial,系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.000<0.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.8665<0.921,说明它们之间的显著性关系稍有减弱。

spss对数据进行相关性分析实验分析报告

spss对数据进行相关性分析实验报告

————————————————————————————————作者:————————————————————————————————日期:

管理统计实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p 值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。 三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。 (1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。

b.在spssd的菜单栏中选择点击Analyze correlate Bivariate, 弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为 0.000<0.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击Analyze correlate partial,系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。

性分析报告

编号: 376MHz/418MHz双模吸盘天线 可靠性、维修性、保障性、测试性、安全性、环境适应性分析报告 拟制: 审核: 批准: XXXX科技有限公司 二零一三年三月 1 概述 为确保产品质量符合要求,达到顾客满意,根据《GJB9001B-2009质量管理休系要求》的规定,对该产品的可靠性、维修性、保障性、测试性、安全性、环境适应性进行分析。 2 可靠性分析 元器件清单 元件选型上天线护套玻璃钢经过GJB150环境试验,高频接头采用国标黄铜加工表面镀涂处理,接头采用316#不锈钢材质,保证了气路可靠性;测控系统元件选择汽车级或者军品级的元件,工作温度覆盖系统工作温度范围,并经过筛选,具有较高的可靠性。 可靠性预计 本器件所采用的元器件有7类13种共57个。其中任一元器件失效,都将造成整个器件失效,即器件正常工作的条件是各元器件都能正常工作。因此,本器件的可靠性模型是一个串联模型。 该器件是可修复产品,寿命服从指数分布,根据可靠性理论,其平均故障间隔时间

与失效率成反比,即: MTBF= 1/∑pi λ (1) 所用元器件均是通用或固化产品,其质量水平、工作应力及环境条件都相对固定,其失效率因子等有关可靠性参数可参考《GJB/Z299C-2006电子设备可靠性预计手册》,从而采用应力分析法来预计本器件的可靠性指标。 本器件一般内置于系统机箱内,使用大环境是舰船甲板或舰船舱内,其环境代号Ns2,工作温度-40℃~+70℃,现计算其可靠性指标。 2.2.1 PIN 二极管的工作失效率1p λ 本器件使用PIN 二极管,其工作失效率模型为 K Q E b p πππλλ=1 (2) 式中: b λ —— 基本失效率,10-6/h ; E π —— 环境系数; Q π —— 质量系数; K π —— 种类系数。 由表5.3.11-1查得基本失效率b λ =×10-6/h ; 由表5.3.11-2查得环境系数E π=14; 由表5.3.11-3查得质量系数Q π=; 由表5.3.11-4查得种类系数K π=; 本器件中使用了18只PIN 二极管,故其工作失效率为: 2.2.2 片状电容器的工作失效率2p λ 本器件选用的片状电容器,其工作失效率模型为: ch K CV Q E b p πππππλλ=2 (3) b λ —— 基本失效率,10-6/h ; E π —— 环境系数;

对评价指标相关性的后果及降低相关性的方法研究_赵松山

o 生活一点通 用酒调味要先放;用醋调味要后放。t 东北财经大学教授 赵松山及降低相关性的方法研究对评价指标相关性的后果 就一般情况而言,组成一个社会经济统计指标体系的各指标 之间总存在着一定程度的相关关系。但作为评价指标体系,如果指标之间的相关性大,则会带来一系列问题。本文仅对统计指标相关性的后果,以及如何降低指标的相关程度进行探讨。一、指标相关性带来的问题设Y 为因变量,X 1与X 2为解释指标变量。当X 1与X 2不相关时,得模型为Y=b 1x 1+b 2x 2式中b 1、b 2分别表示解释指标变量对Y 的说明能力或作用程度,即边际值=9Y/9X 1=b 1,9Y/9X 2=b 2(假定b 1,b 2均大于0)。当X 1与X 2相关时,得模型为Y=c 1x 1+c 2x 2式中c 1(c 2)表示解释指标变量X 1(X 2)对Y 的说明能力和X 2(X 1)通过X 1(X 2)对Y 的说明能力之和,即9Y 9X 1=9(b 1x 1+b 2x 2)9X 1+9(b 1x 1+b 2x 2)9X 1@9X 19X 2=b 1(1+a 1)=c 1式中,X 1=a 1X 2,a 1>0。可见,c 1>b 1,即指标相关时,会夸大某些指标的作用程度。从信息角度看,信息相关势必存在信息重迭,造成信息的损失和浪费,以及指标解释的不真实性。如果把解释指标变量视为评价指标变量,因变量视为待评价 对象变量时,由于评价指标之间的相关夸大(或缩小)某些指标的评价作用,而使评价结果失去客观性。这是从评价指标与被评价对象的关系考虑的。如果我们换个角度,从各评价指标与评价指标体系整体关系去认识,若指标之间是相关的,则评价指标X i 与X j 样本分布相互间有影响,因此两者之间的变异系数之差会变小。而变异系数是指标鉴别能力的一种度量。这种相关性导致变异系数之差变小,最终表现为相关指标鉴别能力相对变小,即相关指标在统计指标体系整体中的功能下降。当指标体系中各指标之间均高度相关时,各指标在指标体系整体中的功能(作用)会几乎相同,掩盖了各指标本身在指标体系整体中所具有的重要程度的差异性。这一分析告诉我们,通过指标的相关分析,剔除高度相关的指标,既提高了指标的评价功能,又简化了指标体系,同时增加了评价的客观性和真实性。二、降低指标相关性的方法 (一)相关系数法 指标的相关性只能通过样本的相关系数来估计,假设初选指标变量为X 1,X 2,,,X h ,样本数为n,设X ij 为样本i 的第j 个指标的观测值,原始指标资料数据矩阵为X=(X ij )h n ,然后进行同向归一化数据变换,得到数据矩阵Z=(Z i j )h no 计算两个指标间的简单相关系数r ij ,计算公式为: r ij =E (Z ki -Z i )(Z kj -Z j )E (Z ki -Z i )2E (Z kj -Z j ) 2 (i,j=1,2,,,h)。 5 #研究与探讨#

SPSS相关分析报告案例讲解要点

相关分析 一、两个变量的相关分析:Bivariate 1.相关系数的含义 相关分析是研究变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量,通常用r 表示。 ①相关系数的取值范围在-1和+1之间,即:–1≤r ≤ 1。 ②计算结果,若r 为正,则表明两变量为正相关;若r 为负,则表明两变量为负相关。 ③相关系数r 的数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或–1,则表示两个现象完全直线性相关。如果=0,则表示两个现象完全不相关(不是直线相关)。 ④3.0

相关文档
最新文档