统计学课件第七章 相关与回归
合集下载
统计学课件第七章 相关与回归

2
Lxy Lxx Lyy
(公式3)
r
xy x
n x y
y
L
xy
n xy x y n x ( x) n y ( y ) 2
2 2 2
(公式5)
r
xy xy xy x y xy x y n (公式6) xy f 2 2 2 2 x y xy x ( x) y ( y ) f
2
( y y )
2
(公式2)
10
设 : L xy ( x x )( y y ), L xx ( x x ) 2 , L yy ( y y ) 2 则: r 或:r ( x x )( y y ) ( x x )
2
( y y ) (公式4)
18
( x x)( y y) 偏大
( p p)(q q ) 偏小
第七章
[不相关]
相关与回归分析
Y
STAT
Y
xx
A图
B图
yy
X
X
A图: x x 0 ( x x )( y y) 0 xy 0
9
二、(线性)相关系数 (一)定义:反映变量x和变量y之间线性相关方向与密切程度 的统计指标。注:线性相关 相关系数r;曲线相关 相关 指数R。 (二)积差法计算公式:
xy x数列与y数列的协方差 xy r (公式1), x y , x数列, y数列的标准差 x y r ( x x )( y y ) n 2 2 ( x x ) ( y y ) n n ( x x )( y y ) ( x x )
大学统计学原理经典课件第七章 相关与回归分析

y=f(x布在直线周围
x
相关关系与函数关系的联系
(1)都可用函数式加以描述,但表达式不
同; (2)函数有时也可能表现为相关关系; (3)相关分析有时需要利用函数关系数学 表达式来研究; (4)相关关系是相关分析的研究对象,函 数关系是相关分析的工具。
变量之间的关系
学历和收入之间的关系 广告投入与销售额之间的关系
第一节
相关分析的意义和任务
一. 相关关系的概念
二. 相关关系的种类 三. 相关分析的主要内容
一、相关关系的概念
函数关系 (确定性关系) ⒈ 出租汽车费用与行驶里程: 总费用=行驶里程 每公里单价
G KP
相关关系
(非确定性关系)
2 2 2 2 2
13 9145651.19 12827.5 7448 13 16073323.77 12827.5 13 5213898 7448
2
0.9978
人均国民收入与人均消费金额之间的相关系数为 0.9978,说明两者之间是高度线性相关的。
第三节 直线回归分析
2
2
或化简为
r
n x x n y y
2 2 2
n xy x y
2
简单相关系数的方向和程度的决定因素 ( x x )( y y ) 根据公式, r ( x x ) ( y y)
2 2
则说明是正相关; ( x x)( y y ) 0 ,则是负相 关; ( x x)( y y ) 0 ,则是零相关。
x
另一类是变量间不存在完全的确定性关系, 不能用精确的数学公式来表示,虽然这些变 量间存在着十分密切的关系,但不能由一个 或几个变量的值精确地求出另一个变量的值。 这些变量间的关系称为相关关系,把存在相 关关系的变量称为相关变量。
x
相关关系与函数关系的联系
(1)都可用函数式加以描述,但表达式不
同; (2)函数有时也可能表现为相关关系; (3)相关分析有时需要利用函数关系数学 表达式来研究; (4)相关关系是相关分析的研究对象,函 数关系是相关分析的工具。
变量之间的关系
学历和收入之间的关系 广告投入与销售额之间的关系
第一节
相关分析的意义和任务
一. 相关关系的概念
二. 相关关系的种类 三. 相关分析的主要内容
一、相关关系的概念
函数关系 (确定性关系) ⒈ 出租汽车费用与行驶里程: 总费用=行驶里程 每公里单价
G KP
相关关系
(非确定性关系)
2 2 2 2 2
13 9145651.19 12827.5 7448 13 16073323.77 12827.5 13 5213898 7448
2
0.9978
人均国民收入与人均消费金额之间的相关系数为 0.9978,说明两者之间是高度线性相关的。
第三节 直线回归分析
2
2
或化简为
r
n x x n y y
2 2 2
n xy x y
2
简单相关系数的方向和程度的决定因素 ( x x )( y y ) 根据公式, r ( x x ) ( y y)
2 2
则说明是正相关; ( x x)( y y ) 0 ,则是负相 关; ( x x)( y y ) 0 ,则是零相关。
x
另一类是变量间不存在完全的确定性关系, 不能用精确的数学公式来表示,虽然这些变 量间存在着十分密切的关系,但不能由一个 或几个变量的值精确地求出另一个变量的值。 这些变量间的关系称为相关关系,把存在相 关关系的变量称为相关变量。
统计学 第七章相关与回归分析

统计学
STATISTICS
第二节相关分析
7 - 18
统计学
STATISTICS
一、相关表和相关图
7 - 19
相关表与相关图 (概念要点)
统计学
STATISTICS
1、相关表和相关图是研究相关关系的直观工具。一般在进 行详细的定量分析之前,可以利用它们对现象之间存在 的相关关系的方向、形式和密切程度做大致的判断。
▪ 父亲身高y与子女身高x之间的关系 ▪ 收入水平y与受教育程度x之间的关系 ▪ 粮食亩产量y与施肥量x1 、降雨量x2 、温度
x3之间的关系 ▪ 商品的消费量y与居民收入x之间的关系 ▪ 商品销售额y与广告费支出x之间的关系
7 -9
统计学
STATISTICS
二、相关关系的种类
7 - 10
相关关系的种类
STATISTICS
函数关系的例子
▪ 某种商品的销售额y与销售量x之间的关系可表 示为 y = px (p 为单价)
▪ 圆的面积S与半径之间的关系可表示为S=R2
▪ 企业的原材料消耗额y与产量x1 、单位产量消 耗x2 、原材料价格x3之间的关系可表示为 y = x1 x2 x3
7 -7
(二)相关关系
2、相关表是一种反映变量之间相关关系的统计表。它是将 某一变量按其取值的大小排列,然后再将与其相关的另 一变量的对应值平行排列,便可得到简单的相关表。
3、相关图又称散点图。它是以直角坐标系的横轴代表变量 X,纵轴代表Y,将两个变量间相应的变量值用坐标点 的形式描绘出来,用来反应量变量之间相关关系的图形 。
7 - 14
(二)回归分析
(Regression)
统计学
STATISTICS
统计学 第 七 章 相关与回归分析

3. 利用所求的关系式,根据一个或几个变量 的取值来预测或控制另一个特定变量的取 值,并给出这种预测或控制的精确程度
(一)回归分析与相关分析的关系
回归分析与相关分析是研究现象 之间相互关系的两种基本方法。
区别:
1、相关分析研究两个变量之间相关的 方向和相关的密切程度。但是相关分析不 能指出两变量相互关系的具体形式,也无 法从一个变量的变化来推测另一个变量的 变化关系。
2、按研究变量多少分为单相关和 复相关
单相关即一元相关,亦称简单相 关,是指一个因变量与一个自变量 之间的依存关系。复相关又称多元 相关,是指一个因变量与两个或两 个以上自变量之间的复杂依存关系。
3、按相关形式分为线性相关和非 线性相关
从相关图上观察:观察的样本点的 分布近似表现为直线形式,即观察点近 似地分布于一直线的两边,则称此种相 关为直线相关或线性相关。如果这些样 本点近似地表现为一条曲线,则称这种 相关为曲线相关或非线性相关(curved relationship).
不确定性的统计关系 —相关关系
Y= f(X)+ε (ε为随机变量)
在这种关系中,变量之间的关系值 是随机的,当一个(或几个)变量的值 确定以后,另一变量的值虽然与它(们) 有关,但却不能完全确定。然而,它们
之间又遵循一定的统计规律。
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)
之间的关系
▪ 商品销售额(y)与广告费支出(x)
▲相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。
▲相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。
例题1: 经验表明:商场利润额与 其销售额之间存在相关关系。下表为 某市12家百货公司的销售额与利润额 统计表,试计算其相关系数。
(一)回归分析与相关分析的关系
回归分析与相关分析是研究现象 之间相互关系的两种基本方法。
区别:
1、相关分析研究两个变量之间相关的 方向和相关的密切程度。但是相关分析不 能指出两变量相互关系的具体形式,也无 法从一个变量的变化来推测另一个变量的 变化关系。
2、按研究变量多少分为单相关和 复相关
单相关即一元相关,亦称简单相 关,是指一个因变量与一个自变量 之间的依存关系。复相关又称多元 相关,是指一个因变量与两个或两 个以上自变量之间的复杂依存关系。
3、按相关形式分为线性相关和非 线性相关
从相关图上观察:观察的样本点的 分布近似表现为直线形式,即观察点近 似地分布于一直线的两边,则称此种相 关为直线相关或线性相关。如果这些样 本点近似地表现为一条曲线,则称这种 相关为曲线相关或非线性相关(curved relationship).
不确定性的统计关系 —相关关系
Y= f(X)+ε (ε为随机变量)
在这种关系中,变量之间的关系值 是随机的,当一个(或几个)变量的值 确定以后,另一变量的值虽然与它(们) 有关,但却不能完全确定。然而,它们
之间又遵循一定的统计规律。
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)
之间的关系
▪ 商品销售额(y)与广告费支出(x)
▲相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。
▲相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。
例题1: 经验表明:商场利润额与 其销售额之间存在相关关系。下表为 某市12家百货公司的销售额与利润额 统计表,试计算其相关系数。
《统计学原理与应用》课件第07章 相关与回归分析

74.4 172.0 248.0 418.0 575.0 805.2 972.0 1,280.0
104,214
4,544.6
统计学基础
第七章 相关与回归分析
根据计算结果可知:Βιβλιοθήκη x 36.4y 880
n8
x2 207.54
y2 104,214
xy 4,544.6
Fundamentals of Statistics
n x2 ( x)2 n y2 ( y)2
公式7—3
公式7—3是实际工作中使用较多的计算公式
Fundamentals of Statistics
统计学基础
第七章 相关与回归分析
(四)相关系数的运用
(1)相关系数有正负号,分别表示正相关和负相关。
(2)相关系数的取值范围在绝对值的0 之1 间。其值大小 反映两变量之间相关的密切程度。
统计学基础
第七章 相关与回归分析
二、相关关系的种类
3.相关关系按照相关的方向分为正相关和负相 关 正相关:是指一个变量的数量变动和另一个变 量的数量变动方向一致.
负相关:当一个变量的数量变动与另一个变量 的数量变动方向相反时,称为负相关.
Fundamentals of Statistics
统计学基础
统计学基础
第七章 相关与回归分析
二、相关关系的测定 (一)相关系数的含义:
相关系数是在直线相关的条件下,用来说明两个 变量之间相关关系密切程度的统计分析指标。
Fundamentals of Statistics
统计学基础
第七章 相关与回归分析
(二)相关系数的作用
1.说明直线相关条件下,两变量的相关关系的密切程 度的高低. (见教材第159页说明)
统计学课件之线性相关与回归

➢ 线性关系是否存在、关系的密切程度 以及方向性
back
➢ 积差相关系数 ➢ 用ρ(总体)或r(样本)表示 ➢ 用来对线性关系的密切程度与方向
进行统计描述的指标
back
r lxy x xy y
lxxlyy
x x2 y y2
其中,lxy是x与y的离均差积和
lxx与lyy分别是x与y的离均差平方和
0.14
2
0.25
0.25
3
0.23
0.28
4
0.24
0.25
5
0.26
0.28
6
0.09
0.10
7
0.25
0.27
8
0.06
0.09
9
0.23
0.24
10
0.33
0.30
11
0.15
0.16
12
0.04
0.05
13
0.20
0.20
14
0.34
0.32
15
0.22
0.24 back
➢ 针对上例,请做线性回归分析。 ➢ a = 0.0319 b = 0.8973 ➢ F = MS回/ MS残 = 295.46 tb = 17.189 ➢ R2 = 0.9578 = ( 0.9787 )^2 = r^2
➢ 简单回归
➢ 研究两个连续性变量x与y之间的数量变化 依存关系
➢ 要求——y是服从正态分布的随机变量, 而对x无太严格要求
➢ 主要任务——找出合适的直线回归方程, 以确定一条最接近于各实测点的直线,描 述两个变量之间的线性回归关系。
back
➢ yˆ相当于y的计算值,与y的实测值不完全相同
back
➢ 积差相关系数 ➢ 用ρ(总体)或r(样本)表示 ➢ 用来对线性关系的密切程度与方向
进行统计描述的指标
back
r lxy x xy y
lxxlyy
x x2 y y2
其中,lxy是x与y的离均差积和
lxx与lyy分别是x与y的离均差平方和
0.14
2
0.25
0.25
3
0.23
0.28
4
0.24
0.25
5
0.26
0.28
6
0.09
0.10
7
0.25
0.27
8
0.06
0.09
9
0.23
0.24
10
0.33
0.30
11
0.15
0.16
12
0.04
0.05
13
0.20
0.20
14
0.34
0.32
15
0.22
0.24 back
➢ 针对上例,请做线性回归分析。 ➢ a = 0.0319 b = 0.8973 ➢ F = MS回/ MS残 = 295.46 tb = 17.189 ➢ R2 = 0.9578 = ( 0.9787 )^2 = r^2
➢ 简单回归
➢ 研究两个连续性变量x与y之间的数量变化 依存关系
➢ 要求——y是服从正态分布的随机变量, 而对x无太严格要求
➢ 主要任务——找出合适的直线回归方程, 以确定一条最接近于各实测点的直线,描 述两个变量之间的线性回归关系。
back
➢ yˆ相当于y的计算值,与y的实测值不完全相同
生物统计学课件 7、回归与相关分析

第一节 直线回归
㈡数据整理
由原始数据算出一级数据6个: ΣX=1182 ΣY=32650 ΣXY=3252610 320
ΣX 2=118112 ΣY 2=896696700 n=12
Байду номын сангаас
再由一级数据算出二级数据5个:
SSX= ΣX 2 - (ΣX) 2 /n=1685.00 SSY= ΣY 2 - (ΣY ) 2 /n =831491.67 SP= ΣXY - ΣX ΣY /n =36585.00
280
80
X=ΣX/n =98.5 Ӯ =ΣY/n =2720.8333
㈢计算三级数据
b = SP/ SSX =21.7122 =36585÷1685
a= Ӯ -bX=582.1816 =2720.8333- 21.7122×98.5 得所求直线回归方程为:
y = 582.1816 + 21.7122 x
第一节 直线回归
二、建立直线回归方程
340
例7.1 在四川白鹅的生产性能研究中, 得到如下一组n = 12(只)关于雏鹅重(g) 与70日龄重(10g)的关系的数据,其结 300 果如下表,试予分析。
解 ㈠描散点图
本例已知雏鹅70日龄重随雏鹅重的变 260 化而变化,且不可逆;又据散点图反映的 趋势来看,在80—120g的重量范围, 70日 龄重随雏鹅重呈上升的线性变化关系。
程 y = 582.1816 + 21.7122 x可用于预测。
而是多元回归。
第二节 直线相关
一、相关的含义
二、相关系数
如果两个变量X和Y,总是X和Y 相互 前已述及,具有线性回归关系的
制约、平行变化,则称X和Y为相关关系。 双变量中,Y变量的总变异量分解为:
第七相关与回归优秀课件

一.相关的分类
(一)按相关的性质分类 1.正相关:两种测量值变动方向相同 2.负相关:两种测量值变动方向相反 3.零相关:两种测量值变动方向无规
律
一.相关的分类
(二)按相关的形式划分 1.直线相关:直线或线性相关 2.曲线相关:曲线或非线性相关
二.散点图
设研究变量为X和Y,以直角坐标 系的横轴表示X变量,以纵轴表示Y变 量。根据对每一个个体的测量,把每 一个个体在这两种测量上的取值用直 角坐标系中的一个点表示,即可以得 到散点图。在散点图中可以粗略的看 出两个变量相关关系的性质。
3.取值范围 [-1,1]
r 值为正 ——正相关 为负 ——负相关 |r|=1 --- 完全相关 |r|=0 --- 零相关
三.相关系数correlation coefficient
4.r的使用条件 (1)要求成对的数据,而这成对的数据应该
来自于同一总体或同一样本 (2)两组变量都是连续型随机变量 (3)数据的对数n最好不要小于30 (4)两组变量的分布应该近似于正态分布 (5)两组变量之间的关系应该是直线性的
例2 用例1中的数据计算相关系数
学号 语文 数学
学号 语文 数学
1 5 12
9 10 20
2 8 15
10 9 17
3 7 14
11 7 15
4 9 18
12 7 16
5 10 19
13 9 16
6 8 18
14 6 13
7 6 14
15 8 16
8 6 17
例3 表中是10名中学生身高与体重的测量结 果,问身高与体重的关系如何?
例9 根据例1的15对数据,求回归方程
随机抽取15名学生的语文测验分数和算术测验分数, 语文分数为10分制,数学分数为20分制。画出这两个测 验分数的相关散点图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、正相关:当一个变量的数值增加或减少时,另一个变量的 数值也相应增加或减少。(二者变动方向一致,即同增同减)
2、负相关:当一个变量的数值增加或减少时,另一个变量的 数值则减少或增加。(二者变动方向相反,即一增一减)
6
第七章 相关与回归分析
STAT
(三)按相关的形式可分为 1、**线性相关(直线相关):一个变量对另一个变量的影响 表现为直线的形式。进一步可区分为正相关与负相关。 2、非线性相关(曲线相关):一个变量对另一个变量的影响 表现为曲线的形式。非线性相关一般不区分方向。 (四)按影响因素的多少可区分为 1、**单(简单)相关:两个变量之间的相关关系; 2、复(多元)相关:三个或三个以上的变量之间的相关关系。 [例]:体重与身高、食欲、睡眠时间之间的关系 3、偏相关:在三个或三个以上的变量中,假定其他变量不变 只测定其中两个变量的相关关系。
7
第七章 相关与回归分析
STAT
三、相关分析的特点
1、相关分析的两个变量是对等的,不必区分自变量和因 变量;
2、只能算出一个相关系数; 3、相关分析的两个变量都是随机变量。
8
第二节 相关关系的测定 一、相关图表 (一)相关表
相关表是把具有相关关系的两种变量的数值,相对应地有 顺序地排列在一张表上。
1、 简单相关表:原始资料未经分组 某月企业销售收入与销售利润相关表
企业编号 销售收入(万元) 销售利润(万元)
1
10
1.8
2
20
2.0
3
24
2.4
4
30
3.5
5
40
5.0
2、单变量分组相关表:只对一个变量分组
线 性 正 Leabharlann 关9第七章 相关与回归分析
STAT
3、双变量分组相关表:同时对两个变量都进行分组而制成的 相关表。
相关关系的绝对值 r 在:
0.3以下,为微弱线性相关; 0.3—0.5,为低度线性相关; 0.5—0.8,为显著(中度)线性相关, 0.8以上为高度线性相关。
13
例:某企业某商品在过去八年的价格与相应的销售资料见下表, 试分析该商品销售量与价格的相关关系。
销售 (吨 )x
90 94 75 58 47 70 60 45 539
xy n
xy f f
12
相关系数的取值范围: 1r1
当r=0时,表明两个变量之间完全不相关,即不存在线性相 关关系;
当r= 1时,相关关系转为函数关系,称为完全相关;
当[-1<r<1]时,表明两个变量之间不完全相关; 当[-1<r<0]时,表明两个变量之间是负相关; 当[0<r<1]时,表明两个变量之间是正相关. r 越接近于1(+1或-1),表明相关关系越强, r 越接近于0,表 明相关关系越弱。
n
x2
(
2
x)
n y2 ( y)2
8 3733 539 60
0.9864 (高度负相关 )
8 38659 539 2 8 492 60 2
即商品的价格与销售量 在一般情况下存在着一 定的负相关 .
价格上升 , 其销量下降 .
(三)相关系数r的计算公式中,协方差与变量标准差的作用
1、协方差(积差平均数)的意义(略)
30 家同类企业的有关资料
单位成本 y
产量 x(件)
合计
(元/件)
20 30 40 50 80
18
4 ————4
16
4 3 1 1 —9
15
1 2 3 3 1 10
14
—— 1 2 4 7
合计
9 5 5 6 5 30
(二)相关图:以横轴代表X,纵轴代表Y,绘制散点图。
不足之处:难以量化,反映相关程度不精确。
r
n
( x x )( y y ) (公式 2 )
(x x)2 (y y)2
(x x)2 (y y)2
n
n
11
L L L 设 : ( x x )( y y ), ( x x ) 2 , ( y y ) 2
xy
xx
yy
则 : r ( x x )( y y ) L xy (公式 3)
5
第七章 相关与回归分析
STAT
二、相关关系的种类
(一)按相关的程度分
1、完全相关:一个变量的数量变化由另一个变量的数量变化 所唯一确定(函数关系);
2、不相关:两个变量彼此的数量变化互相独立(没有关系); 3、不完全相关:两个变量之间的关系介于完全相关和不相关 之间(相关关系有关系,但不确定)。 (二)按相关的方向分
(x x)2 (y y)2
L xx L yy
L 或 : r
xy (公式 4 )
n x y
r
xy
n xy x y
x y
n
x2
(
2
x)
n y2 ( y)2
(公式 5 )
r
x y xy x y 2 (x)2 2 (y)2
xy x y (公式
x
y
6
)
xy
xy
(1)显示x与y是正相关还是负相关
(x x)(y y)
r
xy
n
x
y
(x x)2 (y y)2
(x x)(y y) (x x)2 (y y)2
n
n
15
第七章 相关与回归分析
STAT
直线相关条件下:x与y分布在第一、三象限时,协方差为
10
二、(线性)相关系数
(一)定义:反映变量x和变量y之间线性相关方向与密切程度 的统计指标。注:线性相关 相关系数r;曲线相关 相关 指数R。
(二)积差法计算公式:
r
xy x
y
(公式
1),
xy
x, y
x数列与 y数列的协方差 x数列 , y数列的标准差
( x x )( y y )
2011
第七章 相关与回归分析
STAT
(四)相关分析与回归分析的区别与联系
区别:相关分析是研究变量之间相关程度大小的统计方法, 回归分析是通过函数关系来表达变量之间数量关系的统计方法。
联系:相关分析与回归分析是互相补充、密切联系的。相 关分析需要依靠回归分析来表明现象数量变化的一般关系,而 回归分析则建立在相关分析的基础上,只有在现象之间存在高 度相关时,进行回归分析求其现象数量变化的一般关系才有意 义。
量价
格
(万 元 /吨 )y
5
4
6
9
10
7
8
11
60
xy
450 376 450 522 470 490 480 495 3733
x2
8100 8836 5625 3364 2209 4900 3600 2025 38659
y2
25 16 36 81 100 49 64 121 492
14
r
n xy x y
2、负相关:当一个变量的数值增加或减少时,另一个变量的 数值则减少或增加。(二者变动方向相反,即一增一减)
6
第七章 相关与回归分析
STAT
(三)按相关的形式可分为 1、**线性相关(直线相关):一个变量对另一个变量的影响 表现为直线的形式。进一步可区分为正相关与负相关。 2、非线性相关(曲线相关):一个变量对另一个变量的影响 表现为曲线的形式。非线性相关一般不区分方向。 (四)按影响因素的多少可区分为 1、**单(简单)相关:两个变量之间的相关关系; 2、复(多元)相关:三个或三个以上的变量之间的相关关系。 [例]:体重与身高、食欲、睡眠时间之间的关系 3、偏相关:在三个或三个以上的变量中,假定其他变量不变 只测定其中两个变量的相关关系。
7
第七章 相关与回归分析
STAT
三、相关分析的特点
1、相关分析的两个变量是对等的,不必区分自变量和因 变量;
2、只能算出一个相关系数; 3、相关分析的两个变量都是随机变量。
8
第二节 相关关系的测定 一、相关图表 (一)相关表
相关表是把具有相关关系的两种变量的数值,相对应地有 顺序地排列在一张表上。
1、 简单相关表:原始资料未经分组 某月企业销售收入与销售利润相关表
企业编号 销售收入(万元) 销售利润(万元)
1
10
1.8
2
20
2.0
3
24
2.4
4
30
3.5
5
40
5.0
2、单变量分组相关表:只对一个变量分组
线 性 正 Leabharlann 关9第七章 相关与回归分析
STAT
3、双变量分组相关表:同时对两个变量都进行分组而制成的 相关表。
相关关系的绝对值 r 在:
0.3以下,为微弱线性相关; 0.3—0.5,为低度线性相关; 0.5—0.8,为显著(中度)线性相关, 0.8以上为高度线性相关。
13
例:某企业某商品在过去八年的价格与相应的销售资料见下表, 试分析该商品销售量与价格的相关关系。
销售 (吨 )x
90 94 75 58 47 70 60 45 539
xy n
xy f f
12
相关系数的取值范围: 1r1
当r=0时,表明两个变量之间完全不相关,即不存在线性相 关关系;
当r= 1时,相关关系转为函数关系,称为完全相关;
当[-1<r<1]时,表明两个变量之间不完全相关; 当[-1<r<0]时,表明两个变量之间是负相关; 当[0<r<1]时,表明两个变量之间是正相关. r 越接近于1(+1或-1),表明相关关系越强, r 越接近于0,表 明相关关系越弱。
n
x2
(
2
x)
n y2 ( y)2
8 3733 539 60
0.9864 (高度负相关 )
8 38659 539 2 8 492 60 2
即商品的价格与销售量 在一般情况下存在着一 定的负相关 .
价格上升 , 其销量下降 .
(三)相关系数r的计算公式中,协方差与变量标准差的作用
1、协方差(积差平均数)的意义(略)
30 家同类企业的有关资料
单位成本 y
产量 x(件)
合计
(元/件)
20 30 40 50 80
18
4 ————4
16
4 3 1 1 —9
15
1 2 3 3 1 10
14
—— 1 2 4 7
合计
9 5 5 6 5 30
(二)相关图:以横轴代表X,纵轴代表Y,绘制散点图。
不足之处:难以量化,反映相关程度不精确。
r
n
( x x )( y y ) (公式 2 )
(x x)2 (y y)2
(x x)2 (y y)2
n
n
11
L L L 设 : ( x x )( y y ), ( x x ) 2 , ( y y ) 2
xy
xx
yy
则 : r ( x x )( y y ) L xy (公式 3)
5
第七章 相关与回归分析
STAT
二、相关关系的种类
(一)按相关的程度分
1、完全相关:一个变量的数量变化由另一个变量的数量变化 所唯一确定(函数关系);
2、不相关:两个变量彼此的数量变化互相独立(没有关系); 3、不完全相关:两个变量之间的关系介于完全相关和不相关 之间(相关关系有关系,但不确定)。 (二)按相关的方向分
(x x)2 (y y)2
L xx L yy
L 或 : r
xy (公式 4 )
n x y
r
xy
n xy x y
x y
n
x2
(
2
x)
n y2 ( y)2
(公式 5 )
r
x y xy x y 2 (x)2 2 (y)2
xy x y (公式
x
y
6
)
xy
xy
(1)显示x与y是正相关还是负相关
(x x)(y y)
r
xy
n
x
y
(x x)2 (y y)2
(x x)(y y) (x x)2 (y y)2
n
n
15
第七章 相关与回归分析
STAT
直线相关条件下:x与y分布在第一、三象限时,协方差为
10
二、(线性)相关系数
(一)定义:反映变量x和变量y之间线性相关方向与密切程度 的统计指标。注:线性相关 相关系数r;曲线相关 相关 指数R。
(二)积差法计算公式:
r
xy x
y
(公式
1),
xy
x, y
x数列与 y数列的协方差 x数列 , y数列的标准差
( x x )( y y )
2011
第七章 相关与回归分析
STAT
(四)相关分析与回归分析的区别与联系
区别:相关分析是研究变量之间相关程度大小的统计方法, 回归分析是通过函数关系来表达变量之间数量关系的统计方法。
联系:相关分析与回归分析是互相补充、密切联系的。相 关分析需要依靠回归分析来表明现象数量变化的一般关系,而 回归分析则建立在相关分析的基础上,只有在现象之间存在高 度相关时,进行回归分析求其现象数量变化的一般关系才有意 义。
量价
格
(万 元 /吨 )y
5
4
6
9
10
7
8
11
60
xy
450 376 450 522 470 490 480 495 3733
x2
8100 8836 5625 3364 2209 4900 3600 2025 38659
y2
25 16 36 81 100 49 64 121 492
14
r
n xy x y