第8章相关与回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

判定系数
回归直线与各观测数据的接近程度称为回归直线的拟合优度(goodness of fit)。 度量回归直线的拟合优度最常用的指标是判定系数(又称可决系数)。 该指标是建立在对总离差平方和进行分解的基础之上的。
r
n X tY t X t Y t
(n X t2( X t)2(n Y t2( Y t)2)
相关系数r 的特征
r的取值介于-1与1之间。 当r=0时,只是表明两个变量之间不存在线性关系,它并不意味着X与Y之间不存在其他类型 的相关关系。 当r>0时,X与Y为正相关;当r<0时,X与Y为负相关。 当r=1时,称为完全正相关,而r=-1时,称为完全负相关。
章相关与回归分析
学习目标
明确什么是相关关系和回归分析。 掌握单相关系数的计算方法和含义。 掌握一元线性回归方程的参数估计方法。 掌握一元线性回归方程的检验方法。 了解多元线性回归方程的参数估计和检验方法。 了解非线性回归方程的参数估计方法。
“相关”的概念最初是由进化论创始人达尔文(Charles Darwin,1809-1882)于1859年 在《物种起源》中提出的
的关系可表示为 y = p x (p 为单价) – 圆的面积(S)与半径之间的关系: S =
R2
相关关系

变量间关系不能用函数关系精确表达

一个变量的取值不能由另一个变量唯一确定
y
– 商品销售额(y)与广告费支出(x)之间的关 系
– 收入水平(y)与受教育程度(x)之间的关系
x
函数关系可以用数学分析的方法去研究,而相关关系必须借助于统计学中的相关与回归 分析方法。
回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系 进行测定,确定一个回归方程,根据这个回归方程可以从已知量来推测未知量,从而为估算 和预测提供了一个重要的方法。
二、 一元线性回归模型
描述y 如何依赖于 x 和误差项 的方程称为回归函数。 总体回归函数:
y = b0 + b1 x + b0 和 b1 称为模型的参数 样本回归函数:
Q et2 (Yt -Yˆt )2 (Yt bˆ1 bˆ2Xt )2
一元线性回归方程的参数估计
b2
nXtYt XtYt nXt2 (Xt)2
b b b
1 Y t/n 2 X t/n Y 2X
一元线性回归模型的检验
拟合优度的评价 判定系数 估计标准误差 显著性检验 F检验 t检验
完全正线性相关
正线性相关
完全负线性相关
负线性相关
非线性相关
wk.baidu.com
不相关
三、相关分析的主要内容
u判断现象之间有无相关关系 u判断相关关系的表现形式和密切程度
第二节 相关分析的方法
1. 定性分析 2. 相关表 3. 相关图
——散点图
二、相关关系的测定
单相关分析是对两个变量之间的相关程度进行分析。单相关分析所用的指标称为单相关系数 (简称相关系数)。 通常以ρ表示总体的相关系数,以r表示样本的相关系数。
1885年,达尔文的表弟高尔登(Francis Galton,1822-1911)在英国皇家学会上发表了 关于身长遗传中相关现象的演说,首次赋予“相关”一词以新的涵义
1885年,高尔登在英国皇家学会上发表了关于回归现象的演说,并于1886年发表的《在遗 传的身长中向中等身长的回归》论文中,正式提出回归概念
1886年,高尔登在一篇《家属在身长方面的类似》的论文中,首次提出“相关系数”
统计应用:父代与子代的关系
1875年,Galton利用豌豆试验来确定尺寸的遗传规律。他挑选了7组不同尺寸的豌豆,并说服英 国不同地区的朋友每一组种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌豆种子(子代) 进行比较。
二、相关关系的类型
按所研究的变量多少可分为单相关、复相关和偏相关。 按相关的方向可分为正相关和负相关。 按相关的形式可分为线性相关和非线性相关。 按相关的程度可分为完全相关、不完全相关和不相关。
相关关系的类型 相关关系
完全相关
不完全相关
线性相关
非线性相关
不相关
Scatter Diagram (散点图)
复相关系数和偏相关系数
复相关系数反映一个变量Y与其他多个变量X1,X2,…Xk之间的线性相关程度 偏相关系数 反映在X2,…Xk不变的情况下,变量Y与X1之间的线性相关程度
第三节 简单线性回归分析
p回归分析的内容 p回归分析的特点 p相关分析与回归分析的区别与联系
相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的 具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。
当一个变量取一定数值时,另一个变量有确定值与之相对应,这种关系称为确定性的函数关 系。 当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在 一定的范围内变化,这种关系称为不确定性的相关关系。
变量间的关系: 函数关系
y
x
是一一对应的确定关系
记为 y = f (x), x 称为自变量,y 称为因变量 – 某种商品的销售额(y)与销售量(x)之间
他发现,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代。这一现象他称 为“返祖”。
一个总体中在某一时期具有某一极端特征的个体在未来的某一时期将减弱它的极端性。
第一节 相关关系
函数关系与相关关系 相关关系的类型 相关分析与回归分析 单相关系数 复相关系数和偏相关系数
一、函数关系与相关关系
Co(vX,Y)
Va(rX)Va(rY)
总体相关系数的定义式是:
Cov(X,Y)
Var(X)Var(Y)
协方差表示的是两个变量总体误差的方差,这与只表示一个变量误差的方差不同。
C o v ( X ,Y ) E [ ( X E ( X ) ( Y E ( Y ) ]
样本相关系数的定义公式是:
yt bˆ0+bˆ1x+et
一元线性回归模型的估计
最小二乘法:通过使残差平方和最小来估计回归系数的一种方法。 德国著名数学家、物理学家和天文学家高斯(Karl Gauss)是最小二乘法(最小平方法)的 创立者,他在1809年出版的《关于太阳圆周曲线的天体运动理论》一书中,首次提出用最小 平方法的原理确定行星轨道。
相关文档
最新文档