应用统计学 第8章 相关分析与回归分析
2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案一、单选题1.相关分析研究的是( A )A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。
A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。
A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零表明两变量(B)。
A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是(B)。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6.时间数列自身相关是指( C )。
A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。
A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。
A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9.相关分析对资料的要求是(A)。
A.两变量均为随机的B.两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.回归分析中简单回归是指(D)。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性回归D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A )A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有(ABD )。
MBA管理统计学(中科大万红燕)第八章回归分析和相关分析

2010-7-23
销售额
12
第二节 相关分析
例1解:
xi = 2139, ∑ yi = 11966, ∑ xi2 = 179291 ∑ yi2 = 6947974, ∑ xi y i = 1055391, n = 30 ∑ r= n∑ xi yi ∑ xi ∑ yi (∑ xi ) 2 n∑ yi2 (∑ yi ) 2
2010-7-23
4
第一节 相关与回归分析的基本概念
三.相关分析与回归分析
相关分析和回归分析是研究现象之间相关关系 的两种基本方法. 相关分析:研究两个或两个以上随机变量之间 相关关系密切程度和相关方向的统计分析方法. 回归分析:研究某一随机变量(因变量)与其 他一个或几个变量(自变量)之间数量变动关 系形式的统计分析方法.
一.一元线性回归模型的建立 设因变量y(通常是随机变量)和一个自变量 (非随机变量)X之间有某种相关关系.在x的 不全相同的取值点x1,x2,…,xn作为独立观 察得到y的个观察值y1,y2,… ,yn记为( x1, y1 )( x2 , y2 ), … ,(xn , yn ). 根据这组数据寻求X与Y之间关系. 设一元线性回归模型为:yi=a+bxi+ ei
r=0.955248
2010-7-23 14
第二节 相关分析
25000 税收收入(亿元 亿元) 20000 15000 10000 5000 0
0 20000 40000 60000 80000 100000 120000 140000
GDP(亿元)
2010-7-23
15
第二节 相关分析
二.有序数据的相关系数(等级相关系数)
2010-7-23
8
第8章_直线相关与回归 R

b = r⋅
Sy Sx
(3)
a = y − bx
例:数据同前,(1)计算r (2)求直线回归方程 r = 0.997 Sx = 1.5811 Sy = 13.9642 b = 8.805 a = -2.415
y = − 2 . 4 + 8 . 8x
∧
书 P125 例7.1 根据下表资料,试建立直线回归方程
温度
直线回归的一般研究步骤: 1. 建立直线回归方差.
天数
2. 用F检验、t 检验方法 确定 直线关系的显著性. 3. 区间估计
1、直线回归方程的建立
直观证明 yi = a + BC yi = a + bxi 性质 (1)b=0时,表示y的变化与x的取值 无关; 两变量间不存在直线回归关系 (2) b>0 表示正相关 BC = b·xi
∑ (x
− x y − y (n − 1 )S x S y
Sr = 0.04469
)(
)
r = 0.997 t0.05 = 3.182
t = 22.31
t0.01 = 5.841 ∴│t│>t0.01
∴差异极显著
第三节. 相关系数的显著性检验
(1). 研究意义 由于抽样误差存在,从总体相关系数(ρ)=0的双变量 正态总体中抽出的。样本相关系数并不一定为0 ,为判断 r 所代表的总体是否存在直线相关,必须进行r 的显著性 检验。 1、 t 检验原理 r − ρ r t = ρ= 0 时 t = 服从df = n-2的t分布 Sr Sr (Sr: 相关系数的标准误) 原理: 测定实际r值是否与总体ρ=0相同 (即通过假设检验,测定r来自ρ=0总体的概率)
统计学第八章练习题

第八章相关与回归分析一、填空题8.1.1客观现象之间的数量联系可以归纳为两种不同的类型,一种是_____________ ,另一种是__________________ 。
8.1.2回归分析中对相互联系的两个或多个变量区分为__________________ 和___________ 。
8.1.3 _____________ 是指变量之间存在的严格确定的依存关系。
8.1.4 变量之间客观存在的非严格确定的依存关系,称为_____________________ 。
8.1.5按 ____________ 的多少不同,相关关系可分为单相关、复相关和偏相关。
8.1.6两个现象的相关,即一个变量对另一个变量的相关关系,称为。
8.1.7在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为____________________________ 。
8.1.8按变量之间相关关系的 _______________ 不同,可分为完全相关、不完全相关和不相关。
8.1.9按相关关系的 ____________________ 不同可分为线性相关和非线性相关。
8.1.10 线性相关中按_________________ 可分为正相关和负相关。
8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为__________________ 。
8.1.12当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为。
8.1.13当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为。
8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为__________________ 。
8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为_____________________ 。
统计学习题答案 第8章 相关与回归分析【精选文档】

6.表中给出y 对2x 和3x 回归的结果:
离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14
(1) 该回归分析中样本容量是多少? (2) 计算RSS ;
(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;
(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对
y 的贡献为多少?
解:(1)该回归分析中样本容量是14+1=15
(2)计算RSS=66042-65965=77
ESS 的自由度为k —1=2,RSS 的自由度 n-k=15—3=12 (3)计算:可决系数 2
65965/660420.9988R == 修正的可决系数 2151
1(10.9988)0.9986153
R -=-
⨯-=- (4)检验X2和X3对Y 是否有显著影响
/(1)65965/232982
5140.11/()77/12 6.4166
ESS k F RSS n k -=
===-
(5) F 统计量远比F 临界值大,说明X2和X3联合起来对Y 有显著影响,但并不能确定X2和X3各自对Y 的贡献为多少。
7. 在计算一元线性回归方程时,已得到以下结果:
试根据此结果,填写下表的空格:
来 源 平方和 自由度 方差 来自回归 2179.56
来自残差 99。
11 22 总离差平方和
2278。
67。
统计学8ppt课件

商品销售量q(百件)
商品价格p(元)
33
8
32.5
9
26
11
27
12
25
12.5
23.5
13
21
14
16.5
16
第
17
八
合计 219.5
章
17 112.5
pq 264 292.5 286 324 312.5 305.5 294 264 255 2597.5
P2 64 81 121 144 156.25 169 196 256 289 1476.25
原
理
▪ 回归参数估计 ▪ 方程拟合效果评价 ▪ 回归参数的推断
第 八 章
返回本章首页
统
计 学
第二节 简单线性相关分析
原
理
➢ 一、散点图和相关表 ➢ 二、相关系数的测定与应用 ➢ 三、相关系数的密切程度
第 八 章
统
计 学
一、散点图和相关表
原
理
例:近年来国家教育部决定将各高校的后勤社会化。 某从事饮食业的企业家认为这是一个很好的投资机 会,他得到十组高校人数与周边饭店的季销售额的 数据资料,并想根据高校的数据决策其投资规模。
2
-2
3
-1
4
0
5
1
6
2
7
3
28
0
游客(万人) 100 112 125 140 155 168 180 980
t2
1
9
4
4
9
1
16
0
25
1
36
4
49
9
140
28
ty
第8章 直线回归与相关

散点图可直观地,定性地表示了两个变量之间 散点图可直观地, 的关系.为了探讨它们之间的规律性, 的关系.为了探讨它们之间的规律性,还必须 根据观测值将其内在关系定量地表达出来. 根据观测值将其内在关系定量地表达出来.
上一张 下一张 主 页 退 出
若呈因果关系的两个相关变量y 依变量) 若呈因果关系的两个相关变量y(依变量)与 x(自变量)间的关系是直线关系,,那么,根 自变量)间的关系是直线关系,,那么, ,,那么 据n对观测值所描出的散点图,如图6-1(b)和 对观测值所描出的散点图,如图6 所示. 图6-1(e)所示. 由于依变量y 由于依变量y的实际观测值总是带有随机误 差,因而依变量y的实际观测值yi可用自变量x的 因而依变量y的实际观测值y 可用自变量x 实际观测值x 表示为: 实际观测值xi表示为:
统计学上采用相关分析 统计学上采用相关分析 ( correlation analysis)来研究呈平行关系相关变量之间 analysis)来研究呈平行关系相关变量之间 的关系. 的关系. 对两个变量间的直线关系进行相关分析 称为简单相关分析 也叫直线相关分析 简单相关分析( 直线相关分析); 称为简单相关分析(也叫直线相关分析); 对多个变量进行相关分析时,研究一个 对多个变量进行相关分析时, 变量与多个变量间的线性相关称为复相关 变量与多个变量间的线性相关称为复相关 分析; 分析;研究其余变量保持不变的情况下两 个变量间的线性相关称为偏相关分析 偏相关分析. 个变量间的线性相关称为偏相关分析.
二, 直线回归
1 直线回归方程的建立 2.1.1数学模型 2.1.1数学模型
对于两个相关变量,一个变量用x表示,另 对于两个相关变量,一个变量用x表示, 一个变量用y表示, 一个变量用y表示,如果通过试验或调查获得两 个变量的n对观测值:( 个变量的n对观测值:(x1,y1),(x2, :(x ),(x y2),……,(xn,yn) ),……,( ,(x 为了直观地看出x 为了直观地看出x和y间的变化趋势,可将 间的变化趋势, 每一对观测值在平面直角坐标系中描点, 每一对观测值在平面直角坐标系中描点,作出散 见图6 点图 (见图6-1).
统计学第八章题目

一.单项选择题1、用于测定两个变量之间密切程度的方法是〔 D 〕.A、定性判断B、相关表C、相关图D、相关系数2、产品产量与单位成本的相关系数是—0.95,单位成本与利润率的相关系数是0.90,产量与利润的相关系数是0.08,因此〔 C〕.A、产量与利润的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、无法判断哪对变量的相关程度最高3、相关系数的取值X围是〔 D 〕.A、0≤r≤1B、-1≤r≤0C、r>0D、-1≤r≤14、变量x与y之间的负相关是指〔C 〕.A、x值增大时y值也随之增大B、x值减少时y值也随之减少C、x值增大时y值随之减少,或x值减少时y值随之增大D、y的取值几乎不受x取值的影响5、两个变量之间的相关关系称为〔 B 〕.A、复相关B、单相关C、曲线相关D、直线相关6、、正方形的边长与周长的相关系数为〔 A 〕.A、1B、-1C、0D、无法计算7、在一元线性回归方程中,回归系数b的含义是< B >.A 、当x=0时,y 的平均值B 、当x 变动一个单位时,y 的平均变动数额C 、当x 变动一个单位时,y 增加的总数额D 、当y 变动一个单位时,x 的平均变动数额8、常用的求解一元线性回归方程的方法是< B >.A 、相关系数法B 、最小平方法C 、误差绝对值最小法D 、误差和最小法9、下列回归方程与相关系数的对应式中,错误的是〔 C 〕A 、89.0,5.2170ˆ-=-=r x yB 、94.0,8.35ˆ-=--=r x yC 、78.0,5.036ˆ-=+=r x yD 、98.0,9.25ˆ=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y的方差为去100,则二者的相关系数的值为〔 B 〕.A 、0.75B 、-0.75C 、0.1D 、-0.111、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b的值为〔 B 〕.A 、0.94B 、-0.94C 、0.6D 、-0.612、若相关系数为正值,则回归系数的值〔 B 〕.A 、为负B 、为正C 、视a 的符号而定D 、不能确定13、回归估计标准误差是说明〔 C 〕的指标.A 、平均数代表性B 、现象之间相关程度C、回归直线代表性D、抽样误差平均程度14、已知变量x与y线性相关,x与y的协方差为-60,x的方差为100,y的方差为去64,建立了y依x的回归方程,则回归估计标准误差的值可能为〔 A 〕.A.-3.8B.0C.4.7D.8.915、进行回归分析,要求两个变量〔 C 〕.A、都是随机的B、都不是随机的C、一个是随机的,一个是给定的D、随机或不随机都可以二.多项选择题1.呈相关关系的各变量之间〔 A、B、D 〕A.一定存在严格的依存关系B.存在关系,但不确定C.存在着明显的因果关系D.存在着不固定的依存关系D.以上说法都不对2.直线积差相关系数可以表明两个变量之间的〔D、E 〕A.线性相关程度 B 因果关系 C.变异程度D.相关方向E.曲线相关密切程度3.可用来判断变量之间相关方向的指标有〔A、B〕A.相关系数B.回归系数C.回归方程参数D.估计标准误差E.x,y的平均数4.如果相关系数为0,则两变量〔 A、D 〕A.无直线相关B.呈负线性相关C.呈正线性相关D.可能存在曲线相关E.无线性相关,也无非线性相关5.回归系数和相关系数〔 A、C 〕A.一个为正值,另一个肯定也为正值B.一个为正值,另一个肯定为负值C.前者的取值X围为〔-∞,∞〕,后者的取值X围为〔-1,1〕D.前者的取值X围为〔-1,1〕,后者的取值X围为〔-∞,∞〕E.两者没有关系6.估计标准误差是反映〔 A、C、D 〕的指标.A.回归方程代表性B.自变量数列的离散程度C.因变量数列的离散程度D.因变量估计值的可靠程度E.因变量数列的集中程度7.相关系数的绝对值的大小〔 B、C〕A、和回归系数的绝对值呈反向关系B、和回归系数的绝对值呈正向关系C、和回归估计标准误差呈反向关系D、和回归估计标准误差呈正向关系E、和回归系数的绝对值没有关系8.若所有的观测点都落在回归直线上,则〔A、B、D〕A、相关系数可能为+1B、相关系数可能为-1C、两变量之间呈线性函数关系D、两变量之间呈完全相关关系E、相关系数可能为0.859.建立一元回归方程是为了〔 A 、B 〕A 、确定两个变量之间的数量关系B 、用自变量推算因变量C 、用于两个变量互相推算 D 、确定两个变量的相关程度E 、以上说法都对10.成本依产量回归方程bx a y+=ˆ中〔 A 、C 、D 〕 A 、x 代表产量 B 、y 代表产量 C 、b 叫作回归系数D 、b 代表x 增加一个单位时,y 平均增加b 个单位E 、b 代表y 增加一个单位时,x 平均增加b 个单位11.用最小平方法拟合的趋势线,必须满足〔 B 、D 〕A 、∑=-0)ˆ(yy B 、∑-)ˆ(y y 最小 C 、∑-)ˆ(y y 最大 D 、2)ˆ(∑-yy 最小 E 、2)ˆ(∑-y y 最大 三、判断题1.施肥量与收获率是正相关关系.〔 ×〕2.计算相关系数的两个变量都是随机变量.< × >3.当直线相关系数为0时,表明两个变量之间存在负相关关系.〔 ×〕4.若直线回归方程为ŷ=17+2.5X,则变量X 与Y 之间存在负相关关系.〔 ×〕5.计算相关系数是测定相关系数的唯一方法.〔×〕6.利用一个回归方程,两个变量可以互相推算.〔 ×〕7.回归估计标准误差指的就是实际值y 与估计值yˆ的平均误差程度.〔 √ 〕8.回归系数b 和相关系数r 都可以用来判断现象之间相关的密切程度.〔√〕9.在一元回归分析中,两个变量是对等的关系,不需要区分自变量和因变量.〔×〕10.回归估计标准误差的值越大,表明回归方程的代表性越低.〔√〕四、简答题1.相关关系与函数关系有何区别与联系?答:<1>区别:具有相关关系的变量之间的数量关系不确定,而具有函数关系的变量之间的数量关系是确定的.〔2〕__函数关系往往通过相关关系表现出来,相关关系也常常借助函数关系的方式进行研究.由于认识局限和测量误差等原因,确定性的函数关系在实际中往往表现为相关关系;反之,当人们对事物的内部规律了解得更深刻的时候,相关关系又可能转化为确定性的函数关系.2.简述相关关系的判别方法.答:〔1〕按现象相关的因素多少划分为单相关和负相关;〔2〕按现象之间的相关方向划分正相关与负相关;〔3〕按现象之间相关的形式划分为直线相关与曲线相关;〔4〕按现象之间相关的程度划分为不相关、完全相关和不完全相关.3.说明相关系数的取值X围与其判断标准.答:〔1〕相关系数的值在-1和+1之间,其绝对值越接近1,表示相关程度越高;〔2〕相关系数大于0,表示正相关;相关系数小于0,表示负相关. 〔3〕相关系数等于0,表示两个变量之间不存在直线相关,但并不表明两变量之间没有其他形式的相关关系.〔4〕|r| =1,表示存在完全直线相关;0<|r|<0.3,表示存在微弱直线相关;0.3≤|r|<0.5,表示存在低度直线相关;0.5≤|r|<0.8,表示存在显著直线相关;0.8≤|r|<1,表示存在高度直线相关.4.什么是估计标准误差?有什么作用?答:估计标准误差:是因变量的实际值与估计值得标准差,即以回归直线为中心反映各实际值与估计值之间的平均误差程度.作用:可以衡量回归方程的代表性大小.越小Sy,表明实际观测点与所拟合的回归线的离差越小,即回归线有较强的代表性;反之,其越大,表明实际观测点与所拟合的回归线的离差越大,即回归线的代表性较差.5.应用相关分析与回归分析应注意哪些问题?答:应用相关分析时,判断现象之间是否存在依存关系是相关分析的起始点.只有存在相互依存关系,才有必要和可能进行相关分析.应用回归分析时,回归分析是近似地表示变量间的平均变化关系.6.相关分析与回归分析有何区别?答:〔1〕相关分析不说明谁是自变量,谁是因变量;而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒.〔2〕相关分析中每一个变量都是随机的;回归分析中的自变量是一般变量,因变量是随机变量.五、综合题1.在其他条件不变的情况下,某种商品的需求量〔y 〕与该商品的价格〔x 〕有关.现对给定时期内的价格与需求量进行观察,得到如下所示的一组数据:要求:(1) 计算价格与需求量之间的简单相关系数,并说明相关方向和程度;解:相关系数r==---∑∑∑∑∑∑∑2222)()(y y n x x n y x xy n 364816369680883692005677655640---=-0.854属于负相关;属于高度直线相关.(2) 拟合需求量对价格的回归直线,并解释回归系数的实际含义.解:设,bx a y +=^则,b=∑∑∑∑∑--22)(x x n yx xy n =883692005677655640--=121.3- a=---x b y=73.89=-∑∑n x b n y 则x y 121.373.89^-=该方程表明,该商品的价格每增加1元,商品的需求量就降3.121吨;该商品价格为0时,其固定的需求量为89.73吨.2.某地区家计调查资料显示,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差60元,支出对收入的回归系数为0.8.要求:(1) 计算相关系数;(2) 拟合支出对收入的回归方程.解:〔1〕设年收入为x,年消费支出为y,则,由题可知:设收入与消费支出之间的回归方程为: 则104088008.06000-=⨯-=-=x b y a所以,收入与消费支出之间的回归方程为: <2>回归系数b=0.8 =-x 8800,6000=-y .回归方程为 bx a y +=^ a=---x b y 可得a=1040即支出对收入的回归方程为x y 8.01040^+-= 3.下面是一个企业的广告费支出与销售额资料:单位:万元要求:〔1〕计算广告费支出与销售额间的相关系数;<2>若下月投资700万元的广告费,估计销售额的区间X 围是多少?设 用x y 分别表示广告费、销售额:由题意得;2500=∑x 25000=∑y由广告费与销售额可建立一元线性回归方程则 bx a y+=ˆ ∑∑∑∑∑--=x x n n b xy x y22)(2 =62500001450000525002500138000005-⨯⨯-⨯ =6.5 a=y - b x =5.652500525000⨯-=1750 y ˆ=1750+6.5x 当x=700时,yˆ=1750+6.5⨯700=6300〔万元〕 所以销售额的区间X 围是6300万元.4.检查五位学生"统计学原理〞的学习时间成绩如下所示:广告费 销售额 广告费 1 销售额 0.817265 1(1)计算学习时数与学习成绩之间的相关系数;解:学习时数和学习成绩之间的相关系数为:0.955779009 如图所示:(2)建立学习成绩〔y 〕与学习时间〔x 〕的直线回归方程;解:直线回归方程为:4.202.5ˆ+=x y 如图所示:(3)解释回归系数的含义; 660 750 1070 15 90解:回归系数是指X 每变化一个单位,y 的平均变化值本题是指学习成绩每增加一个小时,y 的平均变化值为5.2分.(4)计算回归估计标准误差.解:回归标准误差计算得: 6.53197264如图所示:5.根据某地区历年人均收入〔元〕与商品销售额〔万元〕资料计算的有关数据如下;〔x 代表人均收入,y 代表销售额〕n=9,546=∑x , 260=∑y , 343622=∑x ,16918=∑xy要求:建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义.解:设=^y a+bx则,b=∑∑∑∑∑--22)(x x n y x xy n =2546343629260546169189-⨯⨯-⨯=1114210302=0.925 a=---x b y =nx b n y ∑∑- =228.279546925.09260-=⨯- 所以,=^y =-27.228+0.925x回归系数的含义:该方程表明人均收入每增加1元,商品销售额平均增加0.925万元.当人均收入为0时,商品销售额为-27.228万元.所有,翻版必究.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
(2)
其中, 表示随机误差项(stochastic, random error term)或简称为误差项。
第一节 古典回归模型
表8-4 从表8-3的总体中抽取一个随机样本
X
Y
X
Y
1
0.77 6
3.20
2
1.10 7
4.00
3
1.70 8
4.30
4
1.65 9
4.50
5
2.50 10
6.00
29
图8-5 总体回归线与样本回归线
0
ˆ0 t 2 (n 2)S(ˆ0 ), ˆ0 t 2 (n 2)S(ˆ0 )
42
8.2.3 多元线性回归模型
• 8.2.3.1 多元线性回归模型的参数估计 yi 0 1x1i 2x2i L k xki i i 1, 2,L n
35
2、相关分析与回归分析的区别
• ①变量的地位不同 • ②变量的性质不同 • ③研究的目的不同 • ④研究的方法不同 • ⑤所起的作用不同
36
8.2.2 一元线性回归模型
8.2.2.1 回归模型的基本假定 • 回归模型是描述因变量如何依赖自变量和随
机误差项的方程。一元线性回归模型只涉及 一个自变量,可表述为:
3
如:商品的消费量(y)与居民收入(x)之间的关系
各观测点分布在直线周围。
变量间关系是不能用函数关系精确表达的,一个变量 的取值不能由另一个变量唯一确定。当变量x取某个值 时,变量y的取值可能有几个。
4
8.1.1.2 相关关系的种类
1. 按相关的方向可以分为正相关和负相关。 1. 按相关的程度可分为完全相关、不完全相关和不相关。 2. 按涉及的变量或因素的个数可以分为单相关与复相关。 1. 按相关的表现形式可分为线性相关与非线性相关。
• 第二步:构造并计算检验统计量
tr
n2 1 r2
0.95
10 2 8.61 1 0.95 0.95
19
• 第三步:确定临界值。根据给定的显著性水平 =0.05和自由度10-2=8,查找t分布表或利用 Excel计算,得到临界值。
t0.025 (8) TINV (0.05,8) 2.31
系密切程度的数量指标。早在1890年,英 国著名统计学家Karl Pearson便提出了一个 测定两个变量线性相关的计算方法,通常称 为积差相关系数或简单相关系数。
13
总体相关系数:
XY XY
式中: XY——是变量X和Y的协方差
X ——是变量X的标准差
Y ——是变量Y的标准差
5
相关关系
单相关
复相关
线性相关 曲线相关
正
负
相
相
关
关
多元线 性相关
多元 非线 性相
关
6
8.1.1.3 相关图表
• 相关表和相关图可直观地表达变量之间 的相关关系的程度。
• 相关表是将具有相关关系的原始数据,按 某一顺序平行排列在一张表上,以观察它 们之间的相互关系。
7
表8-1高校人数和周边饭店季营业额
第一节 古典回归模型
• 用样本回归函数(sample regression function,S R F)来表示样本回归线。
(3)
Y^表i 示表ˆ总0示体条的件估均0 计值量,;E(Y|Xi)的估计量;
表ˆ1示 的估1 计量;
第一节 古典回归模型
• 建立随机的样本回归函数:
Yi ˆ0 ˆ1Xi ei (4)
• 其中ei为残差项(residual term),或简称
为残差(residual)。
第一节 古典回归模型
• 回归分析的主要目的是根据样本回归函数
Yi ˆ0 ˆ1Xi ei
来估计总体回归函数,
第一节 古典回归模型
8.2.1.2 相关分析与回归分析的联系与区别
• 1、相关分析与回归分析的联系 • ①相关分析和回归分析具有共同的研究对象 • ②相关分析和回归分析需要相互补充 • ③相关分析是回归分析的前提 • ④回归分析是相关分析的拓展
根据给定的显著性水平和自由度n-2,查找t分布中的相
应临界值 t 2。如果 | t |,t就2否定原假设,认为 r 在统
计上是显著的,即总体相关系数不为零,总体变量间存 在线性相关关系。
18
• 检验高校学生人数与周边饭店季营业额之间的相关 系数是否显著,显著性水平=0.05。
• 第一步:提出假设 H0 : 0; H1 : 0
( ei2 )( xi2 ) n(n 2)Sxx
41
2、置信区间 • 对于给定的置信度1-,1参数的置信区间为:
ˆ1 t 2 (n 2)S(ˆ1), ˆ1 t 2 (n 2)S(ˆ1)
即以100(1-)%的概率回归系数属于该区间内。
•
同理,
参数的置信区间为
负相关。
• 4、若 r ,0 表示两变量不存在线性相关。
16
• 5、当 0 | r时|,1 表示两变量存在不同程度的线性 相关。 的数值| r越| 接近于1,表示两变量之间线性
相关程度越高;反之 的数值越| r接| 近于0,表示两
变量之间线性相关程度越低。通常认为:
0 |微r弱|相0.关3 ;
饭 店
学生人 数(千 人)
季营业 额(千 元)
饭 店
学生人 数(千 人)
季营业额 (千元)
x
y
x
y
1
2
58
6 16
137
2
6
105 7 20
157
3
8
88
8 20
169
4
8
118 9 22
149
5
12
117 10 26
202
8
• 相关图也称为分布图或散点图,它是在平面 直角坐标中把相关关系的原始数据用点描绘 出来,通常以直角坐标的横轴代表自变量x, 纵轴代表因变量y。相关图所反映的变量之 间的相关关系的方向和程序比相关表更为清 晰,也更为直观。
15
8.1.2.2 相关系数的性质
• 1、| r | 1
• 2、若 0 r ,1表示变量x与变量y为线性正相关关
系;若
1,表r示变0量x与变量y为线性负相关
关系。
• 3、若 | r |,1表示两变量完全线性相关,即变量x与 变量y之间存在确定的函数关系。若 ,r表示1两变
量完全线性正相关;若 ,表示r 两 变1量完全线性
第8章 相关分析和回归分析
1
主要内容和学习目标
• 相关分析(掌握) • 线性回归分析(掌握) • 回归模型的统计检验和预测(掌握) • 非线性回归模型(了解)
2
8.1相关分析
• 8.1.1 相关关系的概念和种类 • 8.1.1.1 相关关系的概念 • 在社会经济发展变化中,客观现象总是普遍
联系和相互依存的,客观现象(变量)之间 的数量依存关系可分为两种类型:确定性关 系和相关关系。 • 相关关系是指现象之间客观存在的非确定性 的数量依存关系。
• 1 又称为斜率(slope),斜率度量了X 每变动一
单位,Y 的均值的变化率。
• 例 位, (如 千果 元斜)率,Y1为的0(.期5,望那)均么值,将当增收加入0x.5每个增单加位1单
(千元);即,平均而言,消费支出将增加0.5 千元。
第一节 古典回归模型
模型的随机设定
• 从图中可看出单个家庭的消费支出与平均消费支出 之间存在着一定的离差,即
样本相关系数:
r xi x yi y
(xi x)2
( yi y)2
14
• 计算学生人数和季营业额的相关系数
21040 1 1401300
r
10
0.95
(2528 1 140140) (184730 1 13001300)
10
10
23
图8-4 不同收入水平的家庭消费支出散点分布图
消费支出 Y 8
6
随机试验所有可能结果的集合称 为总体或样本空间
总体回归线 PRL
4
2
0
收入 X
0
2
4
6
8
10
24
• 由图中看出总体回归直线是线性的,用函数的形式来 表示:
(1)
这是直线的数学表达式,在式(1)中,
E(Y|Xi)表示给定X值相应的(或条件的) Y的均值, 称为Y的条件期望或条件均值下标i代表第i个子总体。
8
6
总体回归线
4
样本回归线
2
0
0
2
4
6
8
10
30
• 得到一条很好地“拟合”了样本数据 的直线,称之为样本回归线(sample regression lines, SRL)。
• 可能从K个不同的样本中得到K条不同 的样本回归直线,所有的这些样本回 归线不可能都相同。每一条直线也最 多是对真实总体回归线的近似。
• 用数学形式表示为:
min :
e2 i
^
(Yi Yi )2
(Yi ˆ0 ˆ1Xi )2
• 最小二乘原理就是所选样本回归函数使得所有Y的估
计值与真实值差的平方和最小。
第二节 回归模型的参数的估计
• 求解联立方程
• 解得
ˆ1
n
n
xi yi xi2 (
21
回归分析的内容和步骤: • ①选择适当的回归模型。 • ②进行参数估计。 • ③进行模型的检验。 • ④进行预测。即根据回归方程进行适当的经