[理学]古典回归模型
合集下载
古典线性回归模型

概率(Probability)对于一个随机事件A,用一个数P (A)来表示该事件发生的可能性大小,这个数P(A) 就称为随机事件A的概率,因此,概率度量了随机事 件发生的可能性的大小。 概率的定义 定义在事件域F上的一个集合函数P称为概率,如果 它满足如下三个条件: (i)P(A)≥0,对一切 F (ii)P(Ω)=1; P A A F (iii)若 ,i=1,2…,且两两互不相容,则 P( A ) 性质(iii)称为可列可加性(conformable addition) 或完全可加性。
某工厂用机器生产商品,当机器运转正常时,产品 合格率为98%,当机器发生故障时,产品合格率为 55%。每天开工的时候,机器运转正常的规律为95%。 已知某日早上第一件产品为合格品,则机器调整良 好的概率是多少? A:机器运转正常。B:合格品
P( A | B) P( AB) P( B | A) P( A) P( B | A) P( A) P( B) P( B) P( B | A) P( A) P( B | A) P( A)
由这个定义,其取值一定在-1和1之间。如果X和Y是相互独 立的,那么ρXY =0。如果Y=aX+b,这里a,b是不等于0的常数, 那么|ρXY|=1,此时,我们说X和Y是完全相关的。X和Y的值越 接近线性关系,|ρXY|值接近1。
相关系数=0能证明两个变量 不相关吗? 什么情况下等于1,什么情 况下等于-1?
3000
1500
2000
2500
a=5250,b=-800
回归的本质就是寻找y的平均值(在x的条 件下)
3
3.5 s w
4 Fitted values
古典线性回归模型

6
从总体与样本的关系看残差与随机扰动项 • 最小二乘估计直线有4条性质。性质中 的残差是一个样本的残差。 • 从总体与样本的关系看,数据是总体的 一个子集,自然u^i也是ui的一个子集, 而ui是总体的随机扰动项。 • 样本一般说来总会反映一些总体的性质, 于是对随机扰动项作出类似最小二乘估 计残差的假设。 • 从而完成了数据生成过程的假设。
8
假设1 随机扰动项ui垂直波动 (Vertical Error Jumps)
• 样本数据点只沿着yi的方向在真实直线附 近垂直跳动,即这种波动围绕真实直线上 下波动。对于每一个xi,yi总是垂直变动, 没有横向偏移。这也就是说观察到的xi是 准确无误的,实际中的xi没有丝毫偏差, 而对应于xi的yi却存在垂直的偏差。 • 误差变量模型——xi存在随机偏差
假设6 数据产生过程是线性的 (Linearity of the Model)
• yi=a+b1xi1+b2xi2+b3xi3++bkxik+ui • (i=1,2, ,n) • 因变量yi=自变量的线性组合再加上一个随机 扰动项。自然,因变量yi也是一个随机变量, 于是必须对yi的分布做一番讨论。 • 而a、b等回归估计系数乃是由yi和xij估计出来 的,自然也需对它们的性质作进一步的讨论。 关于它们性质的讨论十分有用,影响到估计得 到规律(回归方程)的检验——可靠性。 19 • 如果是非线性就不能采用最小二乘法。
解决问题的思路
• 根据古典模型的假设,推断出因变量的 性质 • 在通过高斯-马尔科夫定理精确地讨论最 小二乘估计量的性质
22
关于随机扰动项的6项假定
假设1 随机扰动项ui垂直波动 自变量X是确定性变量 假设2 残差分布均值为零 ui=0 假设3 随机扰动项方差一定 Var(ui)=2 假设4 随机扰动项(误差)相互独立 E(ui,uj)=0uiuj=0 (i<>j) 假设5 所有xi都是可观察的并且独立于ui E(x,uj)=0xuj=0 假设6 数据产生过程是线性的 Y=XB+u
从总体与样本的关系看残差与随机扰动项 • 最小二乘估计直线有4条性质。性质中 的残差是一个样本的残差。 • 从总体与样本的关系看,数据是总体的 一个子集,自然u^i也是ui的一个子集, 而ui是总体的随机扰动项。 • 样本一般说来总会反映一些总体的性质, 于是对随机扰动项作出类似最小二乘估 计残差的假设。 • 从而完成了数据生成过程的假设。
8
假设1 随机扰动项ui垂直波动 (Vertical Error Jumps)
• 样本数据点只沿着yi的方向在真实直线附 近垂直跳动,即这种波动围绕真实直线上 下波动。对于每一个xi,yi总是垂直变动, 没有横向偏移。这也就是说观察到的xi是 准确无误的,实际中的xi没有丝毫偏差, 而对应于xi的yi却存在垂直的偏差。 • 误差变量模型——xi存在随机偏差
假设6 数据产生过程是线性的 (Linearity of the Model)
• yi=a+b1xi1+b2xi2+b3xi3++bkxik+ui • (i=1,2, ,n) • 因变量yi=自变量的线性组合再加上一个随机 扰动项。自然,因变量yi也是一个随机变量, 于是必须对yi的分布做一番讨论。 • 而a、b等回归估计系数乃是由yi和xij估计出来 的,自然也需对它们的性质作进一步的讨论。 关于它们性质的讨论十分有用,影响到估计得 到规律(回归方程)的检验——可靠性。 19 • 如果是非线性就不能采用最小二乘法。
解决问题的思路
• 根据古典模型的假设,推断出因变量的 性质 • 在通过高斯-马尔科夫定理精确地讨论最 小二乘估计量的性质
22
关于随机扰动项的6项假定
假设1 随机扰动项ui垂直波动 自变量X是确定性变量 假设2 残差分布均值为零 ui=0 假设3 随机扰动项方差一定 Var(ui)=2 假设4 随机扰动项(误差)相互独立 E(ui,uj)=0uiuj=0 (i<>j) 假设5 所有xi都是可观察的并且独立于ui E(x,uj)=0xuj=0 假设6 数据产生过程是线性的 Y=XB+u
光华管理学院古典线性回归模型

proc corr data=two; var x2 x1 beta; run; /* 看看模拟产生的x1是否与beta相关*/
proc reg data=two; model eret=beta; model eret=beta x1; run; /* 可以看到两个回归结果中,beta的系数几乎相同。理论上应该完全相同*/
• 直观上为什么是这样?
• Ballentine diagram – 交叉部分哪去了? – 多元回归模型,只能反映边际关系(线性关系),联合影响(非 线性关系)无法反映出来
• 例题exer2.sas
/* 分步回归*/ proc reg data=one; model beta=beta2; output out=resout residual=ress; run; /* 第一步,把感兴趣的x对所有其它解释变量回
data one; set wang.exer1_ret09; run; proc sort data=one nodupkey; by id date; run;
proc reg outest=outfile EDF data=one noprint; model dretwd=retindex; by id; run; /* 估计结果输出到文件outfile中, EDF是要输出自由度、R2等指标, noprint是要求估计结果不要出现在output窗口*/
• 实证研究(计量经济分析)与案例研究的根本差别在于前者“看平均 ”,后者“看例子”(奇异值)。 – 前者是科学,后者是艺术,比如西医与中医。现实中更多的是介 乎科学与艺术之间,所以我们要中西医结合。
– 这里u是一个均值为0的随机变量。因为事实上,不可能只有x影响 y,我们把所有其它因素加总到了u中
proc reg data=two; model eret=beta; model eret=beta x1; run; /* 可以看到两个回归结果中,beta的系数几乎相同。理论上应该完全相同*/
• 直观上为什么是这样?
• Ballentine diagram – 交叉部分哪去了? – 多元回归模型,只能反映边际关系(线性关系),联合影响(非 线性关系)无法反映出来
• 例题exer2.sas
/* 分步回归*/ proc reg data=one; model beta=beta2; output out=resout residual=ress; run; /* 第一步,把感兴趣的x对所有其它解释变量回
data one; set wang.exer1_ret09; run; proc sort data=one nodupkey; by id date; run;
proc reg outest=outfile EDF data=one noprint; model dretwd=retindex; by id; run; /* 估计结果输出到文件outfile中, EDF是要输出自由度、R2等指标, noprint是要求估计结果不要出现在output窗口*/
• 实证研究(计量经济分析)与案例研究的根本差别在于前者“看平均 ”,后者“看例子”(奇异值)。 – 前者是科学,后者是艺术,比如西医与中医。现实中更多的是介 乎科学与艺术之间,所以我们要中西医结合。
– 这里u是一个均值为0的随机变量。因为事实上,不可能只有x影响 y,我们把所有其它因素加总到了u中
第3讲 古典线性回归模型

用矩阵形式表示的正规方程组
移项得
当(X ′X )
−1
ˆ) X′ (y − Xβ = 0 ˆ X ′ Xβ= X ′y
存在时,即得回归参数的最小二乘估计为:
ˆ β = (X ′ X )-1 X ′y
2. 方差的估计
用估计的回归方程计算因变量的回归值 ˆ ˆ y = Xβ ˆ ˆ 将β = ( X ′X ) −1 X ′y 代入可得 y = X ( X ′X ) −1 X ′y 记H = X ( X ′X ) −1 X ′,称为帽子矩阵,H 是对称幂等阵,即 H′ = H H 2 = X ( X ′X ) −1 X ′X ( X ′X ) −1 X ′ = H 矩阵H的迹为 tr ( H ) = tr ( X ( X ′X ) −1 X ′) = tr ( ( X ′X ) −1 X ′X ) = tr ( I p +1 ) = p + 1
0 0
其中: J t +1
λ1 = ⋱ λt +1
λi > 0 , i = 1,2, ⋯ , t + 1 。 由 CHC ′ = CH 2 C ′ = CHC ′ ⋅ CHC ′ ,
证明: (1)与(2)在前面已说明。下面证明性质(3) 。 由 于
SSE = y ′(1 − H ) y = ( y − X β )′(1 − H )( y − X β )
,
H = X ( X ′X ) −1 X ′ 是一个非负定矩阵,其秩为 X 的秩 t + 1 。所以
必存在正交阵 C 使
J ′ = t +1 CHC 0
4. 用矩阵形式表示,即
E( X Tε ) = 0 ∑ ε i ∑ E (ε i ) ∑ x1iε i = ∑ x1i E (ε i ) = 0 E ⋮ ⋮ ∑ x ε ∑ x E (ε ) pi i pi i
回归模型的要素

回归模型的要素
回归模型是一种统计分析方法,用于建立变量之间的关系模型。
它基于变量之间的线性关系假设,并通过拟合数据来估计模型参数。
回归模型包含以下要素:
1. 因变量(Dependent Variable):也称为被解释变量或目标变量,它是我们想要预测或解释的变量。
2. 自变量(Independent Variables):也称为解释变量或预测变量,它们是用来解释或预测因变量的变量。
回归模型可以包含一个或多个自变量。
3. 线性关系(Linear Relationship):回归模型假设因变量与自变量之间存在线性关系,即自变量的变化对因变量的影响是线性的。
4. 残差(Residuals):在回归模型中,残差是指观测值与模型预测值之间的差异。
回归模型的目标是通过最小化残差的平方和来找到最佳拟合线。
5. 模型参数(Model Parameters):回归模型的参数是用来描述自变量与因变量之间关系的数值。
在线性回归模型中,参数表示自变量对因变量的影响程度。
6. 截距(Intercept):截距是回归模型中的常数项,表示在自变量为零时,因变量的预测值。
它反映了因变量在没有自变量影响时的基准水平。
通过确定回归模型的要素,并进行数据拟合和参数估计,我
们可以使用回归模型来预测或解释因变量的变化。
Ch2古典回归模型

2.1 古典线性回归模型 古典线性回归模型有如下一些基本假定: A2.1.1 解释变量(X)与扰动误差项不相关. 但是,如果X是非随机的,(即其值为固定数 值), 则该假定自动满足. A2.1.2 扰动项的期望或均值为零. 即
E (ui ) 0
A2.1.3 同方差(homoscedastic)假定,即 每个ui的方差为一常数σ2。
估计值的标准差通常用作对估计回归线的拟 合优度(goodness of fit)的简单度量。
2.3 普通最小二乘估计量的性质 高斯---马尔柯夫定理:若满足古典 线性回归模型的基本假定,则在所有无 偏估计量中,OLS估计量具有最小方差 性;则OLS估计量是最优线性无偏 (Best Linear Unbiased Estimator, BLUE)估计量。
2 i
)
b2 ~ N ( B2 ,
x
2 2 i
)
2.5 假设检验 T检验 零假设(―Zero‖ null hypothesis),也称之为 稻草人假设(straw man hypothesis). H0:B2=0 H1 B2≠0 利用分布
b2 B2 ~ tn2 2 ˆ / xi
设圆面积为S1,正 方形面积为S2,利 用蒙特卡罗试验确 定S1/S2。
则,πr2/4r2=S1/S2
π=4*S1/S2
考虑平面上的一个边长为1的正方形及其 内部的一个形状不规则的“图形”,如 何求出这个“图形”的面积呢? Monte Carlo方法是这样一种“随机化” 的方法:向该正方形“随机地”投掷N个 点落于“图形”内,则该“图形”的面 积近似为M/N。
第二章 古典回归模型
03中级计量古典模型

在矩阵形式中,Xi是矩阵X 中的一列。
需要注意的是,在计量经济学中,“线性”指的是估 计参数可以表达为样本观察值和误差项的线性函数,
而并不要求回归方程中变量之间的关系为线性的。
例:CD函数
Y
e0
X
1 1
X
2 2
eu
对该函数两边取对数得到:LnY=0+1LnX1+2LnX2+e
18
b b b ki xi kiui b b ki xi 1 kiui kiui
最小二乘法估计
(一元回归模型)
最小方差(取决于总体方差、样本方差和样本容量) 估计参数bˆ1 的方差为:
Var bˆ ki2E ei2 2 ki2 2 xi2
即: Y*=0+1X1*+2X2*+e
比较: Y
e X X 0 1 2 12
u
4
不同数学函数的性质
模型 线性 双对数 左对数 右对数 倒数
数学方程 Y=β0+β1X lnY=β0+β1lnX lnY=β0+β1X Y=β0+β1lnX Y=β0+β1(1/X)
斜率(dY/dX) β1
14
最小二乘法估计
(一元回归模型)
在应用研究中很少会使用到一元回归模型。 介绍该模型的主要目的是说明OLS的性质、 算法及相应的统计检验方法。
然而,也存在一些特殊的应用,例如:
凯恩斯宏观消费模型Ct=a+bYt+et 恩格尔曲线FSi=a+bLnYi+ei 增长曲线LnYt=a+bTt+et
2.1 古典回归模型

举例说明: 举例说明: 假设一个总体由60户家庭组成,为了研究 家庭消费支出Y与家庭收入X之间的关系,将这 60户家庭按人均月收入划分成组内收入水平大 致相同的10个组。表2-1列出了每组各个家庭 的人均月消费支出和收入情况。
表2-1
人均月收入X 人均月收入X 180 200 220 240 260 280 300 320 340 360
(3)相关程度的度量
以简单线性相关系数为例 X和Y的总体线性相关系数:
ρ=
Cov ( X , Y ) Var ( X )Var (Y )
X和Y的样本线性相关系数:
γ XY =
∑ (X − X )(Y − Y ) ∑(X − X ) ∑ (Y − Y )
i i 2 i i
2
相关系数的特点
⑴相关系数取值在[-1,1] ⑵当r=0时,表明X与Y没有线性相关关系 ⑶当0<|r|<1时,表明X与Y存在一定的线 性相关关系。若r>0表明为正相关,r<0 表明为负相关。 ⑷当|r|=1时,表明X与Y完全线性相关。
使用相关系数应注意的问题
X和Y 都是相互对称的随机变量。 线性相关系数只反映变量间的线性相关程度, 不能说明非线性相关关系。 样本相关系数是总体相关系数的样本估计值, 由于抽样波动,样本相关系数是个随机变量, 其统计显著性有待检验。 相关系数只能反映线性相关程度,不能确定 因果关系,不能说明相关关系具体接近哪条 直线
单位:元/月
条件均值 E(Y) 165 177 189 201 213 225 237 249 261 273
消费支出
300 270 240 210 180 150 120 160 180 200 220 240 260 280 300 320 340
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区别:
从研究目的上,相关分析用一定的数量指标(相关系 数)度量变量间相关联系的方向和程度;回归分析却是要 寻求变量间联系的具体数学形式,是要根据解释变量的固 定值去估计和预测被解释变量的平均值。
从对变量的处理上,相关分析对称的对待相互联系的 变量,相关的变量不一定具有因果关系,均视为随机变量; 回归分析是建立在变量因果关系的基础上的,研究解释变 量的变动对被解释变量的具体影响。回归分析必须划定解 释变量和被解释变量,对变量的处理是不对称的。
一、回归分析
㈠相关与回归(统计学知识介绍)
在统计学中考察经济变量间的依存关系,通常分
确定性的函数 Y=f(X)
函数关系
例子,商品销售量X和销售额Y Y=PX
不确定性的随机关系
相关关系
Y=f(X)+ (为随机变量)
例子,居民消费函数 Y=a+bX+
没有关系
⒈相关关系的表现 对相关关系的描述通常最直观的是座标图
第二章 回归模型
引例
从2004年中国国际旅游交易会上获悉,到2020 年,中国旅游业总收入将达到3000亿美元,相 当于GDP的8%至11%。 ?
是什么决定性因素能使中国旅游业总收入到 2020年达到3000亿美元? 旅游业的发展与这种决定性因素的数量关系究竟 如何?
怎样具体测定旅游业发展与这种决定性因素的数 量关系?
对参数而言是线性的——Y的条件均值是的线 性函数 例子
计量经济学中的线性回归模型主要指参数“线 性”
㈢随机误差项
概念
各个Yi值与条件均值
E(YXi)的偏差i代表排
除在模型以外的所有因
素对Y的影响
Y
性质
i是期望为0,有一定
分布的随机变量
随机误差项的性质决
定着计量经济方法的选
X
择。
关系。若r>0表明为正相关,r<0表明为负相关。 ⑷当|r|=1时,表明X与Y完全线性相关。
使用相关系数应注意的问题
X和Y 都是相互对称的随机变量。 简单相关系数只反映变量间的线性相关程度,
不能说明非线性相关关系。 样本相关系数是总体相关系数的样本估计值,
由于抽样波动,样本相关系数是个随机变量, 其统计显著性有待检验。 相关系数只能反映线性相关程度,不能确定因 果关系,不能说明相关关系具体接近哪条直线
⒋回归分析
回归的古典意义: 高尔顿在1889年发表的著作《自然的遗传》中,首次
提出了回归的概念 (父母身高与孩子身高的关系)
回归的现代意义: 一个应变量对若干解释变量依存关系的研究
回归分析的基本思想: 在相关分析的基础上,对具有相关关系的两个或多个变
量之间的数量变化的一般关系进行测定,确定一个相应的数 学表达式,以便从一个已知量来推断另一个未知量. 回归的目的(实质):
二者都只是从数据出发定量分析经济变量间相互联系的手 段,并不能决定经济现象之间的本质联系。本质需要结合 实际经验分析,并要从经济学原理上加以说明。对本来没 有内在联系的经济现象,仅凭数据进行相关分析和回归分 析,可能是一种“伪相关”和“伪回归”。
注意的几个概念
•Y的条件分布
当解释变量X取某固定 Y 值时(条件),Y的值不确 定,Y的不同取值形成一定 的分布,这就是Y 的条件 分布。
⑵个别值表现形式(随机设定形式) 对于一定的Xi,Y的每一个值Yi分布在E(YXi)的周围, 若 是令随每机一变个量值Yi与条件均值E(YXi)的偏差i,显然i
则有 i= Yi-E(YXi)= Yi- 1-2Xi Yi= 1+2Xi + i
对线性回归模型线性的两种解释
对变量而言是线性的——Y的条件均值是X的 线性函数
注意
实际的经济研究中总体回归函数通常是未知的, 只能根据经济理论和实践经验去设定。“计量” 的目的就是寻找PRF。
总体回归函数中Y和X的关系可以是线性的, 也可以是非线性的。
⒉总体回归函数的表现形式
⑴条件均值表现形式 假如Y的条件均值E(YXi)是解释变量X的线性函数, 可表示为 E(YXi)=f(Xi)=1+2Xi 1 和 2 分别是总体回归函数的总体回归参数参数
二、古典回归模型的基本假定
为什么要作基本假定? 模型中随机误差项,估计的参数是随机变量, 只有对随机误差的分布作出假定,才能确定所 估计的参数分布性质,也才可能进行假设检验 和区间估计。 只有具备一定的假设条件,所作出的估计才具 有较好的统计性质。
六大假定
⑴解释变量非随机,被解释变量随机 ⑵零均值假定(正态性假定) ⑶同方差假定 ⑷非自相关性假定 ⑸解释变量与随机误差项不相关假定 ⑹无多重共线性假定 补充:延伸到y
第一节 古典回归模型
对经济变量相互关系的计量,最基本的方法 是回归分析。回归分析是计量经济学的主要工具, 也是计量经济学理论和方法的主要内容。只有一 个解释变量的线性回归模型是最简单的,称为简 单线性回归模型或一元线性回归模型。本章从一 元线性回归模型入手,讨论在基本假定满足的条 件下,对经济变量关系计量的基本理论和方法, 这也是我们学习的基础。
y
...
...
.. .
. ..
..
.
x
图2.1
⒉相关关系的类型
•从涉及的变量数量看 简单相关——只有两个变量的相关关系 多重相关(复相关)——三个或三个以上变量的 相关关系。例:某人身高与体重与年龄的关系 •从变量相关关系的表现形式(可根据散点图) 线性相关 非线性相关 •从变量相关关系变化的方向 正相关:收入 对消费量影响 负相关:价格 不相关
• Y的条件期望
对于X的每一个取值, 对Y所形成的分布确定其期 望或均值,称为Y的条件期 望或条件均值E(YXi)
图2.2
xi
⒌回归线与回归函数
回归线:对于每一个X的取值,都有Y的条件 期的望点E的(Y轨X迹i)所与形之成对的应直,线代或表曲这线些,Y的称条为件回期归望线。
回归函数:被解释变量Y的条件期望随解释变 量X的变化而有规律的变化,如果把Y的条件 期望E(YXi)表示为X的某种函数 E(YXi)=f(Xi) 这个函数称为回归函数。
⒊相关程度的度量
X和Y的总体线性相rY
X和Y的样本线性相关系数:
XY
2 XY
XY
Xi X Yi Y N
Xi X 2 N Yi Y 2 N
相关系数的特点
⑴相关系数取值在[-1,1] ⑵当r=0时,表明X与Y没有线性相关关系 ⑶当0<|r|<1时,表明X与Y存在一定的线性相关
E Y Xi 0 1Xi
样本回归模型
样本回归函数(直线)
Yi ˆ0 ˆ1Xi ei
残差
Yˆi ˆ0 ˆ1Xi
根据课本例题p17~20进行说明
回归分析的目的
用样本回归函数去估计总体回归函数 由于样本对总体总是存在代表性误差,SRF总
会过高或过低估计PRF。 要解决的问题 寻求一种规则和方法,使得到的SRF的参数尽 可能接近总体回归函数的参数。这样的规则和 方法有很多,最常用的就是最小二乘法。
复习
理解掌握总体回归模型和样本回归模型的区别; 比较总体回归模型、样本回归模型和总体回归函 数、样本回归函数。
了解随机误差项产生的原因;比较随机误差项和 残差项。
着重理解古典假设。
样本回归函数:
如果把被解释变量Y的 样本条件均值表示为解释变 量X的某种函数,这个函数 称为样本回归函数(SRF)
图2.4
xi
样本回归函数的特点
每次抽样都能获得一个样本,就可以拟合一条 样本回归线,所以样本回归线随抽样波动而变 化,可以有很多条(SRF不唯一)
样本回归函数的函数形式应与设定的总体回归 函数的函数形式一致
可分为:总体回归函数;样本回归函数
㈡总体回归函数(PRF)
⒈总体回归函数的概念 前提:假如已知所研究的经济现象的总体被解 释变量Y和解释变量X的每个观测值,可以计 算出总体被解释变量Y的条件期望E(YXi),并 将其表现为解释变量X的某种函数 E(YXi)=f(Xi) 这个函数称为总体回归函数(PRF)
图2.3
产生随机误差的原因
(1)模型中被忽略的因素的影响; (2)变量观测值的观测误差的影响; (3)模型函数形式的设定误差的影响; (4)其它随机因素的影响。 见p20-21 设置随机误差的意义: p21
㈣样本回归函数(SRF)
样本回归线:
对于X的一定值,取得Y Y 的样本观测值,可计算其条 件均值,样本观测值条件均 值的轨迹,称为样本回归线。
ei 在概念上类似总体回归函数中的 i ,可以视 为对 i 的估计
样本回归函数与总体回归函数的关系
Y
Yi
Yˆi
E(YXi)
SRF
i
ei
PRF
图2.5
Xi
X
总体回归模型
Yi E Y Xi i 0 1Xi i
总体回归函数(直线)
系统变 化部分
非系统 变化部分
研究变量相互之间的依存关系时,首先需要分 析它们是否存在相关关系,随后要明确相关关 系的类型,而且还应计量其相关关系的密切程 度,在统计上这种分析研究称为相关分析。相 关分析主要是指用一个指标(相关系数)去表 明现象间相互依存关系的性质和密切程度。
计量经济学关心的是:变量间的因果关系及隐 藏在随机性后面的统计规律性,这靠相关分析 无法完成.相关分析并不能说明变量间相关关 系的具体形式,还不能从一个变量的变化去推 测另一个变量的具体变化。这时就需要运用回 归分析。
由固定的解释变量去估计应变量的平均值。
相关分析与回归分析的联系及区别
联系:二者都是对变量间依存关系的研究,二 者可以互相补充。相关分析可以表明变量间相 关关系的性质和程度,只有当变量间存在一定 程度的相关关系时,进行回归分析去寻求相关 的具体数学形式才有意义。同时,在进行相关 分析时如果要具体确定变量间相关的具体数学 形式,又要依赖回归分析,而且相关分析中相 关系数的确定也是建立在回归分析的基础上。