2 一元回归模型
2一元线性回归模型

E( y | x) 0 1x
总体回归函数(population regression function PRF)E( y | x) 0 1x ,是x的一个线性函数。
这样y就分成两部分, 0 1x 称为的系统部分;u称为非 系统部分。
样本回归函数
样本回归函数(sample regression function, SRF)
同方差性和异方差性
同方差性和异方差性
正(负)序列相关及零相关
最小二乘法的基本假定
假定6:ui和Xi的协方差为零。 cov(ui , Xi ) E[ui Eui ][ Xi EXi ] E[ui (Xi EXi )] E(ui Xi ) 0
假定7:观测次数n必须大于待估计的参数个数。 假定8:X值要有变异性。 假定9:正确地设定了回归模型。
可得 Y ˆ0 ˆ1X 。
(2)估计的Y(= Yˆi )均值等于实测的Y的均值,因为 Yˆi ˆ0 ˆ1Xi (Y ˆ1X ) ˆ1Xi Y ˆ1(Xi X )
等式两边对样本值求和再除以样本容量n得:Yˆ Y
(3)残差 uˆi 的均值为零。因为由最小二乘法得
2 (Yi ˆ0 ˆ1Xi ) 0
不会!
其均值的变异,称为解释平方和(Explained Sum of
Squares, ESS )。
uˆi2 (Yi Yˆi )2 为残差或未被解释的围绕回归线的Y值的
变异,称为残差平方和(Residual Sum of Squares,
RSS ).
TSS=ESS+RSS 这说明总变异由两部分组成:
定义 r2 ESS (Yˆi Y )2
TSS
(Yi Y )2
于是
r2
计量经济学第2章 一元线性回归模型

15
~ ~ • 因为 2是β2的线性无偏估计,因此根据线性性, 2 ~ 可以写成下列形式: 2 CiYi
• 其中αi是线性组合的系数,为确定性的数值。则有
E ( 2 ) E[ Ci ( 1 2 X i ui )]
E[ 1 Ci 2 Ci X i Ci ui ]
6
ˆ ˆ X )2 ] ˆ , ˆ ) [ (Yi Q( 1 2 i 1 2 ˆ ˆ X 2 Yi 1 2 i ˆ ˆ 1 1 2 ˆ ˆ ˆ ˆ [ ( Y X ) ] 1 2 i Q( 1 , 2 ) i ˆ ˆ X X 2 Yi 1 2 i i ˆ ˆ 2 2
16
~
i
i
• 因此 ~ 2 CiYi 1 Ci 2 Ci X i Ci ui 2 Ci ui
• 再计算方差Var( ) 2 ,得 ~ ~ ~ 2 ~ Var ( 2 ) E[ 2 E ( 2 )] E ( 2 2 ) 2
C E (ui )
2 i 2 i
i
~
i
i
i
i
E ( 2 Ci ui 2 ) 2 E ( Ci ui ) 2
i
2 u
C
i
2 i
i
~ ˆ)的大小,可以对上述表达式做一 • 为了比较Var( ) 和 Var( 2 2
些处理: ~ 2 2 2 2 Var ( 2 ) u C ( C b b ) i u i i i
8
• 2.几个常用的结果
• (1) • (2) • (3) • (4)
一元二次回归模型拟合方法

一元二次回归模型拟合方法一、一元线性回归模型引入从简单的一元线性回归开始。
这里,我们以房屋面积(x)与房屋价格(y)为例,显而易见,二者是一种线性关系,房屋价格正比于房屋面积,我们假设比例为w:y ^ = w ∗ x \hat{y} = w * x y^=w∗x然而,这种线性方程一定是过原点的,即当x为0时,y也一定为0。
这可能并不符合现实中某些场景。
为了能够让方程具有更广泛的适应性,我们这里再增加一个截距,设为b,即之前的方程变为:y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b而以上方程,就是我们数据建模的模型。
方程中的w与b,就是模型的参数。
假定数据集如下:线性回归是用来解释自变量与因变量之间的关系,但是,这种关系并非严格的函数映射关系。
从数据集中,我们也看到了这一点。
相同面积的房屋,价格并不完全相同,但是,也不会相差过大。
二、下一步目的,去学习(确定)w与b的值我们现在的目的就是,从现有的数据(经验)中,去学习(确定)w与b的值。
一旦w与b的值确定,我们就能够确定拟合数据的线性方程,这样就可以对未知的数据x(房屋面积)进行预测y(房屋价格)。
1. 引入权重eg. 房屋价格会随着房屋面积改变而改变,也符合常规认识,我们认为房屋面积越大,房屋价格越高。
对于这种线性关系,接下来我们就可以去建立这个函数的模型。
对于这个线性的模型,可以表示为x y 之间有一定的比例。
这个时候我们可以建立这样的关系,建立这样的模型。
模型就是一个映射,一个函数,通过历史数据,建立一个模型,一个函数。
Y = f(x) ,法则,成比例,法则我们不知道,可以先预设出来,用w表示比例,表示法则,W*x;W表示我们这个x的比例关系,W :weight 权重应用的房屋价格这个例子:Y就是房屋的价格, x就是面积,所以可以把比例认为是房屋的单价;单价不知道,应该从我们数据集中求出来,因为模型要靠历史数据集建立出来。
2.一元回归模型

一元回归模型(1)一、一元回归模型的定义:● 1、回归的含义回归分析研究的是一个变量(被解释变量)对另一个变量(解释变量)的依赖关系。
其目的是通过后者的已知或设定值,去估计或预测前者的均值。
● 2、统计关系与确定性关系在经济研究中,主要处理的是经济变量之间统计依赖的关系。
变量之间的关系是一种统计性的关系,而非确定性关系。
● 3、回归与相关相关分析:测度两个变量之间的线性关联程度,可以用相关系数来测量。
对两个变量不加区分,都是随机变量。
回归分析:根据某个变量的设定值来估计或预测另外一个变量的平均值。
解释变量是固定的(非随机的),被解释变量是随机的。
● 4、总体与样本的关系。
● 总体:研究对象的全体。
● 个体:总体中的每个元素称为个体● 样本:从总体中随机抽取的一组个体,称为样本一个例子:假设一个国家由60户居民组成,我们要研究每周家庭消费支出与可支配收入的关系。
收入(X )80 100 120 140 160 180 200 220 240 260 支出(Y )55 65 79 80 102 110 120 135 137 150 6070 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185115 162 191 共计32546244570767875068510439661211散点图:5010015020050100150200250300XY总体回归曲线(population regression curve ):当解释变量取给定值时被解释变量的条件均值或期望值的轨迹。
(一)总体回归函数(population regression function,PRF ):)()(i i X f X Y E = 一元回归的总体回归函数:i i i X X f X Y E 21)()(ββ+== 计量分析的随机设定: 随机干扰(随机误差)项:)(i i i X Y E Y u -=有:i i i u X Y E Y +=)(,上式中,)(i X Y E 称为系统性(确定性)成分,i u 称为非系统性成分。
2.2 一元线性回归模型的参数估计

于是,Y的概率函数为
P(Yi ) = 1
− 1 2σ
2
ˆ ˆ (Yi − β 0 − β1 X i ) 2
σ 2π
e
(i=1,2,…n)
4/29/2012
14
因为Yi是相互独立的,所以的所有样本观测值的联 合概率,也即或然函数(likelihood function) 或然函数(likelihood function)为: 或然函数
§2.2 一元线性回归模型的参数估计
一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计(OLS) 参数的普通最小二乘估计(OLS) 参数估计的最大或然法(ML) 三、参数估计的最大或然法(ML) * 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干扰项方差的估计
4/29/2012
1
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
4/29/2012
-973 1314090 1822500 947508 -929 975870 1102500 863784 -445 334050 562500 198381 -412 185580 202500 170074 -159 23910 22500 25408 28 4140 22500 762 402 180720 202500 161283 511 382950 562500 260712 1018 1068480 1102500 1035510 963 1299510 1822500 926599 5769300 7425000 4590020
数学人教A版(2019)选择性必修第三册8.2.1一元线性回归模型(共45张ppt)

问题提出——由散点图寻找一条适当的直线
方案1:先画出一条直线,测量
出各点与直线的距离,然后移动
直线,到达一个使距离的和最小
的位置.测量出此时的斜率和截
距,就可得到一条直线,如图.
方案2:在图中选择两
点画直线,使得直线两
侧的点的个数基本相同,
把这条直线作为所求直
线,如图.
方案3:在散点图中多取几对
Y称为因变量或响应变量;
x称为自变量或解释变量;
a称为截距参数,
b称为斜率参数;
e是Y与bx+a之间的随机误差.
思考4:为什么要假设E(e)=0,而不假设它为某个不
为0的常数?
因为随机误差表示大量已知和未知的影响因素之和,因为
误差是随机的,即取各种正负误差的可能性一样,它们会
相互抵消,所以随机误差的期望值应为0.
则它们之间的关系可以表示为下面的一元线性回归模型:
理解为
Y bx a e
E (Y ) bx a
2
E (e) 0, D(e)
思考5:你能结合身高案例解释上述模型的意义吗?
如 : x 170 , 则E (Y ) 170 b a.
由于E(Y)=bx+a,故模型可解释为父亲身高为xi的所有男大学生的身高(子总体)的均值E(Y)
为bxi+a,即该子总体的均值与父亲身高是线性函数关系。
思考6:父亲身高为xi的某一名男大学生,他的身高yi一定为bxi+a吗?
yi不一定为bxi+a,yi=bxi+a+ei,bxi+a是子总体的均值,yi只是该子总体中的一个样本值
,
这个样本值yi与均值E(Y)有一个误差项ei=yi−(bxi+a).
2 一元线性回归模型
4、回归分析
(1)“回归”一词的古典意义 英国生物学家F.高尔顿(Francis 遗传学研究中首先提出的。
Galton)在
(2)“回归”一词的现代意义: 回归分析是研究一个被解释变量(或因变量)对一 个或多个解释变量(或自变量)数量依赖关系的数 学分析方法。 目的:通过解释变量的已知值或设定值,去估计被 解释变量的平均值,或分析解释变量变动对被解释 变量产生的影响。
相关关系:非确定现象随机变量间的关系。
函数关系:
圆面积 f , 半径 半径2
欧姆定律(电流C=V/k, V为电压)
相关关系: 农作物产量 f 气温, 降雨量, 阳光, 施肥量
高档消费品的销售量与城镇居民收入之间的关 系 储蓄额与居民收入之间的关系 广告支出与商品销售额 工业增加值与能源消耗量 数学成绩与统计学成绩 „„
问:能否从该样本估计总体回归函数PRF?
可支配收入X 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 消费支出Y 888 1121 1340 1650 2179 2210 2398 2650 3021 3288
回答:of course
该样本的散点图: 样本散点图近 似于一条直线,画 一条直线以尽可能 地拟合该散点图, 由于样本取自总体, 该线可以近似地代 表总体回归线。该 线称为样本回归线
上例
ui Yi -E(Y Xi ) Yi 0 1X i 总体回归函数 Yi 0 1X i ui 个别值表现形式
引入随机扰动项的主要原因: 1、作为未知影响因素的代表
2、作为无法取得数据的已知因素的代表 3、作为众多细小影响因素的综合代表 4、模型的设定误差 5、变量的观测误差 6、变量的内在随机性
第八章8.2一元线性回归模型及其应用PPT课件(人教版)
三、非线性回归
例3 下表为收集到的一组数据: x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 (1)作出x与y的散点图,并猜测x与y之间的关系;
解 作出散点图如图,从散点图可以看出x 与y不具有线性相关关系,根据已有知识可 以发现样本点散布在某一条指数函数型曲线 y=c1ec2x的周围,其中c1,c2为待定的参数.
年份
2015 202X 202X 202X 202X
时间代号t
1
2
3
4
5
储蓄存款y(千亿元) 5
6
7
8
10
(1)求 y 关于 t 的经验回归方程y^=b^ t+a^ ;
n
tiyi-n t y
i=1
参考公式:b^ =
n
t2i -n
t2
,a^ =
y
-b^
t
i=1
解 由题意可知,n=5, t =1nn ti=155=3, i=1
来比较两个模型的拟合效果,R2 越 大 ,模型
n
yi- y 2
i=1
拟合效果越好,R2 越 小 ,模型拟合效果越差.
思考 利用经验回归方程求得的函数值一定是真实值吗? 答案 不一定,他只是真实值的一个预测估计值.
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
知识点四 对模型刻画数据效果的分析
1.残差图法
在残差图中,如果残差比较均匀地集中在以 横轴为对称轴的水平带状
区域内 ,则说明经验回归方程较好地刻画了两个变量的关系.
2.残差平方和法
n
(yi-y^i)2
残差平方和 i=1
2 一元线性回归模型
负线性相关
不相关
正线性相关
3、常用的两种相关关系的分析方法 对变量间(不确定性的)相关关系(统计依赖关系)
的考察主要是通过相关分析(correlation analysis)或
回归分析(regression analysis)来完成的。
• ……
• E(Y|X=3500)=2585
• 问题4:收入X与平均消费支出E(Y|X)之 间是什么关系?如何用方程式来表现这两种 关系?
图形说明:平均来说,随着收入的增加,消费支出也
在线性增加。即每一个消费支出的(条件)期望均落
在一根正斜率的直线上。这条直线称为总体回归线。
3500
每 月 消 费 支 出 Y (元) 3000 2500 2000 1500 1000 500 0 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X(元)
答:E(Y|X=800)=2420/4=561×1/4+ 594 ×1/4+ 627 ×1/4+ 638 ×1/4=605 • 知识点及注意点4: • 期望也称均值,描述一个随机变量的平均值 • 条件期望(条件均值):给定X的Y的期望值, 记为E(Y|X)。
• 对于每一个给定的X,都对应有且只有一个Y 的条件均值。 • E(Y|X=800)=561×1/4+ 594 ×1/4+ 627 ×1/4+ 638 ×1/4=605 • E(Y|X=1100)=825 • E(Y|X=1400)=1045
量。 • 记为
Y E (Y | X )
• 随机误差项主要包括下列因素(P27书中 六点综合为四点) –在解释变量中被忽略的因素的影响 P27; 说明:模型中被省略了的影响Y的那些 因素包含在随机扰动项中。
2.2 一元线性回归模型的基本假设
n→∞
(2.2.3)
变异性假设是为了通过X的变化来解释被解释变量Y的变化;非零 有限常数假设旨在排除时间序列数据出现持续上升或下降的变量作为 解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往 产生伪回归问题(也称虚假回归:P261,274,295)
三、对随机干扰项的假设 假设4: 随机干扰项具有给定X条件下的零均值、同方差和序列不相关性: (违背该假设则出现随机解释变量问题、异方差性和序列相关性, 分别在第4.4、4.1和4.2节分析) E(i|Xi)=0 (2.2.4) Var(i|Xi)=2 (2.2.5) Cov(i,j)=0 i≠j (2.2.6) 式(2.2.4)意味着的期望不随X变化而变化,且总为0,即与不相关; 该假设成立时也称X为外生解释变量,否则称X为内生解释变量。只有该 假设成立时,总体回归函数的随机形式(2.1.7)式才能等价于非随机形式 (2.1.4)式。 式(2.2.5)表明的方差不依赖于X的变化而变化,且为常数2。图2.2.1 根据期望迭代法则,式(2.2.4) 、(2.2.5),有 E(i)=0 (2.2.7) Var(i)=2 (2.2.8) 式(2.2.6)表明在给定解释变量任意两个不同值时,对应的不相关, 即序列不相关性。
因此要对这些假设进行检验。
以上假设都是针对普通最小二乘法的。在违背这 些基本假设的情况下,普通最小二乘法估计量就不再 是最佳线性无偏估计量,因此使用普通最小二乘法进 行估计已无多大意义。但模型本身还是可以估计的,
尤其是可以通过最大似然法等其它原理进行估计。
(练习题3)
补充思考题
1、一元线性回归模型有哪些基本假设(经典假设)?
(2.2.1) i=1,2,…,n (2.2.2)
Y为被解释变量,X为解释变量,0与1为待估 参数, 为随机干扰项。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 随机误差项主要包括下列因素: 随机误差项主要包括下列因素:
–在解释变量中被忽略的因素的影响; 在解释变量中被忽略的因素的影响; 在解释变量中被忽略的因素的影响 –变量观测值的观测误差的影响; 变量观测值的观测误差的影响; 变量观测值的观测误差的影响 –模型关系的设定误差的影响; 模型关系的设定误差的影响; 模型关系的设定误差的影响 –其它随机因素的影响。 其它随机因素的影响。 其它随机因素的影响
• 其目的在于通过后者的已知或设定值,去估计和 其目的在于通过后者的已知或设定值, 在于通过后者的已知或设定值 预测前者的(总体)均值。 (或)预测前者的(总体)均值。 • 两类变量; 两类变量;
–被解释变量(Explained Variable)或应变量(Dependent 被解释变量( 被解释变量 ) 应变量( Variable)。 )。 –解释变量(Explanatory Variable)或自变量 解释变量( 解释变量 ) (Independent Variable)。 )。
7
• 注意: 注意:
–不存在线性相关并不意味着不相关。 不存在线性相关并不意味着不相关。 不存在线性相关并不意味着不相关 –存在相关关系并不一定存在因果关系。 存在相关关系并不一定存在因果关系。 存在相关关系并不一定存在因果关系 – 相关分析对称地对待任何(两个)变量,两个变量 相关分析对称地对待任何(两个)变量, 对称地对待任何 都被看作是随机的。 都被看作是随机的。 – 回归分析对变量的处理方法存在不对称性,即区分 回归分析对变量的处理方法存在不对称性, 对变量的处理方法存在不对称性 应变量(被解释变量)和自变量(解释变量), ),前 应变量(被解释变量)和自变量(解释变量),前 者是随机变量,后者不一定是。 者是随机变量,后者不一定是。
圆面积 = f (π , 半径 ) = π ⋅ 半径
2
• 统计依赖或相关关系:研究的是非确定性现象 统计依赖或相关关系: 随机变量间的关系。 随机变量间的关系。
农作物产量 = f (气温, 降雨量, 阳光, 施肥量)
6
• 对变量间统计依赖关系的考察主要是通过相关 对变量间统计依赖关系的考察主要是通过相关 统计依赖关系的考察主要是通过 分析(correlation analysis)或回归分析 分析 或 (regression analysis)来完成的。 来完成的。 来完成的 • 相关分析适用于所有统计关系。 相关分析适用于所有统计关系。 适用于所有统计关系
15
每月可支配收入X(元)
2、总体回归函数
• 在给定解释变量 i条件下被解释变量 i的期望 在给定解释变量X 条件下被解释变量Y 轨迹称为总体回归线 总体回归线( 轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线 ),或更一般地称为 ),或更一般地称为总体回归曲线 (population regression curve)。 )。 • 相应的函数称为(双变量)总体回归函数 相应的函数称为(双变量) (population regression function, PRF)。 )。
• 称为总体回归函数(PRF)的随机设定形式。表 称为总体回归函数 总体回归函数( ) 随机设定形式。 明被解释变量除了受解释变量的系统性影响外, 明被解释变量除了受解释变量的系统性影响外, 还受其他因素的随机性影响。 还受其他因素的随机性影响。由于方程中引入了 随机项,成为计量经济学模型,因此也称为总体 随机项,成为计量经济学模型,因此也称为总体 回归模型(PRM)。 回归模型 。
µ i = Yi − E (Y | X i )
19
• 例2.1中,给定收入水平 i ,个别家庭的支出可 中 给定收入水平X 个别家庭的支出可 表示为两部分之和: 表示为两部分之和:
– 该收入水平下所有家庭的平均消费支出 该收入水平下所有家庭的平均消费支出E(Y|Xi),称 , 为系统性(systematic)或确定性(deterministic)部 系统性( ) 确定性( 部 分; – 其他随机或非确定性(nonsystematic)部分µi。 其他随机 非确定性( 随机或 部分
3
§2.1 回归分析概述 (Regression Analysis) )
一、变量间的关系及回归分析的基本概念 二、总体回归函数 三、随机扰动项 四、样本回归函数
4
一、变量间的关系及回归分析 的基本概念
5
1、变量间的关系
• 确定性关系或函数关系:研究的是确定性现象 确定性关系或函数关系: 非随机变量间的关系。 非随机变量间的关系。
9
二、总体回归函数 Population Regression Function, PRF
10
1、条件均值(conditional mean) 条件均值 • 例2.1:问题:某投资商想在某社区建立一 :问题 某投资商想在某社区建立一 超市,于是委托一研究小组研究该社区每 超市 于是委托一研究小组研究该社区每 月的家庭消费支出与家庭可支配收入的 关系.(假设该社区只有 个家庭 假设该社区只有100个家庭 个家庭) 关系 假设该社区只有
• 问题:能否从一次抽样中获得总体的近似信息? 问题:能否从一次抽样中获得总体的近似信息? 如果可以,如何从抽样中获得总体的近似信息? 如果可以,如何从抽样中获得总体的近似信息? • 例2.2:在例2.1的总体中有如下一个样本,能 2.2:在例2.1的总体中有如下一个样本, 2.1的总体中有如下一个样本 否从该样本估计总体回归函数? 否从该样本估计总体回归函数?
共计
2420
21450 21285
15510
13
• 由于不确定因素的影响,对同一收入水 由于不确定因素的影响, 平X,不同家庭的消费支出不完全相同; ,不同家庭的消费支出不完全相同; • 因此,给定收入X的值 ,可得消费支出 因此,给定收入 的值 的值Xi, Y的条件均值(conditional mean)或条 ) 的条件均值( 件期望(conditional expectation): 件期望( ): E(Y|X=Xi)。 。 • 该例中:E(Y | X=800)=605 该例中:
计量经济学 Econometrics
1
经典单方程计量经济学模型: 第二章 经典单方程计量经济学模型: 一元线性回归模型 The Classical Single Equation Econometric Model: Simple Regression Model
2
本章内容
• §2.1回归分析概述 • §2.2一元线性回归模型的参数估计 • §2.3一元线性回归模型的检验 • §2.4一元线性回归模型的预测
– – – – 相关系数(correlation coefficient) 相关系数 正相关(positive correlation) 正相关 负相关(negative correlation) 负相关 不相关(non-correlation) 不相关
• 回归分析仅对存在因果关系而言。 回归分析仅对存在因果关系而言。 仅对存在因果关系而言
E (Y | X i ) = β 0 + β 1 X i
是未知参数, 为线性函数。其中,β0,β1是未知参数,称为 线性函数。其中, 回归系数( 回归系数(regression coefficients)。 )。
17
三、随机扰动项 Stochastic Disturbance
18
• 总体回归函数说明在给定的收入水平 i下,该 总体回归函数说明在给定的收入水平X 社区家庭平均的消费支出水平。 社区家庭平均的消费支出水平。 • 但对某一个别的家庭,其消费支出可能与该平 但对某一个别的家庭, 均水平有偏差。 均水平有偏差。 • 称为观察值围绕它的期望值的离差 称为观察值围绕它的期望值的离差 ),是一个不可观测的随机变量 (deviation),是一个不可观测的随机变量, ),是一个不可观测的随机变量, 随机干扰项( 又称为随机干扰项 又称为随机干扰项(stochastic disturbance)或 ) 随机误差项( 随机误差项(stochastic error)。 )。
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 X Y 800 594 1100 638 1400 1122 1700 1155 2000 1408 2300 1595 2600 1969 2900 2078 3200 2585 3500 2530
E(Y | X i ) = f ( X i )
16
• 含义:回归函数(PRF)说明被解释变量 的 含义:回归函数( )说明被解释变量Y的 平均望)随解释变量 变化 的规律。 的规律。 • 函数形式:可以是线性或非线性的。 函数形式:可以是线性或非线性的。 • 例2.1中,将居民消费支出看成是其可支配收入 中 的线性函数时: 的线性函数时:
11
• 为达到此目的,该研究小组收集100户家 为达到此目的,该研究小组收集 户家 庭每月的可支配收入和消费支出,并按可 庭每月的可支配收入和消费支出 并按可 支配收入划分为组内收入差不多的10组 支配收入划分为组内收入差不多的 组, 以分析每一收入组的家庭消费支出。 以分析每一收入组的家庭消费支出。
• 产生并设计随机误差项的主要原因: 产生并设计随机误差项的主要原因:
–理论的模糊性; 理论的模糊性; 理论的模糊性 –数据的欠缺; 数据的欠缺; 数据的欠缺 –节省原则; 节省原则; 节省原则 –…… ……
21
四、样本回归函数 Sample Regression Function, SRF
22
1、样本回归函数
14
• 描出散点图发现:随着收入的增加,消费“平 描出散点图发现:随着收入的增加,消费“ 均地说”也在增加, 均地说”也在增加,且Y的条件均值均落在一 的条件均值均落在一 根正斜率的直线上。 根正斜率的直线上。