第二章经典单方程计量经济学模型：一元线性回归模型

合集下载

计量经济学期末考试重点

计量经济学期末考试重点第一章绪论1、什么是计量经济学？由哪三组组成？答：计量经济学是经济学的一个分支学科，是以揭示经济活动中客观存在的数量关系为内容的分支学科。

统计学、经济理论和数学三者结合起来便构成了计量经济学。

2、计量经济学的内容体系，重点是理论计量和应用计量和经典计量经济学理论方法方面的特征答：1）广义计量经济学和狭义计量经济学2）初、中、高级计量经济学3）理论计量经济学和应用计量经济理论计量经济学是以介绍、研究计量经济学的理论与方法为主要内容，侧重于理论与方法的数学证明与推导，与数理统计联系极为密切。

除了介绍计量经济模型的数学理论基础、普遍应用的计量经济模型的参数估计方法与检验方法外，还研究特殊模型的估计方法与检验方法，应用了广泛的数学知识。

应用计量经济学则以建立与应用计量经济学模型为主要内容，强调应用模型的经济学和经济统计学基础，侧重于建立与应用模型过程中实际问题的处理。

本课程是二者的结合。

4）、经典计量经济学和非经典计量经济学经典计量经济学（Classical Econometrics）一般指20世纪70年代以前发展并广泛应用的计量经济学。

经典计量经济学在理论方法方面特征是：⑴模型类型—随机模型；⑵模型导向—理论导向；⑶模型结构—线性或者可以化为线性，因果分析，解释变量具有同等地位，模型具有明确的形式和参数；⑷数据类型—以时间序列数据或者截面数据为样本，被解释变量为服从正态分布的连续随机变量；⑸估计方法—仅利用样本信息，采用最小二乘方法或者最大似然方法估计模型。

经典计量经济学在应用方面的特征是：⑴应用模型方法论基础—实证分析、经验分析、归纳；⑵应用模型的功能—结构分析、政策评价、经济预测、理论检验与发展；⑶应用模型的领域—传统的应用领域，例如生产、需求、消费、投资、货币需求，以及宏观经济等。

5）、微观计量经济学和宏观计量经济学3、为什么说计量经济学是经济学的一个分支？（4点和综述）答：（1）、从计量经济学的定义看（2）、从计量经济学在西方国家经济学科中的地位看（3）、从计量经济学与数理统计学的区别看（4）、从建立与应用计量经济学模型的全过程看综上所述，计量经济学是一门经济学科，而不是应用数学或其他。

计量经济学的2.2 一元线性回归模型的参数估计

基于样本数据，所得到的总体回归函数的一个估计函数称为样本回归函数。
问题：当我们设定总体回归模型的函数形式后，如何通过样本数据得到总体回归函数的一个估计（即样本回归函数）？--参数估计问题
E (Y | X i ) 0 1 X i
ˆ ˆ ˆ Yi f ( X i ) 0 1 X i
Xi确定
作此假设的理由：当我们把PRF表述为时，我们假定了X和u(后者代表所有被省略的变量的影响)对Y有各自的（并且可加的)影响。但若X和u是相关 25 的，就不可能评估它们各自对Y的影响。
线性回归模型的基本假设（4）
假设4、服从零均值、同方差、零协方差的正态分布 i~N(0, 2 ) i=1,2, …,n 意为：ui服从正态分布且相互独立。因为对两个正态分布的变量来说，零协方差或零相关意为这两个变量独立。作该假设的理由：i代表回归模型中末明显引进的许多解释
Yi 0 1 X i i
i=1,2,…,n
Y为被解释变量，X为解释变量，0与1为待估参数，为随机干扰项
3
回归分析的主要目的是要通过样本回归函数（模型）SRF尽可能准确地估计总体回归函数（模型）PRF。
ˆ ˆ ˆ Yi 0 1 X i
ˆ ˆ ˆ Yi 0 1 X i ui
同方差假设表明：对应于不同X值的全部Y值具有同样的重要性。
22
线性回归模型的基本假设（2-3）
假设2、随机误差项具有零均值、同方差和不自相关性(不序列相关)： (2.3) 不自相关： Cov(i, j|Xi, Xj)=0 i≠j i,j= 1,2, …,n 或记为 Cov(i, j)=0 i≠j i,j= 1,2, …,n 意为：相关系数为0， i, j非线性相关。几何意义如下

2.1回归分析概述

表 2.1.1 某社区家庭每月收入与消费支出统计表每月家庭可支配收入X（元） 800 每月家庭消费支出 Y （元） 561 594 627 638 1100 638 748 814 847 935 968 1400 869 913 924 979 1012 1045 1078 1122 1155 1188 1210 1700 1023 1100 1144 1155 1210 1243 1254 1298 1331 1364 1408 1430 1485 2000 1254 1309 1364 1397 1408 1474 1496 1496 1562 1573 1606 1650 1716 2300 2600 2900 1969 1991 2046 2068 2101 2189 2233 2244 2299 2310 3200 2090 2134 2178 2266 2354 2486 2552 2585 2640 3500 2299 2321 2530 2629 2860 2871 1408 1650 1452 1738 1551 1749 1595 1804 1650 1848 1672 1881 1683 1925 1716 1969 1749 2013 1771 2035 1804 2101 1870 2112 1947 2200 2002 4950 11495 16445 19305 23870 25025
2、回归分析的基本概念、回归分析(regression analysis) 回归分析(regression analysis)是研究一个变量关于另一个（些）变量的具体依赖关系的计算方法和理论。其目的其目的在于通过后者的已知或设定值，去估计和（或）预测前者的（总体）均值。被解释变量被解释变量（Explained Variable）或应变应变量（Dependent Variable）。解释变量解释变量（Explanatory Variable）或自变自变量（Independent Variable）。

计量经济学-2.1 一元回归模型

1122 1298 1496 1716 1969 1155 1331 1562 1749 2013
2244 2585 2299 2640
1188 1364 1573 1771 2035 2310
1210 1408 1606 1804 2101
1430 1650 1870 2112 1485 1716 1947 2200
–“衍生的随机误差”包含上述所有内容，并不一定服从极限法则，不一定满足基本假设。
–在§9.3中将进一步讨论。
四、样本回归函数 Sample Regression Function, SRF
1、样本回归函数
• 问题：能否从一次抽样中获得总体的近似信息？如果可以，如பைடு நூலகம்从抽样中获得总体的近似信息？
• 随机误差项主要包括下列因素：
–在解释变量中被忽略的因素的影响；
• 影响不显著的因素 • 未知的影响因素 • 无法获得数据的因素
–变量观测值的观测误差的影响；
–模型关系的设定误差的影响；
–其它随机因素的影响。
• 关于随机项的说明：
–将随机项区分为“源生的随机扰动”和“衍生的随机误差”。
–“源生的随机扰动”仅包含无数对被解释变量影响不显著的因素的影响，服从极限法则（大数定律和中心极限定理），满足基本假设。
• 关于变量的术语
– Explained Variable ~ Explanatory Variable – Dependent Variable ~ Independent Variable – Endogenous Variable ~ Exogenous Variable – Response Variable ~ Control Variable – Predicted Variable ~ Predictor Variable – Regressand ~ Regressor

计量经济学复习

第二章一元线性回归模型1.随机误差项形成的原因：① 在解释变量中被忽略的因素 ② 变量观测值的观测误差 ③ 模型的关系误差或设定误差 ④ 其他随机因素的影响。

2.总体回归方程和样本回归方程的区别和联系：总体回归方程是对总体变量间关系的定量表述,条件均值E(Y|X=x)是x 的一个函数 ,记作:E(Y|X=x)=f(x),其中,f(x)为x 的某个函数 ,它表明在X=x 下,Y 的条件均值与x 之间的关系。

但实际中往往不可能得到总体的全部资料 ,只能先从总体中抽取一个样本,获得样本回归方程 ,并用它对总体回归方程做出统计推断。

通过样本回归方程按照一定的准则近似地估计总体回归方程 ,但由于样本回归方程随着样本的不同而有所不同,所以这种高估或低估是不可避免的。

3.随机误差项的假定条件：（1）零均值：随机误差项具有零均值，即E( )=0，i=1，2，… （2）随机误差项具有同方差：即每个对应的随机误差项具有相同的常数方差。

Var( )=Var( )= ，i=1,2，… （3）无序列相关：即任意两个和所对应的随机误差项、是不相关的。

Cov( , )=E( )=0,i j,i,j=1,2,… （4）解释变量X 是确定性变量，与随机误差项不相关。

Cov( , )=E( )=0，此假定保证解释变量X 是非随机变量。

（5）服从正态分布，～N(0, )4.为什么用决定系数评价拟合优度，而不用残差平方和作为评价标准？判定系数 = = 1- ，含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣。

该值越大说明拟合得越好。

而残差平方和值的大小受变量值大小的影响,不适合具有不同量纲的模型的比较。

5.可决系数说明了什么？在简单线性回归中它与斜率系数的t 检验的关系是什么？可决系数是对模型拟合优度的综合度量 ,其值越大,说明在Y 的总变差中由模型作出了解释的部分占得比重越大 ,模型的拟合优度越高 ,模型总体线性关系的显著性越强。

2.1 线性回归模型概述

△几点注意
– 不线性相关并不意味着不相关；不线性相关并不意味着不相关； – 有相关关系并不意味着一定有因果关系；有相关关系并不意味着一定有因果关系； – 相关分析对称地对待任何（两个）变量，两变量，相关分析对称地对待任何对称地对待任何个变量都被看作是随机的；回归分析对变量的个变量都被看作是随机的；回归分析对变量的处理方法存在不对称性，即区分因变量（处理方法存在不对称性，即区分因变量（被解不对称性释变量）和自变量（解释变量）：前者是随机释变量）和自变量（解释变量）：前者是随机）：变量，后者不是。变量，后者不是。
• 回归与因果关系
– 回归分析研究的一个变量对另一个变量的依赖关系可以是一种因果关系，但也可能不是因果关系。 – 统计关系本身不可能意味着任何因果关系
• 回归与相关
– 回归分析和相关分析都是研究变量间关系的统计学课题 – 两者的主要差别：两者的主要差别： – ◇回归分析中需要区别自变量和因变量；相关分析回归分析中需要区别自变量和因变量；中则不需要区分 – ◇相关分析中所涉及的变量y与x全是随机变量。而相关分析中所涉及的变量y 全是随机变量。回归分析中，因变量y是随机变量，自变量x 回归分析中，因变量y是随机变量，自变量x 可以是随机变量，是随机变量，也可以是非随机的确定变量 –◇相关分析的研究主要是为刻画两类变量间线性相 ◇ 关的密切程度。而回归分析不仅可以揭示变量X 关的密切程度。而回归分析不仅可以揭示变量X对变量y的影响大小，变量y的影响大小，还可以由回归方程进行预测和控制
描出散点图发现：随着收入的增加，消费 “平均地说”也在增加，且Y的条件均值均落在平均地说” 平均地说总体回归线。一根正斜率的直线上。这条直线称为总体回归线总体回归线

计量经济学习题第2章-一元线性回归模型

第2章一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

A 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

A 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

A 都是随机变量B 都不是随机变量C 一个是随机变量，一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

A 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ－＝ D ˆ()ββ－为最小 6、对于01ˆˆi i iY X e ββ=++，以σˆ表示估计标准误差，Y ˆ表示回归值，则__________。

A i i ˆˆ0Y Y 0σ∑＝时，（－）＝B 2iiˆˆ0Y Y σ∑＝时，（－）＝0 C ii ˆˆ0Y Y σ∑＝时，（－）为最小 D 2iiˆˆ0Y Yσ∑＝时，（－）为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+，则普通最小二乘法确定的i ˆβ的公式中，错误的是__________。

A ()()()i i 12iX X Y -Y ˆX X β--∑∑＝B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑＝C ii122iX Y -nXY ˆX -nXβ∑∑＝ D i i ii12xn X Y -X Y ˆβσ∑∑∑＝8、对于i 01i iˆˆY =X +e ββ+，以ˆσ表示估计标准误差，r 表示相关系数，则有__________。

计量经济学2.1 回归分析概述

（*）式称为总体回归函数（方程）PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外，还受其他因素的随机性影响。由于方程中引入了随机项，成为计量经济学模型，因此也称为总体回归模型。
28
引入随机误差项的主要原因（1）
1）存在未知的影响被解释变量的因素
理论模糊性使得无法知道或确定所有影响因素
9
相关分析与回归分析的区别
对变量间统计依赖关系的考察有两种易混淆的分析方法：（1）相关分析(correlation analysis)：测度两个变量之间的线性关联力度。（可通过相关系数来判定）
（2）回归分析(regression analysis)：考察一个变量如何依赖于另一个变量而变化。从而试图根据一个变量的设定值来估计或预测另一变量的平均值。
例2.1中，个别家庭的消费支出为：
(*) 即，给定收入水平Xi ,个别家庭的支出可表示为两部分之和: （1）该收入水平下所有家庭的平均消费支出E(Y|Xi)，称为系统性（systematic）或确定性（deterministic)部分。（2）其他随机或非确定性（nonsystematic)部分i。
30
回归分析概念--样本回归函数（SRF）
总体的信息往往无法掌握，现实的情况只能是在一次观测中得到总体的一个样本。
ห้องสมุดไป่ตู้
问题：能从一次抽样中获得总体的近似的信息吗？如果可以，如何从抽样中获得总体的近似信息？例2.2：在例2.1的总体中有如下一个样本，
问：能否从该样本估计总体回归函数PRF？
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y X 800 594 1100 638 1400 1122 1700 1155 2000 1408 2300 1595 2600 1969 2900 2078 3200 2585 3500 2530

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 第二章经典单方程计量经济学模型：一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。首先，本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始，建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述，由总体回归模型在若干基本假设下得到，但它只是建立在理论之上，在现实中只能先从总体中抽取一个样本，获得样本回归函数，并用它对总体回归函数做出统计推断。本章的一个重点是如何获取线性的样本回归函数，主要涉及到普通最小二乘法（OLS）的学习与掌握。同时，也介绍了极大似然估计法（ML）以及矩估计法（MM）。本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断，即进行所谓的统计检验。统计检验包括两个方面，一是先检验样本回归函数与样本点的“拟合优度”，第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次：第一，检验解释变量对被解释变量是否存在着显著的线性影响关系，通过变量的t检验完成；第二，检验回归函数与总体回归函数的“接近”程度，通过参数估计值的“区间检验”完成。本章还有三方面的内容不容忽视。其一，若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二，参数估计量统计性质的分析，包括小样本性质与大样本性质，尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三，运用样本回归函数进行预测，包括被解释变量条件均值与个值的预测，以及预测置信区间的计算及其变化特征。

二、典型例题分析例1、令kids表示一名妇女生育孩子的数目，educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为 educkids

10 2

（1）随机扰动项包含什么样的因素？它们可能与教育水平相关吗？（2）上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗？请解释。解答：（1）收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素，在上述简单回归模型中，它们被包含在了随机扰动项之中。有些因素可能与教育水平相关，如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。（2）当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时，上述回归模型不能够揭示教育对生育率在其他条件不变下的影响，因为这时出现解释变量与随机扰动项相关的情形，基本假设4不满足。例2．已知回归模型NE，式中E为某类公司一名新员工的起始薪金（元），N为所受教育水平（年）。随机扰动项的分布未知，其他所有假设都满足。（1）从直观及经济角度解释和。

（2）OLS估计量ˆ和ˆ满足线性性、无偏性及有效性吗？简单陈述理由。（3）对参数的假设检验还能进行吗？简单陈述理由。解答：

（1）N为接受过N年教育的员工的总体平均起始薪金。当N为零时，平均薪金

为，因此表示没有接受过教育员工的平均起始薪金。是每单位N变化所引起的E的变化，即表示每多接受一年学校教育所对应的薪金增加值。（2）OLS估计量ˆ和仍ˆ满足线性性、无偏性及有效性，因为这些性质的的成立无需随机扰动项的正态分布假设。（3）如果t的分布未知，则所有的假设检验都是无效的。因为t检验与F检验是建立在的正态分布假设之上的。例3、在例2中，如果被解释变量新员工起始薪金的计量单位由元改为100元，估计的截距项与斜率项有无变化？如果解释变量所受教育水平的度量单位由年改为月，估计的截距项与斜率项有无变化？解答：首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金，则

NEE100*

由此有如下新模型 )100/()100/()100/(*NE 3

或 ****NE 这里100/*，100/*。所以新的回归系数将为原始模型回归系数的1/100。再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度，则N*=12N，于是

)12/*(NNE

或 *)12/(NE 可见，估计的截距项不变，而斜率项将为原回归系数的1/12。例4．对于人均存款与人均收入之间的关系式tttYS使用美国36年的年度数据得如下估计模型，括号内为标准差：

)011.0()105.151(067.0105.384ˆttYS

2R ＝0.538 023.199ˆ

（1）的经济解释是什么？（2）和的符号是什么？为什么？实际的符号与你的直觉一致吗？如果有冲突的话，你可以给出可能的原因吗？（3）对于拟合优度你有什么看法吗？（4）检验是否每一个回归系数都与零显著不同（在1%水平下）。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么？解答：

（1）为收入的边际储蓄倾向，表示人均收入每增加1美元时人均储蓄的预期平均变

化量。（2）由于收入为零时，家庭仍会有支出，可预期零收入时的平均储蓄为负，因此符号应为负。储蓄是收入的一部分，且会随着收入的增加而增加，因此预期的符号为正。实际的回归式中，的符号为正，与预期的一致。但截距项为负，与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为，省略该变量将对截距项的估计产生影响；另一种可能就是线性设定可能不正确。（3）拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度，表明收入的变化可以解释储蓄中53.8 %的变动。（4）检验单个参数采用t检验，零假设为参数为零，备择假设为参数不为零。双变量 4

情形下在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知，双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09，截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值，截距项小于临界值，因此拒绝斜率项为零的假设，但不拒绝截距项为零的假设。

三、教材中部分习题 2.1、为什么计量经济学模型的理论方程中必须包含随机干扰项？计量经济模型考察的是具有因果关系的随机变量间的具体联系方式。由于是对基变量，意味着影响被解释变量的因素是复杂的除了解释变量的影响外，还有其他无法在模型中独立列出的各种因素的影响。这样，模型中就必须使用一个随机干扰项变量来代表所有这些在模型中无法独立表示出来的影响因素。（或见第一章习题） 2-2．下列方程哪些是正确的？哪些是错误的？为什么？ ⑴ yxtntt12,,, ⑵ yxtnttt12,,,

⑶ yxtnttt,,,12

⑷ ,,,yxtnttt12 ⑸ yxtntt,,,12 ⑹ ,,,yxtntt12 ⑺ yxtnttt,,,12 ⑻ ,,,yxtnttt12 其中带“＾”者表示“估计值”。答：错；正；错；错；错；正，正，错。

2.3、线性回归模型有哪些基本假设？违背基本假设的计量经济学模型是否就不可估计？答：线性回归模型的基本假设（实际是针对普通最小二乘法的基本假设）有两大类：一类是关于解释变量的，解释变量是确定性变量，而且如果是随机变量则解释变量与随机干扰项之间互不相关；一类是关于随即干扰项的，随机误差项具有0均值和同方差；随机误差项在不同样本点之间是独立的，不存在序列相关；随机误差项与解释变量之间不相关；随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的，只是不能使用普通最小二乘法进行估计。 5

2.4、线性回归模型 yxtnttt12,,,

的0均值假设是否可以表示为101nttn？为什么？（答：严格来说，随机干扰项的0均值假设是关于X的条件期望为0，线性回归模型：tttxy中的0均值假设0)E(2u不可以表示为：101nttn，因为前者表示取

完所的可能的样本组合后的平均状态，而后者只是一个样本的平均值。）二者是两个完全不同的概念。 2.5、假设已经得到01YX关系的最小二乘估计，试回答：假设决定把X变量的计量单位扩大10倍，这样对远回归的斜率和截距有何影响？如果Y变量的单位扩大10倍，又会怎样？

答：01010110/10,1010.1010XXXXYXXX记为原变量计量单位扩大倍的变量，。于是所以，解释变量的单位扩大倍，回归的截距不变，斜率项将为原系数的倍。其他问题方法相同。

如果Y变量的计量单位扩大10倍，斜率和截距系数都将为原始模型回归系数的1/10 2.10、下面数据是对X和Y的观察值得到的。 ∑Yi=1110； ∑Xi=1680； ∑XiYi=204200∑Xi2=315400； ∑Yi2=133300假定满足所有的古典线性回归模型的假设，要求：（1）b1和b2？（2）b1和b2的标准差？（3）r2？（4）对B1、B2分别建立95%的置信区间？利用置信区间法，你可以接受零假设：B2=0吗？

(解：⑴168nXXi，111nYYi

177201111681011101681111680204200)())((YXXYXYYXYYXXiiiiii