计量经济学第7章 含有定性信息的多元回归分析

合集下载

计量经济学多元回归

计量经济学多元回归

一、数据调入二、Y与T, L ,K 的多元回归43.7781.067.025.078.067.068.7732.675-+++-=kl t y系数显著性临界值16.2)13(t )1317(t 0.0252==--α因为7.43>2.16,k 的系数通过显著性检验 其他的没有通过 方程的显著性检验3439.3551.10183439.3)14,3()1,(05.0>===--F F K N K F α9948.09958.022==R R563.179=SE方程的整体效果显著,但3个系数检验没有通过22R R 查找方法Se查找方法F查找方法(0.05,3,13),T的查询方法同上TINYAIC=13.42125SC=三、剔除时间变量的二元线性回归模型最不显著的先剔除533.14427.4922.2834.0208.1269.2387-++-=kl y系数显著性临界值145.2)14(t )1217(t 0.0252==--α因为2.922>2.16,4.43>2.16,14.53>2.16 系数通过显著性检验 方程的显著性检验74.3953.158974.3)14,2()1,(05.0>===--F F K N K F α方程整体效果显著9950.09956.022==R R0069.176=SE AIC=13.3377 SC=13.48475经济意义检验在K 不变的条件下,在劳力l 增加一个单位产值将增加1.21个单位。

在劳力L 投入不变的条件下将资产k 增加一个单位,产值将增加0.83个单位。

经济意义上不尽合理 三、逐步回归法分别作Y 与T 、L 、K 的一元回归1139.22113.91172.485194.2041Ty +-=系数显著性临界值13.2)15(t )1117(t 0.0252==--α因为9.113>2.13,22.114>2.13,系数通过显著性检验 方程的显著性检验74.357.49254.4)15,1()1,(05.0>===--F F K N K F α方程整体效果显著 968.0970.022==R R 512.441=SE AIC=15.13 SC=15.23经济意义检验95.436.995.492.13046-+-=Ly系数显著性临界值 13.2)15(t )1117(t 0.0252==--α因为9.36>2.13, 4.95>2.13,系数通过显著性检验方程的显著性检验74.3734.19354.4)15,1()1,(05.0>===--F F K N K F α方程整体效果显著 925.0929.022==R R 98.681=SE AIC=16.00 SC=16.10经济意义检验56.3787.7074.1424.1200k y +-= 系数显著性临界值13.2)15(t )1117(t 0.0252==--α因为7.87>2.13, 37.56>2.13,系数通过显著性检验 方程的显著性检验74.310.141154.4)15,1()1,(05.0>===--F F K N K F α方程整体效果显著 98878.0989.022==R R40.263=SE AIC=14.095 SC=14.19经济意义检验在系数检验显著条件下R 2 F 越大越好 aic ,sc 越小越好选择一元模型(y c k )二、以k 为基础即二元中必须包括k (对比ykt ,ykl ) 382.4904.8443.120728.163727.0370.1417l k y ++= 系数显著性临界值145.2)14(t )1217(t 0.0252==--α因为12.443>2.16,8.904>2.16,4.382>2.16 系数通过显著性检验 方程的显著性检验74.3301.157174.3)14,2()1,(05.0>===--F F K N K F α方程整体效果显著 9950.09956.022==R R 04.177=SE AIC=13.35 SC=13.50 经济意义检验。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解
伍德里奇《计量经济学导论》(第5 版)笔记和课后习题详解
读书笔记模板
01 思维导图
03 目录分析 05 读书笔记
目录
02 内容摘要 04 作者介绍 06 精彩摘录
思维导图
本书关键字分析思维导图
第版
计量经济 学
时间
习题
序列
经典
变量
笔记
教材
笔记 复习
模型
导论
笔记
第章
习题
分析
数据
回归
内容摘要
本书是伍德里奇《计量经济学导论》(第5版)教材的配套电子书,主要包括以下内容:(1)整理名校笔记, 浓缩内容精华。每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经 济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。(2)解析课后习 题,提供详尽答案。本书参考国外教材的英文答案和相关资料对每章的课后习题进行了详细的分析和解答。(3) 补充相关要点,强化专业知识。一般来说,国外英文教材的中译本不太符合中国学生的思维习惯,有些语言的表 述不清或条理性不强而给学习带来了不便,因此,对每章复习笔记的一些重要知识点和一些习题的解答,我们在 不违背原书原意的基础上结合其他相关经典教材进行了必要的整理和分析。本书特别适用于参加研究生入学考试 指定考研考博参考书目为伍德里奇所著的《计量经济学导论》的考生,也可供各大院校学习计量经济学的师生参 考。

2.1复习笔记 2.2课后习题详解
3.1复习笔记 3.2课后习题详解
4.1复习笔记 4.2课后习题详解
5.1复习笔记 5.2课后习题详解
6.1复习笔记 6.2课后习题详解
7.1复习笔记 7.2课后习题详解

计量经济学中的回归分析方法

计量经济学中的回归分析方法

计量经济学中的回归分析方法计量经济学是经济学中的一个重要分支,它主要是利用经济数据来进行定量分析。

而对于计量经济学来说,最重要的方法之一就是回归分析。

回归分析方法可以用来寻找变量之间的关系,进而预测未来的趋势和结果。

本文将介绍回归分析方法的基本原理及其在计量经济学中的应用。

回归分析的基本原理回归分析是一种利用数据来寻找变量之间关系的方法,其核心原理是利用多元线性回归模型。

多元线性回归模型可以描述多个自变量与一个因变量之间的关系,如下所示:Y = β0 + β1X1 + β2X2 + … + βkXk + ε其中,Y表示因变量,即需要预测的变量;X1、X2、 (X)表示自变量,即可以通过对它们的变化来预测Y的变化;β0、β1、β2、…、βk表示模型中的系数,它们可以反映每个自变量对因变量的影响;ε表示误差项,即预测结果与真实值之间的差异。

利用回归分析方法,我们可以通过最小化误差项来得到最佳的系数估计值,从而建立一个能够准确预测未来趋势和结果的模型。

回归分析的应用在计量经济学中,回归分析被广泛应用于各个领域。

下面我们以宏观经济学和微观经济学为例,来介绍回归分析在计量经济学中的具体应用。

1. 宏观经济学:用回归分析预测国内生产总值(GDP)国内生产总值是一个国家经济发展的重要指标,因此预测GDP 的变化是宏观经济学研究的重点之一。

在这个领域,回归分析可以用来寻找各种经济因素与GDP之间的关系,进而通过对这些因素的预测来预测GDP的变化。

例如,我们可以通过回归分析来确定投资、消费、进出口等因素与GDP之间的关系,进而利用这些关系来预测未来的GDP变化。

2. 微观经济学:用回归分析估算价格弹性在微观经济学中,回归分析可以用来估算价格弹性。

价格弹性可以衡量消费者对价格变化的敏感度,其计算公式为:价格弹性= %Δ数量÷ %Δ价格例如,如果价格变化1%,相应数量变化1.5%,那么价格弹性就是1.5 ÷ 1 = 1.5。

计量经济学-7多重共线性

计量经济学-7多重共线性

2 2
因此,存在完全共线性时,不能利用OLS估计参数,参数的 方差变为无限大。
计量经济学
2.不完全多重共线性
假定X1,X2 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机项。则
x1 x2 vi
ˆ 1
[ yi ( xi 2 vi )]( x i22 ) ( yi xi 2 )[ ( xi 2 vi ) xi 2 ] [ ( xi 2 vi ) 2 ]( x i22 ) [ ( xi 2 vi ) xi 2 ]2
计量经济学
6、无多重共线。设( X i1,X i 2, ,X iP)为 (X 1,X 2, ,X P)的第i个观测值, 1 1 记: X 1 X 11 X 21 X n1 X 12 X 22 X n2 X 1P X 2P X nP
4、OLS估计量对观测值的轻微变化相当敏感。
计量经济学
三、多重共线的检验
1、利用解释变量之间的拟合优度(判定系数)检验法 ①每次以一个解释变量对余下的P-1个解释变量做回归, 即建立P个回归方程: 2 X1 g ( X , X , , X ) R 1 2 3 P 1
X2 g ( ,X 3, ,X P) 2 X1 X P g( ,X 2, ,X P 1) p X1
计量经济学
2、利用先验信息 假定对回归模型:
Yi 0 1 X i1 2 X i 2 ui
已知X1和X2 之间高度共线。根据先验信息,确定β2=2β1, 带入模型后可得:
Yi 0 1 X i1 2 1 X i 2 ui 0 1 ( X i1 2 X i 2 ) ui 设变量Z i ( X i1 2 X i 2 ), 估计方程 Yi 0 1Z i ui ˆ 和 ˆ 2 ˆ。 可得到

计量经济学 多元线性回归分析PPT44页

计量经济学 多元线性回归分析PPT44页
55、 为 中 华 之 崛起而 读书。 ——周 恩来
计量经济学 多元线性回归分 析
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞 不前时 ,我继 续拼搏 。
谢谢!
51、 天 下 之 பைடு நூலகம் 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
33、如果惧怕前面跌宕的山岩,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可 以被永 远肯定 。

计量经济学多元线性回归模型

计量经济学多元线性回归模型
习惯上:把常 数项看成为一 虚变量的系数, (3-1) 该虚变量的样 本观测值始终 取1。这样: 模型中解 释变量的数目 为(k+1)
Y1 Y 2 Yn
1 1 1
X 11 X 12 X 1n
X 21 X 22 X 2n
X k1 Xk2 X kn
第三章
◆ 学习目的
多元线性回归模型
理解多元线性回归模型的矩阵表示,掌握 多元线性回归模型的参数估计、检验和预测。
第三章
◆ 基本要求
多元线性回归模型
1)理解多元线性回归模型的矩阵表示,了解多元线性回归模型的基本假设;
2)掌握多元线性回归模型的普通最小二乘参数估计方法,了解多元线性回归模 型的普通最小二乘参数估计量与样本回归线的性质、多元线性回归模型的随机误 差项方差的普通最小二乘参数估计; 3)学会对多元线性回归模型进行拟合优度检验,对多元线性回归模型的参数进 行区间估计,对多元线性回归模型进行变量显著性检验和方程显著性检验;

Y1 Y Y 2 Yn
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 Xk2 X kn
0 1 k
1 2 n
二、多元线性回归模型的基本假设
一、多元线性回归模型的矩阵表示
Y1 0 1 X 11 2 X 21 k X k1 1 Y X X X 2 0 1 12 2 22 k k2 2 Yn 0 1 X 1n 2 X 2 n k X kn n
0 1 k

经济统计学中的多元线性回归分析

经济统计学中的多元线性回归分析

经济统计学中的多元线性回归分析经济统计学是研究经济现象的一门学科,通过对经济数据的收集、整理和分析,帮助我们了解经济运行规律和预测未来走势。

而多元线性回归分析是经济统计学中一种常用的分析方法,用来研究多个自变量对一个因变量的影响程度。

多元线性回归分析的基本原理是通过建立一个数学模型,来描述自变量与因变量之间的关系。

在经济统计学中,自变量通常是影响经济现象的各种因素,如GDP、通货膨胀率、利率等;而因变量则是我们想要研究的经济现象本身,比如消费水平、投资额等。

通过多元线性回归分析,我们可以了解各个因素对经济现象的贡献程度,从而更好地理解和预测经济运行情况。

在进行多元线性回归分析之前,我们首先需要收集相关的数据。

这些数据可以通过各种途径获得,如调查问卷、统计年鉴、金融报表等。

然后,我们需要对数据进行整理和清洗,以确保数据的准确性和可靠性。

接下来,我们可以使用统计软件,如SPSS、Excel等,来进行回归分析。

多元线性回归分析的核心是建立回归模型。

回归模型可以用数学公式表示为:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε,其中Y表示因变量,X1、X2、...、Xn表示自变量,β0、β1、β2、...、βn表示回归系数,ε表示误差项。

回归系数表示自变量对因变量的影响程度,而误差项则代表模型无法解释的部分。

在建立回归模型之后,我们需要进行模型的检验和解释。

模型检验可以通过各种统计指标来进行,如R方、调整R方、F统计量等。

R方表示回归模型对因变量变异的解释程度,数值越接近1,说明模型的拟合程度越好。

F统计量则表示回归模型的整体显著性,数值越大,说明模型的拟合程度越好。

除了模型检验,我们还可以通过回归系数的显著性检验来解释模型。

回归系数的显著性检验可以通过计算t值和p值来进行。

t值表示回归系数与零之间的差异程度,而p值则表示这种差异是否显著。

一般来说,当p值小于0.05时,我们可以认为回归系数是显著的,即自变量对因变量的影响是存在的。

多元回归定量分析

多元回归定量分析

异方差问题
• 这时候就产生异方差问题。 • 如果异方差,出有什么影响呢?
– 无偏性有影响吗? – 一致性有影响吗? – T检验ቤተ መጻሕፍቲ ባይዱ影响吗? – F检验有影响吗? – 渐近性有影响吗?
• 如何解决异方差问题
项目评价的进一步讨论
• 内生性的一般解释
Y 0 1X u
• 内生性的简单办法?
– 可观察因素:加变量 – 不可观察因素:
• 检验不同组回归函数的区别 • 线性概率模型 • 对项目评价的进一步讨论
• 把总体的样本分成两组:男性和女性。 • 对男性和女性分别做这样的回归:P239
cumgpa 0 1sat 2hsperc 3tothrs u
• 现在,如果我们想检验,男性和女性所有 的回归系数是否一样,应该怎么做?
– 截距不同 – 斜率也不同
• 看下面的这个方程:
cumgpa (0 0 female) (1 1 female)sat (2 2 female)hsperc (3 3 female)tothrs u
• 这个方程意味着什么呢?检验上面的假设, 实际上就是:
0 0,1 0,2 0,3 0
• 上面的方程可以写为:
cumgpa 0 0 female 1sat 1 female *sat 2hsperc 2 female*hsperc 3tothrs 3 female *tothrs u
普通的F检验
• 在上面的方程中,我们就可以构建普通的F 检验。P144 4.37 P149 4.41
F (SSRr SSR ur ) / q SSR ur /(n k 1)
F
(R2ur (1 R2ur
R2r ) ) / (n
/q k 1)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 第7章 含有定性信息的多元回归分析: 二值(或虚拟)变量 在前面几章中,我们的多元回归模型中的因变量和自变量都具有定量的含义。就像小时工资率、受教育年数、大学平均成绩、空气污染量、企业销售水平和被拘捕次数等。在每种情况下,变量的大小都传递了有用的信息。在经验研究中,我们还必须在回归模型中考虑定性因素。一个人的性别或种族、一个企业所属的产业(制造业、零售业等)和一个城市在美国所处的地理位置(南、北、西等)都可以被认为是定性因素。 本章的绝大部分内容都在探讨定性自变量。我们在第7.1节介绍了描述定性信息之后,又在第7.2、7.3和7.4节中说明了,如何在多元回归模型中很容易地包含定性的解释变量。这几节几乎涵盖了定性自变量用于横截面数据回归分析的所有流行方法。 我们在第7.5节讨论了定性因变量的一种特殊情况,即二值因变量。这种情形下的多元回归模型具有一个有趣的含义,并被称为线性概率模型。尽管有些计量经济学家对线性概率模型多有中伤,但其简洁性还是使之在许多经验研究中有用武之地。虽然我们在第7.5节将指出其缺陷,但在经验研究中,这些缺陷常常都是次要的。

7.1 对定性信息的描述 定性信息通常以二值信息的形式出现:一个人是男还是女;一个人有还是没有一台个人计算机;一家企业向其一类特定的雇员提供还是不提供退休金方案;一个州实行或不实行死刑。在所有这些例子中,有关信息可通过定义一个二值变量(binary variable)或一个0-1变量来刻画。在计量经济学中,对二值变量最常见的称呼是虚拟变量(dummy variable),尽管这个名称并不是特别形象。 在定义一个虚拟变量时,我们必须决定赋予哪个事件的值为1和哪个事件的值为0。比如,在一项对个人工资决定的研究中,我们可能定义female为一个虚拟变量,并对女性取值1,而对男性取值0。这种情形中的变量名称就是取值1的事件。通过定义male在一个人为男性时取值1并在一个人为女性时取值0,也能刻画同样的信息。这两种情况都比使用gender更好,因为这个名称没有指出虚拟变量何时取值1:gender=1对应于男性还是女性?虽然怎样称呼变量对得到回归结果而言并不重要,但它总有助于选择那些使方程和阐述都更清晰的变量。

表7.1 WAGE1.RAW中的局部数据列表 个人编号 wage educ exper female married 1 3.10 11 2 1 0 2 3.24 12 22 1 1 3 3.00 11 2 0 0 4 6.00 8 44 0 1 5 5.30 12 7 0 1

      525 11.56 16 5 0 1 526 3.50 14 5 1 0

问题7.1 假设在一项比较民主党和共和党候选人之间选举结果的研究中,你想标明每个候选人所在的党派。在这种情形中,名称party是二值变量的一个明智选择吗?更好的名称是什么? 2

假设我们在工资的例子中已选择了female来表示性别。此外,我们还定义了一个二值变量married,并在一个人已婚时取值1,而在其他情况下取值0。表7.1给出了可能得到的一个数据集的部分列表。我们看到,第1个人为女性并且未婚,第2个人为女性并且已婚,第3个人为男性并且未婚,等等。 我们为什么要用数值0和1来描述定性信息呢?在某种意义上,这些值是任意的:用任意两个不同的数值都是一样的。使用0-1变量来刻画定性信息的真正好处,像我们将看到的那样,在于它导致回归模型中的参数有十分自然的解释。

7.2 只有一个虚拟自变量 我们如何在回归模型中引入二值信息呢?在只有一个虚拟解释变量的最简单情形中,我们只在方程中增加一个虚拟变量作为自变量。比如,考虑如下决定小时工资的简单模型:

.100ueducfemalewage (7.1)

我们用0表示female的参数,以强调虚拟变量参数的含义;以后,无论如何,我们还是使用最方便的符号。 在模型(7.1)中,只有两个被观测因素影响工资:性别和受教育水平。由于对女性female=1,而对男性female=0,所以参数0具有如下含义:给定同等受教育程度(和同样的误差项u),0是女性与男性之间在

小时工资上的差异。因此,系数0决定了是否对女人存在歧视:如果0<0,那么在其他因素的相同水平下,女人总体上挣得要比男人少。 用期望的术语来讲,如果我们假定了零条件均值假定E(ufemale, educ)=0,那么

0= E(wagefemale=1, educ) E(wagefemale=0, educ).

由于female=1对应于女性和female=0对应于男性,所以我们可以更简单地把这个模型写成 0= E(wagefemale, educ) E(wagemale, educ). (7.2)

这里的关键在于,在两个预期中,受教育水平是相同的;差值0只是由于性别所致。 这种情况可以在图上描绘成男性与女性之间的截距迁移(intercept shift)。在图7.1中,给出了0<0的情形,从而男人比女人每小时都多挣一个固定的数量。这个差距与受教育水平无关,这就解释了为什么女人和男人的工资-受教育变化关系是平行的。

图7.1 .100ueducfemalewage在0<0情况下的图示 3

这里,你可能想知道为什么我们没有在(7.1)中还包括一个虚拟变量male,它对男性取值1和对女性取值0。原因在于,这样做是多余的。在(7.1)中,男性线的截距是0,女性线的截距是0+0。由于只有两

组数据,所以我们只需要两个不同的截距。这意味着,除了0之外,我们只需要一个虚拟变量;我们已经选择了针对女性的虚拟变量。由于female+male =1意味着male是female的一个完全线性函数,所以使用两个虚拟变量将导致完全多重共线性。包括两个性别的虚拟变量是所谓虚拟变量陷阱(dummy variable trap)中最简单的例子,当使用过多的虚拟变量来描述一定组数的数据时,就会掉进这种虚拟变量陷阱。我们以后还要讨论这个问题。 在(7.1)中,我们已经选择了男性为基组(base group)或基准组(benchmark group),即与之进行比较的那一

组。这就是为什么0表示了男性的截距,而0为女性与男性之间在截距上的差异。通过将模型写成

ueducmalewage100

我们就能选择女性为基组,其中女性的截距是0,而男性的截距是0+0;这意味着0=0+0和0+0 =0。在任何一个实际应用中,我们如何选择基组都不重要,但重要的是,要保持基组不变。 有些研究者喜欢将模型中的总截距去掉,而将每一组的虚拟变量都包括进来。那么,这里的方程就是ueducfemalemalewage100,其中男人的截距是0,女人的截距是0

。在这种情形下,

因为没有总截距,所以不存在虚拟变量陷阱。但由于检验截距的差值更困难,而且对不含截距项的回归怎样计算R平方没有一个一致同意的方法,所以这个表达式很少有人使用。因此,我们将总是引进一个总的截距项作为基组的截距。 当解释变量更多时并没有什么大的改变。取男性那一组为基组,除了控制受教育水平之外,还控制工作经历和现职任期的一个模型是

.exp32100utenureereducfemalewage (7.3)

如果educ、exper和tenure都是相关的生产力特征,那么男人与女人之间没有差别的虚拟假设是H0:0=0。对立假设是,对女人存在歧视H1:0<0。 我们怎样才能对工资歧视进行实际检验呢?回答很简单:完全像从前那样用OLS来估计模型,并使用通常的t统计量。当某些自变量被定义为虚拟变量时,在OLS的操作和统计理论方面都没有任何改变。迄今为止,唯一的改变是我们对虚拟变量系数的解释。

例7.1 小时工资方程 利用WAGE1.RAW中的数据,我们估计模型(7.3)。目前,我们还是使用wage而不是log(wage)作为因变量:

tenureereducfemalegeaw141.0exp025.0572.081.157.1ˆ (0.72) (0.26) (0.049) (0.012) (0.021) (7.4) n=526, R2=0.364. 4

负的截距(这里是男人组的截距)不是很有意义,因为样本中没有一个人具有接近于零年的educ、exper和tenure。female的系数则很有意思,因为它度量的是;在给定相同水平的educ、exper和tenure的情况下,一个女人和一个男人之间每小时在工资上的平均差距。如果我们找到受教育水平、工作经历和现职任期相同的一个女人和一个男人,那么平均来看,女人每小时比男人要少挣1.81美元。(要记住,这可是用1976年的工资水平来度量的呀!) 重要的是记住,由于我们已经进行了多元回归并控制了educ、exper和tenure,所以这1.81美元的工资差距不能由男人和女人之间在受教育水平、工作经历和现职任期水平上的平均差距来解释。我们可以断定,这1.81美元的差别,是由于性别或我们在回归中没有控制的与性别相关的因素所导致的。 将方程(7.4)中female的系数,与把所有其他解释变量都从方程中去掉时所得到的系数估计值相比,是颇有意义的:

femalegeaw51.210.7ˆ (0.21) (0.30) (7.5) n=526, R2=0.116. (7.5)中的系数具有一个简单的解释。这个截距就是样本中男人的平均工资(令female=0),所以男人平均每小时挣7.10美元。female的系数为女人和男人之间平均工资的差距。因此,样本中女人的平均工资是7.10 2.51=4.59,或每小时4.59美元。(顺便提一下,样本中有274个男人和252个女人。) 方程(7.5)为男人和女人这两组之间进行均值比较检验提供了一个简单的方法。估计差别2.51的t统计量8.37在统计上是十分显著的(当然2.51在经济上也相当大)。一般而言,对一个常数和一个虚拟变量进行简单回归,是比较两组均值的直接方法。要通常的t统计量生效,我们还必须假定同方差性,这就意味着,对男人和对女人而言,工资的总体方程是相同的。 由于方程(7.5)没有控制受教育水平、工作经历和现职任期上的差异,而且总体上说,在这个样本中,女人的受教育水平、工作经历和现职任期比男人要低些,所以估计出来的男女工资差异比(7.4)要大。方程(7.4)给出了性别工资差距在其他条件不变情况下更可靠的估计值;它仍显示出一个很大的差别。

相关文档
最新文档