选择偏差_比较优势与教育的异质性回报_基于中国微观数据的实证研究
教育回报率的性别差异实证分析

s 是从 小学 开始 算 起接 受教 育 的时 问跨 度 , 对 工作 年 限t 的测算 , 则 用 “ 2 0 0 5 一 出 生年 份一 s 一6 ”得 到 。本 文 共选 用 4 8 1 5 个 样 本 数据 , 居 民平 均年 收 入9 9 5 5 . 6 0 元 , 平 均受 教 育 8 . 5 9 年 , 平 均 已经 工作 了3 0 程 进 行分 析 , 将性 别作 为 虚 拟变 量 加 入 到模 型 中进 行 回 归 , 并 不 能 多 年 。具体 的数 据如 表2 所示 。 完 全反 映 教育 回报率 的性 别差 异 , 很 多学 者 虽然 进 行 了分性 别 的研 本 文将 样 本 分 为 男 女两 类 群 体 , 其 中男性 样 本 有 2 3 0 8 人, 女 性 究, 但 性 别 并不 是 主要 的 关注 点 , 所 以没有 进 行 更深 入 的 阐释 。( 表
一
、
引 言
近年 来 , 我 国 高校 普 遍 扩 招 , 随之 而 来 的 是人 数 逐 年 增 多 的 毕
1 )
本 文 采用 全 国综 合 社 会 调查 的数 据 ( C G S S ) , 运 用 明 瑟 收 入方 业生 , 而 空 缺职 位供 不应 求 , 竞争激烈 , 使 大 学 生 面 临 巨 大 的就 业 程 , 将 数 据 按 男 女分 类 , 分 别进 行 回 归 。然 后 加 入 了 农村 、城 镇 和 压力 。其 中 , 女生 的就业 状 况 更为 堪忧 。很 多公 司都 存 在着 性 别歧 培 训 等虚 拟 变 量 , 使 方 程 更 加 显著 , 教 育 回报 率 更 加 准确 。对 数 据 视 的 现象 , 即 相 同水 平 的 男 女性 面 对 同样 的工 作 , 公司 可 能 更愿 意 回 归结 果 进 行 分析 , 计 算 出男 性 与 女 性 的教 育 回报 率 , 并 对 两 者 之
教育收益率估算中的计量偏误及调整方法的综述

教育收益率估算中的计量偏误及调整方法的综述邓峰【摘要】Mincer's human capital earnings function has been widely used in empirical studies for estimating the rate of return to education. However, OLS estimates of Mincer's function potentially suffer from omitted variables, measurement error ,sample selectivity bias, heterogeneity and so on. Many econometric approaches are developed correspondingly to reduce the above-mentioned problems. This paper aims to conduct a thorough review of the results associated with those corrective approaches in order to provide an accurate estimate of China's rate of return to education.%明瑟收入方程在各国估算教育收益率的实证研究中得到了广泛的应用。
由于使用OLS方法估算明瑟收益率会面临遗漏变量、测量误差、选择偏差和异质性等问题,国内外学者采用各种计量方法来保证教育收益率估算的准确性。
本文围绕纠正明瑟收益率偏误的各种计量方法,对这些方法在估算中国教育收益率研究中的有效性进行探讨,以期为我国教育收益率的准确估计寻找新的思路。
【期刊名称】《教育与经济》【年(卷),期】2013(000)005【总页数】7页(P42-48)【关键词】明瑟方程;教育收益率;计量偏误【作者】邓峰【作者单位】北京理工大学教育研究院,北京,100081【正文语种】中文【中图分类】F08;G40-054人力资本理论认为,教育作为人力资本投资的主要形式,不仅是推进经济发展和社会进步的主要途径,而且是提高个体劳动生产率和收入的主要方式。
教育回报率异质性研究综述

教育回报率异质性研究综述摘要:基于同质性研究视角下,教育回报率是受教育年限对收入的边际影响问题研究。
但由于个体异质性问题,教育回报率对不同个体来说有差异的。
国内外学者在舒尔茨、贝克尔和明瑟等经济学家的人力资本理论基础上,开展了广泛的异质性研究。
众多学者将性别、培训、父母教育程度等个人因素以及职业、行业、所有制以及地区因素引入教育回报率研究中。
关键词:教育回报;异质性;综述教育回报率的研究无论是对公共政策实施还是对个体都有十分重要的意义。
舒尔茨(1960)提人力资本对经济增长起着核心的作用,而教育作为最重要的人力资本积累的途径,进而对收入提升有重要作用。
贝克尔在《人力资本》一书的研究结果显示,人们的受教育程度越高,获取的教育回报率越低,并且教育人力资本的供求关系状况影响了教育回报率的总体变动趋势。
明瑟根据人力资本理论分别运用差异补偿模型型(Mincer,1958)与会计恒等式模型(Mincer,1974)推导出研究收入决定的明瑟工资模型。
其模型的基本特征是教育年数与工资收入呈线性关系,教育年数越高,收入就越多,年龄与收入呈二次性关系,随着年龄增加,收入会呈现出加速递增、减速递增与递减的趋势。
上述理论主要基于同质性假设下的研究推论,因此会存在选择性偏差、遗漏变量等问题。
一、个体异质性影响教育回报率研究较早的研究未考虑个体差异对教育回报的影响,随着计量技术的发展,研究者加入了更多的控制变量进行教育回报率的异质性研究。
20世纪90年代,有学者通过研究美国职业高中和普通高中两种不同教育类型的教育回报率,认为接受职业教育的男性教育回报比女性高。
亦有国外学者认为教育回报并不存在性别差异,两者都可以增加就业机会以及提高收入。
杨铭等(2019)认为,不同性别的教育回报差异在城乡不同群体中,表现出较大差异。
韩国学者通过修正的明瑟方程探讨高中教育学历的劳动者在劳动力市场的回报,认为性别、婚姻状况以及户籍类型等因素会对毕业生收入产生差异,以此来解释职业教育所面临的问题。
本科毕业论文模板之研究方法的优劣势与选择准则详解

本科毕业论文模板之研究方法的优劣势与选择准则详解在完成本科毕业论文时,一个关键的环节是选择合适的研究方法。
选择合适的研究方法不仅可以提高研究的效率和准确性,还可以为研究者们提供指导和框架。
本文将详细讨论研究方法的优劣势以及选择准则,以帮助读者理解并应用于自己的毕业论文研究中。
一、实证研究法实证研究法是一种基于实证主义哲学观点的研究方法,主要通过数据收集和分析来验证或推翻研究假设。
这种方法的优势在于其科学性和客观性,可以提供有力的实证证据支持研究结论。
然而,实证研究法也存在着一些局限性,例如可能忽视了个体的经验和主观性,以及数据收集与分析的复杂性。
二、定性研究法定性研究法是一种主要关注研究对象的质性特征和意义的研究方法。
通过深入访谈、观察和文献分析等方式,研究者可以获得丰富的描述性信息,并深入理解研究对象的背后动机和意义。
定性研究法的优势在于其深度和详尽性,可以揭示出实证研究法所无法捕捉到的细节。
然而,定性研究法受限于样本数量的限制,结果的可靠性和代表性可能受到质疑。
三、文献综述与meta分析文献综述和meta分析是一种通过收集、综合和分析文献研究的方法。
这种方法的优势在于可以整合大量已有的研究成果,并提供对问题的系统性概述。
此外,meta分析可以通过汇总多个研究的结果,计算出更为精确和可信的总体效应。
然而,文献综述和meta分析的有效性与结果的可靠性高度依赖于所选择的文献的质量和数据的统计方法。
四、实验设计实验设计是一种控制变量来检验因果关系的研究方法。
通过在实验组和对照组之间施加不同的处理,研究者可以检验特定变量对结果的影响。
实验设计的优势在于其可控性和可重复性,可以提供较为确凿的因果关系证据。
然而,实验设计也受限于实验环境与现实环境之间的差异,结果的推广性可能有所局限。
综上所述,选择合适的研究方法是毕业论文的关键环节之一。
实证研究法具有科学性和客观性的优势,适用于验证或推翻研究假设;定性研究法注重深度和详尽性,揭示研究对象背后的动机和意义;文献综述和meta分析可以整合大量已有研究成果,并计算总体效应;实验设计具有可控性和可重复性,适用于检验因果关系。
报告中的实证结果的消除误差和偏见的方法

报告中的实证结果的消除误差和偏见的方法在社会科学研究中,实证研究是一种通过收集和分析现有数据来验证或推翻特定假设的方法。
然而,在实证研究中,由于多种原因,误差和偏见是无可避免的。
为了提高实证研究的准确性和可靠性,研究人员需要采取一些方法来消除误差和偏见。
本文将介绍六种常用的方法,分别是:随机抽样、清理数据、控制变量、双盲试验、去除噪声和多样性。
一、随机抽样随机抽样是实证研究中最常用的方法之一,它可以消除抽样误差。
通过随机抽样,研究人员可以确保样本具有代表性,能够准确地反映全体人群。
在随机抽样过程中,每个个体都有相等的机会被选入样本,从而避免了选择性偏差。
二、清理数据数据清理是消除数据误差的关键步骤。
在实证研究中,数据往往会存在缺失、错误、异常值等问题。
为了确保数据的准确性和一致性,研究人员需要对原始数据进行清理。
这包括检查数据的完整性、一致性和逻辑性,并进行必要的修正和删除。
三、控制变量控制变量是实证研究中常用的方法之一,它可以消除外部因素对实证结果的影响。
在实证研究中,往往存在多个变量之间的相互作用。
为了确定特定变量对实证结果的影响,研究人员可以通过控制其他相关变量来消除混杂因素的干扰。
四、双盲试验双盲试验是一种消除实证研究中主观偏见的方法。
在实施双盲试验时,实验参与者和研究人员都不知道给予的处理或干预是否有效。
这样可以避免参与者和研究人员对处理的预期产生主观偏见,并确保实证结果的客观性。
五、去除噪声在实证研究中,噪声是不可避免的,它可以干扰实证结果的准确性。
为了消除噪声的影响,研究人员可以采用统计方法,如平均值、中位数、回归分析等,来过滤掉随机误差。
同时,在样本量足够大的情况下,噪声的影响也会减小。
六、多样性多样性是实证研究中重要的考虑因素之一,它可以减少研究结果的偏见。
在实证研究中,研究人员可以通过增加样本的多样性来提高研究结果的泛化能力。
多样性可以包括地理多样性、文化多样性、年龄多样性等。
我国城乡教育回报率差异研究基于CHIP数据的实证分析

3、促进城乡教育交流。通过开展城乡学生交流、城乡教师交流等活动,加 强城乡之间的教育互动和合作。这不仅可以增加农村学生接触城市教育的机会, 还可以提高农村教师的教育教学水平。
4、完善劳动力市场制度。加强对劳动力市场的监管,确保城乡居民在就业 方面得到公平待遇。同时,鼓励企业到农村投资和发展,为农村居民提供更多的 就业机会和稳定的收入来源。
实证结果与分析
通过实证分析,我们发现我国城乡教育回报率存在显著差异。具体而言,城 市居民的教育回报率明显高于农村居民。这主要源于以下原因:
1、教育资源分配不均。城市拥有丰富的教育资源和优秀的教学条件,农村 则相对匮乏。这种不均衡的资源分配导致农村居民难以获得优质的教育,进而影 响了其未来收益。
然而,本次演示的研究还存在一定的局限性。首先,CHIP数据的时间跨度较 短,可能无法全面反映近年来我国城乡教育回报率的变化趋势。其次,本次演示 主要了教育回报率的差异,而未考虑到教育投资的成本问题以及个人选择接受教 育的决策过程。未来研究可以进一步拓展到教育投资成本及个人教育决策方面, 以期为缩小城乡教育回报率差异提供更为全面的政策建议。
文献综述
教育回报率是指通过教育投资所获得的未来收益的贴现值。国内外学者针对 教育回报率开展了大量研究,普遍认为教育对个人和社会的回报率均较高。然而, 对于城乡教育回报率差异的研究相对较少,这为本次演示的研究提供了契机。
研究方法与数据来源
本次演示采用了 CHIP数据,该数据涵盖了我国城乡居民的收入、教育、健 康等多方面信息。通过建立回归模型,对城乡教育回报率差异进行了实证分析。 首先,以受教育程度为自变量,以小时工资率为因变量进行回归分析;然后,以 城乡虚拟变量和其他控制变量为自变量,以上述回归残差为因变量进行回归分析。
近十年有关我国职业教育回报率研究综述

近十年有关我国职业教育回报率研究综述房基;闫广芬【摘要】职业教育回报率是指排除性别、工作经验、区域差异等因素后,职业教育对于个人收入或社会经济发展的影响.研究者对于职业教育回报率的计量方法经历了多样化阶段、单一化阶段和深入化阶段.总体来看,目前对职业教育回报率研究还存在很大不足,主要有:研究逻辑起点不明确、研究深度不足、研究结果不可比、回报率动态研究不足.【期刊名称】《职业技术教育》【年(卷),期】2017(038)016【总页数】5页(P50-54)【关键词】职业教育回报率;丹尼森计量模型;明瑟计量模型【作者】房基;闫广芬【作者单位】天津大学教育学院天津,300350;天津大学教育学院【正文语种】中文【中图分类】G719.2伴随着我国工业化、现代化进程的加快,产业结构的优化升级,以及经济增长方式的转变,加快发展职业教育,建立现代职业教育体系,不仅是当务之急,更关乎我国全面建成小康社会的未来大计。
本文通过梳理近十年有关我国职业教育回报率的研究,旨在找出国内有关研究的发展与局限,为我国职业教育发展找到一定的实证依据。
与教育回报率近义的还有教育贡献率、教育收益率两词。
有研究者认为,教育收益率是在其他条件不变的情况下,每增加一年受教育时间所引起的收入的增长[1],多指教育对于个人收入增长的作用大小;而教育回报率、贡献率多指教育对于社会经济发展的作用大小,研究中教育回报率与贡献率不具体区分,统称教育回报率。
教育经济学家萨哈罗普勒斯指出,“教育投资的回报率”主要是指去除性别、工作经验、区域差异等因素对结果的影响后,就业者每多受一年教育所获得的收入增长率[2]。
对于教育回报率的研究不仅包括个人回报率,在当代人们同样关注宏观上教育对社会的回报率。
职业教育回报率在以往研究中未有统一的定义,从教育回报率的定义中衍生出职业教育回报率的定义应是科学可行的。
基于此,笔者认为,职业教育回报率指的是排除性别、工作经验、区域差异等异质性因素后,职业教育对于个人收入或者社会经济发展的影响大小。
2024年小学教育论文参考文献参考

[9]董先安.浅释中国地区收入差距:1952-2002[J].经济研究.2004(09)
[10]周英章,孙崎岖.我国教育投入对实际经济增长的贡献实证分析[J].中国软科学.2002(07)
[14]冉幕娟,吴永球,陈永丽.城乡教育不平等与收入差距关系研究[J].山西财经大学学报(高等教育版).2006(01)
[15]张海峰.城乡教育不平等与收入差距扩大--基于省级混合截面数据的实证分析[J].山西财经大学学报.2006(02)
[16]江小涓,李辉.我国地区之间实际收入差距小于名义收入差距--加入地区间价格差异后的一项研究[J].经济研究.2005(09)
[5]黄万阳.人民币实际汇率错位测度、效应与矫正研究[D].东北财经大学2005
[6]孟军.能源节约、碳减排与中国经济增长[D].东北财经大学2013
[7]潘祺志.我国工业能耗强度变动与节能路径选择[D].东北财经大学2010
[8]张有绪.品牌资产模型与测度方法研究[D].东北财经大学2009
[9]徐勇.中国国内旅游业发展及其与经济增长关系的`计量分析[D].东北财经大学2012
[4]岳昌君.教育对个人收入差异的影响[J].经济学(季刊).2004(S1)
[5]孙志军.中国教育个人收益率研究:一个文献综述及其政策含义[J].中国人口科学.2004(05)
[6]张红宇.城乡居民收入差距的平抑机制:工业化中期阶段的经济增长与政府行为选择[J].管理世界.2004(04)
[7]林光彬.等级制度、市场ቤተ መጻሕፍቲ ባይዱ济与城乡收入差距扩大[J].管理世界.2004(04)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选择偏差、比较优势与教育的异质性回报B 基于中国微观数据的实证研究李雪松(中国社会科学院数量经济与技术经济研究所100732)詹姆斯#赫克曼(美国芝加哥大学经济系)内容提要:本文根据2000年中国的微观数据,运用现代微观计量经济学的分析方法,在考虑异质性和选择偏差的基础上,估计了20世纪末中国的教育回报。
研究结果表明:与受教育水平相关的收益在人们中间存在显著的异质性;在当今中国的劳动力市场上存在一种重要的实证现象,即人们根据比较优势原理对教育水平进行选择。
传统的普通最小二乘法以及工具变量法都难以对这种选择做出合理的估计,我们的分析框架弥补了上述两种方法的缺陷。
2000年中国6个省区城镇青年大学教育的平均回报率为43%(年均近11%)。
中国在经历二十多年的市场经济改革后,较之80年代及90年代初期,教育的平均回报有了显著提高,中国的教育和劳动力市场已经开始发挥重要作用。
关键词:微观数据异质性选择偏差中国教育回报一、引言微观数据有两个基本特征:异质性以及缺少与实际相反的状况。
由于存在未被观测到的异质性,即使在所有可以被观测到的方面都相同的人们仍然会做出不同的决策、获得不同的收入、选择不同的投资组合。
缺少与实际相反的状况引发了数据缺失问题,如果某人实际选择了一种状况,我们就不可能观测到他(她)做出其他选择时的结果。
如果我们观测到某大学毕业生的当前收入水平,我们就不可能同时观测到假使他(她)高中毕业就参加工作的当前收入水平。
过去,解决选择和数据缺失问题的方法大多没有考虑异质性,他们一般都假设不同的个人具有同质性。
本文的研究充分考虑了个人之间显著的异质性。
我们根据中国城镇居民家庭收入与支出调查(C UHIES2000)所公布的横截面微观数据,估计了中国高等教育的异质性回报。
对学历做出不同选择的人们有着各自不同的教育回报率。
本文的工作建立在由Heckman和Vytlacil(1999,2000, 2001),Carneiro,Heckman和Vytlacil(2001)以及Carneiro(2002)等研究所形成的半参数分析框架基础之上。
边际政策效应(MTE)是这些文献的核心概念,这个概念是由Bjorklund和Moffitt(1987)首先提出的。
边际政策效应是指,处于接受或不接受教育临界状态的人最终选择接受教育时的平均回报。
这些人根据未被观测到的自身特征选择接受教育的不同水平。
我们的研究结果表明:对于2000年中国6省区(广东、辽宁、四川、陕西、浙江和北京)的城镇居民来说,大学4年教育的平均政策效应(ATE))))随机挑选任何一个人接受大学教育后其一生收入将增长43%(即每年大学教育带来近11%的回报率)。
而用另外两种方法)))普通最小二乘法(OLS)和工具变量法(IV))))对ATE做出的估计结果分别为29%和56%(即每年大学教育分别带来约7%和14%的回报率)。
总体中存在着显著的回报异质性,估算出的选择偏差达到了-22%。
我们的发现与Carneiro,Heckman和Vytlacil(2001)相似:人们根据比较优势原理对教育水平进行选912004年第4期李雪松、詹姆斯#赫克曼:选择偏差、比较优势与教育的异质性回报:基于中国微观数据的实证研究择。
最小二乘法(OLS)对真实的平均政策效应(ATE)给出了一个下偏的估计,而工具变量法(I V)则给出了一个上偏的估计。
在经历了二十多年以市场为导向的经济改革后,中国的平均教育回报较之80年代和90年代初期有了较大幅度的提高。
中国的教育和劳动力市场已经开始发挥作用,技能获得的回报也比以前更多了。
本文的余下内容是这样安排的:第二部分描述考虑和不考虑异质性时的收入模型;第三部分对选择偏差、边际政策效应(MTE)进行定义,并给出估计MTE的理论框架;第四部分是中国数据的实证分析结果;第五部分进行简要地总结。
二、考虑和不考虑异质性时的模型考虑如下明瑟尔(Mincer)方程,其参数为常数,这是假设不存在异质性时的传统教育回报模型。
ln Y i=B S i+C X i+U i(1)其中i表示不同的个人(i=1,2,,,n),ln Y i为收入的对数形式,S i表示受教育水平,X i为解释变量向量,比如工作年限、工作年限的平方、以及性别、地区、产业、企业所有制等虚拟变量,U i是期望为零的随机误差项,B为教育回报率,C为系数向量。
直接运用普通最小二乘法(OLS)对方程(1)进行估计存在一个问题:该模型可能遗漏了个人能力变量A i,它被包含在误差项U i之中。
许多实证分析认为Cov(A i,S i)X0,因此E(U i|S i)X0。
此时最小二乘法只能得出有偏、非一致的估计量。
Griliches(1977)阐述了对该问题的经典看法。
可是,在现实生活中,大多数数据并不包括对个人能力的度量。
于是不少经济学家想方设法运用一些变通的方法,试图来消除或减弱个人能力偏差。
许多学者采用工具变量(I V)法,找出一个与S i高度相关但与U i不相关的工具变量I i;另外一些学者采用固定效应方法,假设双胞胎、兄弟姐妹具有相近的个人能力,对他们进行成对比较;还有一些学者使用个人能力的代理变量,并把这些代理变量作为解释变量包含在X i中。
由于大多数数据并不具备采用固定效应方法所需的足够信息,而且使用该方法还需满足误差项可分离的条件,这种比较可能会使误差更趋严重。
找到满意的工具变量也很困难,事实上,大量有关教育回报和收益问题的文献中普遍使用的工具变量都是无效的,它们往往与被遗漏的个人能力相关(Carneiro与Heckman(2002)以及Carneiro(2002))。
许多实证分析表明:家庭背景往往与个人能力关系密切,良好的家庭氛围通常有助于提高个人能力(Carneiro和Heckman,2003)。
本文在实证分析过程中使用父母收入作为个人能力的代理变量。
设想一种比模型(1)更为普遍的形式,它考虑了教育的异质性回报,用随机系数的形式表示如下:ln Y i=B i S i+C X i+U i(2)其中B i表示存在异质性时的教育回报率,因人而异。
X i是由其他解释变量组成的向量,该模型在一种更为普遍的条件下对个人能力偏差进行了校正。
本文着重讨论两种教育水平的选择:高中和大学。
令S i=1表示大学学历,S i=0表示高中学历(没有接受大学教育)。
显然存在多种学历选择,我们的分析则是对实际情况的一种简化,这种简化普遍存在于文献中。
大量证据表明,在多数情况下,教育回报与受教育年限并不成线性关系,使用传统的收入对数对于学历的回归系数将导致对教育回报率估计的严重偏差(Heckman,Lochner 和Todd,2003)。
92两种潜在的选择结果(ln Y0i,ln Y1i)可以表示为:ln Y0i=C0X i+U0i(当S i=0时)(3a)ln Y1i=C1X i+U1i(当S i=1时)(3b)对总体而言,E(U0i|X i)=0,E(U1i|X i)=0。
由于存在数据缺失问题,在横截面上想同时获知一个人的ln Y0i和ln Y1i通常是不可能的。
我们仅仅可以确定分布F(ln Y0i|X i,S i=0)和F(ln Y1i|X i,S i=1),而不可能确定分布F(ln Y0i|X i)和F(ln Y1i|X i)。
由于异质性及选择问题的普遍存在,我们不可能再使用诸如OLS和IV的传统方法来估计参数。
对结果进行整理,有:ln Y i=S i ln Y1i+(1-S i)ln Y0i(4a)=[(C1-C0)X i]S i+C0X i+[U0i+(U1i-U0i)S i](4b)=[(C1-C0)X i+(U1i-U0i)]S i+C0X i+U0i(4c)=B i S i+C0X i+U0i(4d)其中B i=(C1-C0)X i+(U1i-U0i)(5)表示个体i的异质性教育回报。
当C1X C0(即存在观测到的异质性(C1-C0)X i),或U1i X U0i(即存在未观测到的异质性(U1i-U0i))时,B i在总体中是一个变量,教育回报是一个服从于一定分布的随机变量。
在给定X的条件下,B i的平均值为:B=E(B i|X i)=E[(C1-C0)X i](6)假设人们根据下述选择规则来决定是否进入大学学习:S*i=P i(Z i)-U siS i=1当S*i\0时0当S*i<0时(7)其中S*i为隐藏变量,代表入学的净收益,Z i是可观测到的变量向量(Z i可能包含部分X i)。
P i=P i(Z i)表示参与或接受政策(比如进入大学学习)的概率,它可用概率模型或逻辑模型估计出来。
U s i表示个体i在政策选择过程中未被观测到的异质性。
为不失一般性,假设U si在[0,1]区间上服从均匀分布(Heckman和Vytlacil,1999),对于个体i 来说,是否进入大学学习完全取决于观测到的异质性P i(Z i)与未被观测到的异质性U si之间的比较。
U s i越小,则进入大学学习的可能性越大。
三、选择偏差与边际政策效应令$i=ln Y1i-ln Y0i表示某项政策使个体i从S i=0转变到S i=1时的经济收益。
根据方程(3a)、(3b)及(5),$i=B i。
根据方程(3a)、(3b)及(6),普通最小二乘法(OLS)估计量的概率极限为: p lim(^B O LS)=E(ln Y i|X i,S i=1)-E(ln Y i|X i,S i=0)=E(C1X i+U1i|X i,S i=1)-E(C0X i +U0i|X i,S i=0)=^B(ATE)+[E(U1i|S i=1)-E(U0i|S i=0)](偏差)(8)其中,平均政策效应ATE表示随机挑选一个具有特征X的个体所具有的教育回报的均值,定义如下:932004年第4期ATE=E($i|X i)=E(B i|X i)= B(9)如果人们很清楚各自的U si且依据(U0i,U1i)采取行动,那么S i将与U0i及U1i相关,方程(8)的第二项将不为零。
因此普通最小二乘法OLS是对ATE的有偏估计量。
注意到方程(8)也可表示为:p lim(^B O LS)=E(ln Y i|X i,S i=1)-E(ln Y i|X i,S i=0)=E(B i|X i,S i=1)(TT)+[E(U0i|S i=1)-E(U0i|S i=0)](选择偏差)(10)其中参与者的平均政策效应TT表示那些政策参与者(比如进入大学学习)与假设他们没有参与该政策(比如没有接受大学教育)时相比所获得的效应的均值,定义为:TT=E($i|X i,S i=1)=E(B i|X i,S i=1)= B+E(U1i-U0i|S i=1)=ATE+E(U1i-U0i|S i=1)](分类效应)(11)选择偏差E(U0i|S i=1)-E(U0i|S i=0)表示事实上的政策参与者(比如进入大学学习)假设他们未参加项目时的不可观测变量与真正未参加项目者(比如未接受大学教育)的不可观测变量之差的均值,也即大学毕业生如果他们高中毕业就参加工作的当前收入与真正高中毕业生的当前收入之间的不可观测变量差异的均值。