基于面板数据模型及其固定效应的模型分析
Stata面板数据回归分析中的固定效应模型与随机效应模型比较

Stata面板数据回归分析中的固定效应模型与随机效应模型比较随着数据量的增多和分析需求的提高,面板数据的分析在社会科学研究中扮演着重要的角色。
而固定效应模型(Fixed Effects Model)与随机效应模型(Random Effects Model)是面板数据回归分析中常见的两种方法。
本文将对这两种模型进行比较,分析它们的优缺点和适用场景。
一、固定效应模型固定效应模型是一种针对面板数据中个体固定特征的建模方法。
在这个模型中,个体固定特征被视为影响因变量的固定影响,而面板数据中的跨时间变动则被视为影响因变量的随机影响。
因此,固定效应模型用于捕捉个体固定特征与因变量之间的关系。
在Stata中,通过使用"xtreg"命令进行固定效应模型分析。
该命令需要指定因变量、自变量以及两个固定效应模型的预测变量:个体固定效应和时间固定效应。
其中,个体固定效应可以通过使用"dummies"函数或"i."操作符来实现,时间固定效应则需要使用"i."操作符。
固定效应模型的优点在于能够有效控制个体固定特征的影响,从而减少了因个体异质性引起的内生性问题。
此外,固定效应模型对时间不变的个体特征敏感,适用于个体固定效应存在的分析场景。
然而,固定效应模型并不能捕捉个体固定特征与因变量之间的动态关系,忽略了这种关系的时间变化。
同时,当面板数据存在时间维度的异质性时,固定效应模型也不能准确估计时间维度的影响。
二、随机效应模型随机效应模型则是一种对面板数据中个体随机特征进行建模的方法。
在随机效应模型中,个体随机特征被视为影响因变量的随机影响,而个体之间的差异则被视为影响因变量的固定影响。
因此,随机效应模型用于探索个体随机特征与因变量之间的关系。
在Stata中,通过使用"xtreg"命令的"re"选项进行随机效应模型分析。
面板数据回归分析中的固定时间效应模型与固定个体效应模型比较

面板数据回归分析中的固定时间效应模型与固定个体效应模型比较面板数据回归分析是经济学和社会科学研究中常用的方法之一,它可以在多个时间点和多个个体之间对变量之间的关系进行建模和分析。
在面板数据回归分析中,研究者通常关注两种常见模型:固定时间效应模型与固定个体效应模型。
固定时间效应模型是一种用于揭示时间固定效应的面板数据模型。
在这种模型中,时间被视为一个固定的条件,并且对于所有个体来说是相同的。
该模型基于的假设是,个体之间的差异是固定的,而时间对于个体之间的差异没有影响。
因此,该模型的主要目的是控制时间效应,以便分析个体之间的差异。
与固定时间效应模型相比,固定个体效应模型关注的是个体固定效应。
在这个模型中,个体被视为一个固定的条件,并且对于所有时间点来说是相同的。
该模型的基本假设是,时间对于个体之间的差异是没有影响的,而个体之间的差异是固定的。
因此,该模型的目的是控制个体效应,从而分析时间点之间的差异。
固定时间效应模型和固定个体效应模型都有各自的优点和适用范围。
固定时间效应模型适用于研究时间点之间的差异,比如研究不同年份之间的经济增长率的影响因素。
通过控制时间效应,该模型可以消除个体之间的差异,使得研究者可以更加准确地估计时间点之间的关系。
相反,固定个体效应模型适用于研究个体之间的差异,比如研究不同国家之间的经济增长率的影响因素。
通过控制个体效应,该模型可以消除时间点之间的差异,使得研究者可以更加准确地估计个体之间的关系。
虽然固定时间效应模型和固定个体效应模型在控制不同方面的效应上有所不同,但它们也存在一些共同之处。
首先,它们都可以用于面板数据回归分析,并提供了一种对变量之间关系进行建模和分析的方法。
其次,它们都可以通过引入虚拟变量来控制相应的效应,比如固定时间效应模型可以通过引入时间虚拟变量来控制时间效应,固定个体效应模型可以通过引入个体虚拟变量来控制个体效应。
因此,在实际研究中,研究者需要根据研究问题和数据特征来选择使用固定时间效应模型还是固定个体效应模型。
使用面板数据个体固定效应模型进行估计

使用面板数据个体固定效应模型进行估计一、概述近年来,面板数据分析在经济学、社会学、公共管理等领域得到了越来越广泛的应用。
面板数据有别于交叉数据和时间序列数据,它集合了个体(如个人、公司、国家)和时间的信息,具有独特的优势和特点。
个体固定效应模型是一种在面板数据分析中常用的方法,它能够控制个体特征的固定效应,从而更准确地估计变量间的关系。
本文将围绕面板数据个体固定效应模型的估计方法展开探讨。
二、面板数据个体固定效应模型简介个体固定效应模型是面板数据分析中最常用的模型之一。
在该模型中,我们假设每个个体都有一个固定的效应,这个效应代表了个体固有的特征,如性别、种族、文化背景等。
个体固定效应模型的基本形式如下:Y_it = α_i + X_itβ + μ_it其中,Y_it代表第i个个体在第t个时间点的因变量,α_i是个体i的固定效应,X_it是自变量,β是自变量的系数,μ_it是误差项。
个体固定效应模型的特点在于它能够控制个体固有的特征,减少了遗漏变量引起的偏误,同时也可以更准确地估计自变量对因变量的影响。
三、面板数据个体固定效应模型的估计方法在实际应用中,我们需要利用样本数据对个体固定效应模型进行估计。
常用的方法包括最小二乘法、广义矩估计和最大似然估计等。
下面将详细介绍这些方法的原理和步骤。
1. 最小二乘法最小二乘法是个体固定效应模型估计中最简单也是最常用的方法。
它通过最小化残差平方和来估计模型参数。
具体而言,最小二乘法的步骤如下:(1)建立个体固定效应模型,确定自变量和因变量的取值范围。
(2)利用样本数据估计模型参数,求解出α_i和β的估计值。
(3)检验估计结果的显著性和稳健性。
最小二乘法的优势在于计算简单,易于实现。
但是,它也存在一些局限性,比如对异方差和序列相关性敏感,容易产生估计偏误。
2. 广义矩估计广义矩估计是一种比最小二乘法更一般的估计方法。
它不仅可以处理异方差和序列相关性等问题,还能充分利用面板数据的信息。
面板数据模型中的固定效应和随机效应假设是什么如何进行假设检验

面板数据模型中的固定效应和随机效应假设是什么如何进行假设检验面板数据模型是应用于经济学和社会科学领域的一种常用数据分析方法,它可以同时考虑时间序列和横截面的特征,充分利用了面板数据集的信息。
在面板数据模型中,固定效应和随机效应是两种常见的假设,它们主要用于解释个体间的异质性问题和个体特征对因变量的影响。
一、固定效应假设固定效应假设认为,个体间的异质性是固定不变的,即个体的特征对因变量的影响是固定的。
在固定效应模型中,我们假设个体的特征与时间无关,只与个体自身有关。
这种假设可以用下式表示:Yit = α + βXit + Cit + εit其中,Yit表示第i个个体在第t个时间点的因变量观测值,Xit表示第i个个体在第t个时间点的自变量观测值,Cit表示个体i的固定效应,α表示常数项,β表示自变量的系数,εit表示随机误差项。
在固定效应模型中,我们通常使用最小二乘法估计参数,但由于个体固定效应引入了个体间的相关性,最小二乘法估计会产生一致性偏差。
因此,为了进行假设检验,我们采用固定效应模型的差分法。
差分法的基本思想是将模型中的观测数据对进行差分,消除个体固定效应,从而得到一个不包含个体固定效应的模型。
假设检验是判断固定效应是否存在的一种统计方法。
最常用的假设检验是随机效应模型与固定效应模型之间的检验,即H0:个体固定效应为零,H1:个体固定效应不为零。
有几种常见的检验方法,如:1. 特征检验法(F检验):通过比较随机效应模型和固定效应模型的回归平方和之间的差异,进行假设检验。
如果F统计量的值小于给定的显著性水平(如0.05),则拒绝原假设,即认为个体固定效应不为零。
2. 求解限制性最小二乘法(RLS):通过对随机效应模型进行限制,求解限制性最小二乘法,并与随机效应模型的最小二乘法进行比较,进行假设检验。
如果限制性最小二乘法的估计值与随机效应模型的最小二乘法估计值之间的差异显著大于零,则拒绝原假设。
题目什么是面板数据请简要解释固定效应模型的基本原理

题目什么是面板数据请简要解释固定效应模型的基本原理面板数据是一种经济学研究中常用的数据类型,它是在一定时间序列上观察多个个体的数据集合。
它结合了截面数据(cross-sectional data)和时间序列数据(time series data)的特点,提供了一种更加全面、丰富的分析角度,从而增强了统计模型的解释力和预测能力。
固定效应模型(fixed effects model)是对面板数据进行分析的一种常用方法,它可以帮助我们解决数据中存在的个体特征的问题。
在固定效应模型中,我们假设每个个体的特征是不变的,并将其表示为个体固定效应。
这意味着我们在模型中引入了个体固定效应的虚拟变量,用于衡量不同个体之间的差异。
固定效应模型的基本原理是通过控制个体特征的固定效应,来解决由于个体间差异引起的内生性问题。
在传统的OLS(普通最小二乘法)回归中,我们通常会将个体间差异当作一个不可观测的误差项,从而导致估计结果不准确。
而固定效应模型通过引入个体固定效应的虚拟变量,将这些个体间差异捕捉到模型中,从而更准确地估计出变量之间的关系。
在固定效应模型中,我们首先需要将个体特征的固定效应进行估计。
通常使用固定效应最小二乘法(within estimator)或差分法(first-differenced estimator)来估计个体固定效应。
其中,固定效应最小二乘法将个体固定效应作为虚拟变量引入回归模型,通过对个体内变异的分析来估计模型参数;差分法则通过对数据进行差分处理,消除个体固定效应的影响,从而得到变量的变动信息。
固定效应模型的估计结果可以帮助我们分析面板数据中个体特征对变量之间关系的影响。
通过固定效应模型,我们可以控制个体特征的固定效应,从而更加准确地研究变量之间的因果关系。
例如,在经济学中,我们可以使用固定效应模型来研究不同个体对政策变化的反应差异,或者企业特征对经营绩效的影响等。
总之,面板数据是一种重要的数据类型,而固定效应模型则是对面板数据进行分析的常用方法之一。
面板数据回归分析中的固定效应模型与混合效应模型比较

面板数据回归分析中的固定效应模型与混合效应模型比较在面板数据回归分析中,有两种常见的模型被广泛运用,分别是固定效应模型和混合效应模型。
本文将对这两种模型进行比较和探讨。
一、固定效应模型固定效应模型是最简单也最常用的面板数据回归分析模型之一。
在该模型中,我们假设不同个体(或单位)之间存在着固定的特征或效应,这些特征对因变量产生了影响。
因此,我们使用个体固定效应将这些特征纳入模型中。
在固定效应模型中,我们通常使用差分法(法1)或虚拟变量法(法2)来消除个体固定效应。
差分法通过计算每个个体的平均值与个别观察的离差来实现。
虚拟变量法则引入具有k-1个虚拟变量的模型,其中k是个体数目。
这种方法将每个个体的固定效应表示为一组二进制指示变量。
然后,我们可以对调整后的数据集运行普通最小二乘回归,得到固定效应模型的估计结果。
这些结果可以用于判断个体固定效应是否对因变量有显著的影响。
此外,我们还可以通过Hausman检验来比较固定效应模型和随机效应模型的优劣。
二、混合效应模型混合效应模型相对于固定效应模型来说更加复杂一些。
在此模型中,我们将个体固定效应与随机效应同时纳入考虑。
随机效应由个体之间的异质性引起,而个体固定效应则包括已知或未知的个体特征。
为了估计混合效应模型,我们需要假设随机效应服从一个特定的概率分布。
常见的概率分布包括正态分布或者混合效应符合特定的分布(如gamma分布、二项式分布等)。
利用最大似然估计等方法,可以获得混合效应模型的参数估计结果。
与固定效应模型相比,混合效应模型更加灵活,允许个体之间的异质性在建模中得到更好的捕捉。
然而,混合效应模型的估计更为复杂,计算量也会相应增加。
三、模型比较固定效应模型和混合效应模型各有优缺点,适用于不同的研究问题和数据特征。
固定效应模型适用于个体固定效应显著的情况,且计算相对简单。
混合效应模型则适用于个体随机效应显著的情况,能更好地捕捉个体之间的异质性。
在实际应用中,我们可以根据数据和研究目的来选择适合的模型。
面板数据probit固定效应

面板数据probit固定效应
面板数据Probit模型是一种用于分析面板数据的统计模型,它可以帮助研究人员探索不同变量对于二元(0-1)因变量的影响。
在面板数据中,我们通常会遇到固定效应模型,它可以帮助我们控制个体特征的固定效应,从而更准确地估计变量之间的关系。
固定效应模型是一种控制了个体固定特征的面板数据模型,它可以消除个体间的异质性,从而更准确地估计出变量对于因变量的影响。
在Probit模型中,固定效应可以帮助我们控制个体特征的影响,从而更准确地估计出变量对于二元因变量的影响。
使用面板数据Probit固定效应模型可以帮助研究人员在探索二元因变量的影响时,更准确地估计出各个解释变量对于因变量的影响。
这种模型在实证研究中具有广泛的应用,尤其是在经济学、社会学和政治学等领域。
总之,面板数据Probit固定效应模型为研究人员提供了一种有效的工具,可以帮助他们更准确地分析面板数据,并探索变量对于二元因变量的影响。
通过控制个体特征的固定效应,这种模型可以
提高研究结果的准确性和可靠性,为学术研究和政策制定提供有力的支持。
固定效应模型结果解读

固定效应模型结果解读固定效应模型(FixedEffectsModel)是一种常见的面板数据分析方法,它可以用于探究个体间的异质性和时间趋势对数据的影响。
本文将从固定效应模型的基本原理、模型结果解读以及应用案例三个方面进行阐述。
一、固定效应模型的基本原理固定效应模型是一种面板数据模型,其基本假设是个体效应与时间无关,且个体效应与解释变量之间不存在相关性。
换句话说,固定效应模型假设个体间的差异是固定的,不随时间变化,只有时间上的变异才会影响因变量。
因此,固定效应模型的核心是控制个体间的异质性,以便更准确地估计时间变化对因变量的影响。
固定效应模型的基本形式为:Yit = αi + β1 X1it + β2 X2it + … + βk Xkit + uit 其中,Yit表示第i个个体在第t个时间点的因变量值,αi表示第i个个体的固定效应,也就是不变的个体差异,X1it ~ Xkit为解释变量,β1 ~ βk为各解释变量的系数,uit为误差项。
为了控制个体间的异质性,固定效应模型通常采用差分(demean)方法,即对每个个体的变量值减去该个体的平均值,以消除个体间的固定效应。
因此,固定效应模型的估计方法是OLS(最小二乘法),但需要考虑个体间的聚类效应,因此需要进行异方差-稳健标准误(heteroskedasticity-robust standard errors)估计。
二、固定效应模型结果解读固定效应模型的核心是控制个体间的异质性,因此其系数解释应该是“时间变化对因变量的影响”,而不是“个体间差异对因变量的影响”。
因此,在解读固定效应模型结果时,需要关注系数的符号、大小和显著性,以及控制变量的影响。
1. 系数符号系数符号表示自变量的变化方向与因变量的变化方向是否一致。
如果系数为正,表示自变量的增加带来因变量的增加;如果系数为负,表示自变量的增加带来因变量的减少。
在探究时间变化对因变量的影响时,系数的符号应该与预期一致,即随着时间的增加,因变量的变化方向应该与系数符号一致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于面板数据模型及其固定效应的模型分析在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。
同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。
面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。
使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。
在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。
而这些工作在只有横截面数据或时序数据时是无法完成的。
然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。
使用面板数据做过实际研究的人可能会发现,使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。
大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。
然而,这个被广泛接受的理论假说,本质上来讲是有问题的。
我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。
因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而不是截距项。
我们试图从面板数据的横截面维度和时间序列维度的样本相关异质性角度来解释为什么使用的效应不同会使估计结果产生如此巨大的差异,而这很有可能正是由于异质性导致了在使用不同效应时,使估计的结果有显着的差异。
另外,所谓的不可观测的异质性(Unobserved Heterogeneity)在理论上被假定是无法用回归元观测的,同时,一般认为面板模型的固定效应与回归元可能是相关的,而且这个效应与回归元是否正交(相关)实际上也是判断应该使用固定效应还是随机效应的标准之一(Greene,20XX;Mundlak,1978)。
而所谓的不可观测的异质性,实际上至少并不是完全不可观测的,通过适当的模型设定,把固定效应再进行分解,就得到可观测的和真正不可观测的异质性,并且模型的估计将在国家效应和随机效应之间获得融合,在这点上,我们与Mundlak(1978)的结论是一致的。
面板模型的很多方法和解释通过教科书的广泛传播和人们的应用,已经形成了面板计量技术的使用者和研究者头脑中标准的理解,而这种已经在人们脑海中形成规范解释的东西则可能是较难以改变的,因此为了说明问题,我们在文中尽量使用直观的例子来进行解释,并对我们的想法给予简要而直接的证明,来加强论文的理论性。
一、横截面和时间序列,哪一个维度?一个有其他遗漏变量的例子读者可能会对这个问题稍微感到奇隆,并回答面板数据由于是二维数据,那么其回归结果也应该同时来自于两个维度,这正是面板数据的长处,并且直觉上两个维度上的相关关系应该是一致的,这应该是个不言自明的问题。
这个回答表面上看似正确的,然而真实的答案却不是那么简单,面板数据的回归结果并不真的一定同时来自两个维度,关于哪个维度占主要的问题在面板数据的分析中是至关重要的,尤其当我们有横截面和时间序列的维度相关异质性问题时。
这里我们所说的异质性不同于传统的面板异质性。
传统的面板异质性宣称异质性来自于依横截面和时点不同而变化的截距项,并通过横截面和时点的虚拟变量捕捉;而这个论点可能是武断的,异质性可能并不来自于截距项,而是来自于回归元的系数,尤其是在数据中经常有这样的现象,即自变量与因变量在横截面上的相关关系与时间序列上的相关关系是不同的②,这是我们所探讨的异质性,导致这种异质性的原因可能有很多,遗漏变量是一个可能的重要原因。
另外自变量在不同维度上对因变量本身就具有不同的作用,这也是一种可能。
图1为有其他变量遗漏的情况。
图1的面板数据样本具有4个截面,6个时期,数据由如下过程生成:然而,如果是不可观测的,那么模型就会产生遗漏变量偏差。
在实际面板数据模型的应用中,经常采用的步骤是先做混合回归,然后做横截面固定效应回归,然后做时间固定效应回归(或与横截面固定效应同时使用)。
如果看图1,很可能研究者就会采用横截面固定效应或者双固定效应,而在上面的案例中,采用混合回归与横截面固定效应回归都会得到完全错误的结果,其中横截面固定效应的估计结果偏差最高,双固定效应的估计稍好,但是也经常产生有偏的结果,只有时期固定效应会产生最无偏有效的估计结果。
图2给出了使用各种效应得到的回归拟合线,每个回归的截距项已经取平均从而使得回归线落在样本点的中央,从图2中可以看到,不同的模型设定对估计系数产生明显的影响。
很明显,只有时间固定效应得到了x与y的真实的相关关系,偏差最小;横截面固定效应则显示了x与y在时序上的相关关系,是偏差最大的估计;混合回归也基本显示了时序的信息;而双固定效应在这里凑巧也有较大的估计偏误,这是因为双固定效应的双向组内均值离差操作损失了许多有用的样本信息,并且在我们模拟中的一个相对大的干扰项方差也降低了估计的效率。
那么,为什么以上结果会发生呢?为了解决这个问题,我们需要探讨面板数据模型固定效应估计的本质。
1.横截面和时间固定效应的本质如果我们有一个截面个体的时间序列样本y和X,我们可以对y和X做回归得到截距项α和系数向量β,这反映了样本在时序上的相关关系,如果我们把每个截面都做回归,就得到一个方程系统:从式(5)和式(6)中,很容易发现,拟合准则对于β和α的一阶条件产生了同样的估计条件,也即是横截面固定效应估计量的估计条件:Xβ+Dα=y (7)这个估计量即是有一个线性约束=β的每个截面个体的时间序列回归的估计量,同时我们知道这也是横截面固定效应的估计量。
因此,我们有推论1: 推论 1 横截面固定效应估计本质上是在做一个有线性约束的时间序列回归,约束则是每个横截面个体具有相同的回归系数。
同样,容易证明,时间固定效应估计量本质上是在做一个有线性约束的横截面回归,约束则是每个时期的横截面回归具有相同的回归系数。
而回忆固定效应的算法,我们知道,横截面固定效应(时期固定效应),或者说不可观测的异质性,实际上是约束每个横截面(每个时期)的误差项的均值为0的结果,因此,固定效应,或者说不可观测的异质性实际是估计的结果而不是原因。
2.每个横截面的和总的β的关系给定横截面个体i,我们知道该横截面的时间序列回归的估计量包含在式(10)中:可以看到,每个截面的时序回归实际上是把估计横截面固定效应的样本按横截面分成n份,或者反过来说横截面固定效应的估计实际上是把每一个截面的时序回归的样本放到一起形成一个大样本,那么,每个截面的回归系数与固定效应的回归系数β有什么样的关系呢?我们通过假设只有一个回归元x来给出直接的例证,若只有一个x,则对于某截面i有:如果现在有多于1个的回归元,并且回归元之间理论上是无关的,那么这时式(13)仍然成立,但如果回归元之间是相关的,问题就会复杂很多,不过如果使用偏回归方法,先排除其他变量的干扰,我们仍然可以得到类似的结论,我们自己所做的一些数值模拟和估计也显示了这点,细节不在这里补充。
由以上的讨论,可得到推论2。
推论 2 横截面固定效应估计本质上是在做一个有线性约束的时间序列回归,其估计结果等于对每一个横截面进行时序回归得到的系数的加权平均。
同样的结论可以推广到时间固定效应的估计,即时间固定效应的估计结果等于每个时期横截面回归估计结果的加权平均。
现在我们知道图1和图2所示的例子中为什么使用混合效应,横截面固定效应会出现明显的偏误,而时期固定效应的结果则是正确的。
因为和由于非平稳性导致在时序上两者是相关的,但是因为是随机生成的,并且和的生成过程是独立的,因此和在横截面维度上是不相关的。
而使用混合回归不区分样本信息究竟来自哪个维度,它合并了时间序列和横截面二维的样本信息进行回归,因此导致的估计产生向上的偏误(因为被遗漏了),但混合回归的结果并不是偏误最严重的,因为至少在横截面方向上和是无关的;横截面固定效应估计则有最严重的偏误,因为如前所述,横截面固定效应是做一个有线性约束的时序回归,其结果等于每个截面的回归结果的加权平均,而这里和在时间序列上相关性明显,导致估计结果有很大偏误;只有时期固定效应产生了最准确的估计,因为时期固定效应做的是横截面方向的回归,而这里由于在横截面方向上和是无关的,因此即使缺失,也不会对的估计结果产生干扰,时期固定效应在以上我们所模拟的数据中是最好的估计量③。
上面的例子中所做的模拟数据是一个有着大T小N的数据集,而面板数据一般是有着大N小T的数据集,因此我们的模拟可能会由于其特定的T和N而受到质疑,而实际上,理论结果并不受到样本尺寸的明显影响。
图3和图4展示了另一个有着相对大N和小T的模拟数据,其中N=6,T=3。
3.四个估计量之间的关系前面我们说明了横截面固定效应和时间固定效应的本质,即横截面固定效应估计得到的更多是样本时间维上的相关关系,时间固定效应估计得到的更多是样本横截面维度上的相关关系;而混合效应的本质则十分容易理解,它不区分这两个维度,把所有样本当成一个维度来估计,合并了样本截面维和时间维上的信息;而双向固定效应的估计量我们知道为,下面我们要继续深入问下一个问题:混合效应、截面固定效应、时间固定效应和双向固定效应之间的关系是什么?同时,双向固定效应的本质又是什么?由式(17),我们得到:总之,我们有推论3。
推论3 混合效应、截面固定效应、时期固定效应以及双向固定效应的估计量有式(20)和式(21)所示的理论关系,双向固定效应估计量可以表示为其他三个估计量的(正定)矩阵加权平均形式,在只有一个自变量时,关系可简化为式(27),权重为相应估计量的自变量方差之比。