面板数据的F检验固定效应检验
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析)面板数据分析方法:面板单位根检验—若为同阶—面板协整—回归分析—若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。
先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。
不是时间序列那种接近0.8为优秀。
另外,建议回归前先做stationary。
很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。
fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。
该如何选择呢?步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。
李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。
这种情况称为称为虚假回归或伪回归(spurious regression)。
他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。
因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。
而检验数据平稳性最常用的办法就是单位根检验。
首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。
stata面板数据固定效应的异方差检验结果

标题:Stata面板数据固定效应的异方差检验结果在进行面板数据分析时,固定效应模型是一种常用的方法,它可以帮助研究者控制个体间的不可观测的异质性,并更准确地估计变量间的关系。
然而,在使用固定效应模型进行面板数据分析时,我们也需要关注异方差的存在,因为异方差的存在会影响到模型的稳健性和准确性。
本文将使用Stata软件对固定效应模型进行异方差检验,并共享检验结果。
1. 异方差的定义让我们来了解一下异方差的概念。
异方差是指误差项的方差不是恒定的,而是随着自变量或其他因素的变化而变化。
在面板数据分析中,由于不同个体或单位之间的特征差异,误差项的方差可能存在异方差的情况。
2. Stata软件中固定效应模型的异方差检验方法在Stata软件中,我们可以使用“xttest3”命令来进行固定效应模型的异方差检验。
这个命令可以帮助我们检验面板数据中误差项的异方差性质。
3. Stata命令示例下面是一个在Stata中进行固定效应模型异方差检验的示例:```stataxtset id timextreg y x1 x2, fexttest3```在这个示例中,我们首先使用“xtset”命令来指定面板数据的格式,然后使用“xtreg, fe”命令来拟合固定效应模型,最后使用“xttest3”命令来进行异方差检验。
4. 异方差检验的结果在进行了上述命令后,Stata会输出异方差检验的结果。
我们需要关注的主要指标包括LM统计量、Chisq统计量、以及对应的p值。
5. 结果分析对于LM统计量和Chisq统计量,它们的值越大,对应的p值越小,就越表明存在异方差。
通常情况下,我们会根据LM统计量和Chisq统计量的显著性水平来判断是否存在异方差。
如果p值小于0.05,我们就可以拒绝存在异方差的原假设,即面板数据中存在异方差。
6. 结论通过Stata软件对固定效应模型进行异方差检验,我们可以得出面板数据中是否存在异方差的结论。
如果存在异方差,我们需要在后续分析中进行相应的修正,以确保模型估计的准确性和稳健性。
面板数据模型设定检验方法

1:(STATA 的双固定效应)xi :xtreg y x1 x2 i.year,fe 2:变系数模型 (1)生成虚拟变量 tab id,gen(id) gen open1=id1*open gen open2=id2*open (2)变系数命令xtreg y open1 open2。
,fe 面板数据模型设定检验方法4.1 F 检验先介绍原理。
F 统计量定义为()()/~, (30)/()R U U RSS RSS J F F J N k RSS N k -=--其中RSS r 表示施加约束条件后估计模型的残差平方和,RSS u 表示未施加约束条件的估计模型的残差平方和,J 表示约束条件个数,N 表示样本容量,k 表示未加约束的模型中被估参数的个数。
在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( J , N – k )的F 分布。
以检验个体固定效应回归模型为例,介绍F 检验的应用。
建立假设H 0:i =。
模型中不同个体的截距相同(真实模型为混合回归模型)。
H 1:模型中不同个体的截距项i不同(真实模型为个体固定效应回归模型)。
F 统计量定义为:F =)/()]()/[()(k N NT SSE k N NT k NT SSE SSE u u r --------1=)/()/()(k N NT SSE N SSE SSE u u r ----1(31)其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。
非约束模型比约束模型多了N -1个被估参数。
以案例1为例,已知SSE r = 4824588,SSE u = 2270386,F =)/()/()(11----N NT SSE N SSE SSE u u r =)/()/()(115105227038611522703864824588----=22510182443= 8.1(32)F 0.05(6, 87) = 1.8因为F = 8.1 > F 0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析)面板数据分析方法:面板单位根检验—若为同阶—面板协整—回归分析—若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。
先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。
不是时间序列那种接近0.8为优秀。
另外,建议回归前先做stationary。
很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。
fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。
该如何选择呢?步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。
李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。
这种情况称为称为虚假回归或伪回归(spurious regression)。
他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。
因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。
而检验数据平稳性最常用的办法就是单位根检验。
首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。
面板数据固定效应模型的检验

汇报人:2023-11-26contents •引言•固定效应模型原理及假设条件•面板数据描述性统计与预处理•固定效应模型构建与估计方法•实证结果分析与讨论•结论与展望目录011 2 3通过F检验或Hausman检验,判断固定效应模型是否显著优于混合OLS模型。
固定效应显著性检验通过LM检验或似然比检验,判断时间固定效应是否显著。
时间固定效应检验通过观察个体固定效应的系数显著性,判断个体固定效应是否显著。
个体固定效应检验固定效应模型的假设检验通过BP检验、White检验等方法,检验模型是否存在异方差性。
异方差性检验自相关性检验多重共线性检验通过观察残差图、DW检验等方法,判断模型是否存在自相关性。
通过计算方差膨胀因子(VIF)、条件指数等方法,判断模型是否存在多重共线性问题。
030201固定效应模型的稳健性检验固定效应估计法(FE)通过引入个体和时间固定效应,消除个体和时间层面上的异质性,提高模型估计的准确性。
随机效应估计法(RE)假设个体和时间效应与解释变量无关,通过广义最小二乘法(GLS)进行估计,适用于大样本数据。
最小二乘法(OLS)适用于满足经典假设的面板数据,具有无偏性和一致性。
固定效应模型的估计方法选择02引言介绍面板数据固定效应模型的检验方法,阐述其原理及应用场景。
目的面板数据固定效应模型是经济学、金融学等领域中广泛应用的计量经济学模型之一,用于分析个体和时间因素对因变量的影响。
背景目的和背景如何验证固定效应模型是否适用于所研究的问题,以确保估计结果的一致性和有效性。
如何在固定效应模型与其他面板数据模型之间进行选择,以找到最适合所研究问题的模型。
研究问题模型选择问题固定效应模型的有效性数据来源与样本选择数据来源说明数据的来源,如公开数据库、调查问卷等,以确保数据的可靠性和准确性。
样本选择阐述样本选择的依据和原则,如样本的代表性、时间跨度等,以保证研究结论的普适性和可推广性。
03固定效应模型原理及假设条件面板数据固定效应模型是针对面板数据的一种线性回归模型,通过在模型中加入个体固定效应和时间固定效应来控制不同个体和时间对因变量的影响,从而得到更加准确的估计结果。
面板数据模型的检验方法研究

面板数据模型的检验方法研究一、本文概述在统计学和经济学的实证研究中,面板数据模型已经成为了一种非常重要的工具。
由于其能够同时考虑时间序列和横截面数据的信息,使得模型设定更加丰富,能够更好地刻画现实世界的复杂性。
然而,随着面板数据模型应用的广泛,如何对其进行准确且有效的检验,确保模型的适用性和预测准确性,成为了亟待解决的问题。
本文旨在探讨面板数据模型的检验方法,以期为相关领域的实证研究提供有益的参考。
具体而言,本文首先将对面板数据模型的基本理论进行梳理,明确其特点和适用场景。
然后,将详细介绍面板数据模型的常见检验方法,包括但不限于单位根检验、协整检验、模型设定检验等。
这些检验方法不仅能够检验模型的内在稳定性和一致性,还能为模型参数的估计和预测提供重要依据。
本文还将对面板数据模型检验方法的最新研究进展进行综述,以期为读者提供全面的视角。
本文将通过实际案例分析,演示面板数据模型检验方法的应用,从而增强文章的实用性和操作性。
总体而言,本文期望通过对面板数据模型检验方法的深入研究,为相关领域的研究者提供一套系统、完整的检验方法体系,以推动面板数据模型在实证研究中的应用和发展。
二、面板数据模型理论基础面板数据模型(Panel Data Model)是计量经济学中一个重要的分析工具,它能够同时处理横截面和时间序列两个维度的数据。
面板数据模型不仅能够控制不可观测的异质性,提高估计效率,还能更好地捕捉数据的动态特征。
因此,面板数据模型在经济、金融、社会学等领域得到了广泛的应用。
面板数据模型的理论基础主要建立在三大类别之上:固定效应模型、随机效应模型和混合效应模型。
固定效应模型假设每个个体的截距项是固定的,不同个体之间的截距项存在差异,但不随时间变化。
随机效应模型则假设截距项是随机的,并且与解释变量不相关。
混合效应模型则假设所有个体的截距项都相同,没有考虑个体差异。
在实际应用中,研究者通常需要根据样本数据和研究目的选择合适的模型。
面板数据的F检验,固定效应检验

里板数据模型(PANEL DATA)F考验,牢固效力考验之阳早格格创做1.里板数据定义.时间序列数据大概截里数据皆是一维数据.比圆时间序列数据是变量准时间得到的数据;截里数据是变量正在截里空间上的数据.里板数据(panel data)也称时间序列截里数据(time series and cross section data)大概混同数据(pool data).里板数据是共时正在时间战截里空间上博得的二维数据.里板数据示企图睹图1.里板数据从横截里(cross section)上瞅,是由若搞个体(entity, unit, individual)正在某一时刻形成的截里瞅测值,从纵剖里(longitudinal section)上瞅是一个时间序列.里板数据用单下标变量表示.比圆yi t, i = 1, 2, …, N; t = 1, 2, …, TN表示里板数据中含有N个个体.T表示时间序列的最大少度.若牢固t稳定,yi ., ( i = 1, 2, …, N)是横截里上的N个随机变量;若牢固i稳定,y. t, (t = 1, 2, …, T)是纵剖里上的一个时间序列(个体).图1 N=7,T=50的里板数据示企图比圆1990-2000年30个省份的农业总产值数据.牢固正在某一年份上,它是由30个农业总产总值数字组成的截里数据;牢固正在某一省份上,它是由11年农业总产值数据组成的一个时间序列.里板数据由30个个体组成.公有330个瞅测值.对付于里板数据yi t, i = 1, 2, …, N; t = 1, 2, …, T去道,如果从横截里上瞅,每个变量皆有瞅测值,从纵剖里上瞅,每一期皆有瞅测值,则称此里板数据为仄稳里板数据(balanced panel data).若正在里板数据中拾得若搞个瞅测值,则称此里板数据为非仄稳里板数据(unbalanced panel data).注意:EViwes 3.1、4.1、5.0既允许用仄稳里板数据也允许用非仄稳里板数据预计模型.例1(file:panel02):1996-2002年华夏东北、华北、华东15个省级天区的住户家庭人均消耗(稳定代价)战人均支进数据睹表1战表2.数据是7年的,每一年皆有15个数据,共105组瞅测值.人均消耗战支进二个里板数据皆是仄稳里板数据,各有15个个体.人均消耗战支进的里板数据从纵剖里瞅察分别睹图2战图3.从横截里瞅察分别睹图4战图5.横截里数据集面图的表示与瞅测值程序有闭.图4战图5经纪均消耗战支进瞅测值程序是按天区名的汉语拼音字母程序排序的.住户家庭人均消耗数据(稳定代价)天区人均消耗1996199719981999200020012002 CP-AH(安徽)CP-BJ(北京)CP-FJ(祸建)CP-HB(河北)CP-HLJ(乌龙江)CP-JL(凶林)CP-JS(江苏)CP-JX(江西)CP-LN(辽宁)CP-NMG(内受古)CP-SD(山东)CP-SH(上海)CP-SX(山西)CP-TJ(天津)CP-ZJ(浙江)资料根源:《华夏统计年鉴》1997-2003.住户家庭人均支进数据(稳定代价)天区人均支进1996199719981999200020012002 IP-AH(安徽)IP-BJ(北京)IP-FJ(祸建)IP-HB(河北)IP-HLJ(乌龙江)IP-JL(凶林)IP-JS(江苏)IP-JX(江西)IP-LN(辽宁)IP-NMG(内受古)IP-SD(山东)IP-SH(上海)IP-SX(山西)IP-TJ(天津)IP-ZJ(浙江)资料根源:《华夏统计年鉴》1997-2003.图2 15个省级天区的人均消耗序列(纵剖里)图3 15个省级天区的人均支进序列(file:4panel02)图4 15个省级天区的人均消耗集面图图5 15个省级天区的人均支进集面图(7个横截里叠加)(每条连线表示共一年度15个天区的消耗值) (每条连线表示共一年度15个天区的支进值)用CP表示消耗,IP表示支进.AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、祸建省、河北省、乌龙江省、凶林省、江苏省、江西省、辽宁省、内受古自治区、山东省、上海市、山西省、天津市、浙江省.15个天区7年人均消耗对付支进的里板数据集面图睹图6战图7.图6中每一种标记代表一个省级天区的7个瞅测面组成的时间序列.相称于瞅察15个时间序列.图7中每一种标记代表一个年度的截里集面图(共7个截里).相称于瞅察7个截里集面图的叠加.图6 用15个时间序列表示的人均消耗对付支进的里板数据图7 用7个截里表示的人均消耗对付支进的里板数据(7个截里叠加)为了瞅察得更领会一些,图8给出北京战内受古1996-2002年消耗对付支进集面图.从图中不妨瞅出,无论是从支进仍旧从消耗瞅内受古的火仄皆矮于北京市.内受古2002年的支进与消耗规模还不如北京市1996年的大.图9给出该15个省级天区1996战2002年的消耗对付支进集面图.可睹6年之后15个天区的消耗战支进皆有了相映的普及.图8 北京战内受古1996-2002年消耗对付支进时序图图9 1996战2002年15个天区的消耗对付支进集面图2.里板数据的预计.用里板数据建坐的模型常常有3种.即混同预计模型、牢固效力模型战随机效力模型.2.1 混同预计模型.如果从时间上瞅,分歧个体之间不存留隐著性好别;从截里上瞅,分歧截里之间也不存留隐著性好别,那么便不妨曲交把里板数据混同正在所有用一般最小二乘法(OLS)预计参数.如果从时间战截里瞅模型截距皆不为整,且是一个相共的常数,以二变量模型为例,则建坐如下模型,yit = a +b1 xit +eit, i = 1, 2, …, N; t = 1, 2, …,T (1)a 战b1不随i,t变更.称模型(1)为混同预计模型.以例1中15个天区1996战2002年数据建坐闭于消耗的混同预计模型,得截止如下:图10EViwes预计要领:正在挨启处事文献窗心的前提上,面打主功能菜单中的Objects键,选New Object功能,进而挨启New Object(新对付象)采用窗.正在Type of Object采用区采用Pool(混同数据库),面打OK键,进而挨启Pool (混同数据)窗心.正在窗心中输进15个天区标记AH(安徽)、BJ(北京)、…、ZJ(浙江).工具栏中面打Sheet 键,进而挨启Series List(列写序列名)窗心,定义变量CP?战IP?,面打OK键,Pool(混同大概合并数据库)窗心隐现里板数据.正在Pool窗心的工具栏中面打Estimate 键,挨启Pooled Estimation(混同预计)窗心如下图.图11正在Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP?;Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗面打Common;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.得输出截止如图10.相映表黑式是= 129.6313+0.7587IPit15个省级天区的人均开销仄稳占支进的76%.如果从时间战截里上瞅模型截距皆为整,便不妨建坐不含截距项的(a = 0)的混同预计模型.以二变量模型为例,建坐混同预计模型如下,yit = b1 xit +eit, i = 1, 2, …, N; t = 1, 2, …,T (2)对付于本例,果为上式中的截距项有隐著性(t = 2.0 > t0.05 (103) = 1.99),所以建坐截距项为整的混同预计模型是分歧适的.EViwes预计要领:正在Pooled Estimation(混同预计)对付话框中Intercept(截距项)采用窗中选None,其余选项共上.2.2 牢固效力模型.正在里板数据集面图中,如果对付于分歧的截里大概分歧的时间序列,模型的截距是分歧的,则不妨采与正在模型中加假造变量的要领预计返回参数,称此种模型为牢固效力模型(fixed effects regression model).牢固效力模型分为3种典型,即个体牢固效力模型(entity fixed effects regression model)、时刻牢固效力模型(time fixed effects regression model)战时刻个体牢固效力模型(time and entity fixed effects regression model).底下分别介绍.(1)个体牢固效力模型.个体牢固效力模型便是对付于分歧的个体有分歧截距的模型.如果对付于分歧的时间序列(个体)截距是分歧的,然而是对付于分歧的横截里,模型的截距不隐著性变更,那么便该当建坐个体牢固效力模型,表示如下,yit = b1 xit +g1 W1 + g2W2 + … +gNWN +eit, t = 1, 2, …, T (3)其中Wi=eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yit, xit, i = 1, 2, …, N; t = 1, 2, …, T分别表示被阐明变量妥协释变量.模型(3)大概者表示为y1t = g1 +b1 x1t +e1t, i = 1(对付于第1个个体,大概时间序列),t = 1, 2, …, Ty2t = g2 +b1 x2t +e2 t, i = 2(对付于第2个个体,大概时间序列),t = 1, 2, …, T…yN t = gN +b1 xN t +e N t, i = N(对付于第N个个体,大概时间序列),t = 1, 2, …, T写成矩阵形式,y1 = (1 x1) +e1 = g1 +x1 b +e1…yN = (1 xN) +eN = gN + xNb+eN上式中yi,gi,ei,xi皆是N´1阶列背量.b为标量.当模型中含有k个阐明变量时,b为k´1阶列背量.进一步写成矩阵形式,= + b +上式中的元素1,0皆是T´1阶列背量.里板数据模型用OLS要领预计时应谦脚如下5个假定条件:(1)E(eit|xi1, xi2, …, xiT, ai) = 0.以xi1, xi2, …, xiT, ai为条件的eit的憧憬等于整.(2)(xi1, xi2, …, xiT), ( yi1, yi2, …, yiT), i = 1, 2, …, N分别去自于共一个共同分集总体,并相互独力.(3)(xit, eit)具备非整的有限值4阶矩.(4)阐明变量之间不存留真足共线性.(5)Cov(eit eis|xit,xis, ai) = 0, t ¹ s.正在牢固效力模型中随机缺面项eit正在时间上利害自相闭的.其中xit代表一个大概多个阐明变量.对付模型(1)举止OLS预计,局部参数预计量皆是无偏偏的战普遍的.模型的自由度是NT –1–N.当模型含有k个阐明变量,且N很大,相对付较小时,果为模型中含有k + N个被估参数,普遍硬件真止OLS运算很艰易.正在计量经济教硬件中是采与一种特殊处理办法举止OLS预计.预计本理是,先用每个变量减其组内均值,把数据核心化(entity-demeaned),而后用变更的数据先预计个体牢固效力模型的返回系数(不包罗截距项),而后利用组内均值等式预计截距项.那种要领预计起去速度快.简曲分3步如下.(1)最先把变量核心化(entity-demeaned).仍以单阐明变量模型(3)为例,则有= gi+ b1 + , i = 1, 2, …, N (4)其中 = ,= , = , i = 1, 2, …, N.公式(1)、(4)相减得,(yit - ) = b1(xit -) + (eit- ) (5)令(yit - ) = ,(xit -) = ,(eit- ) = ,上式写为= b1 + (6)用OLS法预计(1)、(6)式中的b1,截止是一般的,然而是用(6)式预计,不妨缩小被估参数个数.(2)用OLS法预计返回参数(不包罗截距项,即牢固效力).正在k个阐明变量条件下,把用背量形式表示,则利用核心化数据,按OLS法预计公式预计个体牢固效力模型中返回参数预计量的圆好协圆好矩阵预计式如下,() = ( ' )-1 (7)其中 = ,是相对付于的残好背量.(3)预计返回模型截距项,即牢固效力参数gi.= - (8)以例1(file:panel02)为例得到的个体牢固效力模型预计截止如下:注意:个体牢固效力模型的EViwes输出截止中不大众截距项.图12EViwes预计要领:正在EViwes的Pooled Estimation对付话框中Intercept选项中选Fixed effects.其余选项共上.注意:(1)个体牢固效力模型的EViwes输出截止中不大众截距项.(2)EViwes输出截止中不给出形貌个体效力的截距项相映的尺度好战t值.不认为截距项是模型中的要害参数.(3)当对付个体牢固效力模型采用加权预计时,输出截止将给出加权预计战非加权预计二种统计量评介截止.(4)输出截止的联坐圆程组形式不妨通过面打View选Representations功能赢得.(5)面打View选Wald Coefficient Tests…功能不妨对付模型的斜率举止Wald考验.(6)面打View选Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能不妨分别得到按个体预计的残好序列表,残好序列图,残好序列的圆好协圆好矩阵,残好序列的相闭系数矩阵.(7)面打Procs选Make Model功能,将会出现预计截止的联坐圆程形式,进一步面打Solve键,正在随后出现的对付话框中不妨举止径背战固态预测.输出截止的圆程形式是(55.0)= 北京+ x2t = 1053.2 + 0.70x2t… (55.0)= 浙江+ x15t = 714.2 + 0.70x15t(55.0)从截止瞅,北京、上海、浙江是消耗函数截距(自收消耗)最大的3个天区.相对付于混同预计模型去道,是可有需要建坐个体牢固效力模型不妨通过F考验去完毕.本假设H0:分歧个体的模型截距项相共(建坐混同预计模型).备择假设H1:分歧个体的模型截距项分歧(建坐个体牢固效力模型).F统计量定义为:F= = (9)其中SSEr,SSEu分别表示拘束模型(混同预计模型)战非拘束模型(个体牢固效力模型)的残好仄圆战.非拘束模型比拘束模型多了N-1个被估参数.(混同预计模型给出大众截距项.)注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-N-k.用上例预计,已知SSEr = 4824588,SSEu = 2270386,果为F= 7.15> F0.05(14, 89) = 1.81,所以,中断本假设.论断是该当建坐个体牢固效力模型.(2)时刻牢固效力模型.时刻牢固效力模型便是对付于分歧的截里(时刻面)有分歧截距的模型.如果确知对付于分歧的截里,模型的截距隐著分歧,然而是对付于分歧的时间序列(个体)截距是相共的,那么该当建坐时刻牢固效力模型,表示如下,yit = b1 xit +a1 + a2D2 + … +aT DT+eit, i = 1, 2, …,N (10)其中Dt=eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yi t, xit, i = 1, 2, …, N; t = 1, 2, …, T分别表示被阐明变量妥协释变量.模型(10)也可表示为yi1 = a1 +b1 xi1 + ei1, t = 1,(对付于第1个截里),i = 1, 2, …, Nyi2 = (a1 +a2) +b1 xi2 + ei2, t = 2,(对付于第2个截里),i = 1, 2, …, N…yiT = (a1 +aT) +b1 xiT + eiT, t = T,(对付于第T个截里),i = 1, 2, …, N如果谦脚上述模型假定条件,对付模型(2)举止OLS预计,局部参数预计量皆具备无偏偏性战普遍性.模型的自由度是NT –T-1.图13EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP? 战假造变量D1997, D1998, D1999, D2000, D2001, D2002;正在Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗面打Common;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.以例1为例得到的时刻牢固效力模型预计截止如下:(1.5) (74.6)(1.5) (0.4) (74.6)…(1.5) (0.4) (74.6)相对付于混同预计模型去道,是可有需要建坐时刻牢固效力模型不妨通过F考验去完毕.H0:对付于分歧横截里模型截距项相共(建坐混同预计模型).H1:对付于分歧横截里模型的截距项分歧(建坐时刻牢固效力模型).F统计量定义为:F= = (11)其中SSEr,SSEu分别表示拘束模型(混同预计模型的)战非拘束模型(时刻牢固效力模型的)的残好仄圆战.非拘束模型比拘束模型多了T-1个被估参数.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-T- k.用上例预计,已知SSEr= 4824588,SSEu= 4028843,果为F= 3.19> F0.05(14, 89) = 2.2,中断本假设,论断是该当建坐时刻牢固效力模型.(3)时刻个体牢固效力模型.时刻个体牢固效力模型便是对付于分歧的截里(时刻面)、分歧的时间序列(个体)皆有分歧截距的模型.如果确知对付于分歧的截里、分歧的时间序列(个体)模型的截距皆隐著天不相共,那么该当建坐时刻个体效力模型,表示如下,yit = b1 xit +a1+a2D2 +…+aT DT+g1W1+g2W2+…+gNWN+eit, i=1,2,…,N,t = 1, 2, …, T(12)其中假造变量Dt= (注意不是从1启初)Wi= (注意是从1启初)eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yi t, xit, (i = 1, 2, …, N; t = 1, 2, …, T)分别表示被阐明变量妥协释变量.模型也可表示为y11 = a1 +g1 +b1 x11 + e11, t = 1,i = 1(对付于第1个截里、第1个个体)y21 = a1 +g2 +b1 x21 + e21, t = 1,i = 2(对付于第1个截里、第2个个体)…yN1 = a1 +gN +b1 xN1 + eN1, t = 1,i = N(对付于第1个截里、第N个个体)y12 = (a1 +a2) +g1 +b1 x12 + e12, t = 2,i = 1(对付于第2个截里、第1个个体)y22 = (a1 +a2) +g2 +b1 x22 + e22, t = 2,i = 2(对付于第2个截里、第2个个体)…yN2 = (a1 +a2) +gN +b1 xN2 + eN2, t = 2,i = N(对付于第2个截里、第N个个体)…y1T = (a1 +aT) +g1 +b1 x12 + e1T, t = T,i = 1(对付于第T个截里、第1个个体)y2T = (a1 +aT) +g2 +b1 x22 + e2T, t = T,i = 2(对付于第T个截里、第2个个体)…yNT = (a1 +aT) +gN +b1 xNT + eNT, t = T,i = N(对付于第T个截里、第N个个体)如果谦脚上述模型假定条件,对付模型(12)举止OLS预计,局部参数预计量皆是无偏偏的战普遍的.模型的自由度是NT– N–T.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT– N -T- k+1.以例1为例得到的截里、时刻牢固效力模型预计截止如下:图14EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP? 战假造变量D1997, D1998, D1999, D2000, D2001, D2002;正在Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗中选Fixed effects;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.注意:(1)对付于第1个截里(t=1)EViwes输出截止中把(a1+gi), (i = 1, 2, …, N)预计正在所有.(2)对付于第2, …, T个截里(t=1)EViwes输出截止中分别把(a1 +at), (t = 2, …, T)预计正在所有.输出截止如下:= 1996 + x11 = 537.9627 + 0.6712x11,(1996年安徽省)= 1996 + x21 = 1223.758 + 0.6712x21,(1996年北京市)…= 1997 + x11 = 98.91126 + 0.6712x11,(1997年安徽省)= 1997 + x21 = 98.91126 +1223.758 +0.6712x21,(1997年北京市)…= 2002 + + x15,7 = (183.3882 +870.4197) + 0.6712x15,1,(2002年浙江省)相对付于混同预计模型去道,是可有需要建坐时刻个体牢固效力模型不妨通过F考验去完毕.H0:对付于分歧横截里,分歧序列,模型截距项皆相共(建坐混同预计模型).H1:分歧横截里,分歧序列,模型截距项各不相共(建坐时刻个体牢固效力模型).F统计量定义为:F= =(13)其中SSEr,SSEu分别表示拘束模型(混同预计模型的)战非拘束模型(时刻个体牢固效力模型的)的残好仄圆战.非拘束模型比拘束模型多了N+T个被估参数.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-N-T- k+1.用上例预计,已知SSEr= 4824588,SSEu= 2045670,果为F= 5.6> F0.05(14, 89) = 1.64,中断本假设,论断是该当建坐时刻个体牢固效力模型.(4)随机效力模型正在牢固效力模型中采与假造变量的本果是阐明被阐明变量的疑息不敷完备.也不妨通过对付缺面项的领会去形貌那种疑息的缺得.yit = a+ b1 xit + eit (14)其中缺面项正在时间上战截里上皆是相闭的,用3个分量表示如下.eit = ui + vt + wit (15)其中ui ~N(0, su2)表示截里随机缺面分量;vt ~N(0, sv2)表示时间随机缺面分量;wit ~N(0, sw2)表示混战随机缺面分量.共时还假定ui,vt,wit之间互不相闭,各自分别不存留截里自相闭、时间自相闭战混战自相闭.上述模型称为随机效力模型.随机效力模型战牢固效力模型比较,相称于把牢固效力模型中的截距项瞅成二个随机变量.一个是截里随机缺面项(ui),一个是时间随机缺面项(vt).如果那二个随机缺面项皆遵循正态分集,对付模型预计时便不妨节省自由度,果为此条件下只需要预计二个随机缺面项的均值战圆好.假定牢固效力模型中的截距项包罗了截里随机缺面项战时间随机缺面项的仄稳效力,而且对付均值的离好分别是ui 战vt,牢固效力模型便形成了随机效力模型.为了简单明黑,先假定模型中只存留截里随机缺面项ui,不存留时间随机缺面分量(vt),yit = a+ b1 xit + (wit+ ui)= a+ b1 xit+eit (16)截里随机缺面项ui是属于第个个体的随机动摇分量,并正在所有时间范畴(t = 1,2, …, T)脆持稳定.随机缺面项ui, wit 应谦脚如下条件:E(ui) =0,E(wit) = 0E(wit 2) = sw2,E(ui 2)= su2,E(wit uj) =0, 包罗所有的i, t, j.E(wit wjs) =0, i ¹ j, t ¹ sE(ui uj) =0, i ¹ j果为根据上式有eit = wit+ ui所以那种随机效力模型又称为缺面分量模型(error component model).有论断,E(eit) = E(wit+uj) =0,(16)式,yit = a+ b1 xit + (wit+ ui),也不妨写成yit = (a + ui) + b1 xit + wit.遵循正态分集的截距项的均值效力au被包罗正在返回函数的常数项中.E(eit 2) = E(wit+uj)2 = sw2 +su2,E(eit eis) = E[(wit+ ui)(wis+ ui)] = E[(wit wis + ui wis + wit ui + ui2)] =su2, t ¹ s令ei = (ei1, ei2, …eiT)'则W = E(eiei') ==sw2 I(T´T) +su21(T´1)1(T´1) '其中I(T´T)是(T´T)阶单位阵,1(T´1)是(T´1)阶列背量.果为第i期与j期瞅测值是相互独力的,所以NT个瞅测值所对付应的随机缺面项的圆好与协圆好矩阵V是V = = ÄW = IN´NÄW其中IN´N表示由(T´1)阶列背量为元素形成的单位阵,其中每一个元素1大概0皆是(T´1)阶列背量.Ä表示科罗内克积(Kronecker product).其运算准则是AN´KÄB =考验个体随机效力的本假设与考验统计量是H0:su2 = 0.(混同预计模型)H1:su2 ¹ 0.(个体随机效力模型)LM= ==其中表示由个体随机效力模型预计的残好仄圆战. 表示由混同预计模型预计的残好仄圆战.统计量LM遵循1个自由度的c2分集.不妨对付随机效力模型举止广义最小二乘预计.以瞅测值圆好的倒数为权.为了供权数,必须采与二阶段最小二乘法预计.果为各随机缺面分量的圆好普遍是已知的,第一阶段用一般最小二乘预计法对付混同数据举止预计(采与牢固效力模型).用预计的残好预计随机缺面分量的圆好.第二步用那些预计的圆好预计参数的广义最小二乘预计值.如果随机缺面分量遵循的是正态分集,模型的参数还不妨用极大似然法预计.仍以例1为例给出随机效力模型预计截止如下:图15注意:随机效力模型EViwes输出截止中含有大众截距项.图16以例1为例,用个体随机效力模型战混同模型预计的统计量的值是LM = = =8.75´(24.4)2 = 5209果为F= 5209 > F0.05 (1) = 3.84,所以中断本假设,论断是该当建坐个体随机效力模型.假定截里截距战时间截距皆是随机的.分别遵循均值为au战av,圆好为su2战sv2的正态分集.随机缺面项将由3部分组成,并有圆好.Var(eit) = Var(ui) + Var(vt) + Var(wit) =su2 +sv2+sw2当su2战sv 2皆等于整,随机效力模型退化为牢固效力模型.随机效力模型战牢固效力模型哪一个更佳些?本质是各有劣缺面.随机效力模型的佳处是节省自由度.对付于从时间序列战截里二圆里上瞅皆存留较大变更的数据,随机效力模型能精确天形貌出缺面根源的特性.牢固效力模型的佳处是很简单领会任性截里数据所对付应的果变量与局部截里数据对付应的果变量均值的好别程度.别的,牢固效力模型不央供缺面项中的个体效力分量与模型中的阐明变量不相闭.天然,那一假定不可坐时,大概会引起模型参数预计的纷歧致性.(5)返回系数分歧的里板数据模型当认为对付于分歧个体,阐明变量的返回系数存留隐著性好别时,还不妨建坐返回系数分歧的里板数据模型. EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗脆持空黑(如果需要预计时刻牢固效力也可输进假造变量D1997, D1998,D1999, D2000, D2001, D2002);正在Cross section specific coefficients(截里系数分歧)采用窗挖进IP?;正在Intercept(截距项)采用窗中选Fixed effects(也不妨搞其余采用);正在Weighting(权数)采用窗面打Noweighting(也不妨搞其余采用).面打Pooled Estimation(混同预计)窗心中的OK键.图17(9.1)= 北京+ x2t = 36.22 + 0.81x2t(31.0)…= 浙江+ x15t = 1328.26 + 0.63 x15t(21.1)R2 = 0.995, SSEr = 1409247用EViwes建坐里板数据预计模型步调.利用1996~2002年15个省级天区乡镇住户家庭年人均消耗性开销战年人均支进数据(稳定代价数据)介绍里板数据模型预计步调.(1)建坐混同数据库(Pool)对付象.最先建坐处事文献.正在挨启处事文献窗心的前提上,面打EViwes主功能菜单上的Objects键,选New Object功能(如图18),进而挨启New Object(新对付象)采用窗.正在Type of Object采用区采用Pool(合并数据库),并正在Name of Object采用区为混同数据库起名Pool01(初初隐现为Untitled).如图19,面打OK键,进而挨启混同数据库(Pool)窗心.正在窗心中输进15个天区的标记AH(安徽)、BJ(北京)、…、ZJ(浙江),如图20.图18 图19图20(2)定义序列名并输进数据.正在新建的混同数据库(Pool)窗心的工具栏中面打Sheet 键(第2种路径是,面打View键,选Spreadsheet (stacked data)功能),进而挨启Series List(列写序列名)窗心,定义时间序列变量CP?战IP?(?标记表示与CP战IP贯串的15个天区标记名)如图21.面打OK键,进而挨启混同数据库(Pool)窗心,(面打Edit+-键,使EViwes处于可编写状态)输进数据.输进完毕后的情形睹图22.图22所示为以截里为序的阵列式排列(stacked data).面打Order+-键,还不妨变更为以时间为序的阵列式排列.处事文献也不妨以合并数据(Pool data)战非合并数据的形式用复造战粘揭的要领建坐.图21 图22(3)预计模型图23面打Estimation键,随后弹出Pooled Estimation(混同预计)对付话窗(睹图23).先对付Pooled Estimation(混同预计)对付话窗中各选项功能给以阐明.Dependent Variable(相依变量)采用窗:用于挖写被阐明变量.Sample(样本范畴)采用窗:用于挖写样本区间. Balanced Sample(仄稳样本)采用块:面打挑勾后表示用仄稳数据预计.Common coefficients(系数相共)采用窗:用于挖写对付于分歧横截里斜率(返回系数)相共的阐明变量战假造变量. Cross section specific coefficients(截里系数分歧)采用窗:用于挖写对付于分歧横截里斜率(返回系数)分歧的阐明变量.Intercept(截距项)采用窗:从中不妨选None(不要截距项)、Common(共一截距项)、Fixed effects(个体分歧截距项分歧)、Random effects(随机效力截距项). Weighting(权数)采用窗:从中不妨选No weighting(等权预计)、Cross section weights(按截里与权数)、SUR(似不相闭返回)、iterate to convergence(迭代至支敛).“等权预计”的要领是所有的瞅测值皆给以相等的权数;“按截里与权数”的要领是以横截里模型残好的圆好为权数,属于广义最小二乘法预计.“似不相闭返回”的要领是利用横截里模型残好的协圆好举止广义最小二乘法预计,该法将自动建正横截里中出现的同圆好战近期自相闭;“迭代至支敛”要领当采用广义最小二乘法预计时,面打此键将包管参数预计背去到支敛为止.正在Options对付话框中不妨给出支敛准则战最大迭代次数.用EViwes不妨预计牢固效力模型(包罗个体牢固效力模型、时刻牢固效力模型战时刻个体牢固效力模型3种)、随机效力模型、戴有AR(1)参数的模型、截里分歧返回系数也分歧的里板数据模型.用EViwes不妨采用一般最小二乘法、加权最小二乘法(以截里模型的圆好为权)、似不相闭返回法预计模型参数.不妨正在Common coefficients采用窗战Cross section specific coefficients采用窗中挖进AR(1)项.如果把AR(1)项挖正在Common coefficients采用窗中相称于假设模型有相共的自返回缺面项,如果把AR(1)项挖正在Cross section specific coefficients采用窗中相称于假设模型有分歧的自返回缺面项.注意:如果把阐明变量挖进Cross section specific coefficients采用窗中,将会得到很多的返回参数.。
面板数据F检验

面板数据F检验1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y i t, i= 1, 2, …, N; t= 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数据的F检验固定效应检验标准化工作室编码[XX968T-XX89628-XJ668-XT689N]面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y, i= 1, 2, …, N; t= 1, 2, …, Ti tN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y, ( ii .= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
人均消费和收入的面板数据从纵剖面观察分别见图2和图3。
从横截面观察分别见图4和图5。
横截面数据散点图的表现与观测值顺序有关。
图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002 CP-AH(安徽)CP-BJ(北京)CP-FJ(福建)CP-HB(河北)CP-HLJ(黑龙江)CP-JL(吉林)CP-JS(江苏)CP-JX(江西)CP-LN(辽宁)CP-NMG(内蒙古)CP-SD(山东)CP-SH(上海)CP-SX(山西)CP-TJ(天津)CP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996199719981999200020012002 IP-AH(安徽)IP-BJ(北京)IP-FJ(福建)IP-HB(河北)IP-HLJ(黑龙江)IP-JL(吉林)IP-JS(江苏)IP-JX(江西)IP-LN(辽宁)IP-NMG(内蒙古)IP-SD(山东)IP-SH(上海)IP-SX(山西)IP-TJ(天津)IP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
图2 15个省级地区的人均消费序列(纵剖面)图3 15个省级地区的人均收入序列(file:4panel02)图4 15个省级地区的人均消费散点图图5 15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。
AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15个地区7年人均消费对收入的面板数据散点图见图6和图7。
图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。
相当于观察15个时间序列。
图7中每一种符号代表一个年度的截面散点图(共7个截面)。
相当于观察7个截面散点图的叠加。
图6 用15个时间序列表示的人均消费对收入的面板数据图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。
从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。
内蒙古2002年的收入与消费规模还不如北京市1996年的大。
图9给出该15个省级地区1996和2002年的消费对收入散点图。
可见6年之后15个地区的消费和收入都有了相应的提高。
图8 北京和内蒙古1996-2002年消费对收入时序图图9 1996和2002年15个地区的消费对收入散点图2.面板数据的估计。
用面板数据建立的模型通常有3种。
即混合估计模型、固定效应模型和随机效应模型。
混合估计模型。
如果从时间上看,不同个体之间不存在显着性差异;从截面上看,不同截面之间也不存在显着性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,y= a +b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (1)ita 和b不随i,t变化。
称模型(1)为混合估计模型。
1以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:图10EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object(新对象)选择窗。
在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。
在窗口中输入15个地区标识AH(安徽)、BJ(北京)、…、ZJ(浙江)。
工具栏中点击Sheet 键,从而打开Series List(列写序列名)窗口,定义变量CP和IP,点击OK键,Pool (混合或合并数据库)窗口显示面板数据。
在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation(混合估计)窗口如下图。
图11在Dependent Variable(相依变量)选择窗填入CP;在Common coefficients(系数相同)选择窗填入IP;Cross section specific coefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击No weighting。
点击Pooled Estimation(混合估计)窗口中的OK键。
得输出结果如图10。
相应表达式是= +IP itR2 = , SSEr = 4824588,(103)=15个省级地区的人均支出平均占收入的76%。
如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a = 0)的混合估计模型。
以二变量模型为例,建立混合估计模型如下,yit= b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (2)对于本例,因为上式中的截距项有显着性(t = > (103) = ),所以建立截距项为零的混合估计模型是不合适的。
EViwes估计方法:在Pooled Estimation(混合估计)对话框中Intercept(截距项)选择窗中选None,其余选项同上。
固定效应模型。
在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。
下面分别介绍。
(1)个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显着性变化,那么就应该建立个体固定效应模型,表示如下,y= b1 x it +g1 W1 + g2W2 + … +g N W N+e it, t= 1, 2, …, T (3)it其中W=ie, i= 1, 2, …, N; t= 1, 2, …, T,表示随机误差项。
y it, x it, i= 1, 2, …, itN; t= 1, 2, …, T分别表示被解释变量和解释变量。
模型(3)或者表示为y= g1 +b1 x1t +e1t, i = 1(对于第1个个体,或时间序列),t= 1, 2, …, T 1ty= g2 +b1 x2t +e2 t, i = 2(对于第2个个体,或时间序列),t= 1, 2, …, T 2t…y= g N +b1 x N t +e N t, i = N(对于第N个个体,或时间序列),t= 1, 2, …, T N t写成矩阵形式,y= (1x1) +e1 = g1 +x1 b +e11…y= (1x N) +e N = g N + x N b+e NN上式中y i,g i,e i,x i都是N′1阶列向量。
b为标量。
当模型中含有k个解释变量时,b 为k′1阶列向量。
进一步写成矩阵形式,= + b+上式中的元素1,0都是T′1阶列向量。
面板数据模型用OLS方法估计时应满足如下5个假定条件:(1)E(e it|x i1, x i2, …, x iT, a i) = 0。
以x i1, x i2, …, x iT, a i为条件的e it的期望等于零。