面板数据模型入门讲解
面板数据模型

面板数据模型面板数据模型是指在经济学和社会科学领域中,用于分析面板数据的统计模型。
面板数据是指在一定时间内对同一组体(如个人、家庭、企业等)进行多次观测的数据集合。
面板数据模型的主要目的是研究个体特征和时间变化对观测变量的影响。
面板数据模型可以分为固定效应模型和随机效应模型两种。
固定效应模型假设个体固定特征对观测变量有影响,而随机效应模型则认为这些个体固定特征与观测变量之间存在随机关系。
在面板数据模型中,通常会使用一些常见的统计方法,如最小二乘法(OLS)和固定效应模型(FE)。
最小二乘法是一种常见的回归分析方法,用于估计模型中的参数。
固定效应模型则通过引入个体固定效应来控制个体特征对观测变量的影响。
面板数据模型的优势在于可以同时考虑个体特征和时间变化对观测变量的影响,从而提供更准确的分析结果。
此外,面板数据模型还可以解决传统的截面数据和时间序列数据模型所存在的一些问题,如异质性和序列相关性等。
为了使用面板数据模型进行分析,需要满足一些基本的假设,如面板数据的一致性、个体固定效应的异质性、个体特征与观测变量之间的线性关系等。
同时,还需要对数据进行一些预处理,如去除异常值、缺失值处理等。
在实际应用中,面板数据模型被广泛应用于经济学、金融学、社会学等领域的研究中。
例如,可以使用面板数据模型来研究个体收入与教育水平、劳动力市场参预率之间的关系,或者分析企业绩效与市场环境、管理策略的关系等。
总之,面板数据模型是一种用于分析面板数据的统计模型,通过考虑个体特征和时间变化对观测变量的影响,提供了一种更准确的分析方法。
在实际应用中,面板数据模型可以匡助研究人员深入理解个体和时间的交互作用,从而得出更可靠的结论。
面板数据模型

面板数据模型面板数据模型是一种用于分析和预测数据的统计模型。
它广泛应用于经济学、金融学、市场营销和社会科学等领域,用于研究变量之间的关系和影响因素。
面板数据模型可以有效地处理时间序列和横截面数据的问题,具有很高的灵活性和准确性。
面板数据模型的基本假设是存在个体间的异质性,并且个体间的异质性是固定的。
这意味着个体之间的差异不随时间而变化。
面板数据模型可以分为固定效应模型和随机效应模型两种。
固定效应模型假设个体间的差异是固定的,不随时间变化。
该模型可以通过引入个体固定效应来控制个体间的差异。
个体固定效应可以捕捉到个体特有的影响因素,如个体的天赋能力、个体的经验等。
固定效应模型的估计方法包括最小二乘法和差分法。
随机效应模型假设个体间的差异是随机的,可以用一个随机项来表示。
该模型可以通过引入个体随机效应来控制个体间的差异。
个体随机效应可以捕捉到个体间的随机波动。
随机效应模型的估计方法包括广义最小二乘法和随机效应模型估计法。
面板数据模型的优点在于可以利用个体间和时间间的差异来进行分析,从而控制了个体间和时间间的混淆因素。
面板数据模型可以提供更准确和稳健的估计结果,增强了研究的可信度和可解释性。
面板数据模型的应用非常广泛。
在经济学中,面板数据模型可以用于研究经济增长、收入分配、劳动力市场等问题。
在金融学中,面板数据模型可以用于研究股票市场、利率市场等问题。
在市场营销中,面板数据模型可以用于研究消费者行为、市场竞争等问题。
在社会科学中,面板数据模型可以用于研究教育、健康、犯罪等问题。
总之,面板数据模型是一种强大的分析工具,可以帮助研究人员更好地理解和预测数据。
面板数据模型的应用范围广泛,可以应用于各种领域的研究。
通过合理选择模型和估计方法,可以得到准确和稳健的结果,为决策提供有力支持。
面板数据模型

面板数据模型面板数据模型是一种用于描述面板数据结构和分析的统计模型。
它是一种多层次的数据结构,包含了不同时间点和不同个体的观测数据。
面板数据模型广泛应用于经济学、社会学、医学等领域的研究中。
面板数据模型的标准格式如下:1. 面板数据的基本信息:- 面板数据的来源和采集方法;- 面板数据的时间范围和频率;- 面板数据的样本规模和样本特征。
2. 面板数据的变量定义:- 面板数据中所包含的变量名称和含义;- 面板数据中的自变量和因变量的定义;- 面板数据中可能存在的缺失值和异常值处理方法。
3. 面板数据模型的建立:- 面板数据模型的理论基础和假设前提;- 面板数据模型的数学表达式和形式;- 面板数据模型的参数估计方法和模型诊断。
4. 面板数据模型的应用:- 面板数据模型在实际研究中的应用案例;- 面板数据模型的结果解释和推断方法;- 面板数据模型的政策效果评估和预测分析。
5. 面板数据模型的优缺点:- 面板数据模型相比其他统计模型的优势;- 面板数据模型的局限性和应用条件;- 面板数据模型的改进和发展方向。
6. 面板数据模型的软件实现:- 面板数据模型的常用软件工具和编程语言;- 面板数据模型的软件实现步骤和代码示例;- 面板数据模型的软件可视化和结果输出。
总结:面板数据模型是一种强大的分析工具,可以用于描述和分析面板数据结构。
它能够捕捉到时间和个体之间的变化和相关性,为研究者提供了丰富的数据信息。
然而,面板数据模型也存在一些局限性,如样本选择偏差和模型假设的限制等。
因此,在应用面板数据模型时,需要根据具体研究问题和数据特点进行合理的模型选择和分析方法。
面板数据模型 (2)

面板数据模型1. 引言面板数据模型(Panel Data Model)是一种针对面板数据分析的统计模型。
面板数据也称为纵向数据或者长期追踪数据,在经济学和社会科学领域广泛应用。
面板数据由包含多个个体和多个时间点的观测数据组成,可以提供比截面数据(cross-sectional data)更多的信息。
本文将介绍面板数据模型的基本概念、应用领域、建模方法和相关统计分析技术。
2. 面板数据模型的基本概念2.1 面板数据的构成面板数据由个体维度和时间维度两个维度构成。
个体维度指的是一组被观察的个体,可以是人、公司、地区等;时间维度指的是一段时间内的观测点,可以是年、月、季度等。
面板数据是在个体和时间维度上的交叉观测数据。
2.2 面板数据的类型面板数据分为平衡面板数据和非平衡面板数据。
平衡面板数据指的是所有个体在每个时间点上都有观测值;非平衡面板数据指的是个体在某些时间点上缺少观测值。
2.3 面板数据模型的优势相比于截面数据和时间序列数据,面板数据有以下几个优势:•能够控制个体固定效应:面板数据模型可以减少个体固定效应的干扰,提高模型的解释能力;•能够捕捉个体间的异质性:面板数据模型可以捕捉个体之间的差异和变动,提供更全面的分析结果;•提供更多的信息和数据点:面板数据相对于时间序列数据,提供了更多的观测点,可以提高统计分析的准确性。
3. 面板数据模型的应用领域面板数据模型在经济学、金融学、社会学等领域广泛应用,具体领域包括但不限于:•劳动经济学:分析个体的劳动供给行为和工资决定因素;•金融学:评估公司和证券的风险和收益;•医学研究:研究药物治疗的效果和副作用;•教育经济学:评估教育政策的效果和影响;•发展经济学:分析发展中国家的经济增长和贫困问题。
4. 面板数据模型的建模方法面板数据模型的建模方法主要包括固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)。
面板数据模型

面板数据模型引言概述:面板数据模型是一种经济学和统计学中常用的数据分析方法。
它适用于具有时间和个体维度的数据,可以帮助研究人员更好地理解个体之间的关系以及时间的变化趋势。
本文将详细介绍面板数据模型的概念、应用领域、优势和限制,并提供一些实际案例来说明其实际价值。
正文内容:1. 面板数据模型的概念1.1 面板数据模型的定义面板数据模型是一种同时考虑时间和个体维度的数据分析方法。
它将个体的观察结果按照时间顺序排列,形成一个面板数据集,以便分析个体之间的关系和时间的变化趋势。
1.2 面板数据模型的分类面板数据模型可以分为固定效应模型和随机效应模型。
固定效应模型假设个体之间的差异是固定的,而随机效应模型则允许个体之间的差异是随机的。
2. 面板数据模型的应用领域2.1 经济学领域面板数据模型在经济学领域得到广泛应用。
例如,研究人员可以利用面板数据模型来分析不同国家或地区的经济增长率、失业率和通货膨胀率之间的关系,以及企业的生产效率和市场竞争程度之间的关系。
2.2 社会科学领域面板数据模型也在社会科学领域具有重要意义。
研究人员可以利用面板数据模型来研究教育、健康、就业等社会问题,并分析个体特征对这些问题的影响。
2.3 金融领域面板数据模型在金融领域的应用也非常广泛。
例如,研究人员可以利用面板数据模型来分析不同股票的收益率之间的关系,以及股票市场的波动与宏观经济指标之间的关系。
3. 面板数据模型的优势3.1 控制个体固定效应面板数据模型可以通过固定效应来控制个体固有的差异,从而更准确地分析个体之间的关系。
3.2 利用时间维度的信息面板数据模型可以利用时间维度的信息,分析个体随时间的变化趋势,更好地理解时间的影响。
3.3 提高数据的效率面板数据模型可以利用面板数据集中的交叉个体和时间信息,提高数据的效率,减少估计的方差。
4. 面板数据模型的限制4.1 数据缺失问题面板数据模型在面对数据缺失问题时可能会出现一些困难,需要采取一些特殊的处理方法。
面板数据模型理论知识(最新)

面板数据模型理论知识(最新)1.Panel Data 模型简介Panel Data 即面板数据,是截面数据与时间序列数据综合起来的一种数据类型,是截面上个体在不同时点的重复观测数据。
相对于一维的截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。
(1)由于观测值的增多,可以增加自由度并减少了解释变量间的共线性,提高了估计量的抽样精度。
(2)面板数据建模比单截面数据建模可以获得更多的动态信息,可以构建并检验更复杂的行为模型。
(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计的影响,可以从多方面对同一经济现象进行更加全面解释。
Panel Data 模型的一般形式为it K k kit kit it it x y μβα++=∑=1其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N个个体;t =1,2,3……T ,表示已知T 个时点。
参数it α表示模型的截距项,k 是解释变量的个数,kit β是相对应解释变量的待估计系数。
随机误差项it μ相互独立,且满足零均值,等方差为2δ的假设。
面板数据模型可以构建三种形式(以截面估计为例):形式一:不变参数模型i K k ki k i x y μβα++=∑=1,又叫混合回归模型,是指无论从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。
形式二:变截距模型i K k ki k i i x y μβαα+++=∑=1*,*α为每个个体方程共同的截距项,i α是不同个体之间的异质性差异。
对于不同个体或时期而言,截距项不同而解释变量的斜率相同,说明存在不可观测个体异质影响但基本结构是相同的,可以通过截距项的不同而体现出来个体之间的差异。
当i α与i x 相关时,那就说明模型为固定效应模型,当i α与i x 不相关时,说明模型为随机效应模型。
形式三:变参数模型i K k ki ki i i x y μβαα+++=∑=1* ,对于不同个体或时期而言,截距项(i αα+*)和每个解释变量的斜率ki β都是不相同的,表明不同个体之间既存在个体异质影响也存在不同的结构影响,即每个个体或时期都对应一个互不相同的方程。
面板数据模型

面板数据模型面板数据模型是一种用于描述面板数据的统计模型。
面板数据,也称为纵向数据或者追踪数据,是指在一段时间内对同一组体(如个人、家庭或者企业)进行多次观察所得到的数据。
面板数据模型可以用于分析面板数据的动态变化和相关性,从而揭示出数据中的规律和趋势。
面板数据模型的基本形式是固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)。
固定效应模型假设个体间存在固定的差异,这些差异对于解释个体间的变化是恒定不变的;而随机效应模型则假设个体间的差异是随机的,可以通过随机抽样来表示。
面板数据模型的建立需要考虑以下几个方面的因素:1. 时间维度:面板数据模型中的时间维度是非常重要的,它可以匡助我们分析数据的变化趋势和周期性。
在建立模型时,需要将时间作为一个重要的解释变量,并考虑时间的滞后效应。
2. 个体维度:面板数据模型中的个体维度是指研究对象的个体特征,如个人的性别、年龄、教育程度等。
在建立模型时,需要考虑个体特征对数据的影响,并将其作为解释变量加入模型中。
3. 面板数据的特征:面板数据模型中的数据通常具有自相关性和异方差性。
自相关性是指数据中的观测值之间存在相关性,即前一时期的观测值会对后一时期的观测值产生影响;异方差性是指数据的方差在不同个体或者不同时间段之间存在差异。
在建立模型时,需要考虑这些数据特征,并采取相应的处理方法,如使用差分法、固定效应模型或者随机效应模型等。
4. 模型选择和估计方法:在建立面板数据模型时,需要选择适当的模型和估计方法。
常用的面板数据模型包括固定效应模型、随机效应模型、混合效应模型等。
估计方法包括最小二乘法、广义最小二乘法、极大似然法等。
选择适当的模型和估计方法可以提高模型的准确性和可靠性。
面板数据模型的应用非常广泛,可以用于各个领域的数据分析和预测。
例如,在经济学中,面板数据模型可以用于分析个体消费行为、企业投资决策、政府政策效果等;在社会学中,面板数据模型可以用于研究人口变动、社会流动性等;在医学研究中,面板数据模型可以用于分析药物疗效、疾病发展等。
面板数据模型

面板数据模型面板数据模型是一种用于分析和预测数据的统计模型。
它是一种多变量数据分析方法,用于探索不同变量之间的关系,并预测未来的趋势和模式。
面板数据模型通常用于经济学、金融学、社会科学等领域的研究中,以匡助研究人员理解和解释复杂的数据现象。
面板数据模型的基本假设是,观察对象(例如个人、企业、国家等)在不同时间和空间上的观测是独立且随机的。
它将观测对象的特征视为固定效应,并考虑时间和空间的变化。
面板数据模型可以分为固定效应模型和随机效应模型两种。
固定效应模型假设观测对象的特征是固定的,不随时间和空间的变化而变化。
它通过引入虚拟变量来捕捉不同观测对象之间的差异,并控制这些差异对因变量的影响。
固定效应模型可以用来分析个体之间的差异,例如不同企业之间的生产效率差异。
随机效应模型假设观测对象的特征是随机的,可能随时间和空间的变化而变化。
它通过引入随机项来捕捉观测对象特征的随机变化,并控制这些随机变化对因变量的影响。
随机效应模型可以用来分析观测对象的动态变化,例如个人在不同时间点的收入变化。
面板数据模型的估计方法有不少种,常用的方法包括最小二乘法、固定效应模型和随机效应模型。
最小二乘法是一种常见的估计方法,它通过最小化观测值与模型预测值之间的差异来估计模型参数。
固定效应模型和随机效应模型则通过引入虚拟变量和随机项来估计模型参数。
面板数据模型的应用范围广泛,可以用于分析各种类型的数据,例如时间序列数据、横截面数据和面板数据。
它可以用于预测未来的趋势和模式,评估政策的效果,解释复杂的数据现象等。
面板数据模型的优势在于可以利用更多的信息来估计模型参数,提高预测的准确性和解释的可靠性。
总之,面板数据模型是一种用于分析和预测数据的统计模型,可以匡助研究人员理解和解释复杂的数据现象。
它是一种多变量数据分析方法,可以用于经济学、金融学、社会科学等领域的研究中。
面板数据模型的应用范围广泛,可以用于分析各种类型的数据,并提供准确的预测和解释。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十四章 面板数据模型在第五章,当我们分析城镇居民的消费特征时,我们使用的是城镇居民的时间序列数据;而当分析农村居民的消费特征时,我们使用农村居民的时间序列数据。
如果我们想要分析全体中国居民的消费特征呢?我们有两种选择:一是使用中国居民的时间序列数据进行分析,二是把城镇居民和农村居民的样本合并,实际上就是两个时间序列的样本合并为一个样本。
多个观测对象的时间序列数据所组成的样本数据,被称为面板数据(Panel Data )。
通常也被称为综列数据,意即综合了多个时间序列的数据。
当然,面板数据也可以看成多个横截面数据的综合。
在面板数据中,每一个观测对象,我们称之为一个个体(Individual )。
例如城镇居民是一个观测个体,农村居民是另一个观测个体。
如果面板数据中各观测个体的观测区间是相同的,我们称其为平衡的面板数据,反之,则为非平衡的面板数据。
基于面板数据所建立的计量经济学模型则被称为面板数据模型。
例如,表5.3.1中城镇居民和农村居民的样本数据具有相同的采样区间,所以,它是一个平衡的面板数据。
§14.1 面板数据模型一、两个例子1. 居民消费行为的面板数据分析让我们重新回到居民消费的例子。
在表5.1.1中,如果我们将城镇居民和农村居民的时间序列数据作为一个样本,以分析中国居民的消费特征。
那么,此时模型(5.1.1)的凯恩斯消费函数就可以表述为:it it it Y C εββ++=10 (14.1.1) it t i it u ++=λμε (14.1.2) 其中:it C 和it Y 分别表示第i 个观测个体在第t 期的消费和收入。
i =1、2分别表示城镇居民和农村居民两个观测个体,t =1980、…、2008表示不同年度。
it u 为经典误差项。
在(14.1.2)中,i μ随观测个体的变化,而不随时间变化,它反映个体之间不随时间变化的差异性,被称为个体效应。
t λ反映不随个体变化的时间上的差异性,被称为时间效应。
在本例中,城镇居民和农村居民的消费差异一部分来自收入差异和随机扰动,还有一部分差异是由城镇居民和农村居民的身份或地域差异决定的,它不随时间变化,这种差异性就由1μ和2μ来反映。
同时,对同一种居民,在收入不变的情况下,消费支出还可能随时间的变化而变化,这种变化的来源在于除随机扰动以外经济环境的一些系统性变化,如经济体制的变迁,这种变化是所有居民共同面对的,所导致的居民消费在时间上的差异性就由时间效应1980λ、1981λ、…、2008λ来反映。
实际上,模型(14.1.1)还隐含了一个假定,既假定城乡居民的边际消费倾向相同并且不随时间变化。
尽管这一假定不一定成立,但作为熟悉面板数据模型基础知识的例子,我们还是暂且保留这一假定。
2. 农村居民收入分析为了考察中国农民收入与农村要素投入结构之间的关系,同样地,我们既可以采用全国的时间序列总量数据进行分析,也可以采用各省市自治区的横截面数据进行分析。
但是,如果能够综合各省市自治区的时间序列数据,从而基于面板数据进行分析,一个显而易见的好处就是,我们将会有更多更具体的信息,估计和检验统计量都会有更大的自由度,从而获得更可靠的分析结论。
简单而言,由于农村剩余劳动力的存在,影响农村居民收入的要素配置因素可以分为以下几个方面:资本拥有量、投资主体结构、劳动的配置状态等。
所以,基于省际面板数据,有研究者建立了如下的面板数据模型:it it it it it RCI RLT CSC PIC εββββ+++=3210)(ln )ln +( (14.1.3)it t i it u ++=λμε。
N i Λ,2,1=,T t Λ,2,1=其中:PIC it 为地区i 在第t 期的农村人均纯收入,各年份的现值均按本地区农村消费者价格指数折算为1995年不变价。
RLT it 为地区i 在第t 期乡村劳动力中非农产业从业人数与农林牧渔等传统产业从业人数之比。
RCI it 为地区i 在第t 期农村集体投资与个人投资的比率。
CSC it 为估算的地区i 在第t 期农村人均资本存量。
i μ和t λ分别为个体效应和时间效应。
i μ反映除劳动力分配比例、投资比例、资本存量的影响以外,各省人均纯收入受本省内在因素(如地理位置,经济发展基础等)所导致的不随时间变化的差异性。
而时间效应反映除解释变量的影响以外,所有省份农村人均纯收入面对共同的经济环境的变化而形成的时间上的差异性。
显然,面板模型与我们以前所学的模型之间的区别,就在于存在个体效应和时间效应。
简而言之,剔除了解释变量的影响以后,由个体内部不变的因素所导致的个体之间的差异性,就是个体效应;由所有个体所面对的共同因素所导致的时间上的变化,就是时间效应。
二、面板数据的特征及优势基于前面两个例子,我们发现,面板数据既可以看作多个个体时间序列数据的合并,也可以看作多个时点横截面数据的合并。
所以,面板数据的基本特征就是其数据结构的二维性(图14.1.1)。
或者说,面板数据是一个数据平面,这也正是其被以“面板”命名的原因。
图14.1.1 变量X的面板数据结构那么,有读者会说,我们可以基于全国的总量数据(城镇居民和农村居民数据加总)来分析中国居民的消费行为,为什么要使用面板数据呢?实际上,使用面板数据会为我们的计量经济学分析带来很多的好处。
(1)扩大信息量,增加估计和检验统计量的自由度。
显然,与时间序列数据和横截面数据不同,面板数据是二维数据。
它既包含观测同一个体随时间的变化,也包含同一时间不同个体之间的差异。
这显著扩大了样本的信息量和样本容量,有助于提高参数估计的精度和检验结论的可靠性。
对模型(14.1.1)而言,如果我们基于居民的时间序列数据进行分析,样本容量为29。
而基于城镇和农村的面板数据,样本容量则为58,如果基于省市区的面板数据,样本容量将更大,模型估计量和检验统计量的自由度显著增加。
更重要的是,基于总量数据进行分析,无法反映两种居民之间的差异性,其数据信息对于两种居民都有显著的偏差。
(2)有助于提供动态分析的可靠性。
基于单个个体的时间序列数据进行动态分析,一方面会受到采样区间的限制,另一方面其研究结论也缺乏普适性。
而基于面板数据,则可以在较短的采样区间内反映多个个体共同的动态变化特征,从而弱化样本区间的制约得到更为可靠的分析结论。
当我们在模型(14.1.1)中引入预期因素时,其回归模型被表述为:it t i it it C Y C εβββ+++=-1,210。
(14.1.4)如果使用总量数据,我们只能根据不同年度消费额的变化信息来估计消费的动态性质,而使用面板数据,我们有两种居民消费的变化信息可供利用。
(3)有助于反映经济结构、经济制度的渐进性变化。
对于所考察的经济体系而言,经济结构和经济制度的变化通常是渐进性的,我们很难找到一个量化的指标来反映这种渐进性变化。
幸运的是,使用面板数据时,时间效应是被解释变量中不随个体变化而只随时间变化的部分,它反映了所有个体所面对的共同因素的影响。
所以,时间效应是对经济结构和经济制度渐变效应的一个很好的度量指标。
(4)面板数据有助于反映经济体的结构性特征。
与总量数据相比,面板数据提供了更具微观层次的信息。
对很多经济问题的分析而言,某些变量涉及不同观测个体之间的相互关系,例如资本和劳动在区域和产业之间的流动,技术的溢出,通胀的相互影响等。
使用面板数据使得这些结构性变化信息的分析成为可能。
三、面板数据模型的混合估计既然面板数据有诸多优势,那么,面板数据模型的分析与时间序列或横截面数据模型有什么不同呢?在(14.1.1)和(14.1.3)中,如果假定个体效应和时间效应为0,那么,这些模型与我们前面所熟悉的单方程模型没有任何本质上的差异。
所以,我们可以直接基于OLS 对其进行估计。
也就是说,我们没有考虑面板数据的结构特殊性,而直接把各时间序列或各横截面数据混合起来进行估计,这种估计方法我们称之为面板混合OLS 估计。
对于模型(14.1.3),如果假定个体效应和时间效应为0,则模型可以表述为:u RCI RLT CSC PIC +++=3210)(ln )ln ββββ+( (14.1.5)其中:'1111)(NT N it T PIC PIC PIC PIC PIC PIC ΛΛΛΛ=,PIC it 为地区i 在第t 期的农村人均纯收入。
也就是说,我们将各个地区的数据堆积起来,看成是对同一个对象的观测数据。
其他变量的向量表述也是类似的。
如果u 为经典误差项,这一模型与第五章所讲的多元线性回归模型没有任何本质区别,其OLS 估计量是线性无偏最优估计量。
基于中国28个省市自治区(不包括重庆、海南、西藏)1995~2005年的面板数据,其面板混合OLS 估计的结果为:it it it it RCI RLT CSC PIC 0104.02523.0)(ln 35911.08158.7)n l -+(+=∧ (14.1.6) t 统计值 202.2730 17.2520 5.7464 -3.1736p 值 0.0000 0.0000 0.0000 0.00172R =0.8409 2R =0.8393。
但是,对面板数据而言,把个体效应和时间效应假定为0一般是不符合经济现实的,尤其是个体效应。
我们很难想象各地区农村居民的消费特征不存在差异性。
当我们考虑个体效应与时间效应时,我们会发现,面板数据在为我们带来更多信息和便利的同时,也带来了一些新的问题。
§14.2 固定效应与随机效应面板数据模型的一般形式可以表述为:it Kit K it it X X Y εβββ++++=Λ110 (14.2.1) it t i it u ++=λμε。
N i ,,2,1Λ= T t ,,2,1Λ=。
其中:it u 为经典误差项。
0)(=i E μ,0)(=t E λ,0)(=it i u E μ,0)(=it t u E λ。
我们已经知道,与时间序列数据或横截面数据的单方程模型相比,面板数据模型唯一的不同之处就是存在个体效应i μ和时间效应t λ。
根据i μ和t λ与模型解释变量是否相关,面板数据的个体效应和时间效应又分为两种情形:固定效应和随机效应。
如果个体效应i μ与模型中的解释变量是相关的,我们就称这种个体效应是固定效应(Fixed Effect )。
反之,如果个体效应i μ与模型中的解释变量不相关,我们称之为随机效应(Random Effect )。
同样地,如果时间效应t λ与模型中的解释变量是相关的,我们就称这种时间效应是固定效应。
反之,则为随机效应。
例如:在模型(14.1.1)中,如果个体效应i μ与收入it Y 相关,时间效应t λ与收入it Y 不相关,那么,该模型的个体效应是固定效应,时间效应是随机效应。