第七章 Panel Data模型
面板数据是什么有哪些主要的面板数据模型

面板数据是什么有哪些主要的面板数据模型面板数据(Panel data),也被称为纵向数据(longitudinal data)或者追踪数据(follow-up data),是一种常用于经济学、社会学等领域的数据收集与分析方法。
与截面数据(cross-sectional data)只涉及一个时间点上的多个观察对象不同,面板数据同时涉及多个时间点和多个观察对象,用于研究时间和个体之间的关系。
面板数据的优势在于它能够通过观察多个时间点上的同一组观察对象,捕捉个体和时间的变化,从而提供更加全面和准确的数据信息。
同时,面板数据还可以减少一些估计中的偏误和提高估计的效率。
接下来,我们将介绍面板数据的主要模型。
1. 固定效应模型(Fixed Effects Model)固定效应模型是面板数据分析中最简单的模型之一。
它假设个体固定效应与解释变量无关,然后通过消除这些固定效应来估计模型的参数。
固定效应模型的核心是个体固定效应的控制,这可以通过个体固定效应的虚拟变量进行实现。
固定效应模型的估计方法包括最小二乘法(OLS)和差分中立变量法(Demeaning Approach)等。
2. 随机效应模型(Random Effects Model)相比于固定效应模型,随机效应模型假设个体固定效应与解释变量相关。
换句话说,个体固定效应被视为随机变量,与解释变量存在相关性。
在随机效应模型中,个体固定效应被视为一种随机误差项,通过估计个体固定效应的方差来分析其对因变量的影响。
3. 差分检验模型(Difference-in-Differences Model)差分检验模型常用于研究政策干预的效果。
该模型基于两组观察对象,其中一组接受了某种政策干预,而另一组则没有。
通过比较两组观察对象在政策干预前后的差异,我们可以评估政策干预的影响。
差分检验模型需要同时估计个体和时间的固定效应,以控制其他可能影响因素的干扰。
4. 面板向量自回归模型(Panel Vector Autoregression Model)面板向量自回归模型是一种扩展的时间序列模型,用于分析多个时间点上的多个变量之间的关系。
面板数据模型理论

5.2 面板数据模型理论5.2.1 面板数据模型及类型。
面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。
面板数据用双下标变量表示。
例如:it y , N i ,,2,1 =;T t ,,2,1 =其中,N 表示面板数据中含有的个体数。
T 表示时间序列的时期数。
若固定t 不变,•i y ),,2,1(N i =是横截面上的N 个随机变量;若固定i 不变,t y •,),,2,1(T t =是纵剖面上的一个时间序列。
对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。
面板数据模型的解析表达式为:it it it it it x y μβα++= T j N i ,2,1;,2,1==其中,it y 为被解释变量;it α表示截距项,),,,(21k it it itit x x x x =为k ⨯1维解释变量向量;'21),,,(k it it it it ββββ =为1⨯k 维参数向量;i 表示不同的个体;t 表示不同的时间;it μ为随机扰动项,满足经典计量经济模型的基本假设),0(~2μσμIIDN it 。
面板数据模型通常分为三类。
panel data

平行数据(Panel Data)模型厦门大学财政系王艺明平行数据(Panel Data)§平行数据是指对不同时刻的横截面个体作连续观测所得到的多维数据。
由于这类数据有着独特的优点,使平行数据模型目前已在计量经济学、社会学等领域有着较为广泛的应用。
§平行数据在EViews中被称为时序与横截面混合数据(pooled time series and cross-section data)。
平行数据模型是一类利用平行数量分析变量间相互关系并预测其变化趋势的计量经济模型。
模型能够同时反映研究对象在时间和横截面单元两个方向上的变化规律及不同时间、不同单元的特性。
Panel Data模型的基本设定§平行数据模型的基本假设:参数齐性假设,即被解释变量y由某一参数的概率分布函数P(y|θ)。
§假定时间序列参数齐性,及参数值不随时间的不同而变化,则平行数据模型可表示为:§yit =αi+βi’xit+εiti=1,…,N; t=1,…,T§xit ’=(x1it,x2it,…,xKit),为外生变量向量,βi’=(β1i ,β2i,…,βKi),为参数向量,K是外生变量个数,T是时期总数§其中参数αi 和βi都是个体时期恒量(individual time-invariant variable),其取值只受到截面单元不同的影响§E(εit )=0; E(εit2)=σi2; E(εitεjt)=σij; E(εitεjt-s)=0Panel Data 模型的基本设定I §根据模型的不同设定通常有三类估计方法§T 较大,N 较小。
通常采用时间序列模型的假设,即T 趋于无穷大,而N 固定、有限。
§该假设下,标准的方法是Zellner 的似无相关回归方法(Zellner Seemingly Unrelated Regression, SUR ),该方法考虑到回归方程间残差的相关性,即E(εit εjt )=σij ,采用GLS 方法估计似无相关回归(SUR)§假设要估计以下方程组§y1t=α1+β1’x1t+u1t§y2t=α2+β2’x2t+u2t§y3t=α3+β3’x3t+u3t§由于各种经济形态中存在的共同事件对不同横截面误差的影响方式类似,所以它们是同期相关的§Cov(u1t ,u2t)=σ12, Cov(u2t,u3t)=σ23,Cov(u1t,u3t)=σ13§这种情况下可采用Zellner(1962)的似无相关回归(SUR)方法进行参数估计似无相关回归(SUR)§其步骤为§1、使用OLS方法分别估计每个方程并求残)差(uit§2、使用残差估计方差和协方差(σ)ij§3、使用第2步中求得的估计值求所有参数的广义最小二乘估计值(FGLS)§在EViews中可以直接进行SUR估计Panel Data 模型的基本设定II §N 较大而T 较小。
面板数据模型panel data model

自由度K为模型中解释变量(不包括截距项)的个数。
计量经济学,面板数据模型,王少平
24
六、动态面板数据模型
动态面板模型:解释变量中包含被解释变量的滞后 项。 一般形式:
Yit 1 2 X 2it k X kit Yit 1 it
it i t uit
Iit 1 2 Fit 3Cit Iit 1 i t uit i 1, 2,, N t 1, 2,, T
(5)
计量经济学,面板数据模型,王少平
11
四、静态面板数据模型估计
面板数据一般模型:
Yit 1 2 X 2it k X kit it
计量经济学,面板数据模型,王少平
26
2. LSDV估计的有偏和非一致性
模型(17)可以表示为: Yit 1 D1 N DN Yi,t 1 uit 等价于模型:
Y Y
* i ,t
* i ,t 1
* it
* it
其中:
1 T * Yi ,t 1 Yi ,t 1 Yi ,t T t 1
(18)
其中:uit 为经典误差项, E(i ) 0 E(iuit ) 0
要得到 的一致估计量:需为 Yi,t 1 寻找适当的工具变 量。 GMM以工具变量为基础,核心思想在于利用正交条件 估计未知参数。
计量经济学,面板数据模型,王少平
28
六、动态面板-IV估计
固定效应:如果个体效应或时间效应与模型中的解释变量相关 随机效应:如果个体效应或时间效应与模型中的解释变量不相 关
面板数据模型

面板数据模型面板数据模型(Panel Data Model)是一种经济学和统计学中常用的数据分析方法,它允许研究人员在时间和个体维度上分析数据。
该模型结合了截面数据(Cross-sectional Data)和时间序列数据(Time Series Data),能够捕捉到个体间的异质性和时间的动态变化。
面板数据模型的基本假设是个体间存在固定效应(Fixed Effects)和时间效应(Time Effects),即个体特定的不变因素和时间特定的不变因素会对观测数据产生影响。
通过控制这些效应,面板数据模型可以更准确地估计变量之间的关系。
面板数据模型的普通形式可以表示为:Yit = α + βXit + εit其中,Yit表示第i个个体在第t个时间点的观测值,α是截距项,β是自变量Xit的系数,εit是误差项。
面板数据模型可以通过固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)来估计参数。
固定效应模型假设个体间的差异是固定的,即个体特定的不变因素对观测数据产生影响。
该模型通过引入个体固定效应来控制个体间的差异,估计其他变量对因变量的影响。
随机效应模型假设个体间的差异是随机的,即个体特定的不变因素对观测数据不产生影响。
该模型通过引入个体随机效应来控制个体间的差异,估计其他变量对因变量的影响。
面板数据模型的估计方法包括最小二乘法(Ordinary Least Squares, OLS)、固定效应估计法(Fixed Effects Estimation)和随机效应估计法(Random Effects Estimation)。
最小二乘法是一种常用的估计方法,但在面板数据模型中存在一致性问题。
固定效应估计法通过个体间的差异来估计参数,可以解决一致性问题。
随机效应估计法则通过个体间和时间间的差异来估计参数,可以更全面地捕捉到数据的变化。
面板数据模型在经济学和社会科学研究中具有广泛的应用。
面板数据模型理论知识

1.Panel Data 模型简介Panel Data 即面板数据,是截面数据与时间序列数据综合起来的一种数据类型,是截面上个体在不同时点的重复观测数据。
相对于一维的截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。
(1)由于观测值的增多,可以增加自由度并减少了解释变量间的共线性,提高了估计量的抽样精度。
(2)面板数据建模比单截面数据建模可以获得更多的动态信息,可以构建并检验更复杂的行为模型。
(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计的影响,可以从多方面对同一经济现象进行更加全面解释。
Panel Data 模型的一般形式为it Kk kit kit it it x y μβα++=∑=1其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N 个个体;t =1,2,3……T ,表示已知T 个时点。
参数itα表示模型的截距项,k 是解释变量的个数,kitβ是相对应解释变量的待估计系数。
随机误差项itμ相互独立,且满足零均值,等方差为2δ的假设。
面板数据模型可以构建三种形式(以截面估计为例):形式一: 不变参数模型 i Kk ki k i x y μβα++=∑=1,又叫混合回归模型,是指无论从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。
形式二:变截距模型i Kk ki k i i x y μβαα+++=∑=1*,*α为每个个体方程共同的截距项,i α是不同个体之间的异质性差异。
对于不同个体或时期而言,截距项不同而解释变量的斜率相同,说明存在不可观测个体异质影响但基本结构是相同的,可以通过截距项的不同而体现出来个体之间的差异。
当i α与i x 相关时,那就说明模型为固定效应模型,当i α与i x 不相关时,说明模型为随机效应模型。
形式三:变参数模型 i Kk ki ki i i x y μβαα+++=∑=1* ,对于不同个体或时期而言,截距项(i αα+*)和每个解释变量的斜率ki β都是不相同的,表明不同个体之间既存在个体异质影响也存在不同的结构影响,即每个个体或时期都对应一个互不相同的方程。
面板数据的模型(panel data model)

面板数据的模型(panel data model)王志刚 2004年11月11日一. 混合数据模型和面板数据模型如果扰动项it ε服从独立同分布假定,而且和解释变量不相关,那么就可以采用混合最小二乘法估计(Pooled OLS ),但是这里要注意POLS 暗含着一个假定就是,截距项和解释变量的系数是相同的,不随着个体和时间而变化。
我们一般采用单因子(one-way effects )模型,假定截距项具有个体异质性,也就是:这种模型是最常见的面板模型(又称为纵列数据longitudinal data ),因为面板数据往往要求个体纬度 N>>T(时间纬度),下面我们基本上以这种模型为例。
it u 是独立同分布,而且均值为0,方差为2u σ。
如对截距项和解释变量系数均有个体的异质性,那么要采用随机系数模型(Random coefficient model ),stata 的xtrchh 过程提供了相应的估计。
双因子模型(two-way ):it t i it u ++=γαε二. 固定效应(Fixed effects ) vs 随机效应(Random effects)如果个体效应i α是一个均值为0,方差为2ασ的独立同分布的随机变量,也就是()0,cov =it i x α,该模型就称为随机效应模型(又称为error component model );如果相关,则称为固定效应模型。
1.在随机效应模型中,it ε在每个个体内部存在着一阶自相关,因为他们都包含着相同的个体效应;此时OLS 无效,而且标准差也失真,应该采用广义最小二乘估计(GLS)其中:是个体按时间的均值;有待估计;我们可以通过对组内和组间估计得到相应的残差,从而可以计算出方差;T k n e e e e nnk nT ubetween between between between within within u 22222,,ˆˆ1σσσσσα-=-'='--=;组间估计:εβ+=..i i x y ;组内估计如下;2.如果个体效应和解释变量相关,OLS 和GLS 都将失效,此时要采用固定效应模型。
第七章 Panel Data模型

第七章Panel Data 模型引言---概念(1)Panel DataPanel Data,即面板数据,是截面数据与时间序列数据综合起来的一种数据类型。
其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板。
其实,这种数据类型更应该命名为“时间序列---截面数据”,也称为“平行数据”或“TS-CS数据(Time Series-Cross section data)”。
(2)截面数据例如,城市名:广州、深圳、珠海、佛山的GDP分别为10、11、9、8(单位亿元)。
这就是截面数据,即在一个时间点处切开,看各个研究个体(城市)的不同就是截面数据。
(3)时间序列例如:2000、2001、2002、2003、2004各年,广州市GDP分别为8、9、10、11、12(单位亿元)。
这就是时间序列,即选一个研究个体(城市),看各个样本时间的不同,就是时间序列。
(4)面板数据例如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:北京市分别为8、9、10、11、12;上海市分别为9、10、11、12、13;天津市分别为5、6、7、8、9;重庆市分别为7、8、9、10、11(单位亿元)。
这就是面板数据,即面板数据是截面上个体在不同时间点的重复观测数据。
面板数据的示意图(图1)图表 1 面板数据示意图面板数据从横截面看,是由若干个个体(城市)在某一时间点构成的截面观测值,从纵剖面看,每个个体都是一个时间序列。
通常,面板数据用双下标变量表示,例如:,1,2,,;1,2,,it y i N t T ==,i 对应面板数据中不同个体。
N 表示面板数据中含有N 个个体。
t 对应面板数据中不同时间点。
T 表示时间序列的最大长度。
若固定t 不变,.,(1,2,,)i y i N =是截面上的N 个随机变量;若固定i 不变,.,(1,2,,)t y t T =是纵剖面上的一个时间序列(个体)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章Panel Data 模型引言---概念(1)Panel DataPanel Data,即面板数据,是截面数据与时间序列数据综合起来的一种数据类型。
其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板。
其实,这种数据类型更应该命名为“时间序列---截面数据”,也称为“平行数据”或“TS-CS数据(Time Series-Cross section data)”。
(2)截面数据例如,城市名:广州、深圳、珠海、佛山的GDP分别为10、11、9、8(单位亿元)。
这就是截面数据,即在一个时间点处切开,看各个研究个体(城市)的不同就是截面数据。
(3)时间序列例如:2000、2001、2002、2003、2004各年,广州市GDP分别为8、9、10、11、12(单位亿元)。
这就是时间序列,即选一个研究个体(城市),看各个样本时间的不同,就是时间序列。
(4)面板数据例如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:北京市分别为8、9、10、11、12;上海市分别为9、10、11、12、13;天津市分别为5、6、7、8、9;重庆市分别为7、8、9、10、11(单位亿元)。
这就是面板数据,即面板数据是截面上个体在不同时间点的重复观测数据。
面板数据的示意图(图1)图表 1 面板数据示意图面板数据从横截面看,是由若干个个体(城市)在某一时间点构成的截面观测值,从纵剖面看,每个个体都是一个时间序列。
通常,面板数据用双下标变量表示,例如:,1,2,,;1,2,,it y i N t T ==,i 对应面板数据中不同个体。
N 表示面板数据中含有N 个个体。
t 对应面板数据中不同时间点。
T 表示时间序列的最大长度。
若固定t 不变,.,(1,2,,)i y i N =是截面上的N 个随机变量;若固定i 不变,.,(1,2,,)t y t T =是纵剖面上的一个时间序列(个体)。
利用面板数据建立模型的好处是:【1】由于观测值的增多,可以增加估计量的抽样精度;【2】对于固定效应模型能得到参数的一致估计量,甚至有效估计量。
【3】面板数据建模比单截面数据建模可以获得更多的动态信息。
例如1990-2000 年30 个省份的农业总产值数据。
固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。
面板数据由30 个个体组成。
共有330 个观测值。
(5)平衡面板数据与非平衡面板数据对于面板数据,1,2,,;1,2,,it y i N t T ==,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据;若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据。
第一节 面板数据基本模型用面板数据建立的模型通常有2大类,即固定效应模型和随机效应模型。
在每类模型中,又可以仅从截面单位的不同出发建立,或仅从时间出发建立模型。
一.基本形式Panel 数据既反映截面的不同个体,又反映这些个体不同时间的状况,如果一个面板数据模型定义为,,1,2,,;1,2,,it it it it it Y i N t T αμ=++==X β (7.1) 其中it Y 为被回归变量,12(,,,)it it it kit X X X =X ,k 是解释变量个数;it α是模型的截距;it β是参数向量,反映解释变量X 与被解释变量Y 之间的关系;it μ是随机干扰项,相互独立,0均值,等方差,即有2~...(0,)it u i i d μσ。
二.固定效应模型固定效应模型的基本形式如式(7.1)。
(1)个体固定效应模型如果仅从截面单位出发建立模型,截距项可以写成it i αμα=+,μ表示所有截面单位在所有时间上的均值,即总平均值;i α表示不同截面单位截距与总平均的差异,也称为截面效应。
模型如式(7.2)。
(1,,;1,,)it i it it it Y i N t T μαμ=+++==X β (7.2)(2)时点固定效应模型 如果仅从时间出发建立模型,截距可以写成it t αμλ=+,μ表示所有截面单位在所有时间上的均值;t λ是不同时间截距与总平均的差异,亦可称为时间效应。
模式如式(7.3)。
(1,,;1,,)it t it it it Y i N t T μλμ=+++==X β (7.3)固定效应模型中,无论是参数向量it β,还是截面效应i α或时间效应t λ,一旦估计出来都是固定的常数。
一般来说,当截面单位是总体的所有单位时,通常采用固定效应模型。
(3)个体时点固定效应模型综合考虑截面单位与时点时,则建立个体时点固定效应模型,其基本形式为(7.3-1)。
(1,,;1,,)it i t it it it Y i N t T μαλμ=++++==X β三.随机效应模型随机效应模型的基本形式如式(7.4)。
(1,,;1,,)it it i it Y C i N t T αμ=+++==X β (7.4)式中,()()0it i E E C μ==;22()it u E μσ=;22()i c E C σ=;(,)0,it j E C i j μ=≠;(,)0it js E μμ=,,t s i j ≠≠;(,)0,i j E C C i j =≠。
可以看出,模型中i C 是随机的,称为随机效应。
它反映除了能够用共同的变量X 解释Y 的变化外,不同个体之间仍存在的差异。
如果这些差异不提取出来,随机干扰项将不是独立同分布的。
这些差异虽然无法直接观测但客观存在,只能用随机效应表示,相当于在模型中引入一个不可直接观测的潜变量。
当截面单位随机取自一个大的总体时,需要考虑利用随机效应模型。
一般来说,研究利用的是宏观经济数据,如全国不同省市区的数据、某市不同地区的数据,这些数据通常都经过汇总平均处理,不同截面个体之间的差异运用共同的解释变量可以较充分地说明,采用固定效应模型即可;若研究利用的是微观个体数据,如居民数据、消费者数据、企业数据等,建立模型时,不同个体之间差异很难完全用共同的变量加以解释,剩余的由个体本身的因素带来的差异,不宜放入模型的随机干扰项中,只能用随机效应反映。
这种情况需要运用随机效应模型。
第二节 固定效应模型当截面单位是总体所有单位,即不需要以样本推断总体时,可以运用固定效应模型。
所以固定效应模型,即在模型中,除随机干扰项外,其余待估计参数均为常数。
下面不考虑时间变化,仅考虑截面单位变化,讨论固定效应模型。
时间变化,截面单位不变的情况类似。
若不考虑时间变化效应(非动态),固定效应模型由式(7.2)可以改写为式(7.5)的基本形式。
(1,,;1,,)it it i it Y V i N t T μα=+++==X β (7.5)式中,β是×1k 为参数向量;μ为常数项,所有截面单位的均值;i α是不同的常数,截面影响通过参数i α的差异说明;2~...N(0,)it vV i i d σ。
从式(7.5)可以看出,实际上可以设定:i i u μα=+,将总体均值作为常数项μ,个体的截距不同表现为个体与总体均值的偏差,即截面单位对总体平均的偏离i α。
一.固定效应模型的类型根据模型截距、斜率是否相同,固定效应模型可以分为下面四类。
1. 模型A :不同截面单位的截距、斜率均相同这类模型反映不同截面单位有相同的截距和斜率,实际上是对所有截面和时序的混合数据建立的普通线性回归模型。
模型如式(7.6)。
(1,,;1,,)it it it Y V i N t T α=++==X β (7.6)2. 模型B :不同截面单位的截距不同、斜率相同这类模型是考虑不同截面单位有不同截距,但有相同的变化率。
模型如式(7.7)。
(1,,;1,,)it i it it Y V i N t T α=++==X β (7.7)3. 模型C :不同截面单位的截距相同、斜率不同这类模型是考虑不同截面单位有相同截距,但有不同的变化率。
该类模型在实际中的意义不大。
模型如式(7.8)。
(1,,;1,,)it it i it Y V i N t T α=++==X β (7.8)4. 模型D :不同截面单位的截距、斜率均不同 这类模型是考虑不同截面单位不同的截距和不同的变化率。
模型如式(7.9)。
(1,,;1,,)it i it i it Y V i N t T α=++==X β (7.9)式(7.7)、式(7.9)中i α也可以表述为i μα+的形式。
二.模型形式的检验对于实际数据适合采用上述哪个模型类型,可以通过模型形式的检验进行判定。
(一) 检验的基础模型形式的检验实际上是为数据选择合适的模型形式,是一个不断递进的检验,先从最简单的模型A 开始,一次检验,一直到不能拒绝该类模型为止。
一般来说,模型越合适,意味着模型的残差越小,也=可以考虑建立在最小二乘估计基础上的残差,利用协方差分析构造检验统计量。
模型形式检验的基础是各模型的残差平方和。
1. 模型A 的残差平方和模型A 的残差平方和记为1S ,其计算公式如式(7.10)。
'1'1YY XY XX XY S T T T T -=- (7.10)式中,'11()()N T XX it it i t T X X X X ===--∑∑;'11()()N TXY it it i t T X X X Y ===--∑∑; 211()N T YY it i t T Y Y ===-∑∑。
2. 模型B 的残差平方和模型B 的残差平方和记为2S ,其计算如式(7.11)。
'1'2YY XY XX XY S W W W W -=- (7.11)式中,,1N YY YY i i W W==∑,这实际上式对截面单位求和;2,1()T YY i it i t W Y Y ==-∑,是每一截面单位在时间上的求和;,1N XX XX i i W W ==∑;'2,11()()()T TXX i it it i it i t t W X X X X X X ===--=-∑∑;,1N XY XY i i W W ==∑,,1()()TXY i it i it i t W X X Y Y ==--∑∑. 3. 模型C 的残差平方和模型C 的残差平方和记为3S ,其计算如式(7.12)。
311ˆˆ()N Tit it i i t S Y X αβ===--∑∑ (7.12) 4. 模型D 的残差平方和模型D 的残差平方和记为4S ,其计算如式(7.13)。