对固定效应变面板变系数的直接半参估计
固定效应模型及估计原理说明

固定效应模型及估计原理说明固定效应模型是一种用于估计面板数据的统计模型,也称为个体固定效应模型、个体平均效应模型或者虚拟变量模型。
它的基本假设是,个体间的差异可以用个体固定效应进行捕捉,而时间间的差异可用时间固定效应进行捕捉。
在固定效应模型中,我们假设个体i在时间t的观测变量Y_i,t与个体特征X_i,t和时间特征T_t的关系可以如下表示:Y_i,t=α+X_i,tβ+λ_i+γD_t+ε_i,t其中,Y_i,t表示个体i在时间t的观测变量;α是一个常数项;X_i,t表示个体i在时间t的特征变量;β是特征变量的系数;λ_i表示个体固定效应,它捕捉了个体间的差异;D_t是时间虚拟变量,捕捉了时间间的差异;γ是时间虚拟变量的系数;ε_i,t是误差项。
个体固定效应λ_i是一个虚拟变量,它会为每个个体i赋予一个独特的数值。
例如,我们可以使用个体的ID作为个体固定效应的取值。
个体固定效应的存在可以控制掉所有不随时间变化的个体特征,保留了个体间的差异。
时间固定效应D_t也是一个虚拟变量,它会为每个时间t赋予一个独特的数值。
例如,我们可以使用时间的年份作为时间固定效应的取值。
时间固定效应的存在可以控制掉所有不随个体变化的时间特征,保留了时间间的差异。
为了估计固定效应模型,我们需要使用固定效应估计原理。
固定效应估计原理的核心是差分方法,通过在面板数据中进行差分操作,控制个体固定效应和时间固定效应,从而消除它们的影响,进而得到β的一致估计。
具体地,固定效应估计原理可以通过两步进行:第一步是个体平均差分,第二步是时间平均差分。
在个体平均差分中,我们计算出每个个体的平均值,并将每个时间点的观测值减去该个体的平均值,得到一个个体的差异项。
这样一来,个体固定效应就消除了。
在时间平均差分中,我们计算出每个时间点的平均值,并将每个个体的观测值减去该时间点的平均值,得到一个时间的差异项。
这样一来,时间固定效应就消除了。
最后,我们对差异项进行回归分析,估计出β的值。
固定效应面板数据模型

– 所以,在建立Panel Data模型时必须控制不可观察的 个体和(或)时间的特征以避免模型设定的偏差并改 进参数估计的有效性。
• Panel Data是来自经济活动的复杂过程。
– 若假设经济变量在每个时点上都是由参数化的概率分 布函数生成的,实际上是不现实的。 – 忽视这种在横截面或时间上参数的本质上的差异可能 会导致参数估计不是一致估计或估计出的参数值无意 义。
• 检验假设1的F统计量
(S 2 S1 ) /[(n 1) K ] F1 ~ F[(n 1) K , n(T K 1)] S1 /[nT n( K 1)]
•从直观上看,如S2-S1很小,F1则很小,低于临界值,接受 H1。 S2为截距变化、系数不变的模型的残差平方和,S1为截 距、系数都变化的模型的残差平方和。
• 模型6:截面个体和时点变截距模型。
Yit i t Xit β it
i 1,, n t 1,, T
该模型表示,在横截面个体之间,存在个体影响,同时 在不同的时点之间,存在个体影响,但是不存在变化的 经济结构,因而结构参数在不同横截面个体上是相同的。 这是一类在实际应用中常见的模型。从应用的角度,人们 希望既控制截面个体影响,也控制时点影响,然后求得平 均意义上的不变的结构参数。 该模型的估计方法与模型2并无大的差别。
– 如果n充分小,此模型可以当作具有(n+K)个参数的 多元回归,参数可由普通最小二乘进行估计。
ˆ α ˆ D X D X β
1
D X y
– 当n很大,甚至成千上万,OLS计算可能超过任何计算 机的存储容量。可用分块回归的方法进行计算。
– 分块回归的思路是:首先设法消去参数αi,估计参数β; 然后再在每个截面个体上利用变量的观测值和参数β的 估计值,计算参数αi的估计量。
自适应变系数面板数据模型的半参数估计

自适应变系数面板数据模型的半参数估计
武大勇, 周永卫
(郑州航空工业管理学院 数理系, 郑州 450015)
摘
要: 文章把一般的面板数据模型拓广到自适应变系数的情形。对于自适应变系数的面板
数据模型, 首先在假设参数部分已知的条件下推导出了模型中非参数部分的估计;然后, 利用给出 了参数部分的数值求法; 最后, 从数值试验上验证了所给出的估计。 关键词: 面板数据; 半参数估计; 自适应; 变系数 中图分类号: O212; F224.0 文献标识码: A 文章编号: 1002-6487 (2011) 17-0021-03
τ τ z Y it - ∑ {a j + b j ( β τ X it - z)} X it, jú ∑∑ ê ê ú K h ( β X it - )w( β X it ) i=1 t=1 N T
对于给定的系数 β = β 0 已知, 我们假设 {g j (·)} ( j = 1,⋯, p)
为了简单起见, 我 们 假பைடு நூலகம்设 权 函 数 w( β τ X it ) 的 导 函 数
p
变量,X 为 p × 1 维解释变量, 在本文中, 我们对于回归函数
G( x) 利用下面形式的变系数模型做近似: g ( x) = ∑ g j ( β τ x) x j
j=0 p
(1)
这里 X i, t 为 p × 1 维的, 且第一个元素为 1 , 系数函数 误差项 {ε } 假设为独立同分布 (i.i.d ) 的。在本文 β = 1 ;
根据cravenandwahba1979提供的选择最优窗宽的广义交叉核实方法thegeneralizedcrossvalidationmethod对于给给定的令y?itxyiyi1?yiti1?n显然y?这里hh是一个nn矩阵显然其与y选择h最小化itg?xit1y?2?y?nhhy1y2?yn1y2?yn是独立的根据广义交叉核实方法gcvgcvh1n1n1trhh2i1nt1tyity?it2上式实际上是给定后非参数函数g的估计g?的渐进均方误差可得gcvhc0c1h4c2nh1oph4n1h1最小化上式可得最优窗宽为hoptc24nc115理论新探22统计与决策2011年第17期总第341期这里nnt其中的系数c0c1c2可根据ruppert1997提供的方法获得
使用面板数据个体固定效应模型进行估计

使用面板数据个体固定效应模型进行估计一、概述近年来,面板数据分析在经济学、社会学、公共管理等领域得到了越来越广泛的应用。
面板数据有别于交叉数据和时间序列数据,它集合了个体(如个人、公司、国家)和时间的信息,具有独特的优势和特点。
个体固定效应模型是一种在面板数据分析中常用的方法,它能够控制个体特征的固定效应,从而更准确地估计变量间的关系。
本文将围绕面板数据个体固定效应模型的估计方法展开探讨。
二、面板数据个体固定效应模型简介个体固定效应模型是面板数据分析中最常用的模型之一。
在该模型中,我们假设每个个体都有一个固定的效应,这个效应代表了个体固有的特征,如性别、种族、文化背景等。
个体固定效应模型的基本形式如下:Y_it = α_i + X_itβ + μ_it其中,Y_it代表第i个个体在第t个时间点的因变量,α_i是个体i的固定效应,X_it是自变量,β是自变量的系数,μ_it是误差项。
个体固定效应模型的特点在于它能够控制个体固有的特征,减少了遗漏变量引起的偏误,同时也可以更准确地估计自变量对因变量的影响。
三、面板数据个体固定效应模型的估计方法在实际应用中,我们需要利用样本数据对个体固定效应模型进行估计。
常用的方法包括最小二乘法、广义矩估计和最大似然估计等。
下面将详细介绍这些方法的原理和步骤。
1. 最小二乘法最小二乘法是个体固定效应模型估计中最简单也是最常用的方法。
它通过最小化残差平方和来估计模型参数。
具体而言,最小二乘法的步骤如下:(1)建立个体固定效应模型,确定自变量和因变量的取值范围。
(2)利用样本数据估计模型参数,求解出α_i和β的估计值。
(3)检验估计结果的显著性和稳健性。
最小二乘法的优势在于计算简单,易于实现。
但是,它也存在一些局限性,比如对异方差和序列相关性敏感,容易产生估计偏误。
2. 广义矩估计广义矩估计是一种比最小二乘法更一般的估计方法。
它不仅可以处理异方差和序列相关性等问题,还能充分利用面板数据的信息。
结构变化面板模型估计与检验方法

一、概述结构变化面板模型估计与检验方法是时间序列分析领域的重要研究课题。
面板数据模型通常用于描述变量在不同单位或时间上的变化,并且当面板数据存在结构变化时,估计与检验方法就显得尤为重要。
本文将针对结构变化面板模型的估计与检验方法展开探讨,以期对相关领域的研究工作提供一定的参考。
二、结构变化面板模型简介1. 结构变化的概念2. 面板数据模型的应用场景3. 结构变化面板模型的基本形式三、结构变化面板模型的估计方法1. 固定效应模型的估计1.1 理论基础1.2 估计方法2. 随机效应模型的估计2.1 理论基础2.2 估计方法3. 动态面板数据模型的估计3.1 理论基础3.2 估计方法四、结构变化面板模型的检验方法1. 结构稳定性检验1.1 Chow检验1.2 B本人-Perron检验2. 结构断裂点的检测2.1 断点回归方法2.2 平滑转换回归方法3. 结构变化趋势的检验3.1 均值差异检验3.2 趋势断面积检验五、结构变化面板模型的应用案例1. 通过实例介绍结构变化面板模型的估计与检验方法的具体应用2. 分析结构变化对模型结果的影响3. 对结构变化的原因进行深入探讨六、结论与展望1. 对结构变化面板模型估计与检验方法的总结2. 对未来研究方向的展望在这篇文章中,我们系统地介绍了结构变化面板模型的估计与检验方法,包括其基本概念、应用场景、估计方法和检验方法,并对其进行了实际应用案例的分析。
这些内容将为相关领域的研究工作提供一定的参考,希望能够对读者有所帮助。
我们也对未来研究方向进行了展望,希望能够为该领域的进一步研究工作提供一定的启示。
七、结构变化面板模型的应用案例结构变化面板模型是在实际经济学研究中得到广泛应用的一种方法。
接下来,我们将通过一个具体的应用案例,来介绍结构变化面板模型的实际应用。
在许多经济学研究中,我们经常会遇到一个共同的问题,即在不同的时间点或者不同的实体中,我们能否发现相同的经济规律?动态面板数据模型的引入正是为了解决这一问题。
变系数动态面板数据模型的半参数估计

2
)
= op ( h - 2 ) + O p ( ( nh p )
- 2
1
)
( 13)
0 dp ×1
- 2
1
而 H = di a g { I d + 1 , h I dp } , 所以α- α= op ( h - 2 ) + O p ( ( nh P )
( 2) 由公式 ( 13) 可得 H ( β- β ) g j ( z ) 和 bj = g j ( z)
)
)。
- 2
1
-
h
2
B g ( z)
2
0 dp ×1
= op ( h - 2 ) + O p ( ( nh p )
) , 而 aj =
= 9 g j ( z ) / 9z 。
2 h - g ( z) B g ( z) 2
)
若令 a = ( a1 , L , ad ) ′ 和 b = ( b′ ′ , 则 1 , L , b d)′ β- β ) H (
众所周知 , 关于线性或非线性参数动态面板数据模型的结果已经很多 , 这些模型都是建 立在所有的回归系数都是常数的假设之上 , 具体的结果可以详见 Arellano ( 2003 ) , Baltagi ( 2005 ) , Hsiao ( 2003) 。但是 , 参数化的动态面板数据模型很容易被错误识别 , 被错误识别 的模型的参数估计是非一致的 。为了解决这些问题 , 参数化模型可用半参数或非参数的模型 来代替 , 如 Ho rowitz 和 Markato u ( 1996) , Li 和 Hsiao ( 1998) , Kniesner 和 Li ( 2002) 等 便考虑了这种情况下的参数估计 。本文主要考虑一种混合 ( 回归系数既有常数也有变系数) 的动态面板数据模型 。我们利用 Hansen ( 1982) 中提出的广义矩估计的方法对于变系数动 态面板数据模型中揭示所隐含的矩条件 , 我们得到了所求估计量的一致的半参数估计 。对于 动态面板数据的半参数估计的方法 , Byeo ng , Ro bin 和 Leopold ( 2007 ) 中考虑了常系数的 情况 , Cai 和 Li ( 2005) , Cai 和 Xio ng ( 2006) , Cai 和 Li ( 2007) 中考虑了变系数动态面板 数据的非参数估计 , 而对于变系数的动态面板数据模型利用半参数的方法还未见相关文献 。
固定效应部分线性变系数面板模型的快速有效估计

固定效应部分线性变系数面板 模型的快速有效估计
丁飞鹏陈建宝
内容提要:本文将最小二乘支持向量机(LSSVM)和二次推断函数法(QIF)相结合,为个体内具有
相关结构的固定效应部分线性变系数面板模型提供了一种新的快速估计方法;在一定的正则条件下,论
证了参数估计量的渐近正态性和非参数估计量的收敛速度;采用Monte Carl。模拟考察了估计方法在有
Key words: Partially Linear Varying Coe伍cient Panel Model ; Fixed Effects ; Least Square Support Vector Machine ; Quadratic Inference Function Method
一、弓I言
二是为模型构建了一种新的有效估计方法该方法首先采用b样条函数近似未知系数函数利用滤子法消除个体效应并借鉴qif的思想获得了一种新的损失函数再结合lssvm法获得模型中参数和非参数部分的估计量
第36卷第3期 2019年3月
统计研究 Statistical Research
Vol. 36, No. 3 Mar. 2019
近年来,面板数据频繁出现在各领域的研究中。相比截面数据和时间序列数据,面板数据提供 了更多的数据量,增加了自由度,使研究人员可以构建更加复杂的模型,建立更为有效的统计推断 方法。随着面板数据的广泛应用,与面板数据有关的理论及方法得到了迅速发展,变系数面板模型
*本文获国家社会科学基金项目"半参数变系数空间自回归模型的理论及应用研究"(16BTJ018)、教育部人文社会科学重点 研究基地重大项目"集聚经济下的中国地方政府财税行为研究”(15JJD790029)、福建省自然科学基金项目“几类新的变系数空间 自回归模型的估计和应用研究"(2017J01396)、福建省高校创新团队培育计划和福建师范大学创新团队(IRTL1704)的资助「
13、第七章(面板数据模型——固定影响变系数模型)

面板(平行)数据模型——固定影响变系数模型一、研究目的面板数据模型从系数的角度看,可以分为3种类型,即:不变系数模型(也称为混合模型)、变截距模型、变系数模型。
这三种类型在固定影响变截距模型案例分析中已经介绍过了。
从估计方法的角度看,也可以分为3种类型,分别是:混合模型、固定影响(效应)模型、随机影响(效应)模型。
混合模型也就是不变系数模型,这时面板的三维数据和二维数据没有区别,面板模型等同于一般的回归模型,因此采用OLS就可以得到估计结果。
固定影响模型分为变截距模型和变系数模型,变截距模型在之前的案例分析中介绍了,本案例介绍固定影响变系数模型,以及之前的案例分析中没有涉及的面板数据模型中的一些知识和操作的介绍。
至于随机效应模型会在高级计量分析案例中介绍。
二、面板数据模型原理1、面板数据模型原理这部分内容参见固定影响变截距模型案例分析2、固定影响模型与随机影响模型的区别所谓的固定、随机、混合,主要是针对分组变量而言的。
固定效应模型,表示你打算比较的就是你现在选中的这几组。
例如,我想比较10个公司的业绩,分析目的就是为了比较这10个公司的差别,不想推广到其他公司。
这10个公司不是从很多公司中抽样出来的,分析结论不想推广到其他公司,结论仅限于这10个公司。
“固定”的含义正在于此,这10个公司是固定的,不是随机选择的。
随机效应模型,表示你打算比较的不仅是你的设计中的这几组,而是想通过对这几组的比较,推广到他们所能代表的总体中去。
例如,你打算分析上述10个公司所在行业内其他公司的业绩,那么你所选的10个公司业绩的分析研究,其目的不是为了比较这10个公司的业绩差异,而是为了说明整个行业的所有公司的业绩差异。
你的研究结论就不仅仅限于这10个公司,而是要推广到整个行业。
“随机”的含义就在于此,这10个公司是从整个行业中挑选出来的。
混合效应模型就比较好理解了,就是既有固定的因素,也有随机的因素。
一般来说,只有固定效应模型,才有必要进行两两比较,随机效应模型没有必要进行两两比较,因为研究的目的不是为了比较随机选中的这些组别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了能够得到这类模型中系数的一致估计量,一个可行的解决方法就是讲模型转换成一个不含有未知形式异质性的模型。具体而言,可以通过构建一个异质性变量 与d维解释变量 、q维解释变量 的协同变量有关(与其中之一或者两个变量同时相关)的线性面板模型来解决这一问题。一般形式为:
其中,函数 未知且需要估计, 为随机干扰项。显然,任何试图使用标准非参数估计方法对 进行直接估计都会得到基准曲线的非一致性估计量。造成这一结果的原因在于 。解决这类问题有一个标准的方法,就是将 通过一系列转换从式(1.1)中去除,然后通过一个非参数平滑过程来估计未知曲线。一般存在着多种去除这种非一致性效应的方法。最简单的就是一阶差分:
一、绪论
本篇论文关注于对面板模型变系数的估计。这种回归方法由一个线性回归模型组成,并基于理论,回归系数受到外生变量影响,从而被假定为变系数。例如,在所谓的教育回报问题中,针对教育水平对工资水平的影响弹性的估计问题,通过理论研究指出教育的边际回报可能会随着工作经验的不同而改变,详情可参阅Schultz(2003)。因此,在一定的教育水平条件下,工资-教育弹性可能就会随着工作经验的不同而发生变化。
在本文的实证研究中,针对可能存在的变系数函数形式误设问题,我们采用了非参数估计技术加以解决。但在大多数情况下,对于系数方程形式的估计是通过标准化手段得到的,例如样条平滑、序列估计或者局部多项式回归估计,详情可参阅Su and Ullah(2011)。尽管在绝大多数情况中,直接运用一个已有的技术就能够得到一个正确的推断结果,然而没有多少注意力被放在这些估计过程在非标准设定下的渐近特征也是事实。不幸的是,这些设定与面板数据模型的实证分析息息相关。这里有一个非常清晰的例子,在一个经济计量模型中,存在着一些无法观测的解释变量,这些变量虽然不随着时间变化,但是能够在统计角度上与模型中一些其他的解释变量存在着相关性(固定效应)。固定效应模型中存在的与一些解释变量相关的未知形式的组间异质性不是一个能够简单解决的问题。实际上,在这样的异质性问题下进行估计的计量方法都面临着所谓的附带参数问题(固定效应的可变截距项就是附带参数,会造成最大似然估计结果非一致性),详情可参阅Neyman and Scott(1948)。
三、渐近性质及有效估计量
这一章将对前文所介绍的估计结果的一些初步渐近性质进行分析。为此,设定如下假设:
假设3.1:设 为一组 随机变量,对每一个固定的t,服从独立同分布;对于每一个i,具有严格的平稳性。另,分别设 、 及 为 、 及 的概率密度函数。所有概率密度函数对于其包含的所有参数都是连续可微的且在其支撑集中任一点上都具有上下界。
假设3.2:随机扰动项 服从零均值同方差的独立同分布,且 。干扰项与任意i和t的 和 相互独立。另对于某些 , 。
为一个 维行向量。在这里,K为一个q元内核:
其中,H是一个q维正定对称的窗宽矩阵。通过式(2.9)的最小化得到一个 维列向量 。同样的,得到 和 的估计量,分别为 以及 。其中 为方程 对q维列向量z中所有元素求d阶偏导得到的 矩阵。
很容易就能够将式(2.9)最小化的解写成我们熟知的矩阵形式:
其中,
这个式子表明将通过 对 的内核(kernel?)加权回归得到 的估计量。那么,所感兴趣的量就可以通过局部加权线性回归得到。
(2.1)
这里,K为一个二元内核(kernel?),则有 ,其中对于任意u,v,有
h为一个窗宽。我们用 和 表示使式(2.1)最小化的系数的值。上述过程给出了 和 的估计量,分别为 及 。
为了将收敛速度保持在 ,我们在这里对回归方程进行变换,采用单步后向拟合算法进行估计。用 表示成如式(2.5)的形式:
将式(1.2)带入(2.5),得:
从式(2.6)中可以看出,对于 的估计是一维回归问题。因此我们可以再次使用一元内核权重的局部线性最小二乘估计方法。然而,仍存在着一些问题,由于式(2.5)中 未知,则我们需要将其替换为初试局部线性估计量,即 ,建立如下的回归模型:
到目前为止,对于 的直接非参估计都比较麻烦,具体可参阅Su and Ullah(2011)。其原因在于,对于每一组别(i),式(1.2)的条件期望值 都包含了不同期(t) 的线性组合。这可以被视为一个在不同期具有相同形式的可加性函数。
在一些特殊的情况下,本文也给出了相关问题的一致性估计方法。对于无约束模型形式 的情况,式(1.2)就能够改写为一个完全非参数可加性模型:
Qian and Wang(2012)对可加部分采用了基于一阶差分的边际积分非参估计,即 。
本文中我们所介绍的估计方法主要是将现有的估计结果推广至更为广义的变系数模型,在如式(1.1)所示的 但T保持不变的O型框架下进行研究。我们的方法是基于对可加函数 的局部近似实现的。这个思想由Yang(2002)在一篇完全不同的论文中提出。由于这个估计方法是基于局部近似特性的,所以我们在更为广义的条件下对偏差余项的特征进行研究。这个余项在标准的局部线性回归方法中被忽视(参照Fan and Gijbels 1995b),但当处理一阶差分估计时需要多加注意。实际上,正如已经由Lee and Mukherjee(2008)指出的,将对一阶差分的局部线性估计方法直接应用到面板数据模型会导致估计结果有偏,而且即使在大样本条件下,有偏性都无法去除。通过施加一个高纬度的内核权重,我们的估计方法能够克服无法消除的有偏性问题,但正如预期的,这样会增大估计方差。在Henderson等(2008)的研究中也存在着这样的现象,其最后的估计结果具有一个更大的方差。
其次,使用局部线性最小二乘内核估计的另一个重要优势在于其渐近偏差及方差的表达式比Naradaya-Watson或者其他的非参估计量的偏差与方差表达形式更为优越。特别是Fan(1993)指出的,局部线性最小二乘估计量具有非常重要的渐近大中取小性质。另外,与Naradaya-Watson或者其他非参估计量不同,(2.11)估计结果在Z的密度函数边界处的偏差与方差和在密度函数内部的具有相同的量级。这是一个非常有用的性质,因为在实际应用中,处于边界地带的样本数据可能占总样本数的较大比例。
那么, 的局部线性加权最小二乘估计量就如式(2.11)所示:
。这里 和 分别是 维和 维矩阵。
最后,对选择局部线性最小二乘估计方法做出几点说明。
首先,从式(2.11)的表达形式上可以看出,我们是通过加权最小二乘找到数据拟合平面的方式得到估计结果的,而权重的选择是基于内核及窗宽矩阵H得到的。正如Ruppert和Wand(1994)所讨论的,如果选择一个可能具有紧支撑的高斯内核,那么对 施加的权重就是一个均值为 ,具有 形式椭圆形轮廓的高斯密度函数的值。显然, 距离z越远,则被赋予的权重就越小。然而,在给定的概率密度条件下,由于H决定了这个椭圆形的大小和方向,那么也就决定了各权重的大小和符号。通常,我们用一个简化的形式替代矩阵H,即令 。对角矩阵形式的窗宽矩阵意味着前文所述的所有高斯分布的椭圆形轮廓的轴的方向均与坐标轴方向一致,而对于一般形式的矩阵H,则与H矩阵的特征向量有关。依据不同形式的 ,存在着完全窗宽矩阵更为有利的情况。
对固定效应变面板变系数的直接半参估计
摘要
在这篇论文中,我们介绍了一个用于面板模型中个体效应与解释变量之间存在着未知形式相关性情况下变系数估计的新方法。这个回归方法使用一个基于一阶差分后的局部回归对未知系数进行估计。为了避免无法忽视的渐近有偏性,我们需要引入一个更高维度的内核权重。这是我们能够以扩大变量规模,导致一个较低的收敛概率为代价去除有偏性。为了克服这个问题,我们采用了单步更新算法,这能够使得回归结果能够达到一个较高的收敛概率,同时也体现了所谓的oracle效率特征。我们还得到了渐近分布。由于回归过程是建立在对于窗宽矩阵(指除一定宽度对角线以外的元素全为0的矩阵?具体查阅非参估计)的选择上,我们还提供了一个计算计算这个矩阵的实证方法。蒙特卡洛模拟结果显示这个回归方法在有限样本情况下十分有效。
本文结构如下:第二章,我们建立计量模型并介绍估计过程;第三章,研究其渐近特征并基于此介绍一个转换过程,通过这个过程能够得到一个具有最优收敛率的有效估计量;第四章,介绍如何从实证角度估计带宽矩阵;第五章,给出了一些模拟结果;最后,第六章为结论。
二、统计模型及估计方法
为了更好的说明我们的估计方法,先从单变量模型开始,然后将估计结果扩展到多变量模型。那么,根据式(1.2)建立 的单变量模型。在这种情况下,对于任意 ,其中A为 内部一个非空闭集,将(1.2)泰勒展开:
为了能够在这种情况下保持标准的收敛率(即在不影响对有偏性约束的情况下降低估计方差),我们使用Fan and Zhang(1999)所提出的方法。其核心思想在于通过进一步的平滑处理降低方差,而且偏差余项不会因为任何平滑处理而降低。将这种思想运用到我们的估计问题中,提出一个单步后向拟合算法。由于采用可加模型,那么我们的方法能够得到一个有效估计结果。这意味着,任意一组的估计结果的协方差矩阵是渐近一致的,也就是说我们能够推断出其他组别的协方差矩阵。最后,我们还介绍了一个用来选择窗宽系数(bandwidth parameter非参估计内容,需补课)的数据驱动方法。
如前文所述,可以使用一些变换过程来去除面板模型中的异质性。据我们所知,对于模型(1.1),Sun等(2009)已经提出了一个通过所谓的虚拟变量最小二乘逼近方法得到 的估计量。他们通过如式(1.3)的替代形式对 进行估计。
其中,当i=j时 ,否则为0。基于这个模型,他们推导出一个包含了局部线性回归逼近的最小二乘方法,得到关于未知系数平滑曲线的一致估计量。与我们的方法相比,这个方法存在这一个极大的偏差余项。实际上,这个方法的有偏性来自于两处。其一,对 的局部近似,这种处理方式也存在于我们所讲要介绍的方法中;其二,未知的固定效应只能等于0,因为他们施加了一个可加性强约束—— 。这种形式的约束也被用在了Mammen(2009)中。