面板数据选择

合集下载

如何进行面板数据模型的假设检验和模型选择

如何进行面板数据模型的假设检验和模型选择

如何进行面板数据模型的假设检验和模型选择面板数据模型是一种广泛应用于社会科学研究中的统计分析方法,它能够处理跨时间和个体的数据,克服了截面数据和时间序列数据各自的局限性。

在进行面板数据模型分析时,假设检验和模型选择是两个重要的步骤,能够帮助我们验证模型的有效性和选择最佳的模型。

一、面板数据模型的假设检验面板数据模型的假设检验主要包括固定效应模型和随机效应模型的检验。

1. 固定效应模型的假设检验固定效应模型的核心假设是个体效应不随时间变化,只存在个体间的差异。

以下是固定效应模型的假设检验步骤:首先,我们需要进行单位根检验,以判断个体变量是否是非平稳的。

常用的单位根检验方法有ADF(Augmented Dickey-Fuller)检验和KPSS(Kwiatkowski–Phillips–Schmidt–Shin)检验。

其次,我们需要进行系数的显著性检验,以判断个体效应是否存在显著差异。

在面板数据模型中,通常使用固定效应估计器,该估计器通过对个体效应进行固定效应变换,进而估计出个体与时间变量的关系。

最后,我们需要进行模型整体拟合程度的检验,以判断模型是否具有合理的拟合度。

通常可以使用R平方、调整R平方等指标来评估模型的整体拟合程度。

2. 随机效应模型的假设检验随机效应模型的核心假设是个体效应与解释变量的无关性,即个体效应是随机的。

以下是随机效应模型的假设检验步骤:首先,我们需要进行随机效应的显著性检验,以判断个体效应是否存在显著差异。

通常采用最大似然估计方法来估计个体效应的方差,然后使用Wald检验或似然比检验进行显著性检验。

其次,我们需要进行随机效应与解释变量的相关性检验,以判断个体效应是否与解释变量相关。

通常可以使用F检验或t检验来进行相关性检验。

最后,我们需要进行模型整体拟合程度的检验,以判断模型是否具有合理的拟合度。

同样可以使用R平方、调整R平方等指标来评估模型的整体拟合程度。

二、面板数据模型的模型选择在进行面板数据模型分析时,我们常常面临着多种模型选择的困扰。

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析)面板数据分析方法:面板单位根检验—若为同阶—面板协整—回归分析—若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。

先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。

不是时间序列那种接近0.8为优秀。

另外,建议回归前先做stationary。

很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。

fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。

该如何选择呢?步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。

李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。

这种情况称为称为虚假回归或伪回归(spurious regression)。

他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。

因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。

因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。

而检验数据平稳性最常用的办法就是单位根检验。

首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。

单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。

面板数据的常见处理

面板数据的常见处理

面板数据的常见处理面板数据是一种特殊的数据结构,通常用于经济学和社会科学研究中。

它由多个个体或者单位在一段时间内的观测数据组成,每一个个体或者单位都有多个时间点的观测值。

面板数据的处理涉及到数据清洗、数据转换、数据分析和模型建立等多个方面。

一、数据清洗1. 缺失值处理:面板数据中往往存在缺失值,可以使用插补方法(如均值插补、回归插补等)填补缺失值,确保数据的完整性。

2. 异常值处理:对于异常值,可以采用删除、替换或者标记的方式进行处理,以避免对后续分析的影响。

3. 数据去重:检查数据中是否存在重复观测,如有重复观测,需要进行去重操作,以保证数据的准确性。

二、数据转换1. 时间转换:将面板数据中的时间变量进行转换,常见的转换包括将日期格式转换为年份或者季度,方便后续的时间序列分析。

2. 变量转换:对于需要进行计算的变量,可以进行变量转换,如对数转换、百分比转换等,以满足模型的要求。

3. 数据合并:如果面板数据分散在多个数据集中,需要进行数据合并操作,将不同数据集中的观测值按照像应的标识变量进行合并。

三、数据分析1. 描述性统计:对面板数据进行描述性统计,包括计算均值、标准差、最大值、最小值等,以了解数据的基本特征。

2. 相关性分析:通过计算面板数据中变量之间的相关系数,判断变量之间的相关性,以便进行进一步的分析。

3. 面板数据模型:根据面板数据的特点,可以建立面板数据模型,如固定效应模型、随机效应模型等,进行深入的数据分析和预测。

四、模型建立1. 变量选择:根据面板数据的特点和研究目的,选择合适的自变量和因变量进行模型建立,避免多重共线性和过度拟合问题。

2. 模型估计:使用合适的面板数据模型进行参数估计,如最小二乘法、广义最小二乘法等,得到模型的估计结果。

3. 模型评估:对建立的模型进行评估,包括模型的拟合优度、统计显著性等指标,以判断模型的有效性和可靠性。

以上是面板数据的常见处理方法,通过数据清洗、数据转换、数据分析和模型建立等步骤,可以对面板数据进行全面的处理和分析,得到准确的研究结果。

Stata面板数据回归分析中的工具变量法如何选择合适的工具变量

Stata面板数据回归分析中的工具变量法如何选择合适的工具变量

Stata面板数据回归分析中的工具变量法如何选择合适的工具变量工具变量法(Instrumental Variable,简称IV)在面板数据回归分析中被广泛应用。

它通过引入外生变量作为工具变量来解决内生性问题,从而使得回归结果更具可靠性和稳健性。

在Stata软件中,选择合适的工具变量对于IV估计的准确性起着至关重要的作用。

本文将介绍在Stata面板数据回归分析中如何选择合适的工具变量。

一、IV方法简介在介绍IV方法如何选择合适的工具变量之前,先简要介绍一下IV方法的原理和步骤。

IV方法是通过引入工具变量来解决内生性问题,从而得到一致性的估计。

其基本思想是找到一个与内生变量相关但与误差项不相关的变量作为工具变量,从而通过工具变量的外生性来消除内生性引起的估计偏误。

IV方法的具体步骤如下:1. 识别工具变量:首先需要找到一个与内生变量相关但与误差项不相关的变量作为工具变量。

工具变量的选择要满足两个条件:与内生变量有相关性,与误差项无相关性。

2. 检验工具变量:选择好的工具变量需要经过检验,以确保其满足与内生变量相关但与误差项不相关的要求。

常用的检验方法有Hausman检验和Sargan检验。

3. 使用工具变量进行回归:将选定的工具变量引入回归方程中,通过工具变量的外生性来消除内生性引起的估计偏误。

二、选择合适的工具变量在选择合适的工具变量时,需要考虑以下几个因素:1. 相关性:工具变量应该与内生变量有一定的相关性,才能正确地估计内生变量对因变量的影响。

相关性可以通过计算相关系数来衡量,一般要求相关系数大于0.1。

2. 排除性:工具变量与误差项无相关性,即工具变量不能受到其他未观测到的因素的影响。

排除性通常通过进行统计检验来验证,常用的检验方法有Hausman检验和Sargan检验。

3. 弱工具变量:如果工具变量过弱,即相关系数过小,会导致估计结果的方差增大,同时降低估计的准确性和稳健性。

一般来说,工具变量的F统计量应大于10,同时第一阶段回归的R-squared要大于0.1。

面板数据分析

面板数据分析

总结词
功能强大,易于上手,适合初学者和小型数据 分析任务
01
总结词
操作简便,可视化效果好
03
总结词
适合小型数据量处理
05
02
详细描述
Excel提供了丰富的数据分析工具,如数据透 视表、条件格式、数据筛选等,可以方便地 进行数据清洗、整理和可视化。
04
详细描述
Excel提供了多种图表类型,如柱状图、 折线图、饼图等,可以直观地展示数 据之间的关系和趋势。
详细描述
SQL需要依赖数据库管理系统(DBMS)的支 持,对于没有安装DBMS的计算机无法独立运 行。
06 面板数据分析案例研究
案例一:股票市场面板数据分析
总结词
股票市场数据具有时间序列和横截面两个维 度,通过面板数据分析可以揭示股票价格和 交易量的动态变化,以及不同股票之间的相 互关系。
详细描述
特点
面板数据能够提供更丰富、更全面的 信息,因为它不仅包括每个个体的特 征,还包括这些特征随时间的变化情 况。
面板数据的重要性
提供更准确的估计
提高预测准确性
面板数据可以提供更准确的估计和预 测,因为它考虑了时间和个体效应, 这有助于减少误差和偏差。
面板数据可以用于预测未来的趋势和 结果。通过分析过去的数据,我们可 以建立模型并预测未来的变化。
描述性统计
计算关键变量的均值、中位数、众数、 标准差等统计量,初步了解数据的分 布和特征。
相关性分析
通过计算相关系数或可视化散点图, 探索变量之间的关联性。
数据分布可视化
绘制直方图、箱线图等,直观展示数 据的分布情况。
时间序列趋势分析
通过折线图或柱状图,分析时间序列 数据的趋势和周期性变化。

面板数据模型选择-张晓桐

面板数据模型选择-张晓桐

关系的面板数据研究 案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究 :
个省级地区(不包括重庆、西藏和港澳台地区) 以中国 29 个省级地区(不包括重庆、西藏和港澳台地区)1995-2006 年间 12 年的面板数据来对我国的经济增长与环境问题做出分析, 年的面板数据来对我国的经济增长与环境问题做出分析,所选数据均为平衡 面板数据, 组数据。 其中, RGDP 表示人均国内生产总值 单位: ) 面板数据, 348 组数据。 共 其中, (单位: 元 , SO2 表示工业二氧化硫排放量(单位:吨)。用 BJ、TJ、HEB、SX、NMG、 表示工业二氧化硫排放量(单位: )。用 、 、 、 、 、 LN、JL、HLJ、SH、JS、ZJ、AH、FJ、JX、SD、HEN、HUB、HUN、 、 、 、 、 、 、 、 、 、 、 、 、 、 GD、GX、HAN、SC、GZ、YN、SHX、GS、QH、NX、XJ 分别表示北京、 、 、 、 、 、 、 、 、 、 、 分别表示北京、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安 徽、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、贵 福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、 云南、陕西、甘肃、青海、宁夏、新疆。 州、云南、陕西、甘肃、青海、宁夏、新疆。 各地区 1995-2006 的人均国内生产总值和工业二氧化硫排放量数据均来 中国统计年鉴》。 自于 1996-2007 年《中国统计年鉴》。
关系的面板数据研究 案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究 :
线性混合模型估计结果是 线性混合模型估计结果是 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) ) ) R2 = 0.0005,DW=0.11, N×T= 29×12= 348 , × × 说明二氧化硫排放量 二氧化硫排放量( 人均国内生产总值( 之间不 说明二氧化硫排放量(SO2it, 吨)与人均国内生产总值(RGDPit, 元)之间不 知数据一定非常散。 存在线性关系。 存在线性关系。由可决系数 R2 = 0.0005 知数据一定非常散。 二次多项式混合模型估计结果是 SO2it = 423499.3 + 23.4691 RGDP it - 0.00055 RGDP it 2 (8.0) (3.2) ) ) (-3.3) ) R2 = 0.0315,DW=0.12, N×T= 29×12= 348 , × × 说明二氧化硫排放量 二氧化硫排放量( 人均国内生产总值( 说明二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)有可能存在二 知数据一定非常散。 次非线性关系。 次非线性关系。由可决系数 R2 = 0.0315 知数据一定非常散。 据此就可以建立二次多项式形式的面板数据模型吗 首先分析数据散点图 分析数据散点图。 据此就可以建立二次多项式形式的面板数据模型吗?首先分析数据散点图。

论文写作中的面板数据分析

论文写作中的面板数据分析

论文写作中的面板数据分析面板数据分析在论文写作中扮演着重要的角色。

面板数据是指跨时间和个体的数据集,它允许研究者在多个时间点和多个个体之间进行比较和分析。

本文将探讨面板数据分析在论文写作中的应用,并介绍一些常用的面板数据分析方法。

一、面板数据的特点面板数据具有以下几个特点:1. 时间维度:面板数据包含多个时间点的观测值,可以追踪和比较个体在不同时间点的变化。

2. 个体维度:面板数据包含多个个体的观测值,可以进行跨个体的比较和分析。

3. 个体固定效应:面板数据的个体固定效应是指个体的不可观测的特征或个体特定的影响因素对观测值的影响,可以通过面板数据分析方法进行控制。

二、面板数据的优势面板数据分析相较于截面数据和时间序列数据有以下优势:1. 更有效的利用数据:面板数据可以更充分地利用横向和纵向的信息,提高估计的效率和准确性。

2. 控制个体异质性:面板数据可以通过固定效应模型或随机效应模型控制个体的异质性,避免估计结果的偏误。

3. 分析动态变化:面板数据可以分析个体在时间上的动态变化,研究个体在不同时间点的变化趋势和影响因素。

三、面板数据分析方法在论文写作中,常用的面板数据分析方法包括:1. 固定效应模型:固定效应模型通过引入个体的固定效应控制个体的异质性,适用于个体固定特征对观测值的影响较大的情况。

2. 随机效应模型:随机效应模型通过引入个体的随机效应控制个体的异质性,适用于个体固定特征对观测值的影响较小的情况。

3. 差分法:差分法通过对面板数据进行一阶或高阶的差分,消除个体固定效应,从而探索个体间的变化差异。

4. 合成控制法:合成控制法通过建立一个人工合成的控制组,来研究政策或处理效应。

四、面板数据分析的应用面板数据分析在各个学科和领域中都有广泛的应用,如经济学、管理学、社会学等。

具体应用包括:1. 经济学研究中,可以利用面板数据分析探索不同政策对经济增长的影响,研究企业的投资决策和市场行为等。

2. 管理学研究中,可以利用面板数据分析来研究企业的绩效评估、人力资源管理、创新能力等问题。

面板数据、工具变量选择和HAUSMAN检验的若干问题及在STATA中的实现

面板数据、工具变量选择和HAUSMAN检验的若干问题及在STATA中的实现

面板数据、工具变量选择和HAUSMAN检验的若干问题*第一节关于面板数据PANEL DATA1、面板数据回归为什么好一般而言,面板数据模型的误差项由两部分组成,一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;另外一部分概括了因截面因时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项(事实上这第二部分误差还可分成两部分,一部分是不因截面变化但随时间变化的非观测因素对应的误差项Vt,这一部分一般大家的处理办法是通过在模型中引入时间虚拟变量来加以剥离和控制,另一部分才是因截面因时间而变化的不可观测因素。

不过一般计量经济学的面板数据分析中都主要讨论两部分,在更高级一点的统计学或计量经济学中会讨论误差分量模型,它一般讨论三部分误差)。

非观测效应模型一般根据对时不变非观测效应的不同假设可分为固定效应模型和随机效应模型。

传统上,大家都习惯这样分类:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型。

不过,上述定义不是十分严谨,而且一个非常容易让人产生误解的地方是似乎固定效应模型中的非观测效应是随时间不变的,是固定的,而随机效应模型中的非观测效应则不是固定的,而是随时间变化的。

一个逻辑上比较一致和严谨,并且越来越为大家所接受的假设是(参见Wooldridge的教材和Mundlak1978年的论文),不论固定效应还是随机效应都是随机的,都是概括了那些没有观测到的,不随时间而变化的,但影响被解释变量的因素(尤其当截面个体比较大的时候,这种假设是比较合理的)。

非观测效应究竟应假设为固定效应还是随机效应,关键看这部分不随时间变化的非观测效应对应的因素是否与模型中控制的观测到的解释变量相关,如果这个效应与可观测的解释变量不相关,则这个效应成为随机效应。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

以每个截面观测值为一种符号的面板数据散点图如下(图中把 1995、2001 和 2006 年 数据分别连在一起。):发现二氧化硫排放量(SO2)有逐年增加的趋势。
SO2_BJ SO2_TJ SO2_HEB SO2_SX SO2_NMG SO2_LN SO2_JL SO2_HLJ SO2_SH SO2_JS 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000
800000 so2 700000 600000 500000 400000 300000 200000 rgdp 100000 0 10000 20000 30000 40000 50000 60000
案例 1: 工业 SO2 排放及人均 GDP 关系的面板数据研究
Grossman and Krueger (1991) 用人均收入变化的三类效应来解释该 现象的出现: 经济发展意味着更大规模的经济活动与资源需求量, 因而对环境产生负面的规模效应;但同时经济发展又通过正的技术进 步效应(例如更为环保的新技术的使用)以及结构效应(例如产业结构 的升级与优化) 减少了污染排放、改善了环境质量。因此, 这三类效 应共同决定了环境质量与经济发展之间的这一倒 U 型曲线关系。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
以中国 29 个省级地区(不包括重庆、西藏和港澳台地区)1995-2006 年间 12 年的面板数据来对我国的经济增长与环境问题做出分析,所选数据均为平衡 面板数据, 348 组数据。 共 其中, RGDP 表示人均国内生产总值 (单位: 元) , SO2 表示工业二氧化硫排放量(单位:吨)。用 BJ、TJ、HEB、SX、NMG、 LN、JL、HLJ、SH、JS、ZJ、AH、FJ、JX、SD、HEN、HUB、HUN、 GD、GX、HAN、SC、GZ、YN、SHX、GS、QH、NX、XJ 分别表示北京、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安 徽、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、贵 州、云南、陕西、甘肃、青海、宁夏、新疆。 各地区 1995-2006 的人均国内生产总值和工业二氧化硫排放量数据均来 自于 1996-2007 年《中国统计年鉴》。
SO2_95_06
SO2_95_06F1
2500000 2000000 1500000 1000000 500000 0 -500000 0
SO2_95_06 vs. Polynomial (degree=2) of RGDP
10000
20000
30000 RGDP
40000
50000
60000
线性混合模型的回归直线
SO2_HAN SO2_SC SO2_GZ SO2_YN SO2_SHX SO2_GS SO2_QH SO2_NX SO2_XJ
30000
40000
50000
60000
RGDP_BJ_XJ
从面板数据个体连线散点图看,人均国内生产总值超过 4 万元的只有北京、 天津、上海三个地区。其余 26 个省级地区仍都处于二氧化硫排放量(SO2) 逐年增加的阶段。用倒 U 字曲线拟合是不恰当的。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95_06 vs. Polynomial (degree=3) of RGDP 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000
面板数据模型形式的选择
张晓峒
南开大学数量经济研究所
nkeviews@
面板数据模型形式的选择
张晓峒
【摘要】 面板数据模型除了应用 F 检验和 Hausman 检验确定 应该建立混合模型、固定效应模型还是随机效应模型之外, 如何恰当地选择模型的形式也是一个重要问题。本文运用多 组经济数据展示模型形式的选择过程以及模型形式不合理时 对模型参数估计带来的影响。
案例 2:全国省级地区城镇居民人均食品支出与收入关系研究
5000 food 4000
3000
2000
1000 income 0 0 4000 8000 12000 16000 20000
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
回到线性拟合形式上来。与混合模型 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) R2 = 0.0005,DW=0.11, NT= 2912= 348 相对应,估计个体固定效应模型如下: SO2it = … + 461948.1 + 10.5148 RGDPit (24.2) (5.2) R2 = 0.86,DW=0.79, NT= 2912= 348 从全国平均水平来看,人均国内生产总值(RGDP)每增加 1 元,二氧化硫 排放量(SO2)增加 10.5 吨。从检验结果看应该建立个体固定效应模型。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
线性混合模型估计结果是 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) R2 = 0.0005,DW=0.11, NT= 2912= 348 说明二氧化硫排放量(SO2it, 吨)与人均国内生产总值(RGDPit, 元)之间不 存在线性关系。由可决系数 R2 = 0.0005 知数据一定非常散。 二次多项式混合模型估计结果是 SO2it = 423499.3 + 23.4691 RGDP it - 0.00055 RGDP it 2 (8.0) (3.2) (-3.3) R2 = 0.0315,DW=0.12, NT= 2912= 348 说明二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)有可能存在二 次非线性关系。由可决系数 R2 = 0.0315 知数据一定非常散。 据此就可以建立二次多项式形式的面板数据模型吗?首先分析数据散点图。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95 SO2_96 SO2_97 SO2_98 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000 SO2_99 SO2_00 SO2_01 SO2_02 SO2_03 SO2_04 SO2_05 SO2_06
二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)面板数据散点图。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95_06 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
分析中国二氧化硫排放量(SO2)与人均国内生产总值(RGDP)面板数据的特征。
SO2_95 SO2_96 SO2_97 SO2_98 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000 SO2_99 SO2_00 SO2_01 SO2_02 SO2_03 SO2_04 SO2_05 SO2_06
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
相对应,估计随机效应模型如下: SO2it = … + 465399.6 + 10.1736 RGDPit (6.4) (6.1) R2 = 0.10,DW=0.72, NT= 2912= 348
从检验结果看应该建立个体随机效应模型。如果建立二次多项式模型,预测 将带来很大误差。 本例不应建立倒 U 字模型, 中国目前处于工业化发展阶段, 还没有逾越二氧化硫排放量的最高值。
SO2it = 349806.2+ 41.5645 RGDPit - 0.00156 RGDPit 2 + 1.38 108 RGDPit 2 (4.3) (2.4) (-1.8) (1.2) R2 = 0.035,DW=0.12, NT= 2912= 348
SO2_95_06
面板数据的三次多项式混合模型拟合图(按库兹涅茨曲线假说拟合)。 估计结果显示这种拟合没有显著性,即不存在倒 U 字特征。
SO2_BJ SO2_TJ SO2_HEB SO2_SX SO2_NMG SO2_LN SO2_JL SO2_HLJ SO2_SH SO2_JS 2400000 2000000 1600000 1200000 8ห้องสมุดไป่ตู้0000 400000 0 0 10000 20000
SO2_ZJ SO2_AH SO2_FJ SO2_JX SO2_SD SO2_HEN SO2_HUB SO2_HUN SO2_GD SO2_GX
案例 2: 全国省级地区城镇居民人均食品支出与收入关系研究
28 个省市自治区(不包括西藏、新疆和重庆市)21 年(19852005)共 588 个观 测值。 线性混合模型估计结果是 F1it = 335.84 + 0.2667 I1it (20.6)(88.8) R2 = 0.93,DW=0.15, NT= 2821= 588 线性个体固定效应模型估计结果是 F1it = …+ 374.75 + 0.2577 I1it (26.6)(96.8) R2 = 0.95,DW=0.23, NT= 2821= 588 克服误差项自相关的线性个体固定效应模型估计结果是 F1it = …+ 604.98 + 0.2225 I1it +1.1979AR(1) -0.3620AR(2) (11.8)(34.1) (28.5) (-8.8) R2 = 0.99,DW=2.24, NT= 2821= 532 R2 = 0.99,DW=2.24,一定认为找到了模型的最好估计形式。事实并不是这样。 F1it 和 I1it 的散点图如下:
相关文档
最新文档