空间面板数据分析——R的splm包

（任建辉，暨南大学）

The splm package provides methods for fitting spatial panel data by maximum likelihood and GM.

安装R软件及其编辑器Rstudio

网址：https://www.360docs.net/doc/6d12083505.html,

https://www.360docs.net/doc/6d12083505.html,/

下载好Rstudio以后，操作都可以Rstudio中完成了，包括命令的编写、命令运行、图形展示，最方便的要数查看数据了。

R界面

Rstudio界面，形如matlab

下面进入正题，了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口（studio 左上区域），可以单独的运行每行命令，也可选取一段一起执行，点run按钮。

1、首先，安装splm包并导入，命令如下:

intall.packages(“splm”)，选择最近的下载点

library(splm)

> library(splm)

载入需要的程辑包：MASS

载入需要的程辑包：nlme

载入需要的程辑包：spdep

载入需要的程辑包：sp

载入需要的程辑包：Matrix

载入需要的程辑包：plm

载入需要的程辑包：bdsmatrix

载入程辑包：‘bdsmatrix’

下列对象被屏蔽了from ‘package:base’:

backsolve

载入需要的程辑包：Formula

载入需要的程辑包：sandwich

载入需要的程辑包：zoo

载入程辑包：‘zoo’

下列对象被屏蔽了from ‘package:base’:

as.Date, as.Date.numeric

载入需要的程辑包：spam

载入需要的程辑包：grid

Spam version 0.40-0 (2013-09-11) is loaded.

Type 'help( Spam)' or 'demo( spam)' for a short introduction

and overview of this package.

Help for individual functions is also obtained by adding the

suffix '.spam' to the function name, e.g. 'help( chol.spam)'.

载入程辑包：‘spam’

下列对象被屏蔽了from ‘package:bdsmatrix’:

backsolve

下列对象被屏蔽了from ‘package:base’:

backsolve, forwardsolve

载入需要的程辑包：ibdreg

载入需要的程辑包：car

载入需要的程辑包：lmtest

载入需要的程辑包：Ecdat

载入程辑包：‘Ecdat’

下列对象被屏蔽了from ‘package:car’:

Mroz

下列对象被屏蔽了from ‘package:nlme’:

Gasoline

下列对象被屏蔽了from ‘package:MASS’:

SP500

下列对象被屏蔽了from ‘package:datasets’:

Orange

载入需要的程辑包：maxLik

载入需要的程辑包：miscTools

Please cite the 'maxLik' package as:

Henningsen, Arne and Toomet, Ott (2011). maxLik: A package for maximum likelih ood estimation in R. Computational Statistics 26(3), 443-458. DOI 10.1007/s001 80-010-0217-1.

If you have questions, suggestions, or comments regarding the 'maxLik' package, please use a forum or 'tracker' at maxLik's R-Forge site:

https://https://www.360docs.net/doc/6d12083505.html,/projects/maxlik/

Warning message:

程辑包‘Matrix’是用R版本3.0.3 来建造的

注意：在导入splm时，如果发现还有其他配套的包没有安装，需要先安装。

2、接着，查看数据及结构，命令如下：

data(Produc,package=”Ecdat”)

View(Produc)

3、引入空间权重矩阵（spatial weights matrix），命令如下data(usaww)

Views(usaww)

4、空间面板数据的广义矩估计，命令spgm

GM<-spgm(log(gsp)~log(pcap)+log(pc)+log(emp)+unemp, data=Produc,

listw=usaww, moments=”fullweights”, spatial.error=TRUE) summary(GM)

> GM<-spgm(log(gsp)~log(pcap)+log(pc)+log(emp)+unemp,data=Produc,

+ listw=usaww,moments="fullweights",spatial.error=TRUE)

> summary(GM)

Spatial panel fixed effects GM model

Call:

spgm(formula = log(gsp) ~ log(pcap) + log(pc) + log(emp) + unemp,

data = Produc, listw = usaww, spatial.error = TRUE, moments = "fullweights ")

Residuals:

Min. 1st Qu. Median 3rd Qu. Max.

-0.14000 -0.01950 -0.00316 0.01530 0.16800

Estimated spatial coefficient, variance components and theta:

Estimate

rho 0.3277625

sigma^2_v 0.0012179

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

log(pcap) -0.0022435 0.0262646 -0.0854 0.9319295

log(pc) 0.2414979 0.0235826 10.2405 < 2.2e-16 ***

log(emp) 0.7813276 0.0283855 27.5256 < 2.2e-16 ***

unemp -0.0036026 0.0010094 -3.5691 0.0003582 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

5、空间面板极大似然估计，命令spml

fm<- log(gsp)~log(pcap)+log(pc)+log(emp)+unemp

## fixed effects panel with spatial errors

Fespaterr<-spml(fm,data=Produc,listw=mat2listw(usaww),model=”within”,

spatial.error=”b”,hess=FALSE)

summary(Fespaterr)

> fm<-log(gsp)~log(pcap)+log(pc)+log(emp)+unemp

> Fespaterr<-spml(fm,data=Produc,listw=mat2listw(usaww),model="within",

+ spatial.error="b",hess=FALSE)

> summary(Fespaterr)

Spatial panel fixed effects error model

Call:

spml(formula = fm, data = Produc, listw = mat2listw(usaww), model = "within", spatial.error = "b", hess = FALSE)

Residuals:

Min. 1st Qu. Median 3rd Qu. Max.

-0.1250 -0.0238 -0.0035 0.0171 0.1880

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

rho 0.5574013 0.0329554 16.9138 < 2e-16 ***

log(pcap) 0.0051438 0.0250724 0.2052 0.83745

log(pc) 0.2053026 0.0231996 8.8494 < 2e-16 ***

log(emp) 0.7822540 0.0278741 28.0638 < 2e-16 ***

unemp -0.0022317 0.0010735 -2.0788 0.03764 *

---

S ignif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

##random effects panal with spatial lag

Respatlag<-spml(fm,data=Produc,listw=mat2listw(usaww),model=”random”,

spatial.error=”none”,lag=TRUE)

summary(Respatlag)

> Respatlag<-spml(fm,data=Produc,listw=mat2listw(usaww),model="random",

+ spatial.error="none",lag=TRUE)

> summary(Respatlag)

Spatial panel random effects ML model

Call:

spreml(formula = formula, data = data, index = index, w = listw2mat(listw), w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)

Residuals:

Min. 1st Qu. Median Mean 3rd Qu. Max.

1.38 1.57 1.70 1.70 1.80

2.13

Error variance parameters:

Estimate Std. Error t-value Pr(>|t|)

phi 21.3175 8.3017 2.5678 0.01023 *

Spatial autoregressive coefficient:

Estimate Std. Error t-value Pr(>|t|)

lambda 0.161615 0.029099 5.554 2.793e-08 ***

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

(Intercept) 1.65814995 0.15071855 11.0016 < 2.2e-16 ***

log(pcap) 0.01294505 0.02493997 0.5190 0.6037

log(pc) 0.22555376 0.02163422 10.4258 < 2.2e-16 ***

log(emp) 0.67081075 0.02642113 25.3892 < 2.2e-16 ***

unemp -0.00579716 0.00089175 -6.5009 7.984e-11 ***

---

S ignif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

6、伴有随机效应和序列误差相关的空间面板模型的极大似然估计，命令speml

##random effects panel with spatial lag and serial error correlation

##optimization method set to “BFGS“

Sarsrmod<-spreml(fm,data=Froduc,w=usaww,error=”sr”,lag=TRUE,method=”BFGS”) summary(Sarsrmod)

> Sarsrmod<-spreml(fm,data=Produc,w=usaww,error="sr",lag=TRUE,method="BFGS") > summary(Sarsrmod)

Spatial panel random effects ML model

Call:

spreml(formula = fm, data = Produc, w = usaww, lag = TRUE, errors = "sr",

method = "BFGS")

Residuals:

Min. 1st Qu. Median Mean 3rd Qu. Max.

2.66

3.02 3.18 3.18 3.31 3.77

Error variance parameters:

Estimate Std. Error t-value Pr(>|t|)

psi 0.99726353 0.00082138 1214.1 < 2.2e-16 ***

Spatial autoregressive coefficient:

Estimate Std. Error t-value Pr(>|t|)

lambda 0.302942 0.030376 9.973 < 2.2e-16 ***

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

(Intercept) 1.23670293 0.22777554 5.4295 5.652e-08 ***

log(pcap) 0.08257977 0.03617371 2.2829 0.02244 *

log(pc) 0.01509919 0.01977324 0.7636 0.44510

log(emp) 0.73882021 0.02934144 25.1801 < 2.2e-16 ***

unemp -0.00270962 0.00065851 -4.1148 3.875e-05 ***

---

Signi f. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

7、模型检验

（1）bsjktest，Baltigi,Song,Jung, and Koh LM test for spatial panels

> bsjktest(fm, data=Produc, listw = usaww, test="C.1")

Baltagi, Song, Jung and Koh C.1 conditional test

data: log(gsp) ~ log(pcap) + log(pc) + log(emp) + unemp

LM = 0.2617, df = 1, p-value = 0.609

alternative hypothesis: spatial dependence in error terms, sub RE and serial c orr.

（2）bsktest，Baltigi,Song and Koh LM test for spatial panels

> bsktest(fm,data=Produc, listw = mat2listw(usaww),

+ test="LM1", standardize=TRUE)

Baltagi, Song and Koh SLM1 marginal test

data: log(gsp) ~ log(pcap) + log(pc) + log(emp) + unemp

SLM1 = 0.083, p-value = 0.9338

alternative hypothesis: Random effects

（3）Covariance extractor method for splm objects

> sarremod<-spml(fm,data=Produc,listw=mat2listw(usaww),model="random",

+ lag=TRUE,spatial.error="none")

> library(lmtest)

> coeftest(sarremod)

z test of coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 1.65814995 0.15071855 11.0016 < 2.2e-16 ***

log(pcap) 0.01294505 0.02493997 0.5190 0.6037

log(pc) 0.22555376 0.02163422 10.4258 < 2.2e-16 ***

log(emp) 0.67081075 0.02642113 25.3892 < 2.2e-16 ***

unemp -0.00579716 0.00089175 -6.5009 7.984e-11 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> library(car)

> lht(sarremod,"log(pcap)=log(pc)")

Linear hypothesis test

Hypothesis:

log(pcap) - log(pc) = 0

Model 1: restricted model

Model 2: function (x, ...)

UseMethod("formula")

Df Chisq Pr(>Chisq)

2 1 36.268 1.719e-09 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(更多详情请查看splm的help文档以及文后列的参考文献)

参考文献

1.Baltagi,B.H.,Song,S.H.,Jung B. and Koh, W.(2007) Testing panel data regression models with spatial and serial error correlation. Journal of Econometrics,140,5-51

2.Baltagi,B.H.,Song,S.H and Koh, W.(2003) Testing panel data regression models with spatial error correlation. Journal of Econometrics,117,123-150

https://www.360docs.net/doc/6d12083505.html,lo,G.,Piras,G.(2012) splm:Spatial Panel Data Models in R. Journal of Statistical Software,47(1),1-38.URL https://www.360docs.net/doc/6d12083505.html,/v47/i01/

4.Elhorst, J.P (2003) Specification and estimation of spatial panel data models, International

Regional Science Review,26,pages 244-268

5.Elhorst, J.P(2009) Spatial panel data models, In Fisher,M.M. and Getis,A.(eds),Handbook of Applied Spatial Analysis Springer,Berlin

6.Giovanni Millo and Gaetano Carmeci,(2011) “Non-life insurance consumption in Italy: a subregional panel data analysis”, Journal of Geographical Systems,13:273-298

7.Qu Feng and William C. Horrace,(2012)”Alternative Measures of Technical Efficiency :Skew,Bias and Scale”, Journal of Applied Econometrics, Forthcoming.

8.Kapoor,M.,Kelejian,H.H. and Prucha,I.R.(2007) Panel data model with spatially correlated error components,Journal of Econometrics,140,pages 97-130

9.Mutl,J.,and Pfaffermayr,M.(2011) The Hausman test in a Cliff and Ord panel model,Econometrics Journal,14,pages 48-76

10.Kelejian,H.H. and Prucha,I.R.(1999) A Generalied Moments Estimator for the Autoregressive Parameter in a Spatial Model, International Economic Reviews,40, pages509-533

11. Kelejian,H.H. and Prucha,I.R.(1999) A Generalied Spatial Two Stage Least Square Procedure for Estimating a Spatial Autoregressive Model with Autoregressive Disturbances,Journal of Real Estate Finance and Economics,17,pages99-122

https://www.360docs.net/doc/6d12083505.html,lo,G.(2013) Maximum likelihood estimation of spatially and serially correlated panel with random effects. Computational Statistics and Data Analysis, forthcoming.

13.Zeileis,A(2006)Object-Oriented Computation of Sandwich Estimators. Journal of Statistical Software,16(9),1-16

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项（面板单位根检验—面板协整—回归分析）面板数据分析方法：面板单位根检验—若为同阶—面板协整—回归分析 —若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小，固定效应模型为误差项和解释变量是相关，而随机效应模型表现为误差项和解释变量不相关。先用hausman检验是fixed 还是random，面板数据R-squared值对于一般标准而言，超过0.3为非常优秀的模型。不是时间序列那种接近0.8为优秀。另外，建议回归前先做stationary。很想知道随机效应应该看哪个R方？很多资料说固定看within，随机看overall，我得出的overall非常小0.03，然后within是53%。fe和re输出差不多，不过hausman检验不能拒绝，所以只能是re。该如何选择呢？步骤一：分析数据的平稳性（单位根检验）按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归，尽管有较高的R平方，但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归（spurious regression）。他认为平稳的真正含义是：一个时间序列剔除了不变的均值（可视为截距）和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和（或）截距项，从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述：在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al.(2002)的改进,提出了检验面板单位根的LLC法。Levin et al.(2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25～250之间,截面数介于10～250之间)的面板单位根检验。Im et al.(1997)还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。由上述综述可知，可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进行面板单位根检验。其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin&Chu t*

16种常用数据分析方法

一、描述统计描述性统计是指运用制表和分类，图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充：常用方法：剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验：很多统计方法都要求数值服从或近似服从正态分布，所以之前需要进行正态性检验。常用方法：非参数检验的K-量检验、P-P图、Q-Q图、W 检验、动差法。二、假设检验 1、参数检验参数检验是在已知总体分布的条件下（一股要求总体服从正态分布）对一些主要的参数（如均值、百分数、方差、相关系数等）进行的检验。 1）U验使用条件：当样本含量n较大时，样本值符合正态分布 2）T检验使用条件：当样本含量n较小时，样本值符合正态分布 A 单样本t检验：推断该样本来自的总体均数卩与已知的某一总体均数卩0 （常为理论值或标准值）有无差别； B 配对样本t 检验：当总体均数未知时，且两个样本可以配对，同对中的两者在可能会影响处理效果的各种条件方面扱为相似； C 两独立样本t 检验：无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验非参数检验则不考虑总体分布是否已知，常常也不是针对总体参数，而是针对总体的某些一股性假设（如总体分布的位罝是否相同，总体分布是否正态）进行检验。适用情况：顺序类型的数据资料，这类数据的分布形态一般是未知的。 A 虽然是连续数据，但总体分布形态未知或者非正态； B 体分布虽然正态，数据也是连续类型，但样本容量极小，如10 以下；主要方法包括：卡方检验、秩和检验、二项检验、游程检验、K-量检验等。三、信度分析检査测量的可信度，例如调查问卷的真实性。分类： 1、外在信度：不同时间测量时量表的一致性程度，常用方法重测信度 2、内在信度；每个量表是否测量到单一的概念，同时组成两表的内在体项一致性如何，常用方法分半信度。四、列联表分析用于分析离散变量或定型变量之间是否存在相关。对于二维表，可进行卡方检验，对于三维表，可作Mentel-Hanszel 分层分析列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。五、相关分析研究现象之间是否存在某种依存关系，对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关：两个因素之间的相关关系叫单相关，即研究时只涉及一个自变量和一个因变量； 2、复相关：三个或三个以上因素的相关关系叫复相关，即研究时涉及两个或两个以

面板数据分析简要步骤与注意事项面板单位根面板协整回归分析

面板数据分析简要步骤与注意事项面板单位根—面板协整—回归分析) 步骤一：分析数据的平稳性(单位根检验) 按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归，尽管有较高的R平方，但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归( spurious regression )。他认为平稳的真正含义是：一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项，从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述：在非平稳的面板数据渐进过程中 ,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布 , 这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002) 的改进, 提出了检验面板单位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋势，异方差和高阶序列相关，适合于中等维度(时间序列介于25?250之间，截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的 IPS 法, 但 Breitung(2000) 发现 IPS 法对限定性趋势的设定极为敏感 , 并提出了面板单位根检验的 Breitung 法。Maddala and Wu(1999)又提出了 ADF-Fisher 和 PP-Fisher 面板单位根检验方法。由上述综述可知，可以使用 LLC、IPS、Breintung 、ADF-Fisher 和 PP-Fisher5 种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS、H-Z 分别指 Levin, Lin & Chu t* 统计量、 Breitung t 统计量、 lm Pesaran & Shin W 统量、计 ADF- Fisher Chi-square 统计量、PP-Fisher Chi-square 统计量、Hadri Z 统计量，并且 Levin, Lin & Chu t* 统计量、 Breitung t 统计量的原假设为存在普通的单位根过程， lm Pesaran & Shin W 统计量、 ADF- Fisher Chi-square 统计量、 PP-Fisher Chi-square 统计量的原假设为存在有效的单位根过程， Hadri Z 统计量的检验原假设为不存在普通的单位根过程。有时，为了方便，只采用两种面板数据单位根检验方法，即相同根单位根检验 LLC(Levin-Lin-Chu )检验和不同根单位根检验 Fisher-ADF 检验(注：对普通序列(非面板序列)的单位根检验方法则常用 ADF检验)，如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的，反之则不平稳。如果我们以 T(trend )代表序列含趋势项，以 I (intercept )代表序列含截距项， T&I 代表两项都含，N (none)代表两项都不含，那么我们可以基于前面时序图得出的结论，在单位根检验中选择相应检验模式。但基于时序图得出的结论毕竟是粗略的，严格来说，那些检验结构均需一一检验。具体操作可以参照李子奈的说法：ADF检验是通过三个模型来完成，首先从含有截距和趋势项的模型开始，再检验只含截距项的模型，最后检验二者都不含的模型。并且认

数据分析软件和工具

以下是我在近三年做各类计量和统计分析过程中感受最深的东西，或能对大家有所帮助。当然，它不是ABC的教程，也不是细致的数据分析方法介绍，它只是“总结”和“体会”。由于我所学所做均甚杂，我也不是学统计、数学出身的，故本文没有主线，只有碎片，且文中内容仅为个人观点，许多论断没有数学证明，望统计、计量大牛轻拍。于我个人而言，所用的数据分析软件包括EXCEL、SPSS、STATA、EVIEWS。在分析前期可以使用EXCEL进行数据清洗、数据结构调整、复杂的新变量计算（包括逻辑计算）；在后期呈现美观的图表时，它的制图制表功能更是无可取代的利器；但需要说明的是，EXCEL毕竟只是办公软件，它的作用大多局限在对数据本身进行的操作，而非复杂的统计和计量分析，而且，当样本量达到“万”以上级别时，EXCEL的运行速度有时会让人抓狂。 SPSS是擅长于处理截面数据的傻瓜统计软件。首先，它是专业的统计软件，对“万”甚至“十万”样本量级别的数据集都能应付自如；其次，它是统计软件而非专业的计量软件，因此它的强项在于数据清洗、描述统计、假设检验（T、F、卡方、方差齐性、正态性、信效度等检验）、多元统计分析（因子、聚类、判别、偏相关等）和一些常用的计量分析（初、中级计量教科书里提到的计量分析基本都能实现），对于复杂的、前沿的计量分析无能为力；第三，SPSS主要用于分析截面数据，在时序和面板数据处理方面功能了了；最后，SPSS兼容菜单化和编程化操作，是名副其实的傻瓜软件。 STATA与EVIEWS都是我偏好的计量软件。前者完全编程化操作，后者兼容菜单化和编程化操作；虽然两款软件都能做简单的描述统计，但是较之 SPSS差了许多；STATA与EVIEWS都是计量软件，高级的计量分析能够在这两个软件里得到实现；STATA的扩展性较好，我们可以上网找自己需要的命令文件（.ado文件），不断扩展其应用，但EVIEWS 就只能等着软件升级了；另外，对于时序数据的处理，EVIEWS较强。综上，各款软件有自己的强项和弱项，用什么软件取决于数据本身的属性及分析方法。EXCEL适用于处理小样本数据，SPSS、 STATA、EVIEWS可以处理较大的样本；EXCEL、SPSS适合做数据清洗、新变量计算等分析前准备性工作，而STATA、EVIEWS在这方面较差；制图制表用EXCEL；对截面数据进行统计分析用SPSS，简单的计量分析SPSS、STATA、EVIEWS可以实现，高级的计量分析用 STATA、EVIEWS，时序分析用EVIEWS。关于因果性做统计或计量，我认为最难也最头疼的就是进行因果性判断。假如你有A、B两个变量的数据，你怎么知道哪个变量是因（自变量），哪个变量是果（因变量）？早期，人们通过观察原因和结果之间的表面联系进行因果推论，比如恒常会合、时间顺序。但是，人们渐渐认识到多次的共同出现和共同缺失可能是因果关系，也可能是由共同的原因或其他因素造成的。从归纳法的角度来说，如果在有A的情形下出现B，没有A的情形下就没有B，那么A很可能是B的原因，但也可能是其他未能预料到的因素在起作用，所以，在进行因果判断时应对大量的事例进行比较，以便提高判断的可靠性。有两种解决因果问题的方案：统计的解决方案和科学的解决方案。统计的解决方案主要指运用统计和计量回归的方法对微观数据进行分析，比较受干预样本与未接受干预样本在效果指标（因变量）上的差异。需要强调的是，利用截面数据进行统计分析，不论是进行均值比较、频数分析，还是方差分析、相关分析，其结果只是干预与影响效果之间因果关系成立的必要条件而非充分条件。类似的，利用截面数据进行计量回归，所能得到的最多也只是变量间的数量关系；计量模型中哪个变量为因变量哪个变量为自变量，完全出于分析者根据其他考虑进行的预设，与计量分析结果没有关系。总之，回归并不意味着因果关系的成立，因果关系的判定或推断必须依据经过实践检验的相关理论。虽然利用截面数据进行因果判断显得勉强，但如果研究者掌握了时间序列数据，因果判断仍有可为，其

空间分析复习重点

空间分析的概念空间分析：是基于地理对象的位置和形态特征的空间数据分析技术，其目的在于提取和传输空间信息。包括空间数据操作、空间数据分析、空间统计分析、空间建模。空间数据的类型空间点数据、空间线数据、空间面数据、地统计数据属性数据的类型名义量、次序量、间隔量、比率量属性：与空间数据库中一个独立对象（记录）关联的数据项。属性已成为描述一个位置任何可记录特征或性质的术语。空间统计分析陷阱1）空间自相关：“地理学第一定律”—任何事物都是空间相关的，距离近的空间相关性大。空间自相关破坏了经典统计当中的样本独立性假设。避免空间自相关所用的方法称为空间回归模型。2）可变面元问题MAUP：随面积单元定义的不同而变化的问题，就是可变面元问题。其类型分为：①尺度效应：当空间数据经聚合而改变其单元面积的大小、形状和方向时，分析结果也随之变化的现象。②区划效应：给定尺度下不同的单元组合方式导致分析结果产生变化的现象。3）边界效应：边界效应指分析中由于实体向一个或多个边界近似时出现的误差。生态谬误在同一粒度或聚合水平上，由于聚合方式的不同或划区方案的不同导致的分析结果的变化。（给定尺度下不同的单元组合方式）空间数据的性质空间数据与一般的属性数据相比具有特殊的性质如空间相关性，空间异质性，以及有尺度变化等引起的MAUP效应等。一阶效应：大尺度的趋势，描述某个参数的总体变化性；二阶效应：局部效应，描述空间上邻近位置上的数值相互趋同的倾向。空间依赖性：空间上距离相近的地理事物的相似性比距离远的事物的相似性大。空间异质性：也叫空间非稳定性，意味着功能形式和参数在所研究的区域的不同地方是不一样的，但是在区域的局部，其变化是一致的。 ESDA是在一组数据中寻求重要信息的过程，利用EDA技术，分析人员无须借助于先验理论或假设，直接探索隐藏在数据中的关系、模式和趋势等，获得对问题的理解和相关知识。常见EDA方法：直方图、茎叶图、箱线图、散点图、平行坐标图主题地图的数据分类问题等间隔分类；分位数分类：自然分割分类。空间点模式：根据地理实体或者时间的空间位置研究其分布模式的方法。茎叶图：单变量、小数据集数据分布的图示方法。优点是容易制作，让阅览者能很快抓住变量分布形状。缺点是无法指定图形组距，对大型资料不适用。茎叶图制作方法：①选择适当的数字为茎，通常是起首数字，茎之间的间距相等；②每列标出所有可能叶的数字，叶子按数值大小依次排列；③由第一行数据，在对应的茎之列，顺序记录茎后的一位数字为叶，直到最后一行数据，需排列整齐（叶之间的间隔相等）。箱线图&五数总结箱线图也称箱须图需要五个数，称为五数总结：①最小值②下四分位数：Q1③中位数④上四分位数：Q3⑤最大值。分位数差：IQR = Q3 - Q1 3密度估计是一个随机变量概率密度函数的非参数方法。应用不同带宽生成的100个服从正态分布随机数的核密度估计。空间点模式：一般来说，点模式分析可以用来描述任何类型的事件数据。因为每一事件都可以抽象化为空间上的一个位置点。空间模式的三种基本分布：1）随机分布：任何一点在任何一个位置发生的概率相同，某点的存在不影响其它点的分布。又称泊松分布

面板数据分析步骤

转载：面板数据分析的思路和Eviews操作：面板数据一般有三种：混合估计模型；随机效应模型和固定效应模型。首先，第一步是作固定效应和随机效应模型的选择，一般是用Hausman检验。如果你选用的是所有的企业，反映的是总体的效应，则选择固定效应模型，如果你选用的是抽样估计，则要作Hausman检验。这个可以在Eviews 5.1里头做。 H0：应该建立随机效应模型。 H1：应该建立固定效应模型。先使用随机效应回归，然后做Hausman检验，如果是小概率事件，拒绝原假设则应建立固定效应模型，反之，则应该采用随机效应模型进行估计。第二步，固定效应模型分为三种：个体固定效应模型、时刻固定效应模型和个体时刻固定效应模型（这三个模型的含义我就不讲了，大家可以参考我列的参考书）。如果我们是对个体固定，则应选择个体固定效用模型。但是，我们还需作个体固定效应模型和混合估计模型的选择。所以，就要作F值检验。相对于混合估计模型来说，是否有必要建立个体固定效应模型可以通过F检验来完成。 H0：对于不同横截面模型截距项相同（建立混合估计模型）。SSEr H1：对于不同横截面模型的截距项不同（建立时刻固定效应模型）。SSEu

F统计量定义为：F=[( SSEr - SSEu)/(T+k－2)]/[ SSEu/(NT-T-k)] 其中，SSEr，SSEu分别表示约束模型（混合估计模型的）和非约束模型（个体固定效应模型的）的残差平方和（Sum squared resid）。非约束模型比约束模型多了T–1个被估参数。需要指出的是：当模型中含有k 个解释变量时，F统计量的分母自由度是NT-T- k。通过对F统计量我们将可选择准确、最佳的估计模型。在作回归是也是四步：第一步，先作混合效应模型：在cross-section 一栏选择None ，Period也是None；Weights是cross-section Weights，然后把回归结果的Sum squared resid值复制出来，就是SSEr 第二步：作个体固定效用模型：在cross-section 一栏选择Fixed ，Period也是None；Weights是cross-section Weights，然后把回归结果的Sum squared resid值复制出来，就是SSEu 第三步：根据公式F=[( SSEr - SSEu)/(T+k－2)]/[ SSEu/(NT-T-k)]。计算出结果。其中，T为年数，不管我们的数据是unbalance还是balance 看observations就行了，也即Total pool (balanced) observations:的值，但是如果是balance我们也可以计算，也即是每一年的企业数的总和。比如说我们研究10年，每一年又500加企业，则NT＝10×500＝5000。K为解释变量，不含被解释变量。第四步，根据计算出来的结果查F值分布表。看是否通过检验。检验准则：当F> Fα(T-1, NT-T-k) , α=0.01,0.05或0.1时，拒绝原假设，则结论是应该建立个体固定效应模型，反之，接受原假设，则不能建立个体固定效应模型。

eviews面板数据实例分析

1、已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)与人均收入(ip,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume)与人均收入(income)数据以及消费者价格指数(p)分别见表9、1,9、2与9、3。表9、1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607、43 3693、55 3777、41 3901、81 4232、98 4517、65 4736、52 CONSUMEBJ 5729、52 6531、81 6970、83 7498、48 8493、49 8922、72 10284、6 CONSUMEFJ 4248、47 4935、95 5181、45 5266、69 5638、74 6015、11 6631、68 CONSUMEHB 3424、35 4003、71 3834、43 4026、3 4348、47 4479、75 5069、28 CONSUMEHLJ 3110、92 3213、42 3303、15 3481、74 3824、44 4192、36 4462、08 CONSUMEJL 3037、32 3408、03 3449、74 3661、68 4020、87 4337、22 4973、88 CONSUMEJS 4057、5 4533、57 4889、43 5010、91 5323、18 5532、74 6042、6 CONSUMEJX 2942、11 3199、61 3266、81 3482、33 3623、56 3894、51 4549、32 CONSUMELN 3493、02 3719、91 3890、74 3989、93 4356、06 4654、42 5342、64 CONSUMENMG 2767、84 3032、3 3105、74 3468、99 3927、75 4195、62 4859、88 CONSUMESD 3770、99 4040、63 4143、96 4515、05 5022 5252、41 5596、32 CONSUMESH 6763、12 6819、94 6866、41 8247、69 8868、19 9336、1 10464 CONSUMESX 3035、59 3228、71 3267、7 3492、98 3941、87 4123、01 4710、96 CONSUMETJ 4679、61 5204、15 5471、01 5851、53 6121、04 6987、22 7191、96 CONSUMEZJ 5764、27 6170、14 6217、93 6521、54 7020、22 7952、39 8713、08 表9、2 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512、77 4599、27 4770、47 5064、6 5293、55 5668、8 6032、4 INCOMEBJ 7332、01 7813、16 8471、98 9182、76 10349、69 11577、78 12463、92 INCOMEFJ 5172、93 6143、64 6485、63 6859、81 7432、26 8313、08 9189、36 INCOMEHB 4442、81 4958、67 5084、64 5365、03 5661、16 5984、82 6679、68 INCOMEHLJ 3768、31 4090、72 4268、5 4595、14 4912、88 5425、87 6100、56 INCOMEJL 3805、53 4190、58 4206、64 4480、01 4810 5340、46 6260、16 INCOMEJS 5185、79 5765、2 6017、85 6538、2 6800、23 7375、1 8177、64 INCOMEJX 3780、2 4071、32 4251、42 4720、58 5103、58 5506、02 6335、64 INCOMELN 4207、23 4518、1 4617、24 4898、61 5357、79 5797、01 6524、52 INCOMENMG 3431、81 3944、67 4353、02 4770、53 5129、05 5535、89 6051 INCOMESD 4890、28 5190、79 5380、08 5808、96 6489、97 7101、08 7614、36 INCOMESH 8178、48 8438、89 8773、1 10931、64 11718、01 12883、46 13249、8 INCOMESX 3702、69 3989、92 4098、73 4342、61 4724、11 5391、05 6234、36 INCOMETJ 5967、71 6608、39 7110、54 7649、83 8140、5 8958、7 9337、56 INCOMEZJ 6955、79 7358、72 7836、76 8427、95 9279、16 10464、67 11715、6 表9、3 1996—2002年中国东北、华北、华东15个省级地区的消费者物价指数物价指数1996 1997 1998 1999 2000 2001 2002 PAH 109、9 101、3 100 97、8 100、7 100、5 99

面板数据的分析步骤

面板数据的分析步骤面板数据的分析方法或许我们已经了解许多了，但是到底有没有一个基本的步骤呢？那些步骤是必须的？这些都是我们在研究的过程中需要考虑的，而且又是很实在的问题。面板单位根检验如何进行？协整检验呢？什么情况下要进行模型的修正？面板模型回归形式的选择？如何更有效的进行回归？诸如此类的问题我们应该如何去分析并一一解决？以下是我近期对面板数据研究后做出的一个简要总结，和大家分享一下，也希望大家都进来讨论讨论。步骤一：分析数据的平稳性（单位根检验）按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归，尽管有较高的R平方，但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归（spurious regression）。他认为平稳的真正含义是：一个时间序列剔除了不变的均值（可视为截距）和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和（或）截距项，从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述：在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25～250 之间,截面数介于10～250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。由上述综述可知，可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square 统计量、Hadri Z统计量，并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程，lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程，Hadri Z统计量的检验原假设为不存在普通的单位根过程。有时，为了方便，只采用两种面板数据单位根检验方法，即相同根单位根检验LLC （Levin-Lin-Chu）检验和不同根单位根检验Fisher-ADF检验（注：对普通序列（非面板序列）的单位根检验方法则常用ADF检验），如果在两种检验中均拒绝存在单位根的原假设则我们

基于面板数据模型及其固定效应的模型分析

基于面板数据模型及其固定效应的模型分析在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现,使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而

空间数据分析模型

第7 章空间数据分析模型 7.1 空间数据按照空间数据的维数划分，空间数据有四种基本类型：点数据、线数据、面数据和体数据。点是零维的。从理论上讲，点数据可以是以单独地物目标的抽象表达，也可以是地理单元的抽象表达。这类点数据种类很多，如水深点、高程点、道路交叉点、一座城市、一个区域。线数据是一维的。某些地物可能具有一定宽度，例如道路或河流，但其路线和相对长度是主要特征，也可以把它抽象为线。其他的线数据，有不可见的行政区划界，水陆分界的岸线，或物质运输或思想传播的路线等。面数据是二维的，指的是某种类型的地理实体或现象的区域范围。国家、气候类型和植被特征等，均属于面数据之列。真实的地物通常是三维的，体数据更能表现出地理实体的特征。一般而言，体数据被想象为从某一基准展开的向上下延伸的数，如相对于海水面的陆地或水域。在理论上，体数据可以是相当抽象的，如地理上的密度系指单位面积上某种现象的许多单元分布。在实际工作中常常根据研究的需要，将同一数据置于不同类别中。例如，北京市可以看作一个点（区别于天津），或者看作一个面（特殊行政区，区别于相邻地区），或者看作包括了人口的“体”。 7.2 空间数据分析空间数据分析涉及到空间数据的各个方面，与此有关的内容至少包括四个领域。 1）空间数据处理。空间数据处理的概念常出现在地理信息系统中，通常指的是空间分析。就涉及的内容而言，空间数据处理更多的偏重于空间位置及其关系的分析和管理。 2）空间数据分析。空间数据分析是描述性和探索性的，通过对大量的复杂数据的处理来实现。在各种空间分析中，空间数据分析是重要的组成部分。空间数据分析更多的偏重于具有空间信息的属性数据的分析。 3）空间统计分析。使用统计方法解释空间数据，分析数据在统计上是否是“典型”的，或“期望”的。与统计学类似，空间统计分析与空间数据分析的内容往往是交叉的。 4）空间模型。空间模型涉及到模型构建和空间预测。在人文地理中，模型用来预测不同地方的人流和物流，以便进行区位的优化。在自然地理学中，模型可能是模拟自然过程的空间分异与随时间的变化过程。空间数据分析和空间统计分析是建立空间模型的基础。 7.3 空间数据分析的一些基本问题空间数据不仅有其空间的定位特性，而且具有空间关系的连接属性。这些属性主要表现为空间自相关特点和与之相伴随的可变区域单位问题、尺度和边界效应。传统的统计学方法在对数据进行处理时有一些基本的假设，大多都要求“样本是随机的”，但空间数据可能不一定能满足有关假设，因此，空间数据的分析就有其特殊性（David,2003）。

面板数据分析方法步骤

1.面板数据分析方法步骤面板数据的分析方法或许我们已经了解许多了，但是到底有没有一个基本的步骤呢？那些步骤是必须的？这些都是我们在研究的过程中需要考虑的，而且又是很实在的问题。面板单位根检验如何进行？协整检验呢？什么情况下要进行模型的修正？面板模型回归形式的选择？如何更有效的进行回归？诸如此类的问题我们应该如何去分析并一一解决？以下是我近期对面板数据研究后做出的一个简要总结，和大家分享一下，也希望大家都进来讨论讨论。步骤一：分析数据的平稳性（单位根检验）按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归，尽管有较高的R平方，但其结果是没有任何实际意义的。这种情况称为虚假回归或伪回归（spurious regression）。他认为平稳的真正含义是：一个时间序列剔除了不变的均值（可视为截距）和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和（或）截距项，从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述：在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25～250 之间,截面数介于10～250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。由上述综述可知，可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、

实证研究论文数据分析方法详解

修订日：2010.12.8实证论文数据分析方法详解（周健敏整理）名称变量类型在SPSS软件中的简称（自己设定的代号）变革型领导自变量1 zbl1 交易型领导自变量2 zbl2 回避型领导自变量3 zbl3 认同和内部化调节变量 TJ 领导成员交换中介变量 ZJ 工作绩效因变量 YB 调节变量：如果自变量与因变量的关系是变量M的函数，称变量M为调节变量。也就是, 领导风格（自变量）与工作绩效（因变量）的关系受到组织认同（调节变量）的影响，或组织认同（调节变量）在领导风格（自变量）对工作绩效（因变量）影响关系中起到调节作用。具体来说，对于组织认同高的员工，变革型领导对工作绩效的影响力，要高于组织认同低的员工。中介变量：如果自变量通过影响变量N 来实现对因变量的影响，则称N 为中介变量。也就是，领导风格（自变量）对工作绩效（因变量）影响作用是通过领导成员交换（中介变量）的中介而产生的。研究思路及三个主要部分组成：（1）领导风格对于员工工作绩效的主效应（Main Effects）研究。（2）组织认同对于不同领导风格与员工工作绩效之间关系的调节效应（Moderating Effects）研究。（3）领导成员交换对于不同领导风格与员工工作绩效之间关系的中介效应（Mediator Effects）研究。

目录 1.《调查问卷表》中数据预先处理～～～～～～～～～～～～～～ 3 1.1 剔除无效问卷～～～～～～～～～～～～～～～～～～～～ 3 1.2 重新定义控制变量～～～～～～～～～～～～～～～～～～ 3 2. 把Excel数据导入到SPSS软件中的方法～～～～～～～～～～ 4 3. 确认所有的变量中有无“反向计分”项～～～～～～～～～～～4 3.1 无“反向计分”题～～～～～～～～～～～～～～～～～～ 5 3.2 有“反向计分”题～～～～～～～～～～～～～～～～～～ 5 4. 效度分析～～～～～～～～～～～～～～～～～～～～～～～～6 5. 信度分析～～～～～～～～～～～～～～～～～～～～～～～～8 6. 描述统计～～～～～～～～～～～～～～～～～～～～～～～～9 7. 各变量相关系数～～～～～～～～～～～～～～～～～～～～ 12 7.1 求均值～～～～～～～～～～～～～～～～～～～～～～～12 7.2 相关性～～～～～～～～～～～～～～～～～～～～～～～12 8. 回归分析～～～～～～～～～～～～～～～～～～～～～～～13 8.1 使用各均值来分别求Z值～～～～～～～～～～～～～～～13 8.2 自变量Z值与调节变量Z值的乘积～～～～～～～～～～～13 8.3 进行回归运算～～～～～～～～～～～～～～～～～～～～14 8.3.1 调节作用分析～～～～～～～～～～～～～～～～～～14 8.3.2 中介作用分析～～～～～～～～～～～～～～～～～～18 8.4 调节作用作图～～～～～～～～～～～～～～～～～～～～22

空间分析实习报告

空间分析实习报告学院遥感信息工程学院班级学号姓名日期

一、实习内容简介 1．实验目的：（1）通过实习了解ArcGIS的发展，以及10.1系列软件的构成体系（2）熟练掌握ArcMap的基本操作及应用（3）了解及应用ArcGIS的分析功能模块ArcToolbox （4）加深对地理信息系统的了解 2.实验内容: 首先是对ArcGIS有初步的了解。了解ArcGIS的发展，以及10.1系列软件的构成体系，了解桌面产品部分ArcMap、ArcCatalog和ArcToolbox的相关基础知识。实习一是栅格数据空间分析，ArcGIS软件的Spatial Analyst模块提供了强大的空间分析工具，可以帮助用户解决各种空间分析问题。利用老师所给的数据可以创建数据（如山体阴影），识别数据集之间的空间关系，确定适宜地址，最后寻找一个区域的最佳路径。实习二是矢量数据空间分析，ArcToolbox软件中的Analysis Tools和Network Analyst Tools提供了强大的矢量数据处理与分析工具，可以帮助用户解决各种空间分析问题。利用老师所给的数据可以通过缓冲区分析得到矢量面数据，通过与其它矢量数据的叠置分析、临近分析来辅助选址决策过程；可以构建道路平面网络模型，进而通过网络分析探索最优路径，从而服务于公交选线、智能导航等领域。实习三是三维空间分析，学会用ArcCatalog查找、预览三维数据；在ArcScene中添加数据；查看数据的三维属性；从二维要素与表面中创建新的三维要素；从点数据源中创建新的栅格表面；从现有要素数据中创建TIN表面。实习四是空间数据统计分析，利用地统计分析模块，你可以根据一个点要素层中已测定采样点、栅格层或者利用多边形质心，轻而易举地生成一个连续表面。这些采样点的值可以是海拔高度、地下水位的深度或者污染值的浓度等。当与ArcMap一起使用时，地统计分析模块提供了一整套创建表面的工具，这些表面能够用来可视化、分析及理解各种空间现象。实习五是空间分析建模，空间分析建模就是运用GIS空间分析方法建立数学模型的过程。按照建模的目的，可分为以特征为主的描述模型（descriptive model）和提供辅助决策信息和解决方案为目的的过程模型（process model）两类。本次实习主要是通过使用ArcGIS的模型生成器（Model Builder）来建立模型，从而处理涉及到许多步骤的空间分析问题。二、实习成果及分析实习一：练习1：显示和浏览空间数据。利用ArcMap和空间分析模块显示和浏览数据。添加和显示各类空间数据集、在地图上高亮显示数值、查询指定位置的属性值、分析一张直方图和创建一幅山体阴影图。

面板数据分析方法步骤全解

面板数据分析方法步骤全解面板数据的分析方法或许我们已经了解许多了，但是到底有没有一个基本的步骤呢？那些步骤是必须的？这些都是我们在研究的过程中需要考虑的，而且又是很实在的问题。面板单位根检验如何进行？协整检验呢？什么情况下要进行模型的修正？面板模型回归形式的选择？如何更有效的进行回归？诸如此类的问题我们应该如何去分析并一一解决？以下是我近期对面板数据研究后做出的一个简要总结, 和大家分享一下，也希望大家都进来讨论讨论。步骤一：分析数据的平稳性（单位根检验）按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归, 尽管有较高的R 平方，但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归（spurious regression）。他认为平稳的真正含义是：一个时间序列剔除了不变的均值（可视为截距）和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归，确保估计结果的有效性, 我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项, 从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述：在非平稳的面板数据渐进过程中丄evin

an dLi n(1993)很早就发现这些估计量的极限分布是高斯分布，这些结果也被应用在有异方差的面板数据中，并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002的改进，提出了检验面板单位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋势，异方差和高阶序列相关，适合于中等维度(时间序列介于25?250 之间，截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS法，但Breitung(2000)发现IPS法对限定性趋势的设定极为敏感，并提出了面板单位根检验的Breit ung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。由上述综述可知，可以使用LLC IPS Breintung、ADF-Fisher和 PP-Fisher5种方法进行面板单位根检验。其中LLC-T、BR-T IPS-W、ADF-FCS PP-FCS H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、Im Pesaran & Shin W 统计量、 ADF- Fisher Chi-square统计量、PP-FisherChi-square统计量、Hadri Z 统计量，并且Levin, Lin & Chu t*统计量、Breitung t统计量的原假设为存在普通的单位根过程，Im Pesaran & Shin W统计量、ADF- Fisher Chi-square统计量、PP -Fisher Chi-square统计量的原假设为存在有效的单位根过程，Hadri Z统计量的检验原假设为不存在普通的单位根过程。