5分钟搞定Stata面板数据分析

5分钟搞定Stata面板数据分析
5分钟搞定Stata面板数据分析

【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者:张达

5分钟搞定Stata面板数据分析

简易教程

步骤一:导入数据

原始表如下,

数据请以时间(1998 ,1999,2000, 2001 ??)为横轴,样本名(北京,天津,河北??) 为纵轴

1 裁*■■別1A I

11 ■u 9K ILEXxl-

V,j si ao

LL B-

iic190 ..1( HJ曲1 1

g力?r4 々■l* Mfl 1

KM J| JgRi MM3icm*w II7QQ

-HQ SiqD tuff 1

'C4 3 4 IftJV

-mi KH>loogi liW

(0M 3M9WH jaii I MO

Kai W w ■齐itm

xm fill OTI Mil

taiK ■5W?U|J

TXE HH sia心?9 f Id 叼m in a*

ft I*■JtaC如M~4 気Hi

A|$A rm inoo IM? livra.w

vtatr1IJMj X#*4>t1|

筑?BF7 ■?|!N I9*V1IRV gw

1W1VJ I-J H itW Ml ?

稠申审砂y li>M l>R Md

w VIM e> mu IM HM 內)944

w 命■ n I L BII i mi 靜Ml hw w

3K:1ST? *7^ FJE inm ifini uni

4 5w 心

HtJ TW JTfl 9MI*HAS

■ilJto KO >4*461/M3

1 <141*11诃却4LJt 4ktt VM匸F

\ 4 ■R- 呵鬥1皑用

MA■J广*?i g Ml*

11*K=? 1 31 1MM I“tlM

韓!1fi >w g ivt E4M laM

■ii T PD w im W i.JV 1

P w L*l 1tiZF MM7 <1 H1! liyi

将中文地名替换为数字。

注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值。

A 4豪??A*bmaHAfl M A辜1*

U11 ■■疋***il

1 3 T■|v J科■■

i £ * isS a 4 fl?■ Aa-

fT"iyi4C nv j| if. |f J_■ ■:』 1 I TO E 稱如Mfl 1

Rft?MM 17M UQI iWt m >nm ?IM A

3 山??■ HQ RiE0

4 UJ ■JI 1

£*?咗內mt临■AV tm 4131 ItJV

tfTW W3 F1M 11 s IT-B 1FM1

7

*K??Ijfi artf M?MU3

9 ?

d ■徳xm JC3I Z71I JMI 厂丽

10

w Jfl>3 17円vag*9 Ifi3h4 .UM 11

12 ?n?nr l:tA xi y專鲨>■- F A) '2H2 lii B| 1

严仝“ #■*‘^2^2 I If

l-t??■Itlfi M^fli 9731I^QD IM? IW3"IM ELJftfl申血i jjg.j aw XV IM■■卄

1山??Mi V7M|:H MF IQMQ11RV>Mli n>

17 ?^LM

M*啪■i|l-4 帕砂,M)I 卫

w IP* S4I V M} HM I ]■■■

20冲■理LKlIll i.mi即空it^3 1ST?' I 基fit 虫3UE lar? <7^ 17^i!m. IfiTD|

肝』 4 (Jf. w e 祸1 j is*a-h BtJ T A M?M 9MI却」VttC gu

H ”IM i I4d^t 1/443 R-lfej.!

■ W L| H'*40 粘MJt 4Ui VM i?n 1

>IV4404dri> im>FT?a 1 26

S-4 购!J IJI rj|.列***Ha■丿UK MVt 'tt I

IF”I巾供I i|Wfl III |

KM i< >WI4 IA JJ l>^t14M 一也

11 屮処417 PQ HI怕I Til;! t?V 1

丸Ml申住F MH H'l 1^7 44, i*

11 ■w

去除年份的一行,将其余部分复制到stata的data editor中,或保存为csv格式。

4n n建方财歳决需支出中區炳岌出恵氐十ir^i =_r 十L?亠」亠j

匸4 E藝巾q-件曹中Ff ■,JI 鼻-;L M > 1* ■?InarLAn

」4u ■■* 0?

M r* ■严t ■ ?11

* a.5 *亘*

dJ-

I■■r?j t

*JU ft / U kA?jm i 瞬f1林gt?r*x?■ Aa*

朴_ —C Ci F c H] 1fX> JW4lt ■ IT31S* 咖

2TH 呻rl砂側紳i

3

*HaJ HU 1却M|nm

*a?r JM 才

*g 世¥EH' JM,m Mfii?却

** A lf?5is il^i MM f1*阖jg m U14 MJi 切

1A M百*tfl?l Ulli ■ M 9?!1叫xna am rji 車1TUI 『PI

w1434 IQW WC3* 曲r

m:it) 3)11? 3I 1) mn 涎H?丨AK MW ■~!l II72£MM ?ara

U V.3C WC 44M wn inx IW 1晦:

1#"MS I 吟¥$D 1 MM DKl1XM AMI

刿?Mf? *1itra um=a* i

-HR I?1[如>4^0?Wi 71** JM

17 ?I ! t'4 中tK X tZtf1IM34U

圍即片W W7I WL w 1 w"WM

9'K|-MI)I1*3W

9U:1177 昨四ifiW

E 4M 4?盹s-gf 771t ?0G 4KI

Ji } 0 E IdM i3it

4J4S ma MM11W I71AS 'W s

:MA lil 1■鼻4JM皿

J$*4i ?aA^- ■9-14HPT?i$3EQ

r?町M口0 ?]

*44 IM w ISV?rtt ?^4 右1V& ?an

HM齡《讷 1 st >W M?P i£i

n r m n>■f-4im IM UM 10344 砒?i f*i聲i IW■IM

i肚UH诃UftH Ml Ml s -

11

■輒■ - ,「?r,?J+-A-Z

UJI■W J:

打开stata,调用数据。

方法一:直接复制到data editor中。

方法二:使用口令:in sheet usi ng 文件路径

调用例如:in sheet using C:\STUDY\paper\taxi.csv

其中csv格式可用excel的另存为”导出

如图:

■ 1 1

W1T>#4w*w3* I 讣? M WH fi-JM mU&Md.AMv VWA

7xmr nm JWf MW um負也”m

S fVW ■BU*WM?l耳CM耐鹫1?nj7叭?

*4i'feM-4HM?tUJ J??

i Oti9iuie IkLU 3JFH*

-b?帕is HM LifNi MM

MEMJ47THi iwv59H4'9W n#n

am?HU i?L Wil BUM MW MHJ vwl

f>W9 IF wu W Ld

■HUI Mn nua4JHI t4W?U7t4JVU?EH u14zmi wn mn nm MW 33UI1HH

IT 肚4址UM IttK W??MA li Lh L2THT11 U1srm i y UALZ l-jun ni-i-srKT m

w WJ严MR 时林

u&MJll■MM44U好I MW4L2A S1W

u込M199K JTS■Mf Mis/ sim4feM

I?IMI7 11711 JW?Mit MM EU1 fMM

IV It um rnM2M i n?u Wk> FT

步骤二:调整格式

首先请将代表样本的varl重命名

口令:rename varl样本名

例如:rename varl prov

ince

也可直接在varl处双击,在弹出的窗口中修改

Hariaijlfc Propertie E

karri?

Type

byte

Fofmat

蝴-Og Creite...

Wine label

I

I Manage.

Reset Apply

接下来将数据转化为面板数据的格式

口令:reshape long var, i(样本名)

例如:reshape long var, i(provinee)

其中var代表的是所有的年份(var2,var3,var4 ??)

转化后的格式如图:

Data wide long

?F diss?31->

Number va^idbles7■A

j vciriabl& (6 values^->k

sij vurialJles;

var£ var3…vor7->vor

转化成功后继续重命名,其中」这里代表原始表中的年份,v a r代表该变量的名称口令例如:

rename _j year

rename var taxi

也可直接在需要修改的名称处双击,在弹出的窗口中修改如图:

步骤三:排序

口令:sort变量名

例如:sort provinee year

意思为将province按升序排列,然后再根据排好的province数列排year这一列如图:

(虽然很多时候在执行sort前数据就已经符合要求了,但以防万一请务必执行此操作)

最后,保存。

至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。在处理新变量前请使用

口令:clear

将stata重置

这里为方便举例再处理一个名为so2的变量。如图:

这样处理完全部变量:

步骤四:合并数据

任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量)

口令:merge样本名时间using文件路径

例如:merge province year using C:\STUDY\paper\taxi.dta

意思是将taxi的数据添加到so2的数据表中如图:

然后使用

口令:tab _merge

100%,如图

然后使用

口令:drop _merge

将数据表中的_merge —列去掉,如图:

相关主题
相关文档
最新文档