5分钟搞定Stata面板数据分析
【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者:张达
5分钟搞定Stata面板数据分析
简易教程
步骤一:导入数据
原始表如下,
数据请以时间(1998 ,1999,2000, 2001 ??)为横轴,样本名(北京,天津,河北??) 为纵轴
1 裁*■■別1A I
11 ■u 9K ILEXxl-
V,j si ao
LL B-
iic190 ..1( HJ曲1 1
g力?r4 々■l* Mfl 1
KM J| JgRi MM3icm*w II7QQ
-HQ Siq
'C4 3 4 IftJV
-mi KH>loogi liW
(0M 3M9WH jaii I MO
Kai W w ■齐itm
xm fill OTI Mil
taiK ■5W?U|J
TXE HH sia心?9 f Id 叼m in a*
ft I*■JtaC如M~4 気Hi
A|$A rm inoo IM? livra.w
vtatr1IJMj X#*4>t1|
筑?BF7 ■?|!N I9*V1IRV gw
1W1VJ I-J H itW Ml ?
稠申审砂y li>M l>R Md
w VIM e> mu IM HM 內)944
w 命■ n I L BII i mi 靜Ml hw w
3K:1ST? *7^ FJE inm ifini uni
4 5w 心
HtJ TW JTfl 9MI*HAS
■ilJto KO >4*461/M3
1 <141*11诃却4LJt 4ktt VM匸F
\ 4 ■R- 呵鬥1皑用 MA■J广*?i g Ml* 11*K=? 1 31 1MM I“tlM 韓!1fi >w g ivt E4M laM ■ii T PD w im W i.JV 1 P w L*l 1tiZF MM7 <1 H1! liyi 将中文地名替换为数字。 注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值。 A 4豪??A*bmaHAfl M A辜1* U11 ■■疋***il 1 3 T■|v J科■■ i £ * isS a 4 fl?■ Aa- fT"iyi4C nv j| if. |f J_■ ■:』 1 I TO E 稱如Mfl 1 Rft?MM 17M UQI iWt m >nm ?IM A 3 山??■ HQ RiE0 4 UJ ■JI 1 £*?咗內mt临■AV tm 4131 ItJV tfTW W3 F1M 11 s IT-B 1FM1 7 *K??Ijfi artf M?MU3 9 ? d ■徳xm JC3I Z71I JMI 厂丽 10 w Jfl>3 17円vag*9 Ifi3h4 .UM 11 12 ?n?nr l:tA xi y專鲨>■- F A) '2H2 lii B| 1 严仝“ #■*‘^2^2 I If l-t??■Itlfi M^fli 9731I^QD IM? IW3"IM ELJftfl申血i jjg.j aw XV IM■■卄 1山??Mi V7M|:H MF IQMQ11RV>Mli n> 17 ?^LM M*啪■i|l-4 帕砂,M)I 卫 w IP* S4I V M} HM I ]■■■ 20冲■理LKlIll i.mi即空it^3 1ST?' I 基fit 虫3UE lar? <7^ 17^i!m. IfiTD| 肝』 4 (Jf. w e 祸1 j is*a-h BtJ T A M?M 9MI却」VttC gu H ”IM i I4d^t 1/443 R-lfej.! ■ W L| H'*40 粘MJt 4Ui VM i?n 1 >IV4404dri> im>FT?a 1 26 S-4 购!J IJI rj|.列***Ha■丿UK MVt IF”I巾供I i|Wfl III | KM i< >WI4 IA JJ l>^t14M 一也 11 屮処417 PQ HI怕I Til;! t?V 1 丸Ml申住F MH H'l 1^7 44, i* 11 ■w 去除年份的一行,将其余部分复制到stata的data editor中,或保存为csv格式。 4n n建方财歳决需支出中區炳岌出恵氐十ir^i =_r 十L?亠」亠j 匸4 E藝巾q-件曹中Ff ■,JI 鼻-;L M > 1* ■?InarLAn 」4u ■■* 0? M r* ■严t ■ ?11 * a.5 *亘* dJ- I■■r?j t *JU ft / U kA?jm i 瞬f1林gt?r*x?■ Aa* 朴_ —C Ci F c H] 1fX> JW4lt ■ IT31S* 咖 2TH 呻rl砂側紳i 3 *HaJ HU 1却M|nm *a?r JM 才 *g 世¥EH' JM,m Mfii?却 ** A lf?5is il^i MM f1*阖jg m U14 MJi 切 1A M百*tfl?l Ulli ■ M 9?!1叫xna am rji 車1TUI 『PI w1434 IQW WC3* 曲r m:it) 3)11? 3I 1) mn 涎H?丨AK MW ■~!l II72£MM ?ara U V.3C WC 44M wn inx IW 1晦: 1#"MS I 吟¥$D 1 MM DKl1XM AMI 刿?Mf? *1itra um=a* i -HR I?1[如>4^0?Wi 71** JM 17 ?I ! t'4 中tK X tZtf1IM34U 圍即片W W7I WL w 1 w"WM 9'K|-MI)I1*3W 9U:1177 昨四ifiW E 4M 4?盹s-gf 771t ?0G 4KI Ji } 0 E IdM i3it 4J4S ma MM11W I71AS 'W s :MA lil 1■鼻4JM皿 J$*4i ?aA^- ■9-14HPT?i$3EQ r?町M口0 ?] *44 IM w ISV?rtt ?^4 右1V& ?an HM齡《讷 1 st >W M?P i£i n r m n>■f-4im IM UM 10344 砒?i f*i聲i IW■IM i肚UH诃UftH Ml Ml s - 11 ■輒■ - ,「?r,?J+-A-Z UJI■W J: 打开stata,调用数据。 方法一:直接复制到data editor中。 方法二:使用口令:in sheet usi ng 文件路径 调用例如:in sheet using C:\STUDY\paper\taxi.csv 其中csv格式可用excel的另存为”导出 如图: ■ 1 1 W1T>#4w*w3* I 讣? M WH fi-JM mU&Md.AMv VWA 7xmr nm JWf MW um負也”m S fVW ■BU*WM?l耳CM耐鹫1?nj7叭? *4i'feM-4HM?tUJ J?? i Oti9iuie IkLU 3JFH* -b?帕is HM LifNi MM MEMJ47THi iwv59H4'9W n#n am?HU i?L Wil BUM MW MHJ vwl f>W9 IF wu W Ld ■HUI Mn nua4JHI t4W?U7t4JVU?EH u14zmi wn mn nm MW 33UI1HH IT 肚4址UM IttK W??MA li Lh L2THT11 U1srm i y UALZ l-jun ni-i-srKT m w WJ严MR 时林 u&MJll■MM44U好I MW4L2A S1W u込M199K JTS■Mf Mis/ sim4feM I?IMI7 11711 JW?Mit MM EU1 fMM IV It um rnM2M i n?u Wk> FT 步骤二:调整格式 首先请将代表样本的varl重命名 口令:rename varl样本名 例如:rename varl prov ince 也可直接在varl处双击,在弹出的窗口中修改 Hariaijlfc Propertie E karri? Type byte Fofmat 蝴-Og Creite... Wine label I I Manage. Reset Apply 接下来将数据转化为面板数据的格式 口令:reshape long var, i(样本名) 例如:reshape long var, i(provinee) 其中var代表的是所有的年份(var2,var3,var4 ??) 转化后的格式如图: Data wide long ?F diss?31-> Number va^idbles7■A j vciriabl& (6 values^->k sij vurialJles; var£ var3…vor7->vor 转化成功后继续重命名,其中」这里代表原始表中的年份,v a r代表该变量的名称口令例如: rename _j year rename var taxi 也可直接在需要修改的名称处双击,在弹出的窗口中修改如图: 步骤三:排序 口令:sort变量名 例如:sort provinee year 意思为将province按升序排列,然后再根据排好的province数列排year这一列如图: (虽然很多时候在执行sort前数据就已经符合要求了,但以防万一请务必执行此操作) 最后,保存。 至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。在处理新变量前请使用 口令:clear 将stata重置 这里为方便举例再处理一个名为so2的变量。如图: 这样处理完全部变量: 步骤四:合并数据 任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量) 口令:merge样本名时间using文件路径 例如:merge province year using C:\STUDY\paper\taxi.dta 意思是将taxi的数据添加到so2的数据表中如图: 然后使用 口令:tab _merge 100%,如图 然后使用 口令:drop _merge 将数据表中的_merge —列去掉,如图: