10个stata中有用的命令

合集下载

stata 命令

stata 命令

1.odbc load,dsn("Excel Files;DBQ=D:\1.xls") table("sheet1$") clear lowercase2.winsorizeJ lrate btd tacc hhi pmc com roa major size size_1 inv inv_1 cash_1 lev lev_1 nwcret ret_1 nwc_1 seo , suffix(w) cuts(1 99)winsorizeJ tobinq_1daixizhaiwu tobinq_1jingzhaiwu , suffix(w) cuts(1 98.5)3.生成Dbtd和inINV之前先看下数据情况tabstat lratew btdw taccw hhiw pmcw comw roaw majorw sizew levw nwcw retw seow , stat( max min mean sd median )col(stat)tabstatinvw inv_1w cash_1w size_1w lev_1w nwc_1w tobinq_1daixizhaiwuw tobinq_1jingzhaiwuw , stat( max min mean sd median )col(stat)4. bysort time ind: egen lratewmean =mean( lratew )gen lratewfenlei=lratew – lratewmeangen lratewxuni = lratewfenleireplace lratewxuni = 1 if lratewfenlei >0replace lratewxuni = 0 if lratewfenlei <0drop lratewmean5. reg btdw taccw,noconpredict Dbtd,rbys time ind: egen Dbtdmean =mean( Dbtd )gen Dbtdfenlei=Dbtd – Dbtdmeangen Dbtdxuni = 1 if Dbtdfenlei > 0replace Dbtdxuni = 0 if Dbtdxuni == .drop Dbtdmean6. bysort time : count if lratewfenlei > 0bysort time : count if Dbtdfenlei > 07. tab year, gen(dummy_year)drop dummy_year1tab ind, gen(dummy_ind)drop dummy_ind58.reg invw age_1 inv_1w cash_1w size_1w lev_1w tobinq_1daixizhaiwuw ret_1w dummy*predict inINV_daixi,rreg invw age_1 inv_1w cash_1w size_1w lev_1w tobinq_1jingzhaiwuw ret_1w dummy*predict inINV_jing,r9. logout, save(test) word replace: tabstat invw enINV lratew Dbtd btdw hhiw pmcw comw qwopportunityw cfw majorw levw sizew nwcNw roaw seow , stat( max min mean sd median ) col(stat)10.logout, save(test) word replace:pwcorr inINV_jing lratew Dbtd hhiw pmcw tobinq_1jingzhaiwuwfcfw majorw levw sizew nwcw roaw seow ,sig star(.05)logout, save(test) word replace:spearman invw enINV lratew Dbtd hhiw pmcw comw tobinqw opportunityw cfw majorw levw sizew nwcw,star(.05)11. sktest lratew lratewfenlei ,noadjust 正态分布检验ttest lratew,by (soexuni1) unequal12.probit lratewxuni sizew levw tobinq_1daixizhaiwuw roaw age dummy*predict w1,xbgen imr=normalden(w1)/normal(w1)drop w1 生产IMR系数已重新修改IMR的模型,按照避税和tobinq的不同生成了六个IMR13. logout, save(test) word replace:reg abs_inINV lratew pmcw fcfw NEG fcfneg majorw retwtobinq_1jingzhaiwuw levw sizew nwcw age imr2 seow dummy*logout, save(test) word replace:reg abs_inINV Dbtd pmcw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr5 seow dummy*logout, save(test) word replace:reg abs_inINV lratew hhiw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr2 seow dummy*logout, save(test) word replace:reg abs_inINV Dbtd hhiw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr5 seow dummy*根据性质分成国有和民营与分成中央、地方和民营,结果是一样的,中央和地方没有差异14. xtset zq time15. logout, save(test) word replace:xtreg abs_inINV Dbtd pmcw fcfw fcfneg majorw retwtobinq_1jingzhaiwuw levw sizew nwcw age imr seow dummy*使用面板和非面板数据结果是一致的16.分组检验sort soe0 (分组前必须先排序,否则by命令用不了,如果替换为bys命令,则不用先sort)logout, save(test) word replace:by soe0:reg abs_inINV lratew pmcw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr2 seow dummy*logout, save(test) word replace:by soe0:reg abs_inINV Dbtd pmcw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr5 seow dummy*logout, save(test) word replace:by soe0:reg abs_inINV lratew hhiw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr2 seow dummy*logout, save(test) word replace:by soe0:reg abs_inINV Dbtd hhiw fcfw NEG fcfneg majorw retw tobinq_1jingzhaiwuw levw sizew nwcw age imr5 seow dummy*17.生成交互项gen TC1= lratew * pmcwgen TC2= Dbtd *pmcwgen TC3= lratew *hhiwgen TC4= Dbtd *hhiw18.设置用于将投资效率进行分组的变量gen Dbtdxuni = 1 if Dbtdfenlei > 0replace Dbtdxuni = 0 if Dbtdxuni == .1为投资过度,0为投资不足19.检验假设3,区分投资过度与投资不足sort inv_xuni_jinglogout, save(test) word replace:by inv_xuni_jing: reg inINV_jing lratew pmcw TC1 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy*logout, save(test) word replace:by inv_xuni_jing: reg inINV_jing Dbtd pmcw TC2 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5dummy*logout, save(test) word replace:by inv_xuni_jing: reg inINV_jing lratew hhiw TC3 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy*logout, save(test) word replace:by inv_xuni_jing: reg inINV_jing Dbtd hhiw TC4 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5 dummy*20.进一步检验,区分国有和民营投资不足logout, save(test) word replace:bys soe0 : reg inINV_jing lratew pmcw TC1 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy* if inv_xuni_jing ==0logout, save(test) word replace: bys soe0: reg inINV_jing Dbtd pmcw TC2 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5dummy*if inv_xuni_jing ==0logout, save(test) word replace: bys soe0: reg inINV_jing lratew hhiw TC3tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy*if inv_xuni_jing ==0logout, save(test) word replace: bys soe0: reg inINV_jing Dbtd hhiw TC4 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5 dummy*if inv_xuni_jing ==0投资过度logout, save(test) word replace:bys soe0 : reg inINV_jing lratew pmcw TC1 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy* if inv_xuni_jing ==1logout, save(test) word replace: bys soe0: reg inINV_jing Dbtd pmcw TC2 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5dummy*if inv_xuni_jing ==1logout, save(test) word replace: bys soe0: reg inINV_jing lratew hhiw TC3tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr2 dummy*if inv_xuni_jing ==1logout, save(test) word replace: bys soe0: reg inINV_jing Dbtd hhiw TC4 tobinq_1jingzhaiwuw levw age fcfw majorw sizew retw inv_1w imr5 dummy*if inv_xuni_jing ==1新回归命令:①基础调整阶段encode code, gen(zq)encode time, gen(ztime)xtset zq ztimedrop code time time_1 time_2winsorizeJ jzinv jzinv_1 , suffix(w) cuts(1 99)winsorizeJ roa fcf , suffix(w) cuts(5 95)logout, save(test) excel replace: tabstat lrate btd dbtd hhi pmc com size top1 gqzh seolev roaw fcfw jzinvw jzinv_1winv inv_1 roa_1 growth_1 size_1 lev_1 nwc_1 ret_1 cash_1 age_1 jzinv jzinv_1 , stat( max min mean sd median )col(stat)tab year, gen(dummy_year)tab ind, gen(dummy_ind)drop dummy_ind10drop dummy_year1order zq ztime chanquan1 zcjz zcjz_1 zcjz_2 chanquan2 lrate btd dbtd hhi pmc com size top1 gqzh seo growth lev roaw fcfw jzinvw jzinv_1w inv inv_1 roa_1 growth_1 size_1 lev_1 nwc_1 ret_1 cash_1 age_1 year inddrop jzinv jzinv_1 roa fcfrename jzinvw jzinvrename jzinv_1w jzinv_1rename roaw roarename fcfw fcf②表格回归阶段logout, save(test) excel replace: reg inv inv_1 growth_1 lev_1 ret_1 cash_1 age_1 size_1 dummy* reg inv inv_1 growth_1 lev_1 ret_1 cash_1 age_1 size_1 dummy*predict e, residgen invxl= 1 if e > 0replace invxl = 0 if invxl == .rename ztime timebysort time ind: egen lratewmean =mean( lrate )gen lratewfenlei=lrate–lratewmeangen lratewxuni = lratewfenleireplace lratewxuni = 1 if lratewfenlei >0replace lratewxuni = 0 if lratewfenlei <0drop lratewmeanprobit lratewxuni size lev growth_1 roa age_1 dummy*predict w1,xbgen imr=normalden(w1)/normal(w1)drop w1gen absinvxl=abs( e )bys invxl :reg absinvxl lrate size top1 seo growth_1 lev ret_1 fcf age_1 dummy*。

stata基本命令

stata基本命令

stata基本命令+实例+数据+结果--必看,经典2009-08-25 12:29Stata 常用命令save命令File&#61672;Save As例1. 表1.为某一降压药临床试验数据,试从键盘输入Stata,并保存为Stata 格式文件。

STATA数据库的维护排序SORT 变量名1 变量名2 ……变量更名rename 原变量名新变量名STATA数据库的维护删除变量或记录drop x1 x2 /* 删除变量x1和x2drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5)drop if x<0 /* 删去x1<0的所有记录drop in 10/12 /* 删去第10~12个记录drop if x==. /* 删去x为缺失值的所有记录drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录drop _all /* 删掉数据库中所有变量和数据STATA的变量赋值用generate产生新变量generate 新变量=表达式generate bh=_n /* 将数据库的内部编号赋给变量bh。

generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5个1,5个2,5个3……。

直到数据库结束。

generate block=mod(_n,6) /* 按当前数据库的顺序,依次产生1,2,3,4,5,0。

generate y=log(x) if x>0 /* 产生新变量y,其值为所有x>0的对数值log(x),当x<=0时,用缺失值代替。

egen产生新变量set obs 12egen a=seq() /*产生1到N的自然数egen b=seq(),b(3) /*产生一个序列,每个元素重复#次egen c=seq(),to(4) /*产生多个序列,每个序列从1到#egen d=seq(),f(4)t(6) /*产生多个序列,每个序列从#1到#2encode 字符变量名,gen(新数值变量名)作用:将字符型变量转化为数值变量。

STATA最常用命令大全

STATA最常用命令大全

statasave命令File&#61672;Save As例1. 表1.为某一降压药临床试验数据,试从键盘输入Stata,并保存为Stata格式文件。

STATA数据库的维护排序SORT 变量名1 变量名2 ……变量更名rename 原变量名新变量名STATA数据库的维护删除变量或记录drop x1 x2 /* 删除变量x1和x2drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5)drop if x<0 /* 删去x1<0的所有记录drop in 10/12 /* 删去第10~12个记录drop if x==. /* 删去x为缺失值的所有记录drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录drop _all /* 删掉数据库中所有变量和数据STATA的变量赋值用generate产生新变量generate 新变量=表达式generate bh=_n /* 将数据库的内部编号赋给变量bh。

generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5个1,5个2,5个3……。

直到数据库结束。

generate block=mod(_n,6) /* 按当前数据库的顺序,依次产生1,2,3,4,5,0。

generate y=log(x) if x>0 /* 产生新变量y,其值为所有x>0的对数值log(x),当x<=0时,用缺失值代替。

egen产生新变量set obs 12egen a=seq() /*产生1到N的自然数egen b=seq(),b(3) /*产生一个序列,每个元素重复#次egen c=seq(),to(4) /*产生多个序列,每个序列从1到#egen d=seq(),f(4)t(6) /*产生多个序列,每个序列从#1到#2encode 字符变量名,gen(新数值变量名)作用:将字符型变量转化为数值变量。

计量经济学stata命令汇总

计量经济学stata命令汇总

计量经济学stata命令汇总1. 数据处理与描述性统计summarize 变量1 变量2…计算变量的均值、中位数等统计量tabulate 变量1 变量2…制表histogram 变量画单变量直方图scatter 变量1 变量2…画双变量散点图graph twoway 程序名变量1 变量2…绘制双变量图形sort 变量按照变量排序by 变量: 命令按照变量拆分数据并执行命令replace 变量=表达式替换变量中的值generate 新变量=表达式生成新变量egen 新变量=函数(变量) 生成新变量2. 回归分析regress 因变量自变量1 自变量2…普通最小二乘回归reg 相关变量,robust 异方差鲁棒性回归logit 因变量自变量1 自变量2…二元Logit模型probit 因变量自变量1 自变量2…二元Probit模型tobit 因变量自变量1 自变量2… 截尾变量(下界或上界)cens(下界或上界) 截尾Tobit模型heckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程变量名称=接收权值做二阶段回归Heckman选择模型pheckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程经验Bayes做二阶段回归Pooled Heckman选择模型xtset 变量1 变量2…指定面板数据xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano间隔估计xtlogit 因变量自变量1 自变量2…, fe面板Logit模型xtprobit 因变量自变量1 自变量2…, fe面板Probit模型3. 时间序列分析dfuller 变量单位根检验tsset 变量指定时间序列数据tsline 变量绘制时间序列图arma 阶数, lags(*laglist*) ARMA过程估计arima 阶数, lags(*laglist*) 差分阶数(*diff*) 现有模型(*model*) ARIMA模型估计arch hq/aic, lags(*laglist*) ARCH模型估计garch q=p o=r t=m, arch(q) garch(p) GARCH模型估计ivregress (2SLS)因变量自变量1(内生变量)编号=gmm/cluster(varname) 内生变量外生变量IV或2SLS回归分析4. 面板数据分析&横截面数据分析xtsum 等对面板数据的描述统计量xttest0 2个变量计算相对于H0的t值,考虑了异方差和面板数据结构(前提是两个变量符合随机效应或固定效应假设)xttobit 因变量自变量1 自变量2… 下界 cens(下界或上界)面板Tobit模型xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano面板回归模型xtlogit/xtprobit 因变量自变量1 自变量2…, fe面板分类模型5. 高级统计方法cluster 变量聚类分析pca 变量1 变量2…, components(4)主成分分析mvreg 因变量向量1 向量2…, clustervar(cluster)多元回归及聚类分析multilevel 因变量自变量1 自变量2…, mle 内部命令(通常是cov)多层线性模型分析glm 因变量自变量1 自变量2…, family(binomial) 连接函数(logit/probit) 难以观察到自变量(即随机拦截模型)其他选项广义线性模型分析heckprob/reg3 因变量自变量1 自变量2… 等随机效应模型分析。

Stata统计分析报告命令

Stata统计分析报告命令

Stata统计分析常用命令汇总一、winsorize极端值处理范围:一般在1%和99%分位做极端值处理,对于小于1%的数用1%的值赋值,对于大于99%的数用99%的值赋值。

1、Stata中的单变量极端值处理:stata 11.0,在命令窗口输入“findit winsor”后,系统弹出一个窗口,安装winsor 模块安装好模块之后,就可以调用winsor命令,命令格式:winsor var1, gen(new var) p(0.01) 或者在命令窗口中输入:ssc install winsor安装winsor命令。

winsor命令不能进行批量处理。

2、批量进行winsorize极端值处理:打开链接:/judson.caskey/data.html,找到winsorizeJ,点击右键,另存为到stata中的ado/plus/目录下即可。

命令格式:winsorizeJ var1var2var3,suffix(w)即可,这样会生成三个新变量,var1w var2w var3w,而且默认的是上下1%winsorize。

如果要修改分位点,则写成如下格式:winsorizeJ var 1 var2 var3,suffix(w) cuts(5 95)。

3、Excel中的极端值处理:(略)winsor2 命令使用说明简介:winsor2 winsorize or trim (if trim option is specified) the variables in varlist at particular percentiles specified by option cuts(# #). In defult, new variables will be generated with a suffix "_w" or "_tr", which can be changed by specifying suffix() option. The replace option replaces the variables with their winsorized or trimmed ones.相比于winsor命令的改进:(1) 可以批量处理多个变量;(2) 不仅可以 winsor,也可以 trimming;(3) 附加了 by() 选项,可以分组 winsor 或 trimming;(4) 增加了 replace 选项,可以不必生成新变量,直接替换原变量。

STATA 常用命令

STATA 常用命令

目录STATA 常用命令 (2)一、基本运算 (2)二、数据处理 (3)三、数据导入导出 (3)四、描述性统计 (4)五、相关系数 (4)六、t检验 (4)七、非参数检验Wilcoxon (4)八、多元线性回归 (4)九、面板数据多元回归 (4)十、Logit回归 (5)十一、主成分分析与因子分析 (5)十二、PSM(倾向性匹配) (5)十三、内生性检验 (6)十四、DID (双重差分模型) (6)十五、作图 (7)十六、错误修正 (7)十七、应用技巧 (7)STATA 常用命令一、基本运算2.新变量产生1至n(行数)的变量:gen z=_n新变量赋值:gen y=log(x) if x>0gen y=seq(x)gen y=rmean(x)gen y=x+zDummy 变量:gen d=1 if x>1replace d=0 if x<=1自动生成年度(year)的Dummy变量:tabulate year, gen(Dyear)替换变量中的数值:replace x=0 if x<0更换变量名称:rename var1 x字符型变量转换为数值型:destring x, replace force(手动操作:选定变量=>右键=>数据)提取年度:gen ymd=date(date,”YMD”)format %td ymdgen year=year(ymd)提取字符:gen code=substr(x,1,1)3.变量处理一阶滞后变量:gen lag_x=L.x将所有变量的缺失值改为0:mvencode _all, mv(0) override去掉重复数值:duplicates drop x, force变量的标准化:egen x1=std(x)变量的缩尾处理:先安装:ssc install winsor, replacewinsor x , gen (x1) p(0.01)二、数据处理1.基本操作帮助:help ttestsearch ttest打开文件:use “ “查看:list x in 1/4展示数据集:describe (d)频率:tab x 或tab x y z命令窗口的执行命令:enter命令文件的执行命令:ctrl +D命令窗口换行:ctrl+enter清空内存(对新数据集开始检验时先清除原数据):clear点击历史窗口,可以将已执行的命令重新恢复为待执行的命令从小到大排列:sort x从大到小排列:gsort -x删除变量:drop x删除若干行:drop in 10/12删除前3行:drop in 1/3删除负数行:drop if x<0删除缺失值:drop if x==.删除不等于C的值:drop if x~=“C”保留变量x和y,删除其他变量:keep x y保留若干行,删除其他行:keep in 10/12保存:save “ 路径” , replace2.数据集合并横向合并:merge x y using “ “纵向合并:append using “ “按一个变量合并:merge 1:m code using "E:\Research\STATA\income.dta"drop _merge按两个变量合并:merge 1:1 code year using "E:\Research\STATA\income.dta"drop _merge3.三、数据导入导出1.Data=>data editor (改为数值型)=>将excel数据粘贴到data editor2.直接导入excel数据,并把第一行作为变量名称:import excel “路径”, firstrow clear3.导入stata 数据集:use “ ”4.导出: 安装asdoc: ssc intall asdoc, replace然后回归分析时:asdoc reg y x在结果窗口点击:Myfile.doc四、描述性统计1.summarize x2.su x3.su x if x>204.su 后不输入具体变量,则对全体变量进行描述性统计。

STATA的简单命令

STATA的简单命令

STATA的简单命令stata中最重要的命令莫过于help和search了。

help用于查找精确的命令,而search是模糊查找。

例如:helpregress另一个例子:如果我们不记得命令的全名,但只记得reg的前半部分,我们可以输入searchreg用户获得信息最有效的另一个途径是使用statalist在线论坛,该论坛提供stata用户交流的一个良好的平台。

要加入statalist,我们可以给以下地址发个邮件:majordomo@邮件的内容为:subscribestatalist变量命名:1.变量名可达32个字符。

2.字符组分为a~Z、a~Z、0~9和下划线“”,不能出现这些字符以外的符号在变量名中。

3.变量名不能以数字开头。

4.变量名区分大小写。

5.倘若遵循以上原则依然无法正常命名变量,那么这个变量可能与stata自身保留的供系系统使用的变量是重复的。

创建数据文件的方法:1.手动输入。

2.将excel和其他文件复制并粘贴到Stata数据表中。

3.使用Stata软件导入。

查看数据的概貌:summarizexcodebookx如果上述两个命令后面没有内容,则显示的结果是所有变量的概述。

对数据进行排序的命令:sort标准1标准2标准3生成数据的命令:Gen1.如果要得到一阶差分,可以用以下命令:gendifference_invest(新变量的名称是任意的)=d.Invest(d.是操作符号,不能更改;Invest是变量名)2.要想产生一个新的变量lag_invest,也就是invest的一阶滞后,那么我们可以采用如下命令:genlag_uinvest=l.invest3.生成对数的命令:genln_invest=ln(invest)分散命令:分散1.scatterx1x2:scatter后的第一个变量是纵轴的变量,第二个变量是横轴的变量。

1/52.scatterx1x2,connect(1):以直线的方式连接相邻的两个点。

stata常用命令

stata常用命令

面板数据估计首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar [varlist] [if exp] , model_type [level(#) ]Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLS Random-effects estimatorpa GEE population-averaged estimatormle Maximum-likelihood Random-effects estimator主要估计方法:xtreg: Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data modelsxtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit : Fixed-effects, random-effects, population-averaged logit modelsxtprobit :Random-effects and population-averaged probit models xtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,betaxtreg命令的应用:声明面板数据类型:tsset sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)´[Var(b)-Var(B)]-1(b-B)~x2(k)Hausman统计量服从自由度为k的χ2分布。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

10个stata中有用的命令
1、set more off/on
表示要求持续翻屏。

碰到大样本量数据检验的时候用stata经常会碰到这样的情况,一个summarize之后出来一大堆东西然后不停的按空格往下拖。

当使用set more off后,结果就会一拖到底了。

2、set memory 20m (,permanent)
stata对于大部分其他统计软件而言都很快,主要的原因是因为stata是将数据载入内存进行分析的,同理要配给stata足够的内存才可行。

当分析一个很大样本量的时候,数据内存量很可能不够,就要使用这个命令了。

在Intercooled和SE版本中其分配的内存量是可以调节的,small stata是不能更改的。

(我记得默认的Intercool是1m,SE是10m。

)命令中“20m”表示的是分配内存量的大小。

后面括号里的意思是表示永远分配给20m大小。

3、log using XXX(,replace )/on/off/close
在过去使用stata的时候我比较郁闷的是要开一个word,边算边把运行结果粘贴到word里面。

而其实不用这个样子的,在刚开始的时候使用log的命令,就会自动记录下以后运行的所有结果,然后使用log close,就会关闭结果输出文件。

而log off/on 是用来表示记录功能的暂停和重新打开的。

4、local/global
这两个命令比较高级了,属于暂元命令。

(其实这两个命令还是一个意思。

唯一的区别在于在两程序内使用同一暂元,则在主程序中local说定义的暂元不会因子程序的重新定义而改变叫做“主程序局域”,而global却会发生变化成为“子程序全局暂元”。

看不懂?那就对了,暂时不用理解那么深刻啦……)
其实这两个命令是用来给变量名或者变量值改名字的。

改了之后要调用新名字的话local用` ‘而global用$。

5、tempvar/tempfile
这两个命令跟上面两个相似,但是是产生临时变量和临时数据文件的。

在进行stata运行的时候,尤其是初级玩家对于各种命令不是很熟悉就会容易生成一大堆自己制造的变量,容易把原来的数据库搞得乱七八糟。

这时候使用tempvar的话就不会破坏原来的数据库。

其实pres erve…restore也可以达到一样的效果,但是要是怕突然出现死机什么的,用tempvar 还是更好一点。

同理,tempfile也是用来产生临时文件的。

6、program
这个命令是用来创造命令的。

比如你觉得什么时候自己有了一个非常奇葩/有意思/惊艳/无聊的想法,想让stata运行,但是苦于不知道应该什么命令,就可以通过program这个命令自创一个来。

在使用program的时候其实跟input差不多,到最后的时候一定要记得end。

7、ssc
严格的来说这并不是一个命令,而是有点像命令的前缀,比如ssc describe/install/hot/new 什么的,搭配不同的命令会产生不同的效果。

这里的ssc实际上是Statistical Software Components的缩写。

这里着重讲一下ssc install,这个命令是让你能在ssc库里面下载一些拓展功能的。

先说点题外话,每一个stata用户,安装到电脑上的实际上只是一个stata 的平台,这些平台自带一些基础命令,然后各个用户根据自己的需要再不断的拓展自己的
stata功能,最后会使每一个stata都是独特的。

比如我自己因为工作的关系,所以我现在的stata里面装了比较多用来数据可视化的相关拓展命令。

搭配mapinfo的话可以画出很多有意思的地图来。

8、webuse以及其他
前些日子用stata结合世行的数据画地图很火(此处膜拜Joao Pedro Azevedo大神),其实用stata的话很多不错的数据库,比如美联储的数据库可以用freduse。

另外也可以直接使用webuse命令调用stata网上的数据库,默认情况下使用的是stata-press的数据库,也可以根据需要使用webuse set自己来更改目标网站。

9、findit
包括本文在内的任何stata教材教给你的东西都是有限的,重要的是在使用stata的过程中不断的探索,尤其是看一些高手写的stata分析过程,受益无穷。

当看到一些陌生的命令,自己stata里面没有却。

相关文档
最新文档