计量经济学软件STATA命令集

STATA常用命令大全

STATA 常用命令大全调整变量格式：format x1 %10.3f ——将x1的列宽固定为10，小数点后取三位format x1 %10.3g ——将x1的列宽固定为10，有效数字取三位format x1 %10.3e ——将x1的列宽固定为10，采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10，小数点后取三位，加入千分位分隔符format x1 %10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符format x1 %-10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符，加入“-”表示左对齐合并数据：use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge using "C:\Documents and Settings\xks\桌面\1999.dta"——将1999和2006的数据按照样本（observation）排列的自然顺序合并起来use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort——将1999和2006的数据按照唯一的（unique）变量id来合并，在合并时对id进行排序（sort）建议采用第一种方法。

对样本进行随机筛选：sample 50在观测案例中随机选取50%的样本，其余删除sample 50,count在观测案例中随机选取50个样本，其余删除查看与编辑数据：browse x1 x2 if x3>3 （按所列变量与条件打开数据查看器）edit x1 x2 if x3>3 （按所列变量与条件打开数据编辑器）数据合并（merge）与扩展（append）merge表示样本量不变，但增加了一些新变量；append表示样本总量增加了，但变量数目不变。

stata命令大全(全)

********* 面板数据计量分析与软件实现 *********说明：以下do文件相当一部分内容来自于中山大学连玉君STATA教程，感谢他的贡献。

本人做了一定的修改与筛选。

*----------面板数据模型* 1.静态面板模型：FE 和RE* 2.模型选择：FE vs POLS, RE vs POLS, FE vs RE （pols混合最小二乘估计）* 3.异方差、序列相关和截面相关检验* 4.动态面板模型（DID-GMM,SYS-GMM）* 5.面板随机前沿模型* 6.面板协整分析（FMOLS,DOLS）*** 说明：1-5均用STATA软件实现， 6用GAUSS软件实现。

* 生产效率分析（尤其指TFP）：数据包络分析（DEA）与随机前沿分析（SFA）*** 说明：DEA由DEAP2.1软件实现，SFA由Frontier4.1实现，尤其后者，侧重于比较C-D与Translog生产函数，一步法与两步法的区别。

常应用于地区经济差异、FDI溢出效应（Spillovers Effect）、工业行业效率状况等。

* 空间计量分析：SLM模型与SEM模型*说明：STATA与Matlab结合使用。

常应用于空间溢出效应（R&D）、财政分权、地方政府公共行为等。

* ---------------------------------* --------一、常用的数据处理与作图-----------* ---------------------------------* 指定面板格式xtset id year （id为截面名称，year为时间名称）xtdes /*数据特征*/xtsum logy h /*数据统计特征*/sum logy h /*数据统计特征*/*添加标签或更改变量名label var h "人力资本"rename h hum*排序sort id year /*是以STATA面板数据格式出现*/sort year id /*是以DEA格式出现*/*删除个别年份或省份drop if year<1992drop if id==2 /*注意用==*/*如何得到连续year或id编号（当完成上述操作时，year或id就不连续，为形成panel格式，需要用egen命令）egen year_new=group(year)xtset id year_new**保留变量或保留观测值keep inv /*删除变量*/**或keep if year==2000**排序sort id year /*是以STATA面板数据格式出现sort year id /*是以DEA格式出现**长数据和宽数据的转换*长>>>宽数据reshape wide logy,i(id) j(year)*宽>>>长数据reshape logy,i(id) j(year)**追加数据（用于面板数据和时间序列）xtset id year*或者xtdestsappend,add(5) /表示在每个省份再追加5年，用于面板数据/tsset*或者tsdes.tsappend,add(8) /表示追加8年，用于时间序列/*方差分解，比如三个变量Y,X,Z都是面板格式的数据，且满足Y=X+Z，求方差var(Y),协方差Cov(X,Y)和Cov（Z,Y）bysort year:corr Y X Z,cov**生产虚拟变量*生成年份虚拟变量tab year,gen(yr)*生成省份虚拟变量tab id,gen(dum)**生成滞后项和差分项xtset id yeargen ylag=l.y /*产生一阶滞后项)，同样可产生二阶滞后项*/gen ylag2=L2.ygen dy=D.y /*产生差分项*/*求出各省2000年以前的open inv的平均增长率collapse (mean) open inv if year<2000,by(id)变量排序，当变量太多，按规律排列。

湘潭大学计量经济学stata常用命令

replace变量＝表达式
replace bolck=6 if block==0 /*将block＝0的数全部替换为6。
replace z=. if z<0 /*将所有小于0的z值用缺失值代替。
replace age = 25 in 17/*将第17条记录中的变量age替换为25。
for var x* : replace X=0 if X==. /*将所有第一个字母为x的变量替换为0，如果该变量的值为缺失值
bar /*条图、百分条图
pie /*圆（饼）图
box /*箱式图
star /*星形图
常用选项
bin(#) /*将数据分几组,缺省为5。
freq /*指定纵轴用频数表示，否则为频率。
normal /*给直方图加上相应正态曲线。
xlab/ylab/[(#,……,#)] /*指定坐标轴的界点。
b2/l2[（“字符串”）] /*指定坐标轴的副标题。
egen b=seq(),b(3) /*产生一个序列，每个元素重复＃次
egen c=seq(),to(4) /*产生多个序列，每个序列从1到＃
egen d=seq(),f(4)t(6) /*产生多个序列，每个序列从#1到＃2
encode字符变量名，gen(新数值变量名)
作用：将字符型变量转化为数值变量。
ttesti #obs #mean #sd #val
直线相关和回归分析
correlate [变量名]
pwcorr [变量名] , [sig star(#) ]
regress因变量自变量
predict新变量, [stdp] [stdf]
stdp计算估计值的标准误
stdf估计预测值y的标准差

stata 常用命令

stata 常用命令Stata是一个流行的统计分析软件，广泛应用于各个领域的数据分析和研究。

它提供了丰富的命令和功能，可帮助用户处理、分析和可视化数据。

在本文中，我将向您介绍一些常用的Stata命令，以及它们在数据分析中的应用。

1. 数据导入与导出在使用Stata进行数据分析之前，我们需要将数据导入软件环境中。

Stata支持多种数据格式，如Excel、CSV、SPSS等。

对于Excel数据，我们可以使用命令"import excel"将数据导入到Stata中；对于CSV数据，可以使用"import delimited"命令。

Stata还提供了"export"命令，可将分析结果导出为Excel、CSV等格式，便于与其他软件进行交互。

2. 数据清洗与处理在数据分析过程中，数据清洗是一个重要的步骤。

Stata提供了一系列命令来处理和净化数据。

"drop"命令可以删除数据集中的变量或观察值；"replace"命令用于修改变量的取值；"gen"命令可以创建新的变量等。

"merge"命令可用于合并不同数据集，"sort"命令可用于排序数据等。

3. 描述性统计分析Stata提供了简单而强大的描述性统计分析命令，帮助用户了解数据的基本特征。

"summarize"命令可用于计算变量的均值、标准差等统计量；"tabulate"命令可用于制作交叉分类表；"histogram"命令可绘制变量的直方图等。

这些命令使我们能够更好地理解数据的分布和特征。

4. 统计模型估计Stata是一个强大的统计软件，支持各种常见的统计模型估计。

"regress"命令可用于进行线性回归分析；"logit"命令可用于二元逻辑回归分析；"heckman"命令可用于处理选择模型等。

stata命令大全(全)

********* 面板数据计量分析与软件实现 *********说明：以下do文件相当一部分内容来自于中山大学连玉君STATA教程，感谢他的贡献。

本人做了一定的修改与筛选。

*----------面板数据模型* 1.静态面板模型：FE 和RE* 2.模型选择：FE vs POLS, RE vs POLS, FE vs RE （pols混合最小二乘估计） * 3.异方差、序列相关和截面相关检验* 4.动态面板模型（DID-GMM,SYS-GMM）* 5.面板随机前沿模型* 6.面板协整分析（FMOLS,DOLS）*** 说明：1-5均用STATA软件实现， 6用GAUSS软件实现。

* 生产效率分析（尤其指TFP）：数据包络分析（DEA）与随机前沿分析（SFA）*** 说明：DEA由DEAP2.1软件实现，SFA由Frontier4.1实现，尤其后者，侧重于比较C-D与Translog生产函数，一步法与两步法的区别。

常应用于地区经济差异、FDI 溢出效应（Spillovers Effect）、工业行业效率状况等。

* 空间计量分析：SLM模型与SEM模型*说明：STATA与Matlab结合使用。

常应用于空间溢出效应（R&D）、财政分权、地方政府公共行为等。

* ---------------------------------* --------一、常用的数据处理与作图-----------* ---------------------------------* 指定面板格式xtset id year （id为截面名称，year为时间名称）xtdes /*数据特征*/xtsum logy h /*数据统计特征*/sum logy h /*数据统计特征*/*添加标签或更改变量名label var h "人力资本"rename h hum*排序sort id year /*是以STATA面板数据格式出现*/sort year id /*是以DEA格式出现*/*删除个别年份或省份drop if year<1992drop if id==2 /*注意用==*/*如何得到连续year或id编号（当完成上述操作时，year或id就不连续，为形成panel 格式，需要用egen命令）egen year_new=group(year)xtset id year_new**保留变量或保留观测值keep inv /*删除变量*/**或keep if year==2000**排序sort id year /*是以STATA面板数据格式出现sort year id /*是以DEA格式出现**长数据和宽数据的转换*长>>>宽数据reshape wide logy,i(id) j(year)*宽>>>长数据reshape logy,i(id) j(year)**追加数据（用于面板数据和时间序列）xtset id year*或者xtdestsappend,add(5) /表示在每个省份再追加5年，用于面板数据/tsset*或者tsdes.tsappend,add(8) /表示追加8年，用于时间序列/*方差分解，比如三个变量Y,X,Z都是面板格式的数据，且满足Y=X+Z，求方差var(Y),协方差Cov(X,Y)和Cov（Z,Y）bysort year:corr Y X Z,cov**生产虚拟变量*生成年份虚拟变量tab year,gen(yr)*生成省份虚拟变量tab id,gen(dum)**生成滞后项和差分项xtset id yeargen ylag=l.y /*产生一阶滞后项)，同样可产生二阶滞后项*/gen ylag2=L2.ygen dy=D.y /*产生差分项*/*求出各省2000年以前的open inv的平均增长率collapse (mean) open inv if year<2000,by(id)变量排序，当变量太多，按规律排列。

stata命令大全(全)

*********面板数据计量分析与软件实现*********说明：以下do文件相当一部分容来自于大学连玉君STATA教程，感他的贡献。

本人做了一定的修改与筛选。

*----------面板数据模型* 1.静态面板模型：FE 和RE* 2.模型选择：FE vs POLS, RE vs POLS, FE vs RE （pols混合最小二乘估计）* 3.异方差、序列相关和截面相关检验* 4.动态面板模型（DID-GMM,SYS-GMM）* 5.面板随机前沿模型* 6.面板协整分析（FMOLS,DOLS）*** 说明：1-5均用STATA软件实现， 6用GAUSS软件实现。

* 生产效率分析（尤其指TFP）：数据包络分析（DEA）与随机前沿分析（SFA）*** 说明：DEA由DEAP2.1软件实现，SFA由Frontier4.1实现，尤其后者，侧重于比较C-D与Translog 生产函数，一步法与两步法的区别。

常应用于地区经济差异、FDI溢出效应（Spillovers Effect）、工业行业效率状况等。

* 空间计量分析：SLM模型与SEM模型*说明：STATA与Matlab结合使用。

常应用于空间溢出效应（R&D）、财政分权、地方政府公共行为等。

* ---------------------------------* --------一、常用的数据处理与作图-----------* ---------------------------------* 指定面板格式xtset id year （id为截面名称，year为时间名称）xtdes /*数据特征*/xtsum logy h /*数据统计特征*/sum logy h /*数据统计特征*/*添加标签或更改变量名label var h "人力资本"rename h hum*排序sort id year /*是以STATA面板数据格式出现*/sort year id /*是以DEA格式出现*/*删除个别年份或省份drop if year<1992drop if id==2 /*注意用==*/*如何得到连续year或id编号（当完成上述操作时，year或id就不连续，为形成panel格式，需要用egen命令）egen year_new=group(year)xtset id year_new**保留变量或保留观测值keep inv /*删除变量*/**或keep if year==2000**排序sort id year /*是以STATA面板数据格式出现sort year id /*是以DEA格式出现**长数据和宽数据的转换*长>>>宽数据reshape wide logy,i(id) j(year)*宽>>>长数据reshape logy,i(id) j(year)**追加数据（用于面板数据和时间序列）xtset id year*或者xtdestsappend,add(5) /表示在每个省份再追加5年，用于面板数据/tsset*或者tsdes.tsappend,add(8) /表示追加8年，用于时间序列/*方差分解，比如三个变量Y,X,Z都是面板格式的数据，且满足Y=X+Z，求方差var(Y),协方差Cov(X,Y)和Cov（Z,Y）bysort year:corr Y X Z,cov**生产虚拟变量*生成年份虚拟变量tab year,gen(yr)*生成省份虚拟变量tab id,gen(dum)**生成滞后项和差分项xtset id yeargen ylag=l.y /*产生一阶滞后项)，同样可产生二阶滞后项*/ gen ylag2=L2.ygen dy=D.y /*产生差分项*/*求出各省2000年以前的open inv的平均增长率collapse (mean) open inv if year<2000,by(id)变量排序，当变量太多，按规律排列。

上海海洋大学计量经济学应用软件STATA命令集

计量经济学应用软件STATA 命令集一、基本操作 des y x （数据描述）（查看数据内部结构）● gen lny=log(y) ● gen lnx=log(x)● corr lnx1 lnx2 lnx3 lnx4 lnx5（多重共线性lnx 的相关系数） ● gen x1=x[_n-1]replace di=1 if year<=1990 replace di=0 if di==.● reg y x （一元函数回归模型）● reg y x1 x2 x3（多元函数回归模型）● summarize y x （一元回归预测的统计描述）（查看变量的基本统计量）● predict yhat （一元回归的y 预测值就是输入两个给的x 之后算的东西）f Y 平均值置信度95%的预测区间为：^^2f Y t ασ个别值置信度95%的预测区间为：^^2f Y t ασ ●● predict e, r 【异方差的生成残差平方序列】 ● gen e2=e*e ● corr y x二、检验● estat imtest, white 【异方差的white 检验】● tsset year （按照时间序列排列在画图之前，是虚拟变量，自相关所用） ● estat dwatson 【自相关 dw 】二、违反经典假设的处理方法【异方差的修正】●gen w1=1/x●gen w2=1/(x*x)●gen w3=1/sqrt(x)●reg y x [aw=w1]●reg y x [aw=w2]●reg y x [aw=w3]●prais y x, corc【为解决自相关问题，选用科克伦—奥克特（CO）迭代法】●prais y x, nolog 【为解决自相关问题，用普莱斯－温斯滕（Prais-Winsten）PW估计法。

】●两个方法谁大谁好●iveg y (x=x1)四、画图●scatter e x【异方差画散点图】●histogram q, width(8000) frequency●graph twoway (scatter y x)(lfit y x) 【一元散点图只有y x的】●graph twoway connect x y year, msymbol(circle) msymbol(triangle)【多元回归散点图y x1 x2 这样的】predict e,r●line e year【自相关的残差与时间t的散点图】●gen e1=L.e【残差与残差滞后的散点图】●twoway (scatter e e1) (lfit e e1)五、DW检验决策规则六虚拟变量德宾—沃森d 统计量：在0.05显著性水平上L d 和U d 的显著点。

stata 计量方法(一)

stata 计量方法(一)Stata 计量方法Stata 是一种常用的统计软件，尤其在计量经济学领域得到广泛的应用。

本文将介绍使用 Stata 进行计量方法分析的基本步骤和常用命令。

回归分析回归分析是计量经济学中最基础的方法之一，用于探究一个或多个自变量对一个因变量的影响程度。

在 Stata 中，可以使用reg命令进行回归分析。

reg dependent_variable independent_variable1 independent_variable2 ...例如，以下命令将运行一个简单线性回归，其中自变量为x，因变量为y：reg y x多元回归分析多元回归分析是指使用多个自变量来解释因变量。

在 Stata 中，可以使用reg命令进行多元回归分析。

reg dependent_variable independent_variable1 independent_variable2 ...例如，以下命令将运行一个多元回归模型，其中自变量为x1和x2，因变量为y：reg y x1 x2差分处理差分处理是指对两个或多个时间点的数据进行比较。

在 Stata 中，可以使用diff命令进行差分处理。

diff variable, difference_option例如，以下命令将计算变量x的一阶差分：diff x, difference(1)仪器变量回归仪器变量回归是用于处理自变量与因变量之间存在内生性问题的一种方法。

在 Stata 中，可以使用ivreg命令进行仪器变量回归。

ivreg dependent_variable (endogeneous_variable = instruments) independent_variable1 independent_variable2 ...例如，以下命令将运行一个仪器变量回归模型，其中自变量为x，因变量为y，仪器变量为z：ivreg y (x = z) other_variables总结本文介绍了 Stata 中常用的计量方法分析，包括回归分析、多元回归分析、差分处理和仪器变量回归。