STATA入门2 命令语句

合集下载

STATA常用命令大全

STATA 常用命令大全调整变量格式：format x1 %10.3f ——将x1的列宽固定为10，小数点后取三位format x1 %10.3g ——将x1的列宽固定为10，有效数字取三位format x1 %10.3e ——将x1的列宽固定为10，采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10，小数点后取三位，加入千分位分隔符format x1 %10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符format x1 %-10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符，加入“-”表示左对齐合并数据：use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge using "C:\Documents and Settings\xks\桌面\1999.dta"——将1999和2006的数据按照样本（observation）排列的自然顺序合并起来use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort——将1999和2006的数据按照唯一的（unique）变量id来合并，在合并时对id进行排序（sort）建议采用第一种方法。

对样本进行随机筛选：sample 50在观测案例中随机选取50%的样本，其余删除sample 50,count在观测案例中随机选取50个样本，其余删除查看与编辑数据：browse x1 x2 if x3>3 （按所列变量与条件打开数据查看器）edit x1 x2 if x3>3 （按所列变量与条件打开数据编辑器）数据合并（merge）与扩展（append）merge表示样本量不变，但增加了一些新变量；append表示样本总量增加了，但变量数目不变。

stata输出结果命令

Байду номын сангаас
建议使用outreg2命令。比如你得到一个模型结果。那在reg y x 后加est store model1，然后再使用outreg2 [model1] using tab01,word replace se tdec(3) bdec(3)即可。具体可Help outreg2命令看看。祝好运~
2.esttab命令无论什么检验、回归等，均可使用esttab命令（附加star选项）将不同显著性水平标成不同数量星号。以回归结果为例： use test1.dta xtset province year local xx "aggci ln_realgdp indus open urban" xtdpdsys theil `xx', twostep est store sys_gmm reg theil L.theil `xx',robust est store ols xtreg theil L.theil `xx',robust fe est store fe local models "sys_gmm ols fe" esttab `models', star(* 0.1 ** 0.05 *** 0.01) b(%6.4f) se(%6.4f) mtitle(`models') r2 sca(r2_w) //在一张表列出上面三组结果
请您及时更换请请请您正在使用的模版将于2周后被下线请您及时更换
stata输出结果命令
1.outreg2 命令 ssc install outreg2 上一步是安装，安装之后即可使用，在你做完回归之后 outreg2 using file1.doc, replace file1是你存储的结果命名

STATA简单命令

STATA的简单命令Stata中最重要的命令莫过于help和search了。

help用于查找精确的命令，而search是模糊查找。

例如：help regress又如：我们记不清regress命令的全名，只记得regress的前半部分reg，那么可以输入search reg用户获得信息最有效的另一个途径是使用Statalist在线论坛，该论坛提供Stata用户交流的一个良好的平台。

要加入Statalist，我们可以给以下地址发个邮件：**************************.edu邮件的内容为：subscribe Statalist变量的命名：1.变量名可达32个字符。

2.字符组成部分为A~Z、a~z、0~9与下划线“_”，这些字符以外的其他符号不可以出现在变量名中。

3.变量名不能以数字开头。

4.变量名区分大小写。

5.倘若遵循以上原则依然无法正常命名变量，那么这个变量可能与Stata自身保留的供系统使用的变量重复了。

创建数据文件的方法：1.手动输入。

2.从excel等文件中复制粘贴到stata数据表中。

3.运用stata软件导入。

查看数据的概貌：summarize xcodebook x如果上面两个命令后面不加内容，那么显示的结果是所有变量的概貌。

对数据进行排序的命令：sort 标准1 标准2 标准3生成数据的命令：gen1.如果要得到一阶差分，可以用以下命令：gen Difference_invest（新变量的名称是任意的）=d.invest（d.是运算符号，不得改变；invest是变量名称）2.要想产生一个新的变量Lag_invest，也就是invest的一阶滞后，那么我们可以采用如下命令：gen Lag_invest = l.invest3.生成对数的命令：gen Ln_invest=ln(invest)作散点图的命令：scatter1.scatter x1 x2：scatter后的第一个变量是纵轴的变量，第二个变量是横轴的变量。

STATA的简单命令

STATA的简单命令Stata中最重要的命令莫过于help和search了。

help用于查找精确的命令，而search是模糊查找。

要加入Statalist，我们可以给以下地址发个邮件：majordomo@邮件的内容为：subscribe Statalist变量的命名：1.变量名可达32个字符。

2.字符组成部分为A~Z、a~z、0~9与下划线“_”，这些字符以外的其他符号不可以出现在变量名中。

3.变量名不能以数字开头。

4.变量名区分大小写。

5.倘若遵循以上原则依然无法正常命名变量，那么这个变量可能与Stata自身保留的供系统使用的变量重复了。

创建数据文件的方法：1.手动输入。

2.从excel等文件中复制粘贴到stata数据表中。

3.运用stata软件导入。

查看数据的概貌：summarize xcodebook x如果上面两个命令后面不加内容，那么显示的结果是所有变量的概貌。

计量经济学stata命令汇总

计量经济学stata命令汇总1. 数据处理与描述性统计summarize 变量1 变量2…计算变量的均值、中位数等统计量tabulate 变量1 变量2…制表histogram 变量画单变量直方图scatter 变量1 变量2…画双变量散点图graph twoway 程序名变量1 变量2…绘制双变量图形sort 变量按照变量排序by 变量: 命令按照变量拆分数据并执行命令replace 变量=表达式替换变量中的值generate 新变量=表达式生成新变量egen 新变量=函数(变量) 生成新变量2. 回归分析regress 因变量自变量1 自变量2…普通最小二乘回归reg 相关变量,robust 异方差鲁棒性回归logit 因变量自变量1 自变量2…二元Logit模型probit 因变量自变量1 自变量2…二元Probit模型tobit 因变量自变量1 自变量2… 截尾变量（下界或上界）cens(下界或上界) 截尾Tobit模型heckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程变量名称=接收权值做二阶段回归Heckman选择模型pheckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程经验Bayes做二阶段回归Pooled Heckman选择模型xtset 变量1 变量2…指定面板数据xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano间隔估计xtlogit 因变量自变量1 自变量2…, fe面板Logit模型xtprobit 因变量自变量1 自变量2…, fe面板Probit模型3. 时间序列分析dfuller 变量单位根检验tsset 变量指定时间序列数据tsline 变量绘制时间序列图arma 阶数, lags(*laglist*) ARMA过程估计arima 阶数, lags(*laglist*) 差分阶数(*diff*) 现有模型(*model*) ARIMA模型估计arch hq/aic, lags(*laglist*) ARCH模型估计garch q=p o=r t=m, arch(q) garch(p) GARCH模型估计ivregress （2SLS）因变量自变量1（内生变量）编号=gmm/cluster(varname) 内生变量外生变量IV或2SLS回归分析4. 面板数据分析&横截面数据分析xtsum 等对面板数据的描述统计量xttest0 2个变量计算相对于H0的t值，考虑了异方差和面板数据结构（前提是两个变量符合随机效应或固定效应假设）xttobit 因变量自变量1 自变量2… 下界 cens(下界或上界)面板Tobit模型xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano面板回归模型xtlogit/xtprobit 因变量自变量1 自变量2…, fe面板分类模型5. 高级统计方法cluster 变量聚类分析pca 变量1 变量2…, components(4)主成分分析mvreg 因变量向量1 向量2…, clustervar(cluster)多元回归及聚类分析multilevel 因变量自变量1 自变量2…, mle 内部命令（通常是cov）多层线性模型分析glm 因变量自变量1 自变量2…, family(binomial) 连接函数(logit/probit) 难以观察到自变量（即随机拦截模型）其他选项广义线性模型分析heckprob/reg3 因变量自变量1 自变量2… 等随机效应模型分析。

Stata常用命令

Stata常用命令大学期间觉得学的最有用的软件之一就是stata了，对stata基本是在血和泪的尝试中爬过，到了最后基本属于只要stata不出现红字错误命令就开心得不得了。

顺便整理一下常用的stata命令如下，应该对付计量方向第一学期的入门问题不大（求stata大神不虐..），所以就只写了一部分常用的，有时间后面再补充吧。

主要就是分为基本操作和回归统计两部分：1、基本操作import/use/insheet/merge：基本常用的导入文件就是这四个了，建议直接从stata的menu菜单中导入，导入xlsx和csv这种常见的格式时还有一些备用选项可以自己体验一下（比如string和把第一行视为变量名之类）。

merge需要单独说一下，因为是将两个数据库合并为一个，原理也比较简单，两个数据库中根据一些相同的变量把其他数据“加”到原来的数据库中，也是建议直接菜单操作，不要用命令。

在Data的Combine datasets的merge two datasets中，分为1:1、m:1、1:m各种形式，基本用两次就差不多能搞懂。

help：一定第一个学的是这个！啥不会就help一下，不知道函数了就help function，不知道回归细节就help regress，多读help文件！gen/egen:最常用的建立函数的命令，这两个不同之处在于gen一般是初等函数，egen的函数会复杂一些。

常用的函数包括数学函数和其他函数，比如count/tag之类，建议直接到菜单里Data下Create data的create new variable或create new variable(extended)直接生成函数，会方便的多。

mean/abs/sqrt/max/min/sum/sd：常用数学函数，分别是求均值、绝对值、方根、最大最小、求和、方差用的。

keep if/drop if：这两个也是最常用的，在数据需要进行筛选的时候，两个命令的区别也很明显，keep是留下哪些，drop是去掉哪些。

stata 常用命令

stata 常用命令Stata是一个流行的统计分析软件，广泛应用于各个领域的数据分析和研究。

它提供了丰富的命令和功能，可帮助用户处理、分析和可视化数据。

在本文中，我将向您介绍一些常用的Stata命令，以及它们在数据分析中的应用。

1. 数据导入与导出在使用Stata进行数据分析之前，我们需要将数据导入软件环境中。

Stata支持多种数据格式，如Excel、CSV、SPSS等。

对于Excel数据，我们可以使用命令"import excel"将数据导入到Stata中；对于CSV数据，可以使用"import delimited"命令。

Stata还提供了"export"命令，可将分析结果导出为Excel、CSV等格式，便于与其他软件进行交互。

2. 数据清洗与处理在数据分析过程中，数据清洗是一个重要的步骤。

Stata提供了一系列命令来处理和净化数据。

"drop"命令可以删除数据集中的变量或观察值；"replace"命令用于修改变量的取值；"gen"命令可以创建新的变量等。

"merge"命令可用于合并不同数据集，"sort"命令可用于排序数据等。

3. 描述性统计分析Stata提供了简单而强大的描述性统计分析命令，帮助用户了解数据的基本特征。

"summarize"命令可用于计算变量的均值、标准差等统计量；"tabulate"命令可用于制作交叉分类表；"histogram"命令可绘制变量的直方图等。

这些命令使我们能够更好地理解数据的分布和特征。

4. 统计模型估计Stata是一个强大的统计软件，支持各种常见的统计模型估计。

"regress"命令可用于进行线性回归分析；"logit"命令可用于二元逻辑回归分析；"heckman"命令可用于处理选择模型等。

stata语法

Stata语法简介Stata是一种常用的统计分析软件，具有强大的数据管理和统计功能。

本文将详细介绍Stata的基本语法和常用命令，以帮助读者快速上手使用Stata进行数据分析和统计建模。

安装和启动Stata1.安装Stata软件：首先，需要从Stata官网下载并安装Stata软件。

按照安装向导进行操作，完成安装过程。

2.启动Stata软件：双击桌面上的Stata图标，或者在开始菜单中找到Stata程序，点击打开。

基本语法Stata的基本语法遵循以下几个规则： 1. 命令不区分大小写：Stata中的命令不区分大小写，例如summarize和SUMMARIZE是等效的。

2. 命令以英文句点（.）结尾：在Stata中，每条命令都要以英文句点结尾。

例如，使用summarize命令计算变量的描述统计信息，应该输入summarize varname.。

3. 使用分号（;）分隔多个命令：如果需要在一行中输入多个命令，可以使用分号进行分隔。

例如，clear; use filename表示先清除当前的数据，然后使用指定的数据文件。

4. 使用斜杠（/）表示换行：当命令太长时，可以使用斜杠表示换行。

例如，summarize varname1 varname2 / varname3 varname4表示对变量varname1和varname2进行描述统计，并对变量varname3和varname4进行描述统计。

数据管理Stata提供了丰富的数据管理功能，包括数据导入、数据清洗、数据变换等。

数据导入使用Stata导入数据的常用命令有： - use：使用指定的数据文件，例如use mydata.dta。

- import excel：导入Excel文件，例如import excel "myfile.xlsx",sheet("Sheet1") firstrow clear。

- import delimited：导入文本文件，例如import delimited "mydata.csv", clear.数据清洗Stata提供了多种数据清洗工具，例如： - drop：删除指定的变量，例如drop varname。

Stata基本命令

Stata基本命令一、描述性统计命令：sum(var1 var2)二、独立样本t检验命令：ttest var1, by(group)三、回归（一）检测变量是否需要加对数1、C-D方程中基本都要加对数，除了0-1的小数和离散变量命令：gen lnvar1=log(var1)，若var1有零值，则gen lnvar1=log(var1+1) 2、其他方程的变量检测（1）sktest var1，若PT(skewness)>0.05，则呈正态分布，不用加对数（2）ladder var1，若P(chi2)越大，就选这种形式。

（二）构建面板数据命令：xtset county year（三）回归1、随机效应模型命令：xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re 2、固定效应模型（地区变量不需要放进去）命令：xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe3、随机效应模型和固定效应模型的结果只能两者选其一，方法是Hausman检验，做法如下：第一步：固定效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe第二步：存储固定效应值 est store fe第三步：随机效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re第四步：存储随机效应值 est store re第五步：检测 hausman fe re，看prob>chi2的结果，若显著，则选择固定效应模型。

（一般都是选择固定效应模型）四、注意数据的保存和命令的保存Do命令的保存，可以使用英文的””在里面加注释。

零基础小白STATA数据分析实用常见命令整理

STATA基础入门零基础实用命令整理第一章数据的读入与熟悉1.读入文件中的部分变量. use[变量] using [文件名]Eg . use age sex height weight using [文件名]2.读入文件中的部分观察量. use[文件名] in X/Y. use "I:\stata\chapter3.dta" in 601/1000软件只读入从第601个观察到第1000个观察之间的400个观察量3.描述、管理数据的基本命令命令功能. describe描述数据的基本情况：样本总量、变量总数、变量的格式等. list. list [变量名]－列出数据中所有变量的分布，从第一个样本到最后一个样本－列出选定变量的分布. list [变量名] in X/Y 列出数据中被选定的变量分布。

in限定数据的观察值范围。

比如，若只想查看第100个-200个观察值的分布，则将X/Y替换成100/200. order [变量名]按选定变量排序。

比如，样本的编号、年龄、性别、教育程度，……，等. aorder 将所有变量从 a-z 排序. label variable给变量贴上标签命令功能. sort [变量名] －将某个变量的数值进行排序。

一般情况下，排序的方式是从小到大－可同时排序多个变量－Stata将缺失值描述为最大数值，故排列在最后. sort [变量名] [in] 对某些变量的某个取值范围进行排序；没有指定的取值范围保持在原地方. gsort [+|-][变量名] －可从小到大和从大到小－若变量名前没有任何符号或加上+号，则按升序排列；若在变量名前加上－号，则按降序排列－变量可以是数值型、也可以是字符型. gsort [+|-][变量名] ，mfirst －mfirst指定将缺失值置于所有有效数值之前. gsort -age第二章变量的生成与处理1.离散和连续测量离散方式（discrete measure）：由定性测量和定序测量组成；适用于低层次数据连续方式（continuous measure）：由定距测量和定比测量组成。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2命令语句
2.1掌握命令语句的格式
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
注：[ ]表示可有可无的项,显然只有command是必不可少的，下面结合例子分项来讲解命令的各个组成部分。

2.2命令command
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] . use auto, clear//打开美国汽车数据文件auto.dta,后面的clear表示先清除内
存中可能存在的数据集
. summarize /*很多命令可单独使用，单独使用时，一般是对所有变量进
行操作，等价于后面加上代表所有变量的_all。

*/ . summarize _all //注意到该命令输出结果与上一个命令完全一样
. sum //与前一命令等价，sum为summarize的略写
. su // su是summarize的最简化略写，不能再简化为s
. s //简写前提是不引起混淆。

执行这个命令将出现错误信息
注意，在用list做练习的时候可能会遇到结果窗口停止，其右下角出现一个蓝色的“more ‘,按键盘上任何一个键，屏幕滚动一行。

这一现象与第一讲中“set more on”的设置有关，请参考1.6.1
2.3变量varlist
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
varlist表示一个变量，或者多个变量，多个变量之间用空格隔开。

. use auto, clear
. sum price //求价格的观察值个数，平均值，方差，最小值和最大值. su p //变量和命令均可略写,注意到两个结果完全一样
. su t //分数据中有两个变量的开首字母为t（trunk和turn），所以
STATA认为t为模糊的省略。

m ambiguous abbreviation 红色为错误信息
. sum trunk turn //求trunk和turn变量的五数概略统计
. su t* //等价于前一命令，以t开首的所有变量可用t*来表示。

2.4 分类操作by varlist
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
先看下面的例子,在汽车数据集中，有一个变量foreign，该变量表示某个车是进口车（1 Foreign）还是国产车（0 Domestic）。

如果我们需要知道车的平均价格和重量，则
. use auto, clear
. sum price weight
*如果需要分别知道国产车和进口车的价格和重量，可以采用分类操作来求得，
. by foreign: sum price weight //分别计算国产车和进口车的价格和重量
但如果执行下面两个命令，将出现错误*/
. sort price //按价格从低到高重新排序
. by foreign: sum price weight
*not sorted
/* 系统提示没有排序，这是因为by varlist在执行时要求内存中的数据是按照by 后面的变量排序的。

当我们用sort price重新排序后，就打乱了原来按照foreign的排序，所以出现了错误提示。

更正的办法是：*/
. sort foreign //按国产车和进口车排序
. by foreign: sum price weight
*更简略的方式是把两个命令用一个组合命令来写。

. by foreign, sort: sum price weight
如果不想从小到大排序，而是从大到小排序，其命令为gsort。

. sort - price //按价格从高到低排序
. sort foreign -price /*先把国产车都排在前，进口车排在后面，然后
在国产车内容再按价格从大小到排序，在进口车
内部，也按从大到小排序*/
2.5 赋值及运算=exp
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
该选项主要用于给新变量赋值或替换原变量的值
例：生成一个新的价格变量nprice，该变量的取值为原汽车价格变量price的基础上涨价10元
. use auto, clear
. gen nprice=price+10//生成新变量nprice，其值为price+10
. list price nprice//比较一下两个变量
/*上面的命令generate(略写为gen) 生成一个新的变量，新的变量的变量名为nprice,新的价格在原价格的基础上均增加了10元。

. replace nprice=nprice-10/*命令replace则直接改变原变量的赋值，
Nprice调减后与price变量取值相等*/ . list price nprice//再比较一下两个变量，相等。

检验上表中的运算符，di是display命令的略写
. di 4-2 //输出2
. di 3*5 //输出15
. di 8/2 //8除以2，输出4
. di 2^3 //2的立方，输出8
. di –(2+3^(2-3))/sqrt(2*3) //特号运算优先，想一想，结果应为多少？
. di 3<5 //输出结果为1，意味着3小于5为真
. di 3>5 //输出的结果为0，意味着3大于5为假。

2.6 条件表达式if exp
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
例：只查看国产车的品牌和价格，则加入筛选条件if foreign==0 */ . use auto, clear
. list make price if foreign==0
*只查看价格超过1万元的进口车（同时满足两个条件），则
. list make price if foreign==1 & price>10000
*查看价格超过1万元或者进口车（两个条件任满足一个）
. list make price if foreign==1 |price>10000
*分类型查看价格超过1万元的汽车的品德和价格
. by foreign, sort: list make price if price>10000
2.7 范围筛选in range
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
如果要计算较低的前10台车的平均价格，则要先按价格排序，然后仅对前10个车的价格求平均值
. sysuse auto, clear
. sort price
. sum price in 1/5
注意“1/5”中，斜杠不是除号，而是从1到5的意思，即1，2，3，4，5。

如果要计算前10台车中的国产车的平均价格，则可将范围和条件筛选联合使用。

. sum price in 1/10 if foreign==0
2.8 加权weight
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
下表是2005年湖北省高考640分及以上成绩一分一段的人数统计，第一列score 为高考分数，第二列num为该分数段的人数。

现在我们要求640分及以上考生的
操作：
先将上面的表格复制，然后进入STATA，执行如下命令
. clear //清空STATA
. edit
然后把光标定位在表格的第一行第一列，点右键，选择粘贴（paste），上表数。