STATA入门2 命令语句
STATA常用命令大全

STATA 常用命令大全调整变量格式:format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐合并数据:use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge using "C:\Documents and Settings\xks\桌面\1999.dta"——将1999和2006的数据按照样本(observation)排列的自然顺序合并起来use "C:\Documents and Settings\xks\桌面\2006.dta", clearmerge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort——将1999和2006的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort)建议采用第一种方法。
对样本进行随机筛选:sample 50在观测案例中随机选取50%的样本,其余删除sample 50,count在观测案例中随机选取50个样本,其余删除查看与编辑数据:browse x1 x2 if x3>3 (按所列变量与条件打开数据查看器)edit x1 x2 if x3>3 (按所列变量与条件打开数据编辑器)数据合并(merge)与扩展(append)merge表示样本量不变,但增加了一些新变量;append表示样本总量增加了,但变量数目不变。
stata输出结果命令

建议使用outreg2命令。比如你得到一个模型结果。那在reg y x 后加est store model1,然后再使用outreg2 [model1] using tab01,word replace se tdec(3) bdec(3)即可。具体可Help outreg2命令看看。祝好运~
2.esttab命令 无论什么检验、回归等,均可使用esttab命令(附加star选项)将不同显著性水平标成不同数量星号。以回归结果为例: use test1.dta xtset province year local xx "aggci ln_realgdp indus open urban" xtdpdsys theil `xx', twostep est store sys_gmm reg theil L.theil `xx',robust est store ols xtreg theil L.theil `xx',robust fe est store fe local models "sys_gmm ols fe" esttab `models', star(* 0.1 ** 0.05 *** 0.01) b(%6.4f) se(%6.4f) mtitle(`models') r2 sca(r2_w) //在一张表列出上面三组结果
请您及时更换请请请您正在使用的模版将于2周后被下线请您及时更换
stata输 出 结 果 命 令
1.outreg2 命令 ssc install outreg2 上一步是安装,安装之后即可使用,在你做完回归之后 outreg2 using file1.doc, replace file1是你存储的结果命名
STATA简单命令

STATA的简单命令Stata中最重要的命令莫过于help和search了。
help用于查找精确的命令,而search是模糊查找。
例如:help regress又如:我们记不清regress命令的全名,只记得regress的前半部分reg,那么可以输入search reg用户获得信息最有效的另一个途径是使用Statalist在线论坛,该论坛提供Stata用户交流的一个良好的平台。
要加入Statalist,我们可以给以下地址发个邮件:**************************.edu邮件的内容为:subscribe Statalist变量的命名:1.变量名可达32个字符。
2.字符组成部分为A~Z、a~z、0~9与下划线“_”,这些字符以外的其他符号不可以出现在变量名中。
3.变量名不能以数字开头。
4.变量名区分大小写。
5.倘若遵循以上原则依然无法正常命名变量,那么这个变量可能与Stata自身保留的供系统使用的变量重复了。
创建数据文件的方法:1.手动输入。
2.从excel等文件中复制粘贴到stata数据表中。
3.运用stata软件导入。
查看数据的概貌:summarize xcodebook x如果上面两个命令后面不加内容,那么显示的结果是所有变量的概貌。
对数据进行排序的命令:sort 标准1 标准2 标准3生成数据的命令:gen1.如果要得到一阶差分,可以用以下命令:gen Difference_invest(新变量的名称是任意的)=d.invest(d.是运算符号,不得改变;invest是变量名称)2.要想产生一个新的变量Lag_invest,也就是invest的一阶滞后,那么我们可以采用如下命令:gen Lag_invest = l.invest3.生成对数的命令:gen Ln_invest=ln(invest)作散点图的命令:scatter1.scatter x1 x2:scatter后的第一个变量是纵轴的变量,第二个变量是横轴的变量。
STATA的简单命令

STATA的简单命令Stata中最重要的命令莫过于help和search了。
help用于查找精确的命令,而search是模糊查找。
例如:help regress又如:我们记不清regress命令的全名,只记得regress的前半部分reg,那么可以输入search reg用户获得信息最有效的另一个途径是使用Statalist在线论坛,该论坛提供Stata用户交流的一个良好的平台。
要加入Statalist,我们可以给以下地址发个邮件:majordomo@邮件的内容为:subscribe Statalist变量的命名:1.变量名可达32个字符。
2.字符组成部分为A~Z、a~z、0~9与下划线“_”,这些字符以外的其他符号不可以出现在变量名中。
3.变量名不能以数字开头。
4.变量名区分大小写。
5.倘若遵循以上原则依然无法正常命名变量,那么这个变量可能与Stata自身保留的供系统使用的变量重复了。
创建数据文件的方法:1.手动输入。
2.从excel等文件中复制粘贴到stata数据表中。
3.运用stata软件导入。
查看数据的概貌:summarize xcodebook x如果上面两个命令后面不加内容,那么显示的结果是所有变量的概貌。
对数据进行排序的命令:sort 标准1 标准2 标准3生成数据的命令:gen1.如果要得到一阶差分,可以用以下命令:gen Difference_invest(新变量的名称是任意的)=d.invest(d.是运算符号,不得改变;invest是变量名称)2.要想产生一个新的变量Lag_invest,也就是invest的一阶滞后,那么我们可以采用如下命令:gen Lag_invest = l.invest3.生成对数的命令:gen Ln_invest=ln(invest)作散点图的命令:scatter1.scatter x1 x2:scatter后的第一个变量是纵轴的变量,第二个变量是横轴的变量。
计量经济学stata命令汇总

计量经济学stata命令汇总1. 数据处理与描述性统计summarize 变量1 变量2…计算变量的均值、中位数等统计量tabulate 变量1 变量2…制表histogram 变量画单变量直方图scatter 变量1 变量2…画双变量散点图graph twoway 程序名变量1 变量2…绘制双变量图形sort 变量按照变量排序by 变量: 命令按照变量拆分数据并执行命令replace 变量=表达式替换变量中的值generate 新变量=表达式生成新变量egen 新变量=函数(变量) 生成新变量2. 回归分析regress 因变量自变量1 自变量2…普通最小二乘回归reg 相关变量,robust 异方差鲁棒性回归logit 因变量自变量1 自变量2…二元Logit模型probit 因变量自变量1 自变量2…二元Probit模型tobit 因变量自变量1 自变量2… 截尾变量(下界或上界)cens(下界或上界) 截尾Tobit模型heckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程变量名称=接收权值做二阶段回归Heckman选择模型pheckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程经验Bayes做二阶段回归Pooled Heckman选择模型xtset 变量1 变量2…指定面板数据xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano间隔估计xtlogit 因变量自变量1 自变量2…, fe面板Logit模型xtprobit 因变量自变量1 自变量2…, fe面板Probit模型3. 时间序列分析dfuller 变量单位根检验tsset 变量指定时间序列数据tsline 变量绘制时间序列图arma 阶数, lags(*laglist*) ARMA过程估计arima 阶数, lags(*laglist*) 差分阶数(*diff*) 现有模型(*model*) ARIMA模型估计arch hq/aic, lags(*laglist*) ARCH模型估计garch q=p o=r t=m, arch(q) garch(p) GARCH模型估计ivregress (2SLS)因变量自变量1(内生变量)编号=gmm/cluster(varname) 内生变量外生变量IV或2SLS回归分析4. 面板数据分析&横截面数据分析xtsum 等对面板数据的描述统计量xttest0 2个变量计算相对于H0的t值,考虑了异方差和面板数据结构(前提是两个变量符合随机效应或固定效应假设)xttobit 因变量自变量1 自变量2… 下界 cens(下界或上界)面板Tobit模型xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano面板回归模型xtlogit/xtprobit 因变量自变量1 自变量2…, fe面板分类模型5. 高级统计方法cluster 变量聚类分析pca 变量1 变量2…, components(4)主成分分析mvreg 因变量向量1 向量2…, clustervar(cluster)多元回归及聚类分析multilevel 因变量自变量1 自变量2…, mle 内部命令(通常是cov)多层线性模型分析glm 因变量自变量1 自变量2…, family(binomial) 连接函数(logit/probit) 难以观察到自变量(即随机拦截模型)其他选项广义线性模型分析heckprob/reg3 因变量自变量1 自变量2… 等随机效应模型分析。
Stata常用命令

Stata常用命令大学期间觉得学的最有用的软件之一就是stata了,对stata基本是在血和泪的尝试中爬过,到了最后基本属于只要stata不出现红字错误命令就开心得不得了。
顺便整理一下常用的stata命令如下,应该对付计量方向第一学期的入门问题不大(求stata大神不虐..),所以就只写了一部分常用的,有时间后面再补充吧。
主要就是分为基本操作和回归统计两部分:1、基本操作import/use/insheet/merge:基本常用的导入文件就是这四个了,建议直接从stata的menu菜单中导入,导入xlsx和csv这种常见的格式时还有一些备用选项可以自己体验一下(比如string和把第一行视为变量名之类)。
merge需要单独说一下,因为是将两个数据库合并为一个,原理也比较简单,两个数据库中根据一些相同的变量把其他数据“加”到原来的数据库中,也是建议直接菜单操作,不要用命令。
在Data的Combine datasets的merge two datasets中,分为1:1、m:1、1:m各种形式,基本用两次就差不多能搞懂。
help:一定第一个学的是这个!啥不会就help一下,不知道函数了就help function,不知道回归细节就help regress,多读help文件!gen/egen:最常用的建立函数的命令,这两个不同之处在于gen一般是初等函数,egen的函数会复杂一些。
常用的函数包括数学函数和其他函数,比如count/tag之类,建议直接到菜单里Data下Create data的create new variable或create new variable(extended)直接生成函数,会方便的多。
mean/abs/sqrt/max/min/sum/sd:常用数学函数,分别是求均值、绝对值、方根、最大最小、求和、方差用的。
keep if/drop if:这两个也是最常用的,在数据需要进行筛选的时候,两个命令的区别也很明显,keep是留下哪些,drop是去掉哪些。
stata 常用命令
stata 常用命令Stata是一个流行的统计分析软件,广泛应用于各个领域的数据分析和研究。
它提供了丰富的命令和功能,可帮助用户处理、分析和可视化数据。
在本文中,我将向您介绍一些常用的Stata命令,以及它们在数据分析中的应用。
1. 数据导入与导出在使用Stata进行数据分析之前,我们需要将数据导入软件环境中。
Stata支持多种数据格式,如Excel、CSV、SPSS等。
对于Excel数据,我们可以使用命令"import excel"将数据导入到Stata中;对于CSV数据,可以使用"import delimited"命令。
Stata还提供了"export"命令,可将分析结果导出为Excel、CSV等格式,便于与其他软件进行交互。
2. 数据清洗与处理在数据分析过程中,数据清洗是一个重要的步骤。
Stata提供了一系列命令来处理和净化数据。
"drop"命令可以删除数据集中的变量或观察值;"replace"命令用于修改变量的取值;"gen"命令可以创建新的变量等。
"merge"命令可用于合并不同数据集,"sort"命令可用于排序数据等。
3. 描述性统计分析Stata提供了简单而强大的描述性统计分析命令,帮助用户了解数据的基本特征。
"summarize"命令可用于计算变量的均值、标准差等统计量;"tabulate"命令可用于制作交叉分类表;"histogram"命令可绘制变量的直方图等。
这些命令使我们能够更好地理解数据的分布和特征。
4. 统计模型估计Stata是一个强大的统计软件,支持各种常见的统计模型估计。
"regress"命令可用于进行线性回归分析;"logit"命令可用于二元逻辑回归分析;"heckman"命令可用于处理选择模型等。
stata语法
Stata语法简介Stata是一种常用的统计分析软件,具有强大的数据管理和统计功能。
本文将详细介绍Stata的基本语法和常用命令,以帮助读者快速上手使用Stata进行数据分析和统计建模。
安装和启动Stata1.安装Stata软件:首先,需要从Stata官网下载并安装Stata软件。
按照安装向导进行操作,完成安装过程。
2.启动Stata软件:双击桌面上的Stata图标,或者在开始菜单中找到Stata程序,点击打开。
基本语法Stata的基本语法遵循以下几个规则: 1. 命令不区分大小写:Stata中的命令不区分大小写,例如summarize和SUMMARIZE是等效的。
2. 命令以英文句点(.)结尾:在Stata中,每条命令都要以英文句点结尾。
例如,使用summarize命令计算变量的描述统计信息,应该输入summarize varname.。
3. 使用分号(;)分隔多个命令:如果需要在一行中输入多个命令,可以使用分号进行分隔。
例如,clear; use filename表示先清除当前的数据,然后使用指定的数据文件。
4. 使用斜杠(/)表示换行:当命令太长时,可以使用斜杠表示换行。
例如,summarize varname1 varname2 / varname3 varname4表示对变量varname1和varname2进行描述统计,并对变量varname3和varname4进行描述统计。
数据管理Stata提供了丰富的数据管理功能,包括数据导入、数据清洗、数据变换等。
数据导入使用Stata导入数据的常用命令有: - use:使用指定的数据文件,例如use mydata.dta。
- import excel:导入Excel文件,例如import excel "myfile.xlsx",sheet("Sheet1") firstrow clear。
- import delimited:导入文本文件,例如import delimited "mydata.csv", clear.数据清洗Stata提供了多种数据清洗工具,例如: - drop:删除指定的变量,例如drop varname。
Stata基本命令
Stata基本命令一、描述性统计命令:sum(var1 var2)二、独立样本t检验命令:ttest var1, by(group)三、回归(一)检测变量是否需要加对数1、C-D方程中基本都要加对数,除了0-1的小数和离散变量命令:gen lnvar1=log(var1),若var1有零值,则gen lnvar1=log(var1+1) 2、其他方程的变量检测(1)sktest var1,若PT(skewness)>0.05,则呈正态分布,不用加对数(2)ladder var1,若P(chi2)越大,就选这种形式。
(二)构建面板数据命令:xtset county year(三)回归1、随机效应模型命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re 2、固定效应模型(地区变量不需要放进去)命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe3、随机效应模型和固定效应模型的结果只能两者选其一,方法是Hausman检验,做法如下:第一步:固定效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe第二步:存储固定效应值 est store fe第三步:随机效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re第四步:存储随机效应值 est store re第五步:检测 hausman fe re,看prob>chi2的结果,若显著,则选择固定效应模型。
(一般都是选择固定效应模型)四、注意数据的保存和命令的保存Do命令的保存,可以使用英文的””在里面加注释。
零基础小白STATA数据分析实用常见命令整理
STATA基础入门零基础实用命令整理第一章数据的读入与熟悉1.读入文件中的部分变量. use[变量] using [文件名]Eg . use age sex height weight using [文件名]2.读入文件中的部分观察量. use[文件名] in X/Y. use "I:\stata\chapter3.dta" in 601/1000软件只读入从第601个观察到第1000个观察之间的400个观察量3.描述、管理数据的基本命令命令功能. describe描述数据的基本情况:样本总量、变量总数、变量的格式等. list. list [变量名]-列出数据中所有变量的分布,从第一个样本到最后一个样本-列出选定变量的分布. list [变量名] in X/Y 列出数据中被选定的变量分布。
in限定数据的观察值范围。
比如,若只想查看第100个-200个观察值的分布,则将X/Y替换成100/200. order [变量名]按选定变量排序。
比如,样本的编号、年龄、性别、教育程度,……,等. aorder 将所有变量从 a-z 排序. label variable给变量贴上标签命令功能. sort [变量名] -将某个变量的数值进行排序。
一般情况下,排序的方式是从小到大-可同时排序多个变量-Stata将缺失值描述为最大数值,故排列在最后. sort [变量名] [in] 对某些变量的某个取值范围进行排序;没有指定的取值范围保持在原地方. gsort [+|-][变量名] -可从小到大和从大到小-若变量名前没有任何符号或加上+号,则按升序排列;若在变量名前加上-号,则按降序排列-变量可以是数值型、也可以是字符型. gsort [+|-][变量名] ,mfirst -mfirst指定将缺失值置于所有有效数值之前. gsort -age第二章变量的生成与处理1.离散和连续测量离散方式(discrete measure):由定性测量和定序测量组成;适用于低层次数据连续方式(continuous measure):由定距测量和定比测量组成。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2命令语句
2.1掌握命令语句的格式
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
注:[ ]表示可有可无的项,显然只有command是必不可少的,下面结合例子分项来讲解命令的各个组成部分。
2.2命令command
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] . use auto, clear//打开美国汽车数据文件auto.dta,后面的clear表示先清除内
存中可能存在的数据集
. summarize /*很多命令可单独使用,单独使用时,一般是对所有变量进
行操作,等价于后面加上代表所有变量的_all。
*/ . summarize _all //注意到该命令输出结果与上一个命令完全一样
. sum //与前一命令等价,sum为summarize的略写
. su // su是summarize的最简化略写,不能再简化为s
. s //简写前提是不引起混淆。
执行这个命令将出现错误信息
注意,在用list做练习的时候可能会遇到结果窗口停止,其右下角出现一个蓝色的“more ‘,按键盘上任何一个键,屏幕滚动一行。
这一现象与第一讲中“set more on”的设置有关,请参考1.6.1
2.3变量varlist
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
varlist表示一个变量,或者多个变量,多个变量之间用空格隔开。
. use auto, clear
. sum price //求价格的观察值个数,平均值,方差,最小值和最大值. su p //变量和命令均可略写,注意到两个结果完全一样
. su t //分数据中有两个变量的开首字母为t(trunk和turn),所以
STATA认为t为模糊的省略。
m ambiguous abbreviation 红色为错误信息
. sum trunk turn //求trunk和turn变量的五数概略统计
. su t* //等价于前一命令,以t开首的所有变量可用t*来表示。
2.4 分类操作by varlist
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
先看下面的例子,在汽车数据集中,有一个变量foreign,该变量表示某个车是进口车(1 Foreign)还是国产车(0 Domestic)。
如果我们需要知道车的平均价格和重量,则
. use auto, clear
. sum price weight
*如果需要分别知道国产车和进口车的价格和重量,可以采用分类操作来求得,
. by foreign: sum price weight //分别计算国产车和进口车的价格和重量
但如果执行下面两个命令,将出现错误*/
. sort price //按价格从低到高重新排序
. by foreign: sum price weight
*not sorted
/* 系统提示没有排序,这是因为by varlist在执行时要求内存中的数据是按照by 后面的变量排序的。
当我们用sort price重新排序后,就打乱了原来按照foreign的排序,所以出现了错误提示。
更正的办法是:*/
. sort foreign //按国产车和进口车排序
. by foreign: sum price weight
*更简略的方式是把两个命令用一个组合命令来写。
. by foreign, sort: sum price weight
如果不想从小到大排序,而是从大到小排序,其命令为gsort。
. sort - price //按价格从高到低排序
. sort foreign -price /*先把国产车都排在前,进口车排在后面,然后
在国产车内容再按价格从大小到排序,在进口车
内部,也按从大到小排序*/
2.5 赋值及运算=exp
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
该选项主要用于给新变量赋值或替换原变量的值
例:生成一个新的价格变量nprice,该变量的取值为原汽车价格变量price的基础上涨价10元
. use auto, clear
. gen nprice=price+10//生成新变量nprice,其值为price+10
. list price nprice//比较一下两个变量
/*上面的命令generate(略写为gen) 生成一个新的变量,新的变量的变量名为nprice,新的价格在原价格的基础上均增加了10元。
. replace nprice=nprice-10/*命令replace则直接改变原变量的赋值,
Nprice调减后与price变量取值相等*/ . list price nprice//再比较一下两个变量,相等。
检验上表中的运算符,di是display命令的略写
. di 4-2 //输出2
. di 3*5 //输出15
. di 8/2 //8除以2,输出4
. di 2^3 //2的立方,输出8
. di –(2+3^(2-3))/sqrt(2*3) //特号运算优先,想一想,结果应为多少?
. di 3<5 //输出结果为1,意味着3小于5为真
. di 3>5 //输出的结果为0,意味着3大于5为假。
2.6 条件表达式if exp
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
例:只查看国产车的品牌和价格,则加入筛选条件if foreign==0 */ . use auto, clear
. list make price if foreign==0
*只查看价格超过1万元的进口车(同时满足两个条件),则
. list make price if foreign==1 & price>10000
*查看价格超过1万元或者进口车(两个条件任满足一个)
. list make price if foreign==1 |price>10000
*分类型查看价格超过1万元的汽车的品德和价格
. by foreign, sort: list make price if price>10000
2.7 范围筛选in range
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
如果要计算较低的前10台车的平均价格,则要先按价格排序,然后仅对前10个车的价格求平均值
. sysuse auto, clear
. sort price
. sum price in 1/5
注意“1/5”中,斜杠不是除号,而是从1到5的意思,即1,2,3,4,5。
如果要计算前10台车中的国产车的平均价格,则可将范围和条件筛选联合使用。
. sum price in 1/10 if foreign==0
2.8 加权weight
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
下表是2005年湖北省高考640分及以上成绩一分一段的人数统计,第一列score 为高考分数,第二列num为该分数段的人数。
现在我们要求640分及以上考生的
操作:
先将上面的表格复制,然后进入STATA,执行如下命令
. clear //清空STATA
. edit
然后把光标定位在表格的第一行第一列,点右键,选择粘贴(paste),上表数。