Stata讲义精要-聂辉华

合集下载

Stata讲义

expand和contract的用法
• 该命令可以把数据库按照要求进行扩展。 • use score,clear • sum score • sum score [weight=number] • edit • expand number • edit • sum score • contract score [缺省的情况下，做频数，当然也
– collapse price mpg,by(foreign) 国产车和进口车分别计算均值，当然也可以计算方差等。
• 注意：
– 该命令对数据有巨大的破坏作用，尽量不用 save, replace
– 在实际应用中，该命令常跟outsheet一起使用
– outsheet using mean.xls
• save数据保存命令
– save,replace
• erase 删除数据命令
– 一定要加上扩展名
• describe 数据一般描述命令 • codebook 展示各变量情况的命令 • sum 展示各变量数量情况的命令 • generate 生成新变量命令 • rename 变量重命名命令 • drop 删除变量或观察值的命令 • keep 保留变量或观察值的命令 • sort 对某些变量按观察值大小进行排序的命令
– 两个数据库都要排序。 – _merge的含义同上。有的时候这个变量很管用。
collapse命令的用法
• 这个命令非常有用，一定要记住。它可以直接得到绝大多数变量的常用统计量。
– use auto,clear – sum price mpg – collapse price mpg – collapse (mean) price mpg – collapse (sd) price – collapse (mean) price (sd) mpg – collapse (mean) price (sd) sdprice=price

Stata讲义精要-聂辉华

5
二、数据管理
变量管理：对变量进行改变最重要的是产生新变量的命令generate or gen or g 表示运算的符号：等于、加、减、乘、除、乘方、指数、对数、滞后、领先和差分分别对应于=, +, -, *, / ,^ , exp, log, l., f., d.）。表示逻辑关系的符号：&表示and，|表示or，!= 表示不等，= =表示相等。表示大小关系的符号：>，<，>=，<=。表示条件关系的命令：if
四、计量分析
5、动态面板数据（Dynamic Panel Data）方程右边包含了因变量的滞后项（可以推广到多阶滞后），因此称之为动态面板模型。估计方法为GMM，包括差分GMM和系统 GMM 命令结构为：xtabond2 depvar varlist [if exp] [in range] [weight] [, level(#) twostep robust noconstant small noleveleq orthogonal gmmopt [gmmopt ...] ivopt [ivopt ...] artests(#) arlevels h(#) nodiffsargan nomata]
15
Cont’d
其他选项的说明：
level(#)表明了置信度，默认值为95% beta 表示去均值和标准差之后的beta系数 noconstant 无截距项回归 robust 产生一致性的标准差 (Huber/White/sandwich)
其它回归命令多方程回归：for var y1-y10 z1-z5:reg x x1x22，因变量分别为y1-y10 z1-z5，自变量均为 x1-x22，共有15个回归方程。分年度回归：by year: reg y x1 x2

STATA基本操作入门PPT课件

第8页/共23页
6.2查看变量的统计特征
• 如果要查看满足q≥10000的子样本的统计指标。方法：输入summarize q if q >=10000 • 或者su q if q >=10000
第9页/共23页
6.3 查看变量的统计特征
• 如果要查看更多的统计指标 • 方法：输入 su q,detail • 显示了百分位数，方差，偏度与峰度
第21页/共23页
9.6 图像合并展示
• 将线性拟合和二次拟合这两个图像在一起展示 • 方法:输入graph combine scatter1.gph scatter2.gph
第22页/共23页
谢谢您的观看！
第23页/共23页
第10页/共23页
6.4 查看变量的统计特征
• 如果summarize 后面不输入具体变量，则展示所有变量的统计指标 • 方法：输入summarize 或 su
第11页/共23页
7.经验累积分布函数
• 如果要查看q的经验累积分布函数 • 方法：tabulate q 或则 ta q
第12页/共23页
• 展示满足q>=10000的q的数据 • 方法：list q if q >=10000 • 展示满足q>=10000的q和tc的数据 • 方法：list q tc if q >=10000
第7页/共23页
6.1查看变量的统计特征
• 查看变量q的统计特征： • 方法：输入summarize q 或 su q • 展示变量q的样本容量，平均值，标准差，最小值，最大值
8.相关系数
• 如果要显示PL,PF两个变量的相关系数 • 方法：pwcorr pl pf
第13页/共23页

Stata教程剖析

第一章 Stata 概貌§1.1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件，由美国计算机资源中心（Computer Resource Center）研制。

从1985至1998的十四年时间里，已连续推出1.1，1.2，1.3，1.4，1.5，……及2.0，2.1，3.0，3.1，4.0，5.0，6.0等多个版本，通过不断更新和扩充，内容日趋完善。

它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点，又在许多方面别具一格。

Stata融汇了上述程序的优点，克服了各自的缺点，使其功能更加强大，操作更加灵活、简单，易学易用，越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间，输出结果简洁，所选方法先进，内容较齐全，制作的图形十分精美，可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力1.Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。

对640k内存的微机，3.1版本的Stata可以管理2400个记录×99个变量，并随计算机扩展内存的增加而增加；对4.0的WINDOWS版本，Stata可以管理4800个记录×99个变量；对WINDOWS 95下的5.0版本，可根据计算机的配置情况设置变量数和记录数，如32M扩展内存的计算机，可处理2千万个数据。

变量数和记录数可以互相交易（trade），即减少记录数可以增加变量数，减少变量数可以增加记录数。

2.可以将分组变量转换成指示变量(哑变量)，将字符串变量映射成数字代码。

3.可以对数据文件进行横向和纵向链接，可以将行数据转为列数据，或反之。

4.可以恢复、修改执行过的命令。

5.可以利用数值函数或字符串函数产生新变量。

6.可以从键盘或磁盘读入数据。

二、 Stata的统计功能Stata的统计功能很强，除了传统的统计分析方法外，还收集了近20年发展起来的新方法，如Cox比例风险回归，指数与Weibull回归，多类结果与有序结果的logistic回归，Poisson回归、负二项回归及广义负二项回归，随机效应模型等。

STATA_讲义

STATA 讲义目录Stata入门教程：Stata概貌Stata 第一章数据输入，存盘和调用文件命令以及数据管理命令Stata第二章描述性统计命令与输出结果说明Stata第三章正态检验与作图命令Stata第四章 t检验和单因素方差分析（上）Stata第四章 t检验和单因素方差分析（下）Stata第五章多组计量资料比较的非参数检验命令与输出结果说明Stata第六章卡方检验Stata第七章相关分析Stata第八章单因素生存分析Stata第九章多因素方差分析命令与输出结果说明Stata第十章线性回归和逐步回归命令和输出结果说明Stata第十一章 Logistic回归分析命令与输出结果说明Stata第十二章 Cox回归分析命令与输出结果说明第一章 Stata 概貌§1.1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件，由美国计算机资源中心（Computer Resource Center）研制。

从1985至1998的十四年时间里，已连续推出1.1，1.2，1.3，1.4，1.5，……及2.0，2.1，3.0，3.1，4.0，5.0，6.0等多个版本，通过不断更新和扩充，内容日趋完善。

它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点，又在许多方面别具一格。

Stata融汇了上述程序的优点，克服了各自的缺点，使其功能更加强大，操作更加灵活、简单，易学易用，越来越受到人们的重视和欢迎。

一、 Stata的数据管理能力1. Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。

stata讲义

Stata介绍作为流行的计量经济学软件，Stata的功能十分地全面和强大。

可以毫不夸张地说，凡是成熟的计量经济学方法，在Stata中都可以找到相应的命令，而这些命令都有许多选项以适应不同的环境或满足不同的需要。

即使是最详细的Stata手册，也难免有遗珠之憾，更何况本文仅是一个粗浅的介绍。

掌握Stata最好的办法是在实践中学习：Stata 本身提供了非常强大的帮助系统，并且关于Stata的书籍和网络资源都不少。

本文拟根据如下顺序介绍Stata：1．界面；2．文件和数据；3．语法和命令；4．数据管理；5．描述统计；6．画图；7．回归和回归分析；8．常用命令。

第3和第4部分是最体现Stata灵活性的地方，也是应用Stata的基础。

第5和第6部分介绍如何用Stata完成基本的统计功能。

Stata的功能很多，比如回归，曲线拟合，生存分析，主成分分析，因子分析，聚类分析，时间序列分析等等。

但回归无疑是其中最重要的功能。

第7部分介绍如何用Stata作线性回归和Logistic回归。

本文第2和第3部分包含了作者的观点，难免有偏颇之处。

其余部分主要来自文献的归纳和总结。

限于水平有限，错误在所难免，敬请原谅。

1．界面图1 Stata界面Stata有4个窗口：1． Stata Command（右下）用于向Stata输入命令；2． Stata Results（右上）用于显示运行结果；3． Review（左上）记录使用过的命令；4． Variables（左下）显示当前memory中的所有变量。

窗口上方是工具栏，其上的按钮依次为（从左到右）Open, Save, Print Graph/Print Log, Log Start/Stop/Suspend, Bring Log to Front, Bring Graph to Front, Do-file Editor, Data Editor, Data Browser, Clear –more- condition, Break。

高级计量经济学讲义（北大CCER）--STATA_NOTE

STATA BASIC COMMANDS(notes for Junsoo Lee)I. BASICclearset memory 80mcd c:cd \work\statainsheet using water.txtsave water.dta* use water.dtalog using water, replacesummarize _alldescribe _allII. MORE on BASICMemoryC:\stata\wstata /k5000C:\stata\wstata /k5000 set matsize 100C:\stata\wstata /k5000 run c:\data\profile.doData filesInfile x1 x2 x3 using test.txt* only text fileInsheet x1 x2 x3 using text.txt* if saved by spreadsheetsave test, replacesave test, appenduse testlistdescribeLog FileLog using test.logLog using test.log, replaceLog using test.log, appendLog closeLog using test.log, noprocBreakCtrl-K Ctrl-breakRegressionRegress y x1 x2Predict yhatRegress y x1 x2, robustvce* variance-covariancevce, corrmatrix v = get(vce)coeff & predgent asif = _b[const] + _b[ed]*ed + _b[tenure]*tenure testregress y x1 x2test x1 = x2* b1 = b2joint restrictionstest 2*(x1+x2) = 3*x3test x4+x5 = 0, accum* two joint restrictionslr testregress y x1 x2lrtest, saving(0)regress y x1 x2 x3lrtestnon-linear restrictionsregress y x1 x2 x3eq one: 3*_b[x2]^2 = _b[x3]eq two: _b[x3] / _b[x2] = 2testnl one twoBy region: regress y x1 x2By foreign: regress y x1 x2Graph y x1 x2 if foreign ==0, correct(.1) symbol(oi)Graph y x1 x2 if foreign ==1, correct(.1) symbol(oi)t-testttest mpg, by(foreign)* Ho: diff = 0 where foreign is a dummy variableCii 97 24 6* n=97 mean=24 std=6 95 c.i.ttest 97 24 6 22* test Ho: mu = 22ListList x1 if x2 > 20List x1 – x5List x1 x2 if x4 > 10 | (x5>3 & x6 > 10)* ~ = not equal & and | or ~ not >= greater than or equal SortSort mpgCreating new variablesgen lx1 = ln(x1)* if same variable is uses, use “replace”.replace x1 = x1 / 1000Gen x3 = 1.05 * x1 if foreign == 0Replace x3 = 1.20 * x1 if foreign == 1ClearDrop _allMoreSet more offSet more onDescriptive statistics SummarizeSum if mpg > 20Sum if foreign == 0Sum x1, detailBy region: summarize x1 x2 CountCount if x == 1Count if y = float(1.1)* precision issueTabulateTab foreignTab x2 foreignTab x2 foreign, chi2* Pearson chi-square test (df=n-1) CorrelateCorr x1 x2Corr x1 x2 if foreign == 0GraphGraph x1 x2Sort foreignGraph x1 x2, by(foreign) total* three graphs; 0, 1, totalTutorial introTutorial graphicsTutorial survivalTutorial logitLong Line* semi-colon should be used.#delimit;summarize x1 x2if foreign == 1;gen x3 = x1 + x2;#delimit crDo fileDo myjobDo myjob.doDo myjob, nostop* don’t stop even with errorsBatch Jobs* at DOSc:\stata\wstata /b do bigjob.doADO filesWhich fitType c:\stata\ado\f\fit.adoType c:\stata\ado\f\fit.hlpThree places to putOfficial C:\stata\adoPersonal C:\adoCurrent .Global S_ADO “C\stata\ado;d:\ado;.”* to refine pathsmacro list S_ADOCDCd d:Cd \work\dataCd “\work\detailed data”Lags and LeadsGen xlag1 = x[_n-1]Gen xlead1 = x[_n+1]Procedures (Program)Program define helloDisplay “hi there”EndDo helloScoreProbit y x1, x2, score(u)* will be stored in UPoisson Regression (Example provided by Todd)#delimit ;* Poisson regression (Ex. 5.3, Greene, p. 208); * For Junsoo Lee;input id y x ;1 6 1.5;2 7 1.8;3 4 1.8;4 10 2.0;5 10 1.3;6 6 1.6;7 4 1.2;8 7 1.9;9 2 1.8;10 3 1.0;11 6 1.4;12 5 0.5;13 3 0.8;14 3 1.1;15 4 0.7;end;list;* Poisson regression;poisson y x ;Poisson MLE (Example provided by David/Todd)clearinsheet using c:\temp\poisson_data.txtlog using c:\temp\poisson_output.log, replace/* this is the "canned" routine that estimates the poisson regression */ poisson y x/* this maximizes lnL directly, using logged factorial of y */program define poisreg1args lnf thetaquietly replace `lnf' = -exp(`theta') + $ML_y1*(`theta') - lnfact($ML_y1) endml model lf poisreg1 (y=x)ml maximize/* this maximizes lnL directly, using the logged gamma function */program define poisreg2version 6args lnf thetaquietly replace `lnf' = -exp(`theta') + $ML_y1*(`theta') - lngamma($ML_y1 + 1)endml model lf poisreg2 (y=x)ml maximizePanel Estimationclearset memory 40mset more offset matsize 350log using panel.log, replaceuse panel.dta, cleartsset state yearregress y x1 x2 state2-state51 yr82-yr95xtivreg y l1.y x1 x2 yr82-yr95 (l.y = l2.y), i(state) fextivreg y l1.y x1 x2 yr82-yr95 (l.y = l2.y), i(state) fdxtivreg y l1.y x1 x2 yr82-yr95 (l.y = l2.y), i(state) re ec2slsxtabond y x1 x2 yr82-yr95, lags(1)xtabond y x1 x2 yr82-yr95, lags(1) twostep log closeOn-line HelpH weibullHelp for ^brier^。

Stata操作讲义_经济学_高等教育_教育专区

Stata操作讲义第一讲Stata操作入门第一节概况Stata最初由美国计算机资源中心（Computer Resource Center）研制，现在为Stata公司的产品，其最新版本为7.0版。

它操作灵活、简单、易学易用，是一个非常有特色的统计分析软件，现在已越来越受到人们的重视和欢迎，并且和SAS、SPSS一起，被称为新的三大权威统计软件。

Stata最为突出的特点是短小精悍、功能强大，其最新的7.0版整个系统只有10M左右，但已经包含了全部的统计分析、数据管理和绘图等功能，尤其是他的统计分析功能极为全面，比起1G以上大小的SAS系统也毫不逊色。

另外，由于Stata在分析时是将数据全部读入内存，在计算全部完成后才和磁盘交换数据，因此运算速度极快。

由于Stata的用户群始终定位于专业统计分析人员，因此他的操作方式也别具一格，在Windows席卷天下的时代，他一直坚持使用命令行／程序操作方式，拒不推出菜单操作系统。

但是，Stata的命令语句极为简洁明快，而且在统计分析命令的设置上又非常有条理，它将相同类型的统计模型均归在同一个命令族下，而不同命令族又可以使用相同功能的选项，这使得用户学习时极易上手。

更为令人叹服的是，Stata语句在简洁的同时又拥有着极高的灵活性，用户可以充分发挥自己的聪明才智，熟练应用各种技巧，真正做到随心所欲。

除了操作方式简洁外，Stata的用户接口在其他方面也做得非常简洁，数据格式简单，分析结果输出简洁明快，易于阅读，这一切都使得Stata成为非常适合于进行统计教学的统计软件。

Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件（ADO文件），这些文件可以自行修改、添加和下载。

用户可随时到Stata网站寻找并下载最新的升级文件。

事实上，Stata的这一特点使得他始终处于统计分析方法发展的最前沿，用户几乎总是能很快找到最新统计算法的Stata程序版本，而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

22
Cont’d
Hausman检验 xtreg y x1 x2, fe est store fixed xtreg y x1 x2, re hausman fixed . 若卡方概率小于0.05，则用固定效应模型（原假设为FE和RE不存在系统性差别）
23
18
Cont’d
1.4 回归诊断检验多重共线性：vif，方差膨胀因子（均值小于10）检验异方差：hettest，BP检验；或者 whitetst，怀特检验其它检验：dwstat，durbina， bgodfrey，但它们仅用于时间序列，不可用于横截面数据。
19
STATA讲义精要
基于互联网材料改编
中国人民大学聂辉华
2011.2.26

1
一、STATA简介
1、Stata9.0及以上版本优点：（1）运算速度非常快；（2）简单与灵活性兼备（命令与编程）；（3）更新速度快，可扩展性强（自行下载更新）；（4）面板数据和离散模型的分析功能非常强大，特别适用于微观计量经济学。缺点：数据限制，非线性估计的直观性，做图功能差
16
Cont’d
1.2预测命令：predict [type] newvarname [if exp] [,statistic]，其中的statistic常用的有以下几种：
– xb 因变量的拟合值； – resid 产生残差序列，可命名为e或uhat – stdf 残差的标准差 – covratio 产生协方差比 – dfbeta(varname) 衡量某一观测值加入前后对回归系
11
三、统计分析
1、描述性统计 (1)描述：sum var1 var2, detail，详细描述变量的观测值个数、均值、标准差等基本统计特征（其它选项参考help命令）。分类描述：by year: sum var1 var3 (2)列表描述：tab或tabstat。例如， tabstat lwage educ, stats(mean median sum max min sd var skewness kurtosis)

4
二、数据管理
录入数据：点击菜单栏中的Data editor，可以手工录入数据，并更改变量名称或属性，然后点击菜单栏中的 Save，保存为默认的.dta格式。读取已有数据：using c:\aa.dta（或者通过菜单file-open 打开）。从Excel中复制数据：选定并复制数据后，打开Stata的 Data editor，在左上角第一个框内ctrl+v。导入其它格式的数据：使用Stata transfer软件，可以将各种格式的数据转换为.dta（Stata专用）格式文件。变量名称最好用英文字母，因为有时转换后会丢失中文，或者变成var1、var2等。

14
四、计量分析
1、线性回归分析 1.1 语法格式：regress depvar [varlist] [weight] [if exp] [in range] [,level(#)] beta noconstant robust] 所有命令的格式通常都是：命令被解释变量解释变量条件范围，选项；具体参见help中的reg 例如: reg y x1 x2 if y>50,robust
10
二、数据管理
(10)进行数字计算（计算器）：disp 10^(1/3)，对10开三次方 (11)（按时间）纵向合并两个数据库： – use file1 – sort varname1 – save “xx.dat” – use file2 – sort varname1 – append using file2 这样就把文件2合并到文件1的后面，前提是两者有相同的变量，合并增加了观测值的个数。横向合并：最后一行命令改为：merge varname1 using file1
3
一、STATA简介
3、网络帮助资源
(1)Stata 公司主页上有相关的帮助信息。 /support/faqs/, /links/resources.html, 是一些常见的问题和相关的资源。 (2)UCLA 网站上有大量的例子可供参考。 /stata/。 (3)Boston college 经济系有相关的程序文件可以下载使用。 http://ideas.uqam.ca/ideas/data/bocbocode.html，有些有限制。 (4)其他资源：/stats/stata 。这些网络资源非常重要，在上述网页上可以搜索到许多STATA中所没有的程序。
8
二、数据管理
(4)计算观测值个数：count if var>=10，if后面的条件可选 (5)排序: sort var1 var2（默认为升序）。 (6)改名：rename var1 var2，将变量1改为2。 (7)替换：replace var1=var2 [if] ，对变量重新赋值。 (8)recode var2 1=2 5= 6 *=3，修改变量2中的值，如1改为2，5改为6，其余各值改为3。
21
四、计量分析
4、面板数据（panel data）编制面板：tsset id time，当然横轴也可以是地区、行业或其它维度命令结构：在reg之前加xt，例如xtreg、 xtlogit、xtivreg等固定效应模型：xtreg y x1 x2, fe 随机效应模型：xtreg y x1 x2, re，缺少选项默认为随机效应模型
四、计量分析
5、动态面板数据（Dynamic Panel Data）方程右边包含了因变量的滞后项（可以推广到多阶滞后），因此称之为动态面板模型。估计方法为GMM，包括差分GMM和系统 GMM 命令结构为：xtabond2 depvar varlist [if exp] [in range] [weight] [, level(#) twostep robust noconstant small noleveleq orthogonal gmmopt [gmmopt ...] ivopt [ivopt ...] artests(#) arlevels h(#) nodiffsargan nomata]

5
二、数据管理
变量管理：对变量进行改变最重要的是产生新变量的命令generate or gen or g 表示运算的符号：等于、加、减、乘、除、乘方、指数、对数、滞后、领先和差分分别对应于=, +, -, *, / ,^ , exp, log, l., f., d.）。表示逻辑关系的符号：&表示and，|表示or，!= 表示不等，= =表示相等。表示大小关系的符号：>，<，>=，<=。表示条件关系的命令：if
9
二、数据管理
(9)通过其他方式产生新变量：产生均值或总值：by id: egen y=total(x)或by id: egen mx=mean(x) 产生单个虚拟变量：gen x=(age>60)，大于60 岁的赋值为1，否则为0。产生系列虚拟变量：xi[, prefix(string)] i.year，生成诸如1999y、2000y等。将文字格式转换为数值格式：encode/destring var1, replace
12
Cont’d
相关性分析：corr or pwcorr。例如，cor y x1 x2 x3，就生成了相关系数矩阵。偏相关性分析：pcorr。例如，pwcorr x y z, sig star(0.01)，可以观察相关度是否在 1%的水平上显著 t检验：ttest x, by(treatment) ，其中 treatment为虚拟变量
20
四、计量分析
3、工具变量工具变量的思想与两阶段OLS类似命令结构为：ivreg depvar [var1] (var2 = var_iv) [if] [in] [weight] [, options]，此时 var_iv是var2的工具变量此时通常需要进行内生性检验（残差检验）以及过度识别检验
四、计量分析
2、非线性回归分析限值因变量模型：logit/probit y x1 x2，此时因变量为二元虚拟变量截断模型：tobit y x1 x2，此时因变量为超过某个临界值的数值计数模型：poisson，此时因变量为离散的正数多元限值因变量模型：mlogit/ologit 以上命令详见Stata之help
6
二、数据管理
生成序列号id 非面板序列：sort var1，然后gen id=_n; 面板序列：先是sort var1，然后根据相同的var1再顺序赋予id，即egen id=group(var1)，然后排列成面板，tsset id year。或者在录入时，按照id1、 time1，id2、time2的顺’d
1.3 各种基本检验 test varlist (F检验) test indepvarname (t检验) test indepvar1=indepvar2[=indepvar3….] 举例：test x1 x2，检验x1和x2是否同时为0，等价于x1＝x2＝0 详见help中的test
2
一、STATA简介
2、学习使用可以通过工具栏操作，但最好输入命令（只认小写英文），按回车键运行 Stata的命令起始语通常可以简写为前三个字母，如regress与reg等同设定内存
set memory 500m, perm set maxvar 1000
充分利用工具栏的help，尤其是其中的Stata command或search
7
二、数据管理
解释与应用
(1)生成新变量: gen x2=(x1+10)/2，gen lnx=log(x)，gen l_x=l.x， gen y=x^2。 (2)列举：list [variablenames] in n1/n2，列出数据库中变量从第n1到第n2个观测值。 list [variablenames] in n1/l，列出从第n1到最后一个的观测值。 list if salary>=5000，列出工资超过5000的观测值。 (3)删除：drop if salary==. | salary==0，删除某些观测值。 (4)保留：keep if year>2008，保留2008年以后的观测值；keep var1 var2 var4，只保留变量1、2、4。