stata常用作图指令包你满意

合集下载

Stata常用命令

Stata常用命令大学期间觉得学的最有用的软件之一就是stata了，对stata基本是在血和泪的尝试中爬过，到了最后基本属于只要stata不出现红字错误命令就开心得不得了。

顺便整理一下常用的stata命令如下，应该对付计量方向第一学期的入门问题不大（求stata大神不虐..），所以就只写了一部分常用的，有时间后面再补充吧。

主要就是分为基本操作和回归统计两部分：1、基本操作import/use/insheet/merge：基本常用的导入文件就是这四个了，建议直接从stata的menu菜单中导入，导入xlsx和csv这种常见的格式时还有一些备用选项可以自己体验一下（比如string和把第一行视为变量名之类）。

merge需要单独说一下，因为是将两个数据库合并为一个，原理也比较简单，两个数据库中根据一些相同的变量把其他数据“加”到原来的数据库中，也是建议直接菜单操作，不要用命令。

在Data的Combine datasets的merge two datasets中，分为1:1、m:1、1:m各种形式，基本用两次就差不多能搞懂。

help：一定第一个学的是这个！啥不会就help一下，不知道函数了就help function，不知道回归细节就help regress，多读help文件！gen/egen:最常用的建立函数的命令，这两个不同之处在于gen一般是初等函数，egen的函数会复杂一些。

常用的函数包括数学函数和其他函数，比如count/tag之类，建议直接到菜单里Data下Create data的create new variable或create new variable(extended)直接生成函数，会方便的多。

mean/abs/sqrt/max/min/sum/sd：常用数学函数，分别是求均值、绝对值、方根、最大最小、求和、方差用的。

keep if/drop if：这两个也是最常用的，在数据需要进行筛选的时候，两个命令的区别也很明显，keep是留下哪些，drop是去掉哪些。

STATA最常用命令大全

statasave命令FileSave As例1. 表1.为某一降压药临床试验数据，试从键盘输入Stata，并保存为Stata格式文件。

STATA数据库的维护排序SORT 变量名1 变量名2 ……变量更名rename 原变量名新变量名STATA数据库的维护删除变量或记录drop x1 x2 /* 删除变量x1和x2drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5)drop if x<0 /* 删去x1<0的所有记录drop in 10/12 /* 删去第10~12个记录drop if x==. /* 删去x为缺失值的所有记录drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录drop _all /* 删掉数据库中所有变量和数据STATA的变量赋值用generate产生新变量generate 新变量＝表达式generate bh=_n /* 将数据库的内部编号赋给变量bh。

generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序，依次产生5个1，5个2，5个3……。

直到数据库结束。

generate block=mod(_n,6) /* 按当前数据库的顺序，依次产生1,2,3,4,5,0。

generate y=log(x) if x>0 /* 产生新变量y，其值为所有x>0的对数值log(x)，当x<=0时，用缺失值代替。

egen产生新变量set obs 12egen a=seq() /*产生1到N的自然数egen b=seq(),b(3) /*产生一个序列，每个元素重复＃次egen c=seq(),to(4) /*产生多个序列，每个序列从1到＃egen d=seq(),f(4)t(6) /*产生多个序列，每个序列从#1到＃2encode 字符变量名，gen(新数值变量名)作用：将字符型变量转化为数值变量。

stata命令大全(全)

*--> R-sq: overall corr{x_it*b_w,y_it}A2
*
*-- F(4,373) = 855.93检验除常数项外其他解释变量的联合显著性
*-- corr(u_i, Xb)=-0.2347
*-- sigma_u, sigma_e, rho
* rho = sigma_uA2/(sigma_uA2+sigma_eA2)
*空间计量分析：SLM模型与SEM模型
*说明：STATA与Matlab结合使用。常应用于空间溢出效应（R&D）、财政分权、地方政府公共行为等。
、常用的数据处理与作图
*指定面板格式
xtset id year（id为截面名称，year为时间名称）
xtdes /*数据特征*/
xtsum logy h /*数据统计特征*/
drop if id==2/*注意用==*/
*如何得到连续year或id编号（当完成上述操作时, 为形成panel格式，需要用egen命令）
ege n year_ new二group（year）
xtset id year_ new
**保留变量或保留观测值
keep inv /*删除变量*/
**或
keep if year==2000
dis e(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)
个体效应是否显著?
*F(28,373) =338.86 HO: al=a2 = a3 = a4 = a29
*Prob > F = 0.0000表明，固定效应高度显著
*---如何得到调整后的R2即adj-R2?
ereturn list
考虑中国29个省份的C-D生产函数

有趣的stata指令

有趣的stata指令有趣的Stata指令：让数据分析更有趣Stata是一款强大的数据分析软件，拥有丰富的指令和功能。

在这篇文章中，我将介绍一些有趣的Stata指令，让你的数据分析过程更加有趣和高效。

1. “egen”指令：创建自定义变量“egen”指令可以用来创建自定义变量，这给了我们很大的灵活性。

例如，我们可以使用“egen”指令计算一个变量的总和、平均值、标准差等统计量，或者根据条件创建新的变量。

这样，我们可以根据自己的需求灵活地处理数据。

2. “graph”指令：绘制漂亮的图表数据可视化是数据分析过程中非常重要的一环。

Stata的“graph”指令可以帮助我们绘制各种各样的图表，如散点图、直方图、折线图等。

我们可以根据需要调整图表的样式、颜色、标签等，使图表更加漂亮和易于理解。

3. “collapse”指令：数据聚合当我们需要对大量数据进行分组汇总时，可以使用“collapse”指令。

该指令可以按照指定的变量进行分组，并对其他变量进行聚合操作，如计算平均值、总和等。

这样，我们可以更加方便地进行数据分析和比较。

4. “reshape”指令：数据重塑当数据的结构不符合我们的分析需求时，可以使用“reshape”指令进行数据重塑。

该指令可以将数据从宽格式转换为长格式，或者从长格式转换为宽格式，以便更好地进行数据分析和处理。

5. “tabulate”指令：频数统计在数据分析中，我们经常需要计算某个变量的频数和比例。

Stata 的“tabulate”指令可以帮助我们快速计算变量的频数、比例和交叉表等。

这样，我们可以更好地了解数据的分布情况和特征。

6. “egenmore”指令：扩展egen功能Stata的“egenmore”指令是一个额外的命令集，可以扩展egen的功能。

它包含了许多有用的统计指标和变换函数，如rank、percentile等。

使用这些指令，我们可以更加方便地进行复杂的数据处理和分析。

stata常用作图指令包你满意

S tata tata 作图常用指令作图常用指令作图常用指令1.1.茎叶图茎叶图茎叶图stem x1,line(2)（做x1的茎叶图，每一个十分位的树茎都被拆分成两段来显示，前半段为0～4，后半段为5～9）stem x1,width(2)（做x1的茎叶图，每一个十分位的树茎都被拆分成五段来显示，每个小树茎的组距为2）stem x1,round(100)（将x1除以100后再做x1的茎叶图）2.2.直方图直方图直方图 histogram mpg, discrete frequency normal xlabel(1(1)5)（discrete 表示变量不连续，frequency 表示显示频数，normal 加入正太分布曲线，xlabel 设定x 轴，1和5为极端值，(1)为单位）histogram price, fraction norm（fraction 表示y 轴显示小数，除了frequency 和fraction 这两个选择之外，该命令可替换为“percent”百分比，和“density”密度；未加上discrete 就表示将price 当作连续变量来绘图）histogram price, percent by(foreign)（按照变量“foreign”的分类，将不同类样本的“price”绘制出来，两个图分左右排布）histogram mpg, discrete by(foreign, col(1))（按照变量“foreign”的分类，将不同类样本的“mpg”绘制出来，两个图分上下排布）histogram mpg, discrete percent by(foreign, total) norm（按照变量“foreign”的分类，将不同类样本的“mpg”绘制出来，同时绘出样本整体的“总”直方图）3.3.二变量图二变量图二变量图graph twoway lfit price weight || scatter price weight（作出price和weight的回归线图——“lfit”，然后与price和weight的散点图相叠加）twoway scatter price weight,mlabel(make)（做price和weight的散点图，并在每个点上标注“make”，即厂商的取值） twoway scatter price weight || lfit price weight,by(foreign)（按照变量foreign的分类，分别对不同类样本的price和weight做散点图和回归线图的叠加，两图呈左右分布）twoway scatter price weight || lfit price weight,by(foreign,col(1))（按照变量foreign的分类，分别对不同类样本的price和weight做散点图和回归线图的叠加，两图呈上下分布）twoway scatter price weight [fweight= displacement],msymbol(oh)（画出price和weight的散点图，“msybol(oh)”表示每个点均为中空的圆圈，[fweight= displacement]表示每个点的大小与displacement的取值大小成比例）twoway connected y1 time, yaxis(1) || y2 time, yaxis(2)（画出y1和y2这两个变量的时间点线图，并将它们叠加在一个图中，左边“yaxis(1)”为y1的度量，右边“yaxis(2)”为y2的）twoway line y1 time,yaxis(1) || y2 time,yaxis(2)（与上图基本相同，就是没有点，只显示曲线）graph twoway scatter var1 var4 || scatter var2 var4 || scatter var3 var4（做三个点图的叠加）graph twoway line var1 var4 || line var2 var4 || line var3 var4（做三个线图的叠加）graph twoway connected var1 var4 || connected var2 var4 || connected var3 var4（叠加三个点线相连图）更多变量4.4.更多变量更多变量graph matrix a b c y（画出一个散点图矩阵，显示各变量之间所有可能的两两相互散点图）graph matrix a b c d,half（生成散点图矩阵，只显示下半部分的三角形区域）graph matrix price mpg weight length,half by( foreign,total col(1) ) （根据foreign变量的不同类型绘制price等四个变量的散点图矩阵，要求绘出总图，并上下排列）其他图形5.5.其他图形其他图形graph box y,over(x) yline(.22)（对应x的每一个取值构建y的箱型图，并在y轴的0.22处划一条水平线） graph bar (mean) y,over(x)对应x的每一个取值，显示y的平均数的条形图。

stata常用命令-数据处理-基本绘图

stata常用命令-数据处理-基本绘图cd //change directory 改变原有路径，即设置本次工作的存储位置cd "E:\研二第一学期==\孙老师，空间分析==\空间分析，结课论文==\maoyu\maoyu" //修改原有路径doedit //打开某个dofiledoedit D:\stata11\ado\personal\Net_course_A\A1_intro.do //完整路径doedit A1_intro.do //部分路径，当该文件在当前工作目录中do //执行某个写好的dofile文件do E:\maoyu\myron.dodo D:\stata11\profile.doshellout //打开工作目录中的某个文件shellout Stata_A_dofiles.pdfshellout E:\suns\A.xlsshellout "E:\suns\A.xls"cdout //打开当前工作目录ado // 呈现已经安装的外部命令use //调入数据use "E:\研二第一学期==\孙老师，空间分析==\空间分析，结课论文==\maoyu\maoyu\IndividualA_C2_maoyu.dta",clear//clear 意味着覆盖之前打开的数据clear //清除已经导入的数据sysdir //显示系统目录，如stata安装位置help //打开帮助文档，如help logisticview browse //打开某个网页链接，如view browse "https:///people/78197287/"view browse "/bbs/forum-67-1.html" //人大经济论坛// //两个斜杠代表命令结束，一般在斜杠后作备注/// // 三个斜杠代表换行，一个完整命令与句未结束，下一行接着上一行的Ctrl+D //快速执行当前do文档中的所有命令语句help window manage //界面风格设定帮助Edit-->Preference //界面风格设定按钮选择* //行开头使用星号代表该行处于非命令执行状态，可作文字说明pwd // 显示stata当前工作的路径edit // 打开数据编辑器，可在里面进行复制粘贴，如从excel中复制数据//粘贴时它会提示你是选择第一行作为变量名还是作为数据本身//当然，也可以在数据编辑器里多数据进行手动修改，一般不建议手动修改。

常用stata命令-好用

我常用到的stata命令最重要的两个命令莫过于help和search了。

即使是经常使用stata的人也很难，也没必要记住常用命令的每一个细节，更不用说那些不常用到的了。

所以，在遇到困难又没有免费专家咨询时，使用stata自带的帮助文件就是最佳选择。

stata的帮助文件十分详尽，面面俱到，这既是好处也是麻烦。

当你看到长长的帮助文件时，是不是对迅速找到相关信息感到没有信心？闲话不说了。

help和search都是查找帮助文件的命令，它们之间的区别在于help用于查找精确的命令名，而search是模糊查找。

如果你知道某个命令的名字，并且想知道它的具体使用方法，只须在stata的命令行窗口中输入help空格加上这个名字。

回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。

如果你想知道在stata下做某个估计或某种计算，而不知道具体该如何实现，就需要用search命令了。

使用的方法和help类似，只须把准确的命令名改成某个关键词。

回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。

在列表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。

耐心寻找，反复实验，通常可以较快地找到你需要的内容。

下面该正式处理数据了。

我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。

因为很少有一项实证研究能够一次完成，所以，当你下次继续工作时。

能够重复前面的工作是非常重要的。

有时因为一些细小的不同，你会发现无法复制原先的结果了。

这时如果有记录下以往工作的do文件将把你从地狱带到天堂。

因为你不必一遍又一遍地试图重现做过的工作。

在stata窗口上部的工具栏中有个孤立的小按钮，把鼠标放上去会出现“bring do-file editor to front”，点击它就会出现do文件编辑器。

为了使do文件能够顺利工作，一般需要编辑do文件的“头”和“尾”。

这里给出我使用的“头”和“尾”。

/*（标签。

stata常用命令总结

Stata常用命令总结Stata是一种统计分析软件，广泛用于社会科学、经济学、生物医学等领域的数据分析。

它具有丰富的功能和灵活的数据处理能力，能够进行各种统计分析、数据可视化和模型建立。

本文将总结Stata的常用命令，包括重要观点、关键发现和进一步思考，帮助读者更好地理解和使用Stata。

一、数据导入和处理e命令：用于导入Stata数据文件（.dta）。

2.import命令：用于导入其他格式的数据文件（如Excel、CSV等）。

3.save命令：用于保存当前数据文件。

4.drop命令：用于删除变量或观察值。

5.keep命令：用于保留指定的变量或观察值。

重要观点：在数据导入和处理阶段，要注意数据的完整性和准确性。

需要检查数据的缺失值、异常值和数据类型，做好数据清洗和预处理工作。

二、数据描述和统计分析1.summarize命令：用于计算变量的描述性统计量，如均值、标准差、最大值、最小值等。

2.tabulate命令：用于制作交叉表和列联表。

3.correlate命令：用于计算变量之间的相关系数。

4.regress命令：用于进行线性回归分析。

5.logit命令：用于进行二分类的逻辑回归分析。

重要观点：在进行数据描述和统计分析时，要根据研究问题选择合适的方法和指标。

同时要注意解释统计结果的意义，避免过度解读和误导。

三、数据可视化1.histogram命令：用于绘制直方图。

2.scatter命令：用于绘制散点图。

3.twoway命令：用于绘制多种类型的图形，如线图、柱状图、饼图等。

4.graph export命令：用于将图形导出为图片文件。

重要观点：数据可视化是数据分析的重要手段，能够直观地展示数据的分布和关系。

在进行数据可视化时，要选择合适的图形类型和参数，使图形简洁明了，易于理解和解释。

四、面板数据分析1.xtset命令：用于设置面板数据的时间和单位。

2.xtreg命令：用于进行面板数据的固定效应或随机效应模型分析。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

S tata tata 作图常用指令作图常用指令作图常用指令
1.1.茎叶图茎叶图茎叶图
stem x1,line(2)
（做x1的茎叶图，每一个十分位的树茎都被拆分成两段来显示，前半段为0～4，后半段为5～9）
stem x1,width(2)
（做x1的茎叶图，每一个十分位的树茎都被拆分成五段来显示，每个小树茎的组距为2）
stem x1,round(100)
（将x1除以100后再做x1的茎叶图）
2.2.直方图直方图
直方图 histogram mpg, discrete frequency normal xlabel(1(1)5)
（discrete 表示变量不连续，frequency 表示显示频数，normal 加入正太分布曲线，xlabel 设定x 轴，1和5为极端值，(1)为单位）
histogram price, fraction norm
（fraction 表示y 轴显示小数，除了frequency 和fraction 这两个选择之外，该命令可替换为“percent”百分比，和“density”密度；未加上discrete 就表示将price 当作连续变量来绘图）
histogram price, percent by(foreign)
（按照变量“foreign”的分类，将不同类样本的“price”绘制出来，两个图分左右排布）
histogram mpg, discrete by(foreign, col(1))
（按照变量“foreign”的分类，将不同类样本的“mpg”绘制出来，两个图分上下排布）
histogram mpg, discrete percent by(foreign, total) norm
（按照变量“foreign”的分类，将不同类样本的“mpg”绘制出来，同时绘出样本整体的“总”直方图）
3.3.二变量图二变量图二变量图
graph twoway lfit price weight || scatter price weight
（作出price和weight的回归线图——“lfit”，然后与price和weight的散点图相叠加）
twoway scatter price weight,mlabel(make)
（做price和weight的散点图，并在每个点上标注“make”，即厂商的取值） twoway scatter price weight || lfit price weight,by(foreign)
（按照变量foreign的分类，分别对不同类样本的price和weight做散点图和回归线图的叠加，两图呈左右分布）
twoway scatter price weight || lfit price weight,by(foreign,col(1))（按照变量foreign的分类，分别对不同类样本的price和weight做散点图和回归线图的叠加，两图呈上下分布）
twoway scatter price weight [fweight= displacement],msymbol(oh)
（画出price和weight的散点图，“msybol(oh)”表示每个点均为中空的圆圈，[fweight= displacement]表示每个点的大小与displacement的取值大小成比例）twoway connected y1 time, yaxis(1) || y2 time, yaxis(2)
（画出y1和y2这两个变量的时间点线图，并将它们叠加在一个图中，左边“yaxis(1)”为y1的度量，右边“yaxis(2)”为y2的）
twoway line y1 time,yaxis(1) || y2 time,yaxis(2)
（与上图基本相同，就是没有点，只显示曲线）
graph twoway scatter var1 var4 || scatter var2 var4 || scatter var3 var4（做三个点图的叠加）
graph twoway line var1 var4 || line var2 var4 || line var3 var4
（做三个线图的叠加）
graph twoway connected var1 var4 || connected var2 var4 || connected var3 var4
（叠加三个点线相连图）
更多变量
4.4.更多变量
更多变量
graph matrix a b c y
（画出一个散点图矩阵，显示各变量之间所有可能的两两相互散点图）
graph matrix a b c d,half
（生成散点图矩阵，只显示下半部分的三角形区域）
graph matrix price mpg weight length,half by( foreign,total col(1) ) （根据foreign变量的不同类型绘制price等四个变量的散点图矩阵，要求绘出总图，并上下排列）
其他图形
5.5.其他图形
其他图形
graph box y,over(x) yline(.22)
（对应x的每一个取值构建y的箱型图，并在y轴的0.22处划一条水平线） graph bar (mean) y,over(x)
对应x的每一个取值，显示y的平均数的条形图。

括号中的“mean”也可换成median、sum等
graph bar a1 a2,over(b) stack
（对应在b的每一个取值，显示a1和a2的条形图，a1和a2是叠放成一根条形柱。

若不写入“stack”，则a1和a2显示为两个并排的条形柱）
graph dot (median)y,over(x)
（画点图，沿着水平刻度，在x的每一个取值水平所对应的y的中位数上打点）qnorm x
（画出一幅分位-正态标绘图）
rchart a1 a2 a2
（画出质量控制R图，显示a1到a3的取值范围）。