stata,输出表格
Stata结果输出常用命令整理

Stata结果输出常用命令整理*1.描述性统计输出结果asdoc sum `varlist', save(Myfile.doc) replace stat(N mean sd min p50 max) dec(3) title(asdoc_Table: Descriptive statistics)sum2docx `varlist' using Myfile.docx,replace stats(N mean(%9.2f) sd(%9.3f)min(%9.2f) median(%9.2f) max(%9.2f)) title(sum2docx_Table: Descriptive statistics) outreg2 using Myfile, sum(detail) replace word eqkeep(N mean sd min p50 max)fmt(f) keep(`varlist') sortvar(wage age grade) title(outreg2_Table: Descriptive statistics)estpost summarize `varlist', detailesttab using Myfile.rtf, cells("count mean(fmt(2)) sd(fmt(2)) min(fmt(2))p50(fmt(2)) max(fmt(2))") noobs compress replace title(esttab_Table: Descriptive statistics)*2分组T 均值检验输出local common_exp "save(Myfile.doc) by(south) stat(obs mean p)"asdoc ttest wage, `common_exp' replace title(asdoc_Table: T_test by group)asdoc ttest age, `common_exp' rowappendasdoc ttest race, `common_exp' rowappendasdoc ttest married, `common_exp' rowappendasdoc ttest grade, `common_exp' rowappendasdoc ttest collgrad, `common_exp' rowappendasdoc ttest union, `common_exp' rowappendt2docx `varlist' using Myfile.docx,replace not by(south) title(t2docx_Table: T_test by group)logout, save(Myfile) word replace: ttable2 `varlist', by(south)estpost ttest `varlist', by(south)esttab using Myfile.rtf, cells("N_1 mu_1(fmt(3)) N_2 mu_2(fmt(3)) b(star fmt(3))") starlevels(* 0.10 ** 0.05 *** 0.01) noobs compress replace title(esttab_Table: T_test by group)*3.相关系数矩阵输出asdoc cor `varlist', save(Myfile.doc) replace nonum dec(3) title(asdoc_Table: correlation coefficient matrix)corr2docx `varlist' using Myfile.docx, replace spearman(ignore) pearson(pw) star title(corr2docx_Table: correlation coefficient matrix)logout, save(Myfile) word replace : pwcorr_a `varlist', star1(0.01) star5(0.05)star10(0.1)estpost correlate `varlist', matrixesttab using Myfile.rtf, unstack not noobs compress nogaps replace star(* 0.1 ** 0.05 *** 0.01) b(%8.3f) p(%8.3f) title(esttab_Table: correlation coefficient matrix)*4.回归结果输出asdoc reg wage age married occupation, save(Myfile.doc) nest replace cnames(OLS-1) rep(se) add(race, no)asdoc reg wage age married collgrad occupation, save(Myfile.doc) nest append cnames(OLS-2) add(race, no)asdoc reg wage age married collgrad occupation race_num*, save(Myfile.doc) nest append add(race, yes) cnames(OLS-3) dec(3) drop(occupation race_num*) stat(r2_a, F, rmse, rss) title(asdoc_Table: regression result)reg wage age married occupationest store m1reg wage age married collgrad occupationest store m2reg wage age married collgrad occupation race_num*est store m3reg2docx m1 m2 m3 using Myfile.docx, replace indicate("race=race_num*")b(%9.2f) se(%7.2f) scalars(r2(%9.3f) r2_a(%9.2f) N) drop(occupation)order(married) title(reg2docx_Table: regression result) mtitles("OLS-1" "OLS-2" "OLS-3")reg wage age married occupationoutreg2 using Myfile, word replace title(outreg2_Table: regression result)ctitle(OLS-1) `subexp' addtext(race, no)reg wage age married collgrad occupationoutreg2 using Myfile, word append ctitle(OLS-2) `subexp' addtext(race, no)reg wage age married collgrad occupation race_num*outreg2 using Myfile, word append ctitle(OLS-3) `subexp' addtext(race, yes)reg wage age married occupationest store m1reg wage age married collgrad occupationest store m2reg wage age married collgrad occupation race_num*est store m3*可利用addest自行增加统计量addest, name("chi2") value(`chi2')addest, textn("Industry") texts("Yes")estadd scalar Hausman= r(chi2),replaceestadd scalar Hausman_Test = r(p),replaceesttab m1 m2 m3 using Myfile.rtf, replace star( * 0.10 ** 0.05 *** 0.01 ) nogaps compress order(married) drop(occupation) b(%20.3f) se(%7.2f) r2(%9.3f) ar2 aic bic obslast scalars(F) indicate("race=race_num*") mtitles("OLS-1" "OLS-2" "OLS-3") title(esttab_Table: regression result)。
【原创汇总】stata中描述性统计表格的输出

【原创汇总】stata中描述性统计表格的输出导读:描述性统计通常对收集来的数据进行直接的频率、频数等描述,描述性统计分析一般对样本的最小值、最大值、平均值、标准偏差等进行分析,这些数据有助于了解样本数据特征,能够清晰的看到各个统计量的分布情况。
本文在stata培训会议的基础上,为大家再次呈现一些新的内容,作为补充。
-outreg-该命令描述为:outreg - reformat and write regression tables to a document file命令格式为outreg [using filename] [, options]将所有变量进行描述分析输出sysuse auto, clear(1978 Automobile Data).outreg2 using daqinxueshu.doc, replace sum(log)更多技能,指定变量,或者筛选,命令如下:以下数据来源于计量经济学服务中心stata论文写作专题中盈余管理数据outreg2 using daqinxueshu.doc, replace sum(log) ///keep(dacc rid tm size size debt14 eps)outreg2 using daqinxueshu3.doc, replace sum(log) ///keep(dacc rid tm size size )outreg2 using daqinxueshu3.doc, replace sum(log) /// keep(dacc rid tm size size ) eqkeep(N mean)outreg2 using daqinxueshu3.doc, replace sum(detail) /// keep(dacc rid tm size size debt14 eps)-描述性分析常用的统计量-mean,均值max,最大值min,最小值sd,标准差variance,方差semean,即sd/√n skewness,偏度kurtosis,峰度p1,第一分位数p5,第五分位数p10,第十分位数p50,中位数median,中位数range,max-min-技能-这个小技能你get到了吗global xx 'y x1 x2 x3 x4 x5 x6' des $xxtabstat $xx, stat(mean sd min max) columns(s) format(%4.2f) (XX已经代表了y x1 x2 x3 x4 x5 x6)tabstat y x1 x2 x3 x4 x5 x6tabstat y x1 x2 x3 x4 x5 x6,stats(mean p50 min max)tabstat y x1 x2 x3 x4 x5 x6, stats(mean med min max) col(s) format(%6.2f)tabstat y x1 x2 x3 x4 x5 x6, s(mean p25 med p75 min max) c(s) f(%6.2f)tabstat y x1 x2 x3 x4 x5 x6 , s(mean p25 med p75 min max) c(s) f(%6.2f) by(。
stata频数分布表的命令

Stata频数分布表的命令引言在统计学中,频数分布表是一种用于展示数据分布情况的表格。
它将样本数据按照不同取值或者取值区间进行分类,并统计每个类别中的观测频数和频率。
频数分布表能够帮助我们更好地理解数据的分布特征,揭示样本的集中趋势、离散程度以及可能存在的异常值。
在Stata统计软件中,我们可以使用一些命令来生成频数分布表,本文将详细介绍这些命令的使用方法和常见应用场景。
一、tab命令tab命令是Stata中最常用的生成频数分布表的命令之一。
它可以根据变量的不同取值生成单变量的频数分布表。
1. 语法tab varname [if] [in] [weight] [, options]•varname是要生成频数分布表的变量名。
•if和in是用于筛选数据的条件表达式,可选参数。
•weight用于给观测赋予权重,可选参数。
•options用于设置输出的格式和内容,可选参数。
2. 示例为了更好地理解tab命令的使用方法,我们将使用Stata自带的auto数据集作为示例进行说明。
auto数据集包含1978年的一些汽车信息,其中的变量包括汽车品牌、汽车类型、汽车重量等。
use autotab rep78上述代码中,我们使用了use命令加载了auto数据集,然后通过tab rep78命令生成了关于汽车维修评级(rep78)的频数分布表。
执行该命令后,Stata会输出如下的频数分布表:Repair |Record | Freq. Percent Cum.-----------+-----------------------------------1 |2 2.56 2.562 | 8 10.26 12.823 | 30 38.46 51.284 | 18 23.08 74.365 | 18 23.08 97.44|Total | 76 100.00从以上分布表中,我们可以看出rep78变量的取值范围为1到5,其中维修评级为3的汽车最多,共有30辆。
stata笔记常用

stata笔记常用Stata: 输出regression table到word和excel1. 安装estout。
最简单的方式是在stata的指令输入:ssc install estout, replaceEST安装的指导网址是:2.跑你的regression3.写下这行指令esttab using test.rtf,然后就会出现个漂亮的表格给你(WORD文档)。
只要再小幅修改,就可以直接用了。
这个档案会存在my document\stata下。
如果你用打开的是一个stata do file,结果会保存到do文件所在文件夹中。
如果要得到excel文件,就把后缀改为.xls或者.csv就可以了4.跑多个其实也不难,只要每跑完一个regression,你把它取个名字存起来:est store m1。
m1是你要改的,第一个model所以我叫m1,第二个的话指令就变成est store m2,依次类推。
5.运行指令:esttab m1 m2 ... using test.rtf就行了。
异方差的检验:Breusch-Pagan test in STATA:其基本命令是:estat hettest var1 var2 var3其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。
是你自己设定的一个滞后项数量。
同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性。
White检验:其基本命令是在完成基本的OLS 回归之后,输入imtest, white如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性处理异方差性问题的方法:方法一:WLSWLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。
在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。
之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。
stata估计率的可信区间

stata估计率的可信区间
在Stata中,可以使用`ci`命令来估计率的可信区间。
具体用法
如下:
1. 首先,在Stata中加载数据集。
2. 使用`ci`命令,后面跟上变量名称和所需的置信水平。
例如,如果要估计变量`y`的95%置信区间,可以使用以下命令:
```stata
ci y, level(95)
```
3. 运行命令后,Stata将输出一个表格,其中包含了估计的率、标准误差和置信区间的上下限。
注意:`ci`命令默认使用正态分布来计算置信区间。
如果数据
不服从正态分布,可以使用`boottest`命令进行非参数的置信区
间估计。
具体用法可以参考Stata的帮助文档。
stata asdoc命令用法

让我们来探讨一下Stata软件以及其强大的asdoc命令。
Stata是一种专业的统计分析软件,被广泛应用于学术研究、统计分析和数据处理等领域。
而asdoc命令则是Stata中一个非常有用的附加命令,可以帮助用户将Stata生成的结果导出为高质量的表格和报告。
1. asdoc命令的基本用法asdoc命令的基本用法非常简单,对于Stata用户来说十分方便。
用户只需在Stata的命令窗口中输入“asdoc”命令,再加上需要导出的Stata命令即可。
asdoc命令将会自动运行用户输入的Stata命令,并将结果以精美的表格形式保存为Word、PDF或HTML格式的文档。
2. asdoc命令的参数设置除了基本用法外,asdoc命令还提供了丰富的参数设置,用户可以根据自己的需求进行定制化设置。
用户可以通过asdoc命令设置导出的表格是否包含统计摘要、标准误、显著性水平等内容。
asdoc命令还支持用户自定义表格的标题、注释和列名等信息,使得生成的表格更加规范和直观。
3. asdoc命令的高级功能除了基本用法和参数设置外,asdoc命令还具有许多高级功能,可以帮助用户更好地展现Stata分析结果。
asdoc命令支持对线性回归、Logit回归、生存分析等多种Stata命令的结果进行导出,而且也支持将多个表格组合成为一个文档,便于用户进行整体报告。
总结与回顾:经过以上的讨论,我们可以看到asdoc命令作为Stata软件的一个附加命令,为用户提供了非常便捷的结果导出功能。
用户可以通过asdoc命令将Stata生成的结果直观地展现在文档中,使得报告更加清晰和专业。
asdoc命令也提供了丰富的参数设置和高级功能,满足用户对结果展现的个性化需求,提升了用户在学术研究和数据处理中的工作效率。
个人观点和理解:作为一名Stata用户,我深深感受到了asdoc命令的强大和便利。
它不仅可以帮助我将Stata生成的结果快速导出,还可以通过参数设置和高级功能,使得导出的结果更加符合我的需求。
stata中把文件导出到指定位置的命令
stata中把文件导出到指定位置的命令全文共四篇示例,供读者参考第一篇示例:在Stata中,我们经常需要将数据文件导出到指定的位置,以便与他人分享或在其他软件中使用。
在本文中,我们将讨论如何在Stata中将文件导出到指定位置的命令。
我们需要明确我们要导出的文件类型。
在Stata中,最常见的导出文件格式包括Excel文件(.xls或.xlsx)、CSV文件(逗号分隔的文本文件)和文本文件。
具体选择哪种格式取决于我们将要用途,例如Excel文件通常用于将数据与其他人员或软件交互,而CSV文件和文本文件则更适合用于数据分析。
导出文件到指定位置的命令通常是使用Stata中的export命令。
下面将介绍具体如何使用export命令将文件导出到指定位置:1. 导出为Excel文件(.xls或.xlsx):要将数据导出为Excel文件,我们可以使用export excel命令。
以下是一些常见选项:export excel using "path\filename.xls", replace:将数据导出为Excel文件,并将现有文件替换为新文件。
export excel using "path\filename.xlsx",firstrow(variable_labels) replace:将数据导出为Excel文件,并在第一行显示变量标签而不是变量名称。
在上述命令中,我们需要将path替换为我们要导出的文件路径,filename替换为我们要导出的文件名,replace为可选参数,表示是否替换现有文件。
除了上述三种常见的导出文件格式外,Stata还支持其他格式的文件导出,例如HTML文件、LaTeX文件等。
我们可以根据具体需求选择合适的导出命令和选项。
Stata提供了丰富的导出文件功能,可以满足不同用户的需求。
在导出文件时,我们需要注意文件路径的填写和文件格式的选择,以确保数据能够正确导出到指定位置。
STATA结果以Excel 或者WORD 输出 转引
STA TA結果以Excel 或者WORD 輸出转引:/lyunsun/blog/item/bfc1c7d3df91523c960a1611.htmlSTA TA結果以Excel 或者WORD 輸出因為界面友好以及操作相當簡便的原因,現在用STATA的人越來越多。
如果你不喜歡編程,那么可以直接用鼠標點擊相應選項就可以完成你想要的回歸結果,如果你喜歡編程,那么STA TA一樣可以滿足你的需求,而且很多回歸模型網上有相應的程序可以直接拿過來用。
上面是大家經常說的STA TA的好處。
對于STATA我的感覺是:簡單實用。
尤其在分析微觀數據的時候,STA TA非常方便。
像面板數據分析、樣本選擇糾正,受限變量分析,只要一個簡單的命令就得到想要的漂亮的結果,而且報告了主要的統計量。
總之,STATA很好很強大。
但有個問題對于初學者是個很大的困擾,就是將回歸結果編輯成國際通用的形式很麻煩。
不怕,已經有好心人編制了相應的程序解決這個問題,這樣可以直接將回歸結果編成論文需要的格式輸出到EXCEL 或者WORD中。
這里提供兩種方法:(就這一點上,STATA是唯一提供該功能的統計分析軟件。
)第一種:estout程序網上有一篇叫苦情研究生的臺灣朋友的文章很好。
我就不獻丑了。
考慮到BAIDU空間打開會比較快點,就將全文整理到這里(根據我自己的使用經驗做了修改)。
但大家轉貼的時候要注意版權。
原文地址:/2009/02/stata-regression-tablewordexcel.htmlStata: 輸出regression table到word和excel1. 安裝estout。
最簡單的方式是在stata的指令輸入:ssc install estout, replaceEST安裝的指導網址是:/bocode/e/estout/installation.html2.跑你的regression(先跑一個就好,多個的要多下點指令)此主题相关图片如下:3.寫下這行指令esttab using test.rtf,然後就會出現個漂亮的表格給你(WORD文檔)。
stata导出回归系数表
stata导出回归系数表
stata 导出回归系数表
stata 导出回归系数表
在使用Stata进行回归分析后,我们常常需要将回归系数表导出到其他文档中进行进一步的分析和展示。
下面是Stata导出回归系数表的步骤:
1. 打开Stata软件并导入数据集。
2. 进行回归分析并保存结果。
3. 在命令栏输入“esttab”,并在后面跟上回归结果的名称。
例如:esttab reg1。
4. 按下回车,Stata会自动将回归系数表导出到命令栏。
5. 在命令栏中输入“esttab using 文件路径文件名.扩展名”,将回归系数表保存到指定的文件路径下。
例如:“esttab using D:Datareg1.xls”。
6. 按下回车,回归系数表就会被保存到指定的文件路径下。
通过以上步骤,我们就可以方便地将Stata中的回归系数表导出到其他文档中进行分析和展示。
- 1 -。
stata分位数回归结果导出
stata分位数回归结果导出Stata是一种功能强大的统计分析软件,常用于数据处理和建模。
分位数回归(Quantile Regression)是一种比传统最小二乘回归更加灵活的方法,它可以用来研究不同分位数上自变量对因变量的影响。
进行分位数回归的第一步是加载数据。
可以使用Stata的`use`命令将数据加载到内存中。
```use "数据文件名.dta", clear```然后,可以使用`qreg`命令来进行分位数回归。
`qreg`命令有许多选项,可以控制回归模型的具体设置。
比如,可以使用`robust`选项来进行异方差鲁棒的标准误估计。
下面是一个示例:```qreg y x1 x2, quantile(0.25 0.5 0.75) robust```这个命令会将变量`y`作为因变量,变量`x1`和`x2`作为自变量进行分位数回归。
`quantile(0.25 0.5 0.75)`选项指定了所需的分位数。
`robust`选项告诉Stata使用异方差鲁棒的标准误估计。
分位数回归的另一个重要部分是结果导出。
在Stata中,可以使用`estout`命令将回归结果导出为表格。
首先,需要安装`estout`命令:```ssc install estout```然后,可以使用以下命令将回归结果导出为表格:```eststo cleareststo: qreg y x1 x2, quantile(0.25 0.5 0.75) robustesttab, stats(coef se) b(%10.2f) star(* 0.05 ** 0.01) collabels(none) nonum```这个命令将创建一个名为`est1`的回归结果存储器,并将回归结果存储在其中。
然后,`esttab`命令将结果从`est1`导出为一个表格。
`stats(coef se)`选项指定了要显示的估计值和标准误。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
竭诚为您提供优质文档/双击可除stata,输出表格篇一:stata中将回归结果导出步骤以及需要的程序的下载网址stata结果以excel、woRd以及latex编译格式输出因为界面友好以及操作相当简单的原因,現在用stata的人越來越多。
如果你不喜欢编程,那么可以直接用鼠标点击相应選項就可以完成你想要的回归结果,如果你喜欢编程,那么stata一样可以满足你的需求,而且很多回归模型网上有相应的程序可以直接拿过來用。
上面是大家经常说的stata的好處。
对于stata我的感覺是:简单实用。
尤其在分析微觀數據的時候,stata非常方便。
像面板數據分析、样本選擇糾正,受限變量分析,只要一個简单的命令就得到想要的漂亮的结果,而且報告了主要的統計量。
總之,stata很好很強大。
但有個問題对于初學者是個很大的困擾,就是將回归结果编輯成國際通用的形式很麻煩。
不怕,已经有好心人编制了相应的程序解決這個問題,這样可以直接將回归结果编成論文需要的格式输出到excel或者woRd中。
這里提供兩種方法:(就這一点上,stata是唯一提供該功能的統計分析軟件。
)第一種:estout程序网上有一篇叫苦情研究生的臺灣朋友的文章很好。
我就不獻丑了。
考慮到baidu空間打開會比較快点,就將全文整理到這里(根據我自己的使用经驗做了修改)。
但大家轉貼的時候要注意版權。
原文地址:1.安裝estout。
最简单的方式是在stata的指令输入:sscinstallestout,replaceest安裝的指導网址是:2.跑你的regression(先跑一個就好,多個的要多下点指令)3.寫下這行指令esttabusingtest.rtf,然後就會出現個漂亮的表格給你(woRd文檔)。
只要再小幅修改,就可以直接用了。
這個檔案會存在mydocument\stata下。
如果你用打開的是一個statadofile,结果會保存到do文件所在文件夾中。
如果要得到excel文件,就把后綴改为.xls或者.csv 就可以了。
结果會得到如下的表格。
4.跑多個其实也不難,只要每跑完一個regression,你把它取個名字存起來:eststorem1。
m1是你要改的,第一個model所以我叫m1,第二個的話指令就變成eststorem2,依次類推。
5.運行指令:ingtest.rtf就行了。
6.如果你跑了一系列的regression之後,要跑下一系列,記得打estclear,將你之前存的先清掉。
所以指令像是這样:estclearregression.....eststorem1regression...eststorem2esttab*usingtest.rtf(*是前面儲存的文件名m1,m2,等)(阿寬:這是原作者原話,根據我的经驗可以不這样做,因为后面的會自動將前面的覆蓋。
但为保險起見,也可以運行這样的命令)默認的输出结果是報告t統計量,如果要報告standarderror的可以在後面加個,se選項,即運行如下命令esttab*usingtest.rtf,se(输出word文檔)或者esttab*usingtest.xls,se(输出excel文檔)要注意的是妹運行一次esttab命令會創建一個文件,而後面運行同样的命令不會覆蓋前面的文件,所以每次運行創建的文件名或者文檔格式应該是不同的。
如果要覆蓋前面的文件則要加上選項replace,比如esttab*usingtest.xls,sereplace第二種:outreg2程序。
outreg2程序安装步骤:1.到google上搜索outreg2或者到以下网址上下载相关组件:2.将各个下载了的组件拷贝到stata安装文件的ado文件夹里面(按照相应的首字母顺序)。
3.运行outreg2.可能会跳出一个warning,因为还需要安装一个组件。
鼠标放到蓝色字体的字上面点击就可以了。
(一个更简单的方法是运行以下命令:sscinstalloutreg2,replace如果以前没有安装过outreg2就不用",replace"了)運行命令:helpoutreg2可以查詢如何運行outreg2使用。
三、结果以latex编译格式输出方法一、使用outreg2程序。
例子:regressmpgforeignweightoutreg2usingauto7,tex方法二、latab程序1.到这个网页下载相关组件:2.拷贝到相应ado子文件夹里。
3.運行命令:helplatab根據指南進行相關操作就可以了篇二:stata统计分析命令stata统计分析常用命令汇总一、winsorize极端值处理范围:一般在1%和99%分位做极端值处理,对于小于1%的数用1%的值赋值,对于大于99%的数用99%的值赋值。
1、stata中的单变量极端值处理:stata11.0,在命令窗口输入“finditwinsor”后,系统弹出一个窗口,安装winsor模块安装好模块之后,就可以调用winsor命令,命令格式:winsorvar1,gen(newvar)p(0.01)或者在命令窗口中输入:sscinstallwinsor安装winsor命令。
winsor命令不能进行批量处理。
2、批量进行winsorize极端值处理:打开链接:/judson.caskey/data.html,找到winsorizej,点击右键,另存为到stata中的ado/plus/目录下即可。
命令格式:winsorizejvar1var2var3,suffix(w)即可,这样会生成三个新变量,var1wvar2wvar3w,而且默认的是上下1%winsorize。
如果要修改分位点,则写成如下格式:winsorizejvar1var2var3,suffix(w)cuts(595)。
3、excel中的极端值处理:(略)winsor2命令使用说明简介:winsor2winsorizeortrim(iftrimoptionisspecified)thev ariablesinvarlistatparticularpercentilesspecifiedby optioncuts(##).indefult,newvariableswillbegenerated withasuffix"_w"or"_tr",whichcanbechangedbyspecifyin gsuffix()option.thereplaceoptionreplacesthevariable swiththeirwinsorizedortrimmedones.相比于winsor命令的改进:(1)可以批量处理多个变量;(2)不仅可以winsor,也可以trimming;(3)附加了by()选项,可以分组winsor或trimming;(4)增加了replace选项,可以不必生成新变量,直接替换原变量。
范例:*-winsorat(p1p99),getnewvariable"wage_w".sysusenlsw88,clear.winsor2wage*-left-trimmingat2thpercentile.winsor2wage,cuts(2100)trim*-winsorvariablesby(industrysouth),overwritetheoldv ariables.winsor2wagehours,replaceby(industrysouth)使用方法:1.请将winsor2.ado和winsor2.sthlp放置于stata12\ado\base\w文件夹下;2.输入helpwinsor2可以查看帮助文件;二、描述性统计1、summarize命令格式:su、sum或者summarize[varlist][if][in][weight][,options] 如果summarize或sum后不加任何变量,则默认对数据中的所有变量进行描述统计options选项:detail表示产生更加详细的统计变量separator(n)表示每n个变量画一条分界线,n=0表示禁止使用分界线summarize描述统计输出表中包含:样本容量、平均数、标准差、最小值和最大值2、tabstat命令格式:tabstat[varlist][if][in][weight][,options]options选项:stat(statname)表示设定所需要的统计量col(stat)或c(s)表示将结果报表转置统计量:mean:平均数count/n:观测值数目sum:加总max/min:最大值/最小值range:极差sd:标准差cv:变异系数semean:平均标准误差skewness:偏度var:方差kurtosis:峰度median/p50:中位数p#:#%百分位数例如:tabstat[varlist],stat(countmeansdmedianminmaxrange) col(stat)3、描述性统计结果输出到word或excel用sum做的描述性统计:logout,save(miaoshutongji)wordreplace:sum用tabstat做的描述性统计:logout,save(miaoshutongji)wordreplace:tabstat[varlist],stat(countmeansdmedianminmaxrange)col(sta t)分组描述:bysortvar:三、相关性分析(一)相关性分析1、pearson相关系数命令格式:correlate(简写:cor 或corr)[varlist][if][in][weight][,options]2、spearman相关系数命令格式:spearman[varlist],stats(rhop)3、在stata中,命令corr用于计算一组变量间的协方差或相关系数矩阵;4、命令pwcorr可用于计算一组变量中两两变量的相关系数,同时还可以对相关系数的显著性进行检验;option选项中加上sig可显示显著性水平:pwcorr[varlist],sig5、命令pcorr用于计算一组变量中两两变量的偏相关系数并进行显著性检验。
6、spearman和pearson检验同在一个表的命令:corrtbl[varlist],corrvars([varlist])输出结果中,上三角为spearman相关系数和显著水平,下三角为pearson系数和显著水平。
(二)输出相关系数表到word或excel中。