STATA实用学习笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
北京科技大学
STATA应用
学习摘录
第一章 STATA的基本操作
一、设置内存容
set mem 500m, perm
一、显示输入内容
Display 1
Display “clive”
二、显示数据集结构describe
Describe /d
三、编辑edit
Edit
四、重命名变量
Rename var1 var2
五、显示数据集内容list/browse
List in 1
List in 2/10
六、数据导入:数据文件是文本类型(.csv)
1、insheet: . insheet using “C:\Documents and Settings\Administrator\桌面
\ST9007\dataset\Fees1.csv”, clear
2、内存为空时才可以导入数据集,否则会出现(you must start with an empty dataset)
(1)清空内存中的所有变量:.drop _all
(2)导入语句后加入“clear”命令。
七、保存文件
1、save “C:\Documents and Settings\Administrator\桌面\ST9007\dataset\Fees1.dta”
2、save “C:\Documents and Settings\Administrator\桌面\ST9007\dataset\Fees1.dta”, replace
八、打开及退出已存文件use
1、.Use 文件路径及文件名, clear
2、. Drop _all/.exit
九、记录命令和输出结果(log)
1、开始建立记录文件:log using "J:\phd\output.log", replace
2、暂停记录文件:log off
3、重新打开记录文件:log on
4、关闭记录文件:log close
十一、创建和保存程序文件:(doedit, do)
1、打开程序编辑窗口:doedit
2、写入命令
3、保存文件,.do.
4、运行命令:.do 程序文件路径及文件名
十二、多个数据集合并为一个数据集(变量和结构相同)纵向合并append
insheet using "J:\phd\Fees1.csv", clear
save "J:\phd\Fees1.dta", replace
insheet using "J:\phd\Fees2.csv", clear
append using "J:\phd\Fees1.dta"
save "J:\phd\Fees1.dta", replace
十三、横向合并,在原数据集基础上加上另外的变量merge
1、insheet using "J:\phd\Fees1.csv", clear
sort companyid yearend
save "J:\phd\Fees1.dta", replace
describe
insheet using "J:\phd\Fees6.csv", clear
sort companyid yearend
merge companyid yearend using "J:\phd\Fees1.dta"
save "J:\phd\Fees1.dta", replace
describe
2、_merge==1 obs. From master data
_merge==2 obs. From using data
_merge==3 obs. From both master and using data
十四、帮助文件:help
1、. Help describe
十五、描述性统计量
1、summarize incorporationyear 单个
summarize incorporationyear-big6 连续多个
summarize _all or simply summarize 所有
2、更详细的统计量
summarize incorporationyear, detail
3、centile
centile auditfees, centile(0(10)100)
centile auditfees, centile(0(5)100)
4、tabulate不同类型变量的频数和比例
tabulate companytype
tabulate companytype big6, column 按列计算百分比
tabulate companytype big6, row 按行计算百分比
tab companytype big6 if companytype<=3, row col 同时按行列和条件计算百分比
5、计算满足条件观测的个数
count if big6==1
count if big6==0 | big6==1
6、按离散变量排序,对连续变量计算描述性统计量:
(1)by companytype, sort: summarize auditfees, detail
(2)sort companytype
By companytype:summarize auditees
十六、转换变量
1、按公司类型将公开发行股票公司赋值为1,其他为0
gen listed=0
replace listed=1 if companytype==2