Stata讲义

合集下载

让你快速上手的stata讲义

让你快速上手的stata讲义

Stata简明讲义王非中国经济研究中心ebwf@〇、写在前面的话关于学习Stata的意义,大家只需知道:目前,Stata是计量经济学、特别是微观计量经济学的主流软件。

因此,Stata很重要、很有用,而大家也会在使用Stata 的过程中慢慢体会到它的特点。

本讲义取名为“Stata简明讲义”,意在突出“简”和“明”两个字。

虽然讲义长达五十多页,但相比Stata的完全手册来说,还不及九牛之一毛,故为“简”。

实际上,完全手册中的很多内容都鲜有人(特别是计量经济学者)问津,而本讲义列出的内容则是大家经常用到的操作;所以,“简”也有“简”的好处。

即便如此,掌握这份讲义也并非易事。

所谓“明”,是明晰的意思。

本讲义本着“手把手教”的精神,力求把每项操作都说得具体明晰,以方便初学者(特别是没有程序操作经历的初学者)尽快上手。

至于本讲义在“简明”上做得怎么样,还需要各位读者来评判。

中心的一位学长邹传伟,曾经写过一份“Stata介绍”,在网上可以下载。

那份讲义比较全面,但不够具体明晰。

本讲义参照那份讲义,在框架上查漏补缺,并进一步地明晰化。

本讲义第二部分的“do文件”和第七部分的“残差分析”的相关内容均来自于中心的沈艳老师的相关讲义,而沈老师对于本讲义的成形给予了细致的指导。

本讲义附带了一些数据文件,其中“WAGE1.dta”和“WAGEPRC.dta”均来自Wooldridge的中级计量教材的数据集,而其他数据则为作者自己的杜撰。

尽管从别人那里拿来了许多好东西,但本讲义的任何错误仍源于作者自己的疏忽。

本讲义是这样安排的:第一部分讲Stata的界面,第二部分讲do文件,第三部分讲怎样把数据导入Stata,第四部分专门讲help和search命令以及帮助文件的阅读方法,第五部分讲数据的描述及管理,第六部分讲如何画图,第七部分讲初步的回归分析。

祝各位学习愉快。

一、Stata长什么样?首先,让我们看看Stata长什么样。

我们以Stata 9.1(以下简称Stata)为例。

stata 第一讲

stata 第一讲

****** Stata软件分析与应用 *******--------------------*-> 课程纲要*--------------------/*第一部分:Stata 基本操作1.Stata简介2.数据处理3.初步绘图第二部分:Stata的计量应用1.普通最小二乘法(OLS)2.广义最小二乘法(GLS)3.工具变量法与GMM4.时间序列分析5.面板数据模型第三部分:课堂报告(考核形式)选择一个经济学问题,利用stata实现,讲解相关经济学原理和操作过程,并提交书面报告。

* 教材:* 基础教材:王群勇. STATA在统计与计量分析中的应用. 南开大学出版社Hamilton Lawrence. Statistics with Stata. Cengage Learning.(中文版:郭志刚译. 应用Stata做统计分析. 重庆大学出版社)王天夫. STATA实用教程. 中国人民大学出版社* 高级应用教材:陈强. 高级计量经济学及STATA应用. 高等教育出版社.王志刚. 面板数据模型及其在经济分析中的应用. 经济科学出版社* 万能教材:help菜单The stata journal* 预备知识:计量经济学、数理统计、宏观经济学、微观经济学* ::第一部分::* Stata 基本操作* =====================* 第一讲 Stata简介* =====================* Stata 是何方神圣?Stata 统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS 一起被并称为三大权威统计软件。

它同时具有数据管理软件、统计分析软件、图表绘制软件、矩阵计算软件和程序语言编制的特点,几乎可以完成全部复杂的统计和计量分析工作。

*--------------------*-> Stata有何优点?*--------------------* 短小精悍、功能强大它最新的第12版的安装文件不到200M,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的计量分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。

STATA_讲义

STATA_讲义

STATA 讲义目录Stata入门教程:Stata概貌Stata 第一章数据输入,存盘和调用文件命令以及数据管理命令Stata第二章 描述性统计命令与输出结果说明Stata第三章 正态检验与作图命令Stata第四章 t检验和单因素方差分析(上)Stata第四章 t检验和单因素方差分析(下)Stata第五章 多组计量资料比较的非参数检验命令与输出结果说明Stata第六章 卡方检验Stata第七章 相 关 分 析Stata第八章 单 因 素 生 存 分 析Stata第九章 多因 素 方 差 分 析 命 令 与 输 出 结 果 说 明Stata第十章 线 性 回 归 和 逐 步 回 归 命 令 和 输 出 结 果 说 明Stata第十一章 Logistic回归分析命令与输出结果说明Stata第十二章 Cox回归分析命令与输出结果说明第一章 Stata 概貌§1.1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。

从1985至1998的十四年时间里,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多个版本,通过不断更新和扩充,内容日趋完善。

它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。

Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力1. Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。

stata简单讲义第六讲

stata简单讲义第六讲

线性相关和回归赵耐青在实际研究中,经常要考察两个指标之间的关系,即:相关性。

现以体重与身高的关系为例,分析两个变量之间的相关性。

要求身高和体重呈双正态分布,既:在身高和体重平均数的附近的频数较多,远离身高和体重平均数的频数较少。

样本相关系数计算公式(称为Pearson 相关系数):)()())((22YYXXXY L L L Y Y X X Y Y X X r =----=∑∑∑(1)1. 考察随机模拟相关的情况。

显示两个变量相关的散点图程序simur.ado (本教材配套程序,使用见前言)。

命令为simur 样本量 总体相关系数 如显示样本量为100,ρ=0的散点图 本例命令为simur 100 0如显示样本量为200,ρ=0.8的散点图本例命令为simur 200 0.8如显示样本量为200,ρ=0.99的散点图本例命令为simur 200 0.99如显示样本量为200,ρ=-0.99的散点图本例命令为simur 200 -0.99例1. 测得某地15名正常成年男子的身高x(cm)、体重y(kg)如试计算x和y之间的相关系数r并检验H0:ρ=0 vs H1: ρ≠0。

α=0.05数据格式为176.0 69.0175.0 74.0172.0 68.0170.0 64.0173.0 68.5168.0 56.0172.0 54.0170.0 62.0172.0 63.0173.0 67.0168.0 60.0171.0 68.0172.0 76.0173.0 65.0Stata命令pwcorr 变量1 变量2 …变量m,sig本例命令pwcorr x y,sigpwcorr x y,sigPearson相关系数=0.5994,P值=0.0182<0.05,因此可以认为身高与体重呈正线性相关。

注意:Pearson相关系数又称为线性相关系数并且要求X和Y双正态分布,通常在检查中要求X服从正态分布并且Y服从正态分布。

Stata_A_dofiles中山大学连玉君教授stata初级讲义

Stata_A_dofiles中山大学连玉君教授stata初级讲义

60
61 * 1.5 浏览资料
62 *
1.5.1 变量的名称
63 *
1.5.2 查看资料的结构
64 *
1.5.2.1 更改变量的存储类型
65 *
1.5.2.2 -list- 命令的使用
66 *
1.5.2.3 定义变量的显示格式
67 *
1.5.2.4 数据和变量的标签
68 *
1.5.2.5 附加说明文字
101 *
1.8.2.3 其他命令
102
103 * 1.9 do 文档: 高效快捷地执行命令
104 *
1.9.1 do 文档简介
105 *
1.9.1.1 打开 do 文档编辑器
106 *
1.9.1.2 保存和关闭
107 *
1.9.1.3 执行 do 文档
108 *
1.9.2 合理规划你的do文档
109 *
47 *
1.3.4 时间序列资料
48 *
1.3.5 面板资料
49 *
1.3.6 STATA官方提供的资料
50 *
1.3.7 其它软件中的数据
51
52 * 1.4 存储和导出数据
53 *
1.4.1 存储数据
54 *
1.4.2 导出和转换
55 *
1.4.2.1 -outfile-命令:导出为 .raw 文本格式
214 *
2.6.1.4 一个例子
215 *
2.6.2 横向关联: -joinby-
216 *
2.6.3 纵向合并:追加样本
217 *
2.6.4 大型数据的处理
218 *
2.6.5 一些有用的外部命令

Stata学习讲义

Stata学习讲义

Stata学习讲义刘志阔一、如何导入数据Stata的数据处理功能是极其强大的,不过我们最好在excel中整理数据,然后导入到stata中就可以了。

命令:insheet using name.csv*注意,Stata只能用csv格式,另外把数据放到stata的目录中。

二、如何进行回归Stata中有很多命令,这些命令都是现成的,直接用就可以了。

不过,怎么用是个问题。

熟悉命令的基础上学会如何使用Help。

最简单的命令reg做ols回归,xtreg处理面板等。

命令:reg y x*注意,Stata命令的格式,自己回去看手册。

网络帮助可以采用如下命令获得findit scat3, net;search scat3, net三、如何导出结果Stata可以直接导出发表论文中回归结果,当然不是完全一样。

命令:outreg2 Results using name.word四、如何画图Stata的画图功能也是极其强大的,可以画出各种类型的图标。

命令:scatter y x || lfit y x五、如何存储结果Stata可以储存回归结果,便于分析。

命令:log using name log closed1.codebook可以查看数据有没有缺失2.xml_tab estout 可以输出结果3.qui tab year, gen(yr) 可以生产时间虚拟变量。

4.g q=quarterly( qtr,"YQ")5.form q %tq6.recode province (min/11=1) (12/19=2) (20/31=3)gen eastern=(province==1)gen middle=(province==2)gen western=(province==3)Logout 命令可以把界面内容存到word里面,而不用复制。

Logout,save(名称) word/excel replace:各种描述性命令,statsXml_tab可以输出Excel格式的结果。

第一讲 stata基础----山大stata实验课讲义

第一讲 stata基础----山大stata实验课讲义

Stata命令格式
1。Stata的命令一定要区分大小写,除了极 个别的情况下,stata命令全部用小写。 2。大部分命令可以缩写。 使用缩写可以使stata的命令书写大为简化: 例如: display-------di summarize------sum describe------des regress------reg 得到正确命令缩写的简单方法:看help。
添加标签
打开wage1数据文件。 1。为整个数据添加标签:例如,将数据命名 为“工资表”。 2。为变量增加标签,例如, wage:年工资总额 educ:受教育年限。 exper:工龄。 3。为变量值增加标签 例如:为变量marrid添加数值标签marry: 1=married; 0=Unmarried
1002
1003
87
76
72
80Biblioteka 80852。在Excel或者记事本文件编辑好后导入。 直接粘贴 Import导入:除了xls格式,还可以导入txt 格式和其他格式。 练习:利用import方法将wage2.xls导入
数据类型的转变
首先先学习两种最简单的: 1. 数值型------字符型 tostring 变量列表,gen(新变量) | replace 2. 字符型------数值型 destring 变量列表,gen(新变量) | replace
display 显示计算结果。经常写为: di summarize 求某个变量的观察值个数、平 均值、标准差、最小值和最大值。经常写为: sum scatter 生成两个变量的散点图。 set obs 定义样本个数(使用前一定要用 drop或者clear命令清空当前样本)
generate 建立新变量并赋值。经常写为 gen sort 按照某一个变量排序,一般用于升序。 gsort 按照某一个变量排序,既可升序又可 降序。

stata1-5讲义

stata1-5讲义

果一般而言是没有意义的并容易产生误导。可是如何让大家相信这种滥用和误用
计量模型所导致的偏误呢?
由于在社会科学中,被广泛认同的数理模型很少,讨论估计量是否一致或有
偏误的最好办法是假设我们已知某个理论公式及其相应参数,然后按照这个公式
通过蒙特卡洛方法生成假设数据,再来看在什么条件下用什么方法可以获得一致
(2)将其解压到 D:/stata9。 (3)点击 setup 安装>>改变安装路径到 D:/stata9>>选择 Stata/SE 版本。
1.2 启用和退出
(1) 程序→Stata,即可进入 Stata,启动后出现文件对话框,要求输入注册单 位和密码等。
中国人民大学 陈传波
9
chrisccb@
的或渐近正态的估计结果,这种方法已被国外的统计和计量教材大量采用。
本书正是在这两个方面突出了自己的特色。作者 9 年来潜心钻研 STATA,
利用 STATA 处理过农村住户数据、人口普查数据(部分)等大量数据,积累了
丰富的数据处理经验。本书的前 9 讲集中介绍数据处理的知识和技巧,后 9 讲通
过蒙特卡洛模拟帮助读者从直观上理解数理统计和计量的基本理论,并掌握相应
本书从第 10 讲开始,运用蒙特卡洛模拟方法,将基于随机变量的数理统计 和计量经济学的核心思想和方法的黑箱打开,让读者在如同做游戏一样的感觉中 深刻理解抽样分布、假设检验、回归分析等方法的强大魔力和无处不在的陷阱, 这有利于读者批判性地理解他人基于统计数据得出的结论,也很利于读者在自己 运用统计和计量分析时正确对待和解释估计结果。
中国人民大学 陈传波
8
chrisccb@
STATA 十八讲1入门
1 STATA 入门
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

expand和contract的用法
• 该命令可以把数据库按照要求进行扩展。 • use score,clear • sum score • sum score [weight=number] • edit • expand number • edit • sum score • contract score [缺省的情况下,做频数,当然也
– collapse price mpg,by(foreign) 国产车和进口 车分别计算均值,当然也可以计算方差等。
• 注意:
– 该命令对数据有巨大的破坏作用,尽量不用 save, replace
– 在实际应用中,该命令常跟outsheet一起使用
– outsheet using mean.xls
• save数据保存命令
– save,replace
• erase 删除数据命令
– 一定要加上扩展名
• describe 数据一般描述命令 • codebook 展示各变量情况的命令 • sum 展示各变量数量情况的命令 • generate 生成新变量命令 • rename 变量重命名命令 • drop 删除变量或观察值的命令 • keep 保留变量或观察值的命令 • sort 对某些变量按观察值大小进行排序的命令
– 两个数据库都要排序。 – _merge的含义同上。有的时候这个变量很管用。
collapse命令的用法
• 这个命令非常有用,一定要记住。它可以 直接得到绝大多数变量的常用统计量。
– use auto,clear – sum price mpg – collapse price mpg – collapse (mean) price mpg – collapse (sd) price – collapse (mean) price (sd) mpg – collapse (mean) price (sd) sdprice=price
• 为什么要做这样的转换?
– 我要做关于个人教育回报率的研究。 – 但我拿到的数据是基于家庭层次上的。 – 具体的例子。
xpose命令
• xpose命令,把列变成行的命令。
– use math1,clear – xpose, clear varname (没有varname就变不
回去了) – xpose ,clear
• 是不是乱了?
– 人对不齐 – 一个数据库的id还丢失了。
• _merge的含义
– 注意事项。如果原数据库中有_merge的时候,不能再进行merge 的操作了,必须把这个变量去掉。
• use chinese2,clear • merge id using math2 (?) • sort id • merge id using math2 (?) • use math2,clear • sort id • save,replace • use chinese2,clear • merge id using math2 • 提醒:
• 1 80 0
5000
• 1 81 0
5500
• 1 82 0
6000
• 2 80 1
2000
• 2 81 1
2200
• 2 82 1
3300
• 3 80 0
3000
• 3 81 0
2000
• 3 82 0
1000
可以相互转换
• reshape long inc,i(id) j(year)
• reshape wide inc,i(id) j(year)
• 数据文件。以.dta结尾。 • 命令文件。以.do结尾。 • 日志文件。以.smcl结尾。 • 图形文件。以.gph结尾。
Stata的帮助系统
• Help菜单。 • Help命令。
– Help use
学习Stata的参考书
• 王群勇的两本书。 • 陈传波的资料。
数据库的基本介绍
• 数据库
– 命名原则
reshape命令的用法
• 假设有下面的一个数据库(宽形式):
– id sex inc80 inc81 inc82
– 1 0 5000 5500 6000
– 2 1 2000 2200 3300
– 3 0 3000 2000 1000
• 还有一种形式(长形式)
• id year gender inc
• webuse nlswo – Input (最傻冒的数据输入方法)
• 与Excel之间的互动
– 从Excel到Stata – 从Stata到Excel – Insheet 也是很傻的一个命令 – Outsheet
• Outsheet using book2.xls
• 与其它文件(SAS、SPSS)之间的互动
– Statransfer软件.
• 如何读取不知名的文件?
– .dat的文件?例子。 – Infix
• Set memory
– Infile1 – Infile2
• Help命令的用法。
简单的数据操作命令
• use打开数据库命令 • clear清空内存数据命令 • edit数据编辑命令 • input手动录入命令 • insheet、outsheet、infix等数据转换命令。 • set mem设置内存命令
补充命令
• rmdir 移去某个文件夹
– mkdir ggg – rmdir ggg (很傻的命令)
• gsort 扩展排序命令
– use auto,clear – sort price – sort –price – gsort –price
• saveold 保存成老版本的格式 • infile 数据读取命令
怎么样偷懒?
• 把数据拷到一个txt文件里面。
• 直接用infile读取。
– infile score number using gyh.txt – save score.dta,replace
• 能不能直接拷到Stata或者是Excel里面?
复杂的数据处理命令
• label命令,加注标签命令 • expand命令,数据扩展命令 • contract命令,数据萎缩命令 • append命令,纵向连接命令 • merge命令,横向连接命令 • collapse命令,计算统计量命令 • reshape命令,宽数据和长数据转换命令 • xpose命令,把列变成行的命令
加权命令weight
• 计算加权平均值 • score num • 650 193 • 649 26 • 648 23 • 647 16 • 646 21 • 645 26 • 644 32 • 643 23 • 642 38 • 641 29 • 640 38 • sum score • sum score [weight=num]
补充命令
• rmdir 移去某个文件夹
– mkdir ggg – rmdir ggg (很傻的命令)
• gsort 扩展排序命令
– use auto,clear – sort price – sort –price – gsort –price
• saveold 保存成老版本的格式 • infile 数据读取命令
• 变量
– 命名原则
• 观测值
数据的载入
• 最基本的数据读取
– use 数据基本格式
• Use auto.dta (注意当前文件夹所在的位置) • 命令出错的显示 • Set mem
– sysuse
• Sysdir 查询系统文件夹的命令 • Clear 清空内存中的数据库
– webuse 从stata官方网站获得数据
– id Chinese – 1 92 – 2 86 – 3 88
• 二班的语文成绩 chinese2.dta
– id Chinese – 4 93 – 5 88 – 6 89 – 7 95
append的用法
• 把一班、二班的数学成绩合起来。
– use math1,clear – append using math2 – list
Stata是什么?
• Stata是一个软件,它具有数据处理、统计 分析、绘图等功能,速度快、操作简单、 功能强大。
• 它与SAS、SPSS并称为三大权威数据处理 软件。
• 最新版本是10.0。
Stata的特点
• 小。只有几十个M。
• 快。与内存交换数据。
– 缺陷。
• 命令行操作为主、菜单操作为辅。
– DOS。
为什么要学Stata?
• 与计量经济学理论密切相关。
– 很多实用的命令。
• 强大的学习网络
– 专门讨论Stata学习的网站。
Stata的安装
• 跟一般软件的安装一样。
– 陈传波的文件。 – 注意事项。不要有中文字符,不要有空格。
• 绿色软件。解压缩就能用。
Stata涉及到的四种文件
• 把一班的数学成绩和二班的语文成绩合起 来。
– use math1,clear – append using chinese2 – list
merge的用法
• 两种merge的方法
– 一种是乱点鸳鸯 – 一种是有秩序的组合
• 把二班的数学成绩和二班的语文成绩合并起来。
– use chinese2,clear – gsort –id – list – save,replace – merge using math2
可以做百分数、累积百分数等] • count • edit
append和merge的用法
四个数据库
• 一班的数学成绩math1.dta
– id math – 1 92 – 2 86 – 3 88
• 二班的数学成绩math2.dta
相关文档
最新文档