stata第三讲【山大陈波】

合集下载

stata 中文教程

stata 中文教程

Stata介绍作为流行的计量经济学软件,Stata的功能十分地全面和强大。

可以毫不夸张地说,凡是成熟的计量经济学方法,在Stata中都可以找到相应的命令,而这些命令都有许多选项以适应不同的环境或满足不同的需要。

即使是最详细的Stata手册,也难免有遗珠之憾,更何况本文仅是一个粗浅的介绍。

掌握Stata最好的办法是在实践中学习:Stata 本身提供了非常强大的帮助系统,并且关于Stata的书籍和网络资源都不少。

本文拟根据如下顺序介绍Stata:1.界面;2.文件和数据;3.语法和命令;4.数据管理;5.描述统计;6.画图;7.回归和回归分析;8.常用命令。

第3和第4部分是最体现Stata灵活性的地方,也是应用Stata的基础。

第5和第6部分介绍如何用Stata完成基本的统计功能。

Stata的功能很多,比如回归,曲线拟合,生存分析,主成分分析,因子分析,聚类分析,时间序列分析等等。

但回归无疑是其中最重要的功能。

第7部分介绍如何用Stata作线性回归和Logistic回归。

本文第2和第3部分包含了作者的观点,难免有偏颇之处。

其余部分主要来自文献的归纳和总结。

限于水平有限,错误在所难免,敬请原谅。

1.界面图1 Stata界面Stata有4个窗口:1. Stata Command(右下)用于向Stata输入命令;2. Stata Results(右上)用于显示运行结果;3. Review(左上)记录使用过的命令;4. Variables(左下)显示当前memory中的所有变量。

窗口上方是工具栏,其上的按钮依次为(从左到右)Open, Save, Print Graph/Print Log, Log Start/Stop/Suspend, Bring Log to Front, Bring Graph to Front, Do-file Editor, Data Editor, Data Browser, Clear –more- condition, Break。

让你快速上手的stata讲义

让你快速上手的stata讲义

Stata简明讲义王非中国经济研究中心ebwf@〇、写在前面的话关于学习Stata的意义,大家只需知道:目前,Stata是计量经济学、特别是微观计量经济学的主流软件。

因此,Stata很重要、很有用,而大家也会在使用Stata 的过程中慢慢体会到它的特点。

本讲义取名为“Stata简明讲义”,意在突出“简”和“明”两个字。

虽然讲义长达五十多页,但相比Stata的完全手册来说,还不及九牛之一毛,故为“简”。

实际上,完全手册中的很多内容都鲜有人(特别是计量经济学者)问津,而本讲义列出的内容则是大家经常用到的操作;所以,“简”也有“简”的好处。

即便如此,掌握这份讲义也并非易事。

所谓“明”,是明晰的意思。

本讲义本着“手把手教”的精神,力求把每项操作都说得具体明晰,以方便初学者(特别是没有程序操作经历的初学者)尽快上手。

至于本讲义在“简明”上做得怎么样,还需要各位读者来评判。

中心的一位学长邹传伟,曾经写过一份“Stata介绍”,在网上可以下载。

那份讲义比较全面,但不够具体明晰。

本讲义参照那份讲义,在框架上查漏补缺,并进一步地明晰化。

本讲义第二部分的“do文件”和第七部分的“残差分析”的相关内容均来自于中心的沈艳老师的相关讲义,而沈老师对于本讲义的成形给予了细致的指导。

本讲义附带了一些数据文件,其中“WAGE1.dta”和“WAGEPRC.dta”均来自Wooldridge的中级计量教材的数据集,而其他数据则为作者自己的杜撰。

尽管从别人那里拿来了许多好东西,但本讲义的任何错误仍源于作者自己的疏忽。

本讲义是这样安排的:第一部分讲Stata的界面,第二部分讲do文件,第三部分讲怎样把数据导入Stata,第四部分专门讲help和search命令以及帮助文件的阅读方法,第五部分讲数据的描述及管理,第六部分讲如何画图,第七部分讲初步的回归分析。

祝各位学习愉快。

一、Stata长什么样?首先,让我们看看Stata长什么样。

我们以Stata 9.1(以下简称Stata)为例。

计量经济学stata上机教程

计量经济学stata上机教程

计量经济学stata上机教程2014计量经济学上机教程1Stata操作基础主要内容:1. Stata的特点与功能2. Stata的界面管理3. Stata的命令语法4. 数据处理5. 统计描述、制图与输出结果6. log文档与do文档7. 常用函数8. Stata的帮助系统与学习资源9. 课后练习1. Stata的特点与功能, 将统计功能与计量分析完整地结合起来。

不仅可以实现诸多统计分析方法,比如描述统计、假设检验、方差分析、主成分分析等,而且可以实现多种计量经济模型的估计和检验,包括经典单方程回归模型、方程组模型、微观数据模型(离散选择模型、计数模型、截断模型、归并模型等)、时间序列数据模型(ARMA、VAR、GARCH等)以及面板数据分析。

, 强大的数据处理功能。

, 精致的作图功能。

, 丰富的网络资源。

Stata 12有各种版本,其中尤以SE(特殊版)最为常用。

用户可以在命令栏中输入about命令查看所安装的版本信息。

2--per ml sodium hydroxide [c (NaOH) =1.000 mol/L] potassium hydrogen phthalate standard solution of quality g. ... After dilution to 1000mL. 1.1.2 0.000 35mol/L iodine solution: dissolve 20 g of potassium iodide in Cheng You (30~40) 500mL mL water bottle; 5mL iodine stock solution, and then diluted to scale and mix. This solution every other day to prepare. 1.1.3 acetate buffer (PH5.3): dissolve 87g sodium acetate (CH3COONa • 3H2O) 400mL water and 10.5mL in glacial acetic acid is dissolved in a small amount of water. volume and then mixing the two together and add water to 500mL, using regulation to PH5.3. 1.1.40.5mol/L sodium chloride: 14.5 g of sodium chloride dissolved in boiled water, and constant volume to 500mL. 1.1.5 soluble starch: pure before use should determine its value. Accurate said take amount starch (equivalent to dry state 1g) Yu 250mL high type beaker in the, added80~90mL distilled water, Yu asbestos online in constantly mixing Xia quickly heating to boiling, then with fire keep micro-boiling 3min, stamped and cooling to at room temperature, transfer to 100mL capacity bottle in the, into 40 ? water bath in the makes solution reached this temperature, and in 40 ? Shi with distilled water (40 ?) set capacity, this starch solution placed 40 ? thermostat water bath in the for determination samples with. 1.2 the instrument a) constant temperaturewater bath: (40+-0.2) 0C. B) spectrophotometer. 1.3 procedures 1.3.1 preparation of samples: weighing 50mL 10G sample不同的版本对于样本容量、变量个数、矩阵阶数等有着不同的限制,用户可以通过以下命令了解和改变这些设定:memory 显示目前存储空间query memory 查看目前实际设定的存储空间set memory 10m 设定存储空间的大小set matsize 250 设定最大矩阵阶数set maxvar 2500 设定最大变量数(最小设定为2048)help limits 显示Stata的各种极限 2. Stata的界面管理, 首次打开Stata,将会出现一个询问是否进行更新的对话框。

Stata_A_dofiles中山大学连玉君教授stata初级讲义

Stata_A_dofiles中山大学连玉君教授stata初级讲义

60
61 * 1.5 浏览资料
62 *
1.5.1 变量的名称
63 *
1.5.2 查看资料的结构
64 *
1.5.2.1 更改变量的存储类型
65 *
1.5.2.2 -list- 命令的使用
66 *
1.5.2.3 定义变量的显示格式
67 *
1.5.2.4 数据和变量的标签
68 *
1.5.2.5 附加说明文字
101 *
1.8.2.3 其他命令
102
103 * 1.9 do 文档: 高效快捷地执行命令
104 *
1.9.1 do 文档简介
105 *
1.9.1.1 打开 do 文档编辑器
106 *
1.9.1.2 保存和关闭
107 *
1.9.1.3 执行 do 文档
108 *
1.9.2 合理规划你的do文档
109 *
47 *
1.3.4 时间序列资料
48 *
1.3.5 面板资料
49 *
1.3.6 STATA官方提供的资料
50 *
1.3.7 其它软件中的数据
51
52 * 1.4 存储和导出数据
53 *
1.4.1 存储数据
54 *
1.4.2 导出和转换
55 *
1.4.2.1 -outfile-命令:导出为 .raw 文本格式
214 *
2.6.1.4 一个例子
215 *
2.6.2 横向关联: -joinby-
216 *
2.6.3 纵向合并:追加样本
217 *
2.6.4 大型数据的处理
218 *
2.6.5 一些有用的外部命令

stata入门中文讲义_经济学_高等教育_教育专区

stata入门中文讲义_经济学_高等教育_教育专区

Stata及数据处理目录第一章STATA基础 (3)1.1 命令格式 (4)1.2 缩写、关系式和错误信息 (6)1.3 do文件 (6)1.4 标量和矩阵 (7)1.5 使用Stata命令的结果 (8)1.6 宏 (10)1.7 循环语句 (11)1.8 用户写的程序 (15)1.9 参考文献 (15)1.10 练习 (15)第二章数据管理和画图 (18)2.1数据类型和格式 (18)2.2 数据输入 (19)2.3 画图 (21)第3章线性回归基础 (22)3.1 数据和数据描述 (22)3.1.1 变量描述 (23)3.1.2 简单统计 (23)3.1.3 二维表 (23)3.1.4 加统计信息的一维表 (26)3.1.5 统计检验 (26)3.1.6 数据画图 (27)3.2 回归分析 (28)3.2.1 相关分析 (28)3.2.2 线性回归 (29)3.2.3 假设检验 Wald test (30)3.2.4 估计结果呈现 (30)3.3 预测 (34)3.4 Stata 资源 (35)第4章数据处理的组织方法 (36)1、可执行程序的编写与执行 (36)方法1:do文件 (36)方法2:交互式-program-命令 (36)方法3:在do文件中使用program命令 (38)方法4:do文件合并 (39)方法5:ado 文件 (40)2、do文件的组织 (40)3、数据导入 (40)4、_n和_N的用法 (44)第一章STATA基础STATA的使用有两种方式,即菜单驱动和命令驱动。

菜单驱动比较适合于初学者,容易入学,而命令驱动更有效率,适合于高级用户。

我们主要着眼于经验分析,因而重点介绍命令驱动模式。

图1.1Stata12.1的基本界面关于STATA的使用,可以参考Stata手册,特别是[GS] Getting Started with Stata,尤其是第1章A sample session和第2章The Stata User Interface。

stata操作介绍之基础部分一讲述ppt课件

stata操作介绍之基础部分一讲述ppt课件
Stata 菜单栏简介
包含八项下拉菜单:文件、编辑、数据、绘图、统计分析、用户、窗口及帮助。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1.10 Stata文件格式
• Stata常用的文件格式:
文件类型
扩展名
数据文件
.dta
命令程序文件
.do
运行程序文件
.ado
帮助文件
.hlp
说明
stata使用的数据
一系列命令的集合
用于完成用户提交的数据处理与统 计分析任务的程序文件
与相应的.ado文件有相同的文件名, 形成一堆文件,并提供在线帮助
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
命令回顾 窗口
结果窗口
命令窗口
变量 名
窗口
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1.4 Stata与其他软件的区别
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。

stata第六讲【山大陈波】

stata第六讲【山大陈波】

利用极大似然估计方法拟合, Yhat=0 负的产出 Yhat<>0(通常yhat=1) 正的产出
例如: sysuse auto,clear logit foreign weight mpg
相当于计算如下概率: Pr(foreign = 1) = F(B0 + B1weight + B2mpg)
use brand,clear
tab brand
mlogit brand age female 结果分析 可以利用predict提取个体选择概率
predict p1 p2 p3
list 可以根据研究需要,自由地指定用来比较的base outcome(参照点)。 mlogit brand age female,base(3)
负二项回归模型
所谓负二项分布是指,在独立的实验中,成 功n次的时候,失败次数x的概率分布。当成 功n次时,实验停止,此时失败次数为x,那 么总的实验次数为(n+x),而且最后一次 (即第(n+x)次)是成功的。那么,前 (n+x-1)次试验中成功次数为(n-1)、失 败次数为x。负二项分布适用于当试验成功的 次数(n)确定下来后,试验失败的次数(x) 的分布。
伪随机数
例二: clear set obs 10000 gen x1 = uniform() gen x2 = uniform() list x1 x2 in 1/50 但是如果加上一句话:set seed 123,情况会 发生变化。
set seed 12345 gen x3 = uniform() set seed 12345 gen x4 = uniform() list x3 x4 in 1/50
3。自由度为k1,k2的F分布 clear rndf 1000 3 20 histogram xf

第一讲 stata基础----山大stata实验课讲义

第一讲 stata基础----山大stata实验课讲义

Stata命令格式
1。Stata的命令一定要区分大小写,除了极 个别的情况下,stata命令全部用小写。 2。大部分命令可以缩写。 使用缩写可以使stata的命令书写大为简化: 例如: display-------di summarize------sum describe------des regress------reg 得到正确命令缩写的简单方法:看help。
添加标签
打开wage1数据文件。 1。为整个数据添加标签:例如,将数据命名 为“工资表”。 2。为变量增加标签,例如, wage:年工资总额 educ:受教育年限。 exper:工龄。 3。为变量值增加标签 例如:为变量marrid添加数值标签marry: 1=married; 0=Unmarried
1002
1003
87
76
72
80Biblioteka 80852。在Excel或者记事本文件编辑好后导入。 直接粘贴 Import导入:除了xls格式,还可以导入txt 格式和其他格式。 练习:利用import方法将wage2.xls导入
数据类型的转变
首先先学习两种最简单的: 1. 数值型------字符型 tostring 变量列表,gen(新变量) | replace 2. 字符型------数值型 destring 变量列表,gen(新变量) | replace
display 显示计算结果。经常写为: di summarize 求某个变量的观察值个数、平 均值、标准差、最小值和最大值。经常写为: sum scatter 生成两个变量的散点图。 set obs 定义样本个数(使用前一定要用 drop或者clear命令清空当前样本)
generate 建立新变量并赋值。经常写为 gen sort 按照某一个变量排序,一般用于升序。 gsort 按照某一个变量排序,既可升序又可 降序。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例题:利用MLE方法估计下列两个方程: 1.price=b0+b1*weight+b2*length+ε 2.price=b0+b1*weight+b2*length+b3*mpg+ε 利用wald检验和LR检验验证:b3=0
sysuse auto,clear ml model lf myprog (price = weight length) (sigma:) ml max est store r0 ml model lf myprog (price = weight length mpg) (sigma:) ml max est store r1
异方差的检验与FGLS
异方差是违背了球型扰动项假设的一种情形。 在存在异方差的情况下: (1)OLS 估计量依然是无偏、一致且渐近 正态的。 (2)估计量方差Var(b|X) 的表达式不再是 σ2(X’X)−1,因为Var(ε|X) ≠σ2I。 (3)Gauss-Markov 定理不再成立,即OLS 不再是最佳线性无偏估计(BLUE)。
参数约束检验的三大方法: Wald检验 似然比检验(LR) 拉格朗日乘数检验(LM) 注意: 1。参数约束检验不仅用于MLE中,同时可以用在其 他计量方法中。 2。由于LM检验在后面的计量模型中广泛使用,检验 过程与模型设定密切相关,因此stata没有提供单纯 使用LM进行检验的命令,只能通过手动计算的方法, 因此,在此我们重点关注前两种检验。
Stata上机实验
大样本OLS
大样本OLS经常采用稳健标准差估计(robust) 稳健标准差是指其标准差对于模型中可能存 在的异方差或自相关问题不敏感,基于稳健 标准差计算的稳健t统计量仍然渐进分布t分布。 因此,在Stata中利用robust选项可以得到异 方差稳健估计量。
Nerlove(1963)的一篇著名文章
我们可以利用矩阵运算的方法将回归结果展 现的所有统计量都手动计算出来。 大家有兴趣回去做一遍,可以加深你对这些 知识的理解。
逐步回归法
逐步回归法分为逐步剔除和逐步加入。 逐步剔除又分为逐步剔除(Backward selection)和逐步分层剔除 (Backward hierarchical selection) 1。逐步剔除 stepwise, pr(显著性水平): 回归方程 例如:对auto数据 Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 2。逐个分层剔除 Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 去掉foreign 重新做一遍
3。BP 检验:做完回归后,使用命令: estat hettest ,normal(使用拟合值yˆ ) estat hettest,rhs (使用方程右边的解释变量,而不 是yˆ ) estat hettest [varlist] (指定使用某些解释变量) 最初的BP 检验假设扰动项服从正态分布,有一 定局限性。Koenker(1981)将此假定放松为iid, 在实际中较多采用,其命令为: estat hettest, iid estat hettest, rhs iid estat hettest [varlist],iid
异方差的处理
1。使用“异方差稳健标准差”(robust standard error):这是最简单,也是目前比较流行的方法。 只要样本容量较大,即使在异方差的情况下,只要 使用稳健标准差,则所有参数估计、假设检验均可 照常进行。 2。FGLS。由于广义最小二乘法与加权最小二乘法 的一个缺点是假设扰动项的协方差矩阵为已知。这 常常是一个不现实的假定。因此,现代计量经济学 多使用“可行广义最小二乘法”(FGLS)。
2。还可以将变量转换为矩阵 mkmat 变量名表,mat(矩阵名) 练习:sysuse auto reg price mpg weight foreign 要求:利用矩阵运算手动计算出参数
gen cons = 1 mkmat price, mat(y) mkmat mpg weight foreign cons, mat(X) mat b = inv(X'*X)*X'*y mat list b (还可以看一下矩阵x与y的值)
为了检验美国电力行业是否存在规模经济, Nerlove(1963)收集了1955年145家美国电 力企业的总成本(TC)、产量(Q)、工资率(PL)、 燃料价格(PF)及资本租赁价格(PK)的数据 (nerlove.dta)。假设第个企业的生产函数 为Cobb-Douglas:
Qi = Ai Li Ki Fi
逐步加入又分为逐步加入(Forward selection)和逐步分层加 入(Forward hierarchical selection) 1。逐步加入 stepwise, pe(显著性水平): 回归方程 例如:对auto数据 Stepwise,pe(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 2。逐个分层加入 Stepwise,pe(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign
α1
α2
α3
其中分别为生产率、劳动力、资本与燃料。 记为规模效应(degree of returns to scale)。 假设企业追求成本最小化,可证明其成本函 数也为Cobb-Douglas:
TCi = δiQ (PL)i (PK)i (PF)i
r r
1 r i
α1
α2
α3
r
其中是的函数。取对数 后得到如下模型。
约束回归
例一:use production,clear cons def 1 lnl+lnk = 1 cnsreg lny lnl lnk, c(1) 例二:use nerlove,clear
cons def 1 lnpl+lnpk+lnpf=1 . cons def 2 lnq=1 . cnsreg lntc lnq lnpl lnpk lnpf, c(1-2)
矩阵运算
1。手动建立矩阵命令:matrix Matrix input 矩阵变量名=(矩阵) 同一行元素用,分隔 不同行元素用\分割 建立矩阵 : 3 6 8 5 11 7 2 18 16
显示矩阵变量 mat dir 显示矩阵内容 Mat list 矩阵变量
常用矩阵运算: C=A+B A-B A*B Kronecker乘积 :C=A#B 常用矩阵函数: trace(m1) m1的迹 Diag(v1) 向量的对角矩阵 inv(m1) m1的逆矩阵
异方差的检验
1。残差图 2。怀特检验 3。Breusch-Pagan(BP)检验 4。 G-Q 检验 (Goldfeld-Quandt,1965) 5。 Szroeter's 秩检验(Szreter,1978) 后两种现在已经基本不用。
一般截面数据容易产生异方差 而时间序列数据容易产生自相关
1。残差图: rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versus-predictor plot) 作图命令一定要在回归完成之后进行 2。怀特检验:做完回归后,使用命令: estat imtest, white
分别使用普通OLS和稳健的标准差OLS进行 估计。 结果可以看到:稳健标准差与普通标准差的 估计的系数相同,但标准差和t值存在着较大 的差别,尤其是lnq的标准差。
约束回归
定义约束条件 constraint define n 条件 约束回归语句 Cnsreg 被解释变量 解释变量, constraints(条 件编号)
例二: use production,clear ml model lf myprog (lny= lnk lnl)(sigma:) ml max 例三:附加约束的MLE cons def 1 lnk + lnl = 1 ml model lf myprog (lny= lnk lnl)(sigma:),constraint(1) ml max
我们举一个最简单的多元线形回归的例子, 更复杂的例子我们将在“stata编程”部分介 绍。 假设x_i 服从均值为mu, 标准差为prog.ado 执行MLE: 例一: sysuse auto,clear ml model lf myprog (price= weight length foreign)(sigma:) ml max 和OLS比较:reg price weight length foreign 回归系数完全相同
wald检验:test mpg (Prob > chi2 =0.2878) LR检验: lrtest r0 r1 (Prob > chi2 =0.2896) 均接受原假设 所以 b3=0 成立 自己联系:将方程2改为: price=b0+b1*weight+b2*length+b3*mpg+b4 *foreign+ε 检验: b3=b4=0
例一
使用WLS对nerlove.dta的无约束回归方程重 新进行估计。假设 log σi2 = δ ln qi + ui ˆ (无截距项)。检验是否存在异方差,如果 存在则使用FGLS方法进行回归。 检验结果存在异方差,需要利用FGLS加以消 除。
相关文档
最新文档