stata第二讲

合集下载

stata 中文教程

stata 中文教程

Stata介绍作为流行的计量经济学软件,Stata的功能十分地全面和强大。

可以毫不夸张地说,凡是成熟的计量经济学方法,在Stata中都可以找到相应的命令,而这些命令都有许多选项以适应不同的环境或满足不同的需要。

即使是最详细的Stata手册,也难免有遗珠之憾,更何况本文仅是一个粗浅的介绍。

掌握Stata最好的办法是在实践中学习:Stata 本身提供了非常强大的帮助系统,并且关于Stata的书籍和网络资源都不少。

本文拟根据如下顺序介绍Stata:1.界面;2.文件和数据;3.语法和命令;4.数据管理;5.描述统计;6.画图;7.回归和回归分析;8.常用命令。

第3和第4部分是最体现Stata灵活性的地方,也是应用Stata的基础。

第5和第6部分介绍如何用Stata完成基本的统计功能。

Stata的功能很多,比如回归,曲线拟合,生存分析,主成分分析,因子分析,聚类分析,时间序列分析等等。

但回归无疑是其中最重要的功能。

第7部分介绍如何用Stata作线性回归和Logistic回归。

本文第2和第3部分包含了作者的观点,难免有偏颇之处。

其余部分主要来自文献的归纳和总结。

限于水平有限,错误在所难免,敬请原谅。

1.界面图1 Stata界面Stata有4个窗口:1. Stata Command(右下)用于向Stata输入命令;2. Stata Results(右上)用于显示运行结果;3. Review(左上)记录使用过的命令;4. Variables(左下)显示当前memory中的所有变量。

窗口上方是工具栏,其上的按钮依次为(从左到右)Open, Save, Print Graph/Print Log, Log Start/Stop/Suspend, Bring Log to Front, Bring Graph to Front, Do-file Editor, Data Editor, Data Browser, Clear –more- condition, Break。

stata操作介绍之相关性分析PPT课件02

stata操作介绍之相关性分析PPT课件02
correlate尽可能使用两两变量中所有没有缺失的数据
pwcorr [varlist] [if] [in] [weight] [ ,correlate_ options ]
pwcorr只采用没有任何缺失数据的完整观 测值
选项 means covariance
correlate 选 项 说 明含义
test price advert
P值,拒绝原假设 ,即价格和广告支出的 系数不同时为0
相关检验和处理
回归分析时通常需要检验数据是否存在多重共线、序列相关和异方差
等问题,如果存在这些问题,则需要对其进行处理。
1.多重共线性的检验和处理
中多重共线性检验的命令格式为:
vif //该命令用来得到自变量的方差膨胀因子
ptions]
选项 noconstant hascons level(#) beta noheader
含义 不加常数项做线性回归 由用户指定常数项的值 设定置信水平(默认值为95% ) 报告标准化的beta系数 不报告输出表名
实现因变量为销售收入,自变量为单价和广告支出的线 性回归,其命令为:
regress sales price advert
表下方区域为基本的回归结果。第1列依次为被解释变量 sales,解释变量price、advert,截距项constant;第2列 回归系数;第3列回归系数的标准误;第4列回归系数的 t 统计量值;第5列p值;
表左上方区域为方差分析表。第2列从上到下依次为回归平 方为和自(由SS度E,)、分残别差为平k方=2和,(nS-SkR-1)和=7总5-2离-1差=7平2,方n和-1(=S7S5T-1)=;74第;3列第 4列为均方和(MSS),由各项平方和除以相应的自由度得到。 表ua右red上)、方调区整域的给判出定了系样数本(数Ad(Nj uRm-sbqeuraroefdo)、bs)F、统判计定量系的数值(、R-回sq 归方程标准误 (Root MSE) 以及其他一些统计量的信息。

让你快速上手的stata讲义

让你快速上手的stata讲义

Stata简明讲义王非中国经济研究中心ebwf@〇、写在前面的话关于学习Stata的意义,大家只需知道:目前,Stata是计量经济学、特别是微观计量经济学的主流软件。

因此,Stata很重要、很有用,而大家也会在使用Stata 的过程中慢慢体会到它的特点。

本讲义取名为“Stata简明讲义”,意在突出“简”和“明”两个字。

虽然讲义长达五十多页,但相比Stata的完全手册来说,还不及九牛之一毛,故为“简”。

实际上,完全手册中的很多内容都鲜有人(特别是计量经济学者)问津,而本讲义列出的内容则是大家经常用到的操作;所以,“简”也有“简”的好处。

即便如此,掌握这份讲义也并非易事。

所谓“明”,是明晰的意思。

本讲义本着“手把手教”的精神,力求把每项操作都说得具体明晰,以方便初学者(特别是没有程序操作经历的初学者)尽快上手。

至于本讲义在“简明”上做得怎么样,还需要各位读者来评判。

中心的一位学长邹传伟,曾经写过一份“Stata介绍”,在网上可以下载。

那份讲义比较全面,但不够具体明晰。

本讲义参照那份讲义,在框架上查漏补缺,并进一步地明晰化。

本讲义第二部分的“do文件”和第七部分的“残差分析”的相关内容均来自于中心的沈艳老师的相关讲义,而沈老师对于本讲义的成形给予了细致的指导。

本讲义附带了一些数据文件,其中“WAGE1.dta”和“WAGEPRC.dta”均来自Wooldridge的中级计量教材的数据集,而其他数据则为作者自己的杜撰。

尽管从别人那里拿来了许多好东西,但本讲义的任何错误仍源于作者自己的疏忽。

本讲义是这样安排的:第一部分讲Stata的界面,第二部分讲do文件,第三部分讲怎样把数据导入Stata,第四部分专门讲help和search命令以及帮助文件的阅读方法,第五部分讲数据的描述及管理,第六部分讲如何画图,第七部分讲初步的回归分析。

祝各位学习愉快。

一、Stata长什么样?首先,让我们看看Stata长什么样。

我们以Stata 9.1(以下简称Stata)为例。

STATA学习系列 ppt课件

STATA学习系列  ppt课件

Variance .0655441 Skewness 5.857965 Kurtosis 38.08436
医学资料
12
1.Census数据,对模型分析
list state if influ >4/50(>4/n) state 2. Alaska 9. Florida 11. Hawaii 44. Utah . lvr2plot,s([state]) trim (12) border (图象)
Source | SS df -------------+-----------------------------Model | .00005593 3 Residual | .000027249 46 -------------+-----------------------------Total | .000083179 49
医学资料 11
1.Census数据,对模型分析
影响因素分析:



predict influs,cooksd (cook’sd用来衡量每个收集到的数值对回归系数的影响强度。) . summarize influs,detail
.


Cook's D ------------------------------------------------------------Percentiles Smallest 1% 1.35e-08 1.35e-08 5% 6.25e-06 4.54e-06 10% .0000502 6.25e-06 Obs 25% .0010358 .0000109 Sum of Wgt.
-----------------------------------------------------------------------------drate | Coef. Std. Err. t P>|t| -------------+---------------------------------------------------------------medage | .0004851 .001207 0.40 0.690 medagesq | 2.37e-06 .0000206 0.12 0.909 pcturban | -.0035348 .0008293 -4.26 0.000 _cons | -.005598 .0178979 -0.31 0.756 ------------------------------------------------------------------------------

《stata基础》课件

《stata基础》课件

Stata的特点
高效可靠、易于使用和学习、 自动化、开放性和灵活性、 强大的图形功能。
Stata的应用领域
Stata被广泛应用于社会科学、 医学和卫生、教育、经济学、 金融、政治科学等领域。
Stata基本操作
1
文件类型
2
Stata的文件类型,如何识别文件类型,
如何处理不同类型的文件。
3
常用命令
4
Stata的常用命令,如何运行命令和脚本。
数据的分割和堆叠
如何按照条件分割数据集,如何 将多个数据集堆叠成一个数据集。
Stata数据分析
1
描述性统计
如何计算描述性统计量,如何画制表和图形。
2
假设检验
基础假设检验、方差分析、非参检验等。
3
回归分析
单因素、多因素、分层回归等基本回归分析方法。
4
面板数据分析
如何处理面板数据,如何进行面板数据分析。
Stata基础课件PPT
本课程详细介绍Stata的基本操作、数据处理和分析、绘图功能和高级应用等 方面。从此你可以掌握Stata的全面操作,数据处理和分析,提高Stata的应用 水平。
Stata介绍
什么是Stata?
Stata是一款强大的数据分析 软件,被广泛应用于多个领 域,如社会科学、健康科学、 教育、经济学、金融、政治 科学等。
Stata的扩展程序
Stata的并行计算
如何下载和安装Stata的扩展程序, 如何使用额外的命令。
如何利用Stata高效地运行大数据 集,如何使用Stata的并行计算。
总结和展望
1 Stata的优缺点
Stata的优点有:强大的数据管理和较高的统计分析能力;缺点有:虽然易学但不便宜, 还需要花时间去了解命令。

Stata软件基本操作和数据分析入门(完整版讲义)

Stata软件基本操作和数据分析入门(完整版讲义)

Stata软件基本操作和数据分析入门(完整版讲义)Stata软件基本操作和数据分析入门第一讲Stata操作入门张文彤赵耐青第一节概况Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。

它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。

Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS 系统也毫不逊色。

另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。

由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。

但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。

更为令人叹服的是,Stata 语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。

除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。

Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。

用户可随时到Stata网站寻找并下载最新的升级文件。

事实上,Stata 的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata 程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。

Stata入门

Stata入门
Stata入门
东南大学经济管理学院 秦双全
过程窗口
一、认识stata
结果 窗口
变量 窗口
命令 窗口
• 通过下拉菜单“windows”在桌面上摆放各 功能窗、可以把光标放在各窗口边缘来调 整各窗口的大小,通过单击右键选择 “preferences”改变“结果”栏的颜色
二、回归前的工作
• 1、导入数据 • 如果原来就有stata文件打开即可
10、计算功能:di splay log(2) 11\用do 文件(下拉菜单倒数第6个钮)
三、回归
• 回归的命令很多,也有很多的参数在此只说最简单 的,详细的请参考help reg • Reg y x1 x2 x3 if….,noc • 一般的回归参数在stata返回的结果上都有 • 如果要检验某些(如x1x3)参数的联合显著度: Test x1 x3 (test x1==1~~ test _b[X1]==1 test _b[_cons]) _b[varname]表示变量的系数 Testnl _b[x1]=_b[x2]^2,表示非线性检验 约束回归:先定义约束条件,constraint def 1 x1+x2=4 然后进行回归:cnsreg y x1 x2 x3 x4,c(1) 如果有多个约束条件,则定义多个条件后,c(1-n)
2、异方差
(1)、危害 虽然参数估计是无偏的,但是方差增大了。 (2)、检验 a imtest (,white) ---怀特检验 如果P值小于0.05则存在异方差 b hettest --BPG检验 同上 c BP 检验 reg Y X X predict e,resid gen e2=e2 rege2 X X 如果该方程显著则异方差 d 格莱泽检验 :regY X X predict e ,resid gen e1=abs(e) reg e1 x x 同上 (3)补救 WLS a 两边同除X 后OLS b 两边同除根号x c 两边同除 Y的均值或 d 两边取对数 (4) 不要过度反应:只有ols比gls大10倍问题才严重

stata操作介绍之基础部分一讲述ppt课件

stata操作介绍之基础部分一讲述ppt课件
Stata 菜单栏简介
包含八项下拉菜单:文件、编辑、数据、绘图、统计分析、用户、窗口及帮助。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1.10 Stata文件格式
• Stata常用的文件格式:
文件类型
扩展名
数据文件
.dta
命令程序文件
.do
运行程序文件
.ado
帮助文件
.hlp
说明
stata使用的数据
一系列命令的集合
用于完成用户提交的数据处理与统 计分析任务的程序文件
与相应的.ado文件有相同的文件名, 形成一堆文件,并提供在线帮助
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
命令回顾 窗口
结果窗口
命令窗口
变量 名
窗口
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1.4 Stata与其他软件的区别
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

inft 0 1unemt ut
例三:我国某地区1955---1984农产品收购量
sg、库存量kc存放在文件warehouse.dta中 估计如下方程: Sgt=a+b0kct+b1kct-1+u
回归后预测值的获得
Predict
1。拟合值的获得: predict yhat, xb 或者 predict yhat
2。残差的获得
predict e , residuals 或者 predict e, res
回归的假设检验
Test命令
例一 sysuse auto, clear reg price mpg weight length
1。检验参数的联合显著性
2。分别检验各参数的显著性
3。三个参数对被解释变量的影响相同
入(Forward hierarchical selection) 1。逐步加入 stepwise, pe(显著性水平): 回归方程 例如:对auto数据 Stepwise,pe(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign
Regress命令详解:
regress depvar [indepvars] [if] [in] [weight] [,
options]
1。要求方程省略常数项(自己设置常数项)
reg price mpg weight foreign, nocons(hascons) 2。稳健性估计(一般用于大样本OLS) reg price mpg weight foreign, vce(robust) 或者:reg price mpg weight foreign, r 3。设置置信区间(默认95%) reg price mpg weight foreign, level(99)
4。标准化系数
reg price mpg weight foreign, beta 5。部分数据回归
reg price mpg weight length foreign in 1/30
(为什么foreign被drop掉?)
reg price mpg weight length if foreign==0
2。逐个分层加入 Stepwise,pe(0.05) hier:reg price mpg rep78 headroom
trunk weight length turn displacement gear_ratio foreign
残差点的图形表示

rvfplot:残差拟合值图 可以加参数yline(0) 将e 与ˆy 画在一起 rvpplot x1:残差预测值图 将e 与x1 画在一起 avplot avplots lvr2plot
对数 平方项 n次方
指数 交乘项 虽然对函数形式的选择有检验方法,但最好 还是从“经济意义”角度确定。
例题
例一:利用wage2的数据检验明瑟(mincer)工
资方程的简单形式: Ln(wage)=b0+b1*educ+b2*exper +b3*exper^2+ u
例二:利用phillips的数据拟合预期增强的菲
件编号)
约束回归
例一:打开production cons def 1 lnl+lnk = 1 cnsreg lny lnl lnk, c (1)
例二:sysuse auto,clear cons def 1 price = weight cons def 2 displacement = weight cons def 3 gear_ratio = -foreign cnsreg mpg price weight displacement gear_ratio foreign
例三:生产函数production
use production,clear reg lny lnl lnk



test lnl lnk test (lnl=0.8) (lnk=0.2) test lnk+lnl=1
非线性检验:testnl
例一



. sysuse auto gen weight2 = weight^2 reg price mpg trunk length weight weightsq foreign testnl _b[mpg] = 1/_b[weight] testnl (_b[mpg] = 1/_b[weight]) (_b[trunk] = 1/_b[length])
利普斯曲线为
e
inft inft 1 (unemt 0 ) ut
其中,unemt表示第t期的失业率(%),inft
表示第t期的通货膨胀率(%),infte表示预 期通货膨胀率,μ0表示自然失业率(%)。 按照适应性预期理论,infte = inft-1。 令Δinft=inft - inft-1,上述模型可以简化为:
mat dir 显示矩阵内容
Mat list 矩阵变量
常用矩阵运算: C=A+B A-B A*B Kronecker乘积 :C=A#B

常用矩阵函数: trace(m1) m1的迹 Diag(v1) 向量的对角矩阵 inv(m1) m1的逆矩阵
2。还可以将变量转换为矩阵
Stata上机实验
作业解答
作业1答案
作业2答案
添加标签
1。为整个数据添加标签:例如,将数据命名



为“工资表”。 菜单:Data->Labels->Label dataset 命令:label data “工资表“ 2。为变量增加标签,例如,给变量wage增 加标签“年工资总额” 菜单:Data->Labels->Label variables 命令 label variable wage “年工资总额"
小样本OLS
小样本OLS假设条件较为严格



假设1: 二者之间存在线性关系 y = a0 + a1*x1 + a2*x2 + ... + ak*xk +ε y = Xb +ε 假设2: X 是满秩的,i.e. rank(X) = k 假设3: 干扰项的条件期望为零(严格外生性) * E[ε| X] = 0
例二:打开production
reg lny lnl lnk testnl _b[lnl] * _b[lnk] = 0.25
testnl _b[lnl] * _b[lnk] = 0.5

大样本OLS
大样本OLS经常采用稳健标准差估计(robust)
稳健标准差是指其标准差对于模型中可能存
length, c(1-3) (本题没有什么经济意义,只是让大家熟悉这种方法)
矩阵运算
1。手动建立矩阵命令:matrix Matrix input 矩阵变量名=(矩阵) 同一行元素用,分隔
不同行元素用\分割
建立矩阵 :

3 5 2
6 8 11 7 18 16
显示矩阵变量
例二: use wage2, clear reg lnwage educ tenure exper expersq 1。教育(educ)和工作时间(tenure)对工资的
影响相同。 test educ=tenure 2。工龄(exper)对工资没有影响 test exper 或者 test exper =0 3。检验 educ和 tenure的联合显著性 test educ tenure 或者 test (educ=0) (tenure=0)
2。逐个分层剔除 Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight
length turn displacement gear_ratio foreign 去掉foreign 重新做一遍
逐步加入又分为逐步加入(Forward selection)和逐步分层加
自己练习:为下列变量增加标签
educ:受教育年限。 exper:工龄。
tenure:现有岗位任期。
为变量值增加标签 例如:为变量marrid添加数值标签marry:

1=married; 0=Unmarried 菜单:Data->Labels->Label values->Define or modify label values Data->Labels->Label values->Assign label values to variable 命令: . label define marry 1 “married” 0 “unmarried" . label values married marry
我们可以利用矩阵运算的方法将回归结果展
现的所有统计量都手动计算出来。 大家有兴趣回去做一遍,可以加深你对这些 知识的理解。
逐步回归法
逐步回归法分为逐步剔除和逐步加入。 逐步剔除又分为逐步剔除(Backward selection)和逐步分层剔除

(Backward hierarchical selection) 1。逐步剔除 stepwise, pr(显著性水平): 回归方程 例如:对auto数据 Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign
相关文档
最新文档