运用Stata做计量经济学
使用Stata进行经济学和统计分析

使用Stata进行经济学和统计分析在当今的经济学研究和数据分析领域,Stata 凭借其强大的功能和易用性,成为了众多学者和研究人员的得力工具。
Stata 是一款专门用于数据管理、统计分析和绘图的软件,它为我们解决各种经济和统计问题提供了高效而可靠的途径。
Stata 的一个显著优势在于其丰富的数据管理功能。
在进行经济研究时,我们常常需要处理大量的数据,这些数据可能来自不同的来源,格式也各不相同。
Stata 能够轻松地读取和导入各种常见的数据格式,如 Excel、CSV 等,并且可以对数据进行清理、转换和合并等操作。
例如,我们可以使用`drop` 命令删除不需要的变量,使用`generate`命令创建新的变量,使用`merge` 命令将多个数据集合并在一起。
通过这些操作,我们能够将原始数据整理成适合分析的形式,为后续的研究工作打下坚实的基础。
在统计分析方面,Stata 提供了广泛而全面的统计方法。
无论是描述性统计、推断统计,还是复杂的计量经济学模型,Stata 都能应对自如。
比如,我们可以使用`summarize` 命令快速获取数据的均值、标准差、最小值和最大值等描述性统计量,从而对数据的基本特征有一个直观的了解。
对于假设检验,Stata 提供了`ttest` 命令用于均值比较,`chi2test` 命令用于独立性检验等。
在计量经济学领域,Stata 支持线性回归、Logit 模型、Probit 模型、面板数据模型等多种模型的估计和检验。
以线性回归为例,我们可以使用`regress` 命令来估计回归方程,并通过查看输出结果中的系数估计值、标准误、t 值和 p 值等信息来评估模型的拟合效果和变量的显著性。
除了基本的统计分析,Stata 还在处理时间序列数据方面表现出色。
时间序列数据在经济学中非常常见,如股票价格、通货膨胀率等。
Stata 提供了一系列专门用于时间序列分析的命令和函数,如`arima` 命令用于拟合自回归移动平均模型(ARIMA),`forecast` 命令用于进行预测。
计量经济学stata案例应用题

计量经济学stata案例应用题1. 使用 Stata 对某地区 2010 年至 2020 年的人口增长率进行分析。
首先,从国家统计局或其他可靠资源中获取相应地区每年的人口数据,并导入 Stata。
然后,计算每年的人口增长率,可以使用以下公式:人口增长率=(当前年份的人口-上一年份的人口)/ 上一年份的人口* 100。
最后,使用命令 summarize,regress 或者 graph 等命令对数据进行进一步分析和可视化。
2. 对某汽车制造公司的销售数据进行分析,判断价格、广告费用和其它因素对销售额的影响。
导入销售数据集,并确保数据的完整性和准确性。
使用命令 summarize,correlate 或者 graph 命令来计算变量之间的相关性。
使用命令 regress 来进行回归分析,考虑价格、广告费用和其他相关因素的影响,并根据回归系数和显著性水平进行解读。
使用命令 predict 来进行销售额的预测,并使用 graph 命令绘制销售额的趋势图或其他可视化图表。
3. 分析某公司员工的工资水平与其受教育程度、工作经验、性别和其他因素之间的关系。
导入员工的工资和个人信息数据集,并确保数据的完整性和准确性。
使用命令 tabulate 和 summarize 对不同因素之间的关系进行初步探索性分析。
使用命令 regress 或者是 logistic 命令对员工工资与受教育程度、工作经验、性别等因素进行回归分析,考虑相应的控制变量。
对回归结果进行解读,判断各个因素对工资水平的影响,并使用 graph 命令绘制相关图表来支持和解释分析结果。
4. 对某超市的销售数据进行分析,了解不同产品类别的销售趋势以及其它因素对销售额的影响。
导入超市的销售数据集,并确保数据的完整性和准确性。
使用 summarize,tabulate 或 graph 命令对产品类别的销售额和销售趋势进行初步分析和可视化。
使用命令regress 和相应的控制变量对销售额进行回归分析,考虑不同因素(例如季节、广告费用、促销活动等)的影响,并对结果进行解读。
运用Stata做计量经济学(最新整理)

运用Stata做计量经济学运用Stata建模的7步骤:1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……;2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……;3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差;4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……;5、修正模型:WLS、GLS、工具变量法(ivregress),……;6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……;7、整理:关闭日志、生成do文件备用1、准备工作让STATA处于初始状态,清除所有使用过的痕迹clear指明版本号version11设定并进入工作文件夹:cd D:\ (设定路径,将数据、程序和输出结果文件均存入该文件夹)关闭以前的日志capture log close建立日志:log using , replace设定内存:set mem 20m关闭more:set more off读入数据:use .dta, clear认识变量:describe建立时间变量:tsset2、用描述统计方法探索数据特征必要的数据转换:gen、replace、……;描述统计量:summarize, detail相关系数矩阵:corr/pwcorr散点图和拟合直线图:scatter y x || lfit y x矩阵散点图:graph matrix y x1 x2 x3,half线性趋势图:line y xOLS建立模型:regress y x1 x2 x3;由方差分析表并用F和R2检验模型整体显著性;依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量;估计参数,判别变量的相对重要性;构造和估计约束模型,用以检验经济理论4、诊断模型(1)检验异方差残差拟合值散点图:rvfplot残差平方与某个自变量的散点图predict e, residualsgen e2=eˆ2scatter e2 x1Breusch-Pagan拉格朗日乘数异方差检验estat hettest通过信息矩阵检验执行的white异方差检验estat imtest, white解析检验的零假设H0:同方差(2)检验序列相关散点图法predict rgen lagr=l.rscatter r lagr,xline(0) yline(0)趋势图法line r year, yline(0)Breusch-Godfrey LM test for autocorrelationestat bgodfrey,lags(1 2 3)Durbin’s alternative test for autocorrelationestat dubinalt,lags(1 2 3)Durbin-Watson dw-statisticestat dwatson(3)多重共线性检验多重共线性是否存在:R2和F很高,但t检验不显著判定系数检验法:某一自变量对其余自变量回归的R>0.8,判定该自变量引起多重共线性方差膨胀因子大于5estat vif(1)异方差的修正——WLSpredict r, residualsregress y x1 x2 x3 [w=1/abs(r)](2)修正同时存在异方差和序列相关之prais选项是corc变换,循环迭代Prais m gdp, corc第一次迭代后停止,两步法prais m gdp, twostep矫正同时存在异方差和序列相关之Newey-West假定模型存在异方差和滞后3阶的序列相关,用OLS估计Newey-West标准误Newey m gdp, lag(3)(3)多重共线性的修正排除引起共线性的变量差分法(短期模型)岭回归法(有偏估计)逐步回归法A. 向前法(只进不出)sw reg ...,pe(0.#)B. 向后法(只出不进)sw reg ...,pe(0.#)C. (有进有出)向前法sw reg ...,pe(0.#) pr(0.#) forwardpe(0.#) < pr(0.#)向前法是空模型的开始D. (有进有出)向后法sw reg ...,pe(0.#) pr(0.#)pe(0.#) < pr(0.#)向后法是满模型的开始(4)修正随机解释变量tsset yearivreg consp (gdpp=l.gdpp)用滞后一期的gdpp作gdpp的工具变量常数项虚拟变量自己作自己的工具变量。
计量经济学Stata软件应用

40
30
20
10
0
0
5
10
15
20
years of education
Fitted values
hourly wage
整理ppt
13
三、简单回归分析的Stata软件操作实例
7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样
本。命令如下:
reg wage edu if age<=30 得到以下运行结果,保存该运行结果;
入wage,在Independent Variables选项框中选择或键入edu→点击OK即可
整理ppt
11
三、简单回归分析的Stata软件操作实例
5、生成新变量 z 为上一个回归的拟合值,生成新变量 u 为 上一个回归的残差;然后根据 u 对数据进行从小到大的排 序,并列出 u 最小的5个观测。 命令如下: predict z (生成拟合值) predict u, residual ( 生成残差 ) sort u (根据 u 对数据从小到大排序) list wage z u in 1/5 (列出 u 最小的5个观测值以及对应的实
残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,
n-k-1=1225-1-1=1223,n-1=1225-1=1224;第4列为均方和(MSS),由各项
平方和除以相应的自由度得到。
(3) 表右上方区域给出了样本数(Number of obs)、判定系数(R-squared)、
8.06 0.000 7.81 0.000
.2979069 2.684359
.4895815 4.485031
(1) 表下方区域为基本的回归结果。第1列依次为被解释变量wage,解释 变量edu,截距项constant;第2列回归系数的OLS估计值;第3列回归系 数的标准误;第4列回归系数的 t 统计量值;
stata 计量方法(一)

stata 计量方法(一)Stata 计量方法Stata 是一种常用的统计软件,尤其在计量经济学领域得到广泛的应用。
本文将介绍使用 Stata 进行计量方法分析的基本步骤和常用命令。
回归分析回归分析是计量经济学中最基础的方法之一,用于探究一个或多个自变量对一个因变量的影响程度。
在 Stata 中,可以使用reg命令进行回归分析。
reg dependent_variable independent_variable1 independent_variable2 ...例如,以下命令将运行一个简单线性回归,其中自变量为x,因变量为y:reg y x多元回归分析多元回归分析是指使用多个自变量来解释因变量。
在 Stata 中,可以使用reg命令进行多元回归分析。
reg dependent_variable independent_variable1 independent_variable2 ...例如,以下命令将运行一个多元回归模型,其中自变量为x1和x2,因变量为y:reg y x1 x2差分处理差分处理是指对两个或多个时间点的数据进行比较。
在 Stata 中,可以使用diff命令进行差分处理。
diff variable, difference_option例如,以下命令将计算变量x的一阶差分:diff x, difference(1)仪器变量回归仪器变量回归是用于处理自变量与因变量之间存在内生性问题的一种方法。
在 Stata 中,可以使用ivreg命令进行仪器变量回归。
ivreg dependent_variable (endogeneous_variable = instruments) independent_variable1 independent_variable2 ...例如,以下命令将运行一个仪器变量回归模型,其中自变量为x,因变量为y,仪器变量为z:ivreg y (x = z) other_variables总结本文介绍了 Stata 中常用的计量方法分析,包括回归分析、多元回归分析、差分处理和仪器变量回归。
运用Stata建立计量经济学模型

➢
(2)为分析类似项目提供借鉴
➢ 操作:(1)在回顾窗口选择命令并复制
➢
(2)点击do-file Editor,或打开一个已存在的do文件
➢
(3)将复制的命令粘贴在do文件中
➢
(4)编辑已执行过的命令,包括增加注释
➢
(5)调试do文件
➢
(6)保存
9/2/2020
17
总结
➢1、准备工作;目录、日志、读入数据、熟 悉数据、时间变量、more、……;
➢ 通过信息矩阵检验执行的white异方差检验
➢ estat imtest, white
➢
9/2/2020
解析检验的零假设H0:同方差
6
4、诊断模型
➢ (2)检验序列相关 ➢ 散点图法
➢ predict r ➢ gen lagr=l.r ➢ scatter r lagr,xline(0) yline(0)
➢ pe(0.#) < pr(0.#)向前法是空模型的开始
➢ D. (有进有出)向后法 sw reg ...,pe(0.#) pr(0.#)
➢ pe(0.#) < pr(0.#)向后法是满模型的开始
9/2/2020
11
5、修正模型
➢ (4)修正随机解释变量 ➢ tsset year ➢ ivreg consp (gdpp=l.gdpp) ➢ 用滞后一期的gdpp作gdpp的工具变量 ➢ 常数项虚拟变量自己作自己的工具变量。 ➢ ivreg y1 x1 x2 (y2 y3 = z1 z2 z3) x3 ➢ 用z1 z2 z3作y2和y3的工具变量 ➢ x1 x2 x3和常数项虚拟变量自己作自己的工具变量
➢6、应用模型:置信区间、预测、结构分析、 边际分析、弹性分析、……;
计量经济学stata操作指南

计量经济学stata操作指南计量经济学stata操作(实验课)第一章stata基本知识1、stata窗口介绍2、基本操作(1)窗口锁定:Edit-preferences-general preferences-windowing-lock splitter (2)数据导入(3)打开文件:use E:\example.dta,clear(4)日期数据导入:gen newvar=date(varname, “ymd”)format newvar %td 年度数据gen newvar=monthly(varname, “ym”)format newvar %tm 月度数据gen newvar=quarterly(varname, “yq”)format newvar %tq 季度数据(5)变量标签Label variable tc ` “total output” ’(6)审视数据describelist x1 x2list x1 x2 in 1/5list x1 x2 if q>=1000drop if q>=1000keep if q>=1000(6)考察变量的统计特征summarize x1su x1 if q>=10000su q,detailsutabulate x1correlate x1 x2 x3 x4 x5 x6(7)画图histogram x1, width(1000) frequency kdensity x1scatter x1 x2twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) (8)生成新变量gen lnx1=log(x1)gen q2=q^2gen lnx1lnx2=lnx1*lnx2gen larg=(x1>=10000)rename larg largeg large=(q>=6000)replace large=(q>=6000)drop ln*(8)计算功能display log(2)(9)线性回归分析regress y1 x1 x2 x3 x4vce #显示估计系数的协方差矩阵reg y1 x1 x2 x3 x4,noc #不要常数项reg y1 x1 x2 x3 x4 if q>=6000reg y1 x1 x2 x3 x4 if largereg y1 x1 x2 x3 x4 if large==0reg y1 x1 x2 x3 x4 if ~large predict yhatpredict e1,residualdisplay 1/_b[x1]test x1=1 # F检验,变量x1的系数等于1test (x1=1) (x2+x3+x4=1) # F联合假设检验test x1 x2 #系数显著性的联合检验testnl _b[x1]= _b[x2]^2(10)约束回归constraint def 1 x1+x2+x3=1cnsreg y1 x1 x2 x3 x4,c(1)cons def 2 x4=1cnsreg y1 x1 x2 x3 x4,c(1-2)(11)stata的日志File-log-begin-输入文件名log off 暂时关闭log on 恢复使用log close 彻底退出(12)stata命令库更新Update allhelp command第二章有关大样本ols的stata命令及实例(1)ols估计的稳健标准差reg y x1 x2 x3,robust(2)实例use example.dta,clearreg y1 x1 x2 x3 x4test x1=1reg y1 x1 x2 x3 x4,rtestnl _b[x1]=_b[x2]^2第三章最大似然估计法的stata命令及实例(1)最大似然估计help ml(2)LR检验lrtest #对面板数据中的异方差进行检验(3)正态分布检验sysuse auto #调用系统数据集auto.dtahist mpg,normalkdensity mpg,normalqnorm mpg*手工计算JB统计量sum mpg,detaildi (r(N)/6)*((r(skewness)^2)+[(1/4)*(r(kurtosis)-3)^2]) di chi2tail(自由度,上一步计算值)*下载非官方程序ssc install jb6jb6 mpg*正态分布的三个检验sktest mpgswilk mpgsfrancia mpg*取对数后再检验gen lnmpg=log(mpg)kdensity lnmpg, normaljb6 lnmpgsktest lnmpg第四章处理异方差的stata命令及实例(1)画残差图rvfplotrvfplot varname*例题use example.dta,clearreg y x1 x2 x3 x4rvfplot # 与拟合值的散点图rvfplot x1 # 画残差与解释变量的散点图(2)怀特检验estat imtest,white*下载非官方软件ssc install whitetst(3)BP检验estat hettest #默认设置为使用拟合值estat hettest,rhs #使用方程右边的解释变量estat hettest [varlist] #指定使用某些解释变量estat hettest,iidestat hettest,rhs iidestat hettest [varlist],iid(4)WLSreg y x1 x2 x3 x4 [aw=1/var]*例题quietly reg y x1 x2 x3 x4predict e1,resgen e2=e1^2gen lne2=log(e2)reg lne2 x2,nocpredict lne2fgen e2f=exp(lne2f)reg y x1 x2 x3 x4 [aw=1/e2f](5)stata命令的批处理(写程序)Window-do-file editor-new do-file#WLS for examplelog using E:\wls_example.smcl,replaceset more offuse E:\example.dta,clearreg y x1 x2 x3 x4predict e1,resgen e2=e1^2g lne2=log(e2)reg lne2 x2,nocpredict lne2fg e2f=exp(lne2f)*wls regressionreg y x1 x2 x3 x4 [aw=1/e2f]log closeexit第五章处理自相关的stata命令及实例(1)滞后算子/差分算子tsset yearl.l2.D.D2.LD.(2)画残差图scatter e1 l.e1ac e1pac e1(3)BG检验estat bgodfrey(默认p=1)estat bgodfrey,lags(p)estat bgodfrey,nomiss0(使用不添加0的BG检验)(4)Ljung-Box Q检验reg y x1 x2 x3 x4predict e1,residwntestq e1wntestq e1,lags(p)* wntestq指的是“white noise test Q”,因为白噪声没有自相关(5)DW检验做完OLS回归后,使用estat dwatson(6)HAC稳健标准差newey y x1 x2 x3 x4,lag(p)reg y x1 x2 x3 x4,cluster(varname)(7)处理一阶自相关的FGLSprais y x1 x2 x3 x4 (使用默认的PW估计方法)prais y x1 x2 x3 x4,corc (使用CO估计法)(8)实例use icecream.dta, cleartsset timegraph twoway connect consumption temp100 time, msymbol(circle) msymbol(triangle) reg consumption temp price incomepredict e1, resg e2=l.e1twoway (scatter e1 e2) (lfit e1 e2)ac e1pac e1estat bgodfreywntestq e1estat dwatsonnewey consumption temp price income, lag (3)prais consumption temp price income, corcprais consumption temp price income, nologreg consumption temp l.temp price incomeestat bgodfreyestat dwatson第六章模型设定与数据问题(1)解释变量的选择reg y x1 x2 x3estat ic*例题use icecream.dta, clearreg consumption temp price incomeestat icreg consumption temp l.temp price incomeestat ic(2)对函数形式的检验(reset检验)reg y x1 x2 x3estat ovtest (使用被解释变量的2、3、4次方作为非线性项)estat ovtest, rhs (使用解释变量的幂作为非线性项,ovtest-omitted variable test)*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat ovtestg lnq2=lnq^2reg lntc lnq lnq2 lnpl lnpk lnpfestat ovtest(3)多重共线性estat vif*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat vif(4)极端数据reg y x1 x2 x3predict lev, leverage (列出所有解释变量的lev值)gsort –levsum levlist lev in 1/3*例题use nerlove.dta, clearquietly reg lntc lnq lnpl lnpk lnpfpredict lev, leveragesum levgsort –levlist lev in 1/3(5)虚拟变量gen d=(year>=1978)tabulate province, generate (pr)reg y x1 x2 x3 pr2-pr30(6)经济结构变动的检验方法1:use consumption_china.dta, cleargraph twoway connect c y year, msymbol(circle) msymbol(triangle)reg c yreg c y if year<1992reg c y if year>=1992计算F统计量方法2:gen d=(year>1991)gen yd=y*dreg c y d ydtest d yd第七章工具变量法的stata命令及实例(1)2SLS的stata命令ivregress 2sls depvar [varlist1] (varlist2=instlist)如:ivregress 2sls y x1 (x2=z1 z2)ivregress 2sls y x1 (x2 x3=z1 z2 z3 z4) ,r firstestat firststage,all forcenonrobust (检验弱工具变量的命令)ivregress liml depvar [varlist 1] (varlist2=instlist)estat overid (过度识别检验的命令)*对解释变量内生性的检验(hausman test),缺点:不适合于异方差的情形reg y x1 x2estimates store olsivregress 2sls y x1 (x2=z1 z2)estimates store ivhausman iv ols, constant sigmamore*DWH检验estat endogenous*GMM的过度识别检验ivregress gmm y x1 (x2=z1 z2) (两步GMM)ivregress gmm y x1 (x2=z1 z2),igmm (迭代GMM)estat overid*使用异方差自相关稳健的标准差GMM命令ivregress gmm y x1 (x2=z1 z2), vce (hac nwest[#])(2)实例use grilic.dta,clearsumcorr iq sreg lw s expr tenure rns smsa,rreg lw s iq expr tenure rns smsa,rivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),restat overidivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first estat overidestat firststage, all forcenonrobust (检验工具变量与内生变量的相关性)ivregress liml lw s expr tenure rns smsa (iq=med kww),r *内生解释变量检验quietly reg lw s iq expr tenure rns smsaestimates store olsquietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store ivhausman iv ols, constant sigmamoreestat endogenous (存在异方差的情形)*存在异方差情形下,GMM比2sls更有效率ivregress gmm lw s expr tenure rns smsa (iq=med kww)estat overidivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm*将各种估计方法的结果存储在一张表中quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww)estimates store gmmquietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmmestimates store igmmestimates table gmm igmm第八章短面板的stata命令及实例(1)面板数据的设定xtset panelvar timevarencode country,gen(cntry) (将字符型变量转化为数字型变量)xtdesxtsumxttab varnamextline varname,overlay*实例use traffic.dta,clearxtset state yearxtdesxtsum fatal beertax unrate state yearxtline fatal(2)混合回归reg y x1 x2 x3,vce(cluster id)如:reg fatal beertax unrate perinck,vce(cluster state)estimates store ols对比:reg fatal beertax unrate perinck(3)固定效应xtreg y x1 x2 x3,fe vce(cluster id)xi:reg y x1 x2 x3 i.id,vce(cluster id) (LSDV法)xtserial y x1 x2 x3,output (一阶差分法,同时报告面板一阶自相关)estimates store FD*双向固定效应模型tab year, gen (year)xtreg fatal beertax unrate perinck year2-year7, fe vce (cluster state)estimates store FE_TWtest year2 year3 year4 year5 year6 year7(4)随机效应xtreg y x1 x2 x3,re vce(cluster id) (随机效应FGLS)xtreg y x1 x2 x3,mle (随机效应MLE)xttest0 (在执行命令xtreg, re 后执行,进行LM检验)(5)组间估计量xtreg y x1 x2 x3,be(6)固定效应还是随机效应:hausman testxtreg y x1 x2 x3,feestimates store fextreg y x1 x2 x3,reestimates store rehausman fe re,constant sigmamore (若使用了vce(cluster id),则无法直接使用该命令,解决办法详见P163)estimates table ols fe_robust fe_tw re be, b se (将主要回归结果列表比较)第九章长面板与动态面板(1)仅解决组内自相关的FGLSxtpcse y x1 x2 x3 ,corr(ar1) (具有共同的自相关系数)xtpcse y x1 x2 x3 ,corr(psar1) (允许每个面板个体有自身的相关系数)例题:use mus08cigar.dta,cleartab state,gen(state)gen t=year-62reg lnc lnp lnpmin lny state2-state10 t,vce(cluster state)estimates store OLSxtpcse lnc lnp lnpmin lny state2-state10 t,corr(ar1) (考虑存在组内自相关,且各组回归系数相同)estimates store AR1xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1) (考虑存在组内自相关,且各组回归系数不相同)estimates store PSAR1xtpcse lnc lnp lnpmin lny state2-state10 t, hetonly (仅考虑不同个体扰动性存在异方差,忽略自相关)estimates store HETONL Yestimates table OLS AR1 PSAR1 HETONL Y, b se(2)同时处理组内自相关与组间同期相关的FGLSxtgls y x1 x2 x3,panels (option/iid/het/cor) corr(option/ar1/psar1) igls注:执行上述xtpcse、xtgls命令时,如果没有个体虚拟变量,则为随机效应模型;如果加上个体虚拟变量,则为固定效应模型。
计量经济分析及stata应用

计量经济分析及stata应用计量经济学是一门研究经济理论和经济数据之间关系的学科。
它的目的是通过使用统计方法和经济理论来分析经济现象,并得出关于经济模型和政策的结论。
Stata是一个广泛使用的计量经济学软件包,它提供了许多工具和算法,可以帮助研究人员进行经济数据的分析和模型估计。
在计量经济分析中,我们首先需要收集和整理经济数据。
这些数据可以是时间序列数据,如GDP、通货膨胀率等,也可以是截面数据,如个人收入、教育水平等。
一旦数据准备就绪,我们可以开始对其进行描述性统计,以了解数据的基本特征,如平均值、标准差、最大值和最小值等。
接下来,我们可以使用计量经济模型来研究变量之间的关系。
最常见的模型是线性回归模型,它可以分析自变量与因变量之间的线性关系。
例如,我们可能希望了解教育水平对个人收入的影响。
我们可以构建一个回归模型,其中教育水平是自变量,个人收入是因变量。
通过估计回归模型的系数,我们可以得出关于教育水平对个人收入的影响的结论。
为了得出可靠的结论,我们需要进行统计推断。
我们需要检验模型的显著性,以确定自变量是否对因变量有统计上的重要影响。
常用的检验方法包括t检验和F 检验。
另外,我们还可以进行样本外预测,以测试模型的预测能力。
在使用Stata进行计量经济分析时,我们可以使用命令来进行各种操作。
例如,我们可以使用"summarize"命令来计算描述性统计量,使用"regress"命令来估计回归模型的系数,使用"test"命令来进行假设检验,使用"predict"命令来进行样本外预测等等。
此外,Stata还提供了一些图形工具,可以帮助我们更好地理解数据和模型。
总之,计量经济分析及其在Stata中的应用是经济学研究中的重要组成部分。
通过合理地选择经济模型和使用适当的统计方法,我们可以从经济数据中提取有关经济现象和政策的重要信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运用Stata做计量经济学
运用Stata建模的7步骤:
1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……;
2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……;
3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差;
4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……;
5、修正模型:WLS、GLS、工具变量法(ivregress),……;
6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……;
7、整理:关闭日志、生成do文件备用
1、准备工作
让STATA处于初始状态,清除所有使用过的痕迹clear
指明版本号version11
设定并进入工作文件夹:cd D:\ (设定路径,将数据、程序和输出结果文件均存入该文件夹)
关闭以前的日志capture log close
建立日志:log using , replace
设定内存:set mem 20m
关闭more:set more off
读入数据:use .dta, clear
认识变量:describe
建立时间变量:tsset
2、用描述统计方法探索数据特征
必要的数据转换:gen、replace、……;
描述统计量:summarize, detail
相关系数矩阵:corr/pwcorr
散点图和拟合直线图:scatter y x || lfit y x
矩阵散点图:graph matrix y x1 x2 x3,half
线性趋势图:line y x
3、建立模型
OLS建立模型:regress y x1 x2 x3;
由方差分析表并用F和R2检验模型整体显著性;
依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量;
估计参数,判别变量的相对重要性;
构造和估计约束模型,用以检验经济理论
4、诊断模型
(1)检验异方差
残差拟合值散点图:rvfplot
残差平方与某个自变量的散点图
predict e, residuals
gen e2=eˆ2
scatter e2 x1
Breusch-Pagan拉格朗日乘数异方差检验estat hettest
通过信息矩阵检验执行的white异方差检验estat imtest, white
解析检验的零假设H0:同方差
(2)检验序列相关
散点图法
predict r
gen lagr=l.r
scatter r lagr,xline(0) yline(0)
趋势图法
line r year, yline(0)
Breusch-Godfrey LM test for autocorrelation estat bgodfrey,lags(1 2 3)
Durbin’s alternative test for autocorrelation
estat dubinalt,lags(1 2 3)
Durbin-Watson dw-statistic
estat dwatson
(3)多重共线性
检验多重共线性是否存在:R2和F很高,但t检验不显著
判定系数检验法:某一自变量对其余自变量回归的R>0.8,判定该自变量引起多重共线性方差膨胀因子大于5
estat vif
5、修正模型
(1)异方差的修正——WLS
predict r, residuals
regress y x1 x2 x3 [w=1/abs(r)]
(2)修正同时存在异方差和序列相关之prais
选项是corc变换,循环迭代
Prais m gdp, corc
第一次迭代后停止,两步法
prais m gdp, twostep
矫正同时存在异方差和序列相关之Newey-West
假定模型存在异方差和滞后3阶的序列相关,用OLS估计Newey-West标准误
Newey m gdp, lag(3)
(3)多重共线性的修正
排除引起共线性的变量
差分法(短期模型)
岭回归法(有偏估计)
逐步回归法
A. 向前法(只进不出)sw reg ...,pe(0.#)
B. 向后法(只出不进)sw reg ...,pe(0.#)
C. (有进有出)向前法sw reg ...,pe(0.#) pr(0.#) forward
pe(0.#) < pr(0.#)向前法是空模型的开始
D. (有进有出)向后法sw reg ...,pe(0.#) pr(0.#)
pe(0.#) < pr(0.#)向后法是满模型的开始
(4)修正随机解释变量
tsset year
ivreg consp (gdpp=l.gdpp)
用滞后一期的gdpp作gdpp的工具变量
常数项虚拟变量自己作自己的工具变量。
ivreg y1 x1 x2 (y2 y3 = z1 z2 z3) x3
用z1 z2 z3作y2和y3的工具变量
x1 x2 x3和常数项虚拟变量自己作自己的工具变量
6、运用模型(regress postestimation)点估计:predict yhat
残差:predict r, residuals
均值预测的标准误:predict zxbzw, stdp
个别值预测的标准误:predict rxbzw, stdf
F 的临界值 invFtail(df1,df2,0.05)
F 的临界概率(边际概率)Ftail(df1,df2,ftest)
t 的临界值invttail(df,0.025)
t 的临界概率(边际概率)ttail(df,ttest)
常用模型回归系数的意义
线性模型:边际效应
^^^01i i y x ββ=+ ^1dy dx
β= 线性-对数模型:自变量的相对变化引起因变量的绝对变化 ^^^01ln i i y x ββ=+ ^1dy dx
x
β= 对数-线性模型:自变量的绝对变化引起因变量的相对变化
^^^01ln i i y x ββ=+ ^1dy
y dx
β=
双对数模型:弹性系数
^^^01ln ln i i y x ββ=+ ^1dy
y dx
x
β= 差分模型:短期边际效应
^^1i i y x β∆=∆ ^1y x
β∂∆=∂∆ 自变量x 比上期增加一个单位,平均来说因变量y 比上期增加了^1β个单位。
无常数项。
7、整理
在results窗口审视整个估计过程,尤其注意出错的地方
关闭日志文件:log close
生成do文件:(1)记录和再现建模分析过程
(2)为分析类似项目提供借鉴
操作:(1)在回顾窗口选择命令并复制
(2)点击do-file Editor,或打开一个已存在的do文件
(3)将复制的命令粘贴在do文件中
(4)编辑已执行过的命令,包括增加注释
(5)调试do文件
(6)保存。