如何用stata做事件研究

如何用stata做事件研究
如何用stata做事件研究

用stata做事件研究

时间研究通常被用来检验市场对附带相应利益事件的反应。事件研究通常包括以下几步:

(1)净化数据(提出无关和无法研究以及其他原因)和计算事件窗口

(2)估计正常表现

(3)计算异常表现和累积超额回报

(4)显著性检验

(5)全部事件交叉检验(相当于稳健性检验)

这个文章旨在帮助你用stata来开展事件研究。假设你已经拥有一个时间变量(date)和公司标识(company_id),如果你需要准备你的数据或者想要利用我们的数据尝试一下相应的命令,去data preparation页面。

我们同时也假设你对stata 有一个基本的了解。如果你需要和stata命令相关的帮助,你可以从here找到更多。如果你从一个可执行文件中进入命令,你的任务就会简单的多,因为可执行文件中包含了一系列的stata命令。

净化数据并计算事件窗口和估计窗口

你很可能获取了超出你需要的每个公司的观察值,也有可能有一些公司的观察值不充分。在你开展下一步前,你必须确保你的分析是建立在正确的观察值之上。为了实现这一点,你需要设立一个变量dif ,它将会计算从观察(相当于估计期)到事件期的天数,这即有可能是节假日,也有可能是交易日。

就交易日天数:

sort company_id date

by company_id: gen datenum=_n

by company_id: gen target=datenum if date==event_date

egen td=min(target), by(company_id)

drop target

gen dif=datenum-td

就节假日:

gen dif=date-event_date

由上可以看出,计算交易日天数比计算节假日天数稍微复杂一点。对于交易日,我们首先需要设立一个变量,这个变量是用来计算每一个公司标识范围内的天数,然后我们再确定哪些观测值发生在事件期内。

我们设立一个和事件天数有关的变量。这个事件天数建立在company_id范围内的所有观察值的基础上。最后,我们选取二者之间的差异来设立一个变量dif,以计算每一个个体观测值和事件期之间的天数。下一步,我们需要确定我们事件期前后的最小观察期天数以及事件窗口之前的估计窗口的最小观察期天数。比如我们想要一个事件期前后两天的窗口(总共5天的事件期)以及一个30天的估计窗口(你可以改变这些数字以适应你的分析)。

by company_id: gen event_window=1 if dif>=-2 & dif<=2

egen count_event_obs=count(event_window), by(company_id)

by company_id: gen estimation_window=1 if dif<-30 & dif>=-60

egen count_est_obs=count(estimation_window), by(company_id)

replace event_window=0 if event_window==.

replace estimation_window=0 if estimation_window==.

确定事件窗口和估计窗口的程序是相同的。首先,我们设立一个变量,当观测值在特定的日期内等于1;其次,我们设立另一个变量来计算,在每一个公司标识范围内,有多少观测值的变量值等于1;最后,我们用0代替所有的缺省值,设立一个哑变量。此时,你就可以确定哪个公司没有充分的观测值。

tab company_id if count_event_obs<5

tab company_id if count_est_obs<30

Tab命令将会产生一个公司标识符的列表,这个列表中包含的就是没有足够的事件窗口及估计窗口观察值窗口的公司,同时还会报告这些公司的总的观测值的数量,为了排除这些公司使用如下命令:

drop if count_event_obs < 5

drop if count_est_obs < 30

你必须确保在删除任何观察值之前,样本已经用另一个名字保存。

此时,你也可以剔除一些你不需要的变量。

估计正常表现

现在我们到了真正分析的地方。首先,我们需要一种途径和方法来估计正常表现。为了实现这一点,我们将会利用估计窗口中的数据来对每个公司进行单变量回归,并保存α(常数项)和β(解释变量的系数),随后我们会使用这个保存的回归系数来预测事件窗口的正常表现。

就回报这个回归中的被解释变量来讲,它仅仅是针对既定股票回报的CRSR变量,而我们用来预测ret的解释变量,使一个对于任何股票的指数加权回报。对你的样本集使用等价变量。

set more off /* this command just keeps stata from pausing after each screen of output */

gen predicted_return=.

egen id=group(company_id)

/* for multiple event dates, use: egen id = group(group_id) */

forvalues i=1(1)N { /*note: replace N with the highest value of id */

l id company_id if id==`i' & dif==0

reg ret market_return if id==`i' & estimation_window==1

predict p if id==`i'

replace predicted_return = p if id==`i' & event_window==1

drop p

}

这儿,我们设立了一个变量id,以计算公司数量(从1到实际数)。N代表的是包含完整数据的公司——事件联合体数目(即事件有关的有完整数据的公司的数目)。这个过程通过在公司间重复,并对每一个公司在估计窗口开展回归,然后用回归结果来预测事件窗口的正常回报。

异常表现和累积超额回报

现在我们可以用我们的数据计算异常表现和累积超额回报。日异常回报等于事件窗口中的每天的实际回报减预期回报。整个事件窗口的超额回报的总额就是累积超额回报。

sort id date

gen abnormal_return=ret-predicted_return if event_window==1

by id: egen cumulative_abnormal_return = sum(abnormal_return)

此处我们仅仅计算了事件窗口中每个样本观测值的超额回报,随后我们将CAR等于所有公司的超额回报之和。

显著性检验

我们将计算一个检验统计量(t值)来确定每支股票平均的超额回报是否显著不等于0。AR即超额回报,AR_SD是超额回报的标准差。如果t统计量的绝对值大于1.96,那么平均的超额回报在5%的水平显著不等于0.1.96这个值来自于均值为0,标准差为1的标准正态分布,其中正态分布95%的部分分布在±1.96之间。

sort id date

by id: egen ar_sd = sd(abnormal_return)

gen test =(1/sqrt(number of days in event window)) * ( cumulative_abnormal_return /ar_sd)

list company_id cumulative_abnormal_return test if dif==0

Note: this test uses the sample standard deviation. A less conservative alternative is to use the population standard deviation. To derive this from the sample standard

deviation produced by Stata, multiply ar_sd by the square root of n-1/n; in our example,

by the square root of 4/5.

这会将你的事件研究的结果生成一项Excel文件。

outsheet company_id event_date cumulative_abnormal_return test using stats.csv if dif==0, comma name

全部事件交叉检验

除了观察每个公司的平均超额回报,你可能还想计算将所有公司视为一个整体的累积超额回报,代码如下:

reg cumulative_abnormal_return if dif==0, robust

从回归中得到的系数的P值可以告诉你,所有公司的累积超额回报的显著性。此时,P 检验比T检验更可靠,因为它更允许你使用一个强的标准误差。

进一步的阅读

发展中国家资本市场对环境表现的反应,大部分事件研究方法论来自于世界银行的working paper

事件研究法的计算步骤

事件研究法的计算步骤 1.定义事件期 考察所得税优惠事件对上市公司股票价格影响的首要工作是确立一个事件期。事件期包括:事前估计期与事后观察期。 事前估计期,又称清洁期,其作用在于估计正常收益率,本文所选用的清洁期为[-5,0],即公告前的前5到前0个交易日,共5个交易日;事后观察期,又称时间窗,用于研究事件发生后股价的异常变化,探讨并购重组绩效的变化,确定事件窗的目的是为了获得并购重组事件对股票价格的全部影响. 事件窗的长短可以根据研究需要自行设定,就短期绩效研究一般为[-10, 10]。本文事件研究选择的事件窗是[0,5]. 即从事件宣布日起的前5后5 个交易日,共0个交易日 . 2.计算事件期[-5,0]内的样本公司股票价格和市场指数{沪、深指数)日收益率 r m,t 和r i,t (百分比收益率). r m,t = (P m,t – P m,t-1 )/P m,t-1 r i,t = (P i,t – P i,t-1 )/P i,t-1 在本文计算中将百分比收益率转换股票连续复利收益率和市场指数连续复利收益率. R m,t = In (r m,t +1) R i,t = In (r i,t +1) 3.计算预期正常收益率 建立在假设资本资产定价模型(CAPM) 成立的情况下,根据证券资本资产定价理论模型来计算正常收益率.选择所得税优惠政策颁布前段期间为事前估计期,以该期数据为样本,以市场指数收益率为解释变量,以个股收益率为被解释变量,进行回归得 R i,t =α i + β i R m,i + ε i,t 其中R i,t R m,i 分别为个股和市场指数的日收益率,且是股票的收益率对市场指 数收益率的回归系数,ε i,t 代表回归残差.回归后得到的α i, β i ,如果α i, β i ,在估计期内保持稳定,则可算出预期正常收益率为: R i,t =α i + β i R m,i 4.计算每只股票在[-5,5]内每日超常收益率(AR)。股票i在第t日的超长收益 率为:AR i,t = R i,t – R m,t 5.计算所有股票在[-5,5]内每日的超常平均收益率(Average Agnominal Return). 就是计算所有股票超常收益率的算术平均值.所有股票在第t 日的平均收益率为:

stata回归分析完整步骤-吐血推荐12页

stata回归分析完整步骤——吐血推荐 ****下载连乘函数prod,方法为:findit dm71 sort stkcd date //对公司和日期排序 gen r1=1+r //r为实际公司的股票收益率 gen r2=1+r_yq //r_yq为公司的预期股票收益率 egen r3=prod(r1),by(stkcd date) //求每个公司事件日的累计复合收益率 egen r4=prod(r2),by(stkcd date) //求每个公司事件日的累计预期的复合收益率 gen r=r4-r3 capture clear (清空内存中的数据) capture log close (关闭所有打开的日志文件) set mem 128m (设置用于stata使用的内存容量) set more off (关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。)set matsize 4000 (设置矩阵的最大阶数。我用的是不是太大了?) cd D: (进入数据所在的盘符和文件夹。和dos的命令行很相似。) log using (文件名).log,replace (打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。) use (文件名),clear (打开数据文件。) (文件内容) log close (关闭日志文件。) exit,clear (退出并清空内存中的数据。) 假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。检查数据的重要命令包括codebook,su,ta,des和list。其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。ta空格后面加一个(或两个)变量名是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按大小排列的累积比率。des后面可以加任意个变量名,只要数据中有。它报告变量的存储的类型,显示的格式和标签。标签中一般记录这个变量的定义和单位。list报告变量的观察值,可以用if或in来限制范围。所有这些命令都可以后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无力,打开stata 亲自实验一下吧。

用stata做事件研究

用stata做事件研究 时间研究通常被用来检验市场对附带相应利益事件的反应。事件研究通常包括以下几步: (1)净化数据(提出无关和无法研究以及其他原因)和计算事件窗口 (2)估计正常表现 (3)计算异常表现和累积超额回报 (4)显著性检验 (5)全部事件交叉检验(相当于稳健性检验) 这个文章旨在帮助你用stata来开展事件研究。假设你已经拥有一个时间变量(date)和公司标识(company_id),如果你需要准备你的数据或者想要利用我们的数据尝试一下相应的命令,去data preparation页面。 我们同时也假设你对stata 有一个基本的了解。如果你需要和stata命令相关的帮助,你可以从here找到更多。如果你从一个可执行文件中进入命令,你的任务就会简单的多,因为可执行文件中包含了一系列的stata命令。 净化数据并计算事件窗口和估计窗口 你很可能获取了超出你需要的每个公司的观察值,也有可能有一些公司的观察值不充分。在你开展下一步前,你必须确保你的分析是建立在正确的观察值之上。为了实现这一点,你需要设立一个变量dif ,它将会计算从观察(相当于估计期)到事件期的天数,这即有可能是节假日,也有可能是交易日。 就交易日天数: sort company_id date by company_id: gen datenum=_n by company_id: gen target=datenum if date==event_date egen td=min(target), by(company_id) drop target gen dif=datenum-td 就节假日: gen dif=date-event_date 由上可以看出,计算交易日天数比计算节假日天数稍微复杂一点。对于交易日,我们首先需要设立一个变量,这个变量是用来计算每一个公司标识范围内的天数,然后我们再确定哪些观测值发生在事件期内。 我们设立一个和事件天数有关的变量。这个事件天数建立在company_id范围内的所有观察值的基础上。最后,我们选取二者之间的差异来设立一个变量dif,以计算每一个个体观测值和事件期之间的天数。下一步,我们需要确定我们事件期前后的最小观察期天数以及事件窗口之前的估计窗口的最小观察期天数。比如我们想要一个事件期前后两天的窗口(总共5天的事件期)以及一个30天的估计窗口(你可以改变这些数字以适应你的分析)。 by company_id: gen event_window=1 if dif>=-2 & dif<=2 egen count_event_obs=count(event_window), by(company_id) by company_id: gen estimation_window=1 if dif<-30 & dif>=-60 egen count_est_obs=count(estimation_window), by(company_id) replace event_window=0 if event_window==. replace estimation_window=0 if estimation_window==.

第九章 事件研究法

第九章事件研究法 本章导读: 在了解了stata的基本概念和命令后,从本章开始介绍会计和财务研究中的一些经典研究方法和程序。在国外,事件研究法首先被广泛应用于金融经济领域 ,近几十年来出现的有关事件研究方面的文献已成为会计与财务文献中的重要组成部分。本章首先对事件研究法的概念和基本步骤作了简单介绍,以及事件研究法如何在stata中实现。 9.1 事件研究法简介 事件研究法 (Event Study) 是一种统计方法,是在研究当市场上某一个事件发生的时后,股价是否会产生波动时,以及是否会产生“异常报酬率”(abnormal returns),借由此种资讯,我可以了解到股价的波动与该事件是否相关。 一般而言 ,事件研究包括以下几大步骤 ●定义事件以及事件研究窗口 ●选择研究样本 ●选择度量正常收益的模型 ●估计异常收益和累计超额报酬 ●检验异常收益的显著性 ●实证结果与解释 9.1.1 定义事件与事件窗 事件包括合并、收购、收益公告或再融资行为等 ,若研究者关心增发对股东财富的影响 ,此时的事件即为增发公告。事件研究所涉及的窗口包括估计窗、事件窗与事后窗等 ,如图1 ,t = 0 为事件日; t = T1 + 1 至t = T0 代表事件窗,其长度为L1 = T1 - T0 ; t = T0 + 1 至t = T1 为估计窗,其长度为L2 = T2 - T1 ;t = T2 + 1 至t = T3 为事后窗,其长度为L3 = T3 - T2。估计窗的作用在于估计正常收益(或估计正常收益模型的参数) ,一般情况下,估计窗的长度应大于等于120天;事件窗是用于检验股价对事件有无异常反映的期间, 有时事件窗仅为一天(即事件发生的当天) ,有时为两天(即事件公告当天与后一天) ,有时为三天(即公告前一天、公告当天与公告后一天) ,也有学者将事件窗定义为公告前后10天、20天或更长,事件窗长短主要取决于研究者的研究目的:事后窗主要用于考察事件发生后股价(或企业价值)有无异常变化,常见于探讨某一事件长期绩效的研究中。 9.1.2 研究样本的选择

运用Stata做计量经济学

运用Stata做计量经济学 运用Stata建模的7步骤: 1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……; 2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……; 3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差; 4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……; 5、修正模型:WLS、GLS、工具变量法(ivregress),……; 6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……; 7、整理:关闭日志、生成do文件备用 1、准备工作 让STATA处于初始状态,清除所有使用过的痕迹clear 指明版本号version11 设定并进入工作文件夹:cd D:\ (设定路径,将数据、程序和输出结果文件均存入该文件夹) 关闭以前的日志capture log close 建立日志:log using , replace 设定内存:set mem 20m

关闭more:set more off 读入数据:use .dta, clear 认识变量:describe 建立时间变量:tsset 2、用描述统计方法探索数据特征 必要的数据转换:gen、replace、……; 描述统计量:summarize, detail 相关系数矩阵:corr/pwcorr 散点图和拟合直线图:scatter y x || lfit y x 矩阵散点图:graph matrix y x1 x2 x3,half 线性趋势图:line y x 3、建立模型 OLS建立模型:regress y x1 x2 x3; 由方差分析表并用F和R2检验模型整体显著性; 依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量; 估计参数,判别变量的相对重要性; 构造和估计约束模型,用以检验经济理论

PE事件研究法

定向增发短期公告效应的实证研究 ——基于中国中小企业板的样本数据 简介:本文采用事件分析法为研究方法,结合我国中小板企业的情况,通过对样本的超额回报率和累计超额回报率进行计算研究之后,得出:定向增发公告日当天至公告日后第3个交易日存在着显著的正的公告效应。本文还综合了之前的文献研究,可以比较分析中小板上市公司与主板上市公司在定向增发的不同表现。 关键词:定向增发公告效应超额收益率 一、中国上市公司定向增发概述 所谓定向增发就是上市公司针对特定投资者再融资一种方式,只有业绩良好的上市公司才能够争取获得定向增发的权利,定向增发给企业带来低成本的资金来源,满足企业投向拟定项目的资金需求。 在企业经营中可能会由于各种原因使其现有资金无法满足营运的资金需求,上市公司就会结合自身财务状况和公司的资产结构选择通过再一次发行股票和债券的方式进行融资。我国上市公司主要的再融资方式有以下几种:(1)公开发行股票;(2)配股;(3)发行可转换公司债券;(4)定向增发。其中,定向增发(即海外常见的私募股权配售)是一个重要的再融资方式。 近年来,越来越多的企业选择定向增发为其再融资途径,其相对于其他几种再融资方式的优势在于:(1)定向增发的发行门槛较低。定向增发相对于公开发行股票和配股来说,其发行的佣金将会大幅减少,并且不需要宣传等费用,发行成本也会降低。相对于债券来说,定向增发不会恶化其财务状况。(2)定向增发的审批手续快捷、简单。因为只面向少数投资者发行,定向增发的审批程序简单,对信息披露的要求也较低。(3)定向增发除了对其募集的资金的用途和管理层在此过程中不得有违规操作有规定以外,没有其他的要求,这就是说,亏损企业也可以申请定向增发。这对于由于盈利状况不佳无法从公开发行渠道融资但面临有潜力的可投资项目的企业来说,是一个很好的再融资选择。

应用stata做统计分析

1)Describe 数据的简要描述d 2)List 将所有数据列在result里面l 3)Summarize 分析统计指标su 4)correlate 统计各个变量之间的相关系数cor 5)graph twoway connected math score,yaxis(1)||connected english score,yaxis(2) title(“”)横 坐标表示score 左y轴表示数学右y轴表示英语 6)browse chinese math if score>640只显示总分大于640的数学和语文的成绩 7)edit math ability score 只显示数学基本能力和总分,可以进行编辑 8)gen any=uniform() 新建一个随机变量,从0-1 9)list math chinese english in 60/70 列出其中60-70个观测值的数学语文和英语 10)replace any=100*any 将ANY这个变量的值*100,然后取代原来的变量 11)sample 10 仅剩下随即的10%,sample 30,count随机的剩下30个观测值 12)gsort –math 按数学从高到低排序 13)gsort name 将观测值的姓名顺序排序 14)gsort –name 姓名逆序排序 15)help gesort 排序的帮助 16)tabulate math if score>600 在result窗口中显示总分600以上的数学得频数百分比及 累计百分比 17)edit math score 在编辑器窗口中只显示数学和总分 18)list in 4在result窗口中只显示第4个观测值 19)list in 10/20列出第10-20个观测值 20)sum if score>660 只对总分大于660的观测值进行统计分析 21)sun if place !=”canada”对字符串的除外统计 22)sum if score>600&score<650 23)list if score>620|(math>=140&english>=135)列出其中的总分大于620 或者数学大于140 和英语大于135 的观测值 24)help datafun寻找日期的命令 25)help strfun字符串函数 26)dispay 作为统计显示的计算器使用 27)sum math ,display r(mean),gen mathdev=math-r(menn),sum math mathdev 28)help egen生成函数的扩展 29)tabulate class,gen (class) 在编辑窗口新生成16个变量,class26-41,并且以0-1 表示 30)list class class10-class14 在result 中只显示10-14班的内容 31)sum math if class!=28 对数学进行求统计量,然后排出28班 32)replace score2=1 if score >=600&score<.主要针对缺失值的运算因为缺失值.被认为是非 常大的数。 33)gen score3=autocode(score,4,600,700) 将编辑器中的数据,按照625 650 675 700进行分 类 34)list score score2 score3 此时result窗口显示的是每一个分数对应的指标,是否是600以 上的,在哪个区间上? 35)gen score5=group(5) 将编辑器中的数据按规模分为5组 36)gen caseid=_n 在编辑器里面创建一个变量从1-2-3.。。 37)display score[45] 此时是在上一步的基础上选择第45条观测值 38)gen difscore=score-score[_n-1]生成一个新变量difscore其数值=序列2的数据减去序列

事件研究法命令

在做事件研究法,前两天发了求助帖https://www.360docs.net/doc/a117462531.html,/thread-1192259-1-1.html,问题是想把每个事件日的数据与距事件日最近的财务数据(如EPS)对应起来 今天终于把问题解决了,基本的想法是用date命令把事件日以及财务数据公布日的天数列出来,然后进行区分,借鉴了网站上教的事件研究法处理初始数据的方法(详见https://www.360docs.net/doc/a117462531.html,/online_help/stats_packages/stata/eventstudydataprep.html)想来还是把用到的命令贴出来,希望对童鞋们有用~ use 用来做每个减持事件日对应最近的EPS的.dta,clear sort stock_code event_date by stock_code event_date:gen n=_n keep if n==1 save eventdates by stock_code: gen eventcount=_N drop n by stock_code: keep if _n==1 by stock_code: gen eventcount=_N drop n by stock_code: keep if _n==1 sort stock_code keep stock_code eventcount save eventcount use 只有EPS每季度的数据.dta, clear sort stock_code merge m:m stock_code using eventcount use 只有EPS每季度的数据.dta, clear sort stock_code

事件史分析操作及说明A_08

事件史分析的Stata操作及说明 目录 离散时间模型示例:职位晋升分析 (1) Cox模型 (2) Cox模型示例:癌症数据分析 (3) 分层的(stratified) Cox模型的背景 (11) 示例:癌症生存的分层分析 (12) 最大似然估计的连续时间存活分析 (18) Exponential分布模型 (18) Gompertz模型 (19) Weibull模型 (19) 用Stata拟合exponential模型、Weibull模型和Gompertz模型:癌症生存 (19) 本章参考文献: 1.* Lawrence C. Hamilton. Statistics with STATA, Updated for Version 9. Brooks/Cole, a division of Thomson Learning, Inc.,-2006. (第11章)// 中译本:郭志刚等,应用STATA做统计分析,重庆大学出版社,2008. 2.* Rabe-Hesketh and Everitt. A Handbook of Statistical Analyses Using Stata. Chapman & Hall/CRC, 2004 3.* Kleinbaum. Survival Analysis. 1996; 4.* Yamaguchi, Kazuo. Event History Analysis. Sage Publications. Inc. 1991 5.* Allison, Paul D.. Event History Analysis: Regression for Longitudinal Event Data.Sage Publications, Inc. 1984 6.* Blossfeld, Hamerle and Mayer. Event History https://www.360docs.net/doc/a117462531.html,wrence Erlbaum Associates, Inc. 1989 7.* Blossfeld and Rohwer. Techniques of Event History Modeling: New Approaches to Causal Analysis (Second Edition). Lawrence Erlbaum Associates, Publishers, 2002. 8.* Cleves, Gould and Gutierrez. An Introduction to Survival Analysis Using Stata (reviced edition). Stata Press Publication, 2004. 9.* Janet M. Box-Steffensmeier and Bradford S. Jones. Event History Modeling : A Guide for Social Scientists. Cambridge University Press, 2004 10.梁在,事件史分析,载郭志刚主编《社会统计分析方法----SPSS软件应用》,中国人民大学出版社,1999年。 11.郭申阳,使用SPSS软件对事件史原始数据进行预处理,载郭志刚主编《社会统计分析方法----SPSS软件应用》, 中国人民大学出版社,1999年。 12.郭志刚,历时研究与事件史分析,《中国人口科学》第1期,2001年2月,第67~72页。 13.Cox, "Regression models and life tables," Journal of the Royal Statistical Society, 1972 14.Petersen, "The statistical analysis of event histories," Sociological Methods and Research, 1991 15.Allison, "Discrete-time methods for the analysis of event histories," Sociological Methodology, 1982 16.Poston, "Son preference and fertility in China." Journal of Biosocial Science 34: (2002): 333-347 标志* 者,社会学系资料室有正版或复印本。 重要声明 本讲义仅作为选修《高级社会统计专题》课同学的参考资料。 本讲义内容是从有关文献中选取、翻译和编辑的,辅助学生理解统 计方法原理和操作。本讲义不允许复印、传播或用于其他目的。 使用中如发现错误之处,请联系:zguo@ https://www.360docs.net/doc/a117462531.html,

生存分析Stata实现

第十四章生存分析的Stata实现 本章使用的STATA命令: 结局变量为1表示失效事件发生 例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存时间(天)。分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。现用Kaplan-Meier法计算生存率。

Stata命令为: stset time,failure(d) sts list sts graph 结果为:

例14-3 下面是来自于Berkson & Gage(1950)的一个研究队列。为了叙述方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有374名患者进入研究队列。 表14-3 寿命表法计算生存率的计算用表 (1) (2) (3) (4) (5) (6) (7) (8) (9) 序号术后生存 年数 期初观察 例数 期内 死亡 期内截尾 人数 校正期初 人数 死亡 概率 生存 概率 生存率t n d c n c=n-c/2 q=d/n c p=1-q S(t) 1 0~374 90 0 374 0.2406 0.7594 0.7594 2 1~284 76 0 284 0.2676 0.7324 0.5561 3 2~208 51 0 208 0.2452 0.7548 0.4198 4 3~157 2 5 12 151 0.165 6 0.8344 0.3503 5 4~120 20 5 117.5 0.1702 0.8298 0.2907 6 5~95 7 9 90.5 0.0773 0.9227 0.2682 7 6~79 4 9 74.5 0.0537 0.9463 0.2538 8 7~66 1 3 64.5 0.0155 0.9845 0.2498 9 8~62 3 5 59.5 0.0504 0.9496 0.2372 10 9~54 2 5 51.5 0.0388 0.9612 0.2280 11 10+47 21 26 34 0.6176 0.3824 0.0872 Stata数据格式为:

STATA在经济社会生活中的研究应用

摘要:大数据时代的到来,意味着我们生活、工作、思维的大变革。这种变革是势不可挡的。从上世纪九十年代的下海浪潮,到新世纪的全民炒股,数据在源源不断地产生变革的动力。这种变革下,stata统计软件可以有效帮助大众用数据解释、预测社会生活的未来。笔者运用stata的数据管理和分析功能在经济社会生活中做出了有益尝试,通过演绎现有数据,实现stata在实际的经济社会生活中应用的功能归纳。 关键词:stata;数据管理和分析 一、stata在经济生活中的应用 无论是国家宏观经济局势还是日常经济生活,stata在经济数据中应运而生,淋漓尽致地发挥着强大的数据管理与分析功能。笔者从《中国财政年鉴2014》、《中国环境统计年鉴2014》、《中国环境年鉴2014》中获得2014年地方环保资金投入决算,并进行了一系列数据描述与分析,无不体现出stata的优越性。 笔者对地方财政环保支出做了统计,直观反映出31个省份的地方财政环保支出(万元)和环境监测经费(万元)的均值、标准差、最小值、最大值,便于从宏观角度了解年度地方环保支出的概况。(表1)同时,笔者对地方财政环保支出(万元)和环境监测经费(万元)两个变量进行了回归分析。(表2) 表1① 表2 笔者对地方财政环保支出(万元)和环境监测经费(万元)、地方财政环保人均支出(元)和人均环境监测经费(元)进行了相关性分析,反映了全国范围内,环境监测经费在地方财政支出中的占比、人均环境监测在地方财政环保人均支出中的占比。(表3)表3② 在回归分析、方差分析等检验中,都假设数据服从正态分布,因此需要对数据作正态性检验。使用表4所示方法进行正态性检验,能了解数据整体分布情况。 表4 通过对31个省市的财政环保支出(万元)和环境监测经费(万元)做散点图(图1)分析,可以直观反映省市间在环保支出和监测经费支出上的差异,同时将财政环保支出(万元)和环境监测经费(万元)同时分析,可以反映各省市环境监测经费在环保中的大致占比。 图1 对人均环境监测经费(元)进行箱形图展示(图2),可以反映出上分位数(2.2)、下分位数(5.9)、中位数(3.1)、异常值(11.1)。 图2 二、stata运用于经济社会生活的启示 理论模型和经验分析是规范性的研究的两个关键因素。在实际生活中,无论是从事科学研究、时事分析,还是发现、积累、探究生活现象的点滴,我们都希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的难题。 然而,通过笔者对stata统计软件的理论和实践的学习,发现其在实际生活研究中的优越性是非常突出的。首先,一般用法方面:操作页面直观便捷,命令语句简单易懂,可以每次只输入一个命令,也可以一次输入多个命令。第二,数据管理方面:stata操作强于sas,一般数据分析的需求其数据变量都可以实现,除非数据文件超越计算机内存允许范围。第三,统计分析方面:其包含容易操作的回归分析工具,具备一系列稳健方法,包括稳健回归等命令,在调查数据分析中,非常简单的语句就可以做到概率回归等调查数据分析。绘图功能方面:其绘图命令的句法非常简单,却能满足多种需求,另外,笔者发现stata产生的图形的

相关文档
最新文档