stata操作介绍之相关性分析(三)资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、线性回归分析
❖相关性分析 ❖回归分析 ❖多重共线性等相关检验和处理
1
线性回归分析的stata应用实例 本部分用到的实例是Big Andy’s Burger Barn的销售模 型。Big Andy的汉堡销售收入取决于单价和广告支出 水平 。因此,这个模型包含两个解释变量和一个常 数项。
sales= α1 +α2*price +α3*advert+ ε 其中,sales为指定城市的月销售额并以千美仄元度量, price是以美元度量的单个汉堡的价格,advert为广告 支出,同样以千美元度量。
4
用pwcorr命令实现所有变量的Pearson相关系数分析,并在显著 性水平超过0.05的相关系数上打上星号,其命令为:
pwcorr , sig star(0.05)
5
2. Kendall T相关系数分析 Kendall T相关性分析是一个非参数度量变量间的相关性,其取值在 一1和1之间。 Kendall T相关性分析的命令格式:
8
用spearman命令实现所有变量的Spearman秩相关系数分析,并 在显著性水平超过0.05的相关系数上打上星号,其命令为: spearman, star(0.05)
9
4.偏相关系数分析 双变量相关分析是研究两个变量之间的相关关系,有时在分析两个 变量之间相关关系时,往往会有其他变量的影响因素混合在里面, 此时计算出来的相关系数可能并不能真正反映两个变量之间的关系。 偏相关性分析的命令格式:
13
பைடு நூலகம்
表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SS E为)、k=残2,差n平-k方-1=和75(S-2S-R1=)和72总,离n-差1=平75方-1=和74(S;ST第);4列第为3列均为方自和由(M度S,S),分别由 各项平方和除以相应的自由度得到。 表调整右的上判方定区系域数给(出Ad了j R样-s本qu数ar(eNd)u、mFbe统r 计of量o的bs值)、、判回定归系方数程(R标-s准qu误are(dR)、 oot MSE) 以及其他一些统计量的信息。
ktau [varlist] [if] [in] [weight] [ , ktau _ options ]
选项 print(#) star(#)
含义 在屏幕上仅显示达到相应显著性水平的相关系数 在显著的相关系数上打上星号
6
用ktau命令实现所有变量的Kendall T相关系数分析,并在显著 性水平超过0.05的相关系数上打上星号,其命令为: ktau , star(0.05)
选项 obs sig print(#) star(#) listwise
pwcorr选项说明
含义 显示计算每个相关系数时使用的观测值个数 显示显著性检验的P值 在屏幕上仅显示达到相应显著性水平的相关系数 在显著的相关系数上打上星号 使用listwise的方法处理缺失值,这样pwcorr就退化成correlate命 令了。所谓listwis。方法是说,如果某一观测值中某个或者多个 变量出现缺失,则将整个观测值删掉,这也正是correlate命令使 用的方法。对于没有缺失值的数据集,这两种方法没有区别
2
相关性分析
相关性分析主要目的是研究变量之间关系的密切程度。相关性 分析的方法主要有:Pearson相关系数分析、Kendall T相关系数 分析、Spearman秩相关系数分析以及偏相关系数分析。 1. Pearson相关系数分析
Pearson相关性分析是一个描述线性相关强度的量,取值于一1和1 之间。 Pearson相关性分析的命令格式: correlate [varlist] [if] [in] [weight] [ ,correlate_ options ]
7
3. Spearman秩相关系数分析 Spearman秩相关性分析也是一种不依赖于总体分布的非参数检验, 取值也在一1和1之间。 Spearman秩相关性分析的命令格式: spearman [varlist] [if] [in] [weight] [ , spearman _ options ]
1.regress实现因变量对自变量的回归
因变量
自变量
regress命令的格式: regress depvar indepvars[if] [in] [weight] [options]
选项 noconstant hascons level(#) beta noheader
12
含义 不加常数项做线性回归 由用户指定常数项的值 设定置信水平(默认值为95% ) 报告标准化的beta系数 不报告输出表名
correlate尽可能使用两两变量中所有没有缺失的数据
pwcorr [varlist] [if] [in] [weight] [ ,correlate_ options ]
pwcorr只采用没有任何缺失数据的完整观测值
3
选项 means covariance
correlate选项说明
含义 显示变量的均值、标准差、最大最小信 显示协方差矩阵
实现因变量为销售收入,自变量为单价和广告支出的线性回归, 其命令为:
regress sales price advert
表下方区域为基本的回归结果。第1列依次为被解释变量sales, 解释变量price、advert,截距项constant;第2列回归系数;第3 列回归系数的标准误;第4列回归系数的 t 统计量值;第5列p值; 第6列95%的置信区间
pcorr varnamel varlist [if] [in] [weight]
10
用pcorr命令实现偏相关分析,其命令为: pcorr, sales price advert
11
回归分析
回归分析时常用的Stata 命令有:regress , predict, test命令。regress, predict, test 是一组命令,它们完成各种简单和多元的普通最小二 乘法回归。
14
2.predict计算拟合值和残差 指定存储类 型的格式 变量名
指定需要拟合值 还是残差值,若 为resid,则是残差
predict命令的格式: predict [type] newvar [if] [in][,single_ options]
相关文档
最新文档