Stata软件之回归分析模板.ppt
合集下载
《回归分析》PPT课件

在回归分析中,若自变量间中/高相关,则某些与因变量有关系的变量会被排除在回 归模型之外
多元共线性
即数学上的线性相依,指在回归模型中 预测变量本身间有很高的相关。
有很多评价指标,如容差(容忍度)、 VIF,特征值
特征值若小于0.01,预测变量间可能存在多元共线性;
方差比例:若有两个或多个自变量在一个特征值上高于0.8 或 0.7以上,表示 可能存在多元共线性
整理成表格
表1 福利措施、同侪关系、适应学习对组织效能的影响
Beta
t
福利 0.180 5.513*
措施
**
同侪 0.264 8.166*
关系
**
适应 0.369 12.558
学习
***
R=0.73 R2=0.5 F=464.
阶层回归
如第一层自变量为福利措施 第二层为同辈关系 第三层为适应学习
学习完毕请自行删除
什么是回归分析
用一定的数学模型来表述变量相关关系 的方法。
一元线性回归
最简单的回归是只涉及一个因变量和一个自变量一元 线性回归,此时的表达式为:
y= 0+ 1 x+ y为因变量,x为自变量或预测变量, 0为截距即当
x=0时y的值, 1为斜率即1个单位的x变化对应 1个单 位y的变化。 是误差,服从N(0, σ2)的正态分布,不 同观察值之间是相互。
练习
“组织效能.sav”
15回归系数及检验组织效能0180福利措施0264同侪关系0369适应学习在回归分析中若自变量间中高相关则某些与因变量有关系的变量会被排除在回归模型之外容差及方差膨胀系数vif检验多元回归分析的共线性问题
《回归分析》PPT课件
本课件PPT仅供学习使用 本课件PPT仅供学习使用 本课件PPT仅供学习使用
多元共线性
即数学上的线性相依,指在回归模型中 预测变量本身间有很高的相关。
有很多评价指标,如容差(容忍度)、 VIF,特征值
特征值若小于0.01,预测变量间可能存在多元共线性;
方差比例:若有两个或多个自变量在一个特征值上高于0.8 或 0.7以上,表示 可能存在多元共线性
整理成表格
表1 福利措施、同侪关系、适应学习对组织效能的影响
Beta
t
福利 0.180 5.513*
措施
**
同侪 0.264 8.166*
关系
**
适应 0.369 12.558
学习
***
R=0.73 R2=0.5 F=464.
阶层回归
如第一层自变量为福利措施 第二层为同辈关系 第三层为适应学习
学习完毕请自行删除
什么是回归分析
用一定的数学模型来表述变量相关关系 的方法。
一元线性回归
最简单的回归是只涉及一个因变量和一个自变量一元 线性回归,此时的表达式为:
y= 0+ 1 x+ y为因变量,x为自变量或预测变量, 0为截距即当
x=0时y的值, 1为斜率即1个单位的x变化对应 1个单 位y的变化。 是误差,服从N(0, σ2)的正态分布,不 同观察值之间是相互。
练习
“组织效能.sav”
15回归系数及检验组织效能0180福利措施0264同侪关系0369适应学习在回归分析中若自变量间中高相关则某些与因变量有关系的变量会被排除在回归模型之外容差及方差膨胀系数vif检验多元回归分析的共线性问题
《回归分析》PPT课件
本课件PPT仅供学习使用 本课件PPT仅供学习使用 本课件PPT仅供学习使用
金融数据库如何使用STATA做回归分析 ppt课件

– 实验数据:在实验环境中获得 – 非实验数据:对个人、企业或者经济系统中进
行观测得到
• 通常情况下,社会科学使用非实验数据。
金融数据库如何使用STATA做回归 分析
数据类型
• 时间序列:变量由不同时间的观测值构成。如1993年至 2015年股票价格,GDP, CPI,汽车销售量。
• 横截面数据:在某个时点对个人、企业、家庭、国家等个 体采集样本形成的数据。如某时点股票价格、GDP, CPI, 汽车销售量,某年份个人、家庭收入,企业销售额。
– 多元回归,回归分析推断,大样本理论 – 虚拟变量回归 – 异方差,自相关
• 使用STATA做多元回归分析
– 数据导入、描述、画图 – 回归分析、回归诊断
金融数据库如何使用STATA做回归 分析
教材
• 计量经济学
– 伍德里奇,计量经济学导论,人民大学出版社 – Chattefueer & Hadi, Regression Analysis by Sample – Stock & Watson, 计量经济学导论 – Jonhnston: Econometric Methods
–
金融数据库如何使用STATA做回归 分析
国内常用微观数据5
• 中国家庭动态跟踪调查数据。( Chinese Family Panel Studies, CFPS) 。
– 是北京大学中国社会科学调查中心(ISSS)实施的一项旨在通过跟 踪搜集个体、家庭、社区三个层次的数据,反映中国社会、经济、 人口、教育和健康的变迁。2008年在北京、上海、广东的展开探 索性调查,调查规模为2400户;2009年在北京、上海、广东三地 展开工具性测试跟踪调查,测试CAPI技术、调查进程实时管理技 术、调查进程实时技术支持系统、数据质量实时监控技术的稳定 性和可靠性。2010年在全国(西藏、青海、新疆、宁夏、内蒙古、 海南、香港、澳门、台湾不在其列)正式实施,调查规模为 16000户,每年一次跟踪调查。
行观测得到
• 通常情况下,社会科学使用非实验数据。
金融数据库如何使用STATA做回归 分析
数据类型
• 时间序列:变量由不同时间的观测值构成。如1993年至 2015年股票价格,GDP, CPI,汽车销售量。
• 横截面数据:在某个时点对个人、企业、家庭、国家等个 体采集样本形成的数据。如某时点股票价格、GDP, CPI, 汽车销售量,某年份个人、家庭收入,企业销售额。
– 多元回归,回归分析推断,大样本理论 – 虚拟变量回归 – 异方差,自相关
• 使用STATA做多元回归分析
– 数据导入、描述、画图 – 回归分析、回归诊断
金融数据库如何使用STATA做回归 分析
教材
• 计量经济学
– 伍德里奇,计量经济学导论,人民大学出版社 – Chattefueer & Hadi, Regression Analysis by Sample – Stock & Watson, 计量经济学导论 – Jonhnston: Econometric Methods
–
金融数据库如何使用STATA做回归 分析
国内常用微观数据5
• 中国家庭动态跟踪调查数据。( Chinese Family Panel Studies, CFPS) 。
– 是北京大学中国社会科学调查中心(ISSS)实施的一项旨在通过跟 踪搜集个体、家庭、社区三个层次的数据,反映中国社会、经济、 人口、教育和健康的变迁。2008年在北京、上海、广东的展开探 索性调查,调查规模为2400户;2009年在北京、上海、广东三地 展开工具性测试跟踪调查,测试CAPI技术、调查进程实时管理技 术、调查进程实时技术支持系统、数据质量实时监控技术的稳定 性和可靠性。2010年在全国(西藏、青海、新疆、宁夏、内蒙古、 海南、香港、澳门、台湾不在其列)正式实施,调查规模为 16000户,每年一次跟踪调查。
stata软件基本操作和简单的一元线性回归PPT专业课件

Page 1
stata软件基本操作和 简单的一元线性回归
一、 Stata软件介绍
Page 2
Stata是世界著名的统计分析软件之一。 Stata 是一套提供其使用者数据分析、数据管理以 及绘制专业图表的完整及整合性统计软件。它提供 许许多多功能,包含线性混合模型、均衡重复反复 及多项式普罗比模式。用Stata绘制的统计图形相当 精美。 Stata的统计功能很强,除了传统的统计分析方法外, 还收集了近20年发展起来的新方法,如Cox比例风 险回归,指数与Weibull回归,多类结果与有序结果 的logistic回归,Poisson回归,负二项回归及广义负 二项回归,随机效应模型等。
这两种方式都要自己查表找ta/2(n-2)临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、 DW值等重要信息。这会在后面的课程中说明。
• 模型检验:R方、t、F检验
第一步 导入数据
• 点击data editor(edit)图标进入数据编辑器
Page 11
• 复制“时间序列”工作表的消费和收入数据(连同第一行 表头,不要第一列),在数据编辑器里粘贴
• 弹出提示,询问第一行是否要当成变量名称(表头),选 左边为是
• 点击variables manager按钮,更改变量名为英文,消费 为Y,收入为X
注意用英文逗号,然后空格!!
若只想对某一个变量进行描述,则输入
summarize 变量名, detail
多个变量直接以空格隔开即可
第二步 画散点图/描述统计
(2)图形描述 在命令栏输入:scatter Y X 即可,注意纵轴变量在前
Page 14
扩展:让图形更美观,可自行查阅help scatter的帮助文件 如:想每个点标上是第几行数据怎么做? gen n=_n scatter Y X, mlabel(n)
stata软件基本操作和 简单的一元线性回归
一、 Stata软件介绍
Page 2
Stata是世界著名的统计分析软件之一。 Stata 是一套提供其使用者数据分析、数据管理以 及绘制专业图表的完整及整合性统计软件。它提供 许许多多功能,包含线性混合模型、均衡重复反复 及多项式普罗比模式。用Stata绘制的统计图形相当 精美。 Stata的统计功能很强,除了传统的统计分析方法外, 还收集了近20年发展起来的新方法,如Cox比例风 险回归,指数与Weibull回归,多类结果与有序结果 的logistic回归,Poisson回归,负二项回归及广义负 二项回归,随机效应模型等。
这两种方式都要自己查表找ta/2(n-2)临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、 DW值等重要信息。这会在后面的课程中说明。
• 模型检验:R方、t、F检验
第一步 导入数据
• 点击data editor(edit)图标进入数据编辑器
Page 11
• 复制“时间序列”工作表的消费和收入数据(连同第一行 表头,不要第一列),在数据编辑器里粘贴
• 弹出提示,询问第一行是否要当成变量名称(表头),选 左边为是
• 点击variables manager按钮,更改变量名为英文,消费 为Y,收入为X
注意用英文逗号,然后空格!!
若只想对某一个变量进行描述,则输入
summarize 变量名, detail
多个变量直接以空格隔开即可
第二步 画散点图/描述统计
(2)图形描述 在命令栏输入:scatter Y X 即可,注意纵轴变量在前
Page 14
扩展:让图形更美观,可自行查阅help scatter的帮助文件 如:想每个点标上是第几行数据怎么做? gen n=_n scatter Y X, mlabel(n)
基于stata的回归分析18页PPT

• variable name type format label variable label
• --------------------------------------------------------------------------------------------------
• price
1、数据的统计性质
• 导入数据: • 方法一:cd F:\研究生\研一下\双学位中计2\
课件\statafiles;(设定当前工作区)use hprice2, clear (调用数据) • 方法二:use F:\研究生\研一下\双学位中计 2\课件\statafiles\hprice2.dta, clear
• stratio float %9.0g
average student-teacher ratio
• lprice
float %9.0g
log(price)
• lnox
float %9.0g
log(nox)
• --------------------------------------------------------------------------------------------------
e.g. x ~ N (0, 2) u x2, then
cov(u, x) E(ux) E(u)E(x) E(x3) E(x2)E(x) 0
E(u | x) E(x2 | x) 2
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
课件用stata做面板数据回归 课件

短面板
• 短面板回归基本步骤
• (1)导入并设定为面板数据。 • (2)做固定效应模型,并报告聚类稳健标准误与普通标准误。 • (3)做随机效应模型,并报告聚类稳健标准误与普通标准误。 • (4)比较两个模型的聚类稳健标准误与普通标准误是否相差较大,并决定采取是否使用辅助回归的
Hausman检验。若相差较大则采用辅助回归的Hausman检验,若相差不大则采用传统Hausman检验。 • (5)通过Hausman检验,决定采用固定效应模型还是随机效应模型。 • (6)报告并分析结果。
• 如果聚类稳健标准误与普通标准误相差较大,则传统Hausman检验不适用。
短面板
• Hausman检验
Stata与其他计量软件比较
• Eviews
• 界面不够人性化,使用前最好熟悉每个命令操作的程序语言 • 数据处理能力较弱 • 强于时间序列分析,但其它回归分析(如面板数据等)、数据处理、统计分析较弱 • 软件小,对内存要求也不高 • 小块头,小智慧!
Stata与其他计量软件比较
• Stata
• 简单易懂、界面像Excel,操作多样化(即可编程,也可鼠标操作) • 数据管理能力弱于SAS,一次主要用于一个数据文件,可处理的单个数据文件受内存大小影响,可处
课件-用st • 面板数据的设定 • 短面板 • 长面板 • 面板回归与空间计量
Stata与其他计量软件比较
• SPSS • SAS • Eviews • Stata
Stata与其他计量软件比较
• SPSS
• 界面人性化,基本如Excel,很容易上手 • 数据文件最多4096个变量 • 强于统计分析,如方差分析,没有稳健方法,弱于计量分析,缺乏调查数据分析 • 程序较大,属于统计软件而非真正的计量软件 • 大块头,小智慧!
课件-用stata做面板数据回归

数据转换
Stata软件提供了丰富的数据转换工具,如变量计算、数 据分组、数据合并等,方便用户对数据进行处理和转换。
03 面板数据回归的Stata实 现
数据的准备与处理
数据清洗
检查数据中的缺失值、异常值和重复值,并进行相应 的处理。
数据转换
对数据进行必要的转换,如对数转换、标准化等,以 满足回归模型的要求。
它利用个体和时间两个维度的信息, 通过控制个体固定效应和时间固定效 应,来估计参数的固定效应模型。
面板数据回归的应用场景
面板数据回归适用于研究不同个体在 一段时间内的行为和表现,例如经济 增长、消费行为、投资决策等。
它可以帮助我们更好地理解经济和社 会现象,为政策制定提供科学依据。
面板数据回归的基本假设
课件-用stata做面板 数据回归
目录
CONTENTS
• 面板数据回归简介 • Stata软件介绍 • 面板数据回归的Stata实现 • 面板数据回归的注意事项与建议 • Stata软件进阶技巧
01 面板数据回归简介
面板数据回归的定义
面板数据回归是一种统计方法,用于 分析时间序列和截面数据,以研究不 同个体在不同时间点的行为和表现。
按照安装向导的指引,逐步完成软件的安装过 程。
启动软件
安装完成后,双击桌面上的Stata图标,即可启动软件。
Stata软件的数据导入与整理
数据导入
Stata软件支持多种数据格式,如Excel、CSV、数据库等 ,用户可以通过“文件”菜单中的“导入数据”选项导入 数据。
数据整理
在导入数据后,用户可以使用Stata软件的数据管理功能 ,如数据排序、变量转换、缺失值处理等,对数据进行整 理和清洗。
面板数据回归的模型选择与优化
Stata软件提供了丰富的数据转换工具,如变量计算、数 据分组、数据合并等,方便用户对数据进行处理和转换。
03 面板数据回归的Stata实 现
数据的准备与处理
数据清洗
检查数据中的缺失值、异常值和重复值,并进行相应 的处理。
数据转换
对数据进行必要的转换,如对数转换、标准化等,以 满足回归模型的要求。
它利用个体和时间两个维度的信息, 通过控制个体固定效应和时间固定效 应,来估计参数的固定效应模型。
面板数据回归的应用场景
面板数据回归适用于研究不同个体在 一段时间内的行为和表现,例如经济 增长、消费行为、投资决策等。
它可以帮助我们更好地理解经济和社 会现象,为政策制定提供科学依据。
面板数据回归的基本假设
课件-用stata做面板 数据回归
目录
CONTENTS
• 面板数据回归简介 • Stata软件介绍 • 面板数据回归的Stata实现 • 面板数据回归的注意事项与建议 • Stata软件进阶技巧
01 面板数据回归简介
面板数据回归的定义
面板数据回归是一种统计方法,用于 分析时间序列和截面数据,以研究不 同个体在不同时间点的行为和表现。
按照安装向导的指引,逐步完成软件的安装过 程。
启动软件
安装完成后,双击桌面上的Stata图标,即可启动软件。
Stata软件的数据导入与整理
数据导入
Stata软件支持多种数据格式,如Excel、CSV、数据库等 ,用户可以通过“文件”菜单中的“导入数据”选项导入 数据。
数据整理
在导入数据后,用户可以使用Stata软件的数据管理功能 ,如数据排序、变量转换、缺失值处理等,对数据进行整 理和清洗。
面板数据回归的模型选择与优化
Stata软件之回归讲解精品PPT课件

40
30
20
10
0
0
5
10
15
20
years of education
Fitted values
hourly wage
三、简单回归分析的Stata软件操作实例
7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样
本。命令如下:
reg wage edu if age<=30 得到以下运行结果,保存该运行结果;
16 0 0 0
1.25
lnwage
1225 1.808352 .5307399 .2231435
第1列:变量名; 第2列:观测数; 第3列:均值; 第4列:标准差; 第5列:最小值; 第6列:最大值。
Max
60 19 50 2500 37.5
3.624341
三、简单回归分析的Stata软件操作实例
edu _cons
.3937442 .0488491 3.584695 .4589088
8.06 0.000 7.81 0.000
.2979069 2.684359
.4895815 4.485031
(2) 表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SSE)、
残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,
age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior;
4:college years of education years of work experience:
age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
计量经济学Stata软件应用【Stata软件之回归分析】次课PPT课件

obs:
1,225
vars:
11
25 Aug 2009 08:38
size:
58,800 (99.4% of memory free)
storage display variable name type format
value label
variable label
age female married edulevel
y 1xu
即假定截距系数 0 0 时,该模型被称为过原点回归;过 原点回归在实际中有一定的应用,但除非有非常明确的理 论分析表明 0 0 ,否则不宜轻易使用过原点回归模型。
.
4
二、简单回归分析的Stata基本命令
➢ regress y x 以 y 为被解释变量,x 为解释变量进行普通最小二乘 (OLS)回归。regress命令可简写为横线上方的三个字 母reg。
结果显示“工资方程1.dta”数据文件包含1225个样本和11个 变
量;11个变量的定义及说明见第3列。
.
8Hale Waihona Puke 三、简单回归分析的Stata软件操作实例
3、变量的描述性统计分析。对于定量变量,使用summarize 命令:su age edu exp expsq wage lnwage,得到以下运行结 果,保存该运行结果;
2、给出数据的简要描述。使用describe命令,简写为: des 得到以下运行结果;
.
7
三、简单回归分析的Stata软件操作实例
Contains data fromD:\½²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¾Ý\¡¾ÖØÒª¡¿\¡¾¼ÆÁ¿¾¼ÃѧÈí¼þÓ¦Ó
> ÿμþ¡¿\10649289\stata10\¹¤×Ê·½³Ì1.dta
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、给出数据的简要描述。使用describe命令,简写为: des 得到以下运行结果;
三、简单回归分析的Stata软件操作实例
Contains data from D:\½²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¾Ý\¡¾ÖØÒª¡¿\¡¾¼ÆÁ¿¾¼ÃѧÈí¼þÓ¦Ó
> ÿμþ¡¿\10649289\stata10\¹¤×Ê·½³Ì1.dta
计量经济软件应用
——Stata软件实验之一元、 多元回归分析
内容概要
一、实验目的 二、简单回归分析的Stata基本命令 三、简单回归分析的Stata软件操作实例 四、多元回归分析的Stata基本命令 五、多元回归分析的Stata软件操作实例
一、实验目的:
掌握运用Stata软件进行简单回归分析以及 多元回归分析的操作方法和步骤,并能看懂 Stata软件运行结果。
二、简单回归分析的Stata基本命令
简单线性回归模型 ( simple linear regression model ) 指 只有一个解释变量的回归模型。如:
y 0 1x u
其中,y 为被解释变量,x 为解释变量,u 为随机误差项, 表示除 x 之外影响 y 的因素;1称为斜率参数或斜率系 数,0称为截距参数或截距系数,也称为截距项或常数项。 简单线性回归模型的一种特殊情况:
的残差(即 ei yi yˆi )。
三、简单回归分析的Stata软件操作实例
实验 1 简单回归分析:教育对工资的影响
劳动经济学中经常讨论的一个问题是劳动者工资的决定。不 难想象,决定工资的因素有很多,例如能力、性别、工作经验、 教育水平、行业、职业等。在这里仅考虑其中一种因素:教育 水平,建立如下计量模型:
age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior;
4:college years of education years of work experience:
age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
wage 0 1edu u,,,,,,,,,,,,,,,,,,,,,,,,,(3.1)
其中,wage 为被解释变量,表示小时工资,单位为元;edu 为解释变量,表示受教育年限,即个人接受教育的年数,单 位为年;u为随机误差项。假定模型(3.1)满足简单回归模型的 全部5条基本假定,这样0, 1的OLS估计量 ˆ0, ˆ1 将是最佳线性 无偏估计量。请根据表S-2中给出的数据采用Stata软件完成上 述模型的估计等工作。
16 0 0 0
1.25
60 19 50 2500 37.5
lnwa ge
1225 1.808352 .5307399 .2231435 3.624341
第1列:变量名; 第2列:观测数; 第3列:均值; 第4列:标准差; 第5列:最小值; 第6列:最大值。
三、简单回归分析的Stata软件操作实例
y 1x u 即假定截距系数 0 0时,该模型被称为过原点回归;过 原点回归在实际中有一定的应用,但除非有非常明确的理 论分析表明 0 0 ,否则不宜轻易使用过原点回归模型。
二、简单回归分析的Stata基本命令
➢ regress y x
以 y 为被解释变量,x 为解释变量进行普通最小二乘
(OLS)回归。regress命令可简写为横线上方的三个字
obs:
1,225
v ars:
11
25 Aug 2009 08:38
s ize:
58,800 (99.4% of memory free)
storage display variable name type format
va lue la bel
variable label
age female married edulevel
edu exp
expsq health migrant wage
mo re
f loat f loat f loat f loat
%9 .0g %9 .0g %9 .0g %9 .0g
float %9.0g float %9.0g
f loat f loat f loat f loat
%9 .0g %9 .0g %9 .0g %9 .0g
母reg。
➢ regress y x, noconstant
y 对 x 的回归,不包含截距项 (constant),即过原点回归。
➢ predict z
根据最近的回归生成一个新变量 z,其值等于每一个观测
的拟合值(即
yˆ
)。
i
➢ predict u, residual
根据最近的回归生成一个新变量 u,其值等于每一个观测
三、简单回归分析的Stata软件操作实例
1、打开数据文件。直接双击“工资方程1.dta”文件;或者点 击Stata窗口工具栏最左侧的Open键,然后选择“工资方程 1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata 窗口工具栏右起第4个Data Editor键,将数据粘贴到打开的 数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左 起第二个Save键保存数据,保存时需要给数据文件命名。
Va riab le
Obs
Mean Std. a ge ed u ex p ex psq wa ge
1225 1225 1225 1225 1225
36.79755 8.992653
21.8049 613.9776
7.1255
10.67631 2.719068 11.77443 548.3072 4.766828
结果显示“工资方程1.dta”数据文件包含1225个样本和11个 变
量;11个变量的定义及说明见第3列。
三、简单回归分析的Stata软件操作实例
3、变量的描述性统计分析。对于定量变量,使用summarize 命令:su age edu exp expsq wage lnwage,得到以下运行结 果,保存该运行结果;
三、简单回归分析的Stata软件操作实例
Contains data from D:\½²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¾Ý\¡¾ÖØÒª¡¿\¡¾¼ÆÁ¿¾¼ÃѧÈí¼þÓ¦Ó
> ÿμþ¡¿\10649289\stata10\¹¤×Ê·½³Ì1.dta
计量经济软件应用
——Stata软件实验之一元、 多元回归分析
内容概要
一、实验目的 二、简单回归分析的Stata基本命令 三、简单回归分析的Stata软件操作实例 四、多元回归分析的Stata基本命令 五、多元回归分析的Stata软件操作实例
一、实验目的:
掌握运用Stata软件进行简单回归分析以及 多元回归分析的操作方法和步骤,并能看懂 Stata软件运行结果。
二、简单回归分析的Stata基本命令
简单线性回归模型 ( simple linear regression model ) 指 只有一个解释变量的回归模型。如:
y 0 1x u
其中,y 为被解释变量,x 为解释变量,u 为随机误差项, 表示除 x 之外影响 y 的因素;1称为斜率参数或斜率系 数,0称为截距参数或截距系数,也称为截距项或常数项。 简单线性回归模型的一种特殊情况:
的残差(即 ei yi yˆi )。
三、简单回归分析的Stata软件操作实例
实验 1 简单回归分析:教育对工资的影响
劳动经济学中经常讨论的一个问题是劳动者工资的决定。不 难想象,决定工资的因素有很多,例如能力、性别、工作经验、 教育水平、行业、职业等。在这里仅考虑其中一种因素:教育 水平,建立如下计量模型:
age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior;
4:college years of education years of work experience:
age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
wage 0 1edu u,,,,,,,,,,,,,,,,,,,,,,,,,(3.1)
其中,wage 为被解释变量,表示小时工资,单位为元;edu 为解释变量,表示受教育年限,即个人接受教育的年数,单 位为年;u为随机误差项。假定模型(3.1)满足简单回归模型的 全部5条基本假定,这样0, 1的OLS估计量 ˆ0, ˆ1 将是最佳线性 无偏估计量。请根据表S-2中给出的数据采用Stata软件完成上 述模型的估计等工作。
16 0 0 0
1.25
60 19 50 2500 37.5
lnwa ge
1225 1.808352 .5307399 .2231435 3.624341
第1列:变量名; 第2列:观测数; 第3列:均值; 第4列:标准差; 第5列:最小值; 第6列:最大值。
三、简单回归分析的Stata软件操作实例
y 1x u 即假定截距系数 0 0时,该模型被称为过原点回归;过 原点回归在实际中有一定的应用,但除非有非常明确的理 论分析表明 0 0 ,否则不宜轻易使用过原点回归模型。
二、简单回归分析的Stata基本命令
➢ regress y x
以 y 为被解释变量,x 为解释变量进行普通最小二乘
(OLS)回归。regress命令可简写为横线上方的三个字
obs:
1,225
v ars:
11
25 Aug 2009 08:38
s ize:
58,800 (99.4% of memory free)
storage display variable name type format
va lue la bel
variable label
age female married edulevel
edu exp
expsq health migrant wage
mo re
f loat f loat f loat f loat
%9 .0g %9 .0g %9 .0g %9 .0g
float %9.0g float %9.0g
f loat f loat f loat f loat
%9 .0g %9 .0g %9 .0g %9 .0g
母reg。
➢ regress y x, noconstant
y 对 x 的回归,不包含截距项 (constant),即过原点回归。
➢ predict z
根据最近的回归生成一个新变量 z,其值等于每一个观测
的拟合值(即
yˆ
)。
i
➢ predict u, residual
根据最近的回归生成一个新变量 u,其值等于每一个观测
三、简单回归分析的Stata软件操作实例
1、打开数据文件。直接双击“工资方程1.dta”文件;或者点 击Stata窗口工具栏最左侧的Open键,然后选择“工资方程 1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata 窗口工具栏右起第4个Data Editor键,将数据粘贴到打开的 数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左 起第二个Save键保存数据,保存时需要给数据文件命名。
Va riab le
Obs
Mean Std. a ge ed u ex p ex psq wa ge
1225 1225 1225 1225 1225
36.79755 8.992653
21.8049 613.9776
7.1255
10.67631 2.719068 11.77443 548.3072 4.766828
结果显示“工资方程1.dta”数据文件包含1225个样本和11个 变
量;11个变量的定义及说明见第3列。
三、简单回归分析的Stata软件操作实例
3、变量的描述性统计分析。对于定量变量,使用summarize 命令:su age edu exp expsq wage lnwage,得到以下运行结 果,保存该运行结果;