SPSS课件虚拟变量
合集下载
第四讲 虚拟变量ppt课件

① 若定性变量含有 m 个类别,则模型中最多只能引入 m-1 个虚拟变量,例如对于季 据(有 4 个季节) ,最多只能引入 3 个虚拟变量。当引入 4 个虚拟变量时,就会导致多 注意: (1) 当定性变量含有 m 个类别时,模型不能引入 m个虚 线性。看表 8-1 数据,4 个虚拟变量定义为, 拟变量。最多只能引入 m -1个虚拟变量,否则当模型中存在
2. 测量斜率变动
以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟 变量考察回归函数的斜率是否发生变化。方法是在模型中加入定量变量与
虚拟变量的乘积项。设模型如下,
Yi = 0 + 1 Xi + 2 Di + 3 (Xi Di) + ui
100 Y 80
按2,3 是否为零,回归函数可有如下四种形式。
表 8-1 xt 和虚拟变量 D1、D2、D3、D4 截距项时就会产生完全多重共线性,无法估计回归参数。比 t xt D1 D2 D3 D4 如,对于季节数据引入 4个虚拟变量,数据如下表, 1995.2 1995.1 x1 1995.3 1995.2 x2 1995.4 1995.3 x3 1996.1 1995.4 x4 1996.2 1996.1 x5 1996.3 1996.2 x6 1996.4 1996.3 x7 1997.1 1996.4 x8 1997.1 … x9
Yˆ i = - 0.5667 + 0.0963 Xi
(-3.5) (11.6) R2 = 0.88, DW = 1.85
比较回归方程,前者的确定系数为0.99,后者的确定系数仅为0.88。说 明该回归模型中引入虚拟变量非常必要。
把“季节”因素引入模型
“季节”是在研究经济问题中常常遇到的定性因素。比如,酒,肉的销量 在冬季要超过其它季节,而饮料的销量又以夏季为最大。当建立这类问 题的计量模型时,就要考虑把“季节”因素引入模型。由于一年有四个 季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个虚 拟变量。
虚拟变量模型.最全优质PPT

E ( Y i|X i,D 2 i 0 ,D 3 i 1 ) (1 3 ) X i
设 Y i 为消费支出;X i 为收入;D i 为虚拟变量, 即
1,城镇居民
Di 0,农村居民 i1,2,3, ,n
上述表达式的意义在于,在收入不变的条件下,研 究城镇居民和农村居民对消Y i 费的不同影响,即判断 城乡居民在消费上是否存在显著性差异。 农村居民年平均消费:
E (Y i,|X i,D i0)12X i
1.2 二态变量的作用
引入虚拟变量的作用,在于将定性因素或属性因素 对因变量的影响数量化。 1.可以描述和测量定性(或属性)因素的影响。 2.能够正确反映经济变量之间的相互关系,提高模 型的精度;例如在分段回归中的应用。 3.便于处理异常数据。由于某些突发事件的存在, 如战争、自然灾害,使原本比较稳定的经济关系发 生一段时间的混乱,此时可以利用虚拟变量。
设变量D表示某种属性,该属性有两种类型,即当 属性存在时D取值为1;当属性不存在时D取值为0。 记为
1 具有某种属性 D0 不具有该属性
该变量D即为二态变量。二态变量又称虚拟变量、 名义变量或哑变量,是用以反映质的属性的一个人 工变量,是量化了的质变量,通常取值为0或1, 一般“1”代表某一属性存在,“0”代表某一属 性不存在, 即“是”或“否”,“男”或“女”等。
对上述模型进行回归,利用样本统计量对假 设作出判断(t检验)。只有一个定性解释变 量往往可用于检验一个属性因素对被解释变 量的影响是否显著性存在。
2.1.2 模型中有一个定量解释变量和一
个定性解释变量
设模型形式为
Y i12Xi3D iui
式中,X i 为定量变量,D i 为具有两个属性类型 的定性变量。
设模型形式为
设 Y i 为消费支出;X i 为收入;D i 为虚拟变量, 即
1,城镇居民
Di 0,农村居民 i1,2,3, ,n
上述表达式的意义在于,在收入不变的条件下,研 究城镇居民和农村居民对消Y i 费的不同影响,即判断 城乡居民在消费上是否存在显著性差异。 农村居民年平均消费:
E (Y i,|X i,D i0)12X i
1.2 二态变量的作用
引入虚拟变量的作用,在于将定性因素或属性因素 对因变量的影响数量化。 1.可以描述和测量定性(或属性)因素的影响。 2.能够正确反映经济变量之间的相互关系,提高模 型的精度;例如在分段回归中的应用。 3.便于处理异常数据。由于某些突发事件的存在, 如战争、自然灾害,使原本比较稳定的经济关系发 生一段时间的混乱,此时可以利用虚拟变量。
设变量D表示某种属性,该属性有两种类型,即当 属性存在时D取值为1;当属性不存在时D取值为0。 记为
1 具有某种属性 D0 不具有该属性
该变量D即为二态变量。二态变量又称虚拟变量、 名义变量或哑变量,是用以反映质的属性的一个人 工变量,是量化了的质变量,通常取值为0或1, 一般“1”代表某一属性存在,“0”代表某一属 性不存在, 即“是”或“否”,“男”或“女”等。
对上述模型进行回归,利用样本统计量对假 设作出判断(t检验)。只有一个定性解释变 量往往可用于检验一个属性因素对被解释变 量的影响是否显著性存在。
2.1.2 模型中有一个定量解释变量和一
个定性解释变量
设模型形式为
Y i12Xi3D iui
式中,X i 为定量变量,D i 为具有两个属性类型 的定性变量。
设模型形式为
【精选】4-2虚拟变量回归分析汇总PPT课件

SPSS输出结果
Co efficien tas
Unstandardized Standardized
Coef f icients
Coef f icients
Model
1
(C onstant)
年龄
B
Std. Error
1.409
.682
.068
.013
Bet a .569
ED2
-1.127
.295
-. 399
Sig. .069 .001 .004 .005 .003 .002 .015
回归方程的解释
当案例在两个分类变量都等于0时,即文化 程度为文盲,居住地在农村时,此种情况 称为参照类(其他情况将于此进行比较), 其回归方程为:
表明所有参照类妇女年龄每上升1岁,其曾 生子女数的平均变化量为0.068个。
反常年份 正常年份
反常年份 EYt | Xt,Dt 1(12)Xt
正常年份 EYt | Xt,Dt 01Xt
在正常年份的基础上进行比较,(只有斜率系数发生改变)。
(2)截距和斜率均发生变化
模型形式:
Y i f X t , D t , D t X t 0 1 D , 1 2 D
例,同样研究消费支出 Y 、收入 X 、年份状况 D 间的影
可以应用它们的信息进行线性回归。 但是,必须先将定性变量转换为哑变量
(也称虚拟变量),然后再将它们引入方 程,所得的回归结果才有明确的解释意义。
虚拟自变量 (dummy variable)
也叫“哑变量”,是指测度级别为名义 和序次层级的自变量。
虚拟自变量可有不同的水平
➢ 只有两个水平的虚拟自变量
回归方程的解释
spss第八章虚拟变量

10
模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国 GDP的时间序列,必须考虑“文革”因素 对国民经济的破坏性影响,剔除不可比 的“文革”因素。 2、检验不同属性类型对因变量的作用, 例如工资模型中的文化程度、季节对销 售额的影响。 3、提高模型的精度,相当与将不同属性 的样本合并,扩大了样本容量(增加了 12 误差自由度,从而降低了误差方差)。
虚拟变量在模型中,可以作解释变量,也 可以作因变量。 虚拟变量作解释变量时出现在方程的右端 虚拟变量作因变量(被解释变量)时出现 在方程的左端
9
虚拟变量模型
引入虚拟变量后,回归方程中同时含有一 般解释变量和虚拟变量,称这种结构的模 型为虚拟变量模型或斜方差分析模型。 在第8章(本章)中讨论虚拟自变量模型 在第14章(虚拟因变量)中讨论虚拟因变 量。虚拟变量作因变量又称抉择模型。
虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量 的个数应按下列原则确定: 如果有 m 种互斥的属性类型,在模型中引 入 m-1 个虚拟变量 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量 再如,文化程度分小学、初中、高中、大 学、研究生5类,引用4个虚拟变量
13
虚拟变量是一用以反映质的属性的一个人 工变量,通常记为D(Dummy)。 虚拟变量D只取0或1两个值 对基础类型或肯定类型设D=1 对比较类型或否定类型设D=0
7
虚拟变量举例
D= D= 1 0 0 1 本科学历 非本科学历 “文革”时期 非“文革”时期
8
虚拟变量的引入
模型中引入虚拟变量的必要性
现实经济生活错综复杂,往往要求人们按 照经济变量的质或量的不同,分别进行处 理。因此,回归模型中,往往有必要引入 虚拟变量,以表示这些质的区别。例如, 消费函数,对于平时与战时,萧条与繁荣, 乃至性别、教育程度、季节性等等,都会 因质的有不同表现出不同的差异。6虚拟变量的定义
《SPSS的使用教程》PPT课件

标准型数值变量带逗点的数值型变量圆点的数值型变量科学计数法日期型变量美元数量自定义型变量字符型变量10在spss对话框中用号表示数字型变量字符串则用a表示在spss对话框中用号表示数字型变量字符串则用a表示用号表示数字型变量用a号表示字符型变量定义的字符串长度如果小于等于8则图标中会有一个小于符号如上图大于8时图标中会有一个大于符号11变量长度width小数点位数decimal确定变量总长度小数点后位数变量名标签label例如变量为sex可令标签为性别
要想看变量值标签,点击: 或选菜单: 会得到如右结果:
6. 频数统计
下面进行频数统计:
7. 练习:奥运会临时超市网点设计
• 2004高教社杯全国大学生数学建模竞赛题目 A题 • 2008 年北京将举办奥运会。根据问卷调查资料分析
人流量的规律 ,给出比赛主场馆的周边临时商业网 点( Mini Supermarket )的设计方案,以满足观 众、游客、工作人员等在奥运会期间的购物需求。
新建数据文 件并输入
打开已有数 据并编辑
方法二:通过菜单打开(或新建)
新建数据文 件并输入
打开已有数 据并编辑
2. 定义变量
定义变量有两种方法: 1) 双击变量名,新建变量或修改已有变量
2) 在编辑窗口左下方可以进行数据与变量的编辑切换
点击进入变量编辑窗口
进入变量编辑窗口后会出现如下状态:
变量变名量类变型量小长数度点变位量数名变标量签值标缺签数省据值显示对宽齐变度格量式测度类型
变量值标签(Values) 变量取不同值时,可赋以相应名称 点击省略号会弹出如下对话框:
定义变量值标签的方法:在第一个Value栏输入数 值,在第二个Value栏输入标签,然后点击Add按 钮就可增加一个标签,最后点击OK按钮结束定 义。另外还可进行修改与删除操作。
要想看变量值标签,点击: 或选菜单: 会得到如右结果:
6. 频数统计
下面进行频数统计:
7. 练习:奥运会临时超市网点设计
• 2004高教社杯全国大学生数学建模竞赛题目 A题 • 2008 年北京将举办奥运会。根据问卷调查资料分析
人流量的规律 ,给出比赛主场馆的周边临时商业网 点( Mini Supermarket )的设计方案,以满足观 众、游客、工作人员等在奥运会期间的购物需求。
新建数据文 件并输入
打开已有数 据并编辑
方法二:通过菜单打开(或新建)
新建数据文 件并输入
打开已有数 据并编辑
2. 定义变量
定义变量有两种方法: 1) 双击变量名,新建变量或修改已有变量
2) 在编辑窗口左下方可以进行数据与变量的编辑切换
点击进入变量编辑窗口
进入变量编辑窗口后会出现如下状态:
变量变名量类变型量小长数度点变位量数名变标量签值标缺签数省据值显示对宽齐变度格量式测度类型
变量值标签(Values) 变量取不同值时,可赋以相应名称 点击省略号会弹出如下对话框:
定义变量值标签的方法:在第一个Value栏输入数 值,在第二个Value栏输入标签,然后点击Add按 钮就可增加一个标签,最后点击OK按钮结束定 义。另外还可进行修改与删除操作。
第四节虚拟变量

1 中高收入家庭 D 0 低收入家庭
将我国城镇居民的彩电需求函数设成:
Yi=a+bxi+ αDi+ βXDi+εi 同时引入加法和乘法方法,再进行t检验。
DATA D1 输入虚拟变量的值(前三个为0,后五个为1)
(由于D是EViews软件的保留字,所以将虚拟变量取名 为D1;另外,此时也可以用SMPL和GENR命令直接生 成D1变量)
低收入家庭:
中高收入家庭:yˆi 57.61 0.0119xi
yˆi (57.61 31.8731) (0.0119 0.0088)xi 89.48 0.003xi
事实上,现阶段我国城镇居民中高收入家庭的彩电普及 率已达到百分之百,所以对彩电的消费需求处于更新换 代阶段。
此例说明了三个问题: ①如何设置和在模型中引入虚拟变量; ②如何测量定性因素(即收入层次)的影响; ③如何区分不同类型的模型(即需求函数)。
估计以下模型:
+εi
D
1 0
样本2 样本1
Yi= a1 +b1xi+ (a2 - a1 )Di+(b2-b1)XDi +εi 其中,XDi=xi*Di。
第(1)种情况下模型结构是稳定的,其余情
利用t检验判断D况、都X表D明系模数型的结构显不著稳性定,。可以得到四种检 验结果: (1)两个系数均等于零,即a2=a1,b2=b1,表明两个回 归模型之间没有显著差异,称之为“重合回归” 。
❖
17、儿童是中心,教育的措施便围绕 他们而 组织起 来。上 午11时3分41秒 上午11时3分11:03:4121.6.28
❖
1、Genius only means hard-working all one's life. (Mendeleyer, Russian Chemist)
虚拟变量回归PPT课件

Yi ——年工资
X i ——工龄
D1 =1 只是高中毕业
D2 =1 大学毕业及以上
D1=0 其他
D2 =0 其他
基础类型: E(Yi Xi , D1 0, D2 0) 0 Xi (高中以下)
比较类型:E(Yi Xi , D1 1, D2 0) (0 1) Xi(高中) E(Yi Xi , D1 0, D2 1) (0 2) X(i 大学及以上)
用t检验分别检验 1 和 2 的统计显著性:可以分别验
证两个定性变量对截距是否有显著影响
17
注意:
● u i 应服从基本假定
● 两个定性变量分别有两种类型,可以用两个虚拟变量,
不会落入虚拟变量陷阱(为什么?)
注意:“两个定性变量个两种类型”和“一个定性变量三种
类型”都用了两个虚拟变量,但其性质是不同的。
的变量称虚拟变量,一般常用D(dummy) 表示
D=0 表示某种属性或状态不出现或不存在
D=1 表示某种属性或状态出现或存在
4
虚拟变量的作用
● 作为属性因素的代表,如性别(男/女)
● 作为某些非精确计量的数量因素的代表,
如受教育程度(高中及以下、专科、本科及以上)
● 作为某些偶然因素或政策因素的代表,
作用:假定其他因素都不变,只研究某种定性因素在某定 量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因)
2. 解释变量中既含定量变量,又含虚拟变量
作用:研究定量变量和虚拟变量同时对被解释变量的影响
3. 虚拟被解释变量模型:被解释变量本身取值为0或1
作用:对某社会经济现象进行“是”与“否”判断研究 (离散选择模型)
●K个定性变量可选用K个虚拟变量去表示,这不会出现
《虚拟变量模型 》课件

业类型的效应,可以使用虚拟变量模型。理分类变量对连续结果的影响,能够同时分析多个分类变量的效应,有助于更好地理解数据之 间的关系。
缺点
当分类变量类别过多时,会导致虚拟变量的数量增加,从而增加模型的复杂性和计算负担。此外,虚 拟变量模型对于非线性关系的处理能力有限,可能无法准确捕捉数据之间的关系。
虚拟变量模型
目录
• 虚拟变量模型概述 • 虚拟变量模型的建立 • 虚拟变量模型的参数估计与检验 • 虚拟变量模型的应用案例 • 虚拟变量模型的局限性及未来研究方向 • 结论
01
虚拟变量模型概述
定义与特点
定义
虚拟变量模型是一种统计学方法,用于处理分类变量对连续结果的影响。它通过引入一系列二进制(或多元)虚 拟变量来代表分类变量的不同类别。
详细描述
通过引入虚拟变量,研究者可以控制和比较不同类别消费者之间的差异,例如 不同年龄、性别、收入水平的消费者在产品选择、品牌忠诚度和价格敏感度等 方面的表现。
案例二:市场细分研究
总结词
虚拟变量模型在市场细分研究中起到关 键作用,帮助企业了解不同客户群体的 需求和行为特征,从而制定更精准的市 场策略。
确定虚拟变量的数量
根据分类变量的数量,确定需要创建的虚拟变量的数量。
命名虚拟变量
为每个虚拟变量选择一个有意义的名称,以便在模型中使用。
构建虚拟变量模型
确定模型的形式
根据研究假设和问题,选择适合的模型形式 ,如线性回归、逻辑回归等。
引入虚拟变量
将选定的虚拟变量引入到模型中,并根据模 型的要求设置相应的参数。
特点
虚拟变量模型能够揭示分类变量对连续结果的影响,同时能够处理多个分类变量对结果的影响。它通过引入虚拟 变量来控制分类变量的效应,从而更好地理解数据之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归中变量的测量尺度
z 因变量(Y):定距变量
z 自变量(X):定类、定序变量或定 距变量,对于分类变量需要转换成虚 拟变量
北京大学教育经济与管理系:《教育统计与SPSS应用》
线性回归的位置
北京大学教育经济与管理系:《教育统计与SPSS应用》
一元线性回归
北京大学教育经济与管理系:《教育统计与SPSS应用》
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤17:将原变量中代表初中的“2”设为新变量的“1”
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤18:将原变量的其余取值都设为“0”
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤19:点击“Continue”,回到主对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤23:在Name栏中填写第二个虚拟变量edu3
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤24:在Label栏中填写变量名标签-高中
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤25:点击“Change”按钮
北京大学教育经济与管理系:《教育统计与SPSS应用》
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤8:将原变量的其余取值都设为“0”
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤9:点击“Continue”,回到主对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤10:点击“OK”,生成表示小学的虚拟变量edu1
步骤4:在Label栏中填写变量名标签-小学
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤5:点击“Change”按钮
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤6:点击“Old and New Values”按钮
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤7:将原变量中表示小学的“1”设为新变量的“1”
步骤32:选择因变量“月收入”
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤32:选择自变量“虚拟性别”,“edu1”,“edu2”,“edu3”和年龄
北京大学教育经济与管理系:《教育统计与SPSS应用》
点击“OK”,结果一:确定系数表
北京大学教育经济与管理系:《教育统计与SPSS应用》
线性回归的类型
z 一元线性回归,针对一个影响变量 (自变量)的回归分析
z 多元线性回归,针对多个影响变量 (自变量)的回归分析
北京大学教育经济与管理系:《教育统计与SPSS应用》
回归方程 z 一元线性回归
Y=A+BX+ε
z 多元线性回归
Y=B0+B1X1+B2X2 +…+ BnXn +ε
北京大学教育经济与管理系:《教育统计与SPSS应用》
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤11:重新点击“Recode”,弹出对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤12:将四分类的教育变量拖入中间空白框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤13:在Name栏中填写第二个虚拟变量edu2
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤1:点击“Recode”,弹出对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤2:将四分类的教育变量拖入中间空白框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤3:在Name栏中填写第一个虚拟变量edu1
北京大学教育经济与管理系:《教育统计与SPSS应用》
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三告诉我们什么?
z 由此我们可以得到回归方程式: y=534.493+137.048×性别-112.371×小 学-79.864×初中-65.704×高中- 1.749×年龄
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三告诉我们什么?
z 从表中B=135.406,可以发现男性比女性的平均 月收入多135.406元(由于在设定虚拟变量时,将 女性取值为“0”,因此这里以女性为参照项)。
z 由此我们可以得到回归方程: y=396.656+135.406X
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三告诉我们什么?
z 表中的t检验是针对回归系数的显著度检验,而结 果二中的方差分析是对整个回归方程的检验,在 一元回归分析中,这两种检验结果是等同的。而 在多元回归分析中,则有可能是不同的。整体方 程的显著并不意味着每个回归系数都显著,但每 个系数的显著一定意味着整体方程是显著的。
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤7:将原变量的“2”设为新变量的“0”
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤8:点击“Continue”,回到主对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤8:点击“OK”,生成新的虚拟性别变量
北京大学教育经济与管理系:《教育统计与SPSS应用》
小学=1、初中=2、高中=3、大专及以上=4
北京大学教育经济与管理系:《教育统计与SPSS应用》
由于例题中的教育变量是个四分类的定 序变量,因此我们需要设置三个“1”、“0” 取值的虚拟教育变量:edu1、edu2和edu3, 分别用来表示“小学”、“初中”和“高 中”,将“大专及以上”教育类别作为参照 项,其余三个类别分别与其进行比较。
z 但这并不意味着每个自变量与因变量都具 有显著的线性关系,具体的结论还需要看 后面对每个自变量的回归系数的检验结果。
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三:回归系数表
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三告诉我们什么?
z 表中B栏的非标准化回归系数表明: ¾ 第一,在控制了其他变量之后,男性比女性 的月收入高约137元; ¾ 第二,小学、初中和高中程度的受访者的月 收入,与大专及以上教育程度的受访者月收 入相比,分别低了约112元、80元和66元; ¾ 第三,年龄每增加一年,月收入就降低约2元
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤1:点击“Recode”,弹出对话框
通常选择Recode into Different Variable
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤2:将“性别”变量移到中间空白框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤29:点击“Continue”,回到主对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤30:点击“OK”,生成表示高中的虚拟变量edu3
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤31:点击“Regression”中的“Linear”,弹出对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 表中调整后的R平方=0.033,表示性别能够解释 收入3.3%的变化
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果二:方差分析表
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果二告诉我们什么?
z 结果二是对回归方程进行显著度检验的方 差分析,即判断总体回归系数中至少有一 个不等于0
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤20:点击“OK”,生成表示初中的虚拟变量edu2
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤21:重新点击“Recode”,弹出对话框
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤22:将四分类的教育变量拖入中间空白框
z 表中Beta栏的标准化回归系数的绝对值可 以用于比较各个自变量之间对因变量的贡 献大小: 性别(0.184) > 小学(0.117) > 初中(0.103) > 高中(0.082) > 年龄(0.061)
北京大学教育经济与管理系:《教育统计与SPSS应用》
结果三告诉我们什么?
z Sig栏中每个回归系数的显著度水平,表明 各自所对应的那个自变量与因变量之间是 否存在显著的线性相关关系 从结果看,所有回归系数的显著度(即P值) 都小于0.05,由此,我们可以认为性别、教 育和年龄都会影响受访者的月收入。
z 从表中显著度<0.001,可以发现性别对收入的影 响是非常显著的。
北京大学教育经济与管理系:《教育统计与SPSS应用》
多元线性回归
北京大学教育经济与管理系:《教育统计与SPSS应用》
实例2 将受访者的性别、教育程度
(四分类的教育程度: 小学、初中、 高中、大专及以上 )和年龄作为自变量, 通过多元线性回归,分析其对月收 入的影响。
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤14:在Label栏中填写变量名标签-初中
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤15:点击“Change”按钮
北京大学教育经济与管理系:《教育统计与SPSS应用》
步骤16:点击“Old and New Values”按钮
例1 对受访者的性别和月收入进行 一元线性回归分析
北京大学教育经济与管理系:《教育统计与SPSS应用》
注意
当自变量是分类变量时,需要将原 变量转换成虚拟变量,所有虚拟变量都 是 “1”和“0”取值的二分变量。
当原变量是二分类变量时,我们只需要 设定一个“1”、“0”取值的虚拟变量,并 且把取值为“0”的那个类别作为参照项
结果一告诉我们什么?
z 表中调整后的R平方=0.044,表示整 个方程能够解释收入变化的4.4%。