第十一章 分类资料的回归分析

合集下载

因果分析法

因果分析法

| t |≤ t α 2 ( n − 2 )
回归效应不显著
r 检验: 检验:
r=
n∑ xy − ∑ x∑ y n ∑ x − (∑ x )
2
n∑ y − (∑ y )
2
|r|> rα 方程显著
ˆ 置信区间 = y ± tα SE
市场调查与预测 8 第十一章 因果分析法
举例:询问女士的年龄 举例:某企业销售额和广告费支出统计资料
时间
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 合计
销售额y (万元)
195 210 244 264 294 314 360 432 481 567 655 704 4 720
广告费x (万元)
20 20 26 35 52 56 81 131 149 163 232 202 1 167
y = a + b1 x2 + b2 x2 + b3 x3 + L + bm xm
y ——因变量或预测变量 —— xi ——第i个自变量 a ——截距 bi ——第i个自变量的斜率或称为偏 回归系数,表示在其他自变量 均固定不变时,改变一单位xi 引起预测值y的变化。 m——自变量的个数
市场调查与预测
12
第十一章 因果分析法
四、多元线性回归预测 R 检验:通过复相关系数检验一组自变量 检验: 与因变量之间的线性相关程度 F 检验:用来判定模型显著性问题 检验: t 检验:用来判定每一个回归系数的显著 检验: 性问题 DW 检验:用来判定自相关问题 检验:
市场调查与预测 13 第十一章 因果分析法
b= 12 × 600566 1167 × 4720 = 2.2767 2 12 × 175661 − 1167

定量分析方法(11-1)

定量分析方法(11-1)

第十一章 回 归 分 析本章以一元线性回归模型为重点介绍回归分析方法,对于一元线性回归模型所建立的理论与方法作适当的修改便可推广到多元线性回归模型。

§1 回归的概念一、变量之间的关系现实中,各种变量相互依赖、相互影响,存在着某种关系。

如:价格与需求量、利率与投资、收入与消费,等等。

大致可以归纳为两类关系:确定性关系(函数关系),非确定性关系(统计关系)。

1. 确定性关系:变量之间存在着某种完全确定的关系。

如:总收益Y 与产量X 之间的关系:X P Y ⋅=当价格一定时,Y 由X 完全确定。

表现在图形上,()Y X ,的所有点位于一条直线上。

一般地:()n X X X f Y ,,21= (多元函数)2. 非确定性关系:变量之间由于受到某些随机因素的影响而呈现出一种不确定的关系。

如:农业产量主要受到降雨量、施肥量、温度等的影响,但决定产量的并非完全是这些因素,还要受到许多其它因素的影响,如冰雹、蝗灾等自然灾害。

非确定性关系可以分为两大类:1) 相关关系:两个变量处于完全对等的位置,且两个变量皆为随机变量,常用相关系数来度量。

如:计量经济学成绩与统计学成绩,物价水平和股票价格,等等。

2) 回归关系:一个变量的变化是另一个变量变化的原因,而不是相反。

如:消费量Y 与可支配收入X 之间便是一种回归关系。

一般来讲,随着可支配收入的增加,消费增加,可支配收入是影响消费的主要因素,但并非唯一的因XYPX Y =素,影响消费的因素还有消费习惯、地区差异、年龄构成、宗教信仰等等。

同样收入的家庭,有的支出多,有的支出少,即使是同一家庭,其每个月的收入相同的话,各个月的支出也不会完全一样。

这样,对应于一个X 的值,Y 有多个不同的值相对应,X 与Y 呈现出不确定性的关系。

此时:()u X f Y += (u 为随机影响)表现在图形上,()Y X ,的点不是完全处于一条直线(或曲线)上,而是围绕在一条理论线的两旁变化。

回归分析方法

回归分析方法

回归分析方法
回归分析是统计学中一种重要的数据分析方法,它用于研究自
变量和因变量之间的关系。

回归分析方法可以帮助我们预测和解释
变量之间的关系,从而更好地理解数据的特征和趋势。

在本文中,
我们将介绍回归分析的基本概念、常见的回归模型以及如何进行回
归分析。

首先,回归分析的基本概念包括自变量和因变量。

自变量是研
究者可以控制或观察到的变量,而因变量是研究者希望预测或解释
的变量。

回归分析旨在通过自变量的变化来预测或解释因变量的变化,从而揭示它们之间的关系。

常见的回归模型包括线性回归、多元线性回归、逻辑回归等。

线性回归是最简单的回归模型之一,它假设自变量和因变量之间的
关系是线性的。

多元线性回归则允许多个自变量对因变量产生影响,逻辑回归则用于因变量是二元变量的情况,例如成功与失败、生存
与死亡等。

进行回归分析时,我们需要收集数据、建立模型、进行拟合和
检验模型的拟合优度。

在收集数据时,我们需要确保数据的质量和
完整性,避免因为数据缺失或异常值而影响分析结果。

建立模型时,我们需要选择合适的自变量和因变量,并根据实际情况选择合适的
回归模型。

进行拟合和检验模型的拟合优度时,我们需要根据实际
情况选择合适的统计指标和方法,例如残差分析、R方值等。

总之,回归分析方法是一种重要的数据分析方法,它可以帮助
我们预测和解释变量之间的关系。

通过本文的介绍,相信读者对回
归分析有了更深入的了解,希望能够在实际工作中灵活运用回归分
析方法,为决策提供更可靠的依据。

管理统计学习题参考答案第十一章

管理统计学习题参考答案第十一章

十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。

回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。

相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。

相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。

既可以从描述统计的角度,也可以从推断统计的角度来说明。

所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。

所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。

它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。

只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。

在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。

需要指出的是,相关分析和回归分析只是定量分析的手段。

通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。

因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。

技术经济学第十一章 技术经济预测

技术经济学第十一章 技术经济预测
a,b — 回归系数
(二)由已知样本数据根据最小二乘法原理求出回归 系数。
n
b
xi yi
xi
yi
n xi2 ( xi )2
a yi b xi
n
(三)计算相关系数r,进行相关检验。
r
n xi yi xi yi
n xi2 ( xi )2 n yi2 ( yi )2
1.专家个人判断 主要优点是可以最大限度地发挥专家个人的能力, 但易带片面性。
2.专家会议 互相取长补短,有利于得出较为正确的结论,容 易受到一些心理因素的影响。
3. 德尔菲法 在专家个人判断和专家会议基础上发展起来的一 种专家调查法。
二、德尔菲法
德尔菲法是采用匿名函询的方法,通过一系列 简明的调查征询表向专家们进行调查,并通过有控 制的反馈,取得尽可能一致的意见,对事物的未来 作出预测。
(一)德尔菲法的特点
德尔菲法预测过程实际上是一个由被调查的专 家们集体交流信息的过程。主要特点有:
匿名性:被调查的专家们互不见面,不直接交 流信息,而是通过匿名的方式,专家们可改变自己 的观点,服从言之有理的意见。
反馈性:为了使专家们能进行书面讨论,德尔 菲法采用多轮调查的方式。即在每一轮调查表返回 后,由调查工作组将各位专家提供的信息和资料进 行综合、整理、归纳与分类,再随同下一轮调查表 一起函送给各位专家,使专家们了解预测调查的全 面情况。这样可促使专家们进行再思考,完善或改 变自己的观点,或者作出新的判断。这种不断反馈 有力地促进专家之间的信息交流和书面讨论。德尔 菲法一般要进行三轮到四轮专家意见征询。
Se


M
2

N

11.1 简单线性回归的统计描述

11.1 简单线性回归的统计描述

第十一章 简单线性回归分析一、线性回归描述引 言• 父亲身高与儿子身高存在相关(相关关系) • 可否通过父亲身高预测儿子的身高?• 新生儿的体重与体表面积存在相关• 可否通过体重预测体表面积?(依存关系)第一节 概述• 例11­1 为研究大气污染物一氧化氮(NO)的浓度是否受到汽车流量、 气候状况等因素的影响,选择24个工业水平相近的城市的一个交通点, 统计单位时间过往的汽车数(千辆)、同时在低空的相同高度测定了 该时间段平均气温(℃)、空气湿度(%)、风速(m/s)以及空气 中一氧化氮(NO)的浓度(ppm),数据如表11­1所示。

表11­1 24 个城市交通点空气中NO 浓度监测数据一氧化氮 车流量 气温 气湿 风速 一氧化氮 车流量 气温 气湿 风速 (Y ) ( 1 X ) ( 2 X )( 3 X ) ( 4 X ) (Y ) ( 1 X ) ( 2 X )( 3 X ) ( 4 X ) 0.066 1.300 20.0 80 0.45 0.005 0.948 22.5 69 2.00 0.076 1.444 23.0 57 0.50 0.011 1.440 21.5 79 2.40 0.001 0.786 26.5 64 1.50 0.003 1.084 28.5 59 3.00 0.170 1.652 23.0 84 0.40 0.140 1.844 26.0 73 1.00 0.156 1.756 29.5 72 0.90 0.039 1.116 35.0 92 2.80 0.120 1.754 30.0 76 0.80 0.059 1.656 20.0 83 1.45 0.040 1.200 22.5 69 1.80 0.087 1.536 23.0 57 1.50 0.120 1.500 21.8 77 0.60 0.039 0.960 24.8 67 1.50 0.100 1.200 27.0 58 1.70 0.222 1.784 23.3 83 0.90 0.129 1.476 27.0 65 0.65 0.145 1.496 27.0 65 0.65 0.135 1.820 22.0 83 0.40 0.029 1.060 26.0 58 1.83 0.0991.43628.0682.000.0991.43628.0682.00资料来源:数据选自《卫生统计学》第 5版(方积乾主编)人民卫生出版社研究目的• 通过探讨与一氧化氮(NO)浓度相关的影响因素,为控 制空气污染提供依据。

社会研究方法(第四版)第十一章

社会研究方法(第四版)第十一章
.87 5.02
a 71.87 176 8212 . Y 8212 . .87 X
有了这一回归方程后,我们就可以由预测变量的值 经回归方程计算出标准变量的预测值。如另一名大学生 的身高为170厘米,则其体重的预测值为65.78公斤。
资料审核的方法主要有两种,即逻辑审核与 计算审核。 逻辑审核,即核查资料的内容是否合乎逻辑 和常识,项目之间有无互相矛盾之处,与其 他有关资料进行对照是否有明显出入等等。 计算审核,是针对数字资料进行的审查。要 检查计算有无错误。度量单位有没有错,前 后数字之间有无相互矛盾之处等等。
二、资料的转换
2 定序层次:中位值(中位数)(单选)
其意义为按大小顺序排列,处在一群数据中央位置的数值。 (1)原始资料,求中位值 例如:有9个人,他们的月工资分别如下: 47,42,50,51,92,112,71,83,108 首先作排列处理,从小到大排列 42,47,50,51,71,83,92,108,112 其次求中央位置 Md的位置=(N+1)÷2=(9+1)÷2=5 最后求中位置Md=71
二、单变量推论统计
区间估计 以样本统计量的抽样分布为理论依据,按一 定概率要求,由样本统计量的值来估计总体 参数的值所在的范围,叫做总体参数的区间 估计。 区间估计的实质就是在一定的可信度(置信 度)下,用样本统计值的某个范围来估价总 体的参数值 。范围的大小反映的是这种估计 的精确性问题,而可信度高低反映的是这种 估计的可靠性或和握性问题。
a b
两个变量(预测变量X与标准变量Y)间的回 归分析,是只有一个自变量的线性回归,也叫 一元线性回归。其回归方程为:
Y a bX
其中a,b、对一对特定数据来说是常数:

第十一章多重多元回归分析

第十一章多重多元回归分析

X1 11.5 9 7.9 9.1 11.6 13 11.6 10.7 11.1
X2 95.3 97.7 110.7 89 88 87.7 79.7 119.3 87.7
Y1 26.4 30.8 39.7 35.4 29.3 24.6 25.6 29.9 32.2
Y2 39.2 46.8 39.1 35.3 37 44.8 43.7 38.8 35.6
第十一章 多重多元回归分析
第一节 什么是多重多元回归分析
– 在工厂里研究产品的质量指标,而反映产品质量指标 有好几个,产品的质量指标可作为多个因变量;而 影响产品质量指标的因素也有多个,可作为自变量, 如何从数量上揭示这种相互依赖关系,又如何建立 它们的回归式以及预测预报就是一个多重多元回归 分析问题。
回归方程的检验:
即检验
这里,P=2,m2=m=2,N=9
在 所以,回归方程是显著的。
回归系数的检验 (1)检验
即检验

有无作用,在
之下,
表明

作用显著
(2)再检验
即检验 对
有无作用,在
之下,
表明

作用不显著

在 其中:
之下的剩余阵为:

独立,所以,
例:下表为某农学院育种研究室2002年品种区试的部分资料,其中x1为冬季分 蘖(单位:万),x2为株高(单位:厘米),y1为每穗粒数,y2为千粒重(单 位:克),进行y1、y2关于x1、x2的归归分析。
品种 小偃6号 7576/3矮790 68G(2)8 79190-1 9615_1 9615-13 73(36) 丰产3号 矮丰3号
称为回归方程
将数据写成矩阵的形式:
将n组数据带入到回归模型中:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章分类资料的回归分析――Regression菜单详解(下)(医学统计之星:张文彤)上次更新日期:10.1 Linear过程10.1.1 简单操作入门10.1.1.1 界面详解10.1.1.2 输出结果解释10.1.2 复杂实例操作10.1.2.1 分析实例10.1.2.2 结果解释10.2 Curve Estimation过程10.2.1 界面详解10.2.2 实例操作10.3 Binary Logistic过程10.3.1 界面详解与实例10.3.2 结果解释10.3.3 模型的进一步优化与简单诊断10.3.3.1 模型的进一步优化10.3.3.2 模型的简单诊断在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上...我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器,在流行病学中称王称霸,更有那些1:M的配对卡方,N:M的配对卡方,含失访数据的N:M 配对卡方之类的,简直象恐龙一般,搞得我头都大了。

其实恐龙我还能讲出十多种来,可上面这些东西我现在还没彻底弄明白,好在社会进步迅速,没等这些恐龙完全统制地球,Logistic模型就已经飞速进化到了现代人的阶段,各种各样的Logistic模型不断地在蚕食着恐龙爷爷们的领地,也许还象贪吃的人类一样贪婪的享用着恐龙的身体。

好,这是好事,这里不能讲动物保护,现在我们就远离那些恐龙,来看看现代白领的生活方式。

特别声明:我上面的话并非有贬低流行病学的意思,实际上我一直都在做流行病学,我这样写只是想说明近些年来统计方法的普及速度之快而已。

据我一位学数学的师兄讲,Logistic模型和卡方在原理上是不一样的,在公式推演上也不可能划等号,只是一般来说两者的检验结果会非常接近而已,多数情况下可忽略其不同。

§10.3 Binary Logistic过程所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在0~1之间,回归方程的应变量取值可是在实数集中,直接做会出现0~1范围之外的不可能结果,因此就有人耍小聪明,将率做了一个Logit变换,这样取值区间就变成了整个实数集,作出来的结果就不会有问题了,从而该方法就被叫做了Logistic回归。

随着模型的发展,Logistic家族也变得人丁兴旺起来,除了最早的两分类Logistic外,还有配对Logistic模型,多分类Logistic模型、随机效应的Logistic模型等。

由于SPSS的能力所限,对话框只能完成其中的两分类和多分类模型,下面我们就介绍一下最重要和最基本的两分类模型。

10.3.1 界面详解与实例例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析(本例来自《卫生统计学》第四版第11章)。

∙i:标本序号∙x1:确诊时患者的年龄(岁)∙x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级∙x3:肾细胞癌组织内微血管数(MVC)∙x4:肾癌细胞核组织学分级,由低到高共4级∙x5:肾细胞癌分期,由低到高共4期∙y:肾细胞癌转移情况(有转移y=1; 无转移y=0)。

在菜单上选择Analyze==》Regression==》Binary Logistic...,系统弹出Logistic回归对话框如下:左侧是候选变量框,右上角是应变量框,选入二分类的应变量,下方的Covariates框是用于选入自变量的,只不过这里按国外的习惯被称为了协变量。

两框中间的是BLOCK系列按扭,我在上一课已经讲过了,不再重复。

中下部的>a*b>框是用于选入交互作用的,和其他的对话框不太相同(我也不知道为什么SPSS偏在这里做得不同),下方的Method列表框用于选择变量进入方法,有进入法、前进法和后退法三大类,三类之下又有细分。

最下面的四个按钮比较重要,请大家听我慢慢道来:o Select>>钮:用于限定一个筛选条件,只有满足该条件的记录才会被纳入分析,单击它后对话框会展开让你填入相应的条件。

不过我觉得该功能纯属多余,和专门的Select对话框的功能重复了。

o Categorical钮:如果你的自变量是多分类的(如血型等),你必须要将它用哑变量的方式来分析,那么就要用该按钮将该变量指定为分类变量,如果有必要,可用里面的选择按钮进行详细的定义,如以哪个取值作为基础水平,各水平间比较的方法是什么等。

当然,如果你弄不明白,不改也可以,默认的是以最大取值为基础水平,用Deviance做比较。

o Save钮:将中间结果存储起来供以后分析,共有预测值、影响强度因子和残差三大类。

o Options钮:这一部分非常重要,但又常常被忽视,在这里我们可以对模型作精确定义,还可以选择模型预测情况的描述方式,如Statistics and Plots中的Classification plots就是非常重要的模型预测工具,Correlations of estimates则是重要的模型诊断工具,Iterationhistory可以看到迭代的具体情况,从而得知你的模型是否在迭代时存在病态,下方则可以确定进入和排除的概率标准,这在逐步回归中是非常有用的。

好,根据我们的目的,应变量为Y,而X1~X5为自变量,具体的分析操作如下:1.Analyze==》Regression==》Binary Logistic...2.Dependent框:选入Y3.Covariates框:选入x1~x54.OK钮:单击10.3.2 结果解释Logistic Regression上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析,可见此处因不存在缺失值,26条记录均纳入了分析。

上表为应变量分类情况列表,没什么好解释的。

Block 0: Beginning Block此处已经开始了拟合,Block 0拟合的是只有常数的无效模型,上表为分类预测表,可见在17例观察值为0的记录中,共有17例被预测为0,9例1也都被预测为0,总预测准确率为65.4%,这是不纳入任何解释变量时的预测准确率,相当于比较基线。

上表为Block 0时的变量系数,可见常数的系数值为-0.636。

上表为在Block 0处尚未纳入分析方程的侯选变量,所作的检验表示如果分别将他们纳入方程,则方程的改变是否会有显著意义(根据所用统计量的不同,可能是拟合优度,Deviance值等)。

可见如果将X2系列的哑变量纳入方程,则方程的改变是有显著意义的,X4和X5也是如此,由于Stepwise方法是一个一个的进入变量,下一步将会先纳入P值最小的变量X2,然后再重新计算该表,再做选择。

Block 1: Method = Forward Stepwise (Conditional)此处开始了Block 1的拟合,根据我们的设定,采用的方法为Forward(我们只设定了一个Block,所以后面不会再有Block 2了)。

上表为全局检验,对每一步都作了Step、Block和Model的检验,可见6个检验都是有意义的。

此处为模型概况汇总,可见从STEP1到STEP2,DEVINCE从18降到11,两种决定系数也都有上升。

此处为每一步的预测情况汇总,可见准确率由Block 0的65%上升到了84%,最后达到96%,效果不错,最终只出现了一例错判。

上表为方程中变量检验情况列表,分别给出了Step 1和Step 2的拟合情况。

注意X4的P值略大于0.05,但仍然是可以接受的,因为这里用到的是排除标准(默认为0.1),该变量可以留在方程中。

以Step 2中的X2为例,可见其系数为2.413,OR值为11。

上表为假设将这些变量单独移出方程,则方程的改变有无统计学意义,可见都是有统计学意义的,因此他们应当保留在方程中。

最后这个表格说明的是在每一步中,尚未进入方程的变量如果再进入现有方程,则方程的改变有无统计学意义。

可见在Step 1时,X4还应该引入,而在Step 2时,其它变量是否引入都无关了。

10.3.3 模型的进一步优化与简单诊断10.3.3.1 模型的进一步优化前面我们将X1~X5直接引入了方程,实际上,其中X2、X4、X5这三个自变量为多分类变量,我们并无证据认为它们之间个各等级的OR值是成倍上升的,严格来说,这里应当采用哑变量来分析,即需要用Categorical钮将他们定义为分类变量。

但本次分析不能这样做,原因是这里总例数只有26例,如果引入哑变量模型会使得每个等级的记录数非常少,从而分析结果将极为奇怪,无法正常解释,但为了说明哑变量模型的用法,下面我将演示它是如何做的,毕竟不是每个例子都只有26例。

默认情况下定义分类变量非常容易,做到如上图所示就可以了,此时分析结果中的改变如下:上表为自变量中多分类变量的哑变量取值情况代码表。

左侧为原变量名及取值,右侧为相应的哑变量名及编码情况:以X5为例,表中可见X5=4时,即取值最高的情况被作为了基线水平,这是多分类变量生成哑变量的默认情况。

而X5(1)代表的是X5=1的情况(X5为1时取1,否则取0),X5(2)代表的是X5=2的情况,依此类推。

同时注意到许多等级值有几个记录,显然后面的分析结果不会太好。

相应的,分析结果中也以哑变量在进行分析,如下所示:上表出现了非常有趣的现象:所有的检验P值均远远大于0.05,但是所有的变量均没有被移出方程,这是怎么回事?再看看下面的这个表格吧。

这个表格为方程的似然值改变情况的检验,可见在最后Step 2生成的方程中,无论移出X2还是X4都会引起方程的显著性改变。

也就是说,似然比检验的结果和上面的Walds检验结果冲突,以谁为准?此处应以似然比检验为准,因为它是全局性的检验,且Walds检验本身就不太准,这一点大家记住就行了,实在要弄明白请去查阅相关文献。

请注意:上面的哑变量均是以最高水平为基线水平,这不符合我们的目的,我们希望将最低水平作为基线水平。

比如以肾细胞癌第一期为基线水平,需要这样做只要在Categoriacl框中选中相应的变量,在Reference Category处选择First,再单击Change即可,此时变量旁的标示会做出相应的改变如下:分析结果中也会做出相应的改变,此处略。

相关文档
最新文档