SPSS for logistic回归模型
Spss软件之logistic回归分析

…
n
0
1
Xn01
X n02
…
1
0
X n11
X n12
…
2
0
Xn21
X n22
…
Xk X 10k X 11 k X 12k
X iMk
X n0k X n1 k X n2k
M
0
XnM1
XnM2
…
X nMk
Conditional logistic regression
用Pi表示第i层在一组危险因素作用下发病的概率, 条 件 logistic 模型可表示为
n
L
1
i1 1
M
k exp
j (X itj X i0 j )
t 1
j1
可以看出,条件logistic 回归分析只估计了表示危 险因素作用的βj值,表示匹配组效应的常数项βi0 则被自动地消去了。
Conditional logistic regression
对上述条件似然函数L取自然对数后,用非线性 迭代法求出参数的估计值bi及其标准误Sbi。回归 系数的假设检验及分析方法与非条件logistic回归 完全相同。
c1 1, c0 0,
Xj
1, 暴露
0,非暴露
ORj exp( j )
Logistic regression analysis
0,
ORj
1
无作用
ORj exp( j ), j >0, ORj 1 危险因子
0, ORj 1 保护因子
二、模型的参数估计
在logistic回归模型中,回归系数的估计通常用最大 似然法(MLE)。其基本思想是先建立一个样本 的似然函数,求似然函数达到最大值时参数的取 值,即为参数的极大似然估计值。
SPSS数据分析—配对Logistic回归模型

Logistic回归模型也可以用于配对资料,但是其分析方法和操作方法均与之前介绍的不同,具体表现在以下几个方面1.每个配对组共有同一个回归参数,也就是说协变量在不同配对组中的作用相同2.常数项随着配对组变化而变化,反映了非实验因素在配对组中的作用,但是我们并不关心其大小,因此在拟合时采用条件似然函数代替了一般似然函数,从而在拟合中消去了反映层因素的参数。
SPSS中没有直接拟合配对Logistic回归模型的过程,需要对数据进行一些处理,采用其他方法进行拟合,拟合方法有变量差值拟合和COX模型一、变量差值拟合只适用于1:1配对,通过求出同一对中案例组与对照组多有变量的差值,对差值进行不含常数项的无序多分类Logistic回归模型拟合来达到目的例:收集了一组数据,希望分析服用雌激素与子宫内膜癌之间的关系,除了研究因素之外,还额外收集了两个变量,数据为配对数据,1为病例,0为对照,case为是否患病,也就是因变量采用变量差值进行拟合,首先求出所有变量之间的差值,可以使用计算变量过程,但是该过程每次只能处理一个变量,比较麻烦,我们使用语法编辑器进行程序编写,如下全部选中之后运行,在原数据中就会依次出现新生成的差值变量,接下来,我们对这些差值变量进行无序多分类Logistic回归分析—回归—多项Logistic==================================================二、分层Cox模型该方法最常用来进行生存函数估计,但是由于在拟合方法上和配对Logistic模型一致,因此也可以用来拟合配对Logistic回归模型,它不仅可以拟合1:1配对,还可以拟合1:r,n:m配对,应用范围比较广。
在数据组成上,和变量差值拟合有所不同,需要给每个个案一个虚拟生存时间,默认案例组比对照组生存时间段,具体值不限,两个时间差距大小也不限。
案例发生算为失效事件,对照组为删失,并且对子号作为分层因素,我们还是通过变量差值拟合的案例来进行说明我们将原数据调整如下我们将原来并排排列的案例组和对照组合并为竖列,并且增加虚拟生存时间变量time,案例组为1,对照组为2,接下来按照Cox回归模型进行拟合分析—生存函数—Cox回归。
SPSS做Logistic回归步骤

SPSS 二分类的Logistic 回归的操作和分析方法二分类指的是因变量的数据只有两个值,代表事物的两种类别, 典型的二分类变量如性别、是否患病等。
因变量为二分变量原则上是 无法做回归的,在回归方程中的因变量实质上是概率,而不是变量本 身。
在理解二分类变量以后,我们看看如何做二分类变量的logistic 回归。
1 .打开数据以后,菜单栏上依次点击: analyse --regression --binary logistic ,打开二分回归对话框2 .将因变量和自变量放入格子的列表里,如图所示,上面的是因变 量,下面的是自变量,我们看到这里有三个自变量pre 1courtpre卜 卜EJ Pa ri 即 u sei.P1自中叫5口同”“LvaisTic好 Io ■网 □N W□imsnstcri RfrdddiMNonparaTTietrtc Tests Foi ■白MuH0lalfflpul3&on Deiscriplrve SI 挑助聪LfiOli ncaf - Neuf-31 nuHlpEa ResponseMissing value AnaJisis. EH 必占律蛉的国q 商本 Ublik^s 时小如M Wflftdaw HOI LFl[« Edi! View工陷 nW"" ATiilyrtCam pl«i £aEpl 骷与Opsin al Scaling (CALREGJp..R 蜜GertEralized LinearMatfcIs 卜 Mbosti ModelsRlNafllin&af .曲:AT.r+ci HC] 2^^161;! Sfiiisrcs.tosnpareGeneral LinearMMml 48?B6Ci3强理 G"一四忙—一 3 La,43W8口 AutoioaticUn^r ModjeliFig..M 二1 Linear...国 guive EslirnatiCin...C>ep«n (lferit3 .设置回归方法,这里选择最简单的方法:enter ,它指的是将所有的 变量一次纳入到方程。
spss logistic回归分析

Log
P 1− P
= 1.358 −1.832x1
−
2.140x3
应用Logistic回归分析时的注意事项
1. Logistic回归是乘法模型,这一点,在结果解释时需 要慎重。
对于自变量(X1,X2),OR12=EXP(β1+β2)=OR1×OR2
例:某研究调查胃癌发病的危险因素,得到“有不良饮食习 惯”相对于“无不良饮食习惯”的OR=2.6, “喜吃卤食和盐渍 食物”相对于“不吃卤食和盐渍食物”的OR=2.4。那么根据 Logistic回归,“有不良饮食习惯且喜吃卤食和盐渍食物”相 对于“无不良饮食习惯且不吃卤食和盐渍食物”的 OR=2.6×2.4=6.24,得出此结论时需要考虑:从专业知识上 是否合理?
另法:将X1、X3指定为分类变量。
另法:将X1、X3指定为分类变量。
注:变量编码发生 了变化:0→ 0.5, 1→ -0.5
与前述结果相比,X1与X3的回归系数符号发生了变化,结果解释有 所不同:病情不严重组相对于严重组,OR=4.928(病情不严重的 患者,其治愈的概率是病情严重的患者的4.928倍);新疗法组相对 于旧疗法组, OR=9.707, (接受新疗法的患者,其治愈的概率是 接受旧疗法的患者的9.707倍)。 注:对于二分类变量,可以当作连续变量处理,也可以指定为 分类变量,但要注意结果解释。
2. 通常情况下,自变量为二分类变量时,可以当作连续变 量进入模型(常用0、1或者1、2赋值),也可以通过 “categorical”来指定哑变量。但是,对多分类变量应该 通过“categorical”来指定哑变量,而不宜直接作为连续 变量处理。
多元线性回归分析与Logistic回归分析都是实际工作中 常用的方法,用于影响因素分析时,多元线性回归的因 变量是连续变量,而Logistic回归的因变量是分类变 量;两种方法的自变量可为连续变量或分类变量,当为 分类变量时,均需相应的哑变量(二分类变量例外)。
SPSS专题2回归分析线性回归Logistic回归对数线性模型

(Constant)
410.150
18.817
21.797
.000
l i fe_expectancy_ femal e(year)
-4.896
.284
-.885
-17.252
.000
cl eanwateraccess_ rural (%)
-.237
a. Dependent Vari abl e: Di e before 5 per 1000
Kendall Spearman
Corre la ti ons
Kendal l's tau_b cl eanwateraccess_ rural (%)
cl eanwateracc
ess_rural (%)
Correl ati on Coeffi ci ent
1 . 00 0
Si g. (2-tai l ed)
Corre la ti ons
cl eanwateraccess_ rural (%)
Pearson Correl ati on Si g. (2-tai l ed)
cl eanwateracc e ss_ ru ra l(% )
l i fe_expectancy_ femal e(year)
N
Die before 5 per 1000
5
还有定性变量
下面是对三种收入对高一成绩和高一与初三成绩差的盒 形图
高一成绩与初三成绩之差 高一成绩
110
100
90
80
70
60
50
39 25
40
30
N=
11
27
12
1
2
SPSS数据分析—二分类Logistic回归模型

对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能对连续变量进行分析。
使用线性回归模型可以解决上述的部分问题,但是传统的线性模型默认因变量为连续变量,当因变量为分类变量时,传统线性回归模型的拟合方法会出现问题,因此人们继续发展出了专门针对分类变量的回归模型。
此类模型采用的基本方法是采用变量变换,使其符合传统回归模型的要求。
根据变换的方法不同也就衍生出不同的回归模型,例如采用Logit变换的Logistic回归模型,采用Probit变换的Probit回归模型等,相比之下,Logistic是使用最为广泛的针对分类数据的回归模型。
Logistic回归模型的适用条件1.因变量为二分类变量或是某事件的发生率2.自变量与Logit变换后的因变量呈线性关系3.残差合计为0,且服从二项分布4.各观测值之间独立由于Logistic回归模型的残差项服从二项分布而不是正态分布,因此不能使用最小二乘法进行参数估计,而是要使用最大似然法。
和其他回归分析一样,Logistic回归也放在分析—回归过程下面,下面我们通过一个例子来说明具体操作收集了一组数据,希望通过这些数据分析出低出生体重儿的影响因素,数据如下可见,数据集中变量比较多,且数据类型丰富,因变量为二分类变量Low,有两个水平:0-正常体重,1-低出生体重,我们先做一个最简单的单变量Logistic 回归,只考虑smoke这个因素分析—回归—二元Logistic回归前面我们只引入了一个自变量,可以看到模型的效果并不理想,而且Logistic 回归和传统回归模型一样,也可以引入多个自变量并且可以对自变量进行筛选,尽量引入对因变量存在强影响的自变量,下面我们继续加入自变量并进行筛选。
详解利用SPSS进行Logistic_回归分析
第8 章利用SPSS 进行Logistic 回归分析现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1 表示。
如果我们采用多个因素对0-1 表示的某种现象进行因果关系解释,就可能应用到logistic 回归。
Logistic 回归分为二值logistic 回归和多值logistic 回归两类。
首先用实例讲述二值logistic 回归,然后进一步说明多值logistic 回归。
在阅读这部分内容之前,最好先看看有关SPSS 软件操作技术的教科书。
§8.1 二值logistic 回归8.1.1 数据准备和选项设置我们研究2005 年影响中国各地区城市化水平的经济地理因素。
城市化水平用城镇人口比重表征,影响因素包括人均GDP、第二产业产值比重、第三产业产值比重以及地理位置。
地理位置为名义变量,中国各地区被分别划分到三大地带:东部地带、中部地带和西部地带。
我们用各地区的地带分类代表地理位置。
第一步:整理原始数据。
这些数据不妨录入Excel 中。
数据整理内容包括两个方面:一是对各地区按照三大地带的分类结果赋值,用0、1 表示,二是将城镇人口比重转换逻辑值,变量名称为“城市化”。
以各地区2005 年城镇人口比重的平均值45.41%为临界值,凡是城镇人口比重大于等于45.41%的地区,逻辑值用Yes 表示,否则用No 表示(图8-1-1)图8-1-1 原始数据(Excel 中,局部)将数据拷贝或者导入SPSS 的数据窗口(Data View)中(图8-1-2)。
图8-1-2 中国31 个地区的数据(SPSS 中,局部)第二步:打开“聚类分析”对话框。
沿着主菜单的“Analyze→Regression→Binary Logistic K”的路径(图8-1-3)打开二值Logistic 回归分析选项框(图8-1-4)。
图8-1-3 打开二值Logistic 回归分析对话框的路径对数据进行多次拟合试验,结果表明,像二产比重、三产比重等对城市化水平影响不显著。
logistic回归模型 SPSS例析
Logistic 回归Logistic 回归是多元回归分析的拓展,其因变量不是连续的变量;在logistic 分析中,因变量是分类的变量;logistic 和probit 回归皆为定性回归方程的一种;他们的特点就在于回归因变量的离散型而非连续型。
Logistic 回归又分为binary 和multinominal 两类;1、Logistic 回归原理Logistic 回归Logistic 回归模型描述的是概率P 与协变量12,.......k x x x 之间的关系,考虑到P 的取值在0----1之间,为此要首先把Plogistic 变换为()ln()1pf p p=-,使得它的取值在+∞-∞到之间,然后建立logistic 回归模型P=p(Y=1)()ln()1pf p p=-=011+......k k x x βββ++011011+......+......1k kk kx x x x e p eββββββ++++⇒=+Logistic 回归模型的数据结构观察值个数 取1的观察值个数 取0的观察值个数 协变量12,.......k x x x 的值 N1 r1 n1-ri ……………………… N2 r2 n2-r2 ………………………. . . . . . . . .Nt rt nt-rt ………………………. 根据数据,得到参数0 1....k βββ的似然函数011011011+ (1)+......+......1()()11k ki i ik k k kx x r n r t i x x x x e e eβββββββββ++-=++++∏++使用迭代算法可以求得0 1....k βββ的极大似然估计。
2、含名义数据的logistic 模型婚姻状况是名义数据,分为四种情形:未婚、有配偶、丧偶、离婚;在建立logistic 模型时,定义变量M1、M2、M3,使得(M1=1,M2=0,M3=0)表示未婚; (M1=0,M2=1,M3=0)表示有配偶 (M1=0,M2=0,M3=1)表示丧偶 (M1=-1,M2=-1,M3=-1)表示离婚 也可以将三变量定义为(M1=1,M2=0,M3=0)表示未婚; (M1=0,M2=1,M3=0)表示有配偶 (M1=0,M2=0,M3=1)表示丧偶 (M1=0,M2=0,M3=0)表示离婚 一般来说,只要矩阵[]1111122213331444a b c a b c a b c a b c非奇异,可以定义(M1=a1,M2=b1,M3=c1)表示未婚; (M1=a2,M2=b2,M3=c2)表示有配偶 (M1=a3,M2=b3,M3=c3)表示丧偶 (M1=a4,M2=b4,M3=c4)表示离婚3、含有有序数据的logistic 回归文化程度是有序的定性变量,他有一个顺序,由低到高为文盲、小学、中学、高中、中专;大学。
经典实用的spss课件 十三、logistic回归模型
行参数估计。
3Leabharlann 模型结果解释与可视化解释模型系数的含义,并通过图表展示 模型的效果和变量的影响。
实战应用
案例分析 实战练习
以实际案例为例,演示如何应用Logistic回归模型 进行分类预测和决策支持。
通过实际数据和案例,进行Logistic回归模型的练 习和应用。
总结与展望
总结本次课程内容
回顾本次课程所学的知识和技能,总结关键要点。
展望下一步学习方向
探讨Logistic回归模型的延伸应用和未来发展方向。
经典实用的SPSS课件 十 三、logistic回归模型
SPSS的Logistic回归模型是一种经典且实用的统计分析方法。本课程将深入探 讨Logistic回归模型的应用,以及数据处理和模型建立的相关操作。
什么是Logistic回归模型
Logistic回归模型是一种分类模型,用于预测二分类或多分类的概率。它基于 特征变量与分类变量之间的关系,通过建立回归方程来进行预测和解释。
Logistic回归模型的应用场景
市场营销
预测客户购买某产品的概率, 帮助制定营销策略。
医学研究
预测疾病发生的概率,辅助 诊断和治疗决策。
信用风险评估
预测借款人违约的概率,辅 助风险管理和授信决策。
数据处理
数据收集与清洗
收集相关数据,并进行数据清洗,包括处理缺失值和异常值。
数据预处理
对数据进行预处理,如标准化、离散化等,以满足模型的前提条件。
建立模型
模型建立方法
选择合适的自变量,确定模型的形式,进行参数估 计。
模型评估方法
对模型进行评估,包括拟合优度、模型显著性、变 量重要性等指标。
SPSS操作
SPSS二项Logistic回归综述
b. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.
从上表中可知,-2倍的对上似然函数值较高;Cox & Snell R2和 Nagelkerke R2的值均接近0,说明模型的拟合优度较低。
➢ 基本操作:
选择分析(analyze)--回归(regression)--二元Logistic回归
被解释变量的选择
解释变量的选择
选择解释变量的筛选策略
条件变量的选择,只有满足条件变量 值的样本才参与回归分析
选择解释变量的筛选策略 (1)进入(enter):表示解释 变量全部强行进入模型; (2)向前:条件(forward: conditional)表示向前筛选变量 且变量进入模型的依据是比分检 验统计量,剔除出模型的依据是 条件参数估计原则下的似然率卡 方(首选选择使变化量变化最小 的解释变量剔除出模型); (3)向前:LR(forward: LR) 表示向前筛选变量且变量进入模 型的依据是比分检验统计量,剔 除出模型的依据是极大似然估计 原则下的似然比卡方; (4)向后:条件(backward: conditional)表示向后筛选变量 且变量剔除出模型的依据是条件 参数估计原则下的似然比卡方; (5)向后:LR( backward : LR) 表示向后筛选变量且变量剔除出 模型的依据是极大似然估计原则 下的似然比卡方; (6)向后:Wald( backward : Wald)表示向后筛选变量且变量 剔除出模型的依据是wald统计量;
➢上表中step行是本步与前一步相比的似然比卡方;Block行是本块与前一块相 比的似然比卡方;Model行是本模型与前一模型相比的似然比卡方。 ➢本例中没有设置解释变量块且解释变量是一次性强制进入,所以三行结果相同。 ➢模型显著性检验的零假设:各回归系数同时为0,解释变量全体与logit P的线 性关系不显著;备择假设:·······。如果显著性水平为0.05,因为概率P值0.001 小于0.05,应拒绝零假设,认为‘所有回归系数不同时为0,解释变量全体与 Logit P之间的关系显著,采用该模型是合理的’。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chi-square 1.624 1.624 1.624
df 3 3 3
Si g. .654 .654 .654
结果分析
模型的总的检 验情况
❖ 变量筛选方法用的是强行引入法或全回归法。此表 中显示共进行了1次,选入了3个变量。
简单分析实例
结果分析
Model Summary
模型摘要表
Step 1
-2 Log Cox & Snell
哑变量设置
例2 Hosmer 和Lemeshow于1989年研究了低出生体重 婴儿的影响因素,结果变量为是否娩出低出生体重 儿(变量名为LOW,1表示低出生体重儿,0表示非 低出生体重儿),考虑的自变量有产妇妊娠前体重、 产妇年龄、种族、是否吸烟、早产次数、是否患高 血压等。(数据文件见:logistic_step.sav。)
哑变量设置
❖ 哑变量设置应该注意的问题
参照水平最好要有实际意义,不推荐使用其他作为参照; 参照水平组要有一定的频数作保证,应不少于30或50例; 对有序自变量的分析:
从专业出发确定; 分别以哑变量和连续性变量的方式引入模型进行比较 后确定。
逐步回归
❖ 6 种筛选自变量的方法
Forward:Conditional (最可靠) Forward:LR Forward:Wald (应当慎用) Backward: Conditional (最可靠) Backward:LR Backward:Wald(应当慎用)
未患 病
患病
Overall Percentage
a. The cut value is .500
是否 患冠心 病
未患 病
患病
5
3
2
4
Percentage Correct 62.5 66.7 64.3
❖ 此表显示每一步模型对因变量的分类预测情况,总的预
测准确率为50%。
简单分析实例
结果分析
Variables in the Equation
.184
Wal d 6.391
30.370 6.683 4.270
33.224
df 1 1 1 1
1
Sctep lwt
3
ptl
-.015
.007
5.584
1
.728
.327
4.961
1
ht
1.789
.694
6.639
1
Constant
.893
.829
1.158
1
a. Variable(s) entered on step 1: ptl.
1
.038
race(2)
.329
.534
.380
1
.537
sm oke
.927
.399
5.414
1
.020
ptl
.552
.345
2.562
1
.109
ht
1.763
.689
6.541
1
.011
ui
.649
.468
1.925
1
.165
ftv
.032
.171
.035
1
.851
Constant
1.143
1.087
Si g. .013 .023 .008 .002
Exp(B) 3.882 2.395 1.097 .004
❖ 此表输出模型中的各自变量的偏回归系数及其标准 误、Wald 2、自由度、P 值、OR值(即exp(B))。
哑变量设置
在回归模型中,回归系数b表示其他自变量不变,x 每改变一个单位时,所预测的y的平均变化量,当x 为连续性变量时,这样解释没有问题,二分类变量 由于只存在两个类别间的比较,也可以对系数得到 很好的解释。但是当x为多分类变量时,仅拟合一 个回归系数就不太合适了,此时需要使用哑变量 (dummy variable)方式对模型进行定义。
❖ 此表为选入模型中的变量及其检验情况表。因刚开始时
自变量还没有选入,只有常数。
Step 0
Variables not in the Equation
Va ri a b le s
sex
ecg
age
Overall Statistics
Score 1.167 .219 .871 1.523
未选入模型 中的变量
df 1 1 1 3
Si g. .280 .640 .351 .677
❖ 此表为未选入模型中的变量及其检验情况表。通过P值
可以看出下一步将选入哪一个变量(首先选P值最小的变量)。
简单分析实例
Omnibus Tests of Model Coefficients
Step 1
Step Bl ock M od e l
likelihood R Square
17.497a
.110
Na ge l ke rke R Square
.147
a. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.
T o ta l
14
100.0
Unselected Cases
0
.0
T o ta l
14
100.0
a. If weight is in effect, see classification table for the total number of cases.
❖ 此表为个体处理总结表,包括选择多少例参加分析 多少例确失等。
❖ 本表输出当前模型的-2log(似然值)和两个伪决定 系数,但对于logistic回归而言,通常看见的伪决定系 数不像线性回归模型中的决定系数那么大。
简单分析实例
结果分析
Classification Tablea
分类表
Pred i cte d
Observed Step 1 是 否 患 冠 心 病
1.104
1
.293
a. Variable(s) entered on step 1: age, lwt, race, smoke, ptl, ht, ui, ftv.28 1.736 5.831 1.913 1.033 3.135
❖ 白人低出生体重的风险较低,而黑人风险较高。
❖ 给出了模型拟合过程中每一步的-2log(L)及两 个伪决定系数。
逐步回归
结果分析
Variables in the Equation
Satep 1 Sbtep 2
ptl Constant ptl ht Constant
B .802 -.964 .823 1.272
-1.062
S.E. .317 .175 .318 .616
B
S.E.
Wal d
Satep sex
1
ecg
1.356 .873
.546
6.162
.384
5.162
age
.093
.035
7.000
Constant
-5.642
1.806
9.757
a. Variable(s) entered on step 1: sex, ecg, age.
df 1 1 1 1
选入模型的变 量表
.346
.985 2.071 5.986 2.441
逐步回归
结果分析
Step 1
Variables not in the Equation
Va ri a b le s
age
l wt
race
race(1)
race(2)
sm oke
ht
ui
ftv
Overall Statistics
Score 3.149 3.340 5.359 5.028 2.056 3.164 4.722 2.162 .753
22.858
df 1 1 2 1 1 1 1 1 1 8
Si g. .076 .068 .069 .025 .152 .075 .030 .141 .385 .004
❖ 输出了尚不在模型中的自变量是否能被引入的Score 检验结果,这里只给出第一步的结果。
b. Variable(s) entered on step 2: ht.
c. Variable(s) entered on step 3: lwt.
Si g. .011 .000 .010 .039
.000
.018 .026 .010 .282
Exp(B) 2.230 .381 2.277 3.569
❖ logistic回归模型:
log it(P) 0 1 X1 p X p
P exp(0 1 X1 p X p ) 1 exp(0 1 X1 p X p )
1 P
1
1 exp(0 1 X1 p X p )
模型简介-适用条件
反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。 ❖ logistic回归模型应该使用最大似然法来解决方程的估计 和检验问题,不应当使用以前的最小二乘法进行参数估计。
预测分类表
Pred i cte d
Observed Step 0 是 否 患 冠 心 病
未患 病 患病
Overall Percentage
a. Constant is included in the model.
b. The cut value is .500