SPSS-配对条件_Logistic_回归分析

SPSS配对调查资料的条件 Logistic 回归分析（1:1或1:n）

1. 1:1 病例对照研究的基本概念

在管理工作中，我们也经常要开展对照调查。例如为什么有的人患了胃癌，有的人却不会患胃癌？如果在同一居住地选取同性别、年龄相差仅±2 岁的健康人作对照调查，调查他们与患胃癌有关的各种影响因素，这就是医学上很常用的所谓“1:1 病例对照研究”。病例对照研究资料常用条件Logistic 回归分析。条件Logistic 回归模型（conditional logistic regression model,CLRM)，下称CLRM 模型。

2. 条件Logistic 回归模型的一个实例

某地在肿瘤防治健康教育、社区干预工作中做了一项调查，内容是三种生活因素与胃癌发病的关系。调查的三种生活因素取值见表 11-6。

请拟合条件Logistic 回归模型，说明胃癌发病的主要危险因素。

表 11-6 三种生活因素与胃癌发病关系的取值

------------------------------------------------------------------------------------------ 变量名取值范围

------------------------------------------------------------------------------------------ X1 (不良生活习惯) 0，1，2，3，4 表示程度（0 表示无，4 表示很多）

X2 (喜吃卤食和盐腌食物) 0，1，2，3，4 表示程度（0 表示不吃，4 表示喜欢吃、吃很多） X3 (精神状况) 0 表示差，1 表示好

------------------------------------------------------------------------------------------

表 11-7 50 对胃癌病例（S=1）与对照（S=0）三种生活习惯调查结果

------------------------------------------------------------------------------------------ 病例对照病例对照

-----------------------------------------------------------------------------

No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3

------------------------------------------------------------------------------------------

1 1

2 4 0 1 0

3 1 0 26 1 2 2 0 26 0 1 1 0

2 1

3 2 1 2 0 0 1 0 27 1 2 0 1 27 0 0 2 1

3 1 3 0 0 3 0 2 0 1 28 1 1 1 1 28 0 3 0 1

4 1 3 0 0 4 0 2 0 1 29 1 2 0 1 29 0 4 0 0

5 1 3 0 1 5 0 0 0 0 30 1 3 1 0 30 0 0 2 1

6 1 2 2 0 6 0 0 1 0 31 1 1 0 1 31 0 0 0 0

7 1 3 1 0 7 0 2 1 0 32 1 4 2 1 32 0 1 0 1

8 1 3 0 0 8 0 2 0 0 33 1 4 0 1 33 0 2 0 1

9 1 2 2 0 9 0 1 0 1 34 1 2 0 1 34 0 0 0 1

10 1 1 0 0 10 0 2 0 0 35 1 1 2 0 35 0 2 0 1

11 1 3 0 0 11 0 0 1 1 36 1 2 0 0 36 0 2 0 1

12 1 3 4 0 12 0 3 2 0 37 1 0 1 1 37 0 1 1 0

13 1 1 1 1 13 0 2 0 0 38 1 0 0 1 38 0 4 0 0

14 1 2 2 1 14 0 0 2 1 39 1 3 0 1 39 0 0 1 0

15 1 2 3 0 15 0 2 0 0 40 1 2 0 1 40 0 3 0 1

16 1 2 4 1 16 0 0 0 1 41 1 2 0 0 41 0 1 0 1

17 1 1 1 0 17 0 0 1 1 42 1 3 0 1 42 0 0 0 1

18 1 1 3 1 18 0 0 0 1 43 1 2 1 1 43 0 0 0 0

19 1 3 4 1 19 0 2 0 0 44 1 2 0 1 44 0 1 0 0

20 1 0 2 0 20 0 0 0 0 45 1 1 1 1 45 0 0 0 1

21 1 3 2 1 21 0 3 1 0 46 1 0 1 1 46 0 0 0 0

22 1 1 0 0 22 0 2 0 1 47 1 2 1 0 47 0 0 0 0

23 1 3 0 0 23 0 2 2 0 48 1 2 0 1 48 0 1 1 0

24 1 1 1 1 24 0 0 1 1 49 1 1 2 1 49 0 0 0 1

25 1 1 2 0 25 0 2 0 0 50 1 2 0 1 50 0 0 3 1

------------------------------------------------------------------------------------------- 3. 条件Logistic 回归模型的拟合原理与方法

本例以 SPSS 软件包来拟合 CLRM 模型。SPSS 虽有一个 LOGISTIC REGRESSION 命令，却无法拟合条件 Logistic 模型(CLRM)，但有拟合 Cox 回归模型的固有命令（COXREG）。回顾一下Cox 回归模型的公式：

h (t,X) = h0(t) exp (X1 β1 + X2 β2 + ...+ Xp βp)

将两侧同时取对数可得：

LN(h(t,X)) = LN (h0(t)) + (X1 β1 + X2 β2 + ...+ Xp βp)

如果是含有分层变量的Cox 回归模型, 则公式变为：

LN(h(t,X)) = LN (h0i(t)) + (X1 β1 + X2 β2 + ...+ Xp βp)

各层的基线风险函数h0i(t) 可以完全无关，而协变量的系数则在所有层中保持不变。作为半参数的方法，Cox 模型在拟合时并不估计基线风险函数h0i(t)，只估计各协变量的系数值β。这则与条件 Logistic 回归模型不关心αi 的大小，只解出系数值β的思路一致。而且两者都以最大似然法（LR）来拟合。把配对因素作为分层因素，即可消除配对因素的作用，因此可用分层变量控制法的原理，来拟合条件 Logistic 回归模型。

在使用SPSS的COXREG 命令拟合条件 Logistic 模型时（Analyze → Survival → Cox Regression），要回答下列5个对话框：

① Time: 给每行记录一个虚拟的生存时间（Time)，一般默认“病例”生存时间短（例如

为“1”），“对照”生存时间长（例如为“2”）。只要“对照”的生存时间（例如“2”～“100”）长于“病例”即可。因为SPSS 会把在最短的完全数据的生存时间之前的截尾数据（Censored）全部去掉而不参加分析。输出分层状态时，Event=“1”；Censored=“2”。

② Status 与 Define Event: 选入虚拟生存状态变量。定义事件时“病例”全为“1”（Single value），为完全数据；“对照”全“0”，为截尾数据。此值“1”表示事件已发生，本例即“病例”。

③ Covariates: 选入要进行分析的协变量（即自变量 X1，X2，X3）。

④ Method: 用 FSTEP（LR），即似然比法。

⑤ Strata: 录入配对的对子号，“1”指第1 个对子（含“病例”为“1”一行与“对照”者为“0”一行）；“2”指第2 个对子。本例指变量“No”。

4. 拟合条件Logistic 回归模型所用程序文件

所用程序文件名为 CondLogiRegre.sps。

*Conditional Logistic Regression; filename: CondLogiRegre.sps.

*---------------------------------------------------------------.

*Fang Ji-Qian: Med. Stat. and Computer Experiment, P.492:.

* Using COX-Regression to fit Conditional Logistic Regression:.

DATA LIST FREE /No Status Time x1 x2 x3.

BEGIN DATA.

1 1 1

2 4 0 1 0 2

3 1 0 2 1 1 3 2 1 2 0 2 0 1 0

3 1 1 3 0 0 3 0 2 2 0 1

4 1 1 3 0 0 4 0 2 2 0 1

5 1 1 3 0 1 5 0 2 0 0 0

6 1 1 2 2 0 6 0 2 0 1 0

7 1 1 3 1 0 7 0 2 2 1 0 8 1 1 3 0 0 8 0 2 2 0 0

9 1 1 2 2 0 9 0 2 1 0 1 10 1 1 1 0 0 10 0 2 2 0 0

11 1 1 3 0 0 11 0 2 0 1 1 12 1 1 3 4 0 12 0 2 3 2 0

13 1 1 1 1 1 13 0 2 2 0 0 14 1 1 2 2 1 14 0 2 0 2 1

15 1 1 2 3 0 15 0 2 2 0 0 16 1 1 2 4 1 16 0 2 0 0 1

17 1 1 1 1 0 17 0 2 0 1 1 18 1 1 1 3 1 18 0 2 0 0 1

19 1 1 3 4 1 19 0 2 2 0 0 20 1 1 0 2 0 20 0 2 0 0 0

21 1 1 3 2 1 21 0 2 3 1 0 22 1 1 1 0 0 22 0 2 2 0 1

23 1 1 3 0 0 23 0 2 2 2 0 24 1 1 1 1 1 24 0 2 0 1 1

25 1 1 1 2 0 25 0 2 2 0 0 26 1 1 2 2 0 26 0 2 1 1 0

27 1 1 2 0 1 27 0 2 0 2 1 28 1 1 1 1 1 28 0 2 3 0 1

29 1 1 2 0 1 29 0 2 4 0 0 30 1 1 3 1 0 30 0 2 0 2 1

31 1 1 1 0 1 31 0 2 0 0 0 32 1 1 4 2 1 32 0 2 1 0 1

33 1 1 4 0 1 33 0 2 2 0 1 34 1 1 2 0 1 34 0 2 0 0 1

35 1 1 1 2 0 35 0 2 2 0 1 36 1 1 2 0 0 36 0 2 2 0 1

37 1 1 0 1 1 37 0 2 1 1 0 38 1 1 0 0 1 38 0 2 4 0 0

39 1 1 3 0 1 39 0 2 0 1 0 40 1 1 2 0 1 40 0 2 3 0 1

41 1 1 2 0 0 41 0 2 1 0 1 42 1 1 3 0 1 42 0 2 0 0 1

43 1 1 2 1 1 43 0 2 0 0 0 44 1 1 2 0 1 44 0 2 1 0 0

45 1 1 1 1 1 45 0 2 0 0 1 46 1 1 0 1 1 46 0 2 0 0 0

47 1 1 2 1 0 47 0 2 0 0 0 48 1 1 2 0 1 48 0 2 1 1 0

49 1 1 1 2 1 49 0 2 0 0 1 50 1 1 2 0 1 50 0 2 0 3 1

END DATA.

LIST VARIABLES=ALL /FORMAT=NUMBERED /CASES=FROM 1 TO 50.

* When programing:.

* "Status": "Case"=1; "Control"=0.

* "Time": "Case"=1; "Control"=2, that is,

the survival time of "Control" should longer than "Case".

* "Define Event": Single value: "1" means "Case".

* "Covariate": Inpute the independence variables.

* "Method": ENTER, FSTEP, BSTEP, etc.

* "Strata": The No. of per pairs, that is,No.

COXREG Time /STATUS=Status(1)

/STRATA=No

/METHOD=FSTEP(LR) X1 X2 X3

/PRINT=DEFAULT CI(95)

/CRITERIA=PIN(0.05) POUT(0.1) ITERATE(20).

*--------------------------------------------------------------------------.

5. 拟合条件Logistic 回归模型的主要运算结果

运行程序文件 CondLogiRegre.sps 可得到下列主要结果：

Variables in the Equation

B SE Wald df Sig. Exp(B) 95.0% CI for Exp(B)

Lower Upper

Step 1 X1 0.659 0.220 8.973 1 0.003 1.932 1.256 2.973

Step 2 X1 0.785 0.257 9.351 1 0.002 2.193 1.326 3.629

X2 0.814 0.307 7.042 1 0.008 2.257 1.237 4.118

回归系数 B 表示病例与对照变量值之差与患病优势的关系，即 Exp(B) 表示病例与对照暴露水平相差 1 个单位时患病的比数比（Odd Ratio, OR）。从表中可见，X3（精神状况）未被引入回归模型，只引入影响因素 X1 与 X2,说明精神状况的好坏与胃癌发病无显著相关，而 X1 (不良生活习惯) 和X2 (喜吃卤食和盐腌食物)与患胃癌有较密切的关系。

注意：X1 与 X2 的回归系数 B 都是正值（前者为0.785,后者为0.814），OR 值都大于 1（前者 Exp(B) = OR = 2.193,后者 Exp(B) = OR = 2.257），而且都有统计学显著性（前者 Sig.= P = 0.002,后者 P = 0.008）。说明不良生活习惯、喜吃卤食和盐腌食物会增加胃癌发病机会；而且不良生活习惯越多、卤食和盐腌食物吃得越多，胃癌发病的机会就越大。

Logistic回归分析简介

Logistic回归分析简介 Logistic回归：实际上属于判别分析，因拥有很差的判别效率而不常用。1．应用范围： ①适用于流行病学资料的危险因素分析 ②实验室中药物的剂量-反应关系 ③临床试验评价 ④疾病的预后因素分析 2．Logistic回归的分类： ①按因变量的资料类型分：二分类多分类其中二分较为常用 ②按研究方法分：条件Logistic回归非条件Logistic回归两者针对的资料类型不一样，后者针对成组研究，前者针对配对或配伍研究。 3．Logistic回归的应用条件是： ①独立性。各观测对象间是相互独立的； ②LogitP与自变量是线性关系； ③样本量。经验值是病例对照各50例以上或为自变量的5-10倍（以10倍为宜），不过随着统计技术和软件的发展，样本量较小或不能进行似然

估计的情况下可采用精确logistic回归分析，此时要求分析变量不能太多，且变量分类不能太多； ④当队列资料进行logistic回归分析时，观察时间应该相同，否则需考虑观察时间的影响（建议用Poisson回归）。 4．拟和logistic回归方程的步骤： ①对每一个变量进行量化，并进行单因素分析； ②数据的离散化，对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散，或是按照四分、五分位数法来确定等级，也可采用聚类方法将计量资料聚为二类或多类，变为离散变量。 ③对性质相近的一些自变量进行部分多因素分析，并探讨各自变量（等级变量，数值变量）纳入模型时的适宜尺度，及对自变量进行必要的变量变换； ④在单变量分析和相关自变量分析的基础上，对P≤α（常取0.2，0.15或 0.3）的变量，以及专业上认为重要的变量进行多因素的逐步筛选；模型程序每拟合一个模型将给出多个指标值，供用户判断模型优劣和筛选变量。可以采用双向筛选技术：a进入变量的筛选用score统计量或G统计量或LRS(似然比统计量)，用户确定P值临界值如：0.05、0.1或0.2，选择统计量显著且最大的变量进入模型；b剔除变量的选择用Z统计量(Wald 统计量)，用户确定其P值显著性水平，当变量不显者，从模型中予以剔除。这样，选入和剔除反复循环，直至无变量选入，也无变量删除为止，选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定，一般

实验7相关及回归分析SPSS应用

实验7 相关与回归分析 7.1实验目的熟练掌握一元线性回归分析的SPSS应用技能，掌握一元非线性回归分析的SPSS应用技能，对实验结果做出解释。 7.2相关知识（略） 7.3实验内容 7.3.1一元线性回归分析的SPSS实验 7.3.2一元非线性回归分析的SPSS实验 7.4实验要求 7.4.1准备实验数据 1.线性回归分析数据（The Wall 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》 Street Journal Almanac 1999）上。航班正点到达的比率和每10万名乘客投诉的次数的数据，见表7-1所示。表7-1 美国航空公司航空正点率与乘客投诉次数资料 2.非线性回归分析数据 1992～2013年某国保费收入与国内生产总值的数据，试研究保费收入与国内生产

总值的关系的数据，见表7-2所示。表7-2 1992～2013年某国保费收入与国内生产总值数据单位：万元 7.4.2完成一元线性回归分析的SPSS 实验，对实验结果作出简要分析。 7.4.3完成一元非线性回归分析的SPSS 实验，对实验结果作出简要分析。 7.5实验步骤 7.5.1 完成一元线性回归分析的SPSS 实验步骤 1.运用SPSS 绘制散点图散点图。第一步：在excel 中输入数据图7-1 第二步：将excel 数据导入spss 单击打开数据文档按钮（或选择菜单文件→打开）→选择文件航空公司航班

正点率与投诉率.xls 图7-2 第三步：选择菜单图形→旧对话框→散点/点状，在散点图/点图对话框中，选择简单分布按钮图7-3 第三步：在简单散点图对话框中，将候选变量框中的投诉率添加到Y轴，航班正点率添加到X轴，点击确定：

SPSS—二元Logistic回归结果分析报告

SPSS—二元Logistic回归结果分析 2011-12-02 16:48 身心疲惫，睡意连连，头不断往下掉，拿出耳机，听下歌曲，缓解我这严重的睡意吧！今天来分析二元Logistic回归的结果分析结果如下： 1：在“案例处理汇总”中可以看出：选定的案例489个，未选定的案例361个，这个结果是根据设定的validate = 1得到的，在“因变量编码”中可以看出“违约”的两种结果“是”或者“否” 分别用值“1“和“0”代替，在“分类变量编码”中教育水平分为5类，如果选中“为完成高中，高中，大专，大学等，其中的任何一个，那么就取值为 1，未选中的为0，如果四个都未被选中，那么就是”研究生“ 频率分别代表了处在某个教育水平的个数，总和应该为489个

1：在“分类表”中可以看出：预测有360个是“否”（未违约）有129个是“是”（违约） 2：在“方程中的变量”表中可以看出：最初是对“常数项”记性赋值，B为 -1.026，标准误差为：0.103 那么wald =( B/S.E)2=(-1.026/0.103)2 = 99.2248, 跟表中的“100.029几乎接近，是因为我对数据进行的向下舍入的关系，所以数据会稍微偏小， B和Exp(B) 是对数关系，将B进行对数抓换后，可以得到：Exp(B) = e^-1.026 = 0.358, 其中自由度为1， sig为0.000，非常显著

1：从“不在方程中的变量”可以看出，最初模型，只有“常数项”被纳入了模型，其它变量都不在最初模型表中分别给出了，得分，df , Sig三个值, 而其中得分（Score)计算公式如下：（公式中（Xi- Xˉ) 少了一个平方）下面来举例说明这个计算过程：(“年龄”自变量的得分为例）从“分类表”中可以看出：有129人违约，违约记为“1”则违约总和为 129，选定案例总和为489 那么： yˉ = 129/489 = 0.16 xˉ = 16951 / 489 = 34.2 所以：∑(Xi-xˉ)2 = 30074.9979

logistic回归分析案例

1. 数据制备（栅格数据）（1）宝塔区基底图层.tif （2）居民点扩增.tif 、坡度.tif 、坡向.tif 等要素数据。在 environment settings ------ p rocessing extent ------ snap raster （选中基底图层），保证栅格数据像元无偏移，且行列的数量一致。化:Raster to ASCII Inyul r aiLtvl- 匚” k 『号樹 ± 如葡让也\1非*订kilt :f 10. 2 'iiStati EeiT-SlaT 14t L J. KT 2.通过CLUE-S 莫型中的fileconvert 模块，获得logistic 回归分析的数据集。（1）将上一步骤中的因变量 y 和影响因素x 的.txt 文档后缀改为.asc 格式，并将文件放在CLUE-S 模型所在的文件夹中。（2）打开FileCo nvert V2软件，按下图勾选，填写"file list "内容，点击start con version ， 3 田F1 曰 It:. （3）栅格数据转为 ASCII 码，生成txt 文档。匚onversion Tools Ejicel From GPS From KML From Raster 气 Raster to ASCII y Raster to Fist 声.Raster to Point

生成stat .txt文档。祥Fi le 荃 flFfijie? I1id J?1Ji w ■■ 1 ? 9><4 P t414 Tl ?J19 12词 ■M*￡LD|i4I# ■ Q电兀列心￡i k1lf\ 15?1 *■4JE RI7 <1- I 4 話M3 IS r擠uSstalB-^aG 齬￡淨珀bCMir 二i缶 pad... ■ 枝jfcsurrT^cM.a^t 炉 MBlOrtTIdH■: 护 xVcomr-.iic / rll asc 播Tann砂￡]T (2)logistic回归分析按图设置参数因变量、自变量；由于x3属于分类变量，点击分类按钮，按图设置参数。 >M!L4M|昨T祜lt?M? 曲唱-Hl'F1 wB-j' MtF M|T ffl￥ g： ZTStiRiiri SHilfi VTU '_'■ rt 舖C r TI薔色Z4d* ■i aa ■；? 1 iTdlfAflWVK4Wt4「利 E 呻■■} 1■ IdfcWM^U.一尉仇■臂H xlAftL lAMDf Jfit 1Q1?7r -iwns ■B-13磁MT 13 J 工 '-恫fl T l￡j v-IIHH M4Q J0W PW回沐神to 型 rwa： wm 1 H teiiy- 卩厲 4a13 4 ■ira 401?wa 70i-221 ?d'131fefl 加ifUnm 片nu t013*Ozmwkt他 w p1W址?囲血|淞：幽 11013 1 Qm Sft?t 121JJ V s? 014*」； 11 H?iKa； H013 5 *旳 ti a IM■ KK MS V；941 ti Q144T f 7W filwvjcfic OH