第18章 Logistic回归案例辨析及参考答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第18章 Logistic 回归 案例辨析及参考答案
案例18-1 一项前瞻性队列研究中,欲研究某疾病与甲、乙两因素的关系,数据见教材表18-13。
教材表18-13 某前瞻性队列研究中疾病与甲、乙两因素的关系 乙 因 素 甲 因 素 发 病 未发病 合计
(2X )
(1X ) (Y =1) (Y =0) 暴露(2X =1)
暴露(1X =1)
150
250
400
未暴露(1X =0) 250 150 400 未暴露(2X =0)
暴露(1X =1)
400
150
550
未暴露(1X =0)
200
450
650
疾病发病与否是因变量Y (发病赋值1,未发病赋值0),甲、乙两个因素为两个自变量1X 和2X ,采用logistic 回归研究疾病与甲、乙两个因素的关系。
(1) 单变量模型 分析结果提示:疾病与甲因素有联系(回归系数Wald 检验2
χ=44.766,P <0.001);疾病与乙因素没有联系(回归系数Wald 检验2
χ=0.000,P =1.000)。
(2)主效应模型 将甲、乙两个因素同时纳入模型,拟合结果见教材表18-14。提示疾病与甲因素有联系,与乙因素的联系仍然没有统计学意义。与单变量拟合结果比较,纳入乙因素后,甲因素的优势比只有微小改变。研究者据此得出结论:疾病与甲因素有联系,疾病与乙因素没有联系,乙因素也不是混杂因素。
教材表18-14 按照模型22110it log X X βββπ++=拟合结果
变 量 b SE Wald df P
exp(b ) 1
X 0.607 0.091 44.838 1 <0.001 1.835 2X -0.026 0.092 0.077 1 0.781 0.975 Constant
-0.278
0.072
15.076
1
<0.001
0.757
(3)有交互效应的模型 根据专业知识判断,甲、乙两因素间可能存在交互效应,选用有交互效应的全模型,拟合结果见教材表18-15。结果提示:疾病与甲因素有联系,疾病
与乙因素也有联系,甲、乙两因素间还有交互效应。甲、乙因素及其交互项的标准化回归系数分别为1b '=0.229,2
b '=0.177,3b '=0.546,因此,交互效应对疾病发生与否的影响程度
最强。
教材表18-15 按照模型1322110logit X *X X X ββββπ+++=拟合结果 变 量
b SE Wald df P
exp(b ) 1X
1.792 0.128 195.889 1 <0.001 6.000 2X 1.322 0.134 97.661 1 <0.001 3.750 21X *X
-2.813 0.194 209.831 1 <0.001 0.060 Constant
-0.811
0.085
91.053
1
<0.001
0.444
上述3种拟合模型,得出不完全一致的结论,你认为何者更合理?
案例辨析 三种做法所得结果不完全一致,这是很正常的,不能根据研究者的主观愿望去选择结果,应根据资料的实际情况、统计分析的结果及其与实际情况的吻合程度来决定应选取哪一种统计分析方法。
正确做法 欲研究某疾病与甲、乙两因素的关系,可以采用Logistic 回归研究疾病的发生与否与甲、乙两个因素的关系。单变量模型分别将甲因素与乙因素引入Logistic 回归模型,由于可能存在其他混杂因素,单变量模型分析的结果并不可靠。将甲、乙两个因素同时纳入模型,若根据专业知识判断,甲、乙两因素间不存在交互效应,则建立主效应模型;若甲、乙两因素间可能存在交互效应,则应选用有交互效应的全模型,但不宜用标准化回归系数比较主效应与交互效应对疾病发生的影响程度,因为交互效应除依赖于乘积项的系数外,还依赖于两个变量的乘积。
案例18-2 某感冒颗粒治疗小儿急性上呼吸道感染风热证的三期临床试验研究中,选择东中西5家三级甲等医院儿科为试验中心,根据试验方案,PP 数据集样本共428例。因变量为疗效(有效赋值1,无效赋值0),影响疗效的可能因素有药物(服用某感冒颗粒赋值1X =1,服用对照药赋值1X =0)以及5个临床试验中心(2X ),原始记录数据经汇总整理,试验组322例,对照组106例,5个分中心治疗病例数及治疗结局见教材表18-16。
教材表18-16 某感冒颗粒多中心临床治疗试验汇总结果
分中心 试验组
对照组
编号 有效 无效 有效 无效 1 35 27 10 10 2 47 18 15 7 3 63 21 18 9 4 26 22 9 6 5
46
17
14
8
药物上市前多中心临床试验中,特别关注中心变量与药物间是否存在交互效应,结合教材表18-16中数据,5个分中心变量为无序分类变量,按照哑变量设置方法,共设置4个哑变量1D ,2D ,3D ,4D ,以中心1为参照。运用SPSS 软件计算时,将药物变量、中心变量以及中心与药物交互项均纳入SPSS 软件Logistic 回归界面的变量框,采用多种逐步法自动筛选变量并建立Logistic 回归模型,回归分析最后一步结果见教材表18-17。研究者认为:药物变量、中心变量与药物变量的交互项均被剔除,模型最后只保留了中心变量。所以,交互效应不存在。
教材表18-17 SPSS 软件自动逐步回归最后一步的分析结果
b
S.E. Wald df P
exp(b ) D
- - 11.688 4 0.020 - 1D
0.713 0.325 4.818 1 0.028 2.039 2D 0.798 0.308 6.700 1 0.010 2.220 3D
0.027 0.337 0.007 1 0.935 1.028 4D
0.680 0.325 4.362 1 0.037 1.973 试问,上述建模变量筛选方法以及中心变量与药物间无交互效应的解释是否恰当? 案例辨析 盲目运用变量筛选方法进行变量筛选是不妥当的。
正确做法 该研究关注中心变量与药物间是否存在交互效应。分析两变量的交互效应时,模型中必须包含相应两变量的主效应,运用SPSS 软件计算时,将药物变量、中心变量以及中心与药物交互项均纳入SPSS 软件logistic 回归界面的变量框,而且三个变量均需作为强制引入变量,因此不能采用SPSS 软件提供的逐步法自动筛选变量。
案例18-3 某医师研究某市成年人(≥18岁)抑郁症发生的危险因素。从该市成年人