《Logistic回归》PPT课件

合集下载

logistic回归 ppt课件

logistic回归  ppt课件

比值比
OR=[P1/(1-P1)]/[P2/(1-P2)]
比值比 Odds Ratio
Odds=P/(1-P) 暴露组: P=a/(a+b) 1-P= b/(a+b) Odds=a/b 非暴露组:P=c/(c+d) 1-P= d/(c+d) Odds=c/d
病例 对照
暴露组
非暴露组
a c
b d
P ad 1 /(1 P 1) OR P0 /(1 P0 ) bc
相同,如下表: X1 暴露(X2=1) 非暴露(X2=0) X1 X1 X2 X2+1 X2 X3 X3 X3
Logistic回归系数与OR的关系:
P * ) exp b0 b1 x1 b2 ( x2 1) b3 x3 暴露: ( 1 P expb0 b1x1 b2 x 2 b3x3 b2
当年龄为a时, odds(Y=1|age=a) = exp(-4.353 + 0.038 a) 当年龄为a+1, odds(Y=1|age=a+1) = exp(-4.353 + 0.038 (a+1))
P ) exp b 0 b1x1 b 2 x 2 b 3 x 3 非暴露:( 1 P
p * ( ) 1 p exp(b 2 ) OR p 1 p
例:log odds (Y=1) = - 4.353 + 0.038 age
Y:妇女是否患有骨质疏松,Y=1为是,Y=0为否
1 , 2 ….. m分别为m个自变量的回归系数。 P ln( ) 取值:-∞ ~ +∞ 1 P
Logistic回归模型的函数
1.00

Logistic回归模型1PPT课件

Logistic回归模型1PPT课件
利用logistic分布函数的特征来表示在自变量X 的作用下出现阳性结果或阴性性结果的概率。
出现阳性结果的概率记为: P( y=1|x),
出现阴性结果的概率为: Q( y=0|x), 注意:P+Q=1。
当只有一个自变量时,logistic回归模型:
exp(X) P(y1|x)1ex0 p(X)
(1)
(10)
P(1)─X取1时,为暴露组 ; P(0)─X取0时,为非暴露组。
loig (tP )0x
lO n ) li [ o ( P R ( 1 t ) l g ] i [ o P ( 0 t ) ( g ] 0 1 ) ( 0 0 )
lnO ( R ) ORe
(五) 的统计学意义
-
1
Logistic 回归模型
主讲:黄志碧
回归分析概述
1、根据自变量多少分
(1)简单回归(一个自变量)
(2)多元回归(多个自变量) 2、根据Y的取值分
(1)确定型回归(多元线性回归) (2)概率型回归(Logistic回归) 3、根据回归图形分 线性回归(多元线性回归) 非线性回归(Logistic回归)
模型拟合优度检验: H0设实际频数分布和理 论频数分布相符合,即模型的拟合优度较好。
-
38
第二节 二项分类变量资料 非条件logistic 回归
二项分类反应变量是最常见的变量类型, 又称0、1变量。可用于病例-对照研究,队列 研究和横断面研究,其中成组设计的非条件 Logistic回归最常见。
-
0
Q (y0|x)1ex 1p 0(X) (2)
式中, 0 为回归线的截距, 是与X有关的
参数,也称回归系数。
Q P((yy 1 0||x x))exp 0(X) (3)

《logistic回归》课件

《logistic回归》课件
03
易于理解和实现: 由于基于逻辑函数,模型输出结 果易于解释,且实现简单。
Logistic回归的优势与不足
• 稳定性好: 在数据量较小或特征维度较高 时,Logistic回归的预测结果相对稳定。
Logistic回归的优势与不足
01
不足:
02
对数据预处理要求高: 需要对输入数据进行标准化或归一化处理,以 避免特征间的尺度差异对模型的影响。
模型假设
01
线性关系
因变量与自变量之间存在线性关系 。
无自相关
因变量与自变量之间不存在自相关 。
03
02
无多重共线性
自变量之间不存在多重共线性,即 自变量之间相互独立。
随机误差项
误差项是独立的,且服从二项分布 。
04
模型参数求解
最大似然估计法
通过最大化似然函数来求解模型参数。
梯度下降法
通过最小化损失函数来求解模型参数。
特征选择与降维
在处理大数据集时,特征选择和降维是提高模 型性能和可解释性的重要手段。
通过使用诸如逐步回归、LASSO回归等方法, 可以自动选择对模型贡献最大的特征,从而减 少特征数量并提高模型的泛化能力。
降维技术如主成分分析(PCA)可以将高维特 征转换为低维特征,简化数据结构并揭示数据 中的潜在模式。
迭代法
通过迭代的方式逐步逼近最优解。
牛顿法
利用牛顿迭代公式求解模型参数。
模型评估指标
准确率
正确预测的样本数占总样本数的比例 。
精度
预测为正例的样本中实际为正例的比 例。
召回率
实际为正例的样本中被预测为正例的 比例。
F1分数
精度和召回率的调和平均数,用于综 合评估模型性能。

Logisic回归分析PPT课件

Logisic回归分析PPT课件

0
吸烟 不吸烟
各 变 量
X2
1
0
饮酒 不饮酒


Y
1
病例
0
对照
39
17
表16-1 吸烟与食道癌关系的病例-对照调查资料
分层 吸烟 饮酒 观察例数 阳性数 阴性数
g
X1
X2
ng
dg
ng dg
1
0
0
199
63 136
2
0
1
170
63 107
3
1
0
101
44
57
4
1
1
416
265 151
39
18
经 logistic 回归计算后得
计算公式为:
OR j
P1 P0
/(1 /(1
P1 ) P0 )
式中 P1 和 P0 分别表示在 X j 取值为 c1 及 c0 时 的发病概率, ORj 称作多变量调整后的优势比, 表示扣除了其他自变量影响后危险因素的作用。
39
12
与 logisticP 的关系:
对比某一危险因素两个不同暴露水平X j c1 与X j c0 的发病 情况(假定其它因素的水平相同),其优势比的自然对数为:
.
51
2
0
1
1
0
1
2
1
1
52
2
1
1
1
0
0
2
1
1
53
2
1
0
1
0
0
1
1
1
54
3
1
1
0
1

Logistic回归分析(共53张PPT)

Logistic回归分析(共53张PPT)
数值。
• 优势比
• 常把出现某种结果的概率与不出现的概率 之比称为比值(odds),即odds=p/1-p。两个
比值之比称为比值比(Odds Ratio),简称 OR。
• Logistic回归中的常数项(b0)表示,在不
接触任何潜在危险/保护因素条件下,效 应指标发生与不发生事件的概率之比的对 数值。

Forward: LR ( 向前逐步法:似然比 法 likelihood ratio,LR)→ 再击下 方的 Save 钮,将 Predicted values 、 Influence 与 Residuls 窗口中的 预选项全勾选 → Continue → 再击 下方的 Options 钮,将 Statistics and Plot 小窗口中的选项全勾选 → Continue → OK 。
三、参数检验
• 似然比检验(likehood ratio test)
通过比较包含与不包含某一个或几 个待检验观察因素的两个模型的对数似 然函数变化来进行,其统计量为G (又 称Deviance)。
G=-2(ln Lp-ln Lk) 样本量较大时, G近似服从自由度
为待检验因素个数的2分布。
• 比分检验(score test)
, Logistic回归系数的解释变得更为复杂 ,应特别小心。
根据Wald检验,可知Logistic回归系
数bi服从u分布。因此其可信区间为
病例与对照匹配---条件logistic回归 其中, 为常数项, 为偏回归系数。 应变量水平数大于2,且水平之间不存在等级递减或递增的关系时,对这种多分类变量通过拟合一种广义Logit模型方法。
u= bi s bi
u服从正态分布,即为标准正态离差。

《logistic回归分析》PPT课件

《logistic回归分析》PPT课件
3
第一节 非条件logistic回归
一、logistic 回归模型:
设因变量 Y 是一个二分类变量,其取值为 Y =1 和Y =0。 影响 Y 取值的 m 个自变量分别为 X1, X 2 ,, X m 。在 m 个自变量(即暴露因素)作用下阳性结果发生的条件
概率为 P P(Y 1 X1, X 2 ,, X m ) ,则 logistic 回归模
表 1 调查数据
y
x
1
0
1
a
b
0
c
d
合计 a+c b+d
表 2 对应概率
y
x
1
0
1 0 合计
p1 1- p1
1
p2 1- p2
1
9
表 1 调查数据
y
x
1
0
1
a
b
0
c
d
合计 a+c b+d
表 2 对应概率
y
x
1
0
1 0 合计
p1 1- p1
1
p2 1- p2
1
Logistic
模型为:
p1

p( y
1|
(2)多分类资料Logistic回归: 因变量为多项分类的资料,可 用多项分类Logistic回归模型或有序分类Logistic回归模型进 行分析。
2
非条件Logistic回归分析 条件Logistic回归分析 无序分类反应变量Logistic回归分析 有序多分类反应变量Logistic回归分析 Logistic回归分析应用及注意事项
21
对所拟合模型的假设检验:
概率p值均小 于0.05,说明 方程有意义。

[医学]Logistic回归.ppt

[医学]Logistic回归.ppt
/*模型的拟合优度检验*/ run;
结果1:拟合优度检验结果
两种拟合优度检验的结果均显示:P值 =0.64>>0.05,因此可以认为当前模型与拟 合最好的模型比较,差别无统计意义。因此没 有必要对模型作进一步改进。
结果2:模型检验
似然比的卡方=(无协变量的-2LOGL值)-(有两个协变量的- 2LOGL值)=107.669-95.9=11.769,自由度df=2(模型 中的协变量个数),相应的P值=0.0028,因此可以认为两个协 变量的回归系数至少有一个不为0。即:认为模型有统计学意义。
常用统计软件
Logistic回归
Logistic回归分析的分类
按数据的类型: o 非条件logistic回归分析(成组数据) o 条件logistic回归分析(配对病例-对照数据)
按因变量取值个数: o 二分类logistic回归分析 o 多分类logistic回归分析
按自变量个数: o 一元logistic回归分析 o 多元logistic回归分析
实例1
假设我们有一个数据,45个观测值,四个变 量,包括: age(年龄,数值型); vision(视力状况,二分类:1表示差,0表 示好); drive(驾车教育,二分类:1表示参加过驾 车教育,0表示没有); Accident(去年是否发生事故,二分类:1 表示出过事故,0表示没有)。
(取值范围0~1)
考虑使用概率的logit变换函数
0.8
0.6 pP
0.4
0.2
-4
-2
0
2
4
Logiyt(P)
非条件logistic回归的数学模型
因此,我们使用P与(1-P)的比值的对数, 来建立logit(P)与X的多重线性回归模型:

logistic回归(共36张PPT)

logistic回归(共36张PPT)
二分类自变量 系数为比数比的对数值,由此比数比=eb
多分类自变量 以第i类作参照,比较相邻或相隔的两个类别。
连续型自变量 当自变量改变一个单位时,比数比为eb
2022/11/3
27
输出结果的解释
模型拟合的优劣
自变量与结果变量(因变量)有无关系
确认因变量与自变量的编码 模型包含的各个自变量的临床意义 由模型回归系数计算得到的各个自变 量的比数比的临床意义
3
一般直线回归难以解决的问题
医学数据的复杂、多样
连续型和离散型数据
医学研究中疾病的复杂性
一种疾病可能有多种致病因素或与多种危 险因素有关
疾病转归的影响因素也可能多种多样 临床治疗结局的综合性
2022/11/3
4
简单的解决方法
固定其他因素,研究有影响的一两个因 素; 分层分析:按1~2个因素组成的层进行 层内分析和综合。 统计模型
2022/11/3
28
输出结果的解释
模型的预测结果的评价
敏感度、特异度和阳性预测值
正确选择预测概率界值,简单地以0.5为 界值,但并不是最好的。
C指数
预测结果与观察结果的一致性的度量。 C值越大(最大为1),模型预测结果的
能力越强。
2022/11/3
29
非条件logistic回归
研究对象之间是否发生某事件是 独立的。 适用于:
放入所有变量,再逐个筛选
理论上看,前进法选择变量的经验公式缺乏总体概念,当用于因
素分析时,建议用后退法。当变量间有完全相关性时,后退法无 法使用,可用前进法。
2022/11/3
21
5.交互作用的引入
交互作用的定义
当自变量和因变量的关系随第三个变量 的变化而改变时,则存在交互作用
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计概率。其中,P为概率;β0为常数项;β1、2、m为偏 回归系数。Exp为指数函数。(曲线关系)
二、回归方程(线性函数表达式 )
反应变量阳性结果的概率P与自变量X的关系通常
不是直线关系,呈曲线关系;而自变量X与P和(1-
P)比值的对数呈线性关系,因此Logistic回归模
型P与X线性函数表达式为:
·检验模型中所有自变量整体来看是否与所研究事 件的对数优势比存在线性关系,也即方程是否成 立。
·检验的方法有似然比检验( likehood ratio test )、 比分检验(score test)和Wald检验(wald test)。 上述三种方法中,似然比检验最可靠,比分检验 一般与它相一致,但两者均要求较大的计算量; 而Wald检验未考虑各因素间的综合作用,在因素 间有共线性时结果不如其它两者可靠。
logit(P)= ln(
p 1 p
)
= β0+β1χ1 + … +βm χm
P为事件发生的概率,1-P为事件不发生的概率。

优势(比值)odds=
p 1 p

三、模型参数的意义
三、模型参数的意义
三、模型参数的意义
四、优势比估计(及可信区间)
即ORj=exp(bj)。优势比的意义:利用参数和优势比 探讨影响因素。
p exp(0 1X1 m X m ) 1 exp(0 1X1 m X m )

1
1 exp[(0 1X1 m X m )]
1 e 1 ( 0 1X1 m Xm )
此形式为概率预测模型,给定自变量的取值时,可估
五、模型参数的估计
根据样本数据,可以通过统计软件求出Logistic 回归模型的常数项β0和各项回归系数β,建立回 归方程,描述和分析反应变量与自变量的关系。
ቤተ መጻሕፍቲ ባይዱ
参数估计
参数估计
标准化回归参数
标准化回归参数用于评价各自变量对模型的贡 献大小。
模型参数的估计通常用统计软件完成。 根据样本数据,可以通过统计软件求出Logistic
因变量是分类变量(二分类、多分类)发生结果的 概率。作出多个自变量(危险因素)估计应变量 (非连续变量Y,是发生结果的概率)的回归方程。 研究某现象发生与因素间关系也可以用X检验,但 有局限性,仅能研究一个因素,且为定性结论。
二、与多重线性回归区别。
多重线性回归:自变量和因变量是连续变量;资料 符合正态性、线性等条件要求;主要用于研究一个因 变量与多个自变量之间依存关系。 Logistic回归:主要用于筛选疾病的危险因素,作 病因分析;控制和校正混杂因素的影响;其因变量是 分类变量,自变量可以是分类变量,也可以是连续变 量;自变量X与因变量Y之间无线性关系;属于概率型 非线性回归方法。
三、 Logistic回归的分类
Logistic回归主要分为:二分类和多分类两种。 非条件Logistic回归,适用于成组设计、且因变 量为二分类变量的资料; 条件Logistic回归,适用于配对设计、且因变量 为二分类变量的资料; 多分类Logistic回归,适用于因变量为多分类变 量的资料,分为有序和无序多分类Logistic回归 分析两种。(结果为痊愈、显效、有效、无效/不 同肝炎类型甲、乙、丙、丁、戊型的危险因素研 究)
第二节 非条件Logistic回归分析
一、Logistic回归模型: 设Y为2分类变量的反应变量,结果有两种: Y=1表示某事件发生; Y=0表示某事件不发生。 x为自变量可以是连续变量或分类变量。 根据大量观察,反应变量阳性结果的概率P与
自变量X的关系通常不是直线关系,而是曲线关系。
Logistic回归模型
似然比检验( likehood ratio test )
通过比较包含与不包含某一个或几个待检验观察因 素的两个模型的对数似然函数变化来进行,其统计 量为G (又称Deviance)。 G=-2(ln Lp-ln Lk) 样本量较大时,G近似服从自由度为待检验因素个数 的2分布。
似然比检验
当G大于临界值时,接受H1,拒绝无效假设,认为从 整体上看适合作Logistic回归分析,回归方程成立。
.263 .636 .171
1 .679
1.301
.374 4.527
.085 .036 5.521
1 .019
1.089 1.014 1.168
·检验方法常用Wald X2检验,无效假设H0:β=0。 当X2大于临界值时,拒绝无效假设,自变量能进 入方程。
x2


ˆ SE ( ˆ )
2

方 程 中的 变 量
步1a 骤
性别 年龄
EXP(B) 的 95.0% C.I.
B
S.E. Wald df sig. Exp(B) 下限 上限
回归模型的常数项β0和各项回归系数β,在对 回归系数进行检验后,建立回归方程,描述和 分析反应变量与自变量的关系。
例题
为研究糖尿病与血压、血脂等因素关系,研究56例病 人和65例正常人,结果如下,试进行分析。
变量赋值
也可设置哑变量
六、回归系数的假设检验
(一)Logistic回归方程的检验(对模型回归系数 整体检验):
本例模型的似然比检验结果:
X2=-2(ln Lp-ln Lk)=95.497
模 型 系数 的 综 合检 验
步骤 1
步骤 块 模型
卡方 95.497 95.497 95.497
df 11 11 11
显 著性 .000 .000 .000
(二)单个回归系数假设检验
为了确定哪些自变量能进入方程,还需要对每个 自变量的回归系数进行假设检验,判断其对模型 是否有贡献。
第九章 Logistic回归
(非条件Logistic回归)
第一节 Logistic回归概述
一、Logistic回归目的: Logistic回归通常以离散 型的分类变量(疾病的死亡、痊愈等)发生结果的 概率为因变量,以影响疾病发生和预后的因素为自 变量建立模型。研究分类变量(因变量)与影响因 素(自变量)之间关系的研究方法。属于概率型非 线性回归方法。
相关文档
最新文档