医学研究中的logistic模型精讲ppt课件
合集下载
logistic回归分析精选PPT课件

Number of obs =
LR chi2(1)
=
Prob > chi2
=
Pseudo R2
=
152 30.67 0.0000 0.1455
------------------------------------------------------------------------------
case |
Coef. Std. Err.
z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
exposure | 2.112829 .4228578 5.00 0.000 1.284043 2.941615
2
二分类资料的分析
非条件logistic模型:成组病例对照研究资料 条件logistic模型:配比病例对照研究资料3源自非条件logistic回归模型
lo ( p ) g 0 + i 1 X 1 + t = 2 X 2 k X k
01X1+ 2X2+ + kXk
p1ee01X12X2 kXk 1
|------------------------+----------------------
Odds ratio |
8.271605
| 3.4193 21.33091 (exact)
Attr. frac. ex. |
.8791045
| .7075425 .9531197 (exact)
Attr. frac. pop |
.4626866
logistic回归 ppt课件

比值比
OR=[P1/(1-P1)]/[P2/(1-P2)]
比值比 Odds Ratio
Odds=P/(1-P) 暴露组: P=a/(a+b) 1-P= b/(a+b) Odds=a/b 非暴露组:P=c/(c+d) 1-P= d/(c+d) Odds=c/d
病例 对照
暴露组
非暴露组
a c
b d
P ad 1 /(1 P 1) OR P0 /(1 P0 ) bc
相同,如下表: X1 暴露(X2=1) 非暴露(X2=0) X1 X1 X2 X2+1 X2 X3 X3 X3
Logistic回归系数与OR的关系:
P * ) exp b0 b1 x1 b2 ( x2 1) b3 x3 暴露: ( 1 P expb0 b1x1 b2 x 2 b3x3 b2
当年龄为a时, odds(Y=1|age=a) = exp(-4.353 + 0.038 a) 当年龄为a+1, odds(Y=1|age=a+1) = exp(-4.353 + 0.038 (a+1))
P ) exp b 0 b1x1 b 2 x 2 b 3 x 3 非暴露:( 1 P
p * ( ) 1 p exp(b 2 ) OR p 1 p
例:log odds (Y=1) = - 4.353 + 0.038 age
Y:妇女是否患有骨质疏松,Y=1为是,Y=0为否
1 , 2 ….. m分别为m个自变量的回归系数。 P ln( ) 取值:-∞ ~ +∞ 1 P
Logistic回归模型的函数
1.00
医学统计学13.Logistic回归分析(15)课件

H0 : 1 2 m 0
H1 : 各(j j 1,2,,m)不全为0
ln
1
P P
=
0
1X1
2 X 2
mXm
模型中某β是否为0进行检验
说明某自变量对Y的作用是否有统计意义
H0 :j 0 H1 : j 0
6、回归模型或回归系数的假设检验
检验方法:
1)似然比检验 (likelihood ratio test) 2)Wald检验 3)计分检验(score test)
统计学中,把ln(P/Q)称为 P 的Logit 转换或对 数转换,记为Logit P。由此得到的回归方程,称 为Logistic回归方程。
或: P
1
1 EXP[(0 1X1 2 X 2 m X m )]
P
1
P概率 1
1 exp[(0 x)]
Z 0 1x
0.5
β为正值,x 越
.793
12.726
Cons tant
1.697
.659
6.635
a. V ariable(s ) entered on step 1: x 1, x 2, x3.
df 1 1 1 1
Sig. .682 .104 .000 .010
Ex p(B) .998
2.208 .059
5.455
2 ( bj )2
当某影响因素Xi仅为两个水平 (1暴露,0非暴露),则:
OR exp b
i
i
当bi=0时,ORi=1,说明因素Xi对疾病发生不起作用; 当bi>0时,ORi>1,说明因素Xi对疾病发生是危险因素; 当bi<0时,ORi<1,说明因素Xi对疾病发生是保护因素。
logistic回归分析PPT优秀课件

(2)线性回归分析:由于因变量是分类变量,不能满足 其正态性要求;有些自变量对因变量的影响并非线性。
2
logistic回归:不仅适用于病因学分析,也可用于其他方面的研究,研 究某个二分类(或无序及有序多分类)目标变量与有关因素的关 系。
logistic回归的分类: (1)二分类资料logistic回归: 因变量为两分类变量的资料,可用
非条件logistic回归和条件logistic回归进行分析。非条件logistic回 归多用于非配比病例-对照研究或队列研究资料,条件logistic回归 多用于配对或配比资料。 (2)多分类资料logistic回归: 因变量为多项分类的资料,可用多 项分类logistic回归模型或有序分类logistic回归模型进行分析。
比较
调查方向:收集回顾性资料
人数 暴露
疾病
a/(a+b) c/(c+d)
a
+
b
-
病例
c
病例对照原理示意图
6
是否暴露 暴露组 未暴露组 合计
病例 a c a+c
对照 b d b+d
合计 a+b(n1) c+d(n2) n
比数比(odds ratio、OR):病例对照研究中表示疾病与暴露间
联系强度的指标,也称比值比。
相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率 之比。但病例对照研究不能计算发病率,只能计算比值比OR值。 OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组 的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。
OR>1,说明 该因素使疾病的危险性增加,为危险因素;
OR<1,说明 该因素使疾病的危险性减小,为保护因素;
2
logistic回归:不仅适用于病因学分析,也可用于其他方面的研究,研 究某个二分类(或无序及有序多分类)目标变量与有关因素的关 系。
logistic回归的分类: (1)二分类资料logistic回归: 因变量为两分类变量的资料,可用
非条件logistic回归和条件logistic回归进行分析。非条件logistic回 归多用于非配比病例-对照研究或队列研究资料,条件logistic回归 多用于配对或配比资料。 (2)多分类资料logistic回归: 因变量为多项分类的资料,可用多 项分类logistic回归模型或有序分类logistic回归模型进行分析。
比较
调查方向:收集回顾性资料
人数 暴露
疾病
a/(a+b) c/(c+d)
a
+
b
-
病例
c
病例对照原理示意图
6
是否暴露 暴露组 未暴露组 合计
病例 a c a+c
对照 b d b+d
合计 a+b(n1) c+d(n2) n
比数比(odds ratio、OR):病例对照研究中表示疾病与暴露间
联系强度的指标,也称比值比。
相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率 之比。但病例对照研究不能计算发病率,只能计算比值比OR值。 OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组 的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。
OR>1,说明 该因素使疾病的危险性增加,为危险因素;
OR<1,说明 该因素使疾病的危险性减小,为保护因素;
logistic回归分析PPT精品课程课件讲义

问题的提出(续)
• 但在医学研究中常碰到因变量的取值仅有两个, 如是否发病、死亡或痊愈等;
• 分析“母亲怀孕期间体重增加”对“新生儿出 生低体重”的影响
二、概念的引入
• 如按线性回归思想建立模型: P=α +βX • P的意义是发生出生低体重的概率
• 在线性回归模型中,X的取值是任意的,P值可能大 于1或小于0,无法从医学意义进行解释, 显然不适 宜用线性回归建立预测模型。
表明ECG异常者CHD发病是正常者的2.056倍。 (3) 比较各变量对方程贡献的大小: 根据标化的值大小,确定各因素对CHD发病影响的 大小。在此项研究中,危险因素中吸烟对方程贡献最大 ,其他依次为相对体重、年龄、 胆固醇、ECG和BP。
4) 用于预测发病率: 可根据该公式预测某人在不同因素暴露条件下 CHD的发病率。如某受试者A暴露于因素xi的情况 为: X=(45, 210, 130, 100, 120, 0, 0) 利用该模型计算该受试者A在暴露上述各种研究因 素的条件下,12年间CHD的发病率为: PA1 = 1/{1+exp[-(-13.2573 + 0.1216 x 45 + 0.0070 x 210 + +0.7206 x 0)]} = 1/[1+exp(-2.9813)] = 0.048
小 结
• (1)logistic回归分析要求因变量是二分变量,或任何取值
为0或1的属性数据。
• (2)logistic回归分析中对自变量的正态性、方差齐性不作
要求,对自变量类型也不作要求;
• (3)自变量与因变量(y)之间是非线性关系,但是与logit y之
间应符合线性关系。
1. 定群研究资料分析…弗明汉心脏研究 742 名居住在弗明汉年龄为 40-49 岁的男性,在各自暴露不 同水平的影响因素(详见下表中的7种因素),经 12年追踪观察 CHD发病情况。根据此742名受试者每人暴露各项因素的水平 和 CHD 发病与否的资料,采用多因素 LOGISTIC 回归模型进
精品课程医学统计学教学课件-logistic回归分析

前瞻性研究方法,将人群按照是否暴露于某因素进行分组,追踪 各组的结局并比较其差异。
详细描述
队列研究在医学中常用于评估危险因素对疾病发生和发展的影响,以及评估预防 措施的效果。通过长期追踪和研究对象的定期随访,收集各组人群的结局数据, 分析暴露因素与结局之间的关联。
随机对照试验
随着大数据和人工智能技术的不断发 展,Logistic回归分析在医学领域的 应用越来越广泛。未来的研究将更加 注重Logistic回归分析与其他先进技 术的结合,如深度学习、机器学习等 ,以提高模型的预测精度和稳定性。
未来的研究将更加关注Logistic回归 分析在临床实践中的应用,如疾病预 测、诊断和治疗方案的制定等。同时 ,如何将Logistic回归分析与其他统 计方法结合,以更好地解决医学实际 问题,也是值得探讨的方向。
课件采用了多种教学方法,如理论讲解、案例分析、软件操作等,使学生能够全面了解和 掌握Logistic回归分析的技能。
教学效果
通过本课件的学习,学生能够熟练掌握Logistic回归分析的基本原理和应用,提高解决实 际问题的能力,为后续的医学研究和临床实践打下坚实的基础。
研究展望
研究前沿
研究方向
教学改进
03
Logistic回归分析在医学 中的应用
病例对照研究
总结词
病例对照研究是一种回顾性研究方法,通过比较病例组和对 照组的暴露情况,探讨疾病与暴露因素之间的关联。
详细描述
在医学领域,病例对照研究常用于探讨病因、预测风险和评 估干预措施的效果。通过收集病例组和对照组的相关信息, 分析暴露因素与疾病发生之间的关系,为病因推断提供依据 。
利用样本数据,建立Logistic回归模 型,描述自变量与因变量之间的关系。
详细描述
队列研究在医学中常用于评估危险因素对疾病发生和发展的影响,以及评估预防 措施的效果。通过长期追踪和研究对象的定期随访,收集各组人群的结局数据, 分析暴露因素与结局之间的关联。
随机对照试验
随着大数据和人工智能技术的不断发 展,Logistic回归分析在医学领域的 应用越来越广泛。未来的研究将更加 注重Logistic回归分析与其他先进技 术的结合,如深度学习、机器学习等 ,以提高模型的预测精度和稳定性。
未来的研究将更加关注Logistic回归 分析在临床实践中的应用,如疾病预 测、诊断和治疗方案的制定等。同时 ,如何将Logistic回归分析与其他统 计方法结合,以更好地解决医学实际 问题,也是值得探讨的方向。
课件采用了多种教学方法,如理论讲解、案例分析、软件操作等,使学生能够全面了解和 掌握Logistic回归分析的技能。
教学效果
通过本课件的学习,学生能够熟练掌握Logistic回归分析的基本原理和应用,提高解决实 际问题的能力,为后续的医学研究和临床实践打下坚实的基础。
研究展望
研究前沿
研究方向
教学改进
03
Logistic回归分析在医学 中的应用
病例对照研究
总结词
病例对照研究是一种回顾性研究方法,通过比较病例组和对 照组的暴露情况,探讨疾病与暴露因素之间的关联。
详细描述
在医学领域,病例对照研究常用于探讨病因、预测风险和评 估干预措施的效果。通过收集病例组和对照组的相关信息, 分析暴露因素与疾病发生之间的关系,为病因推断提供依据 。
利用样本数据,建立Logistic回归模 型,描述自变量与因变量之间的关系。
Logistic回归分析(共53张PPT)
数值。
• 优势比
• 常把出现某种结果的概率与不出现的概率 之比称为比值(odds),即odds=p/1-p。两个
比值之比称为比值比(Odds Ratio),简称 OR。
• Logistic回归中的常数项(b0)表示,在不
接触任何潜在危险/保护因素条件下,效 应指标发生与不发生事件的概率之比的对 数值。
Forward: LR ( 向前逐步法:似然比 法 likelihood ratio,LR)→ 再击下 方的 Save 钮,将 Predicted values 、 Influence 与 Residuls 窗口中的 预选项全勾选 → Continue → 再击 下方的 Options 钮,将 Statistics and Plot 小窗口中的选项全勾选 → Continue → OK 。
三、参数检验
• 似然比检验(likehood ratio test)
通过比较包含与不包含某一个或几 个待检验观察因素的两个模型的对数似 然函数变化来进行,其统计量为G (又 称Deviance)。
G=-2(ln Lp-ln Lk) 样本量较大时, G近似服从自由度
为待检验因素个数的2分布。
• 比分检验(score test)
, Logistic回归系数的解释变得更为复杂 ,应特别小心。
根据Wald检验,可知Logistic回归系
数bi服从u分布。因此其可信区间为
病例与对照匹配---条件logistic回归 其中, 为常数项, 为偏回归系数。 应变量水平数大于2,且水平之间不存在等级递减或递增的关系时,对这种多分类变量通过拟合一种广义Logit模型方法。
u= bi s bi
u服从正态分布,即为标准正态离差。
• 优势比
• 常把出现某种结果的概率与不出现的概率 之比称为比值(odds),即odds=p/1-p。两个
比值之比称为比值比(Odds Ratio),简称 OR。
• Logistic回归中的常数项(b0)表示,在不
接触任何潜在危险/保护因素条件下,效 应指标发生与不发生事件的概率之比的对 数值。
Forward: LR ( 向前逐步法:似然比 法 likelihood ratio,LR)→ 再击下 方的 Save 钮,将 Predicted values 、 Influence 与 Residuls 窗口中的 预选项全勾选 → Continue → 再击 下方的 Options 钮,将 Statistics and Plot 小窗口中的选项全勾选 → Continue → OK 。
三、参数检验
• 似然比检验(likehood ratio test)
通过比较包含与不包含某一个或几 个待检验观察因素的两个模型的对数似 然函数变化来进行,其统计量为G (又 称Deviance)。
G=-2(ln Lp-ln Lk) 样本量较大时, G近似服从自由度
为待检验因素个数的2分布。
• 比分检验(score test)
, Logistic回归系数的解释变得更为复杂 ,应特别小心。
根据Wald检验,可知Logistic回归系
数bi服从u分布。因此其可信区间为
病例与对照匹配---条件logistic回归 其中, 为常数项, 为偏回归系数。 应变量水平数大于2,且水平之间不存在等级递减或递增的关系时,对这种多分类变量通过拟合一种广义Logit模型方法。
u= bi s bi
u服从正态分布,即为标准正态离差。
论文经典方法Logistic回归分析及其应用课堂PPT课件PPT40页
概述
1967年Truelt J,Connifield J和Kannel W在《Journal of Chronic Disease》上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。一般概念一元直线回归多元直线回归
.
第2页,共40页。
一元直线回归模型 y = a + b x + e多元直线回归模型 y = a + b1x1 + b2x2 + … + bkxk + e
.
第39页,共40页。
其他问题
logistic回归的局限性理论上的不足:自变量对疾病的影响是独立的,但实际情况及推导结果不同。模型有不合理性:“乘法模型”与一般希望的“相加模型”相矛盾。最大似然法估计参数的局限样本含量不宜太少:例数大于200例时才可不考虑参数估计的偏性。
.
第40页,共40页。
.
第30页,共40页。
非条件logistic回归
研究对象之间是否发生某事件是独立的。适用于:成组的病例-对照研究无分层的队列研究或横断面调查诊断性试验
.
第31页,共40页。
条件logistic回归
研究中有N个配比组,每组中n个病例配m个对照者。这时,各个研究对象发生某事件的概率即为条件概率。适用于配比设计的病例-对照研究精细分层设计的队列研究
value labelssex 1 '男' 2 '女'/hisc 1 '是' 0 '否' 9 '无法判断'/nsex 1 '正常' 0 '异常' 9 '未检'/demdx 1 '有' 0 '无'/addx 0 '无' 1 '危险性' 2 '可能' 3 '很可能'/edu 0 ‘文盲’ 1 ‘小学程度’ 2 ‘初中及以上'
1967年Truelt J,Connifield J和Kannel W在《Journal of Chronic Disease》上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。一般概念一元直线回归多元直线回归
.
第2页,共40页。
一元直线回归模型 y = a + b x + e多元直线回归模型 y = a + b1x1 + b2x2 + … + bkxk + e
.
第39页,共40页。
其他问题
logistic回归的局限性理论上的不足:自变量对疾病的影响是独立的,但实际情况及推导结果不同。模型有不合理性:“乘法模型”与一般希望的“相加模型”相矛盾。最大似然法估计参数的局限样本含量不宜太少:例数大于200例时才可不考虑参数估计的偏性。
.
第40页,共40页。
.
第30页,共40页。
非条件logistic回归
研究对象之间是否发生某事件是独立的。适用于:成组的病例-对照研究无分层的队列研究或横断面调查诊断性试验
.
第31页,共40页。
条件logistic回归
研究中有N个配比组,每组中n个病例配m个对照者。这时,各个研究对象发生某事件的概率即为条件概率。适用于配比设计的病例-对照研究精细分层设计的队列研究
value labelssex 1 '男' 2 '女'/hisc 1 '是' 0 '否' 9 '无法判断'/nsex 1 '正常' 0 '异常' 9 '未检'/demdx 1 '有' 0 '无'/addx 0 '无' 1 '危险性' 2 '可能' 3 '很可能'/edu 0 ‘文盲’ 1 ‘小学程度’ 2 ‘初中及以上'
[医学]Logistic回归.ppt
/*模型的拟合优度检验*/ run;
结果1:拟合优度检验结果
两种拟合优度检验的结果均显示:P值 =0.64>>0.05,因此可以认为当前模型与拟 合最好的模型比较,差别无统计意义。因此没 有必要对模型作进一步改进。
结果2:模型检验
似然比的卡方=(无协变量的-2LOGL值)-(有两个协变量的- 2LOGL值)=107.669-95.9=11.769,自由度df=2(模型 中的协变量个数),相应的P值=0.0028,因此可以认为两个协 变量的回归系数至少有一个不为0。即:认为模型有统计学意义。
常用统计软件
Logistic回归
Logistic回归分析的分类
按数据的类型: o 非条件logistic回归分析(成组数据) o 条件logistic回归分析(配对病例-对照数据)
按因变量取值个数: o 二分类logistic回归分析 o 多分类logistic回归分析
按自变量个数: o 一元logistic回归分析 o 多元logistic回归分析
实例1
假设我们有一个数据,45个观测值,四个变 量,包括: age(年龄,数值型); vision(视力状况,二分类:1表示差,0表 示好); drive(驾车教育,二分类:1表示参加过驾 车教育,0表示没有); Accident(去年是否发生事故,二分类:1 表示出过事故,0表示没有)。
(取值范围0~1)
考虑使用概率的logit变换函数
0.8
0.6 pP
0.4
0.2
-4
-2
0
2
4
Logiyt(P)
非条件logistic回归的数学模型
因此,我们使用P与(1-P)的比值的对数, 来建立logit(P)与X的多重线性回归模型:
结果1:拟合优度检验结果
两种拟合优度检验的结果均显示:P值 =0.64>>0.05,因此可以认为当前模型与拟 合最好的模型比较,差别无统计意义。因此没 有必要对模型作进一步改进。
结果2:模型检验
似然比的卡方=(无协变量的-2LOGL值)-(有两个协变量的- 2LOGL值)=107.669-95.9=11.769,自由度df=2(模型 中的协变量个数),相应的P值=0.0028,因此可以认为两个协 变量的回归系数至少有一个不为0。即:认为模型有统计学意义。
常用统计软件
Logistic回归
Logistic回归分析的分类
按数据的类型: o 非条件logistic回归分析(成组数据) o 条件logistic回归分析(配对病例-对照数据)
按因变量取值个数: o 二分类logistic回归分析 o 多分类logistic回归分析
按自变量个数: o 一元logistic回归分析 o 多元logistic回归分析
实例1
假设我们有一个数据,45个观测值,四个变 量,包括: age(年龄,数值型); vision(视力状况,二分类:1表示差,0表 示好); drive(驾车教育,二分类:1表示参加过驾 车教育,0表示没有); Accident(去年是否发生事故,二分类:1 表示出过事故,0表示没有)。
(取值范围0~1)
考虑使用概率的logit变换函数
0.8
0.6 pP
0.4
0.2
-4
-2
0
2
4
Logiyt(P)
非条件logistic回归的数学模型
因此,我们使用P与(1-P)的比值的对数, 来建立logit(P)与X的多重线性回归模型:
《Logistic回归》PPT课件
常量 -20.207 4.652 18.866
1 .000
.000
a. 在步骤 1 中输入的变量: 性别, 年龄, 学历, 体重指数, 家族史, 吸烟, 血压, 总胆 固醇, 甘油三脂, 高密度脂蛋白, 低密度脂蛋白.
七、变量筛选
从所用的方法看,有强迫法、前进法、后退 法和逐步法。在这些方法中,筛选变量的过 程与线性回归过程的完全一样。但其中所用 的统计量不再是线性回归分析中的F统计量, 而是以上介绍的参数检验方法中的三种统计 量之一。
八、logistic 回归模型拟合优度检验和预 测准确度检验
(一)拟合优度检验:
Logistic回归模型的拟合优度检验是通过比较模型 预测的与实际观测的事件发生与不发生的频数有无差 别来进行检验。如果预测的值与实际观测的值越接近, 说明模型的拟合效果越好。
·模型的拟合优度检验方法有偏差检验(Deviance)、 皮尔逊(pearson)检验、统计量(Homser-Lemeshow), 分别计算统计量X2D、X2 P、X2HL值。统计量值越小, 对应的概率越大。无效假设H0:模型的拟合效果好。
第九章 Logistic回归
(非条件Logistic回归)
第一节 Logistic回归概述
一、Logistic回归目的: Logistic回归通常以离散 型的分类变量(疾病的死亡、痊愈等)发生结果的 概率为因变量,以影响疾病发生和预后的因素为自 变量建立模型。研究分类变量(因变量)与影响因 素(自变量)之间关系的研究方法。属于概率型非 线性回归方法。
本例模型的似然比检验结果:
X2=-2(ln Lp-ln Lk)=95.497
模 型 系数 的 综 合检 验
步骤 1
步骤 块 模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反推预测: 根据logistic曲线拟合结果,什么时险因素
探索疾病的危险因素是logistic回归的一个重要作用 病因研究一般可分为探索性研究和证实性研究 探索性研究主要用于对疾病发生的影响因素不确定,作为
疾病危险的初步探索,如病例对照研究 证实性研究在探索性研究的基础上,初步确定某因素可能
线性回归是非常经典的回归模型,但不适用于因 变量为分类变量的情况
考虑选择一个在(0,1)之间有S型曲线的分布, 如probit分布、logistic分布等
Logistic分布是最流行的一种分布 形成了我们今天熟悉的logistic回归模型
Logistic模型在医学研究中的地位
logistic回归模型在医学中的主要用途: 探索疾病发生的危险因素 验证某危险因素对疾病的效果,校正其它混杂因
用logistic曲线拟合剂量反应关系
该实验的结果为死亡率,因此最高为1 可以考虑二参数logistic曲线拟合
用logistic曲线拟合剂量反应关系
用logistic曲线拟合剂量反应关系
用logistic曲线拟合剂量反应关系
拟合模型: 1
y 1 e-0.14( x51.26)
Logistic回归模型
Logistic回归模型(单因素logistic回归模型):
1 p
1 e(0 1x)
p为阳性率,如疾病发生率、死亡率等 β0和β1为待估参数,分别表示模型的截距和斜率
Logistic回归模型
Logistic回归模型(多因素logistic回归模型):
1
e p
1
(0 1x2 x2 ...m xm )
p为阳性率,如疾病发生率、死亡率等
β0为待估参数,表示模型的截距 β1、 β1、…… βm为待估参数,分别表示各自变量
的斜率
用logistic曲线拟合剂量反应关系
剂量反应关系: 某药物的生理反应强度对给药量的函数 随着药量增加,反应强度增大,但不会无限增大
61
1710
68
1724
75
1739
81
1750
87
1755
用logistic曲线拟合SARS发展趋势
感染人数无上限,但有下限(0),考虑三参数模型
用logistic曲线拟合SARS发展趋势
拟合模型:
1732 y 1 e-0.11( x21.08)
感染人数以0.11的速度增 长
Logistic曲线与直线拟合的比较 logistic曲线 直线拟合
用logistic曲线拟合SARS发展趋势
例2:2003年SARS在香港的感染人数,t=0表示
2003年3月17日。
天数 0
病例数 95
5
222
12
470
19
800
26
1108
33
1358
40
1527
47
1621
54
1674
素的影响 预测某疾病发生的概率 评价不同因素水平下的发病风险
logistic曲线
常用于描述:
初期增长速度越来越快 后期增长速度越来越慢 最终趋于一个上限值 反映事物发生、发展、成熟、饱和的整个过程
例如:人口增长趋势、企业成长模式、物种种群数量的增 加、细胞的增长、药物浓度在体内的变化等
在第21天时感染速率最高 ,从21以后感染速度放慢
最高感染人数约为1732 人
用logistic曲线拟合SARS发展趋势
Logistic曲线与指数曲线拟合的比较 logistic曲线 指数曲线
用logistic曲线拟合SARS发展趋势
预测模拟(预测刻画器)
用logistic曲线拟合SARS发展趋势
logistic曲线
最简单的logistic曲线: 1
y 1 e-x
logistic曲线
常见的logistic曲线(三参数logistic曲线):
y
1
K e-a( xb)
式中,K、a、b为待估参数
K 代表曲线的上限值
a反映了增长速度
b表示拐点,在这一点增长速度最快,这一点对应 的y值为K/2
,而是有一个上限值 不少剂量反应关系都呈S型曲线,可用logistic曲线
来描述
用logistic曲线拟合剂量反应关系
例1:某实验室进行小鼠的药物毒性实验,下面数 据为不同剂量下的小鼠死亡率。
剂量(mg/kg) 30.7 38.4 48 60 75
死亡率 0 0.2
0.35 0.8 0.95
医学研究中的logistic模型精讲
冯国双
Logistic分布与logistic模型
Logistic分布首先由比利时数学家Verhulst于1838 年提出
最初主要用于研究人口的增长趋势 很多物种都符合logistic分布,呈现“S”型的发展
趋势
Logistic模型在医学研究中的地位
logistic曲线
四参数logistic曲线:
y
1
DC e-a( xb)
式中,D、C、a、b为待估参数
D 代表曲线的上限值
C 代表曲线的下限值
a反映了增长速度
b表示拐点,在这一点增长速度最快
logistic曲线
二参数logistic曲线: 1
y 1 e-a(xb) 式中,a、b为待估参数 a反映了增长速度 b表示拐点,在这一点增长速度最快
死亡率以0.14的速率增长 剂量在51.26时死亡率的增长
速度达到高峰,以后死亡率 增长速度开始下降 半数致死剂量为 51.26(95%CI :48.96-53.56)
用logistic曲线拟合剂量反应关系
反推: 在什么剂量下死亡率达到50%?
用logistic曲线拟合剂量反应关系
回忆是否准确。如果这一点能避免,其效率还是很高的
是疾病的影响因素,用于进一步证实。如队列研究
用logistic回归探索疾病危险因素
病例对照研究在医院中应用非常广泛,具有很多优点: 收集数据快,符合医院特点,可以利用病史快速收集到病
例及对照的数据 研究时间短,可以很快发现一些疾病的危险因素 病例对照研究是回顾性的,很大的一个问题是调查对象的
探索疾病的危险因素是logistic回归的一个重要作用 病因研究一般可分为探索性研究和证实性研究 探索性研究主要用于对疾病发生的影响因素不确定,作为
疾病危险的初步探索,如病例对照研究 证实性研究在探索性研究的基础上,初步确定某因素可能
线性回归是非常经典的回归模型,但不适用于因 变量为分类变量的情况
考虑选择一个在(0,1)之间有S型曲线的分布, 如probit分布、logistic分布等
Logistic分布是最流行的一种分布 形成了我们今天熟悉的logistic回归模型
Logistic模型在医学研究中的地位
logistic回归模型在医学中的主要用途: 探索疾病发生的危险因素 验证某危险因素对疾病的效果,校正其它混杂因
用logistic曲线拟合剂量反应关系
该实验的结果为死亡率,因此最高为1 可以考虑二参数logistic曲线拟合
用logistic曲线拟合剂量反应关系
用logistic曲线拟合剂量反应关系
用logistic曲线拟合剂量反应关系
拟合模型: 1
y 1 e-0.14( x51.26)
Logistic回归模型
Logistic回归模型(单因素logistic回归模型):
1 p
1 e(0 1x)
p为阳性率,如疾病发生率、死亡率等 β0和β1为待估参数,分别表示模型的截距和斜率
Logistic回归模型
Logistic回归模型(多因素logistic回归模型):
1
e p
1
(0 1x2 x2 ...m xm )
p为阳性率,如疾病发生率、死亡率等
β0为待估参数,表示模型的截距 β1、 β1、…… βm为待估参数,分别表示各自变量
的斜率
用logistic曲线拟合剂量反应关系
剂量反应关系: 某药物的生理反应强度对给药量的函数 随着药量增加,反应强度增大,但不会无限增大
61
1710
68
1724
75
1739
81
1750
87
1755
用logistic曲线拟合SARS发展趋势
感染人数无上限,但有下限(0),考虑三参数模型
用logistic曲线拟合SARS发展趋势
拟合模型:
1732 y 1 e-0.11( x21.08)
感染人数以0.11的速度增 长
Logistic曲线与直线拟合的比较 logistic曲线 直线拟合
用logistic曲线拟合SARS发展趋势
例2:2003年SARS在香港的感染人数,t=0表示
2003年3月17日。
天数 0
病例数 95
5
222
12
470
19
800
26
1108
33
1358
40
1527
47
1621
54
1674
素的影响 预测某疾病发生的概率 评价不同因素水平下的发病风险
logistic曲线
常用于描述:
初期增长速度越来越快 后期增长速度越来越慢 最终趋于一个上限值 反映事物发生、发展、成熟、饱和的整个过程
例如:人口增长趋势、企业成长模式、物种种群数量的增 加、细胞的增长、药物浓度在体内的变化等
在第21天时感染速率最高 ,从21以后感染速度放慢
最高感染人数约为1732 人
用logistic曲线拟合SARS发展趋势
Logistic曲线与指数曲线拟合的比较 logistic曲线 指数曲线
用logistic曲线拟合SARS发展趋势
预测模拟(预测刻画器)
用logistic曲线拟合SARS发展趋势
logistic曲线
最简单的logistic曲线: 1
y 1 e-x
logistic曲线
常见的logistic曲线(三参数logistic曲线):
y
1
K e-a( xb)
式中,K、a、b为待估参数
K 代表曲线的上限值
a反映了增长速度
b表示拐点,在这一点增长速度最快,这一点对应 的y值为K/2
,而是有一个上限值 不少剂量反应关系都呈S型曲线,可用logistic曲线
来描述
用logistic曲线拟合剂量反应关系
例1:某实验室进行小鼠的药物毒性实验,下面数 据为不同剂量下的小鼠死亡率。
剂量(mg/kg) 30.7 38.4 48 60 75
死亡率 0 0.2
0.35 0.8 0.95
医学研究中的logistic模型精讲
冯国双
Logistic分布与logistic模型
Logistic分布首先由比利时数学家Verhulst于1838 年提出
最初主要用于研究人口的增长趋势 很多物种都符合logistic分布,呈现“S”型的发展
趋势
Logistic模型在医学研究中的地位
logistic曲线
四参数logistic曲线:
y
1
DC e-a( xb)
式中,D、C、a、b为待估参数
D 代表曲线的上限值
C 代表曲线的下限值
a反映了增长速度
b表示拐点,在这一点增长速度最快
logistic曲线
二参数logistic曲线: 1
y 1 e-a(xb) 式中,a、b为待估参数 a反映了增长速度 b表示拐点,在这一点增长速度最快
死亡率以0.14的速率增长 剂量在51.26时死亡率的增长
速度达到高峰,以后死亡率 增长速度开始下降 半数致死剂量为 51.26(95%CI :48.96-53.56)
用logistic曲线拟合剂量反应关系
反推: 在什么剂量下死亡率达到50%?
用logistic曲线拟合剂量反应关系
回忆是否准确。如果这一点能避免,其效率还是很高的
是疾病的影响因素,用于进一步证实。如队列研究
用logistic回归探索疾病危险因素
病例对照研究在医院中应用非常广泛,具有很多优点: 收集数据快,符合医院特点,可以利用病史快速收集到病
例及对照的数据 研究时间短,可以很快发现一些疾病的危险因素 病例对照研究是回顾性的,很大的一个问题是调查对象的