03生存分析

合集下载

生存分析sun幻灯片

生存分析sun幻灯片

然后将各点垂直向下再水平向右连成阶梯形。
(7)必要时可按正态近似法估计总体生存率的可信区间。
某时点ti的总体生存率 1 % 的可信区间为:
Sti u 2SESti
(16.11) 22
用某中药+化疗(中药组)和化疗(对照组)两种 疗法治疗白血病后,随访记录患者死前存活月数, 结果如下。试分别估计两组的生存率并绘制生存率 曲线。 中药组:10 2+ 12+ 13 18 6+ 19+ 26 9+ 8+
of survival),即将时刻 t 尚存活看成是前 t 个时段一直
存活的累计结果。如: n年生存率 1p0 1 p11 p2 ......1 pn1 。 14
(四)生存率曲线(survival curve): 是指以时间为横轴、生存率为纵轴,将各个时点的生 存率连接在一起的曲线图。曲线形状分为两种: 1、阶梯形:小样本资料用直接法估计的生存曲线; 2、折线形:大样本资料用频数表法估计的生存曲线。 (五)中位生存期(median survival time): 也称半数生存期,即生存时间的中位数,表示生存率 等于 50%时的时间。反映生存时间的平均水平。


的生存率 标准误
ix n
dq
p
p(x>t) s
(1) (2) (3) (4) (5)
(6)
(7)
(8)
1 1 10 1 0.1000 0.9000 0.9000 0.0949
2 2+ 9
0 0.0000 1.0000 0.9000 .
33 8 46 7 57 6
1 0.1250 0.8750 0.7875 0.1340 1 0.1429 0.8571 0.6750 0.1551 1 0.1667 0.8333 0.5625 0.1651

生存分析

生存分析
属于非参数方法
例 29.4 两组儿童横纹肌肉瘤治疗后复发时间(月数)如表 29.5, 对照 组为“摘除+放疗”,处理组为“摘除+放疗+化疗”,问两组缓解率 是否不同?
表 29.5 两组儿童横纹肌肉瘤治疗后复发时间(月数,"+"表示未复发) 对照组 2 3 9 10 10 12+ 15 15+ 16 18+ 24+ 30 36+ 40+ 45+ 处理组 9 12+ 16 19 19+ 20+ 20+ 24+ 24+ 30+ 31+ 34+ 42+ 44+ 53+ 59+ 62+
S(t)
1.0
treat
0.8
0.6
control
0.4
0.2
0.0 0 12 24 36 48 60
t (month)
图29.5儿童横纹肌肉瘤加化疗组(treat)与对照组(control)缓解曲线比较
生存曲线的比较-log-rank检验
2L

(a j ej )2
v
2 j
v 1
Data aa;
12 12
37
0
1
0
13 17
37
0
0
1
14 14
29
0
0
1
15 13
13
0
0
1
16 17
31
0
0
1
维生素 C
vitC
1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1
观察记录
整理

医学统计学生存分析

医学统计学生存分析

pi
(8) 0.7594 0.7324 0.7548 0.8344 0.8298 0.9227 0.9463 0.9845 0.9496 0.9612
生存率
Sˆ(ti )
(9) 0.7594 0.7594×0.7324=0.5562 0.5562×0.7548=0.4198 0.4198×0.8344=0.3503 0.3503×0.8298=0.2907 0.2907×0.9227=0.2682 0.2682×0.9463=0.2538 0.2538×0.9845=0.2499 0.2499×0.9496=0.2373 0.2373×0.9612=0.2281
0.4286×0.8333=0.3571 0.1281
0.3571×1.0000=0.3571 0.1281
0.3571×0.7500=0.2678 0.1233
0.2678×1.0000=0.2678 0.1233
0.2678×0.5000=0.1339 0.1130
0.1339×1.0000=0.1339 0.1130
25
12
157 151.0
5 4~
20
5
120 117.5
6 5~
7
9
95
90.5
7 6~
4
9
79
74.5
8 7~
1
3
66
64.5
9 8~
3
5
62
59.5
10 9~10
2
5
54 51.5
注:生存时间长于 10 年者 47 例。
qi
(7) 90/374.0=0.2406 76/284.0=0.2676 51/208.0=0.2452 25/151.0=0.1656 20/117.5=0.1702 7/90.5=0.0773 4/74.5=0.0537 1/64.5=0.0155 3/59.5=0.0504 2/51.5=0.0388

生存分析SPSS单因素和多因素对生存率的可能分析

生存分析SPSS单因素和多因素对生存率的可能分析

No
X1
X2
X3 X4 X5 X6
t
Y
1 54
0 01 10
52
0
2 57 0 1 0 0 0 51 0
3 58
0 00 11
35
1
4 43
1 1 1 1 0 103
0
5 48 0 1 0 0 0
7
1
6 40
0 10 00
60
0
7 44
0 10 00
58
0
8 36
0 00 11
29
1
9 39
1 11 01
1
51 48 1 0 0 1 0 120
0
52 72 0 1 0 1 0 24
1
53 42 0 0 0 1 0
2
1
54 63 1 0 1 1 0 120
0
55 55 0 1 1 0 0 12
1
56 39 0 0 0 1 0
5
1
57 44 0 0 0 1 0 120
0
58 42 1 1 1 0 0 120
Company Logo
一、建立数据文件(同前)
二、操作过程
主菜单:分析Analyze生存SurvivalKaplan-Meier
对话框参数设置:
1. 时间time框:选入 “t”。 2. 状态status框:选入“status”,击define events 钮,在single value
框填入“1”。 3. 因子factor框:选入“group”。 4. 单击选项option按钮,弹出对话框:
(2)比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的 生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。

《病例对照研究》课件

《病例对照研究》课件
02 知识巩固
课后练习与总结
03 互动环节
学员间的讨论与交流
课程评估及建议
参训人员对课程的评价反映了课程的质量和效果,课 程的优点和改进意见将对未来的课程设计和改进起到 重要作用。
课程资源分享
学习资料
课件下载链接 参考书目推荐
文献推荐
专业期刊推荐 相关论文链接
课后指导
学习计划制定 学习小组组建
课程结束与感谢
参考文献
Smith, J. et al.
Epidemiological Review, 2020
Brown, K. et al.
Research Journal, 2018
Johnson, L. et al.
Journal of Medicine, 2019
● 05
第5章 排版及制作技巧
PPT制作技巧
知识检测与总结
知识点回顾
回顾本章重点知识 梳理相关概念
重点概念梳理
整理本章重点概念 强化记忆和理解
总结与反思
总结本章学习内容 反思学习收获和不足
案例研究
病例分析
通过真实病例进行 深入分析
结果总结
总结病例对照研究 的结果
经验分享
分享研究过程中的 经验和教训
对照研究
比较不同病例的治 疗效果
01 色彩搭配
女性患病率
女性患病比例
总结
通过以上实例分析,病例对照研究可以帮助我们深入了解不 同疾病与暴露因素、药物使用、工作时间和性别等因素之间 的关联性,为预防和治疗提供重要参考依据。
● 04
第四章 数据解读与结论
01 结果的意义和影响
影响社会公众对疾病的认识和防控措施
02 结果的可靠性和一致性

生存模型的概念及生存模型数学

生存模型的概念及生存模型数学

最小二乘估计
通过最小化误差平方和来估计未知参数,适 用于线性回归模型。
贝叶斯估计
利用先验信息结合样本数据来估计未知参数, 能够综合考虑已知和未知信息。
检验方法
01
显著性检验
通过比较不同样本或不同处理组 的结果,判断其差异是否具有统 计学上的显著性。
02
拟合优度检验
03
异方差性检验
检验模型是否能够很好地拟合实 际数据,常用的方法有卡方检验、 残差分析等。
应用场景
适用于具有已知或假设的分布形式的生存数据,如某些医学和工程领域的研究。
非参数生存模型
定义
非参数生存模型是一种不假定数据遵循特定 分布的模型,它根据数据本身的特点进行建 模。
特点
非参数生存模型不对生存时间的分布做出假设,而 是直接根据实际观测数据进行建模。
应用场景
适用于分布形式未知或多种分布形式可能的 生存数据,如某些生物学和环境科学领域的 研究。
06 生存模型的发展趋势与挑 战
生存模型的发展趋势
生存分析在医学领域的应用
随着医学研究的深入,生存分析在临床试验、流行病学和生物统计学等领域的应用越来越广泛,研究疾病发生、发展 和转归的过程,为临床决策提供依据。
生存分析与机器学习的结合
机器学习算法在生存分析中的应用逐渐成为研究热点,通过数据挖掘和预测模型,对生存时间进行更精确的预测和风 险评估。
R语言的灵活性和开放性使得用户可以根据自己的需求进行定制和扩展,实现特定的 生存分析方法。
Python实现
Python是一种通用编程语言,也广泛应用于数据分析和科学计算。
Python有许多生存分析库,如lifelines、survivalml等,提供了丰富的生 存分析方法和工具。

《生存分析SPSS单因素和多因素对生存率的可能分析》PPT模板课件

《生存分析SPSS单因素和多因素对生存率的可能分析》PPT模板课件

1
51 48 1 0 0 1 0 120
0
52 72 0 1 0 1 0 24
1
53 42 0 0 0 1 0
2
1
54 63 1 0 1 1 0 120
0
55 55 0 1 1 0 0 12
1
56 39 0 0 0 1 0
5
1
57 44 0 0 0 1 0 120
0
58 42 1 1 1 0 0 120
生存分析SPSS单因素和多因素对生存率的 可能分析
(Excellent handout training template)
生存分析的理论复习
1. 何为生存分析?
生存分析(survival analysis)是将事件的结果(终点事件)和 出现结果经历的时间结合起来分析的一种统计分析方法。
2. 生存分析的目的:
.0%
100.0%
2-1.模型检验(全变量模型)
模 型 系 数 的 综 合 a , b测 试
倍对整 数体 (得分 从) 上一步骤开始 从更 上改 一块开始更改
似然值 卡方 df Sig.卡方 df Sig.卡方 df Sig.
.02 50 2.174
6.02 01 3.942
6.02 01 1.942
o
g
o
Kaplan-Meier 过程
Kaplan-Meier过程用于(尤其小样本资料): 1. 估计各生存时间的生存率以及中位生存时间。 2. 绘制各种曲线:如生存函数、风险函数曲线等。 3. 比较某研究因素不同水平的生存时间有无差异。 4. 控制某个分层因素后对研究因素不同水平的生存时间
分布进行比较。 5. 对多组生存时间分布进行两两比较。 (各总体分布比较采用Log-rank等非参数方法)

生存分析SPSS过程(SPSSofSurvivalAnalysis)

生存分析SPSS过程(SPSSofSurvivalAnalysis)

生存分析SPSS过程(SPSS of Survival Analysis)Company name生存分析SPSS过程(SPSS of Survival Analysis)邹莉玲预防医学教研室Company Logo1. 何为生存分析?生存分析(survival analysis)是将事件的结果(终点事件)和出现结果经历的时间结合起来分析的一种统计分析方法。

2. 生存分析的目的:描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。

统计方法包括Kaplan-Meier(K-M)法、寿命表法。

比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。

统计方法log-rank检验等。

影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。

如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。

统计方法cox比例风险回归模型等。

预测:建立cox回归预测模型。

生存分析的理论复习Company Logo生存分析(Survival Analysis)菜单Company Logo寿命表(Life Tables)过程Life tables 过程用于(小样本和大样本资料):估计某生存时间的生存率,以及中位生存时间。

绘制各种曲线:如生存函数、风险函数曲线等。

对某一研究因素不同水平的生存时间分布的比较。

控制另一个因素后对研究因素不同水平的生存时间分布的比较。

对多组生存时间分布进行两两比较。

(比较总体生存时间分布采用wilcoxon检验)Company LogoCompany Logo实例分析例1:为了比较不同手术方法治疗肾上腺肿瘤的疗效,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下所示:其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。

(1)计算甲、乙两法术后10月的生存率和标准误。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


生存率的标准误和置信区间
正态分布原理(Greenwood法):
SE[S(t i )] S(t i )
n (n
j1 j
i
dj
j
dj )
100(1-)%可信区间为:
S(t i ) u SES(t i )
不适合曲线尾部或接近尾部总体生存率的置信区间估计
生存率的标准误和置信区间
手术组
手术加化疗组
中位生存时间
19.1952 25
30

生存时间(月) 乳腺癌患者手术组与手术加化疗组的生存曲线
Log-rank检验

也称时序检验,用于两组或多组生存率比较, 基本思想是实际死亡数和期望死亡数之间的比 较,属于非参数检验。
(Ak Tk )2 2 Tk k 1
m
m 1
描述研究对象生存(死亡)的过程
生存函数(su积生存概率(cumulative probability of survival),简称生存率,记为S(t),指观 察对象经历时刻t后仍存活的概率。
S ( t ) P( T t )

S(0)=1,S(∞)=0,为单调递减函数。
生存曲线的比较

11例乳腺癌患者接受治疗(手术+化疗)后的 生存时间(月):
10
20

14
20+
15
24
16+ 19
26 28
19
10例乳腺癌患者单纯接受手术治疗后的生存时 间(月):
6 9 13 15 19 20 22 24
18
19
生存曲线
生 存 0.8 率
0.6 0.4 0.2 0.0 0 5 10 15 20 1.0
Mean(A)=12.5 Mean(B)=11.0
?
主要内容

生存分析中的基本概念 生存率的估计和生存曲线 生存曲线的log-rank检验 Cox比例风险回归模型

11例乳腺癌患者接受治疗(手术+化疗)后的 生存时间(月):
10 14 15 16+ 19 19 20 20+ 24 26 28
生存分析
郜艳晖 广东药学院卫生统计学教研室
主要内容

生存分析中的基本概念 生存率的估计和生存曲线 生存曲线的log-rank检验 Cox比例风险回归模型
引例:
分别用草药、西药治疗肝炎病人,两 组谷丙转氨酶的阴转率都是80%,问两药 的治疗效果相同吗?
疗效的评价: 1 结局:是否阴转 2 结局事件发生所经历的时间:从治疗开始到阴转的 时间
d1i c1i
(4) 1 1 0 1 0 1 0 1 2 1 0 1 1 0 0 10 (5) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
T1i
(6) 0.4762 0.4500 0.4211 0.4444 0.4118 0.8750 0.0000 0.4615 1.6667 0.7500 0.0000 0.4000 0.5000 0.0000 0.0000 6.8567
序 号 时间(月) 死亡数 期初例数 生存概率
pi (ni di ) / ni
生存率
S (ti )
标准误
SE[S (ti )]
i
(1) 1 2 3 4 5 6 7 8 9 10
ti
(2) 10 14 15 16+ 19 20 20+ 24 26 28
di
(3) 1 1 1 0 2 1 0 1 1 1
Log-rank检验
( 10 6.8567)2 ( 9 12.1433)2 2 6.8567 12.1433 2.2509
1
Log-rank检验

应用条件: 要求各组生存曲线不能交叉。若有交叉,提示 存在混杂因素,应用分层分析或多因素分析来 校正混杂作用。 前述log-rank检验为近似法(结果较保守); 一般统计软件中输出精确法。
随访研究
起点 终点 删失
研究开始时间
t
研究结束时间
随访研究
起点 终点 删失
研究开始时间
t
研究结束时间
起始事件和终点事件
疾病确诊 治疗开始 手 术 接触毒物 吸 毒 HIV感染 出 生 死亡 痊愈 复发 出现毒性反映 HIV感染 自杀未遂 发病
生存时间(survival time)

又称失效时间(failure time):定义为观察 对象从起始事件到终点事件所经历的时间,用 t表示。

高度和坡度 曲线下降速度快,图形坡度大,曲线陡峭,生 存率较低,生存期较短; 反之,生存率较高,生存期较长。
SAS程序
Proc lifetest method=PL; Time t*y(0); Run;
主要内容

生存分析中的基本概念 生存率的估计和生存曲线 生存曲线的比较(log-rank检验) Cox比例风险回归模型
生存率的估计

如无删失数据,
t时刻仍存活的例数 S ( t ) P( T t ) 观察总例数

如有删失数据,分母需要分时段校正。
生存率的估计

小样本时,不需要对生存时间进行分组,常用 乘积极限法(product-limited,PL),也称 Kaplan-Meier(K-M)法估计生存率。

大样本时,需要对生存时间进行分组,常用寿 命表(lifetime table)法估计生存率。
属于非参数方法
指某单位时段开始 指0时刻存活的个 时存活的个体到该 体在t时刻仍存活的 Kaplan-Meier,K-M法 时段结束时仍存活 概率。 的可能性。 11 例乳腺癌患者手术加化疗后的生存率及其标准误
F ( t ) P( T t ) f ( x )dx
0
t
风险函数(hazard function)

又称危险率函数、条件死亡率、人时死亡率等, 记为h(t),表示t时刻仍存活的个体(T>t)在(t, t+Δt)内死亡的概率。
P( t T t t / T t ) h( t ) lim t t 0 死于区间(t,t+t)的例数 在t时刻尚存的例数 t
n2i
(7) 11 11 11 10 10 9 8 7 7 5 4 3 3 2 1 11
d 2i
(8) 0 0 1 0 1 1 0 0 2 1 0 0 1 1 1 9
c2i T2i
(9) 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 2 (10) 0.5238 0.5500 0.5789 0.5556 0.5882 1.1250 0.0000 0.5385 2.3333 1.2500 0.0000 0.6000 1.5000 1.0000 1.0000 12.1433

3 9+ 15 20 20+ 26 30+
?
平均生存时间 ti的平均数 (当有删失数据时,求不出)
中位生存时间 ti的中位数 : 50%的病人生存, 50%的病人死亡的时间 (当删失较早或删失比例超过50%时, 求不出)
问题3 如何综合评价
两组间的比较: A 3 6 8 10 22 26 30+30+ B 6 8 10 20 30+30+30+30+ •以30天为界 的分类结果: 死亡 生存 A 6 2 B 4 4 •完全数据的均数:
生存率的对数变换:
G(t i ) ln{ ln[S(t i )]}
SE[G(t i )] S(t i )
n (n
j1 j
i
dj
j
dj )
nj dj ln j1 nj
i
2
exp{ exp[G( ti ) 1.96SE[ G( ti )]]}

SAS程序
Proc lifetest method=PL; Time t*y(0); Strata group; Run;
主要内容

生存分析中的基本概念 生存率的估计和生存曲线 生存曲线的log-rank检验 Cox比例风险回归模型
数据结构
t 6 9 10 y 1 1 0 x1 1 1 0 x2 … … x3 …
19
… …
1
0
概率密度函数

又称死亡密度函数,指观察对象在t时刻的瞬 时死亡率,记为f(t),
P( t T t t ) f ( t ) lim t 0 t
死于区间(t,t+t)的例数 观察总例数 t

累积分布函数,也称死亡概率,指观察对象从 观察开始到t时刻为止的死亡概率。
ni
(4) 11 10 9 8 7 5 4 3 2 1
(5) 10/11=0.9091 9/10=0.9000 8/9=0.8889 8/8=1.0000 5/7=0.7143 4/5=0.8000 4/4=1.0000 2/3=0.6667 1/2=0.5000 0/1=0.0000
(6) 0.9091 0.9091× 0.9000=0.8182 0.8182× 0.8889=0.7273 0.7273× 1.0000=0.7273 0.7273× 0.7143=0.5195 0.5195× 0.8000=0.4156 0.4156× 1.0000=0.4156 0.4156× 0.6667=0.2771 0.2771× 0.5000=0.1385 0.1385× 0.0000=0.0000
中位生存时间(median survival time)

表示50%的个体活过此时间,即生存率50%所对 应的生存时间。 当删失数据>样本量的50%时,无法估计中位 生存时间,宜用生存时间超过一给定时间长度 的概率(如3年生存率或5年生存率)来描述。
相关文档
最新文档