医学统计学-生存分析

合集下载

卫生统计学:生存分析

卫生统计学:生存分析
5年生存率=期活初满观5年察例例数数
条件生存概率和生存率的计算
例:手术治疗100例食管癌患者,术后1、 2、3年的死亡数分别为10、20、30,若无 截尾数据,试求各年条件生存概率及逐年 生存率。 生存率计算方法:
直接法 概率乘法定理
由例子可看出,生存率与条件生存概 率不同。条件生存概率是单个时段的 结果,而生存率实质上是累积条件生 存概率(cumulative probability of survival),是多个时段的累积结果。 例如,3年生存率是第1年存活,第2年 也存活,第3年还存活的可能性。
42 42 45+
Survival Functions
1.0
.8
.6
.4
组别
乙疗法组
.2
乙疗法组-censored
甲疗法组
0.0
甲疗法组-censored
0
10
20
30
40
50
生存时间
三、中位生存期
中位生存期(median survival time) 又称半数生存期,表示恰好有50%的 个体尚存活的时间。 中位生存期越长,表示疾病的预后越
比较:对不同处理组生存率进行比较,如 比较不同疗法治疗脑瘤的生存率,以了解 哪种治疗方案较优。
影响因素分析:目的是为了探索和了解影 响生存时间长短的因素,或平衡某些因素 影响后,研究某个或某些因素对生存率的 影响。如为改善脑瘤病人的预后,应了解 影响病人预后的主要因素,包括病人的年 龄、性别、病程、肿瘤分期、治疗方案等。
量化值
X1
性别
女=0
男=1
X2 年龄(岁) <40=1
40-60=2
≥60=3
X3 组织学分类

医学统计学--生存分析

医学统计学--生存分析

随访记录
终止 是否 生存 日期 死亡 时间 98/11/29 Y 140 98/12/29 Y 160 98/11/29 失访 99 98/11/25车祸死亡 36
随访研究资料
• 随访资料: • 随访观察某事件出现“某结局”和“结局 出现的时间”的资料统称为随访资料,评价 该资料的统计学方法为生存分析。 • 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法
起点 起点 死亡
死亡
失访
起点
起点
起点
90年 91年 92年
93年
存活 存活
(研究结束)
(三)生存分析主要研究的内容
• 1.统计描述:用统计指标描述生存过程, 计算不同时间点(t)的生存率
• 2.统计推断:统计检验不同处理方式的生 存过程有无差别
• 3.自变量(x)与时间(t)的关系:影响 生存时间的危险因素分析

• 甲药 • 乙药
• 疗效除了应评价“结局”的好坏,结 局所经历的时间长短也是评价疗效重 要的指标。
• 例:收集生存数据和影响预后的因素 。


• • • • • • • 病例 号 1 2 3 4
某病用不同药后随访记录(天)
预后因素
性别 处理 组 1 A药 2 B药 1 A药 2 B药 开始 日期 98/07/12 98/07/01 98/08/22 98/10/20
讲义例:17-1
• 某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下: • 1,3,5(3),6(3),7,8,10(2),14+, 17,,19+,20+,22+,26+,31+,34,34+,44, 59 • 注:( )括号内的数为相同时间点的人数 • 数据特点: • 1.生存时间的分布为偏态分布, • 2.有截尾值 • 3.每个值包含两个含义,即“t”和状态“死亡 与否”

医学统计学生存分析

医学统计学生存分析

5 59 2
1
0 07/20/1996 06/21/1998 23 1
死亡
6 59 1
1
1 08/19/1996 09/10/1999 37 1
死亡
1. 完全数据 (complete data) 按随访结局,2 号、5 号和 6 号患者
2. 删失数据 (censored data) 未能观察到终点事件发生,生存时间未知
例 21-1 374 名某恶性肿瘤患者随访资料
表 21-3 寿命表法估计生存率计算表
序 号
确诊 后 年数
期内 死亡 数
期内 删失 数
期初 病例 数
期初 有效 例数
死亡 概率
生存 概率
i
ti
di
ci
ni
ni
ni1 di1 ci1 ni 0.5ci
(1) (2)
(3)
(4)
(5)
生存率 标准误
SSˆ (ti )
(10) 0.0221 0.0257 0.0255 0.0248 0.0239 0.0235 0.0233 0.0233 0.0232 0.0232
生存曲线(survival curve) 以生存时间为横轴,生存率为纵轴,将各个时间点所 对应的生存率连接在一起的曲线
Sˆ (t k
)

P(T

tk
)

tk时刻仍存活的例数 观察总例数
若有删失数据,须分时段 (0,t1),(t1,t2 ),...,(tk 1,tk ) 计算生存 概率各时段上的 P1, P2,..., Pk
Sˆ(tk ) P(T tk ) p1 p2 pk Sˆ(tk1) pk
pi

医学统计学--生存分析

医学统计学--生存分析
1.临床治疗方案或处理措施的效果评价。如恶 性肿瘤手术或化疗后(转移或死亡前)生存时间、
肾移植术后生存时间、心脏起搏器的保留时间、
种植牙的保留时间等。 2.疾病危险因素分析和疾病预后的影响因素分析。 如肺癌发病危险因素分析、肾移植手术效果的影 响因素分析等。
3.特殊人群卫生保健措施的效果评价。如中老 年糖尿病预防效果评价、青少年控制吸烟的健康 教育干预试验效果评价、食管癌高发区干预措施 的效果评价、不同种类宫内节育器的节育效果评 价(宫内保留时间或有效避孕时间)、某疫苗接种 效果评价(观察抗体滴度了解免疫力持续时间或
生存概率 pt
0.9286 0.9231 0.9167 0.9091 0.9000 0.8889 0.8750 0.8571 0.8333 1.0000 0.7500 1.0000 0.5000 1.0000
生存率 S(t)
0.9268 0.8572 0.7858 0.7144 0.6429 0.5715 0.5001 0.4286 0.3571 0.3571 0.2678 0.2678 0.1339 0.1339
生存率(survival rate, survival function)表示 观察对象经历tk个单位时间段后仍存活的可能性。
0 S (t ) 1 。若无截尾数据,则
tk时刻仍存活的例数 S (tk ) P(T tk ) 观察总例数
若有截尾数据,须分时段计算生存概率。假 定观察对象在各个时段的生存事件独立,应用概 率乘法定理:
2. 某时点生存率不能反映整个生存过程,比较时可 能出现不正确的结论。
分析生存资料的统计方法称为生存分析 (survival analysis)。它是将事件的结局和发生 这种结局所经历的时间两个因素综合起来分析 的一种统计方法。它能够处理截尾数据, 并对整个生存过程进行分析或比较。

医学统计学-生存分析

医学统计学-生存分析

A meta-analysis is a two-stage process. 提取单个研究的数据,并估计其进行点估计和可信区间; 决定是否合适将结果汇总,若是,计算其汇总值。
Meta分析不仅是简单将单个研究的数据累加
Meta分析
系统综述的特征:最佳证据
*
规范的临床问题
1
全面、完整的资料
2
对原始研究的质量评价,纳入合格的研究
结果解读(2)
结果解读:生存函数
Gehan比分检验:其基本思想是,在假定无效假设(两总体生存曲线相同)成立的前提下,则两样本来自分布相同的总体,两样本的Gehan比分合计V值应为0,若V值偏离0太远,则无效假设成立的可能性就很小。
对数秩检验:其基本思想是,在假定无效假设(两总体生存曲线相同)成立的前提下,可根据不同日期两种处理的期初人数和死亡人数,计算各种处理在各个时期的理论死亡数。若无效假设成立,则实际死亡数与理论死亡数不会相差太大。
检索方法:常未说明 有明确检索策略
文献选择:有潜在偏倚 有明确入选/排除标准
文献评价:方法不统一 有严格评价方法
结果合成:定性 定量/定性
结论推断:有时遵循研究依据 大多遵循研究依据
生存分析的主要内容:
1
描述生存过程(估计生存函数)
2
比较生存过程(比较生存函数)
3
影响生存时间的因素分析
4
SPSS中的菜单位置
第一章
生存率的估计方法有参数法和非参数法。常用非参数法,非参数法主要有二个,即乘积极限法与寿命表法。
01
寿命表法适用于观察例数较多而分组的资料,不同的分组寿命表法的计算结果亦会不同,当分组资料中每一个分组区间中最多只有 1个观察值时,寿命表法的计算结果与乘积极限法完全相同。

医学统计学-生存分析课件

医学统计学-生存分析课件

PPT学习交流
26
【例2】某医院对100例胰腺癌切除术后的患者进行随 访,得资料如下。试分析其生存过程。
PPT学习交流
27
• (7)=(6)-(5)/2
• (8)=(4)/(7)
• (9)= 1-(8)
PPT学习交流
28
PPT学习交流
29
SPSS软件操作
• 第一步:建立变量。
PPT学习交流
30
医学统计学 (11)
PPT学习交流
1
•第一部分
•生存分析
•第二部分
•Meta分析
PPT学习交流
2
•第一部分
•生存分析
PPT学习交流
3
在医学研究中,常常用追踪的方式来研究事 物发展的规律。如:了解某药物的疗效,了解手 术的存活时间,了解某医疗仪器设备使用寿命等 等。
PPT学习交流
4
生存资料的特点
如:急性白血病病人从治疗开始到复发为止之间的缓解期, 冠心病病人两次发作之间的时间间隔,戒烟开始到重新吸烟 之间的时间间隔,接触危险因素到发病的时间间隔等。
生存分析中最基本的问题就是计算生存时间,要明确规定事 件的起点、终点及时间的测度单位,否则就无法分析比较。
PPT学习交流
8
中位生存时间是指寿命中位数,表示有且只有 50%的观察对象还可以活这么长时间。由于截尾 数据的存在,中位生存期的计算不同于普通的中 位数,它可以利用生存函数公式或生存曲线图, 令生存率为50%时,推算出生存时间。
21
• 第三步:生存分析(2)
PPT学习交流
22
• 第三步:生存分析(3)
PPT学习交流
23
• 第四步:结果解读(1)

原题目:医学统计学的生存分析

原题目:医学统计学的生存分析

原题目:医学统计学的生存分析
生存分析是医学统计学中常用的方法之一,用于研究某个事件发生或终止的时间,并分析这个事件与其他相关因素的关系。

本文将介绍生存分析的基本概念、应用场景和常用方法。

1. 基本概念
生存分析是一种统计方法,用于研究个体观测时间的分布和影响这个时间的因素。

其中,个体观测时间指的是从某个初始时间点开始,到某个事件发生或终止的时间间隔。

2. 应用场景
生存分析在医学领域中有着广泛的应用,特别是在研究疾病的发展、治疗效果和生存率等方面。

它可以帮助研究人员比较不同治疗方案的效果,评估疾病的预后和风险因素,并进行患者生存时间的预测。

3. 常用方法
生存分析的常用方法包括Kaplan-Meier曲线、Cox比例风险模型和Log-rank检验等。

Kaplan-Meier曲线是用来描述生存分析结果
的一种方法,可以根据不同组别或不同因素的生存时间进行比较。

Cox比例风险模型可以用来评估各个因素对生存时间的影响,并得到相对风险的估计值。

Log-rank检验则用于比较不同组别或不同因素下的生存时间差异是否显著。

在进行生存分析时,需要注意以下几点:
- 数据收集要准确可靠,避免遗漏或错误的观测;
- 样本量要足够大,以保证结果的可靠性;
- 统计方法要恰当选择,根据研究目的和数据特点采用合适的方法;
- 结果的解读要谨慎,避免过度解读或误导性的解释。

综上所述,生存分析在医学统计学中是一项重要的研究方法,可以帮助研究人员了解事件发生或终止的时间分布规律,并评估影响时间的因素。

在进行生存分析时,需要遵循科学的方法和原则,以确保研究结果的可靠性和准确性。

医学统计学之生存分析

医学统计学之生存分析
表示。
7
资料仅供参考,不当之处,请联系改正。
截尾值(Censored value)出现的原因
截尾的原因主要有3种: ①失访:生存但中途失访:包括拒绝访问、失去联
系等。 ②退出:中途退出试验、改变治疗方案、死于其它
与研究无关的原因:如肺癌患者死于心机梗塞、 自杀或因车祸死亡,终止随访时间为死亡时间。 ③终止:指观察期结束时仍未出现结局。
生存率(survival rate):指研究对象经历 t 个时段后仍存
活的概率,即生存时间大于等于 t 的概率,用 PT t
表示。
生存率随时间 t 变化而变化,即生存率是相对于时间 t 的
函数,称为生存函数(survival function),记为 S t 。
生存函数在某时点的函数值就是生存率。
8
资料仅供参考,不当之处,请联系改正。
关于截尾或删失
删失的模式图
患者进入期间
随访开始
失访 失访 研究截止时仍存活
事件
研究截止时点
9
资料仅供参考,不当之处,请联系改正。
3.生存时间资料的整理:
对于随访资料,需记录的原始数据包括开始观 察的时点(起始事件发生的时间)、终止观察的 时点、研究对象的结局、考虑的影响因素。生 存时间为反映时间长短的指标,属数值变量:
其研究内容主要包括 3 个方面:① 对生存状况 进行统计描述(生存概率、生存率、中位生存期等); ② 寻找影响生存时间的“危险因素”和“保护因素”; ③ 估计生存率和生存时间长短,进行预后评价。
5
资料仅供参考,不当之处,请联系改正。
一、基本概念
(一)生存时间(survival time): 1.定义:广义的生存时间是指从某个起始事件开
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品课件
描述生存过程
➢ 生存率的估计方法有参数法和非参数法。常用非 参数法,非参数法主要有二个,即乘积极限法与 寿命表法。
➢ 乘积极限法,又称Kaplan-Meier法,主要用于观 察例数较少(n<50)而未分组的生存资料;
➢ 寿命表法适用于观察例数较多而分组的资料,不 同的分组寿命表法的计算结果亦会不同,当分组 资料中每一个分组区间中最多只有 1个观察值时 ,寿命表法的计算结果与乘积极限法完全相同。
• Log-rank
精品课件
• 第三步:生存分析(4)
精品课件
• 第四步:结果解读(1)
结果解读:基本描述
精品课件
• 第四步:结果解读(2)
精品课件
• 第四步:结果解读(3)
结果解读:生存表统计描述 中位生存时间及95%CI
精品课件
• 第四步:结果解读(4)
结果解读:组间比较的Log Rank 检验
精品课件
• 第四步:生存分析(1)
精品课件
• 第四步:生存分析(2)
精品课件
• 第三步:生存分析(3)
精品课件
• 第四步:结果解读(1)
结果解读:寿命表描述
精品课件
• 第四步:结果解读(2) 结果解读:生存函数
精品课件
生存曲线的比较
• 对数秩检验:其基本思想是,在假定无效假设 (两总体生存曲线相同)成立的前提下,可根 据不同日期两种处理的期初人数和死亡人数, 计算各种处理在各个时期的理论死亡数。若无 效假设成立,则实际死亡数与理论死亡数不会 相差太大。
精品课件
• 第三步:生存分析(1)
精品课件
• 第三步:生存分析(2)
精品课件
• 第三步:生存分析(3)
精品课件
• 第四步:结果解读(1)
结果解读:生存表基本描述
精品课件
• 第四步:结果解读(2)
结果解读:生存表统计描述 中位生存时间及95%CI
精品课件
• 第四步:结果解读(3) 结果解读:生存函数图
• X3为有无淋巴结浸润(0=无,1=有),RR>1,危险因素
• X4为缓解出院后的巩固治疗(0=无,1=有),RR<1,保
护因素
精品课件
• 第四步:结果解读(2)
结果解读:生存函数,具体到个案的生存函
数估计值。
精品课件
PH(比例风险)假定判断
➢满足前提条件才可以进行Cox回归 ➢是否满足前提条件,看以因素为分类依据
精品课件
SPSS软件操作
• 第一步:建立变量。
精品课件
• 第二步:输入原始数据
精品课件
• 第三步:生存分析(1)
精品课件
• 第三步:生存分析(2)
精品课件
• 第三步:生存分析(3)
精品课件
• 第三步:生存分析(4)
精品课件
• 第四步:结果解读(1)
结果解读:有意义的因素,相对危险度RR及 其95%CI。
密度曲线,由曲线上可看出不同时间的死亡速率及死亡高峰时间。纵 坐标越大,其死亡速率越高,如曲线呈现单调下降,则死亡速率越来 越小,如呈现峰值,则为死亡高峰。
精品课件
生存分析的主要内容: 1.描述生存过程(估计生存函数) 2.比较生存过程(比较生存函数) 3.影响生存时间的因素分析
精品课件
SPSS中的菜 单位置
精品课件
• (6)/(11)=总死亡率 • 甲组理论死亡数=(9)*总死亡率 • 乙组理论死亡数=(10)*总死亡率
精品课件
精品课件
SPSS软件操作
• 第一步:建立变量。
精品课件
• 第二步:输入原始数据
精品课件
• 第四步:生存分析(1)
精品课件
• 第四步:生存分析(2)
精品课件
• 第三步:生存分析(3)
队列 研精究品课件
病例 对照 研究
横断面 研究
Meta分析
• 系统综述和meta分析的基本概念 • 系统综述的基本步骤介绍 • Meta分析 • 软件操作-----Rev Man
精品课件
系统综述
对某一具体的临床问题,系统、全面地 收集所有已发表或未发表的相关的临床研究文章 ,用统一、科学的评价标准筛选出合格的研究质 量评价,应用统计学方法定量综合/描述性方法 进行定性综合,得出可靠的结论,并随着新的临 床研究结果的出现及时作出更新。
• Gehan比分检验:其基本思想是,在假定无效假 设(两总体生存曲线相同)成立的前提下,则 两样本来自分布相同的总体,两样本的Gehan比 分合计V值应为0,若V值偏离0太远,则无效假 设成立的可能性就很小。
精品课件
【例3】某医生将20例某恶性肿瘤患者随机分为两组 ,一组采用纯中药治疗(甲组),另一组采用中西 医结合治疗(乙组),观察终点为死亡,从缓解出 院日开始随访。试分析两种治疗方案的效果有无差 别?
• 按观察对象生存时间的完整性可分为两种类型。 ➢ (1)完全数据:指观察起点到发生结局事件的时间
明确、完整的资料,即具有明确完整生存时间的 数据。 ➢ (2)截尾数据:指由于其他因素(非研究因素)导致 观察对象的生存时间难以明确判断,这种生存时 间数据称为截尾数据。也称为截尾值、删失值或 终检值。 ➢ 不论截尾数据的产生原因为何,截尾生存时间的 计算均为观察起点至截尾点所经历的时间,而且 一般情况下其准确的生存时间要长于截尾时间, 常在此类数据的右上角标记“+”。
精品课件
生存分析基本概念
起始事件是反映生存时间起始特征的事件,如疾 病确诊、某种疾病治疗开始、接触毒物等。
在生存分析随防研究过程中,一部分研究对象可 观察到死亡,可以得到准确的生存时间,它提供 的信息是完全;这种事件称为失效事件,也称之 为死亡事件、终点事件。
精品课件
➢ 生存时间(survival time)是指任何两个有联系事件之间 的时间间隔,常用t表示。狭义的生存时间指患某疾病的 病人从发病到死亡所经历的时间跨度,广义的生存时间定 义为从某种起始事件到终点事件所经历的时间跨度。
精品课件
• 第四步:结果解读(3) 结果解读:生存曲线
精品课件
• 第四步:结果解读(4)
结果解读:组间比较 Z=1.706,p=0.191
精品课件
COX比例风险回归模型
➢在医学研究中,观察对象生存时间往往受多种因 素的影响,如胃癌手术后的生存时间,除了与治疗 方案有关外,还可能与患者年龄、体质、病情轻重 、病理类型、用药等情况有关。统计学上将这些因 素称为协变量。 ➢由于生存时间资料常存在截尾值,生存时间t往 往不能满足正态分布和方差齐性的要求,一般不适 宜用参数方法(如多元线性回归等)来分析生存时间 与各协变量之间的关系。 ➢为解决这类问题,英国生物统计学家 D. R Cox 于 1972 年提出比例风险回归模型用于分析带有协 变量的生存时间资料。
精品课件
Meta分析
• A meta-analysis is a two-stage process.
–提取单个研究的数据,并估计其进行点估计和 可信区间;
–决定是否合适将结果汇总,若是,计算其汇总 值。
• Meta分析不仅是简单将单个研究的数据累加
精品课件
系统综述的特征:最佳证据
• 规范的临床问题 • 全面、完整的资料 • 对原始研究的质量评价,纳入合格的研究 • 统计学综合(meta分析)/ 描述性综合(偏倚
•From: Critical Appraisal Skills Programme (CASP),
Oxford.
精品课件
传统综述和SR比较
传统综述
研究问题:涉及范围泛 文献来源:不全面 检索方法:常未说明 文献选择:有潜在偏倚 文献评价:方法不统一 结果合成:定性 结论推断:有时遵循研究依据 结果更新:不定期更新
的生存曲线是否不交叉,若有交叉则表示 不满足前提条件
精品课件
• 第五步:PH假定判断(1)
精品课件
• 第五步:PH假定判断(2)
精品课件
• 第六步:结果解读(1)
精品课件
• 第六步:结果解读(2)
精品课件
同理将X3改为X4
• 重复相同的步骤
精品课件
• 第五步:PH(比例风险)假定判断(1)
精品课件
【例5】50例某恶性肿瘤的生存时间及有关预后因素资料如 表。X1为患者年龄、X2为病理类型(0=低分化,1=高分 化),X3为有无淋巴结浸润(0=无,1=有),X4为缓解 出院后的巩固治疗(0=无,1=有),T为患者的生存时间 ,S为患者的随访结局(0=截尾,1=死亡)。试进行生存 分析。
相互排斥的事件,如生存与死亡、有效与无效等 。 ➢ (3)生存资料一般需经过前瞻性随访观察才能获得 ,随访往往从某统一的时点开始,到某规定的时 点结束,所以生存资料有时也称为随访资料。 ➢ (4)由于失访等原因使一些研究对象的生存时间难 判断,导致部分生存时间数据不完整。
精品课件
生存资料的数据类型
➢ 如:急性白血病病人从治疗开始到复发为止之间的缓解期, 冠心病病人两次发作之间的时间间隔,戒烟开始到重新吸烟 之间的时间间隔,接触危险因素到发病的时间间隔等。
➢ 生存分析中最基本的问题就是计算生存时间,要明确规定事 件的起点、终点及时间的测度单位,否则就无法分析比较。
精品课件
➢ 中位生存时间是指寿命中位数,表示有且只有50% 的观察对象还可以活这么长时间。由于截尾数据 的存在,中位生存期的计算不同于普通的中位数 ,它可以利用生存函数公式或生存曲线图,令生 存率为50%时,推算出生存时间。
精品课件
➢ 生存函数 ➢ 生存概率又称为生存率或生存函数,它表示一个病人的生存
时间长于时间t的概率,用S(t)表示。 ➢ 以时间t为横坐标,S(t)为纵坐标所作的曲线称为生存率曲线
相关文档
最新文档