医学统计学课件--生存分析第十七章
合集下载
《医学统计学》完整课件

确保受试者在医学统计学研究中的权 益得到充分尊重,遵循知情同意原则
,不损害受试者身心健康。
保护隐私
对受试者个人信息和数据进行严格保 密,防止数据泄露和滥用,确保个人
隐私不受侵犯。
公正选择受试者
遵循公平、公正原则,合理选择受试 者,避免任何形式的歧视和偏见。
数据安全与隐私保护
1 2
数据加密与备份
对医学统计数据进行加密处理,确保数据安全; 同时定期备份数据,防止数据丢失。
医学统计学的应用领域
临床试验
流行病学
在临床试验中,医学统计学用于分析试验 数据,评估治疗效果和安全性。
在流行病学研究中,医学统计学用于分析 疾病分布和影响因素,为预防和控制疾病 提供依据。
公共卫生
生物统计学
在公共卫生领域,医学统计学用于监测和 评估公共卫生状况,制定和评估公共卫生 政策。
在生物统计学中,医学统计学用于研究生 物学数据的分布和变化规律,为生物学研 究和医学研究提供支持。
生存分析中的多因素分析方法
多因素分析方法
考虑多个因素对生存时间的影响,常用方法有Cox比例风险模型和 分层分析等。
Cox比例风险模型
一种半参数模型,用于研究多个因素对生存时间的影响,并给出相 对风险比。
分层分析
将研究对象按照某些特征进行分层,然后在各层内进行统计分析,以 探讨各层内因素对生存时间的影响。
数据整理
对收集到的数据进行整理、核对和分类,确 保数据的规范化和标准化。
数据分析
选择合适的数据分析方法和技术,对数据进 行深入分析和挖掘,得出科学结论。
报告撰写
按照学术规范和要求,撰写研究报告或论文 ,客观地呈现研究结果和结论。
07
医学统计学中的伦理问题与数 据安全
,不损害受试者身心健康。
保护隐私
对受试者个人信息和数据进行严格保 密,防止数据泄露和滥用,确保个人
隐私不受侵犯。
公正选择受试者
遵循公平、公正原则,合理选择受试 者,避免任何形式的歧视和偏见。
数据安全与隐私保护
1 2
数据加密与备份
对医学统计数据进行加密处理,确保数据安全; 同时定期备份数据,防止数据丢失。
医学统计学的应用领域
临床试验
流行病学
在临床试验中,医学统计学用于分析试验 数据,评估治疗效果和安全性。
在流行病学研究中,医学统计学用于分析 疾病分布和影响因素,为预防和控制疾病 提供依据。
公共卫生
生物统计学
在公共卫生领域,医学统计学用于监测和 评估公共卫生状况,制定和评估公共卫生 政策。
在生物统计学中,医学统计学用于研究生 物学数据的分布和变化规律,为生物学研 究和医学研究提供支持。
生存分析中的多因素分析方法
多因素分析方法
考虑多个因素对生存时间的影响,常用方法有Cox比例风险模型和 分层分析等。
Cox比例风险模型
一种半参数模型,用于研究多个因素对生存时间的影响,并给出相 对风险比。
分层分析
将研究对象按照某些特征进行分层,然后在各层内进行统计分析,以 探讨各层内因素对生存时间的影响。
数据整理
对收集到的数据进行整理、核对和分类,确 保数据的规范化和标准化。
数据分析
选择合适的数据分析方法和技术,对数据进 行深入分析和挖掘,得出科学结论。
报告撰写
按照学术规范和要求,撰写研究报告或论文 ,客观地呈现研究结果和结论。
07
医学统计学中的伦理问题与数 据安全
图文《医学统计学》PPT课件

步骤
提出假设、构造检验统计量、确定拒绝域、计算p值、做出决策。
t检验和方差分析
t检验
用于比较两组均数是否有差别,包括单样本t检验、配对样本t检验和独立样本t检验。
方差分析
用于比较多组均数是否有差别,包括单因素方差分析和多因素方差分析。
卡方检验和秩和检验
卡方检验
用于推断两个或多个总体率或构成比之 间有无差别,多用于分类资料的统计分 析。
特点
以医学为背景,以数据为基础, 运用统计学方法揭示医学现象的 数量特征和规律。
发展历程及现状
发展历程
医学统计学经历了从描述性统计到推 断性统计,再到现代多元统计分析的 发展历程。
现状
随着计算机技术的发展和大数据时代 的到来,医学统计学在医学研究和实 践中发挥着越来越重要的作用。
研究对象与任务
研究对象
样本量
样本中所包含的个体数目 。
随机抽样与非随机抽样
随机抽样
按照随机原则从总体中抽取样本的方法,保证每个个体被抽 中的机会相等。
非随机抽样
根据研究者的主观意愿或方便性选择样本的方法,可能导致 选择偏倚。
变量与数据类型
变量
研究中观察或测量的特征或属性。
数据类型
根据变量的性质可分为定量数据和定性数据。定量数据包括连续型数据和离散型 数据,定性数据包括分类数据和顺序数据。
医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务
医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分 析影响医学现象的因素、预测医学现象的发展趋势等。
02
医学统计学基本概念
总体与样本
01
02
03
总体
提出假设、构造检验统计量、确定拒绝域、计算p值、做出决策。
t检验和方差分析
t检验
用于比较两组均数是否有差别,包括单样本t检验、配对样本t检验和独立样本t检验。
方差分析
用于比较多组均数是否有差别,包括单因素方差分析和多因素方差分析。
卡方检验和秩和检验
卡方检验
用于推断两个或多个总体率或构成比之 间有无差别,多用于分类资料的统计分 析。
特点
以医学为背景,以数据为基础, 运用统计学方法揭示医学现象的 数量特征和规律。
发展历程及现状
发展历程
医学统计学经历了从描述性统计到推 断性统计,再到现代多元统计分析的 发展历程。
现状
随着计算机技术的发展和大数据时代 的到来,医学统计学在医学研究和实 践中发挥着越来越重要的作用。
研究对象与任务
研究对象
样本量
样本中所包含的个体数目 。
随机抽样与非随机抽样
随机抽样
按照随机原则从总体中抽取样本的方法,保证每个个体被抽 中的机会相等。
非随机抽样
根据研究者的主观意愿或方便性选择样本的方法,可能导致 选择偏倚。
变量与数据类型
变量
研究中观察或测量的特征或属性。
数据类型
根据变量的性质可分为定量数据和定性数据。定量数据包括连续型数据和离散型 数据,定性数据包括分类数据和顺序数据。
医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务
医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分 析影响医学现象的因素、预测医学现象的发展趋势等。
02
医学统计学基本概念
总体与样本
01
02
03
总体
生存分析医学ppt课件

0 1 2 3 4 5 6 7 8 9 10 时间/年
图1 某恶性肿瘤生存曲线(寿命表法)
1. 曲线折线形:因不知道时段内生存率的变化规律,故用 直线连接各端点,形成一条折线。
2. 曲线连续:可估计任意时点的纵坐标值(生存率)。
3. 曲线尾部稳定性好:寿命表法用于大样本,通常最后一 个时段仍有一定观察例数,故曲线尾部稳定性较好。
③终止:指研究结束时终点事件尚未发生。
* 终点事件 + 截尾值
研究起始
* *
+
+ +
*
+
研究终点
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
(5) 生存时间的特点: ①同时考虑生存结局和生存时间; ②生存时间可能含有删失数据; ③生存时间的分布和常见的统计分布有明显不同,如呈指数
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
生存分析 Survival Anห้องสมุดไป่ตู้lysis
公共卫生学院卫生统计学教研室
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
(3)根据是否观察到研究对象的结局,将生存时间数据的分为 两类:
①完全数据(complete data):观察对象在观察期内出现终点 事件,这时记录到的时间信息是完整的,这种生存时间数 据称为完全数据。
图1 某恶性肿瘤生存曲线(寿命表法)
1. 曲线折线形:因不知道时段内生存率的变化规律,故用 直线连接各端点,形成一条折线。
2. 曲线连续:可估计任意时点的纵坐标值(生存率)。
3. 曲线尾部稳定性好:寿命表法用于大样本,通常最后一 个时段仍有一定观察例数,故曲线尾部稳定性较好。
③终止:指研究结束时终点事件尚未发生。
* 终点事件 + 截尾值
研究起始
* *
+
+ +
*
+
研究终点
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
(5) 生存时间的特点: ①同时考虑生存结局和生存时间; ②生存时间可能含有删失数据; ③生存时间的分布和常见的统计分布有明显不同,如呈指数
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
生存分析 Survival Anห้องสมุดไป่ตู้lysis
公共卫生学院卫生统计学教研室
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
(3)根据是否观察到研究对象的结局,将生存时间数据的分为 两类:
①完全数据(complete data):观察对象在观察期内出现终点 事件,这时记录到的时间信息是完整的,这种生存时间数 据称为完全数据。
《医学生存分析》PPT课件

p2、…pt,S(t)=p1×p2×…×pt ,即累积生存概率。
24.11.2020
h
29
24.11.2020
h
30
可采用SPSS软件中生存分析方法计算出生 存率大小,并画出生存函数图(或生存率 曲线)直接观察。
研究者关心的研究对象的特定结局,当被观察 对象出现终点事件通常记为1,出现截尾记为0。 起点事件是反映研究对象生存过程的起始特征的 事件。
生存时间的起点和终点要有严格、统一的定义, 以便于计算生存时间。
24.11.2020
h
16
3、暴露因素及混杂因素 除了要研究的危险因素(暴露因素)外,还要控
制混杂因素的影响。
必须分清暴露因素和混杂因素。
如:在比较A、B两种治疗方案治疗某恶性疾病 的生存情况的同时,病人的肾功能状况也影响 治疗后的生存情况。这项研究中,暴露因素为 A、B两种治疗方案,混杂因素是肾功能状况。
24.11.2020
h
17
随访资料的特点
1、生存时间的分布呈偏态。 一般为正偏态,因为生存时间一般为单调递减。 102名黑色素瘤患者的生存时间资料,做直方图。
对于例2,若比较两组的存活率,可采用两样本卡 方检验;但只考虑了生存效果评价的其中一个方 面。
而评价生存效果,不仅要看是否出现了某种结局 (如:有效、治愈、死亡等),还要考虑出现这 些结局所经历的时间长短。(举例说明)
24.11.2020
h
6
措施:采用生存分析方法。
生存分析方法特点: (1)能将研究对象的随访结局和生存时间两个因素同时结
24.11.2020
h
14
“生存”和“死亡” 扩展为具有两类互斥结 果的事件,“生存”是某事件某状态的持 续, “死亡”是某终点事件的发生。
24.11.2020
h
29
24.11.2020
h
30
可采用SPSS软件中生存分析方法计算出生 存率大小,并画出生存函数图(或生存率 曲线)直接观察。
研究者关心的研究对象的特定结局,当被观察 对象出现终点事件通常记为1,出现截尾记为0。 起点事件是反映研究对象生存过程的起始特征的 事件。
生存时间的起点和终点要有严格、统一的定义, 以便于计算生存时间。
24.11.2020
h
16
3、暴露因素及混杂因素 除了要研究的危险因素(暴露因素)外,还要控
制混杂因素的影响。
必须分清暴露因素和混杂因素。
如:在比较A、B两种治疗方案治疗某恶性疾病 的生存情况的同时,病人的肾功能状况也影响 治疗后的生存情况。这项研究中,暴露因素为 A、B两种治疗方案,混杂因素是肾功能状况。
24.11.2020
h
17
随访资料的特点
1、生存时间的分布呈偏态。 一般为正偏态,因为生存时间一般为单调递减。 102名黑色素瘤患者的生存时间资料,做直方图。
对于例2,若比较两组的存活率,可采用两样本卡 方检验;但只考虑了生存效果评价的其中一个方 面。
而评价生存效果,不仅要看是否出现了某种结局 (如:有效、治愈、死亡等),还要考虑出现这 些结局所经历的时间长短。(举例说明)
24.11.2020
h
6
措施:采用生存分析方法。
生存分析方法特点: (1)能将研究对象的随访结局和生存时间两个因素同时结
24.11.2020
h
14
“生存”和“死亡” 扩展为具有两类互斥结 果的事件,“生存”是某事件某状态的持 续, “死亡”是某终点事件的发生。
医学统计学:生存分析(sun)

T T
)
2
组数-1
(14.13)
式中A为实际死亡数,T为理论 死亡数。
用log-rank检验对样本的生存率进行比较 时,要求各组生存曲线不能交叉,生存 曲线的交叉提示存在某种混杂因素,此 时应采用分层的办法或多因素的办法来 校正混杂因素。
第四节 Cox比例风险回归模型
对于生存数据的分析,常见的有生存时间的分位数、 中位生存时间、生存函数估计、log-rank检验等,这些 方法已广泛应用于医学的疗效评价和预后分析。在实 践中,人们发现生存分析资料,尤其是医学临床随访 资料具有一定的特殊性,主要表现在生存时间的分布 种类繁多且难以确定,存在截尾数据,需要考虑多个 协变量的影响等。
Cox模型的注意事项
①注意研究资料的代表性及可靠性,保证研究对象是 总体中的一个随机样本;协变量在研究对象中的分布 要适中,否则会给参数的估计带来困难;应将一切可 能因素都包括在调查分析之中,否则容易造成分析结 果的偏差;②对研究生存时间要有明确的规定,如果 以“发病”作为观察的起点,则要对“发病”有一个 明确的规定,对终止事件也要有一个明确的规定,如 果将“治愈”作为结局的终止事件,则要对“治愈” 有一个明确的规定;③如果研究的变量随时间而发生 变化,可以采用伴时协变量的Cox模型进行分析。④ Cox模型分析时,样本含量不宜过小,一般在40例以上。 随着协变量的增加其样本含量应适当的增加,要求样 本含量为观察协变量的5~20倍。要尽量避免观察对象 的失访,过多的失访容易造成研究结果的偏倚。
四、Cox模型的统计描述
1.回归系数和标准回归系数 Cox模 型在分析时可以给出回归系数和标准回 归系数,回归系数用来反映因素对生存 时间影响的强度,一般而言,回归系数 愈大,则因素对生存时间的影响也愈大。 标准回归系数可以比较不同因素间对生 存时间的影响程度,标准回归系数绝对 值较大的因素对生存时间的影响也较大。
医学统计学课件--生存分析第十七章

8
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有:
①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。
截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
2.研究对象观察时间长度相等。
2019/12/4
医学统计学
5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究.
例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较.
例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较.
该类数据通过随访得到,称为随访资料。
100 2019/12/4
100 医学统计学
22
生存时间数据分析时整理示意图
•
• •
失访
死亡
失访
死亡
死亡
死亡
0 2 4 6 8 10 12 14 16 18 20 年
t
2019/“12t/4”表示从研究起医点学统到计学结局出现时间
23
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
为0点)开始,到t时刻仍存活的概率。常用n年 生存率表示。
n年生存率
s(t)
ti时刻存活的人数( 观察的总人数
X
)
时间ti ,i=1,2,3…n
2019假/12/4 设数据是完全数医学据统计,学 计算见例
21
例:某病病人术后生存率
生存 期初
《医学生存分析》课件

生存函数是描述对象在给定时间点之前生存的概率的函数。
定义
通常采用生存概率函数、累积生存函数和条件生存函数三种方式。
计算方法
定义
风险函数是指在给定时间点之前生存的概率相对于时间变化的函数。
计算方法
通常采用函数表达式或估计参数的方法进行计算。
风险函数
Cox比例风险模型是一种半参数模型,用于研究多个因素对生存时间的影响。
数据探索性分析
数据描述
对数据进行描述性统计分析,包括均值、中位数、众数、方差等指标,以了解数据的基本特征。
生存模型
01
选择合适的生存模型,如Cox比例风险模型、Weibull模型等进行拟合。
基于生存模型的数据分析
模型评估
02
通过交叉验证、ROC曲线、Hosmer-Lemeshow检验等方法评估模型的性能。
研究背景及目的
数据来源
本课件所使用的数据来源于某三甲医院的一项关于某疾病患者生存时间的研究。
数据预处理
数据预处理包括数据清理、缺失值处理、异常值处理、数据转换等方面,以确保数据质量和分析结果的可靠性。
数据来源及预处理
生存模型
本课件将介绍常用的生存模型,如Cox比例风险模型、Weibull模型和Log-rank检验等。
生存分析可以帮助医生更好地了解患者的病情和预后,从而制定更加个性化的治疗方案。
医学研究中生存分析的优势
生存分析在医学研究中的挑战
生存分析中的数据往往存在缺失和异质性,需要进行特殊处理和调整,否则可能影响分析结果的准确性。
生存分析中的一些参数和模型的选择需要基于经验和专业知识,对于医学研究者的专业知识和经验要求较高。
指导制定治疗方案
通过对患者的生存分析,医生可以了解不同治疗方案下患者的生存情况,从而指导制定更合适的治疗方案。
统计-生存分析课件PPT

有/无序变量 --- 多项式(multinomial)Logistic 回归
• 时间事件变量 --- 生存分析
基本概念
生存分析主要研究内容
统计学分析
理想情况-相同随访时间
基本概念
生存分析主要研究内容
统计学分析
实际情况-不同随访时间
基本概念
生存分析主要研究内容
统计学分析
相关概念 • 生存分析:对一个或多个非负随机变量进行统计推断,研究事件发生和
二、得分检验 (score test) 检验一个或多个新 变量能否引入模型
三、Wald 检验 检验模型中的变量 是否被剔除
THANK YOU FOR ATTENTION
IF YOU HAVE ANY QUERY, PLEASE FEEL FREE TO ASK ME
响应时间数据及其统计规律的一种统计方法,既考虑结果又考虑生存时
间,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特
征进行描述,对影响生存时间的主要因素进行分析。
• 事件:研究中规定的生存研究的终点(endpoint),结局变量(0 / 1)
• 生存时间:某个起始时间开始,到某个终点事件(方案中规定的事件)
时间 (月)
事件发生
6.4
1
4.5
1
2.5
0
2.9
0
3.8
1
基本概念
生存分析主要研究内容
统计学分析
生存概率等指标的估计
• 分子 • 分母
= 发生事件数(d) = 总风险人时(pt)
• 所研究事件 发生率(人时)
发生事件数(d) = 总风险人时(pt)
• Rate = 3/(6.4+4.5+2.5+2.9+3.8) = 0.149 per pm
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例17-3 表17-3 2418例男性心绞痛病人生存率情况 术后 死亡 截尾 期初 校正 生存 生存率 年数 人数 人数 人数 人数 概率 (t+1)
0- 456 0 2418 2418 0.8114 0.8114
1- 226 39 1962 1942.5 0.8837 0.717
2- 152 22 1697 1686 0.9098 0.6524
*要求掌握概念、方法、用途。
2019/10/22
医学统计学
2
概述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2019/10/22
医学统计学
3
例
甲药 乙药
某病的疗效比较
治愈率(%) 平均治愈时间(月)
2019/10/22
医学统计学
10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。
2.明确结局事件:如死亡或复发。
3.明确研究跨度时间:如2000年至2019年结束。
4.记录个体影响结果(y)的其他自变量。
2019/10/22
医学统计学
11
例:收集生存数据和影响预后的因素 。
29
表17-1资料甲手术描述指标(SPSS 软件)
Survival Time
Standard error
95% Confidence Interval
Mean: 24.23 4.99
( 14.44, 34.01 )
Median: 10.00 6.96
(.00, 23.63 )
•
•
表17-2资料乙手术描述指标
8
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有:
①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。
截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
2.研究对象观察时间长度相等。
2019/10/22
医学统计学
5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究.
例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较.
例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较.
该类数据通过随访得到,称为随访资料。
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
2019/10/22
如给药
医学统计学
t
研究结
束时间
14
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
90年
2019/10/22
起点
起点
91年
92年
医学统计学
存活 存活
93年(研究结
束)
15
资料整理和记录
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下:
80
20
81
12
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2019/10/22
医学统计学
4
例2:
两种方法对疾病的疗效
方法 治疗人数 生存人数 生存率%
甲方法 100
20
20
乙方法 100
50
50
经χ2检验 p<0.05,乙法预后优于甲法。
假定:
1.观察期间疾病的死亡率不随时间变化。
1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59
注:( )括号内的数为相同时间点的人数
数据另一种记录:
对象编号 生存时间(t) 结局状态(0为截尾值)
1
1
1
2
14
0
2019/10/22
医学统计学
16
(三)生存分析主要研究的内容
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。
2.统计推断:检验不同处理方式的生存过程 有无统计差别.
3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2019/10/22
医学统计学
17
第二节 生存率的估计与生存曲线
(一)描述生存资料的几个指标
1.不同时间点生存率
死亡 概率
0.043 0.045 0.t143 0.167 0.067 0.071 0.154 医学0统.0计学00
生存 概率
0.957 0.955 0.857 0.833 0.933 0.929 0.846 1.000
生存率
p(xt)
0.957 0.914 0.783 0.652 0. 609 0.565 0.478 0.478
,14+,17,19+,20+,22+,26+,
31+,34,34+,44,59
计算生存率s(t)和生存曲线
2019/10/22
医学统计学
28
表17-1 甲种手术后病人生存率的计算方法
时间(月) 死亡
ti
人数
1
1
3
1
5
3
6
3
7
1
8
1
10 2
14+ 0 2019/10/22
期初 人数
23 22 21 18 15 14 13 11
2.生存曲线
3.中位生存时间
2019/10/22
医学统计学
18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年死亡 某 某 率年 年的 内平 死均 亡 1人 0数 0%数 0
2019/10/22
医学统计学
19
死亡概率、生存概率
0
2019/10/22
医学统计学
12
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2019/10/22
医学统计学
13
动物实验随访数据(图17-1,a)
2.生存曲线:(survival curve)
指各时点(t)为横轴,生存率S(t)为纵轴,连 接一起的曲线图。描述生存率在各时点(t)的 变化过程。
3.半数生存期(中位数生存时间)
即生存率为0.5时对应的时间(t),描述一 组数据平均生存时间。
注:生存时间(t)是正偏态分布。
2019/10/22
医学统计学
2019/10/22
医学统计学
9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。
3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
23
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
概率乘法原理计算(359页)
s(ti) p ip 1p 2..p i. (公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
2019/10/22
医学统计学
24
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
F某 某 时 时 间 间 段 段 内 初 的 的 死 观 亡 察 数 数d n (17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束
时仍存活的概率。
2019/10/22
某时间段存活人数 p 某时医学间统计学段初的观察数 20
生存率(survival rate)
称为生存函数 记为S(t) S(t) :指观察对象从起始事件(如手术时间
为0点)开始,到t时刻仍存活的概率。常用n年 生存率表示。
n 年 生 存 率 s(t)ti时 刻 观 存 察 活 的 的 总 人 人 数 数 (X )
时间ti ,i=1,2,3…n
2019假/10/22设数据是完全数医学据统计,学 计算见例
25
Survival Functions
1.2
1.0
甲手术
.8
乙手术
.6
.4
.2
0.0
-.2 0
10
20
30
40
50
月 60
图20191/170/2-22 两种手术治疗医方学统式计学术后病人生存曲线的比26 较
(二)生存率估计的统计方法 (非参数方法)
1.小样本数据生存率计算*。
用 kaplan-Meier的乘积极限法(productlimit method,PL法)
21
例:某病病人术后生存率
生存 期初
(ti1,ti ) 人数
[0,1] 100 [1,2] 90 [2,3] 80
死亡 生存 死亡 生存 生存率
人数 人数 概率 概率 s (ti )
0- 456 0 2418 2418 0.8114 0.8114
1- 226 39 1962 1942.5 0.8837 0.717
2- 152 22 1697 1686 0.9098 0.6524
*要求掌握概念、方法、用途。
2019/10/22
医学统计学
2
概述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2019/10/22
医学统计学
3
例
甲药 乙药
某病的疗效比较
治愈率(%) 平均治愈时间(月)
2019/10/22
医学统计学
10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。
2.明确结局事件:如死亡或复发。
3.明确研究跨度时间:如2000年至2019年结束。
4.记录个体影响结果(y)的其他自变量。
2019/10/22
医学统计学
11
例:收集生存数据和影响预后的因素 。
29
表17-1资料甲手术描述指标(SPSS 软件)
Survival Time
Standard error
95% Confidence Interval
Mean: 24.23 4.99
( 14.44, 34.01 )
Median: 10.00 6.96
(.00, 23.63 )
•
•
表17-2资料乙手术描述指标
8
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有:
①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。
截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
2.研究对象观察时间长度相等。
2019/10/22
医学统计学
5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究.
例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较.
例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较.
该类数据通过随访得到,称为随访资料。
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
2019/10/22
如给药
医学统计学
t
研究结
束时间
14
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
90年
2019/10/22
起点
起点
91年
92年
医学统计学
存活 存活
93年(研究结
束)
15
资料整理和记录
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下:
80
20
81
12
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2019/10/22
医学统计学
4
例2:
两种方法对疾病的疗效
方法 治疗人数 生存人数 生存率%
甲方法 100
20
20
乙方法 100
50
50
经χ2检验 p<0.05,乙法预后优于甲法。
假定:
1.观察期间疾病的死亡率不随时间变化。
1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59
注:( )括号内的数为相同时间点的人数
数据另一种记录:
对象编号 生存时间(t) 结局状态(0为截尾值)
1
1
1
2
14
0
2019/10/22
医学统计学
16
(三)生存分析主要研究的内容
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。
2.统计推断:检验不同处理方式的生存过程 有无统计差别.
3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2019/10/22
医学统计学
17
第二节 生存率的估计与生存曲线
(一)描述生存资料的几个指标
1.不同时间点生存率
死亡 概率
0.043 0.045 0.t143 0.167 0.067 0.071 0.154 医学0统.0计学00
生存 概率
0.957 0.955 0.857 0.833 0.933 0.929 0.846 1.000
生存率
p(xt)
0.957 0.914 0.783 0.652 0. 609 0.565 0.478 0.478
,14+,17,19+,20+,22+,26+,
31+,34,34+,44,59
计算生存率s(t)和生存曲线
2019/10/22
医学统计学
28
表17-1 甲种手术后病人生存率的计算方法
时间(月) 死亡
ti
人数
1
1
3
1
5
3
6
3
7
1
8
1
10 2
14+ 0 2019/10/22
期初 人数
23 22 21 18 15 14 13 11
2.生存曲线
3.中位生存时间
2019/10/22
医学统计学
18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年死亡 某 某 率年 年的 内平 死均 亡 1人 0数 0%数 0
2019/10/22
医学统计学
19
死亡概率、生存概率
0
2019/10/22
医学统计学
12
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2019/10/22
医学统计学
13
动物实验随访数据(图17-1,a)
2.生存曲线:(survival curve)
指各时点(t)为横轴,生存率S(t)为纵轴,连 接一起的曲线图。描述生存率在各时点(t)的 变化过程。
3.半数生存期(中位数生存时间)
即生存率为0.5时对应的时间(t),描述一 组数据平均生存时间。
注:生存时间(t)是正偏态分布。
2019/10/22
医学统计学
2019/10/22
医学统计学
9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。
3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
23
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
概率乘法原理计算(359页)
s(ti) p ip 1p 2..p i. (公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
2019/10/22
医学统计学
24
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
F某 某 时 时 间 间 段 段 内 初 的 的 死 观 亡 察 数 数d n (17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束
时仍存活的概率。
2019/10/22
某时间段存活人数 p 某时医学间统计学段初的观察数 20
生存率(survival rate)
称为生存函数 记为S(t) S(t) :指观察对象从起始事件(如手术时间
为0点)开始,到t时刻仍存活的概率。常用n年 生存率表示。
n 年 生 存 率 s(t)ti时 刻 观 存 察 活 的 的 总 人 人 数 数 (X )
时间ti ,i=1,2,3…n
2019假/10/22设数据是完全数医学据统计,学 计算见例
25
Survival Functions
1.2
1.0
甲手术
.8
乙手术
.6
.4
.2
0.0
-.2 0
10
20
30
40
50
月 60
图20191/170/2-22 两种手术治疗医方学统式计学术后病人生存曲线的比26 较
(二)生存率估计的统计方法 (非参数方法)
1.小样本数据生存率计算*。
用 kaplan-Meier的乘积极限法(productlimit method,PL法)
21
例:某病病人术后生存率
生存 期初
(ti1,ti ) 人数
[0,1] 100 [1,2] 90 [2,3] 80
死亡 生存 死亡 生存 生存率
人数 人数 概率 概率 s (ti )