SurvivalAnalysis

合集下载

生存分析SPSS

生存分析SPSS
以下7种方法。


2021/10/10
22
三、主要输出结果
1.分析例数描述
案 例 处 理摘 要
分析
事件 a
中可 用的
删失
案例
合计
删除
带有缺失值的案例
的案 例
带有负时间的案例
层中的最早事件之
前删失的案例
合计
N 26 37 63 0 0
0
0
合计
63
a. 因变量: t
2021/10/10
23
百分比 41.3% 58.7% 100.0% .0% .0% .0%
(4)预测:建立cox回归预测模型。
生存分析(Survival Analysis)菜单
寿命表(Life Tables)过程
Life tables 过程用于(小样本和大样本资料): 1. 估计某生存时间的生存率,以及中位生存时间。 2. 绘制各种曲线:如生存函数、风险函数曲线等。 3. 对某一研究因素不同水平的生存时间分布的比较。 4. 控制另一个因素后对研究因素不同水平的生存时间分
1
35 50 1 0 0 1 0 26
1
36 33 1 1 0 0 0 120
0
37 57 1 1 1 0 0 120
0
38 48 1 0 0 1 0 120
0
39 28 0 0 0 1 0
3
1
40 54 1 0 1 1 0 120
1
41 35 0 1 0 1 1
7
1
42 41)为了比较不同手术方法治疗肾上腺 肿瘤的疗效,某研究者随机将43例病人分成两组,甲组 23例、乙组20例的生存时间(月)如下所示:
其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。

19 生存分析

19 生存分析

死亡率,记为h(t)。描述某个体的瞬时死亡风险随时间变
化的情况。
ht
lim
△t 0
Pt
T
t △t △t
|
T
t
h(t)=0意味着没有死亡风险,t时刻S(t)平坦;大的h(t)意味 着S(t)的快速下降,风险函数越大,生存函数下降越快。
h(t)是速率而不是概率,其取值范围为0至+∞。
t
S(t) exp[ 0 h(u)du]
(2) 寻找影响生存时间的“危险因素”和“保护因素”; (3) 估计生存率和生存时间长短,进行预后评价。
因变量为连续型资 料,最好满足正态 分布
因变量为分类资料, 二分类、有序分类、 多分类
Байду номын сангаас
因变量为时间+结 局变量,常含有缺 失值
线性回归
Logistic回归
Cox回归
第一节 基本概念
一、生存时间 1. 生存分析(survival analysis):
失去联系等,未能观察到其死亡结局。 ③退出:中途退出试验或改变治疗方案或死于其它与研究无
关的原因。
* 终点事件 + 截尾值
研究起始
* *
+
+ +
*
+
研究终点
4. 生存时间的特点:
① 同时考虑生存结局和生存时间; ② 生存时间可能含有删失数据; ③ 生存时间的分布和常见的统计分布有明显不同,如呈
指数分布Weibull分布、对数正态分布、对数logistic分 布、gamma分布或更为复杂的分布,因此需有能分析 这类数据的特殊的统计方法; ④ 生存时间的影响因素多而复杂且不易控制。
① 如资料中无删失数据,则直接计算生存率。

ch18生存分析

ch18生存分析

半数存活时间
Median Survival Time
First-order Controls type 1 2 3 4
Med Time 50.000 90.000 27.000 203.077
存活时间的总体统计假设
Overall Comparisonsa
Wilcoxon (Gehan) Statistic df Sig. 9.343 3 .025 a. Comparisons are exact.
第十八章 生存分析
生存分析(survival analysis)是将事 件的结果(终点事件)和出现这一结 果所经历的时间结合起来分析的一种 统计分析方法。 生存分析不同于其它多因素分析的主 要区别点就是生存分析考虑了每个观 测现象出现某一结局的时间长短。
第一节 生存分析基本概念
一、生存时间(survival time,failure time ) 终点事件(失效事件)与起始事件之间 的时间间隔。 终点事件(event)指研究者所关心的特定 结局。 起始事件是反映研究对象生存过程的起 始特征的事件。
[例]某研究者欲研究4种亚型肺癌病人的生存时间 有无差别,资料整理后如lung_ca.sav,试比较不同 肺癌亚型病人生存时间是否相同。
显示时间范围和间隔。 定义事件发生与否 的值。
期初存活数nx
Interval Number First-order Start Entering Controls Time Interval type 1 0 18 30 13 60 7 90 3 120 2 150 1 180 1 2 0 12 30 10 60 6 90 6 120 5 150 4 180 3
type Log Rank 腺癌 (Mantel- 大细胞癌 Cox) 小细胞癌 鳞癌

第十七章生存分析SurvivalAnalysis

第十七章生存分析SurvivalAnalysis
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
12
动物实验随访数据(图17-1,a)
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
如给药
t
研究结
束时间
13
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
起点
90年
91年
起点 92年
存活 存活
93年(研究结
0 2 4 6 8 10 12 14 16 18 20 年
t
“t”表示从研究起点到结局出现时间 22
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
概率乘法原理计算(359页)
s(ti ) pi p1 p2...pi (公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
该类数据通过随访得到,称为随访资料。
5
随访研究资料
• 当研究事件(y)的结局是两分类数据(发
生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
6
第一节 生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。
2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期

生存分析

生存分析

Change From Previous Step Chi-square df Sig. 14.304 1 .000 4.913 1 .027
Change From Previous Block Chi-square df Sig. 14.304 1 .000 19.217 2 .000
a. Variable(s) Entered at Step Number 1: x4 b. Variable(s) Entered at Step Number 2: x5 c. Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: 201.994 d. Beginning Block Number 1. Method = Forward Stepwise (Likelihood Ratio)
生存分析
Survival Analysis
To be or not to be is only a part of the question. The question also includes how long to be.


生存分析(survival analysis)是将事件 的结果(终点事件)和出现这一结果所 经历的时间结合起来分析的一种统计分 析方法。 生存分析不同于其它多因素分析的主要 区别点就是生存分析考虑了每个观测出 现某一结局的时间长短。
腺癌 大 细胞 癌 are Sig . Chi-Square type Sig . Log Rank (Mantel-Cox) 3.465 腺 癌 .063 大 细胞 癌 465 .063 癌 209 .648 5.316 小 细胞.021 007 .003 2.883 鳞 癌 .090

收藏可能是网上最全的生存分析资料

收藏可能是网上最全的生存分析资料

收藏可能是网上最全的生存分析资料1、生存分析的概念生存分析(survival analysis)是对生存时间进行分析的统计技术总称。

既考虑结果又考虑生存时间的一种统计方法,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特征进行描述,对影响生存时间的主要因素进行分析。

生存分析的基本目的就是刻画生存时间的分布。

生存分析相较于其它多因素分析的主要区别点:生存分析考虑到了每个研究对象出现某一结局所经历的时间长短。

(一)基本概念:1.起始事件(initial event):反应生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始等。

2.失效事件(failure event):在生存分析随访研究过程中,一部分研究对象可观察到死亡,可以得到准确的生存时间,它提供的信息是完全的,这种事件称为失效事件,也称之为死亡事件、终点事件。

3.生存时间(survival time):从规定的观察起点到某一特定终点事件出现的时间长短。

其中根据研究对象的结局,生存时间数据可分为两种类型:1)完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(complete data)。

用符号“ t ”表示。

2)删失数据(截尾数据):规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,如病人生存时间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号“ t+ ”表示。

产生删失数据的常见原因有:1)研究结束时终点事件尚未发生;2)失访;3)死于其它原因;4)由于严重药物反应而终止观察或改变治疗措施。

4.死亡概率(probability of death):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。

注意:如果年内有删失,则分母用校正人口数(有效数目):校正人口数 = 年初人口数—删失例数/25.生存概率(probability of survival):单位时段开始时存活的个体,到该时段结束时仍然存活的可能性。

生存分析

生存分析

1 1 3 3 1 1 2 0 1 0 0 0 0 0 1 0 1 1
23 22 21 18 15 14 13 11 10 9 8 7 6 5 4 3 2 1
0.043 0.045 0.143 0.167 0.067 0.071 0.154 0.000 0.100 0.000 0.000 0.000 0.000 0.000 0.250 0.000 0.500 1.000
0.0425 0.0588 0.0860 0.0993 0.1018 0.1034 0.1042 0.1041 0.1041 0.1041 0.1041 0.1041 0.1041 0.1041 0.1216 0.1216 0.1293 -
15
表17-3
2418例男性心绞痛病人生存率寿命表法估计结果
u= S1 (t ) − S 2 (t ) SE 2 [ S1 (t )] + SE 2 [ S 2 (t )]
如比较多个时间点处的生存率,检验水准 应取Bonferroni校正,即 α′ = α / k ,其中k 为比较的次数,以保证总的I型错误概率不 超过α。
24
实例1:对表17-4资料作log-rank检验
Means and Medians for Survival Time Mean 95% Confidence Interval Lower Bound Upper Bound Estimate 14.444 34.011 10.000 5.496 10.104 6.000 10.671 22.209 9.000
22
分析多条生存曲线有无差别时需先对所有 曲线作整体比较(类似方差分析),当 P<0.05时才进一步作两两比较 若(P<0.05),则生存时间有统计学意义的 差别。可从以下几方面来评价各组差别的 大小:生存曲线图目测判断、中位生存期 比较等

生存分析(survivalanalysis)

生存分析(survivalanalysis)

⽣存分析(survivalanalysis)⼀、⽣存分析(survival analysis)的定义 ⽣存分析:对⼀个或多个⾮负随机变量进⾏统计推断,研究⽣存现象和响应时间数据及其统计规律的⼀门学科。

⽣存分析:既考虑结果⼜考虑⽣存时间的⼀种统计⽅法,并可充分利⽤截尾数据所提供的不完全信息,对⽣存时间的分布特征进⾏描述,对影响⽣存时间的主要因素进⾏分析。

⽣存分析不同于其它多因素分析的主要区别点:⽣存分析考虑了每个观测出现某⼀结局的时间长短。

应⽤场景 什么是⽣存?⽣存的意义很⼴泛,它可以指⼈或动物的存活(相对于死亡),可以是患者的病情正处于缓解状态(相对于再次复发或恶化),还可以是某个系统或产品正常⼯作(相对于失效或故障),甚⾄可是是客户的流失与否等。

在⽣存分析中,研究的主要对象是寿命超过某⼀时间的概率。

还可以描述其他⼀些事情发⽣的概率,例如产品的失效、出狱犯⼈第⼀次犯罪、失业⼈员第⼀次找到⼯作等等。

在某些领域的分析中,常常⽤追踪的⽅式来研究事物的发展规律,⽐如研究某种药物的疗效,⼿术后的存活时间,某件机器的使⽤寿命等。

在医学研究中,常常⽤追踪的⽅式来研究事物发展的规律。

如,了解某药物的疗效,了解⼿术的存活时间,了解某医疗仪器设备使⽤寿命等等。

对⽣存资料的分析称为⽣存分析。

所谓⽣存资料就是描述寿命或者⼀个发⽣时间的数据。

更详细的说⼀个⼈的⽣存时间的长短与许多因素有联系的,研究因素与⽣存时间的联系有⽆及程度⼤⼩,称为⽣存分析。

例如研究病⼈感染了病毒后,多长时间会死亡;⼯作的机器多长时间会发⽣崩溃等。

这⾥“个体的存活”可以推⼴抽象成某些关注的事件。

所以SA就成了研究某⼀事件与它的发⽣时间的联系的⽅法。

这个⽅法⼴泛的⽤在医学、⽣物学等学科上,近年来也越来越多⼈⽤在互联⽹数据挖掘中,例如⽤survival analysis去预测信息在社交⽹络的传播程度,或者去预测⽤户流失的概率。

⽣存分析研究的内容 1.描述⽣存过程 研究⽣存时间的分布特点,估计⽣存率及平均存活时间,绘制⽣存曲线等,根据⽣存时间的长短,可以估算出各个时点的⽣存率,并根据⽣存率来估计中位⽣存时间,也可以根据⽣存曲线分析其⽣存特点,⼀般使⽤Kaplan-Meier法和寿命表法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
3B. Comparing Survival Functions
1.00
0.75
Survival Distribution 0.50 Function
0.25
Low
High Medium
0.00 0
10
20
30
40
50
60
Time
11
Log-Rank Test
The log-rank test • tests whether the survival functions are
0
5
10
Survival Time
15
20
9
Figure 1. Plot of survival distribution functions for the NCI and the SCI Groups. The Y-axis is the probability of not declining to GDS 3 or above. The X-axis is the time (in years) to decline. (Barry Reisberg et al., 2010; Alzheimer & Dementia; in press.)
◦ However one should use the customized logistic regression procedures designed to account for 5
Key Assumption: Independent Censoring
Those still at risk at time t in the study are a random sample of the population at risk at time t, for all t
◦ T: survival time of a randomly selected
individual
t

◦ t: a specSif(itc)poPin(tTin tti)mee.xp (u)du
0

3
Hazard Function/Rate
Hazard Function (t): instantaneous
lim 0

S(t) S t
Here f(t) is the probabilitfytd endsiFtyt
function of the survival time Td.tThat is,
where F(t) is thFetcum1uSlativePT t
C uThrevKeaplan–Meier estimator is the
nonparametric maximum likelihood
estimate of S(t). It is a product of the
form
Sˆ(t)

r1

d1

r2

d2
...
ri

di
r1
r2
ri
distribution function of T:
4
2. The Key Word is ‘Censoring’
Because of censoring, many common data analysis procedures can not be adopted directly.
For example, one could use the logistic regression model to model the relationship between survival probability and some relevant covariates
failure rate at time t given that the
subject has survived upto time t. That

t
is
lim 0
P(t

T

t
|T

t)

P(t T t P(T t)
)
S(t) S(t ) 1 f t
Data are typically subject to censoring (e.g. when a study ends before the event occurs)
Survival Function - A function describing the proportion of individuals surviving to or beyond a given time. Notation:
rk
is ttkhe number of subjects alive just
dbkefore time
tk
denotes the number who died at time
7
Kaplan-Meier Curve, Example
Time ti # at risk # events
0
This assumption means that the hazard function, λ(t), can be estimated in a fair/unbiased/valid way
6
3A. Kaplan-Meier (Product-
Limit) Estimator of the Survival
20
0

1.00
5
20
2
[1(2/20)]*1.00=0.90
6
18
0
[1(0/18)]*0.90=0.90

10
15
1
[1(1/15)]*0.90=0.84
13
14
2
(1-
8
Kaplan Meier Curve
Proportion Surviving (95% Confidence) 0.6 0.7 0.8 0.9 1.0
Survival Analysis
A Brief Introduction
2
1. Survival Function, Hazard
Function
In many medical studies, the primary endpoint is time until an event occurs (e.g. death, remission)
相关文档
最新文档