生存分析-自学

合集下载

生存分析入门及其应用领域

生存分析入门及其应用领域

生存分析入门及其应用领域生存分析是一种用于研究事件发生时间和受影响因素的统计方法。

它广泛应用于医学、工程、社会科学等众多领域。

本文将为您介绍生存分析的基本概念和应用领域,帮助您了解并应用这一重要的数据分析方法。

什么是生存分析?生存分析,也被称为事件时间分析或时间至事件分析,是一种用于研究个体事件发生时间和影响因素的数据分析方法。

通常,这些事件可以是死亡、疾病复发、故障等。

生存分析的目标是分析事件发生的概率,并探究与事件发生相关的因素。

在生存分析中,有两个重要的概念:生存时间和生存函数。

生存时间指的是从某个起始点(如诊断日期)到事件发生(如死亡)的时间间隔。

而生存函数则是描述在给定时间内事件未发生的概率。

基本方法生存分析的基本方法有多种,其中最常用的是Kaplan-Meier法和Cox 比例风险模型。

Kaplan-Meier方法是一种非参数的生存分析方法,用于估计生存函数。

它考虑到了Censored数据,即在研究期间未发生事件或失去跟踪的个体。

通过绘制生存曲线,可以清晰地展示不同因素对生存时间的影响。

Cox比例风险模型是一种常用的半参数生存分析方法,用于探究不同因素对生存时间的影响。

它可以同时考虑多个因素,并根据因素的相对风险水平进行排序。

通过估计风险比(HR),可以确定不同因素对生存时间的相对影响。

应用领域生存分析在许多领域中都具有广泛的应用,以下是其中几个应用领域的简要介绍:医学研究生存分析在医学研究中扮演着重要角色。

它可以用于评估治疗的效果、预测疾病的发展和患者的生存期。

通过分析患者的生存数据,医生可以制定更精确的治疗方案,并提供更好的患者护理。

工程可靠性生存分析可以应用于工程领域,用于评估产品的可靠性和寿命。

通过分析故障发生的时间,工程师可以预测设备的寿命,并采取相应的维护措施,以提高设备的可靠性和稳定性。

社会科学生存分析在社会科学研究中也有重要应用。

它可以用于研究人口统计学数据、就业前景、婚姻稳定性等方面。

生存分析入门及其应用领域

生存分析入门及其应用领域

生存分析入门及其应用领域生存分析,是一种用于研究事件发生与时间关系的统计分析方法。

生存分析不仅仅被应用在医学领域,也被广泛应用于其他领域,如生态学、经济学、社会学等。

本文将介绍生存分析的基本概念,常用方法以及在不同领域的应用。

什么是生存分析生存分析是一种用来评估个体从某一事件发生到达另一事件(如死亡、疾病复发等)之间的时间长度的统计方法。

生存分析的主要目的是根据时间数据,估计个体发生某一事件的概率或到达某一事件的时间。

生存分析常用于研究人群中疾病发生的风险因素,评估医疗干预措施的效果,预测患者的生存时间等。

常用的生存分析方法生存分析的常用方法包括Kaplan-Meier曲线、Cox比例风险模型等。

Kaplan-Meier曲线是生存分析中最常用的方法之一,用于估计在不同时间点上生存率的方法。

通过Kaplan-Meier曲线,可以直观地展示在不同时间点上患者的存活率。

Cox比例风险模型是一种用来评估不同变量对生存时间影响的方法。

通过该模型,可以计算出不同因素对生存时间的风险比,从而评估各种危险因素的影响程度。

生存分析在不同领域的应用医学领域在医学领域,生存分析被广泛应用于评估疾病的生存率、比较不同治疗方法的效果、预测患者的生存时间等。

例如,在肿瘤研究中,生存分析可以帮助医生评估不同治疗方案对患者生存时间的影响,以制定更有效的治疗方案。

生态学领域生存分析在生态学领域也有着重要的应用,用于研究动植物的寿命、种群的生存率以及环境因素对生物存活的影响。

通过生存分析,可以更好地理解生态系统中各种生物的生存策略和适应能力。

社会学领域在社会学领域,生存分析可以帮助研究人员分析人群中特定事件的发生率及其影响因素。

例如,在犯罪学领域,生存分析可以用来评估犯罪行为的发生率,以及不同因素对犯罪行为的影响程度。

生存分析作为一种重要的统计分析方法,不仅在医学领域有着广泛的应用,也在生态学、经济学、社会学等领域发挥着重要作用。

如何做生存分析?

如何做生存分析?

如何做生存分析?生存分析是医学领域常见的分析方法,也可以拓展到其他专业领域。

这篇帖子的目的就是介绍怎么做生存分析,希望能对临床医学的同学提供一定帮助。

简明扼要地讲,生存分析的目的无外乎六个字:描述、比较、关系。

1.描述是指对研究群体生存时间的分布情况进行描述、刻画。

类似的,描述特定人群的身高状况时,需要采用均数和标准差来分别衡量数据分布的集中程度和离散程度,在做生存分析时,描述生存时间的分布情况也是十分有必要的和有意义的。

但是生存时间的数据资料和身高、体重等常规数据资料不一样,因为含有“截尾”数据,所以就需要变换思路来描述这类数据,经典的也是被大家所接受的解决方法就是生存曲线了。

而绘制生存曲线的方法有两种,即K-M法和寿命表法,分别对应不同的数据源。

很多软件(如R、SAS、SPSS)都可以绘制生存曲线,这个过程还是比较简单的,我会在前面的文章中介绍如何使用GraphPad Prism 绘制生存曲线。

2.比较指比较不同组别之间生存分布的差异。

大多数情况下,研究的兴趣点在于比较两组或者多组之间的差别,比如使用A药和B药时,病人的生存时间是否有差异,从而判断A药与B药哪个疗效好。

你可以类比样本均数的比较,比如研究学校里面男生和女生的身高是否有差异时,通过抽样获得两组样本均数,然后根据假设检验(H0和H1)在统计学上进行检验,得出统计量(t、F、Z、卡方值之类的)和p值,最后做出统计推断和得出结论。

没有学过统计理论的同学对这个检验的过程似懂非懂,不明白其中的道理,所以觉得难以理解,在这里举个不是特别恰当的例子:比如某美女正在纠结本周末是否去逛街,因为需要考虑气温、阳光、心情等等很多因素。

我们假定只考虑气温吧,她心说,“如果气温低于5度就不去逛街”。

那么无效假设H0就可以是:这周末气温低于5度;择备假设为H1:这周末气温不低于5度。

这样就可以根据历史气温数据的分布情况,推算出本周末气温低于5度的概率,发现这种情况出现的可能性极低(P < 0.05),所以她就得出了结论,本周末可以出去逛街。

(完整word版)生存分析知识点总结,推荐文档

(完整word版)生存分析知识点总结,推荐文档

生存分析知识点总结09统计(经济分析1班)周姗琪 32009121215一、基本概念1、生存分析:将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。

研究生存现象和响应时间数据及其统计规律的一门学科。

对一个或多个非负随机变量(生存时间)进行统计分析研究。

对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。

2、生存时间:生存时间也叫寿命、存活时间、失效时间等等3、研究目的:①描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。

统计方法包括K-M法、寿命表法。

②比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。

统计方法log-rank检验等。

③影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。

如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。

统计方法Cox比例风险回归模型等。

④预测:建立Cox回归预测模型。

4、研究内容:描述生存过程和对生存过程影响因素分析及结局预测。

5、主要分析方法:参数法方法、非参数方法、半参数方法。

二、生存分析数据类型1、完全数据:每个个体确切的生产时间都是知道的。

这样的数据称为完全数据。

但在实际的生存分析中,数据在很多情况下是很难完全观察到的。

2、删失:在研究结束时,无法获得某些个体确切的生存时间。

①右删失:在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据。

②左删失:研究对象在时刻Ct开始接受观察,而在此之前我们感兴趣的时间已经发生,这就是左删失。

③区间删失:若个体的确切生存时间不知道,只知道其生存时间在两个观察时间L和R之间(L<R),则称该个体的生存时间在[L,R]上是区间删失的。

3、截断:在研究或者观测中,淘汰了一些对象(样本),使得研究者“意识不到他们的存在”。

14-生存分析

14-生存分析

将原始数据录入计算软件,首先对每个备选的自变量作单因素Cox回 归模型,得到表23-9所示结果。由表23-9可见,在水准上,有统计 学意义的因素为年龄和确诊到手术时间。
Cox回归应用中的注意事项
1.Cox回归分析结论的正确性要以科学的设计、有代 表性的抽样为前提。如果样本例数过少(多因素分析 中死亡例数一般应在自变量个数的10倍以上),或者 抽样不随机而使得某些变量在其各个水平上分布极偏, 很难得到真正的结果。有时回归分析得到的相对危险 度与专业知识相悖,并非是什么专业上的新发现,而 是设计上的缺陷造成。通过计算机软件进行模型拟合 只能保证计算上的准确,不合理的设计得到的数据计 算出的结果只能是错得更复杂。另外,虽然它可以利 用删失数据的信息,但过多的删失很可能会带来分析 结果的偏倚。
2. 截尾原因无偏性 例如,老年患者常因不重视随访而失访,由此可能 使估计的生存率偏高。为防止截尾偏性,常需对被截尾者的年龄、 职业和地区等构成情况进行分析。
3. 生存时间尽可能精确 因为多数生存分析方法都是在生存时间排序的 基础上进行的,即使是小小的舍入误差,也可能改变生存时间顺序 而影响结果。对于随访资料,生存时间最好精确到天数。
完全数据
完全数据(complete data):是指从观 察的起始事件一直达到观察的终点事件。 是生存分析最重要的资料,即观察对象 完整的生存时间。
截尾数据
截尾数据(censored data)在随访工作中,由于某种 原因未能观察到病人的明确结局(即终止事件),所 以不知道该病人的确切生存时间,它所提供关于生存 时间的信息是不完全的。
产生截尾现象的原因: ①病人失访 ②病人的生存期超过了研究的终止期
③在动物实验中,达到了事先规定的终止事件

生存分析入门及其应用领域

生存分析入门及其应用领域

生存分析入门及其应用领域生存分析是一种统计方法,用于研究个体在给定时间内生存或发生特定事件的概率。

它广泛应用于医学、生物学、社会科学等领域,帮助研究人员了解个体的生存状况和预测未来事件的发生概率。

本文将介绍生存分析的基本概念和方法,并探讨其在不同领域的应用。

一、生存分析的基本概念和方法1.1 生存函数和生存率生存函数是描述个体在给定时间内存活的概率分布函数。

它可以用来计算个体在不同时间点的生存率。

生存率是指个体在给定时间段内存活下来的概率。

1.2 风险函数和累积风险函数风险函数是描述个体在给定时间点发生事件的概率密度函数。

它可以用来计算个体在不同时间点发生事件的风险。

累积风险函数是指个体在给定时间段内发生事件的累积概率。

1.3 生存分析方法生存分析方法包括Kaplan-Meier方法、Cox比例风险模型等。

Kaplan-Meier方法用于估计生存函数和生存率,适用于无法满足正态分布假设的数据。

Cox比例风险模型用于分析多个协变量对生存时间的影响,可以得出各个协变量的风险比。

二、生存分析在医学领域的应用2.1 癌症生存分析生存分析在癌症研究中广泛应用。

研究人员可以通过分析患者的生存时间和相关协变量,评估不同治疗方法对患者生存率的影响。

此外,生存分析还可以用于预测患者的生存时间和制定个体化治疗方案。

2.2 药物研发生存分析在药物研发中也有重要应用。

研究人员可以通过分析药物对动物或人体的生存时间和相关协变量,评估药物的疗效和安全性。

生存分析可以帮助筛选出具有潜在治疗效果的药物,并为临床试验的设计提供依据。

三、生存分析在社会科学领域的应用3.1 人口统计学生存分析在人口统计学中被广泛应用。

研究人员可以通过分析人群的生存时间和相关协变量,评估不同因素对人口生存率的影响。

生存分析可以帮助政府和决策者制定人口政策和社会福利政策。

3.2 金融风险管理生存分析在金融风险管理中也有应用。

研究人员可以通过分析金融产品的生存时间和相关协变量,评估不同因素对金融产品的风险和收益的影响。

生存分析(survivalanalysis)

生存分析(survivalanalysis)

⽣存分析(survivalanalysis)⼀、⽣存分析(survival analysis)的定义 ⽣存分析:对⼀个或多个⾮负随机变量进⾏统计推断,研究⽣存现象和响应时间数据及其统计规律的⼀门学科。

⽣存分析:既考虑结果⼜考虑⽣存时间的⼀种统计⽅法,并可充分利⽤截尾数据所提供的不完全信息,对⽣存时间的分布特征进⾏描述,对影响⽣存时间的主要因素进⾏分析。

⽣存分析不同于其它多因素分析的主要区别点:⽣存分析考虑了每个观测出现某⼀结局的时间长短。

应⽤场景 什么是⽣存?⽣存的意义很⼴泛,它可以指⼈或动物的存活(相对于死亡),可以是患者的病情正处于缓解状态(相对于再次复发或恶化),还可以是某个系统或产品正常⼯作(相对于失效或故障),甚⾄可是是客户的流失与否等。

在⽣存分析中,研究的主要对象是寿命超过某⼀时间的概率。

还可以描述其他⼀些事情发⽣的概率,例如产品的失效、出狱犯⼈第⼀次犯罪、失业⼈员第⼀次找到⼯作等等。

在某些领域的分析中,常常⽤追踪的⽅式来研究事物的发展规律,⽐如研究某种药物的疗效,⼿术后的存活时间,某件机器的使⽤寿命等。

在医学研究中,常常⽤追踪的⽅式来研究事物发展的规律。

如,了解某药物的疗效,了解⼿术的存活时间,了解某医疗仪器设备使⽤寿命等等。

对⽣存资料的分析称为⽣存分析。

所谓⽣存资料就是描述寿命或者⼀个发⽣时间的数据。

更详细的说⼀个⼈的⽣存时间的长短与许多因素有联系的,研究因素与⽣存时间的联系有⽆及程度⼤⼩,称为⽣存分析。

例如研究病⼈感染了病毒后,多长时间会死亡;⼯作的机器多长时间会发⽣崩溃等。

这⾥“个体的存活”可以推⼴抽象成某些关注的事件。

所以SA就成了研究某⼀事件与它的发⽣时间的联系的⽅法。

这个⽅法⼴泛的⽤在医学、⽣物学等学科上,近年来也越来越多⼈⽤在互联⽹数据挖掘中,例如⽤survival analysis去预测信息在社交⽹络的传播程度,或者去预测⽤户流失的概率。

⽣存分析研究的内容 1.描述⽣存过程 研究⽣存时间的分布特点,估计⽣存率及平均存活时间,绘制⽣存曲线等,根据⽣存时间的长短,可以估算出各个时点的⽣存率,并根据⽣存率来估计中位⽣存时间,也可以根据⽣存曲线分析其⽣存特点,⼀般使⽤Kaplan-Meier法和寿命表法。

生存分析习题答案

生存分析习题答案

生存分析习题答案生存分析习题答案生存分析是一种用于研究个体生存时间的统计方法。

它广泛应用于医学、生物学、经济学等领域,帮助我们了解不同因素对个体生存的影响。

在本文中,我们将回答一些生存分析习题,帮助读者更好地理解这一概念和方法。

问题一:在一个研究中,我们观察了100名患者的生存时间,并得到了以下数据:50名患者在观察期内死亡,50名患者在观察期结束时仍然存活。

请计算该研究的生存率和存活率。

解答一:生存率是指在给定时间点或时间段内存活下来的个体所占的比例。

在这个研究中,我们观察了100名患者,其中50名患者在观察期内死亡,因此观察期内的生存率为50%。

存活率是指在给定时间点或时间段内仍然存活的个体所占的比例。

由于观察期结束时仍然存活的患者有50名,因此观察期结束时的存活率也为50%。

问题二:在一个药物试验中,我们随机分配了两组患者,一组接受新药治疗,另一组接受安慰剂。

我们观察了两组患者的生存时间,并得到了以下数据:新药组中有30名患者在观察期内死亡,20名患者在观察期结束时仍然存活;安慰剂组中有40名患者在观察期内死亡,30名患者在观察期结束时仍然存活。

请计算两组患者的生存率和存活率,并分析新药对生存的影响。

解答二:首先,我们计算新药组的生存率和存活率。

在新药组中,观察期内死亡的患者有30名,观察期结束时仍然存活的患者有20名。

因此,新药组的生存率为30%(30/100),存活率为20%(20/100)。

接下来,我们计算安慰剂组的生存率和存活率。

在安慰剂组中,观察期内死亡的患者有40名,观察期结束时仍然存活的患者有30名。

因此,安慰剂组的生存率为40%(40/100),存活率为30%(30/100)。

通过比较两组患者的生存率和存活率,我们可以初步判断新药对生存的影响。

在这个例子中,新药组的生存率和存活率均低于安慰剂组,这可能意味着新药对生存没有显著的积极影响。

问题三:在一个研究中,我们观察了一组患者的生存时间,并得到了以下数据:10名患者在第1年死亡,20名患者在第2年死亡,30名患者在第3年死亡,剩余40名患者在第4年结束时仍然存活。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

17
第四节 Cox比例风险回归模型
Cox比例风险回归模型(Cox’s proportional hazards regression model),简称Cox回归 模型。 该模型由英国统计学家 D.R.Cox于1972年提 出,主要用于肿瘤和其它慢性病的预后分析, 也可用于队列研究的病因探索。其优点: 多因素分析方法 不考虑生存时间分布 利用截尾数据
生存资料统计学处理方法
(一)设计 目的:专业目的:据专业知识确定。
统计学目的: 估计:根据样本生存资料估计总体生 存率及其它有关指标(如中位生存期 等),如根据脑瘤患者治疗后的生存 时间资料,估计不同时间的生存率、 生存曲线以及中位生存期等。
比较:对不同处理组生存率进行比较,如 比较不同疗法治疗脑瘤的生存率,以了解 哪种治疗方案较优。
X3
X4
组织学分类 乳头状腺癌=0 管状腺癌=1 肿瘤大小(cm)≤6=0 >6=1
细胞增殖抗原(PCNA) <55%=0 ≥55%=1 X6 淋巴管浸润 无=0 有=1 X7 血管浸润 无=0 有=1 Time 手术到观察结束 实际天数 Event 结束时是否死亡 未死=0 死亡=1
X5
27 39 44 22 58 8 22 44
log-rank检验用于整条生存曲线的比较, 若比较两组某时间点处的生存率,则按下 式计算:
u S1 (t ) S 2 (t ) SE 2 [ S1 (t )] SE 2 [ S 2 (t )]
如比较多个时间点处生存率,检验水准应 取Bonferroni校正,即 α α / k,其中k为 比较的次数,以保证总的I型错误概率不超 过 。
1 2 3 4 5 6 …
男 男 女 男 女 女
45 50 36 52 56 60
…1991.05.20 …1992.01.12 …1991.10.24 …1994.11.02 …1994.06.25 …1993.12.05
1995.06.04 1998.08.25 1994.03.18 2000.12.30 1995.03.17 1996.08.16
3
例如,某肿瘤医院调查了1991-1995年间经手 术治疗的大肠癌患者150例,对可能影响大肠 癌术后生存时间的因素进行了调查,如性 别、年龄、组织学分类、肿瘤大小、Dure’S 分期等。随访截止日期为2000年12月30日, 随访记录见下表。
大肠癌患者的随访记录
编号 性别 年龄 … 手术日期 随访终止日期 随访结局 生存时间(天)
18
RR e
β>0 , RR>1 ,说明变量 X 增加时,危 险率增加,即X是危险因素。 β<0 , RR<1 ,说明变量 X 增加时,危 险率下降,即X是保护因素。 β=0 , RR=1 ,说明变量 X 增加时,危 险率不变,即X是危险无关因素。
死亡 死亡 失访 存活 死亡 死于其它
1476 2417 876+ 2250+ 265 985+
4
生存时间
生存时间的度量单位可以是年、月、 日、小时等。常用符号t表示,截尾数据在 其右上角标记“+”。 生存资料的主要特点:
含有截尾数据。 截尾数据的特点:真实的生存时间未知, 只知道比观察到的截尾生存时间要长。 生存时间的分布一般不呈正态分布。
二、条件生存概率、生存率、生存曲线
条件生存概率: (conditional probability of survival) 表示某单位时段开始时存活的个体,到该 时段结束时仍存活的可能性。 年条件生存概率表示年初尚存人口存 活满1年的可能性。
p 活满一年例数 年初观察例数
5
生存率: (survival rate, survival function ) 指观察对象经历t个单位时段后仍存活的 可能性。 活满3年例数 3年生存率= 期初观察例数
Survival Functions
1.0
.8
.6
.4
组别
乙疗法组
Cum Survival
.2

乙疗法组-censored 甲疗法组
0.0 0 10 20 30 40 50
甲疗法组-censored
生存时间
8
三、中位生存期
中位生存期(median survival time) 又称半数生存期,表示恰好有50%的 个体尚存活的时间。 中位生存期越长,表示疾病的预后越 好;中位生存期越短,预后越差。 估计中位生存期常用图解法或线性内 插法。
9
影响因素分析:目的是为了探索和了解影 响生存时间长短的因素,或平衡某些因素 影响后,研究某个或某些因素对生存率的 影响。如为改善脑瘤病人的预后,应了解 影响病人预后的主要因素,包括病人的年 龄、性别、病程、肿瘤分期、治疗方案等。 预测:具有不同因素水平的个体生存预测, 如根据脑瘤病人的年龄、性别、病程、肿 瘤分期、治疗方案等预测该病人 t 年(月) 生存率。
大肠癌生存资料
序号 1 2 3 4 5 6 … 65 X1 X2 X3 X4 0 2 1 0 0 2 1 0 1 2 1 1 0 3 1 1 1 2 0 1 1 2 1 1 0 1 1 1 X5 X6 X7 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 1 1 1 1 0 0 Time 2896 992 2811 2052 2975 856 584 Event 0 1 0 1 0 1 1
1
第一节 生存分析基本概念
一、生存时间
( survival time,failure time ) 终点事件与起始事件之间的时间间隔。 终点事件指研究者所关心的特定结局。 起始事件是反映研究对象生存过程的起 始特征的事件。
生存时间举例
起始事件 服药 手术切除 染毒 化疗 缓解 终点事件 痊愈 死亡 死亡 缓解 复发
2
终点事件和起始事件是相对而言的, 它们都由研究目的决定,须在设计时 明确规定,并在研究期间严格遵守, 不能随意改变。
生存时间的类型
1. 完全数据(complete data) 从起点至死亡(死于所研究疾病)所经历 的时间。 2. 截尾数据(删失数据,censored data) 从起点至截尾点所经历的时间。 截尾原因:失访、死于其它疾病、观察结 束时病人尚存活等。
一、Cox模型的基本形式
h(t , X ) h0 (t ) exp( 1 X 1 2 X 2 p X p )
h(t,X)—t 时 刻 风 险 函 数 、 风 险 率 或 瞬 时 死 亡 率(hazard function)。 h0(t)— 基 准 风 险 函 数 , 即 所 有 变 量 都 取 0 时 t 时刻风险函数。 X1 、 X2 、 … 、 Xp— 协 变 量 、 影 响 因 素 、 预 后 因素。 β1、 β2、…、 βp—回归系数。
生存曲线(survival curve) 以观察(随访)时间为横轴,以生存率 为纵轴,将各个时间点所对应的生存率 连接在一起的曲线图。 生存曲线是一条下降的曲线,分析时 应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生存期。
7
某医师收集20例脑瘤患者甲、乙两疗法 治疗的生存时间(周)如下: 甲疗法组 1 3 3 7 10 15 15 23 30 乙疗法组 5 7+ 13 13 23 30 30+ 38 42 42 45+
方法:前瞻性队列研究 回顾性队列研究 确定起始事件、终点事件、随访终止日 期、生存时间、截尾。 确定可能的影响因素、水平以及量化方 法。
10
大肠癌影响因素量化表
变量名 X1 X2 因素 性别 年龄(岁) 量化值 女=0 男=1 <40=1 40-60=2 ≥60=3 病例数 构成比(%) 32 48.5 34 51.5 10 15.1 37 56.1 19 28.8 20 46 29 37 30.3 69.7 43.9 56.1
40.9 59.1 66.7 33.3 87.9 12.1 33.3 66.7
11
设计调查表:一览表:因素较少时。 单一表:因素较多时。 调查表中应包括 三联体 可能的影响因素 数据 观察起点和终点(年、月、日) 生存时间 生存结局 样本含量:非截尾例数至少是可能影响因 素的10倍。
5年生存率=
活满5年例数 期初观察例数
条件生存概率和生存率的计算 例:手术治疗100例食管癌患者,术后1、 2、3年的死亡数分别为10、20、30,若无 截尾数据,试求各年条件生存概率及逐年 生存率。 生存率计算方法:
直接法 概率乘法定理
6
由例子可看出,生存率与条件生存概 率不同。条件生存概率是单个时段的 结果,而生存率实质上是累积条件生 存概率(cumulative probability of survival),是多个时段的累积结果。 例如,3年生存率是第1年存活,第2年 也存活,第3年还存活的可能性。
二、大样本资料的生存分析 生存率的计算 寿命表法 生存曲线
15
第三节 生存曲线的log-rank检验
log-rank检验(对数秩检验、时序检验) 该检验属非参数检验,用于比较两组或多组 生存曲线或生存时间是否相同。 检验统计量为卡方。 自由度=组数-1。 P≤0.05,两组或多组生存曲线不同。 P>0.05,两组或多组生存曲线差别无统计学 意义。
(二)搜集资料 可能的影响因素: 从病历获得。 生存时间及结局: 短期可观察到的结局可从病历获得; 长期结局一般不能从病历直接获得,通过 信访、电话等得到。
12
(三)整理资料 认真检查、核对原始数据,包括影响因素、 生存时间和生存结局。 尽量避免缺失值。 建立数据库 FoxBase 、 Foxpro 、 Virual Foxpro 等专业 数据库 统计软件数据库(SAS、SPSS等) Office办公软件中的Excel、Access
相关文档
最新文档