队列研究方法及统计学考虑

合集下载

队列研究

队列研究

合计
13
1168
1181
三、资料分析
1.率的计算 1)累积发病率(cumulative incidence) 2)发病密度(incidence density) 暴露人口由于迁移他处、死于其他疾病、中途 加入等,应将变动着的人群转变为人时数代替人 数来计算,如人年,此种发病率称发病密度。如 1个观察对象观察满一年为1人年。 2.暴露人年的计算 1)小样本 从观察对象中剔除死亡、迁徙及失去 联系者,补充新加入的人数来折算人年。
2)小样本:算各人随访人年数,各年龄组的总人年数
例: 有3人从开始观察日至1981.1.1止,逐个计算人年
对象 出生日期 进入研究日期 退出研究日期
1 1927.3.21 2 1935.4. 9 3 1942.11.12 1966.7.19 1961.11.11 1970.2. 1 1977.9.14(迁居外地) 1973.12.1(死亡) 1981.1. 1(随访结束)
a c AR Ie Iu= ab cd
例2 AR=3.31-0.12=3.19%
RR与AR的区别 RR评价暴露与疾病的联系强度,不说明绝对危险度的大小 用于病因研究 AR表示某因素对疾病的绝对危险,用于公共卫生决策。
例: 吸烟对不同疾病的AR和RR
疾病
肺癌 心血管病
死亡率1/105 吸组
(一)常见偏倚 1.失访偏倚 研究对象由于移居外地、外出、不合作或死于其 他疾病未能追踪观察到,以至在研究中丢失。 影响研究真实性,其程度取决于: 1)失访人群的质,即失访人群与未失访人群在所 研究的主要方面区别 2)失访人群的量,小于观察人群总数的5%,偏 倚不大
2.选择偏倚 任何非研究因素在研究人群中与一般人群分布不 一致,暴露人群或非暴露人群划分错误。 往往高估或低估联系强度 3.测量偏倚 对疾病诊断缺乏正确标准,或测量仪器精确性差, 造成漏诊或误诊 4.混杂偏倚 如性别、年龄等

队列研究

队列研究

预防医学第十五章队列研究预防医学教研室第十五章队列研究第一节概述一、定义“队列”,指在一定期间对其进行随访的人群组。

队列研究将研究对象按是否暴露于某因素分成暴露组与非暴露组(对照组),随访适当长的时间,比较两组所研究疾病的发病率或死亡率差异,以研究暴露因素与疾病之间的关系。

研究人群吸烟不吸肺癌不患肺癌不患a b cd (人数)调查方向现在将来队列研究示意图队列研究资料归纳表━━━━━━━━━━━━━━━━━━━━━病例非病例合计发病率─────────────────────暴露组a b a+b a/(a+b)非暴露组c d c+d c/(c+d)─────────────────────合计a+c b+d N(a+c)/N ━━━━━━━━━━━━━━━━━━━━━a/(a+b )与c/(c+d),如果有显著差异,说明暴露因素与疾病有联系,且很可能是因果关系。

二、特点①观察性研究方法;②设立对照;③由“因”求“果”,是前瞻性研究;④能验证因果关系的假设。

三、种类1、前瞻性队列研究从“现在”开始的前瞻性研究。

观察开始时,病例未出现,需要追踪观察一定时间,方能得到结果(发病或死亡)。

2、回顾性队列研究(历史前瞻性研究)追溯过去某个时间开始的暴露情况,调查那时以来的发病情况,对暴露人群与非暴露人群进行比较,以研究暴露与疾病的关系。

研究开始时,已发病或死亡。

3、双向性队列研究回顾性队列研究观察到“现在”后,再继续前瞻性随访。

四、用途1、检验病因假设2、描述疾病的自然史3、评价自发的预防效果实例二十世纪上半叶在英国发现:肺癌死亡率与支气管炎、肺结核及其它癌症不同,呈迅速上升趋势,且与烟草的消耗量有平行关系。

肺癌吸烟?Doll与Hill在1948年进行病例对照研究发现:吸烟者患肺癌的危险性明显高于不吸烟者,吸烟可能是肺癌的病因。

(假设)从1951年开始,进行了队列研究研究对象:英国医生。

发函调查了59600名医生的一般情况与吸烟状况,来自40701名医生的调查表可供分析。

队列研究 (2)

队列研究 (2)

二 特点 1. 对比性研究 2. 自然观察法 3. 抽样性研究 4. 由因到果研究 5. 单因多果的研究 6. 能较确切证实因素与疾病的因果联系
三 用途 1. 检验病因假设 2. 评价自发的预防效果 3. 研究疾病自然史 4. 新药上市后监测
四 、 种类
1. 前瞻性队列研究 ( prospective cohort study ) 前瞻性队列研究应考虑的问题: 1)有明确检验假设; 2)队列人群发病率较高; 3)潜伏期较短; 4)准确地测量及诊断方法; 5)有足够的观察人群; 6)失访率低。 2. 历史性队列研究( historical cohort study ) 1)--5) 6)有比较详细的历史记录或档案材料。
5. 样本量大小
(1) 影响因素 ①人群发病率的高低(是否接近0.5) ②暴露人群与对照人群的发病率差异 ③第一类误差 ④第二类误差(把握度) (2) 样本量的计算 ①计数资料的样本量计算
n 2PQ ( ) ( P1 P 0 )
2 2
P1为暴露组发病率; P0为非暴露组发病率; P=(P1+P0)/2 Q=1-P
(2) 发病密度( incidence density, ID ) 当观察人口不稳定时,以观察人数乘以观察时间(通常为年) 计算的发病率称为发病密度。
(3)标化率、标化死亡比和标化死亡比例比的计算
① 标化率( standardized rate )的计算

由于暴露组与非暴露组(一般人群为对照)经常存在年龄构 成的差别,以至于不能直接比较粗率,而必须用校正年龄 的标化率进行比较
队 列 研 究(Cohort Study)


一 基本概念 将特定人群分为暴露某因素与非暴露 某因素或不同暴露水平的亚组,追踪观察一 定时间,比较两组或各组的发病率或死亡率 以检验该因素与发病有无因果联系及联系 强度。 队列可分为两种固定队列(fixed cohort); 动态队列(dynamic cohort)。

队列研究

队列研究

第四章队列研究探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。

通过描述性研究,可以初步获得研究对象的各种特征,但此时疾病的影响因素与结局是同时观察的,因此需要采用分析性研究方法加以探讨。

队列研究(cohort study)是分析性研究的重要方法之一,它可以直接观察暴露于不同危险因素或不同特征人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。

第一节概述一、概念队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观察一定的时间,比较两组或各组发病率或死亡书的差异,以检验该因素与某疾病有无因果关联及关联强度大小的一种观察性研究方法。

二、研究目的{一)检验病因假设由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检验病因假设是队列研究的主要目的和用途。

一次队列研究可以只检验一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检验一种秘錤与多种结局之间的关联(如可同时检验吸烟与肺癌、心脏病、慢性支气忏炎等的关联)。

* '(二)评价预防效果有些域鋸有预防某结局发生的效应,即具有预防效果。

如大蒜的摄入可预防消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危险等。

这里的预防措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。

通过这种人群的“自然实验”(natural experiment)也可以评价某因素的预防效果。

(三)研究疾病自然史临床上只能通过观察单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。

在队列研究开始时,研究前研究对象只是具有某种暴谣而不患有相应的疾病,因此可以观察人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,M时还可以观察到各种自然和社会因素对疾病进程的影响。

队列研究不但可了解个体疾病的自然史,而且可了解疾病在人群中的发生发展过程。

三、研究类型(一)前瞻性队列研究(prospective cohort study)研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得®要随访观察一段时间后才能获得,这是队列研究的基本形式。

队列研究

队列研究

5、有足够的观察人群并将其分成暴露组与非 暴露组 6、观察人群相对稳定 7、有足够的人力、物力和时间支持长时间的 研究工作 (二)选择历史性队列研究的要点 1-5 同上 6、是否可被利用的医学记录或档案资料
实施
五、研究对象的选择 (一)暴露人群的选择
1、特殊暴露人群 (1)职业人群 (2)特殊暴露人群 2、一般人群 (1)一般社区居民 (2)有组织的团体人群
abcd lnRR的95%CI
ln RR 1.96 Varln RR
反自然对数即为RR95%CI
RR=1: 说明暴露因素与疾病无关联。 RR>1: 说明暴露因素与疾病有“正”关 联,是致病因素。 RR<1: 说明暴露因素与疾病有“负”关 联,是保护因素。
表 RR与关联强度
RR
0.9~1.0
1.0~1.1
0.7~0.8 0.4~0.6 0.1~0.3 <0.1
1.2~1.4 1.5~2.9 3.0~9.9
10~
关联强度 无 弱 中 强
很强
(2)归因危险度 / 特异危险度(Attributable Risk, AR)
AR=暴露组发病率-非暴露组发病率
意义
➢ 暴露与非暴露人群比较,所增加的疾病发 生数量
➢ 根据研究开始时研究者掌握的有关研究对象 在过去某时刻的暴露情况的历史材料分组
➢ 不需要随访,研究开始时结局已出现
优点
➢ 短期内完成资料的收集和分析 ➢ 时间顺序仍是由因到果 ➢ 省时、省力、出结果快
缺点
➢资料积累时未受到研究者的控制,内容上 未必符合要求
➢需要足够完整可靠的过去某段时间有关研 究对象的暴露和结局的历史记录或档案材料
队列研究的优点和局限性
一、优点 (一)适用于常见病。 (二)研究方向由“因”及“果”,资料偏 倚少较可靠。 (三)可以直接获得两队列人群的发病率或 死亡率,及各种疾病危险关联指标,故结果 真实可靠。

队列研究计算统计学效能的方法学

队列研究计算统计学效能的方法学

队列研究计算统计学效能的方法学随着大数据时代的到来,计算统计学作为处理大规模数据的一种方法,成为了数据科学领域不可或缺的技能之一。

而在实际应用中,计算统计学的效能往往成为了关注的焦点,而队列研究则是一种常用的方法,用于评估计算统计学的效能。

本文将从方法学的角度,针对队列研究计算统计学效能进行深入探讨。

1. 队列研究的概念和原理队列研究是一种通过模拟系统中任务进入队列、等待队列和完成队列的过程,来评估系统效能的方法。

在计算统计学中,队列研究可以用于评估各种算法和模型在处理大规模数据时的效能表现。

其原理是通过构建队列模型,对任务的到达、处理和完成进行模拟,从而得出系统性能指标,如平均等待时间、平均服务时间等。

2. 队列研究在计算统计学中的应用在计算统计学中,队列研究被广泛应用于评估各种算法和模型的效能。

在数据挖掘领域,可以利用队列研究来评估不同的分类算法在处理大规模数据时的效能表现,从而选择合适的算法进行应用。

在机器学习领域,队列研究也可以用于评估不同的模型在训练和预测过程中的效能表现,为模型选择和优化提供依据。

3. 队列研究计算统计学效能的方法在进行队列研究计算统计学效能评估时,需要注意以下几个方法:(1)确定评估指标:评估计算统计学效能时,需要确定系统性能的评价指标,如平均等待时间、平均服务时间、系统利用率等,以便于对系统进行综合评估。

(2)构建队列模型:根据实际情况构建队列模型,包括任务到达的分布、任务处理时间的分布等。

对于不同的计算统计学问题,可能需要采用不同的队列模型,如M/M/1队列、M/M/c队列等。

(3)进行仿真实验:利用仿真工具或编程语言进行队列模型的仿真实验,模拟任务的到达、处理和完成过程,并记录系统性能指标。

(4)分析结果和优化:对仿真实验结果进行分析,发现性能瓶颈,并对系统进行优化,如调整算法参数、更换算法模型等。

4. 队列研究计算统计学效能的意义队列研究对于评估计算统计学效能具有重要的意义。

病例队列研究

病例队列研究
康的生活方式可以降低发病风险。
案例三:糖尿病的病例队列研究
总结词
这项研究通过长期跟踪糖尿病患者,评估了糖尿病对心血管疾病、肾脏疾病等并发症的 影响。
详细描述
研究者选取了一组糖尿病患者和一组健康对照者,收集了他们的血糖、血压、血脂等生 理指标以及生活习惯等信息。经过多年随访,发现糖尿病患者发生心血管疾病、肾脏疾 病等并发症的风险较高,而有效的血糖控制和健康的生活方式可以降低并发症的发生风
通过病例队列研究,深入探讨病因的 作用机制,为预防和治疗提供科学依 据。
疾病自然史研究
疾病演变过程
通过长期追踪病例队列,研究疾病的演变过程,了解疾病的发展规律。
疾病预后评估
通过对病例队列的随访,评估疾病的预后情况,为临床治疗和患者管理提供指导。
药物疗效评价
药物效果评估
通过病例队列研究,比较药物治疗组和 对照组的疾病结局,从而评估药物的疗 效。
选择的病例应具有代表性,能够 反映目标人群的特征和分布情况, 以确保研究结果的可靠性。
可及性
确保所选病例能够被研究者所接 触和获取,以便进行后续的调查 和追踪。
分组方法
相似性原则
根据研究目的和研究问题, 将具有相似特征或背景的 病例归为一组,以便进行 比较和分析。
差异性原则
在分组时,应考虑不同组 别之间的差异性,以便更 准确地比较和评估不同组 别之间的差异。
生存曲线
绘制生存时间与时间的关系曲线,直观展示生存 变化趋势。
3
影响因素分析
研究影响生存时间的因素,如治疗方式、疾病分 期等。
Part
05
病例队列研究的优缺点
优点
病因研究的有效工具
病例队列研究能够有效地揭示疾 病与暴露因素之间的因果关系, 为病因研究提供有力证据。

第4章.队列研究(谭红专)

第4章.队列研究(谭红专)

第四章队列研究队列研究(cohort study)是分析流行病学(analytical epidemiology)研究中的重要方法之一,它通过直接观察危险因素暴露状况不同的人群的结局来探讨危险因素与所观察结局的关系。

与之类似的名称还有前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)等。

队列研究与病例对照研究相比,其检验病因假设的效能优于病例对照研究。

因此,队列研究在流行病学病因研究中应用广泛。

第一节概述一、概念队列研究是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究(observational study)方法。

这里观察的结局主要是与暴露因子可能有关的结局。

暴露(exposure)是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。

暴露在不同的研究中有不同的含意,暴露可以是有害的,也可以是有益的,但都是需要研究的。

队列(cohort)原意是指古罗马军团中的一个分队,流行病学家加以借用,表示一个特定的研究人群组。

根据特定条件的不同,流行病学中的队列一般有两种情况:一是指特定时期内出生的一组人群,叫出生队列(birth cohort);另一种是泛指具有某种共同暴露或特征的一组人群,一般即称之为队列或暴露队列(exposure cohort),如某个时期进入某工厂工作的一组人群。

根据人群进出队列的时间不同,队列又可分为两种:一种叫固定队列(人群)(fixed cohort),是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有因为结局事件以外的其他原因退出,也不再加入新的成员,即在观察期内保持队列的相对固定。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际过程中,每个研究对象的入队列时间和出队 列时间多数是不一样的
队列研究的人时如何定义?
临床常见 ▪ 入队列时间:病人首次入院时间/手术时间/首次药物治疗时间/确诊时间 ▪ 出队列时间:研究结束时间/末次随访时间/发生关注终点时间
① 研究结束时间——采集队列信息时间 ② 末次随访——每个受试者最末次随访到的时间 ③ 发生关注终点时间——死亡/复发/恶化/新发疾病时间,等等.
c
d
合计
a+c=m1
b+d=m0
合计 a+b=n1 c+d=n0 a+b+c+d=t
暴露组发病率=a/n1 非暴露组发病率=c/n0
报告时必须注明时间长短
队列研究评价
表2 队列研究资料归纳整理表(发病密度)
暴露组
非暴露组
合计
病例数
A1
A0
M
人年数
T1

T0
T
暴露组发病率= A1 / T1 非暴露组发病率= A0 / T 0
历的时间 o 在动物实验研究中,从开始给药到发生死亡所经历的时

生存时间不仅是活着的时间 可以是任意两件事件之间的时间间隔!
得结果可能与真实值存在较大偏差
生存分析
生存时间 (survival time): 从某起始事件到某终止事件所经历的时间跨度称为生存时间
o 在临床研究中,急性白血病患者从骨髓移植治疗开始到 复发为止之间的时间间隔
o 冠心病患者在两次发作之间的时间间隔 o 在流行病学研究中,从开始接触某危险因素到发病所经
HR与RR的区别
▪ 两者均用于前瞻性研究,多数认为HR与RR意思一样,但HR还考虑了时间因素, 换言之,包含了时间效应的RR就是HR;
▪ 从终点时间的角度来看,也可以这样理解,RR考虑了终点事件的差异,而HR不 仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据
样本量计算
队列研究—样本量计算公式(定量指标)
▪ HR主要通过COX回归分析得出,其计算较为复杂,需要用 软件计算
OR,RR,HR的区别
OR与RR的区别
▪ 从公式即可看出,OR或RR值越大,表明暴露的效应越大,暴露与结局关联的强 度也就越大。两者均为比值,因此以1为界限
▪ RR的计算需要使用发病率,因此队列研究、随机对照试验等前瞻性研究均可使用 RR;但回顾性研究(如病例-对照研究),是根据研究对象状态分组,无法直接 计算发病率,只能使用OR
队列研究数据(人时的计算)
当队列内对象的动态变化较大时,以人数为基数计算 发病率就显得不尽合理。此时,应考虑每个观察对象的观 察时间,以人时的方式来表示对象的观察时间
常用的人时单位包括人年,人月和人日等 总人时=所有观察对象的观察时间
如100人观察10年等于1000人年;1000人观察1年、 或500人观察2年也等于1000人年
▪ 未被注意的基线偏差造 成研究结果很难被评价 或掌控
▪ 需要更多的患者和更长 的随访时间
队列研究模式
前瞻性、观察法、设立对照 、由因到果、符合 时间顺序、能确证暴露和结局的因果关系
队列研究类型
队列研究类型
队列研究-方案设计
1、明确PICO问题
P-人群/患者
I-干预/暴露
C-比较/对照
O-结局
队列研究——样本量计算公式(定性指标)
样本量计算
如果研究涉及随访,必须考虑失访率!
Lost to Follow-up Rate!
注册研究强调连续入选病例,故实际 样本量会远远大于计算出来的样本量!
统计分析
队列研究常见统计方法
▪ 连续变量 正态分布且方差齐——t检验(两组比较);方差检验
(两组及以上比较); 非参数检验;多元线性回归等
队列研究方法及统计学考虑
注册研究特殊之处在于:有特定疾病或治疗的患者在医院就
诊均需纳入登记,强调连续入选病例,获得真实世界数据。
队列研究的必要性
随机对照研究 (RCT)
▪ 严格的入组/排除标准 ▪ 缺乏长期随访 ▪ 通常难以反映各年龄段、各
阶层患者情况, ▪ 伦理问题 ▪ 费用巨大
队列研究
▪ 缺乏随机分组导致组间 存在基线情况的偏差
▪ 分类变量(不含时间) 卡方检验(OR/RR值);logistic回归(OR值)等
▪ 分类变量(含时间)——生存分析 Cox比例风险模型(HR值)等
如何处理组间不均衡
▪ 建立模型后把不均衡的组间变量放入模 型作为混杂因素进行模型校正
▪ 倾向性评分(propensity score matching) ▪ 巢式病例对照研究(nested case-control
study)
倾向性评分
▪ 应用条件 1) 需要匹配的变量很多,配对通常不可行; 2) 实验组与对照组人数相差甚远(>4:1) ; 3) 混杂因素多,分层分析不可行; 4) 受样本量限制,可能多因素回归可能过度拟合
▪ 目的 将多个变量(多维)转化为一个中间变量(一维)
▪ 倾向值(propensity score) 是在控制其他混杂因素的条件下,个体接 受干预的概率
相对危险度 (relative risk, RR)
相对危险度说明暴露于某可疑危险因素后,暴露组 发生所研究疾病结局的危险性是非暴露组的倍数
RR越大,暴露的效应越大,暴露与结局关联的强度越大 RR>1,危险因素; RR=1,无关联; RR<1,保护因素
风险比值比(Hazard ratio,HR)
▪ 又叫风险函数比,是生存分析资料中用于估计因为某种因素 的存在而使死亡/缓解/复发等风险改变的倍数。其计算公式 为: HR=暴露组的风险函数h1(t)/非暴露组的风险函数h0(t) t指在相同的时间点上
▪ 分析策略 匹配、分层、多因素调整
倾向性评分
治疗组 对照组
最终分析
.00 .10 .20 .30 .40 .50 .60 .70 .80 .90 1.00
缺陷: ▪ 只能尽量减少混杂因素产生的影响,不能完全消除 ▪ 只能平衡和控制可观测的混杂因素 ▪ 当有重要的混杂因素缺失或不可观测时,采用倾向值分析所
2、 明确入选排除标准——准确、客观、可行、易操作 3、 暴露(水平,时间,方式,持续时间等)和结局(客观)应明确 4、 样本量——满足最低样本量的基础上,尽量大的样本量 5、 随访期应保证能发现足够数量的结局
评价指标
队列研究评价
表1 队列研究资料归纳整理表(累积发病率)
病例
非病例
暴露组
a
b
非暴露组
相关文档
最新文档