第四章 队列研究
第四章 队列研究

四、研究类型
队列研究依据研究对象进入队列时间及终止观察的时间不同,分为 前瞻性(prospective)队列研究、历史性(historical)队列研究和双向 性(ambispective)队列研究三种。三种队列研究方法示意如图4-3。
暴露组 回顾性地收集已有的历史资料 历史性 队列研究 非暴露组
继续前瞻 性收集资料 双向性 队列研究 暴露组 非暴露组 暴露组 前瞻性收集资料 前瞻性
非暴露组
不出现某种结局
前瞻性地收集结局事件发生的资料 研究开始
图4-2 队列研究的结构模式图
三、研究目的 1. 检验病因假设 由于队列研究检验病因假设的能力较强,因此深入
检验病因假设是队列研究的主要用途和目的。一次队列研究可以只 检验一种暴露与一种疾病之间的因果关联(如吸烟与肺癌),也可 同时检验一种暴露与多种结果之间的关联(如可同时检验吸烟与肺 癌、心脏病、慢性支气管炎等的关联)。 2. 评价预防效果 有些暴露有预防某结局发生的效应,即出现预防效 果。如大量的蔬菜摄入可预防肠癌的发生,戒烟可减少吸烟者肺癌 发生的危险等,这里的预防措施(如蔬菜摄入和戒烟)不是人为给 予的,而是研究对象的自发行为。这种现象又被称为“人群的自然 实验”。 3. 研究疾病自然史 临床上观察疾病的自然史只能观察单个病人从起 病到痊愈或死亡的过程;而队列研究可以观察人群从暴露于某因素 后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的 变化与表现,这个过程多数伴有各种自然和社会因素的影响,队列 研究不但可了解个体疾病的全部自然史,而且可了解全部人群疾病 的发展过程。
第四章 队列研究1

第二节 研究设计与实施
确定研究因素
确定研究结局
选择研究现场
研究对象 确定样本量 资料收集与随防 质量控制
确定研究因素和结局
文献资料
(描述性研究和病例对照研究) 个人既往研究结果
暴露因素
性质 定性(quality) 定量(quantity) 方法 访谈 实验室 检查 查阅记录 测量 统一标准 发病或死亡
历史性队列研究 (Historical cohort study)
也称为回顾性队列研究(retrospective cohort
study) 双向性队列研究(Ambispective cohort study)
历史性队列
双向性队列
暴露 因 素 非暴露
结 局
前瞻性队列
暴露 因 素 非暴露 结 局
暴露组(exposure population):
包括不同暴露水平的亚组。
对照组(control population) : 根据研究目的和研究条件选择不同 的对照人群。
可比性
暴露组的选择
职业人群:如石棉作业工人等 特殊暴露人群:如接受放射线治疗的人 一般人群:Framingham研究 有组织的人群:如医学会会员、工会会员等
对照组的选择
内对照:与暴露组来自同一人群 外对照:与暴露组来自不同人群 总人口对照:全人口为对照。如全国或某省 /市、县的统计资料
多重对照:同时选用上述两种或以上的对照
样本含量的估计
计算样本量时需考虑的问题 抽样方法 暴露组与非暴露组的比例 失访率
影响样本量的因素
全人群(对照人群)中所研究疾病的发病率P0
3例研究对象的出生日期与进出研究时间
编号
流行病学第四章 队列研究

流行病学第四章队列研究在流行病学的领域中,队列研究是一种重要的研究方法,它对于我们理解疾病的发生、发展以及影响因素有着不可替代的作用。
队列研究,简单来说,就是选定一群人,按照他们是否暴露于某种因素或者具有某种特征,分成不同的组,然后追踪观察一段时间,看看这些组中疾病的发生情况有何不同。
为了更清楚地理解队列研究,我们先来看看它的几个关键要素。
首先是暴露因素,这是队列研究的核心关注点。
它可以是生活习惯,比如吸烟、饮酒;也可以是环境因素,像是空气污染、辐射;还可以是遗传因素、职业因素等等。
确定准确且有研究价值的暴露因素是队列研究成功的第一步。
接下来是队列的确定。
这一群被选定的人要有一定的代表性,能够反映出我们想要研究的总体人群的特征。
队列可以是基于职业的,比如某个工厂的工人;可以是基于地域的,比如某个社区的居民;也可以是基于其他特定特征的,比如某种疾病的高危人群。
在追踪观察的过程中,要准确地记录每个研究对象的健康状况变化以及与暴露因素相关的信息。
这需要有完善的随访机制,确保不丢失任何重要的数据。
队列研究的类型主要有两种,前瞻性队列研究和回顾性队列研究。
前瞻性队列研究是从现在开始,对选定的队列进行追踪观察,一直到未来某个时间点,看看疾病是否发生以及和暴露因素的关系。
这种研究方法的优点是可以直接观察到暴露因素和疾病发生的先后顺序,结果比较可靠。
但它需要耗费较长的时间,而且在随访过程中可能会遇到很多困难,比如研究对象的失访。
回顾性队列研究则是基于过去已经存在的资料,比如过去的病历记录、职业档案等,来分析暴露因素和疾病之间的关系。
这种方法相对省时省力,但可能会因为资料的不完整或者不准确而影响研究结果的可靠性。
队列研究有很多优点。
它可以直接观察到疾病的自然史,了解疾病从暴露到发病的整个过程。
而且,由于是在疾病发生之前就确定了研究对象和暴露因素,所以能够更好地判断因果关系。
此外,队列研究还可以同时研究一种暴露因素与多种疾病的关系,或者多种暴露因素与一种疾病的关系。
队列研究

第四章队列研究探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。
通过描述性研究,可以初步获得研究对象的各种特征,但此时疾病的影响因素与结局是同时观察的,因此需要采用分析性研究方法加以探讨。
队列研究(cohort study)是分析性研究的重要方法之一,它可以直接观察暴露于不同危险因素或不同特征人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。
第一节概述一、概念队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观察一定的时间,比较两组或各组发病率或死亡书的差异,以检验该因素与某疾病有无因果关联及关联强度大小的一种观察性研究方法。
二、研究目的{一)检验病因假设由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检验病因假设是队列研究的主要目的和用途。
一次队列研究可以只检验一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检验一种秘錤与多种结局之间的关联(如可同时检验吸烟与肺癌、心脏病、慢性支气忏炎等的关联)。
* '(二)评价预防效果有些域鋸有预防某结局发生的效应,即具有预防效果。
如大蒜的摄入可预防消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危险等。
这里的预防措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。
通过这种人群的“自然实验”(natural experiment)也可以评价某因素的预防效果。
(三)研究疾病自然史临床上只能通过观察单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。
在队列研究开始时,研究前研究对象只是具有某种暴谣而不患有相应的疾病,因此可以观察人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,M时还可以观察到各种自然和社会因素对疾病进程的影响。
队列研究不但可了解个体疾病的自然史,而且可了解疾病在人群中的发生发展过程。
三、研究类型(一)前瞻性队列研究(prospective cohort study)研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得®要随访观察一段时间后才能获得,这是队列研究的基本形式。
第四章队列研究(cohortstudy)

4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第四章 队列研究 (cohort study)
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
流行病学第四章 队列研究

yes
暴露组
目标人群 代表 未患某研究 性样 疾病
No Yes 非暴露组 No
队列研究的结构模式图
本
固定队列
出现结局 未出现结局
研究开始
研究结束
动态队列
出现结局
失访
研究开始
研究结束
队列研究的特点
属于观察性研究
设立对照组 由因及果
能计算发病率,确证暴露与疾病的因果联系
质量控制
培训调查员
制定相应的规章制度 盲法
资料分析
计算各组的发病或死亡率
对组间率的差异进行统计学显著性检验 对差异有统计学显著性的进一步计算关联强
度
累计发病率:观察人群比较稳定
观察期内发病(或死亡 )人数 CI 观察开始时的人口数
发病密度:观察期间人群人数产生了较大的
直接获得暴露组和非暴露组的发病率或死亡率
直接估计危险度
符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力
设计要求严密,资料的收集和分析难度较大
队列研究的实施—确定研究结局
结局:指研究者预期的结果事件。是队列研
究观察的自然终点。 结局不仅限于发病、死亡还可以是中间变量。
队列研究的实施—确定研究对象
暴露人群的选择: 职业人群 特殊暴露人群 一般人群 有组织的人群团体 对照人群的选择 内对照 外对照 人群对照 多种对照
职业人群
暴露史比较明确,有关暴露与疾病的历史记
流行病学 第四章 队列研究

南京医科大学公共卫生学院流行病与卫生统计学系 电邮:sujing@
流行病学病因研究的一般过程
描述疾病频 度和分布
描述性研究
三间分布 常规资料 临床信息
形成
检验
→ 假设 → 假设
→ 因果 推断
逻辑推理
(Mill’s 准则)
队列研究 病例对照研究
实验研究
结合各方面因
素进行综合分
二、基本原理
选定一组研究人群,根据过去或目前的暴露情 况进行分组 有无暴露因素:暴露组和非暴露组 暴露因素的水平:低、中、高剂量组
随访观察各组的观察结局(发病或死亡) 比较各组发病率或死亡率的差异,从而判定暴
露因素与发病有无因果关联及关联大小
©by Jing Su
暴
露
组
研
究
对
象
对
照
组
发病 未发病 发病 未发病
研究现场: 江苏省海门市(HCC高发区)
研究人群: 35个镇的1008个村的25-64岁居民 海门市防疫站工作人员入户调查
©by Jing Su
四、确定样本量
决定因素: 1、一般人群(非暴露组的)所研究疾病的发病
或死亡率(P0),P0越接近0.5,样本越小 2、暴露组与对照组人群发病率之差d= P1- P0, 暴露组疾病的发病或死亡率(P1),或相对危 险度(RR)估算P1,d越大,样本越小
注意事项: 一般对照组样本数≥暴露组的样本数 估计失访对数据分析的影响,一般按估计样
本量增加10%作为实际样本量
©by Jing Su
例:乙肝病毒感染与原发性肝细胞癌的队列研究
假设HCC发病率P0=0.003/人年(全国水平)
假设HBV感染者的发病率为未感染者的2.5倍,即
第四章 流行病学 队列研究

第四章队列研究定义:队列研究是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。
主要特点1)观察法2)设立对照3)由因到果,符合时间顺序4)确证暴露和结局因果关系一、研究目的(用途)检验病因假设评价预防措施效果研究疾病的自然史新药的上市后监测二、研究类型1.前瞻性队列研究:研究队列的确定是现在2.历史性队列研究:研究对象在过去某时刻3.双向性队列研究:研究队列的确定是过去,根据研究对象过去某时刻的暴露情况分组,需要随访,部分结局可能已出现三、率的计算1.累积发病率2.发病密度3.标化死亡比(SMR)4.标化比例死亡比(SPMR)计算方法是以全人口中某病因死亡占全部死亡的比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。
适用条件:不能得到历年人口资料;仅有死亡人数、原因、日期和年龄。
四、效应的估计1.相对危险度(RR )意义:暴露组发病或死亡的危险是非暴露组的多少倍。
RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。
2.归因危险度(AR )意义:AR值增加,暴露因素消除后所减少的疾病数量增加。
RR和AR的流行病学意义不同:RR说明暴露者与非暴露者比较相应疾病危险增加的倍数;AR则是指暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生。
前者具有病因学的意义,后者更具有疾病预防和公共卫生学上的意义。
3.归因危险度百分比AR%(病因分值EF)意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。
4.人群归因危险度(PAR)PAR=I t-I0I t:总人群率I o:非暴露组率说明暴露对一个具体人群的危害程度,以及消除这个因素后该人群中的发病率或死亡率可能降低的程度。
意义:暴露人群与一般人群比较,所增加的疾病发生率的大小;PAR值增加,暴露因素消除后所减少的疾病数量增加。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般人群 吸烟与肺癌;口服避孕药与子宫内膜癌;饮食与高血压等。
1948年美国把Framingham 30-60岁居民,作为心血管病前 瞻性研究基地。 注意问题:因素与疾病均应常见;无或不需特殊暴露人群
有组织的团体 医生、工会会员;参加保险者
28
2、对照人群(非暴露人群)的选择
可比性
内对照:同一队列无暴露或暴露水平低者(最理想的对照) 如Framingham心脏病研究 外对照:在特殊暴露人群以外的特设对照
22
确定研究因素
明确研究因素的定义 一般应对暴露因素进行定量,除了暴露水平 以外,还应考虑暴露时间、暴露方式 同时需收集其他暴露因素资料及背景资料, 包括各种可疑的混杂因素及研究对象的人口 学特征,以利于对研究结果作深入分析。
23
主要暴露因素 在描述性研究和病例对照研究的基础上确定
可能影响结局暴露因素
35
质量控制
1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员 的工作;对不同调查员的数据进行分布比较;变量 的时间趋势分析。
36
Coronary Heart Disease (CHD) Risk And Framingham Heart Study
39
率的计算
1、队列发病(死亡)率的计算 累积发病率+发病密度: 取决于研究人口的稳定性。 ① 累积发病率(cumulative incidence,CI) 定义:某一固定人群在一定时期内某病新发生例数(D) 与时期开始时总人数(N)之比。 前提:研究人群数量比较多,人口比较稳定,资料整齐。 公式:CI= 发病累积人数 / 固定人口数,也即
3
根据特定条件的不同,流行病学中的队列一般有两种情 况:一是指特定时期内出生的一组人群,叫出生队列 (birth cohort);另一种是泛指具有某种共同暴露或特征 的一组人群,一般即称之为队列或暴露队列,如某个时期 进入某化工厂工作的一组人群。
4
根据人群进出队列的时间不同,又可分为: 固定队列 人群都在某一段时间或一个短时期内进入队 列,对人群进行随访到观察期终止,不再加入新成员。 动态队列 在某一时期确定队列后,原有的队列成员可 以不断退出,新的观察对象可以随时加入。
12
三、研究类型
(一)前瞻性队列研究:即时性队列研究,开始时确定 对象、分组,经随访得到结局。 研究队列的确定是现在 根据研究对象现在暴露分组 需要随访(follow-up)
结局在将来某时刻出现
13
优点
直接获得暴露与结局资料,结果可信 时间顺序增强病因推断可信度
缺点
随访观察时间长,花费大
37
第三节 资料分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组
非暴露组 合计
a
c
b
d
a+b=n1 a/n1= Ie
c+d=n0 c/n0 = Io
a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
38
流行病学资料分析原则
1、描述性分析: 研究对象的一般特征 均衡性检验 2、推断性分析: 显著性检验:比较两组率有无显著性差异 效应估计(联系强度) :用率或暴露比估计 3、控制混杂因素:匹配;分层;多因素分析
影响可行性
14
应用指征
1、有明确的研究目的和检验假设; 2、所研究疾病的发病率或死亡率一般不低于5‰; 3、要有把握获得观察人群的暴露资料; 4、要有把握确定发病或死亡等结局的简便而可靠的手段;
5、要有把握获得足够数量的观察人群,并且该人群能被长 期随访观察而获得完整可靠的资料;
6、要有足够的人力、物力和财力
混杂因素 人口学特征等
暴露测量 性质 定性(quality) 定量(quantity) 查阅记录
24
方法 访谈
实验室检查
确定研究结局
结局变量也叫结果变量,简称为结局。是指随访观察中 将出现的预期结果事 件,也即研究者希望追踪观察的事 件。结局就是队列研究观察的自然终点,它与观察期的 终止不是一个概念。
15
(二)历史性队列研究:也称回顾性队列研究,研究工作是 现在开始的,而研究对象是过去进入队列的。
其分组是根据研究开始时已掌握的有关研究对象在过去某个时点暴
露情况的历史材料作出的。 不需要随访,研究开始时结局已出现。
16
优点
短期内完成资料的收集和分析 时间顺序仍是由因到果
省时、省力、出结果快
time
Study starts Exposure Disease occurrence
前瞻性队列
time
20
第二节 队列研究设计与实施
确定研究目的 确定研究因素
确定研究结局
确定样本量
确定研究现场和研究人群
资料收集与随访
21
确定研究目的
队列研究的主要目的是进一步验证现况调 查或病例对照研究中已发现的有特异影响、 且在统计学上有联系的危险(或保护)因 素。 因此,在设计阶段,必须查阅有关文献, 了解国内外在该因素方面已做过哪些工作, 包括其研究的方法及结论等。
研究者预期的结果事件;死亡、发病以及某些试验指
标的变化:血清学指标、分子标志物等
研究结局的确定应全面、具体、客观。 结局变量的测定,应给出明确统一的标准,并在研究 的全过程中严格遵守。
25
一次研究可有多个结局
慢性 支气 管炎
吸烟 吸烟
肺癌
冠心 病
结局的测量
采用国际或国内通用的标准
26
确定研究现场和人群 研究现场要求: 人口相对稳定,便于随访; 有足量研究对象; 领导重视; 群众配合; 交通方便; 被研究的疾病发病率高。
30
可用下式计算出各组所需的样本含量
2 PQ ua u n 2 p1 p0
P为两 式中p1与p0分别代表暴露组与对照组的预期发病率, 个发病率的平均值,Q=1-P,uα和uβ为标准正态分布下的面 积,可查表求得。
考虑失访:10%
31
资料收集与随访
暴露资料(即基线资料)+两组人群特征资料+结局资料。
11
队列研究的目的:
1. 检验病因假设 由于队列研究检验病因假设的能力较强,因此深入检验病因假 设是队列研究的主要用途和目的。 一种暴露 一个或多个结局
2. 评价预防效果 有些暴露有预防某结局发生的效应,即出现预防效果。 如大量的蔬菜摄入可预防肠癌的发生,戒烟可减少吸烟者肺癌发生的危险等
3. 研究疾病自然史 暴露之后疾病发生发展的过程,以及多种因素(自然或社会)的影响
基线资料收集(baseline information): 待研究的暴露因素和暴露情况的资料,疾病与健康状况 的资料以及个人信息资料 1)查阅各种常规记录 2)询问调查 3)医学检查 4)环境的测量 研究对象人群特征资料 结局资料(outcome data)收集------随访follow-up
32
随访期:据疾病的潜伏期(病因作用到临床发现)和暴露与疾病的联系强度作出 随访目的: 1)确定研究对象是否处于观察之中(分母) 2)确定人群中事件结局(分子) 3)收集暴露因素的变化、混杂因素的资料 1)利用记录或档案 2)特殊方法:面谈、电话、通信 3)环境检测
随访方法:
观察终点(end point)与终止时间:前者是观察对象出现了预期的结果;后者是整 个研究可得出结论的时间 间隔时间:据具体情况而定,慢性病间隔一般为1-2年 随访者:培训
如则 果至 a 暴少 露 两 a b与 组 疾的 病发 存病 在率 c 病显 著 c d因 关不 系等
Time
10
队列研究的特点:
(1)研究对象按暴露与否分组;
(2)从因果关系看,由因及果; (3)获得发病率指标; (4)研究对象为非病人但可能患病者; (5)可用于罕见暴露因素研究;
(6)观察时间较长;
第四章 队列研究
(Cohort Study)
1
第一节 概 述
一、基本概念:
队列(cohort ):泛指共同暴露 于某因素或者具有某种共同特征 的一组人群。例如一组出生队列 有相同的出生年代,一组吸烟队 列有共同的吸烟经历。 Roman legion
具有共同的经历
随访一定的时间
2
大多数慢性病都是历时多年的一个过程所形成。在此期间 发生的许多事件都可能起致病作用。 队列研究通过对某一人群在某种病尚未明显发生前,某 个(或某些)可能起病因作用或保护作用的事件的后果进 行随访监测,进行从“因”观“果”的流行病学研究。
注:
首先,暴露必须有明确定义; 其次,根据资料或特别检查结果,评定队列成员的暴露状 况,剔除其中已患或疑似已患所研究疾病的人和对之不易 感的人。原则是只能以受危者,即有可能患这种病但并未 患这种病的人,作为观察对象。 除所研究的暴露之外,还要收集与患病危险度有关系的其 他暴露的资料。
33
随访:对暴露组和对照组采用同样的方法同等地进行
8
二、基本原理
根据研究对象是否暴露于某研究因素或其不同水平将研
究对象分成暴露组(E)与非暴露组(Ē)
随访一定时间,比较两组之间所研究结局(outcome)发
生率的差异,以分析暴露因素与研究结局之间的关系
9
暴 露 组
未患 所研 究的 疾病
发
病
a b
c d
研 究 对 象
未发病
非 暴 露 组
发
病
未发病
缺点
资料积累时未受到研究者的控制,内容上 未必符合要求 需要足够完整可靠的过去某段时间研究对 象的暴露和结局的历史记录或档案材料