队列研究
第5章队列研究

第5章队列研究一、名词解释1、队列研究:又称为前瞻性研究、随访研究及纵向研究,是通过将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的组或队列,随访观察一段时间,比较各组人群某病的发病率或死亡率,从而判定暴露因子与疾病之间有无因果关联及关联大小的一种观察性研究方法。
2、暴露:是指研究对象接触过某种待研究的物质、具备某种特征或行为。
3、随访:实际上就是基线调查后每隔一段时间对研究对象进行观察测量,收集疾病结局资料的过程。
4、人时:就是将随访人数乘以观察时间的积和,常以人年作为单位,故又称为人年数。
5、相对危险度:是暴露组的发病率除以非暴露组的发病率,是反映暴露与发病(死亡)关联强度的最有用的指标,也叫危险比或率比。
6、失访偏倚:队列研究的观察随访中,部分对象迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列而引起的偏倚即为失访偏倚。
二、是非题1、-2、-3、+4、+5、-三、选择题1、 b2、 b3、 e4、 a5、 e四、简答题1、队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据是否暴露于某个待研究的因素,或其不同的暴露水平分组,随访观察一段时间,定期检查并记录各组人群预期结局的发生情况,比较各组结局的发生率,从而评价暴露因素与结局的关系。
如果暴露组某结局的发生率明显高于或低于非暴露组,则可推测暴露与结局之间可能存在因果关系。
在队列研究的研究对象必须是在研究开始时没有出现研究结局,有可能出现该结局的人群。
暴露组与非暴露组必须有可比性,非暴露组必须使除了未暴露于所研究的暴露因素之外,其余各方面都尽可能与暴露组相同的一组人群。
2、累计发病率:指在一定时期内固定队列中某病新发病例数与观察开始时总人数之比。
发病密度:是指一定时间内的平均发病率,是以观察人时为分母计算发病率,这时的率带有瞬时频率性质称为发病密度。
标化比:以全人口发病(死亡)率做标准,算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再计算观察人群中实际发病(死亡)人数与此预期发病人数之比即得标化发病(死亡)比。
队列研究-医学统计学

1
473.5
0
36.5
13337.5
73 74 467 819 57
1612
发病密度=1612/13337.5*100%=12.1%
wn
40
3.标化死亡比 (standardized mortality ratio SMR)
研究人群中观察发病死 (亡)数 SMR 标准人口(全人口)期 预发病(死亡)数
wn
4
暴露 a+b 非暴露 c+d
前瞻性收集发病情况 病人a
比较
非病人b a /(a+b)
病人c
非病人d c /(c+d)
队列研究原理示意图
wn
5
(一)队列研究的定义
选定暴露和未暴露于某种因素的两组人群, 追踪观察一段时间后,比较两组发病结局的 差异,从而判定暴露因素与发病有无因果关联 及关联强度的一种观察性研究方法。
13
结论
吸烟者比不吸烟者发生肺癌多, 吸烟与肺癌之间有剂量效应关系,吸烟量 越大,患肺癌的危险性亦越大。 重度吸烟者发生肺癌的危险性比不吸烟者 大45倍。 吸纸烟者毕吸烟斗者患肺癌风险大。
wn
14
二、队列研究的设计与实施
(一)确定研究因素 (二)确定研究结局 (三)确定研究现场和研究人群 (四)确定队列大小 (五)资料收集与随访 (六)质量控制
变化范围 0~∞ 适用条件
结局事件的发生率比较低,无论观察 的时间长或短,都不宜直接计算率时。
wn
41
标化死亡比 (SMR)
预期发病(死亡)数的计算
以全人口某病的发病(死亡)率乘以某单 位人口数
wn
42
意义
标化死亡比 (SMR)
预防医学-队列研究

预防医学
七、 资料分析和结果解释
2.归因危险度AR(Attributable risk)
a c AR I e I 0 n1 n0
或
AR RR I 0 I 0 I 0 RR 1
意义 • 暴露与非暴露人群比较,所增加的发病或死亡率 • AR值越大,暴露因素消除后所减少的疾病发病 概率越大
对照组 年龄相差不超过 3 岁,出生地区相同, 工种的体力消耗相当,在同一城市的 造纸厂随机选择的343名男性工人
预防医学
四
资料收集
• 查阅档案记录 用药情况、既往车间CS2的浓度等 • 询问 姓名、性别、年龄、工种及工作年限、 吸烟、业余时间的体力活动情况 • 实验室检查 血糖、血脂、血清胆固醇水平、血压、 心电图、心脏大小、体重及车间CS2浓度 的动态变化
预防医学
分析性研究
(Analytical Study)
分析性研究
概念: 是进一步在有选择的人群中观察可疑病因 与疾病和健康状况之间有无关联的一种研 究方法。
队列研究 病例对照 研究
• 按是否暴露于某研究因素而 将研究对象分组 • 前瞻性观察发病水平的差别
• 按是否患病将研究对象分为 两组 • 研究因素的暴露有无差别
考虑到失访,实际上每组需扩大10%,即2541人
预防医学
六、 资料的收集
基线资料的收集
资料的收集
随访和结局资料的收集
获得途径
主要暴露因素
结局有关的其他信息
所需信息
人口学资料
预防医学
随访和结局资料的收集
结局( outcome variable )是观察人群中出 现的预期结果事件,是队列研究的观察终点。 一次研究可有多个结局
队列研究

暴露 组率
Ie a n1 RR I0 c n0
意义
非暴露 组率
E发病或死亡的危险是Ē的多少倍 RR值 ,暴露的效应 暴露与结局关联强度
实例
乙肝病毒感染与PHCC关系的队列研究结果
暴露组
累积发病率 发病密度
非暴露组
RR
14.75 15.63
75.25‰ 7.749 ‰
5.10‰ 0.4959‰
结局的关系。
危险因素(risk factor)泛指能引起某特定不良
结局(outcome),或使其发生的概率增加的因 子,包括个人行为、生活方式、环境和遗传等多 方面的因素。危险因素的反面称为保护因素 (protective factor).
结局 暴露
Y
E
目标人群
代表性 样本 N
Ē
时间顺序
Y
N
过去
发病、死亡、健康状况和生命质量
终极结果(发病)或中间结局(血清变化)
正面(生命延长)和负面(发病)
定性或定量
可多个或多方面(实例的结局是PHCC死亡 )
一次研究可有多个结局
慢性 支气 管炎 吸烟
吸烟
肺癌
冠心 病
结局的测量
采用国际或国内通用的标准
确定研究现场与研究人群
研究现场 有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高
优 点
时间顺序增强了病因推断的可信度
直接获得暴露与结局资料,结果可信
能获得发病率
缺 点
所需样本量大,花费大,时间长 影响可行性
前瞻性队列研究应用条件
有明确的检验假设 所研究疾病的发生率较高,一般不低于5‰ 明确规定暴露因素和结局变量 有可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群
第四章队列研究(cohortstudy)

4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第四章 队列研究 (cohort study)
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
队列研究

基线资料收集方法
(1)查阅医院、工厂、单位及个人健康保险的 记录或档案; (2)访问研究对象或其它能够提供信息的人;
(3)对研究对象进行体格检查和实验室检查;
(4)环境调查与检测。
(二) 随 访
1.随访对象:暴露组和对照组观察/研究对 象; 2.随访方法:面对面访问、电话访问、自填 问卷、定期体检、环境与疾病的监测、医 院医疗与工作单位的出勤记录的收集等。 对暴露组和对照组采用相同的方法同等随 访,追踪至观察终止期。对失访者补访。 失访原因分析。比较失访者与继续观察者 基线资料,估计有无偏差。
队 列 研 究
前瞻性研究(prospective study)、 发 生率研 究(incidence study)、
随访研究(follow-up study)、
纵向研究(longitudinal study)、 是分析流行病学研究中的重要方法, 检验病因假设的效能优于病例对照 研究。在病因流行病学研究中应用 广泛。
(二)影响队列大小的几个因素
1.一般人群(对照人群)中目标疾病的发病率p0: n∝p0q0; 其 中 q0=1 - p0 。 p0→0.5 , p0q0→Max,n→Min 2.暴露组与对照组发病率之差(d=p1 - p0): d→↑,n→↓。
3.要求的显著性水平α值: 要求的α→↑, n→↓。常取α =0.05或 0.01。 4.检验效能(power of test)或把握度 1-β: 若 要 (1-β)→↑,β→↓, 则 n→↑ 。 常 取 β=0.10,有时用0.20。
图4-2 队列研究的结构模式图
队列研究的基本特点: 1. 属于观察法:暴露不是人为给予 的,是在研究之前已客观存在的, 这是与实验研究的重要区别点。
队列研究

第一节概述
固定队列
Fixed Cohort
出现结局 未出现结局
研究开始
研究结束
第一节概述
动态队列
Dynamic Cohort
出现结局
失访
研究开始
研究结束
第一节概述
时间顺序
结局(疾病) 是否暴露某个危险因子
Yes 暴露组
目标人群 代表 未患某研究 性样 疾病
AR % Ie I0 Ie 100 %
或
AR %
RR 1 100 % RR
意义
暴露人群中的发病或死亡归因于暴露的部 分占全部发病或死亡百分比
人群归因危险度
population attributable risk PAR
PAR= It-I0
It:总人群率 Io:非暴露组率
意义
结果
随着血清胆固醇水平的升高,其患冠心病的RR增 大,说明存在剂量效应关系
选择偏倚
失访偏倚 信息偏倚
混杂偏倚
selection bias
研究人群在一些重要因素方面与一
般人群或待研究的总体人群存在的差异
选择偏倚
产生原因
选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等
发病密度 (incidence density)
)人数 ID 观察期内发病(或死亡 观察人时
变化范围: 0~∞ 适用条件:
观察时间长,人口不稳定,存在失访, 资料不很整齐
五 效应估计
相对危险度
归因危险度
归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系
队列研究

(暴露在研究之前就客观存在,不是人为给予的)
2.设立对照组。
3.属于由“因”到“果”的研究。 3.能验证暴露因素与结局的因果联系。
(三)研究类型
1. 前瞻性队列研究(prospective cohort study) 是队列研究的基本形式,研究开始时结局 尚未出现。 2. 历史性队列研究(historical cohort study) 又称回顾性队列研究(retrospective cohort study) ,研究者根据已掌握的研究对象 在过去某个时点的暴露情况进行分组,研究开始 时结局已经出现。 3. 双向性队列研究(ambispective cohort study)
①RR>1 危险因素,RR越大,联系强度越强; ②RR<1 保护因素,RR越小,联系强度越强; ③RR=1 研究因素与疾病无联系。
• RR的点估计值(样本值)
• RR的95%可信区间(总体范围):
RR U , RR L RR
11.96 / 2
2.归因危险度(attributable risk , AR)
四、队列研究的资料整理与分析
步骤: • 资料正确性和完整性检查; • 描述性分析:
– 包括: 研究对象的组成及人口学特征;随访 时间、经过、失访情况及结局发生情况;两 组的可比性及资料的可靠性(偏倚情况)等。
• 推断性分析:
– 暴露与结局的联系及其联系强度分析。
(一)率的计算
1.累积发病率 (cumulative incidence rate, CI)
图2. 队列研究类型示意图
三、队列研究的设计与实施
(一)确定研究因素
• 在描述性研究和病例对照研究基础上确定暴露 因素。 • 对暴露因素必须明确规定,如性质、时间、频 率、强度、方式等。 最好将暴露定量。 • 应明确划分暴露与非暴露人群的界限以及暴露 因素分级标准。 • 除暴露因素外,还要同时收集研究对象的人口 学特征和可疑混杂因素资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5、有足够的观察人群并将其分成暴露组与非 暴露组 6、观察人群相对稳定 7、有足够的人力、物力和时间支持长时间的 研究工作 (二)选择历史性队列研究的要点 1-5 同上 6、是否可被利用的医学记录或档案资料
实施
五、研究对象的选择 (一)暴露人群的选择
1、特殊暴露人群 (1)职业人群 (2)特殊暴露人群 2、一般人群 (1)一般社区居民 (2)有组织的团体人群
abcd lnRR的95%CI
ln RR 1.96 Varln RR
反自然对数即为RR95%CI
RR=1: 说明暴露因素与疾病无关联。 RR>1: 说明暴露因素与疾病有“正”关 联,是致病因素。 RR<1: 说明暴露因素与疾病有“负”关 联,是保护因素。
表 RR与关联强度
RR
0.9~1.0
1.0~1.1
0.7~0.8 0.4~0.6 0.1~0.3 <0.1
1.2~1.4 1.5~2.9 3.0~9.9
10~
关联强度 无 弱 中 强
很强
(2)归因危险度 / 特异危险度(Attributable Risk, AR)
AR=暴露组发病率-非暴露组发病率
意义
➢ 暴露与非暴露人群比较,所增加的疾病发 生数量
➢ 根据研究开始时研究者掌握的有关研究对象 在过去某时刻的暴露情况的历史材料分组
➢ 不需要随访,研究开始时结局已出现
优点
➢ 短期内完成资料的收集和分析 ➢ 时间顺序仍是由因到果 ➢ 省时、省力、出结果快
缺点
➢资料积累时未受到研究者的控制,内容上 未必符合要求
➢需要足够完整可靠的过去某段时间有关研 究对象的暴露和结局的历史记录或档案材料
队列研究的优点和局限性
一、优点 (一)适用于常见病。 (二)研究方向由“因”及“果”,资料偏 倚少较可靠。 (三)可以直接获得两队列人群的发病率或 死亡率,及各种疾病危险关联指标,故结果 真实可靠。
(四)一次调查可以观察多种结局。 (五)能够了解人群疾病的自然史。 (六)可计算暴露与疾病的“剂量-反应”关系。
队列研究所观察的结局是可疑病因引 起的效应(发病或死亡),除了所研究的 一种病,还可能与其他多种疾病存在联系, 这样就可观察一个因素的多种效应。
暴露(exposure) 指接触过某种物质、具备某种特征或
处于某种状态
队列(cohort) 有共同经历或有共同暴露特征的一群人 分为固定队列和动态队列
固定队列 Fixed Cohort
双向性队列研究 ambispective cohort study
➢ 研究队列的确定是过去 ➢ 根据研究对象过去某时刻的暴露情况分组 ➢ 需要随访 ➢ 结局可能已出现
概述
四、队列研究的用途 ➢检验病因假设 ➢描述疾病自然史 ➢评价自发的预防效果 ➢新药的上市后监测
队列研究的实施
实施
一、研究因素的确定 暴露因素
2、均衡性检验 检验两组在研究因素以外其它主要特征有 否可比性。 应把两组的上述特征逐一加以比较,必要 时作显著性检验
3、率的计算 (1)累计发病率(Cumulative Incidence)
CI
观察期内发病(或死亡)人数 观察开始时的人口数
变化范围:0-1 适用条件:样本大,人口稳定,整齐的资料
资料收集方式
查阅纪录 调查询问 健康或疾病检查 环境监测
(二)随访
随访对象、内容和方法 随访间隔 随访者
1、观察终点(end point) :指一个研究 对象出现了预期的结局,或一项检测指标达 到某水平,至此就不再对该研究对象进行继 续随访。
2、 观察终止时间(end time):指整个研 究工作观察的截止时间。
(2)发病密度(Incidence Density)
ID
观察期内发病(或死亡)人数 观察人时
变化范围:0-∞ 适用条件:观察时间长,人口不稳定,存在
失访,资料不很整齐
4、暴露人年的计算 ( 1)大样本人群暴露人年的计算 (2)样本直接计算 (3)寿命表法
5、率差异的显著性检验: U检验、χ2检验
(二)公式法: (三)查表法 (四)失访率:一般按照10%的失访率进行样 本量的估计
样本大小的计算 公式法
N Z 2P 1 P Z P11 P1 P01 P0 2 P1 P0 2 P1:暴露组预期发病率 P0:对照组预期发病率
条件:暴露组和对照组样本含量相等
已知 p0=0.007,RR=2.5,α=0.05,β=0.1, 计算样本量
大多数慢性病都是历时多年的一个过程 所形成。在此期间发生的许多事件都可能起 致病作用。
队列研究通过对某一人群在某种病尚未 明显发生前,某个(或某些)可能起病因作 用或保护作用事件的后果进行随访监测,进 行从“因”追“果”的流行病学研究。
概述
一、队列研究的定义 队列研究是选定暴露及未暴露于某因
素的两种人群,追踪其各自的发病结局, 比较两者发病结局的差异,从而判断暴露 因子与发病有无因果关联及关联大小的一 种观察研究方法。
(3)人群归因危险度(Population Attributable Risk, PAR)
PAR=全人口某病发病率(死亡率)- 非暴露组某病发病率(死亡率)
(4)标准化死亡比 (Standardized mortality ratio, SMR)
研究人群中观察发病死 (亡)数 SMR 标准人口(全人口)期 预发病(死亡)数
6、计算暴露与发病的关联强度 ( 1)相对危险度(relative risk,RR)
是暴露组发病率I e (或死亡率)与非暴 露组发病率I 0(或死亡率)的比值 。
RR= I e / I 0
当RR大于1时,RR值越大,暴露的效应越大,暴 露与结局关联强度越大
RR95%CI:
Woolf法
VarInRR 1 1 1 1
出现结局
未出现结局
研究开始
研究结束
动态队列 Dynamic Cohort
出现结局
失访
研究开始
研究结束
概述
二、队列研究的特点 ➢属于观察性研究方法 ➢设立对照组 ➢观察方向由“因”及“果” ➢能准确证明暴露与疾病的因果关系
概述
三、队列研究的种类 ➢前瞻性队列研究
(prospective cohort study) ➢历史性队列研究
是标准人群的SMR倍 SMR<1 研究人群某病发病(死亡)危险<标准人群
5、剂量反应关系 分析方法 ➢ 列出不同暴露水平下的发病率 ➢ 以最低暴露水平组为对照,计算各暴露水平
的RR和AR
表 40~59岁男子按初始血清胆固醇分组冠心病6年发生情况
血清胆固醇
人数 病例数 危险度 平均年发病率
RR
<210
二、局限性 (一)不适用于罕见病。 (二)观察时间较长,易产生失访偏性。 (三)资料分析时要求有较高的技术,花费大, 时间长。 (四)每次研究只能列入一个或一组研究因素。
队列研究研究实例
二硫化碳长期低剂量的暴露 与冠心病的关系
二硫化碳(CS2)
➢神经系统毒物,抑制酶的活性,影响脂蛋白代谢, 造成心血管疾病 ➢长期接触低浓度CS2可引起慢性中毒和动脉粥样硬化 ➢短时间接触高浓度的CS2蒸气可急性中毒
结局的测量 尽量采用国际或国内通用的标准
实施
三、确定研究现场和人群 ➢ 有足够符合条件的研究对象 ➢ 领导重视、群众支持 ➢ 医疗条件较好,交通较便利 ➢ 发病率较高
实施
四、方法的选择 (一)选择前瞻性队列研究的指征
1、是否有明确的假设及因素供检验。 2、所观察的结局的发生率一般不低于5‰。 3、明确规定暴露因素,可准确获得观察人群 的暴露资料。 4、明确规定结局变量,可准确获得结局资料。
(historical cohort study) ➢双向性队列研究
(ambispective cohort study)
时间顺序
过去
现在
回顾性收集已有的历史资料 历史性队列
将来
回顾性收集已有的历史资料
双向性队列
继续前瞻性收集资料
前瞻性收集资料
前瞻性队列
队列研究类型示意图
前瞻性队列研究
Prospective Cohort Study
根据上述条件: Zα=1.96, Zβ=1.282 ,q0=0.993
p1=p0×RR=0.0175,q1=0.9825 代入公式得 N=2310
考虑到失访,实际上每组需扩大10%,即2541人
实施
七、资料的收集 (一) 资料收集的内容和方式
基线(base-line)资料: 暴露的资料 个体的其他信息
➢ 研究队列的确定是现在(concurrent) ➢ 根据研究对象现在暴露分组 ➢ 需要随访(follow-up) ➢ 结局在将来某时刻出现
优点
➢ 时间顺序增强病因推断可信度 ➢ 直接获得暴露与结局资料,结果可信 ➢ 能获得发病率
缺点
➢所需样本量大,花费大,时间长 ➢影响可行性
历史性队列研究
Historical Cohort Study
(二)对照人群的选择 1、内对照:在同一研究人群中,选用没
有暴露或暴露水平最低的人员作为对照组。 2、外对照:特设对照 3、总人口对照 4、多重对照
注意:对照人群与暴露人群在主要特征上应 相同或相近。
实施
六、样本量估计 (一)样本量的决定因素 ➢ 一般人群中所研究疾病的发病率水平 P0 ➢ 暴露组与非暴露组发病率之差 (d=P1-P0) ➢ 显著性水平 () ➢ 把握度 ( Power =1-)
队列研究
(Cohort Study)
内容
概述 队列研究的实施 数据资料的整理和分析 队列研究研究实例 队列研究的优点和局限性
概述
队列:
原意是指古罗马军团中的一个分队, 流行病学家加以借用,表示有共同经历或 共同状态的一群人,例如一组出生队列有 相同的出生年代,一组吸烟队列有共同的 吸烟经历。