队列研究
队列研究

资料的整理与分析-效应的估计
PAR=It-I0 It代表全人群的率,I0为非暴露组的率
PAR% It I0 100%
It
PAR%
Pe RR Pe RR
1 1
1
100%
偏倚
选择偏倚(selection bias) 有人拒绝参加; 有些人的档案丢失了或记录不全; 研究对象由志愿者组成,他们往往或是较健
样本含量的计算
2
n z
2 pq z p0q0 p1q1 p1 p0 2
式为分中两布p个下1与发的p病面0分率积别的,代平可表均查暴值表露,求组得q与=。1-对p,照Z组α和的Z预β为期标发准病正率态,
设计与实施-收集基线资料
基线资料一般包括待研究的暴露因素的暴露状况,疾病 与健康状况,年龄、性别、职业、文化、婚姻等个人 状况,家庭环境、个人生活习惯及家族疾病史等。
设计与实施-随访(续)
观察终点
观察终点(end-point)就是指研究对
象出现了预期的结果,达到了这个观察终点, 就不再对该研究对象继续随访。
观察的终止时间:观察终止时间是指整个研 究工作截止的时间。
资料的整理与分析 -人时的计算
常用的人时单位是人年,常用的人年计算方法有下列 三种。
以个人为单位计算暴露人年 用近似法计算暴露人年 用寿命表法计算人年
资料的整理与分析-效应的估计
人群归因危险度(population attributable risk, PAR)与人群归因危险度百分比(PAR%) 后者也叫 人群病因分值(population etiologic fraction, PEF)。PAR是指总人群发病率中归因于暴露的部分, 而PAR%是指PAR占总人群全部发病(或死亡)的百 分比。
第5章队列研究

第5章队列研究一、名词解释1、队列研究:又称为前瞻性研究、随访研究及纵向研究,是通过将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的组或队列,随访观察一段时间,比较各组人群某病的发病率或死亡率,从而判定暴露因子与疾病之间有无因果关联及关联大小的一种观察性研究方法。
2、暴露:是指研究对象接触过某种待研究的物质、具备某种特征或行为。
3、随访:实际上就是基线调查后每隔一段时间对研究对象进行观察测量,收集疾病结局资料的过程。
4、人时:就是将随访人数乘以观察时间的积和,常以人年作为单位,故又称为人年数。
5、相对危险度:是暴露组的发病率除以非暴露组的发病率,是反映暴露与发病(死亡)关联强度的最有用的指标,也叫危险比或率比。
6、失访偏倚:队列研究的观察随访中,部分对象迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列而引起的偏倚即为失访偏倚。
二、是非题1、-2、-3、+4、+5、-三、选择题1、 b2、 b3、 e4、 a5、 e四、简答题1、队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据是否暴露于某个待研究的因素,或其不同的暴露水平分组,随访观察一段时间,定期检查并记录各组人群预期结局的发生情况,比较各组结局的发生率,从而评价暴露因素与结局的关系。
如果暴露组某结局的发生率明显高于或低于非暴露组,则可推测暴露与结局之间可能存在因果关系。
在队列研究的研究对象必须是在研究开始时没有出现研究结局,有可能出现该结局的人群。
暴露组与非暴露组必须有可比性,非暴露组必须使除了未暴露于所研究的暴露因素之外,其余各方面都尽可能与暴露组相同的一组人群。
2、累计发病率:指在一定时期内固定队列中某病新发病例数与观察开始时总人数之比。
发病密度:是指一定时间内的平均发病率,是以观察人时为分母计算发病率,这时的率带有瞬时频率性质称为发病密度。
标化比:以全人口发病(死亡)率做标准,算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再计算观察人群中实际发病(死亡)人数与此预期发病人数之比即得标化发病(死亡)比。
队列研究-医学统计学

1
473.5
0
36.5
13337.5
73 74 467 819 57
1612
发病密度=1612/13337.5*100%=12.1%
wn
40
3.标化死亡比 (standardized mortality ratio SMR)
研究人群中观察发病死 (亡)数 SMR 标准人口(全人口)期 预发病(死亡)数
wn
4
暴露 a+b 非暴露 c+d
前瞻性收集发病情况 病人a
比较
非病人b a /(a+b)
病人c
非病人d c /(c+d)
队列研究原理示意图
wn
5
(一)队列研究的定义
选定暴露和未暴露于某种因素的两组人群, 追踪观察一段时间后,比较两组发病结局的 差异,从而判定暴露因素与发病有无因果关联 及关联强度的一种观察性研究方法。
13
结论
吸烟者比不吸烟者发生肺癌多, 吸烟与肺癌之间有剂量效应关系,吸烟量 越大,患肺癌的危险性亦越大。 重度吸烟者发生肺癌的危险性比不吸烟者 大45倍。 吸纸烟者毕吸烟斗者患肺癌风险大。
wn
14
二、队列研究的设计与实施
(一)确定研究因素 (二)确定研究结局 (三)确定研究现场和研究人群 (四)确定队列大小 (五)资料收集与随访 (六)质量控制
变化范围 0~∞ 适用条件
结局事件的发生率比较低,无论观察 的时间长或短,都不宜直接计算率时。
wn
41
标化死亡比 (SMR)
预期发病(死亡)数的计算
以全人口某病的发病(死亡)率乘以某单 位人口数
wn
42
意义
标化死亡比 (SMR)
第四章队列研究(cohortstudy)

4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第四章 队列研究 (cohort study)
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
队列研究

基线资料收集方法
(1)查阅医院、工厂、单位及个人健康保险的 记录或档案; (2)访问研究对象或其它能够提供信息的人;
(3)对研究对象进行体格检查和实验室检查;
(4)环境调查与检测。
(二) 随 访
1.随访对象:暴露组和对照组观察/研究对 象; 2.随访方法:面对面访问、电话访问、自填 问卷、定期体检、环境与疾病的监测、医 院医疗与工作单位的出勤记录的收集等。 对暴露组和对照组采用相同的方法同等随 访,追踪至观察终止期。对失访者补访。 失访原因分析。比较失访者与继续观察者 基线资料,估计有无偏差。
队 列 研 究
前瞻性研究(prospective study)、 发 生率研 究(incidence study)、
随访研究(follow-up study)、
纵向研究(longitudinal study)、 是分析流行病学研究中的重要方法, 检验病因假设的效能优于病例对照 研究。在病因流行病学研究中应用 广泛。
(二)影响队列大小的几个因素
1.一般人群(对照人群)中目标疾病的发病率p0: n∝p0q0; 其 中 q0=1 - p0 。 p0→0.5 , p0q0→Max,n→Min 2.暴露组与对照组发病率之差(d=p1 - p0): d→↑,n→↓。
3.要求的显著性水平α值: 要求的α→↑, n→↓。常取α =0.05或 0.01。 4.检验效能(power of test)或把握度 1-β: 若 要 (1-β)→↑,β→↓, 则 n→↑ 。 常 取 β=0.10,有时用0.20。
图4-2 队列研究的结构模式图
队列研究的基本特点: 1. 属于观察法:暴露不是人为给予 的,是在研究之前已客观存在的, 这是与实验研究的重要区别点。
队列研究的名词解释

队列研究的名词解释队列研究是一种通过观察和分析数据队列中的顺序和时间间隔,来研究和理解人类行为和社会动态的方法论。
队列研究有着深厚的学术根基,它广泛应用于社会学、心理学、经济学以及其他行为科学领域中。
在队列研究中,人们可以将数据按照进入队列的时间顺序进行排列,从而获取到一种动态的信息序列。
队列中的数据可以是各种形式,比如个体的行为记录、社会事件的发生、经济交易的发展,甚至是自然界中物种的演变过程等等。
通过分析这些数据队列,我们可以揭示出许多隐藏在其背后的规律和机制。
队列研究的一个重要概念是“等待时间”。
在队列中,每个个体或事件都需要经历不同的等待时间才能被处理或出现下一步的行为。
队列研究通过对等待时间的分析,可以帮助我们理解大量现象,如人们等待公共交通的时间、顾客在商店排队等待购买商品的时间、用户在网络平台中排队等待获取服务的时间等等。
通过研究等待时间,我们可以找到优化队列管理、减少等待时间的策略和方法,提高人们的满意度和效率。
此外,队列研究还可以帮助我们理解和解决一些伦理和公平问题。
比如,在医疗领域中,通过队列研究可以分析和理解患者等待手术、检查或治疗的时间,进而优化资源分配,提高医疗服务的公平性。
在教育领域中,队列研究可以揭示学生在等待老师回答问题、分发试卷等行为中所面临的挑战,从而改善教学环节的效果,提高教学质量。
然而,队列研究也存在一些限制性因素。
由于队列研究对数据的时空顺序有严格的要求,数据收集和整理工作可能相对复杂和繁琐。
此外,队列研究的结果也可能受到个体行为的复杂性、外界环境的变动以及数据缺失等因素的影响。
因此,队列研究需要在不同学科的研究者之间进行深度交流和合作,借鉴各自的研究经验和方法,以确保研究结果的准确性和可靠性。
综上所述,队列研究是一种重要的研究方法,它帮助我们理解人类行为和社会动态的规律和机制。
通过对数据队列中的顺序和时间间隔进行观察和分析,我们可以揭示出许多有关等待时间、行为序列、资源分配和公平等问题的见解。
队列研究

第一节概述
固定队列
Fixed Cohort
出现结局 未出现结局
研究开始
研究结束
第一节概述
动态队列
Dynamic Cohort
出现结局
失访
研究开始
研究结束
第一节概述
时间顺序
结局(疾病) 是否暴露某个危险因子
Yes 暴露组
目标人群 代表 未患某研究 性样 疾病
AR % Ie I0 Ie 100 %
或
AR %
RR 1 100 % RR
意义
暴露人群中的发病或死亡归因于暴露的部 分占全部发病或死亡百分比
人群归因危险度
population attributable risk PAR
PAR= It-I0
It:总人群率 Io:非暴露组率
意义
结果
随着血清胆固醇水平的升高,其患冠心病的RR增 大,说明存在剂量效应关系
选择偏倚
失访偏倚 信息偏倚
混杂偏倚
selection bias
研究人群在一些重要因素方面与一
般人群或待研究的总体人群存在的差异
选择偏倚
产生原因
选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等
发病密度 (incidence density)
)人数 ID 观察期内发病(或死亡 观察人时
变化范围: 0~∞ 适用条件:
观察时间长,人口不稳定,存在失访, 资料不很整齐
五 效应估计
相对危险度
归因危险度
归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系
队列研究

(暴露在研究之前就客观存在,不是人为给予的)
2.设立对照组。
3.属于由“因”到“果”的研究。 3.能验证暴露因素与结局的因果联系。
(三)研究类型
1. 前瞻性队列研究(prospective cohort study) 是队列研究的基本形式,研究开始时结局 尚未出现。 2. 历史性队列研究(historical cohort study) 又称回顾性队列研究(retrospective cohort study) ,研究者根据已掌握的研究对象 在过去某个时点的暴露情况进行分组,研究开始 时结局已经出现。 3. 双向性队列研究(ambispective cohort study)
①RR>1 危险因素,RR越大,联系强度越强; ②RR<1 保护因素,RR越小,联系强度越强; ③RR=1 研究因素与疾病无联系。
• RR的点估计值(样本值)
• RR的95%可信区间(总体范围):
RR U , RR L RR
11.96 / 2
2.归因危险度(attributable risk , AR)
四、队列研究的资料整理与分析
步骤: • 资料正确性和完整性检查; • 描述性分析:
– 包括: 研究对象的组成及人口学特征;随访 时间、经过、失访情况及结局发生情况;两 组的可比性及资料的可靠性(偏倚情况)等。
• 推断性分析:
– 暴露与结局的联系及其联系强度分析。
(一)率的计算
1.累积发病率 (cumulative incidence rate, CI)
图2. 队列研究类型示意图
三、队列研究的设计与实施
(一)确定研究因素
• 在描述性研究和病例对照研究基础上确定暴露 因素。 • 对暴露因素必须明确规定,如性质、时间、频 率、强度、方式等。 最好将暴露定量。 • 应明确划分暴露与非暴露人群的界限以及暴露 因素分级标准。 • 除暴露因素外,还要同时收集研究对象的人口 学特征和可疑混杂因素资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
暴露 组率
Ie a n1 RR I0 c n0
意义
非暴露 组率
E发病或死亡的危险是Ē的多少倍 RR值 ,暴露的效应 暴露与结局关联强度
实例
乙肝病毒感染与PHCC关系的队列研究结果
暴露组
累积发病率 发病密度
非暴露组
RR
14.75 15.63
75.25‰ 7.749 ‰
5.10‰ 0.4959‰
结局的关系。
危险因素(risk factor)泛指能引起某特定不良
结局(outcome),或使其发生的概率增加的因 子,包括个人行为、生活方式、环境和遗传等多 方面的因素。危险因素的反面称为保护因素 (protective factor).
结局 暴露
Y
E
目标人群
代表性 样本 N
Ē
时间顺序
Y
N
过去
发病、死亡、健康状况和生命质量
终极结果(发病)或中间结局(血清变化)
正面(生命延长)和负面(发病)
定性或定量
可多个或多方面(实例的结局是PHCC死亡 )
一次研究可有多个结局
慢性 支气 管炎 吸烟
吸烟
肺癌
冠心 病
结局的测量
采用国际或国内通用的标准
确定研究现场与研究人群
研究现场 有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高
优 点
时间顺序增强了病因推断的可信度
直接获得暴露与结局资料,结果可信
能获得发病率
缺 点
所需样本量大,花费大,时间长 影响可行性
前瞻性队列研究应用条件
有明确的检验假设 所研究疾病的发生率较高,一般不低于5‰ 明确规定暴露因素和结局变量 有可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群
资料的收集与随访
基线资料 随 访 资料收集方法
基线(baseline)资料
暴露的资料
个体的其他信息
实例对研究对象的基线资料的收集包括:血
清HBsAg,同时还收集了肝炎史、PHCC家族史、
职业、吸烟、饮茶、饮酒、水源类型、主食
类型等其他可疑危险因素及年龄、性别等人
口学特征资料。
随访(follow up)
AR RR × I 0 I 0 I 0 RR 1
意义
E与Ē 人群比较,所增加的疾病发生数量 AR值 暴露因素消除后所减少的疾病数量
RR与AR的区别 疾病 肺癌 心血管疾病 吸烟者 非吸烟者 RR
(1/10万人年)
AR
50.12
296.75
4.69 170.32
10.7 1.7
产生原因
选择对象的方法不当
最初选定参加研究的对象中有人拒绝参加
历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等
控 制
预防为主,抽样方法正确,严格按规定标 准选择对象,提高研究对象的应答率和依从性
失访偏倚(lost to follow-up)
研究对象因迁移、外出、死于非终点疾病或拒绝继续 参加观察而退出队列所引起的偏倚。 本质上属于选择性偏倚
a(1079)
c(387) a+c=m1
非暴露组发病率=c/n0=75.25‰ 暴露组发病率=a/n1=5.10‰
表4-2
队列研究资料归纳整理表(人时资料) 暴露组 非暴露组 合计
病例数 人年数
A1 (1079)
A0(387)
M T
T1 (139238.27) T 0(780562.01)
暴露组发病率= A1 / T1=774.93 非暴露组发病率= A0 / T 0=49.58
控 制
设计 选择便于随访的人群 在计算的研究样本的基础上扩大10% 实施 加强对随访员的管理 制定随访计划和监测措施 整理资料
对失访对象进行补查
比较失访者和急需观察者的基本特征差异, 以评估失访可能造成的影响
第五节 优点与局限性 优点
直接获得暴露组和非暴露组的发病率或死亡率
有代表性
实例的研究现场是江苏省海门市
研究人群
从目标人群中抽出的具有代表性的人 未患所研究疾病 分为暴露组和对照组
暴露人群选择
职业人群
特殊暴露人群 一般人群 有组织的人群团体
对照人群的选择
内对照(internal control) : 一群研究对象内部
外对照(external control) : 一群研究对象外部
随访对象、内容和方法 随访间隔 随访者
观察终点(研究对象出现了预期的结果)
观察终止时间(整个研究工作截止的时间)
实例是从1993年起到2003年止每年随访一次,观察终点 是PHCC死亡
资料收集方式
查阅纪录 调查询问 健康或疾病检查 环境监测等
质量控制
调查员的选择
RR
1.00 1.81 3.39
AR
0.0000 0.0285 0.0851
结果 血清胆固醇水平 患冠心病的RR 说明存在剂量效应关系
第四节 常见偏倚及其控制
选择偏倚
失访偏倚
信息偏倚 混杂偏倚
选择偏倚(selection bias)
研究人群在一些重要因素方面与一般人群或待研究的 总体人群存在差异,而导致研究结果的偏倚。
1 1 11 a b c d
ln RR的95%CI ln RR ±1 . 96 Var
ln RR
反自然对数即为RR 95%CI,实例算出的危险度比(RR) 的95%可信区间是:13.12~16.60
归因危险度 (attributable risk, AR )
即暴露组发病率(危险度)与对照组发病率(危险度) 相差的绝对值 a c AR I e I 0 或 n1 n0
2
p1:暴露组预期发病率 p0:对照组预期发病率
p : 两个发病率的平均值
实例
已知 p0=0.003,RR=2.5,α=0.05,β=0.1
计算样本量
根据上述条件
zα=1.96, zβ=1.282 ,q0=0.997 p1=p0×RR=0.0075,q1=0.9925 代入公式得 n=5420 即HBsAg阳性组与阴性组各需5420人
影响样本量的因素
对照人群中所研究疾病的发病率p0 暴露组与对照组人群发病率之差p1-p0 第一类错误α值 把握度(power) 1-β
样本量的计算:
查表 公式计算(条件 暴露组和对照组样本含量相等)
z 2 pq z p q p q 0 0 1 1 n 2 p1 p 0
发病密度 (incidence density) ID =
观察期内发病(或死亡)人数 观察人时 0~∞ 观察时间长
变化范围 适用条件
人口不稳定
存在失访 资料不很整齐
标化死亡比 (standardized mortality ratio, SMR)
研究人群中的观察死亡数 SMR 以标准人口死亡率计算的预期死亡数
意义
乙肝病毒感染者发生PHCC的危险是非乙肝病毒感染者 的14.75倍
RR与关联强度
RR
关联强度
0.9~1.0
0.7~0.8 0.4~0.6 0.1~0.3 <0.1
1.0~1.1
1.2~1.4 1.5~2.9 3.0~9.9 10~
无 弱 中 强 很强
RR 95%CI
Woolf法
Var
ln RR
现在
将来
历史性队列
回顾性收集已有的历史资料 继续前瞻性收集资料
双向性队列
前瞻性队列
前瞻性收集资料
时间顺序
前瞻性队列研究 (prospective cohort study)
研究队列的确定是现在(concurrent) 根据研究对象现在的暴露分组
需要随访(follow up)
结局在将来某时刻出现
因素的测量:
需测量暴露的水平,暴露的时间,及暴露的
方式。暴露的测量应采用敏感、精确、简单和
可靠的方法。
性质:定性(quality),定量(quantity) 方法:访谈,实验室检查,查阅记录
确定研究结局
结局是研究队列中预期结果事件,是队列研的自然 终点(natural end)。研究结局的确定应全面、具体、 客观。可包括:
调查员培训 制定调查员手册
监督
第三节 资料的整理与分析
基本整理模式 人时的计算 率的计算
效应的估计
基本整理模式
表4-1 队列研究资料归纳整理表(累积发病率资料)
病例 暴露组 非暴露组 合计 非病例 b(13259) d(75511) b+d=m0 合计 a+b=n1 c+d=n0 a+b+c+d=t
40~59岁男子按基线血清胆固醇分组的冠心病6年发生情况
病例数 16 29 51 96 危险度 0.0352 0.0637 0.1203 0.0720 平均年发病率 0.0059 0.0106 0.0200 0.0120
血清胆固醇(mg/dl) 人数 <210 210~ >245 合计 454 455 424 1333
人时的计算
精确法:逐人逐天计算
近似法:按年平均人口数计算
寿命表法:当年内进入或退出队列的 个人均作1/2人年计算
累积发病率 (cumulative incidence) CI=