流行病学-病例对照研究资料分析
流行病学资料分析ppt

病例对照研究
通过比较病例组和对照组在暴露因素上的 差异,推导出暴露因素与疾病或健康状况 之间的关系。
队列研究
通过比较暴露组和非暴露组在发病率上的 差异,推导出暴露因素与疾病或健康状况 之间的关系。
实验性流行病学分析
随机对照试验
通过将研究对象随机分为实验组和对照组,给予不同的干预 措施,比较两组在发病率上的差异,从而评价干预措施的效 果。
06
流行病学研究的发展趋势
加强跨国合作研究
流行病学跨国合作研究能够促进不同国家和 地区间的研究经验和成果共享,提高全球公 共卫生水平。
通过建立跨国合作机制,加强国际间的数据共享 和信息交流,共同应对跨国界的公共卫生威胁。
促进跨国合作研究,加强国际学术交流,推 动流行病学研究的深入发展。
大数据和人工智能的应用
流行病学资料分析
目录
• 流行病学概述 • 流行病学资料 • 流行病学分析方法 • 流行病学资料的应用 • 流行病学研究的局限性及挑战 • 流行病学研究的发展趋势
01
流行病学概述
流行病学的定义与特点
流行病学定义
流行病学是研究疾病和健康状况在人群中的分布、影响因素 及防治策略与措施的科学。
流行病学特点
流行病学强调以群体为研究对象,以描述性为基础,以病因 推断为重点,以提供防治对策为目标。
流行病学的研究范围
1 2
疾病分布
研究疾病在人群中的发生、发病、死亡和传播 的分布规律及其影响因素。
病因研究
研究疾病发生的各种病因及其影响因素,探讨 病因与疾病发生发展的关系。
3
疾病防治措施
根据病因和影响因素,提出有效的预防、控制 和消灭疾病的对策和措施。
THANKS
病例对照研究(1)_OK

39
资料整理表格
Exposure Cases
Controls
Total
Yes
a
b
a+b=n1
N o
c
d
c+d=n0
Total
a+c=m 1
b+d=m 0 a+b+c+d=t
a 病例组暴露比例: a + c
R R A /A ( B )A /BA D OR C /C ( D ) C /DBC
因为从随机样本的a/b与c/d可以估计A/C和C/D, 所以可用ad/bc估计AD/BC,也即OR估计RR。
47
当疾病率小于5%时,OR是RR的极好近似值。
48
OR的可信区间(confidence interval, CI):
在数据分析时可采用分层来控制混杂因子的作 用。分层就是把样本按照某一个或更多个混杂因 子的暴露有无或作用程度而划分为若干个组,即 “层”,再分别在每一组内分析暴露与疾病之间 的联系,即计算OR。每一层均可归纳成一个四格 表进行分析。
53
第i层内病例与对照按暴露有无分组
54
分析步骤:首先计算各层的χ2和OR值,如果各层的O R具有齐性(经过齐性检验确定),则可进一步计算 总的合并ORMH和χ2MH 。
2、假定暴露造成的相对危险度(RR)。可通过既往研 究或查阅文献获得 RR↑ → 样本量↓
3、要求的显著性水平,即第一类错误α α↓ → 样本量↑
4、要求的把握度,即1-β 1-β↑ → 样本量↑
23
非匹配或成组匹配设计
精品-病例对照研究讲解

第五章病例对照研究一、基本原理:以现在确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,通过询问,实验室检查或复查病史,搜集既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各因素的暴露比例,经统计学检验,若两组差别有意义,则可认为因素与疾病之间存在着统计学上的关联。
在评估了各种偏倚对研究结果的影响之后,再借助病因推断技术,推断出某个或某些暴露因素是疾病的危险因素,而达到探索和检验疾病病因假说的目的。
暴露是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。
这些因素、特征或状态即为暴露因素。
暴露因素也叫研究变量。
二、病例对照研究的类型1、病例与对照不匹配:在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病例人数。
此外没有其它任何限制与规定。
2、病例与对照匹配:匹配或称配比即要求对照在某些因素或特征上与病例保持一致。
匹配分为:A:频数匹配。
匹配的因素所占的比例,在对照组与在病例组一致。
如病例组中男女各半,则对照组中也如此。
B:个体匹配:指以病例和对照的个体为单位进行匹配。
1﹕1匹配又称配对,1﹕2、1﹕3、……1﹕R匹配时,称为匹配。
配比的目的,首先在于提高研究效率。
其次在于控制混杂因素。
所以匹配的特征或变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子。
把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率。
这种情况称为配比过度。
匹配的变量应当一致到什么程度,取决于变量的性质、实际可能与必要性。
如果匹配的因素与暴露有联系,则会低估暴露与疾病的联系。
匹配和匹配后按匹配因素进行分层分析,是控制匹配因素的混杂作用的必要途径。
病例对照研究的衍生类型:1、巢式病例对照研究:在对一个事先确定好的队列进行随访观察的基础上,再应用病例对照研究(主要是匹配病例对照研究)的设计思路进行研究分析。
4病例对照研究

OR
a c
b d
ad bc
成组匹配(或不匹配) CCS
肺癌病例与对照吸烟史比较
吸烟史 病例组 对照组
合计
吸烟
688a
650b
不吸烟
21c
59d
合计
709m1
709m0
X2=19.13, P<0.001, OR=2.97
1338n1 80n0
1418t
混杂因素具备的条件
• 必须是疾病的一个危险因素 • 必须与所研究的暴露因素有联系 • 不应是暴露与疾病之间因果链中的一
病例
暴露 非暴露
对照
病例对照研究的基本模式
暴露 有 无
合计
病例组 a c
a+c
对照组 b d
b+d
比较: a/(a+c)与b/(b+d)
合计 a+b c+d N
特点
1
属观察性研究方法
2
设立对照
3
观察方向:“果→因”
4 不能确证暴露与疾病的因果关系
5
研究因素可以有多项
病例对照研究的类型
➢病例与对照不匹配 ➢病例与对照匹配
频数匹配 个体匹配(1:M)
匹配的目的:控制混杂因素,提高研究效率。 注意防止匹配过头(over-matching)
1:M匹配
目的:以较小的样本获得较高的效率 R值越大,效率越高。 效率递增公式:2R/(R+1) R值不宜超过4
实例:年轻女性阴道腺癌与母亲妊娠期服用已烯雌酚的 关系
病例对照研究的衍生类型
病例对照研究
吴 磊 教授 南昌大学公共卫生学院
复
习
描述性研究 (descriptive study)
病例对照研究

资料分析
组间可比
组间不 可比
两组暴露情 况的比较及 统计学检验
多个因 素水平
多因素 分析
分
单个因
层
素水平
分
析
A
计算关 联强度 OR值
回归分析
估计总 体OR
各层OR 值相同
各层OR 不同(齐 性检验)
总体 同质
总体不 同质
计 算 总 的 OR
交互 作用
40
A 41
A
两组暴露情况的比较
资料分组整理,形成统计表:根据暴露情况(是否 暴露或暴露分级)和疾病状态(病例、对照)进行交 叉分组统计频数,形成列联表
33
A
资料的收集方法 问卷调查:对对象或知情人询问调查获得 直接观察
查阅记A
资料的整理
资料的核查清理:保证数据的完整、准确 人工抽查→逻辑错误→修正→验收→归档
资料编码,形成数据库 资料的归纳、分组
35
A
资料分析
❖ 基本分析方法:比较病例与对照组中研究因素暴 露的比例,估计研究因素与疾病发生的关联强度
11
A
病例对照研究 用途和分类
❖ 病因学研究:探讨致病因素或危险因素与疾病的 关系 ➢探索性病例对照研究:广泛探索疾病的可能危 险因素 ➢验证性病例对照研究:深入检验某个或几个病 因假设
12
A
阴道腺癌患者及配对对照者母亲的部分资料
13
A
吸烟与肺癌关系的研究
14
A
主要内容
1
病例对照研究概述
2 病例对照研究设计实施
25
A
研究对象 对照的选择
❖ 条件: ▪ 未患此病的人(可以是其它疾病); ▪ 不能为有共同危险因素的疾病病人; ▪ 除研究因素外其它条件一致; ▪ 来自同一人群;
第六章 病例对照研究

实例2:
☻年轻女性阴道腺癌与母亲妊娠期服用 己烯雌酚的关系
背景:
☻1966~1969 年 Vincent 纪念医院 7 例阴道癌 患者,15~22岁女青年
☻类型异常;时间、地区分布异常集中; 年龄分布异常 ☻这些分布的差异(属于描述性流行病学 范畴)提示了线索:该地区有某种 /些因 素与阴道腺癌异常发病有关。
实例1.吸烟与肺癌的病例对照研究
☻Doll与Hill于1948~1952年进行研究。从伦敦20 所医院及其他几个地区选取确诊的肺癌1465例。 每一病例按性别、年龄组、职业等配一个非肺癌 对照。调查两者吸烟暴露情况。
经分析:①肺癌病人中不吸烟者的比例远小于对照组, 差别显著;②肺癌病人在病前10年内大量吸烟者(≥25 支/日)显著多于对照组;③随着每日吸烟量的增加, 肺癌预期死亡率升高;④肺癌病人开始吸烟的年龄较 早,持续的年数较多。
如:年龄、性别、 BMI、血型、特殊职业暴露、 环境污染、疾病家族史、某种基因型、吸烟、少 食果蔬、高盐饮食、运动、平衡膳食。
历史与典型范例
☻20世纪20年代: 生殖因素与乳腺癌
☻40~50年代:吸烟与肺癌(Doll and Hill)
☻60年代:口服避孕药与心梗、静脉栓塞; 孕妇服用反应停与婴儿先天畸形;月经棉 条与经期中毒性休克综合征;早孕服用雌 激素与少女阴道腺癌
补体结合试验 对照组 病例组 + - 合计对子数
+ -
2
4(a) 39(c)
43
1(b) 19(d)
20
5 58
63
c 39 b
合计对子数
2
b c 1
bc
34.23 ,p 0.01 , OR
病例对照研究解析
三、病例对照研究的衍生类型
(一)巢式病例对照研究
1.概念
是在队列内套用病例对照研究的一种设计,其研究对象
是在队列研究的基础上确定的,以队列中所有的病例作 为病例组,再根据病例发病时间,在研究队列的非病例 中随机匹配一个或多个对照,组成对照组。但是其研究 方法和分析方法仍与病例对照研究相同。此种研究设计 尤其适合于研究因素包括有复杂的化学或生化分析的前 瞻性研究。
结 果 2.1 单因素分析
2.2多因素Logistic回归分析
2.3 剂量效应梯度分析
应用实例
橡胶职业接触与肺癌关系的病例—队列研究
1.研究对象:1972年上海市中山医院对某橡胶厂职工进行缺血性心
脏病普查,参加者共1598人(男934人,女664人)作为队列成员,并
从1973年1月1日始随访至1995年12月31日,期间死亡共475人,失 访49人,死亡诊断按医院的死亡证明,并通过上海市肿瘤登记中心
三、病例与对照的来源与选择
(1)病例选择
①选择原则:应选择无偏样本。
②入选标准:尽量使用通用标准,标准要客观、 严格、统一。 ③病例来源: 医院(方便,代表性差,可产生选择偏倚) 社区(代表性好,工作量大)。
新发病例所提供的信息较为准确
(2)对照选择
①目的: 为比较病例组的暴露情况和暴露量提供一个基准。
2.影响样本含量的因素
①被研究因素在对照人群中的暴露率(率越高样本越小)。 ②估计该因素造成的相对危险度(RR)或暴露比值比(OR) OR越大样本越小。 ③需要达到的检验显著性水平,α=0.01样本大于α=0.05。 ④要求的把握度1-β 把握度要求越高样本越大。
3.样本量计算方法
①查表法 ②公式法
匹配病例对照研究
实用文档
21
所有调查者采静脉血7ml,分类血 清,用ELISA法测定幽门螺杆菌IgG 抗体
实用文档
22
统计分析
SPSS10.0分析软件,计算比值比(OR )来估计各种危险因素与胃癌的关联 强度。
单因素分析的基础上,进行胃癌发病 相关因素的多因素Logistic回归分析
实用文档
23
结果
Hp感染(OR=32.62)、精神压抑(
p1 p0OR/1 p0(OR1)
q1 1 p1
q0 1 p0
p0;p1为目标人实用群文档中对照组和病例组估计暴露率 59
例:研究口服避孕药与先天性心脏病的关系
,设a=0.05(双侧),b=0.1;对照组暴露 比例p0=0.3;预期OR=2.0
求:需要的总对子数?
解:查表得: Za=1.96 Zβ=1.282 p1=P0OR/[1+p0(OR-1)]=0.3×2/[1+0.3(2-
每个病人配4个对照,共32个对照 调查员用调查表对病例、对照与
她们的母亲进行了调查,经统计学 处理后的主要结果见下表
实用文档
30
研究结论
少女阴道腺癌的发生与其母亲此次 怀孕服用雌激素(OR=28.0)、既 往流产史(OR=10.5)、此次怀孕 出血史(OR=8.0)等因素有关。
实用文档
32
第三节 病例对照研究的设计和实施
实用文档
52
(四)样本含量的估计(size of sample
)
1 影响因素
(1)对照组的暴露率(P0) (2)病例组的暴露率(P1) (3)估计的OR值
实用文档
(4)希望的显著性水平(α=0.05 or =0.01)
巢式病例对照研究和现代流行病学研究方法nestedcase-controlstudy
巢式病例对照研究的类型
根据对照的选择方式不同分为:
匹配巢式病例对照研究(matched nested case-control study) 用匹配的方式选择对照,也就是每当队列内发生一个新病例的同
时,在该队列内部按年龄、性别等因素选择条件相同或相近的、当时尚未 发生相同疾病的一个或几个对象作为该病例的对照,每个病例可选择1~ 10个匹配对照(但最常用的是4~5个)
观察期内的所有新发病例人数
SIR=
研究队列的总人数×全人群发病率
21
巢式病例对照研究的资料分析
疾病与暴露的关联程度分析
巢式病例对照研究整理分析表
病例
对照中的暴露数m(m=0,1,…M)
0 1 2… M
暴露
n1.0
n1.1 n1.2 …
n1.M
非暴露
n0.0
n0.1 n0.2 …
n0.M
22
计算OR值 OR=
欲研究银屑病病人发生癌症的相关危险性,及不同的银 屑病治疗方法与癌症发生的关系。
研究队列
不匹配巢式病例对照研究( unmatched nested case-control study ) 选择对照时不要求任何条件的匹配,只要求在病例发病时该对 象尚未患所研究的疾病即可。
14
巢式病例对照研究的特点
与传统的病例对照研究相比
1.病例和对照来自同一队列(降低了选择偏倚且可比性好) 2.暴露与疾病的时间顺序明确(回忆偏倚小或可以避免) 3.统计效率和检验效率高且可以计算疾病频率
15
巢式病例对照研究的特点
与传统的队列研究相比
1.节省了大量的人力、物力和财力 2.可用于罕见病的研究
16
Байду номын сангаас
病例对照研究专业版
对照组旳比值 b / m0 b d / m0 d
OR a / c ad b / d bc
OR数值范围对暴露与疾病关联旳意义
OR 值范围
0~0.3 0.4~0.5 0.6~0.8 0.9~1.1 1.2~1.6 1.7~2.5
≥2.6
关联意义
高度有益 中度有益 微弱有益 不产生影响 微弱有害 中度有害 高度有害
对照形式旳选择 ● 成组不配比对照 ● 成组配比对照 ● 个体配比对照
对照旳要求
采用与病例相同旳诊疗原则明确 排除旳非患者作为对照,并按 要求旳人口学特征和其他外部 特征旳相同要求选择对照。
对照旳起源 ● 从医院旳其他病人中选 择对照 ● 从一般人口中选择对照 ● 同步选择两种对照
对照组旳选择
信息偏倚
回忆偏倚(recall bias) 回忆偏倚是指研究 对象在回忆某些原因旳暴露史时,因为在精 确性和完整性上旳差别所造成旳系统误差。 回忆偏倚在病例对照研究中最常见。
信息偏倚
报告偏倚(reporting bias) 报告偏倚是指 有研究对象有意地夸张或缩小某些信息而 造成旳偏倚,所以亦称作说谎偏倚。
时是辨认其危险原因旳唯一可行旳措施。 也尤其合用于研究分析多种危险原因与研究
疾病旳联络以及它们之间旳相互作用等。
对照组旳选择原则 1.不患所研究旳疾病,但有暴露于研究原因
旳可能 2.不患与研究原因有关旳其他疾病 3.能以与病例相同旳措施获取暴露资料 4.与病例组旳可比性 5.尽量设置多种对照
样本大小估计
影响样本大小旳原因 1.研究原因旳人群暴露率估计值,一般可
用对照组旳暴露率(P0)来替代。 2.估计旳研究原因与研究疾病旳相对危险
混杂偏倚