实习五、病例对照研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题9: 问题 : 上述资料还可以做哪些因素分析? 上述资料还可以做哪些因素分析?
还可分析开始吸烟年龄、吸烟年限、 还可分析开始吸烟年龄、吸烟年限、 吸烟年龄 吸烟量、 吸烟量、吸烟深浅
(四)分级暴露资料的分析
在收集资料时,如果能收集到研究因素不同暴露 在收集资料时, 水平的信息, 水平的信息,可以用来分析该因素和疾病是否存 剂量反应关系,以增加因果关系推断的依据。 在剂量反应关系,以增加因果关系推断的依据。 收集的资料主要是可以定量的指标或信息。 收集的资料主要是可以定量的指标或信息。如吸 定量的指标或信息 烟的支数/日 体重数、 烟的支数 日、体重数、血生化指标等都可进行 此类分析。 此类分析。 分析时是以不暴露或最低暴露组为参照。 分析时是以不暴露或最低暴露组为参照。 不暴露或最低暴露组为参照
病例组暴露与非暴露的 比值 ad 病例组的暴露比值 a / c OR = = = OR= = 对照组暴露与非暴露的 比值 bc 对照组的暴露比值 b / d
资料的分析
(二)统计推断
1.联系的显著性 联系的显著性 2.联系的强度 (OR) 联系的强度 )
OR是两个暴露比值之比, OR是两个暴露比值之比,其 是两个暴露比值之比 数值范围从0到无限大的正数。 数值范围从0到无限大的正数。 OR不同数值范围表明不同程 OR不同数值范围表明不同程 度的危险性。 度的危险性。
1.联系的显著性 联系的显著性 2.联系的强度 联系的强度 比值:某事物发生的概率与不发生概率之比 病例组暴露比值:a/m1 : c/m1 暴露组暴露比值: 暴露组暴露比值:b/m0:d/m0 常用比值比( )(优势比 常用比值比(odds ratio,OR)(优势比) 比值比 , )(优势比) 表示疾病与暴露之间的联系强度大小。 表示疾病与暴露之间的联系强度大小。 疾病与暴露之间的联系强度大小
问题2
不匹配不分层资料分析 ① 将数据整理成四格表形式
不匹配不分层资料整理表 不匹配不分层资料整理表
② 暴露与疾病的统计学联系
(ad − bc ) T χ =
2 2
m1m0 n1n0
检验病例组某因素的暴露率或暴露比例与 对照组之间的差异是否具有统计学意义。 对照组之间的差异是否具有统计学意义。
③ 关联强度分析
问题3
1、可能有混杂存在; 可能有混杂存在; 可能有混杂存在 2、观察性研究的一种,只能探索病因或者 观察性研究的一种, 观察性研究的一种 检验病因假说,不能直接 直接得出因果关系的 检验病因假说,不能直接得出因果关系的 结论
(二) 分层资料分析
性别分层的结果 表2 按性别分层的结果 男 不吸烟 女 不吸烟 14(b2) 19(d2) 33(n02
χ
( ad − bc N 2 ) × N 2 m 1m 2 n1n 2 −
2
=
χ
2
=
( ad m
1
− bc ) m 2n 1n
2
n
2
界值表, 查χ2界值表,得P< 或 >0.05或0.01,以表示暴露与结局有无 或 , 联系,但联系的强度如何,要计算 联系,但联系的强度如何,要计算OR
资料的分析
(二)统计推断
(三)匹配资料的分析
问题7: 问题 :
为什么要进行匹配?匹配应该注意哪些问题? 为什么要进行匹配?匹配应该注意哪些问题?
问题7: 问题 : 匹配的要求是对照在某些因素或特征上与病例保持一致, 匹配的要求是对照在某些因素或特征上与病例保持一致, 某些因素或特征上与病例保持一致 目的是对两组进行比较时能够排除匹配因素 排除匹配因素对研究结果 目的是对两组进行比较时能够排除匹配因素对研究结果 干扰。 的干扰。
资料的分析
(二)统计推断
常用χ2(卡方)检验 常用 卡方) 1.联系的显著性 联系的显著性 指标意义:检验病例组与对照组 指标意义: 在暴露方面的差异是否具有显著 2.联系的强度 联系的强度 性,换句话说即暴露与疾病之间 有无统计学意义 的联系有无统计学意义。 的联系有无统计学意义。
暴露差异的显著性检验: 可用四格表的χ2检验或校 暴露差异的显著性检验: 正的χ2检验公式
χ2=11.52, χ20.005(1)=7.88<11.52, 则P<0.005,拒绝无 < , 效假设,即两组暴露率在统计学上有显著性差异。 效假设,即两组暴露率在统计学上有显著性差异。 OR=2.32,说明匹配了年龄因素后,吸烟组患肺癌的 ,说明匹配了年龄因素后, 危险性为不吸烟组的2.32倍 危险性为不吸烟组的 倍 OR95%CI=? ?
资料分析: 资料分析:
(1)不匹配(或成组)不分层资料的分析 不匹配(或成组) (2)不匹配分层资料分析 (3)分级资料的分析 (4)个体匹配资料的分析
资料的分析
(一) 描述性统计 1.研究对象一般特征的描述:年龄、性别、职业等 研究对象一般特征的描述:年龄、性别、 研究对象一般特征的描述 计算出各种特征的构成比重---了解资料的一般情况 计算出各种特征的构成比重 了解资料的一般情况 2.均衡性检验 均衡性检验 检验病例组与对照组在某些主要特征的构成上 是否有显著性差别,即两组是否具有可比性。 是否有显著性差别,即两组是否具有可比性。 (卡方检验) 卡方检验)
原理: 原理: 以确诊的患有某特定疾病的病人作为病 例,以不患有该病但具有可比性的个体为 对照,通过询问,实验室检查或复查病史, 对照,通过询问,实验室检查或复查病史, 搜集既往各种可能的危险因素的暴露史, 测量并比较病例组与对照组 病例组与对照组中各因素的 测量并比较病例组与对照组中各因素的暴 经统计学检验, 露比例,经统计学检验,若两组差别有意 义,则可认为因素与疾病之间存在着统计 学上的关系。 学上的关系。
课题一
(一)成组资料分析 问题1:根据表 资 行均衡性分析, 问题 :根据表5-1资料进行均衡性分析,分析 明什么 结果说明什么?
问题2: 问题 :将表中资料按是否吸烟整理成四格表 形式计算χ 、 形式计算 2、OR、OR的95%CI,说明各指标 、 的 , 的含义? 的含义?
问题1:
均衡性分析用来比较两组某些基本特征 相似或齐同.目的是检验病例组与对 是否相似或齐同 是否相似或齐同 目的是检验病例组与对 照组是否有可比性 是否有可比性。 照组是否有可比性。
OR= 表示暴露与疾病无关联; OR=1 表示暴露与疾病无关联; OR> 疾病的危险因素,称为“正关联” OR>1 疾病的危险因素,称为“正关联”,说明 暴露使疾病的危险度增加; 暴露使疾病的危险度增加; OR< 疾病的保护因素,称为“负关联” OR<1 疾病的保护因素,称为“负关联”,说明 使疾病的危险度减少。 使疾病的危险度减少。
匹配的特征或变量必须是已知的混杂因子, 匹配的特征或变量必须是已知的混杂因子,或有充分的 必须是已知的混杂因子 理由怀疑为混杂因子,否则不应匹配。有两种情况不应 理由怀疑为混杂因子,否则不应匹配。 匹配,否则会造成配比过头 配比过头, 匹配,否则会造成配比过头,一是研究因素与疾病因果 链中的中间变量不应匹配,另一种是只与可疑病因有关 中间变量不应匹配 链中的中间变量不应匹配,另一种是只与可疑病因有关 而与疾病无关的因素不应匹配。 疾病无关的因素不应匹配 而与疾病无关Biblioteka Baidu因素不应匹配。
问题8: 问题 : 根据以上资料列出吸烟与否与肺癌的关系表 并计算χ 、 格,并计算χ2、OR、及其可信区间 、
1:1配对病例对照研究资料整理表 配 病例对照研究资 病例 对照 吸烟 不吸烟 合计(对子数 合计 对子数) 对子数 吸烟 31 51 82 不吸烟 22 9 31 合计(对子数 合计 对子数) 对子数 53 60 113
ad OR = bc
④OR的可信限 的可信限
OR95%CI = OR
1±1.96 / χ 2
表1 成组病例对照研究资料的整理表
病例 吸烟 不吸烟 合计 82(a) 31(c) 113
对照 54(b) 59(d) 113
合计 136 90 226
(ad − bc)2 ⋅ n x2 = (a + b)(c + d )(a + c)(b + d )
注意问题 注意问题
♠ 慎重选择匹配因素,可疑致病因素或有研究价值的 慎重选择匹配因素, 选择匹配因素 因素不能作配比因素。 因素不能作配比因素。 ♠ 增加了选择对照的难度。 增加了选择对照的难度。 ♠ 可采用1∶1或1∶M匹配,不宜超过1∶4。 可采用1∶1或1∶M匹配,不宜超过1∶4。 1∶1 匹配 1∶4 ♠ 匹配的特征或变量必须是已知的混杂因素,或有充 匹配的特征或变量必须是已知的混杂因素, 已知的混杂因素 分的理由怀疑为混杂因素。 分的理由怀疑为混杂因素。常作为匹配的因素有年 性别、种族、经济状况、血型、血压等。 龄、性别、种族、经济状况、血型、血压等。否则 会造成匹配过度。 会造成匹配过度。 over-matching: over-matching:使研究因素与疾病之间的关联减 弱或消失,降低了研究效率。同时增加工作难度 弱或消失,降低了研究效率。
病例对照研究 (Case-control study) )
流行病学教研室 黄燕惠 邮箱:reahuang@163.com
提问
1、病例对照研究定义?原理?特点?优缺点? 2、用途?分类(两种分类)? 3、重要的概念: (1)均衡; (2)匹配(配比)、配对; (3)暴露、保护因素、危险因素; (4)比值比(OR)、归因危险度百分比(ARP,AR%)、 人群归因危险度百分比(PARP,PAR%); (5)混杂(混杂偏倚)、混杂因子 4、偏倚的类型?相应的控制? 5、混杂偏倚的判断?
吸烟 病例 对照 合计 59 (a1) 40 (c1)
合计
吸烟 23(a2) 10(c2) 33(n12)
合计 37(m12) 29(m02) 66(n2)
21 (b1) 80 (m11) 40 (d1) 80 (m01)
99 (n11) 61 (n01) 160(n1)
问题4: 问题 : OR1=2.81,说明男性中吸烟者患肺癌的危险性为 , 明男性中吸烟者患肺癌的危险 不吸烟男性的2.81倍. 不吸烟男性的 倍 OR2=3.12,说明女性中吸烟者患肺癌的危险性为 , 明女性中吸烟者患肺癌的危险 不吸烟女性的3.12倍。 不吸烟女性的 倍 OR95%CI=?,可信区间不包括 ,即可认为 ?,可信区 ?,可信区间不包括1.0,即可认为 OR值在0.05水平有显著性差异。 水平有显 值 水平有 著性差异。 问题5: 问题 : 按性别 控前OR值比 按性别分层后,计算总OR值,与调控前 值 值 否存在差异, 果存在有意义 差异, 较是 否存在差异,如 果存在有意义的 差异,则认 为产生了混 偏倚, 生了混杂 是混杂因素。 为产生了混杂偏倚,性别是混杂因素。 问题6: 问题 : 预防和控制混杂偏倚的方法 设计阶段:限制;匹配; 设计阶段:限制;匹配;随机分组 分析阶段:标准化率分析、 分析阶段:标准化率分析、分层分析和多变量分析方 法。
OR=ad/bc=2.89 说明吸烟组患肺癌的危 明吸烟组 不吸烟组 险性为不吸烟组的2.89倍 倍 OR95%CI=1.661~5.030 ,可信区间中不 可信区间 ~ 包括1.0,即可认为该 值在0.05水平上有 认为该OR值 包括 ,即可认为该 水平上有 著性。 显著性。
问题3: 问题 :该计算结果能否说明吸烟与 肺癌之间的真实联系程度?为什么? 肺癌之间的真实联系程度?为什么?
病例对照研究的优缺点 优点 缺点
• 适用于罕见病的研究 • 适用于慢性病的研究 • 研究所需的样本量较小 • 省时、省钱、省力 省时、省钱、 • 可同时研究多个因素与
某疾病的联系
• • • •
不适用于暴露率低的研究 常发生各种偏倚 论证强度较低 只能估计相对危险性
• 暴露与结局出现的时间先
后不易判断
病例对照研究示意图
a 人
+
病例
c b d
群 或 人 可 比 群 样 本
+ -
调查过去 是否暴露 对照
回顾性的 逆向的
研究方向 时间顺序
特点
1.属于观察法 1.属于观察法 2.设立对照组 2.设立对照组 3.观察方向由“果”及“因” 3.观察方向由“果”及“因” 4.不能确实证明暴露与疾病的因果关系。 4.不能确实证明暴露与疾病的因果关系。
本例χ χ20.05(1)=3.84 ,本例χ2=14.48>3.84,则P< 本例 > , < 0.05 结论为 结论为拒绝无效假设,即两组暴露率在统计学 无效假设 即两组暴露率在统计学 统计 上有显著性差异。 上有显著性差异。 OR=ad/bc OR95%CI= OR
( ±1.96/ χ 2) 1
相关文档
最新文档