混杂偏倚confounding bias与交互作用课堂
医学科研中的偏倚和交互作用

医学科研中的偏倚与交互作用与控制第一节概念一、误差科研设计、实施及分析过程中产生的各种误差(error),可能导致研究结果不能真实地、精确地反映实际正确的结果。
误差是指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差。
因此,必须有“金标准”(golden standard)或相对可靠的标准来度量真实值才能度量误差。
研究结果与真实情况的差异即为误差。
误差有两类:(1)随机误差(random error),(2)系统误差(systematic error)或称偏倚。
随机误差(random error):广义的随机误差,泛指因机遇不同估计总体参数时所产生的误差,机遇既可以指选择的机遇,也可以指时间的机遇。
如果误差由机遇以外的原因所造成,则为非随机误差。
狭义的随机误差指随机抽样所得均值对总体均值的误差。
随机误差主要是由抽样误差引起,其中包括一些随机测量误差。
抽样误差指随机抽样所得均值对总体均值的误差,它由总体中个体的变异引起,其大小决定于研究设计和评价指标的统计学特点。
抽样误差无一定方向,可以相互抵消,并可通过改进抽样技术(如严格遵守随机化原则,分层抽样,增加样本含量,重复试验以及提高抽样对象的受检率,减少失访率等)加以控制,但不可能完全避免。
因此在资料分析阶段,必须用统计学方法计算抽样误差的大小。
二、偏倚偏倚是指在调查研究设计或实施阶段,由于某种或某些因素的影响,使得研究或推论的结果与真实的情况存在系统误差,或指在研究或推论过程中所获得的结果系统地偏离其真实值,属于系统误差。
偏倚造成的结果与真值间的差异,具有方向性,它可以发生在高于真值的方向,也可发生在低于真值的方向。
偏倚是影响流行病学研究真实性的重要原因之一,由于有时难以得到判断真实性的金标准,因此即便在很严格的流行病学研究设计之下,也很难判断是否完全避免了偏倚。
尽管如此,如果对偏倚的来源和产生原因有了深刻的认识,则有可能最大限度地减少偏倚的发生,以便取得有价值的研究结果。
【1091】混杂因素与交互作用杂谈!

【1091】混杂因素与交互作用杂谈!统计学在科学研究中的最大的贡献,其实就是对误差的控制。
在控制相关因素导致的误差之后,我们才能得到的事物背后的必然规律。
在统计学的研究中,我们经常听说混杂因素和交互作用,今天就带大家认识一下混杂与交互!1.混杂因素混杂因素(confouding)是指能同时导致研究因素和研究疾病,若在比较的人群组中分布不均衡,可以夸大或者缩小研究因素与疾病之间真实的联系的因素。
混杂模式图混杂因素的条件:①必须是所研究疾病的独立危险因子;②必须与研究因素(暴露因素)有关;③一定不是研究因素与研究疾病因果链上的中间变量。
2.交互作用交互作用(interaction)是指一个因素各个水平之间反应量的差异随其他因素的不同水平而发生变化的现象。
它的存在说明同时研究的若干因素的效应非独立。
交互作用的效应可度量一个因素不同水平的效应变化依赖于另一个或几个因素的水平的程度。
交互作用模式图3.统计分析(1)从统计学的角度来看,假设我们先建立一个简单线性回归模型:E(Y) = β0+β1X1(2)如果探讨变量X2是否是混杂因素,我们将变量X2作为一个新的自变量带入上面的线性模型:E(Y) = β0+β1X1+β2X2【如果β2回归系数有意义,说明X2是一个独立的混杂因素】(3)统计学角度来看,我们建立一个仅有两个自变量的线性回归模型:E(Y) = β0+β1X1+β2X2+β3X1X2【如果β3回归系数有意义,说明X1X2存在交互作用。
】4.松哥漫谈存在混杂那就发现了独立的风险因子,对于科学研究来说,已经有一定的价值。
而如果发现交互作用,那也称为发现了效应修饰因子,对于科学研究来说,价值更大。
正如你抓住了小偷,是不是已经很不错了;但是如果你还挖出了同伙,那价值是不是更大啦!所以对于发表高分论文的研究者而言,当您确定某个独立的风险因素之后,基于专业应该对可能因素进行交互作用分析。
将极大提高论文的价值。
混杂和交互

效应修饰处理方法
如两个因素有交互作用(即存在效应修饰),计算ORHM就不合适,这时 可以暴露组为参照计算SMR估计值。或以未暴露组为标准进行标化,计 算标化比值比(standardized odds ratio, sOR)。 ^ Σai SMR = ──────── bi×ci Σ(────) di a i× d i Σ[────] bi sOR = ─────── Σ ci
效应修饰
客观存在的真实效应。 与发病机制和临床表现的 性质有关。 层间ORi的一致性检验,
混杂
偏倚,歪曲暴露与疾病的联系。 该因素在暴露与非暴露组的分 布不均。 根据经验、已有的知识、统
─────────────────────────────────
多因素分析。
计学显著性检验。
设计:限制。 分析:分层调整、标化、多变 量数学模型模拟。
合计 124 79 203
合计 15 188 ─────────────────── OR1 = 0.95, χ12 = 0.008
以色列缺血性心脏病研究(分层)
────────────────────
年龄< 60岁 心肌梗死 对照 ────────────────────
20 596
合计
616
收缩血压≥140
对照 计 OR 622 1269 14.04 27 29 649 1298 28 69 2.47
女 不吸
19 32 51
合计
60 60 120
────────────────────── 按性别分层后吸烟与肺癌仍有很强的联系,但男、女两层ORi的方向不 一致,即男性的ORi较cOR大,女性的ORi较cOR小。
混杂偏倚医学

04
混杂偏倚的量化与调整
混杂偏倚的量化方法
DeffinetelyEfectSize
该方法通过计算研究间和/或研究内效应大小的变化来评估混杂偏倚。
I^2统计量
该统计量用于量化研究间的变异程度,其值越高表明研究间的差异越大,混杂偏倚可能越大。
Galbraith图
该图以研究为圆心,以其标准误为半径作圆,圆心距离越近表示研究间的异质性越小,反之则越大。
通过宣传和教育,提高研究人员和医学领域工作者对敏感性 分析的认知和应用。
探索新的敏感性分析方法
为满足医学领域对敏感性分析的需求,研究和开发更为精确 和实用的敏感性分析方法。
THANKS
谢谢您的观看
03
,同时考虑环境因素对疾病的影响。
混杂偏倚未来研究方向及展望
加强识别与量化混杂偏倚的研究
研发新的统计方法
针对混杂偏倚的识别和量化,研究更为精 确和实用的统计方法,提高混杂偏倚的控 制水平。
开展多学科合作
融合多学科领域的知识和方法,包括流行 病学、统计学、计算机科学等,共同推进 混杂偏倚的识别与量化研究。
混杂偏倚对医学研究的影响
影响研究结论的可靠性
混杂偏倚可能影响研究结论的可靠 性,导致对干预措施效果的估计不 准确。
误导临床决策
如果混杂偏倚导致研究结论偏离真 实情况,可能误导临床决策,给患 者带来潜在风险或不良后果。
影响资源合理分配
如果混杂偏倚导致资源不合理分配 ,可能影响卫生资源的有效利用和 医学研究的可持续发展。
调整混杂偏倚的方法
要点一
使用随机效应模型
要点二
使用Meta回归分析
该模型假设不同的研究具有一定的随 机效应,通过计算加权平均值来调整 混杂偏倚。
如何识别和控制临床研究中的混杂与偏倚

如何识别和控制临床研究中的混杂与偏倚临床研究中常常充满各种人为的、客观的、明显的、潜在的混杂和偏倚。
然而,一项研究的质量很大程度上取决于研究者能否有效地识别和控制混杂和偏倚。
因为这直接影响到研究结果的可靠性和有效性。
1混杂(confounding)因素在临床研究中,常常存在一些非研究因素,它们与研究因素和研究结局之间有一定的关联,使真正的因果关系被其“修正”。
这些非研究因素就是混杂因素。
混杂因素有两个条件:①可影响结局,如可能促进或阻止阳性结局的发生;②它不均匀地分布于暴露组和非暴露组之间。
必须具备这两个条件才能构成混杂,危及研究结果。
我们要研究某因素A是否为某疾病B的致病因子,在这个研究中,我们必须警惕是否存在另一个因素C。
这个C也可能影响B,而且不均匀地分布在暴露于和不暴露于A的人群中。
下面举两个显而易见的例子说明。
例1:在一项研究吸烟是否导致消化性溃疡的研究中,需要考虑饮酒和喝茶可能是混杂因素。
吸烟人群中嗜茶和酗酒者的比率较高(不均等分布),饮酒和喝茶均可能促进消化性溃疡的发生(影响研究结局)。
所以如果忽略这些混杂因素,研究结果可能导致过分地估计吸烟对消化性溃疡的危险性。
例2:如果简单地用死亡率评价两所医院的诊疗水平,结果收治危重病人较多的医院却因死亡率高而被认为是诊疗水平低。
如果将住院病人的病情轻重这一混杂因素加以考虑,对两所医院的住院病人的病情进行权重积分,或加以标准化处理,这样就可以通过统计学方法进行校正,较准确地评价两所医院的诊疗水平。
之所以人们将随机对照试验称为金标准的临床医学研究,是因为它能通过随机分组而避免混杂因素的影响。
然而,随机对照试验不可能代替其他的研究策略。
各种观察性研究均不可避免存在混杂因素。
幸好统计学能帮助我们在资料分析时消除混杂因素的影响。
常用于控制混杂因素的方法有Mantal-Haenszel法和多元回归分析等。
限于篇幅,统计学方法不在这里讨论。
作为临床医生,首先必须认识,并在研究前充分考虑各种可能的混杂因素,否则在资料收集和记录时将它们遗漏了,等到资料分析时,再好的统计学家或统计学软件均无法弥补,辛辛苦苦收集的资料将前功尽弃。
混杂偏倚(confounding bias)与交互作用

(四)混杂的大小及其方向 cRR – aRR cOR - aOR 混杂偏倚= 混杂偏倚=------------- or -----------aOR aRR cRR= aRR: cRR> aRR: 无混杂 正混杂( confounding), 正混杂(positive confounding), 亦称阳性混杂 负混杂称阴性混杂 cRR低估 称阴性混杂, cRR< aRR: 负混杂称阴性混杂, cRR低估 了因素与研究疾病之间的联系。 了因素与研究疾病之间的联系。
9
(三)混杂的测量
若cRR=aRR(f) cRR=aRR(f) 无混杂作用,cRR不存在 的混杂偏倚。 不存在f 则f无混杂作用,cRR不存在f 的混杂偏倚。 cRR≠aRR(f) 若cRR≠aRR(f) 有混杂作用,cRR存在 的混杂偏倚。 存在f 则f 有混杂作用,cRR存在f 的混杂偏倚。 cRR>aRR(f) 正混杂( confounding), 若 cRR>aRR(f) 为 正混杂 ( positive confounding), 亦 称阳性混杂,即由于f 的混杂作用, cRR高估了研究因 称阳性混杂,即由于f 的混杂作用,使cRR高估了研究因 素与研究疾病之间的联系。 素与研究疾病之间的联系。 cRR<aRR(f) 负混杂( confounding), 若 cRR<aRR(f) 为 负混杂 ( negative confounding), 亦 称阳性混杂, 即由于f 的混杂作用, cRR低估了因素与 称阳性混杂, 即由于f 的混杂作用,使cRR低估了因素与 研究疾病之间的联系。 研究疾病之间的联系。
◦ 研究的暴露因素和研究疾病之外因素(第三因子,外部因素) 研究的暴露因素和研究疾病之外因素(第三因子,外部因素) 此因素与研究疾病有关(独立相关,危险因子或保护因子) 1. 此因素与研究疾病有关(独立相关,危险因子或保护因子) 并且与研究的暴露因素有关(统计关联) 2. 并且与研究的暴露因素有关(统计关联) 该因素不是暴露导致疾病的中间环节或中间变量 3. 该因素不
混杂偏倚-效应修正讲解

♦ 当吸烟的致癌效应RRS≠1时
下述情况下吸烟可导致该研究产生混杂偏倚: ◘ 研究设计阶段:未保证吸烟者在两人群中 的均衡性 ◘ 分析阶段:未先将两人群按吸烟和未吸烟 分层,然后再按每一层去确定氡气暴露和 肺癌之间的关联
该研究中混杂偏倚产生的机理:
是因为导致肺癌产生的另一因素吸烟在两 组人群中分布不均衡。
♦ 个体匹配
指按一个至数个混杂因子分层,为病例选择同层
的对照,一个病例配的对照数多为1-4个。
♦ 匹配的好处
√ 可以有效地控制混杂因子的作用,提高研究 结果的真实性; √ 在减少总样本数的情况下得到结论,提高研 究的效率。
♦ 匹配的缺点:
(A) 难以对匹配掉的混杂因子及交互作用做深
入分析;
(B) 在病例对照调查中,用匹配的方法控制混 杂经常低估暴露对疾病的作用,严重时会 引起过度匹配(overmatching)的问题, 掩盖暴露的真实作用。
二、混杂偏倚产生的机理
例:氡气与肺癌的定群研究 ♠ 以 RR 值描述暴露于氡气人群与不暴露于 氡气人群在肺癌发生频率之间的关联强 度。
以四格表的数据计算关联强度指标RR值 肺癌 患者 (D+) 暴露于氡 气的人群(E) 未暴露于氡 气的人群(Ē ) 未患肺 癌者 (D–)
a
b
a+b
c
d
c+d
a / (a+b) RR = ---------------------c / (c+d)
♦ RR值的真实性评价
此RR值是否真实地反映了氡气与肺癌之间的
关联强度,完全取决于下述条件:
(1)氡气暴露人群(E)和未暴露人群(Ē)之 间在产生肺癌的易感性方面是否可比
(2)导致肺癌的其它危险因素在两组人群之间
医学科研中常见的偏倚类型及控制方法ppt课件

23
来自研究对象的偏倚之回忆偏倚
回忆偏倚:因研究对象的记忆失真或记忆不完 整所造成的研究结果偏倚
病例对照研究和回顾性队列研究最容易出现回 忆偏倚
回忆偏倚的产生与调查时间至事件发生时间、 以及与事件的重要性有关,同时也与调查员的 调查过程和询问技术有关
7
一、选择偏倚(selection bias)
研究者在挑选研究人群时由于选择条 件受限制或设计失误所致的系统误差
➢常见种类:
就诊机会偏倚 现患病例-新发病例偏倚 诊断信息偏倚 ……
8
就诊机会偏倚
又称伯克森偏倚(Berkson rate bias),或入院 率偏倚,指利用医院就诊或住院病人作为研 究对象时,由于患者就医机会不同导致研究 结果的偏差
30
信息偏倚的控制
严格的调查设计和研究人员的科学态度,严 格的质量控制措施 尽量采用“盲法”收集资料 尽量收集客观指标的资料 采用调查技巧避免无应答、回忆和说谎偏倚 收集资料的范围可以适当广泛些,借以分散 调查人员和研究对象对某项因素的注意力, 减少某些偏见带来的偏倚
31
三、混杂偏倚(confounder bias)
25
来自研究对象的偏倚之说谎偏倚
说谎偏倚:研究对象故意造成的 容易发生在敏感问题上,如吸毒史、性行为和
中、小学生吸烟等 与研究对象个人目的有关
26
来自研究者的偏倚之诊断怀疑偏倚
诊断怀疑偏倚:研究者已知研究对象的某些情 况,因而在诊断过程中刻意寻求某种结果而造 成的偏倚
非盲法研究和队列研究中容易发生
13
表8-2 冠心病与高胆固醇血症的关系 (病例对照研究)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
? 随机分配方法分为简单随机分配与分层随机分配 。
14
配比(Matching)
? 配比指的是对比较组的选择,使其针对一个或多个潜在的混 杂因素与指示研究对象相同或接近。
? 配比可在研究对象间逐个配比,此为个体配比,也可是组间 的配比,此为频数配比。个体配比与频数配比无本质的不同。
? 在队列研究中,如果设计时进行了配比,就无需在分析时控 制配比因素。
? 在病例对照研究中 ,若配比因素确实是一个混杂因素,将引 入了一个极似混杂的选择偏倚。
? 引入的偏倚可通过分层分析进行控制。即:配比本身未直接 起到控制混杂的作用,控制混杂是靠分层分析实现的。
15
配比(Matching)
? 在队列研究中,如果设计时进行了配比,就无需在 分析时控制配比因素。
2
(一)混杂偏倚的概念:
指在流行病学研究中 , 由于一个或多个潜在的 混 杂因素(confounding factor) 的影响,掩盖或夸 大了研究因素与疾病 (或事件)之间的联系,从而 使两者之间的真正联系被错误地估计,造成 混杂 (confounding )。
3
? 混杂因子(confounding factor ,confounder) ?
随机化 (randomization)
? 使研究对象以等同的机率被分配在各处理组中, 从而使潜在的混杂因素在各组间分布均衡。
? 随机化方法常用于实验性研究,以在临床试验中 最常用。
? 随机分配方法分为简单随机分配与分层随机分配 。
13
随机化 (randomization)
? 使研究对象以等同的机率被分配在各处理组中, 从而使潜在的混杂因素在各组间分布均衡。
混杂偏倚(confounding bias)与交互作用 (interaction)
北京大学公共卫生学院 流行病学与卫生统计学系 胡永华
1
一、混杂偏倚(confounding bias)
偏倚:
?选择偏倚(selection bias) ?信息偏倚(information bias) ?混杂偏倚(confounding bias)
? 在病例对照研究中 ,若配比因素确实是一个混杂因 素,将引入了一个极似混杂的选择偏倚。
? 引入的偏倚可通过分层分析进行控制。即:配比本 身未直接起到控制混杂的作用,控制混杂是靠分层 分析实现的。
? 研究的暴露因素和研究疾病之外因素(第三因子,外部因素) ? 此外部因素与研究疾病有关(独立相关) ? 并且与研究的暴露因素有关(统计关联)
? 混杂(confounding )
? 若混杂因素在比较的人群组中分布不匀,可以歪曲(掩盖或夸大)因 素与疾病之间真正联系。
? 举例
? 研究吸烟与肺癌的关系 ? 性别是个外部变量,性别与肺癌有关,性别与吸烟暴露有关。故性
7
混杂因素成立与不成立的几种情 况
E D
D F
1
E
E
D
F
F (代理混杂)
F
2
3
E
E
E
D
D
D
D
F
F
E F
8
(三)混杂的测量
? 若 cRR=aRR(f) 则f无混杂作用,cRR不存在f 的混杂偏倚。
? 若 cRR≠aRR(f) 则f 有混杂作用,cRR存在f 的混杂偏倚。
? 若 cRR>aRR(f) 正混杂(positive confounding),亦称阳性混杂,即由于 f 的
10
(四)混杂的大小及其方向
cRR – aRR
cOR
- aOR
混杂偏倚=------------- or ------------
aRR aOR cRR= aRR: 无混杂
cRR> aRR: 正混杂(positive confounding) , 亦称阳性混杂
cRR< aRR: 负混杂称阴性混杂, cRR低估
混杂作用,使cRR高估了研究因素与研究疾病之间的联系。
? 若 cRR<aRR(f) 负混杂(negative confounding),亦称阳性混杂 , 即由于f 的
混杂作用,使cRR低估了因素与研究疾病之间的联系。
9
(三)混杂的测量
? 若cRR=aRR(f) 则f无混杂作用,cRR不存在f 的混杂偏倚。
了因素与研究疾病之间的联系。
11
(五)混杂的控制 (1)设计阶段 ? 限制、随机化、配比 ---利与弊
(2)分析阶段 ? 分层(M-H 法) ? 标准化(直接,间接法) ? 多因素分析(多元回归分析)
12
限制 (restriction)
针对某个或某些可能的混杂因素,在设计时对研究对象的 入选条件予以限制。
别是该研究中的混杂因子。 ? 无论是队列研究还是病例对照研究,若性别在比较组中分布不均衡,
研究将出现混杂。
? 为明确定义混杂因子:
? 流行病学分析中排除一类外部因子:
? 该因子是暴露导致疾病的中间环节或中间变量。
? 如:
吸烟
高血压
心脏病
吸烟
COPD
肺癌
高血压与COPD都不是混杂因子。 因为它们为病因链中的因子,也称内部介导因子
? 若cRR≠aRR(f) 则f 有混杂作用,cRR存在f 的混杂偏倚。
? 若cRR>aRR(f) 为正混杂 (positive confounding),亦 称阳性混杂,即由于f 的混杂作用,使cRR高估了研究因 素与研究疾病之间的联系。
? 若cRR<aRR(f) 为负混杂 (negative confounding),亦 称阳性混杂, 即由于f 的混杂作用,使cRR低估了因素与 研究疾病之间的联系。
6
(二)混杂的特点 1、混杂( confounding )的本质是一种效应的混淆。
外部因素对疾病的效应与暴露因素对疾病的效应交织 在一起,故无法正确评价暴露因素对疾病的真实关系。 2、代理混杂因子(Surrogate Confounders) 与混杂因子密切相关,能够引起混杂外部变量称为代理混 杂因子。如年龄、文化程度、经济状况等。
(Intermediate Factor)。
5
? 混杂因子(confounding factor ,confounder) ?
? 研究的暴露因素和研究疾病之外因素(第三因子,外部因素) 1.此因素与研究疾病有关(独立相关,危险因子或保护因子) 2.并且与研究的暴露因素有关(统计关联) 3.该因素不是暴露导致疾病的中间环节或中间变量