流行病学中常见偏倚
流行病学偏倚的名词解释

流行病学偏倚的名词解释流行病学是研究疾病在人群中的分布、发生和传播规律的科学。
在流行病学研究中,研究者需要考虑到各种可能的偏倚,以保证研究结果的准确性和可靠性。
本文将对流行病学研究中常见的偏倚进行名词解释。
1. 选择偏倚(Selection bias)选择偏倚是指研究中选择研究对象的方式或标准与研究问题不匹配,从而导致研究结果的偏倚。
例如,在研究一种新药物的疗效时,如果研究者只选择了那些对该药物有良好反应的患者进行研究,那么研究结果可能会高估该药物的疗效。
2. 信息偏倚(Information bias)信息偏倚是指研究者在收集、分类、测量或统计数据时出现错误或偏差,导致研究结果的偏倚。
例如,在研究某种疾病的死亡率时,如果研究者只记录了那些在医院内死亡的患者,而没有记录那些在家中或其他地方死亡的患者,那么研究结果可能会低估该疾病的死亡率。
3. 意向性偏倚(Intentional bias)意向性偏倚是指研究者有意或无意地操纵研究过程或结果,以达到某种目的或满足某种偏见。
例如,在研究某种食品的危害性时,如果研究者是该食品的生产商或代理商,那么他们可能会有意或无意地掩盖该食品的危害性,以维护自己的利益。
4. 回忆偏倚(Recall bias)回忆偏倚是指研究对象在回答有关过去经历或行为的问题时,受到记忆衰退、遗忘、误解或夸大等因素的影响,导致研究结果的偏倚。
例如,在研究吸烟与肺癌之间的关系时,如果研究对象在回答吸烟史的问题时存在记忆遗漏或夸大其吸烟量的情况,那么研究结果可能会受到回忆偏倚的影响。
5. 遗传偏倚(Genetic bias)遗传偏倚是指研究者在分析基因与疾病之间的关系时,未能考虑到遗传多样性和环境因素的交互作用,从而导致研究结果的偏倚。
例如,在研究某种遗传疾病的发病率时,如果研究者只考虑了该疾病的基因遗传因素,而未能考虑到环境因素的影响,那么研究结果可能会高估该疾病的遗传风险。
6. 时间偏倚(Time bias)时间偏倚是指研究者在选择研究时间或时间间隔时,未能考虑到研究对象的生命周期、疾病演变过程和治疗影响等因素,从而导致研究结果的偏倚。
流行病学 偏倚

选择偏倚
检出偏倚 或称检出症候偏倚。 指由于一些与疾病无关的因素而引
起疾病的某些症状,促使患者早期就诊 而发现疾病。如选用这部分早期病人作 研究对象,可使研究误认为该因素是疾 病的病因。
检出症候偏倚
例子:妇女使用雌H→子宫容易出血→早期就 医而发现子宫内膜癌,用这部分人作病例对照 研究时,就易造成雌H与子宫癌有关联的错误 结论。实际上该因素只是这部分研究对象得以 发现的一个诱因,而不是其病因,当用全子宫 癌人群的随机样本时即可得出两者无关的结论。
排除偏倚
在研究对象的确定过程中,没有按照对等的原则或标准从观察组或 对照组中排除某些研究对象。
二、信息偏倚(Information bias)
含义 又称观察偏倚、测量偏倚,主要发生于 资料收集阶段,是由于测量暴露或结局的方法 有问题,所获得的信息不准确而产生的系统误 差。
来源 可来源于研究者、研究对象及用于测量 的仪器、设备及方法。
由于研究者事先知道研究对象的对研究因素的暴露情况,在作 出诊断结果时容易出现带有倾向性的主观判断。(如暴露组细致检 查,对非暴露组或对照组则较粗略);另外,研究对象如知道暴露 情况,也可能出现对未来结局的主观判断。
多见于队列研究和实验性研究中。
暴露怀疑偏倚
研究者若事先了解研究对象的患病情况,对病例组和对照组询
一、选择偏倚(selection bias)
定义 研究对象的选取过程中,由于选取方式不当,
导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。
描述性研究的选择偏倚
主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某
些特定群体(志愿者、因特网利用者等)造成的外 部效度(外推)受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
流行病学中常见的偏倚及其控制

膳膳食食改改良组组
降降低胆胆固固醇醇药品物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
流行病学中常见的偏倚及其控制
五年内发生 心肌梗死风险(%)
7
第7页
如图8-2, 研究A和B中膳食改良组五年内发生心机梗死风险为 9%, 而降胆固醇药品组为6%。
研究A样本较小(200人), 两组效应指标(心肌梗死风险) 95%可信限较大, 发生重合, 无显著性差异。
若θ<θ’<1,则为趋向无效值偏倚。
(三)不论θ>1或θ<1,若θ和θ’在1两侧,则 为颠倒偏倚。
流行病学中常见的偏倚及其控制
17
第17页
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值 负偏倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
流行病学中常见的偏倚及其控制
28
第28页
在美国弗明汉地域对心血管系统疾病研究中发觉: 男性居民在队列研究中,含有高胆固醇水平者,患 冠心病OR 值为2.4,而在病例对照研究中,病例 组和对照组却无显著差异(OR =1.16)。
原因: 病例对照研究中现患病例已改变了他们高胆固
醇饮食习惯。
流行病学中常见的偏倚及其控制
Hale Waihona Puke 流行病学中常见的偏倚及其控制
36
第36页
有些人以病例对照研究发觉, 子宫内膜癌患者雌 激素百分比显著高于对照组, 认为子宫内膜癌与服 用雌激素亲密相关。
流行病学中常见的偏倚及其控制
37
第37页
1978年,Horwitz和Feinstein: 口服雌激 素与子宫内膜癌高度关联是虚假,是一个 检出偏倚。
医学专题流行病学探究中常见偏倚

P<0.01,
OR= ad = 660 2880=1.74 bc 9121200
上述结果表明人群中A病与X因素本无关联,而以医院病例 作为样本所得观察结果则是有关联的。
2.现患病例-新病例偏倚 (prevalence-incidence bias)
在病例对照研究,调查时选择的病例往 往是存活的现患病例,无法对那些因患 病已死亡的病例或轻型、非典型或已痊 愈的病例进行调查,而队列研究中常采 用新发生的病例,因而病例对照研究得 出的结论与队列研究的结果可能发生差 异,此即现患病例-新病例偏倚,也称为 奈曼偏倚(Neyman bias)。
检查时新 未发病
检查时现患 未发病
合计
合计
病人总数 人数
病人总数 人数
胆固醇≥
85
462 547
38
P75
34 72
胆固醇<P75 116
1511 1627
113
117 230
合计 RR
201 1973 2174
151
151 302
2.4
1.16
进一步调查发现,患冠心病病人在被诊 断为该病后,其后来的生活习惯或嗜好 发生改变,如开始戒烟、多食低胆固醇 食物、进行体育锻炼,从而使血中胆固 醇水平降低,因此病例对照研究的结论
从上例可以看出选好对照组是十分不容易 的,它同研究者的临床知识,经验,及 关于研究变量的特征,对象选入的方法 等都有关。有时还需将多种对照同时观 察更能说明问题。
5. 无应答偏倚 (nonrespondent bias)
无应答者是指研究对象中未按设计要求 对被调查的内容予以应答者。某个特定 样本中的无应答者的患病情况及某些因 素的暴露情况与应答者可能不同,因此 而产生的偏倚称为无应答偏倚。此种偏 倚在分析性研究和实验性研究中均可发 生。
流行病学研究中的偏倚汇总

选择偏倚的控制
充分了解可能的选择偏倚的来源,在研究 的设计过程中尽量防止。 在病例对照研究和现况研究中,尽量选择 新发病例而不是现患病例。 在研究中采取相应措施,尽量取得研究对 象的合作,以获得尽可能高的应答率。 尽量采用多种对照。
常见偏倚
选择偏倚 〔selection bias〕 信息偏倚 〔information bias〕 混杂偏倚 〔confounding bias〕
学习要点
1.偏倚、误差的概念 2.偏倚的种类 3.常见偏倚产生的原因 4.常见偏倚的控制
真 实 性—推论的可靠程度
影响真实性的因素
观测值
真实值 +
误差
随机误差 (机遇)
+
系统误差 〔偏倚〕
观测值
影响真实性的因素
真实值 +
误差
随机误差 (机遇)
+
☼随机分布的,不可预测的
☼不可防止的〔抽样引起〕
下章案例
SARS发病主要集中在2003年3月至5月,6 月疫情逐渐平息。截止到当年8月7日,全 球累计报告SARS病例8422例,死亡916例, 病例分布于各大洲的32个国家和地区。中 国内地总发病数达5327例,死亡349例,病 例分布于24个省市。其中北京、广东分别 发生2521例和1512例,占全国总病例数的 75.7%。病例以青壮年为主,20-29岁病例 占30%,20-60岁占85%。病例具有明显职 业特点,医务人员所占比例高达20%。发 病无明显性别差异。
入院率偏倚 〔admission rate〕 / Berkson偏倚
Hale Waihona Puke 解决方法:不同类型 的多家医院
☻ 病例组与对照组 〔其他疾病的患者〕 入院率不同
流行病学研究中的偏倚

流行病学研究中的偏倚偏倚(bias)是指从医学研究设计与实施到数据处理和分析的各个环节中产生的系统误差,以及结果解释、推论中的片面性导致的研究结果与真实情况之间出现的倾向性差异,进而导致对暴露与疾病之间联系的错误描述。
在流行病学研究中,存在着多种研究方法,这些方法在设计、实施、分析等环节均可能出现偏倚,而这些偏倚均可归类到选择偏倚、信息偏倚和混杂偏倚三大类中。
下面我们将介绍流行病学研究中三大常见偏倚。
一、选择偏倚流行病学研究的研究对象只是源人群的一个样本,由于选入的研究对象与未选入者在某些特征上存在差异而引起的系统误差称为选择偏倚。
不同的流行病学研究中有不同的选择偏倚,根据产生的原因,可以分为以下几种常见类型。
1.入院率偏倚,又称为伯克森偏倚,是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。
因此,若在医院内选择研究对象进行流行病学研究时,就容易产生该种偏倚。
因为医院在收治病人时是由选择的,同时病人到哪个医院去就诊也是有选择的。
2.现患病例-新病例偏倚,也称奈曼偏倚。
在病例对照研究或现况研究中,用于研究的病例一般是研究时的现患病人,而不包括死亡病例和那些病程短、轻型、不典型的病例。
此外某些病人在患病后,有可能会改变其原来的某些因素的暴露状况,由此而产生的偏倚即为现患病例-新病例偏倚。
例如,冠心病患者会自觉改变其饮食结构,肺癌病人会主动戒烟等,导致暴露与疾病的联系被低估。
3.检出症候偏倚,指某种因素与某疾病在病因学上虽无关联,但由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该疾病相关联的错误结论。
例如,在探究雌激素与子宫内膜癌的关系的与病例对照研究中,初步结果显示子宫内膜癌与雌激素暴露密切相关,进一步分析发现雌激素可以引起妇女不规则子宫出血,从而使他们积极就诊,增加了子宫内膜癌发现的几率,从而导致了雌激素与子宫内膜癌之间的虚假联系。
流行病学研究中的常见偏倚

流行病学研究中的常见偏倚在流行病学研究中,为了准确了解疾病的发生、发展和分布规律,我们需要采用科学的研究方法。
然而,由于各种因素的影响,研究过程中可能会出现偏倚,从而导致研究结果的不准确或错误。
接下来,让我们一起了解一下流行病学研究中常见的几种偏倚。
一、选择偏倚选择偏倚是指在研究对象的选取过程中,由于某些因素的影响,导致入选的研究对象与总体人群之间存在差异。
这种差异可能会使研究结果偏离真实情况。
例如,在病例对照研究中,如果病例组和对照组的选择不是随机的,而是基于某些特定的条件,如医院的就诊患者,那么就可能存在选择偏倚。
因为医院就诊的患者可能不能代表整个患病群体,他们可能具有更严重的病情或者其他特殊的特征。
另一个例子是在队列研究中,如果对暴露组和非暴露组的划分不准确,或者入选的人群在某些重要特征上存在差异,也会产生选择偏倚。
为了减少选择偏倚,我们应尽量采用随机抽样的方法选取研究对象,确保研究对象具有代表性。
同时,在研究设计阶段,要充分考虑可能导致选择偏倚的因素,并采取相应的措施加以避免。
二、信息偏倚信息偏倚又称观察偏倚,是指在收集、整理和分析研究资料的过程中,由于各种因素的影响,导致所获得的信息不准确或不完整。
常见的信息偏倚包括回忆偏倚和测量偏倚。
回忆偏倚通常发生在病例对照研究中,当研究对象回忆过去的暴露情况时,可能会因为记忆不准确或者受到当前疾病状态的影响而出现偏差。
比如,患有某种疾病的人可能会更倾向于回忆起曾经的不良暴露经历。
测量偏倚则可能由于测量工具不准确、测量方法不一致或者观察者的主观判断等原因导致。
例如,在测量血压时,如果使用的血压计不准确或者测量人员操作不规范,就会得到错误的血压值。
为了降低信息偏倚,我们需要采用标准化的测量方法和工具,对调查人员进行严格的培训,提高其测量和调查的准确性。
同时,可以通过客观的记录和验证手段来确保信息的可靠性。
三、混杂偏倚混杂偏倚是指在研究中,由于某个既与研究的疾病有关,又与研究的暴露因素有关的因素的影响,掩盖或夸大了暴露因素与疾病之间的真实联系。
临床流行病学--偏倚

三、常见偏倚及控制
临床流行病学
1、入院率偏倚(Berkson bias)
在利用医院病例作为研究对象时, 由于具有某研究因素的病人与不具有该 研究因素的病人被选为研究对象的机率 不同,而导致研究因素与研究疾病之间 关系发生被歪曲的现象。
8
临床流行病学
实例:
表1 呼吸道疾病与骨关节疾病的关系
一般人群
过敏及 一般人群
曾住院6个月以上者
代谢性 疲劳综合症
疲劳综合症
疾病 病例 对照 计 病例 对照 计
有 13 136 149
1
21 22
无 127 2508 2635 27 208 235
小计 140 2644 2784 28 229 257
OR=1.89
OR=0.37
10
临床流行病学
原因是:
呼 骨 入院率 (%) 过敏 疲劳 入院率 (%) + + 5/17 29.4 + + 1/13 7.3 + - 15/207 7.2 + - 21/136 15.4 - + 18/184 9.8 - + 27/127 21.2 - - 219/2376 9.2 - - 208/2508 8.3
曾住院6个月以上者
呼吸道 骨关节疾病
骨关节疾病
疾病 病例 对照 计 病例 对照 计
有 17 207 224
5 15 20
无 184 2376 2560 18 219 237
小计 201 2583 2784 23 234 257
OR=1.06
OR=4.06
9
临床流行病学
表2 过敏及代谢性疾病与疲劳综合症的关系
19
临床流行病学
4、志愿者偏倚(volunteer bias) 志愿者与非志愿者在许多因素上都
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精选ppt
17
从上例可以看出选好对照组是十分不容易 的,它同研究者的临床知识,经验,及 关于研究变量的特征,对象选入的方法 等都有关。有时还需将多种对照同时观 察更能说明问题。
精选ppt
18
5. 无应答偏倚 (nonrespondent bias)
无应答者是指研究对象中未按设计要求 对被调查的内容予以应答者。某个特定 样本中的无应答者的患病情况及某些因 素的暴露情况与应答者可能不同,因此 而产生的偏倚称为无应答偏倚。此种偏 倚在分析性研究和实验性研究中均可发 生。
流行病学研究中的常见偏倚 及其控制
上海交通大学公共卫生学院 施榕
精选ppt
1
偏倚(bias)
指观察值与真值之间的偏离,是一种随机误 差以外误差的误差,属系统误差 (systemic error)它是由某些较为恒定的 不能准确测量的因素所造成。偏倚可发生在 流行病学研究的设计、实施分析等各个阶段, 如选择对象中以志愿者代替随机样本,使调 查对象不能代表总体。重复抽样或加大样本 含量并不能使这种误差减少或消失。流行病 学研究中常见的偏倚主要有三大类,即选择 偏倚、信息偏倚、混杂偏倚。 。
A病有X因素住院人数=1200×0.25+(1200 -300)×0.4=660人
B病无X因素住院人数=4800×0.6=2800人
B病有X因素住院人数=1200×0.6+(1200- 720)×0.4=912人
精选ppt
6
表6-2 医院为基础的病例对照研究
X A病 (病 例 B病 (对 照
因 素 组 )
精选ppt
9
例如,Friedman等人在美国弗明汉地区 对心血管系统疾病的研究中发现:男性 居民在队列研究中,具有高胆固醇水平 者,患冠心病的RR值为2.40,而另一项 病例对照研究中,病例组与对照组却无 明显差异,OR=1.16(表)。
精选ppt
10
表6-3 费明汉地区男性居民血胆固醇水平与冠心病关系
A病 (病 例 B病 (对 照 合 计
组 )
组 )
1200
1200
2400
4800
4800
9600
OR=1,χ2检验差异无显著性,说明A病与X因素无关系。
精选ppt
5
假设A病住院率为25%,B病住院率为60%,具 有X因素也有一定的入院率为40%。现就上述 不同的入院率计算住院人数:
A病无X因素住院人数=4800×0.25=1200人
精选ppt
2
第一节 选择偏倚及控制
一、选择偏倚概念及类型
选择偏倚(selection bias)是由于选择研究 对象的方法有问题,使入选者与未入选 者在某些特征上存在着系统差异,从而 导致研究结果偏离真实情况。在各类流 行病学研究中均可发生选择偏倚,以病 例对照研究中较为常见,如入院率偏倚、 现患病例-新病例偏倚、检出症候群偏倚 等。
定群研究
病例对照研究
检查时新未发病
检查时现患未发病
合计
合计
病人总数 人数
病人总数 人数
胆固醇≥
85
462 547
38
P75
34 72
胆固醇<P75 116
合计
201
RR
1511 1627 1973 2174 2.4
113 151
117 230 151 302 1.16
精选ppt
11
进一步调查发现,患冠心病病人在被诊 断为该病后,其后来的生活习惯或嗜好 发生改变,如开始戒烟、多食低胆固醇 食物、进行体育锻炼,从而使血中胆固 醇水平降低,因此病例对照研究的结论
用 史 暴 露 非 暴 露 暴 露 非 暴 露
有
45
7
59
42
无
72
110891Fra bibliotek8合 计 117
117
148
148
OR
9.8
1.7
精选ppt
15
1978年,Horwitz指出,这一结论是由检 出征候偏倚所致,两者之间的高度关联 是虚假的。因为在人群中有一定量的无 症状的子宫内膜癌早期病人,她们若不 服用雌激素,子宫不致出血,因而不去 医院就诊,而不能被发现。
精选ppt
13
例如,1975年,Ziel等以病例对照 研究,从美国加州洛杉矶妇女中调查口 服雌激素与子宫内膜癌的关系,结果表 明子宫内膜癌患者雌激素暴露比例明显 高于对照组,认为子宫内膜癌与服用雌 激素密切相关。
精选ppt
14
表6-4 更年期服用雌激素与子宫内膜癌的关系
雌 激 素 服
肿 瘤 科
妇 科
精选ppt
3
1.入院率偏倚(admission rate bias)
入院率偏倚是由于各种疾病的入院率不 同而致的偏倚。现举例说明。
某研究者计划研究A病与X因素的关系, A病例取自某医院,同时,他以同一医院 随机抽取相应人数的B病人作对照。
精选ppt
4
X因 素
有 无
表6-1 人 群 中 病 例 对 对 照 研 究
存在明显的差异。
精选ppt
12
3.检出征候群偏倚(detection signal bias)
检出征候群偏倚是指某因素与某疾病在 病因学上虽无关系,但由于该因素的存 在会引起该病的临床症状或体征的出现, 从而使患者及早就医,接受多种检查, 导致该人群有较高的检出率,致使过高 地估计该因素与该疾病的关联。
组 )
有 660
912
无 1200
2880
合 计
1572 4080
精选ppt
7
2 = 6 6 20 8 - 9 8 1 1 02 2 2 5 06 0 = 8 5 .8 1 2 9 15 4 70 2 188 0 3 67 092 P<0.01, O= R a= d66 2 08= 8 1 .0 74 bc 91 1 2200
上述结果表明人群中A病与X因素本无关联,而以医院病例 作为样本所得观察结果则是有关联的。
精选ppt
8
2.现患病例-新病例偏倚 (prevalence-incidence bias)
在病例对照研究,调查时选择的病例往 往是存活的现患病例,无法对那些因患 病已死亡的病例或轻型、非典型或已痊 愈的病例进行调查,而队列研究中常采 用新发生的病例,因而病例对照研究得 出的结论与队列研究的结果可能发生差 异,此即现患病例-新病例偏倚,也称为 奈曼偏倚(Neyman bias)。
精选ppt
16
4. 志愿者偏倚(volunteer
bias)
一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效果, 这样就可能会得出不正确的结论。