同济大学流行病学-第七章诊断试验和疾病筛检
临床流行病学:第七、八章 诊断试验与筛检试验

灵敏度患病率
灵敏度患病率+(1-患病率)(1-特异度)
阴性预测值=
特异度(1-患病率)
特异度(1-患病率)+ (1-灵敏度)患病率
49
似然比的临床应用
例:一位45岁妇女主诉突发左侧胸痛月余,来门 诊就医。该患者是否患冠心病?
50
似然比的应用步骤:
(1)从文献中找出某一症状或体征的似然比,或找 出不同诊断水平的似然比以及联合诊断的似然比;
“金标准”: 当前临床医学界公认的诊断疾 病的最可靠的方法.
20
2. 选择受试对象
选择的原则: 有代表性, 受试对象应能代表筛检试验可能应
用的目标人群. 病例组: 包括各种临床类型的病例 对照组: 用金标准证实没有目标疾病的其他病例 正常人一般不宜纳入对照组
21
3. 样本含量的估计
所需参数: ① 待评价诊断试验的灵敏度(Se) ② 待评价诊断试验的特异度(Sp)
阴性人群
期 再
诊断试验
筛 检
病人
非病人
治疗
4
筛检试验 诊断试验
再次筛检
疾病预防
治疗
试验阴性 无病者
试验阳性 无病者
试验阳性 确诊患该病
图 疾病筛检流程示意图
5
三. 筛检试验和诊断试验的区别
1. 研究对象不同 2. 目的不同 3. 对试验的要求不同
筛检试验: 快速、简便、灵敏 诊断试验: 科学、准确、特异
合计
(a+b) (c+d)
N
26
二. 评价指标
(一) 真实性 (validity) 效度或准确性(accuracy) 指测量值与实际值相符合的程度
评价真实性的指标:
同济大学流行病学-第七章诊断试验和疾病筛检

同济⼤学流⾏病学-第七章诊断试验和疾病筛检第七章诊断试验和疾病筛检第⼀节概述⼀.筛检(screening)1.定义:时间是运⽤快速、简便的实验、检查或其他⼿段,⾃表⾯健康的⼈群中去发现那些未被识别的可以病⼈或有缺陷者。
⽤于筛检的试验成为筛检试验。
筛检是流⾏病学研究⽅法之⼀,属于观察性研究范畴。
2.⽬的:①疾病的早期发现、早期诊断和早期治疗,属于⼆级预防的内容。
如常见的有结核、⾼⾎压、糖尿病、乳腺癌、⼦宫颈癌等。
②检出某种疾病的⾼危⼈群。
⾼危⼈群是指该⼈群发⽣某种疾病的可能性显著⾼于⼀般⼈群。
例如⽣活⽅式关联疾病的吸烟⼈群、运动不⾜的办公室⼯作⼈群等。
近年来还开始了筛检疾病易感基因和有害基因的国内⼯作。
因为这类筛检是针对疾病病因的,故属于⼀级预防。
③传染病和医学相关事件的预防和控制。
主要指⼀些特殊⼈群和职业⼈群中检查和控制传染源或某些医学相关事件的诱因,以保护⼈群的⼤多数免受其伤害。
如对静脉吸毒⼈群艾滋病毒感染标志的筛检等。
3.类型⼈群整群筛检——以整个⽬标⼈群为对象选择性筛检——以群体中的⼀个亚群或有某种特征的⼈群为对象⽬的治疗性筛检——未早发现、早治疗预防性筛检——为了查出某病的⾼危⼈群⽅法单项筛检——如餐后2h⾎糖多项筛检——如胸痛+痰培养筛检肺结核⼆.诊断(diagnosis)1.定义:诊断是进⼀步把病⼈与可疑有病但实际⽆病者区别开来。
他不同于筛检。
因此,诊断对下⼀步治疗有决定意义,诊断正确与否⾄关重要。
⽤于诊断的试验称为诊断试验.第⼆节试验⽅法的评价⼀.实验⽅法评价的程序试验⽅法评价的基本⽅法是与诊断某疾病的⾦标准作盲法和同步⽐较,基本步骤是:(⼀)确定⾦标准(gold standard)1.⽬的:避免发⽣错误分类偏倚,及时病⼈组中不致于混⼊假病⼈(⾮疾病之⼈)和⾮病⼈组中(对照组)不混有真病⼈(所研究疾病的患者)2.⾦标准——是指⽤来分辨病⼈与⾮病⼈的标准评价⽅法。
3.常见的⾦标准①病理学检查(组织活检和⼫体解剖)②外科⼿术发现③特殊的影响学诊断(如⽤冠状动脉造影诊断冠⼼病)④长期随访观察所得到的结果4.对有些诊断困难的疾病,可能按时还没有真正意义上的⾦标准或是因诊断过程复杂,且费⽤昂贵等。
【流行病学试题及答案】第七章 筛检

【流行病学试题及答案】第七章筛检第七章筛检一、作业习题(一)单项选择题[A1型题]1. 所谓筛检就是A. 对某一特定人群的健康状况进行全面检查评估B. 在疾病暴发后,在人群中发现引起暴发的可能原因C. 在表面健康的人群中发现可能的疾病患者D. 在疾病流行时,对病例发病前所接触的人进行调查,以找出传染源E. 在人群中查找疾病的致病原因2. 为了提高某筛检试验的阳性预测值,可采取A. 增加筛检的次数B. 增加筛检的人数C. 选择高危人群D. 对筛检阳性者进行更仔细的诊断E. 与其他试验方法联合使用3. Slow-growing tumors and fast-growing tumors, screening test may lead toA. Lead time biasB. Length biasC. Selection biasD. Misclassification biasE. Information bias4. 从1990年至2000年,用某筛检试验方法对某病进行筛检。
在这段时间内该病的患病率增加了一倍,试问这种筛检试验方法的哪一特征因受到患病率的影响而发生相应改变A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阳性预测值增加E. 阴性预测值增加5. To examine 10000 women of child-bearing age, the sensitivity and thespecificity are 98% and 99% respectively in pregnacy testing. If only 1%women are pregnancies, the positive predictive value is:A. 0.1%B. 50%C. 89%D. 47%E. 8.9%6. 所谓金标准(gold standard)指的是A. 当前临床医学界公认的诊断疾病的最快速的方法B. 当前临床医学界公认的诊断疾病的最贵的方法C. 当前临床医学界公认的诊断疾病的最先进的方法D. 当前临床医学界公认的诊断疾病的最便宜的方法E. 当前临床医学界公认的诊断疾病的最可靠方法7. 在下列有关似然比的陈述中,哪一项不正确A. 是同时反映灵敏度和特异度的复杂指标B. 该指标全面反映筛检试验的诊断价值,非常稳定C. 不受患病率的影响D. 阴性似然比越小,筛检试验的诊断价值越高E. 在选择筛检试验时应选择阳性似然比高的方法 8. 用ROC曲线决定最佳临界点,此时A. 筛检试验的灵敏度最大和特异度最小B. 筛检试验的灵敏度和特异度均相对最优C. 筛检试验的灵敏度和特异度均最大D. 筛检试验的灵敏度最小和特异度最大E. 筛检试验的灵敏度和特异度均相对最小 [A3型题](9,13题共用题干)青光眼病人的眼压约在22,42mmHg范围,非青光眼病人的眼压约在14,26mmHg范围内,根据这些资料,可以认为: 9. 将筛检标准值定在下列哪一个范围较合适 A. 22,42mmHgB. 22,26mmHgC. 14,22mmHgD. 26,42mmHgE. 15,42mmHg10. 如果将筛检标准值定为22mmHg,可以认为灵敏度与特异度的关系为A. 灵敏度较好,特异度也较好B. 灵敏度较差,特异度也较差C. 灵敏度较好,特异度较差D. 灵敏度较差,特异度较好E. 无法判断11. 如果将筛检标准值定为26mmHg,可以认为灵敏度与特异度的关系为A. 灵敏度较好,特异度也较好B. 灵敏度较差,特异度也较差C. 灵敏度较好,特异度较差D. 灵敏度较差,特异度较好E. 无法判断12. 采用两项筛检试验串联使用,可以使筛检试验的哪一特征增加A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阴性预测值增加E. 患病率增加13. 采用两项筛检试验并联使用,可以使筛检试验的哪一特征增加A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阳性预测值增加E. 患病率增加(二)多项选择题1. 关于筛检,以下哪些陈述是正确的A. 所筛检的疾病有可识别的临床症状和体征B. 对于筛检计划必须要考虑它的成本与效益问题C. 对筛检阳性者,有确实的诊断手段和治疗措施D. 筛检是用来发现人群中的病情严重的病人E. 用于筛检的方法能够被群众所接受2. 筛检的主要的目的是A. 发现某病的可疑患者,并进一步进行确诊和早期治疗B. 对某病的患者进行明确诊断C. 发现高危人群,以便采取针对性措施,延缓疾病的发生D. 在人群中开展疾病的社区防治,提高群众对疾病的认知E. 了解疾病的自然史3. 筛检试验与诊断试验的不同在于A. 筛检试验的受试对象是健康者或无症状的病人,诊断试验的受试对象是病人或筛检阳性者B. 筛检试验简单、便宜,而诊断试验往往复杂、昂贵C. 筛检试验是用来识别病情轻的病人,诊断试验用来识别病情重的病人D. 筛检试验阳性者要做确诊,诊断试验阳性者要做治疗E. 用于筛检的试验的易于被健康者接受,用于诊断的试验能够被病人接受4. 影响筛检试验可靠性的因素有A. 受试对象受检时所处的生物学周期B. 检验人员做试验时所处的生物学周期C. 受试对象的性别D. 检验人员的技术水平E. 测量仪器的稳定性5. 采用两项筛检试验串联使用,可以使哪些指标增加 A. 灵敏度增加B. 特异度增加C. 阳性似然比增加D. 阳性预测值增加E. 阴性预测值增加6. 采用两项筛检试验并联使用,可以使筛检试验的哪些特征增加 A. 灵敏度增加B. 特异度增加C. 阴性似然比增加D. 阳性预测值增加E. 阴性预测值增加7. 筛检效果评价主要从哪几个方面进行A. 真实性B. 可靠性C. 收益D. 生物学效果评价E. 卫生经济学效果8. 影响筛检效果评价的偏倚有A. 选择性偏倚B. 信息偏倚C. 混杂偏倚D. 领先时间偏倚E. 病程长短偏倚9. 在高血压病的筛检方案中,A医师将收缩压、舒张压的水平分别定为140mmHg/90mmHg,而B医师将将收缩压、舒张压的水平分别定为130mmHg/85mmHg。
【流行病学试题及答案】第七章 筛检

【流行病学试题及答案】第七章筛检第七章筛检一、作业习题(一)单项选择题[A1型题]1. 所谓筛检就是A. 对某一特定人群的健康状况进行全面检查评估B. 在疾病暴发后,在人群中发现引起暴发的可能原因C. 在表面健康的人群中发现可能的疾病患者D. 在疾病流行时,对病例发病前所接触的人进行调查,以找出传染源E. 在人群中查找疾病的致病原因2. 为了提高某筛检试验的阳性预测值,可采取A. 增加筛检的次数B. 增加筛检的人数C. 选择高危人群D. 对筛检阳性者进行更仔细的诊断E. 与其他试验方法联合使用3. Slow-growing tumors and fast-growing tumors, screening test may lead toA. Lead time biasB. Length biasC. Selection biasD. Misclassification biasE. Information bias4. 从1990年至2000年,用某筛检试验方法对某病进行筛检。
在这段时间内该病的患病率增加了一倍,试问这种筛检试验方法的哪一特征因受到患病率的影响而发生相应改变A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阳性预测值增加E. 阴性预测值增加5. To examine 10000 women of child-bearing age, the sensitivity and thespecificity are 98% and 99% respectively in pregnacy testing. If only 1%women are pregnancies, the positive predictive value is:A. 0.1%B. 50%C. 89%D. 47%E. 8.9%6. 所谓金标准(gold standard)指的是A. 当前临床医学界公认的诊断疾病的最快速的方法B. 当前临床医学界公认的诊断疾病的最贵的方法C. 当前临床医学界公认的诊断疾病的最先进的方法D. 当前临床医学界公认的诊断疾病的最便宜的方法E. 当前临床医学界公认的诊断疾病的最可靠方法7. 在下列有关似然比的陈述中,哪一项不正确A. 是同时反映灵敏度和特异度的复杂指标B. 该指标全面反映筛检试验的诊断价值,非常稳定C. 不受患病率的影响D. 阴性似然比越小,筛检试验的诊断价值越高E. 在选择筛检试验时应选择阳性似然比高的方法 8. 用ROC曲线决定最佳临界点,此时A. 筛检试验的灵敏度最大和特异度最小B. 筛检试验的灵敏度和特异度均相对最优C. 筛检试验的灵敏度和特异度均最大D. 筛检试验的灵敏度最小和特异度最大E. 筛检试验的灵敏度和特异度均相对最小 [A3型题](9,13题共用题干)青光眼病人的眼压约在22,42mmHg范围,非青光眼病人的眼压约在14,26mmHg范围内,根据这些资料,可以认为: 9. 将筛检标准值定在下列哪一个范围较合适 A. 22,42mmHgB. 22,26mmHgC. 14,22mmHgD. 26,42mmHgE. 15,42mmHg10. 如果将筛检标准值定为22mmHg,可以认为灵敏度与特异度的关系为A. 灵敏度较好,特异度也较好B. 灵敏度较差,特异度也较差C. 灵敏度较好,特异度较差D. 灵敏度较差,特异度较好E. 无法判断11. 如果将筛检标准值定为26mmHg,可以认为灵敏度与特异度的关系为A. 灵敏度较好,特异度也较好B. 灵敏度较差,特异度也较差C. 灵敏度较好,特异度较差D. 灵敏度较差,特异度较好E. 无法判断12. 采用两项筛检试验串联使用,可以使筛检试验的哪一特征增加A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阴性预测值增加E. 患病率增加13. 采用两项筛检试验并联使用,可以使筛检试验的哪一特征增加A. 灵敏度增加B. 特异度增加C. 领先时间增加D. 阳性预测值增加E. 患病率增加(二)多项选择题1. 关于筛检,以下哪些陈述是正确的A. 所筛检的疾病有可识别的临床症状和体征B. 对于筛检计划必须要考虑它的成本与效益问题C. 对筛检阳性者,有确实的诊断手段和治疗措施D. 筛检是用来发现人群中的病情严重的病人E. 用于筛检的方法能够被群众所接受2. 筛检的主要的目的是A. 发现某病的可疑患者,并进一步进行确诊和早期治疗B. 对某病的患者进行明确诊断C. 发现高危人群,以便采取针对性措施,延缓疾病的发生D. 在人群中开展疾病的社区防治,提高群众对疾病的认知E. 了解疾病的自然史3. 筛检试验与诊断试验的不同在于A. 筛检试验的受试对象是健康者或无症状的病人,诊断试验的受试对象是病人或筛检阳性者B. 筛检试验简单、便宜,而诊断试验往往复杂、昂贵C. 筛检试验是用来识别病情轻的病人,诊断试验用来识别病情重的病人D. 筛检试验阳性者要做确诊,诊断试验阳性者要做治疗E. 用于筛检的试验的易于被健康者接受,用于诊断的试验能够被病人接受4. 影响筛检试验可靠性的因素有A. 受试对象受检时所处的生物学周期B. 检验人员做试验时所处的生物学周期C. 受试对象的性别D. 检验人员的技术水平E. 测量仪器的稳定性5. 采用两项筛检试验串联使用,可以使哪些指标增加 A. 灵敏度增加B. 特异度增加C. 阳性似然比增加D. 阳性预测值增加E. 阴性预测值增加6. 采用两项筛检试验并联使用,可以使筛检试验的哪些特征增加 A. 灵敏度增加B. 特异度增加C. 阴性似然比增加D. 阳性预测值增加E. 阴性预测值增加7. 筛检效果评价主要从哪几个方面进行A. 真实性B. 可靠性C. 收益D. 生物学效果评价E. 卫生经济学效果8. 影响筛检效果评价的偏倚有A. 选择性偏倚B. 信息偏倚C. 混杂偏倚D. 领先时间偏倚E. 病程长短偏倚9. 在高血压病的筛检方案中,A医师将收缩压、舒张压的水平分别定为140mmHg/90mmHg,而B医师将将收缩压、舒张压的水平分别定为130mmHg/85mmHg。
流行病学课件:诊断试验和筛检试验

第一节 概 述
概念
◆筛检的定义、分类与特性 ◆诊断的定义
筛检的目的和用途 筛检的实施原则 实例
第二节 诊断试验与筛检试验的评价
评价过程
◆选择金标准(gold standard) ◆选择研究对象 ◆样本含量估计 ◆评价结果
评价指标
◆真实性(validity)
灵敏度(sensitivity,SN) 特异度(specificity,SP) 假阳性率(false positive rate) 假阴性率(false negative rate) 约登指数(Youden’s index) 粗一致性(crude agreement)
灵敏度(sensitivity,SN):真阳性率。将实 际有病的人判定为患者的能力。 灵敏度(SN)=a/(a+c) × 100%
特异度(specificity,SP):真阴性率。将实 际无病的人判定为非患者的能力。 特异度(SP)=d/(b+d) × 100%
假阳性率(false positive rate):全部非病人中 被筛检为阳性者的比例。 假阳性率=b/(b+d) × 100%=1-特异度
分类: •整群筛检
对整个目标人群进行筛检。
•选择筛检
对高危人群进行筛检。效益较好。
特性 •对象是表面上无病的人群 •使用的方法必须是简便、快速、易行的 •工作方式是医务人员主动去发现病人 •结果是初步的,需经诊断加以确认或排除
诊断(diagnosis)是把病人与可疑有 病但实际无病者区别开来。用于诊断的试 验称为诊断试验。
符合率 a d 100% abcd
Kappa n(ad)(r1c1r2c2 ) n2 (r1c1r2c2 )
流行病学课件-诊断与筛检试验的评价

阴性似然比
假阴性率 真阴性率
1
灵敏度 特异度
复习-确定试验判断标准
受试者工作特征曲线(ROC曲线)
是以真阳性率(灵敏度)为纵坐标,假阳
非病人
病人
性率(1-特异度)为横坐标所做的曲线,
以表示灵敏度血糖与值特异度之间相互关系的一
种方法。该曲线最接近左上角的表5-2计算上述试验的灵敏度,特异度, 假阴性率,假阳性率,一致率,约登指数,阳性似然比,阴
性似然比,并说明各项指标的意义 (注意:书上表中数字有 误,斜体字是需要修改的数字)
实习表2 2种试验检测甲状腺功能低下与正常人的结果
表1 试验检查结果真实性评价模式表
灵敏度=(a/a+c)*100% 假阳性率=(b/b+d) *100% 约登指数=灵敏度+特异度-1 粗一致率=a+d/a+b+c+d
复习
真实性:是指测定值与实际值符合的程度,是指将病人 和正常人正确区分开的能力。主要指标有灵敏度,特异 度,假阳性率,假阴性率,约登指数,粗一致率。
可靠性:一项试验在相同条件下,重复检测稳定程度。 如:变异系数、符合率、kappa值
评价试验的收益: 预测值:又称预告值或诊断价值,它表示试验结果判断正确
状腺激素释放激素兴奋试验(TRH兴奋试验)。 (4)了解甲状腺肿大情况的项目: 甲状腺B型超声检查,甲状腺放射性核素显影检查等。 (5)甲状腺免疫学检查: (6)了解甲状腺病变性质的项目 (7)检查电解质情况
问题1:在一张坐标图上将实习表5-1绘制成ROC曲
线,并找出截断值。
灵敏度
可以将实习表5-1整理成下表
复习——公式
表1 试验检查结果真实性评价模式表
流行病学第七章 诊断性试验的评价

Hao Liang, Epidemiology Department of Guangxi Medical University
1
第七章:诊断试验的评价
第一节 概述 一、诊断试验概念 二、诊断试验评价的目的意义 第二节 诊断试验的评价 一、诊断试验评价的原理 二、真实性 三、可靠性 四、实用性 第三节 提高诊断试验效率的方法 一、选择患病率较高的人群 二、采取联合试验 第三节 诊断试验评价的设计 一、确定金标准 二、研究对象选择 三、样本含量的估计 四、确定诊断试验的分界值 五、与e Status (Gold Standard)
Present Test Positive Absent
Test Negative
6
Disease Status(Gold Standard) Present Test Positive Test Negative 真阳性(True positive): 表示用金标准方法确诊患 某病而用新方法试验亦判定为阳性者; Absent
16
例子
表 血清肌酸磷酸激酶测定诊断急性心肌梗死 血清磷酸 肌酸激酶 阳性 阴性 合 计 急性心肌梗死(金标准判定) 有 无 合计 225 24 249 25 121 146 250 145 395
•敏感度(真阳性率)=(225/250)×100%=90.0% •漏诊率(假阴性率)=(25/250)×100%=10.0% •误诊率(假阳性率)=(24/145)×100%=16.6% •特异度(真阴性率)=(121/145)×100%=83.4%
a ab
100 %
20
阴性预测值(negative predictive value, -PV)是 指在诊断试验检测为阴性者中,用金标准诊断为“无病”
流行病学 诊断试验和筛检试验

试验
Positive Negative
合计
金标准确诊
Present
Absent
TP
FP
FN
TN
TP+FN
FP+TN
合计
TP+FP FN+TN
TP+FP+FN+TN
阴性预测值(NPV) = TN/(FN+TN)
45
v 试验的预测值与试验的灵敏度、特异度及受检人群中 所检疾病的患病率有关。
v
用多种方法
9
按筛检目的分
v 治疗性筛检(therapeutic screening)
v
二级预防
v 预防性筛检(preventive screening)
v
一级预防
10
应用原则
重大公共卫生问题 有可供识别的早期症状和体征或测量的标志 对被筛检疾病或缺陷有确诊的方法与条件 对病人及高危人群可进行有效治疗和干预 了解疾病自然史 筛检试验快速、简便、经济、可靠、安全、有 效易为群众接受 有保证筛检计划顺利实施的人、财、物 筛检计划连续完整,能按计划进行 筛检、诊断和治疗的成本-收益 筛检计划为目标人群接受,有益无害,尊重个 人隐私,公正、公平、合理
试验所检出的真阳性和真阴性例数之和占受 试人数的百分比。
反映试验结果和金标准诊断结果的符合程度。
35
试验
Positive Negative
合计
评价试验数据整理表
金标准确诊
Present
Absent
TP
FP
FN
TN
TP+FN
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 诊断试验和疾病筛检第一节 概述一.筛检(screening)1.定义:时间是运用快速、简便的实验、检查或其他手段,自表面健康的人群中去发现那些未被识别的可以病人或有缺陷者。
用于筛检的试验成为筛检试验。
筛检是流行病学研究方法之一,属于观察性研究范畴。
2.目的:①疾病的早期发现、早期诊断和早期治疗,属于二级预防的内容。
如常见的有结核、高血压、糖尿病、乳腺癌、子宫颈癌等。
②检出某种疾病的高危人群。
高危人群是指该人群发生某种疾病的可能性显著高于一般人群。
例如生活方式关联疾病的吸烟人群、运动不足的办公室工作人群等。
近年来还开始了筛检疾病易感基因和有害基因的国内工作。
因为这类筛检是针对疾病病因的,故属于一级预防。
③传染病和医学相关事件的预防和控制。
主要指一些特殊人群和职业人群中检查和控制传染源或某些医学相关事件的诱因,以保护人群的大多数免受其伤害。
如对静脉吸毒人群艾滋病毒感染标志的筛检等。
3.类型人群 整群筛检——以整个目标人群为对象选择性筛检——以群体中的一个亚群或有某种特征的人群为对象目的 治疗性筛检——未早发现、早治疗预防性筛检——为了查出某病的高危人群方法 单项筛检——如餐后2h血糖多项筛检——如胸痛+痰培养筛检肺结核二.诊断(diagnosis)1.定义:诊断是进一步把病人与可疑有病但实际无病者区别开来。
他不同于筛检。
因此,诊断对下一步治疗有决定意义,诊断正确与否至关重要。
用于诊断的试验称为诊断试验.第二节 试验方法的评价一.实验方法评价的程序试验方法评价的基本方法是与诊断某疾病的金标准作盲法和同步比较,基本步骤是:(一)确定金标准(gold standard)1.目的:避免发生错误分类偏倚,及时病人组中不致于混入假病人(非疾病之人)和非病人组中(对照组)不混有真病人(所研究疾病的患者)2.金标准——是指用来分辨病人与非病人的标准评价方法。
3.常见的金标准①病理学检查(组织活检和尸体解剖)②外科手术发现③特殊的影响学诊断(如用冠状动脉造影诊断冠心病)④长期随访观察所得到的结果4.对有些诊断困难的疾病,可能按时还没有真正意义上的金标准或是因诊断过程复杂,且费用昂贵等。
此时可选择一个相对较好的方法作为全标准。
(二)选择研究对象研究对象包括两组,一是被金标准确诊的病例组,另一组是金标准证实无该病的人群(对照组)。
病例除要求用金标准正确诊断外,同时还要求所选病例有代表性。
应包括临床各型(轻、中、重)各期(早、中、晚)及有或无并发症。
对照不仅仅是正常人,也可来自其他病例,尤其是容易与疾病相混淆的其他病例。
(三)样本大小因为实验方法的评价也是对样本的研究,因此需要有足够的样本量,可以参照统计学部分的内容。
(四)同步评价被评价的诊断试验方法,因采用盲法观察,同步地对研究对象进行检查。
根据其记过,评价去诊断价值。
二.诊断实验的评价诊断实验的评价主要是从真实性(validity)、可靠性(reliability)和预测值等方面进行的。
(一)真实性真实性——是指测量值与实际值的符合程度。
根据评价程序,任何实验结果都有四种情况(参照P362图30-1)表30-1 诊断性试验方法评价 金标准 结果有病无病 合计 阳性a(真阳性) b(假阳性) a+b 阴性c(假阴性) d(真阴性) c+d 合计 a+c b+d N 正确结果 ①真正有病的实验结果阳性(真阳性a) ②无病人中实验结果阴性(真阴性d) 错误结果 ①真正有病的人试验结果阴性(假阴性c) ②无病人中实验结果阳性(假阳性b) 真实性包括对有病和无病的识别能力,主要评价指标是1.灵敏度(sensitivity,Se)灵敏度——即真阳性率,是指在真正有病的人中,实验结果阳性的百分率。
灵敏度表示试验方法对疾病的检出能力,灵敏度越高,说明该方法对疾病的检出能力越强,病人漏诊机会越少。
理想的灵敏度是100%。
与灵敏度相对应的是漏诊率。
2.特异度(specificity)特异度——即真阴性率,是指在无病的人中实验结果阴性的百分率。
特异度表示试验方法对无病的检出能力。
特异度越高,说明对无病的判断能力越强,无病的人误诊机会越小。
理想的特异度为100%与特异度相对应的是误诊率。
3.似然比(likelihood ratio,LR)似然比——是指真阳性率与真阴性率之比一项实验的似然比越大,试验的诊断价值越高。
4.Youden指数(Youden’s Index)Youden指数——也称正确指数,是指灵敏度与特异度之和减去1通常Youden指数越大,实验的真实性越高。
例如:参照P363表30-2甲胎蛋白诊断肝癌的评价。
注意:诊断标准,也就是诊断水平对灵敏度和特异度有很大的影响。
许多指标在病人和非病人中的分布在大多数情况下并不是完全分离的。
例如:血压、血糖等。
参照P363图30-1在理想(A)和实际情况(B)下正常人和糖尿病人的血糖分布。
图B糖尿病人和非病人之间血糖水平在a-b间有重叠,也就是说在此范围内,既可能是糖尿病病人,也可能是非病人。
如以a虚线处为标准,则灵敏度高(漏诊少),但特异性低(误诊多)如以b虚线处为标准,则特异度高(误诊少),但灵敏度低(漏诊多)因此,就通一诊断实验来说,灵敏度和特异度是矛盾的,要提高灵敏度,必然要损失部分特异度,相反也是。
5.受试者工作特征曲线(receive operator characterristic curve.ROC曲线)ROC曲线是以灵敏度为纵坐标,假阳性率(1-特异度)为横坐标作图所得的曲线,参照P364ROC曲线示意图。
左图:A点Youden指数最高,以此点为标准。
右图:两种方法比较时,以ROC曲线下面积大小为好坏标准,越大越好。
(二)可靠性评价可靠性亦称重复性(repeatablility),是指在完全相等条件下,重复进行某项试验是获得相同结果的稳性程度。
影响因素:1.实验方法来自或仪器的差异。
(如实际的影响等)2.调查对象的生物学变异。
(如血压测定时)3.观察者的测量变异——不同观察者对同一批样品(或样本)进行检查,其测量结果可能有差异,这就是观察者内变异。
(三)预测值(predicative value,PV)预测值——又称诊断价值,是指在已知实验结果(阳性或阴性)的条件下,有无疾病的概率,它表示试验结果的实际临床意义。
1.指标:①阳性预测值(positive predicative value.PPV)是指试验结果阳性者,真正患有疾病的概率。
②阴性预测值(negative predicative value,NPV)是指试验结果阴性者,真正没有患该病的概率。
2.影响因素①试验方法本身(包括灵敏度和特异性)②患病率:通常在患病率固定不变的条件下,特异度的改变对阳性预测值的影响比灵敏度大。
预测值与患病率、灵敏度、特异度之间的关系:参照P366图30-3患病率与预测值的关系,说明当患病率升高时,阳性预测值升高,阴性预测值下降,反之亦然。
再者P365表30-4灵敏度为99%,特异度为95%的诊断实验在不同患病率的人群检查的阳性预测值。
当患病率1%——阳性预测值17%,当2%——29%,10%——68.8%这提示我们在临床上判断一张化验单的阳性结果的临床价值时,必须先要考虑被检人群的患病率高低,才能做出正确的评价。
(四)提高试验效率的方法1.选择合适的方法和指标①选择客观指标 ②采用标准化的测量方法 ③计量数据选择恰当的截值点2.选择患病率较高的人群进行检查,可以获得较高的阳性预测值。
3.联合实验:当单一方法的灵敏度和特异度不能满足要求时采用①平行实验(parallel test)亦称并联实验,是指同时作几项实验,只要有一个结果阳性,即判断为阳性。
参照P366表30-5两种方法并联后:因此,平行实验可以提高灵敏度,但降低特异度。
当临床医师希望尽可能全面地发现病人,而可获得的多项试验单一方法不够敏感时,可采用这个方法。
②系列试验(serial test),也称串联实验。
是指同时做几项实验,只有结果均为阳性,才判断为有病。
参照P366表30-5两种方法串联后:因此,系列实验可以提高特异性,但降低灵敏度。
当临床医师希望尽可能确诊病人时,可采用这个方法。
例如:参照P366表30-6联合实验筛选糖尿病 表30-7尿糖、血糖及联合试验的灵敏度、特异度第三节 疾病筛检一.筛检试验流程参照P367图30-4筛检试验流程示意图筛检实验不是诊断,它仅仅是一种初步检查,对筛查的异常结果(阳性者),可以看做是可疑病人,还需作进一步用诊断实验进行确诊。
二.目的(参照筛①)三.类型(参照筛②)四.实施筛检的原则与条件主要涉及被筛检的疾病和人群,筛检的条件和设备、干预和随访、社会伦理4个方面。
1.所筛检的疾病或缺陷是当前重大的卫生问题,如严重影响人群健康,卫生资源消耗巨大以及给社会和家庭造成严重负担的疾病。
2.被筛检的处于潜伏期或临床前期的疾病或某种危险因素有可供识别的检查与测量标志。
3.对疾病的自然史,包括从潜伏期发展到临床期的全部过程有足够的了解。
4.有快速、简便、准确、可靠、可行、安全、经济及群众易于接受的筛检试验。
5.对经筛检发现并确诊的病人及高危人群能进行及时有效的干预和治疗。
6.具备疾病监测、预防、治疗、干预、健康教育、咨询和社会支持等方面的设备和条件,包括医疗行政机构的良好协作,保证计划顺利完成。
7.有连续而完整的筛检计划。
8.筛检的效果应以经济学、心理学、社会学、医学和卫生服务等方面权衡,有好的收益。
9.筛检计划应能为目标人群接受,并可以生理、心理和社会生活等方面获益。
10.对人群不应产生负面影响,筛检结果应制定保密措施。
五。
疾病筛检的评价1.新发现的病例数或有缺陷的人数。
筛检能以人群中去识别可疑病人或有某种缺陷的人。
一般来说,发现的人越多,说明筛检效果越好。
2.对疾病结局的影响通过筛检应当能够改善疾病预后,降低死亡率,提高生存率。
但在评价预后影响时,要排除领先时间的偏倚。
领先时间偏倚(lead time bias)是在慢性病筛查时必须考虑的偏倚,属于选择偏倚。
由于筛检提前发现了那些尚未发展到明显疾病的病人,如果该病尚无有效的治疗措施,这些人比发展到有明显临床表现而自发就医的病人可能存活期长,所延长的存活期是因诊断时间提前的,可能因为领(参照P368图30-5)先时间偏倚而使研究结果偏离真实情况。
3.卫生经济学评价一项好的筛检方法应当发现的病人多,而花费少。
一般从三方面进行①成本—效果分析(cost-effectiveness analysis)成本包括实验所花费的直接或间接的全部费用,效果指在健康方面的改善。
成本—效果分析是计算筛检所花的费用与其获得的生物学效果。
②成本—效益分析(cost-benefit analysis)是计算筛检取得的经济效益。