诊断试验的评价第七版
诊断性试验的评价指标

病的百分率
灵敏度 A 100% AC
假阴性率
◈假阴性率(false negative rate)(漏诊率、第 二类错误) 即实际有病,但根据该筛检标准被 定为非病者的百分率
假阴性率 C 100% AC
⒉特异度
◈特异度(specificity)(真阴性率) 实际无病按该诊断标准被正确地判为
无病的百分率
ROC曲线研究历史
1950’s
雷达信号观测能力评价
1960’s中期 学
实验心理学、心理物理
1970’s末与1980’s初 诊断医学
Test variable
灵敏度,特异度,假阴性率,假阳性率
ROC曲线是以1-特异性为横坐标,以敏 感性为纵坐标所绘,又称受试者工作曲 线。直观反映了灵敏度和特异度之间的 关系。
灵敏度
灵敏度 患病率 患病率 (1 患病率)(1
特异度)
阴性预测值
特异度
特异度 (1 患病率) (1 患病率) (1 灵敏度) 患病率
患病率(prevalence,P)
经诊断性试验检测的全部病例中,真正“有病” 患者所占的比例。
P ab abcd
ROC的涵义与起源
ROC【receiver(relative) operating characteristic的缩写,译为“接受者工 作特征”】
(accuracy)。 包括 ◆灵敏度与假阴性率 ◆特异度与假阳性率 ◆阳性预测值 ◆阴性预测值 ◆准确度 ◆似然比 ◆符合率
⒈灵敏度
诊断试验评价四格表
诊断试验
Disease Status
有病
无病
+
a
b
a+b
—
c
d
诊断性试验的评价

评价指标之真实性
各种指标的关系
评价指标 学习案例
为评价ECG运动试验诊断冠心病的价值,选用冠状动脉造影显示主动脉造影显 示主干狭窄≥75%作为诊断冠心病的金标准。选取120例确诊的冠心病患者作 为试验组,选取105例非冠心病作为对照组,结果见表2,试对该诊断性试验结 果进行评价 表2 冠心病诊断性试验 诊断性试验
阴性预测值为 63.6%,说明在用金标准确定的 105 例非冠心病患者, 每 100例心电图运动试验阳性者中64例是非冠心病患者
诊断试验的正确应用
必须以金标准为对照,没有金标准的诊断试验评价是缺乏科学依据
试验过程中应贯彻盲法,避免主观因素对结果的干扰
要说明研究对象所包括的病例和对照的来源
金标准 + 诊断性 试验 合计 + a+c d b+d N 合计
特异度
评价指标之真实性
Youden指数
表示诊断的综合能力
Youden指数=灵敏度+特异度-1 一个有效的疾病诊断方法应该灵敏度与特异度都很大 Youden指数的取值范围为,-1≤Youden指数≤1 如果Youden指数≤0表示诊断完全没有价值 当灵敏度与特异度同等重要时,可以使用这一指标
2
选择研究对象
包括用金标准确诊的病例组和用金标准核实的无该病的 患者或正常人,称为对照组 病例组应包括各种病例如轻型、重型,早期、晚期,有 无并发症等 ,使结果具有代表性
3
盲法和同步地测量研究对象,结果整理结四格表样式
评价指标
真实性
灵敏度 特异度 似然比 表示测量值与真值的差异程度
灵敏度越高,则假阴性率(即漏诊率)越低 灵敏度高的诊断性试验用于临床,发生漏诊的机会就少
诊断试验的评价

3、并联试验和串联试验混合进行
联合试验筛检糖尿病的结果
五、提高诊断试验效率的方法
(一)选患病率高的人群应用诊断试验
主观高-转诊、客观高-高危地区
(二)采用联合实验
1、平行(并联)实验:
①定义:同时做几个实验,只要有一个阳性即可认为有病
② 效应:提高灵敏度和阴性预测值
适应:A 急需作出诊断的
B 漏诊减少,误诊增加
2、系列(串联)实验:
① 定义:依次相继实验,皆阳性的才为阳性
(2 ) *特异度(specificity):又称真阴性率。
特异度 d 100% bd
特异度反映一项试验能将实际上未患某病的 人正确地判定为未患某病的能力。其值越大,则
误诊的可能性愈小。假阳性互补
(3) *假阳性率(false positive):又称误 诊率 假阳性率 b 100% 1 特异度
6 可靠性评价指标(可重复性)
(1)定义:可重复性是指诊断实验在完全相 同条件下,进行重复操作获得相同结果的稳 定程度。
(2)测量变异: A 观察者间变异 B 观察者自身变异 C 测量仪器,试剂 D 研究对象生物学变异
(3)评价指标
A 计量资料;用标准差、变异系数; B 记数资料:用观察符合率和卡帕(Kappa)值表示 (4)Kappa值定理:是判断不同观察者间,校正机遇
② 效应:提高特异度和阳性预测值
③ 适应:A 要增加疾病正确性 癌
7 诊断实验的评价

约登指数 正确诊断指数r 约登指数(Youden’s index)是灵敏度与特异度之和减1。 约登指数=灵敏度+特异度-1 约登指数越接近于1,诊断试验的真实性越好,反之越差。 约登指数表示筛检/诊断试验能够正确地判断病人和非病人 的综合能力。
22
符合率(agreement rate):该指标是指试验结果的 真阳性和真阴性人数占受试者总人数的比例。
ad 一致性 100 % abcd
真阳性和真阴性值愈大,一致性愈接近于1,假阳 性和假阴性愈小,该项试验价值愈高。
23
预测值(PV)
又称诊断价值,表示试验结果的实际临床价值。是指已 知试验结果(阳性或阴性)的条件下,表明有无疾病的概率, 即说明试验结果为阳性(或阴性)时,有多少概率有病(或 无病)。 影响因素:疾病的患病率;灵敏度和特异度
约登指数 =(灵敏度+特异度)-1=0.81 阳性似然比=(215÷230)/(16 ÷130)=7.6 阴性似然比=(15 ÷230)/(114 ÷130)=0.074
32
评价指标的相互关系
理想的诊断试验,其灵敏度、特异度均应接近100%。 但在实际工作中很难达到,往往表现为灵敏度↑↓则特异 度↓↑。 两者高低的转换与确定诊断试验阳性结果的截断值(cut off point)或临界点的选择密切相关。
29
(1)阳性似然比:
诊断试验中,真阳性在‘有病’患者中的比例与假阳性在‘无病’ 例数中比例的比值。真阳性率/假阳性率 说明诊断试验正确判断阳性的可能性是错误判断阳性可能性的倍数。 +LR=[a/(a+c)/b/(b+d)]=灵敏度/(1-特异度)
(2)阴性似然比
诊断试验中,假阴性在‘有病’例数中的比例与真阴性在‘无病’ 例数中比例的比值。假阴性率/真阴性率 -LR=[c/(a+c)/d/(b+d)]=(1-灵敏度)/特异度
诊断试验的评价(第七版)

影响因素
方法的差异 被观察者的个体生物学变异 观察者的变异
第二节 筛检和诊断试验的评价
收益:是指经诊断试验可使多少原来未发现的病人
得到正确诊断和早期治疗,改善其预后,以及其创造 的经济价值和社会价值如何。
评价指标 预测值(predictive value) 成本效益分析(cost-effect analysis)
灵敏度=a/(a+c)=85/100=85% 特异度=d/(b+d)=160/200=80% 阳性是然00 - 40 160 200
合计 125 175 300
假阴性率=c/(a+c)=15/100=15% 假阳性率=b/(b+d)=40/200=20% 阴性似然比=15%/80%=0.19
灵敏度 患病率 阳性预测值 灵敏度 患病率 (1 患病率)(1 特异度)
特异度 (1 患病率) 阴性预测值 特异度 (1 患病率) (1 灵敏度) 患病率
◈阳性预测值(positive predictive value): 是指筛检试验阳性者患目标疾病的可能性
a 阳性预测值 100% ab ◈阴性预测值(negative predictive value):
是指筛检试验阴性者不患目标疾病的可能性
d 阴性预测值 100% cd
患病率与预测值关系
表A1 在患病率高的男病人组中运动后心电图与冠状动脉造影的比较 冠状动脉造影显示≥75%狭窄 运动后心电图异常 + - 合计 + 55(α) 49(c) 104 - 7(b) 84(d) 91 合计 62 133 195
第二节 筛检和诊断试验的评价
收益
预测值(predictive value)
复习重点、试题-人卫第七版-流行病学期末复习重点(超全)_2

流行病学1.流行病学的定义:流行病学是研究人群中疾病与健康状况的分布及其影响因素,借以制定和评价预防、控制和消灭疾病及促进健康的策略和措施的科学。
2.现代定义及其认识:①三个层次:疾病、伤残、健康②三个阶段:揭示现象、找出原因、提供措施③三个范畴:描述、分析、实验④三种方法:观察法、实验法、数理法⑤三大要素:原理、方法、应用3. 流行病学的重要观点:①群体的观点(基本);②比较的观点(核心);③概率论的观点(特点)。
4.流行病学的研究方法:观察法、实验法、数理法。
5.流行病学的用途:<1>研究人群健康,疾病消长以及疾病特征变化的规律。
<2>对社区和人群健康做出诊断。
<3>用于卫生决策和评价。
<4>揭示疾病完整的自然史。
<5>利用流行病学方法探讨原因不明的疾病的病因。
<6>疾病预防<7>疾病诊断、治疗与预防方法或措施的效果评价。
4.疾病的三间分布:以疾病频率为测量指标,来描述与分析疾病在不同地区、不同时间和不同人群的分布现象(发病率、患病率、死亡率等),简称“三间分布”第二、三章疾病的分布和描述性研究1、发病指标⑴发病率:是指一定地区、一定时期内,一定人群中某病新病例出现的频率。
发病率=一定时期内某人群中发生某病的新病例数/同期暴露人口数×k k =100%,1000‰……⑵罹患率:罹患率与发病率同样是测量新发病例的频率指标。
罹患率=观察期间某病新病例数/同期暴露人口数×kk =100%或1000‰罹患率:一般多用于衡量小范围、短时间的发病率、观察的时间是以月、周、日或一个流行期为时间单位。
⑶患病率:亦称现患率或流行率,是指在特定时间内,一定人群中某病新旧病例所占的比例。
患病率=特定时间内某人群中某病新旧病例数/同期观察人口数×k2、患病率与发病率的区别:①患病率的分子为特定时间内所调查人群中某病新旧病例的总和,而发病率的分子则为一定时期内暴露人群中某病的新发病例数;②患病率是由横断面调查获得的疾病频率,是衡量疾病的存在或流行情况的静态指标,而发病率是由发病报告或对例研究获得的疾病频率,是衡量疾病发生情况的动态指标。
第七章诊断试验的评价

诊断试验的目的:
是把病人与可疑有病、但实际 无病的人区别开来,以便对确诊
的病人给予相应的治疗。
滨州医学院流行病学教研室
为什么要评价诊断试验
新的诊断试验方法不断被提出 现有诊断方法缺陷需要新的方法 对诊断结果的解释(指导临床实践)
阳性结果 阴性结果 是否受患病率的影响
即实际有病而按该诊断试验被正确 地判为病的百分比。反映诊断试验 发现病人的能力。
灵敏度 A 100% AC
滨州医学院流行病学教研室
假阴性率 (false negative rate) (漏诊率) 即实际有病而被该诊断试验错误地判 段为无病的百分比。 反映的是诊断试验漏诊病人的情况。
假阴性率 C 100% AC
滨州医学院流行病学教研室
第二节 诊断试验的评价
滨州医学院流行病学教研室
诊断实验的评价主要包括:
真实性(validity) 可靠性 (reliability) 实用性
滨州医学院流行病学教研室
金标准
特 定 人 群
病 人
待评价诊断方法
非 病 人
阳性 阴性 阳性 阴性
图2 筛检/诊断试验的评价程序
整理评价结果
表1 诊断试验评价整理表
诊断试验 阳性
阴性
合计
金标准
有病
无病
真阳性 假阳性
a
b
假阴性 真阴性
c
d
a+c
b+d
合计 a+b
c+d
N
滨州医学院流行病学教研室
1、真实性(validity)
诊断试验所获得的测量值与实际值 相符合的程度,亦称效度,又称 准确性。
诊断试验方法的评价

③ Kappa值= ( P0-Pc)/(1-Pc) P0= (a+d)/ (a+b+c+d) =(205+37)/302 = 0.8013 Pc={[ (a+b) (a+c)/ (a+b+c+d)]+[ (c+d) (b+d)/ (a+b+c+d)]}/ (a+b+c+d) = [(236×234)/302+(66×68)/302]/302 = (55224+4488)/91204 = 0.6547 Kappa = (0.8013-0.6547)/(1-0.6547)= 0.1466/0.3453 = 0.4246 由于 0.40 <Kappa< 0.74,表示两种试验的一致性程度为一般,因此,甲胎蛋白检测作
诊断试验方法(fāngfǎ)的 评价
2021/11/11
第一页,共28页。
用于临床疾病诊断的试验方法很 多,而且随着科学技术的发展,特别 (tèbié)是医学、分子生物学、电子计 算机技术的发展,越来越多的新诊断 试验方法被应用于临床。
第二页,共28页。
评价(píngjià)一种新的诊断试验方 法的基本程序是与诊断某病的金标准 作盲法 和同步 比较
倍数,表明诊断试验结果呈阴性时患病与不患病的比例,其 比值越小,试验的诊断价值越高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断试验(diagnostic test)是指应 用各种实验、医疗仪器等手段对病人进 行检查,以确定或排除疾病的试验方法。
诊断试验评价的意义
1.对诊断试验的应用价值进行科学评价 2.为临床医生合理选用诊断试验并正确解 释其结果提供科学依据。
诊断试验评价的意义
夸大所考核诊断试验的敏感度和 特异度 ,使其最初被寄予较大希望, 而经过多年临床实践后被冷落。
第二节 诊断试验的评价
1.建立标准诊断方法 金标准:指目前医学界公认诊断某种疾病最准确的诊断方法。
2.选择研究对象:应能代表该方法可能应用的靶人群。 ➢ 病例组应包括所研究疾病的各种临床类型,以使病例组对该
病患者总体具有代表性。 ➢ 非病例组应选择确定无该病的其他病例或健康人,尤其应包
括易与该病混淆的其他病例,以考察该方法的鉴别能力。 3.样本含量的估计 4.评价
评价程序
金标准 试 验 对 象
盲法检 测
病人 待评价筛检或诊断试验
非病人
真阳阳性性 假阴阴性性
假阳阳性性 真阴阴性性
待评价诊 断试验
阳性 阴性
合计
金标准
病人 非病人
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
a+c
b+d
合计
a+b c+d N
评价
第二节 筛检和诊断试验的评价
❖ 评价内容
1. 真实性(validity) 2. 可靠性(reliability) 3. 收益
❖ 灵敏度越高,阴性预测值越高 ❖ 特异度越高,阳性预测值越高 ❖ 与受检人群目标疾病患病率(P)密切相关
阳性预测值
灵敏度 患病率 灵敏度 患病率 (1 患病率)(1 特异度)
阴性预测值
特异度 (1 患病率) 特异度 (1 患病率) (1 灵敏度) 患病率
◈阳性预测值(positive predictive value): 是指筛检试验阳性者患目标疾病的可能性
+
55(α)
7(b)
62
-
49(c)
84(d)
133
合计
104
91
195
灵敏度=α/(α+c)=55/104=53% 假阴性率=c/(α+c)=49/104=47% 特异度=d/(b+d)=84/91=92% 假阳性率=b/(b+d)=7/91=8% 患病率=(α+c)/(α+b+c+d)=104/195=53% 阳性预测值=α/(α+b)=55/62=89% 阴性预测值=d/(c+d)=84/133=63%
第二节 筛检和诊断试验的评价
收益 ➢ 预测值(predictive value)
又称预告值、诊断价值。是试验结果表明有无疾病 的概率。
一个诊断方法有其一定的特异度、灵敏度,但是 当应用它筛检或诊断患病率不同的人群时,阳性(或阴 性)结果所表示的意义却不同。
✓ 预测值的影响因素: 灵敏度和特异度 患病率
如:癌胚抗原(CEA)诊断结肠癌价值的 报告。最初报道测定36例晚期结、直肠癌 病人CEA中35例(97.2%)升高,对照组 是未患结肠癌的其他病人,结果他们多数 CEA水平较低。
研究者根据此结果认为:CEA是 筛选结肠癌的有效试验。以后经多家 观察将试验对象用于包括早期结肠癌 及其他胃肠道疾病对象时,发现最初 报道的CEA检查结果不正确,不能将 早期结肠癌与其他胃肠病人鉴别开来, 因此,CEA的诊断价值明显降低。
第二节 诊断试验的评价
待评价诊
金标准
断试验 有病
无病
阳性 a真阳性 b假阳性
阴性 c假阴性 d真阴性
合计
a+c
b+d
❖评价指标
真实性(validity):又称有效性,是指诊断试验所获得
的测量值与实际值的符合程度。
灵敏度=
真阳性人数 金标准诊断病人数
=
a
a
c
100%
漏诊率=
假阴性人数 金标准诊断病人数
=
a
c
c
100%
特异度=
真阴性人数 金标准诊断非病人数
=
b
d
d
100%
误诊率=
假阳性人数
金标准诊断非病人数
= b
b
d
100%
➢ 似然比(likelihood ratio, LR) 病人中出现某种试验结果的概率与非病人中出现相应结果的概率
之比,说明病人出现该结果的机会是非病人的多少倍。
阳性似然比
阳性预测值 a 100%
◈阴性预测值(negative parebdictive value): 是指筛检试验阴性者不患目标疾病的可能性
阴性预测值 d 100% cd
患病率与预测值关系
表A1 在患病率高的男病人组中运动后心电图与冠状动脉造影的比较
运动后心电图异常
冠状动脉造影显示≥75%狭窄
+
-
合计
表 ELISA法与微量中和试验检查COXB病毒感染的比较
ELISA法
+ - 合计
微量中和试验
+
-
85
40
15
160
100
200
合计
125 175 300
灵敏度=a/(a+c)=85/100=85%
假阴性率=c/(aꢘ/200=80%
假阳性率=b/(b+d)=40/200=20%
阳性是然比=85%/20%=4.25
阴性似然比=15%/80%=0.19
正确诊断指数=100%-(20%+15%)=0.65
第二节 诊断试验的评价
可靠性(reliability):又称可重复性,是指诊断试验在同
样条件下,进行重复操作获得相同试验结果的稳定程度。
❖ 评价指标
➢
计量资料:变异系数(CV)
真阳性率 假阳性率
灵敏度 误诊率
a/a b/b
c d
100%
阴性似然比
假阴性率 真阴性率
漏诊率 特异度
c/a d/b
c d
100%
➢正确诊断指数(Youden’s index)
r = 1-(假阳性率+假阴性率) = (灵敏度+特异度)-1
第二节 诊断试验的评价
例:某临床医师用酶联免疫吸附试验法(ELISA)检查柯萨奇B组 (COXB)病毒的感染情况,以微量中和试验作为标准诊断,检查 结果见表,试对该法的真实性进行评价。
标准差 均数 100%
➢ 计数资料:Kappa值、符合率
❖ 影响因素
➢ 方法的差异 ➢ 被观察者的个体生物学变异 ➢ 观察者的变异
第二节 筛检和诊断试验的评价
收益:是指经诊断试验可使多少原来未发现的病人
得到正确诊断和早期治疗,改善其预后,以及其创造 的经济价值和社会价值如何。
❖ 评价指标 ➢ 预测值(predictive value) ➢ 成本效益分析(cost-effect analysis)