诊断试验的评价第七版

合集下载

诊断性试验的评价指标

病的百分率
灵敏度 A 100% AC
假阴性率
◈假阴性率(false negative rate)(漏诊率、第二类错误) 即实际有病，但根据该筛检标准被定为非病者的百分率
假阴性率 C 100% AC
⒉特异度
◈特异度(specificity)(真阴性率) 实际无病按该诊断标准被正确地判为
无病的百分率
ROC曲线研究历史
1950’s
雷达信号观测能力评价
1960’s中期学
实验心理学、心理物理
1970’s末与1980’s初诊断医学
Test variable
灵敏度,特异度,假阴性率,假阳性率
ROC曲线是以1-特异性为横坐标，以敏感性为纵坐标所绘，又称受试者工作曲线。直观反映了灵敏度和特异度之间的关系。
灵敏度
灵敏度患病率患病率 (1 患病率)(1
特异度)
阴性预测值
特异度
特异度 (1 患病率) (1 患病率) (1 灵敏度) 患病率
患病率(prevalence,P)
经诊断性试验检测的全部病例中，真正“有病” 患者所占的比例。
P ab abcd
ROC的涵义与起源
ROC【receiver(relative) operating characteristic的缩写，译为“接受者工作特征”】
（accuracy）。包括 ◆灵敏度与假阴性率 ◆特异度与假阳性率 ◆阳性预测值 ◆阴性预测值 ◆准确度 ◆似然比 ◆符合率
⒈灵敏度
诊断试验评价四格表
诊断试验
Disease Status
有病
无病
+
a
b
a+b
—
c
d

诊断性试验的评价

评价指标之真实性
各种指标的关系
评价指标学习案例
为评价ECG运动试验诊断冠心病的价值，选用冠状动脉造影显示主动脉造影显示主干狭窄≥75%作为诊断冠心病的金标准。选取120例确诊的冠心病患者作为试验组，选取105例非冠心病作为对照组，结果见表2，试对该诊断性试验结果进行评价表2 冠心病诊断性试验诊断性试验
阴性预测值为 63.6%，说明在用金标准确定的 105 例非冠心病患者，每 100例心电图运动试验阳性者中64例是非冠心病患者
诊断试验的正确应用
必须以金标准为对照，没有金标准的诊断试验评价是缺乏科学依据
试验过程中应贯彻盲法，避免主观因素对结果的干扰
要说明研究对象所包括的病例和对照的来源
金标准 + 诊断性试验合计 + a+c d b＋d N 合计
特异度
评价指标之真实性
Youden指数
表示诊断的综合能力
Youden指数=灵敏度+特异度-1 一个有效的疾病诊断方法应该灵敏度与特异度都很大 Youden指数的取值范围为，-1≤Youden指数≤1 如果Youden指数≤0表示诊断完全没有价值当灵敏度与特异度同等重要时，可以使用这一指标
2
选择研究对象
包括用金标准确诊的病例组和用金标准核实的无该病的患者或正常人，称为对照组病例组应包括各种病例如轻型、重型，早期、晚期，有无并发症等，使结果具有代表性
3
盲法和同步地测量研究对象，结果整理结四格表样式
评价指标
真实性
灵敏度特异度似然比表示测量值与真值的差异程度
灵敏度越高，则假阴性率（即漏诊率）越低灵敏度高的诊断性试验用于临床，发生漏诊的机会就少

诊断试验的评价

２、串联试验（serial testing）一种依次的试验，是否作下一个试验要根据上一个试验结果来决定。串联试验特异度、阳性预测值增大，减少误诊率，灵敏度和阴性预测值降低，增加漏诊率☆。在临床工作中，当不必迅速作出诊断时或误诊能造成严重后果时，应用此试验。
3、并联试验和串联试验混合进行
联合试验筛检糖尿病的结果
五、提高诊断试验效率的方法
（一）选患病率高的人群应用诊断试验
主观高-转诊、客观高-高危地区
（二）采用联合实验
1、平行（并联）实验：
①定义：同时做几个实验，只要有一个阳性即可认为有病
② 效应：提高灵敏度和阴性预测值
适应：A 急需作出诊断的
B 漏诊减少，误诊增加
2、系列（串联）实验：
① 定义：依次相继实验，皆阳性的才为阳性
（2 ） *特异度（specificity）：又称真阴性率。
特异度 d 100% bd
特异度反映一项试验能将实际上未患某病的人正确地判定为未患某病的能力。其值越大，则
误诊的可能性愈小。假阳性互补
（3） *假阳性率（false positive）：又称误诊率假阳性率 b 100% 1 特异度
6 可靠性评价指标（可重复性）
（1）定义：可重复性是指诊断实验在完全相同条件下，进行重复操作获得相同结果的稳定程度。
（2）测量变异： A 观察者间变异 B 观察者自身变异 C 测量仪器，试剂 D 研究对象生物学变异
（3）评价指标
A 计量资料；用标准差、变异系数； B 记数资料：用观察符合率和卡帕（Kappa）值表示（4）Kappa值定理：是判断不同观察者间，校正机遇
② 效应：提高特异度和阳性预测值
③ 适应：A 要增加疾病正确性癌

7 诊断实验的评价

21

约登指数正确诊断指数r 约登指数（Youden’s index）是灵敏度与特异度之和减１。约登指数＝灵敏度＋特异度－１约登指数越接近于１，诊断试验的真实性越好，反之越差。约登指数表示筛检/诊断试验能够正确地判断病人和非病人的综合能力。
22

符合率（agreement rate）：该指标是指试验结果的真阳性和真阴性人数占受试者总人数的比例。
ad 一致性 100 % abcd

真阳性和真阴性值愈大，一致性愈接近于１，假阳性和假阴性愈小，该项试验价值愈高。
23
预测值（PV）
又称诊断价值，表示试验结果的实际临床价值。是指已知试验结果（阳性或阴性）的条件下，表明有无疾病的概率，即说明试验结果为阳性（或阴性）时，有多少概率有病（或无病）。影响因素：疾病的患病率；灵敏度和特异度
约登指数 =(灵敏度+特异度)-1=0.81 阳性似然比=（215÷230）/（16 ÷130）=7.6 阴性似然比=（15 ÷230）/（114 ÷130）=0.074
32
评价指标的相互关系
理想的诊断试验，其灵敏度、特异度均应接近100%。但在实际工作中很难达到，往往表现为灵敏度↑↓则特异度↓↑。两者高低的转换与确定诊断试验阳性结果的截断值(cut off point)或临界点的选择密切相关。
29
（1）阳性似然比：
诊断试验中，真阳性在‘有病’患者中的比例与假阳性在‘无病’ 例数中比例的比值。真阳性率/假阳性率说明诊断试验正确判断阳性的可能性是错误判断阳性可能性的倍数。 +LR=[a/(a+c)/b/(b+d)]=灵敏度/(1-特异度)
（2）阴性似然比
诊断试验中，假阴性在‘有病’例数中的比例与真阴性在‘无病’ 例数中比例的比值。假阴性率/真阴性率 -LR=[c/(a+c)/d/(b+d)]=(1-灵敏度)/特异度

诊断试验的评价(第七版)

影响因素
方法的差异被观察者的个体生物学变异观察者的变异
第二节筛检和诊断试验的评价
收益：是指经诊断试验可使多少原来未发现的病人
得到正确诊断和早期治疗，改善其预后，以及其创造的经济价值和社会价值如何。

评价指标预测值(predictive value) 成本效益分析（cost-effect analysis)
灵敏度=a/(a+c)=85/100=85% 特异度=d/(b+d)=160/200=80% 阳性是然00 － 40 160 200
合计 125 175 300
假阴性率=c/(a+c)=15/100=15% 假阳性率=b/(b+d)=40/200=20% 阴性似然比=15％/80％＝0.19

灵敏度患病率阳性预测值灵敏度患病率 (1 患病率)(1 特异度)
特异度 (1 患病率) 阴性预测值特异度 (1 患病率) (1 灵敏度) 患病率
◈阳性预测值（positive predictive value）：是指筛检试验阳性者患目标疾病的可能性
a 阳性预测值 100% ab ◈阴性预测值（negative predictive value）：
是指筛检试验阴性者不患目标疾病的可能性
d 阴性预测值 100% cd
患病率与预测值关系
表A1 在患病率高的男病人组中运动后心电图与冠状动脉造影的比较冠状动脉造影显示≥75％狭窄运动后心电图异常＋－合计＋ 55（α） 49（c） 104 － 7（b） 84（d） 91 合计 62 133 195
第二节筛检和诊断试验的评价
收益

预测值(predictive value)

复习重点、试题-人卫第七版-流行病学期末复习重点(超全)_2

流行病学1.流行病学的定义：流行病学是研究人群中疾病与健康状况的分布及其影响因素，借以制定和评价预防、控制和消灭疾病及促进健康的策略和措施的科学。

2.现代定义及其认识：①三个层次：疾病、伤残、健康②三个阶段：揭示现象、找出原因、提供措施③三个范畴：描述、分析、实验④三种方法：观察法、实验法、数理法⑤三大要素：原理、方法、应用3. 流行病学的重要观点：①群体的观点（基本）；②比较的观点（核心）；③概率论的观点（特点）。

4.流行病学的研究方法：观察法、实验法、数理法。

5.流行病学的用途：<1>研究人群健康，疾病消长以及疾病特征变化的规律。

<2>对社区和人群健康做出诊断。

<3>用于卫生决策和评价。

<4>揭示疾病完整的自然史。

<5>利用流行病学方法探讨原因不明的疾病的病因。

<6>疾病预防<7>疾病诊断、治疗与预防方法或措施的效果评价。

4.疾病的三间分布：以疾病频率为测量指标，来描述与分析疾病在不同地区、不同时间和不同人群的分布现象（发病率、患病率、死亡率等），简称“三间分布”第二、三章疾病的分布和描述性研究1、发病指标⑴发病率：是指一定地区、一定时期内，一定人群中某病新病例出现的频率。

发病率=一定时期内某人群中发生某病的新病例数/同期暴露人口数×k k =100%,1000‰……⑵罹患率：罹患率与发病率同样是测量新发病例的频率指标。

罹患率＝观察期间某病新病例数/同期暴露人口数×kk =100%或1000‰罹患率：一般多用于衡量小范围、短时间的发病率、观察的时间是以月、周、日或一个流行期为时间单位。

⑶患病率：亦称现患率或流行率，是指在特定时间内，一定人群中某病新旧病例所占的比例。

患病率＝特定时间内某人群中某病新旧病例数/同期观察人口数×k2、患病率与发病率的区别：①患病率的分子为特定时间内所调查人群中某病新旧病例的总和，而发病率的分子则为一定时期内暴露人群中某病的新发病例数；②患病率是由横断面调查获得的疾病频率，是衡量疾病的存在或流行情况的静态指标，而发病率是由发病报告或对例研究获得的疾病频率，是衡量疾病发生情况的动态指标。

第七章诊断试验的评价

滨州医学院流行病学教研室
诊断试验的目的:
是把病人与可疑有病、但实际无病的人区别开来，以便对确诊
的病人给予相应的治疗。
滨州医学院流行病学教研室
为什么要评价诊断试验
新的诊断试验方法不断被提出现有诊断方法缺陷需要新的方法对诊断结果的解释（指导临床实践）
阳性结果阴性结果是否受患病率的影响
即实际有病而按该诊断试验被正确地判为病的百分比。反映诊断试验发现病人的能力。
灵敏度 A 100% AC
滨州医学院流行病学教研室
假阴性率 (false negative rate) (漏诊率) 即实际有病而被该诊断试验错误地判段为无病的百分比。反映的是诊断试验漏诊病人的情况。
假阴性率 C 100% AC
滨州医学院流行病学教研室
第二节诊断试验的评价
滨州医学院流行病学教研室
诊断实验的评价主要包括：
真实性（validity）可靠性 (reliability) 实用性
滨州医学院流行病学教研室
金标准
特定人群
病人
待评价诊断方法
非病人
阳性阴性阳性阴性
图2 筛检/诊断试验的评价程序
整理评价结果
表1 诊断试验评价整理表
诊断试验阳性
阴性
合计
金标准
有病
无病
真阳性假阳性
a
b
假阴性真阴性
c
d
a+c
b+d
合计 a+b
c+d
N
滨州医学院流行病学教研室
1、真实性（validity）
诊断试验所获得的测量值与实际值相符合的程度,亦称效度，又称准确性。

诊断试验方法的评价

性)+真阴性/(假阴性+真阴性)] ×100% = 1/4[205/(205+29)+37/(31+37)+205/(205+31)+37/(29+37)] ×100% = 1/4[205/234+37/68+205/236+37/68 ] ×100% = 71.24 %
③ Kappa值= ( P0－Pc)/(1－Pc) P0= (a+d）/ (a+b+c+d) =（205+37）/302 = 0.8013 Pc=｛[ (a+b) (a+c)/ (a+b+c+d)]+[ (c+d) (b+d)/ (a+b+c+d)]｝/ (a+b+c+d) = [(236×234)/302+(66×68)/302]/302 = (55224+4488)/91204 = 0.6547 Kappa = (0.8013－0.6547)/(1－0.6547)= 0.1466/0.3453 = 0.4246 由于 0.40 ＜Kappa＜ 0.74，表示两种试验的一致性程度为一般，因此，甲胎蛋白检测作
诊断试验方法(fāngfǎ)的评价
2021/11/11
第一页，共28页。
用于临床疾病诊断的试验方法很多，而且随着科学技术的发展，特别 (tèbié)是医学、分子生物学、电子计算机技术的发展，越来越多的新诊断试验方法被应用于临床。
第二页，共28页。
评价(píngjià)一种新的诊断试验方法的基本程序是与诊断某病的金标准作盲法和同步比较
倍数，表明诊断试验结果呈阴性时患病与不患病的比例，其比值越小，试验的诊断价值越高。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一节概述 ❖定义
诊断试验（diagnostic test)是指应用各种实验、医疗仪器等手段对病人进行检查，以确定或排除疾病的试验方法。
诊断试验评价的意义
1.对诊断试验的应用价值进行科学评价 2.为临床医生合理选用诊断试验并正确解释其结果提供科学依据。
诊断试验评价的意义
夸大所考核诊断试验的敏感度和特异度，使其最初被寄予较大希望，而经过多年临床实践后被冷落。
第二节诊断试验的评价
1.建立标准诊断方法金标准：指目前医学界公认诊断某种疾病最准确的诊断方法。
2.选择研究对象：应能代表该方法可能应用的靶人群。 ➢ 病例组应包括所研究疾病的各种临床类型，以使病例组对该
病患者总体具有代表性。 ➢ 非病例组应选择确定无该病的其他病例或健康人，尤其应包
括易与该病混淆的其他病例，以考察该方法的鉴别能力。 3.样本含量的估计 4.评价
评价程序
金标准试验对象
盲法检测
病人待评价筛检或诊断试验
非病人
真阳阳性性假阴阴性性
假阳阳性性真阴阴性性
待评价诊断试验
阳性阴性
合计
金标准
病人非病人
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
a+c
b+d
合计
a+b c+d N
评价
第二节筛检和诊断试验的评价
❖ 评价内容
1. 真实性（validity) 2. 可靠性（reliability) 3. 收益
❖ 灵敏度越高，阴性预测值越高 ❖ 特异度越高，阳性预测值越高 ❖ 与受检人群目标疾病患病率（P）密切相关
阳性预测值
灵敏度患病率灵敏度患病率 (1 患病率)(1 特异度)
阴性预测值
特异度 (1 患病率) 特异度 (1 患病率) (1 灵敏度) 患病率
◈阳性预测值（positive predictive value）：是指筛检试验阳性者患目标疾病的可能性
＋
55（α）
7（b）
62
－
49（c）
84（d）
133
合计
104
91
195
灵敏度=α/(α＋c)=55/104=53％假阴性率=c/（α＋c）=49/104=47％特异度=d/（b＋d）=84/91=92％假阳性率=b/（b＋d）=7/91=8％患病率=（α＋c）/（α＋b＋c＋d）=104/195=53％阳性预测值=α/（α＋b）=55/62=89％阴性预测值=d/（c＋d）=84/133=63％
第二节筛检和诊断试验的评价
收益 ➢ 预测值(predictive value)
又称预告值、诊断价值。是试验结果表明有无疾病的概率。
一个诊断方法有其一定的特异度、灵敏度，但是当应用它筛检或诊断患病率不同的人群时，阳性（或阴性）结果所表示的意义却不同。
✓ 预测值的影响因素：灵敏度和特异度患病率
如：癌胚抗原（CEA）诊断结肠癌价值的报告。最初报道测定36例晚期结、直肠癌病人CEA中35例（97.2％）升高，对照组是未患结肠癌的其他病人，结果他们多数 CEA水平较低。
研究者根据此结果认为：CEA是筛选结肠癌的有效试验。以后经多家观察将试验对象用于包括早期结肠癌及其他胃肠道疾病对象时，发现最初报道的CEA检查结果不正确，不能将早期结肠癌与其他胃肠病人鉴别开来，因此，CEA的诊断价值明显降低。
第二节诊断试验的评价
待评价诊
金标准
断试验有病
无病
阳性 a真阳性 b假阳性
阴性 c假阴性 d真阴性
合计
a+c
b+d
❖评价指标
真实性（validity)：又称有效性，是指诊断试验所获得
的测量值与实际值的符合程度。
灵敏度＝
真阳性人数金标准诊断病人数
＝
a
a
c
100%
漏诊率＝
假阴性人数金标准诊断病人数
＝
a
c
c
100%
特异度＝
真阴性人数金标准诊断非病人数
＝
b
d
d
100%
误诊率＝
假阳性人数
金标准诊断非病人数
＝ b
b
d
100%
➢ 似然比（likelihood ratio, LR) 病人中出现某种试验结果的概率与非病人中出现相应结果的概率
之比，说明病人出现该结果的机会是非病人的多少倍。
阳性似然比
阳性预测值 a 100%
◈阴性预测值（negative parebdictive value）：是指筛检试验阴性者不患目标疾病的可能性
阴性预测值 d 100% cd
患病率与预测值关系
表A1 在患病率高的男病人组中运动后心电图与冠状动脉造影的比较
运动后心电图异常
冠状动脉造影显示≥75％狭窄
＋
－
合计
表 ELISA法与微量中和试验检查COXB病毒感染的比较
ELISA法
＋－合计
微量中和试验
＋
－
85
40
15
160
100
200
合计
125 175 300
灵敏度=a/(a+c)=85/100=85%
假阴性率=c/(aꢘ/200=80%
假阳性率=b/(b+d)=40/200=20%
阳性是然比=85％/20％＝4.25
阴性似然比=15％/80％＝0.19
正确诊断指数=100％－（20％＋15％）＝0.65
第二节诊断试验的评价
可靠性（reliability)：又称可重复性，是指诊断试验在同
样条件下，进行重复操作获得相同试验结果的稳定程度。
❖ 评价指标
➢
计量资料：变异系数（CV)
真阳性率假阳性率
灵敏度误诊率
a/a b/b
c d
100%
阴性似然比
假阴性率真阴性率
漏诊率特异度
c/a d/b
c d
100%
➢正确诊断指数（Youden’s index)
r = 1-(假阳性率+假阴性率） = （灵敏度+特异度）-1
第二节诊断试验的评价
例：某临床医师用酶联免疫吸附试验法（ELISA)检查柯萨奇B组（COXB)病毒的感染情况，以微量中和试验作为标准诊断，检查结果见表，试对该法的真实性进行评价。
标准差均数 100%
➢ 计数资料：Kappa值、符合率
❖ 影响因素
➢ 方法的差异 ➢ 被观察者的个体生物学变异 ➢ 观察者的变异
第二节筛检和诊断试验的评价
收益：是指经诊断试验可使多少原来未发现的病人
得到正确诊断和早期治疗，改善其预后，以及其创造的经济价值和社会价值如何。
❖ 评价指标 ➢ 预测值(predictive value) ➢ 成本效益分析（cost-effect analysis)