诊断试验的评价

合集下载

常用诊断试验评价指标计算及意义

意义：当OR＞1时，说明病例组的暴露频率大于非病例组的，即暴露有较高的发病危险性；反之，当OR＜1时，说明病例组的暴露概率低于非病例组的，即暴露有保护作用。疾病与暴露联系愈密切，比值比的数值愈大。
似然比(likelihood ratio, LR) 是反映真实性的一种指标，属于同时反映灵敏度和特异度的复合指标。即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。该指标全面反映筛检试验的诊断价值，且非常稳定。似然比的计算只涉及到灵敏度与特异度，不受患病率的影响。
诊断试验的评价指标
诊断试验（diagnostic test）
诊断试验是把可疑有病但实际无病的人与真正的病人区分开来的过程。
一、筛检或诊断试验的真实性评价
金标准
特定人群
病人
非病人
待评价筛查方法
阳性阴性
阳性
阴性
评价指标
（一）真实性评价
• 测量值与真实值的符合程度。 • 灵敏度、特异度、漏诊率、误诊率、正确诊
阳性似然比即正确判断阳性的可能性是错判阳性可能性的倍数。此值愈大，此诊断方法愈好
阳性似然比=a（a+c）/b（b+d）
阴性似然比即错判断阴性的可能性是正确判断阴性的可能性的倍数。此值愈小，此诊断试验方法愈好。
阳性似然比=c（a+c）/d（b+d）
提高试验效率的办法
提高诊断质量的一些方法
• 1、选择合适而正确的指标 • 2、尽可能应用客观指标 • 3、测量标准化 • 4、联合试验（平行、系列、混合）
筛检试验或诊断试验的评价
筛检或诊按“金标准”诊断
断试验有病
无病
合计
阳性 a（真阳性） b（假阳性） a+b 阴性 c（假阴性） d（真阴性） c+d

诊断试验临床效能评价

诊断试验临床效能评价诊断试验的临床效能评价是医疗领域中一项重要的工作，它旨在评估诊断试验的准确性、灵敏性和特异性，从而帮助医生和临床决策者做出准确的诊断和决策。

本文将从准确性、灵敏性和特异性三个方面，分别介绍诊断试验的评价指标和评价方法。

一、准确性评价准确性是评价诊断试验表现的重要指标之一，它代表了试验结果与实际情况之间的一致程度。

常用的准确性指标有阳性预测值（PPV）、阴性预测值（NPV）、真阳性率（TPR）和真阴性率（TNR）。

其中，阳性预测值指的是在试验结果为阳性的情况下，实际患病的比例；阴性预测值则指的是在试验结果为阴性的情况下，实际未患病的比例。

真阳性率和真阴性率则是指试验结果与实际情况一致的比例。

评价诊断试验准确性的方法主要有对照组研究和交叉验证研究。

对照组研究常用于评价新诊断试验与已有试验或“金标准”之间的一致性，通过比较试验结果与“金标准”结果之间的差异，来评价试验的准确性。

交叉验证研究则是指在不同的样本集上进行验证，通过评估试验在不同样本集上的一致性来评价其准确性。

二、灵敏性评价灵敏性是评价诊断试验的另一个重要指标，它代表了试验对实际患者的检出能力。

简而言之，灵敏性越高，试验越能检测出真正的患者。

灵敏性的评价常用的指标是真正阳性率（TPR），也称为召回率或敏感性。

它表示试验对真正患者的检测比例。

评价诊断试验灵敏性的方法主要有“金标准”对照和受试者工作特征曲线（ROC曲线）分析。

在“金标准”对照中，将试验结果与“金标准”结果进行对比，来评价试验的灵敏性。

ROC曲线分析则常用于评价试验结果的连续性，通过绘制曲线来显示不同阈值下试验的灵敏性和特异性。

三、特异性评价特异性是评价诊断试验的又一个重要指标，它代表了试验对非患者的判断能力。

特异性越高，试验越能排除非患者。

特异性的评价常用的指标是真正阴性率（TNR），即试验对真正非患者的判断比例。

评价诊断试验特异性的方法主要有独立样本验证和交叉验证。

诊断试验的临床效能评价

该法与荟萃分析（ Meta）分析方法的原
理相同，故又称诊断性试验的荟萃分析。
目的是对多个同类独立研究的结果进行汇总和合并分析，以达到增大样本含量，提高实验效能的目的。
六、临床应用评价指标的综合分析
灵敏度、特异度是试验方法固有的指标，其它评价指标都可用它们来推导。
预测值在指导临床诊断时比灵敏度、特异度更直观、更容易理解和应用，但它们与患病率或就诊率有关。
六、临床应用评价指标的综合分析
准确性、尤登指数及诊断效率是综合灵敏度、特异度而计算出来的。
似然比表达在某种诊断性试验某个数值范围内患有或不患有某种疾病的概率。它是将灵敏度及特异度较好结合起来的指标。
ROC分析方法是目前公认的诊断试验准确度评价的标准方法。
第四节提高诊断试验效率的方法
09:28:09
齐齐哈尔医学院生化教研室
23
3.漏诊率和误诊率
与灵敏度和特异度互补的指标是漏诊率和误诊率
漏诊率（β），又称假阴性率（False negative rate，FNR）。反映将患者诊断错误的概率，该值愈小愈好。
误诊率（α），又称假阳性率（False positive rate，FPR）。反映将非患者诊断错误的概率，该值愈小愈好。漏诊率（β）＝c/a＋c ＝1－Sen（灵敏度）误诊率（α）＝b/b＋d ＝1－Spe（特异度）
④普查或定期健康体检，能筛选某一疾病, 以防漏诊
09:28:09
齐齐哈尔医学院生化教研室
21
2.特异度（specificity,Spe）又称真
阴性率（true negative rate, TNR）
指在非某病者中，应用该试验获得阴性结果的百分比特异度愈高，误诊病例（误诊率）愈少，其计算公式为：

诊断试验的评价

２、串联试验（serial testing）一种依次的试验，是否作下一个试验要根据上一个试验结果来决定。串联试验特异度、阳性预测值增大，减少误诊率，灵敏度和阴性预测值降低，增加漏诊率☆。在临床工作中，当不必迅速作出诊断时或误诊能造成严重后果时，应用此试验。
3、并联试验和串联试验混合进行
联合试验筛检糖尿病的结果
五、提高诊断试验效率的方法
（一）选患病率高的人群应用诊断试验
主观高-转诊、客观高-高危地区
（二）采用联合实验
1、平行（并联）实验：
①定义：同时做几个实验，只要有一个阳性即可认为有病
② 效应：提高灵敏度和阴性预测值
适应：A 急需作出诊断的
B 漏诊减少，误诊增加
2、系列（串联）实验：
① 定义：依次相继实验，皆阳性的才为阳性
（2 ） *特异度（specificity）：又称真阴性率。
特异度 d 100% bd
特异度反映一项试验能将实际上未患某病的人正确地判定为未患某病的能力。其值越大，则
误诊的可能性愈小。假阳性互补
（3） *假阳性率（false positive）：又称误诊率假阳性率 b 100% 1 特异度
6 可靠性评价指标（可重复性）
（1）定义：可重复性是指诊断实验在完全相同条件下，进行重复操作获得相同结果的稳定程度。
（2）测量变异： A 观察者间变异 B 观察者自身变异 C 测量仪器，试剂 D 研究对象生物学变异
（3）评价指标
A 计量资料；用标准差、变异系数； B 记数资料：用观察符合率和卡帕（Kappa）值表示（4）Kappa值定理：是判断不同观察者间，校正机遇
② 效应：提高特异度和阳性预测值
③ 适应：A 要增加疾病正确性癌

诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法，用于确定患者是否患有某种疾病。

然而，单纯通过试验结果判断是否患病往往并不准确。

因此，我们需要评价诊断试验的准确性，并使用ROC分析来量化其性能。

1. 诊断试验的评价指标为了评估诊断试验的性能，我们需要引入以下四个指标：敏感度、特异度、阳性预测值和阴性预测值。

敏感度（Sensitivity）是指在真正患病的人中，试验能正确诊断出疾病的比例。

敏感度越高，表示试验具有较好的疾病检测能力。

特异度（Specificity）是指在真正健康的人中，试验能正确排除疾病的比例。

特异度越高，表示试验具有较好的非患病排除能力。

阳性预测值（Positive Predictive Value）是指在试验为阳性的情况下，患者真正患病的概率。

阳性预测值越高，表示试验结果与患病状态的相关性越高。

阴性预测值（Negative Predictive Value）是指在试验为阴性的情况下，患者真正健康的概率。

阴性预测值越高，表示试验结果与健康状态的相关性越高。

2. ROC曲线和AUC值为了综合评价诊断试验的准确性，我们引入了ROC曲线（Receiver Operating Characteristic Curve）和AUC值（Area Under Curve）。

ROC曲线是以敏感度为纵轴，以1-特异度为横轴绘制的曲线。

曲线上每一个点表示了在不同阈值下的敏感度和特异度。

ROC曲线越靠近左上角，表示试验性能越好。

AUC值是ROC曲线下面积的数值，范围在0.5到1之间。

AUC值越接近1，表示试验具有较高的准确性。

3. 如何进行ROC分析进行ROC分析通常需要以下步骤：（1）收集样本数据：包括疾病阳性和阴性样本，以及其相应的试验结果。

（2）计算敏感度和特异度：根据试验结果计算敏感度和特异度，并绘制ROC曲线。

（3）计算AUC值：根据ROC曲线计算AUC值。

（4）选择最佳阈值：根据需求和实际情况，选择最佳的阈值以平衡敏感度和特异度。

诊断性试验的评价标准

诊断性试验的评价标准诊断性试验是评估一种诊断测试的准确性和可靠性的重要手段。

在临床实践中，正确的诊断结果对于患者的治疗和预后具有重要的指导意义。

因此，对于诊断性试验的评价标准具有至关重要的意义。

本文将从准确性、可靠性、灵敏度和特异性等方面对诊断性试验的评价标准进行探讨。

首先，准确性是评价诊断性试验的重要指标之一。

准确性包括阳性预测值和阴性预测值。

阳性预测值是指在所有被试验对象中，真正患病者被诊断为患病的比例，而阴性预测值是指在所有被试验对象中，真正非患病者被诊断为非患病的比例。

准确性高意味着诊断性试验能够准确地识别出患病者和非患病者，对于临床诊断具有重要的指导意义。

其次，可靠性是评价诊断性试验的另一个重要指标。

可靠性包括重复性和稳定性。

重复性是指在相同条件下，同一检测者对同一被试验对象进行多次测试，结果之间的一致性程度。

稳定性是指在不同条件下，不同检测者对同一被试验对象进行测试，结果之间的一致性程度。

可靠性高意味着诊断性试验具有较好的重复性和稳定性，能够提供可靠的诊断结果。

此外，灵敏度和特异性也是评价诊断性试验的重要指标之一。

灵敏度是指在所有真正患病者中，被试验对象被诊断为患病的比例。

特异性是指在所有真正非患病者中，被试验对象被诊断为非患病的比例。

灵敏度高意味着诊断性试验能够准确地识别出患病者，而特异性高意味着诊断性试验能够准确地识别出非患病者。

灵敏度和特异性是相互矛盾的指标，提高灵敏度可能会降低特异性，反之亦然。

因此，在实际应用中需要根据具体情况进行权衡。

综上所述，诊断性试验的评价标准包括准确性、可靠性、灵敏度和特异性等方面。

在进行诊断性试验时，需要综合考虑这些指标，选择合适的评价方法，以确保诊断性试验能够提供准确可靠的诊断结果，为临床诊断和治疗提供科学依据。

诊断试验的临床效能评价

该文以免疫荧光技术为金标准，评价PCR技术检测患者宫颈管细胞碎片中沙眼衣原体的敏感性。试验对象为妇产科门诊就诊、患有不同程度的宫颈感染或不孕症患者共77例。结果：免疫荧光技术阳性7例，且这7例阳性标本的PCR检测结果亦为阳性，据此认为 PCR方法敏感性为100％。
背景诊断衣原体的“金标准” 是从细胞培养中分离衣原体。免疫荧光技术为新方法，特异性好，但敏感性较细胞培养技术差
指在诊断试验前被检者可能患病的概率，同患病率／就诊率／拟诊率
2. 验后概率(posterior probability)
是拟得到的某一事件发生的概率，可通过验前概率修正的阳性预测值求得
验后概率=
验前概率×灵敏度
验前概率×灵敏度+（1－验前概率）×（1－特异度
）
思考题1：
某社区的人口为5万人，现拟用血糖试验来筛检糖尿病。不同的筛检标准及其准确性见下表：
算方法，分别计算“病例组”样本含量
n1及“对照组”样本含量n2 。
n1=
Zα2 Sen(1－Sen)
△2
n2=
Zβ2 Spe(1－Spe)
△2
四、数字的提取和数字化
➢临床效能评价最好利用工作中既往测量结果
➢为方便统计软件的使用，各种资料必有数字化
五、诊断分界点
理想的诊断试验正常群体与患者群体分布曲线
4.46%
阴性预测值
99.77%
40881
50000
1.0% 180mg/dl 阳性
250
99
349 71.63% 99.50%
Sen 50.0 阴性
250
49401 49651
Spe 99.8 合计
500

诊断试验方法的评价基本程序与指标

倍数，表明诊疗试验结果呈阳性时患病与不患病百分比，其比值越大，试验诊疗价值越高。
② 阴性似然比(－LR)=假阴性率/真阴性率=漏诊率/特异度阴性似然比指错判阴性可能性是正确判断阴性可能性
倍数，表明诊疗试验结果呈阴性时患病与不患病百分比，其比值越小，试验诊疗价值越高。
诊断试验方法的评价基本程序与指标
Youden指数（YI）越大，试验真实性越高。
诊断试验方法的评价基本程序与指标
第20页
举例：见教材 P243
302例高度疑为肝癌病人肝穿刺活检（金标准），病理汇报明确诊疗为肝癌234例，非肝癌68例。对上述病人行血中甲胎蛋白检测，结果为，阳性236例（其中肝癌者205例），阴性66例（其中肝癌者29例），试评价甲胎蛋白检测作为诊疗肝癌价值。
错误结果：① 真正有病人试验结果阴性（假阴性 c） ② 真正无病人试验结果阳性（假阳性 b）
诊断试验方法的评价基本程序与指标
第15页
一项试验方法得出正确结果越多，则该试验真实性越高。评价试验方法真实性包含两个方面，即对有病和无病识别能力。主要评价指标以下：
⒈ 灵敏度（sensitivity） ⒉ 特异度（specificity） ⒊ 似然比（likelihood ratio, LR） ⒋ Youden指数（Youden’s Index, YI）
诊断试验方法的评价基本程序与指标
第3页
第一节评价基本程序（步骤）
确立金标准选择研究对象样本大小预计同时评价依据试验检验结果评价诊疗价值
诊断试验方法的评价基本程序与指标
第4页
一、确立金标准
要评价一个新诊疗试验方法，首先要确定一个参考标准即金标准（gold standard）。
诊断试验方法的评价基本程序与指标

诊断性试验的评价指标

诊断试验的评价指标
真实性：敏感度（Sen）、特异度（Spe）、误诊率、
阳性预测值、阴性预测值、假阴性率、假阳性率、似然比、符合率、准确度。可靠性：
方法的差异、个体差异、观察者变异收益：
预测值、成本效益分析
诊断试验评价的指标
真实性（validity）测量值与实际值相符合的程度,亦称效度，又称准确性
_ a b
准确度＝
abcd
4.似然比(likelihood ratio, LR)
★是同时反映灵敏度和特异度的复合指标
★似然比俞大、诊断价值也俞大
◈阳性似然比：
诊断试验结果的真阳性率与假阳性率之比
真阳性率灵敏度 LR 假阳性率 1 特异度
◈阴性似然比
诊断试验结果的假阴性率与真阴性率之比
LR
假阴性率真阴性率
1
灵敏度特异度
预测值
◈阳性预测值（positive
predictive value）：是指筛检试
验阳性者患目标疾病的可能性，即
用金标准诊断为“无病”者所占的
比例。阳性预测值
A 100%
A B
◈阴性预测值（negative
predictive value）：是指筛检试
特异度 D 100% BD
假阳性率
◈假阳性率(false positive rate)(误诊率、第一类错误)
即实际无病，但根据该诊断标准被定为有病的百分率
假阳性率
B
B D
100%
3.准确度（AC）
也称符合率（agreement reat）,真阳性和真阴性者在总检查例数中的比例。反应了真确诊断患者与排除病人的能力。
病的百分率

诊断试验评价指标

· 阳性预测值(positive predictive value,+P 假如诊断试验结果是阳性病人真正有病的可能性。
· 计算公式：+PV＝a / ( a +b ) · 反映诊断指标阳性时患者患某病的概率。
•2021/1/12
•5
诊断试验的综合评价指标
· 阴性预测值(negative predictive value,－P 假如试验结果是阴性，病人真正无病的概
•13
Thank You
†世界触手可及
ห้องสมุดไป่ตู้
率
· 计算公式：－PV＝d / (c +d )
· 反映诊断结果阴性时受试者不会患某病的
概率
•2021/1/12
•6
诊断试验的综合评价指标
· 总符合率〔〕 · 计算公式： =(a+d)/(a+b+c+d) · 表示观察值与标准值或真实值符合的程
度
•2021/1/12
•7
诊断试验的综合评价指标
· 阳性似然比(positive likelihood ratio，PLR 指真阳性率与假阳性率之比，说明病人中出现某种检验结果阳性的概率是非病人的多少倍，即一项试验按某已定标准判断某病人结果为阳性
诊断试验评价指标
诊断试验的评价指标
· 根本指标
· 灵敏度、特异度
· 预测值
· 阳性预测值、阴性预测值
· 综合评价指标
· 总符合率、阳性似然比、阴性似然比
· 差异性检验
· 配对卡方检验、Kappa系数
•2021/1/12
•2
诊断试验评价的根本指标
·灵敏度〔Sensitivity，Se〕是试验发现有病的人的才能，即实际诊断为有病的病例中，诊断试验结果为阳性例数的比例。 ·计算公式：Se =a/(a+c) ·又称真阳性率 ·将实际有病的人正确判断为患者的才能

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

11
试验方法的评价
包括两方面：一、真实性（validity）
真实性是指测量值与实际值的符合程度。二、可靠性（reliability）
也称重复性（repeatability），指一项试验在相同的条件重复试验获得相同结果的稳定程度。
12
试验方法评价的结果
被评价试验结果
阳性阴性合计
金标准
有病
灵敏度(Se )
真阳性真阳性假阴性 100%
a ac
1 0 0%
灵敏度表示试验方法对疾病的检出能力。灵敏度越高，说明试验方法对疾病检出能力越强，病人漏诊机会越少性真阳性假阴性
a
c
c
100%
20
2、特异度（specificity，Sp )
➢ 要评价一个试验方法，金标准的选择是非常重要的。一项诊断试验的准确程度只有在金标准诊断的病人组和非病人组中进行考核，才能得到正确地评价。
9
研究对象
➢ 在诊断试验方法评价中，研究对象包括两组，一是被金标准确诊的病例组，另一组是金标准证实无该病的人群，即对照组。
➢ 所有的研究对象都要有代表性，病例组和对照组都应代表各自的总体。
诊断指标
• 主观指标 • 半客观（或半主观）指标 • 客观指标
1
一、诊断试验研究与评价的理论依据就大多数诊断指标而言，在正常人中符合正
态分布，在病人中也符合正态分布，但病人和正常人之间有部分重叠。
如图19-1所示，A、B之间既有病人又有正常人，A为病人的最低值，B为正常人的最高值。如果我们把诊断标准定在A上，则有一部分正常人被判为病人如果把诊断标准定在B上，则有一部分病人被判作正常人;如果诊断标准定在C上则既有病人被判作正常人，又有正常人被判作病人。
N
1 pc
15
Kappa值的解释
Kappa值在-1～1之间。 Kappa<0说明由机遇因素所致一致率>观察一致性； Kappa= -1说明两个结果完全不一致； Kappa=0表示观察一致率完全由机遇所致； Kappa>0说明观察一致性大于因机遇所致的一致程度； Kappa=1说明两个结果完全一致； Kappa值越高表示一致性程度越好。一般认为，Kappa值在 0.75～1之间为一致性高；0.4～0.74 为一般；小于0.39以下为一致性差。
无病
A (真阳性) B (假阳性)
C (假阴性) D (真阴性)
A+C
B+D
合计
A+B C+D
N
13
可靠性的评价
➢ 变异系数
CV 标准差/算术均数
➢ 符合率或一致性
符合率
真阳性真阴性受试总人数
a
a b
d c
d
100 %
➢ 调整一致性
调整符合率 1 a d a d 100 % 4ac bd ab cd
16
甲、乙二医生阅读胸部X线片诊断结果
甲医生诊断
乙医生诊断
合计
肺门淋巴结结核正常
肺门淋巴结结核正常合计
46（α） 12（c） 58（c1）
10（b） 56（r1） 32（d） 44（r2） 42（c2） 100（Ｎ）
观察一致率= （46＋32）/100＝78％机遇一致率＝[（58×56）/100＋（42×44）/100]/100=51% Kappa=(78%-51%)/(1-51%)=0.55
8
金标准（gold standard）
➢ 金标准是指一种疾病标准诊断方法，是当前医学界公认的、诊断某病的可靠的诊断方法，应用该标准能较正确区分某种疾病的人和不具有该病的人。
➢ 常见的金标准有：病理学检查（组织活检和尸体解剖）诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断如冠状动脉造影诊断冠心病。
17
影响试验可靠性的因素
1．实验方法本身或仪器的差异 2．调查对象的生物学变异 3．观察者的测量变异
18
试验方法真实性的评价
包括两个方面： 1、对有病的识别能力 2、对无病的识别能力
19
真实性评价指标
1、灵敏度（sensitivity, Se)
在真正有病的人中，试验结果阳性的百分率，即真阳性率。
这就是临床上的漏诊和误诊问题。
2
3
例如，以舒张压为诊断指标在病人与正常人群中检查。如果将诊断标准定为90mmHg l2kPa)，则有部分本是正常人，但按此标准被判为高血压病人。亦有部分本是高血压患者但按诊断标准被判为正常人。即有些人舒张压虽未超过 90mmHg(l2kPa)，但是高血压患者。降低诊断标准，使正常人被判为高血压的比例增加;提高诊断标准，使病人被判为正常人的比例增加。
这种分布上的重叠是由于机体的个体差异所造成的。由于重叠使得临床疾病的诊断较为复杂。也由于分布的重叠，使得对诊断试验的研究和诊断标准的把握成为临床工作之必需。
4
5
6
正常人与病人间分布上的重叠是研究诊断试验的理论依据。对诊断试验研究的目的在于正确地认识重叠，制定合理的诊断标准，正确区分正常与异常，做出疾病的准确诊断。
对一种诊断试验的研究与评价包括三方面内容:确定医学参考值范围（正常值范围）; 对诊断试验进行评价；确定诊断标准。
7
试验方法评价的方法
被评价的方法与与标准方法作同步、盲法试验。一、确定金标准二、选择研究对象：病人和非病人三、样本大小四、同步试验、盲法(double blind)观察五、根据试验检查的结果，评价其诊断价值
样本大小
N U2P(1 P)
2
p为试验的预期特异性或灵敏度，为容许误差，为第一类误差的概率，U值由U界值表可查得。
10
3 ·同步测试对确定的每个受试对象，用金标准和被评价的诊断试验同时进行测试。
可以理解，将受试对象用金标准诊断分为病人与非病人，而用待评价的诊断试验测试，在真正病人中有的将被判为病人 (阳性)，有的将被判为非病人 (阴性)，即将其分为两部分。在真正非病人中待评价的诊断试验也将其判为两部分，病人 (阳性)与非病人 (阴性) 。
14
Kappa值
表示两种试验的结果的一致性的程度
被评价试验结果
阳性阴性合计
金标准
有病
无病
A (真阳性)
C (假阴性) A+C
B (假阳性)
D (真阴性) B+D
合计
观察一致率：p0
ad n
A+B
机遇一致率：
pc
[(a b)(a c) n
(c d)(b d)] n
n
C+D Kappa p0 pc