诊断性试验设计与评价
诊断试验临床效能评价

诊断试验临床效能评价诊断试验的临床效能评价是医疗领域中一项重要的工作,它旨在评估诊断试验的准确性、灵敏性和特异性,从而帮助医生和临床决策者做出准确的诊断和决策。
本文将从准确性、灵敏性和特异性三个方面,分别介绍诊断试验的评价指标和评价方法。
一、准确性评价准确性是评价诊断试验表现的重要指标之一,它代表了试验结果与实际情况之间的一致程度。
常用的准确性指标有阳性预测值(PPV)、阴性预测值(NPV)、真阳性率(TPR)和真阴性率(TNR)。
其中,阳性预测值指的是在试验结果为阳性的情况下,实际患病的比例;阴性预测值则指的是在试验结果为阴性的情况下,实际未患病的比例。
真阳性率和真阴性率则是指试验结果与实际情况一致的比例。
评价诊断试验准确性的方法主要有对照组研究和交叉验证研究。
对照组研究常用于评价新诊断试验与已有试验或“金标准”之间的一致性,通过比较试验结果与“金标准”结果之间的差异,来评价试验的准确性。
交叉验证研究则是指在不同的样本集上进行验证,通过评估试验在不同样本集上的一致性来评价其准确性。
二、灵敏性评价灵敏性是评价诊断试验的另一个重要指标,它代表了试验对实际患者的检出能力。
简而言之,灵敏性越高,试验越能检测出真正的患者。
灵敏性的评价常用的指标是真正阳性率(TPR),也称为召回率或敏感性。
它表示试验对真正患者的检测比例。
评价诊断试验灵敏性的方法主要有“金标准”对照和受试者工作特征曲线(ROC曲线)分析。
在“金标准”对照中,将试验结果与“金标准”结果进行对比,来评价试验的灵敏性。
ROC曲线分析则常用于评价试验结果的连续性,通过绘制曲线来显示不同阈值下试验的灵敏性和特异性。
三、特异性评价特异性是评价诊断试验的又一个重要指标,它代表了试验对非患者的判断能力。
特异性越高,试验越能排除非患者。
特异性的评价常用的指标是真正阴性率(TNR),即试验对真正非患者的判断比例。
评价诊断试验特异性的方法主要有独立样本验证和交叉验证。
医学科研设计-医学诊断试验设计

01
阴性预测值(predictive value -):经本次试验为阴性结果的人群中,真正未患病的频率(概率)。阴性预测值的计算公式 Pv-=d/(c+d)
02
阳性预测值&阴性预测值
1
阳性似然比(likelihood ratio +,LR+):是指本次诊断是严重真阳性率与假阳性率之比。计算公式为LR+=[ a/(a+c)]/[ b/(b+d)]= Pa /Pb
敏感性和特异性
定义:反映诊断试验敏感性的指标,即金标准确诊有病,而本次试验检查结果也是阳性的频率,又称真阳性率。
公式为 Pa=a/(a+c)
敏感度反映本次试验能够正确识别本病的能力,敏感度与漏诊率的和为1(100%)。研究者应选敏感度高的诊断方法,避免漏诊。
敏感度(sensitivity,Pa)
特异度是反映诊断试验特异性的指标,即金标准确诊未患该病而本次试验检查结果为阴性的频率,又称真阴性率。
公式为 Pd=d/(c+d)
特异度反映本次试验能够正确鉴别未患本病的效能。特异度与误诊率之和为1(100%)。研究者应选用特异度高的指标,避免误诊。
特异度(specificity,Pd)
假阴性率(Pc):经金标准确诊为患有本病的患者而在本次试验中检查结果为阴性的频率,又称漏诊率。计算公式Pc=c/(a+c)=1- Pa
诊断试验研究的评价
诊断性实验是指临床医生用物理学、生物化学、血清免疫学、影像学的检查以及临床检查。
诊断试验研究是指采用金标准对诊断试验方法进行比较评价的研究。
壹
贰
诊断试验的意义
依据诊断某病的金标准作盲法和同步试验的比较。
诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法,用于确定患者是否患有某种疾病。
然而,单纯通过试验结果判断是否患病往往并不准确。
因此,我们需要评价诊断试验的准确性,并使用ROC分析来量化其性能。
1. 诊断试验的评价指标为了评估诊断试验的性能,我们需要引入以下四个指标:敏感度、特异度、阳性预测值和阴性预测值。
敏感度(Sensitivity)是指在真正患病的人中,试验能正确诊断出疾病的比例。
敏感度越高,表示试验具有较好的疾病检测能力。
特异度(Specificity)是指在真正健康的人中,试验能正确排除疾病的比例。
特异度越高,表示试验具有较好的非患病排除能力。
阳性预测值(Positive Predictive Value)是指在试验为阳性的情况下,患者真正患病的概率。
阳性预测值越高,表示试验结果与患病状态的相关性越高。
阴性预测值(Negative Predictive Value)是指在试验为阴性的情况下,患者真正健康的概率。
阴性预测值越高,表示试验结果与健康状态的相关性越高。
2. ROC曲线和AUC值为了综合评价诊断试验的准确性,我们引入了ROC曲线(Receiver Operating Characteristic Curve)和AUC值(Area Under Curve)。
ROC曲线是以敏感度为纵轴,以1-特异度为横轴绘制的曲线。
曲线上每一个点表示了在不同阈值下的敏感度和特异度。
ROC曲线越靠近左上角,表示试验性能越好。
AUC值是ROC曲线下面积的数值,范围在0.5到1之间。
AUC值越接近1,表示试验具有较高的准确性。
3. 如何进行ROC分析进行ROC分析通常需要以下步骤:(1)收集样本数据:包括疾病阳性和阴性样本,以及其相应的试验结果。
(2)计算敏感度和特异度:根据试验结果计算敏感度和特异度,并绘制ROC曲线。
(3)计算AUC值:根据ROC曲线计算AUC值。
(4)选择最佳阈值:根据需求和实际情况,选择最佳的阈值以平衡敏感度和特异度。
诊断试验的临床效能评价

背景 诊断衣原体的“金标准” 是从细胞培养中分离衣原体。 免疫荧光技术为新方法,特异性好,但敏感性较细胞培养技术差
指在诊断试验前被检者可能 患病的概率,同患病率/就诊率 /拟诊率
2. 验后概率(posterior probability)
是拟得到的某一事件发生的概率,可 通过验前概率修正的阳性预测值求得
验后概率=
验前概率×灵敏度
验前概率×灵敏度+(1-验前概率)×(1-特异度
)
思考题1:
某社区的人口为5万人,现拟用血糖试验 来筛检糖尿病。不同的筛检标准及其准确 性见下表:
算方法,分别计算“病例组”样本含量
n1及“对照组”样本含量n2 。
n1=
Zα2 Sen(1-Sen)
△2
n2=
Zβ2 Spe(1-Spe)
△2
四、数字的提取和数字化
➢临床效能评价最好利用工作中既往 测量结果
➢为方便统计软件的使用,各种资料 必有数字化
五、诊断分界点
理想的诊断试验 正常群体与患者 群体分布曲线
4.46%
阴性 预测值
99.77%
40881
50000
1.0% 180mg/dl 阳性
250
99
349 71.63% 99.50%
Sen 50.0 阴性
250
49401 49651
Spe 99.8 合计
500
诊断实验的研究与评价

3)再检验其血清肌酸磷酸酶(CPK)>80单位,此时阳性似然比为7.75。
其验前比=0.9167/(1-0.9167)=11.0048;验后比=11.0048×7.75=85.25。
• 验后概率=85.25/(1+85.25)=0.988 经过询问症状,心电图检查及血清CPK检查,该病人患冠心病的可能性为98.8%,因
•
粗一 致 a率 d 10 % 0 abcd
调整 1 一 a 致 a率 dd 4 a ba cc db d
4.似然比(likelihood ratio LR)
综合了灵敏度和特异度的信息,其含义为:病人 中出现某种检测结果的概率与非病人中出现相应结 果的概率之比,它表明某项试验所确定的阳性界值 (截点)能否良好地区分真阳性和假阳性。根据似 然比可以判断诊断试验阳性或阴性时患病的概率, 以助临床医生的诊断决策。
•
误诊率B 10% 0 BD
正确诊断指数(Youden指数)
一项诊断方法发现真正的病人和非病人的总能力。
约登指A 数=(灵D敏度+ 特异度 )-1
或 约登A+指C数 = B+D +
-1
将灵敏度和特异度合并为一个指标,可更全面地评价、
比较各种筛检试验的真实性。 指数愈大,反映的真实性也愈大。
约登指数的标准误为
ROC Curve
1.00
.75
Se ns it iv ity
.50
.25
0.00
0.00
.25
.50
.75
1.00
1 - Specificity
图2--ROC曲线图
第四节 诊断试验的评价
用某些指标对诊断试验的真实性、 可靠性以及效益进行评价。
第12章 诊断性试验

Sp= d/(b+d)
15
一、评价诊断试验真实性的指标
3. 误诊率(misdiagnosis rate)
亦称假阳性率(α),理想的α=0。
表12-2 CPK对急性心肌梗死的诊断价值
CPK(IU/L) 心肌梗死 无心肌梗死 合 计
阳性(≥80)
215
16
231
阴性(<80)
15
114
129
合计
230
130
360
一、评价诊断试验真实性的指标
5.准确度(accuracy,Ac):符合率,粗一致性, 系诊断性试验检出的真阳性和真阴性例数之和占 总病例数的比例。
以CPK80IU作为阳性标准,其阳性似然比为7.6, 现在要预测采用该试验后患者急性心肌梗死的概率 (验后概率)为多少,较验前概率提高了多少。
33
二、评价诊断试验可靠性的指标
亦称重复性或精密度,是指某项诊断试验在完全相同情 况下重复进行时获得相同结果的稳定程度。
影响可靠性的因素
生物学变异
①不同观察者间的变异:表示不同观察者独立地检 查同一样本时所得结果不一致的程度。
PV(+) = a/(a+b) (2)阴性预测值(negative predictive value,PV(-)): 系指诊断性试验检出的全部阴性例数中,真正没有该病的例 数所占的比例。
PV(-) = d/(c+d)
19
6. 预测值
试验结果阳性并不意味肯定有病,阳性结 果提示有病的机会取决于敏感性、特异性及患 病率。
诊断性试验的设计与评价

特异性越高,则假阳性率越低,假阳 性率等于误诊率。因此,特异性高的 试验,用于临床时误诊机会少。高特 异性试验,用于肯定诊断、确诊疾病。 当试验结果阳性时,临床确诊价值最 大。
用高特异性试验,阳性结果肯定诊断, 又称为SpPins。
特异性高的试验适用于:
肯定疾病的诊断;
凡假阳性结果会导致病人精神负担, 或不当防治措施会给病人带来严重危17
4. Spe=Spe1 X Spe2
5. 验后比=验前比 X LR1 X LR2
25
联合试验
2. 序列试验: 依次相继的试验,要所有的试验
阳性才能做出诊断。序列试验提高了特异度 及阳性预测值。但降低了敏感度及阴性预测 值。
3. 例如: 诊断心肌梗死的CPK、AST、LDH,没
有一种试验是很特异的,如采用序列试验, 即三项均阳性才能诊断,这样可提高诊断心 肌梗死的特异度。
进行比较。 新的诊断性试验,应该具备方法更为简便、
更为可靠或者减少危险、减少创伤、节约费 用等优点,这样的诊断性试验才具有推广意 义。
4
二、评价诊断性试验的条件
3。列出四格表
诊 断
+
性
试 验
-
标准诊断
有病
无病
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
5
必须用评价的资料列出四格表, 方法如下
12
如果扩大检查范围,将该地全体运动员都 作上述检查,结果如表2:
冠状动脉狭窄>75%
是
否
运动心电图+ 55(a) 42(b) 97
- 49(c) 478(d) 527
104
520 624
13
SEN=55/104=53%(不变) SPE=478/520=92%(不变) ACC=(55+478)/624=85%(增加20%, 14个 百分点) +PV=55/97=57%(下降38%, 32个百分点) -PV=478/527=91%(增加44%, 28个百分 点) PREV=104/624=17%(原为53%) +LR=0.53/(1-0.92)=6.6(不变) -LR=(1-0.53)/0.92=0.51(不变) 阳性率=97/624=15%(下降52%, 16个百 分点)
实验的诊断性能评价

漏诊率、误诊率越小,说明该临床检验方法的性能就越好。 3.1.4 准确度
准确度又称总符合率、诊断效率(diagnostic efficiency,DF),
是指在患病和非患病者中,用诊断试验能准确划分患者和非患病者的
百分比。反映诊断试验正确诊断患者与非患者的能力。其计算公式为:
准确度=
a
ab bc
理想的诊断试验其灵敏度、特异度最好均为 100%,即假阳性与假阴
性均为零,无一漏诊与误诊。
灵敏度和特异性之间的关系 对于一项诊断试验,可以通过调整
分界值提高灵敏度或特异性,但二者不能同时提高。提高一个,必然
降低另一个,因此,选择分界时必须权衡,使两者得到兼顾。
在大多数情况下,如单独使用敏感性很高的诊断试验,虽然漏诊
3.1.3 漏诊率和误诊率 漏诊率,又称假阴性率(False negative rate),即将患者错
误诊断的百分率,其计算公式为:漏诊率=1 灵敏度= c 100% 。
ac
误诊率,又称假阳性率(False positive rate),即将非患者 错误诊断的百分率,其计算公式为:误诊率=1 特异度= b 100% 。
测值越高;③受检人群研究疾病流行率越高,假阳性率越低,阳性预
测值越高,阴性预测值越低。
流行率对阳性预测值的影响见表 2。由表可以看出,即使诊断敏
感度和特异度都达到 99%,只有在流行率达到 50%时,才有较高的
阳性预测值。所以在临床诊断中,应先询问病史,后对怀疑的病人做
诊断试验。同时也说明部分临床上很好的试验,用作普查效果并不理
用诊断试验检测患病人群中的阴性率与非患病人群的阴性率之间的
比值,即假阴性率与真阴性率之比。其计算公式为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
3) 准确性(accuracy):经诊断性试验检查 后真阳性与真阴性占总例数的比例。
ACC =(a+d)Fra bibliotek(a+b+c+d)
4) 阳性预测值(positive predictive value):诊断性试验阳性的人中真正有 病的人数所占的比例。(即诊断性试验阳 性时,患病的可能性)
+PV = a /(a+b)
5) 阴性预测值(negative predictive value):诊断性试验阴性的人中,真正 无该病的人数所占的比例。(即诊断性试 验阴性时,不患该病的可能性)
-PV = d /(c+d)
9
6) 患病率(prevalence):
PREV =(a+c)/(a+b+c+d)
7) 阳性似然比(positive likelihood ratio): 有病者诊断性试验阳性的概率与无病者试验阳 性的概率之比。
+LR =[ a /(a+c)] / [ b /(b+d)]
= Sen/(1-Spe)
8) 阴性似然比(negative likelihood ratio): 有病者试验阴性的概率和无病者试验阴性的概 率之比。
15
结果解释
PREV的下降是由于扩大了检查范围, 被检人群中,患病者例数减少所致。
随着PREV的下降,ACC、-PV ↑,而+PV、阳性率↓。
SEN、SPE、+LR、-LR、稳定不变。
在评价诊断性试验中,一般不用阳性率,因 阳性病例数并未说明是真阳性或假阳性。
16
从以上2组数据可以看出:
患病率
11
不稳定指标及其影响因素
现举例说明不稳定指标及其影响因素:某地运动 员有胸前区疼痛史者195例,分别作运动心 电图及冠状动脉造影,结果如表1:
冠状动脉狭窄>75%(金标准)
是
否
运动心电图 + 55(a) 7(b) 62
- 49(c) 84(d) 133
104
91
195
12
SEN=a/(a+c)=55/104=53% SPE=d/(b+d)=84/91=92% ACC=(a+d)/(a+b+c+d)=55+84/195=71% +PV=a/(a+b)=55/62=89% -PV=d/(c+d)=84/133=63% PREV(冠状动脉狭窄) =(a+c)/(a+b+c+d)=104/195=53% +LR=SEN/(1-SPE)=0.53/(1-0.92)=6.6 -LR=(1-SEN)/SPE=(1-0.53)/0.92=0.51 阳性率=(a+b)/(a+b+c+d)=62/195=31%
诊断性试验的分析与评价
一、定义
对疾病进行诊断的试验方法,即称为诊 断性试验。
诊断性试验不仅包括实验室检查,还包括病 史、体检结果、影象学检查、各种公认的诊 断标准等。
2
诊断性试验的应用
1. 诊断疾病 2. 筛检无症状病人 3. 疾病的随访 4. 判断疾病的严重性 5. 估计疾病的临床过程极其预后 6. 估计对治疗的反应 7. 测定目前对治疗的实际反应
疾病漏诊可能造成严重后果; 用于排除疾病; 用于筛选无症状且发病率又比较低的疾病。
当患病率变化后,SEN、SPE、+LR及-LR都很稳 定,两组数字相同,而PV随PREV不同有很大变化, 尤其是+PV随患病率增高而增加。因此,PV不能 看做试验本身的特性。敏感度越高,则假阴性越 低,假阴性率等于漏诊率。因此,高敏感度的试 验,用于临床诊断时漏诊率低。通常用高敏感度 试验,阴性结果排除诊断,又称为SnNout。 高敏感度试验用于:
-LR = [ c/(a+c)] / [ d /(b+d)]
=(1-Sen)/Spe
LR:有病者得出某一试验结果的概率与无病者得
出该试验结果的概率之比。
10
2。诊断性试验指标的临床意义
稳定的指标:敏感性、特异性、+LR、-LR (是最重要的指标)
相对稳定的指标:准确性 不稳定的指标:阳性预测值、阴性预测值、
13
如果扩大检查范围,将该地全体运动员都 作上述检查,结果如表2:
冠状动脉狭窄>75%
是
否
运动心电图+ 55(a) 42(b) 97
- 49(c) 478(d) 527
104
520 624
14
SEN=55/104=53%(不变) SPE=478/520=92%(不变) ACC=(55+478)/624=85%(增加20%,14个 百分点) +PV=55/97=57%(下降38%,32个百分点) -PV=478/527=91%(增加44%,28个百分 点) PREV=104/624=17%(原为53%) +LR=0.53/(1-0.92)=6.6(不变) -LR=(1-0.53)/0.92=0.51(不变) 阳性率=97/624=15%(下降52%,16个百 分点)
3
二、评价诊断性试验的条件
1。标准诊断:
疾病的诊断,必须有标准诊断(即金标准, gold standard,或参考标准,reference standard)。标准诊断是目前公认的诊断方 法,如:活检、手术、尸检、特殊检查或长 期随访的结果
4
二、评价诊断性试验的条件
2。诊断方法的对比:
评价新的诊断性试验,必须与标准诊断方法 进行比较。
新的诊断性试验,应该具备方法更为简便、 更为可靠或者减少危险、减少创伤、节约费 用等优点,这样的诊断性试验才具有推广意 义。
5
二、评价诊断性试验的条件
3。列出四格表
诊 断
+
性
试 验
-
标准诊断
有病
无病
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
6
必须用评价的资料列出四格表,方法如下
用标准诊断方法,诊断的病例数为 a+c 在有病的受试者中,诊断性试验阳性者为 a,
阴性者为 c 用标准诊断方法,判断无该病的例数为 b+d 无该病的受试者中,诊断性试验阳性例数为
b,阴性例数为 d
从评价的资料中,不能绘制四格表的诊断性试 验,无法进行评价
7
三、评价诊断性试验的常用指标
1。评价指标
1) 敏感度(sensitivity):经金标准确诊 有病的人中,诊断性试验阳性者所占的比 例。 SEN = a /( a+c)