诊断性试验的设计与评价

合集下载

诊断试验临床效能评价

诊断试验临床效能评价诊断试验的临床效能评价是医疗领域中一项重要的工作，它旨在评估诊断试验的准确性、灵敏性和特异性，从而帮助医生和临床决策者做出准确的诊断和决策。

本文将从准确性、灵敏性和特异性三个方面，分别介绍诊断试验的评价指标和评价方法。

一、准确性评价准确性是评价诊断试验表现的重要指标之一，它代表了试验结果与实际情况之间的一致程度。

常用的准确性指标有阳性预测值（PPV）、阴性预测值（NPV）、真阳性率（TPR）和真阴性率（TNR）。

其中，阳性预测值指的是在试验结果为阳性的情况下，实际患病的比例；阴性预测值则指的是在试验结果为阴性的情况下，实际未患病的比例。

真阳性率和真阴性率则是指试验结果与实际情况一致的比例。

评价诊断试验准确性的方法主要有对照组研究和交叉验证研究。

对照组研究常用于评价新诊断试验与已有试验或“金标准”之间的一致性，通过比较试验结果与“金标准”结果之间的差异，来评价试验的准确性。

交叉验证研究则是指在不同的样本集上进行验证，通过评估试验在不同样本集上的一致性来评价其准确性。

二、灵敏性评价灵敏性是评价诊断试验的另一个重要指标，它代表了试验对实际患者的检出能力。

简而言之，灵敏性越高，试验越能检测出真正的患者。

灵敏性的评价常用的指标是真正阳性率（TPR），也称为召回率或敏感性。

它表示试验对真正患者的检测比例。

评价诊断试验灵敏性的方法主要有“金标准”对照和受试者工作特征曲线（ROC曲线）分析。

在“金标准”对照中，将试验结果与“金标准”结果进行对比，来评价试验的灵敏性。

ROC曲线分析则常用于评价试验结果的连续性，通过绘制曲线来显示不同阈值下试验的灵敏性和特异性。

三、特异性评价特异性是评价诊断试验的又一个重要指标，它代表了试验对非患者的判断能力。

特异性越高，试验越能排除非患者。

特异性的评价常用的指标是真正阴性率（TNR），即试验对真正非患者的判断比例。

评价诊断试验特异性的方法主要有独立样本验证和交叉验证。

医学实验设计与诊断试验的评价

新诊断试验方法
阳性
阴性
有某种疾病
（a）
(b）
没有某种疾病
(c）
(d）
总符合率(total consistent rate)
Youden 指数（Youden index）
比数积(odds product)
金标准诊断
新诊断试验方法
阳性
阴性
有某种疾病
（a）
(b）
没有某种疾病
(c）
(d）
阳性预测值(positive predictive value)
阴性预测值(negative predictive value)
病理诊断
某种生化酶诊断
合计
有病（阳性）
无病（阴性）
有病（阳性）
80
38
118
无病（阴性）
12
二、诊断试验的评价指标
金标准诊断
新诊断试验方法
阳性
阴性
有某种疾病
（a）
(b）
没有某种疾病
(c）
(d）
敏感度（sensitivity）
特异度（specificity）
误诊率（mistake diagnostic rate）
漏诊率（omission diagnostic rate）
金标准诊断
第二节医学实验研究设计的几个原则
第三节诊断试验的评价
第四节诊断试验的一致性检验
CONTENTS
第一节医学实验设计的三个要素
受试对象受试对象的纳入标准和排除标准选择对处理因素敏感性强的受试对象选择依从性好的患者作研究对象要注意医学伦理则实验中的各组之间除处理因素不同外，要尽可能控制非处理因素，使实验组与对照组在非处理因素方面基本一致，具有齐同可比性。

诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法，用于确定患者是否患有某种疾病。

然而，单纯通过试验结果判断是否患病往往并不准确。

因此，我们需要评价诊断试验的准确性，并使用ROC分析来量化其性能。

1. 诊断试验的评价指标为了评估诊断试验的性能，我们需要引入以下四个指标：敏感度、特异度、阳性预测值和阴性预测值。

敏感度（Sensitivity）是指在真正患病的人中，试验能正确诊断出疾病的比例。

敏感度越高，表示试验具有较好的疾病检测能力。

特异度（Specificity）是指在真正健康的人中，试验能正确排除疾病的比例。

特异度越高，表示试验具有较好的非患病排除能力。

阳性预测值（Positive Predictive Value）是指在试验为阳性的情况下，患者真正患病的概率。

阳性预测值越高，表示试验结果与患病状态的相关性越高。

阴性预测值（Negative Predictive Value）是指在试验为阴性的情况下，患者真正健康的概率。

阴性预测值越高，表示试验结果与健康状态的相关性越高。

2. ROC曲线和AUC值为了综合评价诊断试验的准确性，我们引入了ROC曲线（Receiver Operating Characteristic Curve）和AUC值（Area Under Curve）。

ROC曲线是以敏感度为纵轴，以1-特异度为横轴绘制的曲线。

曲线上每一个点表示了在不同阈值下的敏感度和特异度。

ROC曲线越靠近左上角，表示试验性能越好。

AUC值是ROC曲线下面积的数值，范围在0.5到1之间。

AUC值越接近1，表示试验具有较高的准确性。

3. 如何进行ROC分析进行ROC分析通常需要以下步骤：（1）收集样本数据：包括疾病阳性和阴性样本，以及其相应的试验结果。

（2）计算敏感度和特异度：根据试验结果计算敏感度和特异度，并绘制ROC曲线。

（3）计算AUC值：根据ROC曲线计算AUC值。

（4）选择最佳阈值：根据需求和实际情况，选择最佳的阈值以平衡敏感度和特异度。

教学计划中诊断性评价的设计与实施

选择评价方法：根据评价目标选择合适的评价方法
制定评价标准：根据评价目标和方法制定评价标准
分析评价结果：对评价结果进行分析，找出问题所
在
确定评价目标：明确评价的目的和意义
设计评价工具：根据评价方法和目标设计评价
工具
实施评价：按照评价工具和标准实施评价
反馈与改进：根据评价结果进行反馈和改进
特点：诊断性评价具有及时性、针对性和指导性等特点，可以帮助教师更好地了解学生的学习情况，及时调整教学策略和教学方法。
与其他评价方式的区别：诊断性评价与总结性评价、形成性评价等评价方式不同，它更注重对学生的学习过程进行评价，以便及时调整教学策略和教学方法。
诊断性评价的目的：了解学生的学习情况，找出存在的问题，以便及时调整教学计划。诊断性评价的作用：帮助学生了解自己的学习情况，激发学习动力，提高学习效果。诊断性评价的方法：可以通过测试、观察、访谈等方式进行。诊断性评价的结果：可以为教师提供改进教学的依据，也可以为学生提供个性化的学习建议。
等。
确定评价内容：根据教学目标和教学内容，确定评价的具体方面，如知识掌握、技能运用、情感态
度等。
制定评价指标：根据评价内容，制定具体的评价指标，如考试成绩、作业完成情况、课堂参与度等。
设定评价标准：根据评价指标，设定评价的标准，如优秀、良好、中等、
及格等。
制定评价方法：根据评价标准，制定具体的评价方法，如笔试、面试、观察、问卷调查
添加标题
添加标题
添加标评价过程和标准
评价者要具备专业素养和公正态度，避免偏见和歧视
关注学生的个体差异，制定个性化的评价标准
关注学生的情感需求，采用鼓励性的评价方式

诊断实验的研究与评价

3）再检验其血清肌酸磷酸酶（CPK）>80单位，此时阳性似然比为7.75。
其验前比=0.9167/（1-0.9167）=11.0048；验后比=11.0048×7.75=85.25。
• 验后概率=85.25/（1＋85.25）=0.988 经过询问症状，心电图检查及血清CPK检查，该病人患冠心病的可能性为98.8％，因
•
粗一致 a率 d 10 % 0 abcd
调整 1 一 a 致 a率 dd 4 a ba cc db d
4.似然比（likelihood ratio LR）
综合了灵敏度和特异度的信息，其含义为：病人中出现某种检测结果的概率与非病人中出现相应结果的概率之比，它表明某项试验所确定的阳性界值（截点）能否良好地区分真阳性和假阳性。根据似然比可以判断诊断试验阳性或阴性时患病的概率，以助临床医生的诊断决策。
•
误诊率B 10% 0 BD
正确诊断指数（Youden指数）
一项诊断方法发现真正的病人和非病人的总能力。
约登指A 数=（灵D敏度+ 特异度）－1
或约登A+指C数 = B+D +
－1
将灵敏度和特异度合并为一个指标，可更全面地评价、
比较各种筛检试验的真实性。指数愈大，反映的真实性也愈大。
约登指数的标准误为
ROC Curve
1.00
.75
Se ns it iv ity
.50
.25
0.00
0.00
.25
.50
.75
1.00
1 - Specificity
图2--ROC曲线图
第四节诊断试验的评价
用某些指标对诊断试验的真实性、可靠性以及效益进行评价。

第12章诊断性试验

Se＝ a/(a+c) 2. 特异性(Specificity，Sp)：是指由金标准确定无病的对照组内，经诊断性试验检出阴性结果的人数比例，即试验的“真阴性率”。
Sp＝ d/(b+d)
15
一、评价诊断试验真实性的指标
3. 误诊率(misdiagnosis rate)
亦称假阳性率(α)，理想的α＝0。
表12-2 CPK对急性心肌梗死的诊断价值
CPK(IU/L) 心肌梗死无心肌梗死合计
阳性(≥80)
215
16
231
阴性(＜80)
15
114
129
合计
230
130
360
一、评价诊断试验真实性的指标
5.准确度（accuracy,Ac）:符合率，粗一致性，系诊断性试验检出的真阳性和真阴性例数之和占总病例数的比例。
以CPK80IU作为阳性标准，其阳性似然比为7.6, 现在要预测采用该试验后患者急性心肌梗死的概率 (验后概率)为多少，较验前概率提高了多少。
33
二、评价诊断试验可靠性的指标
亦称重复性或精密度，是指某项诊断试验在完全相同情况下重复进行时获得相同结果的稳定程度。
影响可靠性的因素
生物学变异
①不同观察者间的变异：表示不同观察者独立地检查同一样本时所得结果不一致的程度。
PV(+) ＝ a/(a+b) （2）阴性预测值（negative predictive value，PV(-)）：系指诊断性试验检出的全部阴性例数中，真正没有该病的例数所占的比例。
PV(-) ＝ d/(c+d)
19
6. 预测值
试验结果阳性并不意味肯定有病，阳性结果提示有病的机会取决于敏感性、特异性及患病率。

诊断性试验的设计与评价

16
特异性越高，则假阳性率越低，假阳性率等于误诊率。因此，特异性高的试验，用于临床时误诊机会少。高特异性试验，用于肯定诊断、确诊疾病。当试验结果阳性时，临床确诊价值最大。
用高特异性试验，阳性结果肯定诊断，又称为SpPins。
特异性高的试验适用于:
肯定疾病的诊断；
凡假阳性结果会导致病人精神负担，或不当防治措施会给病人带来严重危17
4. Spe=Spe1 X Spe2
5. 验后比=验前比 X LR1 X LR2
25
联合试验
2. 序列试验: 依次相继的试验，要所有的试验
阳性才能做出诊断。序列试验提高了特异度及阳性预测值。但降低了敏感度及阴性预测值。
3. 例如: 诊断心肌梗死的CPK、AST、LDH，没
有一种试验是很特异的，如采用序列试验，即三项均阳性才能诊断，这样可提高诊断心肌梗死的特异度。
进行比较。新的诊断性试验，应该具备方法更为简便、
更为可靠或者减少危险、减少创伤、节约费用等优点，这样的诊断性试验才具有推广意义。
4
二、评价诊断性试验的条件
3。列出四格表
诊断
+
性
试验
-
标准诊断
有病
无病
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
5
必须用评价的资料列出四格表, 方法如下
12
如果扩大检查范围，将该地全体运动员都作上述检查，结果如表２:
冠状动脉狭窄＞７５％
是
否
运动心电图＋ 55(a) 42(b) 97
－ 49(c) 478(d) 527
104
520 624
13
SEN=55/104=53%（不变） SPE=478/520=92%（不变） ACC=(55+478)/624=85%（增加２０％, １４个百分点） +PV=55/97=57%（下降３８％, ３２个百分点） -PV=478/527=91%（增加４４％, ２８个百分点） PREV=104/624=17%（原为５３％） +LR=0.53/（1-0.92）=6.6（不变） -LR=（1-0.53）/0.92=0.51（不变）阳性率=97/624=15%（下降５２％, １６个百分点）

诊断试验研究

多项检查阳性
380
阴性
101
合计
481
320 699 1019
700 800 1500
+PV=54.29%
-PV=87.38%
与上一次诊断相比，在灵敏度和特异度不变的情况下，阳性
预测值上升了，阴性预测值下降了。
原因是，两次诊断颅骨骨折的患病率不同造成的（前者为
17.20%(86/500) ，后者为 32.07%(481/1500) ）。在
的“阴性”人数所占的比例。
• 假阴性率 FNR=[C/(A+C)] ×100%
•
FNR=1-Se
• 2、特异度(specificity)：指在“金标准”确诊的非病人中，诊断试验检测出的阴性人数所占的比例
• 特异度计算 SP=[D/（B+D）]×100% • 假阳性率（false positive rate，误诊率）：指
人群中青光眼患者与非青光眼患者眼内压分布
ROC曲线（了解）
• ROcharacteristic curve,受试者工作特征曲线) 的横轴表示假阳性率（1-特异度），纵轴表示灵敏度，曲线上的任意一个点代表一项诊断方法的特定阳性标准值相对应的灵敏度和特异度对子。
[1]预测值与患病率的关系
有研究者在前列腺癌患病水平不同的人群中，对用前列腺特异性抗原开展诊断的预测值的变化情况进行了研究，结果如下
诊断对象
一般人群高龄无症状男性有可疑症状者
患病率 (1/10万)
3.50 500.00 50000.00
阳性预测值 %
0.02 3.40 87.50
• 在诊断试验评价中，可靠性是指在相同条件下针对同一研究对象，诊断方法重复检测其结果的稳定程度，或者一致性（consistency）、重现性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

结果解释
ＰＲＥＶ的下降是由于扩大了检查范围，被检人群中，患病者例数减少所致。
随着ＰＲＥ↓。
、、＋、－、稳定不变。
在评价诊断性试验中，一般不用阳性率，因阳性病例数并未说明是真阳性或假阳性。
从以上２组数据可以看出：
当患病率变化后，、、＋及都很稳定，两组数字相同，而随不同有很大变化，尤其是＋随患病率增高而增加。因此，不能看做试验本身的特性。敏感度越高，则假阴性越低，假阴性率等于漏诊率。因此，高敏感度的试验，用于临床诊断时漏诊率低。通常用高敏感度试验，阴性结果排除诊断，又称为。
如果扩大检查范围，将该地全体运动员都作上述检查，结果如表２：
冠状动脉狭窄＞７５％
是
否
运动心电图＋ 55(a) 42(b) 97
－ 49(c) 478(d) 527
104
520 624
55/104=53%（不变） 478/520=92%（不变） (55+478)/624=85%（增加２０％，１４个百分点） 55/97=57%（下降３８％，３２个百分点） 478/527=91%（增加４４％，２８个百分点） 104/624=17%（原为５３％） 0.53/（1-0.92）=6.6（不变）（1-0.53）/0.92=0.51（不变）阳性率=97/624=15%（下降５２％，１６个百分点）
7)
=（）/（）
8) 阳性似然比（）：有病者诊断性试验阳性的概率与无病者试验阳性的概率之比。
9)
=[ a /（）] / [ b /（）]
10)
= （1）
11) 阴性似然比（）：有病者试验阴性的概率和无病者试验阴性的概率之比。
12)
= [ （）] / [ d /（）]
13)
=（1）
14) ：有病者得出某一试验结果的概率与无病者得出该试验结果的概率之比。
五、似然比的临床应用
可用于临床计算患病的概率，便于更准确地对患者作出诊断。
例如：对怀疑急性心肌梗塞患者，作肌酸磷酸激酶（）测定，根据其结果可计算似然比。爱丁堡皇家医院将怀疑心肌梗死者360例收入病房,检测，由一位不知结果的医生根据心电图和尸检结果判断有心肌梗死者 230例，无心梗者130例，测定值如下：
诊断性试验的分析与评价
一、定义
对疾病进行诊断的试验方法，即称为诊断性试验。诊断性试验不仅包括实验室检查，还包括病史、体检结果、影象学检查、各种公认的诊断标准等。
诊断性试验的应用
1. 诊断疾病 2. 筛检无症状病人 3. 疾病的随访 4. 判断疾病的严重性 5. 估计疾病的临床过程极其预后 6. 估计对治疗的反应 7. 测定目前对治疗的实际反应
二、评价诊断性试验的条件
1。标准诊断：疾病的诊断，必须有标准诊断
（即金标准, ，或参考标准，）。标准诊断是目前公认的诊断方法，如：活检、手术、尸检、特殊检查或长期随访的结果
二、评价诊断性试验的条件
2。诊断方法的对比：评价新的诊断性试验，必须与标准诊断方法进行比较。新的诊断性试验，应该具备方法更为简便、更为可靠或者减少危险、减少创伤、节约费用等优点，这样的诊断性试验才具有推广意义。
高敏感度试验用于：
疾病漏诊可能造成严重后果；
用于排除疾病；
用于筛选无症状且发病率又比较低的疾病。
特异性越高，则假阳性率越低，假阳性率等于误诊率。因此，特异性高的试验，用于临床时误诊机会少。高特异性试验，用于肯定诊断、确诊疾病。当试验结果阳性时，临床确诊价值最大。
用高特异性试验，阳性结果肯定诊断，又称为。
2。诊断性试验指标的临床意义稳定的指标：敏感性、特异性、＋、－（是最重要的指标）相对稳定的指标：准确性不稳定的指标：阳性预测值、阴性预测值、患病率
不稳定指标及其影响因素
现举例说明不稳定指标及其影响因素：某地运动员有胸前区疼痛史者１９５例，分别作运动心电图及冠状动脉造影，结果如表１：
二、评价诊断性试验的条件
3。列出四格表
标准诊断
有病
无病
诊断
+ a(真阳性)b(假阳性)
性
试验
- c(假阴性)d(真阴性)
必须用评价的资料列出四格表，方法如下用标准诊断方法，诊断的病例数为在有病的受试者中，诊断性试验阳性者为
a，阴性者为 c 用标准诊断方法，判断无该病的例数为无该病的受试者中，诊断性试验阳性例数
特异性高的试验适用于：
肯定疾病的诊断；
凡假阳性结果会导致病人精神负担，或不当防治措施会给病人带来严重危
四、诊断性试验的样本大小的计算
计算时，先查阅文献或作预试估计、病例组（Ｎ１）：用该试验敏感性估计
Ｐ１=（ａ／ａ＋ｃ）对照组（Ｎ２）：用该试验特异性估计
P２=（ｄ／ｂ＋ｄ）用估计总体率的样本公式分别计算Ｎ１＝2Ｐ１（１－Ｐ１）／δ2 Ｎ２＝2Ｐ２（１－Ｐ２）／δ2 显著性水平μа取０.０５ μ０.０５＝１.９６（双侧检验）诊断性试验的允许误差δ一般定在0.05-0.10
4)
=（）/（）
5) 阳性预测值（）：诊断性试验阳性的人中真正有病的人数所占的比例。（即诊断性试验阳性时，患病的可能性）
6)
= a /（）
7) 阴性预测值（）：诊断性试验阴性的人中，真正无该病的人数所占的比例。（即诊断性试验阴性时，不患该病的可能性）
8)
= d /（）
6) 患病率（）：
冠状动脉狭窄＞75%（金标准）
是
否
运动心电图 + 55（a） 7（b） 62
- 49（c） 84（d） 133
104
91
195
()=55/104=53% ()=84/91=92% ()/()=55+84/195=71% ()=55/62=89% ()=84/133=63% （冠状动脉狭窄）=()/()=104/195=53% (1)=0.53/（1-0.92）=6.6 (1)(1-0.53)/0.92=0.51 阳性率=()/()=62/195=31%
为 b，阴性例数为 d
从评价的资料中，不能绘制四格表的诊断性试验，无法进行评价
三、评价诊断性试验的常用指标
1。评价指标敏感度（）：经金标准确诊有病的人中，诊断性试验阳性者所占的比例。
= a /（）特异度（）：经金标准诊断确定为无该病的人中，诊断性试验阴性所占的比例。
= d /（）
3) 准确性（）：经诊断性试验检查后真阳性与真阴性占总例数的比例。

诊断性试验的设计与评价

诊断试验临床效能评价

医学实验设计与诊断试验的评价

诊断试验的评价和ROC分析

教学计划中诊断性评价的设计与实施

诊断实验的研究与评价

第12章 诊断性试验

诊断性试验的设计与评价

诊断试验研究

第12章诊断性试验