诊断试验评价

合集下载

循证检验医学与诊断性试验评价

循证检验医学与诊断性试验评价什么是循证检验医学？循证检验医学（Evidence-based medicine，EBM）是指通过收集、分析和评价最新的临床研究和资料，结合临床医生的临床经验和患者的价值观，最终达到制定合理的诊疗方案、提高诊疗质量和临床效果的理论和实践体系。

循证检验医学强调临床决策应该基于最好的可获得的证据，而不是凭借医生的直觉或传统经验。

这种理念已经被包括世界卫生组织在内的各大国际组织所接受和推崇。

循证检验医学的主要目的循证检验医学的主要目的是提高临床决策的准确性和效率，进而改善患者的治疗效果和生存质量。

EBM不仅仅是对药物治疗的监管和管理，同时也是对手术、诊断和预防等其他临床决策的质量监控。

循证检验医学的三个基本步骤循证检验医学需要完成三个基本步骤：1.收集证据：通过文献检索和研究之间的比较，收集当前最新的、最好的和最适宜的证据。

2.评价证据：评估证据的质量和信度，以确定其在临床决策中的可靠性和应用性。

3.应用证据：将评估后的证据应用到临床实践中，并结合患者的病情、价值观和意愿来做出适当的临床决策。

诊断性试验评价诊断性试验评价是评价医学诊断准确性和可靠性的一个重要手段。

它的主要目的是判断一种测试在诊断一个疾病时的准确性和有效性。

诊断性试验的类型诊断性试验可以分为两类：1.敏感性和特异性：这是两个最基本的测量指标。

敏感性是指测试可以识别出病人的百分比，特异性则表示测试可以排除病人的百分比。

敏感性和特异性可以帮助医生决定是否需要进一步检查或测试。

2.ROC曲线： ROC曲线是一种受样本大小和预测模型影响较小的诊断性试验评价方法。

它将敏感性和特异性合并成一个质量指标，称为“曲线下面积（area under the curve，AUC）”。

AUC越接近1，则该测试的诊断准确性越高。

如何评价诊断性试验评价诊断性试验需要考虑以下几个因素：1.常见失真：诊断性试验可能涉及各种失真，包括选择性报告、顺序效应、参考标准和治疗可能对测试结果产生的影响等，需要考虑这些因素对试验结果的影响。

实验的诊断性能评价

3.1.3 漏诊率和误诊率漏诊率，又称假阴性率（False negative rate），即将患者错
误诊断的百分率，其计算公式为：漏诊率=1 灵敏度= c 100% 。
ac
误诊率，又称假阳性率（False positive rate），即将非患者错误诊断的百分率，其计算公式为：误诊率=1 特异度= b 100% 。
排除某疾病存在与否的诊断概率，称为预测值（predictive value， PV），又称预告值，也称为试验后诊断为患某病的可能性即验后概率（post test probability），包括阳性预测值和阴性预测值，分别表示诊断试验结果确定或排除某种疾病存在与否的诊断概率。预测值受流行率的影响，不同流行率的人群中疾病的预告值不同。
想。
表 2 流行率、灵敏度和特异度对某疾病＋PV 的影响
根据某试验的灵敏度、特异度和群体中研究疾病的流行率，预测
值亦可以用 Bayes 理论公式估计：
＋PV
=
流行率
流行率灵敏度灵敏度＋（1－流行率）（1－特异度）
－PV＝（1
（1 流行率）
流行率）特异度特异度＋流行率（1－灵敏度）
3.2.3 似然比
1.0 ，其小于 1.0 的大小是当试验结果为阴性时，试验提示患病可能
性降低能力的一种度量。LR(－)＝0.5－0.2 ，认为该试验不太好，而小于 0.1 ，可认为是好的试验。阴性似然比也可表示为（1-敏感度）与特异度之比。 4.阈值
阈值（cut off value）又称分界值、临界值、鉴别值、指定值等，指划分诊断试验结果正常与异常的界值。参考值概念的提出虽然澄清了正常值概念的模糊观点，但是当用医学试验作为过筛试验、确诊或排除疾病等不同用途时，单一个参考值不能满足不同的要求。为了提高诊断指标临床使用效果，不仅要研究基本健康者的参考值，也要研究其他无关疾病患者的参考值及有关疾病在不同病情中的测定数据，即根据不同的目的，研究健康(或称非病理的)与病理的分界水平。 4.1 阈值的选择

筛检或诊断试验评价的方法

筛检或诊断试验评价的方法
确定金标准：临床医学界公认的诊断疾病的最可靠的方法。
选择研究对象
病例组
样本量的估计
对照组
资料的整理，评价指标的分析
偏倚的控制
1
确定金标准
‘金标准’：是指当前临床医学界公认的诊断疾病的最可靠的方法。也称为标准诊断。
通常包括：活检、手术发现、微生物培养、尸检、特殊检查和影像诊断，以及长期随访的结果。
2
例：
冠心病: 肿瘤: 肾结石:
冠状动脉造影病理学检查手术发现
金标准具有创伤性，因此探求一些新的诊断方法（诊断试验），并比较其与金标准的差别、得失及推广价值有现实意义。
3
选择研究对象
（1）病例组：是指用金标准确诊‘有病’的病例，应包含典型的、不典型病例，早、中、晚期病例，轻、中、重病例、有和无并发症的患者。（2）对照组：是指用金标准证实没有目标疾病的其他病例，特别是与该病容易混淆的病例。正常人一般不宜纳入对照组。
靠性和收益。
6
质量控制
１．应该采用盲法判断试验结果避免或减少偏差。２．筛检试验所用的仪器型号、试验条件、试验步骤、试剂质量等要统一、
标准化。筛检试验所涉及的方法须反复测试。观察指标要客观、特异，判断结果的标准要明确具体。参与调查的研究者应经过严格培训。

4
样本大小的计算
与筛检试验研究的样本量有关的因素：１．显著性水平α：α值越小，样本含量越大，一般取α＝0.05。２．容许误差δ：δ越小，样本含量越大；δ越大，样本含量越小，δ 一般在0.05～0.10。３．灵敏度或特异度的估计值Ｐ：病例组样本含量由灵敏度估计，对照组样本含量由特异度估计。
5
整理分析资料

诊断试验的临床效能评价

该文以免疫荧光技术为金标准，评价PCR技术检测患者宫颈管细胞碎片中沙眼衣原体的敏感性。试验对象为妇产科门诊就诊、患有不同程度的宫颈感染或不孕症患者共77例。结果：免疫荧光技术阳性7例，且这7例阳性标本的PCR检测结果亦为阳性，据此认为 PCR方法敏感性为100％。
背景诊断衣原体的“金标准” 是从细胞培养中分离衣原体。免疫荧光技术为新方法，特异性好，但敏感性较细胞培养技术差
指在诊断试验前被检者可能患病的概率，同患病率／就诊率／拟诊率
2. 验后概率(posterior probability)
是拟得到的某一事件发生的概率，可通过验前概率修正的阳性预测值求得
验后概率=
验前概率×灵敏度
验前概率×灵敏度+（1－验前概率）×（1－特异度
）
思考题1：
某社区的人口为5万人，现拟用血糖试验来筛检糖尿病。不同的筛检标准及其准确性见下表：
算方法，分别计算“病例组”样本含量
n1及“对照组”样本含量n2 。
n1=
Zα2 Sen(1－Sen)
△2
n2=
Zβ2 Spe(1－Spe)
△2
四、数字的提取和数字化
➢临床效能评价最好利用工作中既往测量结果
➢为方便统计软件的使用，各种资料必有数字化
五、诊断分界点
理想的诊断试验正常群体与患者群体分布曲线
4.46%
阴性预测值
99.77%
40881
50000
1.0% 180mg/dl 阳性
250
99
349 71.63% 99.50%
Sen 50.0 阴性
250
49401 49651
Spe 99.8 合计
500

临床生化诊断试验的诊断性能评价

临床生化诊断试验的诊断性能评价在临床上，临床诊断试验的目的是对某种疾病进行诊断。

临床诊断试验的范围较广，实验室检查、患者病史、影像诊断、临床资料、仪器诊断等都属于临床诊断试验。

随着医疗事业的不断进步，临床诊断试验越发重要，诊断试验方法也越来越先进。

相对于常规诊断试验方法而言，新的临床诊断试验方法发展时间较短，需要采用合理的评价方法对其评定。

诊断性能评价是临床诊断试验的性能评价的一项。

诊断性能评价强调了对新的诊断方法要包含症状、体征、检查等多项临床试验的评价。

临床诊断试验结果和患病存在真阳性、假阳性、真阴性、假阴性四种关系。

定性试验是判断阴性、阳性的结果，定量试验是判断阴性、阳性的依据。

因此临床诊断试验需要定一系列的计量数据确保结果的可靠性。

真阳性指经临床诊断试验，患者数目被正确分类。

假阳性是指经临床诊断试验，将未患病人员分类为患者的人数。

真阴性是指经临床诊断试验，未患病人数被正确分类。

假阴性是指经临床诊断试验，将患病人员分类为未患者的人数。

诊断试验需要对疾病的状态以及患有疾病的可能性进行识别和预测。

对是否患有疾病、疾病的发展程度、疾病的治疗效果等作出真实可靠的评价，这些都是准确识别疾病的必备条件。

诊断性能评价包括了真实性、有效性、可靠性、灵敏度、特异度、漏诊率、误诊率准确度等多项指标。

真实性是一项至关重要的指标，它证明了检测结果与实际结果之间的重合度，是衡量实验者是否患病的重要指标。

临床诊断试验需要大量的数据提供科学依据，以保障诊断性能评价的可靠性，为此实验人员要进行重复试验，对结果进行多次验证，确保结果的稳定性。

数据的可靠性将对试验的准确性和有效性起到直接影响。

灵敏度通过阳性结果的百分比对患者的能力起到识别作用，灵敏度的值越大越好。

特度度通过阴性结果的百分比对非患者的能力起到识别作用，特异度的值越大越好。

漏诊率与灵敏度互补，该值直接体现出了患者由于漏诊，导致诊断错误的概率，漏诊率值越小越好。

误诊率与特度度互补，该值直接体现出了非患病人员由于误诊，导致诊断错误的概率，误诊率值越小越好。

诊断试验的评价方法与SPSS实操

二、预测值
待评价的诊断方
标准诊断方法
法
有病（阳性）无病（阴性）
合计
有病（阳性） a（真阳性） b（假阳性）
a+b
无病（阴性） c（假阴性） d（真阴性）
c+d
合计
a+c
b+d
n（=a+b+c+d）
阳性预测值：a/(a+b) 阴性预测值：d/(c+d)
以上指标均与金标准对比时才有意义
选择诊断标准时，一般要遵循以下原则：
第二节诊断试验的评价的方法
一、金标准金标准（Gold standard）：公认的、可靠的、
准确的诊断方法。病理检查(活检、尸检)；手术探查确诊；通过认真的随访获得肯定的结论；影象学检查中使用的标准磨具。
有些疾病尚无特异性诊断标准，则以专家制订、得到公认的临床诊断标准为依据。
２)．并联试验（parallel test）也称平行试验，是指采用几种筛检方法检测疾病，凡有一项检测为阳性者即判为阳性，所有检测均为阴性才判为阴性。
联合试验筛检糖尿病的结果
试验结果尿糖血糖糖尿病病人非病人
串联试验并联试验
结果
结果
＋
－
－
＋
＋
＋
－
－
14
10
33
11
117
21
35
7599
－
二、诊断试验的目的是把病人与可疑有病、但实际无病的人区别
开来，以便对确诊的病人给予相应的治疗。好的诊断试验方法对临床诊断的正确性和疾
病的治疗效果产生重要的影响。对于不同疾病不断发现新的诊断试验方法是

诊断试验评价指标

4
诊断试验评价的预测值
阳性预测值(positive predictive value,+PV) 如果诊断试验结果是阳性病人真正有病的可能性。
计算公式：+PV＝a / ( a + b ) 反映诊断指标阳性时患者患某病的概率。
5
诊断试验的综合评价指标
阴性预测值(negative predictive value,－PV) 如果试验结果是阴性，病人真正无病的概率
合前文教学，有利于学生把握本文写作背景，进而加深学生对作品含义的理解。二、教学新课目标导学一：认识作者，了解作品背景作者简介：欧阳修(1007—1072)，字永叔，
自号醉翁，晚年又号“六一居士”。吉州永丰(今属江西)人，因吉州原属庐陵郡，因此他又以“庐陵欧阳修”自居。谥号文忠，世称欧阳文忠公。北宋政治家、文学家、史学
差异性检验——Kappa系数
Kappa系数在0～+1间判断一致性才有意义。Kappa系数越大，表示一致性越好。一般认为Kappa系数>0.8，为高度一致，认为两系统等效；0.4<Kappa系数<0.8认为一致，需进行阳性符合率和阴性符合率比较并进行统计学分析； Kappa系数<0.4则认为两系统不一致，两系统不等效
亭”的名字便暗中透出，然后引出“醉翁亭”来。作者利用空间变幻的手法，移步换景，由远及近，为我们描绘了一幅幅山水特写。2．第二段主要写了什么？它和第一段有什么联系？明确：第二段利用时
间推移，抓住朝暮及四季特点，描绘了对比鲜明的晦明变化图及四季风光图，写出了其中的“乐亦无穷”。第二段是第一段“山水之乐”的具体化。3．第三段同样是写“乐”，但却是写的游人之乐，作者
此醉是为山水之乐而醉，更是为能与百姓同乐而醉。体现太守与百姓关系融洽，“政通人和”才能有这样的乐。5．第四段主要写了什么？明确：写宴会散、众人归的情景。目标导学五：深入解读，把握作

诊断试验评价指标

CK和EKG诊断心梗ROC曲线比较
100%
80% CPK EKG
60%
40%
20%
0% 0% 20% 40% 60% 80% 100%
假阳性率
用途：决定最佳临界点；比较两种诊断试验
评价诊断试验的指标(5)
È 似然比(Likelihood ห้องสมุดไป่ตู้atio, LR)
– 试验阳性结果的似然比系真阳性率和假阳性率之比 – 试验阴性结果的似然比系假阴性率和真阴性率之比 CK+ CKTotal
似然比的特点和应用
疾病
È 比灵敏度和特异度更稳定，不受患病率的影响； È 用于估计疾病概率； È 更科学地描述诊断试验
似然比的计算
非疾病 b(b/b+d) d(d/b+d) b+d +LR=Sen/(1-Spe) -LR=(1-Sen)/Spe a+b+c+d
试验+ a(a/a+c) 试验- c(c/a+c) Total a+c
评价诊断试验的指标(1)
È 黄金标准 (Gold Standard)
– 病理学标准(组织活检和尸体解剖) – 外科手术发现或特殊的影像诊断 – 长期临床随访结果 – 公认地综合临床诊断标准 – 金标准是相对的，选择应结合临床具体情况
诊断试验的四格表
黄金标准病例组诊断试验阳性 (真阳性)a 阴性 (假阴性)c a+c
– 假阳性率＝1－特异度。
1
例1、CK试验诊断心肌梗死(预测值 Predictive value )
心肌梗死组 35 8 7 15 19 13 91(42%) 18 133 19 21 30 30 215(93%) 13 15 2 230 CK水平 480 440 400 360 320 280 240 200 160 120 80 40 0 无心肌梗死组 0 0 0 0 0 1 1 +PV=99% 129(99%) 1 -PV=48% 1 0 5 16 8 +PV=93% 114(88%) 26 -PV=88% 88 130

诊断实验评估指标-灵敏度（sensitivity）特异度（specificity）准确度（。。。

诊断实验评估指标-灵敏度（sensitivity）特异度（specificity）准确度（。

在临床上经常会⽤到诊断试验的⼿段，⽤于疾病诊断、病⼈随访或疗效监测等。

判断某⼀诊断试验的结果是否真实、可靠，是否具有实⽤性，从⽽确定合理的医疗决策。

⼀项诊断试验需要具备能正确的鉴别患病和未患病的能⼒，以反映患病实际情况的准确程度，这其中涉及到⼏个重要概念：灵敏度（sensitivity）、特异度（specificity）、准确度（accuracy）、阳性预测值以及阴性预测值。

希望⼤家能够准确理解以上5个重要指标，并通过以下模拟试题练习加深理解。

模拟试题：⼀项胃癌临床诊断试验受试⼈数是200⼈，实际情况为50⼈患胃癌，150⼈正常；诊断结果显⽰，有160⼈正常，40⼈诊断为胃癌，⽽这40⼈当中实则仅有35⼈真正患癌。

请根据数据判断该项诊断试验的灵敏度（sensitivity）、特异度（specificity）、准确度（accuracy）、阳性预测值以及阴性预测值。

其实，这5个指标在也适⽤于评价我们call变异所⽤的软件效能。

⽐如：全基因组测序进⾏SNV检测时使⽤了2个软件： GATK和MuTect，共检出1300个变异，其中GATK检出1000个SNV，MuTect检出1100个SNV，共有SNV是800个；经过⽬标区域测序进⾏验证后，发现共有的800个突变均得到验证， GATK特有的SNV有80个得到验证，MuTect特有的SNV有150个得到验证（假定经过⽬标区域测序验证成功的SNV即为真实存在的突变）。

请计算MuTect软件的以上5个指标。

灵敏度（Sensitivity，也称为真阳性率）是指实际为阳性的样本中，判断为阳性的⽐例（例如真正有⽣病的⼈中，被医院判断为有⽣病者的⽐例），计算⽅式是真阳性除以真阳性+假阴性（实际为阳性，但判断为阴性）的⽐值（能将实际患病的病例正确地判断为患病的能⼒，即患者被判为阳性的概率）；特异度（Specificity，也称为真阴性率）是指实际为阴性的样本中，判断为阴性的⽐例（例如真正未⽣病的⼈中，被医院判断为未⽣病者的⽐例），计算⽅式是真阴性除以真阴性+假阳性（实际为阴性，但判断为阳性）的⽐值（能正确判断实际未患病的病例的能⼒，即试验结果为阴性的⽐例）。

第六章：诊断试验及其评价讲解

阴性预测值（negtive predictive value）：又称预测阴性结果正确率，即在诊断试验阴性结果的人中，无该病的概率，也是真阴性占阴性结果总数和百分率。
阴性预测值＝ D 100% CD
25
预测值
影响预测值的因素： 1. 灵敏度Se 特异度Sp 2. 患病率P
阳性预测值＝
患病率

患病率灵敏度
灵敏度 1－患病率
1－特异度
阴性预测值＝
1－患病率特异度 1－患病率特异度患病率1－灵敏度
26
预测值与患病率的关系
患病率（%）
+PV （%）
-PV （%）
99
99.9
16.0
95
99.7
50.0
90
ቤተ መጻሕፍቲ ባይዱ
99.4
68.0
80
99.0
83.0
70
98.0
24
预测值
诊断试验阳性阴性合计
病人 A C
A+C
非病人 B D
B+D
合计 A+B C+D
N
阳性预测值（positive predictive value）：又称预测阳性结果正确率，即在诊断试验阳性结果的人中，有该病的概率，也是真阳性占阳性结果总数和百分率。
阳性预测值＝ A 100% A B
130
360
+LR=7.6 -LR=0.07
+LR=93.48/12.31=7.6 -LR=6.52/87.69=0.07
29
似然比的特点和应用
比灵敏度和特异度更稳定，不受患病率的影响；用于估计疾病概率。更科学地描述诊断试验

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

诊断试验评价
诊断试验评价是医学统计学的一个重要领域，用于评估不同诊断试验
的准确性和可靠性。

在医学诊断中，准确地确定是否患有其中一种疾病对
于正确的治疗和预后非常重要。

不同的诊断试验包括实验室检验、影像学
检查和临床表现等，但它们的准确性会有所不同。

而正式的统计学方法可以用来评估诊断试验准确性。

其中，接受者操
作特征曲线（ROC）曲线被广泛用于评估治疗试验的准确性。

ROC曲线可
以反映不同敏感度和特异度的权衡关系。

曲线下面积（AUC）是评估ROC
曲线的一个指标，值越接近1表示试验准确性越高。

另一个常见的统计学方法是计算诊断试验的阳性和阴性似然比。

阳性
似然比是指在患有疾病的人中获得阳性结果的相对可能性，阴性似然比是
指在健康人中获得阴性结果的相对可能性。

似然比提供了一个数值来评估
试验结果的可靠性。

此外，还可以使用卡方检验来评估诊断试验的结果。

卡方检验用于比
较观察到的数据与期望数据之间的差异，可以帮助确定试验结果是否具有
统计学意义。

在进行诊断试验评价时，还需要考虑样本大小和疾病的流行率等因素。

样本大小对于准确性评估非常重要，较小的样本可能导致结果不可靠。

而
疾病的流行率也会影响敏感度和特异度的评估，因为试验结果可能存在偏差。

总之，诊断试验评价是医学统计学的一个重要领域，用于评估不同诊
断试验的准确性和可靠性。

通过使用严谨的统计学方法，可以帮助医生和
研究人员合理评估不同诊断试验的优劣，从而为临床决策提供科学依据。