ROC分析方法概要
roc指标用法

roc指标用法ROC指标,即受试者工作特征曲线,是评估分类器性能的一种重要指标。
它是由Edward F. Coddington和Friedman在1960年定义的,用于表示一类分类器在预测某个特定变量时的准确性。
ROC曲线可以显示模型在不同阈值下的准确性,同时可以用来度量模型的性能,比较多个模型的性能,以及评估一类分类器的整体性能。
ROC曲线由两个变量TPR(真正类率)和FPR(假正类率)共同组成,它们又称为感受性和特异性,分别指的是分类器对“真实”样本分类准确率以及预测“错误”样本分类准确率。
当我们将分类器(如Logistic回归分类器)的阈值从0增加至1时,TPR和FPR都会随之变化,而ROC曲线可绘制出TPR和FPR之间的关系。
ROC曲线能够提供许多有用的信息,帮助我们快速识别模型的优势和劣势。
它形象地展示了通过改变模型阈值,可以从整体得出的分类器的优劣。
因此,当我们研究一个模型的性能时,我们可以注意到,当TPR等于FPR时,1-TPR(即示性错误率)= FPR(假阳率),这表明分类器在某个阈值下等价于随机抽样。
ROC曲线还可以用来评估不同模型之间的性能。
通常,ROC曲线越靠近左上角,表示分类器的效果越好。
此外,ROC曲线上两个模型的曲线可以画在同一张图上,以便比较两者的性能。
当曲线位于另一条曲线的上方时,表明前者的性能优于后者。
ROC曲线的另一个有用的特性是AUC(曲线下面积),它描述了模型的准确性,其取值范围在0和1之间。
AUC越大,表明模型越好,最理想的情况下,AUC为1,表明模型完美拟合数据。
总而言之,ROC曲线应用非常广泛,用于评估分类器的准确率和性能,以及区分模型的优劣。
考虑到其高的可视性和客观性,它是诊断性模型的重要指标,广泛用于机器学习领域的实际应用。
ROC分析的基本原理

ROC分析的基本原理ROC分析是一种二分类模型评估方法,通过绘制接收者操作特征曲线(ROC曲线)来评估分类器的性能。
ROC曲线以真正例率(True Positive Rate,TPR)为纵轴,假正例率(False Positive Rate,FPR)为横轴,展示了分类器在不同阈值下的性能表现。
2.设置阈值:从最大预测概率开始,逐渐降低阈值。
3.计算TPR和FPR:根据当前阈值,计算分类器的TPR和FPR。
TPR的计算公式为TPR=TP/(TP+FN),其中TP为真正例数,FN为假反例数;FPR的计算公式为FPR=FP/(FP+TN),其中FP为假正例数,TN为真反例数。
4.绘制ROC曲线:将每个阈值下的TPR和FPR绘制在坐标系中,得到ROC曲线。
ROC曲线可以直观地展示分类器在不同阈值下的性能。
一般情况下,我们希望模型的TPR尽可能高,同时保持较低的FPR。
在ROC曲线上,离左上角越近的点代表模型性能越好,离对角线越远的点代表模型性能越差。
ROC曲线下方的面积(AUC值)可以作为一个标准指标用于比较分类器的性能。
ROC分析的优势在于它能够综合考虑不同阈值下的TPR和FPR,不同领域的研究者都可以通过ROC曲线来比较不同模型的性能。
此外,ROC分析能够对于样本不平衡的数据集进行评估,因为在极度不平衡的情况下,准确率和召回率可能不适合评估模型的性能。
然而,ROC分析也有一些局限性。
首先,ROC曲线只适用于二分类模型的评估。
其次,当样本集中正例和负例的比例相差悬殊时,ROC曲线往往会显示较好的性能,而实际上分类器的性能可能较差。
最后,对于多分类问题,ROC分析通常需要将多个类别进行二分类比较,可能会遇到多种组合的问题。
综上所述,ROC分析通过绘制ROC曲线来评估分类器的性能,能够综合考虑不同阈值下的TPR和FPR,且适用于样本不平衡的数据集。
然而,也需要注意其局限性,在使用时需结合实际情况进行综合评估。
第21章诊断试验的ROC分析

第21章诊断试验的ROC分析ROC(Receiver Operating Characteristic)曲线是用来评价诊断试验的有效性和准确性的一种图形化工具。
在医学领域,ROC分析常用于评估医学诊断试验的鉴别能力,并选择适当的切点来确定诊断的敏感性和特异性。
下面将详细介绍ROC分析的原理和应用。
首先,ROC曲线是由反映不同切点下的诊断准确性的敏感性(True Positive Rate)和特异性(False Positive Rate)组成的。
敏感性表示实际为阳性结果的患者中被正确诊断为阳性的比例,而特异性则表示实际为阴性结果的患者中被正确诊断为阴性的比例。
ROC曲线的横轴是1-特异性,纵轴是敏感性,曲线越靠近左上角,表示诊断试验的准确性越高。
ROC曲线可以通过画出不同切点下的敏感性和特异性组成。
对于一些切点,可以计算其敏感性和1-特异性,将计算结果作为坐标值绘制在ROC 曲线上。
通过变化切点的位置,可以得到一系列敏感性和特异性值,进而绘制出整个ROC曲线。
在ROC曲线上,我们关心的是曲线下面积(Area Under ROC Curve,AUC)。
AUC越大,表示诊断试验的准确性越高。
通常认为,AUC值大于0.9的诊断试验具有较高可信度,而AUC值小于0.7的试验则不太可靠。
ROC分析在医学诊断中的应用非常广泛。
例如,在肿瘤检测中,我们可以利用ROC曲线评估不同肿瘤标志物(如癌胚抗原、CA125等)的诊断效能,选择最合适的切点来判断是否患有肿瘤。
在传染病检测中,ROC分析可以评估不同检测方法的准确性,选择最佳的诊断指标。
此外,ROC分析也可以用于评估预测模型的性能,如心血管疾病风险预测模型等。
需要注意的是,ROC分析也有一些局限性。
首先,ROC曲线仅基于敏感性和特异性这两个指标,忽略了试验的灵敏度和特异度等其他评估指标。
其次,ROC曲线不能提供诊断的最佳切点,而只能提供一系列切点下的敏感性和特异性值,因此在临床实践中仍需要根据患者病情等因素综合考虑来确定最佳切点。
ROC曲线分析详细解释

ROC曲线分析详细解释(一)ROC曲线的概念受试者工作特征曲线(receiver operator characteristic curve, ROC 曲线),最初用于评价雷达性能,又称为接收者操作特性曲线。
ROC 曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。
传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。
ROC曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。
因此,ROC曲线评价方法适用的范围更为广泛。
(二)ROC曲线的主要作用1.ROC曲线能很容易地查出任意界限值时的对疾病的识别能力。
2.选择最佳的诊断界限值。
ROC曲线越靠近左上角,试验的准确性就越高。
最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。
3.两种或两种以上不同诊断试验对疾病识别能力的比较。
在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所代表的受试者工作最准确。
亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的 AUC最大,则哪一种试验的诊断价值最佳。
(三)ROC曲线分析的主要步骤1.ROC曲线绘制。
依据专业知识,对疾病组和参照组测定结果进行分析,确定测定值的上下限、组距以及截断点(cut-off point),按选择的组距间隔列出累积频数分布表,分别计算出所有截断点的敏感性、特异性和假阳性率(1-特异性)。
以敏感性为纵坐标代表真阳性率,(1-特异性)为横坐标代表假阳性率,作图绘成ROC曲线。
2.ROC曲线评价统计量计算。
ROC曲线下的面积值在1.0和0.5之间。
ROC指标使用技巧

ROC指标使用技巧ROC指标(Receiver Operating Characteristic)是一种用于评估分类模型性能的常用指标。
在机器学习中,分类是一项重要的任务,因此评估分类模型的性能对于选择最佳模型至关重要。
ROC曲线通过绘制真阳性率(True Positive Rate,TPR)和伪阳性率(False Positive Rate,FPR)的关系来衡量分类模型的性能。
以下是使用ROC指标的一些技巧:1.理解ROC曲线:ROC曲线是一个以TPR作为纵轴,以FPR作为横轴的二维图形。
它代表了在分类模型中不同的阈值下,真阳性率和伪阳性率之间的权衡。
ROC曲线越接近左上角(0,1)点,表示分类模型的性能越好。
2. 计算AUC:AUC(Area Under the Curve)是ROC曲线下的面积,是ROC曲线的一个重要性能度量。
AUC的取值范围为0到1,其中0.5表示模型的预测效果等同于随机预测,1表示模型的预测完全准确。
通常来说,AUC越接近1,模型的性能越好。
3.比较不同模型:ROC曲线和AUC是比较不同分类模型性能的有力工具。
在比较不同模型时,可以绘制它们的ROC曲线,并计算它们的AUC值。
通过比较不同模型的AUC值,可以选择最佳模型。
4.选择最佳阈值:分类模型在进行预测时通常需要一个阈值来决定样本的分类。
ROC曲线可以帮助我们选择最佳的阈值。
根据不同的应用场景和需求,可以在ROC曲线上选择不同的阈值,根据需要控制真阳性率和伪阳性率的权衡关系。
5.处理不平衡数据:在实际应用中,分类模型经常面对不平衡的数据集。
不平衡数据集指的是在分类任务中,不同类别之间的样本数量差别很大。
这时候,ROC曲线和AUC可以更好地评估模型的性能,因为它们不受数据分布的影响。
6. ROC曲线的绘制和AUC的计算:ROC曲线可以通过绘制一系列不同阈值下的TPR和FPR之间的关系来得到。
AUC则可以通过计算ROC曲线下的面积来得到。
诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法,用于确定患者是否患有某种疾病。
然而,单纯通过试验结果判断是否患病往往并不准确。
因此,我们需要评价诊断试验的准确性,并使用ROC分析来量化其性能。
1. 诊断试验的评价指标为了评估诊断试验的性能,我们需要引入以下四个指标:敏感度、特异度、阳性预测值和阴性预测值。
敏感度(Sensitivity)是指在真正患病的人中,试验能正确诊断出疾病的比例。
敏感度越高,表示试验具有较好的疾病检测能力。
特异度(Specificity)是指在真正健康的人中,试验能正确排除疾病的比例。
特异度越高,表示试验具有较好的非患病排除能力。
阳性预测值(Positive Predictive Value)是指在试验为阳性的情况下,患者真正患病的概率。
阳性预测值越高,表示试验结果与患病状态的相关性越高。
阴性预测值(Negative Predictive Value)是指在试验为阴性的情况下,患者真正健康的概率。
阴性预测值越高,表示试验结果与健康状态的相关性越高。
2. ROC曲线和AUC值为了综合评价诊断试验的准确性,我们引入了ROC曲线(Receiver Operating Characteristic Curve)和AUC值(Area Under Curve)。
ROC曲线是以敏感度为纵轴,以1-特异度为横轴绘制的曲线。
曲线上每一个点表示了在不同阈值下的敏感度和特异度。
ROC曲线越靠近左上角,表示试验性能越好。
AUC值是ROC曲线下面积的数值,范围在0.5到1之间。
AUC值越接近1,表示试验具有较高的准确性。
3. 如何进行ROC分析进行ROC分析通常需要以下步骤:(1)收集样本数据:包括疾病阳性和阴性样本,以及其相应的试验结果。
(2)计算敏感度和特异度:根据试验结果计算敏感度和特异度,并绘制ROC曲线。
(3)计算AUC值:根据ROC曲线计算AUC值。
(4)选择最佳阈值:根据需求和实际情况,选择最佳的阈值以平衡敏感度和特异度。
医学诊断试验评价的ROC分析

医学诊断试验评价的ROC分析ROC分析是一种用于评价二分类系统性能的方法。
在医学诊断中,通常将诊断结果分为阳性(患病)和阴性(未患病)两类。
ROC曲线是以灵敏度(True Positive Rate)为纵轴,以1-特异度(False Positive Rate)为横轴绘制的曲线。
曲线下面积(Area Under Curve,AUC)反映了试验的诊断准确性,AUC越大,说明试验的准确性越高。
ROC分析的基本步骤如下:1.收集数据:收集一组经过相关诊断试验测试的患者数据,包括患病与否的真实情况和试验结果。
2.绘制ROC曲线:根据患病与否的真实情况和试验结果计算出各个患病与否情况下的灵敏度和1-特异度,将这些点连接起来就可以得到ROC 曲线。
3.计算AUC:根据ROC曲线计算出曲线下面积,常用的计算方法有两种:直接计算法和近似计算法。
直接计算法是通过对多个小矩形的面积进行累加得到AUC,公式为AUC=sum((TP+TP')/2*(FP-FP')),其中TP和FP分别表示每个点的灵敏度和1-特异度,TP'和FP'表示下一个点的灵敏度和1-特异度。
近似计算法是通过曲线上多个点的线性插值得到AUC,公式为AUC=sum((TP+TP')/2*(FP-FP')),其中TP和FP分别表示每个点的灵敏度和1-特异度,TP'和FP'表示下一个点的灵敏度和1-特异度。
4.评价:根据AUC的大小评价诊断试验的准确性,一般认为AUC在0.5-0.7之间的试验判定为低准确性,0.7-0.9之间的试验判定为中等准确性,0.9以上的试验判定为高准确性。
ROC分析的优点是不受患病率的影响,适用于不同患病率的疾病。
此外,ROC曲线上任意一个点都可以作为试验的阈值,根据需要选择不同的阈值,灵活性较大。
尽管ROC分析是一种常用的方法,但也存在一些局限性。
首先,ROC 曲线只适用于二分类问题,对于多分类问题需要使用其他方法。
ROC 分析的基本原理

ROC分析的基本原理宇传华徐勇勇ROC是受试者工作特征或相对工作特征的缩写后来应用于雷达信号观察能力的评价Lusted首次提出了ROC分析可用于医学决策评价该方法广泛用于医学诊断性能的评价[]2ʵÑéÊÒҽѧÓÈÆäÊÇҽѧӰÏñÕï¶Ï׼ȷÐÔµÄÆÀ¼ÛÈç¶ÔÕÕÓ벡ÀýÕý³£ÓëÒì³£Æä×ÊÁÏ¿ÉÁгɱí1的四格表形式[3]ÁéÃô¶È¼ÆË㹫ʽ¼û±í1这几个指标均可不同程度反映诊断的准确性它很大程度上依赖患病率完全无价值地诊断所有样本为阴性其次相同的正确百分率可能有十分不同的假阴性和假阳性它也受诊断阈值的限制它们的值越高灵敏度是病例被正确诊断为阳性的比例true positive fraction/rateÒ²½ÐÕæÒõÐÔÂÊ.1-特异度false positive fraction/rate±È½ÏÁ½¸öÕï¶Ïϵͳʱ¶øÁíÒ»¸öÌØÒì¶È¸ß´Ëʱ¿É½«ÁéÃô¶ÈºÍÌØÒì¶È½áºÏ»ñµÃ¶à¶ÔÁéÃô¶ÈºÍ»æÖÆROC曲线×四格表表1 诊断资料22诊断结果病例对照合计a(真阳性) b a+bc(假阴性真阴性TPF假阳性率]=1第四军医大学卫生统计学教研室西安 710032 疾病 疾病 合计 Disease(+) Disease(-) Total试验(+) 真阳性 假阳性 试验阳性数 Test(+) True positives False positives Test positives试验(-) 假阴性 真阴性 试验阴性数 Test(-) False negatives True negatives Test negatives合计 实际病人数 实际非病人数 所有受试者 Total Disease positives Disease negatives All subjects2 ROC分析资料收集与整理一个诊断系统获得的原始资料可记录成连续性和离散性两种形式它是利用仪器为了叙述的方便其检验结果为8.29, 6.24, 4.61, 1.77Æä¼ìÑé½á¹ûΪ15.90, 13.35, 12.87, 10.22, 5.01ÒÔǰ8个数据的每一个作为诊断阈值(或截断点)СÓÚ¸ÃãÐֵΪÒõÐÔ¶¼¿ÉÕûÀí³ÉÀàËÆ±í1的四格表FPF,TPF(0/4,2/5)(0/4,4/5)(2/4,4/5)(3/4,5/5)Á½¸ö×éµÄÑù±¾Á¿ÍùÍùºÜ´óÒÔ×éÖÐֵΪÕï¶ÏãÐÖµ×éÊý-1Ò²¿É¸ù¾ÝÁÙ´²ÐèҪȡÈô¸É¸öÕï¶ÏãÐÖµ³£½«Õï¶Ï½á¹û»®·ÖΪÀàÀà¿ÉÄÜÕý³£¿ÉÄÜÒì³£·Ö±ð¼ÇΪÀýÈçÆäÖÐÓÐ58份正常一影像工作者对这些CT影像进行分类 表2 109份CT影像分类诊断分类实际情况1,2,,肯定异常对于可从分类高到低以前即分类为置信阈计算ROC 工作点该类以下例数的和为阴性如以表2分类4为置信阈时+11=13异常组阳性例数为33+11=44同样3FPF,TPF(0.3296,0.9020)假设正常组和异常组均服从正态分布图中左边钟型曲线为正常组同时采用4个置信阈将实验结果分为5类即分类越高置信阈越宽松阳性决策的置信度越低也可类似理解同时采用4个置信阈分类1234分类5阳性决策置信度低高图 1 5分类等级资料图解3 ROC 曲线的构建以假阳性率为横轴TPF ºáÖáÓë×ÝÖ᳤¶ÈÏàµÈÔÚͼÖн«ROC 工作点标出构建光滑曲线需要假设对照组和病例组服从某种分布直接用参数产生注意曲线一定通过(0,0)和(1,1)这两点而特异度为而特异度为理论上FPF=0然后水平到达右上角是一条从原点到右上角的对角线表2资料对应的ROC 曲线见图2FPFT P FÃèÊöÁËÏà·´Á½ÖÖ״̬¼äÕï¶ÏϵͳµÄÅбðÄÜÁ¦»òÖÃÐÅãÐÑϸñµÄ±ê×¼²úÉú½ÏµÍµÄÁéÃô¶ÈºÍ½Ï¸ßµÄÌØÒì¶È¿íËɵıê×¼²úÉú½Ï¸ßµÄÁéÃô¶ÈºÍ½ÏµÍµÄÌØÒì¶ÈÈç¹û±È½ÏµÄÕï¶ÏϵͳÇúÏß²»½»²æÈç¹ûÇúÏß½»²æ½áºÏͳ¼ÆÑ§¼ìÑéÅÐ¶ÏÆäÕï¶ÏÐÔÄÜROC 曲线下面积理论上完善的诊断为1半参数和参数方法Wilcoxon非参数法和最大似然估计参数法可根据二项分布标准误计算公式n pp Sp) 1(−=计算FPF和TPF的标准误p=FPF对于TPF n=病例组总例数的标准误为(0.0548,0.0023)0.0548)0.0023)]对于诊断系统的准确性评价,首先应知道受试者(人即哪些是对照组划分它们的标准就是金标准跟踪随访尸体解剖等金标准但是它们应比评价的诊断系统更可靠5.3 最佳工作点的选择阳性似然比为真阳性率与假阳性率之比TPF/FPF约登指数为真阳性率与假阳性率之差TPF-FPF一般选择阳性似然比[]4或约登指数[5]最大者为最佳工作点[(1-P)/P]计算最佳工作点的斜率B和P分别表示花费在假定对病例组实施治疗这一表达式表示治疗疾病的花费和收益之比与(1-患病率)和患病率之比的乘积从(FPF,TPF)=(0,0)到(1,1)´Ó±í´ïʽ¿ÉÒÔ¿´³öÊÕÒæÉÙÔòбÂÊ´óÈç¹û¼²²¡ÖÎÁÆ»¨·ÑÉÙ»ò»¼²¡Âʸß×î¼Ñ¹¤×÷µã½Ó½ü(1,1确保了假阴性的减少Metz CE, Herman BA, Shen JH. Maximum-likelihood estimation of receiver operating characteristic(ROC) curves from continously-distributed data. Stat Med,1998, in press.2 Metz CE. Some practical issues of experimental design and data analysis in radiological ROC studies. Invest Radiol 1989;24:234-245. 3 章扬熙. 临床流行病学(第六讲):诊断试验研究(续) . 中华流行病学杂志1997,18(3):177.4 Feinstein AR. Clinical epidemiology: architecture of clinical research. WB Saunders Company,1985,601-632.5 刘杰,林一帆,张沥等. 图象自动分析检测MG7抗原表达预测胃癌高危价值探讨. 中华预防医学杂志1996;30(5):286.6 Dwyer AJ. In pursuit of a piece of the ROC. Radiology 1997;202:621-625.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章ROC曲线分析概要本文先介绍了ROC理论的一些基础知识如特异度和灵敏度等,然后简要介绍了非参数ROC分析方法,并建立了ROC模型。
最后介绍了ROC曲线及在R软件中的绘制。
2.1 ROC分析的基本要素ROC分析的基本要素包括真阳性和假阳性也称灵敏度和特异度,以及“金标准”“金标准”划分被测试者的真实状态为对照组和病例组两类。
常见的金标准有跟踪随访、活组织检查、尸体解剖、手术探查等。
虽然“金标准”没有必要是十全十美的,但“金标准”应与评价的诊断系统无关,而且比要评价的诊断系统更可靠。
“金标准”不够完美时,可用采用Bayesian、模糊金标准、EM估计等方法解决。
对按照“金标准”确定的二分类总体,对照组和病例组分别用阴性和阳性表示诊断试验结果。
假定总体样本量是N,诊断试验的可能结果总共有四种:被测试者患病且被正确诊断为患病者,被测试者无病且被错误诊断为患病者,被测试者无病且被正确诊断为无病者,被测试者无病且被错误诊断为患病者。
我们可以用一个2×2的列联表来表示它们之间的关系。
TPR=a+c FPR=b+d在医学研究中,诊断试验准确度指标最常用的是灵敏度与特异度。
灵敏度(sensitivity),也叫真阳率(true positive rate,即TPR)是被测试者患病且被正确诊断为患病者的样本量在阳性总体中占的比例。
灵敏度值越大,假阴率越小。
据表2-1 其计算公式是:灵敏度(sensitivity) = 真阳率(TPR) = 1 −假阴率(FNR)= aa+c标准误为:SE TPR=√ac/(a+c)3特异度(specificity),也叫真阴率(true non-positive rate,即TNPR),是受试者无病且被正确诊断为无病者的样本量占阴性总体的比例。
假阳率(false positive rate,即FPR) = 1−特异度特异度值越大,假阳率越小。
据表2-1 其计算公式是:特异度(specificity) =真阴率(TNPR) = 1−假阳率(FPR) = db+d 标准误为:SE FPR=√bd/(b+d)3假设二分类总体均服从正态分布, TPR、FPR、TNPR 和FNPR之间的关系可以用图2-1来描述。
图中 x = c 为截断点(诊断阈值),α为假阳率(FPR),β为假阴率(FNPR)。
2.2 ROC准确性评价指标的优越性诊断试验的准确性评价指标有正确率、灵敏度和特异度等。
它们虽然都可以反映诊断的准确性,但评价的效果不是很理想。
正确率是被测试者被正确诊断的例数和所占总体的百分数。
其计算公式是:正确百分率=a+dN×100%标准误是:SE正确百分率=√(a+d)(b+c)/N3正确百分率的不足之处:1.很大程度上依赖患病率。
例如,虽然患病率是5%,如果判定所有样本为健康者,也有可能有95%的正确百分率;2.受诊断阈值的限制;3.没有表示出假阳性和假阴性错误诊断所占的比例,没有唯一性表示,即使有相同的正确百分率的两个总体,也可能有十分不同的假阳性和假阴性。
基于此,单独计算灵敏度和特异度,以弥补正确率的不足,如果两个指标的值越高,诊断评价效果也就越好,其实不然。
在对诊断系统做出比较时,如果单独使用灵敏度与特异度,就会存在很大的不足:这两个指标依赖于诊断阈值(或截断点),改变诊断阈值可以增加诊断的灵敏度,但同时也减少了特异度;反之,如果增加诊断的特异度,则需要以减少灵敏度为代价。
另外,有人提出的Youden 指数、阳性似然比、:真阳率与假阳率之比)和阴性似然比等等。
Youden指数是指真阳性率与假阳性率之差,计算公式为:Youden指数=灵敏度+特异度-1=真阳性率-假阳性率=TPR−FPR==aa+c −bb+d其标准误为:SEYouden指数=ac(a+c)3+bd(b+d)3阳性似然比(positive likelihood ratio 简写为:LR+)是真阳性率与假阳性率之比,即灵敏度与(1-特异度)的比值,它是ROC曲线某工作点对应的斜率。
阴性似然比(negative likelihood ratio 简写为:LR-)是假阴性率与真阴性率之比,即(1-敏感度)与特异度的比值。
这些诊断指标综合考虑了灵敏度和特异度,但一个指标只对应于一个诊断阈值。
当诊断阈值改变时,会得到不同的指标值,给诊断准确度的比较带来不便。
所以一般选择阳性似然比或Youden指数最大者为最佳工作点。
在评价整个诊断方法的准确性时用ROC 分析,当改变诊断阈值时,可同时获得灵敏度和特异度,也就可以获得TPR 和FPR 值。
ROC 曲线是以FPR 为横坐标和以TPR 为纵坐标绘制而成,并且ROC 曲线下的面积大小衡量了诊断系统的判别能力。
2.3 ROC曲线的构建以假阳性率(FPR)为横坐标、真阳性率(TRP)为纵坐标,形成正方形,在图上将ROC工作点标出,并用线条将这些低昂依序连接起来构建不光滑的ROC 曲线。
构建光滑的曲线需要交涉对照组和病例组服从于某一分布(如正态分布、Gamma分布等),用曲线拟合技术估计其参数,直接用参数产生曲线。
无论资料类型如何,曲线一定通过(0,0)和(1,1)两点,这两个点对应着灵敏度=0,特异度=1和灵敏度=1,特异度=0.理论上诊断实验都有TPR=1,FPR=0。
完全无价值的诊断为TPR=FPR,这条线条称为几率线(guessing line 或 chance line),也称为无信息线(line of no information);ROC曲线对诊断的准确性采用同一尺度直观地体现出来,描述了诊断实验对正反两种状态的判别能力。
曲线上每一个点通过改变其诊断阀值(截断点)而得,是灵敏度和特异度的折衷结果。
提高诊断标准则产生较低的灵敏度和较高的特异度;降低诊断标准则产生较高的灵敏度和较低的特异度。
如果比较两个诊断方法的效果,则较高的ROC曲线具有较好的诊断性能,如果曲线交叉,则通过计算曲线下面积进行进一步比较。
)反映诊断试验的准确度,它可以被看成是正确用ROC曲线下面积(记为AZ=0.5;完美的决策的概率。
该面积的取值范围为(0.5,1),完全无价值的诊断AZ诊断A=1。
习惯上认为ROC曲线下面积为0.50~0.70,表示诊断的准确度较低;Z在0.70~0.90之间表示诊断的准确度中等;面积达到0.90以上则表示诊断的准确度较高。
2.4 ROC 曲线的拟合方法ROC 曲线的获得是通过两个不同的总体(正常组和异常组),它的横轴和纵轴(假阳性率和真阳性率)存在相关关系,因此不能假定它们来自单一的总体,不能用一般非线性模型拟合。
ROC 曲线拟合方法主要有双正态模型参数法和非参数法。
除了主要的ROC 分析方法外,有序回归模型(包括位置尺度模型、比例优势模型、GEE 法)、COX 比例风险模型等也可以拟合ROC 曲线、计算ROC 曲线下面积以及标准误。
这些模型还考虑了协变量的混杂效应。
2.4.1双正态模型参数法双正态模型假定正常组和异常组都服从正态分布。
当前该模型在ROC 分析上比较完善,可以处理不同的ROC 资料,获得光滑的ROC 曲线。
当样本量较大时,有序分类数大于5时,该模型获得的结果是比较可靠的。
但是当样本量较少时,双正态模型拟合会产生退化资料,ML 估计会迭代不收敛。
按“金标准”将实验对象划分为正常组和异常组,假设它们分别服从总体均值为μ0、μ1(μ0<μ1),方差为σ02、σ12的正态分布N(μ0,σ02)、N(μ1,σ12),对任意诊断阀值(截断点)t,假阳性率为:FPR =Pr{x 0>t|正常}=1−Φ(t −μ0σ0) 真阳性率为:TPR =Pr{x 1>t|异常}=1−Φ(t −μ1σ1) 其中x 0、x 1分别表示正常组和异常组的实验测量值或有序分类之;t 为截断点,实验测量值x>t,诊断为阳性,x ≤t 诊断为阴性;Φ(·)为标准正态累积分布函数。
令t =μ0+σ0Φ−1(1−FPR),则有:TPR =Φ[(μ1−μ0σ1)+σ0σ1Φ−1(FPR )]令a =μ1−μ0σ1,b = σ0σ1,则上式可写为:TPR =Φ[a +b Φ−1(FPR ),0≤FPR ≤1其中Φ−1(⋅)为标准正态离差值。
整个ROC 曲线下面积为:A Z =Φ[a √1+b 2]参数a 、b 通过极大似然法(maximum likelihood ,ML )估计。
2.4.2 非参数ROC 拟合方法非参数法主要有:Hanley和McNeil法、Delong和Clarke-Pearson法。
非参数法对正常组和异常组的分布没有要求,它们可以充分利用所有的截断点,对连续性样本量没有大小的显著,不会出现计算结果不收敛的情况。
当截断点(或有序分类)大于5时,结果比较理想,当截断点不断增加时,ROC曲线将逐渐向光滑参数曲线靠拢。
Hanley和McNeil非参数法假设正常组的观察值个数为n,记作x1j(j=1,2,⋯,n0);异常组的观察值个数为n1,记作x0i(i=1,2,⋯,n1)。
异常组的观察值更大,根据Wilcoxon Mann-Whitney统计量,ROX曲线下面积(A Z)等于异常组每个观测值大于正常组每个观测值的概率。
即A Z=1n1n0∑∑ψ(x0i,x1j)n1i=1n0j=1ψ(x0i ,x1j)={1 x1j>x0i0.5 x1j=x0i0 x1j<x0iA Z的标准误为:SE(A Z)=√A Z(1−A Z)+(n1−1)(Q1−A Z2)+(n0−1)(Q2−A Z2)n1n0其中Q1是两个随机随着的异常组观测值比一个随机选择的正常组观察值都更大可能分类为异常的概率。
Q2是一个随机随着的异常组观测值比两个随机选择的正常组观察值都更大可能分类为异常的概率。
2.5 基于非参数法的ROC分析基于本文实证分析采用的是非参数方法的ROC模型,因此将在本小结着重介绍下非参数法的ROC分析。
2.51等级变量的非参数ROC分析通常情况下,诊断系统获得的原始资料的记录有离散型和连续型两种形式。
许多生物医学诊断试验的测量工具是连续型的,如血清抗原和酶浓度;医学影像诊断试验的诊断结果是离散型的。
对于不同的形式,ROC曲线估计方法是相同的,我们以离散型诊断结果为例。
如果将诊断指标以有序分类的方式分成k类,k = 1, … , K。
其中1类别表示完全没患病,K类别表示肯定患病。
假设对于每一个分类类别Y,有一个隐藏的连续决策变量X,将结果划分到第k类中,如果决策变量X在区间(τk−1,τk)中,k = 1, … , K; τ0=−∞, τk=+∞;即当τk−1<X<τk,则Y=k。