ROC分析方法概要

合集下载

ROC曲线分析详细解释

ROC曲线分析详细解释（一）ROC曲线的概念受试者工作特征曲线（receiver operator characteristic curve, ROC 曲线），最初用于评价雷达性能，又称为接收者操作特性曲线。

ROC 曲线是根据一系列不同的二分类方式（分界值或决定阈），以真阳性率（灵敏度）为纵坐标，假阳性率（1-特异度）为横坐标绘制的曲线。

传统的诊断试验评价方法有一个共同的特点，必须将试验结果分为两类，再进行统计分析。

ROC曲线的评价方法与传统的评价方法不同，无须此限制，而是根据实际情况，允许有中间状态，可以把试验结果划分为多个有序分类，如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。

因此，ROC曲线评价方法适用的范围更为广泛。

（二）ROC曲线的主要作用1.ROC曲线能很容易地查出任意界限值时的对疾病的识别能力。

2.选择最佳的诊断界限值。

ROC曲线越靠近左上角,试验的准确性就越高。

最靠近左上角的ROC曲线的点是错误最少的最好阈值，其假阳性和假阴性的总数最少。

3.两种或两种以上不同诊断试验对疾病识别能力的比较。

在对同一种疾病的两种或两种以上诊断方法进行比较时，可将各试验的ROC曲线绘制到同一坐标中，以直观地鉴别优劣，靠近左上角的ROC曲线所代表的受试者工作最准确。

亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较，哪一种试验的 AUC最大，则哪一种试验的诊断价值最佳。

（三）ROC曲线分析的主要步骤1.ROC曲线绘制。

依据专业知识，对疾病组和参照组测定结果进行分析，确定测定值的上下限、组距以及截断点（cut-off point），按选择的组距间隔列出累积频数分布表，分别计算出所有截断点的敏感性、特异性和假阳性率（1-特异性）。

以敏感性为纵坐标代表真阳性率，（1-特异性）为横坐标代表假阳性率，作图绘成ROC曲线。

2.ROC曲线评价统计量计算。

ROC曲线下的面积值在1.0和0.5之间。

ROC分析的基本原理

ROC分析的基本原理ROC分析是一种二分类模型评估方法，通过绘制接收者操作特征曲线（ROC曲线）来评估分类器的性能。

ROC曲线以真正例率（True Positive Rate，TPR）为纵轴，假正例率（False Positive Rate，FPR）为横轴，展示了分类器在不同阈值下的性能表现。

2.设置阈值：从最大预测概率开始，逐渐降低阈值。

3.计算TPR和FPR：根据当前阈值，计算分类器的TPR和FPR。

TPR的计算公式为TPR=TP/(TP+FN)，其中TP为真正例数，FN为假反例数；FPR的计算公式为FPR=FP/(FP+TN)，其中FP为假正例数，TN为真反例数。

4.绘制ROC曲线：将每个阈值下的TPR和FPR绘制在坐标系中，得到ROC曲线。

ROC曲线可以直观地展示分类器在不同阈值下的性能。

一般情况下，我们希望模型的TPR尽可能高，同时保持较低的FPR。

在ROC曲线上，离左上角越近的点代表模型性能越好，离对角线越远的点代表模型性能越差。

ROC曲线下方的面积（AUC值）可以作为一个标准指标用于比较分类器的性能。

ROC分析的优势在于它能够综合考虑不同阈值下的TPR和FPR，不同领域的研究者都可以通过ROC曲线来比较不同模型的性能。

此外，ROC分析能够对于样本不平衡的数据集进行评估，因为在极度不平衡的情况下，准确率和召回率可能不适合评估模型的性能。

然而，ROC分析也有一些局限性。

首先，ROC曲线只适用于二分类模型的评估。

其次，当样本集中正例和负例的比例相差悬殊时，ROC曲线往往会显示较好的性能，而实际上分类器的性能可能较差。

最后，对于多分类问题，ROC分析通常需要将多个类别进行二分类比较，可能会遇到多种组合的问题。

综上所述，ROC分析通过绘制ROC曲线来评估分类器的性能，能够综合考虑不同阈值下的TPR和FPR，且适用于样本不平衡的数据集。

然而，也需要注意其局限性，在使用时需结合实际情况进行综合评估。

第21章诊断试验的ROC分析

第21章诊断试验的ROC分析ROC（Receiver Operating Characteristic）曲线是用来评价诊断试验的有效性和准确性的一种图形化工具。

在医学领域，ROC分析常用于评估医学诊断试验的鉴别能力，并选择适当的切点来确定诊断的敏感性和特异性。

下面将详细介绍ROC分析的原理和应用。

首先，ROC曲线是由反映不同切点下的诊断准确性的敏感性（True Positive Rate）和特异性（False Positive Rate）组成的。

敏感性表示实际为阳性结果的患者中被正确诊断为阳性的比例，而特异性则表示实际为阴性结果的患者中被正确诊断为阴性的比例。

ROC曲线的横轴是1-特异性，纵轴是敏感性，曲线越靠近左上角，表示诊断试验的准确性越高。

ROC曲线可以通过画出不同切点下的敏感性和特异性组成。

对于一些切点，可以计算其敏感性和1-特异性，将计算结果作为坐标值绘制在ROC 曲线上。

通过变化切点的位置，可以得到一系列敏感性和特异性值，进而绘制出整个ROC曲线。

在ROC曲线上，我们关心的是曲线下面积（Area Under ROC Curve，AUC）。

AUC越大，表示诊断试验的准确性越高。

通常认为，AUC值大于0.9的诊断试验具有较高可信度，而AUC值小于0.7的试验则不太可靠。

ROC分析在医学诊断中的应用非常广泛。

例如，在肿瘤检测中，我们可以利用ROC曲线评估不同肿瘤标志物（如癌胚抗原、CA125等）的诊断效能，选择最合适的切点来判断是否患有肿瘤。

在传染病检测中，ROC分析可以评估不同检测方法的准确性，选择最佳的诊断指标。

此外，ROC分析也可以用于评估预测模型的性能，如心血管疾病风险预测模型等。

需要注意的是，ROC分析也有一些局限性。

首先，ROC曲线仅基于敏感性和特异性这两个指标，忽略了试验的灵敏度和特异度等其他评估指标。

其次，ROC曲线不能提供诊断的最佳切点，而只能提供一系列切点下的敏感性和特异性值，因此在临床实践中仍需要根据患者病情等因素综合考虑来确定最佳切点。

ROC分析

表2
ECG诊断结果阳性阴性合计
ECG诊断试验的结果
心肌梗塞
出现 416(TP) 104(FN) 520
不出现 9（FP） 171（TN） 180
合 425 275
计
700(N)
灵敏度（Sensitivity） Sen P(T | D ) TP (TP FN) ＝416/520＝0.8
诊断准确度较低（ <0.7 ）
11
ï Ï Õ ¶ × ¼ È ·¶ È Ö Ð µ È £ ¨ 0.7~0.9 £ ©
0.8 1.0 FPR
0.8 1.0 FPR
（> 0.9 ）诊断准确度较高
ROC曲线的主要作用
1.ROC曲线能很容易地查出任意界限值时的对疾病的识别能力。 2.选择最佳的诊断界限值。ROC曲线越靠近左上角,试
验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值，其假阳性和假阴性的总数最少。
12
ROC曲线的主要作用
3.两种或两种以上不同诊断试验对疾病识别能力的比较。
在对同一种疾病的两种或两种以上诊断方法进行比较时，可将各试验的ROC曲线绘制到同一坐标中，以直观地鉴别优劣，靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较，哪一种试验的 AUC最大，则哪一种试验的诊断价值最佳。
合计
N
灵敏度
◈灵敏度(sensitivity)(真阳性率) 即实际有病而按该诊断（筛检）标准被正确地判为有病的百分率
A 灵敏度 100% AC
5
特异度
◈特异度(specificity)(真阴性率) 实际无病按该诊断标准被正确地判为无病的百分率

ROC指标使用技巧

ROC指标使用技巧ROC指标（Receiver Operating Characteristic）是一种用于评估分类模型性能的常用指标。

在机器学习中，分类是一项重要的任务，因此评估分类模型的性能对于选择最佳模型至关重要。

ROC曲线通过绘制真阳性率（True Positive Rate，TPR）和伪阳性率（False Positive Rate，FPR）的关系来衡量分类模型的性能。

以下是使用ROC指标的一些技巧：1.理解ROC曲线：ROC曲线是一个以TPR作为纵轴，以FPR作为横轴的二维图形。

它代表了在分类模型中不同的阈值下，真阳性率和伪阳性率之间的权衡。

ROC曲线越接近左上角（0,1）点，表示分类模型的性能越好。

2. 计算AUC：AUC（Area Under the Curve）是ROC曲线下的面积，是ROC曲线的一个重要性能度量。

AUC的取值范围为0到1，其中0.5表示模型的预测效果等同于随机预测，1表示模型的预测完全准确。

通常来说，AUC越接近1，模型的性能越好。

3.比较不同模型：ROC曲线和AUC是比较不同分类模型性能的有力工具。

在比较不同模型时，可以绘制它们的ROC曲线，并计算它们的AUC值。

通过比较不同模型的AUC值，可以选择最佳模型。

4.选择最佳阈值：分类模型在进行预测时通常需要一个阈值来决定样本的分类。

ROC曲线可以帮助我们选择最佳的阈值。

根据不同的应用场景和需求，可以在ROC曲线上选择不同的阈值，根据需要控制真阳性率和伪阳性率的权衡关系。

5.处理不平衡数据：在实际应用中，分类模型经常面对不平衡的数据集。

不平衡数据集指的是在分类任务中，不同类别之间的样本数量差别很大。

这时候，ROC曲线和AUC可以更好地评估模型的性能，因为它们不受数据分布的影响。

6. ROC曲线的绘制和AUC的计算：ROC曲线可以通过绘制一系列不同阈值下的TPR和FPR之间的关系来得到。

AUC则可以通过计算ROC曲线下的面积来得到。

诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法，用于确定患者是否患有某种疾病。

然而，单纯通过试验结果判断是否患病往往并不准确。

因此，我们需要评价诊断试验的准确性，并使用ROC分析来量化其性能。

1. 诊断试验的评价指标为了评估诊断试验的性能，我们需要引入以下四个指标：敏感度、特异度、阳性预测值和阴性预测值。

敏感度（Sensitivity）是指在真正患病的人中，试验能正确诊断出疾病的比例。

敏感度越高，表示试验具有较好的疾病检测能力。

特异度（Specificity）是指在真正健康的人中，试验能正确排除疾病的比例。

特异度越高，表示试验具有较好的非患病排除能力。

阳性预测值（Positive Predictive Value）是指在试验为阳性的情况下，患者真正患病的概率。

阳性预测值越高，表示试验结果与患病状态的相关性越高。

阴性预测值（Negative Predictive Value）是指在试验为阴性的情况下，患者真正健康的概率。

阴性预测值越高，表示试验结果与健康状态的相关性越高。

2. ROC曲线和AUC值为了综合评价诊断试验的准确性，我们引入了ROC曲线（Receiver Operating Characteristic Curve）和AUC值（Area Under Curve）。

ROC曲线是以敏感度为纵轴，以1-特异度为横轴绘制的曲线。

曲线上每一个点表示了在不同阈值下的敏感度和特异度。

ROC曲线越靠近左上角，表示试验性能越好。

AUC值是ROC曲线下面积的数值，范围在0.5到1之间。

AUC值越接近1，表示试验具有较高的准确性。

3. 如何进行ROC分析进行ROC分析通常需要以下步骤：（1）收集样本数据：包括疾病阳性和阴性样本，以及其相应的试验结果。

（2）计算敏感度和特异度：根据试验结果计算敏感度和特异度，并绘制ROC曲线。

（3）计算AUC值：根据ROC曲线计算AUC值。

（4）选择最佳阈值：根据需求和实际情况，选择最佳的阈值以平衡敏感度和特异度。

ROC 分析的基本原理

ROC分析的基本原理宇传华徐勇勇ROC是受试者工作特征或相对工作特征的缩写后来应用于雷达信号观察能力的评价Lusted首次提出了ROC分析可用于医学决策评价该方法广泛用于医学诊断性能的评价[]2ÊµÑéÊÒÒ½Ñ§ÓÈÆäÊÇÒ½Ñ§Ó°ÏñÕï¶Ï×¼È·ÐÔµÄÆÀ¼ÛÈç¶ÔÕÕÓë²¡ÀýÕý³£ÓëÒì³£Æä×ÊÁÏ¿ÉÁÐ³É±í1的四格表形式[3]ÁéÃô¶È¼ÆËã¹«Ê½¼û±í1这几个指标均可不同程度反映诊断的准确性它很大程度上依赖患病率完全无价值地诊断所有样本为阴性其次相同的正确百分率可能有十分不同的假阴性和假阳性它也受诊断阈值的限制它们的值越高灵敏度是病例被正确诊断为阳性的比例true positive fraction/rateÒ²½ÐÕæÒõÐÔÂÊ.1-特异度false positive fraction/rate±È½ÏÁ½¸öÕï¶ÏÏµÍ³Ê±¶øÁíÒ»¸öÌØÒì¶È¸ß´ËÊ±¿É½«ÁéÃô¶ÈºÍÌØÒì¶È½áºÏ»ñµÃ¶à¶ÔÁéÃô¶ÈºÍ»æÖÆROC曲线×四格表表1 诊断资料22诊断结果病例对照合计a(真阳性) b a+bc(假阴性真阴性TPF假阳性率］＝１第四军医大学卫生统计学教研室西安 710032　疾病　疾病　合计　　Disease(+) Disease(-) Total试验(+) 真阳性　假阳性　试验阳性数　Test(+) True positives False positives Test positives试验(-) 假阴性　真阴性　试验阴性数　Test(-) False negatives True negatives Test negatives合计　实际病人数　实际非病人数　所有受试者　Total Disease positives Disease negatives All subjects2 ROC分析资料收集与整理一个诊断系统获得的原始资料可记录成连续性和离散性两种形式它是利用仪器为了叙述的方便其检验结果为8.29, 6.24, 4.61, 1.77Æä¼ìÑé½á¹ûÎª15.90, 13.35, 12.87, 10.22, 5.01ÒÔÇ°8个数据的每一个作为诊断阈值(或截断点)Ð¡ÓÚ¸ÃãÐÖµÎªÒõÐÔ¶¼¿ÉÕûÀí³ÉÀàËÆ±í1的四格表FPF,TPF(0/4,2/5)(0/4,4/5)(2/4,4/5)(3/4,5/5)Á½¸ö×éµÄÑù±¾Á¿ÍùÍùºÜ´óÒÔ×éÖÐÖµÎªÕï¶ÏãÐÖµ×éÊý-1Ò²¿É¸ù¾ÝÁÙ´²ÐèÒªÈ¡Èô¸É¸öÕï¶ÏãÐÖµ³£½«Õï¶Ï½á¹û»®·ÖÎªÀàÀà¿ÉÄÜÕý³£¿ÉÄÜÒì³£·Ö±ð¼ÇÎªÀýÈçÆäÖÐÓÐ58份正常一影像工作者对这些CT影像进行分类　表2 109份CT影像分类诊断分类实际情况1,2,,肯定异常对于可从分类高到低以前即分类为置信阈计算ROC 工作点该类以下例数的和为阴性如以表2分类4为置信阈时+11=13异常组阳性例数为33+11=44同样３FPF,TPF(0.3296,0.9020)假设正常组和异常组均服从正态分布图中左边钟型曲线为正常组同时采用4个置信阈将实验结果分为5类即分类越高置信阈越宽松阳性决策的置信度越低也可类似理解同时采用４个置信阈分类１２３４分类５阳性决策置信度低高图 1 5分类等级资料图解3 ROC 曲线的构建以假阳性率为横轴TPF ºáÖáÓë×ÝÖá³¤¶ÈÏàµÈÔÚÍ¼ÖÐ½«ROC 工作点标出构建光滑曲线需要假设对照组和病例组服从某种分布直接用参数产生注意曲线一定通过(0,0)和(1,1)这两点而特异度为而特异度为理论上ＦＰＦ＝０然后水平到达右上角是一条从原点到右上角的对角线表2资料对应的ROC 曲线见图2FPFT P FÃèÊöÁËÏà·´Á½ÖÖ×´Ì¬¼äÕï¶ÏÏµÍ³µÄÅÐ±ðÄÜÁ¦»òÖÃÐÅãÐÑÏ¸ñµÄ±ê×¼²úÉú½ÏµÍµÄÁéÃô¶ÈºÍ½Ï¸ßµÄÌØÒì¶È¿íËÉµÄ±ê×¼²úÉú½Ï¸ßµÄÁéÃô¶ÈºÍ½ÏµÍµÄÌØÒì¶ÈÈç¹û±È½ÏµÄÕï¶ÏÏµÍ³ÇúÏß²»½»²æÈç¹ûÇúÏß½»²æ½áºÏÍ³¼ÆÑ§¼ìÑéÅÐ¶ÏÆäÕï¶ÏÐÔÄÜROC 曲线下面积理论上完善的诊断为1半参数和参数方法Wilcoxon非参数法和最大似然估计参数法可根据二项分布标准误计算公式n pp Sp) 1(−=计算FPF和TPF的标准误ｐ＝ＦＰＦ对于TPF n=病例组总例数的标准误为(0.0548,0.0023)0.0548)0.0023)]对于诊断系统的准确性评价,首先应知道受试者(人即哪些是对照组划分它们的标准就是金标准跟踪随访尸体解剖等金标准但是它们应比评价的诊断系统更可靠5.3 最佳工作点的选择阳性似然比为真阳性率与假阳性率之比TPF/FPF约登指数为真阳性率与假阳性率之差TPF-FPF一般选择阳性似然比[]4或约登指数[5]最大者为最佳工作点［（１－Ｐ）／Ｐ］计算最佳工作点的斜率Ｂ和P分别表示花费在假定对病例组实施治疗这一表达式表示治疗疾病的花费和收益之比与(1-患病率)和患病率之比的乘积从(FPF,TPF)=(0,0)到(1,1)´Ó±í´ïÊ½¿ÉÒÔ¿´³öÊÕÒæÉÙÔòÐ±ÂÊ´óÈç¹û¼²²¡ÖÎÁÆ»¨·ÑÉÙ»ò»¼²¡ÂÊ¸ß×î¼Ñ¹¤×÷µã½Ó½ü(1,1确保了假阴性的减少Ｍｅｔｚ　ＣＥ，　Ｈｅｒｍａｎ　ＢＡ，　Ｓｈｅｎ　ＪＨ．　Ｍａｘｉｍｕｍ－ｌｉｋｅｌｉｈｏｏｄ　ｅｓｔｉｍａｔｉｏｎ　ｏｆ　ｒｅｃｅｉｖｅｒ　ｏｐｅｒａｔｉｎｇｃｈａｒａｃｔｅｒｉｓｔｉｃ（ＲＯＣ）　ｃｕｒｖｅｓ　ｆｒｏｍ　ｃｏｎｔｉｎｏｕｓｌｙ－ｄｉｓｔｒｉｂｕｔｅｄ　ｄａｔａ．　Ｓｔａｔ　Ｍｅｄ，１９９８，　ｉｎ　ｐｒｅｓｓ．２Ｍｅｔｚ　ＣＥ．　Ｓｏｍｅ　ｐｒａｃｔｉｃａｌ　ｉｓｓｕｅｓ　ｏｆ　ｅｘｐｅｒｉｍｅｎｔａｌ　ｄｅｓｉｇｎ　ａｎｄ　ｄａｔａ　ａｎａｌｙｓｉｓ　ｉｎ　ｒａｄｉｏｌｏｇｉｃａｌ　ＲＯＣ　ｓｔｕｄｉｅｓ．　Ｉｎｖｅｓｔ　Ｒａｄｉｏｌ　１９８９；２４：２３４－２４５．　３章扬熙. 临床流行病学(第六讲):诊断试验研究(续) . 中华流行病学杂志1997,18(3):177.4 Feinstein AR. Clinical epidemiology: architecture of clinical research. WB Saunders Company,1985,601-632.5 刘杰,林一帆,张沥等. 图象自动分析检测MG7抗原表达预测胃癌高危价值探讨. 中华预防医学杂志1996;30(5):286.6 Dwyer AJ. In pursuit of a piece of the ROC. Radiology 1997;202:621-625.。

ROC指标详解范文

ROC指标详解范文ROC（Receiver Operating Characteristic）曲线是用于衡量分类模型性能的一种常用工具。

它显示了分类模型在不同阈值下的灵敏度（True Positive Rate）与特异度（1-False Positive Rate）之间的权衡关系。

本文将详细介绍ROC指标的含义、构建方法以及其在实际应用中的作用。

首先，ROC曲线是通过将分类模型的阈值从高到低逐渐调整，计算相应的灵敏度和特异度，得到的曲线。

在ROC曲线中，横坐标表示1-特异度，纵坐标表示灵敏度，曲线的形状和位置能够反映模型的分类性能。

如果ROC曲线越靠近左上角，说明模型的性能越好。

当ROC曲线位于对角线上方时，表示模型在所有不同阈值下都能达到比随机猜测更好的分类效果，这时的ROC曲线被称为完美分类器。

ROC曲线本身并不直接提供一个单一的性能度量值，但可以通过计算曲线下的面积来得到一个综合指标，即AUC（Area Under Curve）。

AUC的取值范围在0.5到1之间，值越接近1表示模型的性能越好，值等于0.5时表示模型的性能与随机猜测相当，值等于0时表示模型的性能非常差。

因此，AUC是评估分类模型性能的常用指标之一1.比较分类模型性能：当有多个分类模型需要进行比较时，可以使用ROC曲线和AUC来判断哪个模型具有更好的性能。

只要比较它们的AUC值，即可得到该模型的性能优劣。

AUC值较大的模型具有更好的分类能力，因为它能在维持较高的灵敏度的同时，降低误报的概率。

2.选择最佳分类阈值：分类模型通常会输出一个预测概率，而不是直接给出分类结果。

将这个预测概率转化为二元分类时，需要选择一个阈值。

ROC曲线可以帮助我们在灵敏度和特异度之间做一个权衡，选择一个合适的阈值，使得模型的性能最佳。

3.评估模型对不同类别的识别能力：ROC曲线可以帮助我们了解模型在不同类别之间的识别能力。

当模型的分类能力不平衡时，ROC曲线上的点会出现很大的偏移。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ROC分析方法概要第二章ROC曲线分析概要本文先介绍了ROC理论的一些基础知识如特异度和灵敏度等，然后简要介绍了非参数ROC分析方法，并建立了ROC模型。

最后介绍了ROC曲线及在R软件中的绘制。

2.1 ROC分析的基本要素ROC分析的基本要素包括真阳性和假阳性也称灵敏度和特异度，以及“金标准”“金标准”划分被测试者的真实状态为对照组和病例组两类。

常见的金标准有跟踪随访、活组织检查、尸体解剖、手术探查等。

虽然“金标准”没有必要是十全十美的，但“金标准”应与评价的诊断系统无关，而且比要评价的诊断系统更可靠。

“金标准”不够完美时，可用采用Bayesian、模糊金标准、EM 估计等方法解决。

对按照“金标准”确定的二分类总体，对照组和病例组分别用阴性和阳性表示诊断试验结果。

假定总体样本量是N，诊断试验的可能结果总共有四种：被测试者患病且被正确诊断为患病者，被测试者无病且被错误诊断为患病者，被测试者无病且被正确诊断为无病者，被测试者无病且被错误诊断为患病者。

我们可以用一个2×2的列联表来表示它们之间的关系。

在医学研究中，诊断试验准确度指标最常用的是灵敏度与特异度。

灵敏度（sensitivity），也叫真阳率（true positive rate，即TPR）是被测试者患病且被正确诊断为患病者的样本量在阳性总体中占的比例。

灵敏度值越大，假阴率越小。

据表2-1 其计算公式是：灵敏度(sensitivity) = 真阳率(TPR) = 1 −假阴率(FNR)=标准误为：特异度（specificity），也叫真阴率（true non-positive rate，即TNPR），是受试者无病且被正确诊断为无病者的样本量占阴性总体的比例。

假阳率（false positive rate，即FPR） = 1−特异度特异度值越大，假阳率越小。

据表2-1 其计算公式是：特异度(specificity) =真阴率(TNPR) = 1−假阳率(FPR) =标准误为：假设二分类总体均服从正态分布， TPR、FPR、TNPR 和FNPR之间的关系可以用图2-1来描述。

图中 x = c 为截断点（诊断阈值），α为假阳率（FPR），β为假阴率（FNPR）。

2.2 ROC准确性评价指标的优越性诊断试验的准确性评价指标有正确率、灵敏度和特异度等。

它们虽然都可以反映诊断的准确性，但评价的效果不是很理想。

正确率是被测试者被正确诊断的例数和所占总体的百分数。

其计算公式是：正确百分率标准误是：正确百分率正确百分率的不足之处：1．很大程度上依赖患病率。

例如，虽然患病率是5%，如果判定所有样本为健康者，也有可能有95%的正确百分率；2．受诊断阈值的限制；3．没有表示出假阳性和假阴性错误诊断所占的比例，没有唯一性表示，即使有相同的正确百分率的两个总体，也可能有十分不同的假阳性和假阴性。

基于此，单独计算灵敏度和特异度，以弥补正确率的不足，如果两个指标的值越高，诊断评价效果也就越好，其实不然。

在对诊断系统做出比较时，如果单独使用灵敏度与特异度，就会存在很大的不足：这两个指标依赖于诊断阈值（或截断点），改变诊断阈值可以增加诊断的灵敏度，但同时也减少了特异度；反之，如果增加诊断的特异度，则需要以减少灵敏度为代价。

另外，有人提出的Youden 指数、阳性似然比、：真阳率与假阳率之比）和阴性似然比等等。

Youden指数是指真阳性率与假阳性率之差，计算公式为：Youden指数=灵敏度+特异度-1=真阳性率-假阳性率=其标准误为：指数阳性似然比（positive likelihood ratio 简写为：LR+）是真阳性率与假阳性率之比，即灵敏度与（1-特异度）的比值，它是ROC曲线某工作点对应的斜率。

阴性似然比（negative likelihood ratio 简写为：LR-）是假阴性率与真阴性率之比，即（1-敏感度）与特异度的比值。

这些诊断指标综合考虑了灵敏度和特异度，但一个指标只对应于一个诊断阈值。

当诊断阈值改变时，会得到不同的指标值，给诊断准确度的比较带来不便。

所以一般选择阳性似然比或Youden指数最大者为最佳工作点。

在评价整个诊断方法的准确性时用 ROC 分析，当改变诊断阈值时，可同时获得灵敏度和特异度，也就可以获得 TPR 和 FPR 值。

ROC 曲线是以 FPR 为横坐标和以 TPR 为纵坐标绘制而成，并且ROC 曲线下的面积大小衡量了诊断系统的判别能力。

参数法对正常组和异常组的分布没有要求，它们可以充分利用所有的截断点，对连续性样本量没有大小的显著，不会出现计算结果不收敛的情况。

当截断点（或有序分类）大于5时，结果比较理想，当截断点不断增加时，ROC曲线将逐渐向光滑参数曲线靠拢。

Hanley和McNeil非参数法,记作；异常组的观察值个假设正常组的观察值个数为n数为n,记作。

异常组的观察值更大，根据Wilcoxon 1Mann-Whitney统计量，ROX曲线下面积（）等于异常组每个观测值大于正常组每个观测值的概率。

即的标准误为：其中是两个随机随着的异常组观测值比一个随机选择的正常组观察值都更大可能分类为异常的概率。

是一个随机随着的异常组观测值比两个随机选择的正常组观察值都更大可能分类为异常的概率。

2.5 基于非参数法的ROC分析基于本文实证分析采用的是非参数方法的ROC模型，因此将在本小结着重介绍下非参数法的ROC分析。

2.51等级变量的非参数ROC分析通常情况下，诊断系统获得的原始资料的记录有离散型和连续型两种形式。

许多生物医学诊断试验的测量工具是连续型的，如血清抗原和酶浓度；医学影像诊断试验的诊断结果是离散型的。

对于不同的形式，ROC曲线估计方法是相同的，我们以离散型诊断结果为例。

如果将诊断指标以有序分类的方式分成k类，k = 1, … , K。

其中1类别表示完全没患病，K类别表示肯定患病。

假设对于每一个分类类别Y，有一个隐藏的连续决策变量X，将结果划分到第k类中，如果决策变量X在区间()中，k = 1, … , K; , ；即当，则Y=k。

第k类中，N k0表示第k 类中的正常个体数，N k1表示第k 类中的异常个体数，N 0为正常总个体数，N 1表示异常总个体数，N 表示总个体数。

一般可划分为5（或6）等级，即肯定不正常、可能不正常、异常可疑、可能正常、肯定正常，分别以1、2、3、4、5 标记。

如表表示：每个分类可以作为诊断阈值（通常从第二个分类开始，因为若以第一个分类为阈值，其实是没有什么意义的），阳性和阴性的判断标准是：该类及以上类别的样本为阳性；该类以下样本为阴性，对于每一个诊断阈值，都可以整理出类似于表2-1 的2 × 2的列联表。

例如，以表2-2 中的分类 3 为诊断阈值时，正常组阳性个体数为 N 30+N 40+N 50 ，其假阳率为异常组阳性个体数为N 31+N 41+N 51，其真阳率为同样可以以表中的分类5、4、2为诊断阈值来计算的 ROC 的坐标点，并得到相应的FPR 和TPR 。

图描述了不同诊断阈值下的分类：此时，我们假设正常组和异常组的总体都满足正态分布。

图中采用4 个诊断阈值将正常组和异常组分为5 类。

2.5.2 实例分析在放射学诊断试验中，有109 份CT 影像，正常影像为58 份，异常影像为51 份，有位影像工作者将这些CT 影像分类为如表2-3 所示：根据2.5.1节的结论，我们可以得到以类别2、3、4、5 为诊断阈值的2×2的列联表，从而得到相应的ROC工作点。

以类别2为诊断阈值：正常组阳性个体数为25 ，其假阳性率为FPR==0.4310异常组阳性个体数为48 ，其真阳性率为TPR==0.9420同理可得到分类3、4、5 这四个诊断阈值所对应的ROC工作点。

故FPR，TPR=(0.4310,0.9420), (0.3296,0.9020), (0.2241,0.8627), (0.0345,0.6471)。

从图可以看出，诊断阈值越严格（分类类别越高），将试验结果决策为阳性的可信度越高；诊断阈值越宽松（分类类别越低），将试验结果决策为阳性的可信度也相应地越低。

2.5.3连续变量的非参数ROC分析若诊断结果为连续型变量，则处理方法与上面等级变量类似，设定阈值c，当y>c时为阳性，当y≤c时为阴性。

那么，若设“金标准”为K，则对于每一个阈值c，我们就能推断出相应的真阳率TPR（灵敏度）和假阳率FPR（1特异度），设灵敏度为Sen(c)，特异度为Spe(c)，则有：其中，n0为金标准K=0时的样本量，同理，n1为金标准K=1时的样本量。

如上述所示，当变量为连续型时，每个c都有对应的灵敏度和特异度，把c 取遍此连续型变量在样本中的所有互异的观测值，把这些点对{FPR(c)，TPR(c)}连成曲线便构成ROC曲线。

2.6 ROC曲线间差异的显著性检验ROC曲线提供了直观比较两个诊断方法准确性的方法，较高的ROC曲线具有较好的诊断性能，但是如果曲线交叉，则无法直观地看出来，同时，直观上看两条曲线有差异，但是不一定是统计显著的，所以需要通过统计检验的方法进一步检验两种诊断方法的准确性是否有显著差别。

采用参数法非参数法拟合ROC 曲线有不同的检验方法。

对于双正态模型方法拟合的ROC曲线，可以采用双变量参数卡方检验（bivariate Chi-square test）、真阳性率z检验（TPR Z-score test）、面积z检验（area z-score test）。

2.6.1双变量参数卡方检验检验两诊断实验的双正态参数间有无差异。

假设两个ROC曲线的参数分别是（）、（）。

原假设：两条双正态ROC曲线相同，即。

如果原假设成立，且参数估计值，为联合正态分布。

则检验统计量为：服从自由度为2的卡方分布，其中为行向量（），是2×2协方差矩阵，矩阵元素：2.6.2真阳性z检验有时候想要研究的是在特定的假阳性率条件下，两条ROC曲线上的真阳性率是否相同。

此时并不关心两诊断实验是否产生完全相同的ROC曲线。

此时，原假设为：在特定的FPR下，两条ROC曲线的TPR相等，即TPR1=TPR2=TPR。

当原假设成立，且，，，为多变量正态，则服从均值为0，标准差的随机正态分布。

其中t=。

2.6.2面积z检验该方法对ROC曲线下面积间的差值做z检验来判断两个诊断实验方法的准确性。

原假设为：两条ROC曲线下面积相等，即Az1= Az2。

，如果原假设成立，且样本量较大，则两诊断ROC曲线下面积的差值：近似服从均值为0，方差为：的正态分布，其中：,为ROC曲线的四个参数。

当两个比较的诊断实验相互独立时，对应的所有交叉曲线协方差项等于0.Metz 等的研究表明，当正常组和异常组的样本量都超过50时，以上检验的结果都是可靠的。