诊断试验评价与ROC分析方法
临床诊断试验评价及相关统计分析

临床诊断试验评价及相关统计分析近年来,临床医学的快速发展使得临床诊断试验成为评估诊断准确性和指导临床决策的重要工具。
然而,准确评价临床诊断试验的可靠性和有效性是一项复杂而具有挑战性的任务。
本文将介绍临床诊断试验评价的相关统计分析方法,以期为临床医生和研究人员提供一定的指导和帮助。
一、临床诊断试验评价的背景和意义临床诊断试验评价作为临床医学领域的重要一环,对于确保准确诊断疾病、选择最佳治疗方案具有重要意义。
临床诊断试验评价的结果直接关系到临床决策的科学性和准确性,因此,必须进行合理、可靠的评价。
二、临床诊断试验评价的指标和方法1. 灵敏度和特异度灵敏度和特异度是评价临床诊断试验的重要指标。
灵敏度是指正确诊断为阳性的病例中,试验结果也呈阳性的比例;特异度是指正确诊断为阴性的病例中,试验结果也呈阴性的比例。
一般来说,高灵敏度和特异度的试验结果意味着试验具有较高的准确性。
2. 阳性预测值和阴性预测值阳性预测值是指试验结果为阳性时,病例确实为阳性的比例;阴性预测值是指试验结果为阴性时,病例确实为阴性的比例。
阳性预测值和阴性预测值是评价临床诊断试验的另外两个重要指标。
较高的阳性预测值和阴性预测值意味着试验结果更可信。
3. ROC曲线和AUC值ROC曲线(Receiver Operating Characteristic curve)和AUC值(Area Under the Curve)是评价临床诊断试验性能的重要方法。
ROC曲线能够直观地展示试验的灵敏度和特异度之间的关系,AUC值则是ROC曲线下面积的度量,代表了试验的整体性能。
AUC值越大,试验的性能越好。
通过绘制ROC曲线和计算AUC值,可以对临床诊断试验的准确性进行客观评价。
三、临床诊断试验评价的统计分析方法1. 敏感性分析敏感性分析是对试验结果的可靠性和稳定性进行评估,通过不同的敏感性分析方法,可以评估试验结果对试验方法、样本数量以及不同研究对象的弹性。
三种9ROC估计方法对诊断试验的评价与应用

是描述诊断 与筛查试验准确度 的基本方 法 , 但多 个研 究单 独
分 析 , 会 给 出 稳 定 性 差 、 研 究 结 果 不 一 致 甚 至 相 反 的 结 常 各
ቤተ መጻሕፍቲ ባይዱ
中任意一个实际数据为 0 则将各观察值加 05 ③稳健法 : , .: 以
s为横轴 , D为纵轴 , 制各独立研究 的( , ) 绘 s D 散点 图。用两 条竖线将散点等分 为 3 , 组 以保证两竖 线问及其两侧的散点 各占 1 。 / 通过求左右两侧散点 的 s与 D的中位数 . 3 并将其连 成一条线 , 求得该线的斜率作为参数 B 观察该线上下散点数 。 是 否相等 , 若不等 则将该直线 上下平移 . 以保证其上 下散点 数基本相同 , 求解参数 。3 建立 S O () R C曲线 回归方程 : A、 将 B
验 表 明 :该 2 独 立 研 究 结 果 有 异 质性 存在 ( 5 . ,= 8项 x= 63 v 0 2 ,< . ) 剔 除 1 、7 2 三 篇 文 献 之 后 , 检 验 各 研 究 结 7P O 5 , 0 4 1 、1 再
量 ;也可用 曲线下 面积作 为诊 断试验 准确度评 价的综合 指 标, 常用 于多项试 验的综合 比较。本文采用一般最z  ̄ J-乘法 , ( at q ae,S 、加权最小二乘法 ( e he atq ae, 1 s sursL ) e w i t l s surs g de
值代入式 () 1 ,解 得 L 、 s与 稳 健 法 的 S O 曲线 回归 方 s wL RC
程:
论 _。它以试验灵敏度为纵轴 ,一 l l 1 特异度为横轴 ,形成经 验 R C曲线 ,虽不能获得反映诊断试验准确度的综合指标 . O 但 仍可为诊断界值 的决策提供 分析依据 。M ss oe 等基于 Mea t 分 析思想 , 出采用真 阳性率(u oiv tT R 与假 阳性 率 提 t ep si r e P ) r te a ,
诊断试验与ROC曲线分析

诊断试验与ROC曲线分析目录一、基本概念1.诊断试验四格表基本统计基本指标2.ROC曲线:二、实例分析1)各诊断项目(变量)分别诊断效果分析:2)诊断模型分析:3)比较两预测模型:4)时间依赖的ROC曲线(Time-dependent ROC)分析一、基本概念1.诊断试验四格表基本统计基本指标诊断试验金标准诊断结果合计患病(D+)未患病(D-)阳性a(真阳性)b(假阳性)a+b阴性c(假阴性)d(真阴性)c+d合计a+c b+d N=a+b+c+d1)检测患病率(prevalence): 是指被检测的全部对象中,检测出来的患者的比例。
即:检测患病率 = (a+b)/(a+b+c+d)2)实际患病率(prevalence): 是指被检测的全部对象中,真正患者的比例。
即:实际患病率 = (a+c)/( a+b+c+d)。
实际患病率对被评价的诊断试验也称为验前概率,而预测值属于验后概率。
3)敏感性: 敏感性就是指由金标准确诊有病组内所检测出阳性病例数的比率(%)。
即本实验诊断的真阳性率。
其敏感性越高,漏诊的机会就越少。
即:敏感性= a/( a+c)4)特异性: 是指由金标准确诊为无病组内所检测出阴性人数的比率(%),即本诊断实验的真阴性率。
特异性越高,发生误诊的机会就越少。
即:特异性= d/(b+d)5)诊断准确率: 是指临床诊断检测出的真阳性和真阴性例数之和,占总检测人数的比例,即称本临床实验诊断的准确性。
即:准确性= (a+d)/ (a+b+c+d)6)阳性似然比(positive likelihood ratio): 阳性似然比是指临床诊断检测出的真阳性率与假阳性率之间的比值,即阳性似然比=敏感性/(1-特异性)= (a/(a+c))/(b/(b+d))。
可用以描述诊断试验阳性时,患病与不患病的机会比。
提示正确判断为阳性的可能性是错误判断为阳性的可能性的倍数。
阳性似然比数值越大,提示能够确诊患有该病的可能性越大。
诊断试验临床效能评价

诊断试验临床效能评价诊断试验的临床效能评价是医疗领域中一项重要的工作,它旨在评估诊断试验的准确性、灵敏性和特异性,从而帮助医生和临床决策者做出准确的诊断和决策。
本文将从准确性、灵敏性和特异性三个方面,分别介绍诊断试验的评价指标和评价方法。
一、准确性评价准确性是评价诊断试验表现的重要指标之一,它代表了试验结果与实际情况之间的一致程度。
常用的准确性指标有阳性预测值(PPV)、阴性预测值(NPV)、真阳性率(TPR)和真阴性率(TNR)。
其中,阳性预测值指的是在试验结果为阳性的情况下,实际患病的比例;阴性预测值则指的是在试验结果为阴性的情况下,实际未患病的比例。
真阳性率和真阴性率则是指试验结果与实际情况一致的比例。
评价诊断试验准确性的方法主要有对照组研究和交叉验证研究。
对照组研究常用于评价新诊断试验与已有试验或“金标准”之间的一致性,通过比较试验结果与“金标准”结果之间的差异,来评价试验的准确性。
交叉验证研究则是指在不同的样本集上进行验证,通过评估试验在不同样本集上的一致性来评价其准确性。
二、灵敏性评价灵敏性是评价诊断试验的另一个重要指标,它代表了试验对实际患者的检出能力。
简而言之,灵敏性越高,试验越能检测出真正的患者。
灵敏性的评价常用的指标是真正阳性率(TPR),也称为召回率或敏感性。
它表示试验对真正患者的检测比例。
评价诊断试验灵敏性的方法主要有“金标准”对照和受试者工作特征曲线(ROC曲线)分析。
在“金标准”对照中,将试验结果与“金标准”结果进行对比,来评价试验的灵敏性。
ROC曲线分析则常用于评价试验结果的连续性,通过绘制曲线来显示不同阈值下试验的灵敏性和特异性。
三、特异性评价特异性是评价诊断试验的又一个重要指标,它代表了试验对非患者的判断能力。
特异性越高,试验越能排除非患者。
特异性的评价常用的指标是真正阴性率(TNR),即试验对真正非患者的判断比例。
评价诊断试验特异性的方法主要有独立样本验证和交叉验证。
第21章诊断试验的ROC分析

第21章诊断试验的ROC分析ROC(Receiver Operating Characteristic)曲线是用来评价诊断试验的有效性和准确性的一种图形化工具。
在医学领域,ROC分析常用于评估医学诊断试验的鉴别能力,并选择适当的切点来确定诊断的敏感性和特异性。
下面将详细介绍ROC分析的原理和应用。
首先,ROC曲线是由反映不同切点下的诊断准确性的敏感性(True Positive Rate)和特异性(False Positive Rate)组成的。
敏感性表示实际为阳性结果的患者中被正确诊断为阳性的比例,而特异性则表示实际为阴性结果的患者中被正确诊断为阴性的比例。
ROC曲线的横轴是1-特异性,纵轴是敏感性,曲线越靠近左上角,表示诊断试验的准确性越高。
ROC曲线可以通过画出不同切点下的敏感性和特异性组成。
对于一些切点,可以计算其敏感性和1-特异性,将计算结果作为坐标值绘制在ROC 曲线上。
通过变化切点的位置,可以得到一系列敏感性和特异性值,进而绘制出整个ROC曲线。
在ROC曲线上,我们关心的是曲线下面积(Area Under ROC Curve,AUC)。
AUC越大,表示诊断试验的准确性越高。
通常认为,AUC值大于0.9的诊断试验具有较高可信度,而AUC值小于0.7的试验则不太可靠。
ROC分析在医学诊断中的应用非常广泛。
例如,在肿瘤检测中,我们可以利用ROC曲线评估不同肿瘤标志物(如癌胚抗原、CA125等)的诊断效能,选择最合适的切点来判断是否患有肿瘤。
在传染病检测中,ROC分析可以评估不同检测方法的准确性,选择最佳的诊断指标。
此外,ROC分析也可以用于评估预测模型的性能,如心血管疾病风险预测模型等。
需要注意的是,ROC分析也有一些局限性。
首先,ROC曲线仅基于敏感性和特异性这两个指标,忽略了试验的灵敏度和特异度等其他评估指标。
其次,ROC曲线不能提供诊断的最佳切点,而只能提供一系列切点下的敏感性和特异性值,因此在临床实践中仍需要根据患者病情等因素综合考虑来确定最佳切点。
诊断试验的评价和ROC分析

诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法,用于确定患者是否患有某种疾病。
然而,单纯通过试验结果判断是否患病往往并不准确。
因此,我们需要评价诊断试验的准确性,并使用ROC分析来量化其性能。
1. 诊断试验的评价指标为了评估诊断试验的性能,我们需要引入以下四个指标:敏感度、特异度、阳性预测值和阴性预测值。
敏感度(Sensitivity)是指在真正患病的人中,试验能正确诊断出疾病的比例。
敏感度越高,表示试验具有较好的疾病检测能力。
特异度(Specificity)是指在真正健康的人中,试验能正确排除疾病的比例。
特异度越高,表示试验具有较好的非患病排除能力。
阳性预测值(Positive Predictive Value)是指在试验为阳性的情况下,患者真正患病的概率。
阳性预测值越高,表示试验结果与患病状态的相关性越高。
阴性预测值(Negative Predictive Value)是指在试验为阴性的情况下,患者真正健康的概率。
阴性预测值越高,表示试验结果与健康状态的相关性越高。
2. ROC曲线和AUC值为了综合评价诊断试验的准确性,我们引入了ROC曲线(Receiver Operating Characteristic Curve)和AUC值(Area Under Curve)。
ROC曲线是以敏感度为纵轴,以1-特异度为横轴绘制的曲线。
曲线上每一个点表示了在不同阈值下的敏感度和特异度。
ROC曲线越靠近左上角,表示试验性能越好。
AUC值是ROC曲线下面积的数值,范围在0.5到1之间。
AUC值越接近1,表示试验具有较高的准确性。
3. 如何进行ROC分析进行ROC分析通常需要以下步骤:(1)收集样本数据:包括疾病阳性和阴性样本,以及其相应的试验结果。
(2)计算敏感度和特异度:根据试验结果计算敏感度和特异度,并绘制ROC曲线。
(3)计算AUC值:根据ROC曲线计算AUC值。
(4)选择最佳阈值:根据需求和实际情况,选择最佳的阈值以平衡敏感度和特异度。
医学诊断试验评价的ROC分析

医学诊断试验评价的ROC分析ROC分析是一种用于评价二分类系统性能的方法。
在医学诊断中,通常将诊断结果分为阳性(患病)和阴性(未患病)两类。
ROC曲线是以灵敏度(True Positive Rate)为纵轴,以1-特异度(False Positive Rate)为横轴绘制的曲线。
曲线下面积(Area Under Curve,AUC)反映了试验的诊断准确性,AUC越大,说明试验的准确性越高。
ROC分析的基本步骤如下:1.收集数据:收集一组经过相关诊断试验测试的患者数据,包括患病与否的真实情况和试验结果。
2.绘制ROC曲线:根据患病与否的真实情况和试验结果计算出各个患病与否情况下的灵敏度和1-特异度,将这些点连接起来就可以得到ROC 曲线。
3.计算AUC:根据ROC曲线计算出曲线下面积,常用的计算方法有两种:直接计算法和近似计算法。
直接计算法是通过对多个小矩形的面积进行累加得到AUC,公式为AUC=sum((TP+TP')/2*(FP-FP')),其中TP和FP分别表示每个点的灵敏度和1-特异度,TP'和FP'表示下一个点的灵敏度和1-特异度。
近似计算法是通过曲线上多个点的线性插值得到AUC,公式为AUC=sum((TP+TP')/2*(FP-FP')),其中TP和FP分别表示每个点的灵敏度和1-特异度,TP'和FP'表示下一个点的灵敏度和1-特异度。
4.评价:根据AUC的大小评价诊断试验的准确性,一般认为AUC在0.5-0.7之间的试验判定为低准确性,0.7-0.9之间的试验判定为中等准确性,0.9以上的试验判定为高准确性。
ROC分析的优点是不受患病率的影响,适用于不同患病率的疾病。
此外,ROC曲线上任意一个点都可以作为试验的阈值,根据需要选择不同的阈值,灵活性较大。
尽管ROC分析是一种常用的方法,但也存在一些局限性。
首先,ROC 曲线只适用于二分类问题,对于多分类问题需要使用其他方法。
诊断试验的评价与ROC分析

9(FP) 171(TN)
180
425 275 700(N)
二、灵敏度(Sensitivity) Sen P(T | D ) TP (TP FN ) = TPR
SEsen TP FN (TP FN)3 Sen(1 Sen) (TP FN) 。
本例TPR=Sen=416/520=0.8,
P1 (TP FN ) N (416 104 ) 700 0.7429 ,而 P0 0.0005。
阳性预报值与阴性预报值
PV TP (TP FP) , PV TN (FN TN ) 一般用于某特定人群,
如例13.2限定研究对象为“进入某医院的急性持久胸痛病人”,这类人群 的患病情况往往在不同级别医院不一样,因此适合大医院或教学医院的 诊断标准不能轻易照搬于基层小医院或流行病学现场。
SE正确百分率 (416 171)(9 104) / 7003 0.0139 1.39% 。
问题:(1)依赖于患病率,(2)没有揭示假阴性和假阳性 错误诊断的频率,(3)受诊断阈值的限制。
例13.2 表13.2 ECG诊断试验的结果
ECG诊断结果
心肌梗塞
出现
不出现
合计
阳性 阴性 合计
416(TP) 104(FN)
0.9999
9999
10000
如果 P0 0.2, PV 0.95 95% ,此时阴性预报价值降低不明显。
例13.2 表13.2 ECG诊断试验的结果
ECG诊断结果
心肌梗塞
出现
不出现
合计
阳性 阴性 合计
416(TP) 104(FN)
520
9(FP) 171(TN)
180
425 275 700(N)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断试验评价与ROC分析方法第一节概述诊断试验包括各种实验室检查诊断、影像诊断和仪器诊断(如X线、超声波、CT扫描、磁共振及纤维内镜等),各种方法的诊断价值如何,必须通过诊断试验确定。
传统诊断试验)、符合率(E)等,这些评价指标为广大的医评价方法有灵敏度(TP)、特异度(1FP学研究工作者所使用,但是为了使用这些指标必须将诊断试验分成“阴性”和“阳性”两种结果,由于这些指标与所选择的诊断标准或阈值有关,评级结果可能出现不一致性情况。
Harris 曾对某文献中的7篇诊断试验的文章进行了分析,发现其中有5篇得到的灵敏度和特异度是明显可以变化的,如果改变分类准则会是另一评价结果,这很容易引导研究人员做出有利于自己的选择。
另一个问题是,从临床决策观点看,无论对何种疾病的诊断,最终应当做出“是”或“非”的回答,但实际中只有很少的情况能够给出明确的诊断,多数情况只能根据检查的结果做出一个不确定的判断,如“正常、大致正常、可疑、非常可疑、异常”,一种新的诊断技术的产生尤为如此。
如果在评价时按照实验样本归为两类或丢弃中间状态的数据,很容易夸大诊断试验的结果。
在实际工作中有相当一些诊断技术由于缺乏准确的评价,在一开始出现时往往过分夸大其作用即与此有关。
ROC分析方法则可以更客观的对诊断试验做出评价。
一、诊断试验的ROC分析方法ROC曲线即受试者工作特征曲线(Receiver operating characteristic curve),ROC曲线及其分析已统计决策理论为基础,起源于电子信号观测理论、用于雷达信号接受能力的评价,目前已经应用于许多医学、非医学领域,如人类感知和决策研究、工业质量控制、军事监控等。
ROC曲线从二十世纪八十年代起广泛应用于医学诊断试验的评价。
美国生物统计百科全书中关于ROC曲线的定义是:“对于存在或可能存在混淆的两种条件或自然状态,需要受试者、专业诊断学工作者以及预测工作者做出精确判断,或者准确决策的一种定量方法。
”在诊断试验的评价研究中,它是以每一个检测结果作为可能的诊断界值(cut-off point),计算得到相应的真阳性率(TP)和假阳性率(FP),以假阳性率(即1-特异度)为横坐标,以真阳性率(即灵敏度)为纵坐标绘制而成的曲线,ROC曲线可从直观上表明诊断试验的准确度。
在医学影像诊断实验研究中,一个突出的问题表现在一些病例难以确定,另一个问题是对不同的医院或不同的观察者(医生),采用的诊断标准可能不一致,如何进行相互间比较,怎样把从不同观察者得到的数据结合起来分析,使分析结果具有较好的一致性。
从本质上讲,一个诊断或预后系统的优劣,不应该取决于观察者在操作过程中对“诊断标准”的把握情况,而在与决策变量对疾病的区分能力。
ROC分析是一种把灵敏度(TP)和特异度(1-FP)结合起来综合评价诊断准确度的一种方法。
其基本思想是不固定诊断标准(阈值),把灵敏度和特异度看作一个连续变化的过程,用ROC曲线描述诊断系统的特性,用曲线下面积说明诊断的准确度。
ROC分析有两个基本的特点: 允许诊断结果在“阴性”和“阳性”之间的中间状态; ROC分析结果与诊断标准无关。
前一特点使诊断试验应用范围拓宽,并且能够保持信息的完整性;后一特点则能保持诊断试验评价结果的一致性。
事实上,实际中只有少数的临床诊断结果具有明确的分类界限,如一个生化检测可能是一个数量化的结果,选择不同的分界点,将会有不同的灵敏度和特异度;当一个诊断结果主要有主观判断(如影像诊断),可以认为医生的诊断结果是通过对潜在的连续变量分组后做出的判断。
无论上面那一种情况,分类阈值的选择对ROC曲线都无影响。
从应用角度看,ROC分析最大的特点在于可以暂时回避诊断标准的选择问题,并且能够较好的保持信息的准确和完整。
理论上,当诊断试验完全无诊断价值即完全凭机会区分患者和非患者时,ROC曲线是一条由原点到右上角的对角线,这条线称为机会线(chance line),有时也称为参照线(reference line),如果获得的ROC曲线落在这条机会线上,其曲线下面积为0.5;理想的诊断试验ROC 曲线是从原点垂直上升至左上角,然后水平到达右上角,其曲线下面积为1,该ROC 曲线对应的诊断试验可完全把患者判为阳性、把非患者判为阴性。
但实际上这样的诊断试验极少或不存在,诊断试验的ROC 曲线一般会位于机会线的上方,离机会线越远说明诊断准确度越高。
ROC 曲线下面积实际的取值范围为0.51,而一般认为对于一个诊断试验,ROC 曲线下面积在0.50.7之间时诊断价值较低,在0.70.9之间时诊断价值中等,在0.9以上时诊断价值较高。
二、 ROC 曲线下面积的估计ROC 曲线下面积估计的方法有参数法和非参数法,均适用于结果为连续性资料或有序资料的诊断试验准确度的评价,但计算均比较复杂,大多需要借助统计软件实现。
(1)ROC 曲线下面积估计的非参数法非参数法是根据诊断试验的检测结果直接计算绘制ROC 曲线所需的工作点(真阳性率,假阳性率),由此绘制的ROC 曲线称为经验ROC 曲线,其曲线下的面积可由梯形规则计算得到;Bamber 于1975年发现:经验ROC 曲线下面积等价于患者组和非患者组实验结果秩和检验的Wilcoxon Mann-Whitney 检验统计量,因而可由Wilcoxon Mann-Whitney 统计量估计曲线下面积的大小。
如果用A Y 和N Y 分别表示患病组和非患病组的诊断变量,A y 和N y 表示各自的取值,假定检测值较大为异常,曲线下面积θ的估计值可以利用下式计算:111(,)NA n n A N N A S y y n n θ=∑∑(1-1)其中:1,(,)1/2,0,A N A N A N A N y y S y y y y y y>⎧⎪==⎨⎪<⎩(1-2)A n 和N n 为患病组和非患病组的检测例数。
其含义是将患病组的所有检测值分别与正常组所有的检测值比较,如果A N y y >得分为1,如果相等得分为0.5,否则不得分,然后计算平均得分即为θ。
可以看出,ROC 曲线下的真实面积θ是患病组检测值大于正常组检测值的概率,即()A N P Y Y θ=>。
ROC 曲线下面积还有另一种解释,即在各种不同诊断特异度下的平均灵敏度。
θ的方差估计可以使用Delong 方法计算:2211()A N Y Y A NVar S S n n θ=+(1-3) 其中:2211[()]1A A n Y Aj j A S V Y n θ==--∑,2211[()]1N N n Y Nj j N S V Y n θ==--∑11()(,)Nn Ai Ai Nj j NV Y S y y n ==∑,11()(,)An Nj Ai Nj i A V Y S y y n ==∑ 对两种诊断方式进行比较时,检验公式为:u =(1-4)式中1()Var θ和2()Var θ为两样本ROC 曲线下面积的方差;12(,)Cov θθ为两样本面积估计的协方差,也可以用Delong 给出的非参数方法计算得到。
在独立试验样本情况下,12(,)0Cov θθ=(2)ROC 曲线下面积估计的参数法曲线下面积估计的参数法常常是通过拟合某种统计学模型来实现的,有学者检查了ROC 曲线与各种基本分布如幂、二项式、Poisson 分布、卡方分布和伽玛分布等,发现ROC 曲线非常逼近双正态模型所产生的曲线,因此拟合双正态模型是目前ROC 曲线分析中最常使用的方法。
该法假设患者和非患者的实验结果均符合正态分布,根据实验结果拟合双正态模型(binormal distribution model ),由模型拟合的ROC 曲线称为拟合ROC 曲线或称为光滑ROC 曲线,该曲线可用两个参数表示,一个参数用a 表示,是患者组与非患者组实验结果的标准化均数之差;另一个参数可用均数b 表示,是非患者组与患者组实验结果的标准差之比,两个参数可由下式估计得到:A NAy y a s -=N A s b s = (1-5)其中A y 、N y 分别是患者组和非患者组检测结果的均数,A s 、N s 分别是患者组和非患者组检测结果的标准差。
由两个参数可得到绘制光滑ROC 曲线所需的工作点及曲线下面积的估计值。
曲线下面积可由下式估计得到:θ=Φ (1-6)Φ为标准正态分布函数。
因为患者组和非患者组的检测结果经常不符合双正态分布的条件,一般需经过正态变换,所以双正态模型的两个参数一般不宜直接计算得到,可由最大似然估计法得到。
参数法的应用条件为:患者与非患者的实验结果均服从正态分布,但这是指ROC 曲线的函数形式,而不是指检验结果的基本分布,因为变量变换几乎可使任何实验结果转换为双正态分布,而且实际上,当检测结果为有序资料时,数据仅有几个值或几个分类,对这类数据可拟合许多不同的分布。
Hajian-Tilaki 等发现,即使数据不服从双正态时,参数与非参数法估计的ROC 曲线下面积及其方差也十分类似,这一结果提示,不必过分要求数据服从双正态,可根据应用的方便性与实用性来选择方法。
参数法估计ROC 曲线下面积的缺点是在极少数情况下,估计的ROC 曲线下面积可能会出现位于机会线下的情况,或者当资料远远偏离其应用条件时,估计的结果可能会严重偏离其真实值。
在样本量较大且想通知较少时,参数法和非参数法估计的ROC 曲线下面积常常近似相等。
三、ROC分析方法研究进展简述作为临床诊断数据评价的一种有效技术,ROC分析已经逐渐为医学研究人员所认可,并引起了更多统计专业人员的注意,把现代发展起来的一些多元统计方法引入ROC分析,使之在理论上有了更稳固的基础,应用范围不断扩大。
虽然ROC分析技术在20世纪50年代就提出,但真正在医学诊断领域应用则在80年代;1989年Hanley给出一个综合性的报告,引起更多的统计专业人员注意则是在90年代;2002年周晓华等出版了《Statistical Methods in Diagnostic Medicine》专著,其中对大量地文献做了综述,内容十分丰富。
下面简要叙述诊断试验ROC分析的有关内容。
ROC分析有参数和非参数两类方法,最具代表性的参数方法是采用双正态模型作ROC 分析,对于连续和有序测量数据,参数法的优点是可以获得ROC曲线方程,得到曲线下的全面积和部分面积,面积的估计值是无偏的,但对连续测量的数据分布有一定要求。
典型的非参数法是Wilcoxon方法,它适合任何类型分布的数据,但无法直接对有协变量的情况进行分析和处理。
由于实际中可能有协变量对诊断试验产生影响,如对某种疾病检测方法进行鉴定,各年龄组检测对象的诊断标准不尽相同,其诊断的准确度也可能存在差异,关键的问题是对协变量的影响大小做出判断,并将其影响在诊断试验评价中给予考虑,对此可以采用回归模型的方法。