2011诊断试验设计与循证评价

合集下载

(循证医学课件)第10章诊断性试验循证分析与评价

制图方法： ➢ 以该试验的敏感度(真阳性率)为纵坐标(Y轴)，而以1-特异度(假阳性率)为横坐标(X轴)，
➢ 依照连续分组测定的数据，分别计算SEN及SPE，按照平面几何方法，将给出各点联成曲线，即为ROC曲线
判定方法： ➢ 曲线的各点中，距Y轴顶点直线距离最近的一点，即为正常值的最佳临界值。
➢ ROC曲线 ➢ 似然比的应用 ➢ 提高敏感度或特异度方法
一、ROC曲线的应用 ROC曲线(receiver operator characteristic curve)
又称受试者工作特征曲线，在诊断性试验中应用的目的有两个：
➢ 1、用于正常值临界点的选择 ➢ 2、用于优选性质类似的诊断性试验
表10-5 +LR和验前概率与验后概率的关系
*表中数据均为验后概率(%)
由上表可知：如果阳性似然比较高，即使验前概率在较低情况下，验后概率也会有很大的增长
表10-6 部分常见病、诊断性试验结果的阳性似然比(1)
接下页
表10-6 部分常见病、诊断性试验结果的阳性似然比(2)
我国诊断性试验的研究不断发展
➢ 1985~1995年中华系列杂志中，共发表诊断性试验的论著50篇
➢ 1996~2000年中华检验医学杂志，共发表诊断性试验论著111篇
➢ 2001~2007年中华医学会6种核心杂志中共检出诊断性试验的论著5l篇
近10年来快速诊断性试验(rapid diagnostic tests，RDTs) 在热带病研究中发展迅速
表10-3 缺血性贫血患者血清铁蛋白检查结果
SEN=731/809=90.4% SPE=1500/1770=84.7% +LR=SEN/ (1-SPE)=5.9

循证检验医学与诊断性试验评价

循证检验医学与诊断性试验评价什么是循证检验医学？循证检验医学（Evidence-based medicine，EBM）是指通过收集、分析和评价最新的临床研究和资料，结合临床医生的临床经验和患者的价值观，最终达到制定合理的诊疗方案、提高诊疗质量和临床效果的理论和实践体系。

循证检验医学强调临床决策应该基于最好的可获得的证据，而不是凭借医生的直觉或传统经验。

这种理念已经被包括世界卫生组织在内的各大国际组织所接受和推崇。

循证检验医学的主要目的循证检验医学的主要目的是提高临床决策的准确性和效率，进而改善患者的治疗效果和生存质量。

EBM不仅仅是对药物治疗的监管和管理，同时也是对手术、诊断和预防等其他临床决策的质量监控。

循证检验医学的三个基本步骤循证检验医学需要完成三个基本步骤：1.收集证据：通过文献检索和研究之间的比较，收集当前最新的、最好的和最适宜的证据。

2.评价证据：评估证据的质量和信度，以确定其在临床决策中的可靠性和应用性。

3.应用证据：将评估后的证据应用到临床实践中，并结合患者的病情、价值观和意愿来做出适当的临床决策。

诊断性试验评价诊断性试验评价是评价医学诊断准确性和可靠性的一个重要手段。

它的主要目的是判断一种测试在诊断一个疾病时的准确性和有效性。

诊断性试验的类型诊断性试验可以分为两类：1.敏感性和特异性：这是两个最基本的测量指标。

敏感性是指测试可以识别出病人的百分比，特异性则表示测试可以排除病人的百分比。

敏感性和特异性可以帮助医生决定是否需要进一步检查或测试。

2.ROC曲线： ROC曲线是一种受样本大小和预测模型影响较小的诊断性试验评价方法。

它将敏感性和特异性合并成一个质量指标，称为“曲线下面积（area under the curve，AUC）”。

AUC越接近1，则该测试的诊断准确性越高。

如何评价诊断性试验评价诊断性试验需要考虑以下几个因素：1.常见失真：诊断性试验可能涉及各种失真，包括选择性报告、顺序效应、参考标准和治疗可能对测试结果产生的影响等，需要考虑这些因素对试验结果的影响。

诊断性研究证据的循证评价ppt课件

对照组
采用金标准测试后证实未患有目标疾病的其他病例，尤其应包括容易与目标疾病混淆的其他病例
26
样本量的确定 1.假阳性率的水平测定，一般情况下特异度高的试验用于肯定性诊断； 2.假阴性率的水平测定，敏感度高的试验一般用于疾病的筛选； 3.允许误差范围，一般为总体率100（1-α）%可信区间宽度的一半。
泻等其他不适，阴道分泌物增多，无外阴瘙痒，于当地医
院检测尿早早孕阳性，查B超：宫腔内可见1.1×1.6cm 孕囊，囊内未见胎芽、胎心。孕囊偏右接近宫角，血 HCG3356mIU/ml。血常规检查：白细胞计数12.31×109/L ，红细胞计数3.05×1012/L。
19
查盆腔彩超：宫腔内可见24×37×4mm条状无回声区，左侧附件区无均质包块（30×20mm）。腹部平坦，未见胃肠型及蠕动波，腹软，无压痛、反跳痛及肌紧张，未触及包块，叩鼓音，移动性浊音阴性，肠鸣音正常存在。宫颈轻度糜烂，无明显举痛，子宫前位，正常大小，质中，无
DOR
似然比 likelihood ratio, LR 受试者工作特征曲线 receiver operator characteristic curve, ROC 预测值 predictive value, PV
31
按所定诊断标准将人群分组按所定诊断标准将人群分组按所定诊断标准按所定诊断标准阳性阴性按“金标准”诊断有病 a（真阳性） c（假阴性）无病 b（假阳性） d（真阴性）
13
重要性
1. 是否通过该诊断方法，就能做出正确诊断或鉴别出病人是否患有目标疾病
2. 是否进行了分层似然比的计算
14
适用性
1. 待评价诊断能否在本单位开展，并且能进行正确的检测

循证医学的评价原则

诊断试验的评价原则诊断性试验的真实性评价1. 是否将诊断性试验与金标准进行独立、盲法和同步比较2.研究对象选择是否包括了适当的病谱3. 诊断性试验的检测结果是否会影响到金标准的应用？诊断性试验的重要性评价阳性预测值+PV=a/(a+b)；阴性预测值-PV=d/(c+d)；验前概率=(a+c)/(a+b+c+d)；验前比=验前概率/（1-验前概率）；验后比=验前比似然比；验后概率=验后比/（1+验后比）能否将该既真实可靠又很重要的诊断性试验证据应用到我们的病人诊断上？1. 该试验是否能在本单位开展并能进行正确的检测?2. 我们在临床上是否能够合理估算病人的验前概率？3. 检测后得到的验后概率是否有助于我们对病人的处理？治疗（单一研究）评价原则真实性评价1.研究对象是否进行随机化分组？2.分配方案是否隐匿？3.试验开始时组间是否基线可比？4.随访是否完整？随访时间是否足够长？5.结果处理是否进行了意向性分析？6.是否对研究对象、医生和研究人员采用盲法治疗？7.除试验方案不同外，各组患者接受的其他治疗方法是否相同？重要性评价1.治疗性证据的效应强度的大小如何？2.疗效证据的精确度如何？实用性评价：上述真实、有重要价值的证据，能否可被应用于自己的临床实践中呢？1.被评价的证据是否与病人情况不符而不能应用？2.治疗性证据可行性如何3.治疗措施对患者的利、弊如何。

4.患者对于治疗措施的价值取向与期望如何？对于有着显著适用的亚组分析证据，如能符合下述条件者，则有着被采用价值：确有生物学和临床依据者；确有统计学显著差异和临床价值者；亚组本身的研究假设是在研究前所设计，而不是在试验中有意设计者；仅属该研究中有限的几个亚组分析的证据之一者；（注意亚组不能设置过多）该证据在另外的研究中可被证实者。

病因和危险因素研究结果的评价原则真实性评价1.研究的两组间除暴露因素或干预措施不同外，其他重要因素是否组间一致？2.不同组别的干预措施或暴露因素、临床结局的测量方法是否一致？是否采用了盲法？3.随访时间是否足够长？是否包括了全部纳入的病例？4.研究结果是否符合病因的条件？1）因果关系是否明确2）是否存在剂量效-应关系？3）暴露因素或干预措施的消长是否与不良反应的消长一致4）不同的研究结果是否一致5）暴露因素或干预措施与不良反应的关系是否符合生物学规律该重要性1. 暴露因素或干预措施与不良反应的关联强如何2.多发生一例不良反应所需要治疗的患者数（NNH）3暴露因素或干预措施与不良反应的关联强的精确度如何适用性1.你的患者与研究中的研究对象是否存在较大差异，导致研究结果不能应用2.你的患者可能接触带的暴露因素和研究中的暴露因素是否有终于不同3.是否应该停止或继续暴露因素，同步比较诊断性试验和金标准结果；列出四表格计算诊断性试验的相关指标偏倚的控制：系统全面无偏移地检出所有于课题相关的文献是减少发表偏倚的方法；在meta分析前，应测量发表偏倚和评估其影响程度；制定客观严密的纳入标准是控制选择者偏倚的方法；客观评诊断学研究设计要点：正确确定诊断性试验的金标准；合理选择研究对象；盲法、独立和价分析结果并合理作出解释。

《循证医学》疾病诊断证据的循证评价与应用 ppt课件

笨，没有学问无颜见爹娘 ……” • “太阳当空照，花儿对我笑，小鸟说早早早……”
诊断试验的范畴（Diagnostic Test）
各种实验室检查（ Lab Examination）病史和体检获得的临床资料（Sign & Symptom） X线、B超、核素等影像学检查各种临床公认的诊断标准
题
然比应用举例
例：女45y, 典型心绞痛, 心电图检查ST 段压低 2.2mm ，患冠心病概率为多少？
文献资料，ST压低2.2，似然比＝ 11
患者有典型心绞痛，估计患病概率 =50％
验前概率＝50％验前比＝0.5/（1-0.5）＝1 验后比＝验前比×似然比＝1×11＝11 验后概率＝11/（1＋11）＝91％
的计算
• 例监护病房CK诊断心梗(CK<80=CK-)
心梗
无心梗
CK+ 215(93.48%) 16(12.31%) 231 +LR=7.6
CK- 15(6.52%) 114(87.69%) 129 -LR
360
似然比的特点和应用
比敏感度和特异度更稳定，不受患病率影响；
诊断冠心病冠状动脉硬化（病理诊断，疾病分类基础）手术（获得病理诊断）
冠脉造影（某种程度替代病理诊断，作为新的金标准） CTA（新的经过评价的诊断试验） EKG（诊断试验）酶学指标（诊断试验）
评价内容
科学性评估：评价标准重要性评估：即结果大小，包括敏感
度/特异度/预测值/似然比适用性评估：是否纳入全部患者或代
表性如何
临床案例1：肝癌的诊断
男性， 35 岁，既往有乙型肝炎病史， HBsAg（+）、HBeAb（+）、HBcAb（+）

诊断试验循证评价

四、临床决策
超声引导下穿刺活检术对于确诊小肝癌是较理想的诊断手段性评价
真实性：
（一）同步、独立、盲法？
金标准：影像学检查对2004年～2006年经影像学检查发现的直径小于3cm(最小的L 5cm)的肝内实质性结节60例进行超声定位，并选择适当的穿刺活检针取材。每例取材 2—3次，组织条长度1.5--2.2cm，标本置于福尔马林液中固定送病理检查。
未提及诊断试验与金标准同步进行；金标准不包括诊断试验，结果进行了独立对比，有确切的评价指标
适当病谱： 2004年～2006年经影像学检查发现的直径小于3cm(最小的L 5cm)的肝内实质性结节60例，男46例，女14例，年龄34—66岁，48例有肝炎病史，17例肝硬化，45例主诉有不同程度右季肋部不适，15例无任何症状，仅在体检时发现。受试对象有男有女，患者病情不一，该试验有较好的病谱。
试验相关内容：
试验目的
•探讨超声引导下经皮穿刺组织学活检对小肝癌的临床早期诊断价值。
试验对象
•经影像学检查发现的直径小于3cm 的肝内实质性结节60例
•对60例经影像学检查发现的直径小于3cm的肝内实质性结节施行超声引导下穿刺活检，行组织病理学检查。 •60个结节156次取材全部成功，病理确诊率达96．7％，无明显并发症发生。
总结
1、有明确的金标准对照，金标准：影像学检查 2、影像学检查与超声引导下穿刺活检两项试验独立进行，且两项试验分别同时送往不同科室进行检测。 3、试验组包含了各种临床类型 4、诊断试验结果未影响金标准的使用，均在超声引导下穿刺活检之前进行影像学检查。 5、重要性：超声引导下穿刺活检能准确区分小肝癌患者。 6、适用性：超声引导下穿刺活检的检查损伤小、安全可靠、医生和患者皆易接受。

(循证医学课件)第10章诊断性试验循证分析与评价

定义：诊断性试验检测为阴性的病例，在用金标准确定为“无病”的病例中所占的比例。
用途：特异度愈高，则假阳性的病例(误诊率)愈低，特别有助于确定诊断。
公式：
三、准确度(accuracy，ACC)
定义：诊断性试验检测为真阳性和真阴性病例总数，在全部被检病例数中所占的比例。
公式：
四、阳性预测值(positive predictive value，+PV) 定义：诊断性试验检测为阳性的全部病例
☺ 对照组、病例组至少样本含量应在30例以上。
➢ 参考临床流行病学样本含量的计算公式。
三、盲法对比试验结果
盲法与金标准进行同期对比，即要求判断试验结果的人不能预先知道，受检病例用金标准诊断为“有病”还是“无病”，以免发生疑诊偏倚，造成人为因素的影响。
表10-1 诊断试验四格表
a (真阳性) c (假阴性)
六、阳性似然比(positive likelihood ratio，+LR)
定义：诊断性试验中，真阳性在“有病”患者中的比例与假阳性在“无病”例数中比例的比值。
用途：诊断性试验阳性时患病与不患病机会的比值，比值愈大则患病的概率愈大。
公式：
例10-1 某诊断性试验的敏感度为90%，特异度为60%，如被检病例为1000例，当被检病例中的患病率增高时，阳性预测值和准确度均有较明显的改变，其结果如下：
诊断性试验的概念
➢ 是对疾病进行诊断的试验方法
诊断性试验的分类
➢ 实验室检查 ➢ 病理诊断 ➢ 影像诊断（如X线、CT、MRI、超声波以及放
射性核素、纤维内镜、电镜等诊断方法）
第一节诊断性试验在临床医学中的重要性
一新的诊断性试验是否一定能超过原来的诊断

诊断性研究证据的评价与应用

验前概率
验前概率(pre-test probability)：临床医师根据病史、体征等，估计该患者可能患病的概率。诊断性试验中验前概率的判断：根据个人经验、人群患病率资料、实践资料、文献描述、对不同情况下验前概率的研究资料
似然比
似然比(likelihood ratio, LR)：诊断试验结果在患者中出现的概率与非患者中出现的概率之比。代表一个诊断性试验区分有病和无病的能力大小。
是否所有病例无论待评价试验的结果如何，都接受了相同的金标准试验？ Workup bias：诊断试验阳性和阴性患者，接受金标准试验的机会不同造成。缺乏假阴性资料
金标准和待评价试验的检测间隔时间是否很短，确信在这个间隔时间内目标疾病的病情不会改变？疾病进展偏倚：于同一时间在同一名患者身上进行待评价试验和金标准以得出结果是最为理想。若上述情况不可行，试验需推迟进行，可能出现因疾病自愈或进展至更严重阶段所导致的错误区分。
预测值的特点灵敏度越高的试验，阴性预测值越高；特异度越高的试验，阳性预测值越高；患病率的高低对预测值的影响更大。
思考？
一位中学女教师36岁，面色不好，心悸半年多，每次月经量偏多，如何进行诊断？根据病史：面色不好、月经量偏多初步诊断：缺铁性贫血(IDA) 可能性有70% (验前概率) 经检查：Hb 65g/L，RBC 3.02 ×102/L，血清铁蛋白20μg/L (LR=4.8) 问：结合上述结果，该教师患IDA的可能性有多大？
金标准是否能将目标疾病准确分为有病、无病状态？ Reference test bias：参考试验偏倚，选择标准诊断方法（“金标准”）不妥造成的偏倚。
“金标准”的选择根据具体临床情况 “金标准”的真实性

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2011诊断试验设计与循证评价
一.诊断试验（diagnostic test）
➢ 是对疾病进行诊断的试验方法。 ➢ 包括实验室检查，各种物理诊断如各种影像诊断（X线诊
断、CT、磁共振成像）、超声诊断以及放射性核素检查、纤维内窥镜、电镜等方法。
2021/1/19
诊断试验评价的意义
• 应用流行病学的方法对新的诊断试验进行评价研究，将有助于临床医师正确选用各种诊断试验，科学地解释诊断试验的各种结果，从而提高诊断水平。
2021/1/19
百分率（％） 100
80
60
40 20 0
50
特异度灵敏度
60
70
80
90
不同诊断界值时敏度与特异度间的平衡
100
Test variable
2021/1/19
（五）诊断试验临界值的制定
ROC曲线法确定诊断试验临界值是目前较为理想的方法
2021/1/19
➢ ROC曲线反映了灵敏度与特异度间的平衡。 ➢ 在ROC曲线空间，如果曲线沿着左边线，然后沿着
0.4
灵
敏 0.2
0.2
度 0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 FPR
0.0 0.2 0.4 0.6 0.8 1.0 FPR
完美诊断试验
无用诊断试验
假阳性率即 1－特异度
完美与无用的ROC曲线
2021/1/19
ROC曲线下面积（Area）与诊断准确度高低
高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F)
上边线越紧密，则试验准确度越高。 ➢ 在ROC曲线空间，如果曲线沿着机会线（45度对角
线）越紧密，则试验准确度越低。 ➢ ROC曲线下面积是重要的试验准确度指标。
2021/1/19Leabharlann 1.0阳 T 0.8 性P
率
R 0.6
即 0.4
1.0
T 0.8 P
R
机率线(chance line)
0.6
(diagonal reference line)
2021/1/19
偏倚的原因
2.诊断实验的测量偏倚
➢ 应注意诊断试验的重复性及测量结果的可靠性,防止测量偏倚。
➢ 如需要由操作者判断结果的试验,至少应该用部分受试者对操作者的变异性进行简要评估。
➢ 试验结果由仪器判断时,应对仪器的变异性进行简要估计。
➢ 对诊断试验中不确定结果出现的频率,计算评价指标时是否包括了这些不确定结果均应说明。
1.0
1.0
0.8
T 0.8
P
R
0.6
0.6
1.0
T 0.8 P R
0.6
0.4
0.4
0.4
0.2
0.0 0.0
A ＝0.664
0.2 0.4 0.6 0.8 1.0 FPR
诊断准确度较低（ <0.7 ）
2021/1/19
0.2
0.0 0.0
A ＝ 0.830
0.2 0.4 0.6 0.8 1.0
诊断准确度中等 FPR （ 0.7~0.9 ）
2021/1/19
1偏.同倚步的盲原法因比较
（五）诊断试验结果的测量 ➢如果先做诊断试验或金标准,然后由了解前一试验结果的人判断后一试验结果,则会发生判断倾向性,使两种方法一致性增高 ➢当评估者了解受试者是患者,就会潜意识地寻找可能存在的阳性结果；相反，如果知道受试者不是患者，则可能放弃仔细寻找阳性信息的机会,使可能存在的阳性信息被遗漏,从而导致敏感度和特异度高于真实值
2021/1/19
（三）样本含量的估计
• 诊断试验要求有一定数量的观察对象，即样本含量。
• 按照统计学中有关总体率的样本含量估算方法，分别计算病例组和对照组的样本含量。
2021/1/19
样本含量计算举例：
2021/1/19
（四）结果测量与处理
（五）诊断试验结果的测量
1.同步盲法比较
➢受检对象在检测前不分组，在整理资料时才按金标准进行分组，尽可能让所有受试患者同时接受诊断试验和金标准方法 ➢采用同步盲法判定结果(尤其是定性结果)，由不知另一试验结果的人独立、客观地对诊断试验或金标准结果做出判断
➢ 导致结论的可信度低甚至是错误的结论。
2021/1/19
（二）研究对象
研究对象的代表性影响评价指标的真实性
• 病例组：是指用金标准确诊“有病”的病例，应包含典型的、不典型病例，早、中、晚期病例，轻、中、重病例，有和无并发症的患者。
• 对照组：是指用金标准证实没有目标疾病的其他病例，特别是与该病容易混淆的病例。
0.2
A ＝ 0.938
0.0 0.0 0.2 0.4 0.6 0.8 1.0 FPR
诊断准确度较高（> 0.9）
临界值的选择
➢ 其选择直接影响到敏感度和特异度等评价指标 ➢ 诊断试验不仅要有区分健康或非某病与某病的界值，最
好还有需要治疗与判断预后的界值（如：医学决定水平） ➢ 其选择取决于诊断试验的目的与权衡漏诊和误诊的利弊 ➢ 有时还要根据研究对象中不同年龄组、不同临床特征时临界值的差异对诊断试验准确性的影响等多种临床实际情况,分别选用多个临界值
2021/1/19
关于金标准
➢ 可正确区分“有病”或“无病”。
➢ 当新试验实际上更优于传统“金标准” 方法时，应采用最新的病理生理知识去更新传统的“金标准”
2021/1/19
常见问题
➢ 金标准选择不当:会造成对受试者诊断分类上的错误,使整个试验的评价失去准确性的基础。
➢ 研究设计方法不熟悉,或是对金标准在诊断性试验评价中的重要性认识不足以及疾病诊断的金标准过于复杂或风险较大等原因, 常选用容易得到结果的、但准确性不高的诊断方法作为金标准。
2021/1/19
二.诊断试验研究的设计原则
– 确定“金标准” – 选择研究对象 – 样本含量的估计 – 诊断试验临界值的制定 – 盲法比较诊断试验与金标准的结果
2021/1/19
（一）金标准（gold standard ）
• 是指当前临床医学界公认的诊断疾病的最可靠的方法。也称为标准诊断。
• 通常包括：活检、手术发现、微生物培养、尸检、特殊检查和影像诊断，以及长期随访的结果。
• 正常人一般不宜纳入对照组。
2021/1/19
常见错误
➢ 将已知某病患者作为病例组,然后再挑选健康人或其他疾病患者作为对照组
➢ 只对诊断试验阳性的患者行金标准检查 ➢ 仅选用经金标准确诊的患者及非患者为研究对象；而将
曾疑为某病,但因某诊断试验阴性暂未采用金标准检查的患者除外 ➢ 只选用金标准确诊有病的患者作为研究对象而无对照组