诊断性研究的文献评价

合集下载

诊断性试验的分析与评价

25
六、提高诊断性试验效率的方法：联合试验
1. 平行试验：同时做几个试验，只要有一个阳性，即
可认为有患病证据。平行试验提高了敏感度和阴性预测值，但降低了特异度及阳性预测值。如联合用阻抗体积描记图及注射125I纤维蛋白原下肢扫描诊断下肢深静脉栓塞。单独应用这2种方法时，2种方法的敏感度均为74%，平行试验可使敏感度提高到94%。 Sen=Sen1 + Sen2 - Sen1 X Sen2
2-39 40-79 80-119 120-159 160-199 200-239 240-279 280-319 320-359 360-399 400-439 440-479
>=480 35 0
AMI
+ 2 - 88
13 26
30 8
30 5
21 0
19 1
18 1
13 1
19 0
15 0
7 0
13
如果扩大检查范围，将该地全体运动员都作上述检查，结果如表２：冠状动脉狭窄＞７５％是否运动心电图＋ 55(a) 42(b) 97 － 49(c) 478(d) 527 104 520 624
14
SEN=55/104=53%（不变） SPE=478/520=92%（不变） ACC=(55+478)/624=85%（增加２０％，１４个百分点） +PV=55/97=57%（下降３８％，３２个百分点） -PV=478/527=91%（增加４４％，２８个百分点） PREV=104/624=17%（原为５３％） +LR=0.53/（1-0.92）=6.6（不变） -LR=（1-0.53）/0.92=0.51（不变）阳性率=97/624=15%（下降５２％，１６个百分点）

临床研究文献的阅读与评价

【二】确定研究证据的类型
表2 原始研究涉及的要紧临床问题及其常用的设计方案
临床问题
常用设计方案
病因：评价某种因素是否与疾病的发生有关队列研究或病例－对照研究
诊断：评价某一诊断试验的真实性和可靠性？断面研究（将新的试验与金标准进行比较）
或评价某一试验在应用于人群时检测
临床前期病例的准确性
治疗：评价某种治疗方法如药物、外科手术，随机、双盲、安慰剂对照实验
各类研究证据的评价原那么
临床医师经常遇到正常人群/患者暴露于某种可能有害因素如环境中的各种危险因素（X射线、物理和化学物质等）或者药物等医疗干预措施，因此暴露者常常提出各类问题。
各类研究证据的评价原那么
如：孕妇长期接触计算机是否会增加流产的风险？输精管结扎术是否会增加前列腺癌的风险？心房纤颤患者服用华法林导致出血的风险有多大？要回答这些问题，临床医师必须评价临床研究证据的真实性、可能有害因素与疾病或不良反应间的相关强度以及与患者的相关性。
临床研究文献的阅读与评价
评价临床研究证据的重要性
证据来源复杂证据质量良莠不齐临床研究证据必须结合患者具体情况
评判临床医学文献对临床医生具有重要意义：
• 作为实践者：你能够判断这篇文章的观点是否可靠，能否被用于你的临床实践。你别指望医学期刊上的文章是100%的正确。
• 作为作者：当你写成一篇论文，准备投给医学期刊前，先自我评阅一番，能够减少退稿率。实际上，假如差不多有了这方面的知识和概念，你在做研究，写文章时差不多注意了这方面的问题，有何须担心退稿呢。
或其他干预措施的效果
预后：确定疾病的结局
照研究类型评价临床研究证据
从三个方面综合考虑临床研究证据的价值：

应用诊断准确性研究报告规范(STARD 2015)提高论文报告质量

山西医药杂志２０１８年４月第４７卷第８期ＳｈａｎｘｉＭｅｄＪ，Ａｐｒｉｌ２０１８，Ｖｏｌ．４７，Ｎｏ．８
· ８８３ ·
·讲座·
应用诊断准确性研究报告规范（ＳＴＡＲＤ２０１５）提高论文报告质量
臧长海李茁立
诊断准确性研究是用来评估某试验方法，正确地将一组研究对象区分为具有或不具有某种状况能力的研究。既往因诊断准确性研究论文撰写无统一的规范指导，导致报告遗漏了部分重要的研究信息，削弱了研究结果的应用价值，阻碍了其传播和应用。为提高诊断性研究报告的质量，“诊断准确性研究报告标准（ＳｔａｎｄａｒｄｓｆｏｒＲｅｐｏｒｔｉｎｇｏｆＤｉａｇｎｏｓｔｉｃＡｃｃｕｒａｃｙ，ＳＴＡＲＤ）”于２００３年发表，２０１５年该专家组对部分条目作了更新，发表了新的ＳＴＡＲＤ声明。［１］遗憾的是，国内目前尚无学术杂志规定投稿的诊断准确性论文需要遵循ＳＴＡＲＤ报告规范，也少有作者在其论文中说明遵循了ＳＴＡＲＤ规范。本文旨在推广和普及ＳＴＡＲＤ报告规范，以提升诊断准确性研究论文的报告质量。１ＳＴＡＲＤ报告规范简介
编号１２３４
条目采用至少一种准确性计算方法（如敏感度、特异度、预测值或ＡＵＣ）明确文章为诊断准确性研究采用研究设计、方法、结果和结论的结构式摘要（明确的指南见ＳＴＡＲＤ摘要）描述待评价试验的科学和临床背景，包括其预期用途或临床意义描述研究目的或假设

循证医学文献评价范文

循证医学文献评价范文循证医学（Evidence-Based Medicine，简称EBM）作为一种基于最新科学研究证据的医学决策方法，在医学界引起了广泛的关注和讨论。

其基本理念是医学决策需要依据当前最佳的科学证据，结合医生个人临床经验和患者特殊情况，以达到最佳的诊断和治疗效果。

然而，对于普通医生而言，如何评价和应用循证医学文献仍然是一个相对陌生的领域。

本文将以医学研究文献评价为主题，分享一篇范例，帮助读者了解循证医学文献的基本评价方法。

首先，让我们来看一篇标题为“高盐摄入与高血压发生的关系”的文献。

这篇文献的目的是探讨高盐饮食与高血压发生之间是否存在相关性。

文章是在对多篇既往的相关研究进行综合分析的基础上得出结论的。

首先要评价的是本文的研究方法。

文章中提到使用了Meta分析的方法，这是一种将多个独立研究结果进行汇总和分析的常用方法。

通过Meta分析，有助于提高研究结果的可信度和统计学意义。

接下来需要关注的是样本选择和研究对象是否具有代表性。

本文中提到，研究对象是从多个不同地区的高血压患者中随机选择而来。

这种多地区、多样本的选择策略有利于提高研究结果的适用性和代表性。

对于实验设计和方法的评价，除了研究对象的选择外，还要关注文献中是否详细描述了实验组和对照组的设置以及随机分组和盲法的运用。

这些因素对于研究结果的可靠性和科学性至关重要。

进一步，对于研究结果的评价，我们可以关注一下数据的统计学处理和结果的明确性。

文章中提到，通过Meta分析的方法，对参与研究的患者进行了系统的数据统计和分析，并得出了一组明确的结果。

这样的结果对于将来的研究和临床实践有较高的参考价值。

此外，还要关注研究结果的可替代性和传递性。

这一点可以从文献的参考文献部分得到体现。

一篇优秀的研究文献，通常会引用其他相关研究的成果，以便读者进一步了解和验证其研究结果的可靠性和普适性。

最后，需要关注的是对实验结果的观点和结论的评价。

在这篇范例文献中，结论是明确的，即高盐饮食与高血压发生之间存在一定的相关性。

文献质量评价

文献质量的评价一、文献质量评价的基本要素在进行文献质量评价时，应依据科学、规范的评价标准，而不是靠评价者的主观感觉、临床或研究经验来判断。

通常，文献质量评价的基本要素包括文献内部真实性、临床重要性和适用性3个方面。

（一）内部真实性内部真实性是指某个研究结果接近真值的程度，即研究结果受各种偏倚的影响程度。

偏倚主要来源于4个方面。

1.选择偏倚选择偏倚主要发生在选择和分配研究对象时。

如果在分配研究对象时，所采取的随机方法不完善，可能会造成各组的基线资料不具有可比性，从而亏大或缩小护理干预措施的效果。

另外，如果用于分组的随机序列公开化，使得研究者和研究对象能够预计到下一个研究对象会将会入选到哪一组，可能会掺杂研究者或患者的主观因素，从而带来偏倚。

因此，为了降低选择偏倚，在分配研究对象时，应采用严格的随机法，并对随机分配方案做到分配隐藏。

分配隐藏的措施包括下列几种：由不直接参与研究的药房人员或中心办公室人员控制随机分配方案；采用相同外观的、按顺序编号的药物容器；使用按顺序编号不透明密闭信封等。

分配方案的隐藏应至少维持到实际分配研究对象时，确定某研究对象被分配到哪一组后，不要随意改变分组情况。

2.实施偏倚实施偏倚主要发生在干预措施的实施过程中。

指除了要验证的措施外，向实验组和对照组提供的其他措施也不相同，从而出现系统偏差，降低实施偏倚的措施是将干预方案进行标准化，并尽可能对研究对象和干预提供者实施盲法。

如果干预提供者知道研究对象接受的时哪一种干预，会有意无意的对干预组的研究对象提供格外的关注；如果研究对象知道自己接受的是哪一种措施，会倾向于提供更多症状。

另外，在研究过程中，如果对照组的研究对象由于各种原因有意或无意地应用了实验组的措施，也会导致实施偏倚。

3.失访偏倚失访偏倚是指在研究的随访过程中，实验组和对照组因退出、失访、违背干预方案的人数或失访者的特征不同而造成的系统差异。

失访的原因往往是发生副反应、疗效差、出现并发症、搬迁或死亡等，如果失访率较高或各组间失访情况不一样，会使研究结果失真。

3-1 文献质量评价概述

3. 用于诊断性试验的指标
·敏感度 (sensitivity, SEN) ·特异度 (specificity, SPE) ·准确度 (accuracy, ACC) ·患病率 (prevalence, PREV)
sensitivity specificity
文献
指标
Confirming nasogastric a sensitivity
准，并对测评者实施盲
法
二、临床重要性
• 指研究是否具有临床应用价值。 • 通常使用量化指标来评价研究结果的临床意义，不同的
研究问题评价指标不同。 • 证据所涉及的临床问题是否明确、具体，以及所选择的
评价指标是否正确。
二、临床重要性
1. 用于病因或危险因素研究的指标
随机对照试验或队列研究
• 相对危险度 (探讨病因及危险因素时)
Japan.

病因暴露组的发病率与非暴露组发病率的比值
二、临床重要性
2. 用于防治措施效果研究的指标
·临床结局：治愈率、有效率、病死率
·绝对危险降低率 (absolute risk reduction, ARR)
·相对危险降低率 (relative risk reduction, RRR) ·获得一例最佳效果需治疗的病例数 (number needed
原始研究存在的问题
原始研究
• 研究方法交代不清
原始研究
• 研究结果之间存在差异
原始研究 • ……
文献质量进行评价的重要性
进行系统评价的必要步骤
节省临床人员时间可以为决策者在制定政策时提供真实、可靠的依据
护理人员“用证”过程中主要存在的问题
简单的将循证护理等同于将文献综述后的结果应用于临床实践

如何阅读和评价医学研究文献

5,是否为常见临床问题，文章中涉及的干预措施或试验方法在你的医院是否可行？如果文章涉及的问题在临床实践中经常遇到，且研究的干预措施或试验方法在你的医院也有条件实行，这样的文章值得深入阅读。
6,如果文章提供的信息是真实的，是否会改变现有的医疗实践？如果文章涉及的干预措施或试验方法，你过去未在类似的病人中使用过，也许新的尝试可能获得意外的收获，因此，有必要继续阅读这篇文章。
第二节
高效率阅读医学文献的基本步骤
一、明确阅读文献的目的提高阅读文献的效率，必须首先明确阅读文献的目的，明确希望从文献中获得什么样的信息，以指导选择目标杂志、数据库和文献的类型。
应先查寻有无相关的系统评价或高质量文献综述，因为这类文献浓缩了大量原始文献的信息，特别是系统评价，其严格的方法学使文献的结论具有很高的真实性和可信度，可节省读者逐篇阅读和评价原始文献的时间和精力，快速和有效地获取有价值的信息资源。如果没有相关的系统评价或综述，再查寻和阅读原始文献。

初筛临床研究证据的真实性和相关性
这篇文章是否值得花时间精读？是否 1. 这篇文章是否来自经同行评审（peer-reviewed）的杂志? 继续停 2. 这篇文章的研究场所是否与你的医院相似，以便结果真实时可应用于你的患者？继续停 3．该研究是否由某个组织所倡议，其研究设计或结果是否可能因此受影响？暂停继续阅读这篇文章摘要的结论部分，确定相关性 4. 如果文章提供的信息是真实的，对我的患者的健康有无直接影响，是否为患者所关心的问题？继续停止 5．是否为临床实践中常见的问题，文章中涉及的干预措施或试验方法在我的医院是否可行？继续停止 6．如果文章提供的信息是真实的，是否会改变现有的医疗实践？继续停止

诊断性试验的评价标准

诊断性试验的评价标准诊断性试验是临床医学中常用的一种研究方法，用于评估医疗检查工具对疾病的诊断能力。

在进行诊断性试验时，我们需要根据一定的评价标准来判断检查工具的准确性和可靠性。

本文将就诊断性试验的评价标准进行探讨。

首先，我们需要关注的是敏感性和特异性。

敏感性是指检查工具能够准确识别患病者的能力，而特异性则是指检查工具能够准确排除非患病者的能力。

一个理想的诊断工具应该具有高的敏感性和特异性，即能够准确地诊断出患病者，并排除非患病者，从而避免误诊和漏诊的情况发生。

其次，我们需要考虑阳性预测值和阴性预测值。

阳性预测值是指在检查结果为阳性的情况下，患者真正患病的概率；而阴性预测值则是指在检查结果为阴性的情况下，患者真正未患病的概率。

这两个指标可以帮助我们更好地理解检查工具的诊断能力，从而进行更准确的诊断和治疗。

此外，我们还需要关注受试者工作特征曲线（ROC曲线）。

ROC曲线是一种用于评估诊断工具准确性的图形方法，它可以直观地展现出检查工具的敏感性和特异性之间的平衡关系。

通过分析ROC曲线，我们可以确定一个最佳的诊断阈值，从而使检查工具的诊断能力达到最优化。

最后，我们需要考虑诊断试验的重复性和稳定性。

重复性是指同一检查工具在不同时间、不同环境下进行重复测试时的一致性，而稳定性则是指检查工具在长时间内保持一致的能力。

一个优秀的诊断工具应该具有良好的重复性和稳定性，以确保其在临床应用中的可靠性和稳定性。

综上所述，诊断性试验的评价标准涉及到敏感性、特异性、阳性预测值、阴性预测值、ROC曲线、重复性和稳定性等多个方面。

通过综合考量这些评价标准，我们可以更准确地评估诊断工具的诊断能力，为临床医学的诊断和治疗提供更可靠的依据。

在进行诊断性试验时，我们需要充分重视这些评价标准，从而确保我们得到的检查结果是准确可靠的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、敏感度（sensitivity,SEN = a/a+c）
诊断性试验检测为阳性的病例在用金标准确定为“有
病”的病例中所占的比例。敏感度越高，漏诊率(1— SEN)越少，易误诊，有助于排除相应的疾病。
可编辑版
9
二、特异度(specificity,SPE=d/b+d)
诊断性试验检测为阴性的受试者在用金标准确定为“无病”的受
诊断性试验中，真阳性在“有病”患者中的比例与假阳性在无病例数中比例的比值。表明诊断性试验阳性时患病机会的比值，比值越大则患病的概率越大。
+LR = a/a+c / b/b+d =Sen/1-Spe
可编辑版
13
预测值的特点
• 灵敏度越高的试验，阴性预测值越高； • 特异度越高的试验，阳性预测值越高； • 患病率的高低对预测值的影响更大。
可编辑版
14
例患病率对预测值的影响(1)
监护病房CK诊断心梗(CK<80=CK-)
心梗
无心梗
CK+
215(93%)
16
CK-
15
114(88%)
第三讲诊断证据的分析与评价
可编辑版
1
诊断证据的评价教学目的来自要求：熟悉诊断研究方法。诊断试验的常用指标、诊断性试验证据的评价。
可编辑版
2
—本节课内容的出处
How to Use an Article About a Diagnostic Test
Roman Jaeschke, Gordon H. Guyatt, David L. Sackett, and the Evidence Based Medicine Working Group
试者中所占的比例。特异度越高，误诊率(1—SPE)越低，易漏诊。
有助于确定诊断。
三、患病率(prevalence,PREV=a+c/a+b+c+d)
经诊断性试验检测的全部病例中，真正“有病”患者所占的比例。在级别不同的医院中，某种疾病的患者集中程度不同，故患病率差别大，从而影响阳性预测值的结果。
—William Osler
可编辑版
4
第二节对诊断性试验研究评估的基本要求
一、金标准的确定
指当前临床医师公认的诊断疾病最可靠的方法，也称标准诊断。用金标准将患者，正确区分“有病”或“无病”。它可以包括病理活检、手术发现、微生物培养、尸检、特殊检查和影像诊断，以及长期随访的结果。
二、盲法的使用
Based on the Users‘ Guides to Evidence-based Medicine and reproduced with permission from JAMA. (1994;271(5):389-391) and (1994;271(9):703-707). Copyright 1995, American Medical Association.
抗原在诊断结直肠癌方面很有价值，甚至作为筛选手段。但后来的研究发现，如果将病人人群扩展到早期结直肠癌病人和其他癌症病人以及其他消化道疾病，癌胚抗原的诊断准确度就明显下降。因此，癌胚抗原已不再作为诊断和筛选指标，只作为结直肠癌病人的随访指标。69年
可编辑版
6
四、诊断性试验与金标准结果作比较
判断新诊断性试验的临床价值，应当将其结果与金
• 诊断性试验的真正价值在于它能够鉴别目标疾病与其他容易混
淆的疾病或状态。 • 如Thomson在36例晚期结直肠癌病人的诊断试验中，发现有
35 例病人癌胚抗原 (Carcino-embryonic-antigen) 升高，而在正常人和其他的病人则癌胚抗原水平很低。因此，他们断定癌胚
可编辑版
11
• 特异度高的试验适用于
– 凡假阳性结果会导致病人精神和肉体上严重危害时
– 要肯定诊断时，当试验结果呈阳性时，价值更大
可编辑版
12
循证医学中诊断性试验常用的指标
四、阳性预测值（positive,+PV
诊断性试验检测为阳性的全部病例中，用金标准诊断为 “有病”的病例所占的比例。
+PV = a/a+b）五、阳性似然比（ positive likelihood ratio,+LR ）
标准诊断的结果进行同步对比，评估时要求每个病例，必须都有两项（即金标准与新试验）检查的结果，并按要求列出四格表。
可编辑版
7
四格表的排列
诊断阳性试验阴性
合计
金标准
有病无病
合计
真阳性（A）假阳性（B） A＋B
假阴性（C）真阴性（D） C＋D
A＋C B＋D A＋B＋C＋D
可编辑版
8
第三节循证医学中诊断性试验常用的指标
可编辑版
5
三、研究对象的选择（被检人群情况）
研究对象包括两组：
• 一组是用金标准确诊“有病”的病例组，病例组应包括各型病例。
• 另一组是金标准证实为“无该病”的其它病例（各型、各期），特别是易混淆的病例，称对照组。
• 病人人群的代表量应足够大、广。以确保检测差异不是由年龄、性别、饮食、活动等非疾病因素所造成。
单盲：是指在诊断性试验中，判断试验的人不知道该病例用
金标准诊断“有病或无病。”双盲:检测者不知道被检测者是否有病；同时，应用“金标准”者与应用被检试验者双方均不知道对方的检测结果。（防“诊断猜疑”偏倚 Diagnostic suspicion bias —比如：
CT显示肺部包块，我们很可能就能“看到”原先没有看到的相应阴影；如果知道超声心动图的结果，我们很可能“听到”原先未听到的杂音）
可编辑版
10
灵敏度和特异度的特点
• 当试验方法和阳性标准固定时，每个诊断试验的灵敏度和特异度是恒定的。
• 区分诊断试验正常和异常的临界点会影响灵敏度和特异度。
• 灵敏度高的试验适用于 ➢ 疾病漏诊可能会造成严重后果(AIDS) ➢ 有几个假设诊断，为排除某病的诊断 ➢ 用于筛检无症状病人而该病的发病率又比较低，当试验结果呈阴性时，价值更大
《循证医学》 Evidence-based Medicine 王家良，人民卫生出版社2005年8月
可编辑版
3
第一节诊断性试验在临床医学中的重要性
Medicine is a science of uncertainty and an art of probability.
医学是一门不确定性的科学和可能性的艺术