证据的分类 分级与

合集下载

临床研究证据的分类、分级和来源

临床研究证据的分类、分级和来源

观察性研究(描述性和分析性研究)
特点: - 研究者不能主动控制研究条件 - 可为前瞻性和回顾性 类型: - 队列研究 - 病例对照研究 - 横断面研究 - 叙述性研究
试验性研究
---- 临床试验 特点: - 研究者可主动控制研究条件 - 可随机分配 - 前瞻性研究 类型: - 随机对照试验 - 交叉试验 - 自身前后对照试验 - 临床同期对照试验
Quasi-randomized control trial
与随机对照试验相似 唯一区别:采用半随机分配方式
按试验对象的生日、住院日或住院号等末尾数 字的奇数或偶数分配研究对象 交替分配研究对象
容易受偏倚因素的影响 结果的真实性、可靠性不及RCT
半随机对照试验设计模式
试验组
研究 合格研 半随机 对象 究对象
例:乙型肝炎病毒与原发性肝癌病因学研究 Lancet 1981;11:1129
肝癌(40)
HBsAg(+) 台湾 社保 人员 无肝 Ca者 (?) 无肝癌(3414)
观察5年
HBsAg(-)
肝癌(1)
无肝癌 (19252)
样本指向
+ -
HBsAg
肝 癌 有 无 40 3414 1 19252
两组发生肝癌的相对危险度: RR=[40/(40+3414)]/[1/(1+19252)] =223
第三章 临床研究证据的 分类、分级和来源


临床研究证据的分类
临床研究证据的分级
临床研究证据的来源
证据的分类
按研究方法分类
原始临床研究证据
按研究问题分类
病因临床研究证据
按用户需要分类
系统评价

证据等级与推荐强度评估

证据等级与推荐强度评估

证据等级与推荐强度评估引言在当前的科学研究和医疗实践中,为了评估证据的可靠性和推荐对策的强度,人们采用了一系列标准和指南。

证据等级与推荐强度评估体系的使用可以帮助医生、研究人员和决策者做出更科学、准确和可靠的决策。

本文将介绍证据等级和推荐强度评估的基本概念、评估标准以及应用范围。

证据等级评估什么是证据等级评估?证据等级评估是一种评价研究证据质量和可信度的方法,它将研究设计的严密性、样本容量、实验方法以及研究结果的一致性等因素综合考虑,以确定证据的可靠程度。

证据等级的分类根据《循证医学指南》的建议,证据等级通常可以分为以下几个级别:•Level I:系统评价与Meta分析•Level II:随机对照试验•Level III:非随机对照试验•Level IV:前瞻性队列研究•Level V:回顾性队列研究和病例对照研究•Level VI:横断面研究•Level VII:专家意见证据等级从 I 到 VII 逐渐减少可靠性和可信度,也代表了不同类型研究的严谨性和证据质量。

推荐强度评估什么是推荐强度评估?推荐强度评估是基于证据等级评估的基础上,进一步考虑治疗效果、副作用、成本效益等多个因素,给出治疗或决策的推荐强度。

推荐强度评估可以帮助医生和决策者判断某项治疗方法的优劣和适用性。

推荐强度的分类推荐强度通常可以分为以下几个级别:•强烈推荐:对治疗效果非常肯定,治疗效果优于其他方案,副作用相对较小,成本效益较高。

•推荐:对治疗效果肯定,治疗效果相对较好,副作用较小,成本效益较高。

•不确定推荐:目前证据不足以支持某项治疗方法的强烈推荐或推荐,需要进一步研究和验证。

•不推荐:治疗效果相对较差,副作用较大,成本效益较低,不推荐使用。

推荐强度评估从强烈推荐到不推荐的级别,体现了不同治疗方案的优劣和适用性。

证据等级和推荐强度评估的应用证据等级和推荐强度评估广泛应用于医学研究、临床实践和卫生政策制定等领域。

在医学研究中,研究人员可以根据证据等级评估的结果来选择最适合的研究方法和设计,提高研究的科学性和可靠性;在临床实践中,医生可以根据推荐强度评估的结果来决定最合适的治疗方案,提高治疗效果和患者满意度;在卫生政策制定中,决策者可以依据证据等级和推荐强度评估的结果来制定政策和指南,提供科学依据和支持。

证据的分类分级与推荐

证据的分类分级与推荐



明确显示干预措施利 大于弊或弊大于利
利弊不确定或无论质 量高低的证据均显示 利弊相当

极低
GRADE标准特点及应用
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊;反映一 项干预措施是否利大于弊的确定程度
【GRADE标准的特点和优势】
该工作组循证制定出国际统一的证据质量分级和推荐强度系统,并于2004年正式
推出。
评价:这是第一个从使用者角度制定的综合性证据分级和推荐强度标准,以易于
理解、方便使用为特点。
认 可 度 : 由 于 其 更 加 科 学 合 理 , 过 程 透 明 , 适 用 性 强 , 目 前 包 括 WHO 和
2)研究结果不一致:不同研究间大相径庭的疗效评估 (异质性或结果的 差异 )意味着各种疗法的疗效确实存在差异。差异可能源于人群 (如药 物对重症人群的疗效可能相对显著 ) 、干预措施 ( 如较高药物剂量会使 疗效更显著)或结局指标(如随时间推移疗效降低)。当结果存在异质性 而研究者未能意识到并给出合理解释时,证据质量亦降低。
六、GRADE标准
针对当前证据分级与推荐意见存在的不足, 2000年,包括 WHO在内的19个国
家 和 国 际 组 织 共 同 创 立 “ 推 荐 分 级 的 评 价 、 制 定 与 评 估 ” (Grading of Recommendations Assessment,Development and Evaluation,GRADE)工作 组,由67名包括临床指南专家、循证医学专家、各个标准的主要制定者及证据研 究人员构成。
科普材料、健康教育材料、 大众媒体为主(电视、广 播、网络、报纸) 关注微观层面,侧重个人 保健,解决自身问题

循证医学证据的分类分级与推荐

循证医学证据的分类分级与推荐
2001年,苏格兰院际指南网络(The Scottish Intercollegiate Guidelines Network,SIGN)发布了更详细的证据分级和推荐强度(表 3—8)。
荷兰、新西兰、澳大利亚等国先后在临床指南中也引入或修订了各自的 证据分级和推荐标准。
局限性:局限于治疗方面,不适于预防、诊断等其他领域
证据的分类、分级与 推荐
授课内容
第一节 证据分类 第二节 证据分级与推荐 第三节 GRADE标准特点及应用
学习目的
掌握证据的分类依据、GRADE证据分级和 推荐标准的内涵和关系
熟悉临床研究证据分级与推荐系统的演进 过程及内容
了解其他领域的证据分级系统
1、飞速发展医疗科研 (尤其是临床研究)导 致大量科研成果产生(海 量信息);全球23000余 种生物医学期刊每年发 表数百万篇文献
1992年AHRQ证据分级及推荐强度
四、SIGN标准
1996年,英格兰北部循证指南制定项目(North of England Evidence Based Guidelines Development Project,NEEBGDP)发布了其制定 的证据分级标准和推荐强度,将RCT,Meta分析和系统评价共同作为 最高级别的证据,这是英国继加拿大和美国之后较系统全面发布自己的 分级标准。
卫生技术评估(health technology assessment, HTA)
二、按使用者需求分类
第二节、证据分级与推荐
要实现科学高效的决策,使用者不必花费大量时间和精力 检索和评价证据质量(quality of evidence),只需要充 分利用研究人员预先确立证据分级标准和推荐意见,参考 各种高质量证据帮助科学决策。
1979年,加拿大定期体检特别工作组(Canadian Task Force on the Periodic Health Examination ,CTFPHE)首次 对研究证据进行分级并给出推荐意见。

证据分级、分类和推荐 李静

证据分级、分类和推荐  李静
2004年,由包括WHO 在内的19 个国家和国际组 织、67名包括临床指南专家、循证医学专家、各 个标准的主要制定者及证据研究人员共同成立的 GRADE 工作组,循证制定出国际统一的证据质 量分级和推荐强度标准,于2008年正式在BMJ杂 志系列推出5篇文章
GRADE为系统评价和指南提供了一个证据质量评价体 系,为指南中的推荐强度评级提供了一种系统方法
基于经验未经严格论证的专家意见
证据临床相关性分级2001
(The Evidence Pyramid)
The different types of material indexed in MEDLINE are labeled in the pyramid diagram, with the least clinically relevant at the bottom and the most clinically relevant at the top. The four layers above case reports and case series represent actual clinical research; the layers below are least clinically relevant and can be useful as background resources
证据分类、分级和推荐
李静
四川大学华西医院 中国循证医学中心 循证医学教育部网上合作研究中心 中国Cochrane中心
1
证据分类
临床研究
一次研究证据:
作者根据自己的工作实践经验 和科研成果写成的原始论文: 主要涉及病因、诊断、治疗和预后
二次研究证据:
对一次文献的系统阅读、综合 分析、提练和概括论述:系统评价、 Meta-分析、综述、临床实践指南、

证据的分类分级与推荐

证据的分类分级与推荐

该工作组循证制定出国际统一的证据质量分级和推荐强度系统,并于2004年正式
推出。
评价:这是第一个从使用者角度制定的综合性证据分级和推荐强度标准,以易于
理解、方便使用为特点。
认 可 度 : 由 于 其 更 加 科 学 合 理 , 过 程 透 明 , 适 用 性 强 , 目 前 包 括 WHO 和
横断面调查
描述性研究 病例系列 个案报道
自身前后对照研究
非随机同期对照研究
2、二次研究证据(secondary research evidence)指尽可能全面 收集某一问题的全部原始研究证据,进行严格评价、整合、分析 、总结后所得出的综合结论,是对多个原始研究证据再加工后得 的证据。 –系统评价(systematic review ,SR)/Meta分析 –临床实践指南(clinical practice guidelines, GCP) –临床决策分析(clinical decision analysis) –临床证据手册(handbook of clinical evidence) –卫生技术评估(health technology assessment, HTA) –实践参数(practice parameter)
用的诠释; 8. 适用于制作系统评价、卫生技术评估及指南。
二 影响证据质量的因素
可能降低证据质量的因素
1)研究的局限性:研究的局限性包括隐蔽分组缺失、盲法缺失(特别是 结局指标为主观性指标且对其评估极易受偏倚影响时 )、失访过多、未 进行意向性分析、观察到疗效就过早终止试验或未报道结果 (通常是未 观察到疗效的一些研究)。
Cochrane协作网在内的 28个国际组织、协会已经采纳 GRADE标准,已成为证据 发展史上的里程碑事件。

第三章 证据的分类、分级与推荐

第三章 证据的分类、分级与推荐
63
证据质量 高质量
中级质量 低质量
极低级质量
表达方式 ⊕⊕⊕⊕或A ⊕⊕⊕○或B ⊕⊕○○或C ⊕○○○或D
推荐强度
支持使用某干预措施的 强推荐
支持使用某干预措施的 弱推荐
反对使用某干预措施的 弱推荐
反对使用某干预措施的 强推荐
表达方式 ↑↑或1 ↑?或2 ↓?或2 ↓↓或1
64
1)强推荐的含义 对患者:在这种情况下,多数患者会采纳推荐方案,只有少
40
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
41
研究的质量 随机分组、方法、编盲 盲法;双盲、单盲、开放性 随访:病例是否完整 分析方法
影响结果解释的因素 偏倚的来源
42
排除质量低的研究,但有排除产生真 实性结果研究的危险
12
13
系统评价(systematic review, SR/Meta analysis) 临床实践指南(clinical practice guidelines,
CPG 临床决策分析(clinical decision analysis) 临床证据手册(handbook of clinical evidence) 卫生技术评价(health technology assessment,
标准,评价标准要有足够的客观性; 对影响预后的重要因素是否进行校正,如疾病的
不同亚型,不同特征的患者人群。
31
结果能否用于自己的病人 -检查样本的代表性:研究人群与我的病人越接近, 应用结果的把握就越大
是否考虑到临床上所有的重要结果 治疗的利与弊
① 治疗作用;肺癌,保守/开放治疗 ② 不良事件;SARS,类固醇治疗 ③ 费用:公费,自费,病人经济状况 32

证据分级、分类和推荐 李静

证据分级、分类和推荐  李静

2011年再次推出GRADE系列文章
2008年推出的系列文章主要针对使用GRADE 结果的临床医生和决策者,这些结果包括证 据概要表、结果总结表和推荐强度分级 未能为负责使用GRADE 方法生产结果的人 提供详尽指导:包括系统评价及卫生技术评 估作者、指南委员会成员及为指南委员会提 供支持的方法学家们 2011年推出的系列文章弥补了上述不足,为 使用GRADE 的每一个步骤提供指导
Guideline 1 created equal!!
Article 1
Guideline 2
Article 2 Textbook
CME
Expert
What’s the truth?
证据分级
20世纪60年代,美国社会学家Campbell和Stanley首次提出了研究证据分级的 思想,评价教育领域部分原始研究的设计,将随机对照研究的质量定 为最高并引入内部真实性和外部真实性的概念
Ⅱ2
证据来自于比较了不同时间、地点有无干预措 施的研究;或无对照研究但疗效巨大(如1940
年青霉素的应用)

基于临床研究、描述性研究或专家委员会的报
告,或权威专家的意见
B 考虑该疾病的证据尚可 C 支持考虑该疾病的证据缺乏
D 不考虑该疾病的证据尚可 E 不考虑该疾病的证据充分
Oxford Centre for Evidence-based Medicine
GRADE证据推荐强度
根据研究结果对患者的利弊关系,将推荐强度分为强和 弱两级
推荐强度
定义

干预措施明显利大于弊、或弊大于利

干预措施因研究质量低而利弊不确定或利弊 相当
术语
解释

包括降低发病率和病死率、提高生活质量、
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

各种证据是否具有相同的重要性?
33
第三节 临床研究证 据的分级
34
分级的依据
证据来源 证据科学性
证据可靠程度
35
分级始于研究设计 各类设计具有不同的优缺

36
非系统性临床观察研究
临床医生对疾病的非系统性观察 病例报告 病例分析 专家评论
无对照、样本量小 存在较大的偏倚
37
非随机研究
43
代表性分级标准
加拿大定期体检特别工作组(CTFPHE标准): 1979年,三级标准
美国胸内科医师学会(ACCP标准) :1986年, 五级标准
美国卫生保健政策研究所(AHRQ标准) :1992 年,四级标准
苏格兰院际指南网络(SIGN标准 ):2001年,四 级
牛津大学循证医学中心:1998年,五级 推荐分级的评价、制定与评估(GRADE标准):
第四节 GRADE标准 的特点及应用
57
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊; 反映一项干预措施是否利大于弊的确定程度
58
【GRADE标准的优势】 1.由一个具有广泛代表性的国际指南制定小组制定; 2.明确界定了证据质量和推荐强度; 3.清楚评价了不同治疗方案的重要结局; 4.对不同级别证据的升级与降级有明确、综合的标准; 5.从证据到推荐全过程透明; 6.明确承认价值观和意愿; 7.就推荐意见的强弱,分别从临床医生、患者、政策制
临床问题 疗效评价
治疗的不良反应
最佳的研究设计 RCT
RCT
诊断或筛查试验
与金标准进行盲法比较
预后评价
队列研究
无法进行RCT或有伦理问 队列研究 题的疗效评价
暴露不良环境的危害
病例对照研究
27
不同临床问题的相似评价标准
➢ 研究结果科学性:是否真实可信? ➢ 研究结果的是什么?有多大? ➢ 研究结果能否应用于我的病人,解
20
各种证据如何分辨质量?
21
第二节 临床研究评 价
22
为什么要评估证据的质量?
大多数干预措施的效果不是非常显著,有的甚 至可对病人造成伤害。
应当对文献等证据进行评价。
23
对文献质量进行评价的意义:
可作为是否纳入研究的标准; 用于解释研究结果间的差异性(异质性); 用于敏感性分析; 作为研究结果统计学分析时赋予权重的根据,
不同亚型,不同特征的患者人群。
31
结果是否有助于处理我的病人
✓ 结果能否用于自己的病人 -检查样本的代表性:研究人群与我的病人越接近, 应用结果的把握就越大
✓ 是否考虑到临床上所有的重要结果 ✓ 治疗的利与弊
① 治疗作用;肺癌,保守/开放治疗 ② 不良事件;SARS,类固醇治疗 ③ 费用:公费,自费,病人经济状况 32
11
按研究方法分类
原始临床研究数据:直接在受试者中进行单个 有关病因、诊断、预防、治疗和预后等试验研 究所获得的第一手数据,进行统计学处理、分 析、总结后得出的结论。
二次临床研究数据:全面收集某一问题的全部 原始研究证据,进行严格评价、整合、分析、 总结后所得出的综合结论,是对多个原始研究 证据再加工后得到的证据。
当研究纳入的患者和观察事件相对较少而致置信区间较宽 时,将降低该研究的证据质量。
5)发表偏倚
若阴性结果的研究不能发表会减弱证据质量,典型情况是 公开的证据仅限于少数试验且这些试验全部由企业赞助, 此时不得不质疑存在发表偏倚。
61
二)可能增加证据质量的因素 1)效应值很大
当方法学严谨的观察性研究显示疗效显著或非常显著且结果一致时, 将提高其证据质量。 2)可能的混杂因素会降低疗效 例如研究证据显示营利性医院患者死亡率低于非营利性医院。但通常 营利性医院卫生资源更多,就诊患者社会经济状况普遍较好、病情较 轻。考虑到这些混杂因素,若得出营利性医院疗效更好,其证据强度 将降低。 3)剂量-效应关系 药物剂量及其效应大小间有明显关联。
具体描述
未来研究几乎不可能改变现 有疗效评价结果的可信度 未来研究可能对现有疗效评 价有重要影响,可能改变评 估结果的可信度 未来研究很有可能对现有疗 效评估有重要影响,改变评 估结果可信度的可能性较大 任何疗效的评估都很不确定
推荐级 具体描述 别

明确显示干预
措施利大于弊

利弊不确定或
者利弊相当
56
定者角度作了明确实用的诠释; 8.适用于制作系统评价、卫生技术评估及指南。
59
二 影响证据质量的因素
一)可能降低证据质量的因素 1)研究的局限性
研究的局限性包括隐蔽分组缺失、盲法缺失(特别是结局指标为主观性指标 且对其评估极易受偏倚影响时)、失访过多、未进行意向性分析、观察到疗 效就过早终止试验或未报道结果(通常是未观察到疗效的一些研究)。 2)研究结果不一致 不同研究间大相径庭的疗效评估(异质性或结果的差异)意味着各种疗法的疗 效确实存在差异。差异可能源于人群(如药物对重症人群的疗效可能相对显 著)、干预措施(如较高药物剂量会使疗效更显著)或结局指标(如随时间推移 疗效降低)。 当结果存在异质性而研究者未能意识到并给出合理解释时,证据质量亦降低 。
60
3)间接证据
第一类,如欲比较两种活性药物的疗效时,若无两药直接 比较的随机对照试验,但有两药均与同一安慰剂比较的随 机对照试验时,便可进行两药疗效的间接比较。但其证据 质量比两药直接比较的随机对照试验低
第二类间接证据包括人群、干预措施、对照措施、预期结 局及相关研究中类似的因素。
4)精确度不够
WHO,2004年,四级
44
CTFPHE标准
ACCP标准
首次对Ⅰ级水平的RCT规定了质量; 将证据等级与推荐强度一一对应; 但忽视了低级别的证据。
证据质量等级标准的发展
老五级证据
新五级证据
53
新九级证据
54
GRADE标准
55
GRADE 证据分级及推荐强度
证据水 平 高 中

极低
HTA) 实践参数(practice parameter)
14
非研究证据
专家意见 个人经验 其他(当地的“智慧”、“诀窍”、
“常识”等)
15
按研究问题分类
病因:如何确定疾病的原因? 诊断:如何正确解释从病史、体检得到的资
料?如何选择、决定诊断试验?某种诊断或治 疗措施的价值? 治疗:如何选择对病人有好处而无害处的治 疗手段,从效果和花费来看,是否值得应用? 某种药物的临床应用? 预防:如何防止疾病的发生、复发? 预后:如何估计病人可能产生的并发症?
解决临床问题,包括: 发病与危险因素→认识与预防疾病; 疾病的早期诊断→提高诊断的准确性; 疾病的正确合理治疗→应用有疗效的措施; 疾病预后的判断→改善预后,提高生存质量。 合理用药和促进卫生管理及决策科学化。
询证医学五步法
第三章 证据的分类、分 级与推荐
9
什么是证据?
10
第一节 临床研究证 据的分类
设立对照组 随机分组
方法:简单随机化、区组随机、分层随机 双盲(Dou 双盲双模拟(double dummy) 开放试验、单盲
40
随访
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
41
决临床问题。
28
诊断试验评价
是否同参照标准(金标准)进行独立的盲法比较; 研究人群是否包括临床上应用该试验的各种病人; 所评价的试验结果有没有影响参照标准检查的实施; 诊断试验的方法描述是否详细,能否重复。
29
治疗措施评价
➢ 有无对照;治疗分配是否随机?
随机化方法是否正确;两组基线是否一致(可比 性);
62
三 影响推荐强度的因素
推荐强度反映对一项干预措施是否利大于弊的确定程度。 干预措施的有利方面包括降低发病率和病死率、提高生活
质量、降低医疗负担和减少资源消耗。 不利方面包括增加发病率和病死率,降低生活质量或增加
资源消耗等。 GRADE系统只有强弱两级推荐,为方便使用GRADE还为
证据质量和推荐强度提供了首选的符号描述法,也为喜欢 使用数字和字母形式的机构提供了首选的数字/字母描述法
63
证据质量与推荐强度的表达方式
证据质量 高质量
中级质量 低质量
极低级质量
表达方式 ⊕⊕⊕⊕或A ⊕⊕⊕○或B ⊕⊕○○或C ⊕○○○或D
推荐强度
支持使用某干预措施的 强推荐
支持使用某干预措施的 弱推荐
反对使用某干预措施的 弱推荐
反对使用某干预措施的 强推荐
表达方式 ↑↑或1 ↑?或2 ↓?或2 ↓↓或1
系统评价中对RCT质量评价内容
研究的质量 随机分组、方法、编盲 盲法;双盲、单盲、开放性 随访:病例是否完整 分析方法
影响结果解释的因素 偏倚的来源
42
对研究质量的处理
排除质量低的研究,但有排除产生真 实性结果研究的危险
纳入低质量的试验同时探讨质量高低 对效应估计值的影响 用敏感性分析探讨排除低质量研究对 系统评价结果证据强度的影响 使用Meta回归模型 累积性Meta分析
➢ 是否用双盲; ➢ 是否交待全部研究结果; ➢ 随访的完整性,有无干扰;
30
预后研究评价
患者是否在病程的相同起点开始随访; 随访的完整性:从纳入研究到研究规定的终点,
失访率高低直接影响研究结果的真实性; 结果评定标准的客观性:定义结果的测量或评价
标准,评价标准要有足够的客观性; 对影响预后的重要因素是否进行校正,如疾病的
16
按用户需要分类
政策制定者:政府官员、机构负责人 等(禁烟、禁反应停)
研究者:临床和基础研究教学人员等 (研究立项)
相关文档
最新文档