数据提取-DXY上传新

系统评价与Meta分析的数据提取

丁香园循证版

水天之间

2013年11月8日

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法何为数据?

数据是对客观事

物的符号表示,

是用于表示客观

事物的未经加工

的原始素材,如

图形符号、数字、

字母、文字等。

系统评价中的数据?

系统评价的数据提取,

不仅指统计数字,还

包括研究人员、研究

时间、研究方法、研

究对象、研究机构、

研究背景、干预措施、

结局指标、研究结果、

出版机构等众多信息。

数据提取

不仅是摘抄信息,还涉及数据处理换算以及数据分析。

数据的来源

发表的文献联系作者单个患者数据

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法

数据提取基本原则

客观数据转换前留原始数据。

做方法评价时候,引用

原始语句作为依据。

数据提取基本原则

提前进行人员培训

培训内容:

数据提取的基本过程;

数据提取表的主要内

容;

相关软件使用;

考察不同评价员对特

定表述方式理解的一

致性。

Coder drift

数据提取基本原则

预试验常见问题:

遗漏某些重要项目;

项目设置过多;

代码设置有歧义;

选项设置不完善。

及时修改。

数据提取基本原则

多人提取

?统计34篇系统评价,20处错误;

?两人提取优于单人双次提取;

?提取人员来源于不同专业;

?提前做好培训保证一致性。

数据提取基本原则

处理分歧

协商讨论

第三方仲裁

联系作者获取更多信息

注明分歧原因

数据提取基本原则

隐藏纳入研究的题目、

作者、作者单位、杂

志名称、研究结果等

信息,而代之以编码,

提高提取数据的可靠

性。

——未得到大样本研

究支持,尚无定论。目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法数据提取基本步骤

?明确需要纳入的数据类型?明确数据提取人员

?设计数据提取表格

?进行预试验

?开始数据提取

?数据核查、修改

?处理意见分歧

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法

数据提取表的设计

数据提取表(data collection form)的功能:1.全面置管地展示原始研究的重要信息,是

评价纳入研究质量的依据;

2.是整个评价过程中的众多决策的历史记录;

3.是进行数据分析的原始数据库。

数据提取表的设计

数据提取表基本内容之——纳入研究基本信息:

1.纳入研究编号。如:Cochrane 2010;

2.方便于盲法;

3.评价员的姓名编号。

4.留有备注栏。

数据提取表的设计

数据提取表基本内容之——研究方法及偏倚:

1.根据不同类型的原始研究而定条目;

2.此部分应处于数据提取表格靠前位置;

3.也可将“结果数据不完整”“选择性报告”

放在结果部分。

4.要描写判断依据。

数据提取表的设计

数据提取表基本内容之——研究对象特征:

1.作为评价临床异质性的依据;

2.为“characteristics of included studies”表格提供素材;

3.不同的系统评价收集信息有所不同。如:卫生经济学系统

评价-经济学信息;SNP-人种;

4.年龄性别等基本信息,诊断标准,疾病严重程度,种族,

社会人口学特征,合并症,研究地点等。

数据提取表的设计

数据提取表基本内容之——干预措施:

1.试验组和对照组接受的所有干预措施的细节;

2.如药物,收集药物名称、给药途径、计量、开始给药时间、

疗程等;

3.心理治疗、物理治疗、患者教育等复杂干预措施,还应收

集干预的具体内容、实施人员、实施时间等;

4.必要时评估干预措施的完整性。

数据提取表的设计

数据提取表基本内容之——结局指标:

1.按原始报告格式收集数据,必要时数据转换;

2.包含变量:结局指标定义、计量单位(分级方法)、测定

时间和测定方式(如调查表、面谈、实验室指标)等。

3.不良反应:全面、未报告不代表没有、明确不良反应定义。

数据提取表的设计

数据提取表基本内容之——研究结果:

1.通常是计划书阶段提前设定好的,如有新的结果增加(严

重不良反应)则需要特别说明;

2.计划书阶段应尽可能详细对分析的结果进行限定:测量尺

度、测量时间点、数据表达式等;

3.每个研究结果都需收集样本量、分组情况、治疗时间、测

量尺度、测量时间、数据类型等等。每个结果的样本量可能不同。

数据提取表的设计数据提取表基本内容之——其他信息:

1.重要引文、资助机构、潜在利益冲突、是否获得伦理批准、是否计算所需样本量;

2.为方便撰写,记录结论与讨论内容:对结果的解释以及对下一步研究的建议。

数据提取表的设计

数据提取表选项的设定和编码:

1.规范填写术语:“是”、“否”、“不清楚”、“未报告”等;

2.说明术语含义,填写备注。

数据提取表的设计数据提取表的设计

构建数据提取表电子文档的形式:

1.Word 、PDF :简易方便,数据转换差;

2.Excel 、Access 、Epidata 等,协作不便,误填操作等;

3.问卷调查网站:SurveyMonkey 、问卷星等,无法与统计软件对接:

4.专门网络系统:Trialstat SRS 、EPPI Centre Reviewer ;(较为昂贵)

目录

一.数据及来源二.数据提取的基本原则三.数据提取的步骤四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据九.常见问题及解决办法

数据提取-不同结局指标的提取

二分类变量(dichotomous variable ):4个值:

试验组和对照组分别的样本量和发生目标事件的例数

group events 合计Yes No 治疗组121(a )160(b)281对照组

160(c)

121(d)

281

合计281281562

数据提取-不同结局指标的提取

连续性变量(continuous variable)又称数值变量(numerical variable)

样本量、均数、标准差

数据提取-不同结局指标的提取

有序分类资料(ordinal data):最好按照等级资料提取,因为即可转换为二分类资料,也可按照连续性资料进行分析。建议不要在提取数据过程中进行转换。

数据提取-不同结局指标的提取

计数资料(count data)例:哮喘患者在随访3年内发生急性发作6次。两种情况:

1.事件发生率较低:计算RR(rate ratio),分别计算试验组和对照组的时间发生频数与各组样本量和随访时间乘积的比值,然后计算两者的比值。例如:试验组200例2型糖尿病患者随访3年,酮症酸中毒发生频数为8,对照组260例患者随访3年,发生频数为12,则RR=[8/(200*3)]/[12/(280*3)]。

2.事件发生率高:则可看做连续性变量,计算试验组和对照组单个个体发生目标事件的均数、及标准差。

注:将所有计数资料都当成二分类资料是错误的!丢失统计信息。数据提取-不同结局指标的提取时间事件结局指标(time-to-event outcome):最好联系作者获取原始数据,也有从图形中提取,但是不推荐。

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法

数据提取-数据转换

利用试验组或对照组均数的标准误或可信区间换算标准差

SD=SE×N

利用可信区间求标准差:

当符合正态分布:

1.N≥100,SD=N×

可信区间上限?可信区间下线

3.92

注:90%可信区间将3.92替换为3.29;99%可信区间将3.92替换为5.15

2.N≤60,将上面公式中

3.92替换为2×t值,t值通过查表获得(自由度为样本量-1)Excel计算t值,输入函数:=tiv(概率,自由度)。

3.样本量介于60-100之间时,两种方法都可用。

当不符合正态分布时,考虑进行数据转换,如去对数值等。

数据提取-数据转换

利用组间均数差及标准误、可信区间、t值或P值计算标准差前提假设:各组的标准差相同。

P值t值SE SD

数据提取-数据转换

利用组间均数差及标准误、可信区间、t 值或P值计算标准差前提假设:各组的标准差相同。

P值t值

P值和自由度查t值表

Excel输入函数=tinv (概率,自由度)

描述不准如P<0.05,取P值上限

概率为P值

数据提取-数据转换

利用组间均数差及标准误、可信区间、t值或P值计算标准差前提假设:各组的标准差相同。

P值t值SE SE=MD/t

MD:mean difference,均数差。

数据提取-数据转换

利用组间均数差及标准误、可信区间、t值或P值计算标准差前提假设:各组的标准差相同。

P值t值SE SD

SD=SE/

1

试验组样本量

+

1

对照组样本量

此处的SD即为试验组标准差又为对照组标准差

数据提取-数据转换

通过中位数和四分位数间距估算均数和标准差

若样本量很大且符合正态分布,则可用中位数代替均数。

四分位数间距≈1.35SD

遗憾的是:

利用中位数和四分位数间距描述的数据通常呈偏

态分布!

目录

一.数据及来源

二.数据提取的基本原则三.数据提取的步骤

四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据

九.常见问题及解决办法

数据提取-同一研究多篇报告

NOT

解决办法:

1.分别对不同报告单独提取数据,然后将数据汇总后填入数据提取表;

2.将不同报告的数据直接填入数据提取表;

3.联系作者核对数据;

4.纳入较新较全的报告(Cochrane 不建议)

目录

一.数据及来源

二.数据提取的基本原则

三.数据提取的步骤四.数据提取表格的设计五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据九.常见问题及解决办法

数据提取-合并亚组数据

1.二分类变量,各亚组四格表相应数据相加即可;

2.连续性变量,需按照公式计算:

注:亚组1的样本量为N1,均数为M1,标准差为SD1;亚组2的样本量为N2,均数为M2,标准差为SD2。

目录

一.数据及来源二.数据提取的基本原则三.数据提取的步骤四.数据提取表格的设计

五.各种类型数据的提取六.数据转换

七.同一研究不同报道的数据提取八.合并亚组数据九.常见问题及解决办法

常见问题及解决办法错误:选择性结果提取

解决办法:

预试验、严格按照计划书、多人核对。

常见问题及解决办法

错误:数据挖掘,勉强提取,提取结果与原始数据相差甚远。

解决办法:

保守、必要时联系作者、预试验、严格按照计划书、多人核对。

常见问题及解决办法错误:数据错误

解决办法:

多人核对。常见问题及解决办法错误:结果主观

解决办法:

提供原文依据。

常见问题及解决办法错误:计算错误

解决办法:

质量控制。数据提取总结

?重点在掌握原则?难点在质量控制?成功在客观准确?失败在忽视细节

说明:

本PPT大部分内容来自国内四本书:

《系统评价/meta分析理论与实践》罗杰、冷卫东主编;《实用循证医学方法学》张天嵩、钟文昭主编

《系统评价/meta设计与实施方法》刘鸣主编;

《系统评价指导手册》杨克虎主编感谢各位老师指导

Email:

maozhiys@https://www.360docs.net/doc/ae4724997.html,

丁香园ID:水天之间

相关主题
相关文档
最新文档