张伟豪元分析培训视频笔记-L5-0108-异质性检验Heterogeneity

合集下载

张伟豪元分析培训视频笔记示例7

张伟豪元分析培训视频笔记示例7

先讲文章的重要性和介绍概念
然后介绍研究方法
这里介绍太笼统,没有介绍文章都从哪里来的,只说了找到30篇
H统计量再次出现
里面的H2.8值就是Q值226.61除以K-1,K就是样本数
总结:元分析文章流程
首先选定主题,告诉别人主题有多么重要
然后要决定做的是哪些变量的关系
接着做文献搜索,包括用哪些关键词、数据库,搜索了多少篇扣除掉重复的等剩下多少篇然后进行分析,首先分析是固定效果模型还是随机效果模型
如果是随机效果模型就要研究异质性,看I、H、R、Q等指标
如果存在异质性,要做调节变量分析
如果是类别变量就做次群体分析,如果是连续变量就做元回归分析
然后检验有没有出版偏误,如果有,你是怎么检查的,选择一个出版偏误的分析方法
做完了就介绍有没有出版偏误,有没有校正
接着可以做一下敏感度分析,看一下有没有离群值或者累计分析中的按一定标准的发展趋势最后就要写结论。

张伟豪元分析培训视频笔记-L5-0114-多重结果在研究中的应用

张伟豪元分析培训视频笔记-L5-0114-多重结果在研究中的应用

比如上图要做一个TPP计划行为理论的研究,AAA代表一篇论文,里面会有三种关系,就是outcome栏里的,那么这个就需要做多重结果
后面就需要选择相关分析correlation,如上
然后建立上图档案,红框中选择auto就行了,前面相关系数一定要输入文章中的皮尔森相关系数,不能输入回归系数,切记!
分析结果后,如果要查看分开的结果,就需要选红框中select by
选择框中的选项,就是选三个其中一个,因此左边框中的出来的结果就是选中的分析结果
如果要把三个所有结果都做出来,就选择上图红框中的选项
结果就会三种都出现
如果要将三种结果作对比,就是ATTtoBI,PBCtoBI等,就要选择group by选项,如上,选择群组比较
结果如上,那么这个和次群体比较有什么区别呢?解释如下
如果要做如上分析,相当于在前面例子的基础上又加上了性别分组
整合之后就如上,这样的话就相当于将次群体和多重结果两项功能合并了,那么就可以在一篇论文中比较不同性别结果有什么不一样,不同性别间的不同变量比较有什么不一样等。

Meta分析中的异质性(heterogeneity)及其处理原则和方法全文

Meta分析中的异质性(heterogeneity)及其处理原则和方法全文

可编辑修改精选全文完整版Meta分析中的异质性(heterogeneity)及其处理原则和方法Meta 分析又称荟萃分析、汇总分析、整合分析,是对具有相同研究题目的多个医学研究进行综合分析。

meta分析的目的在于增大样本含量,减少随机误差所致的差异,增大检验效能。

一个高质量的Meta 分析相当于开展了一个多中心的研究,理想情况下,Meta分析纳入的各项研究均指向同一个结果,即各研究间具有同质性。

尽管,我们试图通过严格的入选和排除标准,以保证纳入研究的同质性。

然而,实际情况往往不尽如意。

会造成“合并萝卜、白菜、西红柿”的错误,就算是勉强合并统计量,得出的结论也不可信。

meta就没有意义了。

所以,合并效应量之前,一定要进行异质性检验。

可以明确的说,纳入Meta分析的所有研究都存在异质性。

当异质性较大时,超出了随机误差,Meta分析的结果就不太可靠。

我们需要通过适当的方法识别它,对其进行检验,以决定后续的处理策略。

梅斯医学提供有关异质性处理的策略。

我们在做meta分析前,必须要做的事有两件:A 确定文献的纳入和排除标准;B 纳入文章的质量评分,例如jadad评分、QUADAS评分等。

临床异质性、方法学异质性和统计学异质性三者是相互独立又相互关联的,临床或方法学上的异质,不一定在统计学上就有异质性表现,反之亦然。

统计学异质性是指:不同试验间被估计的治疗效应的变异。

其实,我们可以这样理解,A“严格执行文献的纳入和排除标准”可以减少临床异质性的来源;B “纳入文章的质量评分”可以减少方法学异质性的来源。

异质性检验方法异质性检验方法主要有图示法和统计学检验。

比如,大家熟悉的森林图,森林图可显示单项研究和合并效应量及其置信区间,如果单项研究结果的置信区间有很少的重叠或者不重叠,则提示研究间可能存在异质性。

如图,第1项研究和第2、第4项研究的置信区间无重叠,提示研究间可能存在异质性。

统计学异质性的六种检验方法,三种是检验,三种图示,即Q统计量、I2统计量、H统计量、Galbraith图法、L’Abbe图、漏斗图)。

张伟豪2017SPSS培训视频笔记5卡方检验

张伟豪2017SPSS培训视频笔记5卡方检验

T检验是检验两个变量相关,自变量为两个分类变量,因变量为连续变量。

而且自变量只能使两个,但并不是说只能检验只有两个变量的数据,比如性别只有男和女,而是可以检测多个分类变量中的两个,比如年级,一年级、二年级、三年级,我可以用T检验只检测一年级和二年级的。

T检验检验的是均值的差异
做独立样本T检验(独立样本检验和配对样本检验的区别查看2016笔记)
将需要分析的因变量选入上面,自变量选入分组变量,如gender
然后要将gender定义为0和1,因为有时分析的变量里面有好几类变量,比如年级有1/2/3.。

不定义的话spss不知道是要分析哪两组变量
上面的表格是描述变量的情况,主要看下面表格
显著性上,没有小于0.05的,说明两组变量是没有差异的。

如果显著性P值没有小于0.05
的,左边的t值就不会大于1.96.这是在95%置信区间中算出来的值。

这些值必须在30个样本以上才可以。

左边这一部分主要是检验两组自变量的方差是否有差异,上面显著性都大于0.05,因此方差没有差异。

因此在没有差异的情况下,t值就看第一行“假定等方差”中的数值。

如果方差不是同质性,那么软件就会自动修正,主要修正自由度,但样本大于30的情况下修正几乎没有什么影响(没太听懂),因此不需要去看这一部分。

只有在一种情况下才需要去看修正后的值,就是显著性P值在0.05左右,比如0.049,那修正后就有可能变得显著。

张伟豪元分析培训视频笔记-L5-0106-效果量介绍

张伟豪元分析培训视频笔记-L5-0106-效果量介绍

效果量又称为实务上的显著性
实务上的显著性含义:由于统计上的显著性是以P值小于0.05来衡量,但是如果样本够大,几乎所有的研究都能够显著,因此,研究者认为不以P值为衡量标准,而是看实际值的大小来判定是否显著,这就是实务上的显著性。

统计上的显著性会受到样本数的影响,样本越大越显著,但是不会受到效果量的影响
以上均为效果量,也就是做某件事肯定会有显著效果。

也就是说,以前的研究都是报告统计上的显著,至于实际现实中某件事有没有效果,一般不会关注,实务上的显著性也就是现实中的显著性,是在现实中能不能感受到明显的变化
比如你戒烟想多活,是因为你觉得戒烟确实有效,你做环保拯救地球是因为你觉得环保行为确实有效
元分析主要做以上三类分析,比例其实相当于卡方检验,平均相当于T检验或方差检验,相关系数相当于相关分析(皮尔森相关)
元分析做的主要就是自变量和因变量的分析,比较简单,有时会加上调节变量
比例主要是RR和OR分析,在样本量很大的情况下两者差别不大
OR就是胜算率,RR就是风险率
具体见上图
平均值差异中一般非标准化差异很少用,主要用标准化差异
相关系数就是皮尔森相关,建议值如上图
上图是概率的解释
上图是胜算的解释
上图是胜算比的解释
大于1表示效果比较明显(解释较为抽象),一般OR大于2表示效果非常明显
风险比比较容易理解,见上图解释
上图例子说明RR含义,上图结果等于2,也就是说,暴露在粉尘下员工得病的风险几率是没有暴露员工的2倍。

上图表明,一般用OR比较多,用RR比较少。

张伟豪元分析培训视频笔记-L5-0120-出版偏误

张伟豪元分析培训视频笔记-L5-0120-出版偏误

出版偏误就是我们没有找到的文章对我们结果的影响,因为没有找到的文章都被作为缺失值,而出版偏误属于非随机缺失,因此会对结果产生影响检验出版偏误由以上几种方法运行数据后,点击红框选项,进行出版偏误分析首先出现漏斗图,发现漏斗图两侧的点并不均衡,左边很多,右边没有,说明可能有出版偏误但是还要看具体统计数据,选择view下面的选项,可以看不同的出版偏误解释方式,先看第一个以上数字的意思是还需要找多少篇不显著的文章,才能没有出版偏误,也就是将Alpha值设为0.05,也就是大于0.05(不显著),而Z值到达了1.95995,也就是小于1.96(不显著),才能达到研究不显著。

那就需要424篇,才能达到不显著。

而我们只有13篇文章,差距太大了,显然不太可能,因此说明我们没有出版偏误。

但是差距多大算差的多?如果现在不是424篇而是42篇呢?这个差距大还是小?现在还没有学者给出标准,因此只能看P值的显著性,P小于0.05就说明没有出版偏误。

下边的分析是指,不一定非要找不到的文章都是不显著的,可以有一点或一小部分是显著的也不会有大的影响,因此可以自己主观设定标准,红框中和下边的1都是不显著,可以自己设定一下,有一点显著的标准,比如0.95,0.98等我们先设定为0.9,下边的均值比率先保持1,然后计算结果显示,还需要41篇文章,才能达到我们设定的标准如果我们把均值比率也设定为0.95,那么结果显示还需要80篇文章才能达到我们设定的标准。

但是问题和上面方法一样,没有标准告诉我们究竟差多少篇才算够大,没有出版偏误。

因此我们一般用上面的经典方法,看P值就可以了。

我们再看其他几个结果,点红框中的next table红框中的上面是没有修正的结果,下边是修正后的结果,如果这个P值大于0.05,说明没有出版偏误,以上两个结果都大于0.05,说明没有出版偏误再看下一个报表,也看红框中的P值,也大于0.05,说明没有出版偏误。

那么这几个计算结果都一样,如果出现有的有偏误有的没有该怎么办呢?这就要用到最后一种方法trim and fill上图为运行结果这种方法的原理是,先把左边偏离比较多的,影响比较小的文章移除,每移除一个就计算一次,看看是否平均分布,如果没有再继续移除,直到平均分布为止,最后会算出一个校正后的效果量,trim就是剪的意思。

张伟豪元分析培训视频笔记-L5-0117-CMA分析与报表解读

张伟豪元分析培训视频笔记-L5-0117-CMA分析与报表解读

以上是元分析的步骤以上为森林图点击红框中,放大图形放大后可以再调整尺寸,如红框中放大后图形,方框的大小代表权重,越大代表权重越大。

方框是点估计值,也就是左边中的ODDS ratio,两边线段是置信区间,如果不包含1,(因为是ODDS ratio,所以是1,要是RR 就是0),那么就是显著,如果包含了就是不显著,Z值小于1.96,P值大于0.05,说明就是不显著上图红框代表权重,一般文章里不会报告权重如果放大显示,权重就显示为数字,而不是图形了上图为分析的固定效应和随机效应,随机效应的置信区间明显比较宽,是因为随机效应加入了组间方差,因此会比较宽,而且点估计值也不一样。

需要报告哪个就写哪个下一步要看有没有同质性或异质性,如果没有异质性就用固定效应,有异质性就用随机效应。

从森林图中看,每个研究的估计值和区间都差很多,因此直觉判断为有异质性,然后就要看计算结果点next table看结果结果中卡方值Q为163.165,主要看P值,小于0.1,说明有异质性,I值为92.645,一般I 小于25为没有异质性,25到50之间为一般异质性,大于75为高度异质性。

T值为组间方差,I值为组间方差T除以总方差,也就是说组间方差所占比例高达92.645,每组和每组间的差异很大。

I值为标准化值,范围从0到1.另外,I值的缺点是如果样本比较少,比如只有十几篇文章,那么I值就会不太精确。

点击红框可以更改图表颜色,用以复制到word中去一般P值小于0.1就可以,说明就有异质性,如果看森林图里有明显的的偏离中心而且权重比较大的值,可以把这篇文章删掉,那么P值就可能大于0.1了,这样就说明没有异质性,直接报告固定效应的值就可以了另外一个判断异质性的标准就是I值,上图为I值的特性异质性的处理,一种是有异质性就不进行元分析,第二种是探讨原因,忽略后直接进行随机效果分析(后边会讲到这两种方法,分别是上图中的次群体分析和元回归分析),第三种是找出极端值,删除后直接用固定效果报告。

张伟豪元分析培训视频笔记示例2

张伟豪元分析培训视频笔记示例2

引言也要先写文章的重要性,和以前文章的差异性
这篇文章没有像上一篇把有哪些差异都写出来,只是写了有差异。

因此在看文章时要知道谁的文章完整,谁的不完整,自己在写文章时要尽量都写完整,这样才能写好。

而且没有完整的文章,只能自己去发现文章的好坏,因此也就没有一个完美的范文去参考
要分清楚文章一共要有多少个变量,上图中10个与ATT和BI的关系,就是20个,再加上ATTA和BI的关系,一共是21个,但不是每篇文章都有21个变量,有几个就用几个
CMA做不了信度分析,因此上表为从每篇文章中抄出来的信度
上图中公式写不写都没关系,CMA的结果中可以直接出来,复制就可以
最后发现这个文章没有做异质性分析、也没有做次群体分析,也没有说明用的固定效应模型还是随机效应模型。

而且文章里要有森林图和漏斗图,这两篇文章都没有。

因此,自己写文章时就要注意,查漏补缺。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如果组间方差够大,就是有异质性,一般组间方差占组内方差超过三分之一,就是够大了。

如果异质性值大于0.1(因为异质性统计值不够大,所以显著性不用0.05,而用0.1),那么就是没有异质性。

异质性检验主要的方法是卡方检验或者称为Q检验
异质性检验是检验组间差异,主要检验指标就是上图中的统计检验的三个值,T2,Q检验,I2
那么I2是怎么得来的?看上图中,分析数据出来后就是上图中的森林图
上图中,森林图每条线段的中间点是点估计值,点的两边线段就是区间估计值。

1.00代表没有异质性(如果是OR或CR,就是1,如果是相关分析就是0)。

也就是区间包含0或1代表不显著,比如第一条线段包含1,显著性就是0.116,不显著,第二条线段不包含1,显著性就是0.000,显著。

森林图是视觉看有没有异质性,上图看着每条线段差距比较大,有左有右,认为是有异质性,就需要看下next table。

Df自由度是12代表有13篇论文,Q-value的显著性显著,代表有异质性。

上图中的T au Squared就是组间方差,I-Squared就是Tau(组间方差)除以组间加组内。

一般I-Squared值低于25%代表没有异质性,50%以上比较严重的异质性,上图中已经是92.645,代表有很高的异质性。

上图为森林图,黑框越大,代表样本数越大,权重越大。

黑框两边为置信区间,如果穿过Y 轴,代表置信区间包含0,也就是不显著。

Y轴有可能是0,有可能是1(上边解释过原因)。

菱形代表所有样本的集合,因为是所有样本,所以置信区间很小,小到看不到。

异质性检验不能在统计结果出来后再解释为什么有异质性,应该是作者在数据建档之后就要解释“论文可能存在异质性,原因可能是。

”,而不能在统计结果出来再解释。

异质性的来源有以上几种
然后要找出异质性的原因,其实就是进行调节变量分析
调节变量分析就两类,一类是类别变量,就是方差分析,一类是连续变量,就是回归分析
如果做回归分析,要有5个尺度,也就是5个选项。

后边就会讲到,回归分析就是固定效应模型的扩展,混合模型就是随机效果的拓展
总结,异质性检验其实就是组间的方差够不够大,如果够大就是有异质性。

并且我们要找到一些原因来解释组间方差。

相关文档
最新文档