meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择
meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

在Meta分析中最常用的是固定效应模型、随机效应模型。怎样理解这两种模型呢?举个简单的例子:让十个学生去测量操场中的同一根旗杆,旗杆长度的测量值可以看作是一个固定效应模型;然而如果让一个学生去测量操场上长度不同的十根旗杆,旗杆长度的测量值则是随机效应模型。

一般来说,随机效应模型得出的结论偏向于保守,置信区间较大,更难以发现差异,带给我们的信息是如果各个试验的结果差异很大的时候,是否需要把各个试验合并需要慎重考虑,作出结论的时候就要更加小心。从另一个角度来说,Meta分析本来就是用来分析结论不一致甚至是相反的临床试验,通过Meta分析提供一个可靠的综合的答案,如果每个试验的结果都一模一样,根本就没有必要作Meta分析,因此要通过齐性检验来解决这对矛盾。

一般来说判断方法是根据I2来确定。

1.就是根据I2值来决定模型的使用,大部分

认为>50%,存在异质性,使用随机效应模型,≤50%,用固定效应模型,有了异质性,通过敏感性分析,或者亚亚组分析,去探求异质性的来源,但是这两者都是定性的,不一定能找到,即使你做了,研究数目多的话,可以做个meta 回归来找异质性的来源

2.在任何情况下都使用随机效应模型,因为如果异质性很小,那么随即和固定效应模型最终合并结果不会有很大差别,当异质性很大时,就只能使用随机效应模型,所以可以说,在任何情况下都使用随机效应模型

3.还有一种,看P值,一般推荐P的界值是0.1,但现在大部分使用0.05,就是说P>0.05,用固定,≤0.05用随机效应模型。

但是这些都没有统一的说法,存在争议,如果你的审稿人是其中一种,你和他相冲突了,你只能按照他说的去修改,因为没有谁对谁错,但是现在你的文章在人家手里,如果模型不影响你的结果,你就遵照他们的建议

但是,也不必过度强调哪种方法,更重要的是找到异质性根源。meta分析中,异质性是天然存在的。如果异质性较小,选择固定效应模型

更可靠;如果异质性较大,则建议选择随机效应模型,但仍然需要通过敏感性分析,寻找到异质性根据,以消除其影响。

有关异质性,齐性,下面再有一个例子进行说明:

Meta分析是汇总众多研究结果的一种定量分析方法,主要目的是为了得到比单一研究更精确的结果估计,以及分析影响研究结果间差异的因素。目前,Meta 分析主要根据研究的“效应尺度”(effect magnitude)的齐性检验结果,决定采用固定效应或随机效应模型合并每项研究的“效应尺度”,但一般未考虑到研究具有不同的特征以及相应的平均“效应尺度”的差异[2]。多水平模型是国外教育学界80年代中后期发展起来的一门多元统计分析新技术,是当前国际上统计学研究中一个新兴而重要的领域[1]。本文拟通过对“效应尺度”的选择以及具有协变量的两水平混合效应模型建模方法的探讨,估计总平均“效应尺度”以及具有不同研究特征的平均“效应尺度”及其可信区间。

Meta分析的数据具有两个水平的层次结构

(two-level hierarchy),水平2为研究水平,水平1为个体水平。对于具有这种特征的数据,两个水平模型可将传统模型中单一的随机误差项分解到与数据层次结构相对应的水平上,即分解出研究水平的变异。模型基本结构为:Y ij=β0+u0j+e ij

j=1,2,…,m,代表研究项目数;i=1,2,…,n,代表研究个体数;Y ij为各项研究的“效应尺度”;β0为总平均“效应尺度”的估计;u0j和e ij分别为研究水平和个体水平残差。

Meta分析一般只能得到各项研究的结果即“效应尺度”及其标准误以及样本含量等数据,研究个体的数据一般是不可得的,因此,这里拟合的两水平模型为聚集水平(水平2)模型,可表达为:

Y*j=β0+u.j+e*j

Var(u.j)=σ2u

Var(e.j)=σ2e/n j

总方差为σ2u+σ2e/n j,可通过对随机部分定义一个设计变量来拟合模型,即z.j=1/n j,相应的随机系数为e.j,n j为每项研究中的研究个体数。

本文首先拟合的无任何解释变量的“无效

模型”(null model)为:

Y.j=β0+u.j+e.j z.j

在收集到的文献中,多数研究的“效应尺度”为OR值,有的为ln(OR)值,即通过logistic 回归模型获得的β值,两者可相互转换。分别将OR值和ln(OR)值作为反应变量拟合两个“无效模型”,因此,式中Y.j分别表示两个模型中第j项研究的OR j值和ln(OR j)值,β0分别表示合并全部OR j和ln(OR j)的平均估计值,u.j 为第j项研究的随机效应,e.j为与第j项研究有关的随机误差,结果见表1。

然后ln(OR)为反应变量,在模型中引入研究水平协变量国别x.j(国内研究取0,国外研究取1),将其效应β1拟合为固定效应,用一个随机成份拟合剩余的部分,结果见表2。混合效应模型为:

Y.j=β0+β1x.j+u.j+e.j z.j

另一种建模方式,即不拟合截距项,将国别转换为x1.j和x2.j两个哑变量引入模型,它们分别对应于国内与国外研究,仍将其效应β1和β2拟合为固定效应,同时用一个共同的随机成份u.j拟合剩余部分,结果见表3与表4。模型可表

达为:

Y.j=β1x1.j+β2x2.j+u.j+e.j z.j

表1分别以OR和ln(OR)为“效应尺度”的拟合结果

以OR为“效应

尺度”

以ln(OR)为“效应尺度”

标准误估计值标准误

固定参数

β05.1640 0.6086 1.4060

0.10

50

随机参数研究水平

σ2u

个体

水平σ2e

17.7900

1

3.6320

0.5392

1

0.10

94

0 以OR为“效应尺度”,模型所估计的总平

均“效应尺度”为 5.1640,95%可信区间为3.9711~6.3569;以ln(OR)为“效应尺度”,根据ln(O)±uαS ln(OR),可计算总平均“效应尺度”OR的估计为eβ0=4.0796,95%可信区间为4.0796×e±1.96×0.1050,即3.3208~5.0118。可见,

总平均“效应尺度”下降了 1.0844,可信区间亦变窄。此外,研究水平的方差估计从17.7900下降到0.5392,估计精度亦增加,标准误从3.6320下降到0.1094。

表2引入研究水平协变量的拟合结果

估计值标准误

固定参数β0

β1

1.0370

0.6238

0.1496

0.1943

随机参数σ2u(研究

水平)

σ2u(个体

水平)

0.4453

1

0.0904

结果表明,“效应尺度”与国别有关,其参数估计为正,表明国外研究的OR值较大,经转换得国内研究的OR估计为e1.0370=2.8207,国外研究的OR值计为e1.6608=5.2635,相差甚大。研究间方差及其标准误估计分别从0.5392和0.1094下降为0.4453和0.0904,亦表明国别这一研究水平协变量解释了部分研究结果间变异。

但从参数估计难以计算国外平均“效应尺度”的可信区间。

表3引入研究水平协变量的拟合结果(不拟合截距项)

估计值标准误

固定参数β0

β1

1.0370

1.6600

0.1496

0.1241

随机参数

σ2u(水平2)

σ2u(水平1) 0.4453

1

0.0904

根据,可直接得到国内与国外研究的平均“效应尺度”及其可信区间,见表4。

表4根据表3的转换结果

研究数目OR 95%可信区

国内研究20 2.8207 2.1039~

3.7818

国外研究29 5.2593 4.1237~

6.7076

与表2转换结果比较,国内、外研究的OR 估计基本一致,研究间方差及其标准误估计完全一致,但拟合国内外两个哑变量的固定效应,可直接得到其标准误的估计,国外略小。

在流行病学横断面调查和病例对照研究中,常采用比值比OR反映暴露与疾病的联系强度,即患者暴露比与非患者暴露比的比值,但其常不服从正态分布,而其对数转换值ln(OR)近似服从正态分布。多水平模型的基本假定是反应变量遵从正态分布,水平2和水平1残差遵从N(0,σ2u)和N(0,σ2e/n j)[1],故在两水平混合效应模型中应以ln(OR)为分析的“效应尺度”,然后再将分析结果转换为OR值,否则平均“效应尺度”及其可信区间均不可靠。

通过采用的固定效应或随机效应模型可得到平均“效应尺度”及其可信区间的估计,但这些模型一般不能分析影响研究结果间差异的因素[2]。两水平混合效应模型将研究水平协变量拟合为固定效应,用以解释研究结果间的差别,以一个随机成份拟合其剩余部分,从而正确评价

研究水平的因素对研究结果的影响。在Meta 分析中,各面研究结果常具有很大的不同一性,如本文国内外研究结果的估计分别为2.8207和5.2593,相差达2.4386,如不考虑研究水平协变量的影响而直接合并的结果为4.0796,可见,固定或随机效应模型的合并是不适宜的。“无效模型”中研究水平的方差估计σ2u为0.5392,亦提示研究结果之间存在较大的不同一性。混合效应模型表明,国别这一研究水平协变量解释了部分研究结果间的变异,研究水平方差下降为0.4453,但仍遗留了较大的变异,提示尚存在其它因素导致研究结果间的差异,如果可得到这些研究水平的因素,则可通过两水平混合效应模型进一步评价其对研究结果的影响。

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较(一)

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较(一) 【关键词】重复测量;混合效应线性模型;单因素方差分析; 摘要:目的:通过混合效应线性模型与单因素方差分析在重复测量资料中的应用比较,旨在说明两方法在处理重复测量资料时的应用特点。方法:用混合效应线性模型和单因素方差分析处理重复测量资料并比较。结果:混合效应线性模型和单因素方差分析都是处理重复测量资料的重要统计方法,前者在选择协方差结构下可对重复测量资料的固定效应和随机效应参数及协方差矩阵进行参数估计和统计检验,后者可对重复测量资料的固定效应做出统计推断。结论:混合效应线性模型是处理重复测量资料的有力方法,它对资料的协方差结构要求宽松,且结论可靠;单因素方差分析对资料的协方差结构有严格的限定。 关键词:重复测量;混合效应线性模型;单因素方差分析; 统计方法特点重复测量数据(repeatedmeasuresdata)是医学领域中常见的一种数据资料。所谓重复测量是指对同一个观察对象在不同时间点上进行的多次测量〔1〕。由于重复测量资料是对同一受试对象的某一观察指标进行的重复观察所得的数据,同一受试者的观察数据间可能存在相关性,一些传统的统计学方法如t检验等就不能充分揭示这一内在特点,有时甚至会导致错误的结论。 对重复测量资料的分析方法大致可分为两类,即单变量统计分析方法和多变量统计分析方法〔2〕。本研究通过选用多变量统计分析方法中的混合线性效应模型对一例题的分析,并与单因素方差分析进行比较,来说明两种方法在处理重复测量资料中的应用特点。 1方法简介 简单说,混合效应线性模型就是所拟和的模型中既包含固定效应又包含随机效应,特别是个体内的数据结构的选择将对各因素的评价产生直接影响〔3〕。 混合效应线性模型是一般线性模型的扩展,其表达式为: Y=Xβ+Zγ+ε(1) X为已知设计矩阵,β为固定效应参数构成的未知向量,ε是未知的随机误差向量,其元素不必为同独立分布了。在式(1)中Y,γ都是正态随机向量,其均值为0,方差阵分别为G 与R,二者之间不相关,因此Y的方差表达式为: V=ZGZ+R(2) 当R=σ2I,Z=0时,混合线性模型退化为一般线性模型。对G和R必须选择其协方差结构,常用的结构有无结构(一般为协方差)、自回归(常用一阶)、复合对称(共同协方差加一对角元)等〔4〕。选择协方差矩阵的方法是在相同的结构模型下,选择几个不同结构的协方差矩阵,从中选取似然比统计量(-2LogLikelihood)、Akaikes信息量标准(AkaikesInformationCriterion,AIC)及SchwartsBayesian标准(SchwartsBayesianCriterion,BIC)较小的一个,当这些统计量较接近时,则选取含参数个数最少的一个。通常以AIC为主要判断指标。 2实例分析 下面用一实例比较两种方法对处理重复测量资料时的特点:某药有新旧两种剂型,为了比较这两种剂型的代谢情况,对16例病人服药后分别在0、4、8、12小时测得血药浓度(表1),问该药新旧剂型的血药浓度随时间变化的趋势是否一致。表1四个时间点某药新旧剂型血药浓度1用SAS软件的MIXED过程对固定效应和随机效应参数β、γ及协方差矩阵G、R进行估计和统计检验。在本例中因变量为血药浓度,药物剂型、测量时间为固定效应,受试者为随机效应,同时选择合适的协方差结构以便在控制随机误差的基础上分析处理因素(药物剂型)对反应变量(血药浓度)的关系。本例指定为常用的无结构协方差(UN)和复合对称性协方差(CS)。 模型拟合情况见表2。表2模型配合统计量由表2可见,在UN结构下协方差配合的似然比统计量-2LogLikelihood=398.0(表2),对无效模型的似然比检验,χ2=134.43,ν=9,P<0.0001,

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择 在Meta分析中最常用的是固定效应模型、随机效应模型。怎样理解这两种模型呢?举个简单的例子:让十个学生去测量操场中的同一根旗杆,旗杆长度的测量值可以看作是一个固定效应模型;然而如果让一个学生去测量操场上长度不同的十根旗杆,旗杆长度的测量值则是随机效应模型。 一般来说,随机效应模型得出的结论偏向于保守,置信区间较大,更难以发现差异,带给我们的信息是如果各个试验的结果差异很大的时候,是否需要把各个试验合并需要慎重考虑,作出结论的时候就要更加小心。从另一个角度来说,Meta分析本来就是用来分析结论不一致甚至是相反的临床试验,通过Meta分析提供一个可靠的综合的答案,如果每个试验的结果都一模一样,根本就没有必要作Meta分析,因此要通过齐性检验来解决这对矛盾。 一般来说判断方法是根据I2来确定。 1.就是根据I2值来决定模型的使用,大部分

认为>50%,存在异质性,使用随机效应模型,≤50%,用固定效应模型,有了异质性,通过敏感性分析,或者亚亚组分析,去探求异质性的来源,但是这两者都是定性的,不一定能找到,即使你做了,研究数目多的话,可以做个meta 回归来找异质性的来源 2.在任何情况下都使用随机效应模型,因为如果异质性很小,那么随即和固定效应模型最终合并结果不会有很大差别,当异质性很大时,就只能使用随机效应模型,所以可以说,在任何情况下都使用随机效应模型 3.还有一种,看P值,一般推荐P的界值是0.1,但现在大部分使用0.05,就是说P>0.05,用固定,≤0.05用随机效应模型。 但是这些都没有统一的说法,存在争议,如果你的审稿人是其中一种,你和他相冲突了,你只能按照他说的去修改,因为没有谁对谁错,但是现在你的文章在人家手里,如果模型不影响你的结果,你就遵照他们的建议 但是,也不必过度强调哪种方法,更重要的是找到异质性根源。meta分析中,异质性是天然存在的。如果异质性较小,选择固定效应模型

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较

【关键词】重复测量;混合效应线性模型;单因素方差分析; 摘要:目的:通过混合效应线性模型与单因素方差分析在重复测量资料中的应用比较,旨在说明两方法在处理重复测量资料时的应用特点。方法:用混合效应线性模型和单因素方差分析处理重复测量资料并比较。结果:混合效应线性模型和单因素方差分析都是处理重复测量资料的重要统计方法,前者在选择协方差结构下可对重复测量资料的固定效应和随机效应参数及协方差矩阵进行参数估计和统计检验,后者可对重复测量资料的固定效应做出统计推断。结论:混合效应线性模型是处理重复测量资料的有力方法,它对资料的协方差结构要求宽松,且结论可靠;单因素方差分析对资料的协方差结构有严格的限定。 关键词:重复测量;混合效应线性模型;单因素方差分析; 统计方法特点重复测量数据(repeated measures data)是医学领域中常见的一种数据资料。所谓重复测量是指对同一个观察对象在不同时间点上进行的多次测量[1]。由于重复测量资料是对同一受试对象的某一观察指标进行的重复观察所得的数据,同一受试者的观察数据间可能存在相关性,一些传统的统计学方法如t检验等就不能充分揭示这一内在特点,有时甚至会导致错误的结论。 对重复测量资料的分析方法大致可分为两类,即单变量统计分析方法和多变量统计分析方法[2]。本研究通过选用多变量统计分析方法中的混合线性效应模型对一例题的分析,并与单因素方差分析进行比较,来说明两种方法在处理重复测量资料中的应用特点。 1方法简介 简单说,混合效应线性模型就是所拟和的模型中既包含固定效应又包含随机效应,特别是个体内的数据结构的选择将对各因素的评价产生直接影响[3]。 混合效应线性模型是一般线性模型的扩展,其表达式为: y=xβ+zγ+ε(1) x为已知设计矩阵,β为固定效应参数构成的未知向量,ε是未知的随机误差向量,其元素不必为同独立分布了。在式(1)中y,γ都是正态随机向量,其均值为0,方差阵分别为g 与r,二者之间不相关,因此y的方差表达式为: v=zgz+r(2) 2实例分析 下面用一实例比较两种方法对处理重复测量资料时的特点:某药有新旧两种剂型,为了比较这两种剂型的代谢情况,对16例病人服药后分别在0、4、8、12小时测得血药浓度(表1),问该药新旧剂型的血药浓度随时间变化的趋势是否一致。表1四个时间点某药新旧剂型血药浓度1用sas软件的mixed过程对固定效应和随机效应参数β、γ及协方差矩阵g、r进行估计和统计检验。在本例中因变量为血药浓度,药物剂型、测量时间为固定效应,受试者为随机效应,同时选择合适的协方差结构以便在控制随机误差的基础上分析处理因素(药物剂型)对反应变量(血药浓度)的关系。本例指定为常用的无结构协方差(un)和复合对称性协方差(cs)。 模型拟合情况见表2。表2模型配合统计量由表2可见,在un结构下协方差配合的似然比统计量-2log likelihood=398.0(表2),对无效模型的似然比检验,χ2=134.43,ν=9, p <0.0001,说明模型拟合效果显著,模型较好地拟和了资料。在cs结构下,似然比统计量-2log likelihood=506.4,aic、aicc、bic三个值都是un模型小于cs模型,故本例选用un 结构作模型拟合。 在un结构下的固定效应参数估计值及假设检验结果见表3、4。 由表4可知,在un结构下,不同处理组之间的差别无统计学意义(p=0.07551),不同测量时间点的血药浓度及处理组×时间点的交互作用的差别有统计学意义(p<0.0001),且这种交互作用主要体现在新剂型组。

混合OLS、固定模型与随机模型的区别

方差分析(写成英文我就认识了。。analysis of variance (ANOVA) )主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model)。 所谓的固定、随机、混合,主要是针对分组变量而言的。 固定效应模型,表示你打算比较的就是你现在选中的这几组。例如,我想比较3种药物的疗效,我的目的就是为了比较这三种药的差别,不想往外推广。这三种药不是从很多种药中抽样出来的,不想推广到其他的药物,结论仅限于这三种药。“固定”的含义正在于此,这三种药是固定的,不是随机选择的。 随机效应模型,表示你打算比较的不仅是你的设计中的这几组,而是想通过对这几组的比较,推广到他们所能代表的总体中去。例如,你想知道是否名牌大学的就业率高于普通大学,你选择了北大、清华、北京工商大学、北京科技大学4所学校进行比较,你的目的不是为了比较这4所学校之间的就业率差异,而是为了说明他们所代表的名牌和普通大学之间的差异。你的结论不会仅限于这4所大学,而是要推广到名牌和普通这样的一个更广泛的范围。“随机”的含义就在于此,这4所学校是从名牌和普通大学中随机挑选出来的。混合效应模型就比较好理解了,就是既有固定的因素,也有随机的因素。 一般来说,只有固定效应模型,才有必要进行两两比较,随机效应模型没有必要进行两两比较,因为研究的目的不是为了比较随机选中的这些组别。 固定效应和随机效应的选择是大家做面板数据常常要遇到的问题,一个常见的方法是做huasman检验,即先估计一个随机效应,然后做检验,如果拒绝零假设,则可以使用固定效应,反之如果接受零假设,则使用随机效应。但

方差分析 固定效应模型 随机效应模型 混合效应模型

随机效应与固定效应 2009年05月15日星期五21:01 方差分析主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model)。 所谓的固定、随机、混合,主要是针对分组变量而言的。 固定效应模型,表示你打算比较的就是你现在选中的这几组。例如,我想比较3种药物的疗效,我的目的就是为了比较这三种药的差别,不想往外推广。这三种药不是从很多种药中抽样出来的,不想推广到其他的药物,结论仅限于这三种药。“固定” 的含义正在于此,这三种药是固定的,不是随机选择的。 随机效应模型,表示你打算比较的不仅是你的设计中的这几组,而是想通过对这几组的比较,推广到他们所能代表的总体中去。例如,你想知道是否名牌大学的就业率高于普通大学,你选择了北大、清华、北京工商大学、北京科技大学4所学校进行比较,你的目的不是为了比较这4所学校之间的就业率差异,而是为了说明他们所代表的名牌和普通大学之间的差异。你的结论不会仅限于这4所大学,而是要推广到名牌和普通这样的一个更广泛的范围。“随机”的含义就在于此,这4所学校是从名牌和普通大学中随机挑选出来的。 混合效应模型就比较好理解了,就是既有固定的因素,也有随机的因素。 一般来说,只有固定效应模型,才有必要进行两两比较,随机效应模型没有必要进行两两比较,因为研究的目的不是为了比较随机选中的这些组别。 固定效应和随机效应的选择是大家做面板数据常常要遇到的问题,一个常见的方法是做huasman检验,即先估计一个随机效应,然后做检验,如果拒绝零假设,则可以使用固定效应,反之如果接受零假设,则使用随机效应。但这种方法往往得到事与愿违的结果。另一个想法是在建立模型前根据数据性质确定使用那种模型,比如数据是从总体中抽样得到的,则可以使用随机效应,比如从N个家庭中抽出了M个样本,则由于存在随机抽样,则建议使用随机效应,反之如果数据是总体数据,比如31个省市的Gdp,则不存在随机抽样问题,可以使用固定效应。同时,从估计自由度角度看,由于固定效应模型要估计每个截面的参数,因此随机效应比固定效应有较大的自由度.

相关主题
相关文档
最新文档