混合效应模型中的方差成分检验
线性混合模型中方差分量的估计与QR分解

线性混合模型中方差分量的估计与QR分解
范永辉;王松桂
【期刊名称】《应用概率统计》
【年(卷),期】2008(024)002
【摘要】在线性混合模型中,极大似然估计足一种很重要的估计方法,但是它常常需要通过迭代求解.应用设计阵的QR分解,可以把设计阵变换成上三角矩阵.这样可以降低参与迭代运算的矩阵的阶数,还可以减少参与运算的数据量,从而提高运算的速度.本文讨论了QR分解在EM算法中的应用,并用模拟的方法验证了QR分解可以极大的提高运算的速度.本文同时讨论QR分解在另外一种估计方法,即ANOVA估计中的应用.
【总页数】9页(P208-216)
【作者】范永辉;王松桂
【作者单位】河北师范大学数信学院,石家庄,050016;北京工业大学应用数理学院,北京,100022;北京工业大学应用数理学院,北京,100022
【正文语种】中文
【中图分类】O212.1
【相关文献】
1.线性混合模型中方差分量的估计的改进 [J], 吴瑛;郭大伟
2.线性混合效应模型中方差分量两种估计的比较 [J], 李大森
3.一类线性混合模型中方差分量的估计 [J], 薛蕊
4.线性混合效应模型中方差分量的估计 [J], 许王莉
5.线性混合模型中方差分量的非负估计 [J], 杨戍;高惠
因版权原因,仅展示原文概要,查看原文内容请购买。
混合效应模型多水平模型(英)课件

数据预处理
在分析前,对原始数据进行清洗和整理,包 括处理缺失值、异常值以及进行必要的编码 转换。此外,还需对连续变量进行适当的离 散化或分段处理,以便更好地拟合模型。
模型的建立和拟合
模型选择
根据研究目的和数据特征,选择适合的混合 效应模型或多水平模型。在本例中,考虑到 学生成绩在不同课程中存在一定的相关性, 我们选择使用随机截距和斜率模型。
模型拟合
使用适当的统计软件(如R、Stata等)对模 型进行拟合。在拟合过程中,需要设置正确 的模型公式,指定固定效应和随机效应的参 数,并选择合适的估计方法(如最大似然估
计、限制极大似然估计等)。
结果解释和讨论
要点一
结果解释
根据模型的拟合结果,解释各参数的含义和估计值。在本 例中,需要关注随机截距和斜率的估计值及其显著性,以 及它们对学生成绩的影响。
混合效应模型多水平模型能够处理不同类型的数据,包 括连续数据、分类数据和二元数据等。
考虑个体差异
该模型能够考虑不同个体之间的差异,对个体进行更准 确的预测和推断。
混合效应模型多水平模型的优势和不足
• 适用于大型样本量:该模型适用于大型样本量,能够提高 估计的准确性和稳定性。
混合效应模型多水平模型的优势和不足
PART 03
多水平模型的理论基础
多水平模型的基本概念
定义
多水平模型是一种统计分析方法,用于分析具有层次结构的数据,例如学生嵌 套在学校,家庭嵌套在社区等。
目的
解释不同层次的数据对结果变量的影响,并估计和检验不同层次的效应。
多水平模型的参数估计
方法
使用最大似然估计或广义最小二乘法 等统计方法来估计多水平模型的参数 。
2023-2026
proc mixed 误差项 sas 混合模型 公式

proc mixed 误差项sas 混合模型公式全文共四篇示例,供读者参考第一篇示例:PROC MIXED是SAS中用于混合模型分析的过程,混合模型是一种能够处理多层次结构或者重复测量数据的统计模型。
在混合模型中,我们可以同时考虑固定效应和随机效应,进而对不同层次的变量进行分析。
在混合模型中,误差项扮演着非常重要的角色,它是模型中必不可少的一个组成部分。
本文将介绍关于PROC MIXED中误差项的相关知识,并给出相应的混合模型公式。
误差项在混合模型中是指未被模型中的自变量所解释的部分,也就是模型中未被考虑的随机误差。
在混合模型中,我们通常假设误差项服从正态分布,并且具有均值为0、方差为σ^2的特性。
误差项的存在使得我们能够量化模型中的不确定性,评估模型的拟合程度,并且进行相关的统计推断。
在PROC MIXED中,我们可以通过指定各种固定效应和随机效应来构建混合模型。
常见的混合模型可以被表达为如下的公式:Y = Xβ + Zγ + εY表示观测到的因变量向量,X是固定效应矩阵,β是固定效应参数向量,Z是随机效应矩阵,γ是随机效应参数向量,ε是误差项向量。
在该公式中,固定效应表示各个因素对因变量的整体影响,而随机效应则表示了在样本中的个体差异。
误差项则是模型中未被解释的残差部分。
在具体的数据分析过程中,我们需要根据研究的实际情况来构建混合模型。
在进行实验设计时,我们需要考虑实验中的重复测量数据或者样本数据的层次结构。
在这种情况下,混合模型能够更好地分析不同层次之间的关系,并且考虑到各个层次的变异性。
通过PROC MIXED进行混合模型分析时,我们可以通过设定不同的协方差结构来进一步扩展模型的适用范围。
可以选择不同的协方差结构来描述不同层次的数据之间的相关性。
PROC MIXED还提供了丰富的选项来进行模型拟合和参数估计,包括最大似然估计、重复测量设计、协变量调整等功能。
第二篇示例:混合模型是一种在统计分析中常用的模型,特别是当研究对象存在多个层次或重复测量时。
SPSS数据分析—混合线性模型

SPSS数据分析—混合线性模型之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。
虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的角度讲,由于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集性的数据。
数据的聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同城市间的指标离散度上。
从层次堆积性数据也可以看出,随机抽样只能保证数据被抽到的几率相同,但是对于抽到的是什么样的数据,却无法控制了。
对于这种具有层次结构的数据,如果阐发目的仅限于这几种层次,比如就阐发这几个城市,那么可以把它当做一种固定因子,只阐发固定效应而不用考虑这种堆积性,但是如果想把结果推广到所有城市,那就不能忽略这种特征,否则会降低结果的准确性,因而还要加入随机效应。
混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对随机误差的分解也越来越精细,结果也越来越准确。
多级模型与混合效应模型

多级模型与混合效应模型随着社会科学研究的深入,研究者们发现,单纯使用传统的普通线性模型已经无法准确地解释数据中的各种复杂关系。
为了更好地处理多层次数据和考虑个体间的差异,多级模型和混合效应模型逐渐成为社会科学研究中的重要工具。
本文将针对多级模型和混合效应模型进行阐述,以帮助读者更好地理解和运用这些方法。
一、多级模型的基本原理与应用场景多级模型,又被称为分层线性模型或者混合线性模型,是为了解决传统普通线性模型在处理多层次数据时遇到的问题而发展起来的。
它的基本原理在于将多层次的数据结构纳入模型中,充分考虑不同层级之间的关系,从而获得更准确的结果。
多级模型的应用场景非常广泛,包括但不限于教育研究、医学研究、社会心理学研究等领域。
举一个具体的例子,假设我们对不同学校的学生进行成绩分析,传统的普通线性模型只能考虑学生个体特征对成绩的影响,而多级模型还能考虑学校因素对成绩的影响。
通过引入学校这一层次的变量,我们可以更全面地理解学生成绩的变化,并且解释更多的方差。
二、混合效应模型的原理与适用范围混合效应模型是多级模型的一种特殊情况,它特指当多层次数据结构中的某些层次变量被认为是随机效应时的模型。
简单来说,混合效应模型允许个体间存在差异,并在模型中引入随机效应以考虑这种差异。
通过考虑随机效应,我们可以更准确地估计固定效应的大小。
混合效应模型的适用范围同样非常广泛。
除了教育研究、医学研究、社会心理学研究等领域外,混合效应模型还在经济学、生态学、地理学等领域得到了广泛的应用。
例如,在经济学中,我们可以使用混合效应模型来分析不同国家之间的GDP增长差异,其中国家作为随机效应被考虑,而其他因素如人口、教育水平等则作为固定效应。
三、多级模型与混合效应模型的优点与局限性多级模型和混合效应模型相比于传统普通线性模型有一些明显的优点。
首先,它们可以更全面地考虑数据中的层次结构,从而提高模型的准确性。
其次,它们能够解释个体间的差异,并引入随机效应处理这些差异,提高模型的解释力。
非等间距重复测量线性混合模型中协方差结构的选择

_ 陈丽花 美斯达 (MacroStat)医药 开发有 限公 司
等 。但这 种 限制 条件 通 常不被 消 费者 强 烈感知 。对 于每 月消 费额 度 (ARPU,用A表示 )低 于运 营 商设定 的 最低 消费 额度 (用 M表 示 )
用户 ,差额部 分 实 际上 并没 有被 有效 利 用 ,因此 消费 者 的实 际折 扣 率 随着这 个 差额 的增 大 而降低 ,当消 费者 每 月消 费额 度下 降到 一 定
四 、结 论 和 建 议 本 文对 电信 运 营商 的高 额补 贴 从不 同维 度 进行 了分 类 ,并 从运 营 商和 消费 者 的角度 对 高额 补贴 作 用和 实 际效 果进 行 了分析 认 为 : 高额 补贴 作 为 电信 运 营 商重 要 的竞争 和 营销 手段 在 通信 市场 上 普遍 存 在 ,它对 运 营商具 有 发展 用 户 、锁定 用 户在 网 时长 、降 低资 费水 平 、刺 激话 务量 和转 移 利润 。从 消 费者 的 角度 来看 ,高 额 补贴 以较 低 的现 场感 受折 扣率 颇 受欢 迎 ,但 事实 上 大部 分消 费者 所 获得 的 实 际折 扣率 高于 现场 感 受折 扣率 。 事 实上 ,到 目前 为 止各 界都 还 未对 何 为 “高额 补贴 ”做 出 明确 定 义 ,因此 业 内外人 士 虽 然看 到过 高额 度 的补 贴对 市场 竞 争和 监 管 产生 不 利影 响 ,但也 无 法找 到合 适 的方 式 予 以有效 监管 。 从本 文 的 分析 来 看 ,作 者 建 议 以 (实 际折 扣 率 水平 )为 标 准 予 以监 管 ,比 如规 定 不得低 于O 5。 其次 ,鉴 于高 额 补贴 对 消 费者 具有 较 大的 迷惑 -性,从 保护 消 费
线性混合模型中方差分量的ANOVA估计的改进

线性混合模型中方差分量的ANOVA估计的改进
范永辉; 王松桂
【期刊名称】《《高校应用数学学报A辑》》
【年(卷),期】2007(022)001
【摘要】讨论了在含三个方差分量的线性混合模型中,在均方误差意义下,方差分量的方差分析估计的改进,并把这一结果推广到一般的线性混合模型上,得到一个改进方差分析估计的简单方法.
【总页数】7页(P67-73)
【作者】范永辉; 王松桂
【作者单位】北京工业大学应用数理学院北京 100022; 河北师范大学数信学院河北石家庄 050016
【正文语种】中文
【中图分类】O212.4
【相关文献】
1.线性混合模型中方差分量的估计的改进 [J], 吴瑛;郭大伟
2.线性混合效应模型中方差分量两种估计的比较 [J], 李大森
3.一类线性混合模型中方差分量的估计 [J], 薛蕊
4.线性混合效应模型中方差分量的估计 [J], 许王莉
5.线性混合模型中方差分量的非负估计 [J], 杨戍;高惠
因版权原因,仅展示原文概要,查看原文内容请购买。
线性混合效应模型入门之一(linear mixed effects model)

适用场景线性混合效应模型入门(linear mixed effects model),缩写LMM,在生物医学或社会学研究中经常会用到。
它主要适用于内部存在层次结构或聚集的数据,大体上有两种情况:(1)内部聚集数据:比如要研究A、B两种教学方法对学生考试成绩的影响,从4所学校选取1000名学生作为研究对象。
由于学校之间的差异,来自其中某一所学校的学生成绩可能整体都好于另一所学校,换句话说就是学生成绩在学校这个维度上存在聚集现象。
(2)重复测量数据:比如要研究A、B两种降压药物对高血压患者血压的影响,在每个患者服药前、服药后1个月、3个月、6个月分别测量血压。
由于同一个患者的每次血压之间存在明显的相关性,不能适用于传统的方差分析方法。
随机效应与固定效应之所以称为“线性混合效应模型”,就是因为这种模型结合了固定效应和随机效应。
固定效应(fixed effect):所谓固定效应,指的是这个因素的每个水平(level)已经“穷举”出来了,不能或者不需要再做“推广”。
比如上面的降压药物研究,虽然降压药物有很多,但是研究者只关心A、B两种药物的效果,所以可以视为固定效应。
固定效应影响的是响应变量或因变量(如血压)的均值。
随机效应(random effect):指的是该因素是从一个更大的总体中抽取出来的样本,我们的研究结果要推广到整个总体。
还是上面的药物研究,参与研究的患者只是一个小样本,所以患者作为随机效应。
随机效应影响的是响应变量(血压)的变异程度即方差。
图a中演示是固定效应因子,每次重复实验,因子都是A1、A2、A3三个水平,三个水平的效应均值是固定的。
图b演示的是随机效应因子,每次重复实验,因子水平都不一样,如第一次是B1、B2、B3,第二次是B4、B5、B6,以此类推。
所以因子的每个水平对均值的影响都是随机的,不固定的。
当然这两种效应有时并不是绝对的,主要还是看研究的目的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
・166・ 中国卫生统计2017年2月第34卷第1期 混合效应模型中的方差成分检验 曾 平 赵杨 陈峰。
在很多科学问题中需要在混合效应模型框架下对 随机效应方差成分(暂记为 )进行假设检验 j,也 即检验 :r =0。除直接科学兴趣外,许多间接医学 问题也能转化为对方差成分的检验。例如,为判断在 惩罚样条回归中是参数模型还是非参数模型更合适, Claeskens 首先建立混合效应模型,将模型选择问题 转化为对随机效应方差成分是否等于零的假设检验问 题,最后通过限制性似然比检验 :丁 =0。其他研究 者也用同样的方法处理过类似问题Ⅲ8 。然而,方差 成分为非负参数,对方差成分的假设检验是非标准的: 在 下 位于参数空间边缘。由于这种限制,常用 的渐近 无效分布对似然比统计量不再成立¨ ’ 。 混合效应模型中的方差成分检验吸引了广泛研究兴 趣l卜8. 。本文主要介绍方差成分检验的似然比方 法,方差成分得分检验或Wald检验可参考其他相关 文献 13,20,21]。 线性混合效应模型的方差成分检验 设y为连续变量, =(X --, )和Z=(z ,…, Zq)分别为,z×P和n×q的矩阵, 为样本量。在广 泛意义上】,、 和Z既适于非独立数据结构 I2 ,如 重复测量数据或聚群数据 ,也适于独立数据情 形 ¨,如惩罚样条回归。更加详细的例子可参 考上述文献。y、 和z之间的关系由线性混合效应 模型 刻画 p q Y=∑Xjflj+∑Zkb + , (1) 用矩阵的形式模型(1)可表达为 Y= +z易+s,b~Ⅳ(0,r K),占~Ⅳ(0, In) (2) 式中 为固定效应,b为随机效应, 为未知方差成 分, 为已知q×q矩阵描述随机效应间相互关系,L :国家自然科学基金项目(81402765,81473070,81373102);国家统计 局全国统计科学研究项目(2014LY1 12);江苏省教育厅高校哲学社会 科学研究基金项目(2013SJD790032,2013SJB790059);南京医科大学公 共卫生学院优秀博士论文培育项目 1.徐州医科大学公共卫生学院流行病与卫生统计学教研室(221004) 2.南京医科大学公共卫生学院生物统计学系 为n维单位阵, 为残差方差,与b不相关。模型中 y的期望和方差分别为 E(y)= ,Var(1,)=.1-2ZKZ + I =or ^ (3) 其中 ^=AZKZ +J ,A=,/2/o-。。设参数为0=( ,A, or ),模型(2)的对数似然函数为 ’ r 1 (0):一 1{,z log(o" )+ (y一 ) (y—
L )+logl 1) (4) 似然比统计量定义为
=2sup[ (0)一 (0)] (5) 1.渐近混合卡方分布 显然检验/40:b=0等价于检验/40: =0。如前 文所述虽然定义似然比统计量并不难,但是 : =0 是非标准形式检验,渐近 无效分布不再成立。这 里,与非标准形式检验对应是标准形式检验,后者指参 数位于参数空间内部 。Self和Liang…、Liang和 Selfl3 以及Stram和Lee_2 假设:如y能够划分为许多 独立同分布的亚向量、亚向量维度趋于无穷且研究为 均匀设计,那么职 渐近服从0.5Q +0.5ox , 为 退化到零的点分布, 是自由度为1的卡方分布。然 而,Crainiceanu和Ruppert 认为,Stram和Lee的假设 条件在实际中很难满足,并显示0.5ox +0.5ox 会导 致保守结果。为验证这一点,图1给出了模拟例子。 对特殊纵向数据,Pinheiro和Bates 发现非等比例卡 方混合分布更加合适,如0.65x +0.35x 。但对更一 般的似然比方差成分检验,Crainiceanu和Ruppert_8 证 明 和 的混合比例取决于具体数据,没有满足所 有情形的混合比例参数H 。 数据根据模型(1)模拟 ,设丁 =0,然后对比 L尺 和0.5ox +0.5ox 的分位数。0.5ox +0.5ox 的分位数总是大于对应 的分位数(散点和虚线 重叠表示两分布一致),意味着在0.50Xo+0.5ox 提 供的临界值过大。因此如果采用0.5 +0.5 作为 似然比统计量的理论无效分布将产生保守结果,降低 统计效能和导致假阴性结果。 2.基于谱分解的模拟分布 为了获得似然比统计量的无效分布,Crainiceanu Chinese Jouma1 ofHealth Statistics.Feb.2017.Vo1.34.No.1 模拟计算的似然比统计量 模拟计算的似然比统计量 模拟计算的似然比统计量模拟计算的似然比统计量 图1模拟计算的似然比统计量和0.5 +0.50x 的分位数。 和Ruppert在谱分解基础上提出了一种基于模拟抽样 残差,由 条件下的模型计算获得;h。 为矩阵H= 算法 。假设模型(2)中A已知,可获得卢和 的极x(x X) X 对角线上元素。在 : =0条件下,模型 大似 估计值 (1)退化为简单线性模型Y:∑7 ,q-Eo假设台和 卢=( lX) y, =(y P 1p ̄y)/ 分别是JB和 z在 模型下的 值。基于重抽样
, 获得似然比统计量无效分布可执行为:①根据原始数 带人对数似然函数,获得剖面似然函数 据j[)获得似然比统计量的观察值,记做职 如;②获得
(A)=÷{,z 1og( l,)+logf f} (7) 重抽样数据 ,采用相同的模型和估计算法获得关 于D 似然比统计量,记做职 ;③重复第二步 次, 一f RT r 一 得到B个 ;则似然比统计量统计量的无效分布由
~ 职 组成,其对应的P值由LRn 7 等于或大于职 , 、 …,:LL, ,7 /’J H Lti L J n 、 J ’~/ J …n
{,zlog[¨ g ¨ )) 比例 p: 。具体而言在 是矩阵 z ZK 的特征根,其中, 第二步中如果通过分布N( , )获得重抽样】, 、同 (A) 2,Dn(A) 丁_ 2+ 时保持 和Z不变,则为参数b。。tstrap检验;如果Y
n叩 =X +台 、且台 通过有放回方式从台。随机获得,那 T, ,0、 厶+1“ 么为非参数bootstrap检验;如果Y = o+ 、且
是 z PoZK 特征根,P。=, 一X(X X) X 。则 LRT 以分布收敛于.厂LK 。 基于上述谱分解可建立模拟算法获得职 的无 效分布。需要注意的是,该分布是有限样本下的精确 分布而非大样本近似分布。谱分解模拟算法只与随机 效应维度有关、与样本量无关,因此在实际中具有较高 计算速度 。。。 。该算法获得的无效分布能够保证似 然比检验有效控制I型错误率,与其他方差成分检验 方法相比具有更高统计效能 , 。’ 。当Stram和 Lee假设条件满足时,基于模拟得到的精确分布弱收 敛于0.50 ̄ +0.50 ̄ 。 3.重抽样方法 统计分析中当面对复杂假设检验时诉诸于重抽样 方法是一种常用策略 。重抽样避免了数学推导, 概念上简单并且容易操作,属于计算密集型统计技术。 Fitzmaurice等 以及Lee和Braun_4 提出了似然比 方差成分的permutation检验,Faraway 建立了似然 比方差成分的参数bootstrap检验。其他研究者对似 然比方差成分提出了类似的重抽样检验方法¨ J。
设 。 =  ̄/1一h。 称为调整残差,称台。为原始
通过无放回方式从台。随机获得,那么为permutation检 验。由此可见,参数bootstrap检验、非参数bootstrap 检验和permutation检验的主要差别在于如何产生新 的数据。这三种重抽样方法往往获得相似的结果,但 相对参数和非参数bootstrap检验,permutation检验假 设条件更少 , 。另外进行重抽样的对象是调整 残差 而非原始残差 ,这是因为 。是同方差,而 是异方差 。一般而言,实际数据分析 取值1000 左右就足够 ’ .3 51 。
广义线性混合效应模型的方差成分检验 1.1ogistic混合效应模型和PQL算法 目前几乎所有似然比方差成分检验都是在线性混 合效应模型框架下完成,即都是针对连续应变量的;而 对离散应变量似然比方差成分检验的研究还很少。以 logistic回归为例,接下来讨论广义混合效应模型的似 然比方差成分检验。设y为二分类应变量, 和z同 前。y、 和z之间的关系通过logistic混合效应模 型 卜 描述
(】,),log【 )= + +Zb, ・168・ b—N(O,T2K) (10) 为y期望。感兴趣的检验是14o:西=0,同样等价于 Hn:丁 =0。模型(1O)的对数似然函数可表示为:L n (/3,丁 )=∑J.Ef(Yi l/3,b)f(b l丁 )] 。似然比检验
i=l 统计量
2[L 。(J8, )一L(/3, =0)] (11) 然而,由于对数似然函数涉及积分运算,实际中除极有 限和简单情况外,大多数时候都无法精确计算 L 。(卢, )和获得精确的对数似然值。因此不能直 接通过式(11)进行似然比检验。 logistic混合模型的参数估计算法包括数值积 分 ,惩罚拟似然(penalized quasi—likelihood,PQL)和 边际拟似然(marginal quasi—likelihood,MQL) ,伪似 然估计 川,Monte Carlo估计 和Gibbs抽样 。 数值积分只适用于低维度的积分运算,一般很难处理 超过五维的积分 ;Monte Carlo估计和Gibbs抽样的 不足在于计算繁重。PQL和MQL能够通过近似方法 有效处理高维积分问题,计算相对简单,且能够通过重 复调用已有的线性混合模型程序执行。对logistic混 合模型进行方差成分的似然比检验至少包含以下的三 个困难 ]:与线性混合模型不同,通常不能获得关于 logistic混合模型对数函数的闭型表达式,因此精确计 算logistic混合模型的对数似然值和似然比统计量变 得很困难;由于涉及高维计算运算,很难获得logistic 混合模型参数的精确估计值;即使能够有效估计logis— cic混合模型和计算其对数似然比统计量,如何获得该 统计量的无效分布也不清楚。基于logistic混合模型 已有的理论发展,本文仅仅专注其方差成分的似然比 检验。 2.基于重抽样方法的伪似然比方差成分检验 为了处理上面的问题,可以通过基于重抽样的伪 似然比方法进行方差成分检验 。具体步骤如下:① 采用PQL算法估计logistic混合模型参数;PQL算法 可通过R软件中的函数glmmPQL进行,该函数包含 在MASS软件包中 ;②当PQL算法收敛时,有工作 应变量 Y = +Z西+8,b~N(0,T2K), —N(0,R) (12) 和伪似然函数 1 . . ( )=一 一[1og l D I+(y 一X卢) D一 (y 一X )] 厶 +C (13) c为一个常数,D=r ZKZ +R, =( D ) D y 。③将 (.r )看做y 的对数似然函数,计算伪 似然比统计量LRT =2sup o[ vH!(7- )一 ,H0 ( )];④通过重抽样的方法获得伪似然比统计量 LRT 的无效分布。 中国卫生统计2017年2月第34卷第1期 其他问题和可能的研究方向 目前,由于以下几方面的原因,似然比方差成分检 验主要集中在线性混合效应模型并且模型中只包含一 个方差成分 ’他’" :①能够较为容易估计线性混合 效应模型的参数和计算其对数似然值,进而计算似然 比统计量;②多个方差成分共存时,不存在简单的对数 似然函数谱分解形式,因此很难获得似然比统计量的 无效分布;③由于可能的高维积分运算,一般难以精确 估计广义混合效应模型的参数和计算其对数似然值, 以及获得似然比统计量的无效分布;④重抽样方法属 于计算密集型统计方法,难以大规模运用。 在标准的参数假设检验中似然比检验被证明是在 小样本时最优的 。事实上,由于似然比检验充分利 用了H。条件下的模型和H 条件下的模型,相对得分 检验和Wald检验,似然比检验被证明在非标准参数 假设检验也具有更高统计效能 .3 U'如J。因此,推广和 发展似然比检验以适合更加广泛的情形具有理论和实 际意义。具体而言,以下几方面问题值得进一步探索: ①在线性混合效应模型中当存在多个方差成分而仅对 其中某个成分感兴趣时,Greven 等建议可以首先从 应变量中消除冗余随机效应;此时,尚包括应变量的残 差和待检验方差成分,然后按照前文只包含单个方差 成分的似然比检验进行统计分析。然而,这样做的缺 点在于,没有考虑到随机效应之间可能存在的相关,而 且在模型估计多个方差成分时还可能存在数值问题, 如模型不收敛或计算不稳定。②在线性混合效应模型 中假设残差是独立的;当存在相关协方差结构,即 ~ N(0, ( )), 为一般形式协方差矩阵、包含未知参 数向量 ;在这种情况下可先估计残差协方差,在此基 础上建立伪数据,然后将伪数据当做原始数据按照线 性混合效应模型框架下相似的方法进行似然比方差成 分检验 。但这种方法在协方差矩阵 的选择以及 其适用性等方面需要更多的研究。③前文在广义线性 混合效应模型框架下建立的伪似然比方差成分检验其 有效性取决于PQL算法;PQL算法本身属于有偏估 计;虽然提出了校正PQL偏倚的算法 卜 J,有偏和无