广义线性混合效应模型及其应用
GLMM:广义线性混合模型(遗传参数评估)

GLMM:广义线性混合模型(遗传参数评估)展开全文0. 飞哥感言这篇文章,主要是介绍了抗性数据,如何利用GLMM模型进行的分析,文中,他将9级分类性状变为了二分类性状,进行分析。
分析中用到了加性效应(A矩阵),空间分析(行列信息)。
对比了SAS和ASReml,结果基本一致。
其实,9分级性状,可以直接使用ASReml进行有序多分类性状分析,用累计Logistic模型分析,也可以考虑系谱数据和空间位置信息。
这样效果应该更好。
回头找下数据,测试一下。
1. 文献Genetic analysis of resistance to Pseudomonas syringae pv. actinidiae (Psa) in a kiwifruit progeny test: an application of generalised linear mixed models (GLMMs)2. 摘要「要点:」o LMM模型可以结合遗传(G矩阵)和空间分析(误差R矩阵),估算BLUP值o SAS中的GLIMMIX可以处理GLMM模型,但是门槛较高o ASReml可以处理GLMM模型3. 介绍「要点:」o介绍病原菌的来源o介绍抗病亲本的利用o如何更有效的评估和利用「后代检验是衡量标准」「要点」o对于抗性数据,在进行分析时,将其变为连续性状o作为连续性状是有信息损失的o可以用二分类性状,用GLMM模型进行遗传评估4. GLMM相对于LMM的优势「对于分类数据,GLMM模型评估遗传评估是标配」5. 常用软件o R中的lme4o SAS中的GLIMMIXo ASRemlo R中的ASReml-R并对Psa易感的附加遗传、环境方差成分和狭义遗传力进行可靠估计。
基于上述原因,我们使用了适用于二进制/二项分布式数据的GLMM方法。
GLMM的基本原理在一段时间前就已经开发出来,但它在广泛可用的统计软件中的实现却发生了很晚。
R lme4包装(Bates等人。
广义线性混合效应模型在临床疗效评价中的应用

广义线性混合效应模型在临床疗效评价中的应用【摘要】目的:探讨临床疗效评价中分类重复测量资料的广义线性混合效应模型(GLMMs)及的GLIMMIX宏实现。
方法:利用GLIMMIX宏ERROR和LINK语句来指示疗效指标的分布及连接函数,通过REPEATED 和RANDOM语句的TYPE选项选择合适方差协方差结构矩阵来模拟不同时间疗效指标的相关性,采用基于线性的伪似然函数进行模型参数估计。
结果:广义线性混合效应模型允许临床疗效评价指标是指数家族中任意分布,可以通过连接函数将疗效指标的均数向量与模型参数建立线性关系,简化运算过程。
结论:广义线性混合效应模型建模灵活,可为临床疗效评价提供更丰富的信息。
【关键词】广义线性混合效应模型临床疗效评价分类重复测量资料 GLIMMIX宏Apllications of Generalized Linear Mixed Models in Clinical CurativeEffects EvaluationLuo Tiane, et al Abstract Objective :To discuss generalized linear mixed models(GLMMs) of categorical repeated measurement datas in clinical curative effect evaluation, implementing with GLIMMIX macro in soft. Methods: Using the ERROR and LINK sentences of GLIMMX macro to sign the distribution and link function of the index ,adopting the TYPE option of REPEATED and RANDOM sentences to select the appropriatevariance covariance matrixs for modeling the relations, making use of pseudo likelihood function based on linear to estimate the model parameters. Results: GLMMs allow the index may be one of the exponential family (Contimuum distributions including Nomal ,beta distribution ,chi squareddistribution etc;Dispersedistributions includingBinomal ,Poisson and inverse Binomal etc), the vecor of expected means of the index is linked to the model parameters by a link function and model the linear equation, simple the calculator procedure. Conclusion: GLMMs can easily fit statistical models,the results are objective and reality, can strongly provide the abundant information for clinical curative effect evaluation. Key words generalized linear mixed models; clinical curative effects evaluation; categorical repeated measurement datas; GLIMMIX macro 临床疗效评价中常常需要对同一患者在不同时点进行多次观测并记录其疗效指标,当疗效指标为属性特征或类别时,称其为分类重复测量资料,如在治疗前、疗后4周、8周、12周等连续检测乙肝患者核心抗体,其结果有阴性、阳性两个水平;连续监测病人的治疗效果,反应变量为治愈、显效、好转、无效等。
广义线性模型在社会科学中的应用研究

广义线性模型在社会科学中的应用研究广义线性模型(Generalized linear model,缩写为GLM)是一种常用的统计分析模型,广泛应用于社会科学领域的数据分析中。
本文将介绍广义线性模型的定义、构成及应用,并结合实例深入探讨该模型在社会科学中的应用研究。
一、广义线性模型的定义和构成广义线性模型是一种可广泛使用的数学模型,其主要目的是将反应变量与解释变量建立联系,并通过建立最佳拟合函数,预测和分析反应变量。
GLM与线性回归分析相似,但它允许在解释变量和反应变量之间建立非线性关系,因此可以发现线性回归模型无法发现的关系。
GLM的主要组成部分包括:反应变量、解释变量、矩阵X和一个非线性函数g()。
二、广义线性模型的应用1. 分类模型广义线性模型最常用于有二元反应变量的数据,例如分类数据。
例如,它可以用来建立一个二元指示器模型,以确定两个类别之间的关系。
该模型可用于识别两种制度之间关系的因素,如一个国家的政治形势。
2. 计数模型广义线性模型还可以与计数数据配合使用。
例如,在社会科学中,研究人员可能会使用计数来记录政策实施的次数、事件发生的频率或各种社会现象的数量,如贫困率、犯罪率等等。
GLM的计数模型能够处理响应方差不稳定且需满足非负要求的计数数据。
例如,研究员可以使用计数模型来评估决策对某些社会现象的影响和进一步预测这些现象可能出现的次数。
3. 连续变量模型广义线性模型也可以用于处理连续变量的数据。
例如,在社会科学中,研究人员可能会使用连续变量记录特定事件的数量或相关变量,如时间、资金等。
这些模型变量经常出现在经济学研究中,如收入、产量、就业、生产等。
三、实例分析在社会科学应用中的GLM,不仅包括单一概率模型、计数模型等,还有插值、回归分析等高级统计分析模型。
以下是一个实例分析,展示了如何使用广义线性模型来探索我们感兴趣的某些社会现象。
1. 健康和收入变量之间的关系假设我们关注的是人们的健康和收入变量之间的关系。
广义线性混合模型在信度理论中的应用

⼴义线性混合模型在信度理论中的应⽤2019-04-07⼀、引⾔在过去的⼏⼗年⾥,⼴义线性模型(GLM)已经成为了⼀种常⽤的统计⼯具来拟合精算数据。
⼴义线性模型是对经典的线性回归模型的进⼀步推⼴。
这⼀推⼴是有双重意义的。
⾸先,偏离均值的随机误差不再局限于正态分布,⽽是扩展到了指数散布族,从⽽更适合于精算数据。
其次,⽆需要求随机变量的均值是解释变量的线性函数,⽽仅要求它以某⼀度量是线性的。
这样在处理数据的时候就有了更⼤的灵活性。
标准的⼴义线性模型假设样本之间是相互独⽴的,然⽽在精算和⼀般的统计问题中这种独⽴性却常常不能满⾜。
在实践运⽤中,纵向数据、群集数据就使这⼀假设遭到破坏。
本⽂主要集中在可以重复测量的纵向数据,因为样本之间的相依性,我们需要⼀个更合适的⼯具来进⾏统计建模。
线性混合模型⾃Laird和Ware于1982年⾸次起就被⼴泛⽤来拟合纵向数据。
混合模型通过在均值结构中引⼊随机效应,实现了对古典线性混合模型的推⼴。
随机效应的引⼊主要反映了不同对象之间的异质性,以及同⼀对象不同观测之间的相关性。
对于指数散布族来说,⼴义线性混合模型通过在线性预测部分引⼊随机效应推⼴了⼴义线性模型。
随机效应不仅决定了同⼀对象的观测之间的相关结构,也考虑了因为不可观测的特质引起的对象之间的异质性。
⼆、模型介绍(⼀)⼴义线性模型⼴义线性模型(GLM)是允许总体均值通过⼀个联系函数⽽依靠⼀个线性组合来实现对经典线性模型的⾃然推⼴,这就使得被解释变量的分布可以扩展到整个指数散布族。
⼀个⼴义线性模型包主要有以下元素组成:1.被解释变量服从指数族分布,有着如下规范的密度函数形式:f(y;θ,)=exp{∫[y-µ(θ)V(µ)dµ(θ)+c(y,)]}其中V(·)和c(·)是已知函数,θ为⾃然参数,为已知的离差参数,且满⾜以下关系:µ=µ(θ)=E(Y)V(Y)=V(µ)指数散布族⾮常灵活,可以⽤来对连续的、⼆元数据和计数数据建模。
广义线性模型在数据分析中的应用

广义线性模型在数据分析中的应用随着数据量的增长,数据分析的需求也随之产生。
广义线性模型是一种常见的数据分析工具,它不仅能够处理传统的正态分布数据,还能适用于非正态分布数据。
在本文中,我们将探讨广义线性模型在数据分析中的应用。
一、什么是广义线性模型?广义线性模型(Generalized Linear Model, GLM)是一种基于指数分布族的概率分布函数和线性预测子的建模方式。
它是普通线性模型(OLS)的扩展,能够应用于非正态分布数据,如泊松分布、二项分布、伽马分布等。
广义线性模型的一般形式为:$$ \eta = X\beta $$其中$\eta = g(\mu)$,$g$是一个非线性函数,$\mu$是响应变量的均值。
二、广义线性模型的应用广义线性模型可以应用于许多数据分析场景,包括:1.计数数据分析计数数据是指一种离散型的数据,比如一个区域内的动物数量、每日销售量等。
泊松分布是经常用来模拟计数数据的概率分布,因此可以使用广义线性模型来分析该类数据。
例如,我们可以考虑分析某商家一天中不同时间段的销售数量。
我们可以使用泊松分布来建模,然后使用广义线性模型进行分析,以探索哪个时间段的销售量最高。
此外,如果我们需要考虑其他解释变量(如天气、季节等)对销售数量的影响,我们也可以将其包含在模型中。
2.二项数据分析二项数据是指一种二元分类的数据,比如某项活动的成功或失败、某种产品的缺陷与否等。
在这种情况下,我们可以使用广义线性模型来建立一个二项分布模型来分析数据。
例如,我们可以考虑某项活动在不同条件下的成功概率,然后使用广义线性模型进行建模。
在这个建模过程中,我们可以考虑一些解释变量,如活动方式、活动时间等。
3.连续数据分析广义线性模型同样适用于连续型的数据,比如房价、工资等。
在这种情况下,我们可以使用伽马分布或正态分布等概率分布来建立一个广义线性模型来分析数据。
例如,我们可以考虑某个城市房屋的价格,然后建立一个广义线性模型来探究每平米房屋价格受哪些因素的影响,如房屋的位置、房屋面积等等。
广义线性混合效应模型及其应用

研究方法
GLMM包括固定效应和随机效应两个部分。在固定效应部分,模型通常包括一 个或多个解释变量,以及一个链接函数。随机效应部分则考虑到个体之间的差异。 在实现GLMM时,通常需要通过迭代方法来估计模型参数。常见的迭代方法包括最 大似然估计、贝叶斯估计等。模型的拟合效果和整体解释性可以通过各种统计指 标来评价,如AIC、BIC、R-squared等。
结果与讨论
在本研究中,我们应用GLMM对一组分类重复测量资料进行了分析。结果表明, GLMM能够较好地拟合数据,并具有较高的整体解释性和分类准确性。此外,我们 还发现,通过考虑到个体之间的差异和测量时间的影响,GLMM能够为个体间的关 联性提供更准确的建模。
结论
本研究表明,GLMM在处理分类重复测量资料方面具有显著优势。通过灵活地 建模个体间的关联性和考虑到测量时间的影响,GLMM为科学领域提供了更深入的 见解。未来研究方向包括进一步探索GLMM在其他领域的应用、开发更有效的算法 以处理更大规模的数据集,以及研究如何将GLMM与其他先进技术相结合以获得更 全面的分析结果。
五、结论与展望
广义线性混合效应模型作为一种灵活、实用的统计工具,在处理复杂数据结 构和代谢过程方面具有很大的优势。本次演示介绍了该模型的基本概念、应用及 其研究意义。通过实际案例的介绍,我们展示了该模型在各个领域的应用情况。
未来,广义线性混合效应模型还有很大的发展空间。首先,随着数据科学和 统计学的发展,新的技术和方法将会不断涌现,这些新技术和方法可以进一步优 化广义线性混合效应模型的建模过程和结果解释。其次,随着大数据时代的到来, 数据的复杂性和维度将会越来越高,如何有效利用广义线性混合效应模型处理这 些复杂数据,将是一个重要的研究方向。
广义线性混合效应模型及其应 用
关于广义线性模型和一般线性模型的数学理论和应用

关于广义线性模型和一般线性模型的数学理论和应用线性模型是统计学领域非常重要的一类模型,其中包括广义线性模型(Generalized Linear Models,简称GLM)和一般线性模型(General Linear Models,简称GLM)。
GLM和GLM有着紧密的联系,但也各自有着特点和应用。
本文将探讨GLM和GLM的数学理论和应用。
一、广义线性模型广义线性模型是由Mcullagh和Nelder于1982年提出的,它是线性模型的扩展,可以适应更为复杂的数据结构和变异模式。
与传统的线性模型相比,GLM的形式更为灵活,不仅能够模拟标量数据,还能够模拟其他类型的数据,比如二元数据、计数数据、序数数据等。
GLM的最大特点是可以将因变量的均值与自变量联系起来,并将自变量的参数与因变量的概率分布函数联系起来。
具体地说,GLM的一般形式为:$$ g(E(Y_i))=\beta_0+\beta_1x_{1i}+\dots+\beta_px_{pi} $$其中,$Y_i$表示因变量,$x_i$是自变量,$g$是一个连续函数,称为连接函数(link function),一般为对数函数、逆正弦函数、逆双曲正切函数等。
$\beta_0,\beta_1,\dots,\beta_p$是待求参数。
通常情况下,GLM的因变量$Y$的概率分布函数是指数分布族,具体包括正态分布、二项分布、泊松分布、伽马分布等。
GLM的优点是可以拟合非正态分布的数据,并且能够建立出统一的推导框架。
在实际应用中,GLM广泛用于医疗、金融、风险分析等领域。
二、一般线性模型一般线性模型是经典的线性模型,也是广义线性模型的一种特殊情况。
一般线性模型将因变量$Y$视为自变量的一个线性组合,即:$$ Y=X\beta+\epsilon $$其中,$X$是一个$n\times(p+1)$的矩阵,第一列全为1,$\beta$是$p+1$个待求参数,$\epsilon$是一个$n$维的随机误差向量,假设$\epsilon$服从正态分布$N(0,\sigma^2I)$。
广义线性模型及其在统计学中的应用

广义线性模型及其在统计学中的应用广义线性模型是统计学中一个重要的模型,可以用来建立响应变量与解释变量之间的关系,它是线性模型的一种推广形式。
该模型的应用范围十分广泛,可以用于分类、回归、时间序列分析等多个领域。
一、广义线性模型的定义广义线性模型是基于分布族以及链接函数的概率论模型,可以用来描述解释变量对响应变量的影响。
该模型通过将响应变量转化为一组线性预测器的和,并通过一个链接函数将这个和映射到一个合适的响应变量上,从而建立响应变量与解释变量之间的关系。
广义线性模型中假设响应变量的分布属于指数分布族,该分布族仅包含正态分布、泊松分布、二项分布等概率分布。
二、广义线性模型的组成部分广义线性模型由三部分组成:随机部分、线性预测部分和链接函数。
1.随机部分:随机部分是广义线性模型中的响应变量Y的概率分布,可以假设Y服从指数分布族中的某款分布,如正态分布、泊松分布等等。
2.线性预测部分:线性预测部分是用来建立解释变量和响应变量之间的关系。
假设我们有p个解释变量,那么线性预测部分就可以表示为:η = β_0 + β1x1 + β2x2 + ...+ βpxp其中,η代表了Y的总体期望值的线性预测,βi是解释变量xi 的系数。
3.链接函数:链接函数用于将线性预测部分的计算结果映射到响应变量Y的值上,使得Y的值与线性预测部分保持一致。
由于不同的概率分布族需要采用不同的链接函数,因此广义线性模型的链接函数是根据分布族来确定的。
例如,对于二项分布,采用的是logit函数作为链接函数,而对于泊松分布,采用的是对数链接函数。
三、广义线性模型的应用广义线性模型在统计学中的应用十分广泛,这里简单介绍一下它在分类和回归中的应用。
1.分类在分类问题中,广义线性模型可以通过二项分布来描述响应变量Y的分布。
例如,在疾病诊断中,我们可以将疾病的结果分为两种情况:患病与未患病。
假设我们有一些特征来描述每个患者,如年龄、性别、体重等,我们可以使用广义线性模型来预测每个患者是否患病。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从 结 果 看 到 , 考 虑 了 不 同 中 心 的 差 异 , A、B 两 种 药 物 的 副 作 用 的 发 生 有 差 异 ( β1 = - 0.9298, P = 0.0354, B 药 更 易 发 生 副 作 用 ) , 不 同 实 验 中 心 的 间 的 方 差 为 1.5809, P = 0.1842, 差异无统计学意义。
设随机效应 ui 的密度函数为: fu( ui, G) , 有边际似然函数:
& Li ! β, γ" = Li ! β, ui " fu ! ui, γ" dui ui
&#% $ ni
=
ui
fy ! yij ui,
j=1
Xij,
β"fu ! ui,
γ" dui
( 1.5)
γ是 Ui 的方差协方差矩阵, 是 G 的参数估计值。
得到似然函数:
% L! β, γ" = Li ! β, γ" ( 1.6) i
从上式可以看到, 计算似然函数比线性混合效应模型复杂
· 2104 ·
现代预防医学 2007 年第 34 卷第 11 期 Modern Preventive Medicine, 2007, Vol.34, NO.11
得 多 , 需 要 解 决 随 机 效 应 ui 的 高 维 积 分 的 问 题 , 许 多 最 大 化 似然函数的近似的推断方法被提出, 目前积分近似方法主要有 Laplace 近似 ( Liu and Pierce, 1993) , Adaptive Gaussian 积分, 一阶泰勒 ( first- order Taylor) 序列展开近似。 2 实例分析
为了研究 A、B 两种药物的的副作用情况 , 研 究 者 随 机 选 取 了 15 个 中 心 做 临 床 实 验 , 在 每 个 中 心 中 , 随 机 抽 取 一 定 数 量 的 病 人 , 其 中 nA 个 病 人 接 受 A 药 物 , nB 个 病 人 接 受 B 药 物。数据格式见表 1。
1 方法介绍 广义线性模型目前已在医学领域有广泛的应用, 但要求观
测之间互相独立, 在模型中增加随机效应项 ui: μij=E ! Yij ui, Xij " =ηij=X' ijβ+Z' ijui ( 1.1)
反应变量 Yij 的条件分布的期望: μij=E ! Yij ui, Xij " ( 1.2) 条件均数 μij ( 考虑了随机效应) 通过联结函数 g ( .) 与条件线 性预测值 ηij 联结,
g( μij) =ηij=X' ijβ+Z' ijui ( 1.3) 式 ( 1.3) 为广义线性混合模型的 一 般 式 , Yij: 第 i 类 的 第 j 个 观测的反应变量, i=1, ……, m, j=1, ……ni, 考虑随机效应 ui 的条件下独立, 服从指数分布族, 可以是二项分布、Poisson 分布、Gamma 分布等, 其密度函数为:
关键词: 广义线性混合效应模型; 最大似然估计; 随机效应
GENERALIZED LINEAR MIXED MODELS AND ITS APPLICATION LI Li- xia, GAO Yan- hui, ZHANG Pei - de, et al. ( Department of Medical Statistics, Guangdong College of Pharmacy, Guangzhou 510224, China)
Abstr act: [ Objective ] To explore the application of ceneralized linear mixed models in medical research. [ Methods ] How to fit a generalized linear mixed model for binomial data with the nlmixed procedure was demonstrated. [ Res ults ] In multi- center trials, we constructed ceneralized linear mixed models regarding center as random effect. [ Conclus ion] General- ized linear mixed model is an increasingly popular choice for the modelling of correlated data, non- normal response in a regres- sion setting.
βA, βB 为固定效应, ui 为第 i 个中心的随机效应, 则有:
! " log
πiA 1- πiA
=ηiA=β0+βA=ui
! " log
πiB 1- πiB
=ηiB=β0+βB=ui
采用 SAS 8.0 的 nlmixed 过程拟合模型, 程序如下:
data multicenter;
input center group¥ n x@@; datalines; ……;
研 究 者 随 机 选 取 了 15 个 中 心 做 临 床 实 验 , 病 人 来 自 不 同 的中心, 而可能每个中心的医疗条件, 服务质量, 医生的素质 等不同, 从而可能产生非药物作用所带来的差异, 我们尝试用
广 义 线 性 混 合 模 型 来 分 析 数 据 。 发 生 副 作 用 的 例 数 xij 服 从 二 项分布, 拟和含随机效应的 Logistic 回归模型:
proc nlmixed data=multicenter;
parms beta0=- 1 beta1=1 s2u=2; /* 定义参数及其初始值 * /
eta=beta0+beta1*group+u; expeta=exp( eta) ; p=expta /( 1+expeta) ;
model x ̄binomial ( n, p) ; /* 定义 x 的条件分布 * /
# $ fY! yij ui; φ" =exp yθa-! bφ! θ""+c ! y, φ"
作者简介: 李丽霞 ( 1974- ) , 女, 硕士, 研究方向: 统计学的教学 作者单位: 广东药学院预防医学系卫生统计教研室, 广州, 510224
其中, θ称为自然参数, ቤተ መጻሕፍቲ ባይዱ称为尺度参数。
Xij: 解释变量, β: 固定效应参数矢量, ui: 随机效应, 服 从均数为 0, 方差协方差矩阵为 γ的多变量正态分布, ui 解释 了由于不可测因子引起的类间的异质性和同一类内观测到的相
为了解决关于随机效应的高维积分问题, 其他许多近似方 法被选择, 例如 Penalized Quasi- Likelihood ( PQL, Breslow and Clayton 1993) , Marginal Quasi- Likelihood ( MQL) 等 , The % GLIMMIX macro ( Wolfinger&o’Connell, 1993) 使 用 限 制 性 伪 似 然 ( restricted pseudo—likelihood, REPL) 拟 合 广 义 线 性 模 型, 贝叶斯方法通过 Gibbs 抽样技术在后验分布中重复 抽 样 避
2
变量所不能解释的变异) , σu 反映了类间的异质性。
广义线性模型的参数估计与性能受到大家的关注, 由于模
型中因变量与自变量间的非线性关系与随机效应 ui 的存在, 模型的参数估计比较困难, 设第 i 类的似然函数为:
ni
% Li ! β, ui " =fy! yi ui, Xi, β" = fy! yij ui, Xij, β" ( 1.4) j=1
与边际模型 ( marginal models) 相比, 广义线性模型又称
为条件模型 ( conditional model) , 当 Z=1 时, ηij=X' ijβ+ui, 为最 简单的混合模型, 称为随机截距模型 ( random- intercept
model) , ui 代表了第 i 类对类内观测的影响 ( 可以观测到的协
现代预防医学 2007 年第 34 卷第 11 期 Modern Preventive Medicine, 2007, Vol.34, NO.11
文 章 编 号 : 1003- 8507( 2007) 11- 2103- 02
中 图 分 类 号 : R195.1
文献标识码: A
· 2103 · 【流 行 病 与 统 计 方 法 】
关, 不同类间的 ui 是相互独立的, Zij: 与随机效应相关的解释 变量。设计矩阵有两部分: 固定效应 X 与随机效应 Z。分析的
数据不同可以选择不同的联结函数 g ( .) , 可以拟合含随机效
应的 Logistic 回归, 含随机效应的 Poisson 回归, Probit 回归等
多种模型。
Key wor ds: Generalized linear mixed Models ; Maximum likelihood es timation; Random effect
在生物与医学领域中常常会遇到不独立的数据, 例如: 分 析家系资料中的的遗传、环境效应, 分析重复测量资料, 多中 心临床试验数据, 毒理学实验中的窝别效应等, 家庭、重复测 量中的不同个体、实验中心、窝别等都可以看作不同的类 ( cluster) , 研究总 体 中 有 许 多 类 , 同 一 类 中 的 观 测 相 关 , 而 经 典的回归模型要求观测间互相独立, 而线性混合效应模型要求 应变量是连续性变量, 不适合因变量为离散或计数的资料, 广 义 线 性 混 合 模 型 ( Generalized linear mixed models, GLMMs) 是 广 义 线 性 模 型 的 ( Generalized linear models, GLMs) 与 线 性 混 合 效 应 模 型 ( linear mixed model) 的 扩 展 , 通 过 在 模 型 中 纳 入随机效 应 来 解 释 数 据 间 的 相 关 , 过 度 离 散 ( overdispersion) 、 异质性 ( heterogeneity) 等问题。