交互作用分析
交互作用分析

交互作用分析若某因子不同水準間輸出的差異,會隨 其它因子水準的設定改變而改變,則這 些因子之間存在交互作用。
交互作用的處理方法y Study control factor interactions to quantify theireffects.觀察控制因子間的交互作用y To minimize the likelihood of significant interactionsand avoid having to estimate them.減少顯著的交互作用的發生1Interactions definedy Antisynergistic 反向交互作用Factor A 水準一到水準二間的輸出差異,會隨著 B水準設定而改變,且其變化方向相反。
Response Factor B HighA , B 間有相 互影響Factor B Low Low Factor AHighInteractions definedy Synergistic 正向交互作用Factor A水準一到水準二間的輸出差異,不會隨 著 B 水準設定而改變。
Response Factor B High A , B 間不會影響到水準 的決定Factor B LowHighLow Factor A不平行的量愈 大表示相互的 作用愈大2Measurement of InteractionsB1 B210 9 8 7 6 5 4 3 2 1Run (L4) 1 2 3 4A 1 1 2 2B 1 2 1 2C (A-B) 1 2 2 1Y 7 5 10 81 Factor A2Delta 1 = A2B1 – A1B1 Delta 2 = A2B2 – A2B1 Delta 1 = Delta 2 表示因子 A 與 B之間 無交互作用Measurement of InteractionsB1 B210 9 8 7 6 5 4 3 2 1Run (L4) 1 2 3 4A 1 1 2 2B 1 2 1 2C (A-B) 1 2 2 1Y 9 5 6 81 Factor A2最佳水準組合將發生錯誤Delta 1 = A2B1 – A1B1 -3 = 3 Delta 2 = A2B2 – A2B1 = Delta 1 ≠ Delta 2 且異號,表示因子 A 與 B之間有強交互作用3Degrees of Freedom of Interactionsy 2-level factorsIn the L4, one 2-level column (column 3), with DOF=(2-1)=1, is adequate to estimate the interaction between factors A and B.High Factor B LowRun (L4) 1 2 3 4A 1 1 2 2B 1 2 1 2C (A-B) 1 2 2 1LowFactor AHighDegrees of Freedom of Interactionsy 3-level factorsIn the L9, one 3-level column (column 3,4), with DOF=(31)*2=4, is adequate to estimate the interaction between factors A and B.High Factor B Medium LowRu n (L9)A (1)B (2)C D (1-2) (1-2)1 2 3 4 5 6 7 8 91 1 1 2 2 2 3 3 31 2 3 1 2 3 1 2 31 2 3 2 3 1 3 1 21 2 3 3 1 2 2 3 1LowMediumHigh Factor A4Resolution (解析度)y When all the two-way interactions are free ofconfounding with other two-way interactions and main effects, this is referred to as a Resolution V array.y When two-way interactions confound with two-wayinteractions but not main effects, this is referred to as Resolution IV array.交互作用 主因子效應y When two-way interactions confound with maineffects, this is referred to as Resolution III array.L8 (23), Resolution VRun 1 2 3 4 5 6 7 8 1 A 1 1 1 1 2 2 2 2 2 B 1 1 2 2 1 1 2 2 3 1 1 2 2 2 2 1 1 1-2 4 C 1 2 1 2 1 2 1 2 5 1 2 1 2 2 1 2 1 1-4 6 1 2 2 1 1 2 2 1 2-4 7 1 2 2 1 2 1 1 2Main effects and all two-way interaction are free of confounding called Resolution V.5L8 (24), Resolution IVRun 1 2 3 4 5 6 7 8 1 A 1 1 1 1 2 2 2 2 2 B 1 1 2 2 1 1 2 2 3 1 1 2 2 2 2 1 1 1-2 4-7 4 C 1 2 1 2 1 2 1 2 5 1 2 1 2 2 1 2 1 1-4 2-7 6 1 2 2 1 1 2 2 1 1-7 2-4 7 D 1 2 2 1 2 1 1 2Two-way interactions confound with other two-way interaction, but not main effect, called Resolution IV.L8 (27), Resolution IIIRun 1 2 3 4 5 6 7 8 1 A 1 1 1 1 2 2 2 2 2-3 4-5 6-7 2 B 1 1 2 2 1 1 2 2 1-3 4-6 5-7 3 C 1 1 2 2 2 2 1 1 1-2 4-7 5-6 4 D 1 2 1 2 1 2 1 2 2-6 3-7 5 E 1 2 1 2 2 1 2 1 1-4 2-7 3-5 6 F 1 2 2 1 1 2 2 1 2-4 3-5 7 G 1 2 2 1 2 1 1 2 1-6 2-5 3-46L9 (32), Resolution VRun (L9) 1 A 2 B 3 41 2 3 4 5 6 7 8 91 1 1 2 2 2 3 3 31 2 3 1 2 3 1 2 31 2 3 2 3 1 3 1 2 1-21 2 3 3 1 2 2 3 1 1-2OA 應用場合y 五級解析度OA,可以用來精確的評估因子效應與因子間的交互作用。
交互作用双因子方差分析

若H01 成立,即1 2 r 0 ,那么,虽然 不能苛求做为诸i 的估计值之平方和的若干倍的S A2
rst
r
( xi•• x 2 st xi•• x 2 )恰好等于零,
i1 j1 k 1
i 1
但相对于SE 2
来说一定不应太大,倘若S A2 SE2
超过某个界
限值k1 ,我们就有理由拒绝H01 ,故
后的剩余部分,称为水平组合 Ai , B j 的交互效应。
第7页/共35页
于是 X ij ~ N uij , 2 可以等价的表示为:
X ij uij ij u i j ij ij
ij ~ N 0, 2
, i 1,2,, r; j 1,2,, s
这表明,在因素 A, B 的不同水平组合下,试验结果的相对差异
1 rs
r i1
s
uij ——理论总均值
j 1
记:ui•
1 s
s
uij —因素A在i水平下的理论平均
j 1
记:u• j
1 r
r i 1
uij —因素B在j水平下的理论平均
第6页/共35页
显然
uij u ui• u u• j u uij ui• u• j u 记:i =ui• u
SE2 就基本上刻划了整个试验中随机因素作用的强 度,以它为尺度来比较各种效应的大小应该说是合理
的。
第15页/共35页
从矩估计的角度看, x 、xi•• 、x• j• 、 xij• 分别是 u 、ui• 、u• j 、uij 的估计值,因此, xi•• x 可作为i ui• u 的估计值; x• j• x 可作为 j u• j u 的估计值; xij• xi•• x• j• x 可作为rij uij ui• u• j u 的 估计值。
交互作用双因子方差分析

st
xijk
j1 k 1
称为水平 Ai 下的样本均值;
x• j•
1 rt
r i1
t
xijk
k 1
称为水平 B j 下的样本均值。
r s t
考虑总变差平方和 ST 2 xijk x 2 的如下分解:
i1 j1 k 1
r s t
ST 2
xijk x 2
i1 j1 k1 rst
若 H01 成立,即 1 2 r 0 ,那么,虽然 不能苛求做为诸i 的估计值之平方和的若干倍的S A2
rst
r
( xi•• x 2 st xi•• x 2 )恰好等于零,
i1 j1 k 1
i 1
但相对于 SE
2
来说一定不应太大,倘若
SA2 SE2
超过某个界
限值k1 ,我们就有理由拒绝H01 ,故
0.
s
类似地,由 j
j 1
s j 1
u• j u
1 r
s j 1
r i 1
uij
su
0
r
r
r
ij uij ui• u• j u uij u• j ru• j ru• j 0
i 1
i 1
i 1
s
s
s
ij uij ui u• j u uij ui• sui• sui• 0
2
=
xijk xij• xi•• x x• j• x xij• xi•• x• j• x
i1 j 1 k 1
r s t
rst
rst
xijk xij• 2 xi•• x 2 x• j• x 2
i1 j1 k 1
i 1 j 1 k 1
交互作用的正交试验设计与数据分析

共有 11 个,比因子个数还多。实际经验表明, 多数交互作用是不存在的或很小以至可以忽略不 计,实际中主要考虑部分二级交互作用,具体考察 哪些二级交互作用还要依赖专业知识来决定。
自由度
• 样本中能独立变化的数据数目。只要有 n-1个数确定,第n个值就确定了,它不 能自由变化。所以自由度就是n-1。自由 度表示的是一组数据可以自由变化的数
2水平因素的各级交互作用均占1列;对于3水 平因素,一级交互作用占两列,二级交互作用占四 列,……,可见,m和p越大,交互作用所占列数 越多。
例如,对一个25因素试验,表头设计时,如果考 虑所有各级交互作用,那么连同因素本身,总计应占 列数为:
C51 + C52 +C53 +C54 +C55 =5+10+10+5+1=31,
3
(1)60 (2)3.5 (1)1.1/1 (2)60 91
4
(1)60 (2)3.5 (2)1.2/1 (1)50 94
5
(2)80 (1)2.5 (1)1.1/1 (2)60 91
6
(2)80 (1)2.5 (2)1.2/1 (1)50 96
7
(2)80 (2)3.5 (1)1.1/1 (1)50 83
② 列出试验方案 根据表头设计,将A、B、C各列对应的数 字“1”、“2”换成各因素的具体水平,
得出试验方案列于表。
③ 结果分析 按表所列的试验方案进行试验, 其结果分析与前面并无本质区别,只是:应把 互作当成因素处理进行分析; 应根据互作效应, 选择优化组合。
5.3.1 试验的设计
基因型和表型之间遗传和环境的交互作用分析

基因型和表型之间遗传和环境的交互作用分析人类的基因是我们最为独特的特征之一。
基因使我们具备了基本的生物能力–如生长和繁殖。
然而,我们在外表和功能上的差异也同样显著。
这是由我们的表型特征所决定的,即我们的外表和功能不仅取决于我们的基因,还受到环境的影响。
我们的基因型是由我们从父母那里遗传而来的基因所决定的。
如果两位父亲都携带有相同的基因,那么他们的后代也会携带这些基因。
随着我们从父母那里继承下来的DNA序列,基因型的差异也就被确定了下来。
基因型所决定的是我们的潜在特征,但我们真正展现在外部世界上的特征,如身高、眼色、头发颜色等,取决于我们的表型。
我们的表型不仅仅是基因型的外在表现,还受到许多因素的影响,如环境因素。
基因和环境这两个因素相互作用,一起影响了我们的表型。
表型的变化可以是由基因差异所引起的,也可以是由环境因素造成的,或由他们的相互作用引起的。
基因型和表型之间的遗传作用基因通过控制某些蛋白质的生成来实现他们的功能。
这些蛋白质在人体内扮演不同的角色,并最终影响我们的表型特征。
比如,有一些基因可以控制我们的身高、眼睛颜色或风险元素的分布。
基因型和表型之间的遗传作用也可以通过基因变异来实现。
基因变异是DNA序列发生变化的过程,它是由突变或重组事件所引起的。
突变可以产生新的基因型或表型,但有时可能会对个体的健康造成影响。
例如,有些人携带有基因变异,导致他们对某些药物产生不同的反应。
这就解释了为什么有时候同样的药物可以对一个人有效而对另一个人无效。
此外,一些基因变异也会导致遗传性疾病的出现,如血友病和囊性纤维化等。
基因型和表型之间的环境作用环境因素也会影响我们的表型特征。
环境因素包括我们生活的地方、我们的饮食习惯、我们的生活方式、我们受到的社会和文化影响等等。
环境因素可以影响基因表达,也可以引起基因突变。
环境因素对基因的影响可以通过表观遗传学来解释。
表观遗传学是指不影响基因序列的遗传变化。
这些变化可以影响基因的表达,导致我们的表型特征发生变化。
探究 DOE 实验设计的参数交互作用及其影响分析

探究 DOE 实验设计的参数交互作用及其影响分析DOE(Design of Experiments,实验设计)是一种统计分析方法,用于确定影响试验结果的参数以及参数之间的交互作用。
在探究DOE实验设计的参数交互作用及其影响分析时,研究人员主要关注实验参数之间的相互关系,以及这些参数对试验结果的影响程度。
本文将从DOE实验设计的原理、参数交互作用分析方法、参数影响度量等方面进行探讨。
首先,DOE实验设计的核心原理在于确定主要影响试验结果的参数并系统化地变化它们的取值。
通过这种方式,研究人员可以识别出最具影响力的参数,以及这些参数之间的相互作用。
DOE方法通常采用设计矩阵来考察参数的取值范围,以及它们与试验结果的关联关系。
在参数交互作用分析方面,常用的方法是使用多因素方差分析(ANOVA)或回归分析。
多因素方差分析用于确定各个参数及其交互作用对试验结果的影响程度。
通过计算各个参数和交互项的F值,可以评估它们对试验结果的显著性影响。
此外,利用ANOVA还可以确定参数之间的线性或非线性关系,以及二阶交互作用的存在。
为了更好地理解参数之间的相互作用效应,可以绘制交互作用图。
交互作用图可以通过绘制不同参数之间的二维图形来可视化参数之间的相互关系。
通过观察图形的模式和变化趋势,可以进一步分析参数之间的交互作用情况。
此外,参数影响度量也是分析DOE实验设计的重要内容。
常用的参数影响度量方法包括主效应图和交互作用图。
主效应图可以帮助研究人员识别出对试验结果影响最大的参数。
此外,在交互作用图的基础上,可以通过计算参数之间的相互作用效应大小来评估这些参数的重要性。
对DOE实验设计的参数交互作用及其影响的分析有助于确定主要影响试验结果的参数,并评估它们之间的相互关系。
通过深入研究参数之间的交互作用效应,可以更好地优化实验设计,提高试验结果的准确性和可靠性。
总之,DOE实验设计的参数交互作用及其影响分析是一个复杂而关键的研究领域。
logistic回归模型中交互作用的分析及评价
基础理论与方法logistic回归模型中交互作用的分析及评价导读流行病学病因学研究常运用logistic回归模型分析影响因素的作用并利用纳入乘积项的方法分析因素间交互作用如有统计学意义表示两因素间存在相乘交互作用但乘积项若元统计学意义并不表示两因素间相加交互作用或生物学交互作用的有无研究的癌症家族史 和吸烟资料
注:资料为调查所得,表内数据为实际样本量放大10倍 表3 模型I的logistic回归结果
本例AP=0.469,说明全部女性肺癌病例中归因于 癌症家族史和吸烟的交互作用所引起的病例占 46.9%。但因本研究分析未考虑其他因素的作用及 混杂因素的影响,且分析时为了缩窄可信区间用了 实际观察的10倍样本量分析,所得结论不一定代表 真实情况。
作者单位:香港中文大学公共卫生学院社区及家庭医学系 通讯作者:余德新,Email:iyu@cuhk.edu.hk
万方数据
项无统计学意义,并不表示两因素无相加交互作用, 也不表示两因素对某疾病的发生无生物学交互作 用o Rothman旧J1,Hosmer和Lemeshow¨1指出
logistic或Cox回归模型中乘积项分析的不足,从理
Dural0
Dum01
Dural 1
OR值 ORoo ORlo ORol ORIl
单因素交互作用简单效应分析概要
单因素交互作用简单效应分析概要在数据分析过程中,单因素、交互作用和简单效应分析是常用的统计方法,用于探究变量之间的关系、影响和解释。
下面将对这些概念进行详细介绍。
1.单因素分析单因素分析是一种用于研究一个自变量对一个因变量的影响的统计方法。
它可以帮助我们了解一个变量的效应以及它对因变量的贡献。
在单因素分析中,我们控制其他可能影响因变量的变量,将自变量进行分类或相关指标进行比较,从而确定自变量对因变量的影响大小。
在实际应用中,单因素分析常用于实验和观察研究中。
例如,研究员想要了解不同教育水平对工资收入的影响,可以将参与者分为高中、本科和硕士研究生三组,然后比较不同组的平均收入。
单因素分析的结果通常通过方差分析(ANOVA)进行统计推断。
ANOVA可以帮助我们判断不同组的均值差异是否显著,并提供相应的统计指标,如F值和p值。
2.交互作用分析交互作用分析是一种用于检验两个或多个自变量之间是否存在相互作用的统计方法。
相互作用表示自变量之间的效应取决于其他自变量的水平。
换句话说,当自变量间存在交互作用时,它们一起对因变量产生的效应不是简单的加和,而是有相互作用的复杂效应。
交互作用的检验通常使用方差分析方法或回归分析中的交叉项(interaction term)来实现。
例如,在研究体重对性别和年龄的影响时,研究者可以使用卡方检验或线性回归模型来检验体重和性别、年龄之间的交互作用。
交互作用分析对于理解多个自变量之间的复杂关系非常重要。
它可以帮助我们识别变量间的非线性关系、探索特定子群体的差异以及设计并解释实验结果。
3.简单效应分析简单效应分析是一种用于解释交互作用的统计方法。
当我们在交互作用检验中发现存在交互作用时,简单效应分析可以帮助我们了解自变量间交互作用的具体性质和方向。
简单效应分析通过研究不同自变量水平对因变量的影响来实现。
对于存在交互作用的自变量组合,我们计算各组的平均值并进行比较,以确定其对因变量的影响差异。
回归分析中的交互作用效应检验方法(八)
回归分析中的交互作用效应检验方法回归分析是统计学中一种常用的分析方法,它用于研究自变量与因变量之间的关系。
当研究对象中存在多个自变量时,我们需要考虑这些自变量之间的交互作用效应。
交互作用效应指的是两个或多个自变量相互作用对因变量的影响。
在回归分析中,检验交互作用效应的方法有很多种,接下来我们将介绍其中一些常见的方法。
一、交叉乘积项法交叉乘积项法是一种最常用的检验交互作用效应的方法。
在回归模型中,我们首先需要构建交叉乘积项,即将两个自变量相乘得到一个新的变量,然后将这个新变量加入到回归模型中。
通过检验交叉乘积项的系数是否显著来判断交互作用效应是否存在。
如果交叉乘积项的系数显著不为零,就说明自变量之间存在交互作用效应。
二、边际效应图法边际效应图法是通过绘制边际效应图来检验交互作用效应的方法。
在回归模型中,我们可以通过将自变量固定在不同的取值上,然后绘制因变量在不同取值下的预测值,来观察自变量之间的交互作用效应。
如果不同自变量取值下的因变量预测值存在差异,就说明存在交互作用效应。
三、F检验法F检验法是通过对比包含交互项的回归模型和不包含交互项的回归模型来检验交互作用效应的方法。
在F检验中,我们首先构建包含交互项的回归模型和不包含交互项的回归模型,然后通过F统计量来检验这两个模型之间的显著性差异。
如果F统计量的P值小于显著性水平,就说明交互作用效应显著存在。
四、条件效应图法条件效应图法是通过绘制条件效应图来检验交互作用效应的方法。
在回归模型中,我们可以通过将其中一个自变量固定在某一取值上,然后绘制另一个自变量对因变量的影响图来观察交互作用效应。
如果不同自变量取值下因变量的影响存在差异,就说明存在交互作用效应。
以上介绍了一些常见的回归分析中的交互作用效应检验方法,每种方法都有其独特的优势和适用场景。
在实际应用中,我们可以根据研究问题的特点和数据的特征选择合适的方法来检验交互作用效应。
通过检验交互作用效应,我们能够更准确地理解自变量与因变量之间的关系,为研究者提供更多有价值的信息。
一文轻松看懂线性回归分析的交互作用
一文轻松看懂线性回归分析的交互作用线性回归分析是一种常用的统计方法,用于建立和探索变量之间的关系。
当我们研究两个或更多的自变量(也称为预测因子)对因变量的影响时,交互作用成为一个重要的概念。
为了理解交互作用,让我们考虑一个简单的例子:假设我们想研究年龄和教育对收入的影响。
我们可以使用线性回归模型来解释这种关系,并思考交互作用可能发挥的作用。
在没有交互作用的情况下,我们可以分别考虑年龄和教育对收入的影响。
我们可以通过拟合一个模型,即收入=截距+β1*年龄+β2*教育,来评估这种影响。
这个模型告诉我们,当年龄增加一岁时,收入会增加β1个单位;当教育程度增加一年时,收入会增加β2个单位。
然而,如果存在交互作用,那么年龄和教育对收入的影响将不再简单地加总。
相反,当两个自变量一起考虑时,它们的影响可能会相互影响。
为了检测交互作用,我们可以修改我们的模型,使其包括自变量之间的交互项。
我们可以通过拟合一个模型,即收入=截距+β1*年龄+β2*教育+β3*年龄*教育,来评估这种影响。
在这个模型中,β3表示了年龄和教育的交互作用的影响。
如果β3显著不为零,那么我们可以得出结论:交互作用对收入有显著的影响。
进一步分析可以告诉我们,交互作用的具体形式和模式。
总之,交互作用是线性回归分析中一个重要的概念。
它指的是自变量之间的相互影响,使得它们的效果不能简单地加总。
通过考虑交互作用,我们可以更好地理解变量之间的关系,并提供更准确的预测和解释能力。
要检测和解释交互作用,我们可以通过引入交互项来修改模型,并进行统计推断和分析。
这样,我们就可以更全面地理解和描述变量之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
交互作用分析
一、交互作用的概念
简单地说,交互作用指当 两个因素都存在时,它们的作用大于(协同)或小于(拮
抗)各自作用的和。
要理解交互作用首先要区 别于混杂作用。
混 杂作用
以吸烟(SMK)和饮酒(ALH)对收缩压(SBP)的影响为例,可以建立以下二个模
型:
模型1:SBP = β0+β2’SMK
模型2:SBP = β0+β1ALH+β2SMK
假设从模型1估计的SMK的作用为β2’,从模型2估计的SMK的作用为β2。如吸烟
与饮酒有关(假设吸烟者也 多饮酒),而且饮酒与血压有关,这时可以假想两种可
能:
1. 吸烟与血压无关,但因为饮酒的原因,模型1中的β2’会显著,而模型2控制了
ALH的作用后,SMK的作用β2将不显著。
2. 吸烟与血压有关,模型1中估计的SMK的作用β2’一部分归功于饮酒,模型2估
计的β2是控制了ALH的作用后SMK的作用,因此β2’不等于β2。
是不是β2不等于β2’ 就意味着有交互作用呢?不是的,这 只是意味着β2’中有饮酒
的混杂作用。
那么什么是交互作用呢?
根据吸烟与饮酒将研究对 象分成四组,各组SBP的均数可用下表表示:
不饮酒 饮酒
不吸烟 β0 β0+ β
1
吸烟 β0+β2 β0+ β1+β2+β
12
吸烟与饮酒对SBP的影响,有无交互作用反映在β12上,检验β12是否等于零就是检验
吸烟与饮酒对SBP的影响有无交互作用。而上面的模型2是假设β12等于零所做的回
归方程。
交互作用的理解看上去很 简单,但需要意识到的是交互作用的评价与作用的测量方法
有关。以高血压发病率为例,看吸烟与饮酒对高血压发病率的影响就有两种情况。
I、相加模型:
不饮酒 饮酒
不吸烟 I0 I0+ Ia
吸烟 I0+Is I0+Ia+Is+Isa
II、相乘模型:
不饮酒 饮酒
不吸烟 I0 I0*A
吸烟 I0*S I0*S*A*B
相加模型检验Isa是否等于零,相乘模型检验B是否等于1,可以想象Isa等于零时B
不一定等于1,因此会出现按不同的模型检验得出 的结论不同。在报告交互作用检验
结果时,要清楚所用的是什么模型。一般的线性回归的回归系数直接反映应变量的变
化,是相加模型,而Logistic回归的回归系数反映比值比的变化, 属相乘模型。
二、交互作用的检验
交互作用检验有两种方法,一是对交 互作用项回归系数的检验(Wald test),二是比
较两个回归模 型,一个有交互作用项,另一个没有交互作用项,用似然比检验。本系
统采用似然比检验(Log likelihood ratio test)方法。
如以吸烟与饮酒两个两分类变量为 例,可以形成回归方程:
方程1:F(Y)= β0+β1ALH+β2SMK+β12SMK*ALH
计算该方程似然数(likelihood),似然数表示按得出的模型抽样, 获得所观察的样本
的概率。它是一个很小的数,因此一般取对数表示,即Log likelihood,似然数可以简
单地理解为拟合度。
如果我们假定吸烟与饮酒 无交互作用,β12等于零,则方程为:
方程2:F(Y)= β0+β1ALH+β2SMK
如果方程1和方程2得到的似然数没有显著差别,表明β12是多余的,或者说β12与零
无显著性差异,吸烟与饮酒对f(Y)无交互作用。反之,吸烟与饮酒对f(Y)有交互
作用。
三、交互作用分 析
交互作用分析也可以理解为,在分层 分析基础上对分层变量的不同层级水平上,危险
因素对结果变量的作用的回归系数差异进行统计学检验。如上表中可以看出,在不吸
烟组,饮酒的作用是β1,在吸烟组中饮酒的作用是β1+β12,如β12=0则表示饮酒的作
用 在吸烟组与不吸烟组都一样。分析交互作用主要回答的问题是:有哪些因素影响危
险因素(X)与结果变量(Y)的关系”?有没有效应修饰因子?参看
流行病学
假设检验的思路。
发现效应修饰因子对助于 我们进一步理解危险因素对结果变量的作用通路。
危险因素可以是连续性变 量,也可以是分类型变量。本系统多要分析的可能的效应修
饰因子限于分类型变量。
系统将自动检测结局变量 的类型(如两分类变量、连续变量),再自动默认选择合适
的回归模型(如Logistic回归或线性回归模型)。用户可以对 分布类型和联系函数自
行定义。
用户可以定义表格输出格 式,包括要报告的结果、行列编排、小数点位置等。
如果危险因素是分类型变 量,系统将:
1.
列出危险因素与效应修饰因子的每种 层级组合(联合亚组),如危险因素分3
组,效应修饰因子分2组,联合亚组就有6组。
2.
如果结果是一个连续性的变量,统计 每个联合亚组内结果变量的均数与标准
差;如果结果是一个二分类的变量,统计频数(百分数)。
3. 运行两种回归模型: A 和 B
•
模型A 按联合亚组生成指示变量,放入模型 中(如有6个联合亚组,把一组
作为参照组,放 入5个指示变量于模型中);
•
模型B不考虑危险因素与效应修饰因子的联 合,分别产生指示变量放入模型
中,如危险因素分3组,把一组作为参照,放入2个指示变量于模型中,效应
修饰因子 分2组,一组为参照,放入一个指示变量 于模型中,共3个指示变
量。
然后进行似然比检验比较模型A与模型B,报告P值,即交互作用的P值。
如果危险因素是连续性变 量,系统将:
1. 运行两种回归模型: A 和 B。
•
模型A 按效应修饰因子的每个层级产生危险 因素参数。如效应修饰因子为
SMK分2组(吸烟与不吸烟),危险因素为BMI(体重指数),产生2个
BMI(BMI1与BMI2),当SMK=0(不吸烟)时,BMI1=BMI, BMI2=0;当
SMK=1(吸烟)时,BMI2=BMI, BMI1=0。把BMI1与BMI2同时放入模型中。
•
模型B只有一个危险因素参数。
然后进行似然比检验比较模A与模型B,报告P值,即交互作用的P值。
系统将自动检测结局变量 的类型(如两分类变量、连续变量),再自动默认选择合适
的回归模型(如Logistic回归或线性回归模型)。用户可以对 分布类型和联系函数自
行定义。
用户可以定义表格输出格 式,包括要报告的结果、行列编排、小数点位置等。
例1:
输出结果:
交互作用检验
吸烟 -> N 否 是 合计
交互作用
的 P值
性
别 = 男
一秒肺活量 366 -0.05 (-0.06, -0.04) <0.001 -0.06 (-0.07, -0.05) <0.001 -0.06 (-0.07,
-0.05) <0.001
0.039
最大肺活量 366 -0.04 (-0.05, -0.02) <0.001 -0.05 (-0.06, -0.04) <0.001 -0.05 (-0.05,
-0.04) <0.001
0.029
性
别 = 女
一秒肺活量 364 -0.03 (-0.04, -0.02) <0.001 -0.03 (-0.05, 0.00) 0.030 -0.03 (-0.04,
-0.02) <0.001
0.608
最大肺活量 364 -0.03 (-0.04, -0.02) <0.001 -0.03 (-0.05, -0.01) 0.009 -0.03 (-0.04,
-0.02) <0.001
0.854
合计
一秒肺活量 730 -0.04 (-0.04, -0.03) <0.001 -0.06 (-0.07, -0.05) <0.001 -0.05 (-0.05,
-0.04) <0.001
<0.001
最大肺活量 730 -0.03 (-0.04, -0.02) <0.001 -0.05 (-0.06, -0.04) <0.001 -0.04 (-0.04,
-0.03) <0.001
<0.001
回归系数(95%可信区间) p 值 / 比值比/危险度比(95%可信区间) p 值
结局变量: 一秒肺活量 和 最大肺活量
危险因素: 年龄
分层变量: 性别
模型I: 调整变量: 文化程度, 饮酒, 职业 和 被动吸烟
分组合计 后的分析也调整了: 性别
交互作用 的 P值由对数似然比检验比较两个相嵌模 型得出
于 2012-05-08 使用《易侕统计》软件(www.empowerstats.com)和R软件生成。
例2:
输出结果: