重复测量资料分析
重复测量资料常用分析方法简介

治疗前 试验组 对照组 两组的平均值 12 周 24 周 36 周 4 个时间点的平均值
m10 m00 m.0
m11 m01 m.1
m12 m02 m.2
m13 m03 m.3
p 例171 为了评价某试验药物与对照药物对治疗慢 性乙型肝炎患者的谷丙转氨酶(ALT)水平的影响, 根据统一的诊断标准和入选标准收治20名慢性乙型 肝炎患者随机分为试验组和对照组,试验组服用试 验药,对照组服用对照药。对每一患者在治疗前、 治疗后12周、24周、36周分别测量一次ALT水平, 试验结果见表172。
j =1 n g
2
g:处理水平数
g1 MS1
F 1 =
MS 1 MS E 1
n:各处理内观察对象数
g(n1) MSE1
个体间误差
SS E1 = måå ( X ij . - X . j . )
i =1 j =1
组内(个体内)
m
时间主效应
SS 2 = ng å (X ..t - X ... )
MS3
F 3 =
重复测量误差
2 SS E 2 = ååå (X ijt + X . j . - X ij . - X . jt ) g(n1)(m1) MSE2 j =1 i =1 t =1
21
重复测量设计方差分析检验假设
p 交互相应
H10:m 10 - m00 = m11 - m01 = m12 - m02 = m13 - m03 H 11:m10 - m00 , m11 - m01 , m12 - m02 , m13 - m 03 不全相等
重复测量设计资料的方差分析【57页】

T2
T3
T4
A
1
120
108
112
120
117
A
2
118
109
115
126
123
A
3
119
112
119
124
118
A
4
121
112
119
126
120
A
5
127
121
127
133
126
B
6
121
120
118
131
137
B
7
122
121
119
129
133
B
8
128
129
126
135
142
B
9
117
115
Ty pe III Sum of Squares
1020.100 1020.100 1020.100 1020.100
348.100 348.100 348.100 348.100 333.800 333.800 333.800 333.800
df 1
1.000 1.000 1.000
1 1.000 1.000 1.000
Measure: MEASURE_1
Sourc e TIME
TIME * 分 组
Error(TIME)
Sphericity Assumed Greenhouse-Geis ser Huynh-Feldt Low er-bound Sphericity Assumed Greenhouse-Geis ser Huynh-Feldt Low er-bound Sphericity Assumed Greenhouse-Geis ser Huynh-Feldt Low er-bound
重复测量数据的分析方法

0
0 +β1
0 + β1 + β3 + β 4
0 +β2
0 + β 2 + β3 + β5
0 +β3
20
用Mixed模型进行分析
数据格式
y 52 49 42 51 50 46 50 49 41 51 49 44 49 47 40 51 id 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 g 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 t2 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 t3 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0
y id 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 t2 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 t3 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1
15
Stata数据格式 Stata命令 xtreg y t1 t2,i(id)
48 46 42 53 51 47 52 52 48 52 51 48 53 52 49
β1估计值为-1.2,P=0.002,推断3个月体重平均下降1.2kg, 差异有统计学意义,β2的估计值为-4.8,推断6个月体重平均下 降4.8kg,差异有统计学意义. 16
用Mixed模型进行分析
3个月与6个月比较 命令:test t2=t3 ( 1) t2 - t3 = 0 chi2( 1) = 88.36 Prob > chi2 = 0.0000 P<0.0001,可以推断治疗6个月时平均体 重比治疗3个月时平均体重下降,差异有统 计学意义.
重复测量数据的分析方法

单样本重复测量资料的统计分析方法
称 yit = 0 + β t + ε i + ηit 为mixed 模型 即混合模型的确定性部分表达式
= 0 + β t
t=0时,为服药前收缩压总体均数0; t=1时,为服药后收缩压总体均数1 .
7
单样本重复测量资料的统计分析方法
由于服药前后的收缩压改变量的总体均数为 β=1-0 若β=0说明服药前后收缩压平均变化为0, 即无疗效; 若β<0,说明服药后的人群平均收缩压低于 服药前,即该药物降低收缩压是有效的; 若β>0,说明服药后的人群平均收缩压高于 服药前的平均收缩压,即该药对收缩压有不 利的作用.
用Mixed模型进行分析
β的估计值为-30,P<0.001,因此治疗后的 收缩压低于治疗前,差异有统计学意义. β的95%可信区间为 (-33.87062, -26.12938) 即:有95%可信度可以推断治疗后的人群 平均收缩压至少下降了26mmHg
12
单样本多个时点的重复测量资料
例:为了考察某药物治疗在疗程为6个月中的持 续减肥作用,现考察5个服用该药的女性肥胖者 并且身高为162cm的,这5名女性肥胖者在服 用该药前,服药3个月和服药6个月的体重测量 值(kg)如下:
重复测量数据的分析方法
赵耐青 复旦大学卫生统计教研室
1
重复测量资料简介
为了考察某药物降低血药的作用,现考察5个 原发性高血压呀患者,疗程为2个周,这5名原 发性高血压患者在服用该药前后的收缩压值 (mmHg)如下
肥胖者编号 服药前体重 Y0i 服药后体重 Y1i 1 154 125 2 161 125 3 155 129 4 160 134 5 164 131
分类变量的重复测量资料分析教学课件

contents
目录
• 分类变量与重复测量资料概述 • 重复测量资料的统计分析方法 • 重复测量资料分析的注意事项与挑战 • 分类变量的重复测量资料分析案例 • 重复测量资料分析的软件工具与技术 • 总结与展望
01
分类变量与重复测量资料概述
分类变量的定义与特性
实践与反思
多参与实际研究,将所学知识应用于实际问题中,并不断反思和总 结经验。
在实际研究中的应用与实践
临床研究
在临床研究中,重复测量资料分析可用于评估治疗效果、病程变 化等。
心理学研究
在心理学研究中,重复测量资料分析有助于了解个体心理状态的 变化和影响因素。
环境科学研究
在环境科学研究中,重复测量资料分析可用于监测环境变化、评 估污染物的影响等。
重复测量资料分析的注意事项与 挑战数Leabharlann 处理与缺失值处理缺失数据处理
对于缺失的数据,应进行合理的处理,如插补、删除或保留等,以避免对分析 结果造成影响。
数据转换
对于不符合分析要求的数据,需要进行适当的转换,如编码、标准化等,以提 高分析的准确性和可靠性。
变量类型与测量尺度
变量类型
在分析重复测量资料时,应明确变量的类型,如连续型、有序分类型或无序分类 型,以便选择合适的统计分析方法。
方案提供依据。
案例三:教育程度与职业发展的关系研究
总结词
教育程度对职业发展的影响
分析方法
使用重复测量资料分析方法, 如线性混合效应模型,来评估 教育程度对职业发展的影响。
详细描述
收集个体在不同时间点的教育 程度和职业发展数据,分析教 育程度对职业发展的影响。
结果解释
12-重复测量资料的分析

ˆ ∈=
2 2 (a −1)∑∑(skl )2 − (2a) ∑(sk ) ()22
k
l
k
+ a2 s 2
( )
2
2 式 ( 1 0 - 3 ) 中 的 skl 是 矩 阵 ( 1 0 - 1 ) 中 第 k 行 第 l 列 元 素 ,
s 2 = ∑∑s k l
自由度调整方法2 自由度调整方法
( 2 ) H u y n h - F e l d t 调 整 系 数 ∈( H - F ∈)
ˆ 据 研 究 , 当 ∈真 值 在 0 . 7 以 上 时 , 用 ∈进 行 自 由 度
调 整 后 的 统 计 学 结 论 偏 于 保 守 , 故 Huynh 和 Feldt 提 出 用 平 均 调 整 值 ∈值 进 行 调 整 。 ∈值 的 计 算 公 式 为
重复测量数据常见误用情况
重复进行各时间点的t检验: 重复进行各时间点的t检验: 增大犯Ⅰ 增大犯Ⅰ类错误的概率 差值比较: 差值比较: 降低信度, 降低信度,且差值不一定符合正态性和方 差齐性的条件
重复测量资料方差分析对协方差阵的要求
重复测量资料方差分析的条件: 1. 正态性 处理因素的各处理水平的样本个体之间是相互独立的随机 处理因素的各处理水平的样本个体之间是相互独立 独立的 样本,其总体均数服从正态分布; 正态分布 样本,其总体均数服从正态分布; 2. 方差齐性 同 相互比较的各处理水平的总体方差相等, 相互比较的各处理水平的总体方差相等,即具有方差齐
对于yi与yj两时间点变量间差值 对应的方差可采用协方差矩阵 计算为:
2 2 2 2 syi −yj = syi + syj − 2syi yj 2 2 2 如 sy1−y2 = s11 + s22 − 2s12 :2
重复测量设计资料方差分析

1
SSA21n(A12A22)-C
1
SSB21n(B12B22)-C
1
S S A B S S 处 理 S S A S S B
表中n为各组的例数,I为A因素的水平数,J为B因素的水平数, A为A因素不同水平的合计数,B为B因素不同水平的合计数, C为校正悉数。
重复测量设计资料方差分析
表12-9 总变异的分解
5.0
4.5
4.0
3.5 实验前
5周后
10周后
图1 两组家兔重复血测量清设胆计资固料醇方差的分析对数随时间的变化
第一节 重复测量资料的数据特征
(repeated measurement data)
重复测量设计资料方差分析
重复测量资料的常见形式
前后测量设计 (premeasure-postmeasure design)
Huynh-Feldt Lower-bound
Error(time) Sphericity Assumed
组内误差
Greenhouse-Geisser Huynh-Feldt
Lower-bound
Type III Sum of Squares 1020.100 1020.100 1020.100 1020.100
变异来源
自由度
总变异
4n-1
组间(观察对象) 2n-1
组内(重复测量)
2n
离均差平方和(SS)
SS总= X2C
1
SS组间2
M2j C
SS组 内
X21 2
M2 j
表中n为每个处理组中观察对象的例数,X为 每个观察结果,M为每个观察对象前后两次 观察的合计,C为校正系数。
重复测量设计资料方差分析
重复测量资料如何分析?看最新JAMA论文的分析手法!

重复测量资料如何分析?看最新JAMA论文的分析手法!重复测量资料,一般是指对多个时间点进行随访获得的多结局资料。
由于多个时间点的数据存在着相关性,如何分析重复测量资料是一件棘手的任务。
纵览国内文献,分析方法使用合理的文献乏善可陈。
因此,本文通过近期发表在JAMA杂志的一篇论文来与诸位分享重复测量资料的一种分析思路。
1.研究案例研究案例为2019年11月底发表在JAMA杂志的一篇论文,研究的是药物Bempedoic acid对心血管病高风险群体的低密度脂蛋白胆固醇(LDL-C)的降低作用。
以下为本研究的PICOSStudy design三期,随机、双盲、安慰剂对照临床试验Patient研究由北美及欧洲的91个临床中心开展,共有779名患有动脉粥样硬化性心血管疾病或有家族性高胆固醇血症的患者参与,LDL-C水平高于70mg/dL(1.8mmol/L),并已接受最大耐受剂量的他汀类药物治疗且治疗效果不明显。
本研究将779名患者以2:1进行随机分组。
Intervention & control干预组:180mg bempedoic acid(n=522);对照组:安慰剂(n=257)每日1次,持续52周。
Outcome研究的主要终点为12周的LDL-C水平变化比例,次要终点包括血脂、脂蛋白和生物标志物水平的变化。
2.深入分析该研究设计为重复测量设计,在4周、12周、24周、52周分别进行测量,得到多次的结局数据,那对于此类重复测量资料该如何来分析研究结果呢?重复测量设计的分析方法有很多,有简单的t检验/F检验,也有重复测量方差分析、广义估计模型、线性混合模型等,以下将逐一进行介绍。
第一种基本的t检验/F检验主要针对的是不同时间点的组间差异性。
例如分别对第4周、第12周、第24周、第52周的结局数据进行评估,看看4个时间点的干预组和对照组之间有没有统计学差异。
此类方法简单但也存在问题,如果上述4个不同时间点的分析结果存在矛盾,有些时间点数据分析具有统计学差异,而有些没有,那要如何下结论?研究的药物bempedoic acid的治疗对心血管病的高风险群体到底是有效还是无效?第二种重复测量方差分析重复测量方差分析是重复测量资料的主要分析方法,我们通过对各个时间点的效应取一个平均值来探讨总体上的差异性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(
2
)
2
( )
( )
(10-2)
2 式 ( 1 0 - 3 ) 中 的 skl 是 矩 阵 ( 1 0 - 1 ) 中 第 k 行 第 l 列 元 素 ,
2 s2 = ∑∑ 2 a2 是 所 有 元 素 的 总 平 均 值 , skk = (∑ ll ) a是 s kl s2 k l l
重复测量资料的单变量(univariate) 方差分析实例1
对于yi与yj两时间点变量间差值对应的方差 可采用协方差矩阵计算为:
2 2 2 2 syi −yj = syi +syj −2syi yj 2 2 2 如 sy1−y2 = s11 +s22 −2s12 :2
s2 = ∑ y1i − y )2 (n−1 ( ) 11 1 s2 = ∑ y1i − y )(y2i − y2) (n−1 ( ) 12 1 = ∑y i y2i −∑y i ∑y2i n 1 1 r = ij
本例差值对应的方差精确 相等,说明球形对称。
球形对称的检验
用Mauchly法检验协方差阵是否为球形
H0:资料符合球形要求, H1:资料不满 足球形要求 检验的P值若大于研究者所选择的显著性 水准α时,说明协方差阵的球形性质得到 满足。
球形条件不满足怎么办?
常有两种方法可供选择: 1. 采用MANOVA(多变量方差分析方 法)(超出本书范围) 2. 对重复测量ANOVA检验结果中与时 间有关的F值的自由度进行调整(调小)
2 s2 主 对 角 线 元 素 的 平 均 值 , sk = (∑ kl ) a 是 第 k 行 的 平 均 值 。 l
ˆ ∈的 取 值 在 1 . 0 与 1 / ( a - 1 ) 之 间 。
二、自由度调整方法2
( 2 ) H u y n h - F e l d t 调 整 系 数 ∈( H - F ∈)
' ' ˆ 即 ν1 =ν1×∈, ν2 =ν2×∈。 其 中 ∈ 为 ∈或 ∈。
由 F (ν' ,ν' ) 确 定 调 整 的 F 临 界 值 。 a 1 2 调整后的 F 临界值较原先大,提高了拒绝 H0 的 门 槛 。 减 少 了 犯 I 类 错 误 的 概 率 。
第二节 单因素重复测量资料的 方差分析
实验前 实验前 5 周后 10 周后 0.081 5 周后 0.090 0.386 10 周后 0.065 0.411 0.723
2 s12 = ∑ y1i − y )(y2i − y2) (n−1 ( ) 1
= ∑y i y2i −∑y i ∑y2i n 1 1 r = ij s
2 ij
时间点间的相关系数
' ' 分 子 自 由 度 ν1 =ν1×∈, 分 母 自 由 度 ν2 =ν2×∈
ˆ ˆ ( 1 ) G e e n h o u s e - G e i s s e r 调 整 系 数 ∈( G - G ∈)
( 2 ) H u y n h - F e l d t 调 整 系 数 ∈( H - F ∈)
重复测量资料的单变量(univariate) 方差分析实例1
( 1 ) 总 离 均 差 平 方 和 SS总及 总 自 由 度 ν总
SS总 = 201647 −(2665)
2
(4×9) = 4362.97, ν总 = 36−1= 35。
(2)
SS对 间及 ν对 间 象 象
(2665) = 2023.72; ν 1 SS对 间 = 3182 + 2332 +L 3262 − + 对 间 = 9 −1= 8 象 象 4 36
实验前 5 周后 0.507 1 10 周后 0.269 0.777 1 1
实验前 5 周后 10 周后
2 sii s2 jj
球形对称的实际意义
所有两两时间点变量间差值对应的方差相等
s2 11 2 s V = 21 M 2 s a1 s2 L s2 12 1a 2 2 s22 L s2a M M M 2 2 sa2 L saa
2 sij 2 sii s2 jj
球形对称的实际意义举例
s
2 yi −yj
= s +s −2s
2 yi 2 yj 2 y −y2 1 2 11 2 22
2 yi yj 2 12
如 s :
= s +s −2s
A2 5 20 15 20 A3 10 15 30 25
协方差阵 A1 A1 A2 A3 A4 10 5 10 15
二、自由度调整方法1
ˆ ˆ ( 1 ) G e e n h o u s e - G e i s s e r 调 整 系 数 ∈( G - G ∈) 为 :
ˆ= ∈
a s −s
2 2 kk
2 (a −1)∑∑ skl k l
( )
2
2 2 2 2 2 −(2a)∑sk + a s k
2 s11 0 L 0 2 s12 = ∑ y1i − y )(y2i − y2) (n−1 ( ) 2 1 0 s22 L 0 V= = ∑y i y2i −∑y i ∑y2i n M 1 1 M M M 2 0 0 L s2 sij aa r = ij 2 2 sii s2 且 定11 =L= saa 假 s2 jj
每一根线代表1只兔子 每一根线代表 只兔子
实例举例1
胆固醇(mg mg%)的对数 6.5 6.0 5.5 5.0 4.5 4.0 3.5 实验前
10. 图10.附1
处理组 对照组
5周后
10周后
两组家兔血清胆固醇的对数随时间的变化
每一根线代表1位病人 每一根线代表 位病人
实例举例2
血药浓度 血药浓度(μmol/L)
A4 15 20 25 40
s1-22 = 10 + 20 - 2(5) = 20 s1-32 = 10 + 30 - 2(10) = 20 s1-42 = 10 + 40 - 2(15) = 20 s2-32 = 20 + 30 - 2(15) = 20 s2-42 = 20 + 40 - 2(20) = 20 s3-42 = 30 + 40 - 2(25) = 20
第一节 重复测量资料方差分析 对协方差阵的要求
• 重复测量资料方差分析的条件: 1. 正态性 处理因素的各处理水平的样本个体之间是相 独立的随机样本 其总体均数服从正态分布; 个体内不独立) 样本, 正态分布 互独立的随机样本,其总体均数服从正态分布;(个体内不独立) 2. 方差齐性 相互比较的各处理水平的总体方差相等, 相互比较的各处理水平的总体方差相等, 即具有方差齐同 3. 各时间点组成的协方差阵 各时间点组成的协方差阵 协方差阵(covariance matrix)具有球 形性(sphericity)特征。 Box(1954)指出,若球形性质得不到满足,则方差 分析的F值是有偏的,这会造成过多的拒绝本来是真的 无效假设(即增加了I型错误)。
重复测量资料的协方差矩阵
2 2 2 s11 s12 L s1a 2 2 2 s21 s22 L s2a V= M M M M 2 s s2 L s2 aa a1 a2 2 s11 = ∑ y1i − y )2 (n−1 ( ) 1
时间点间的协方差矩阵
(i)
1:用 药 前
2:A 药
3:C 药
4:B 药
Ti )
318 233 297 284 278 302 342 285 326
Yi
79.50 58.25 74.25 71.00 69.50 75.50 85.50 71.25 81.50
Si )
25914 13739 22127 20430 19374 22852 29906 20605 26700
重复测量资料的方差分析总思想: 将总变异 总变异分解为: 总变异 个体间( 个体间(between subjects)变异 ) 与 个体内(within subject)变异 )变异, 其中个体内变异是与重复因素有关的变量。
表 10-1
病 人 号Βιβλιοθήκη 心室早搏病人在用药前后的心率
药 物 (j) 测 量 和 ( 值 按 病 人 (i) 平 均 值 平 方 和 (
1 2 3 4 5 6 7 8 9 按 药 物 测 量 值 和 平 均 值 (j)
94 57 81 82 67 78 87 82 90
67 52 74 59 65 72 75 68 74
90 69 69 71 74 80 106 76 82
67 55 73 72 72 72 74 59 80
(Y ) 平 方 和 (S )
方差分析 重复测量资料的方差分析
重复测量的定义
重复测量(repeated measure)是指对同一 研究对象的某一观察指标在不同场合( occasion,如时间点)进行的多次测量。 例如,为研究某种药物对高血压(哮喘 病)病人的治疗效果,需要定时多次测定受 试者的血压(FEV1) ,以分析其血压( FEV1)的变动情况。 注:FEV1——最大呼气量
180 150 120 90 60 30 0
10. 图10 . 附2
旧剂型 新剂型
4
8
时间(小时)
12
某药新旧剂型血药浓度随时间的变化
重复测量设计的优缺点
• 优点: 优点: 每一个体作为自 身的对照, 身的对照,克服了个 体间的变异。 体间的变异。分析时 可更好地集中于处理 效应. 效应 因重复测量设计 的每一个体作为自身 的对照, 的对照,所以研究所 需的个体相对较少, 需的个体相对较少, 因此更加经济。 因此更加经济。 • 缺点: 缺点: 滞留效应(Carry-over effect) 滞留效应 前面的处理效应有可能 滞留到下一次的处理. 滞留到下一次的处理 潜隐效应(Latent effect) 潜隐效应 前面的处理效应有可能 激活原本以前不活跃的效 应. 学习效应(Learning effect) 学习效应 由于逐步熟悉实验, 由于逐步熟悉实验,研 究对象的反应能力有可能 逐步得到了提高。 逐步得到了提高。