医学统计学-析因分析
医学统计学分析基本思路指南

医学统计学分析基本思路指南第一篇:医学统计学分析基本思路指南医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。
对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。
这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。
对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。
尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。
但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。
更实际的分析思路是:(1)先确定研究目的,根据研究目的选择方法。
不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。
二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。
三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。
(2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。
不同数据类型采用的统计方法也不同。
定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。
分类资料可用的方法有χ2检验、对数线性模型、logistic 回归等。
图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。
(3)选定统计方法后,需要利用统计软件具体实现统计分析过程。
SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。
(4)统计结果的输出并非数据分析的完成。
析因设计与分析

合计
Tg (ΣX)
4.81
5.38
4.58
4.29
5.17 5.52
5.12
4.20 39.07
ΣX2 2.9403 3.6764 2.6768 2.3257 3.3729 3.8540 3.2914 2.2410 24.3785
A1
A2
B1
A1 B1
A2 B1
B2
A1 B2
A2 B2
2×2=4种处理
2019年10月22日
2×3析因设计
各因素各水平全面组合的设计
A
B
B1
B2
B3
A1
A1B1
A1B2
A1B3
A2
A2B1
A2B2
A2B3
2×3=6种处理
2019年10月22日
2×2×2析因设计
B1 A
C1
C2
B2
C1
C2
A1
A1B1C1 A1B1C2
A1B2C1 A1B2C2
A2
A2B1C1 A2B1C2
A2B2C1 A2B2C2
2×2×2 =8种处理
2019年10月22日
3×3析因试验举例
考察不同剂量考的松和党参对ATP酶活 力的作用。
A因素(考的松)
不用 低剂量 高剂量
不用 O B因素 低剂量 B1
高剂量 B2
A1 A1 B1 A1 B2
AB=[( a2b2- a1b2)-(a2b1- a1b1)]/2= (16-4)/2=6
AB=[( a2b2- a2b1)-(a1b2- a1b1)]/2=(22-10)/2=6
2019年10月22日
B
B1 (未用药) B2 (用药)
研究生医学统计学-随机区组设计和析因设计资料的方差分析

Yi
∑Y
j
2 ij
32783.4
变异分解
总变异: (1) 总变异: 所有观察值之间的变异
处理间变异:处理因素+ (2) 处理间变异:处理因素+随机误差 区组间变异:区组因素+ (3) 区组间变异:区组因素+随机误差 (4) 误差变异: 误差变异: 随机误差
SS总 = SS处理 + SS区组 + SS误差
A2
A3
随机区组的两因素3 随机区组的两因素3×2析因设计
15
析因设计的特点
2个或以上(处理)因素(factor)(分类变量 个或以上(处理)因素( 分类变量) 个或以上 ) 分类变量 本节只考虑两个因素) (本节只考虑两个因素) 每个因素有2个或以上水平 个或以上水平( 每个因素有 个或以上水平(level) ) 每一组合涉及全部因素, 每一组合涉及全部因素,每一因素只有一个水平 参与 几个因素的组合中至少有 2个或以上的观察值 个或以上的观察值 观测值为定量数据(需满足随机、独立、正态、 观测值为定量数据(需满足随机、独立、正态、 等方差的ANOVA条件) 条件) 等方差的 条件
n
a
n
SS处理 = ∑
i=1
a
(∑Yij )
j =1
2
n
n
1 − C = (500.72 + 523.42 + 567.02 ) −1591.12 /24 = 283.83 8
(∑Yij )
i =1 a 2
SS区组 = ∑
j=1
a
1 − C = (197.82 +196.12 + 208.12 + 222.22 3
配伍组编号 1 2 3 4 1 2 3 4 1 2 3 4 日注射量A A1 注射次数B B1(少) B2(多) 33.6 33.0 37.1 30.5 34.1 33.3 34.6 34.4 33.0 28.5 29.5 31.8 29.2 29.9 30.7 28.3 31.4 30.7 28.3 28.2 28.9 28.4 28.6 30.6
析因分析

表9 受试者的体重下降值(kg)
给药顺序 甲组 (AB)
乙组 (BA)
分组后受试者编号 1 2 3 4 5 6 7 8 9 10
前四周 6.129 2.497 4.313 4.540 1.498 4.449 4.994 0.454 0.227 1.589
后四周 –0.454 0.908 0.454 2.724 1.135 2.043 1.816 0.136 1.271 1.271
2.主效应 主效应(main effect)指某一因素各 水平间的平均差别。
30
3.交互作用 当某因素的各个单独效应随另一因 素变化而变化时,则称这两个因素间存在交互作 用(interaction)。
60
50
均 40 数 30
20
缝合2月 缝合1月
10
0
外膜缝合
束膜缝合
图11-2 两因素交互作用示意图
SS组间
(102.91)2 30
(81.46)2 30
(80.94)2 30
(58.99)2 30
876.42 32.16
SS组内 82.10 32.16 49.94
11
4. 列方差分析表
表3 方差分析表
变异来源 自由度 SS MS
总变异 119 82.10
组间
3 32.16 10.72
组内
36
表11-7 A,B两药联合运用的镇痛时间(min)
A药物剂量 1.0 mg
2.5 mg
5.0 mg
5μg 105 80 65 75 115 80 85 120 125
B药物剂量 15μg
115 105 80 125 130 90 65 120 100
医学统计学中常用的分析方法

医学统计学中常用的分析方法医学统计学是现代医学研究中必不可少的一个领域。
医学统计学是通过数据量化来描述和分析人群的疾病发病率、死亡率等重要指标。
在医疗领域中,各种慢性病、癌症等疾病的诊断和治疗,都需要依托经验数据以及一系列科学的研究手段,从而获得越来越准确的分析结果。
下面我们就来介绍医学统计学中常用的分析方法。
一、描述统计学在医治领域中,描述统计学的作用就是通过对样本的描述来深入了解总体特征。
常见的该类统计学指标有平均数、标准差以及四分位数等。
一个样本和你常遇到的人群数据不同,但也表现出自己的普遍特征。
描述统计学可以利用样本中的数据特征,了解该群体的规律和变化趋势,有助于研究者对整个群体的认识。
例如,在研究一种癌症的发病率时,描述统计学可以看到该癌症发病人群的年龄分布、性别分布等特征。
二、参数检验参数检验是将样本得到的数据运用到总体上分别进行推断的方法,用来检验研究者的假定是否成立。
参数检验的结果常表示为 t 值或 F 值等统计指标,这些指标可以在制定检测的同时告诉我们这些检测是否显著。
其中,t 值的大小表示两个样本之间的差别是否显著;F 值的大小表示方差是否显著。
基于参数检验可以根据样本数据,对推论进行延伸并推断总体信息状态。
三、协方差分析协方差分析是用来研究自变量对因变量的影响是否显著,同时控制与自变量无关的某些变量的干扰。
举个例子:人体中身高和体重间的关系是正相关的,但如果控制年龄变量的干扰之后,协方差分析可能会发现身高和体重间的关系并不如之前想象得那么紧密。
协方差分析可以对多个变量之间的关系进行分析和推断。
在医疗领域,随着研究越来越复杂,可能会引入多个干扰因素。
通过协方差分析,可以发现自变量对因变量的影响是否显著,并且还可以刻画各个因素对研究结果的影响程度。
四、生存分析生存分析主要是针对生命活动中发生的事件,例如人类、动物生存时间等等。
在医疗领域,生存分析主要用来研究生存时间和死亡原因的相关性,预测某疾病的患者数量,以及病人存活时间的评估等。
卫生统计学名词解释

1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。
2、标准误:将样本统计量的标准差称为标准误。
3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。
4、u分布:若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,1 2),即u分布。
5、t分布:在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。
6、可信区间:是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。
其确切含义为:如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间。
7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。
然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
8、Ⅰ型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。
Ⅱ型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。
9、检验效能:1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。
10、变量转换:是指原始数据作某种函数转换,如转换为对数值等。
1、方差分析:又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。
2、单向方差分析(one way analysis of variance)是指处理因素只有一个。
这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。
3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)4、LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。
析因设计与统计分析

➢ 多因素多水平析因设计
如2×2×2设计,2×2×3设计,2×3×2×2 设计等
带区组因素的析因设计
资料仅供参考,不当之处,请联系改正。
析因设计类型
例1 缺铁性贫血病人的疗效观察。12例病人随机 分为4组,每组给予不同的治疗,一个月后, 检查各组病人的红细胞增加数x。
疗法
X
疗法1(一般疗法)
90 91 89
86 83 85
92 88 88
72 71 74
81 82 79
A2 80 83 81
89 88 87
76 77 78
86 89 88
A:原料种类;B:培养液种类; C:植物血凝素浓度 。
资料仅供参考,不当之处,请联系改正。
析因设计的特点
至少有2个处理因素,每个因素至少有2个水平; 各因素各水平下的全面组合; 每种组合条件下至少做2次独立重复试验; 试验实施时,所有因素是同时施加的; 分析时,各因素在专业上的地位是平等的。
广东四季豆(A1),湖南刀豆(A2)
培养液种类(B) 标准培养液(B1),199培养液(B2)
植物血凝素浓度(C) 2%(C1),3%(C2),5%(C3)
资料仅供参考,不当之处,请联系改正。
三种因素对淋巴细胞转化试验结果
B1
B2
C1 C2 C3 C1 C2 C3
70 73 76
80 82 79
A1 82 81 85
交互效应(interaction effect) 单独效应(simple effect) 主效应(main effect)
资料仅供参考,不当之处,请联系改正。
析因设计中的三种效应
2×2析因设计 例1 缺铁性贫血病人的疗效观察。
研究生医学统计学-随机区组设计与析因设计资料的方差分析

平均 a1-a2 0.156 0.060 0.132 0.034 0.144 0.047 0.024
单独效应是指其他因素水平固定时,同一因素不同水平的效应之差 主效应是指某一因素单独效应的平均值。 交互作用是指两个或多个因素间的效应互不独立的情形。如果A因 素的水平变化时,B因素的单独效应也发生变化,则认为AB两个因 素存在交互作用。
2
表 9-1 区 组 (j)
三 种 营 养 素 喂 养 四 周 后 各 小 鼠 所 增 体 重 (g) 营 养 素 分 组 (i) 1(A) 2(B) 64.8 66.6 69.5 61.1 91.8 51.8 69.2 48.6 8 523.4 65.3 35459.1 3(C) 76.0 74.5 76.5 86.6 94.7 43.2 61.1 54.4 8 567.0 70.9 42205.0 按区组求 和
SS总 Yij2 C 110447.5 1591.12 / 24 4964.21
i 1 j 1
n
a
n
SS处理
i 1
a
( Yij )
j 1
2
n
n
1 C (500.7 2 523.42 567.02 ) 1591.12 / 24 283.83 8
2
(3)
(4)
(5) 误差变异:SS SS SS SS SS A B AB 总 误差
1 ba n 处理因素B的变异: SSB Y ijk C a n j 1 i 1 k 1 2 a b n 1 A与B交互作用的变异:SS Y AB ijk C SS A SS B n i 1 j 1 k 1