MPH多因素分析方法简介

合集下载

多因素分析

多因素分析

多因素分析研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。

主要包括:多元线性回归(multiple linear regression )判别分析(disoriminant analysis )聚类分析(cluster analysis )主成分分析(principal component analysis )因子分析(factor analysis )典型相关(canonical correlation )logistic 回归(logistic regression )Cox 回归(COX regression )1、 多元回归分析(multiple linear regression )回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。

研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。

函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。

全模型法其数学模型为:εββββ++++=p p x x x y 22110式中 y 为因变量, p x x x 21, 为p 个自变量,0β为常数项,p βββ 21,为待定参数,称为偏回归系数(partial regression coefficient )。

p βββ 21,表示在其它自变量固定不变的情况下,自变量X i 每改变一个单位时,单独引起因变量Y 的平均改变量。

ε为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分例如:1、现有20名糖尿病病人的血糖(Lm m o ly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2μ)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。

逐步回归分析(stepwise regression analysis)在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。

统计学中的多元分析方法

统计学中的多元分析方法

统计学中的多元分析方法在统计学中,多元分析方法是一种重要的数据分析技术。

它可以帮助我们理解和解释多个变量之间的关系,从而为决策制定提供有益的信息和见解。

本文将介绍多元分析方法的基本概念、常见的多元分析技术及其应用领域。

一、多元分析方法概述多元分析方法是一种统计技术,旨在研究多个变量之间的关联关系。

与单变量分析方法相比,多元分析方法可以同时考虑多个变量,帮助我们揭示变量之间的相互作用和依赖关系。

通过多元分析,我们可以发现变量之间的模式、趋势和关联程度,从而更全面地理解数据。

多元分析方法的应用范围广泛,包括但不限于以下几个方面:1. 描述分析:通过多元分析,我们可以对数据进行描述性分析,了解变量之间的相互关系以及各个变量的分布情况。

2. 因果分析:多元分析可以帮助我们确定变量之间的因果关系,找出对某一特定变量影响最大的因素,从而作出科学可靠的结论。

3. 预测分析:通过建立统计模型,多元分析可以预测未来事件的发展趋势,帮助我们做出合理的决策。

二、常见的多元分析技术在多元分析领域,有多种常见的分析技术可供选择,每种技术都有其特定的用途和适用条件。

下面介绍几种常见的多元分析技术。

1. 主成分分析(Principal Component Analysis,PCA)主成分分析是一种降维技术,它通过线性变换将原始变量转化为一组互不相关的主成分。

主成分分析能够帮助我们减少数据的维度,提取出最重要的特征,并保留原始数据的一部分信息。

主成分分析在数据压缩和特征提取等领域具有广泛的应用。

2. 因子分析(Factor Analysis)因子分析是一种用于探索变量之间关系的统计技术。

它基于变量之间的协方差矩阵,将原始变量转化为一组由因子构成的新变量。

因子分析能够帮助我们发现潜在的构成维度和相互关联的变量,从而简化分析过程并提供更深入的理解。

3. 判别分析(Discriminant Analysis)判别分析是一种用于分类问题的统计技术。

全国联考在职公共卫生硕士(MPH)公共卫生综合-试卷1

全国联考在职公共卫生硕士(MPH)公共卫生综合-试卷1

全国联考在职公共卫生硕士(MPH)公共卫生综合-试卷1(总分:84.00,做题时间:90分钟)一、单项选择题(总题数:20,分数:40.00)1.以下对于样本量的叙述正确的是( )。

A.样本量宜大不宜小B.样本量是否足够大C.样本量足量就好√D.样本量大小由调查可行性决定E.样本量估计不能采用经验法决定样本量大小的因素来自多个方面,但其主要是预期现患率;对调查结果精确性的要求:容许误差越大,所需样本量就越小;要求的显著性水平,显著性水平要求越高,样本量要求越大,故A、B、D错。

样本量的估计可以采用经验法,故E错。

2.下列有关队列研究的叙述中错误的是( )。

A.属于分析性研究B.暴露与疾病在时间上必须是前瞻性的C.一般需要计算人年D.随访期间还需要继续收集有关暴露的资料E.观察终点就是观察终止时间√观察终点就是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。

观察终止时间是指整个研究工作截止的时间。

两者不是一个概念。

3.美国Framingham心血管研究中,男性队列中发现高胆固醇水平患冠心病OR=2.4(有显著意义),而在病例对照研究中高胆固醇的OR=1.6(无统计学显著意义)。

分析其原因是患冠心病者诊断后改变了不良生活习惯。

引起两种方法之间差异的偏倚为( )。

A.检出偏倚B.易感性偏倚C.奈曼偏倚√D.伯克森偏倚E.排除偏倚奈曼偏倚:另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差。

4.以实验室为基础的监测系统是( )。

A.法定传染病报告系统B.出生缺陷监测系统C.疾病监测点监测系统D.医院内感染监测系统E.流行性感冒监测系统√以实验室为基础的监测系统,此类系统主要利用实验室方法对病原体或其他致病因素开展监测。

例如,我国的流行性感冒监测系统,它不但开展常规的流感病毒的分离工作,而且有信息的上报、流通和反馈制度。

流行病学常用多因素回归统计分析

流行病学常用多因素回归统计分析

流行病学常用多因素回归统计分析流行病学中常常使用多因素回归模型来分析和解释疾病的发病风险及其与不同危险因素之间的关系。

多因素回归分析是一种统计方法,可以探究多个危险因素对疾病的影响,同时考虑其他潜在影响因素的调整。

多因素回归分析可以用来识别和评估与疾病相关的危险因素,同时控制其他潜在危险因素的影响。

它可以提供关于各个危险因素对疾病贡献的估计值,并确定其统计显著性。

在进行多因素回归分析之前,需要进行数据收集和整理。

一般来说,多因素回归分析需要考虑以下几个步骤:1.变量选择:根据研究的目的和疾病的特点,选择与疾病相关的变量。

这些变量可以包括患者的基本特征(如年龄、性别)、生活方式(如饮食、运动)和环境因素(如空气污染、水质)等。

2.数据收集和整理:收集相关的数据,并进行数据清洗和整理。

确保数据的准确性和完整性。

3.建立回归模型:根据研究的目的和变量的特征,选择合适的回归模型。

常用的回归模型包括线性回归模型、逻辑回归模型等。

4.模型拟合:将收集到的数据应用到回归模型中,进行参数估计和模型拟合。

拟合后可以得到危险因素的估计系数、标准误差、置信区间和P值等。

5.结果解释:根据模型拟合的结果,评估每个危险因素对疾病的影响,并进行解释。

可以根据估计系数和其置信区间来判断危险因素的显著性和贡献。

6.效应调整:对于其他可能的潜在影响因素,可以进行调整处理,检验危险因素对疾病的独立贡献。

调整常用的方法包括多元回归、对匹配等。

7.结果报告:根据分析结果,撰写分析报告,并对结果进行解释和讨论。

多因素回归分析在流行病学中的应用非常广泛。

它可以帮助科研人员确定疾病的风险因素,为预防和控制疾病提供科学依据。

通过多因素回归分析,可以了解各个危险因素之间的相互作用关系,为制定有效的公共卫生政策和预防措施提供指导。

总之,多因素回归分析是流行病学中常用的统计分析方法,可以评估和解释疾病的发病风险及其与多个危险因素之间的关系。

它在流行病学研究和公共卫生实践中具有重要的应用价值。

MPH流行病学绪论课件

MPH流行病学绪论课件
l 宽街水井边有阴沟,附近有一40号住宅,曾 有过4名霍乱患者,患者排泄物可能随阴沟 水等污染井水
l SNOW的推论:”霍乱患者的粪便含有能繁 殖的’病毒’,霍乱在人群中的传播途径主 要是被患者粪便污染的水源”,而霍乱病原 体霍乱弧菌是39年后才发现的
•20
美国弗莱明汉地区高血压研究 l 弗莱明汉小镇被美国DHHS选为心血管病
(三) 理论流行病学
l 掌握疾病的流行规律,可用数学公式归纳 疾病在人群中的流行规律,将疾病流行过 程,抽象化和数学化,称为理论流行病学
l 流行病学方法学研究
•5
三、流行病学研究的范围(1)
l 描述和研究疾病、伤害或健康的 –分布
l 探讨疾病的病因和影响因素 –因素
•6
宿主
病因
环境
流行病学三角
l 他获知上述地区从8月27日至9月2日止,共有89 例霍乱死亡登记,其中6例发生在8月27日至30日 内,4例发生于8月31日,其余79例发生于9月1日和 2日. 因此,他认为这次霍乱暴发是从8月31日开始 的
l 他对8月31日至9月2日3天内的83例死亡病例作 了详细的调查. 发现几乎所有的病例都发生于离 宽街水井不远的地方,其中只有10例住在其他水 井附近
l 注意收集反面证据:附近一工厂有535名工人,但 只有5人发病死亡,调查发现该厂用自来水并有自 备水井; 附近一酒厂有70名工人,无病例,因该厂饮 用河水并有自备井
•19
JOHN SNOW(1813-1858)关于 霍乱流行的调查
l SNOW首创了标点地图分析方法
l 9月8日地方当局根据他的建议封闭了该供 水站,此后病例显著减少
二、流行病学的定义与研究方法
定义: ----流行病学(Epidemiology)是研究人群中疾病

6多因素分析方法及其应用

6多因素分析方法及其应用
2、 回归方程的检验、评价指标。
如方差分析思路,Q、U、R2意义。
3、 “最优”回归方程的含义。 4、 逐步回归的基本思想、用途、注意事项。
4
(二) 相关分析 简单相关、偏相关、复相关的概念和 用途。 (三) 判别分析 1、判别分析的概念、方法和类型。 2、Fisher原则、基本方法和应用注意 事项。 3、Fisher判别与Bayes判别的关系。
数值(定量)变量、无序分类、有序分类变量
2、定量变量转换为分类变量 如体重
9
3、无序分类变量转换为定量变量
如性别
1 女 x 0 男
取值为0、1的变量为两分变量。 若类别数为m,可用m-1个两分变量x1、x2、…、 xm-1量化,如血型:
1 x1 0 1 x3 0 O型 非O 型
11
B型 非B型
10
1 A型 x2 0 非A型
x1=x2=x3=0时为AB型
4、有序分类变量转换为定量变量。
如疗效:全愈 量化 x = 3 有效 2 无效 1 死亡 0
(四) 各种方法的结合应用 1、同一个问题可以用不同的多元分析方法 解, 可多个方法比较其结果,择优者。 2、多种方法结合解决研究的问题。
(二) 收集整理资料 通过调查或实验收集资料。 定性指标量化,定量指标标准化,同趋势化, 异常值等。 建数据文件。
7
(三) 数据处理 用软件处理数据文件,得分析结果。 (四) 结果检验、评价 1、统计检验: F、t、p。 2、统计评价: 拟合优度如R2,内、外考核符合率等。 3、专业评价: 是否与专业知识相符,达到专业要求。 找出发生问题的原因:
多因素分析方法及其应用
1
一、多因素分析的概念及其方法类型

病例对照MPH


允许的假阴性错误的概率。
22
(二) 用公式计算样本量 1 、病例组和对照组人数相等但不配比和成组配 比的样本量估计法
N:病例组或对照组人数; uα 和uβ:分别为α和 β 时正态分布百分位数; n 2 pq (U U ) /(P P ) P0 和 P1:分别为对照组与病例组的某因素的估 计暴露率;
41
(2)显著性检验,采用McNemar 公式计 2 算: (b c ) 2 (b c )
(3)计算比值比OR,其专用公式为: OR= c/b (4)计算比值比的可信限 ) ORL,ORU =OR (1 u /
2
42
例如1976年Mack等报告的在洛杉机所做的外源性 雌激素与子宫内膜癌关系的病例对照研究
2
7.70 2 6.63, 本例 2 7.70 6.63, 则p 0.01 0.01 (1)
结论为不能拒绝无效假设,即两组暴露率有统计学显著差异。
2、 3、
暴露与疾病的联系强度OR:OR=ad/b分析 分析步骤与成组资料相同,整理和计算 要使用专用公式。 (1)将资料整理成四格表如下: 1:1配比病例对照研究资料整理表 病 例 对 照 有暴露史 无暴露史 对子 数 有暴露史 a b a +b 无暴露史 c d c +d 合 计 a+c b+d a+b+c+d=N
( 1 )采用与病例相同的诊断标准,明确 排除的非患者; ( 2 )与规定的病例的人口学特征和其它 外部特征相似。
19
4.对照的来源
(1)从医院的其他病人中选择对照 ;
(2)可以从病例的邻居、社会团体人群中
非研究疾病的病人或健康人、以及病例 的配偶或同胞亲友中选择对照; (3)同时选择两种对照,即从一般人口中 选择对照,又自住院病人中选择对照。

MPH 流行病学 复习提纲精选版

1、流行病学:是研究人群中疾病与健康状况的分布及其影响因素,并研究防制疾病及促进健康的策略和措施的科学。

2、疾病分布:疾病的分布即疾病的人群现象.是指疾病在不同时间、不同地区和不同人群中存在和发生的情况。

3、横断面分析:对一个时间段或若干个时间段不同年龄组的人群患病率、发病率、死亡率的不同分布进行观察和分析,借以说明病因在各年龄组中随时间的变迁、作用的强弱、以及疾病防治措施的效果。

4、出生队列分析:将同一时期出生的人划归一组称为出生队列,可对其随访若干年,以观察死亡情况。

5、地方病:由于某地区的自然环境特点,使得该地区人群经常发生某些疾病称为地方性疾病,也称地方病。

判断一种疾病是否属于地方性疾病的依据是:(1)该地区的各类居民,任何民族发病率均高。

(2)在其他地区居住的相似人群中该病的发病率均低,甚至不发病。

(3)迁入该地区的人经过一段时间后,其发病率和当地居民一致。

(4)人群迁出该地区后,发病率下降或患病症状减轻或自愈。

(5)除人之外,当地的易感动物也可发生同样的疾病。

6、移民流行病学就是一个综合描述的典型。

所谓移民是指由原来居住地区迁移到其他地区,包括国外或国内不同省、市、自治区的现象。

移民流行病学是对移民人群的疾病分布进行研究,以探讨病因。

它是通过观察疾病在移民、移民国当地居民及原居地人群间的发病率、死亡率的差异,来探讨病因线索,区分遗传因素或环境因素作用的大小。

移民流行病学方法常用于肿瘤、慢性病和某些遗传病的研究。

移民流行病学研究应遵循下面的原则:(1)如果主要是环境因素引起的发病率和死亡率的差别,则移民中该病的发病率及死亡率与原居地人的发病率或死亡率不同,而与移居地当地居民人群的发病率及死亡率接近。

(2)如果是遗传因素主要对发病率及死亡率起作用,则移民的发病率及死亡率不同于移居地,而与原居地人群的频率相同。

7、死亡率是指某人群在一定期间内、在一定人群中,总死亡人数与该人群同期平均人口数之比。

MPH社会医学研究方法

疾病统计等资料。 统计年报、调查报告、记录、
案卷等资料。 有关期刊、杂志、报纸、通讯、
专著等资料。
注意: 文献研究的主观性和文献的质量。
5. 德尔菲法(Delphi)
是20世纪60年代初美国兰德公司的专家们为避免集 体讨论存在的屈从于权威或盲目服从多数的缺陷提 出的一种定性预测方法。
在社会卫生政策、卫生计划、卫生措施及所产生效 果的综合评价中,评价指标的选择,各指标的权重 确定等越来越多地采用德尔菲法。
三、定性研究方法
常用的定性研究方法有: 观察法(observation) 深入访谈法(in-depth interview) 专题小组讨论(focus group discussion) 选题小组讨论(nominal group discussion )等.
常用的定性研究方法
1. 观察法:是指通过对事件或研究对象的 行为进行直接的观察来收集数据,是收集 非语言行为资料的主要方法。
其因素是客观存在的。
调查研究
按调查的时间,一般分为三类: (1)现况调查 :指在特定的时点或时期
内,对人群的健康状况、卫生服务状况、 健康危险因素等进行调查研究。
社会医学研究方法
(2)回顾调查研究:是调查过去一定时期内人群 的健康状况、危险因素、生活事件等。是由果到因 的研究方法。
(3)前瞻调查研究:是由因到果的调查研究方法, 是将某一可疑致病因素是否与某病的发生有联系所 进行的追踪调查。
(二)制定研究方案
内容包括3方面:技术路线、实施计划、 资料整理与分析计划。
技术路线是对研究方案做出的统筹安排, 使研究按计划、分步骤、有条不紊地进 行,以保证课题科学、经济、可行。
山西省人口结构、预期寿命及影响因素研究

第15-17章 多因素分析(统计学)


Model
B Std. Error
1
(Constant)
5.943 2.829
总胆固醇x1
.142
.366
甘油三脂x2
.351
.204
胰岛素x3
-.271
.121
糖化血红蛋白x4 .638
.243
Beta
.078 .309 -.339 .398
t 2.101
.390 1.721 -2.229 2.623
序进行检验,直到余下的偏回归系数都具有统计意义
为止。最后得到最优方程。
.
10
例15-1(P.262) 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中 ,试建立血糖与其它几项指标关系的多元线性回归方程。
序号i
1 2 3 … 26 27
表15-2 27名糖尿病人的血糖及有关变量的测量结果
结果有显著性 表明至少有一个自变量与应变量之间存在线性回归关系。
H0:β1=β2=…=βm= 0 H1:β1、β2、…βm不等于0或不全等于0
.
13
ANOVbA
Model
Sum of SquaresdfMean SquareF Sig.
1
R eg re ssion1 33 .71 1
4 33.428 8.278 .000a
.
5
由样本估计而得的多元回归方程:
Y ˆ b 0 b 1 X 1 b 2 X 2 b m X m
Yˆ 为y的估计值或预测值(predicted value); b0为回归方程的常数项(constant),表示各自变量均为0时y 的估计值;
b1、b2、bm为偏回归系数(Partial regression coefficient) 意义:如 b1 表示在X2、X3 …… Xm固定条件下,X1 每增
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多因素(多变量数据)的统计分析介绍一、多因素分析1.研究问题的需要:同时考虑多个因素2.控制混杂因素二、单因素分析与多因素分析的关系1.单因素分析往往需要依据良好的实验设计,组间均衡可比。

但也因此限制了结论的泛化。

2.多因素分析有时是研究工作的需要:⏹因为对于一些问题需要多个指标来反映;⏹有时候在设计阶段无法通过设计来平衡混杂因素,需要采用多因素的分析方法来加以控制或调整。

3.方法选择时要紧密结合专业和研究问题,选择合适的统计方法,以清晰的说明问题为准绳。

4.多因素分析时,专业知识、背景信息以及研究问题本身是至关重要的。

三、常用的多因素分析方法1.析因、正交、协方差和重复测量(多因素ANOVA)2.多元线性回归分析3.非条件Logistic回归分析4.主成分析5.判别分析6.聚类分析7.主成分分析与因子分析四、常用的模型1.广义线性模型(general liner model)单反应变量(univariate)/ 多反应变量(multivariate)/ 重复测量(repeated measures)(基于方差分析)2.回归分析(线性回归,Logistic回归,Cox回归)3.生存分析(survival)4.聚类分析(classify)等五、多变量数据类型1.观察对象同时记录多个反应变量2.观察对象记录一个反应变量和多个解释变量例1:不同组生长发育情况第一组第二组编号身高体重编号身高体重1 184.9 85 1 168.7 622 167.9 65 2 170.8 613 171 70 3 165 504 171 69 4 169.7 555 188 87 5 171.5 666 179 80 6 166.5 527 177 66 7 165 538 179.5 82 8 165 549 187 84 9 173 6410 187 88 10 169 6611 169 65 11 173.8 6412 188 86 12 174 6513 176.7 70 13 170.5 6614 179 77 14 176 6915 183 81 15 169.5 6116 180.5 83 16 176.3 6817 179 79 17 163 5218 178 80 18 172.5 5919 164 65 19 177 6420 174 83 20 173 65在这种情况下同时分析多个反应变量,它们要共同说明某个研究问题,如生长发育,某个健康状态(血脂)等西安交通大学医学院MPH《医学统计学》例2:儿童生长发育与其他相关因素的数据Database from the survey in Tibet on nutritional status of younger children,1999A B C D E F G .. .. .. .. .. .. Height Weight H I .. .. .. .. 日喀则拉孜查务杰地11101普拉08/16/200511..1655444.39.78313.8111日喀则拉孜查务杰地11102琼拉08/16/20051105/16/1972015363.250.812.482.59.212.71日喀则拉孜查务杰地11103卓嘎08/16/20051103/08/1975014554.148.2 6.75711.210.81日喀则拉孜查务杰地11104达瓦08/16/20051108/03/196901636860.17.95811.5101日喀则拉孜查务杰地11105德吉08/16/20051105/15/1980016266.653.513.18512.413.31日喀则拉孜查务杰地11106边巴08/16/20051109/12/1972015658.853.1 5.853.513.811.81日喀则拉孜查务杰地11107搭拉08/16/20051102/08/1974015870.860.8107311.610.31日喀则拉孜查务杰地11108次忘记拉08/16/20051109/13/1970016371.860.211.67912.111.41日喀则拉孜查务杰地11109拉拉08/16/20051111/09/198101524839.68.47311.98.41日喀则拉孜查务杰地11110普间08/16/20051109/13/1981015667.756.511.28510.39.51日喀则拉孜查务查武11201次仁08/16/20051102/17/1967016568.561.7 6.86310.313.51日喀则拉孜查务查武11202达娃08/16/20053108/13/19802...13.491..1日喀则拉孜查务查武11203索朗拉姆08/16/20051105/15/1977016075.160.414.7927.411.91日喀则拉孜查务查武11204曲吉08/16/20051102/13/1979016160.550.310.2779.39.71日喀则拉孜查务查武11205索朗卓拉08/16/20051105/15/198101655646107313.411.91.. ..在这种情况下常是来研究危险或相关因素,即影响反应变量的因素等。

如影响儿童生长发育的危险或积极因素例3 在控制多个影响因素(危险因素)的条件下,分析某个因素对反应变量的影响。

High altitude and early childhood growth retardation: new evidence from Tibet第一部分多因素试验设计的方差分析多因素试验:多个处理因素,同时可能有多个水平,或有其他的控制变量,如协变量、配伍因素等。

析因试验各因素各水平间的全面组合,要分析各因素的独立作用和各因素间的交互作用。

有时是寻找最佳组合。

变异分解如下:SS T= SS A+ SS B +SS AB +SS EMS A= SS A/ SS EMS B= SS B/ SS EMS AB= SS AB/ SS EνSS MS F PT SS TA SS A MS AB SS B MS BAB SS AB MS ABE SS E1.2×2析因试验2.2×3析因试验3.利用广义线性模型中UNIVARIATE进行方差分析。

例:为了研究药物治疗附加磁场对人体内磁性物质分布的影响,安排两个药物组:实验组为“丝裂霉素+高分子物质+磁性物质+磁场”,对照组为“丝裂霉素+高分子物质+磁性物质”。

每组分别于给药后15分钟和60分钟处死实验小鼠,检测小鼠肝脏组织的磁性物质浓度,即铁浓度(mg/g)。

2×2平衡设计一个因素是药物,有2个水平,即实验组(A1)和对照组(A2);一个因素为给药后时间,有2个水平,即15min(B1)和60min(B2)。

两个因素形成有4种组合,每种组合重复例数为6。

将24只小鼠随机分配到4个组合组。

小鼠肝脏组织的铁浓度(mg/g)检测结果实验组(A1)对照组(A2)15min(B1)60min(B2)15min(B1)60min(B2)0.554 1.015 0.337 0.5030.550 1.005 0.276 0.6120.578 1.071 0.313 0.5930.706 1.106 0.387 0.6040.686 1.155 0.431 0.6400.651 1.145 0.362 0.560资料各因素和水平的合计和均数A1A2合计B1 3.725(0.621) 2.106(0.351) 5.831(0.486)B2 6.497(1.083) 3.512(0.585) 10.009(0.834)合计10.222(0.852) 5.618(0.468) 15.840(0.660)方差分析结果变异来源SS df MS F PA 0.8832 1 0.8832 252.34 <0.01B 0.7273 1 0.7273 207.80 <0.01A×B 0.0778 1 0.0778 22.23 <0.01误差0.0707 20 0.0035总 1.7590 23无论是主效应,还是交互效应,均拒绝H0,接受H1,即A因素的两个水平间、B 因素的两个水平间均有显著差异,A、B因素间存在交互效应。

正交试验各因素间各水平的非全面组合,主要分析的是有意义的主效应和部分重要因素的交互作用,特别是一阶交互作用。

该试验的优点就是减少试验次数,但同时也就牺牲了分析各因素间的部分交互作用。

步骤如下:1.根据研究目的确定正交表,安排试验因素:L8(27)2.以至少一列空列(或利用重复)估计误差进行方差分析。

L8(27)3. 广义线性模型时要在MODEL模块中定义CUSTOM,即关心的主效应和部分交互作用,否则将是默认的全面组合。

例:某研究者以大白鼠做试验,观察指标为细胞色素,想了解正氟醚(因素A)的作用,同时要看用生理盐水和用戊巴比妥作为诱导剂(因素B)对正氟醚的图形作用有何影响,以及不同诱导剂对不同性别(因素C)大白鼠有何作用。

L8(27)正交表和试验安排试验号 A B A×B C A×C 空列空列细胞色素1 1 1 1 1 1 1 1 0.662 1 1 1 2 2 2 2 0.233 1 2 2 1 1 2 2 0.114 1 2 2 2 2 1 1 0.135 2 1 2 1 2 1 2 0.646 2 1 2 2 1 2 1 0.957 2 2 1 1 2 2 1 0.158 2 2 1 2 1 1 2 0.12SS T= SS A+ SS B +SS AB +SS C +SS AC +SS E协方差分析有混杂因素(协变量)影响着组见的比较,利用线性回归模型调整协变量的影响,调整组见协变量保持一致后比较组间均数(修正或调整均数)。

步骤:1.专业上观察可能的协变量,估计为线性关系。

2.利用广义线性模型中UNIVARIATE进行方差分析。

分析时将协变量放在COVARIATE中(此项放连续性变量),当有多个因素时要考虑MODEL模块中重新定义CUSTOM。

运动员大学生身高肺活量身高肺活量184.9 4300 168.7 3450167.9 3850 170.8 4100171 4100 165 3800171 4300 169.7 3300188 4800 171.5 3450179 4000 166.5 3250177 5400 165 3600179.5 4000 165 3200187 4800 173 3950187 4800 169 4000169 4500 173.8 4150188 4780 174 3450176.7 3700 170.5 3250179 5250 176 4100183 4250 169.5 3650180.5 4800 176.3 3950179 5000 163 3500178 3700 172.5 3900164 3600 177 3450174 4050 173 3850重复测量不同组的研究对象在不同时间点上重复测量,如治疗前后,多次重复测量等。

相关文档
最新文档