第9章方差分析思考与练习带答案

第9章方差分析思考与练习带答案
第9章方差分析思考与练习带答案

第九章方差分析

【思考与练习】

一、思考题

1. 方差分析的基本思想及其应用条件是什么

2. 在完全随机设计方差分析中SS SS SS

、、各表示什么含义

总组间组内

3. 什么是交互效应请举例说明。

4. 重复测量资料具有何种特点

5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较

二、最佳选择题

1. 方差分析的基本思想为

A. 组间均方大于组内均方

B. 误差均方必然小于组间均方

C. 总变异及其自由度按设计可以分解成几种不同来源

D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著

E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著

3. 完全随机设计的方差分析中,下列式子正确的是

4. 总的方差分析结果有P<,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等

5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为 A. kb k b -- B. 1kb k b --- C. 2kb k b --- D. 1kb k b --+ E. 2kb k b --+

6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差

D. SS SS SS SS =++B A 总误差

E. SS SS SS SS SS =+++B A AB 总误差

7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析 B. 随机区组设计的方差分析 C. 完全随机设计的方差分析

D. 重复测量设计的方差分析

E. 两阶段交叉设计的方差分析

8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是 A. 39 B. 36 C. 26 D. 9 E. 3

9. 采用单因素方差分析比较五个总体均数得0.05P <,若需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是 A. Z 检验 B. t 检验

C. Dunnett –t 检验

D. SNK –q 检验

E. Levene 检验

三、综合分析题

1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A 低剂量,一般疗法+药物A 高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。问三种治疗方案有无差异

表9-1 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102

/L)

编号一般疗法一般疗法+A1一般疗法+A2

1

2

3

4

5

6

7

8

9

10

11

12

2. 在药物敏感试验中,欲比较三种弥散法的抑菌效果,每种方法均采用三种药物,观察其抑菌效果,以抑菌环的直径为观察指标,结果如表9-2所示,试比较三种方法的抑菌效果。

表9-2 三种药物在不同弥散法下的抑菌效果(mm)

药物

弥散法

纸片挖洞钢圈

黄芪

大黄

青霉素

3. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇的效果有无差别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表9-3所示,请问两种疗法降胆固醇效果有无差异。

表9-3 不同治疗方法下胆固醇变化情况(mmol/L)

编号

饮食治疗药物治疗

试验前试验后试验前试验后

1

2

3

4

5

6

7

4. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示。问这三个年级学生周日锻炼时间是否不同

表9-4 初中不同年级学生的锻炼时间(分)

一年级二年级三年级

经数据分析结果见下表:

表9-5 三个年级之间的t检验结果

组别t P

一年级和二年级

一年级和三年级

二年级和三年级

问:(1) 该资料采用的是何种统计分析方法

(2) 所使用的统计分析方法是否正确为什么

(3) 若不正确,可以采用何种正确的统计分析方法。请作分析

【习题解析】

一、思考题

1. 方差分析的基本思想是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,来判断总体均数间的差别是否具有统计学意义。应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本方差齐性。

是各观测值与总均值之差的平方和,即总离均差平方和,表示总变异的2. SS

大小;SS

表示组间变异,指各处理组均值大小的不同,是由处理因素和随机组间

表示组内变异,指同一处理组内部各观察值之间的变异,是误差造成的;SS

组内

由随机误差造成的。

3. 交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个因素之间存在交互效应。例如:某实验研究A、B两种药物在不同剂量情况下对某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。

4. 重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离得越近的数据相关性越高。

5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多

个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两间的差别,需进行多重比较。

二、最佳选择题

1. C

2. C

3. A

4. E

5. D

6. E

7. D

8. E

9. C

三、综合分析题

1. 解:本题采用完全随机设计的方差分析。

表9-6 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102

/L)

一般疗法

一般疗法+A1

一般疗法+A2

合计 X

i n

12 12

12 36 (n ) i X ∑ (X ∑) i X

2

i X ∑

(2

X ∑)

(1) 方差分析

1) 建立检验假设,确定检验水准

0H :123μμμ==,即三种方案治疗后缺铁性贫血患者红细胞升高数相同 1H :321μμμ、、不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高

数不全相同

α=

2) 计算检验统计量

22()/(54.84)/36=83.5396C X N ==∑

22()99.6494-83.5396=16.1098SS X X X C =-=-=∑∑总

136135N ν=-=-=总

22()=() i i i i SS n X X X C =--∑∑∑组间

2229.4316.6028.81()83.539616.0022121212

=++-=

1312k ν=-=-=组间

16.109816.00220.1076SS SS SS =-=-=总组内组间

33N k ν=-=组内 /= 2452.7216/MS SS v F MS SS v =

=

组间组间组间组内

组内组内

方差分析结果见表9-7。

表9-7 完全随机资料的方差分析表

3) 确定P 值,作出统计推断

查F 界值表(附表4)得P <,按α=水准,拒绝0H ,接受1H ,差别有统计学意义,可以认为三种不同方案治疗后患者红细胞升高数的总体均数不全相同。 (2) 用Dunnett-t 法进行多重比较。 1) 建立检验假设,确定检验水准

0H :任一实验组与对照组的总体均数相同 1H :任一实验组与对照组的总体均数不同 0.05α= 2) 计算检验统计量

0.0033e MS = 12312n n n ===

0.02T C X X S -===

表9-8 多个样本均数的Dunnett-t 检验计算表 对比组 (1)

均数差值 (2) 标准误 (3) D t

(4)

Dunnett -t 界值 P

一般疗法与一般疗法+A1 30 < 一般疗法与一般疗法+A2

81

<

3) 确定P 值,作出统计推断

将表9-8中D t 取绝对值,并以计算e MS 时的自由度 33e ν=和实验组数

a =k ?1=2(不含对照组)查Dunnett-t 界值表得P 值,列于表中。按α=水准,一般疗法+A1与一般疗法相比,疗效差别有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同。同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同

SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,group 表示组别 (1为一般疗法,2为一般疗法+药物A 低剂量,3为一般疗法+药物A 高剂量),x 表示患者红细胞的升高数(102/L);再点击Data View 标签,录入数据(见图9-1,图9-2)。

图9-1 Variable View 窗口内定义要输入的变量group 和x

图9-2 Data View窗口内录入数据

分析:

Analyze → Compare Means → one-Way ANOVA

Dependent List框:x

Factor框:group

Post Hoc…→ Equal Variances Assumed: Dunnett:Control Category:first Continue

Option... → Statistics: Homogeneity of Variances test

Continue

OK

输出结果

Test of Homogeneity of Variances

2

Levene

Statisti

c df1df2Sig.

.774233.469

ANOVA

2

Sum of

Squares df Mean Square F Sig.

Between Groups2.000

Within Groups.10833.003

Total35

Multiple Comparisons

Dependent Variable: 红细胞升高数(102/L)

a

a Dunnett t-tests treat one group as a control, and compare all other groups against

it.

2. 解:本题采用析因设计的方差分析。

表9-9 九种不同处理情况下抑菌环的直径(mm)

纸片弥散法1a 挖洞弥散法2a 钢圈弥散法3a

黄芪

1b

大黄2b

青霉素

3b

黄芪

1b

大黄

2b

青霉素

3b

黄芪

1b

大黄 2b

青霉素

3b

合 计

X

i n

4 4 4 4 4 4 4

4 4 36 i X ∑

A n

12 12 12 B n

12 12 12 A X ∑

B X ∑

(1) 建立检验假设,确定检验水准 因素A

0H :三种弥散方法抑菌环直径的总体均数相等 1H :三种弥散方法抑菌环直径的总体均数不全相等

因素B

0H :三种药物抑菌环直径的总体均数相等 1H :三种药物抑菌环直径的总体均数不全相等

AB 交互作用

0H :不同药物对三种弥散方法的抑菌效果无影响

1H :不同药物对三种弥散方法的抑菌效果有影响

α=

(2) 计算检验统计量

22()/(866.9)/3620875.4336C X N ===∑

221322.8320875.4336447.3964SS X C =-=-=∑总

136135N ν=-=-=总

22

2

2109.383.9119.7()= (++

+)-20875.4336=436.6339

44

4

i i SS X C =-∑∑处理

18k ν=-=处理

222

2

301.8287.4277.7()24.5072

121212

()20875.4336A A A SS X C =-++∑∑=-=

12A A ν-== 的水平数

24.507

12.25362

A

A A

SS MS ν=

=

= 222

2

293.3257.5316.1()()20875.4336145.4289

121212

B B B SS X n

C =-=++-=∑∑

1 =

2 B B ν= 的水平数-

145.4289

72.71452

B

B B

SS MS ν=

==

266.6978AB A B SS SS SS SS =--=处理

4AB A B νννν=--=处理

266.6978

66.67454

AB

AB AB

SS MS ν=

=

= 10.7625SS SS SS =-=处理总误差

36927N k ν=-=-=误差 10.7625

0.398627

SS MS ν==

=误差

误差误差

12.2536

30.74160.3986

A A MS F MS =

==误差

72.7145

182.42470.3986B B MS F MS =

==误差

66.6745

167.27170.3986

AB AB MS F MS =

==误差

方差分析结果见表9-10

表9-10 析因设计资料的方差分析表

变异来源 SS

ν

MS

F

P

总变异 35 处 理 8 A 2 < B 2 < AB 4 < 误 差

27

(3) 确定P 值,作出统计推断

根据ν,查F 界值表(附表4)得相应P 值。交互作用的F =,P <,按α=水准,拒绝0H ,接受1H ,差别有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用。这时,如要分析A 因素或B 因素的单独效应,应固定在A 因素的基线水平来分析B 因素的作用,或者固定在B 因素的基线水平来分析A 因素的作用。

SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,g1表示三种弥散方法(1为纸片,2为挖洞,3为钢圈),g2表示三种药物(1为黄芪,2为大黄,3为青霉素),x 表示抑菌效果(mm);点击Data View 标签,录入数据(见图9-3,图9-4)。

图9-3 Variable View窗口内定义要输入的变量g1、g2和x

图9-4 Data View窗口内录入数据

分析:

Analyze → General Linear Model → Univariate

Dependent List框:x

Fixed Factor框:g1、g2

OK

3. 解:本题可采用t检验分析,但最好采用重复测量资料的方差分析。因重复测量资料的方差分析计算量较大,故本题不给出笔算结果,仅提供SPSS软件分析结果。

(1) 建立检验假设,确定检验水准

处理因素K

H:饮食疗法和药物疗法降低胆固醇值的总体均数相同

H:饮食疗法和药物疗法降低胆固醇值的总体均数不相同

1

时间因素I

H:试验前后患者胆固醇值的总体均数相同

H:试验前后患者胆固醇值的总体均数不相同

1

交互作用KI

H:时间对两种方法降低胆固醇的效果无影响

H:时间对两种方法降低胆固醇的效果有影响

1

=

(2) 计算检验统计量

本例是最简单的重复测量设计,时间因素只有两个水平,可以用重复测量的方差分析进行计算,由于时间点只有两个水平,可以不考虑球形对称问题。列出方差分析表见表9-11:

表9-11 重复测量资料的方差分析表

ν 总变异 27 处理 1

个体间误差 12 时间 1 处理×时间 1 个体内误差

12

(3) 确定P 值,作出统计推断

时间因素和治疗方法之间的交互作用,F 值为, P 值为,按α=水准,不拒绝0H ,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对于时间因素,F 值为,P 值为,P <,按α=水准,拒绝0H ,接受1H ,差别有统计学意义,可以认为试验前后患者胆固醇的值不同;两种治疗方法的F 值为,P 值为,

P >,按α=水准,不拒绝0H ,差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差别。

SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,no 表示编号,g 表示分组(1为饮食疗法,2为药物疗法),t1表示实验前患者胆固醇的值(mmol/L),t2表示实验后患者胆固醇的值(mmol/L);击Data View 标签,录入数据(见图9-5,图9-6)。

图9-5 Variable View 窗口内定义要输入的变量no 、g 、t1和t2

图9-6 Data View窗口内录入数据

分析:

Analyze → General Linear Model → Repeated Measures

Within-Subject Factor name:改为t

Number of Levels:键入2 → Add

Define:

Within-Subjects Variables [t]:t1~t2

Between- Subjects Factor [s]:g

Model:→Custom

→ Within-Subjects Model:t

→ Between-Subjects Model:g

Continue

OK

输出结果

Mauchly's Test of Sphericity(b) Within

Subjects

Effect Mauchly's W

Approx.

Chi-Square df Sig.

Epsilon(a)

Greenhouse-G

eisser Huynh-Feldt Lower-bound

time.0000.

4. (1) 该资料采用的是两独立样本t检验作两两比较。

(2) 所使用的统计分析方法错误。欲比较三组均数是否两两不同,用两独立样

本t检验作多次比较,会增大犯I型错误的概率。

(3) 应当先采用完全随机设计方差分析,若分析结果拒绝H0,则进一步采用

SNK法作三组间的两两比较。

完全随机设计方差分析

1) 建立检验假设,确定检验水准

H:三个年级锻炼时间的总体均数相等

H:三个年级锻炼时间的总体均数不全相等,即至少有两个总体均数不等1

α=

2) 计算检验统计量

22

C X N

==

()/(2887.142)/60=138926.4821

22

=-=-=

()148914.9985-138926.4821=9988.5164 SS X X X C

∑∑

160159N ν=-=-=总

22()=() i i i i SS n X X X C =--∑∑∑组间

2221137.469911.241838.432()138926.48212431.7231202020

=++-=

1312k ν=-=-=组间

7556.7933SS SS SS =-=总组内组间

57N k ν=-=组内 /= 9.1711/MS SS v F MS SS v =

=

组间组间组间组内

组内组内

方差分析结果见表9-12。

表9-12 方差分析表

多个样本均数间比较见表9-13。

表9-13 SNK 检验计算表

对比组

A 与

B 两均数之差A B X X - 两均数之差 标准误 X X S -

q 对比组内

包含组数

a q 界值

P

1与3 3 < 1与2 2 < 2与3

2

>

3) 确定P 值,作出统计推断

方差分析结果P <,按α=水准,拒绝0H ,接受1H ,差别有统计学意义,可以认为三个年级锻炼时间的总体均数不全相等;多个均数间的两两比较的SNK 检验结果提示:可以认为一年级和二年级、一年级和三年级的锻炼时间不同;尚不能认为二年级和三年级的锻炼时间不同。

SPSS 操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,group表示组别 (1为一年级,2为二年级,3为三年级),x表示锻炼时间(分);再点击Data View标签,录入数据(见图9-7,图9-8)。

图9-7 Variable View窗口内定义要输入的变量x、g

图9-6 Data View窗口内录入数据

分析:

Analyze→Compare Means →ONEWAY-ANOVA

Dependent List框:锻炼时间(x)

Factor框:g

Post Hoc…→Equal Variances Assumed: S-N-K

Continue

Option...→Statistics: Homogeneity of Variances test Continue

OK

第九章 方差分析

第九章 方差分析(讲义) 第一节 方差分析的基本原理和步骤 思考: 1.如果想要分析A 总体和B 总体平均数的差异,可以用什么方法来检验? 2.如果想要分析A 、B 、C 三个总体平均数的差异,又该用什么方法来证明? 如果是两个总体,用Z 和t 检验。 那是不是三个总体A 、B 、C 的比较就是拿A 和B 做比较,然后那A 与C 做比较 然后再拿B 和C 做比较? 一、方差分析的基本原理:综合的F 检验 方差分析主要处理两个以上的平均数之间的差异检查问题,需要检验的虚无 假设就是“任何一对平均数”之间是否有显著性差异,因此虚无假设为,样本 所属的所有总体的平均数都相等。 一般把这个假设称为“综合虚无假设“,表达式为: 3210:μμμ==H 方差分析最关键的步骤就是变异的分解。 看一个例子9-1:不同噪音强度下解数学题犯错频次 图9-1 数据变异示意图 (一)数据变异文字层面上的分解 从数据可知:不仅组与组之间数据存在不同,而且同一组被试内部也存在着不同。 1.前者称组间变异,因听了不同的噪音而不同。 2.后者称组内变异,因个案本身的不同而造成的不同。 3.而每个数据之间的差异叫做总变异。 2 5 13 3 6 10 2 5 12 2 5 1 4 n=4 1 4 16 无(C ) 中(50)(B ) 强(100(A) K=3 噪音

可以知道:总变异=组间变异+组内变异 一般而言: 1.组间变异是我们想要的结果,即实验条件产生了作用才会令各组之间的数值存在差异。它越大越好! 2.组内变异不是我们研究的目的,但是需要分解它,借助它分析实验是否成功。组内变异其实是实验的误差。它越小越好! 3.问题来了:组间差异多大,组内差异多小才好? (二)数据变异的数学层面的分解 1.数学上如何表示变异? 总变异的数学意义是每一原始分数( )与总平均数( )的离差,记为: 组间变异的数学意义是每一组的平均数( )与总平均数的离差,记为: 组内变异的数学意义是每一组内部的原始分数与其组平均数( )的离差,记为: 2. 先看某一个数据的情况 分析可知,任一个数据( )与总平均数的差异等于他与本组平均数( )之差加上小组平均数与总平均数( )的差。即: 例如: 3.再看总变异的分解及计算 根据变异的可加性,任何一个原始分数都有: 2 67 .6=

第9章方差分析思考与练习-带答案

第九章方差分析 【思考与练习】 一、思考题 1. 方差分析的基本思想及其应用条件是什么? 2. 在完全随机设计方差分析中SS SS SS 、、各表示什么含义? 总组间组内 3. 什么是交互效应?请举例说明。 4. 重复测量资料具有何种特点? 5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较? 二、最佳选择题 1. 方差分析的基本思想为 A. 组间均方大于组内均方 B. 误差均方必然小于组间均方 C. 总变异及其自由度按设计可以分解成几种不同来源 D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著 E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著

3. 完全随机设计的方差分析中,下列式子正确的是 4. 总的方差分析结果有P<0.05,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等 5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为 A. kb k b -- B. 1kb k b --- C. 2kb k b --- D. 1kb k b --+ E. 2kb k b --+ 6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差 D. SS SS SS SS =++B A 总误差 E. SS SS SS SS SS =+++B A AB 总误差 7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析

第9章方差分析与回归分析习题答案

第九章 方差分析与回归分析习题参考答案 1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显著影响. (0.05(2,9) 4.26F =,0.01(2,9) 8.02F =) 34 2 11 1310ij i j x ===∑∑ 【 解 : r=3, 12 444n n 321=++=++=n n , T=120 ,120012 1202 2===n T C 3 4 2 21113101200110(1)1110110T ij T i j SS x C S n s ===-=-==-=?=∑∑或S 322.1112721200724(31)429724A i A A i SS T C S s ==-=-==-=??=∑或S 38 72110=-=-=A T e SS SS SS 计算统计值 722 8.53, 389 A A A e e SS f F SS f = =≈…… 方差分析表 方差来源 、 平方和 自由度 均方 F 值 临界值 显著性 品种A ~ 36 0.050.01(2,9) 4.26(2,9)8.02 F F == ** 误差 ] 总 计 结论:由于0.018.53(2,9)8.02, A F F ≈>=故果树品种对产量有特别显著影响. 品种 试验结果 行和??=i x T i 行均值.i x A 1 10 7 、 13 10 40 10 A 2 12 13 15 12 52 ? 13 A 3 8 4 7 9 28 7

2. ^ ..180x = 43 2 11 2804ij i j x ===∑∑ 解:22..4,3,12,180122700l m n lm C x n ======= 4 3 2 211 28042700104(1)119.45 T ij T i j S x C S n s ===-=-==-=?∑∑或 : 422 .1 12790270090(1)331090 3A i A A i S x C S m l s ==-=-==-≈??=∑或322 .1 12710.5270010.5(1)8 1.312510.5 4B j B B j S x C S l m s ==-=-==-≈?=∑或1049010.5 3.5 e T A B S S S S =--=--= 计算统计值 90310.52 51.43,93.56 3.56 A A B B A B e e e e S f S f F F S f S f = =≈==≈ 方差来源 平方和 自由度 F 值 临界值 显著性 推进器A 【 0.050.01(3,6) 4.76(3,6)9.78F F == 燃料B 0.050.01(2,6) 5.14 (2,6)10.92 F F == · 误差 总 计 结论: 由以上方差分析知,进器对火箭的射程有特别显著影响;燃料对火箭的射程有显著影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据: . 价格x i 1 2 3 4 4 ] 5 需求量y i 10 8 8 7 6 4 ^ 2 1 31,58,147,112,410.5,i i i i i i x y x y x y =====(1)求需求量Y 与价格x 之间 试验 结果 》 燃料B B 1 B 2 B 3 .i x .i x 推进器 A 《 A 1 14 13 12 39 13 A 2 18 16 ^ 14 48 16 A 3 13 12 11 36 12 A 4 20 18 19 57 19 .j x 65 59 % 56 180 .j x 14 15

第九章 方差分析

第九章方差分析 在生产过程和科学实验中,我们经常遇到这样的问题:影响产品产量、质量的因素很多.例如,在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在20世纪20年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面. 第一节单因素试验的方差分析 在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素.因素可分为两类,一类是人们可以控制的;一类是人们不能控制的.例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素,因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变,这样的试验称为单因素试验,如果多于一个因素在改变,就称为多因素试验. 本节通过实例来讨论单因素试验. 1.数学模型 例9.1某试验室对钢锭模进行选材试验.其方法是将试件加热到700℃后,投入到20℃的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好.试验结果如表9-1. 表9-1 试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异. 这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4水平单因素试验. 例9.2考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40℃,50℃, (90) 的水中分别进行4次试验.得到该种纤维在每次试验中的缩水率如表92.试问浸泡水的温度对缩水率有无显著的影响?

第九章 方差分析

第九章 方差分析 第一节 方差分析的基本原理及步骤 一、方差分析的基本原理 假设从一个实验中抽取了9名被试的学习成绩,如表9-1所示。随后又抽取了9名被试的学习成绩,如表9-2所示。你能从这些数据发现什么问题吗? 首先,从数据可知,不仅组与组之间存在不同,而且同一组内部也存在着不同。前者称组间变异,后者称组内变异。 其次,从组间变异看,表9-1组间变异大于表9-2。 表9-1 第1次抽取结果 表9-2 第2次抽取结果 方法 学生实验成绩 X t X 方法 学生实验成绩 X t X A 6 5 7 6 A 1 7 4 4 B 11 9 10 10 7 B 6 2 8 6 5 C 5 4 6 5 C 3 6 5 5 再次,从看组内变异看,表9-1比 9-2差异小。 综上所述,表10-1组间变异较大而组内变异较小,表10-2组间变异较小而组内变异较大,组间变异大小与组内变异大小并非正比关系。这表明,若组间变异与组内变异的比率越大,各组平均数的差异越大。因此,通过组间变异和组内变异比率大小来推论几个相应平均数差异显著性的思想就是方差分析的逻辑依据或基本原理。所以说,方差分析是将实验中的总变异分解为组间变异和组内变异,并通过组间变异和组内变异比率的比较来确定影响实验结果因素的数学方法,其实质是以方差来表示变异的程度。 总变异 组间变异 实验条件 随机误差 组内变异 个体差异 随机误差 实验误差 图10-1 总变异的分解图 二、方差分析的基本过程 (一)综合虚无假设与部分虚无假设 方差分析主要处理多于两个的平均数之间的差异检验问题,需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异。 综合虚无假设:样本所归属的所有总体的平均数都相等 备择假设:至少有两个总体的平均数不相等

第九章-方差分析

第9章方差分析 (Analysis of Variance) 方差分析是指把一种数据的总偏差分解为若干种成分的方法。与其中每一种成分相联系的是某一特殊偏差的来源。通过分析有可能确定每一种偏差来源对总偏差的贡献大小,即在众多的影响因素中,有些影响作用大一些,有些则小些。在现实经济生活中常常需要分析哪几种因素的影响显著,方差分析是解决这一问题的唯一有效的方法。在第八章曾经讨论过两个总体的平均数是否相等的显著性检验问题,但对2个以上的多个总体的平均数是否相等的问题,前面介绍的检验方法无法解决。对这些问题我们采用方差分析来解决。 9.1 单因子方差分析

单因子方差分析是分析一个因子的不同水平对总体的影响的方法。 比如某企业为了推销空调,做了四种不同内容的宣传广告。广告1:强调价格便宜。广告2:强调质量可靠。广告3:强调节能。广告4:强调免费安装和保修。在这个问题中广告是所要检验的因素,四个不同内容的广告可看作是该因素的四个不同的水准的试验。如果以上四种广告内容的宣传对空调销售量的影响没有显著性差异,则从四种广告中任选一种比较经济的广告即可。但是,如果这四种广告对空调销售量的影响有显著性差异,则必须选择对空调的销售量更为有利的方案。 9.1.1 单因子方差分析的资料结构

单因子方差分析是只分析一个因子的不同水平对总体影响的单纯的试验计划法。单因子方差分析至少要对两个水平以上的效果进行比较分析,检验的因子可记作A 。前面所述的四种广告为四个水平,可分别记作4 321,,,A A A A 。每个水平的观测值可以用ij Y 表示。在方 差分析中,当涉及到的因子只有一个时,称为单因子方差分析;涉及的因子有两个时称为双因子方差分析;涉及的因子有两个以上的方差分析,称作多因子方差分析。它具有两个特点; ①各水平的观测值个数不一定相等。 ②各组观测数据必须是,从具有相同方差的相互独立的总体中随机抽样的样本。单因子方差分析的资料结构如 表9-11)。 (表9-1)单因子方差分析的资料结 构 1)因为每一个观测值的个数不一定相等,所以其观测值数不能用n 表示。为了便于区别通常用n j 表示。

相关文档
最新文档