统计学教案习题05方差分析

统计学教案习题05方差分析
统计学教案习题05方差分析

第五章 方差分析

一、教学大纲要求

(一)掌握内容 1.方差分析基本思想

(1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设和F 值的意义。 (3) 方差分析的使用条件。 2.常见实验设计资料的方差分析

(1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。

(2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。

(3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容

多组资料的方差齐性检验、变量变换方法。 (三)了解内容

两因素析因设计方差分析、重复测量设计资料的方差分析。

二、教学内容精要

(一) 方差分析的基本思想 1. 基本思想

方差分析(analysis of variance ,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方和误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

2.分析三种变异

(1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组

)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=

21

)(x x

n k

i i

i -∑= ,组间ν=k -1为组间自由度。k 表示处理组数。

(2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==??

?

???-=k

i n j i ij i x x SS 112)(组内

, k N -=组内ν,为组内均方自由度。

(3)总变异:所有观察值之间的变异(不分组),这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS 总 )。按方差的计算方法,MS 总= 总总ν/SS ,其中SS 总=211

)(∑∑==-k i n j ij

i

x x

, k 为处理组数,i

n 为第i 组例数,总ν=N -1为总的自由度, N 表示总例数。

(二)方差分析的使用条件

(1) 各样本是相互独立的随机样本,且来自正态分布总体。 (2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。 (三)不同设计资料的方差分析 1.完全随机设计的单因素方差分析

(1)资料类型:完全随机设计(completely random design)是将受试对象完全随机地分配到各个处理组。设计因素

中只考虑一个处理因素,目的是比较各组平均值之间的差别是否由处理因素造成。

(2) 方差分析表:见表5-1。F ≥F α时,拒绝H 0: 12k μμμ===。

表5-1 完全随机设计方差分析计算表

来源

SS

ν

MS F 值 组间

SS 组间

1-=k 组间ν

MS 组间=

组间

组间

νSS

F=

组内

组间MS MS

组内 (误差) SS 组内=SS 总 - SS 组间

组内ν=总ν-组内ν=N - k

MS 组内=组内

组内

νSS

总计

SS 总

总ν= N - 1

2.随机区组设计的两因素方差分析

(1)资料类型:随机区组设计(randomized block design )是将受试对象按自然属性(如实验动物的窝别、体重,病人的性别、年龄及病情等)相同或相近者组成单位组(区组),然后把每个组中的受试对象随机地分配给不同处理。设计中有两个因素,一个是处理因素,另一个是按自然属性形成的单位组。单位组的选择原则是“单位组间差别越大越好,单位组内差别越小越好”。

(2)方差分析表:见表5-2。F 处理≥F α时,拒绝H 0: 12k μμμ==

=。

表5-2 随机区组设计方差分析计算表

变异来源 SS

ν

MS F 值

处理组间

SS 处理

处理ν= k-1 MS 处理=

处理

处理

νSS F 处理 =

误差处理

MS MS

单位组间

SS 单位

单位ν= b -1

MS 单位=

单位

单位

νSS

F 单位 =

误差

单位MS MS

误差 SS 误差= SS 总- SS 处理- SS 单位

误差ν=总ν-处理ν-单位ν

=N-k-n+1

MS 误差=

误差

误差

νSS

总计

SS 总

总ν = N -1

3.多个样本均数的多重比较

如果方差分析结果表明各组间有显著差别,则需要进一步进行两两比较,也称均数间的多重比较(multiple comparison )。进行两两比较的方法主要有:

(1) LSD-t 检验:称为最小显著差异t 检验。适用于k 组中某一对或某几对在专业上有特殊意义的均数间差异的比较。检验统计量为t 值,自由度为方差分析表中的误差自由度,查t 界值表。

AB

d B

A S X X t -=

其中 )(11B

A

AB

n n d

MS S +=误差 (5-1)

(2)

Dunnett-t 检验:它适用于k-1个试验组和一个对照组均数差别的多重比较,检验统计量为t 值,自由

度为方差分析表中的误差自由度,查Dunnet-t 界值表。

x

x i i

S x x t --=

,其中0x x i S -=)1

1(

n n MS i +误差 (5-2) (3)SNK-q 检验:在方差分析结果拒绝H 0时采用。适用于所有组均数的两两比较。检验统计量为q ,自由度为比较组数a 和方差分析表中的误差自由度,查q 界值表。

()

A B d

X X S q -=

其中,11()2

A B n n d MS S =

+误差

4.多组资料方差起行检验

当各组标准差相差较大(如1.5倍)时,需检验资料是否满足方差齐性的条件。 5. 变量变换

当资料不能满足方差分析的条件时,如果进行方差分析,可能造成错误的判断。因此对于明显偏离上述使用条件的资料,可以通过变量变换的方法来加以改善。常用的变量变换方法有:

(1)对数变换 对数变换不仅可以将对数正态分布的数据正态化,还能使数据方差达到齐性,特别是各样本的标准差和均数成比例或变异系数接近于一个常数时。变换公式为:

X X lg =' (5-4)

当原始数据中有小值或零时,可用)1lg(+='X X

(2)平方根变换 常用于使服从Possion 分布的计数资料或轻度偏态的资料正态化;当各样本的方差和均数呈正相关时,可使资料达到方差齐性。变换公式为:

X X =

' (5-5)

当原始数据中有小值或零时,可用5.0+=

'X X

(3)倒数变换 常用于数据两端波动较大的资料,可使极端值的影响减小。变换公式为:

X X /1=' (5-6)

(4)平方根反正弦变换 常用于服从二项分布的率或百分比资料。一般地,当总体率较小(<30%)或较大(>70%)时,通过平方根反正弦变换,可使资料接近正态,且达到方差齐性的要求。变换公式为:

X X 1

sin

-=' (5-7) (5)秩转换后,采用秩和检验比较组间差别(祥见第九章)。

6.两因素析因设计方差分析

处理含有两因素两水平的全面组合。例如治疗肿瘤术后病人,可采用4种方法:既不放疗也不化疗(a 0b 0);放疗不化疗(a 1b 0);不放疗化疗(a 0b 1);既放疗又化疗(a 1b 1)。设放疗为A 因素(两水平),化疗为B 因素(两水平),则构成2?2析因设计,目的是分析A 的主效应,B 的主效应及AB 的交互作用。

7.重复测量资料的方差分析

受试对象随机分组后,多次测量某一观察指标,以比较处理效应在不同时间点有无变化。如试验组和对照组的轻度高血压病人入院前、治疗后1天、2天、3天、4天的血压变化。设处理分组为A 因素,重复测量的时间点为B 因素,目的是分析A 的主效应和AB 的交互作用。

三、典型试题分析

1.完全随机设计资料的方差分析中,必然有( )

A .SS 组内

B .MS 组间

C .MS 总=MS 组间+MS 组内

D .SS 总=SS 组间+SS 组内 答案:D

[评析] 本题考点:方差分析过程中离均差平方和的分解、离均差平方和和均方的关系。

方差分析时总变异的来源有:组间变异和组内变异,总离均差平方和等于组间离均差平方和和组内离均差平方差之和,因此,等式SS 总=SS 组间+SS 组内是成立的。离均差平方和除以自由度之后的均方就不再有等式关系,因此C 选项不成立。A 、B 选项不一定成立。D 选项为正确答案。 2.单因素方差分析中,当P <0.05时,可认为( )。

A .各样本均数都不相等

B .各总体均数不等或不全相等

C .各总体均数都不相等

D .各总体均数相等 答案:B

[评析] 本题考点:方差分析的检验假设及统计推断。

方差分析用于多个样本均数的比较,它的备择假设(H 1)是各总体均数不等或不全相等,当P <0.05时,接受H 1,即认为总体均数不等或不全相等。因此答案选B 。 3. 以下说法中不正确的是( )

A .方差除以其自由度就是均方

B .方差分析时要求各样本来自相互独立的正态总体

C .方差分析时要求各样本所在总体的方差相等

D .完全随机设计的方差分析时,组内均方就是误差均方 答案:A

[评析] 本题考点:方差分析的使用条件及均方的概念。

方差就是标准差的平方,也就是均方,因此选项A 是错误的。选项B 、C 是方差分析对资料的要求,因此选项B 和C 都是正确的。在完全随机设计的方差分析中,组内均方就是误差均方,D 选项也是正确的。 4. 当组数等于2时,对于同一资料,方差分析结果和t 检验结果( ) 。

A.完全等价且F = t

B.方差分析结果更准确

C.t 检验结果更准确

D.完全等价且F t =

答案:D

[评析]本题考点:方差分析和t 检验的区别和联系。

对于同一资料,当处理组数为2时,t 检验和方差分析的结果一致且F t =

,因此,正确答案为D 。

5. 完全随机设计和随机单位组设计相比较( )。 A.两种设计试验效率一样

B.随机单位组设计的误差一定小于完全随机设计

C.随机单位组设计的变异来源比完全随机设计分得更细

D.以上说法都不对 答案:C 。

[评析]:本题考点:两种设计及其方差分析的区别。

两种设计不同,随机区组设计除处理因素外,还考虑了单位组因素。进行方差分析时,变异来源多分解出一项:单位组间变异。因此C 选项为正确答案。

四、习 题

(一) 名词解释

1.均方 2.方差分析基本思想 3.总变异 4.组间变异 5.组内变异 6.完全随机设计 7.随机区组设计 (二) 单项选择题

1. 两样本均数的比较,可用( )。

A .方差分析

B .t 检验

C .两者均可

D .方差齐性检验 2.配伍组设计的方差分析中,ν配伍等于( )。

A .ν总-ν误差

B .ν总-ν处理

C .ν总-ν处理+ν误差

D .ν总-ν处理-ν误差

3.在均数为μ,标准差为σ的正态总体中随机抽样,≥-||

μX ( )的概率为5%。

A .1.96σ

B .x

σ96.1 C .0.052,t s ν D.

0.052,x t s ν

4.当自由度(ν1,ν2)及显著性水准α都相同时,方差分析的界值比方差齐性检验的界值( )。

A .大

B .小

C .相等

D .不一定 5.方差分析中变量变换的目的是( )。

A .方差齐性化

B .曲线直线化

C .变量正态化

D .以上都对

6.下面说法中不正确的是()。

A.方差分析可以用于两个样本均数的比较

B.完全随机设计更适合实验对象变异不太大的资料

C.在随机区组设计中,每一个区组内的例数都等于处理数

D.在随机区组设计中,区组内及区组间的差异都是越小越好

7.随机单位设计要求()。

A.单位组内个体差异小,单位组间差异大

B.单位组内没有个体差异,单位组间差异大

C.单位组内个体差异大,单位组间差异小

D.单位组内没有个体差异,单位组间差异小

8.完全随机设计方差分析的检验假设是()。

A.各对比组样本均数相等B.各对比组总体均数相等

C.各对比组样本均数不相等D.各对比组总体均数不相等

9.完全随机设计、随机区组设计的SS和及自由度各分解为几部分()。

A.2,2 B.2,3 C.2,4 D.3,3

10.配对t检验可用哪种设计类型的方差分析来替代()。

A.完全随机设计B.随机区组设计

C.两种设计都可以D.AB都不行

(三)简答题

1.t检验和方差分析的使用条件?

2.如何合理选择检验水准α?

3.以t检验为例,说明检验假设中α和P的区别。

(四)计算题

1.某湖水在不同季节氯化物含量测定值如表5-3所示。问不同季节氯化物含量有无差别?若有差别,进行32个水平的两两比较。

表5-3 某湖水不同季节氯化物含量(mg/L)

春夏秋冬

22.6 19.1 18.9 19.0

22.8 22.8 13.6 16.9

21.0 24.5 17.2 17.6

16.9 18.0 15.1 14.8

20.0 15.2 16.6 13.1

21.9 18.4 14.2 16.9

21.5 20.1 16.7 16.2

21.2 21.2 19.6 14.8

∑ij X167.9 159.3 131.9 129.3 588.40

n 8 8 8 8 32

i

X20.99 19.91 16.49 16.16 18.39

i

∑ij X23548.51 3231.95 2206.27 2114.11 11100.84

s2 3.53 8.56 4.51 3.47

i

2.根据表5-4资料说明大白鼠感染脊髓灰质炎病毒后,再做伤寒或百日咳接种是否影响生存日数?若结论为“有影响”,请做多重比较(和对照组比)。

表5-4 各组大鼠接种后生存日数

伤寒百日咳对照

5 6 8

7 6 9

8 7 10 9 8 10 9 8 10 10 9 11 10 9 12 11 10 12 11 10 14

12

11 16 ∑ij

X

92 84 112 288 i n

10 10 10 30 i X

9.2 8.4 11.2 9.6 ∑ij X 2

886 732 1306 2924 i s 2

4.4

2.93

5.73

3.有三种抗凝剂(A 1,A 2,A 3)对一标本作红细胞沉降速度(一小时值)测定,每种抗凝剂各作5次,问三种抗凝

剂对红细胞沉降速度的测定有无差别?

A 1:15 11 13 12 14 A 2:13 16 14 17 15 A 3:13 15 16 14 12

4.用Dunnett-t 法检验下表中四个处理组均数和对照组的均数的差别。

表5-5 家免脑损伤后大脑左半球组织水含量(%)

试验分组

n

i X

S

对照(未损伤)

8 78.86 0.43 损伤后0.5小时

5 79.65 0.68 损伤后3小时 5 79.77 0.6

6 损伤后6小时 8 80.94 0.75

治疗组

9 79.61 0.66 5.将36只大白鼠按体重相近的原则配为12个单位组,各单位组的3只大白鼠随机地分配到三个饲料组。一个月后观察尿中氨基氮的排出量(mg )。经初步计算,162=总SS ,8=饲料SS ,110=误差SS 。试列出该实验数据的方差分析表。

6.将18名原发性血小板减少症患者按年龄相近的原则配为6个单位组,每个单位组中的3名患者随机分配到A 、B 、C 三个治疗组中,治疗后的血小板升高见表5-6,问3种治疗方法的疗效有无差别?

表5-6 不同人用鹿茸草后血小板的升高值 (104/mm 3) 年龄组

A B C 1 3.8 6.3 8.0 2 4.6 6.3 11.9 3 7.6 10.2 14.1 4 8.6 9.2 14.7 5 6.4 8.1 13.0 6

6.2

6.9

13.4

7.某研究人员以0.3ml/kg 剂量纯苯给大鼠皮下注射染毒,每周3次,经45天后,使实验动物白细胞总数下降至染毒前的50%左右,同时设置未染毒组。两组大鼠均按照是否给予升高白细胞药物分为给药组和不给药组,试验结果见下表,试作统计分析。

表5-7 试验效应指标(吞噬指数)数据 未染毒组

染毒组

不给药 给药

不给药 给药

3.80 3.88 1.85 1.94 3.90 3.84 2.01 2.25

4.06 3.96 2.10 2.03 3.85 3.92 1.92 2.10 3.84 3.80

2.04 2.08

五、 习题答题要点

(一) 名词解释

1.均方:均方差(MS )或方差,是由离均差平方和被自由度相除而得。

2.方差分析:方差分析(analysis of variance ,ANOVA )就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方和误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。

3.总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表示。

4.组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。

5.组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。

6.完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。

7.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数和处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

(二) 单项选择题

1.C

2.D

3.B

4.B

5.D

6.D

7.A

8.B

9.B 10.B (三) 简答题

1. t 检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

2.设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。

3.以t 检验为例,α和P 都是用t 分布尾部面积大小表示,所不同的是:α表示I 型错误的概率,即H 0为真而被错误地拒绝的概率值。α是在统计分析时,根据I 型错误危害的大小,预先规定的,即规定统计结果为“接受 H 1” 时的误判率的界限值为α(即检验水准)。P 值是由实际样本得出的统计结果为“接受 H 1” 时误判率。根据P 和α的大小关系作出“不拒绝H 0”或“拒绝H 0”的统计推断。 (四)计算题

1.完全随机设计单因素芳差分析

解:H 0:4个季节湖水中氯化物含量相等,即μ1=μ2=μ3=μ4

H 1:4个季节湖水中氯化物含量不等或不全相等。

α=0.05

205.1081932/4.588/)(22===∑∑n X C ij

635.281205.1081984.111002=-=-=∑∑C X SS ij 总

170

.141205.108198/)3.1299.1313.1599.167(]/)[(22222=-+++=-=∑∑C

n X SS i ij 组间 465.140141170635.281=-=-=组间总组内SS SS SS

表5-8 方差分析表

变异来源 SS ν

MS F 总变异 组间变异 组内变异

281.635 141.170 140.465

31 3 28

47.057 5.017

9.380

查F 界值表,95.228

,3,05.0=F 。因F >28,3,05.0F 所以P <0.05。按α=0.05水准,拒绝H 0,接受H 1,认为不同季节湖水

中氯化物含量不同或不全相同。

用SNK-q 检验进行各组均数间两两比较。 H 0:任意两对比组的总体均数相等,μA =μB

H 1:μA ≠μB

α=0.05

表5-9 四个样本均数顺序排序

组别

春 夏 秋 冬 i X

位次 20.99 1 19. 91 2 16.49 3 16.16 4

表5-10 四组均数两两比较q 检验

对比组 两均数之差 组数 q 值 P 值 1 , 4 1 , 3 1 , 2 2 , 4 2 , 3 3 , 4

4. 83 4. 50 1. 08 3. 30 3. 42 0. 33

4 3 2 3 2 2

6. 099 5. 682 1.364 4. 735 4. 319 0. 417

<0.01 <0.01 >0.05 <0.01 <0.01 >0.05

春和夏、秋和冬湖水中氯化物含量P >0.05,按α=0.05水准,不拒绝H 0,即不能认为春和夏、秋和冬季湖水中氯化物含量有差别。而其它4组均有P <0.01,按α=0.05水准,拒绝H 0,接受H 1,即认为春夏两季湖水中氯化物含量高于秋冬两季。

2.完全随机设计单因素芳差分析

H 0:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等.

H 1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等. α=0.05

8.276430/288/)(22===∑∑n X C ij 2.1598.276429242=-=-=∑∑C X SS ij 总

22

2

2

[()/](9284112)/102764.841.6

ij i SS X n C

=-=++-=∑∑组间

6.1176.412.159=-=-=组间总组内SS SS SS

表5-11 方差分析表

变异来源 SS ν

MS F 总变异 组间变异 组内变异

159.2 41.6 117.6

29 2 27

20.80 4.36

4.77

查F 界值表,35.327

,2,05.0=F 。因F 〉27,2,05.0F 得P <0.05,按α=0.05水准,拒绝H 0,接受H 1,认为大白鼠感

染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响.

用Dunnet-t 检验方法进行均数间多重比较: H 0:任一组和对照组总体均数相同

H 1:任一组和对照组总体均数不同

α=0.05

由Dunnett-t 检验公式,伤寒和对照组比较:

10

12(1/1/)

(9.2-11.2) 4.36(1/101/10)2/0.93 2.14

X X t MS n n =

+=+=-=-误差

ν=27,查Dunnett-t 检验界值表,得P <0.05。按α=0.05水准,拒绝H 0,接受H 1,故可认为接种伤寒菌苗组较对照组

生存日数减少。

百日咳和对照组比较:

99.2)10/110/1(36.4/)2.114.8(-=+-=百对t

ν=27,查Dunnett-t 检验界值表,得P <0.05,按α=0.05水准,拒绝H 0,接受H 1,认为接种百日咳菌苗组较对照组生

存日数减少。

3.完全随机设计资料方差分析

H 0:三种抗凝剂所作血沉值之间没有差别 H 1:三种抗凝剂所作血沉值之间存在差别

α=0.05

表5-12 方差分析表

变异来源

SS νMS F 总变异

40 14 组间变异

组内变异

10 30 2 12 5 2.5

2 查F 界值表,,88.312

,2,05.0=F 所以P >0.05,按α=0.05水准,不能拒绝H 0。即尚不能认为三种抗凝剂所作血沉值之

间有差别。

4.首先计算误差均方

3086

.1266.0)19(75.0)18(66.0)15(68.0)15(43.0)18()1(222222

=?-+?-+?-+?-+?-=-=∑i

i s n SS 误差

305-35k -N ===误差ν

/12.3086/300.4103MS SS ν===误差误差误差

(1) 损伤后0.5小时和对照组比

H 0:损伤后0.5小时和对照组组织含水量相等 H 1:损伤后0.5小时和对照组组织含水量不等

α=0.05

16

.2)

5

181(4103.086

.7865.79=+-=

t

以30=误差ν,处理数=4查Dunnett-t 界值表,得界值2.25,因t =2.16<2.25, 所以P >0.05。在α=0.05水准上,不拒绝H 0,尚不能认为损伤后0.5小时和对照组组织含水量有差别。

(2)损伤后3小时和对照组比

H 0:损伤后3小时和对照组组织含水量相等 H 1:损伤后3小时和对照组组织含水量不等

α=0.05

2.4911

0.4103()

85

t =

=+

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝H 0,认为损伤后3小时和对照组的组织含水量有差别。 (3)损伤后6小时和对照组比

H 0:损伤后6小时和对照组组织含水量相等 H 1:损伤后6小时和对照组组织含水量不等

α=0.05

6.4911

0.4103()

88

t =

=+

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝H 0,认为损伤后6小时和对照组的组织含水量有差别。 (4)治疗组和对照组比

H 0:治疗组和对照组组的织含水量相等 H 1:治疗组和对照组的组织含水量不等

α=0.05

2.4111

0.4103()

89

t =

=+

因t >2.25(界值),故P <0.05。在α=0.05水准上,拒绝H 0,认为治疗组和对照组的组织含水量有差别。 5.随机去组设计方差分析,总例数N =36,处量组数k =3,区组数n =12。 计算:441108162=--=--=误差饲料总区组SS SS SS SS

351361=-=-=N v 总 2131=-=-=k v 饲料 111121=-=-=n v 区组

221123361=+--=+--=n k N v 误差 根据计算结果填写方差分析表,见表5-11。

表5-13 方差分析表

变异来源 SS

ν MS F P 处理间

8 2 4 0.8 >0.05 区组间 44 11 4 0.8 >0.05

误差

110 22 5 总变异

162 35 6.解:这两组资料用随机区组的方差分析为宜。 (1)处理组间比较

H 0:不同治疗组血小板升高值相同 H 1:不同治疗组血小板升高值不全相同 α=0.05

(2)年龄组间比较

H 0:不同年龄组血小板升高值相同

H 1:不同年龄组血小板升高值不全相同

α=0.05

(3)计算,列方差分析表

表5-14 方差分析表

变异来源

SS ν MS F 总变异 组间 区组间 误差 187.265 129.003 50.132 8.13 17 2 5 10 64.502 10.026 0.813

79.338 12.333

查F界值表,

0.05,2,104.10,

F=

0.05,4,103.48,

F=因此,组间及区组间均为P<0.05。按α=0.05水准,拒绝H0,可认为

不同治疗组间血小板升高值不相同,不同年龄组患者血小板升高值也不相同。

7.设A因素为染毒(2水平), B因素为药物(2水平),做2?2表析因设计方差分析。结果见表5-15。

表5-15方差分析表

变异来源SS νMS F

总变异

染毒

药物

染毒* 药物误差17.339

0.009

17.168

0.014

0.148

19

1

1

1

16

0.00

9

17.168

0.01

4 0.0

09

1.000

1907.555

1.5

55

查F界值表,

0.01,1,168.68,

F=因此,药物组间P<0.01。按α=0.01水准,认为给药组和不给药组吞噬指数不相同。

(赵清波张玉海)

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

应用统计学习题:方差分析

第五章方差分析 序号:5-004 题型:名词解释题 章节:方差分析 题目:方差分析的任务 答案:①求参数μ、μj 、α 1、α 2 ……αm的估计值(参数估计) ②分析观测值的偏差 ③检验各水平效应α 1、α 2 ……αm(等价μ 1 、μ 2 ……μm)有无显著差异 难度:高 评分标准:每题2分,少一条扣去1分。 序号:5-002 题型: 判断题 章节:方差分析 题目:方差分析是一种比较总体方差差异的统计方法。() 答案:错误 难度:中 评分标准:1分 序号:5-003 题型:综合题 章节:方差分析 题目:设有三个车间以不同的工艺生产同一种产品,为考察不同工艺对产品产量的影响,现对每个车间各纪录5天的日产量,如表所示,问三个车间的日产量是否有显著差异? (取α=0.05)。 将最终的计算结果填入下表:

F >)12,2(05.0F 存在显著差异。 解:(1)计算各水平均值和总平均值,465 46 484745441=++++= X , 同理46,5232==X X ,483 46 5246=++=X (2’分) (2)计算总离差平方和S T ,组内平方和S E ,组间平方和S A 。 S T =(44-48)2+(46-48)2+……(45-48)2=172 (1’分) S A =Σ120)4846(5)4852(5)4846(5)(2222j =-+-?+-=-X X (1’分) S E =S T -S A =172-120=52(1’分) (3)计算方差 MS A = 601 3120 =- MS E = 33.43 1552 =-(1’分) (4)作F 检验 85.1333 .460 === E A MS MS F (1’分) 89.3)21,2(),1(05.02==--F m n m F (1’分) 难度:中 评分标准: 每题8分 序号:5-004 题型:综合题 章节:方差分析 题目: 有重复双因素方差分析,A 因素有3个水平,B 因素有3个水平,在A i 、B j 所有可能组合条件下,重复观测2次。试用观测值X ijk 、均值??i X 、??j X ……, i =1、2……n , j =1、2……m , k =1、2…… l 制表。并指定Excel 单元格对应。 有重复双因素方差分析数据表

2014年7月高等教育自学考试 00974《统计学原理》试题及答案

2014年7月高等教育自学考试 统计学原理试卷及答案 (课程代码 00974) 一、单项选择题(本大题共20小题,每小题1分,共20分) 1.构成统计总体的每一个别事物,称为 C A .调查对象 B .调查单位 C .总体单位 D .填报单位 2.对事物进行度量,最精确的计量尺度是A A .定比尺度 B .定序尺度 C .定类尺度 D .定距尺度 3.《中华人民共和国统计法》对我国政府统计的调查方式做的概括中指出,调查方式的主体是C A .统计报表 B .重点调查 C .经常性抽样调查 D .周期性普查 4.是非标志的成数p 和q 的取值范围是D A .大于零 B .小于零 C .大于1 D .界于0和1之间 5.在经过排序的数列中位置居中的数值是A A .中位数 B .众数 C .算术平均数 D .平均差 6.确定中位数的近似公式是A A .d f S f L m m ?-+ -∑1 2 B .d L ??+??+ 2 11 C .∑∑? f f x D . ∑-)(x x 7.反映现象在一段时间内变化总量的是B A .时点指标 B .时期指标 C .动态指标 D .绝对指标 8.重置抽样与不重置抽样的抽样误差相比A A .前者大 B .后者大 C .二者没有区别 D .二者的区别需要其他条件来判断 9.如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数A A .多一些 B .少一些 C .可多可少 D .与总体各单位差异无关 10.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是D A .样本数目 B .样本可能数目 C .总体单位数 D .样本容量 11.在12个单位中抽取4个,如果进行不重置抽样,样本可能数目M 为B A .4 12 B . ! 8!4! 12 C .12×4 D .12 4 12.方差是各变量值对算术平均数的A A .离差平方的平均数 B .离差平均数的平方根 C .离差平方平均数的平方根 D .离差平均数平方的平方根

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1、设某地区有200家独立核算得工业企业,要研究这些企业得产品生产情 况,总体就是( )。 A、每一家工业企业 B、200家工业企业 C、每一件产品 D、200家工业企业得全部工业产品 2、有600家公司每位职工得工资资料,如果要调查这些公司得工资水平情 况,则总体单位就是( )。 A、600家公司得全部职工 B、600家公司得每一位职工 C、600家公司所有职工得全部工资 D、600家公司每个职工得工资 3、一个统计总体( )。 A、只能有一个指标 B、可以有多个指标 C、只能有一个标志 D、可以有多个标志 4、以产品等级来反映某种产品得质量,则该产品等级就是( )。 A、数量标志 B、品质标志 C、数量指标 D、质量指标 5、在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数就是( )。 A、变量值 B、变量 C、指标值 D、指标 6、年龄就是( )。 A、变量值 B、连续型变量 C、离散型变量 D、连续型变量,但在实际应用中常按离散型处理 7、人口普查规定统一得标准时间就是为了( )。 A、登记得方便 B、避免登记得重复与遗漏 C、确定调查得范围 D、确定调查得单位 8、以下哪种调查得报告单位与调查单位就是一致得( )。 A、职工调查 B、工业普查 C、工业设备调查 D、未安装设备调查 9、通过调查大庆、胜利、辽河等油田,了解我国石油生产得基本情况。这 种调查方式就是( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 10、某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定就是( )。 A、调查时间 B、登记期限 C、调查期限 D、标准时间 11、统计分组得关键问题就是( )。 A、确定分组标志与划分各组界限 B、确定组距与组中值

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

统计学原理练习题及答案

统计学原理练习题及答案 2007-12-7 9:32:24 阅读数:6162 《统计学原理》综合练习题 一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。() 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数( ) 10、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。() 15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。() 16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。() 22、施肥量与收获率是正相关关系。() 23、计算相关系数的两个变量都是随机变量() 24、利用一个回归方程,两个变量可以互相推算()

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

统计学原理-计算题

《统计学原理》 计算题 1.某地区国民生产总值(GNP)在1988-1989年平均每年递增15%,1990-1992年平均每年递增12%,1993-1997年平均每年递增9%,试计算: 1)该地区国民生产总值这十年间的总发展速度及平均增长速度 答:该地区GNP在这十年间的总发展速度为 115%2×112%3×109%5=285.88% 平均增长速度为 111.08% == 2)若1997年的国民生产总值为500亿元,以后每年增长8%,到2000年可达到多少亿元? 答:2000年的GNP为 500(1+8%)13=1359.81(亿元) 2.某地有八家银行,从它们所有的全体职工中随机动性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断:(F(T)为95.45%,则t=2) 1)全体职工中有储蓄存款者所占比率的区间范围 答:已知:n=600,p=81%,又F(T)为95.45%,则t=2所以 0.1026% == 故全体职工中有储蓄存款者所占比率的区间范围为 81%±0.1026% 2)平均每人存款金额的区间范围 3.某厂产品产量及出厂价格资料如下表: 要求:对该厂总产值变动进行因素分析。(计算结果百分数保留2位小数) 答:①总产值指数 11 00500010012000604100020 104.08% 600011010000504000020 p q p q ?+?+? ==?+?+? ∑ ∑ 总成本增加量 Σp1q1-Σp0q0=2040000-1960000=80000(元)②产量指数

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

统计学原理第九章(相关与回归)习题答案

第九章相关与回归 一.判断题部分 题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。() 答案:× 题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。() 答案:√ 题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。() 答案:× 题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。() 答案:× 题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。() 答案:× 题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。() 答案:√ 题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。() 答案:×

题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。() 答案:× 题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。() 答案:√ 题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。() 答案:× 题目11:完全相关即是函数关系,其相关系数为±1。() 答案:√ 题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。() 答案× 二.单项选择题部分 题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。 A.相关关系 B.函数关系 C.回归关系 D.随机关系 答案:B 题目2:现象之间的相互关系可以归纳为两种类型,即()。 A.相关关系和函数关系 B.相关关系和因果关系

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

统计学原理例题分析一(20200920021933)

统计学原理例题分析(一) 一、判断题(把“V”或“X”填在题后的括号里) 1.社会经 济统计的研究对象是社会经济现象总体的各个方面。()参考答案:X 2.总体单位是标志的承担者,标志是依附于单位的。() 参考答案:“ 3?标志通常分为品质标志和数量标志两种。() 参考答案:“ 4.当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。() 参考答案:“ 5.调查方案的首要问题是确定调查对象。() 参考答案:“ 6.我国目前基本的统计调查方法是统计报表、抽样调查和普查。() 参考答案:“ 7.调查单位和填报单位在任何情况下都不可能一致。() 参考答案:X 8.按数量标志分组,各组的变量值能准确的反映社会经济现象性质上的差别。() 参考答案:X 9.在确定组限时,最大组的上限应低于最大变量值。() 参考答案:X 10.按数量标志分组的目的,就是要区别各组在数量上的差别。() 参考答案:X 11.离散型变量可以作单项式分组或组距式分组,而连续型变量只能作组距式分组。() 参考答案:2

12.对于任何两个性质相同的变量数列,比较其平均数的代表性,都可以采

用标准差指标。() 参考答案:X 13.样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。() 参考答案:“ 14.样本容量指从一个总体中可能抽取的样本个数。() 参考答案:X 15.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。() 参考答案:X 16.产量增加,则单位产品成本降低,这种现象属于函数关系。() 参考答案:X 17.在直线回归方程Y = a +bx中,b值可以是正的,也可以是负的。 () 参考答案:“ 18.回归系数b和相关系数丫都可用来判断现象之间相关的密切程度。 () 参考答案:X 19.平均指标指数是综合指数的一种变形。() 参考答案:X 20.序时平均数与一般平均数完全相同,因为它们都是将各个变量值的差异抽象化了。() 参考答案:X 二、单项选择题(从下列每小题的四个选项中,选出一个正确的,请将正确答案的序号填在括号内) 1 ?以产品的等级来衡量某种产品的质量好坏,则该产品等级是() A.数量标志 E.品质标志 C.数量指标 D.质量指标。

现代心理与教育统计学课后题完整版

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

统计学原理第三章习题答案

第三章统计资料整理 一.判断题部分 1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(×) 2:统计分组的关键问题是确定组距和组数。(×) 3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。(×) 3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。(∨) 4:次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标志值在总体中所起的作用程度。(∨) 5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(×) 6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(∨) 7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(∨) 8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。(×) 9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。(×) 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(∨) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。(×) 二.单项选择题部分 1:统计整理的关键在( B )。 A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 2:在组距分组时,对于连续型变量,相邻两组的组限( A )。 A、必须是重叠的 B、必须是间断的 C、可以是重叠的,也可以是间断的 D、必须取整数 3:下列分组中属于按品质标志分组的是( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。 A、60---70分这一组 B、70---80分这一组 C、60—70或70—80两组都可以 D、作为上限的那一组 5:某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于( B )。 A、简单分组 B、复合分组 C、分析分组 D、结构分组 6:简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同

现代心理与教育统计学复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量.统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量.一般用大写的X或Y表示随机变量. 随机变量所取得的值,称为观测值.一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本. 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果. 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图-—直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示. 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形. (三)累加次数分布图-累加直方图 (四)累加次数分布图—-累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。 线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。 散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。 第三章 集中量数 集中量数用来表现数据资料的典型水平或集中趋势(central tendency )。 常用的集中量包括算术平均数、加权平均数、中位数和众数等等。 一、算术平均数 算术平均数(arithmetic average )一般简称为平均数(average)或均数、均值(mean)。 一般用M,或者用 表示. 算术平均数是最常用的集中量 (一)算术平均数的计算公式 %100?N f X i n i n X n n X X X X ∑ =∑=+++=1 211 X n X ∑=1

统计学原理例题分析及综合练习

统计学原理例题分析及综合练习 第一部分例题分析 一、判断 1.社会经济统计工作的研究对象是社会经济现象总体的数量方面。【√】 2.全面调查包括普查和统计报表。【×】 3.统计分组的关键是确定组限和组距。【×】 4.变异指标和平均指标从不同侧面反映了总体的特征,因而变异指标的数值越大则平均指标的代表性越高,反之平均指标的代表性越低。【×】 5.抽样极限误差总是大于抽样平均误差。【×】 6.根据样本各单位标志值或标志属性计算的综合指标称为统计量(样本指标)。【√】7.(甲)某产品产量与单位成本的相关系数是-0.8:(乙)产品单位成本与利润率的相关系数是-0. 95;因此,(乙)比(甲)的相关程度高。【√】 8.已知:工资(元)倚劳动生产率(千元)的回归方程为:y。=10+80x因此,当劳动生产率每增长1千元,工资就平均增加90元。【×】 9.在综合指数中,要求其同度量因素必须固定在同一时期。【√】 10.某产品产量在一段时间内发展变化的速度,平均来说是增长的,因此该产品产量的环比增长速度也是年年上升的。【×】 11.已知各期环比增长速度为3%、2%、7%和5%,则相应的定基增长速度的计算方法为【103%×102%×107%×105%】 -100%。【√】二、单选1.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是【C.每一件产品】。 2.对一个统计总体而言【D.可以有多个指标】。 3.在某班学生学习情况调查中【C.全班平均成绩是指标】。 4.全面调查与非全面调查的划分是以【C.调查对象所包括的单位是否完全来划分的】。 5.全国工业企业设备普查,全国每个工业企业是【D.填报单位】。 6.下列分组中哪个是按品质标志分组【B.半成品按品种分组】。 7.某市场销售洗衣机,2009年共销售60000台,年底库存50台。这两个指标是【C.前者是时期指标,后者是时点指标】。 8.反映抽样指标与总体指标之间可允许的误差范围的指标是【B.抽样极限误差】。 9.当所有的观察值y都落在直线yc=a+bx上时,则x与y之间的相关系数为【B.γ=1】。 10.某工厂今年一季度同去年一季度相比,产量提高了5%,产值增长了15%,则产品价格提高了【B.9.5%】。 11.某企业第一、第二季度和下半年的原材料平均库存额分别为l0万元、15万元和20万元,则全年平均库存额为【B.16. 25万元】。 三、多选 1.总体单位是总体的基本组成单位,是标志的直接承担者。因此【A.在国营企业这个总体下,每个国营企业就是总体单位 D.在全部工业产品这个总体下,每一个工业产品就是总体单位】 2.在全国人口普查中【B.每个人是总体单位 C.年龄是变量 E.具有大专以上文化程度的人数是指标】 3.有三个学生,其统计学原理成绩分别是60分、70分、80分。这三个数字是【C.数量标志表现 D.标志值 E.变量值】 4.要了解某市商业企业经营状况,则统计指标是【A.该市商业企业个数 B.该市商业职工数 D.该市商业企业销售额】 5.在对工业企业生产设备的调查中【B.工业企业的全部生产设备是调查对象 C.每台生产设备是调查单位 E.每个工业企业是填报单位】 6.在统计调查中【C.调查时限是调查工作起止的期限 D.抽样调查与典型调查的根本区

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

相关文档
最新文档