练习题解答:第十章交互分类与卡方检验

练习题解答:第十章交互分类与卡方检验
练习题解答:第十章交互分类与卡方检验

第十章 交互分类与2χ检验

练习题:

1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:

表10-26

(1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。

(2) 请根据表10-26的数据完成下面的联合分布的交互分类表。

1

10-27 (4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。

解:(1)Y F (从上到下):50;30;100.

X F (从左到右):115;65.

(2)P 11=15/180;P 21=35/180;1

Y F N =50/180;

P 12=20/180;P 22=10/180;2

Y F N =30/180; P 13=80/180;P 23=20/180;3

Y F N =100/180;

1

X F N =115/180;2

X F N =65/180.

(3)关于X 的边缘分布:

x 分居 不分居

关于Y 的边缘分布:

y 紧张 一般 和睦 P(y)

50/180

30/180

100/180

(4)关于X 的条件分布有三个: y=“紧张”

x 分居 不分居 P(x)

15/50

35/50

y=“一般”

x 分居 不分居 P(x)

20/30

10/30

y=“和睦”

x 分居 不分居 P(x) 80/100

20/100

关于y 的条件分布有两个: X=“分居”

y

紧张 一般 和睦 P(y)

15/115

20/115

80/115

X=“不分居”

y

紧张 一般 和睦 P(y)

35/65

10/65

20/65

2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行

了分析,得到的结果如下表所示: 表10-28

10-29。

(2)根据表10-28和表10-29计算2χ,计算公式为

2

()2

o e e

f f f χ-=∑

。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检

验,请陈

述研究假设1H 和虚无假设0H 。

(4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表,

找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差

异。

(5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。

解:(1)“信教”一列(从上到下):

119185

61.67357?=;

125185

64.78357?=;

113185

58.56357

?=.

“不信教”一列(从上到下):

119172

57.33357

?=;

125172

60.22357?=;

113172

54.44357

?=.

(2)

2

2

2

2

2

2

2

()2(9061.67)(6064.78)(3558.56)(2957.33)(6560.22)(7854.44)61.67

64.78

58.56

57.33

60.22

54.44

=

=47.42

o e e

f f f χ-------=+

+

+

+

+

(3)1H :总体中有无宗教信仰的人的利他主义程度有显著性差异。

0H :总体中有无宗教信仰的人的利他主义程度没有显著性差异。

(4)df =(r -1)(c -1)=(3-1)?(2-1)=2;显著性水平为时的

临界值是。因为20χ=<2

χ=,检验统计值落在否定域中,可以拒绝虚无假设,接

受研究假设,即认为总体中有无宗教信仰的人的利他主义程度是有显著性差异的。 (5

)0.342C

=

=

C 值要利用表“部分交互分类表C 值的上限”中的数值进行修正,本题的表格是3?2,对应的C 值上限是,因此:

C 0.3420.685新==0.4993

3. 某英语培训学校为了研究英语四级考试试卷客观选择题正确答案的设置在

A 、

B 、

C 与

D 的某一个选项上是否有偏好,对最近三年英语四级考试试卷做了分

析,258个单选题的正确答案在A 、B 、C 与D 四个选项上的分布情况如下表所示:

答案选项 频次 A 48 B 74 C 50 D 86 合计

258

(1)请陈述研究假设1H 和虚无假设0H 。

(2)A 、B 、C 与D 四个选项上的期望频次是多少。 (3)根据上表计算2χ值。

(4)若显著性水平为,请判断英语四级考试试卷选择题的正确答案在A 、B 、C 与D 四个选项上的分配是否有显著的倾向。

解:(1)研究假设1H :正确答案在A 、B 、C 与D 四个选项中的设置有偏好。 虚无假设0H :正确答案在A 、B 、C 与D 四个选项中的设置没有偏好。 (2) A 、B 、C 与D 四个选项上的期望频次都是258/4= (3)

2

2

2

2

2

()2(4864.5)(7464.5)(5064.5)(8664.5)64.5

64.5

64.5

64.5

=16.05

o e e

f f f χ-----==

+

+

+

(4) df=4-1=3,显著性水平为时,查2

χ分布表可知临界值是,统计量落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为正确答案在A 、B 、C 与D 四个选项上的分配是有偏好的。

4.某个电视节目收视率的商业调查,涉及到了儿童、少年、青年、中年、

(1)为了分析5个群体的收视习惯是否有显著差异,请陈述研究假设1

H 和虚无假设0H 。

(2)根据上表计算2χ值。

(3)若显著性水平为,请判断不同群体的收视习惯是否有显著性差异。

解:(1) 研究假设1H :5个群体的收视习惯有显著差异。

虚无假设0H :5个群体的收视习惯没有显著差异。 (2)

2

2222222222()2(8961.5)(68.278)(61.556)(9567)(81.678)(39.512)(43.834)(4589)(8989)(52.456)61.5

68.2

61.5

95

81.6

39.5

43.8

45

89

52.4

57.81

o e e

f f f χ-----------==

+

+

+

+

+

+

+

+

+

=∑

(3) df =(r -1)(c -1)=(2-1)?(5-1)=4,显著性水平下的临界值为

,很明显,检验统计值落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为5个群体的收视习惯有显著差异。

5. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS 检验是否

有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有无显著影响,并计算

关系强度系数C 系数、V 系数和φ系数。(显著性水平0.05α=)

解:《武汉市初中生日常行为状况调查问卷》:

C2 你的成绩目前在本班大致属于

1)上等 2)中上等 3)中等 4)中下等 5)下等 C3 你是否有自己的房间以供学习不被打扰 1)有 2)没有

SPSS 的操作步骤如下:

1点击Analyze →Descriptive Statistics →Crosstabs ,打开Crosstabs 对话框,如图10-1

(练习)所示。将变量“是否有自己的房间以供学习不被打扰(c3)”放置在Column(s)框

中,将变量“成绩目前在本班的大致层次(c2)”放置在Row (s )框中,如图10-1(练习)

所示。

的成绩目前在本班大致属于 * 你是否有自己的房间以供学习不被打扰 Crosstabu latio n

% within 你是否有自己的房间以供学习不被打扰

10.6%8.2%10.0%30.6%23.0%28.8%33.8%36.1%34.4%20.7%21.3%20.8%4.3%11.5% 6.0%

上等

中上等

中等

中下等

下等

你的

成绩目前在本班大致属于有没有你是否有自己的房间以供学习不被打扰Total

图10-1(练习) Crosstabs 对话框

2点击Statistics 按钮,分别点击Chi-square 、Contingency coefficient 、Phi and Cram ér ’s V 复选框,如图10-2(练习)所示。

图10-2(练习) Crosstabs :statistics 对话框

3点击Cells 按钮,对单元格进行设置,如图10-3(练习)所示,选择Column 选项,选择的是在单元格中计算列百分比。

图10-3(练习) Crosstabs :Cell Display 对话框 ○4 Format 采取系统默认格式,点击OK ,提交运行,可得到如下的结果。 表10-1(练习) 是否拥有房间与在班上学习层次的交互分类表

表10-2(练习)卡方检验表

各相关关系表

表10-3(练习)

从表10-3(练习)可以看出,列联系数(Contingency coefficient)为,Cramer’s V 系数为,φ系数(Phi系数)为。

6. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS

检验在本

班的学习层次(C2)对自己与母亲关系的好坏(D2)有无显著影响,并计算关系强

α=)

度系数C系数、V系数和φ系数。(显著性水平0.05

解:初中生学习成绩的层次与自己同母亲的关系存在着相互影响,这个题目假定学习层次(C2)为自变量,自己与母亲关系的好坏(D2)为因变量。

《武汉市初中生日常行为状况调查问卷》:

C2你的成绩目前在本班大致属于

1)上等 2)中上等 3)中等 4)中下等 5)下等

D2 你对自己与母亲的关系

1)非常满意 2)比较满意 3)一般 4)不太满意 5)很不满意

SPSS的操作步骤如下:

○1点击Analyze→Descriptive Statistics→Crosstabs,打开Crosstabs对话框,如图10-4(练习)所示。将变量“成绩目前在本班的大致层次(c2)”放置在column(s)框中,将变量“自己与母亲的关系(d2)”放置在row(s)框中,如图10-4(练习)所示。

图10-4(练习) Crosstabs对话框

○2点击Statistics按钮,分别点击Chi-square、Contingency coefficient、

Phi and Cramr’V复选框,如图10-5(练习)所示。

图10-5(练习) Crosstabs:statistics对话框

○3点击Cells按钮,对单元格进行设置,如下图所示,选择Column,设置的是在单元格中计算列百分比。

图10-6(练习) Crosstabs:Cell Display对话框

○4Format采取系统默认格式,点击OK,提交运行,SPSS输出如下的结果。

表10-4(练习)成绩在班上的层次与自己同母亲的关系的交互分类表

你对自己与母亲的关系 * 你的成绩目前在本班大致属于 Crosstabulation % within 你的成绩目前在本班大致属于

46.2%50.3%46.3%33.9%26.7%43.7%

32.7%36.2%31.1%38.5%23.3%33.8%

17.3%10.7%15.8%19.3%30.0%16.1%

3.8% 2.7% 3.4% 3.7%10.0% 3.7%

3.4%

4.6%10.0% 2.7%

100.0%100.0%100.0%100.0%100.0%100.0%非常满意

比较满意

一般

不太满意

很不满意

你对

自己

与母

亲的

关系

Total

上等中上等中等中下等下等

你的成绩目前在本班大致属于

Total

表10-5(练习)卡方检验表

从表10-5(练习)可以看出卡方值为,自由度为16,卡方检验的P值为,小于,即通过了卡方检验。这意味着学生学习成绩的层次对自己与母亲的关系的满意程度有显著影响。从表10-4(练习)可以看出“上等”、“中上等”、“中等”、“中下等”与“下等”5组中与父母不同关系水平的初中生占各组的比例,其表现出的总体趋势为:学生的学习成绩的层次越高,其对自己与母亲的关系越满意。

从表10-3(练习)可以看出,列联系数(Contingency coefficient)为,Cramer’s V 系数为,φ系数(Phi)为。

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 解:(1)Y F (从上到下):50;30;100. X F (从左到右) :115;65. (2)P 11=15/180;P 21=35/180;1 Y F =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3 Y F N =100/180;

1X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居” y 紧张 一般 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:

SPSS 卡方检验

卡方检验 1.四格表的卡方检验 例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性。其中179人未曾使用该抗生素,其耐药率为40.78%;而在395例曾用过该药的人群中,耐药率为45.57%,结果见表1,试兑现人和上人群的耐药率是否一样? 表1 某抗生素的人群耐药性情况 用药史不敏感敏感合计 曾服该药180(174.10)215(220.90)395 未服该药73(78.90)106(100.10)179 合计253 321 574 建立变量名:

录入数值: 加权

统计分析 指定横标目和纵标目,注意不要选反了,选反了会有什么后果?

择分析方法:卡方检验 Chi-square 结果:实际频数理论频数

表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。P=0.285≥0.05还不能认为两组耐药率不同。 表三: (1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专

(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。 (3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。 2.配对四格表的卡方检验 例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计20 8 28 建立变量名: 录入数值:

第八章卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

第八章 卡方检验与交互分析#(精选.)

第八章卡方检验与交互分析 交互分析是社会调查研究中常用方法之一,用于研究两个定类变量的关系。交互分析中用于检验两个变量是否相关的方法叫做卡方检验,也叫独立性检验。卡方检验是建立在观测频次和期望频次之差基础上的一种检验。 一、卡方检验的原理 例:一项调查得到890个样本的与收入和所处地区的数据,希望分析收入和地区的关系。 表1 要检验的H0:收入和地区之间没有相关性,即每一地区的收入分布模式应该是相同的,收入的高低不应随着地区的不同而有所差异。也就是说,如果东部城市的四个收入类别各自比重和中西北部城市的四个收入类别各自比重一致,那么,收入和地区之间是相互独立的。 如果这个890人的样本能够反应总体的独立性特征,那么就应该能够观测到两个地区具有相同的收入分布模式,称为期望模式,样本的期望观测频次如下:表2 接下来,计算观测频次f0与期望频次f e之间的偏差(f0-f e),如果这些偏差比较小,则有利于证明原假设即总体的独立性。反之,则可能推翻原假设。但偏差之和为0,所以对偏差进行平方。但是,为了说明每一个偏差的相对重要性,每一偏差平方和都需要和本组中的期望频次相比较,计算相对(f0-f e)2/f e。然后,将所有组的贡献相加,从而得到度量全部偏差的一个量,叫做卡方

χ2= ,服从自由度为(c-1)(r-1)的卡方分布。如用c 和r 分别表示表 中的列数和行数,自由度为(c-1)(r-1)。 f 0 f e 153.3 164.7 80 86 66 71 129.7 139.3 (f 0-f e ) (f 0-f e )2/f e 计算出卡方值后,可根据已知 的显著性 水平和自由度查卡方分布表,找出临界值,与之作对比。反过来,也可以计算出概值,再根据我们所希望的显著性水平做比较。该例题中计算出χ2为31.6,查表发现对应自由度为3的那一行的所有临界值都小于χ2,因此,概值小于0.001。由于概值如此小,检验水平可以是1%甚至更小,所以一定可以拒绝原假设。也就是说,在总人口中,收入与地区有显著的相关性,二者并不独立。 练习题:在电视的收视率调查中,得到性别与收视习惯的联列表如下,试分析性别和收视习惯的关系。 男 女 总频次 几乎天天看 38 24 62 偶尔看 31 7 38 总频次 69 31 100 相对频率 0.69 0.31 1.00 解:原假设为“性别和收视习惯相互独立”,如果原假设成立,那么两列期望凭此应通过0.69和0.31分别乘以最后一列总频次而得到。 42.8 19.2 146 172 66 100 51 86 166 103 -7.3 7.3 -14 14 -15 15 36.3 -36.3 0.35 0.32 2.45 2.28 3.41 3.17 10.16 9.46 38 24 31 7

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

第十二章 基于秩转换的非参数检验

第十二章基于秩转换的非参数检验A1型题 1 .两组资料比较中,若样本例数n 较小,总体方差不齐,宜采用() A .对数变换 B .秩和检验 C . t 检验 D .方差分析 E . A 、B 都可以 2 .请指出下列五个秩和检验的结果哪个是错误的() A .配对计量资料n=12 , T +=7 , T - =71 查表T 0.05 =13 ~65 ,P<0.05 B .配对计量资料n=8 , T +=12 , T - =24 查表T 0.05 =3 ~33,P<0.05 C .两组计量资料n 1=12, n 2 =10, T 1 =173, T 2 =80 查表T 0.05 =85~145, P< 0.05 D .两组计量资料n 1=10, n 2 =10, T 1 =55,T 2 =15 查表T 0.05 =79~131 , P< 0.05 E .两组计量资料n 1=9, n 2 =13 , T 1 =58, T 2 =195 查表T 0.05 = 581~24 , P< 0.05 3 .配对比较的秩和检验,若检验假设H 成立,则() A .差值为正的秩和与差值为负的秩和相差不会很大 B .差值为正的秩和与差值为负的秩和可能相差很大 C .正秩和的绝对值大于负秩和的绝对值 D .正秩和的绝对值小于负秩和的绝对值 E .正秩和与负秩和相等 4 .以下检验方法除()外,其余均属非参数统计方法 A . Friedman's M 检验 B . H 检验 C .配对设计符号秩检验 D . t 检验 E .查r s 界值表法 5 .等级资料比较宜采用() A . t 检验 B . x2检验 C . u 检验 D .秩和检验 E .t检验 6 .两个小样本数值变量资料比较的假设检验,首先应考虑() A ,用t 检验 B .用秩和检验 C . t 检验或秩和检验均可 D .用u 检验 E .资料符合t 检验还是秩和检验的条件 7 .符合t检验条件的数值变量资料若采用秩和检验,不拒绝H 时,可使() A . I 型错误增大 B . Ⅱ型错误增大

卡方检验应用

卡方检验应用

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据 统计方法。 卡方检验是专用于解决计数数据统计分析 的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否 有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 ~ 解:(1)Y F (从上到下):50;30;100. X F (从左到右):115;65.

(2)P 11=15/180;P 21=35/180;1 Y F N =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180; 1 X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 ! P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 》 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 . 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x : 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 · 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居”

y 紧张 一般 * 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 10-29。 (2)根据表10-28和表10-29计算2χ,计算公式为 2 ()2 o e e f f f χ-=∑ 。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 * 述研究假设1H 和虚无假设0H 。 (4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表, 找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差 异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。

卡方检验

卡方(2χ)检验 常用于检验两个或多个样本率(或构成比)之间有无差别,也用于检验配对计数资料的 差异等。 (一)四格表资料的卡方检验 [例7-30] 某医院用甲、乙两种药物治疗十二指肠球部溃疡,结果见表7-12,试问两种药物疗效有无差别? 表7-12 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(a ) 25(b ) 100(a +b ) 75.00 乙 合 计 50(c ) 30(d ) 80(c +d ) 62.50 125 55 180(n ) 69.44 1.四格表2χ检验的基本公式为: ∑ -=T T A 2 2 )(χ (公式7-44) (1)建立假设,确定检验水准 H 0:π1=π2,即两组愈合率相同; H 1: π1≠π2,即两组愈合率不同; α=0.05 (2)计算理论数RC T n n n T C R RC = (公式7-45) 表7-13 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(69.44) 25(30.56) 100 75.00 乙 合 计 50(55.56) 30(24.44) 80 62.50 125 55 180 69.44 (3)计算检验统计量2χ值 按公式7-44计算: =3.27 (4)确定P 值 ν=(R-1)(C-1)。 本例ν=(2-1)(2-1)=1,查2χ界值表,2105.0,χ=3.84,2 1,1.0χ=2.71,故0.1>P >0.05。 (5)做出推断结论 按α=0.05水准,不拒绝H 0,差异无统计学意义。还不能认为两种药物治疗十二指肠球部溃疡疗效有差别。 2.四格表的专用公式 四格表资料还可用专用公式求2χ值。 44 .24)44.2430(56.55)56.5550(56.30)56.3025(44.69)44.6975()(2 22222 -+ -+-+-=-=∑T T A χ

第十二章直线相关与回归

第十二章 直线相关与回归 A 型选择题 1、若计算得一相关系数r=0.94,则( ) A 、x 与y 之间一定存在因果关系 B 、同一资料作回归分析时,求得回归系数一定为正值 C 、同一资料作回归分析时,求得回归系数一定为负值 D 、求得回归截距a>0 E 、求得回归截距a ≠0 2、对样本相关系数作统计检验(H 0:ρ=0),结果0.05()v r r >,统计结论是( )。 A. 肯定两变量为直线关系 B 、认为两变量有线性相关 C 、两变量不相关 B. 两变量无线性相关 E 、两变量有曲线相关 3、若1210.05()20.01(),v v r r r r >>,则可认为( )。 A. 第一组资料两变量关系密切 B. 第二组资料两变量关系密切 C 、难说哪一组资料中两变量关系更密切 D 、两组资料中两变量关系密切程度不一样 E 、以上答案均不对 4、相关分析可以用于( )有无关系的研究 A 、性别与体重

B、肺活量与胸围 C、职业与血型 D、国籍与智商 E、儿童的性别与体重 5、相关系数的假设检验结果P<α,则在α水平上可认为相应的两个变量间() A、有直线相关关系 B、有曲线相关关系 C、有确定的直线函数关系 D、有确定的曲线函数关系 E、不存在相关关系 6、根据样本算得一相关系数r,经t检验,P<0.01说明() A、两变量有高度相关 B、r来自高度相关的相关总体 C、r来自总体相关系数ρ的总体 D、r来自ρ≠0的总体 E、r来自ρ>0的总体 7、相关系数显著检验的无效假设为() A、r有高度的相关性 B、r来自ρ≠0的总体 C、r来自ρ=0的总体 D、r与总体相关系数ρ差数为0 E、r来自ρ>0的总体

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张 下一张 主 页
退 出

第一节
性别 男 女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1:1, 即与1:1性别比差异是否显著。 性别比差异是否显著。

χ =
2

A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理 论次数偏离程度的一个统计量, 论次数偏离程度的一个统计量, χ2越小, 越小,表明实际观察次数与理 论次数越接近; 论次数越接近; χ2 =0,表示两 者完全吻合; 者完全吻合; χ2越大, 越大,表示两者 相差越大。 相差越大。
上一张 下一张 主 页 退 出

在对次数资料进行χ2检验利用连续型随 机变量χ2分布计算概率时, 分布计算概率时,常常偏低, 常常偏低,特 别是当自由度为1时偏差较大。 时偏差较大。 Yates(1934)提出了一个矫正公式, 提出了一个矫正公式,矫正 后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张 下一张 主 页
退 出

当自由度大于1时,χ2分布与连续型随机 变量χ2分布相近似 ,这时, 这时,可不作连续性矫 正 , 但 要 求各组内的理论次数不小于5。若 某组的理论次数小于5,则应把它与其相邻的 一组或几组合并, 一组或几组合并,直到理论次数大 于5 为 止。

卡方检验12

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。 检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为:

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2 T1.2=43-26.2=16.8 T2.1=53-26.2=26.8 T2.2=44-26.2=17.2 3.计算x2值按公式20.12代入 4.查x2值表求P值 在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。 通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。 二、四格表的专用公式

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

10练习题解答:第十章交互分类与卡方检验

第十章交互分类与F检验 练习题: 1.为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭, 调查结果如下表所示: 表10-26 (1)计算变量X与Y的边际和(即边缘和)F x和F Y并填入上表。 (2)请根据表10-26的数据完成下面的联合分布的交互分类表。 表10-27 (3)根据表10-27指出关于X的边缘分布和关于Y的边缘分布。 (4)根据表10-27指出关于X的条件分布和关于Y的条件分布。解:(1)Fy(从上到下):50: 30: 100. 竹(从左到右): 115: 65. (2) P n=15/180: P.35/1S0: ^.50/180:

% P:c=20/180; P产 10/180:=30/180:

5 P沪80/180; P沪20/180:市二100/180: Fx\ Fx? N =115/180:=65/180. (3 关于y的条件分布有两个: X 2.一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 表10-28

(1)根据 表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 述研究假设0和虚无假设H{) o (4)本题口中的自山度为多少若显著性水平为,请查附录的才分布表, 找出相对应的临 界值。并判断有无宗教信仰的人的利他主义程度有无显著性差异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C系 数。 解:(1)"信教” 一列(从上到下): ,,9X,85 =61.67: 357 125X185 =64.78; 357 ,,3X185=58.56. 357 '‘不信教” 一列(从上到下):1,9X172 =57.33: 357 EG"?: 357

卡方检验1

第十三节卡方检验(1) 一、概述 用于分类计数资料的假设检验方法,属非参数检验。检验的是样本分布偏离理论分布的严重程度,即检验的是分布,不是总体参数。 Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。 统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。 原理:检验两个(或多个)样本率或构成比之间差别是否有统计学意义,从而推断两个(或多个)总体率或构成比之间是否有统计学意义。若P<0.05,拒绝无效假设H0,做出总体上差异有显著性意义的结论。 多组间的两两比较,必须重新规定检验水准。 分类:行×列表x2检验、四格表x2检验、配对x2与一致性检验、分层x2检验 二、界面介绍 1、分类资料数据录入格式简介 在定量资料中,一般每个观察对象的变量值都不一样,记录格式为一个观察病例一条记录。而在分类资料中,所有的变量值都限于很少的几个类别。为记录方便,常常采用频数表格式来记录数据,一条记录对应多个观察病例。对频数资料,分析时需用Weight Cases过程指定一下频数变量用于记录加权。 2、Crosstabs过程界面说明: 【Rows框】用于选择行*列表中的行变量。 【Columns框】用于选择行*列表中的列变量。 【Layer框】Layer 指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用 Previous 和 Next 钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。 【Display clustered bar charts复选框】显示重叠条图。 【Suppress table复选框】禁止在结果中输出行*列表。 【Exact钮】针对2*2以上的行*列表设定计算确切概率的方法,可以是近似概率(Asymptotic only)、蒙特卡罗模拟概率(Monte Carlo)或确切概率计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计

第十二章 卡方检验

第十二章 卡方检验 学习要点 第一节 卡方分布 第二节 卡方检验 第三节 卡方检验的用途 本章小结 学习要点 1.领会χ2检验的思想和应用条件 2.熟练掌握适合性检验和独立性检验的各种方法 3.初步掌握SPSS 中关于χ2分析的操作方法 第一节 卡方分布 一、2 χ的意义及特性 (一)2χ的基本数学定义 χ是一个希腊子母,读音chi (即卡,西,开等),2χ读作“卡平方”或“卡方”,是 国际通用的统计符量。2 χ是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。若以0f 表示实测次数,t f (或e f )表示期望次数,则有 ()e e f f f 2 02 -= χ 实测次数与期望次数差异的大小用2 χ值的大小来说明。2 χ检验(chi-square test )就是检验实测次数与期望次数是否一致的统计方法。

(二)2 χ特性 1.可加性。2 χ的可加性是指若干个相互独立的2 χ值相加后的和仍然是一个2 χ值。根据数学基本定义得到的是一个2 χ值,而根据2 χ可加性的特征,2 χ检验的公式可写为 ()∑ -=e e f f f 2 02 χ 根据2χ可加性的特性,可以对2 χ进行合成与分解,因此2 χ检验能同时对多种资料进 行检验,能把两个或两个以上的实测次数与某种理论模型的期待次数进行比较。由上式可知, 2χ值的大小与组数有关,组数越多,2χ值越大。因此,在考虑2χ值大小的意义时,应同 时考虑组数的多少。 2.2 χ的偏离程度。由 ()∑ -=e e f f f 2 02χ可知,实测次数和理论次数的相对差距越 大,2χ值也越大。由于所得差值越大,除以e f 后,其2χ值也越大。所以2 χ值越大,其 偏离越大,差异的可能性越大;相反,2 χ值越小,偏离越小,差异的可能性越小。 3.若实测次数与理论次数相等,则2 χ值为0,即 ()0 2 02 =-= e e f f f χ 4.2χ值永远为正值。 5.2 χ分布的和也是2 χ分布。 6.2χ检验主要适用于计数资料的统计分析,它对总体分布不作任何假设,所以也称 非参数检验。2 χ检验最初是用于分析分类、非连续变量型的数据,但随着发展也可用于连 续、定量的数据,只是需按一定的标准或组距对事物分类,统计各类的人数后才能进行 2 χ检验。 二、2χ分布曲线及2 χ值表 (一)2 χ分布曲线 如果从总体中随机抽取许若干个样本,每一样本的实测次数与理论次数相比较都可以得到一个2 χ值,若干个样本就可以计算出若干个2 χ值。于是一切可能的2 χ值就组成了一个 的抽样分布,即2χ分布。如果以此绘制次数分布图,我们就可以得到一条2 χ分布曲线。 2χ分布曲线的特点是不以样本容量为转移,而以自由度为转移。自由度不同,则分布 曲线不同,所以2χ分布曲线不是一条,而是一簇。例如1=df ,2=df ,4=df ,6=df , 10=df 的2χ分布曲线如图12-1所示。2χ分布曲线的范围从0到无限大。自由度越小, 曲线越向右偏斜;随着自由度的增大,曲线逐渐趋于对称;当自由度大于30时,曲线近似正态分布。

相关文档
最新文档