第十章 卡方检验..

第十章 卡方检验..
第十章 卡方检验..

第十章χ2检验

χ检验的原理

第一节2

χ检验的假设

一、2

(一)分类相互排斥,互不包容

2

χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。

(二)观测值相互独立

各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。

当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。

(三)期望次数的大小

每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格

χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2

10,这样才能保证检验的准确性。

另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。

用近似的2

χ检验的类别

二、2

(一)配合度检验

配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2

χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。

(二)独立性检验

独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立

χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

立),如果再加入另一个变量的影响,即探讨三个变量之间关系时,就必须使用多维列联表分析方法。

(三)同质性检验

同质性检验的主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说两个母总体是同质的,反之,则说这两个母总体是异质的。

三、2χ检验的基本公式

2χ是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义

是实测次数与期望次数之差的平方与期望次数的比率。2

χ检验就是检验实测次数与期望次数是否一致的统计方法。

基本公式如下:

2

)

(∑-=e

e f f f χ 其中 0f 表示实际观察次数,e f 表示某理论次数。 要求:≥e f 5

四、小期望次数的连续性校正

第一,单元格合并法。若有一格或多个单元格的期望次数小于5时,在配合研究目的情况下,可适当调整变量的分类方式,将部分单元格予以合并。

第二,增加样本数。如果研究者无法改变变量的分类方式,又想获得有效样本,最佳的方法是直接增加样本数来提高期望次数。

第三,去除样本法。如果样本无法增加,次数偏低的类别又不具有分析与研究价值时,可以将该类被试除去,但研究的结论不能推论到这些被除去的母总体中。

第四,使用校正公式。在2×2的列联表检验中,若单元格的期望次数低于10但高于5,可使用耶茨校正(Yates ’ correction for continuity)公式来加以校正。若期望次数低于5时,或样本总人数低于20时,则应使用费舍精确概率检验法(Fisher ’s exact probability test)。当单元格内容牵涉到重复测量设计时(例如前后测设计),则可使用麦内玛检验(McNemar test)。

第二节 配合度检验

配合度检验(goodness of fit test )主要用于检验单一变量的实际观察次数分布与某理论次数是否有差别。由于它检验的内容仅涉及一个因素多项分类的计数资料,故可以说是一种单因素检验(One-way test)。

一、配合度检验的一般问题

1.建立假设

0H :e f f =0 a H :e f f =0

在2χ检验中,理论(或期望)次数的确定就取决于这种比例的假设。

2χ的临界值是在0H 成立的条件下导出理论分布,并由2χ公式计算出来的。若实际计

算出的2χ值大于理论上的临界值()205.0df χ,即2

χ>()2

05.0df χ则说在05.0=α的显著水平上

拒绝0H 。

2.自由度的确定原则

自由度确定的一般原则是:以相互独立的类别数k (或C )减去所受的限制数M ,即

M k df -=

在各种适合性检验中,如果理论次数只受到总和的限制,即受∑∑=e f f

的限制,

则自由度为

1-=k df

在正态分布的适合性检验,因其除了受

∑∑=e f f

的限制以外,还受理论分布的均

数和标准差两个未知参数的限制,即受到三个条件的限制,其自由度为

3-=k df

3.理论次数的计算规则

一是数据分布有其理论概率为依据,这时的理论次数()e f 等于总次数乘以某种属性出现的概率(p ),即

Np f e =

理论次数的计算,一般是根据某种理论,按一定的概率通过样本即实际观察次数计算。某种理论有经验概率,也有理论概率,如二项分布、正态分布等理论概率。

二、配合度检验的应用 (一)检验无差假说

这里讲的无差假说,是指各项分类的实计数之间没有差异,也就是假设,各项分类之间的几会相等,或概率相等,因此理论次数完全按概率相等的条件计算。即:

理论次数=总数×

例10-1:随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异?

解:1)建立假设

(赞成与反对的人数相等)

分类项数

1

f f H e =00:

(赞成与反对的人数不相等)

2)计算统计量

302

1

60=?

=e f 30

)3021(30)3039()(222

2

-+

-=-=∑

f

f

f e

e

χ 4.530

)9(92

2=-+=

3)进行统计决策 查2

χ表,当1=df 时,,

,63.684.3201

.02

05

.0==χ

χ

因为4.52

=χ,2

01.02205

.0χχχ<<,

所以,05.001.0<

例10-2:某项民意测验,答案有同意、不置可否、不同意三种。调查了48人,结果同意的24人,不置可否的12人,不同意的12人。问持这三种意见的人数是否有显著不同?

解:此题为检验无差假说,已知分类的项数为三,故各项分类假设实计数相等。所以

1)建立假设

f

f

H e

=

f

f

H e

1

2)计算统计量

616

)1612(16)1612(16)1624(2

222

=-+-+-=

χ 3)进行统计决策 查

2χ表,当213=-=df 时,99.52

05.0=χ,因为2

05.026χχ?=,所以

05.0

(二)检验假设分布的概率

假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差异。因为已假定所观察的资料是按正态分布的,故其理论次数的计算应按正态分布概率,分

f f H e ≠01:16

3

148,

48,3

1

=?===f

e

N p

别计算各项分类的理论次数。具体方法是先按正态分布理论计算各项分类应有的概率再乘以总数,便得到各项分类的理论次数。

如果不是事先假定所观察的资料为正态分布而是其他分布,如二项分布、泊松分布等,其概率应按各所假定的分布计算。事先假定的分布不是理论分布而是经验分布,亦可按此经验分布计算概率,在乘以总数便可得到理论次数,从而进一步检验假设分布与实计数的分布之间,亦即实计数与理论次数之间差异是否显著。

例10-3:某班有学生50人,体检结果按一定标准划分为甲乙丙三类,其中甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布?

解:该题中的理论次数应按假设的正态分布概率计算。按正态分布,就可以认为

σ3± 包括了全体,各等级所占的横坐标应该相同(σσ236=÷),故各类人数应占的比

率为:

甲级:σσ1~3之间,曲线下的面积应为1587.03413.050.0=- 乙级:σσ1~1-之间,曲线下的面积应为6826.023413.0=? 丙级:σσ3~1--之间,曲线下的面积应为1587.03413.050.0=- 各等级的理论次数为:

8501587.0≈?=甲e f

1)建立假设

H 0:学生的身体状况符合正态分布 H 1:学生的身体状况不符合正态分布 2)计算统计量

44.11881034342488162

222

=-+-+-=)()()(χ

3)进行统计决策 当213=-=df 时,

6.10205

.0=χ

,χ

χ205

.02

>,所以达到显著性水平,拒绝原假设。

说明学生身体状况不符合正态分布。

例10-4:根据以往的经验,某校长认为高中生升学的男女比例为2 :1,今年的升学情况是男生85人,女生35人,问今年升学的男女比例是否符合该校长的经验?

解:此题是假设男女生升学的人数分布与校长的经验分布相同,故理论次数应按经验分布的概率计算

34506826.0=?=f

e 乙

8

501587.0≈?=f

e 丙

理论次数为:

803

2)3585(=?+=f

e 男

403

13585=?+=)(女

f

e

1) 建立假设

H 0:男女升学比例符合校长经验 H 1:男女升学比例不符合校长经验 2)计算统计量

94.04040-358080-852

22

=+=)()(χ

3)进行统计决策 当12-=df 时,

84.3205

.0=χ

,因为χ

χ205

.02<,故差异不显著。接受原假设。说明男

女升学比例符合校长经验。

三、连续变量分布的吻合性检验(自学)

对于连续性数据总体分布的检验,一种方法是将测量数据整理成次数分布表,画出次数分布曲线图,根据次数分布曲线,判断选择恰当的理论分布。有时可选择某一直线或曲线的理论分布函数方程式计算理论次数,然后把实际分组次数(0f )和理论次数(e f )代入检验的基本公式,计算2

χ 值查2

χ表,确定其差异是否显著。

若差异显著,说明实际次数分布于所选择的理论次数分布不吻合,这时可另选择理论分布函数,再次比较,直至吻合,这个理论分布函数就是该实际测量的次数分布函数。若差异不显著则说明所选的理论次数分布于实际次数分布吻合。

对连续随机变量分布的吻合性检验,关键的步骤是计算理论次数与确定自由度。理论次数的计算是把实际次数分布的统计量代入所选的理论分布函数方程,计算各分组区间的理论频率,然后乘以总数得到各分组区间的理论次数。确定自由度时是将分组的数目减去计算理论次数是所用统计量的数目。

下面以正态分布吻合性检验为例,说明理论次数的计算与自由度的确定。

例10-5:表10-1所列资料是552名中学生的身高次数分布,问这些学生的身高分布是否符合正态分布。

解:(1)本题要求检验实际次数分布与正态分布是否符合,它的理论次数计算应该根据正态分布概率,查正态曲线表得到。

一般地,这一类问题计算理论次数的方法有两种。

第一种方法的具体步骤包括:①求各分组区间组中值 与平均数的离差x ;②求各

离差的Z 分数;③根据Z 分数查正态表求y 值;④将y 值乘以 (以Z 分数为单位的组

X c s i

间距),得到按正态分布各分组区间的概率p ;⑤求各组的理论次数 。

第二种方法的步骤是:①求各分组精确上、下限的Z 分数, ; ②查正

态表求各Z 分数的概率;③求各分组区间的概率;用精确上限查到的概率值减去精确下线查到的概率值,这是平均数以上各分组区间的求法。若用平均数以下各分组区间则与

此相反;④用各组区间的概率乘以总数,求出各组的理论次数,即 。

下表是按照第一种方法计算理论次数的过程。

(2)有了各组的理论次数与实际次数,代人 基本公式,得到 。

(3)确定自由度。本题共分11组,在计算理论次数时,为了克服由于分组最高组和最低组两极端次数太少给 带来的影响,进行了组别合并。一般合并分组的原则是当 小于5时,就应合并。合并后为9组。在计算理论次数的过程中共用到平均数、标准差、总数三个统计量,故本题的自由度df=9-3=6

第三节 独立性检验

身高 分组

X

c

f

x

Z

y p

f

e

f

f f

e

e )

2

(

-

169~ 170 2 15.38 3.03 0.0040 0.00237 1 166~ 167 7

12.38 2.44 0.0020 0.01201 7 }0.125

163~ 164 22 9.38 1.85 0.0720 0.04260 24 0.167 160~ 161 57 6.38 1.26 0.1840 0.10888 60 0.150 157~ 158 110 3.38 0.67

0.3187 0.18858 104

0.471 154~ 155 124 0.38 0.07 0.3979 0.23544 130 0.277 151~ 152 112 -2.26 -0.52 0.3484 0.20615 114 0.035 148~ 149 80 -5.26

-1.11 0.2154 0.12746 70

1.429 145~ 146 25 -8.26 -1.70 0.0940 0.05562 31 1.161

142~ 143 8 -11.26 -2.29 0.0289 0.01710 9 139~ 140

4

-14.26 -2.88 0.0067 0.00396 2

}0.090

N=552 62.154=X s=5.07 552=∑f

e

905.32=χ

N p f e ?=标准差

平均数

组限-=Z N p f

e ?=2

χ905.32

=χ2χf

e 合正态分布。

名中学生的身高分布符答:故差异不显著。

,用内插法计算得,时值表。当查552,,905.335

.545.36)4(205.0226938.02

50.0275.02χχχχχχ<====df

独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。

如果要研究的两个因素(又称自变量)或两个以上因素之间是否具有独立性,或有无关联的,或有无“交互作用”的存在,就要独立性检验。其目的在于检验从样本得到的两个变量的观测值,是否具有特殊的关联。

一、独立性检验的一般问题与步骤 (一)统计假设

独立性检验的虚无假设是二因素(或多因素)之间是独立的或无关联的,备择假设则是 二因素(或多因素)之间有关联或者说差异显著。一般多用文字叙述而很少用统计符号表示。

(二)理论次数的计算

独立性检验的理论次数是假设两个变量没有关联的情况下推算出来的。二变量或称两样本其各行或各列数目的和,即每一项分类的数目与总数(N )的比值,提供了样本的比率。

N

n n f c

r e =

(三)自由度的确定

两因素列联表自由度与两因素各自的分类项数有关。设R 为每一行的分类项数,C 为每一列的分类数目,则自由度为: df=(R-1)(C-1)

(四)统计方法的选择

一般应用独立性检验的场合,独立样本居多用2χ检验的基本公式计算: 简捷式:

(五)结果及解释

①查df 为)1)(1(--C R 时确定2

χ临界值,如果2

01.02205.02χχχ或)(?,

则接受原假设,说明两个因素无关联,或者两个因素独立。

②当2

01.02

205.02

χχχ或)(?,则拒绝原假设,说明两个因素有关联,或者两个因素不独立。 二、四格表独立性检验 (一)独立样本四格表检验 计算公式:

-=f

f

e

e f 2

2)(

χ)

1(22

-=∑

f

f

f yi

xi

oi

N χ

)

)()()(()(2

2

D B C A D C B A BC AD N ++++-=

χ

式中A,B,C,D 分别为四格表内各格的实计数,(A+B ),(C+D ),(A+C ),(D+B ) 为各边缘次数,自由度df=1。

四格表各单元格表示方式具体见表如下所示:

因素A

因素B

分类1

A+B

分类2

C+D

A+C

B+D

N=A+B+C+D

例10-7:随机抽取90人,按男女不同性别分类,将学生成绩分为中等以上中等以下两类,结果如下。问男女生在学业水平是是否有关联?

学业水平

性 男 40(A+B ) 别 女 50(C+D )

51(A+C )

39(B+D )

90

解:1)建立假设

H 0:男女生在学业成绩上没有关联 H 1:男女生在学业成绩上有关联 2)计算统计量

02036

.039

51504090

)28172223(22

=?????-?=χ

3)进行统计决策

查χ2

表,当1=df 时,84.32)

1(05.0=χ,205

.02

χχ<

,所以接受原假设,说明男女生在学业成绩上没有关联。

在2×2列联表中若某格的理论次数小于5,一般需要进行耶茨校正,其校正公式为

(

)()()()d b c a d c b a N bc ad N ++++?

?? ??

--=

2

22χ

例10-8:今对一广告的态度调查,随机抽20名被试对该广告进行评价。试问对广告的偏好与性别有无关联?

显然,有两格的实际次数小于5,其理论次数有可能小于5,故需用校正公式。

01

.07200805151282201937202

2==????

?? ??

-?-??=χ 01.02=χ<()484.32

05.01=χ,说明对广告的偏好与性别没有关联。 3)2

χ与φr 的关系

在2×2列联表的独立样本2χ检验中,不仅可以检验两种变量的相倚关系,而且还可

以对“二分变量”的φ相关系数进行显著性检验。只要2

χ检验结果是显著的,就可以检验

φr 是否与零相关的虚无假设有显著的差别,这是因为二者之存在着以下关系:

①22?χNr =,即2χ是φr 系数的函数。

N r 2

χ?=

2.相关样本的2

χ检验

(二)相关样本四格表检验 检验公式为:

例10-8:100名学生先后测验两次,结果如下:

测验1

测验2 对 60(A+B ) 错 40(C+D )

30(A+C )

70(B+D )

100

解:1)建立假设

0H :两次测验分数无显著关系。 a H :两次测验分数有显著关系。

2)计算统计量

D

A D A +-=

2

2

)(χ

()d

a d a +-=

2

2

χ

()5

15

51552=+-=

3)进行统计决策

查2χ值表,当1=df 时,()84.3205.01=χ,()63.6201.01=χ。因为52=χ>

()84.3205.01=χ,p <0.05,相关显著。所以,拒绝虚无假设,接受研究假设,表明两次测验

分数是有关系。

(三)四格表2χ值的近似校正

当四格表中某一格的理论次数小于5时,需要进行叶茨校正,其公式为

三、R ×C 表独立性检验 其假设形式:

0H :假设总体中任何一行(或列)的次数比例分配对所有的行(或列)都相等。

a H :假设总体中任何一行(或列)的次数比例分配时所有的行(或列)都不相等。

()∑

-=f

f f ei

ei oi 2

2

χ 或

????

? ?

?

-?=∑

12

2

f

f f yi

xi

oi N χ 例10-9:某校对学生的课外活动内容进行调查,结果如下表所示。

性别

课外活动 合计

体育 文娱 阅读 男 21(15.3) 11(10.2) 23(29.5) 55 女 6(11.7) 7(7.8) 29(22.5) 42 合计

27

18

52

97 男f 559727

? 559718

? 559752

? 女f

429727

? 429718

? 4297

52

?

解:1)建立假设

0H :性别与课外活动没有关联。 a H :性别与课外活动有关联。

D A D A +--=

2

2

1||)(χ

2)计算统计量

各单元格理论次数的计算:

5

.22)5.2929(8.7)8.77(7.11)7.116(5.29)5.2923(2.10)2.1011(3.153.1521222222

2

-+

-+-+-+-+-=)(χ

= 8.3127

3) 进行统计决策

查表,当()()21213df =--=时,χ

χχ01

.005

.02

22

<<,所以达到显著性水平,说

明性别与课外活动内容有关联。

2、简捷式

采用定义式计算有诸多不便之处,一是随着分类个数的增多需要计算理论次数增多,增大了计算工作量;二是在理论次数计算中常需四舍五入,使计算结果的误差增大。为此可以采用相对简捷的公式计算,即

????

? ?

?

-?=∑

12

2f

f f yi

xi

oi N χ 例10-9用简捷式计算,则有

3217

.815242291842727426525523185511275521972

222222

=???

? ??-?+?+?+?+?+??=χ

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 解:(1)Y F (从上到下):50;30;100. X F (从左到右) :115;65. (2)P 11=15/180;P 21=35/180;1 Y F =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3 Y F N =100/180;

1X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居” y 紧张 一般 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:

SPSS 卡方检验

卡方检验 1.四格表的卡方检验 例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性。其中179人未曾使用该抗生素,其耐药率为40.78%;而在395例曾用过该药的人群中,耐药率为45.57%,结果见表1,试兑现人和上人群的耐药率是否一样? 表1 某抗生素的人群耐药性情况 用药史不敏感敏感合计 曾服该药180(174.10)215(220.90)395 未服该药73(78.90)106(100.10)179 合计253 321 574 建立变量名:

录入数值: 加权

统计分析 指定横标目和纵标目,注意不要选反了,选反了会有什么后果?

择分析方法:卡方检验 Chi-square 结果:实际频数理论频数

表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。P=0.285≥0.05还不能认为两组耐药率不同。 表三: (1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专

(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。 (3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。 2.配对四格表的卡方检验 例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计20 8 28 建立变量名: 录入数值:

第八章卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

第八章 卡方检验与交互分析#(精选.)

第八章卡方检验与交互分析 交互分析是社会调查研究中常用方法之一,用于研究两个定类变量的关系。交互分析中用于检验两个变量是否相关的方法叫做卡方检验,也叫独立性检验。卡方检验是建立在观测频次和期望频次之差基础上的一种检验。 一、卡方检验的原理 例:一项调查得到890个样本的与收入和所处地区的数据,希望分析收入和地区的关系。 表1 要检验的H0:收入和地区之间没有相关性,即每一地区的收入分布模式应该是相同的,收入的高低不应随着地区的不同而有所差异。也就是说,如果东部城市的四个收入类别各自比重和中西北部城市的四个收入类别各自比重一致,那么,收入和地区之间是相互独立的。 如果这个890人的样本能够反应总体的独立性特征,那么就应该能够观测到两个地区具有相同的收入分布模式,称为期望模式,样本的期望观测频次如下:表2 接下来,计算观测频次f0与期望频次f e之间的偏差(f0-f e),如果这些偏差比较小,则有利于证明原假设即总体的独立性。反之,则可能推翻原假设。但偏差之和为0,所以对偏差进行平方。但是,为了说明每一个偏差的相对重要性,每一偏差平方和都需要和本组中的期望频次相比较,计算相对(f0-f e)2/f e。然后,将所有组的贡献相加,从而得到度量全部偏差的一个量,叫做卡方

χ2= ,服从自由度为(c-1)(r-1)的卡方分布。如用c 和r 分别表示表 中的列数和行数,自由度为(c-1)(r-1)。 f 0 f e 153.3 164.7 80 86 66 71 129.7 139.3 (f 0-f e ) (f 0-f e )2/f e 计算出卡方值后,可根据已知 的显著性 水平和自由度查卡方分布表,找出临界值,与之作对比。反过来,也可以计算出概值,再根据我们所希望的显著性水平做比较。该例题中计算出χ2为31.6,查表发现对应自由度为3的那一行的所有临界值都小于χ2,因此,概值小于0.001。由于概值如此小,检验水平可以是1%甚至更小,所以一定可以拒绝原假设。也就是说,在总人口中,收入与地区有显著的相关性,二者并不独立。 练习题:在电视的收视率调查中,得到性别与收视习惯的联列表如下,试分析性别和收视习惯的关系。 男 女 总频次 几乎天天看 38 24 62 偶尔看 31 7 38 总频次 69 31 100 相对频率 0.69 0.31 1.00 解:原假设为“性别和收视习惯相互独立”,如果原假设成立,那么两列期望凭此应通过0.69和0.31分别乘以最后一列总频次而得到。 42.8 19.2 146 172 66 100 51 86 166 103 -7.3 7.3 -14 14 -15 15 36.3 -36.3 0.35 0.32 2.45 2.28 3.41 3.17 10.16 9.46 38 24 31 7

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

第十二章 基于秩转换的非参数检验

第十二章基于秩转换的非参数检验A1型题 1 .两组资料比较中,若样本例数n 较小,总体方差不齐,宜采用() A .对数变换 B .秩和检验 C . t 检验 D .方差分析 E . A 、B 都可以 2 .请指出下列五个秩和检验的结果哪个是错误的() A .配对计量资料n=12 , T +=7 , T - =71 查表T 0.05 =13 ~65 ,P<0.05 B .配对计量资料n=8 , T +=12 , T - =24 查表T 0.05 =3 ~33,P<0.05 C .两组计量资料n 1=12, n 2 =10, T 1 =173, T 2 =80 查表T 0.05 =85~145, P< 0.05 D .两组计量资料n 1=10, n 2 =10, T 1 =55,T 2 =15 查表T 0.05 =79~131 , P< 0.05 E .两组计量资料n 1=9, n 2 =13 , T 1 =58, T 2 =195 查表T 0.05 = 581~24 , P< 0.05 3 .配对比较的秩和检验,若检验假设H 成立,则() A .差值为正的秩和与差值为负的秩和相差不会很大 B .差值为正的秩和与差值为负的秩和可能相差很大 C .正秩和的绝对值大于负秩和的绝对值 D .正秩和的绝对值小于负秩和的绝对值 E .正秩和与负秩和相等 4 .以下检验方法除()外,其余均属非参数统计方法 A . Friedman's M 检验 B . H 检验 C .配对设计符号秩检验 D . t 检验 E .查r s 界值表法 5 .等级资料比较宜采用() A . t 检验 B . x2检验 C . u 检验 D .秩和检验 E .t检验 6 .两个小样本数值变量资料比较的假设检验,首先应考虑() A ,用t 检验 B .用秩和检验 C . t 检验或秩和检验均可 D .用u 检验 E .资料符合t 检验还是秩和检验的条件 7 .符合t检验条件的数值变量资料若采用秩和检验,不拒绝H 时,可使() A . I 型错误增大 B . Ⅱ型错误增大

卡方检验应用

卡方检验应用

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据 统计方法。 卡方检验是专用于解决计数数据统计分析 的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否 有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 ~ 解:(1)Y F (从上到下):50;30;100. X F (从左到右):115;65.

(2)P 11=15/180;P 21=35/180;1 Y F N =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180; 1 X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 ! P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 》 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 . 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x : 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 · 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居”

y 紧张 一般 * 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 10-29。 (2)根据表10-28和表10-29计算2χ,计算公式为 2 ()2 o e e f f f χ-=∑ 。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 * 述研究假设1H 和虚无假设0H 。 (4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表, 找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差 异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。

卡方检验

卡方(2χ)检验 常用于检验两个或多个样本率(或构成比)之间有无差别,也用于检验配对计数资料的 差异等。 (一)四格表资料的卡方检验 [例7-30] 某医院用甲、乙两种药物治疗十二指肠球部溃疡,结果见表7-12,试问两种药物疗效有无差别? 表7-12 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(a ) 25(b ) 100(a +b ) 75.00 乙 合 计 50(c ) 30(d ) 80(c +d ) 62.50 125 55 180(n ) 69.44 1.四格表2χ检验的基本公式为: ∑ -=T T A 2 2 )(χ (公式7-44) (1)建立假设,确定检验水准 H 0:π1=π2,即两组愈合率相同; H 1: π1≠π2,即两组愈合率不同; α=0.05 (2)计算理论数RC T n n n T C R RC = (公式7-45) 表7-13 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(69.44) 25(30.56) 100 75.00 乙 合 计 50(55.56) 30(24.44) 80 62.50 125 55 180 69.44 (3)计算检验统计量2χ值 按公式7-44计算: =3.27 (4)确定P 值 ν=(R-1)(C-1)。 本例ν=(2-1)(2-1)=1,查2χ界值表,2105.0,χ=3.84,2 1,1.0χ=2.71,故0.1>P >0.05。 (5)做出推断结论 按α=0.05水准,不拒绝H 0,差异无统计学意义。还不能认为两种药物治疗十二指肠球部溃疡疗效有差别。 2.四格表的专用公式 四格表资料还可用专用公式求2χ值。 44 .24)44.2430(56.55)56.5550(56.30)56.3025(44.69)44.6975()(2 22222 -+ -+-+-=-=∑T T A χ

第十二章直线相关与回归

第十二章 直线相关与回归 A 型选择题 1、若计算得一相关系数r=0.94,则( ) A 、x 与y 之间一定存在因果关系 B 、同一资料作回归分析时,求得回归系数一定为正值 C 、同一资料作回归分析时,求得回归系数一定为负值 D 、求得回归截距a>0 E 、求得回归截距a ≠0 2、对样本相关系数作统计检验(H 0:ρ=0),结果0.05()v r r >,统计结论是( )。 A. 肯定两变量为直线关系 B 、认为两变量有线性相关 C 、两变量不相关 B. 两变量无线性相关 E 、两变量有曲线相关 3、若1210.05()20.01(),v v r r r r >>,则可认为( )。 A. 第一组资料两变量关系密切 B. 第二组资料两变量关系密切 C 、难说哪一组资料中两变量关系更密切 D 、两组资料中两变量关系密切程度不一样 E 、以上答案均不对 4、相关分析可以用于( )有无关系的研究 A 、性别与体重

B、肺活量与胸围 C、职业与血型 D、国籍与智商 E、儿童的性别与体重 5、相关系数的假设检验结果P<α,则在α水平上可认为相应的两个变量间() A、有直线相关关系 B、有曲线相关关系 C、有确定的直线函数关系 D、有确定的曲线函数关系 E、不存在相关关系 6、根据样本算得一相关系数r,经t检验,P<0.01说明() A、两变量有高度相关 B、r来自高度相关的相关总体 C、r来自总体相关系数ρ的总体 D、r来自ρ≠0的总体 E、r来自ρ>0的总体 7、相关系数显著检验的无效假设为() A、r有高度的相关性 B、r来自ρ≠0的总体 C、r来自ρ=0的总体 D、r与总体相关系数ρ差数为0 E、r来自ρ>0的总体

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张 下一张 主 页
退 出

第一节
性别 男 女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1:1, 即与1:1性别比差异是否显著。 性别比差异是否显著。

χ =
2

A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理 论次数偏离程度的一个统计量, 论次数偏离程度的一个统计量, χ2越小, 越小,表明实际观察次数与理 论次数越接近; 论次数越接近; χ2 =0,表示两 者完全吻合; 者完全吻合; χ2越大, 越大,表示两者 相差越大。 相差越大。
上一张 下一张 主 页 退 出

在对次数资料进行χ2检验利用连续型随 机变量χ2分布计算概率时, 分布计算概率时,常常偏低, 常常偏低,特 别是当自由度为1时偏差较大。 时偏差较大。 Yates(1934)提出了一个矫正公式, 提出了一个矫正公式,矫正 后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张 下一张 主 页
退 出

当自由度大于1时,χ2分布与连续型随机 变量χ2分布相近似 ,这时, 这时,可不作连续性矫 正 , 但 要 求各组内的理论次数不小于5。若 某组的理论次数小于5,则应把它与其相邻的 一组或几组合并, 一组或几组合并,直到理论次数大 于5 为 止。

卡方检验12

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。 检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为:

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2 T1.2=43-26.2=16.8 T2.1=53-26.2=26.8 T2.2=44-26.2=17.2 3.计算x2值按公式20.12代入 4.查x2值表求P值 在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。 通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。 二、四格表的专用公式

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

10练习题解答:第十章交互分类与卡方检验

第十章交互分类与F检验 练习题: 1.为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭, 调查结果如下表所示: 表10-26 (1)计算变量X与Y的边际和(即边缘和)F x和F Y并填入上表。 (2)请根据表10-26的数据完成下面的联合分布的交互分类表。 表10-27 (3)根据表10-27指出关于X的边缘分布和关于Y的边缘分布。 (4)根据表10-27指出关于X的条件分布和关于Y的条件分布。解:(1)Fy(从上到下):50: 30: 100. 竹(从左到右): 115: 65. (2) P n=15/180: P.35/1S0: ^.50/180:

% P:c=20/180; P产 10/180:=30/180:

5 P沪80/180; P沪20/180:市二100/180: Fx\ Fx? N =115/180:=65/180. (3 关于y的条件分布有两个: X 2.一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 表10-28

(1)根据 表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 述研究假设0和虚无假设H{) o (4)本题口中的自山度为多少若显著性水平为,请查附录的才分布表, 找出相对应的临 界值。并判断有无宗教信仰的人的利他主义程度有无显著性差异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C系 数。 解:(1)"信教” 一列(从上到下): ,,9X,85 =61.67: 357 125X185 =64.78; 357 ,,3X185=58.56. 357 '‘不信教” 一列(从上到下):1,9X172 =57.33: 357 EG"?: 357

卡方检验1

第十三节卡方检验(1) 一、概述 用于分类计数资料的假设检验方法,属非参数检验。检验的是样本分布偏离理论分布的严重程度,即检验的是分布,不是总体参数。 Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。 统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。 原理:检验两个(或多个)样本率或构成比之间差别是否有统计学意义,从而推断两个(或多个)总体率或构成比之间是否有统计学意义。若P<0.05,拒绝无效假设H0,做出总体上差异有显著性意义的结论。 多组间的两两比较,必须重新规定检验水准。 分类:行×列表x2检验、四格表x2检验、配对x2与一致性检验、分层x2检验 二、界面介绍 1、分类资料数据录入格式简介 在定量资料中,一般每个观察对象的变量值都不一样,记录格式为一个观察病例一条记录。而在分类资料中,所有的变量值都限于很少的几个类别。为记录方便,常常采用频数表格式来记录数据,一条记录对应多个观察病例。对频数资料,分析时需用Weight Cases过程指定一下频数变量用于记录加权。 2、Crosstabs过程界面说明: 【Rows框】用于选择行*列表中的行变量。 【Columns框】用于选择行*列表中的列变量。 【Layer框】Layer 指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用 Previous 和 Next 钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。 【Display clustered bar charts复选框】显示重叠条图。 【Suppress table复选框】禁止在结果中输出行*列表。 【Exact钮】针对2*2以上的行*列表设定计算确切概率的方法,可以是近似概率(Asymptotic only)、蒙特卡罗模拟概率(Monte Carlo)或确切概率计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计

第十二章 卡方检验

第十二章 卡方检验 学习要点 第一节 卡方分布 第二节 卡方检验 第三节 卡方检验的用途 本章小结 学习要点 1.领会χ2检验的思想和应用条件 2.熟练掌握适合性检验和独立性检验的各种方法 3.初步掌握SPSS 中关于χ2分析的操作方法 第一节 卡方分布 一、2 χ的意义及特性 (一)2χ的基本数学定义 χ是一个希腊子母,读音chi (即卡,西,开等),2χ读作“卡平方”或“卡方”,是 国际通用的统计符量。2 χ是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。若以0f 表示实测次数,t f (或e f )表示期望次数,则有 ()e e f f f 2 02 -= χ 实测次数与期望次数差异的大小用2 χ值的大小来说明。2 χ检验(chi-square test )就是检验实测次数与期望次数是否一致的统计方法。

(二)2 χ特性 1.可加性。2 χ的可加性是指若干个相互独立的2 χ值相加后的和仍然是一个2 χ值。根据数学基本定义得到的是一个2 χ值,而根据2 χ可加性的特征,2 χ检验的公式可写为 ()∑ -=e e f f f 2 02 χ 根据2χ可加性的特性,可以对2 χ进行合成与分解,因此2 χ检验能同时对多种资料进 行检验,能把两个或两个以上的实测次数与某种理论模型的期待次数进行比较。由上式可知, 2χ值的大小与组数有关,组数越多,2χ值越大。因此,在考虑2χ值大小的意义时,应同 时考虑组数的多少。 2.2 χ的偏离程度。由 ()∑ -=e e f f f 2 02χ可知,实测次数和理论次数的相对差距越 大,2χ值也越大。由于所得差值越大,除以e f 后,其2χ值也越大。所以2 χ值越大,其 偏离越大,差异的可能性越大;相反,2 χ值越小,偏离越小,差异的可能性越小。 3.若实测次数与理论次数相等,则2 χ值为0,即 ()0 2 02 =-= e e f f f χ 4.2χ值永远为正值。 5.2 χ分布的和也是2 χ分布。 6.2χ检验主要适用于计数资料的统计分析,它对总体分布不作任何假设,所以也称 非参数检验。2 χ检验最初是用于分析分类、非连续变量型的数据,但随着发展也可用于连 续、定量的数据,只是需按一定的标准或组距对事物分类,统计各类的人数后才能进行 2 χ检验。 二、2χ分布曲线及2 χ值表 (一)2 χ分布曲线 如果从总体中随机抽取许若干个样本,每一样本的实测次数与理论次数相比较都可以得到一个2 χ值,若干个样本就可以计算出若干个2 χ值。于是一切可能的2 χ值就组成了一个 的抽样分布,即2χ分布。如果以此绘制次数分布图,我们就可以得到一条2 χ分布曲线。 2χ分布曲线的特点是不以样本容量为转移,而以自由度为转移。自由度不同,则分布 曲线不同,所以2χ分布曲线不是一条,而是一簇。例如1=df ,2=df ,4=df ,6=df , 10=df 的2χ分布曲线如图12-1所示。2χ分布曲线的范围从0到无限大。自由度越小, 曲线越向右偏斜;随着自由度的增大,曲线逐渐趋于对称;当自由度大于30时,曲线近似正态分布。

相关文档
最新文档