第十二章 卡方检验

第十二章 卡方检验
第十二章 卡方检验

第十二章 卡方检验

学习要点

第一节 卡方分布 第二节 卡方检验

第三节 卡方检验的用途 本章小结

学习要点

1.领会χ2检验的思想和应用条件

2.熟练掌握适合性检验和独立性检验的各种方法 3.初步掌握SPSS 中关于χ2分析的操作方法

第一节 卡方分布

一、2

χ的意义及特性

(一)2χ的基本数学定义

χ是一个希腊子母,读音chi (即卡,西,开等),2χ读作“卡平方”或“卡方”,是

国际通用的统计符量。2

χ是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。若以0f 表示实测次数,t f (或e f )表示期望次数,则有

()e

e f f f 2

02

-=

χ

实测次数与期望次数差异的大小用2

χ值的大小来说明。2

χ检验(chi-square test )就是检验实测次数与期望次数是否一致的统计方法。

(二)2

χ特性

1.可加性。2

χ的可加性是指若干个相互独立的2

χ值相加后的和仍然是一个2

χ值。根据数学基本定义得到的是一个2

χ值,而根据2

χ可加性的特征,2

χ检验的公式可写为

()∑

-=e

e f f f 2

02

χ

根据2χ可加性的特性,可以对2

χ进行合成与分解,因此2

χ检验能同时对多种资料进

行检验,能把两个或两个以上的实测次数与某种理论模型的期待次数进行比较。由上式可知,

2χ值的大小与组数有关,组数越多,2χ值越大。因此,在考虑2χ值大小的意义时,应同

时考虑组数的多少。

2.2

χ的偏离程度。由

()∑

-=e

e f f f 2

02χ可知,实测次数和理论次数的相对差距越

大,2χ值也越大。由于所得差值越大,除以e f 后,其2χ值也越大。所以2

χ值越大,其

偏离越大,差异的可能性越大;相反,2

χ值越小,偏离越小,差异的可能性越小。

3.若实测次数与理论次数相等,则2

χ值为0,即

()0

2

02

=-=

e

e f f f χ

4.2χ值永远为正值。

5.2

χ分布的和也是2

χ分布。

6.2χ检验主要适用于计数资料的统计分析,它对总体分布不作任何假设,所以也称

非参数检验。2

χ检验最初是用于分析分类、非连续变量型的数据,但随着发展也可用于连

续、定量的数据,只是需按一定的标准或组距对事物分类,统计各类的人数后才能进行

2

χ检验。

二、2χ分布曲线及2

χ值表

(一)2

χ分布曲线

如果从总体中随机抽取许若干个样本,每一样本的实测次数与理论次数相比较都可以得到一个2

χ值,若干个样本就可以计算出若干个2

χ值。于是一切可能的2

χ值就组成了一个

的抽样分布,即2χ分布。如果以此绘制次数分布图,我们就可以得到一条2

χ分布曲线。

2χ分布曲线的特点是不以样本容量为转移,而以自由度为转移。自由度不同,则分布

曲线不同,所以2χ分布曲线不是一条,而是一簇。例如1=df ,2=df ,4=df ,6=df ,

10=df 的2χ分布曲线如图12-1所示。2χ分布曲线的范围从0到无限大。自由度越小,

曲线越向右偏斜;随着自由度的增大,曲线逐渐趋于对称;当自由度大于30时,曲线近似正态分布。

第二节 卡方检验

一、卡方检验的意义

适合性检验(goodness of fit test )是检验实际的观察次数与某一理论模型是否相符,又称为1×C 表的2

χ检验。因为它包含单一变量的若干类别,其中C 是类别或组数,也称单因素计数资料的检验。

在心理与教育研究中,常需要对实测数据提出种种科学假设,而证实和推翻这些假设的正确性必须通过适合性的检验。这种检验的过程也是从总体中抽样,把样本数据与根据虚假设推出的理论数据相比较。一般情况下,实际数据与理论数据往往不可能完全一致,那么它

们之究竟有多大的差异才可以拒绝虚无假设则由2

χ值表给出。

二、几种常见的适合性检验 (一)二项分布的适合性检验

这是检验一个样本组的两个实测数据与其理论数是否一致的2

χ检验。因二项分布中

21

=

=q p ,所以其理论次数为:N f e 5.0=。

例12-1:我们去某地调查10000名儿童,其中男童5200名,女童4800名。问男女儿童人数之差有无显著意义?

1)建立假设

0H :男女儿童的人数相等或男女儿童的比例相等,即

21=

=q p 。

a H :男女儿童的人数不相等

2)计算统计量

根据虚无假设确定理论次数

500021

1000021=?=?

=N f e

()∑

-=e

e f f f 2

02

χ()()16

5000

500048005000500052002

2=-+

-=

3) 3) 比较与决策

查表2χ值表,当112=-=df 时,()63.6201.01=χ。因为162=χ>()63.6201

.01=χ,p <0.01,差异极显著。所以,拒绝虚无假设,接受研究假设,说明该地区男女儿童人数分布存在着极明显的差异。

(二)多项分布的适合性检验

这是检验三个或三个以上实测数与理论数的是否符合的2

χ检验。其中,包含实际次数

与理论次数是否适合及实际次数分布与正态分布是否适合的检验。

1)建立假设

0H :三种意见的人数相等(321n n n ==),即

31

321=

==p p p

a H :三种意见的人数不相等(n 1≠n 2≠n 3)

2)计算统计量 根据0H 有理论次数为:

2831

84=?

=e f

()()()50

.1028

2821282128422

222

=-+-+-=

χ

3)比较与决策

查表2χ值表,当213=-=df 时,()21.92

01.02=χ,因为2χ=10.50>()21.92

01.02=χ,

p <0.01,差异极显著。所以,拒绝虚无假设,接受研究假设,表明三种不同意见的人数差

异非常显著,且赞成男女同桌的人数占优势。

2.实际次数分布与正态分布理论的适合检验 1)建立假设

0H :实际次数分布符合正态分布。

a H :实际次数与不符合正态分布。

2)计算统计理

① 计算正态分布下的理论次数

根据第七章正态分布理论,求各等级在正态分布中的位置,即σ

σ

236=,则上等为σ

1以上,中等为σσ1~1-之间,下等为σ1-以下。由此确定各等级所占的比例及理论次数分别为

上等:16.03413.05.0=-=p ,4.64016.0=?=e f 中等:68.023413.0=?=p ,2.274068.0=?=e f 下等与上等相同:16.0=p ,4.6=e f ② 计算2

χ值

()()()53

.124

.64.682.272.27184.64.6142

222

=-+-+-=χ

3)比较与决策

查表2χ值表,当213=-=df 时,()21.92

01.02=χ,因为

53.122=χ>()21.92

01.02=χ,p <0.01,差异极显著。所以,拒绝虚无假设,接受研究假设,说明该班主任对学生学习能

力的评定人数不符合正态分布。

第三节 卡方检验的用途

一、独立性检验的意义

独立性检验(test for independence )是处理二元分类资料的2

χ检验方法,即把一组实验对象按两个标准(变量)分类,一个变量列在行内,另一个变量列在列内,形成列联表。独立性2

χ检验的目的是说明两个变量是彼此独立的(无差异的),还是彼此相关的(有差异的)。因此,其虚无假设是假设两个变量之间彼此独立,没有关联,故称为独立性检验。相反,研究假设假设两变量之间是彼此相关的。

二、二、几种独立性检验的方法 (一)2×2列联表的独立性检验

2×2列联表又称四格表,即由四个实测数据构成四个格子,其形式如表12-1所示。因相配性质不同,又有独立样本的2

χ检验和相关样本的2

χ检验。

1.独立样本的2

χ检验 1)一般式

()()()()()d b c a d c b a bc ad N ++++-=

2

2

χ

例12-4:甲、乙两校高中毕业生同时参加高校统一考试,结果甲校90名毕业生,录取了67名,乙校105名毕业生录取了65名。问两校录取人数之差有无显著意义?

这一研究中是双变量分类问题,一个变量为学校类型——甲校和乙校,另一个变量为录取结果——录取与未录取,形成一个2×2列联表,如表12-1所示。其中各项实际人数以字母a 、b 、c 、d 表示,其边际和则有(b a +)、(d c +)、(d b +)、(c a +)。

1)建立假设

0H :两校录取比例无显著差别,即乙甲p p =

a H :两校录取比例有显著差别,即乙甲p p ≠

2)计算统计量

()484.36313210590652340671952

2

=????-??=χ

3)比较与决策

查2χ临界值表,当1=df 时,()84.3205.01=χ。因为484.32=χ<()84.3205

.01=χ,p >0.05,差异不显著。所以,接受虚无假设,拒绝研究假设,即两校的录取率没有显著的差别。

2)校正式

在2×2列联表中若某格的理论次数小于5,一般需要进行耶茨校正,其校正公式为

()()()()d b c a d c b a N bc ad N ++++?

?? ??

--=

2

22χ

显然,有两格的实际次数小于5,其理论次数有可能小于5,故需用校正公式。

01

.07200805151282201937202

2==????

?? ??

-?-??=χ 01.02=χ<()484.32

05.01=χ,说明性别与幼儿的物体形状分类标准是独立的。

本章小结

2χ检验是适用于计数资料差异显著性的检验方法,是一种通过比较实际次数与理论次

数的偏差来检验二者是否一致的统计方法,其数学意义是实际次数与理论次数偏差平方比理论次数。2

χ值的最大特点是可加性,即多个2

χ值可相加,且永远为正值,2

χ分布的和也

是2χ分布。2χ分布是若干2χ值构成的抽样分布,2

χ分布曲线随自由度的变化而变化。

随着自由度的增大,曲线逐渐趋于对称;当自由度大于30时,曲线近似正态分布。2

χ检

验主要有适合性检验和独立性检验,前者适用于一元分类的计数资料,后者适用于多元分类的计数资料。

第八章卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

SPSS 卡方检验

卡方检验 1.四格表的卡方检验 例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性。其中179人未曾使用该抗生素,其耐药率为40.78%;而在395例曾用过该药的人群中,耐药率为45.57%,结果见表1,试兑现人和上人群的耐药率是否一样? 表1 某抗生素的人群耐药性情况 用药史不敏感敏感合计 曾服该药180(174.10)215(220.90)395 未服该药73(78.90)106(100.10)179 合计253 321 574 建立变量名:

录入数值: 加权

统计分析 指定横标目和纵标目,注意不要选反了,选反了会有什么后果?

择分析方法:卡方检验 Chi-square 结果:实际频数理论频数

表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。P=0.285≥0.05还不能认为两组耐药率不同。 表三: (1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专

(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。 (3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。 2.配对四格表的卡方检验 例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计20 8 28 建立变量名: 录入数值:

卡方检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

第十二章 基于秩转换的非参数检验

第十二章基于秩转换的非参数检验A1型题 1 .两组资料比较中,若样本例数n 较小,总体方差不齐,宜采用() A .对数变换 B .秩和检验 C . t 检验 D .方差分析 E . A 、B 都可以 2 .请指出下列五个秩和检验的结果哪个是错误的() A .配对计量资料n=12 , T +=7 , T - =71 查表T 0.05 =13 ~65 ,P<0.05 B .配对计量资料n=8 , T +=12 , T - =24 查表T 0.05 =3 ~33,P<0.05 C .两组计量资料n 1=12, n 2 =10, T 1 =173, T 2 =80 查表T 0.05 =85~145, P< 0.05 D .两组计量资料n 1=10, n 2 =10, T 1 =55,T 2 =15 查表T 0.05 =79~131 , P< 0.05 E .两组计量资料n 1=9, n 2 =13 , T 1 =58, T 2 =195 查表T 0.05 = 581~24 , P< 0.05 3 .配对比较的秩和检验,若检验假设H 成立,则() A .差值为正的秩和与差值为负的秩和相差不会很大 B .差值为正的秩和与差值为负的秩和可能相差很大 C .正秩和的绝对值大于负秩和的绝对值 D .正秩和的绝对值小于负秩和的绝对值 E .正秩和与负秩和相等 4 .以下检验方法除()外,其余均属非参数统计方法 A . Friedman's M 检验 B . H 检验 C .配对设计符号秩检验 D . t 检验 E .查r s 界值表法 5 .等级资料比较宜采用() A . t 检验 B . x2检验 C . u 检验 D .秩和检验 E .t检验 6 .两个小样本数值变量资料比较的假设检验,首先应考虑() A ,用t 检验 B .用秩和检验 C . t 检验或秩和检验均可 D .用u 检验 E .资料符合t 检验还是秩和检验的条件 7 .符合t检验条件的数值变量资料若采用秩和检验,不拒绝H 时,可使() A . I 型错误增大 B . Ⅱ型错误增大

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

卡方检验

卡方(2χ)检验 常用于检验两个或多个样本率(或构成比)之间有无差别,也用于检验配对计数资料的 差异等。 (一)四格表资料的卡方检验 [例7-30] 某医院用甲、乙两种药物治疗十二指肠球部溃疡,结果见表7-12,试问两种药物疗效有无差别? 表7-12 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(a ) 25(b ) 100(a +b ) 75.00 乙 合 计 50(c ) 30(d ) 80(c +d ) 62.50 125 55 180(n ) 69.44 1.四格表2χ检验的基本公式为: ∑ -=T T A 2 2 )(χ (公式7-44) (1)建立假设,确定检验水准 H 0:π1=π2,即两组愈合率相同; H 1: π1≠π2,即两组愈合率不同; α=0.05 (2)计算理论数RC T n n n T C R RC = (公式7-45) 表7-13 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(69.44) 25(30.56) 100 75.00 乙 合 计 50(55.56) 30(24.44) 80 62.50 125 55 180 69.44 (3)计算检验统计量2χ值 按公式7-44计算: =3.27 (4)确定P 值 ν=(R-1)(C-1)。 本例ν=(2-1)(2-1)=1,查2χ界值表,2105.0,χ=3.84,2 1,1.0χ=2.71,故0.1>P >0.05。 (5)做出推断结论 按α=0.05水准,不拒绝H 0,差异无统计学意义。还不能认为两种药物治疗十二指肠球部溃疡疗效有差别。 2.四格表的专用公式 四格表资料还可用专用公式求2χ值。 44 .24)44.2430(56.55)56.5550(56.30)56.3025(44.69)44.6975()(2 22222 -+ -+-+-=-=∑T T A χ

第十二章直线相关与回归

第十二章 直线相关与回归 A 型选择题 1、若计算得一相关系数r=0.94,则( ) A 、x 与y 之间一定存在因果关系 B 、同一资料作回归分析时,求得回归系数一定为正值 C 、同一资料作回归分析时,求得回归系数一定为负值 D 、求得回归截距a>0 E 、求得回归截距a ≠0 2、对样本相关系数作统计检验(H 0:ρ=0),结果0.05()v r r >,统计结论是( )。 A. 肯定两变量为直线关系 B 、认为两变量有线性相关 C 、两变量不相关 B. 两变量无线性相关 E 、两变量有曲线相关 3、若1210.05()20.01(),v v r r r r >>,则可认为( )。 A. 第一组资料两变量关系密切 B. 第二组资料两变量关系密切 C 、难说哪一组资料中两变量关系更密切 D 、两组资料中两变量关系密切程度不一样 E 、以上答案均不对 4、相关分析可以用于( )有无关系的研究 A 、性别与体重

B、肺活量与胸围 C、职业与血型 D、国籍与智商 E、儿童的性别与体重 5、相关系数的假设检验结果P<α,则在α水平上可认为相应的两个变量间() A、有直线相关关系 B、有曲线相关关系 C、有确定的直线函数关系 D、有确定的曲线函数关系 E、不存在相关关系 6、根据样本算得一相关系数r,经t检验,P<0.01说明() A、两变量有高度相关 B、r来自高度相关的相关总体 C、r来自总体相关系数ρ的总体 D、r来自ρ≠0的总体 E、r来自ρ>0的总体 7、相关系数显著检验的无效假设为() A、r有高度的相关性 B、r来自ρ≠0的总体 C、r来自ρ=0的总体 D、r与总体相关系数ρ差数为0 E、r来自ρ>0的总体

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张 下一张 主 页
退 出

第一节
性别 男 女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1:1, 即与1:1性别比差异是否显著。 性别比差异是否显著。

χ =
2

A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理 论次数偏离程度的一个统计量, 论次数偏离程度的一个统计量, χ2越小, 越小,表明实际观察次数与理 论次数越接近; 论次数越接近; χ2 =0,表示两 者完全吻合; 者完全吻合; χ2越大, 越大,表示两者 相差越大。 相差越大。
上一张 下一张 主 页 退 出

在对次数资料进行χ2检验利用连续型随 机变量χ2分布计算概率时, 分布计算概率时,常常偏低, 常常偏低,特 别是当自由度为1时偏差较大。 时偏差较大。 Yates(1934)提出了一个矫正公式, 提出了一个矫正公式,矫正 后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张 下一张 主 页
退 出

当自由度大于1时,χ2分布与连续型随机 变量χ2分布相近似 ,这时, 这时,可不作连续性矫 正 , 但 要 求各组内的理论次数不小于5。若 某组的理论次数小于5,则应把它与其相邻的 一组或几组合并, 一组或几组合并,直到理论次数大 于5 为 止。

卡方检验12

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。 检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为:

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2 T1.2=43-26.2=16.8 T2.1=53-26.2=26.8 T2.2=44-26.2=17.2 3.计算x2值按公式20.12代入 4.查x2值表求P值 在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。 通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。 二、四格表的专用公式

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

卡方检验1

第十三节卡方检验(1) 一、概述 用于分类计数资料的假设检验方法,属非参数检验。检验的是样本分布偏离理论分布的严重程度,即检验的是分布,不是总体参数。 Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。 统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。 原理:检验两个(或多个)样本率或构成比之间差别是否有统计学意义,从而推断两个(或多个)总体率或构成比之间是否有统计学意义。若P<0.05,拒绝无效假设H0,做出总体上差异有显著性意义的结论。 多组间的两两比较,必须重新规定检验水准。 分类:行×列表x2检验、四格表x2检验、配对x2与一致性检验、分层x2检验 二、界面介绍 1、分类资料数据录入格式简介 在定量资料中,一般每个观察对象的变量值都不一样,记录格式为一个观察病例一条记录。而在分类资料中,所有的变量值都限于很少的几个类别。为记录方便,常常采用频数表格式来记录数据,一条记录对应多个观察病例。对频数资料,分析时需用Weight Cases过程指定一下频数变量用于记录加权。 2、Crosstabs过程界面说明: 【Rows框】用于选择行*列表中的行变量。 【Columns框】用于选择行*列表中的列变量。 【Layer框】Layer 指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用 Previous 和 Next 钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。 【Display clustered bar charts复选框】显示重叠条图。 【Suppress table复选框】禁止在结果中输出行*列表。 【Exact钮】针对2*2以上的行*列表设定计算确切概率的方法,可以是近似概率(Asymptotic only)、蒙特卡罗模拟概率(Monte Carlo)或确切概率计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计

第十二章 卡方检验

第十二章 卡方检验 学习要点 第一节 卡方分布 第二节 卡方检验 第三节 卡方检验的用途 本章小结 学习要点 1.领会χ2检验的思想和应用条件 2.熟练掌握适合性检验和独立性检验的各种方法 3.初步掌握SPSS 中关于χ2分析的操作方法 第一节 卡方分布 一、2 χ的意义及特性 (一)2χ的基本数学定义 χ是一个希腊子母,读音chi (即卡,西,开等),2χ读作“卡平方”或“卡方”,是 国际通用的统计符量。2 χ是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。若以0f 表示实测次数,t f (或e f )表示期望次数,则有 ()e e f f f 2 02 -= χ 实测次数与期望次数差异的大小用2 χ值的大小来说明。2 χ检验(chi-square test )就是检验实测次数与期望次数是否一致的统计方法。

(二)2 χ特性 1.可加性。2 χ的可加性是指若干个相互独立的2 χ值相加后的和仍然是一个2 χ值。根据数学基本定义得到的是一个2 χ值,而根据2 χ可加性的特征,2 χ检验的公式可写为 ()∑ -=e e f f f 2 02 χ 根据2χ可加性的特性,可以对2 χ进行合成与分解,因此2 χ检验能同时对多种资料进 行检验,能把两个或两个以上的实测次数与某种理论模型的期待次数进行比较。由上式可知, 2χ值的大小与组数有关,组数越多,2χ值越大。因此,在考虑2χ值大小的意义时,应同 时考虑组数的多少。 2.2 χ的偏离程度。由 ()∑ -=e e f f f 2 02χ可知,实测次数和理论次数的相对差距越 大,2χ值也越大。由于所得差值越大,除以e f 后,其2χ值也越大。所以2 χ值越大,其 偏离越大,差异的可能性越大;相反,2 χ值越小,偏离越小,差异的可能性越小。 3.若实测次数与理论次数相等,则2 χ值为0,即 ()0 2 02 =-= e e f f f χ 4.2χ值永远为正值。 5.2 χ分布的和也是2 χ分布。 6.2χ检验主要适用于计数资料的统计分析,它对总体分布不作任何假设,所以也称 非参数检验。2 χ检验最初是用于分析分类、非连续变量型的数据,但随着发展也可用于连 续、定量的数据,只是需按一定的标准或组距对事物分类,统计各类的人数后才能进行 2 χ检验。 二、2χ分布曲线及2 χ值表 (一)2 χ分布曲线 如果从总体中随机抽取许若干个样本,每一样本的实测次数与理论次数相比较都可以得到一个2 χ值,若干个样本就可以计算出若干个2 χ值。于是一切可能的2 χ值就组成了一个 的抽样分布,即2χ分布。如果以此绘制次数分布图,我们就可以得到一条2 χ分布曲线。 2χ分布曲线的特点是不以样本容量为转移,而以自由度为转移。自由度不同,则分布 曲线不同,所以2χ分布曲线不是一条,而是一簇。例如1=df ,2=df ,4=df ,6=df , 10=df 的2χ分布曲线如图12-1所示。2χ分布曲线的范围从0到无限大。自由度越小, 曲线越向右偏斜;随着自由度的增大,曲线逐渐趋于对称;当自由度大于30时,曲线近似正态分布。

相关文档
最新文档