第八章卡方检验

第八章卡方检验
第八章卡方检验

第八章

2

χ

检验

一、教学大纲要求

(一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2

χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2

χ检验。 3. 行?列表的2

χ检验。 (二) 熟悉内容

频数分布拟合优度的2

χ检验。 (三) 了解内容 1.2

χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要

(一) 2

χ检验的用途

2χ检验(Chi-square test )用途较广,主要用途如下:

1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2

χ检验的基本思想

1.2

χ检验的基本思想是以2

χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2

χ值不应该很大,若实际计算出的2

χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑

-=

T

T A 2

2

χ,A 为实际频数(Actual Frequency ),T 为理论频数

(Theoretical Frequency )。四格表2

χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2

χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法:

n

p )

1(ππσ-=

,π为总体率,或 (8-1)

n

p p S p )

1(-=

, p 为样本率; (8-2)

2.总体率的可信区间

当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2

χ检验的基本计算 见表8-1。

表8-1 2

χ检验的用途、假设的设立及基本计算公式

资料形式

用途

0H 、1H 的设立与计算公式

自由度

四格表

①独立资料两 样本率的比较

②配对资料两 样本率的比较

0H :两总体率相等 1H :两总体率不等

①专用公式

))()()(()(22

d b c a d c b a n

bc ad ++++-=χ

②当n ≥40但1≤T<5时,校正公式

)

)()()(()2/(2

2

d b c a d c b a n n bc ad ++++--=

χ ③配对设计c

b c b +--=

2

2

)1(χ

1

R ?C 表

①多个样本率、 构成比的比较

②两个变量之 间关联性分析

0H :多个总体率(构成比)相等

(0H :两种属性间存在关联)

1H :多个总体率(构成比)不全相等

(0H :两种属性间存在关联)

)1(

2

2-=∑

C

R n n A n χ (R-1)(C-1)

频数分布表 频数分布的拟合优

度检验

0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布

-T

T A 2)(

据频数表的组数而定

(五)四格表的确切概率法

当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。 (六)2

χ检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正

2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

2.对于R ?C 表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。对于单向有序R ?C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ?C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ?C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

三、典型试题分析

(一)单项选择题

1.下列哪项检验不适用2

χ检验( )

A . 两样本均数的比较

B . 两样本率的比较

C . 多个样本构成比的比较

D . 拟合优度检验

答案:A

[评析] 本题考点:2χ检验的主要用途。2

χ检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )

A .140

B .T <5

C .T 1≤或n 40≤

D .T 1≤或n 100≤ 答案: C

[评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2

χ检验,应用Fisher 精确概率法。

3.2

χ值的取值范围为

A .∞-<2

χ<∞+ B .+∞≤≤2

0χ C .12

≤χ D .02

≤≤∞-χ

答案: B

[评析]根据2χ分布的图形或2χ的基本公式可以判断2

χ值一定是大于等于零且没有上界的,故应选B 。

(二)是非题 两样本率的比较可以采用2

χ检验,也可以采用双侧u 检验。 答案:正确。

[评析]就两个样本率的比较而言,双侧u 检验与2

χ检验是等价的。 (三)简答题

1.四格表的2

χ检验和u 检验有何联系与区别?

答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2

χ检验,两者是等价的,即2

2

χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,

计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2

χ检验可用于2?2列联表资料有无关联的检验。

2.R ?C 表2

χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R ?C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况

正常体重 肥胖

合计 发生 未发生 发 生

19 5 24 未发生 12 86 98 合 计

31 91

122

[评析]这是一个配对设计的资料,因此用配对2

χ检验公式计算。 H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α c

b c b +--=

2

2

)1(χ=

()12.212

511252

=+--,1=ν

2χ=2.11<2

1,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。试对这三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较 矫治方法

有效人数 无效人数 合计

有效率(%)

夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 185

33.51

[评析]

0H :三种措施有效率相等

1H :三种措施有效率不相等或不全相等 05.0=α

)1(2

2

-=∑c

r n n A n χ=185?

?

??

? ??-?+?+?+?+?+?1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2

查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

颈麻

100 41 注药

100 94 置栓

100 89 对照

100 27 [评析] 为了应用2

χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

表8-5 4种镇痛方法的效果比较

镇痛方法 有效例数 无效例数 合计

颈麻

41 59 100 注药

94 6 100 置栓

89 11 100 对照

27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同

05.0=α

)1(22

-=∑c r n n A n χ=400???

? ??-?++?+??110014973

...1001495910025141222=146.175, ν=(4-1)(2-1)=3

查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2

χ分布

C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布

D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2

χ=u D . 两样本率比较时,有22

χ=t 3. 率的标准误的计算公式是: A .

)1(p p - B .

n p p )

1(- C.1-n p D.

n

p p )

1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43?表进行检验时,11=ν C .对四格表检验时,ν=4

D .若2

,05.02,05.0ηνχχ>,则ην>

5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?

A .不能确定

B .甲、乙法一样

C .甲法优于乙法

D .乙法优于甲法 6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:

A .分性别比较

B .两个率比较的2χ检验

C .不具可比性,不能比较

D .对性别进行标准化后再做比较 7.以下说法正确的是

A .两个样本率的比较可用u 检验也可用2χ检验

B .两个样本均数的比较可用u 检验也可用2χ检验

C .对于多个率或构成比的比较,u 检验可以替代2χ检验

D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释

1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表

5. 双向有序分类资料 6. 率的标准误

7. 多个率的两两比较 8. Fisher 精确概率

9. McNemar 检验 10. Yates 校正 (三) 是非题

四个样本率做比较,2

)3(05.02χχ> ,可认为各总体率均不相等。 (四) 计算题

1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?

2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?

表8-6 冠心病诊断结果与眼底动脉硬化级别的关系 眼底动脉硬化级别 冠心病诊断结果

合计 正常 可疑 冠心病 0 340 11 6 357

I 73 13 6 92 II 97 18 18 133 III 3 2 1

6 合计

513 44 31 588

3.表8-7是用两种方法检查已确诊的乳腺癌患者120名的检查结果,问:两种方法何者为优?

表8-7 两种方法检查结果比较

乙法 甲法

合计

+ - +

42 18 60 - 30 30 60 合计

72 48 120

4.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?

表8-8 两种方法检查结果比较 组 别

观察人数 粪见检阴性人数 阴转率(%)

试验组 29 25 86.2 对照组 28 17 60.7 合 计 57 42

73.7

5.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9,问三个疗程组的有效率之间有无显著差异?

表8-9 冠心2号方治疗心绞痛的有效率

疗 程

例数 有效例数 有效率(%) 一疗程 110 82 74.5 二疗程 150 130 86.7 三疗程 63 56 88.9 合 计

323 268 83.0

6.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表8-10。问两组肝波型的差异有无显著性?

表8-10 急性黄疸型肝炎与正常人的超声波波形

组别波型

合计

正常可疑较密

黄疸型肝炎组12 43 232 287

正常人组277 39 11 327

合计289 82 243 614

7.有人研究惯用手与惯用眼之间是否存在一定关系,得资料如表8-11,试作统计分析。

表8-11 冠心2号方治疗心绞痛的有效率

惯用左眼两眼并用惯用右眼合计惯用左手34 62 28 124 两手并用27 28 20 75

惯用右手57 105 52 214

合计118 195 100 413

8.苏格兰西南部两个地区献血人员的血型记录如下表(表8-12),问两地的血型分布是否相同?

表8-12 两个地区献血人员的血型分布

地区血型

合计

A B O AB

Eskdale 33 6 56 5 100

Annandale 54 14 52 5 125

合计87 20 108 10 225

五、习题答题要点

(一)单项选择题

1.C

2.A

3.D

4.D

5.A

6.D

7.A

(二)名词解释

1.实际频数:actual frequency,即实际观察值。理论频数:theoretical frequency,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

χ界值表:将2χ分布右侧尾部面积等于α时所对应的2χ值称为2χ分布的临界值,2.2

χ界值表。

对于不同的自由度及α有不同的临界值,由这些临界值构成的表即2

3.拟合优度:goodness of fit,指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

4.配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A处理,另一个接受B处理,每种处理的反应都按二项

分类。全部n 对实验结果的资料以表8-12表示,这样的表称为配对四格表。

表8-12 配对四格表的形式 A 处理 B 处理 + - + a b -

c

d

5.

双向有序分类资料:对于R C 表资料,当两个定性变量都有序时,这样的资料称

为双向有序分类资料,如“急性放射病分度与放射烧伤面积占不同体表面积的百分比”,这里的两个变量均为有序的。

6. 率的标准误:用以衡量由于抽样引起的样本率与总体率之间的误差的统计量,记为

P σ。n

p )

1(ππσ-=

,π为总体率,n 为样本容量;当总体率π未知时,以样本率P 作为π

的估计值,率的标准误为n

p p S p )

1(-=

。 7. 多个率的两两比较:指当假设检验确定了多个率之间存在差别后,检验哪两个两个样本率之间的差别具有统计学意义的方法。

8.

Fisher 精确概率: 指当四格表中出现理论数小于1或n <40时,用R.A.Fisher (1934)

提出的方法直接计算出的有利于拒绝H 0的概率。

9. McNemar 检验:McNemar’s test for correlated proportions ,是分析配对四格表资料的方法,其计算公式为c

b c b +--=

2

2

)1(χ,v =1。

10.Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates’ correction )。

(三) 是非题

错。多个样本率做比较时,H 1为各总体率不全相等,所以当接受H 1时,并不能说明各总体率均不相等。

(四) 计算题:

1.将资料整理成四格表

手术方法 合并症

电切术 开放手术

用四格表校正公式算得37.22=χ,P >0.05,尚不能认为两种手术的合并症发生率有差异。 2.该资料属双向有序分类资料,用2χ检验解决。

H 0: 冠心病诊断结果与眼底动脉硬化级别无关联 H 1: 冠心病诊断结果与眼底动脉硬化级别有关联

05.0=α

2

χ=61.59,2χ<26,01.0χ,P<0.05,

α水准拒绝H0接受H1,故可认为冠心病与眼底动脉硬化有关联。

按05

=

.0

3.采用配对2χ检验。

H0:两法不分优劣

α

H1: 两法能分优劣05

=

.0

2

α水准不拒绝H0,尚不能认为检出率有差别。

χ=3.00,按05

=

.0

4.可用u检验或2χ检验。用2χ检验时,首先将资料整理成四格表形式,然后再代入

α水准拒绝H0接受H1,认为两组阴转率差别有统计学意义。公式。算得2

χ=4.774,按05

=

.0

α水准拒绝H0接受5.用R?C表2χ检验公式算得2χ=8.539,v=2,P<0.05,,按05

=

.0

H1,三个疗程有效率的差异有统计学意义。

α水准拒绝H0接6.用R?C表2χ检验公式算得2χ=443.456,v=2,P<0.05,,按05

.0

=

受H1,两组肝波型的差异有统计学意义。

α水准不拒绝H0,尚不能认7.由2χ检验公式算得2χ=4.020,v=4,P>0.05,,按05

=

.0

为惯用手与惯用眼之间存在关系。

8.本例只有一个格子的理论频数小于5,故仍可用2χ检验。2χ=5.710,v=3,P>0.05,,α水准不拒绝H0,尚不能认为两地的血型分布不同。

按05

=

.0

(徐勇勇马跃渊)

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 解:(1)Y F (从上到下):50;30;100. X F (从左到右) :115;65. (2)P 11=15/180;P 21=35/180;1 Y F =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3 Y F N =100/180;

1X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居” y 紧张 一般 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:

第八章卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

非参数统计学讲义(第六章)分布检验和某些卡方检验

非参数统计学讲义 主讲:统计系 袁靖 第六章 分布检验和某些卡方检验 §1 引 言 本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或P-P 图,Q-Q 图来直接判断,但这种直观的方式很不精确。 本章将介绍几种分布的检验:K-S 检验,Lilliefors 检验和2χ检验。 实际上,K-S 检验是在针对2χ检验的缺点1上提出的。它们是建立在经验分布函数基础上的检验结果。 §2 Kolmogorov 检验 一、基本假设 一般地要检验手中的样本是否来自某个已知0()F x ,假定其真实分布为()F x ,对应的检验类型有 00:()()A H F x F x = 对x ? 10:()()H F x F x ≠ 至少有一个x 00:()()B H F x F x = 对x ? 10:()()H F x F x < 至少有一个x 00:()()C H F x F x = 对x ? 10:()()H F x F x > 至少有一个x 设()S x 为该组数据的经验分布函数,则 () ()i i I X x X x S x n n ≤≤= =∑的目 二、基本方法 Kolmogorov 于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当n →∞ 时,样本经验分布?n F 以概率1一致收敛到总体分布F ,为此可以定义()S x 到0()F x 的距离为 00((),())sup ()()D S x F x S x F x =- 当H 0成立时,由格氏定理,D 以概率1收敛到0,因此D 的大小可以度量0()F x 对总体分布拟合的好 1 2χ检验与K-S 检验均属拟合优度检验,但2χ检验常用于定类尺度测量数据,K-S 检验还用于定序尺度测量数据;当预期频数较小时,2χ检验常需要合并邻近的类别才能计算,K-S 检验则不需要,因此它能比2 χ检验保留更多的信息;对于 特别小的样本数目,2χ检验不能应用,而K-S 检验则不受限制。此外,2 χ检验需要人为对总体分布的支撑集进行划分, 将总体分布转化成一种导出分布,后果:①样本信息利用不充分;②实际检验的是导出分布对数据的拟合优度,而不是假设分布对数据的拟合优度。

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

第八章 卡方检验与交互分析#(精选.)

第八章卡方检验与交互分析 交互分析是社会调查研究中常用方法之一,用于研究两个定类变量的关系。交互分析中用于检验两个变量是否相关的方法叫做卡方检验,也叫独立性检验。卡方检验是建立在观测频次和期望频次之差基础上的一种检验。 一、卡方检验的原理 例:一项调查得到890个样本的与收入和所处地区的数据,希望分析收入和地区的关系。 表1 要检验的H0:收入和地区之间没有相关性,即每一地区的收入分布模式应该是相同的,收入的高低不应随着地区的不同而有所差异。也就是说,如果东部城市的四个收入类别各自比重和中西北部城市的四个收入类别各自比重一致,那么,收入和地区之间是相互独立的。 如果这个890人的样本能够反应总体的独立性特征,那么就应该能够观测到两个地区具有相同的收入分布模式,称为期望模式,样本的期望观测频次如下:表2 接下来,计算观测频次f0与期望频次f e之间的偏差(f0-f e),如果这些偏差比较小,则有利于证明原假设即总体的独立性。反之,则可能推翻原假设。但偏差之和为0,所以对偏差进行平方。但是,为了说明每一个偏差的相对重要性,每一偏差平方和都需要和本组中的期望频次相比较,计算相对(f0-f e)2/f e。然后,将所有组的贡献相加,从而得到度量全部偏差的一个量,叫做卡方

χ2= ,服从自由度为(c-1)(r-1)的卡方分布。如用c 和r 分别表示表 中的列数和行数,自由度为(c-1)(r-1)。 f 0 f e 153.3 164.7 80 86 66 71 129.7 139.3 (f 0-f e ) (f 0-f e )2/f e 计算出卡方值后,可根据已知 的显著性 水平和自由度查卡方分布表,找出临界值,与之作对比。反过来,也可以计算出概值,再根据我们所希望的显著性水平做比较。该例题中计算出χ2为31.6,查表发现对应自由度为3的那一行的所有临界值都小于χ2,因此,概值小于0.001。由于概值如此小,检验水平可以是1%甚至更小,所以一定可以拒绝原假设。也就是说,在总人口中,收入与地区有显著的相关性,二者并不独立。 练习题:在电视的收视率调查中,得到性别与收视习惯的联列表如下,试分析性别和收视习惯的关系。 男 女 总频次 几乎天天看 38 24 62 偶尔看 31 7 38 总频次 69 31 100 相对频率 0.69 0.31 1.00 解:原假设为“性别和收视习惯相互独立”,如果原假设成立,那么两列期望凭此应通过0.69和0.31分别乘以最后一列总频次而得到。 42.8 19.2 146 172 66 100 51 86 166 103 -7.3 7.3 -14 14 -15 15 36.3 -36.3 0.35 0.32 2.45 2.28 3.41 3.17 10.16 9.46 38 24 31 7

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

卫生统计学第七章卡方检验 十

卫生统计学第七章卡方检验十 一、题型:A1 题号:1 本题分数:2 四格表资料两样本率比较的χ2检验,正确的一项为 A.χ2值为两样本率比较中u值 B.P<α前提下,χ2值越大,越有理由拒绝H0 C.χ2值大小与样本含量无关 D.每个格子的理论频数与实际频数的差值相等 E.χ2检验只能进行单侧检验 正确答案:B 答案解析:根据专业知识确定四格表资料两样本率比较的χ2检验采用单侧检验或是双侧检验,(也可使用四格表专用公式),可以证明四格表计算得出的χ2值与正态近似法两率比较中u值的平方相等,其大小与样本含量有关,且每个格子的理论频数与实际频数的差的绝对值相等,P<α前提下,自由度一定时,χ2值越大,P值越小,越有理由拒绝H0,故答案为B。 做答人数:0

做对人数:0 所占比例: 0 题号:2 本题分数:2 下列能用χ2检验的是 A.成组设计的两样本均数的比较 B.配对设计差值的比较 C.多个样本频率的比较 D.单个样本均数的比较 E.多个样本均数的比较 正确答案:C 答案解析:χ2检验可用于率或构成比比较的假设检验中,不适宜于均数的比较。 做答人数:0 做对人数:0 所占比例: 0 题号:3 本题分数:2 行×列表的自由度是 A.行数-1 B.列数-1

C.行数×列数 D.(行数-1)×(列数-1) E.样本含量-1 正确答案:D 答案解析:行×列表中,行的自由度=行数-1,列的自由度=列数-1,行×列二维表资料的χ2统计量所对应的自由度=(行数-1)×(列数-1)。做答人数:0 做对人数:0 所占比例: 0 题号:4 本题分数:2 四个百分率做比较,有一个理论数小于5,其他都大于5,则 A.只能做校正χ2检验 B.不能做χ2检验 C.直接采用行×列表χ2检验 D.必须先做合理的合并 E.只能做秩和检验 正确答案:C 答案解析:四个百分率做比较,资料可整理为4×2的行×列表,多个率比较的行×列表资料不适宜采用秩和检验,当满足行×列表资料

卡方检验

Stata第六章卡方检验 本节STATA命令摘要 [by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow] tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow] ?列联表分析 STATA命令: [by分层变量:]tab2变量1变量2[, allchi2lichi2exactcellcolumnrow] 上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。具体资料为:(摘自医学统计方法,金丕焕主编,p163)。

组别经常偶尔从不饮用合计肝癌组26442898 健康组28491794 合计549345192 显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。 tab2groupcustom,rowchi2 ->tabulationofgroupbycustom |custom group|123|Total -----------+--------------------------------------------+---------- 1|①264428|98 |②26.5344.9028.57|100.00 -----------+--------------------------------------------+---------- 2|③284917|94 |④29.7952.1318.09|100.00 -----------+--------------------------------------------+---------- Total|⑤549345|192 |⑥28.1248.4423.44|100.00 Pearsonchi2(2)=2.9497Pr=0.229 ①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的

卡方检验应用

卡方检验应用

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据 统计方法。 卡方检验是专用于解决计数数据统计分析 的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否 有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 ~ 解:(1)Y F (从上到下):50;30;100. X F (从左到右):115;65.

(2)P 11=15/180;P 21=35/180;1 Y F N =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180; 1 X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 ! P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 》 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 . 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x : 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 · 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居”

y 紧张 一般 * 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 10-29。 (2)根据表10-28和表10-29计算2χ,计算公式为 2 ()2 o e e f f f χ-=∑ 。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 * 述研究假设1H 和虚无假设0H 。 (4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表, 找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差 异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。

第四章 非参数检验(SPSS v 16.0)

第四章非参数检验 非参数检验(non-parametric test) 卡方检验(test)、 Runs 检验(Runs test)、 Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、 Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、 符号检验(sign test)、 Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、 Fridman 单因素方差分析(Fridman one-way analysis of variance) 多样本中数检验(K-sample median test)。 一、卡方检验 检验(也叫做Pearson Chi-Square test):配合度检验(the test of goodness of fit)和独立性检验(independence test)。 (一)配合度检验 配合度检验: 推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。 作零假设:f0=f e f0和f e分别为变量的每个水平的观测频数和期望频数。 配合度检验的自由度为:N-1,N为变量水平数。 【配合度检验·例】 配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。 某研究者进行了一次问卷调查。调查对象是300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:你对英语的学习兴趣□ 很浓、□ 较浓、□ 一般、□ 有点和□ 没有。获得原始数据如表4-1 所示。似乎较多人认为自己对英语的学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。 该研究者想通过卡方分析证明:①对英语学习有不同兴趣的学生人数不均等和②其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近1:4:8:4:2。 表4-1 300 名学生对英语学习兴趣调查题目的反馈* 学生编号兴趣 001 2 002 3 003 5 …… 300 3 * 英语学习兴趣很浓、较浓、一般、有点和没有5 个等级分别以数字5、4、3、2 和1 表示。 ①对英语学习有不同兴趣的学生人数不均等。

卡方检验应用

卡方检验应用 Prepared on 24 November 2020

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来

10练习题解答:第十章交互分类与卡方检验

第十章交互分类与F检验 练习题: 1.为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭, 调查结果如下表所示: 表10-26 (1)计算变量X与Y的边际和(即边缘和)F x和F Y并填入上表。 (2)请根据表10-26的数据完成下面的联合分布的交互分类表。 表10-27 (3)根据表10-27指出关于X的边缘分布和关于Y的边缘分布。 (4)根据表10-27指出关于X的条件分布和关于Y的条件分布。解:(1)Fy(从上到下):50: 30: 100. 竹(从左到右): 115: 65. (2) P n=15/180: P.35/1S0: ^.50/180:

% P:c=20/180; P产 10/180:=30/180:

5 P沪80/180; P沪20/180:市二100/180: Fx\ Fx? N =115/180:=65/180. (3 关于y的条件分布有两个: X 2.一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 表10-28

(1)根据 表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 述研究假设0和虚无假设H{) o (4)本题口中的自山度为多少若显著性水平为,请查附录的才分布表, 找出相对应的临 界值。并判断有无宗教信仰的人的利他主义程度有无显著性差异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C系 数。 解:(1)"信教” 一列(从上到下): ,,9X,85 =61.67: 357 125X185 =64.78; 357 ,,3X185=58.56. 357 '‘不信教” 一列(从上到下):1,9X172 =57.33: 357 EG"?: 357

时间序列分析(张能福)第四章

第一节模型的识别单变量时间序列的Box-Jenkins 模型识别方法主要是根据样本自相关和偏自相关函数的截尾和拖尾性来判断序列所适合的模型。平稳序列的自相关函数和偏自相关函数的统计特性对非零均值序列的处理计算样本均值,将每一序列值减去样本均值。将序列均值作为一未知参数处理。例如AR 模型例:,Xt 的均值是多少?判定在m步之后截尾的做法是:判定在n步之后截尾的做法是:拖尾:即被负指数控制收敛于零。若序列自相关函数和偏自相关函数无以上特征,而是出现缓慢衰减或周期性衰减情况,则说明序列不是平稳的。例:见演示试验。第二节模型的定阶自相关函数和偏自相关函数定阶法自相关函数和偏自相关函数不但可以用来进行模型的识别,同样也可以用来进行AR 模型和MA 模型的定阶。该方法对ARMA 模型定阶较为困难,同时,用该方法定的阶数也只能作为初步参考值。残差方差定阶法残差方差定阶法借用了统计学中多元回归的原理。假定模型是有限阶的自回归模型,如果选择的阶数小于真正的阶数,则是一种不足拟合,因而剩余平方和必然偏大,残差方差也将偏大;如果选择的阶数大于真正的阶数,则是一种过度拟合,残差方差并不因此而显著减小。AR 、MA 、ARMA 三种模型的残差方差估计式分别为:F检验定阶法基本过程:对N个独立的观察值,建立回归模型:若舍弃后面S个因子,另建一个回归模型:检验舍弃的回归因子对Y的影响是否显著,等价于检验原假设:最佳准则函数定阶法对于AR 模型,AIC 函数可取:BIC 定阶理论上AIC 准则不能给出模型阶数的相容估计,即当样本趋于无穷大时,由AIC 准则选择的模型阶数不能收

敛到其真值(通常比真值高)。另一个定阶选择是BIC 准则:对于AR 模型:还可以定义其它类型的准则函数,如自回归移动平均模型的参数矩估计:将模型分成两个部分,先对AR 部分应用YULE-WALKER 方程,计算得到剩余序列,对剩余序列应用MA 模型的参数估计方法。 二、最小二乘估计(LS )三、极大似然估计(ML )极大似然估计有条件极大似然估计和完全极大似然估计之分。最小二乘估计是条件极大似然估计。具体过程可参看其它参考书。第四节模型的检验参数估计值检验显著性检验残差序列的检验相关性检验显著性检验常用的有t检验和F检验* 在自回归的形式下,t 检验和F检验均为渐近有效。在原假设成立的条件下,有于是检验序列的独立性问题转化为检验若Q < 2 ( K - n - m) ,则接受H0 。若Q > 2 ( K - n - m) ,则拒绝H0 。* 第四章平稳时间序列模型的建立拖尾拖尾截尾偏自相关函数拖尾截尾拖尾自相关函数ARMA(n,m) MA(m) AR(n) 模型图时间序列模型建立流程模型定阶确定ARIMA 中的参数d, p, q 参数估计矩、OLS 、ML 等对初步选取的模型进行参数估计诊断与检验包括参数的显著性检验和残差的随机性检验模型可取吗检验序列的零均值性和平稳性否则进行零均值化和平稳化模型识别用相关图和偏相关图识别模型的类型模型应用YES NO 自相关和偏自相关函数截尾的判定ARMA 模型:MA 模型:AR 模型:基本思想:首先用ARMA(n,m) 进行过度拟合,再令高阶系数中某些取值为零,用F检验判定阶数降低之后的模型与ARMA(n,m) 之间是否存在显著性差异。如果有显著性差异,阶数能够升高;如果没有差异,阶数可以降低。

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张 下一张 主 页
退 出

第一节
性别 男 女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1:1, 即与1:1性别比差异是否显著。 性别比差异是否显著。

χ =
2

A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理 论次数偏离程度的一个统计量, 论次数偏离程度的一个统计量, χ2越小, 越小,表明实际观察次数与理 论次数越接近; 论次数越接近; χ2 =0,表示两 者完全吻合; 者完全吻合; χ2越大, 越大,表示两者 相差越大。 相差越大。
上一张 下一张 主 页 退 出

在对次数资料进行χ2检验利用连续型随 机变量χ2分布计算概率时, 分布计算概率时,常常偏低, 常常偏低,特 别是当自由度为1时偏差较大。 时偏差较大。 Yates(1934)提出了一个矫正公式, 提出了一个矫正公式,矫正 后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张 下一张 主 页
退 出

当自由度大于1时,χ2分布与连续型随机 变量χ2分布相近似 ,这时, 这时,可不作连续性矫 正 , 但 要 求各组内的理论次数不小于5。若 某组的理论次数小于5,则应把它与其相邻的 一组或几组合并, 一组或几组合并,直到理论次数大 于5 为 止。

相关文档
最新文档