第十章卡方检验描述

合集下载

第十章卡方检验

2 检验的基本公式，
表，确定其差异是否显著。（常用的方法）
其关键步骤是计算理论次数与确定自由度。（1）将实际次数分布的统计量代入所选的理论分布函数方程，求各分组区间的理论频率，然后乘以总数得各分组区间的理论次数；
16 （2）将分组的数目减去计算理论次数时所用统计量的数目即自由度。
[例10-5] 表10-2所列资料是 552 名中学生的身高次数分布，问这些学生的身高分布是否符合正态分布？
3、去除样本法； 4、使用校正公式。
7
第二节
察次数分布与某理论次数是否有差别。
配合度检验
配合度检验（goodness of fit test）主要用于检验单一变量的实际观
它检验的内容仅涉及一个因素多项分类的计数资料，是一种单因素检验（one-way test）。
一、配合度检验的问题
（一）统计假设
2、根据各组的理论次数与实际次数计算
2 值，得 2 3.905
3、确定自由度。本题共分 11 组，在计算理论次数时，对最高组和最低
组两极端次数进行了合并，合并后为 9 组。在计算理论次数的过程中共用到
平均数、标准差、总数 3 个统计量，故本题的自由度 df=9-3=6 。 4、查
2 表，得 02.05 12.6， 02.01 16.8
表10-2
身高分组 169 ~ 166 ~ 163 ~ 160 ~ 157 ~ 154 ~ 151 ~ 148 ~ Xe 170 167 164 161 158 155 152 149 fo 2 7 22 57 110 124 112 80
书中数字错！
552 名学生身高的理论次数分布及卡方检验
x 15.38 12.38 9.38 6.38 3.38 0.38 -2.62 -5.62 Z 3.03 2.44 1.85 1.26 0.67 0.07 -0.52 -1.11 y 0.0040 0.0203 0.0720 0.1840 0.3187 0.3979 0.3484 0.2154 p 0.0023 0.0120 0.0426 0.1088 0.1885 0.2354 0.2061 0.1274 fe 1 7 24 60 104 130 114 70

卡方检验的规范表述

卡方检验的规范表述简介卡方检验是一种常用的统计方法，用于检验两个分类变量之间是否存在关联性。

它基于观察频数和期望频数之间的差异来判断两个变量之间的关联性程度。

本文将详细介绍卡方检验的步骤及规范的表述方式。

步骤进行卡方检验的步骤如下：1.建立假设。

首先，我们需要确定原假设（H0）和备择假设（H1）。

原假设通常是指两个变量之间不存在关联性，备择假设则相反。

2.构建观察频数表。

根据实际观察到的数据，构建一个二维频数表（也称为交叉表），其中行表示一个变量的不同水平，列表示另一个变量的不同水平。

频数表的每个单元格中的值表示两个变量同时出现的频数。

3.计算期望频数。

根据原假设，我们需要计算每个单元格的期望频数。

期望频数是指在原假设成立的情况下，每个单元格中预计出现的频数。

可以使用以下公式计算期望频数：期望频数 = (行总计 * 列总计) / 总样本数4.计算卡方值。

根据观察频数和期望频数，我们可以计算卡方值。

卡方值衡量了观察值与期望值之间的差异。

可以使用以下公式计算卡方值：卡方值= Σ((观察频数 - 期望频数)² / 期望频数)5.查表并比较。

根据自由度和显著性水平的选择，在卡方分布表中查找临界值。

自由度的计算方法是自由度 = (行数 - 1) * (列数 - 1)。

根据查找的临界值和计算得到的卡方值进行比较。

如果计算得到的卡方值大于临界值，则可以拒绝原假设，否则无法拒绝原假设。

规范表述根据上述步骤，我们可以用如下的表述方式规范地进行卡方检验报告：1. 假设检验我们首先建立原假设（H0）和备择假设（H1）。

对于卡方检验，原假设通常是两个变量之间不存在关联性，备择假设为存在关联性。

在实际应用中，需要根据具体问题来确定原假设和备择假设。

2. 观察频数表我们根据实际观察到的数据构建了一个二维频数表，表中的行表示一个变量的不同水平，列表示另一个变量的不同水平。

频数表的每个单元格中的值表示两个变量同时出现的频数。

【实用】卡方检验(2)PPT文档

χ2分布有以下几个特点：
（1）χ2分布呈正偏态，右侧无限延伸，但永不与基线相交。
（2）自由度越小，χ2分布偏斜度越大；自由度越大，χ2分布形态越趋于对称。
P172:
从某校随机抽取50个学生，其中男生27人，女生23人，问该校男女生人数是否相等？
第二节单向表的卡方检验
把实得的点计数据按一种分类标准编制成表就是单向表。对于单向表的数据所进行的卡方检验就是单向表的卡方检验。
第十章卡方检验
第一节 χ2及其分布
卡方检验是对总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
某小学历届毕业生汉语拼音测验平均分数为66分，标标准准差差为1。4，以同样的试题测验应届毕业生，从中随机抽取18份，算得平均分为69分，问该校应届与历届毕业生汉语拼音测验成绩是否一样？
第三节双向表的卡方检验
把实得的点计数据按两种分类标准分类后所编制成的表就是双向表。对双向表的数据进行的χ2检验，就是双向表的χ2检验。
在双向表的χ2检验中，如果要判断两种分类特征，即两个因素之间是否有依从关系，这种检验称为独立性χ2检验。
例1：P178。
家庭经济状况属于上、中、下的高三毕业生，对于是否愿意报考师范大学有三种不同的态度（愿意、不愿意、未定），其人数分布如下表所示。问学生是否愿意报考师范大学与家庭经济状况是否有关系？
第四节四格表的卡方检验
独立样本四格表的χ2检验，就是最简单的双向表即22表的χ2检验。它既可以用缩减公式来计算χ2值，又可以用χ2检验的基本公式来计算 χ2值。
第三节
双向表的卡方检验
卡方检验是对总体分布是否服从某种理论分布或某种假设分布所作的假设检验。

统计心理-第十章卡方检验-PPT精选文档

第十章检验
2

2

2
单因素因果关系研究
自变量数据类型类别（2水平）因变量数据类型连续
统计方法平均数差异检验（t, Z）点二列相关，二列相关方差分析（F检验）多列相关
类别（≥3水平）
类别连续
连续
类别连续
2 检验
积差相关一元回归
第十章
检验
2
心理学研究中，有时研究变量是按一定的性质划分为不同类别，然后统计各类别中的人数或个数，即需要用到计数资料。例如，将人按照性别划分为“男”、“女”；将学习成绩划分为“优”、“良”、“中”、“差”四个等级等，然后对各类别分别有多少、占多大比例等问题进行分析。对这些计数资料的统计分析，不能用前几章的统计方法， 2 检验 2 检验则需要使用本章所介绍的。应用分析计数数 2 检验据时，对计数数据总体的分布形态不作任何假设，因此被视为是非参数检验方法的一种。
解：
1建立假:设 H0 : f0 fe 30 ;H1 : f0 fe 2 2 2 f0 fe 39 30 21 30 2 2 2计算值 : 5.4
fe 60 0.5 30

2 3统计决:断 df 211 ;查表得 : 2 3 . 84 , 1.01 6.63 1.05
第一节检验概述
2
2 2 一、和检验的意义 2 检验方法能处理一个因素两项或多项分类的实际
观察频数与理论频数分布是否相一致问题，或者说有无显著差异问题。所谓实际频数简称实计数或实际数，是指在实验或调查中得到的计数资料，又称为观察频数。理论次数是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数，又称为期望次数。 2

10.卡方检验-10

式中 a、b、c、d 分别为四格表中的四个实际频数， n 为总例数。
３.
检验的连续性校正问题
检验的校正公式：
一般原则是： ① 当n ≥40且所有T≥ 5时，用检验的理论公式（9-1）或专用公式（9-9）；若所得的P ≈ α , 改用Fisher确切概率法。
② 当n≥40但有1≤T<5时，用校正公式（9-10）或（9-11）。
甲处理 + -
乙处理
合计
+ a c a+c
b d b+d
合计 a+b c+d n
两个相关样本率比较检验统计量
的计算公式：
b + c≥40
b + c <40
例10-4 用两种不同的方法对53例肺癌患者进行诊断，收集得表10-4的资料，问两种方法的检测结果有无差别？甲法 + 合计乙法 + 25（a） 11（c） 36 2 （b ） 15（d） 17 合计 27 26 53

2 2 30 25 10 17 82 30 10 17 2530 17 10 25 =9.98
（3）确定概率P值和判断结果自由度ν= (2-1) (2-1) =1 查2界值表，20.005（1）=7.88，2＞20.005（1）,P＜ 0.005, 按 =0.05的水准，拒绝H0，接受H1，可认为婴儿腹泻与喂养方式之间存在关联性。
2

2. 行×列表资料经2检验后，如假设检验的结果是拒绝无效假设，只能认为各总体率或构成比之间总的来说有差别，但并不是说它们彼此之间都有差别，如例10-7的检验结果为拒绝了H0，仅能说明甲、乙两城市各种空气质量类别所占的比例不同，不能说明全不相同。如果想进一步了解彼此之间的差别，需将行×列表分割，再进行2检验（详见本章第四节）。

第十章统计卡方检验.ppt

二、单因素的2检验(配合度检验)（P297）
赞成 39
反对 21
解：（1）提出假设： H0：fo= fe H1： fo fe
（2）计算检验统计量
2 fo fe 2 (39 30)2 (21 30)2 5.4
fe
30
30
（3）查2分布表，确定临界值：
• 已经统计出小学生识字的优秀率为0.2，及格率为0.7（不包括优秀在内），不及格率为0.1，现在进行识字教学的改革实验，实验后随机抽取了500名学生进行测试，结果有123人达到优秀水平，有346人达到及格水平，有31人没有及格。问识字教学的改革实验是否有显著性效果？
第二节独立性检验（二因素的2检验）
值表中找到临界值。
（五）做出接受虚无假设或拒绝虚无假设的统计决策。其原则是：
• 1．当公式（10.1）所确定的实得值大于临界时，可拒绝虚无假设（H 0），并接受备择假设。
• 2．当公式（8.1）所确定的实得值小于临界值时，便没有充分理由拒绝虚无假设（H 0），故暂认为虚无假设是成立的，把虚无假设先接受下来。
2 0.05(1)

3.84
2 0.01(1)

6.63
（4）统计决断：02.05(1)

2

2 0.01(1)
0.01 p 0.05
故拒绝虚无假设，接受备择假设，即高中生对文理分科的意见差异显著。
•
2
检验的假设（p293）
– 分类相互独立，互不包容
– 观测值相互独立
– 期望次数的大小
自学能力
实际观察次数（f0） 15
理论次数（fe又称
18

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容，选择合适的行列变量，构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表，以便于进行卡方检验。
计算理论频数
确定期望频数
根据交叉表中的数据，结合各组的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理论频数，为后续的卡方检验提供依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值，该值反映了实际频数与理论频数的差异程度。
自由度的确定
在计算卡方值时，需要确定自由度，自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标，通常选择0.05或0.01作为显著性水平。
判断显著性
根据卡方值和自由度，结合显著性水平判断卡方检验的结果是否显著，从而得出结论。
3.84、6.63等），可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前，需要明确研究的目的和假设，以便有针对性地收集相关数据。
根据研究目的和内容，制定合适的调查问卷或建立数据收集程序，确保数据的完整性和准确性。
详细描述
例如，在市场调研中，我们可以通过卡方检验来分析不同年龄段、性别、职业等人群对于某产品的态度或购买意愿是否有显著差异，从而为产品定位和营销策略提供依据。
实际案例二：医学研究中的应用
总结词
在医学研究中，卡方检验常用于病例对照研究和队列研究中的分类变量关联性分析。
详细描述
例如，在病例对照研究中，我们可以通过卡方检验来比较病例组和对照组在某些基因型、生活方式或暴露因素上的分布是否有统计学差异，从而探讨病因或危险因素。

卡方检验

10.4802
统计决断

双向表的自由度: df=(r -1)(c -1) 查χ2值表，当 df =(3-1)(3-1)=4 时
(24)0.05 9.49
(24)0.01 13.3
9.49 ＜χ2= 10.48 ＜ 13.3，则 0.05 > P > 0.01 结论：学生是否愿意报考师范大学与家庭经济状况有显著关系。
1 ：2 ：1 ？
解：1.提出假设 H0：健康状况好、中、差的人数比例是1：2：1 H1：健康状况好、中、差的人数比例不是1：2：1 2选择检验统计量并计算对点计数据进行差异检验,可选择χ2检验
（3）计算理论次数
fo
fe
13.5 27.0 13.5
54
好中差
总和
15 23 16
54
4、计算卡方值
5、比较决策查χ2值表，当 df =k -1=2 时
(22)0.05 5.99
χ2= 1.22 ＜ 5.99，则 P > 0.05
结论：理论频数与实际频数差异不显著,表明该校老年教师健康状况的人数比例是1：2：1。
χ2的连续性校正
例3：历年优秀学生干部中男女比例为2：8，
今年优秀学生干部中有3个男生，7个女生。问今年优秀学生干部的性别比例与往年是否有显著差异？
六、四格表的χ2检验
如果r×c表的χ2检验所作的结论为差异
显著，这并不意味着各组之间的差异都显著。如果需要进一步知道哪些组差异显著，哪些组差异不显著，还需进行四格表的χ2检验。
1、四格表的含义
四格表是只有两行、两列的双向表。也就
是有两个变量，每一个变量各被分为两类
的双向表
变量Ⅰ 变量 Ⅱ 合计 A C A+C B D B+D 合计 A+B C+D N=A+B+C+D

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

步骤一（ fo - fe ）
步骤二
步骤三
fo （%） fe （%） 60.9 66.7
（ f o - f e )² （ f o - f e )² /fe
社会学
— 5.8
33.5
0.5028
经济学
文学信息学
76.0
61.3 69.2
66.7
66.7 66.7
9.3
— 5.4 2.5
86.5
28.9 6.4

α = 0.05
χ² = 5.1783
0
χ²α (2) = 5.99

2
卡方检验的概念
（一）卡方检验：多个总体的比较
从总体的不同类别中抽取元素构成样本，样本包含总体中各个类别的元素，对不同类别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。拟合优度检验是 χ ² 检验中重要的一部分，可以同时对多个总体进行比较。
第十章卡方检验

卡方分布就是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验，即根据样本的频数分布来推断总体的分布。不同于回归分析以及 t 检验和方差分析（三者都属于参数统计），它属于自由分布的非参数检验（非参数统计）。它可以处理一个因素分为多种类别或多种因素各有多种类别的资料。凡是可以应用比率进行检验的资料，都可以用卡方检验。卡方检验是用途很广的一种假设检验方法。例如，它包括两个或多个样本率及构成比之间的差别有无统计意义的推断，分类变量配对设计下的卡方检验以及频数分布的拟合优度检验等。在社会统计学中应用最多的用于分类变量之间拟合优度和独立性检验的 χ² 检验。 χ² 检验可以判断变量之间是否相关，但，不能判断相关程度为多大。

α = 0.05 χ² = 2.3293
2
0
χ²α (3) = 7.815
（二）适用场合：分类变量之间的关系

χ² 检验用于分类变量之间关系的检验，可以判断不同类别的目标量之间是否存在显著差异。 χ² 检验主要用来检验频数问题，即检验各类实际观察的频数是否显著不同于假设的期望频数。同时，χ² 检验还可用于判断两个分类变量之间是否存在联系；这时称 χ² 检验为对立性检验。如果连个分类变量之间没有关系，则称二者相互独立。
1.2967
0.4338 0.0960
步骤四
2
fo fe 2 2.3293
fe

自由度 = （R-1）×（C-1）=（2-1）×（4-1）= 3 α = 0.05，查表得：χ²α (Байду номын сангаас) = 7.815 由于 χ² < χ²α (3)，所以我们不能拒绝虚无假设，即认为四个专业的学生对宿舍管理改革的赞成是一致的，调查数据中的差异是由于抽样的随机性造成的。

举例说明

某车间有甲，乙，丙三个技工进行生产，上周甲，乙，丙三个人产量分别占总量的 58%，33% 和 9%，丙进行学习，想提高技术。一周后三人产量共生产了 270 件产品，其中甲，乙，丙三人分别生产 150 件，85 件和 35 件。请判断丙学习后三人产量占的比例是否发生了变化。在这个例子中，假定三人产量所占比例没有变化，那么甲，乙，丙三人产量期望值分别为：

首先，我们假设四个专业的学生之间不存在差异，即四个专业的学生赞成改革的比例是一致的，即均为 280 100 % 66 .7% 420
H 0： 1 2 3 4 66.7% H1： 1， 2， 3， 4 不完全相等
观察值专业
期望值

独立性检验

例如，我们分析阅读习惯于学历是否有关。随机抽取 254 人进行调查，调查结果如下表：
高中以下
高中
大学
研究生
合计
早上看
中午看晚上看有空看
6
12 38 21
13
16 40 22
fe 156.6 89.1 24.3
步骤四
—6.6 —4.1 10.7
43.56 16.81 114.49
0.278161 0.188664 4.711523
2
fo fe 2
fe
5.1783

通过差卡方分布表得到 χ²0.05 (2) = 5.99 > χ² = 5.1783，所以认为丙学习后三人产量所占比例没有发生变化。自由度 = k-1= 3-1 = 2

f e甲 0.58 270 156.6件 f e乙 0.33 270 89.1件 f e丙 0.09 270 24.3件
观察值
期望值
步骤一（ fo - fe ）
步骤二（ f o - f e )²
步骤三（ f o - f e )² /fe
fo 150 85 35

φ 系数，克拉默 V 系数。它们用于判断变量之间相关程度的大小，但是这两个系数的应用也有其局限性。
卡方统计量

χ² 可以用于变量之间的拟合优度检验和独立性检验，测定两个分类变量之间的相关程度。 2 f f χ² 统计量表达式为： 2 o e fe
其中，f0 是观察值，fe 是期望值。
在 χ ² 检验中，如果 χ ² > χ ² α (k-1) ，则拒绝虚无假设。 χ²α (k-1) 为给定值，其中（k-1）是自由度。自由度是可以自由变动的变量个数，在列联表中，自由度 = （R－1）× （C－1）。

例如，从某学校社会学，经济学，文学，信息学四个专业中随机抽取 420 名学生针对学校宿舍管理改革的态度进行调查。调查结果如下表所示，以 α = 0.05 的显著性水平检验四个专业的学生对宿舍管理改革的看法是否存在差异。社会学赞成反对合计 67 43 110 经济学 76 24 100 文学 65 41 106 信息学 72 32 104 合计 280 140 420
χ² 统计量是平方和的加总，因而，χ² ≥ 0 。 χ ² 值的大小与变量的个数有关，即观察值和期望值配对数越多， χ² 值越大，因而，χ² 统计量的分布与自由度有关。 χ² 统计量描述的是观察值与期望值之间的接近程度，两个越接近， fo fe 越小，χ² 越小。反之， f o f e 越大，χ² 越大。

第十章卡方检验描述