卡方检验法

合集下载

统计方法卡方检验

统计方法卡方检验卡方检验（Chi-Square Test）是一种统计方法，用于检验两个或多个分类变量之间的关系。

它通过比较观察到的频数与期望的频数之间的差异，来判断这些变量是否独立或存在相关性。

卡方检验可以用于不同类型的问题，包括：1.两个分类变量之间的关系：例如，我们可以使用卡方检验来确定性别和吸烟偏好之间是否存在关联。

2.多个分类变量之间的关系：例如，我们可以使用卡方检验来确定教育水平、职业和收入之间是否有关联。

卡方检验的原理是基于观察到的频数与期望的频数之间的差异。

观察到的频数是指在实际数据中观察到的变量组合的频数。

期望的频数是指在假设独立的情况下，根据变量边际分布计算得到的预期频数。

卡方检验通过计算卡方统计量来衡量这两组频数之间的差异。

在进行卡方检验之前，需要设置零假设（H0）和备择假设（Ha）。

零假设通常是指两个或多个分类变量之间独立的假设，而备择假设则是指两个或多个分类变量之间存在相关性的假设。

卡方检验的计算过程可以分为以下几个步骤：1.收集观察数据：将观察到的数据以交叉表格的形式整理起来。

表格的行和列分别代表两个或多个分类变量的不同组合，表格中的数值表示观察到的频数。

2.计算期望频数：根据变量边际分布计算得到期望频数。

期望频数是在零假设成立的情况下，根据变量边际分布计算得到的预期频数。

3.计算卡方统计量：根据观察频数和期望频数之间的差异计算卡方统计量。

卡方统计量的计算公式为：X^2=Σ(（O-E）^2/E)其中，Σ代表对所有单元格进行求和，O表示观察到的频数，E表示期望频数。

4. 计算自由度：自由度（degrees of freedom）是进行卡方检验时需要考虑的自由变量或条件的数量。

在卡方检验中，自由度等于（行数 - 1）乘以（列数 - 1）。

5.查找临界值：使用给定的自由度和显著性水平（通常为0.05）查找卡方分布表格，以确定接受或拒绝零假设。

6.比较卡方统计量和临界值：如果卡方统计量大于临界值，则拒绝零假设，认为两个或多个分类变量之间存在相关性；如果卡方统计量小于临界值，则接受零假设，认为两个或多个分类变量之间独立。

卡方检验法的基本步骤

卡方检验法的基本步骤1.引言1.1 概述引言是一篇长文的开篇部分，它为读者提供了一个大致了解文章主题和内容的概述。

在本文中，我们将探讨卡方检验法的基本步骤。

卡方检验法是一种统计方法，用于确定观察到的数据是否与期望的数据分布相符合。

它可以用于比较两个或多个分类变量之间的关系，并确定它们是否独立。

卡方检验法的步骤主要包括计算期望频数、计算卡方值和判断显著性。

通过这些步骤，我们可以评估数据之间的差异，从而得出结论。

在接下来的章节中，我们将详细介绍卡方检验法的基本概念和原理，以及具体的步骤。

了解卡方检验法的基本步骤对于进行实证研究和数据分析至关重要。

通过掌握这些步骤，我们可以准确地分析和验证数据，进一步推动统计学和实证研究的发展。

1.2文章结构文章结构部分的内容如下:1.2 文章结构本文将以卡方检验法的基本步骤为核心内容进行阐述，主要分为引言、正文和结论三个部分。

引言部分将对卡方检验法进行概述，介绍其基本概念和原理，旨在为读者提供对该方法的整体了解。

同时，还会说明本文的目的和意义，以引起读者的兴趣和阅读欲望。

正文部分将详细阐述卡方检验法的基本概念和原理。

首先，将介绍卡方检验法是一种统计推断方法，用于分析两个或多个分类变量之间的关联性。

然后，将详细解释卡方检验法的基本步骤，包括建立假设、计算卡方值、确定临界值和进行推断。

通过实例分析，将具体说明每个步骤的操作过程和意义，以帮助读者掌握卡方检验法的实施方法。

结论部分将对本文进行总结，简要回顾卡方检验法的基本步骤和应用前景。

首先，将对卡方检验法的基本步骤进行总结和概括，强调每个步骤的重要性和关联性。

然后，将探讨卡方检验法在实际应用中的前景和意义，包括其在医学研究、社会科学和市场调查等领域的应用。

最后，还将提出未来对于卡方检验法的进一步研究方向和改进空间，以促进该方法在实践中的更广泛应用。

通过以上的文内结构，本文将全面系统地介绍卡方检验法的基本步骤，使读者能够深入了解该方法的原理和实施过程。

卡方检验基本公式检验方法

上述几种情况整理成配对四格表(表7-3)
配对四格表资料的χ2检验（McNemar's test）
H0：b，c来自同一个实验总体（B=C）；
注：B=C=(b+c)/2
H1：b，c来自不同的实验总体（B C ）；α=0.05。
当b c 40时， 2 (b c)2 , 1
bc
b c 40时，需作连续性校正， 2 ( b c 1)2 , 1
1122.59 15
18
卡方值
χ2检验的基本公式
2 ( A T )2 ,
T
(R 1)(C 1)
上述检验统计量由K. Pearson提出，因此许多统计软件上常称这种检验为Pearson’s Chi-square test，下面将要介绍的其他卡方检验都是在此基础上发展起来的。
二、四格表资料专用公式
2
,(2Biblioteka )服从均数为，方差为2的正态分布χ2分布（Chi-square distribution）
0.5 0.4
f
( 2)
1 2(
/ 2)
2 2
(
/ 21)
e2 / 2
纵高
0.3 0.2 0.1 0.0
0
自由度＝1 自由度＝2 自由度＝3 自由度＝6 P＝0.05的临界值
3 3.84 6 7.81 9
检验假设： (以P119 例7-6为例，进一步分析）
H0： A
，任两对比组的总体有效率相等
B
H1： A B，任两对比组的总体有效率不等
0.05
检验水准调整：（否则结果会自相矛盾！）
2 31.586 41 3
P 0.005
7.4 行×列表资料的 2检验

卡方检验和精确概率法-概述说明以及解释

卡方检验和精确概率法-概述说明以及解释1.引言1.1 概述卡方检验和精确概率法是统计学中常用的两种假设检验方法。

它们都是用于检验数据之间的相关性或者关联度，以判断某种因素与某种结果之间是否存在显著的统计关系。

卡方检验是一种非参数的假设检验方法，主要用于分析分类数据的关联性。

它通过统计观察值与期望值之间的差异，来决定变量之间是否存在显著性关系。

卡方检验可以处理多个分类变量之间的相关性问题，并且不受数据分布的限制。

在实际应用中，卡方检验经常用于医学研究、社会科学调研等领域，帮助研究者发现变量之间的关联性，从而进一步分析和解读数据。

精确概率法，又称为精确检验法，是一种基于排列组合原理的计算方法。

它主要用于处理小样本或者数据限制条件较多的情况下的假设检验问题。

与卡方检验不同的是，精确概率法通过枚举出所有可能的组合情况，计算出达到当前观察值或更极端情况下的事件发生概率，从而得出假设检验的结果。

精确概率法的主要优势在于其统计推断的准确性和稳定性，适用于小样本和稀有事件的研究。

本文将会介绍卡方检验和精确概率法的原理和应用，并比较它们的优缺点。

在结论部分，将会对两种方法进行对比分析，进一步探讨它们适用的场景和应用前景。

通过本文的阐述，读者将对卡方检验和精确概率法有更加全面的了解，并能够根据具体问题的特点选择适合的检验方法。

1.2文章结构1.2 文章结构本文将分为三个主要部分，分别是引言、正文和结论。

在引言部分，将对卡方检验和精确概率法的背景和概述进行介绍。

首先会对这两种方法进行简要的概述，包括其原理和应用领域。

接下来会明确本文的结构和目的，为读者提供整体上的概括。

在正文部分，将详细探讨卡方检验和精确概率法。

首先，在2.1节将详细介绍卡方检验的原理和应用。

会对卡方检验的基本原理进行解释，包括假设检验的流程和计算统计量的方法。

同时，会介绍卡方检验的应用领域，包括医学、社会科学和市场调研等。

接着，会对卡方检验的优缺点进行分析和讨论，以便读者全面了解其适用范围和局限性。

定性数据分析——卡方检验

定性数据分析——卡方检验卡方检验（Chi-square test）是统计学中用于检验两个定性变量之间关联性的方法。

它可以帮助我们确定两个变量之间的差异是由于随机因素导致的还是由于真实的关联性。

卡方检验的基本原理是，通过比较实际观察到的频数与期望频数之间的差异来判断变量之间是否存在关联。

在卡方检验中，我们首先要计算期望频数，即假设两个变量之间没有关联时，我们预计每个组别内的频数应该是多少。

然后，我们计算实际观察到的频数与期望频数之间的差异，并将这些差异加总得到一个卡方值。

最后，我们将卡方值与自由度相结合，使用卡方分布表来确定检验结果是否具有统计学意义。

卡方检验可以分为两种类型：拟合优度检验（goodness-of-fit test）和独立性检验（independence test）。

拟合优度检验用于确定观察到的频数是否与预期的频数相匹配。

它在比较一个变量的分布与一个预先给定的理论分布之间的差异时非常有用。

例如，我们可以使用卡方检验来检验一个骰子是否公平，即骰子的六个面是否具有相等的概率。

独立性检验用于确定两个变量之间是否存在关联。

它可以帮助我们确定两个变量是否独立，即它们的分布是否相互独立。

例如，我们可以使用卡方检验来确定男性和女性之间是否存在偏好其中一种产品的差异。

在进行卡方检验时，我们需要满足一些前提条件。

首先，两个变量必须是独立的，即每个观察值只能属于一个组别。

其次，每个组别中的观察值必须相互独立。

最后，期望频数应该足够大，通常要求每个组别的期望频数大于5卡方检验的结果通常以p值的形式呈现。

p值表示观察到的差异是由于随机因素导致的可能性。

如果p值小于预先设定的显著性水平（通常为0.05），则我们可以拒绝原假设，即认为变量之间存在关联。

在实际应用中，卡方检验可以帮助我们解决许多问题。

例如，我们可以使用卡方检验来确定广告宣传对购买行为的影响，消费者对不同品牌的偏好程度，或者员工对不同工作条件的满意度。

卡方检验方法..

1 2 (

2
( )

2

2
)
2
1
e

2
2
0 2 , 1,2,3,...
17

2分布是一种连续型分布(Continuous distribution)，v 个相互独立的标准正态变量 (standard normal variable) ui (i 1,2,, ) 的平方和称为 2 变量，其分布即为 2 分布；自由度(degree of freedom)为v 。

22
第一节四格表资料χ2检验
一般四格表的基本形式 B1 A1 A2 合计 a c a+c B2 b d b+d 合计 a+b c+d n=a+b+c+d
23
表7-1 完全随机设计两样本率比较的四格表
属性处理组 1 阳性 A11 (T11) 阴性 A12 (T12) 合计
n1(固定值)
2
合计
16

(Continuous distribution)，v 个相互独立的标准正态变量(standard normal variable) 2 2 的平方和称为变量，其分布即为分布；自由度(degree of freedom) 为v 。
f ( )
2
分布是一种连续型分布
2

2
0.4
v=1
0.3
0.2
v=4 v=6
0.1
v=9
0.0 0 3 6 9 12 15
18
2分布的形状依赖于自由度ν 的大小：
① 当自由度ν≤2时，曲线呈“L”型； ② 随着ν 的增加，曲线逐渐趋于对称；

卡方检验的原理和内容公式原理

卡方检验是一种统计检验方法，其原理是比较理论频数和实际频数的吻合度或拟合优度。

基本思想是通过统计样本的实际观测值与理论推断值之间的偏离程度，来判断理论值是否符合。

卡方检验的应用范围包括检验某个连续变量或离散变量是否与某种理论分布接近，即分布拟合检验；以及检验类别变量之间是否存在相关性，即列联分析。

卡方检验的基本公式是卡方值，它是由实际频数和理论频数之间的差的平方与理论频数的比值计算得出的。

卡方值的计算公式如下：
卡方值=∑(实际频数-理论频数)^2 / 理论频数
其中，∑表示求和，实际频数和理论频数分别表示观测频数和期望频数。

如果卡方值越大，说明观测频数和期望频数之间的偏离程度越大；如果卡方值越小，说明观测频数和期望频数之间的偏离程度越小，越趋于符合。

需要注意的是，卡方检验的前提假设是样本数据服从卡方分布，且样本量足够大。

同时，卡方检验对于样本量较小的数据可能不太稳定，此时可以考虑使用其他统计方法如Fisher's exact test等。

卡方检验方法的操作方法

卡方检验方法的操作方法
卡方检验是用于分析两个分类变量之间是否存在关联的统计方法。

以下是卡方检验的操作步骤：
1. 设置假设：首先确定需要检验的假设，包括原假设和备择假设。

原假设是两个变量之间没有关联，备择假设是两个变量之间存在关联。

2. 构建列联表：将观察数据按照两个变量的分类情况构建一个列联表，可以是二维或更高维的表格。

3. 计算期望频数：假设原假设成立，根据样本数据的总体比例计算出每个单元格的期望频数。

即将每个单元格的行总频数乘以对应的列总频数，再除以总样本数。

4. 计算卡方统计量：将观察频数和期望频数按照一定的公式计算出卡方统计量。

统计量的计算公式为卡方统计量= (观察频数-期望频数)²/期望频数。

5. 计算自由度：根据列联表的维度计算自由度。

自由度的计算公式为自由度= (行数-1) * (列数-1)。

6. 查找临界值：根据所设定的显著性水平（通常为0.05或0.01），在卡方分布表中查找相应的临界值。

7. 判断结论：将计算得到的卡方统计量与临界值进行比较。

如果计算得到的卡方统计量大于临界值，则拒绝原假设，认为两个变量之间存在关联。

反之，接受原假设。

8. 报告结果：在判断结论的基础上，将结果进行描述并进行解释。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第八章记数数据统计法—卡方检验法知识引入在各个研究领域中，有些研究问题只能划分为不同性质的类别，各类别没有量的联系。

例如，性别分男女，职业分为公务员、教师、工人、……，教师职称又分为教授、副教授、……。

有时虽有量的关系，因研究需要将其按一定的标准分为不同的类别，例如，学习成绩、能力水平、态度等都是连续数据，只是研究者依一定标准将其划分为优良中差，喜欢与不喜欢等少数几个等级。

对这些非连续等距性数据，要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。

卡方检验是专用于解决计数数据统计分析的假设检验法。

本章主要介绍卡方检验的两个应用：拟合性检验和独立性检验。

拟合性检验是用于分析实际次数与理论次数是否相同，适用于单个因素分类的计数数据。

独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。

我们知道，统计分析就是依据样本所提供的信息，正确推论总体的情况。

在这一过程中，最根本的一环是确保样本的代表性及对实验的良好控制。

在心理与教育研究中，所搜集到的有些数据属于定性资料，它们常常是通过调查、访问或问卷获得，除了少数实验可以事先计划外，大部分收集数据的过程是难于控制的。

例如，某研究者关于某项教育措施的问卷调查，由于有一部分教师和学生对该项措施存有意见，或对问卷本身有偏见，根本就不填写问卷。

这样该研究所能收回的问卷只能代表一部分观点，所以它是一个有偏样本，若据此对总体进行推论，就会产生一定的偏差，势必不能真实地反映出教师与学生对这项教育措施的意见。

因此应用计数资料进行统计推断时，要特别小心谨慎，防止样本的偏倚性，只有具有代表性的样本才能作出正确的推论。

第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析，对于总体的分布不作任何假设，因此它又是非参数检验法中的一种。

它由统计学家皮尔逊推导。

理论证明，实际观察次数（f o）与理论次数（f e），又称期望次数）之差的平方再除以理论次数所得的统计量，近似服从卡方分布，可表示为：这是卡方检验的原始公式，其中当f e越大（f e≥5）,近似得越好。

显然f o与f e相差越大，卡方值就越大；f o与f e相差越小，卡方值就越小；因此它能够用来表示f o与f e相差的程度。

根据这个公式，可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。

它主要应用于两种情况：卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题，这里的观测次数是根据样本数据得多的实计数，理论次数则是根据理论或经验得到的期望次数。

这一类检验称为拟合性检验。

拟合性检验的零假设是观测次数与理论次数之间无差异。

其中理论次数的计算一般是根据某种理论，按一定的概率通过样本即实际观测次数来计算。

这里所说的某种理论，可能是经验规律，也可能是理论分布。

确定理论次数是卡方检验的关键。

拟合性检验自由度的确定与两个因素有关：一是分类的项数，二是在计算理论次数时，所用统计量或约束条件的个数，这两者之差即为自由度。

由于一般情况下，计算理论次数时只用到“总数”这一统计量，所以自由度一般是分类的项数减1。

但在对连续数据分布的配合度检验中，常常会用数据个数、平均数、标准差等统计量来计算理论次数，所以此时的自由度应从总分类项中减去更多的个数。

按照检验中理论次数的定义不同，拟合性检验有以下集中应用。

二、检验无差假设所谓无差假设，是指各项分类的实计数之间没有差异，也就是说各项分类之间的概率相等（均匀分布），因此理论次数完全按概率相等的条件来计算。

即任一项的理论次数都等于总数/分类项数。

因此自由度也就等于分类项数减1。

【例1】随机地将麻将色子抛掷300次，检验该色子的六个面是否均匀。

结果1-6点向上的次数依次是，43，49，56，45，66，41。

解：每个类的理论次数是300/6 = 50，代入公式：因此，在0.05的显著性水平下，可以说这个色子的六面是均匀的。

【例2】随机抽取60名高一学生，问他们文理要不要分科，回答赞成的39人，反对的21人，问对分科的意见是否有显著的差异。

解：如果没有显著的差异，则赞成与反对的各占一半，因此是一个无差假设的检验，于是理论次数为60/2=30，代入公式：所以对于文理分科，学生们的态度是有显著的差异的。

三、检验假设分布的概率这里的假设分布可以是经验性的，也可以是某理论分布。

公式中所需的理论次数则按照这里假设的分布进行计算。

【例3】国际色觉障碍讨论会宣布，每12个男子中，有一个是先天性色盲。

从某校抽取的132名男生中有4人是色盲，问该校男子色盲比率与上述比例是否有显著差异？解：按国际色觉障碍讨论会的统计结果，132人应该有132/12=11人是色盲，剩下的121人非色盲，代入公式有：因此，在0.05和显著性水平下，该校男子色盲比率与国际色觉障碍讨论会的统计结果有显著差异，显然根据比例可知该校的色盲率小于国际色觉障碍讨论会的统计结果。

【例4】在英语四级考试中，某学生做对了80个四择一选择题中的28题，现在要判断该生是否是完全凭猜测做题。

解：假如该生完全凭猜测做题，那么平均而言每道题做对的可能性是1/4，因此80个题中平均而能做对80/4=20题，代入公式有：因此，该生可能会做一些题。

四、连续变量分布的拟合性检验对于一组连续数据，经常需要对其次数分布究竟服从哪种理论分布进行探讨，这一方面的主要应用就是在前面经常所提到的总体正态性检验。

首先要将测量数据整理成次数分布表和画出次分布图，并据此选择恰当的理论分布。

这些理论分布是多种多样的，例如有正态分布、均匀分布等。

然后根据选择的理论分布计算出理论次数，就可以计算卡方统计量并进行显著性检验了。

若差异显著，说明所选择的理论分布不合适，可以再选一个理论分布进行检验，直至完全拟合。

当然有时也只需检验是否与某确定的理论分布相符，如正态性检验（参见教材有关内容）。

对连续随机变量分布的吻合性检验，关键的步骤是计算理论次数与确定自由度。

理论次数的计算是按所选理论分布规律，并利用观测数据的有关统计量来计算各分组（次数分布表中）理论次数。

自由度则是用分组数减去计算理论次数时所用统计量的数目。

这种拟合性检验计算较为繁琐，不做要求。

五、小理论次数时的连续性校正卡方检验中，当某分类理论次数小于5时，卡方统计量不能很好地满足卡方分布，此时需要对卡方统计量进行校正，称为卡方的连续性校正，其公式如下：尽管采用此方法校正后，卡方统计量能较为接近卡方分布，不过我们仍然建议在实际中最好增大样本的容量，尽量减少出现这种不大服从理论分布的情况。

第二节独立性检验卡方检验还可以用于检验两个或两个以上因素（各有两项或以上的分类）之间是否相互影响的问题，这种检验称为独立性检验。

例如要讨论血型与性格的关系，血型有A、B、AB、O四类，性格采用心理学上的A型性格来划分，即有A型和B型两种，每个人可能是它们之间交叉所形成的8种类型中的一种，那么倒底它们之间有不有关系，就可以用卡方独立性检验。

卡方独立性检验用于检验两个或两个以上因素（各有两项或以上的分类）之间是否相互影响的问题。

所谓独立，即无关联，互不影响，就意味着一个因素各个分类之间的比例关系，在另一个因素的各项分类下都是相同的，比如在血型与性格关系中，如果A型性格人群中各血型的比例关系，与B型性格人群中各血型的比例关系相同，就可能说血型与性格相互独立，当然这里的“两者比例相同”在统计的意义下，应表述为“两比例差异不超过误差范围”，因为就算总体之间相互独立，收集到两个比例完全相同的样本的可能是很小很小的，甚至是不可能的。

相反，若一个因素各个分类之间的比例关系，在另一个因素的各项分类下是不同的，则它们之间相关。

假如A型性格中A型血的比例高于B型性格中A型血的比例，而且达到显著水平，那么就可以说血型与性格之间相关，不相互独立。

卡方独立性检验的零假设是各因素之间相互独立。

因此理论次数的计算也是基于这一假设，具体计算时，采用列联表的方式，后面将举例说明。

【例1】某校对学生课外活动内容进行调查，结果整理成下表，表中彩色格子里的数是原始数据的汇总数，括号内的数是理论次数（是按下面将要介绍的原理计算得来的），此外的是原始数据。

性别(因素2)课外活动内容(因素1)小计和(fx) 体育文娱阅读男生21(15.3) 11(10.2) 23(29.5) 55女生 6(11.7) 7(7.8) 29(22.5) 42小计和(fy) 27 18 52 97由于所有学生参加三项活动的比例是27:18:52，因此如果课外活动的选择与性别没有关系的话，男女生参加这三项活动的比例也应是这同一比例，而男女各自的人数可以计算，所以每格内的理论次数的计算方法如下：男生中参加体育活动的理论人数：55×27/97=15.3参加文娱活动的理论人数：55×18/97=10.2参加阅读活动的理论人数：55×52/97=29.5女生中参加体育活动的理论人数：42×27/97=11.7参加文娱活动的理论人数：42×18/97= 7.8参加阅读活动的理论人数：42×52/97=22.5我们将行列的小计和分别用f x和f y来表示，总人数用N 来表示时，上述计算理论次数的方法可以表示为：fe ij = fx i× fy j/N所以，卡方独立性检验的公式可以表示如下，其中最后一个式子比较便于计算，fxy 表示每格的原始数据。

由于在计算理论次数时，用了按每个因素分类的小计和（fx 和fy，其个数分别记为R 个和C 个），和总和N ，而总和又可由按每个因素分类的小计和计算得来，因此若从总分类个数R×C中减去R+C，则将总和重复减去了，因此要补1 个自由度回来，所以最终独立性检验的自由度表示为：上述例题最终计算得：或者：这两个公式的计算结果有一点点差异，这完全是计算误差即四舍五入引起的。

df = (3-1)(2-1) = 2，而χ20.05(2) = 5.99，所以在0.05的显著性水平下，拒绝零假设，即可以认为性别与课外活动内容有关联，或者说男女生在选择课外活动上存在显著的差异。

四格表独立性检验对于两个都只作两项分类的因素，它们的数据整理成的是一个2×2 的表格，一般称为四格表，对于四格表教材里给出了一个更简洁的公式：公式中，a、b、c、d的规定要求是a和d必须呈对角线。

该公式的含义非常明确，即当对角线单元格中的次数差异越大时，卡方检验越容易显著，自然也就意味着两变量间的关联越密切。

掌握了一般的R*C表计算后，四格表计算相对简单地多。