第六章 卡方检验
卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。
在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。
卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。
期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。
而实际频数则是实验中观察到的实际结果。
卡方检验的步骤如下:1.建立零假设和备择假设。
零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。
2.确定显著性水平 alpha,通常取值为0.05。
3.构建卡方检验统计量。
计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。
4.根据自由度和显著性水平,查卡方分布表得到 P 值。
5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。
卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。
卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。
举个例子,某药厂要研发一种新的药物来治疗心脏病。
为了验证该药的疗效,实验组和对照组各50 人。
在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。
卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。
除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。
卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。
其中比较明显的一点就是对样本量有一定的要求。
当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。
此外,在面对非常态分布数据时,卡方检验也会出现问题。
当数据呈现正态分布时,卡方检验的准确性最高。
然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。
卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。
医学统计学6卡方检验

卡方检验的卡方值
卡方值是卡方检验的统计量,用于衡量实际观测值和期望值之间的差异。 卡方值越大,就表示观测值与期望值之间的差异越大,这意味着结论更可信。
如何进行卡方检验
第一步
确定研究的问题和相关变量, 并给出所需的假设。
第二步
收集数据并整理成交叉列联 表。
第三步
计算卡方值和自由度。
第四步
查阅卡方分布表,确定相应置信度水准下的临 界值。
2
应用
概率常用于医学研究中,以测量一种治疗对患者的疗效。
3
公式
概率=事件发生的次数/总次数。
统计学中的假设
在统计学中,我们需要制定一个或多个假设进而做出相应的决策。常见的假设有零假设和备择假设。
零假设
零假设是指不存在两个群体之间的差异。
备择假设
备择假设是指存在两个群体之间的差异。
什么是卡方检验
卡方检验是一种用于比较两个或多个群体在某些因素上的分布情况的方法。
卡方检验与其他假设检验的区 别
卡方检验主要用于回答多个分类变量间是否有关联的问题,而 T 检验和 Z 检 验主要用于回答单变量的问题。
卡方检验对于数据的类型并无太多的要求,而 T 检验和 Z 检验只适用于概率 分布为正态分布的数据。
卡方检验的计算公式
卡方检验的计算公式如下: χ² = ∑(O-E)²/E
为什么需要统计学
准确
统计学可以让我们从收集到的数据中得出真正 准确可靠的结论。
决策
统计学有助于做出决策并帮助我们更好地理解 数据背后的信息。
推断
统计学允许我们通过对大量数据的推断得到新 的信息。
掌握
掌握医学统计学对于实现优质医保研究至关重 要。
概率
22第六章卡方检验

≤ (或
2
2 )< c
2 0.01 ,0.01<
p≤0.05,表明实际观察次数与理论次数差异显著,
实际观察的属性类别分配显著不符合已知属性类
别分配的理论或学说;
若 (或
2
2 c)≥
2 ,p 0.01
≤0.01,表明实际
观察次数与理论次数差异极显著,实际观察的 属性类别分配极显著不符合已知属性类别分配
第二节
适合性检验
一、适合性检验的意义
判断实际观察的属性类别分配是否符合
已知属性类别分配理论或学说的假设检验称
为适合性检验 。
在适合性检验中,无效假设
H0
:实际观
察的属性类别分配符合已知属性类别分配的理 论或学说; 备择假设
HA
:实际观察的属性类
别分配不符合已知属性类别分配的理论或学说。
在无效假设成立的条件下,按已知属性类 别分配的理论或学说计算各属性类别的理论次 数。 适合性检验的自由度等于属性类别数减1。 若属性类别数为 k,则适合性检验的自由度为 k-1。然后根据(6-1)或(6-2)式计 p T. i
2 i
其中,Ai为第 i 组的实际观察次数,pi 为 第 i 组的理论比例,T. 为总观察次数: T. Ai
将【例6· 2】按(6-3)式计算 :
2
A 1 T. T. pi
2 2 2 2 2 1 491 76 90 86 743 743 9 / 16 3 / 16 3 / 16 1 / 16
2 c
1650
2 c
1650
3、计算
c2
( A T 0.5)2 ( 390 412.5 0.5) 2 412.5
【实用】卡方检验(5)PPT文档

2 0.619 0.363 (0.4) 0.285 0.316 0.118 试判断该小麦的株高表现是否遵从正态分布。
在假设两种随机现象相互独立的情况下,确定各组合的概率,并计算各组合按概率进行分配时的观测值频数
x 2.381 5.637 12.4 19.72 22.68 18.88 并统计各结果观测值的频数
解:H0:x~N(μσ) HA: x 不服从正太分布 由于总体μ、σ未知,故由样本去估计(采用点估计):
样本 x 65.60,样本 S 22.50
x 65.60, S 22.50
首先算出各组的理论频率:
pi
Φ
xi1
Φ
xi
式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。 本例中:k=9 再算出各组的理论频数:E(fi)=Npi =100×pi
有7=5%1的0置0信水×平认p为i杨麦1号本的株高例遵从中正态各分布组。 的已计算出并列于表6-2中。 继而便可算出x 统计量值: 若两者相互独立,表明三种灌溉方式对叶态2表现的影响相同。
本例中的自由度df=k-1-p=12-1-2=9,查x2 值表可知,
2 2 2 2 2 2 本例中,设灌溉方式与与叶态表现无关联,则深水灌溉与绿叶同时出现的理论频率应为三种灌溉方式中深水灌溉的频率与三种叶态中
且已经算得 样本x 94.8,样本S 5.2。
试判断该小麦的株高表现是否遵从正态分布。
正态分布是连续分布,没有自然的类别,为了利用卡方检
验,可先用第2章介绍的方法将数据进行分组,然后以每组作为 一个类别,再用卡方检验进行正态分布的适合性检验。
组中值 83 86 89 92 95 98 101 104 107 组分点值 84.5 87.5 90.5 93.5 96.5 99.5 102.5 105.5 组频数 3 6 12 20 23 19 10 5 2 理论频数 2.38 5.64 12.4 19.7222.6818.8811.37 4.95 1.98 偏差量 0.62 0.36 -0.4 0.29 0.32 0.12 -1.37 0.05 0.02
卡方检验

Stata第六章卡方检验本节STATA命令摘要[by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow]tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]•列联表分析STATA命令:[by分层变量:]tab2变量1变量2[,allchi2lichi2exactcellcolumnrow]上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。
例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。
用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。
具体资料为:(摘自医学统计方法,金丕焕主编,p163)。
组别经常偶尔从不饮用合计肝癌组26442898健康组28491794合计549345192显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。
tab2groupcustom,rowchi2->tabulationofgroupbycustom|customgroup|123|Total-----------+--------------------------------------------+----------1|①264428|98|②26.5344.9028.57|100.00-----------+--------------------------------------------+----------2|③284917|94|④29.7952.1318.09|100.00-----------+--------------------------------------------+----------Total|⑤549345|192|⑥28.1248.4423.44|100.00Pearsonchi2(2)=2.9497Pr=0.229①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的占第一组观察总数的百分比;③该行表示第二组(健康组)的3个观察数;④该行表示第二组的各个观察数的占第二组观察总数的百分比;⑤该行表示关于饮用醋冷水习惯的三个分类:“经常”,“偶尔”和“从不”的合计数;⑥该行表示上述三个合计数分别占总样本数的百分比。
卡方检验

计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18
统计学-卡方检验

总数
289
289
0
1.2560
H0:大豆花色 2分离符合 大豆花色F 分离符合3∶1比率;HA:不符合 比率; 不符合3∶1比率。 比率。 比率 比率 显著水平
α 。由于该资料只有 ν =0.05。由于该资料只有k=组, = k − 1 = 1 , ,
值时需作连续性矫正。 故在计算 χ 2 值时需作连续性矫正。
上述计算的χ2统计量只是近似地服从连续型随 机变量χ2分布。在对次数资料进行χ2检验利用 连续型随机变量χ2分布计算概率时,常常偏低,
特别是当自由度为1时偏差较大,需要作连续 性矫正。 Yates(1934)提出了一个矫正公式,矫正后的 2 χ2值记为 χc :
( O − E − 0.5) χ =∑ E
ν =k-1
χ2统计量是度量实际观察频数与理论频数偏离程度的 一个统计量, χ2越小,表明实际观察频数与理论频数 越接近; χ2 =0,表示两者完全吻合; χ2越大,表示
两者相差越大。 对于本例,可算得
(O − E)2 χ =∑ E 74.062 (−63.31)2 (−49.31 2 39.562 ) = + + + = 92.696 417.94 139.31 139.31 46.44 ν = 4 −1 = 3
(|O − E| − 1/ 2) 2 2 可得: 由 χC = ∑ 可得: E (|-8.75|-0.5) 2 (|8.75|-0.5) 2 2 χC = + = 0.3140 + 0.9420 = 1.2560 216.75 72.25
2 2 查附表, 查附表, χ 2 = 3.84 现 χ C = 1.2560 < χ 0.05,1 故应接受 。 0 .05, 1 H0,说明大豆花色这对性状是符合 说明大豆花色这对性状是符合3∶1比率,即符合一对等 比率, 比率
第六章 卡方检验

• R*2 或2* C • 无序 • 在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣 四个等级分类,其结果见P169表7-13。问两地水牛体型构 成比是否相同? • 表7-13 两地水牛体型分类统计 • 优 良 中 劣 • 甲 10 10 60 10 • 乙 10 5 20 10
• • • • • • • • • • • • • • •
2、选择Table Analysis,打开对话框
3、将A放在Row,将B放在Column,将freq放在Cell Counts
4、在Statistics中设置Exact Test检验,单击OK
5、结果如下,大致分为3部分,第一部分是频数和列百分比表;第二部分是四种 检验方法结果,p值都大于0.05水平;第三部分是Fisher精确检验结果,p值 位0.7246,远远大于0.05,可见判决情况与被告种族是没有关系的。
高级生物统计
• 第六章 卡方检验
列联表分析
使用Statistics菜单下的Table Analysis可以进行 列联表分析(即属性频数数据分析) 例1:为了考察法院判决是否与被告种族有关,调查了 326位被告的判决情况如表所示: 黑人 有罪 17 白人 19
无罪
149
141
1、首先建立数据集 Data panjue ; Input A B freq@@;\*其中A取1表有罪,2无罪;B 取1表黑人,2表白人*\ Cards; 1 1 17 1 2 19 2 1 149 2 2 141 ; Run;
•
Statistics for Table of r by c Statistic DF Value Prob Chi-Square 1 9.2774 0.0023 Likelihood Ratio Chi-Square 1 9.4190 0.0021 Continuity Adj. Chi-Square 1 7.9444 0.0048 Mantel-Haenszel Chi-Square 1 9.1615 0.0025 Phi Coefficient -0.3405 Contingency Coefficient 0.3224 Cramer's V -0.3405
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• (一)独立性检验的次数资料是按两因子属性类 别进行归组。根据两因子属性类别数的不同而构 成2×2、2×c、r×c列联表(r为行因子的属性类 别数,c为列因子的属性类别数)。而适合性检验 只按某一因子的属性类别将如性别、表现型等次 数资料归组。
• (二)适合性检验按已知的属性分类理论或学说 计算理论次数。独立性检验在计算理论次数时没 有现成的理论或学说可资利用,理论次数是在两 因子相互独立的假设下进行计算。
际观察次数,E表示理论次数,可将上述情况列成表6-1。
表6-1 羔羊性别实际观察次数与理论次数
性别 公 母
合计
实际观察次数O 428(O1) 448(O2) 876
理论次数E O-E
438(E1)
-10
438(E2)
10
876
0
(O-E)2/E 0.2283 0.2283 0.4566
• 从表6-1看到,实际观察次数与理论次数存 在一定的差异,这里公、母各相差10只。 这个差异是属于抽样误差(把对该羊场一年 所生羔羊的性别统计当作是一次抽样调查)、 还是羔羊性别比例发生了实质性的变化?
注射 未注射 列总和
发病 未发病
12(18.7) 32(25.3) 22(15.3) 14(20.7) C1:34 C2:46
行总和
R1:44 R2:36 T:80
发病率 27.3% 61.1%
2、 提出无效假设与备择假设 H0:发病与否和注射疫苗无关,即二因子相互 独立。 HA:发病与否和注射疫苗有关,即二因子彼此 相关。
• 3、 计算理论次数
根据二因子相互独立的假设,由样本数据计算出各个理 论次数。二因子相互独立,就是说注射疫苗与否不影响发 病率。也就是说注射组与未注射组的理论发病率应当相同, 均应等于总发病率34/80=0.425。依此计算出各个理论次数 如下:
注射组的理论发病数:E11=44×34/80=18.7 注射组的理论未发病数:E12=44×46/80=25.3, 未注射组的理论发病数:E21=36×34/80=15.3未注射组的理论
• (四)列表计算 2
表6—3 2计算表
类型 黑色无角牛 黑色有角牛 红色无角牛 红色有角牛
总计
实际观察次 数O
192(O1) 78(O2) 72(O3) 18(O4)
360
理论次数E O-E
202.5(E1) 67.5(E2) 67.5(E3) 22.5(E4)
360
-10.5 +10.5 +4.5 -4.5
6.3 独立性检验
• 一、独立性检验的意义 对次数资料,除进行适合性检验外,有
时需要分析两类因子是相互独立还是彼此 相关。这种根据次数资料判断两类因子彼 此相关或相互独立的假设检验就是独立性 检验。独立性检验实际上是基于次数资料 对子因子间相关性的研究。
• 如研究两类药物对家畜某种疾病治疗效果 的好坏,先将病畜分为两组,一组用第一 种药物治疗,另一组用第二种药物治疗, 然后统计每种药物的治愈头数和未治愈头 数。这时需要分析药物种类与疗效是否相 关,若两者彼此相关,表明疗效因药物不 同而异,即两种药物疗效不相同;若两者 相互独立,表明两种药物疗效相同。
• 三、 2的连续性矫正
• 由公式计算的2只是近似地服从连续型随 机变量2分布。在对次数资料进行2检验利 用连续型随机变量2分布计算概率时,常常
偏低,特别是当自由度为1时偏差较大。 Yates(1934)提出了一个矫正公式,矫正后
的2值记为 c2
• 当自由度大于1时, 分布与连续型随机变量 分布相近似,这时,可不作连续性矫正, 但要求各组内的理论次数不小于5。
H0:实际观察次数之比符合9∶3∶3∶1的理论比例。 HA:实际观察次数之比不符合9∶3∶3∶1的分离理
论比例。
(二)选择计算公式 由于本例的属性类别分类数
k=4:自由度df=k-1=4-1=3>1,计算2。
• (三)计算理论次数 依据各理论比率9:3:3:1计算 理论次数:
黑色无角牛的理论次数E1:360×9/16=202.5; 黑色有角牛的理论次数E2:360×3/16=67.5; 红色无角牛的理论次数E3:360×3/16=67.5; 红色有角牛的理论次数E4:360×1/16=22.5。
• 要回答这个问题, 首先需要确定一个统计 量用以表示实际观察次数与理论次数偏离 的程度;然后判断这一偏离程度是否属于 抽样误差,即进行显著性检验。
• 为了度量实际观察次数与理论次数偏离的程度, 最简单的办法是求出实际观察次数与理论次数的 差数。为了避免正、负抵消,可将两个差数O1-E1、 O2-E2平方后再相加,即计算∑(O-E)2,其值越大, 实际观察次数与理论次数相差亦越大,反之则越 小。
未发病数:E22=36×46/80=20.7。 ★表6-11括号内的数据为相应的理论次数。
• 4、 计算2c值 将表6-11中的实际次数、理论次数代入公 式得:
+
•1)=6.63,而2c =7.944>20.01(1),
1) (r-1)=(2-1) (2-1)=1,在进行2检验时,需作连续性矫正,
应计算值2c 。
表6—10 2×2列联表的一般形式
1
2
行总合
1 2 列总合T.
O11(E11) O21(E21)
C1=O11+O21
O12(E12) O22(E22)
C2=O12+O22
R1=O11+O12 R2=O21+O22 T= O11+O12+ O21+O22
• 适合性检验的自由度等于属性类别分类数减1。若属 性类别分类数为k,则适合性检验的自由度为k-1 。
• 计算出2或2c。将所计算得的2或2c值与根据自由度k-1 查2值表所得的临界2值:20.05、20.01比较:
• 若2 (或2c)<20.05,P>0.05,表明实际观察次数与理论
• 检验步骤如下: (一)提出无效假设与备择假设
H0:子二代分离现象符合3∶1的理论比例。 HA:子二代分离现象不符合3∶1的理论比例。 (二)选择计算公式
由于本例是涉及到两组毛色(白色与黑色),属性 类 别 分 类 数 k=2 , 自 由 度 df=k-1=2-1=1 , 须 使 用 连 续性校正公式来计算。
P<0.01,否定H0,接受HA,表明发病率与是 否注射疫苗极显著相关,这里表现为注射组
发病率极显著低于未注射组,说明该疫苗是
有预防效果的。
• 在进行22列联表独立性检验时,还可利用下述简 化公式计算:
• 【例】 在研究牛的毛色和角的有无两对相
对性状分离现象时,用黑色无角牛和红色 有角牛杂交,子二代出现黑色无角牛192头, 黑色有角牛78头,红色无角牛72头,红色 有角牛18头,共360头。试问这两对性状是 否符合孟德尔遗传规律中9∶3∶3∶1的遗 传比例?
• 检验步骤: (一)提出无效假设与备择假设
第六章 2检验
• 2检验主要有三种用途:一个样本方差的同
质性检验、适合性检验和独立性检验。
• 后两者都适用于离散型资料的假设检验,
其基本原理是通过2值的大小来检验实际观
测值与理论值之间的偏离程度。
• 适合性检验是比较观测值与理论值是否符 合的假设检验,而独立性性检验是判断两 个或两个以上因素之间是否具有关联关系 的假设检验。
x1、x2、…、xn,并求出其标准正态离差:
,
,…
• 记这n个相互独立的标准正态离差的平方和 为:
• 2 =
=
它服从自由度为n的2分布,记为
~ 2 (n);
• 若用样本平均数代替总体平均数μ,则随机 变量
2=
• 服从自由度为n-1的分布,记为
~
2分布是由正态总体随机抽样得来的一种
连续型随机变量的分布。显然,≥0,即的 取值范围是[0,+∞;分布密度曲线是随自由 度不同而改变的一组曲线。随自由度的增 大,曲线由偏斜渐趋于对称
• (三)计算理论次数
根据理论比率3∶1求理论次数:
白色理论次数:E1=260×3/4=195 黑色理论次数:E2=260×1/4=65
• (四)计算 2c
表6—2 2c计算表
性状
白色 黑色 总和
实际观察次 数(O)
理论次数 (E)
O-E
181
195
-14
79
65
+14
260
260
0
2 c
次数差异不显著,可以认为实际观察的属性类别分配符合 已知属性类别分配的理论或学说;
• 若20.05≤2 (或2c)<20.01,0.01<P≤0.05,表明实际观察
次数与理论次数差异显著,实际观察的属性类别分配不符
合已知属性类别分配的理论或学说;
二、适合性检验的方法
• 下面结合实例说明。
【例】 在进行山羊群体遗传检测时,观 察了260只白色羊与黑色羊杂交的子二 代毛色,其中181只为白色,79只为黑 色,问此毛色的比率是否符合孟德尔 遗传分离定律的3∶1比例?
0.935 2.804 3.739
• (五)查临界2值,作出统计推断
• 当自由度df=1时,查得20.05(1) =3.84,计 算的2c<20.05(1),故P>0.05,不能否定H0,
表明实际观察次数与理论次数差异不显著, 可以认为白色羊与黑色羊的比率符合孟德 尔遗传分离定律3∶1的理论比例。
• 若某组的理论次数小于5,则应把它与其相 邻的一组或几组合并,直到理论次数大于5 为止。
6.2 适合性检验
• 一、适合性检验的意义 • 判断实际观察的属性类别分配是否符合已
知属性类别分配理论或学说的假设检验称 为适合性检验。
• 在适合性检验中,无效假设为H0:实际观察的属性 类别分配符合已知属性类别分配的理论或学说;备 择假设为HA:实际观察的属性类别分配不符合已知 属性类别分配的理论或学说。并在无效假设成立的 条件下,按已知属性类别分配的理论或学说计算各 属性类别的理论次数。