X2检验
X2检验的基本思想

除以相应的理论频数,即得统计量x2值。
(A-T)2 x2=∑ T
3、确定概率P值:根据x2的自由度υ=(R-1)(C-1), 查x2界值表。 4、判断结果
如果不能拒绝H0,则认为两个样本来自相同的总体,两
样本率的差异在统计学上无显著性;若拒绝H0,认为两样本 来自不同总体,两样本率的差异在统计学上具有显著性。 x2界值与检验假设的关系
四格表资料确切概率法的计算步骤 1、在四格表周边合计数不变的条件下,列出四个实际
频数a、b、c、d变动的组合情况,共列“周边合计中最小数
+1”个。 2、计算实际D*与各种组合的D* D* =ad-bc 3、计算实际概率与各组合的概率:pi (a+b)!(c+d)!(a+c)!(b+d) ! Pi= a! b! c! d! 4、计算同时满足|Di|≥0实际D*和Pi≤实际P*条件的四格 表的累计概率。
6
50
17
301
55
141
78
492
四格表资料的Fisher确切概率法 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV
的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非
预防组,结果见表。问两组新生儿的HBV总体感染率有无 差别? 两组新生儿HBV感染率的比较 组别 预防注射组 非预防组 合计 阳性 4 5 9 阴性 18 6 24 合计 22 11 33 感染率(%) 18.18 45.45 27.27
当υ≥2时,一般不作校正。
x2
(1A-T1-0.5)2 C=∑ T
(n) (1ad-bc1- )2 2 x2C=∑ (a+b) (c+d) (a+c) (b+d) 注意,最小理论频数TRC的判断:R行与C列中, 行合计数中的最小值与列合计中的最小值所对应格子 的理论频数最小。
X2检验

X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。
一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。
两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。
造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。
为了区别这两种情况,应当进行X2检验。
其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。
将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。
2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。
即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。
上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。
当H0被拒绝时,就意味着接受其对立假设即备择假设H1。
此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。
一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。
3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。
计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。
用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。
后者为81.25人。
然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。
计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。
卡方检验

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。
x2检验 医学统计学

基本思想
所谓两属性X和Y互相独立,是指属性X的概 率和属性Y的概率分布无关,否则称这两种 属性之间存在关联性。即
ij
ri cj
( nri n
)( ncj n
)
Tij
n ij
nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立
α=0.05
2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理
有效例数
无效例数
合计
有效率(%)
A药 B药 合计
68(64.818)a 52(55.182)c
120 (a+c)
6(9.182)b
74 (a+b)
11(7.818)d
63 (c+d)
17 (b+d)
137 (n=a+b+c+d)
91.89 82.54 87.59
P=0.01, x2 =6.63 ▪ P=0.05时, v=1, x2 =3.84
v=2, x2 =5.99
四格表χ2检验公式
当n≥40,T≥5时
2
( ARC TRC )2 TRC
2
ad bc2 n
a ca bc db d
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
为两组疗效之间的差异有统计学意义。
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
配对四格表χ2检验
▪ 一般形式
甲属性
乙属性
卡方检验

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。
x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
X2检验
基本步骤:
提出假设 计算理论次数 计算卡方(基本公式) 计算自由度 结合自由度与显著水平找出卡方临界值 比较数据得出结论
配合度检验
实际频数(观察频数):在实验或调查中得到的计数资料。
理论次数(期望次数):是指根据概率原理、某种理论、某种 理论次数分布或经验次数分布计算出来的次数。
当单元格的人数过少时:
单元格合并法(如调整变量的分类方式);
增加样本数;
去除样本法(次数少的类别不具有研究价值时,但推广结论时 要注意);
使用校正公式(只有两项分类的配合度检验,应用连续性校正 公式计算;如果三项分类及以上时出现某一单元格内的理论次 数小于5,用基本公式即可)。
卡方检验的类别
f0i 2 fxifyi
1)
同质性检验
一、单因素分类数据的同质性检验 二、列联表形式的同质性检验
同质性检验可以分析几种因素之间是否真有实质上的 差异,或者判断几次重复实验的结果是否同质。
是对两个样本同一个变量的分布状况的检验,是对几 个样本数据是否同质作出判断。
1.计算各个样本组的X2值和自由度
性别
学业水平 中等以上 中等以下 男 23(A) 17(B) 40(A+B) 女 28(C) 22(D) 50(C+D)
51(A+C) 39(B+D) 90(A+B+C+D)
2.相关样本四格表卡方检验
(A D )2
2 A D
A,D为四格表中两次 实验或调查中分类项 目不同的那两个格的 实计次数。
X2检验
简单讲,卡方检验方法检验的是样本观测次数(或百分比)与 理论或总体次数(或百分比)的差异性。
应用X2检验分析数据时,对计数数据总体的分布形态不作任何 假设,因此,X2验被视为是非参数检验的一种。
X2检验
X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。
主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。
X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。
在SPSS中,所有X2检验均用Crosstabs完成。
Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。
在分析时可以产生二维至n维列联表,并计算相应的百分数指标。
统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。
如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。
Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies 过程实现。
界面说明【Rows框】用于选择行*列表中的行变量。
【Columns框】用于选择行*列表中的列变量。
【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。
如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。
Layer在这里用的比较少,在多元回归中我们将进行详细的解释。
【Display clustered bar charts复选框】显示重叠条图。
【Suppress table复选框】禁止在结果中输出行*列表。
【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。
Chi-square复选框:计算X2值。
Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。
Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。
统计学-离散型分类计数资料x2检验
谢谢您的聆听
THANKS
实施过程中注意事项
明确研究目的和假设
在进行x2检验前,需要明确研究目的 和假设,以便选择合适的检验方法和 解读结果。
检查数据是否符合要求
在实施x2检验前,应对数据进行检查 ,确保数据符合x2检验的要求,如观 察频数不宜太小等。
注意连续性校正
当数据需要进行连续性校正时,应按 照相应的方法进行校正,以保证检验 结果的准确性。
方法比较
Fisher确切概率法和似然比检验法都是用于分析离散型分类计数资料的统计方法,它们 具有不同的原理和适用范围。Fisher确切概率法适用于小样本或偏态数据,能够提供精
确的P值;而似然比检验法适用于大样本数据,具有较高的检验效能。
选择依据
在实际应用中,应根据研究目的、样本量大小、数据分布类型等因素综合考虑选择哪种统计方法。如果样本 量较小或数据分布偏态严重,推荐使用Fisher确切概率法;如果样本量较大且数据分布近似正态分布,可以 选择使用似然比检验法。同时,还需要注意不同方法间的差异和局限性,以确保分析结果的准确性和可靠性
选择某医院收治的肺癌患者和健康人群作为研 究对象,分别记录其吸烟情况。
研究方法
采用离散型分类计数资料的x2检验方法进行分析。
数据收集与整理
数据来源
01
从医院病历系统中提取肺癌患者和健康人群的吸烟情况数据。
数据整理
02
将吸烟情况分为“吸烟”和“不吸烟”两类,并分别统计肺癌
患者和健康人群中这两类人数的数量。
数据呈现
03
将整理后的数据以表格形式呈现,包括肺癌患者和健康人群的
吸烟情况分类计数。
x2检验结果解读
x2计算
根据整理后的数据,计算x2值。
【统计分析】x2检验
表 10-6
三种药物治疗老年 2 型糖尿病的疗效
有效
无效
合计
35
21
56
17
13
30
29
1
30
81
35
116
有效率(%) 62.5 56.7 96.7 69.8
单向有序R×C表
有两种形式
一种是R×C表中的分组变量(如年龄组)是有序的, 而指标变量(如传染病的类型)是无序的。其研究目 的通常是分析不同年龄组各种传染病的构成情况,此 种单向有序R×C表可用行×列表资料 χ2 检验进行分 析。
α=0.05
2. 计算检验统计
2 b c 12 2 11 12 4.92
bc
2 11
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验
公式与普通四格表检验公式相同
1. 建立假设 H0:两法的结果无相关 H1:两法的结果相关
α=0.05 2. 计算检验统计
2
a
ad bc2 n ca bc d b
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
双向无序R×C表
若研究目的为多个样本率(构成比)的比较, 可用行×列表资料 χ2 检验; 若研究目的为分析两个分类变量直接有无关联 性,可用行×列表资料 χ2 检验及列联系数进 行分析。
组别 降糖 1 号 玉泉丸 格列本脲 合计
x2检验基本思想
组别
+
-
合计
A
a
B
c
合计
m1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谢谢!
51(A+C) 39(B+D) 90(A+B+C+D)
2.相关样本四格表卡方检验
2
(A D )
AD
2
A,D为四格表中两次 实验或调查中分类项 目不同的那两个格的 实计次数。
100名学生先后测验两次,结果如下:
测验1
错 对
测验2 错
对 60
40 100
5(A) 55(B)
25(C) 15(D) 30 70
1. H :
0
H:
1
2.计算理论次数 3.计算卡方值 4.计算自由度 5.根据自由度和显著水平找出相应的卡方临界值
6.得出结论
二、检验假设分布的概率
假设某因素各项分类的次数分布为正态,故其理论次数的计算 应按正态分布概率,分别计算各项分类的理论次数。即先按正 态分布理论计算各项分类应有的概率再乘以总数,便得到各项 分类的理论次数。 事先分布不是理论分布而是经验分布,亦可按此经验分布计算 概率,再乘以总数便可得到理论次数。
小计
113
109
222
计数数据的合并
一、两格表及四格表数据的合并 1.简单合并 条件:分表小样本齐性;各分表某特征的相应比率接近。 2. X2相加法 即将各分表的X2值相加,查自由度为分表数目的X2表,确定显著性水 平。反应不灵敏。 二、R×C表数据的合并 1.简单合并法 2.分表理论次数合并法
某班有学生50人,体检结果按一定标准划分为甲乙丙三类, 其中甲类16人,乙类24人,丙类10人,问该班学生的身体状 况是否符合正态分布?
理论次数计算方法:按正态分布概率计算 按正态分布,正负3σ可认为包括了全体,那么各等级所占的横坐标应该 相同为2σ,故: 甲级: 乙级: 丙级: 因此,各等级的理论次数应为各部分理论上的概率乘以总人数。
基本步骤:
提出假设 计算理论次数
计算卡方(基本公式)
计算自由度 结合自由度与显著水平找出卡方临界值 比较数据得出结论
配合度检验
实际频数(观察频数):在实验或调查中得到的计数资料。 理论次数(期望次数):是指根据概率原理、某种理论、某种 理论次数分布或经验次数分布计算出来的次数。 自由度的确定与两个因素有关:一是实验或调查中分类的项数; 二是计算理论次数时,用观测数目的统计量的个数。
独立性检验
独立性检验主要用于两个或两个以上因素多项分类的计数资料分析, 即研究两类变量之间的关联性和依存性问题。
可以用独立性检验解释:两个因素是否相互独立,或说一因素的几 项分类在另一因素的几项分类上差异是否显著(这是一个问题的两 个方面) 独立性检验一般多采用表格的形式记录观察结果的计数资料,这种 表格即列联表。
独立性检验的统计假设一般多用文字叙述,理论次数是直接因素各自的分类项数有关。
一、四格表独立性检验
1、独立样本四格表卡方检验 当各单元格的理论次数大于或等于5时,可用简洁公式计算卡方 值。
自由度为1
X
2
N AD BC A B C D A C B D
A幼儿园
年龄组 达标 4岁组 6岁组 11 14 未达标 18 9 达标 10 17 未达标 15 10 达标 15 16 未达标 20 9 达标 13 17 未达标 17 11
B幼儿园
C幼儿园
D幼儿园
颜色命名能力 年龄组 达标 4岁组 6岁组 49 64 未达标 70 39 119 103 小计
2
(A D )
AD
2
二、R×C表独立性检验
R×C型列联表(二个因素:一个因素有R个分类,另一有C
个分类)
自由度为(R-1)×(C-1)
R×C表(非四格的表)卡方检验,允许有的格内的实计数
为0,最小的理论次数为0.5
某校对学生的课外活动内容进行调查,结果如图,问性别 与活动内容是否有关联或男女生在课外活动内容上是否存 在差异?
5.查X2表,判断X2值差是否显著。
对四所幼儿园的幼儿颜色命名能力进行了调查,调查材料是15种颜色的彩 色铅笔。凡能正确命名8种颜色及其以上者为达标,低于8种颜色则未达标。 调查对象分4岁组,6岁组。四所幼儿园调查的数据见下表。问这四所幼儿 园儿童颜色命名能力调查结果是否同质?儿童颜色命名能力与年龄有无关 系?
同质性检验可以分析几种因素之间是否真有实质上的 差异,或者判断几次重复实验的结果是否同质。 是对两个样本同一个变量的分布状况的检验,是对几 个样本数据是否同质作出判断。
1.计算各个样本组的X2值和自由度
2.累加各样本组X2值,计算其总和与自由度的总和 3.将各样本组原始数据按类别合并成一个新表,并计算总表的 X2值与自由度 4.计算异质性X2值——各样本组的累积X2值与合并后总表X2值之 差,自由度为各样本累积自由度与合并后总表自由度之差。
2 X 检验
简单讲,卡方检验方法检验的是样本观测次数(或百分比)与 理论或总体次数(或百分比)的差异性。
应用X2检验分析数据时,对计数数据总体的分布形态不作任何 假设,因此,X2验被视为是非参数检验的一种。
统计原理:比较观察值与理论值的差别,如果两者的差异越小, 检验的结果越不容易达到显著性水平;两者的差异越大,检验 的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而 接受备择假设。
当单元格的人数过少时: 单元格合并法(如调整变量的分类方式); 增加样本数; 去除样本法(次数少的类别不具有研究价值时,但推广结论时 要注意); 使用校正公式(只有两项分类的配合度检验,应用连续性校正 公式计算;如果三项分类及以上时出现某一单元格内的理论次 数小于5,用基本公式即可)。
卡方检验的类别
配合度检验
又称无差假说检验、是一种单因素检验,主要用来检验一个因素 多项分类的实际观察数与某理论次数是否接近。
独立性检验
用来检验两个或两个以上因素各种分类之间是否有关联或是否具 有独立性的问题。
同质性检验
检定不同人群母总体在某一个变量的反应是否具有显著差异。— —检测双样本在单一变量的分布情形,如果两样本没有差异,就 可以说两个母总体是同质的。
卡方检验的假设
分类相互排斥,互不包容; 观测值相互独立(最基本的假设):在实验研究中,让
观测值的总数等于实验中不同被试的总数,要求每个被试只有 一个观测值,这是确保观测值相互独立最安全的做法
期望次数的大小:一个简单的处理原则是设法使每一个类别
的理论次数都不要低于1,分类中不超过20%的类别的理论次 数可以小于5。
2
fe
f i. f
N
.j
ij
随机抽取90人,按男女不同性别分类,将学生成绩分为中等以上及中等 以下两类,结果如下。问男女生在学业水平上是否有关联?或男女生在 学业中等以上的比率差异是否显著?
学业水平
中等以上 中等以下
性别 男 23(A) 17(B) 40(A+B)
女
28(C)
22(D)
50(C+D)
活动内容
性别 男 女 合计 体育 21 6 27 文娱 11 7 18 阅读 23 29 52 合计 55 42 97
2
f oi f ei
f
ei
2
fe
2
i
f xi f
N
. yi
f0i N( 1) fxi fyi
2
同质性检验
一、单因素分类数据的同质性检验 二、列联表形式的同质性检验
一、检验无差假说
处理一个因素两项或多项分类的实际观察频数与理论 频数分布是否相一致问题,或说有无显著差异问题。
无差假说既是假设各项分类之间的机会均等,或概率 相等
因此,理论次数=总数×1 ⁄ 分类项数
某项民意测验,答案有同意、不置可否、不同意3种。调查 了48人,结果同意的24人,不置可否的12人,不同意的12人。 问持这3种意见的人数是否有显著不同?