卡方检验配对四个表资料的x2检验

卡方检验SPSS操作

要想获得卡方值，我们需用到非参数检验中的非参数配对检验中的McNemar检验（其实也是常用的配对卡方检验）
16
三、行×列表资料的x2检验第8题，P440
17
其 (SPSS的操作步骤与四格表相同)
步骤一: 定义变量
步骤二: 输入数据
步骤三:对数据按频数进行加权
步骤四:对数据作X2分析
步骤五:分析结果
配对卡方检验专用
药物 A B
T o ta l
药物 * 药效 Cross tabulation
Count % within 药物 Count % within 药物 Count % within 药物
药效
有效
无效
73
9
89.0%
11.0%
52
22
70.3%
29.7%
125
31
80.1%
19.9%
无1/5的格子的理论数大于 1小于5或有 T<1。故不用合并或改用确切概率法。直接选择结果
练习题：
P440: 4、7、8题
23
⑵是否需要校正？四格表资料检验条件：（１）当n≥40且所有T≥5,用普通X2检验（２）当n≥40，但1≤T<5时, 用校正的X2检验（３）当n<40 或 T ≤ 1时，用四格表资料的确切概率法。 2. SPSS不会自动做两两比较
2
卡方检验SPSS操作要领
计数资料（频数表）：都是行列表数据结构： r,c,f（行、列、频数）
.006
Exact Sig. Exact Sig. (2-sided) (1-sided)
Likelihood Ratio
8.758
1

9 第十二章卡方检验(一)

确切概率法计算公式
在四格表的周边合计不变的条件下 , 用下式直接计算表内四个数据的各种组合之概率。的各种组合之概率。式中a、b、c、d为四格表的实际频数
(a+b)!(c+d)!(a+c)!(b+d)! P= a!b c!d!n ! !
四格表资料的精确检验法基本步骤
1、建立假设 Ho：假设差别是由抽样误差引起的 H1：假设差别是本质上存在的确定显著性水准：２、确定显著性水准：α＝0.05 ３、计算确切概率P 周边合计不变，列出各种组合的四格表；（1）周边合计不变，列出各种组合的四格表；计算各个四格表的| （2）计算各个四格表的|A-T|值；样本| （3）求|A-T|值≥样本|A-T|值的所有四格表的Pi 值； Pi=(a+b)!(c+d)!(a+c)!(b+d)!/[a!b!c!d!n!] （4）求出确切概率P：P＝ΣPi 结果判断：４、结果判断：在事先确定的显著性水准α下作出专业结论。出专业结论。
行×列表资料χ2检验时的注意事项
1、行×列表资料χ2检验对资料的要求是：不宜有1／5以上检验对资料的要求是：不宜有1 格子的理论数小于5 且理论数应大于1 格子的理论数小于 5 ，且理论数应大于 1 ，若发生上述情可选用下述三种处理方法三种处理方法：况，可选用下述三种处理方法： ① 适当增大样本含量以增大理论频数；增大理论频数； ② 将理论数过小的格子所在的行或列与性质相近的行或列中的实际数合并，性质相近的行或列中的实际数合并，使重新计算的理论数增大；删去理论数过小的行或列。数增大； ③ 删去理论数过小的行或列。后两种处理方法有可能损失资料信息，且可能破坏样本随机性，有可能损失资料信息，且可能破坏样本随机性，故不宜常规使用。常规使用。 2、当试验效应按照强弱分为若干个级别，试验结果可整理当试验效应按照强弱分为若干个级别，为单向有序行×列表资料，为单向有序行 × 列表资料，在比较各处理组间的效应有无差别时，宜选用秩和检验、Ridit分析趋势检验等，分析、无差别时，宜选用秩和检验、Ridit分析、趋势检验等，检验只能说明各组构成比的差别有无显著性。如作χ2检验只能说明各组构成比的差别有无显著性。 3、多个样本率或多个构成比的χ2检验，结果有显著性意义检验，只能认为总体率或总体构成之间总的来说有差别，时，只能认为总体率或总体构成之间总的来说有差别，不能说明两两之间皆有差别，不能说明两两之间皆有差别，若要对每两个率或每两个构成比进行比较，应采用行× 构成比进行比较，应采用行×列表的χ2分割法或者采用其它率或构成比的多重比较。其它率或构成比的多重比较。

卡方检验

卡方检验(Chi-square test)Li Junrongstat9@7.1 四格表资料的χ2检验χ2检验(Chi-square test)是现代统计学的创始人之一，K. Pearson（1857-1936）于1900年提出的一种具有广泛用途的统计方法，可用于两个或多个率（或者构成比）之间的比较，计数资料的关联度分析，拟合优度检验等。

一、卡方检验的基本思想卡方分布⏹属连续型分布⏹可加性是其基本性质⏹唯一参数，即自由度(1) 自由度为1的χ2分布若Z N ~(,),01则Z 2的分布称为自由度为1的χ2分布.(chi-square distribution),记为χ()12或χ21(). 图形:从纵轴某个点开始单调下降,先凸后凹.02468100.00.10.20.3 2220.05(1)0.05/22220.01(1)0.01/23.84(1.96)6.63(2.5758)Z Zχχ======(2) νZ Z Z ,...,,21互相独立,均服从N (,)01,则22221...νZ Z Z +++的分布称自由度为　ν的χ2分布,记为χν()2或)(2νχ,或简记为χ2.* 图形:单峰,正偏峰;自由度ν很大时,2()νχ近似地服从正态分布.有2()2(),22Z ννχνχννν-=服从均数为，方差为的正态分布.00.10.20.30.40.50369121518¿¨·½Öµ×Ý·ß×ÔÓÉ¶È£½1×ÔÓÉ¶È£½2×ÔÓÉ¶È£½3ÓÉ¶È£½62/)12/(2222)2/(21)(χνχνχ--⎪⎪⎭⎫⎝⎛Γ=ef 3.847.8112.59P ＝0.05的临界值χ2分布（chi-square distribution ）性质:若χνχν2122(),()互相独立, 则χνχν2122()()+服从χ2分布, 自由度=+νν12 χνχν2122()()-服从χ2分布, 自由度=-νν12卡方检验的基本思想组别有效无效合计有效率(%)试验组99 5 10495.20(p 1)对照组7521 9678.13(p 2)合计1742620087.00(p c )表7-1两组降低颅内压有效率的比较实际频数A (actual frequency)理论频数T (theoretical frequency)nn n column row T C R =⨯=总例数合计列合计行)()(RC四格表(fourfold table)它反映了理论数与实际数的吻合情况，该统计量近似地服从自由度为ν的卡方分布。

医学统计学 -第09章卡方检验

0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
（2）计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础：超几何分布，不属于卡方检验
谢谢
表慢性咽炎两种药物疗效资料
分组
兰芩口服液银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率（%） 91.11
68.57 81.25
合计
45 35 80
问题：两个总体有效率是否相等?
（1）建立检验假设 H0：π1=2 两药的总体有效率相同 H1：π1≠π2 两药的总体有效率不同检验水准=0.05
bc
= 1
若b+c<40，采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节行×列表资料的2检验
(一）R×C表最常见的形式是
2×C列联表（一般为2个构成比的比较） R ×2列联表（一般为多个样本率的比较）
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
（1）建立检验假设，确定检验水准
H0 :1 2 3
H1
:
1
,

卡方检验

表内用虚线隔开的这四个数据是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table），或称2行2列表（2×2 contingency table）从该资料算出的两种疗法有效率分别为44.2%和77.3%，两者的差别可能是抽样误差所致，亦可能是两种治疗有效率（总体率）确有所不同。

这里可通过x2检验来区别其差异有无统计学意义，检验的基本公式为：式中A为实际数，以上四格表的四个数据就是实际数。

T为理论数，是根据检验假设推断出来的；即假设这两种卵巢癌治疗的有效率本无不同，差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率，即53/87=60.9%，以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤：1.建立检验假设：H0：π1=π2H1：π1≠π2α=0.052.计算理论数（TRC），计算公式为：TRC=nR.nc/n 公式（20.13）因为上表每行和每列合计数都是固定的，所以只要用TRC式求得其中一项理论数（例如T1. 1=26.2），则其余三项理论数都可用同行或同列合计数相减，直接求出，示范如下：T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

按x2检验的自由度v=（行数-1）（列数-1），则该题的自由度v=（2-1）（2-1）=1，查x2界值表（附表20-1），找到x20.001（1）=6.63，而本题x2=10.0 1即x2＞x20.001（1），P＜0.01，差异有高度统计学意义，按α=0.05水准，拒绝H0，可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算，读者对卡方的基本公式有如下理解：若各理论数与相应实际数相差越小，x2值越小；如两者相同，则x2值必为零，而x2永远为正值。

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验（chi-square test）或称卡方检验x2检验（chi-square test）或称卡方检验，是一种用途较广的假设检验方法。

可以分为成组比较（不配对资料）和个别比较（配对，或同一对象两种处理的比较）两类。

一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者，结果如表20-11，问两种疗法有无差别？表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率（%）化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table），或称2行2列表（2×2 contingency table）从该资料算出的两种疗法有效率分别为44.2%和77.3%，两者的差别可能是抽样误差所致，亦可能是两种治疗有效率（总体率）确有所不同。

这里可通过x2检验来区别其差异有无统计学意义，检验的基本公式为：式中A为实际数，以上四格表的四个数据就是实际数。

T为理论数，是根据检验假设推断出来的；即假设这两种卵巢癌治疗的有效率本无不同，差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率，即53/87=60.9%，以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤：1.建立检验假设：H0：π1=π2H1：π1≠π2α=0.052.计算理论数（TRC），计算公式为：TRC=nR.nc/n 公式（20.13）式中TRC是表示第R行C列格子的理论数，nR为理论数同行的合计数，nC为与理论数同列的合计数，n为总例数。

第1行1列： 43×53/87=26.2第1行2列： 43×34/87=16.8第2行1列： 44×53/87=26.8第2行2列： 4×34/87=17.2以推算结果，可与原四项实际数并列成表20-12：表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的，所以只要用TRC式求得其中一项理论数（例如T1.1=26.2），则其余三项理论数都可用同行或同列合计数相减，直接求出，示范如下：T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

卡方检验12

表内用虚线隔开的这四个数据是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table），或称2行2列表（2×2 contingency table）从该资料算出的两种疗法有效率分别为44.2%和77.3%，两者的差别可能是抽样误差所致，亦可能是两种治疗有效率（总体率）确有所不同。

这里可通过x2检验来区别其差异有无统计学意义，检验的基本公式为：式中A为实际数，以上四格表的四个数据就是实际数。

T为理论数，是根据检验假设推断出来的；即假设这两种卵巢癌治疗的有效率本无不同，差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率，即53/87=60.9%，以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤：1.建立检验假设：H0：π1=π2H1：π1≠π2α=0.052.计算理论数（TRC），计算公式为：因为上表每行和每列合计数都是固定的，所以只要用TRC式求得其中一项理论数（例如T1. 1=26.2），则其余三项理论数都可用同行或同列合计数相减，直接求出，示范如下：T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

按x2检验的自由度v=（行数-1）（列数-1），则该题的自由度v=（2-1）（2-1）=1，查x2界值表（附表20-1），找到x20.001（1）=6.63，而本题x2=10.0 1即x2＞x20.001（1），P＜0.01，差异有高度统计学意义，按α=0.05水准，拒绝H0，可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算，读者对卡方的基本公式有如下理解：若各理论数与相应实际数相差越小，x2值越小；如两者相同，则x2值必为零，而x2永远为正值。

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验（chi-square test）或称卡方检验x2检验（chi-square test）或称卡方检验，是一种用途较广的假设检验方法。

可以分为成组比较（不配对资料）和个别比较（配对，或同一对象两种处理的比较）两类。

一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者，结果如表20-11，问两种疗法有无差别？表20-11 两种疗法治疗卵巢癌的疗效比较表用虚线隔开的这四个数据是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table），或称2行2列表（2×2 contingency table）从该资料算出的两种疗法有效率分别为44.2%和77.3%，两者的差别可能是抽样误差所致，亦可能是两种治疗有效率（总体率）确有所不同。

这里可通过x2检验来区别其差异有无统计学意义，检验的基本公式为：式中A为实际数，以上四格表的四个数据就是实际数。

T为理论数，是根据检验假设推断出来的；即假设这两种卵巢癌治疗的有效率本无不同，差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率，即53/87=60.9%，以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤：1.建立检验假设：H0：π1=π2H1：π1≠π2α=0.052.计算理论数（TRC），计算公式为：TRC=nR.nc/n 公式（20.13）式中TRC是表示第R行C列格子的理论数，nR为理论数同行的合计数，nC为与理论数同列的合计数，n为总例数。

第1行1列： 43×53/87=26.2第1行2列： 43×34/87=16.8第2行1列： 44×53/87=26.8第2行2列： 4×34/87=17.2以推算结果，可与原四项实际数并列成表20-12：表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的，所以只要用TRC式求得其中一项理论数（例如T1.1=26.2），则其余三项理论数都可用同行或同列合计数相减，直接求出，示如下：T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

卡方检验配对四个表资料的x2检验

卡方检验SPSS操作

9 第十二章 卡方检验(一)

卡方检验

医学统计学 -第09章 卡方检验

卡方检验

x2检验或卡方检验和校正卡方检验的计算

卡方检验12

x2检验或卡方检验和校正卡方检验的计算

9 第十二章卡方检验(一)

医学统计学 -第09章卡方检验