第八讲 x2检验

合集下载

x2检验——精选推荐

x2检验——精选推荐

x2检验本章重点1.熟悉x2检验的基本思想。

2.掌握x2检验在四格表资料、行×列表资料中的应用。

3.掌握配对计数资料的x2检验。

χ2 检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用: χ2 检验的适用范围:1.推断两个或两个以上总体率或构成比之间有无差异;2.配对计数资料差异的显著性。

检验统计量:χ2应用:计数资料第一节 四格表资料的χ2 检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料一、四格表资料的基本公式x2检验基本思想检验“实际数”和假设“理论数”的差异是否是由于抽样误差引起(两个样本率的差异体现在“实际数”和假设“理论数”的差异中)。

实际数,用四格表表示,称为四格表资料,分别为a 、b 、c 、d ,其他的数据是从这四个实际数推算出来的,称为理论数(表中括号内的数据)。

实际数用A 表示,理论数T 表示。

A :表示实际频数,即实际观察到的例数。

T :理论频数,即如果假设检验成立,应该观察到的例数。

TRC :第R 行C 列的理论频数nR :相应的行合计,nC :相应的列合计n 为总例数检验统计量χ2 值反映了实际频数与理论频数的吻合程度。

Χ2检验是检验实际数与理论数差异程度的指标。

A 与T 的值越接近, χ2越小,相反,实际数与理论数之间的差数越大, χ2值也就越大。

所得χ2值如果小于界值的χ2,P>0.05,即接受了原假设,可认为两组人群的治疗效果差异无统计学意义。

反之,如果所得χ2值大于查表所得χ2值,则P<0.05,即差异有统计学意义。

自由度计算公式Χ2值的大小,除了取决于A-T 的差值外,还取决于格子数的多少,格子数越多, χ2值越大,只有排除了这种影响, χ2值才能正确反映A 与T 的吻合程度,因此,在查χ2表时,要考虑自由度的大小。

22(), ()(1)A T Tχν-=∑=-行数-1列数 R C RC n n T n=计算公式:V=(行-1)(列-1) 四格表资料由2行2列组成,V=(2-1)(2-1)=1自由度即自由变动的范围,由于四格表周边的合计数已经固定,因此只要算出任一格的理论数,其余三个格子的理论数就没有自由变动的余地了,四格表的自由度V=1。

8.无序分类资料的统计推断—X2检验

8.无序分类资料的统计推断—X2检验

8 无序分类资料的统计推断—— χ2检验χ2检验(chi-square test )是一种用途较广的假设检验方法,这里仅介绍它在分类变量资料中的应用,检验两个或两个以上的样本率或构成比之间的差异是否有统计意义。

8.1 四格表资料的χ2检验四格表即2 ⨯ 2列联表,其自由度df =1,又分为一般与配对两种情形,本节介绍一般四格表的χ2检验,主要是用来推断两个总体率或构成比之间有无差别。

一般四格表,①在总频数n ≥40且所有理论频数≥5时,用Pearson χ2统计量;②在总频数n ≥40且有理论频数<5但≥1时,用校正χ2统计量;③在总频数n <40或有理论频数<1时,用Fisher 精确概率法检验。

计数资料的数据格式有两种,一种是频数表格式,如表8-1;一种是原始记录格式,如前面第4章统计描述中的表4-3,这两种格式在SPSS 操作时有所不同。

例8-1 欲研究内科治疗对某病急性期和慢性期的治疗效果有无不同,某医生收集了182例采用内科疗法的该病患者的资料,数据见表8-1。

请分析不同病期的总体有效率有无差别?表8-1 两种类型疾病的治疗效果组别 有效 无效 合计 有效率(%)急性期 69 37 106 65.1 慢性期 30 46 76 39.5 合计998318254.4解 这是一般四格表,012:H ππ=,即急性期和慢性期的总体有效率相同。

建立3列4行的数据文件,如图8-1,其中行变量r 表示组别(值标签:1=“急性期”、2=“慢性期”),列变量c 表示疗效(值标签:1=“有效”、2=“无效”),freq 表示频数。

1.指定频数变量 选择菜单Data →Weight cases ,弹出Weight cases 对话框,见图8-2;选中Weight cases by ;在左边框中选中频数freq ,并将其送入Frequency 框中;单击OK 。

图8-1 例8.1数据文件 图8-2 Weight cases 对话框2.进行χ2检验 选择菜单Analyze → Descriptive Statistics → Crosstabs (交叉表),弹出Crosstabs 主对话框;将组别r 送入行变量Row(s)框,将疗效c 送入列变量Column(s)框,如图8-3。

卫生统计学:第八章 χ2检验

卫生统计学:第八章   χ2检验

-
6(c)
54(d)
60
合计
30
90
120
配对四格表资料的χ2检验
配对设计
对子号


1
+
+
2
+
-



120
-
-
成组设计
编号 剂量组 结果
1

+
2

+



120

-
甲、乙两种真菌培养基的培养结果


合计
(+)
(-)
(+) 24(a) 36(b) 60
(-) 6(c) 54(d) 60
合计 30
90
6
4
2
9
2.19*
0.0568*
8
7 1
3 10
3.19
0.0065
8
2
9
0
11
4.19
0.0002
* 为实际数据的四格表
d )!
!:阶乘
例8.4
表8.12 某中药制剂预防HIV垂直传播临床试验
组别
新生儿HIV阴性 新生儿HIV阳性 合计
中药制剂
6(a)
4(b)
10
对照组
2(c)
9(d)
11
合计
8
13
22
N=22<40,采用Fisher确切概率计算法 周边合计最小是8,共计可获得8+1=9种组合的四格表
Fisher’s exact probability
=2, x2 =5.99

X2检验

X2检验

X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。

一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。

两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。

造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。

为了区别这两种情况,应当进行X2检验。

其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。

将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。

2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。

即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。

上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。

当H0被拒绝时,就意味着接受其对立假设即备择假设H1。

此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。

一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。

3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。

计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。

用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。

后者为81.25人。

然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。

计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。

x2检验.

x2检验.
服从x2分布,计算出x2值后,查表判断这么大的 x2是否为小概率事件,以判断建设检验是否成立。
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2

( / 21)
e
2 / 2
ß ×¸ Ý
2 0.05(6)
2 2 0.05(6) 12.59 由于
1.
2. 3.
建立假设 H0:不同地区的人群血型分布构成相同 H1:不同地区的人群血型分布构成不同或不全相同 α=0.05 计算检验统计
3212 A2 n 1 2592 1080 987 nR nC
A1 A2
a+b c+d n=a+b+c+d
四格表统计量公式
当n≥40,T≥5时
2 ( A T ) 2 RC RC TRC
ad bc n 2 a c a b c d b d
2
四格表统计量公式
当n≥40,1≤T<5时
2 ( A T 0.5) 2 T
n ad bc n 2 2 a c a b c d b d
2
A T
2
T 411.25 19.81 20.58 297.59
321 41.25
2

444 358.15
358.15
2
4.
v=(3-1)(4-1)=6, 则P<0.05,拒绝H0,认为三个地区的人群血型分布构成不同或不全相同。 查χ2界值表

第八讲 x2检验

第八讲 x2检验
2 2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的 例数。 nR nC TRC n 自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
(3) 确定P 值,作出推断结论
0.5 0.4 0.3
纵高
0.2 0.1 0.0 0 3 6 9 12 卡方值
自由度=1 自由度=2 自由度=3 自由度=6
15
18
当自由度 确定后, 2 分布曲线下右侧尾 部的面积为 时,横轴上相应的 2 值记作 2,
x2分布界值


自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
直接计算表内四个格子数据的各种组合的概 率,然后计算单侧或双侧累计概率,并与检 验水准比较,作出是否拒绝H0的结论
配对四格表χ2检验

一般形式
甲属性 + 合计

乙属性 + a c a+c b d b+d
合计 a+b c+d n=a+b+c+d
注意:a、b、c、d代表的是对子数
配对四格表差异性检验统计量公式
2 2 4. 由于 0.05(6)
则P<0.05,拒绝H0,认为 民族与血型分布有关。
行×列表χ2检验注意事项
1. 若1/5以上格子的理论频数小于5,或至少有1格子 的理论频数小于1,要处理。 进一步增大样本含量 将相临的两行或两列合并(注意合理性) 2. 总的结论有统计学意义,即有差异,并不说明任意 两组间都有差异,做行×列表的分割才能检验任意 两组间是否有差异 3. 有些资料不适合做x2检验,如单向有序的行×列表 (等级资料)

X2检验的基本思想

X2检验的基本思想

甲法
+ - 合计
配对四格表资料示意
乙法
+

a
b
c
d
a+c
b+d
合计
a+b c+d n(a+b+c+d)
x2=
(b-c)2 b+c
x2=
(|b-c|-1)2 b+c
b+c≥40 b+c<40
行×列表资料的X2检验: 一二、、基基本本公数式据:有x五2=种n(情∑况:nARn2C -1) 1、多个样本率的比较:为R行2列 2、两个样本构成比的比较:为2行C列 3、多个样本的构成比比较:为R×C列 4、双向无序分类资料的关联性检验:为R×C列 5、双向有序分类资料的关联性检验:为R×C列
例:某矿工医院探讨矽肺不同期次患者的胸部平片密 度变化,492例患者资料整理成如下表,问矽肺患者肺门 密度的增加与期次有无关系?
不同期次矽肺患者肺门密度级别分布
矽肺期次
肺门密度级别
+
++
+++
合计
I
43
188
14
245
II
1
96
72
169
III
6
合计
50
17
55
78
301
141
492
四格表资料的Fisher确切概率法 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV 的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非 预防组,结果见表。问两组新生儿的HBV总体感染率有无 差别?
x2=∑
(A-T)2 T

X2检验

X2检验

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。

在分析时可以产生二维至n维列联表,并计算相应的百分数指标。

统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。

如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。

Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies 过程实现。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2
b c 1
bc
2
2 11 1
2 11
2
4.92
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验

公式与普通四格表检验公式相同 H1:两法的结果相关 α=0.05
1. 建立假设 H0:两法的结果无相关
2. 计算检验统计
ad bc n 2 a c a b c d b d 2 25 15 2 11 53 15.37
配对四格表χ2检验

一般形式
甲属性 + 合计

乙属性 + a c a+c b d b+d
合计 a+b c+d n=a+b+c+d
注意:a、b、c、d代表的是对子数
配对四格表差异性检验统计量公式
当b+c>40时
b c
2
2
bc
,
v 1
当b+c≤40时

2
b c 1

例10-3 为观察婴儿腹泻是否与喂养方式有关, 某医院儿科随机调查了消化不良儿童82例,对 每个个体分别观察腹泻与否和喂养方式两种属 性,结果如下,分析两种属性的关联性。 喂养方式 腹 有 30 17 47 泻 无 10 25 35 合计
人工 母乳 合计
40 42 82
2×2交叉分类表的一般形式及概率表达

四格表资料,若有理论数小于1或n<40,或作
χ2检验后所得概率P接近检验水准α,需要用确 切概率法直接计算概率以作判断。实际上,当 有统计软件条件下,大样本四格表的资料也可 用确切概率检验
四格表确切概率法

确切概率计算方法的基本思想:在四格表边 缘合计固定不变的条件下,利用公式
a b ! c b ! a c ! b d ! p
属性X
X1 Y1 A11 (π11) 属性Y Y2 A12 (π12)
合计
n1(πr1)
X2
合计
A21 (π21)
m1(πc1)
A22 (π22)
m2 (πc2)
n2(πr2)
n(1.0)
基本思想
所谓两属性X和Y互相独立,是指属性X的 概率和属性Y的概率分布无关,否则称这 两种属性之间存在关联性。即
1
1 1 2
x
2
AT
T
2

χ2值反映了实际频数与理论频数的吻合
程度,如果H0成立,则实际频数与理论 频数之差一般不会很大,若实际频数与 理论频数差别很大,出现大的χ2值的概 率P是很小的,P≤α时我们就怀疑假设成 立,因而拒绝假设,若P>α,则没有理 由拒绝它。
基本公式
( ARC TRC ) TRC
2 2
74 63 120 17
3. P>0.05 差异无统计学意义。
四格表资料χ2统计量的校正公式
当n≥40,1≤T<5时
( A T 0.5)2 2 T
n ad bc n 2 2 a c a b c d b d
bc
2
,
v 1
例10-4

用两种不同的方法对53名肺癌患者进行诊断, 结果如下,问两种方法的检测结果有无差别?
甲法 + 合计
乙法 + 25 11 36 2 15 17
合计 27 26 53
1. 建立假设 H0:两方法的检测结果无差别 H1:两方法的检测结果有差别 α=0.05 2. 计算检验统计
a !b !c !d !
直接计算表内四个格子数据的各种组合的概 率,然后计算单侧或双侧累计概率,并与检 验水准比较,作出是否拒绝H0的结论
行×列表χ2检验

公式:
( ARC TRC )2 2 TRC
A2 2 n 1 nR nC
自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
四格表χ2检验公式
当n≥40,T≥5时
( ARC TRC )2 2 TRC
ad bc n 2 a c a b c d b d
2
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 68 11 6 52 137 2.74
nri ncj ij ri cj ( )( ) n n
Tij n ij nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 30 25 10 17 82 9.98
例题10-6

某医院用3种穴位针刺治疗急性腰扭伤民, 数据如下,试比较3 组总体治愈率有无差别。
治愈数 未愈数 合计 治愈率
穴位
后溪穴
人中穴
80
20
18
20
98
40
81.6
50.0
腰痛穴
合计
24
124
38
76
62
200
38.7
62.0
1. 建立假设 H0:3组总体治愈率相等 H1:3组总体治愈率不全相等 α=0.05 2. 计算检验统计
2

例10-2 两种药物治疗葡萄球菌败血症疗效 的试验结果如下,问两种药物的疗效有无差 异? 疗效
药物
有效
无效
合计

乙 合计
28(26.09)
12(13.91) 40
2(3.91)
4(2.09) 6
30
16 46
1. 建立假设 H0:两药疗效相同 H1:两药疗效不同 α=0.05 2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理 A药 B药 合计 有效例数 无效例数 合 计 有效率(%)
68(64.818)a 52(55.182)c 120 (a+c)
6(9.182)b 11(7.818)d 17 (b+d)
74 63
(a+b) (c+d)
91.89 82.54 87.59
2 2 0.05(6) 4. 由于
则P<0.05,拒绝H0,认为 民族与血型分布有关。
行×列表χ2检验注意事项
1. 若1/5以上格子的理论频数小于5,或至少有1格子 的理论频数小于1,要处理。 进一步增大样本含量 将相临的两行或两列合并(注意合理性) 2. 总的结论有统计学意义,即有差异,并不说明任意 两组间都有差异,做行×列表的分割才能检验任意 两组间是否有差异 3. 有些资料不适合做x2检验,如单向有序的行×列表 (等级资料)
例题10-7

某研究者欲比较维吾尔族与回族的血型分布 情况,数据如下,试比较两个民族血型构成 有无差别。
血型
民 族 维吾尔族 回族 合计
A 442 369 811
B 483 384 867
O 416 487 903
AB 172 115 287
合 计 1513 1355 2868
1. 建立假设 H0:两个民族的血型构成比相等 H1:两个民族的血型构成比不相等 α=0.05 2. 计算检验统计
2
a c a b c d b d
2
ad bc n 2 n
2
28 4 2 12 46 2 46 1.69
30 16 40 6
3. P>0.05 差异无统计学意义。
交叉分类2×2表的关联性分析
2 2
40 42 47 35
3. P<0.05 差异有统计学意义。
列联系数(contingency coefficient)
r
2 n
2
0 <r<1
15.347 本例 r =0.18 15.347 484
四格表确切概率法

该方法是由R.A.Fisher提出的,其理论依据是 超几何分布
合计 275 125 84 484
1. 建立假设 H0:民族与血型无关 H1:民族与血型有关 2. α=0.05 3. 计算检验统计
602 702 222 202 2 484 ( 1) 275 122 275 125 84 86 84 151 15.35
2 2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的 例数。 nR nC TRC n 自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
x2分布界值


自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
2
27 26 36 17
3. P<0.05 , 拒绝H0,两种方法的结果存在关联性。
小结



熟悉χ2检验的基本思想。 掌握χ2检验在四表格资料、行×列表资 料中的应用。 了解行×列表的分割法及四表格的确切 概率法。
习题
1.对于总合计数n为400的4个样本率的资料做检验, 其自由度为( ) A.399 B.395 C.1 D.3 E.8 2.当四格表的周边合计不变时,如果某格的实际频数 有变化,则其理论频数( ) A.增大 B.减小 C.不变 D.不确定 E.增大或减少 3.从甲、乙两文中,查到同类研究的两个率的比较的 四格表资料,其 检验,甲文 ,乙文 , 可认为( ) A.两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.甲文结果不可信 E.甲文说明总体的差别大
相关文档
最新文档