列联表资料的X2检验

合集下载

第五章 χ2检验

第五章 χ2检验

χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。

第六章 χ2检验

第六章 χ2检验

二、计算检验统计量:
2 1 4 1 3
2
2 2 2 2 2 2 2 2 30 38 32 12 19 30 19 9 189 1 0 . 69 112 49 112 68 112 51 112 21 77 49 77 68 77 51 77 21
统计:按照α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。 专业:结合本例,可以认为三种方法治疗慢性支气管炎的效果不同或 不全相同。
2.两组或多组样本构成比的比较
例6-4:欲了解儿童白血病患者的血型分布是否与成 年患者有所不同,资料见表6-4。试分析儿童白血病 患者与成年患者的血型分布构成比有无差别?
第六章 χ2检验
《医学统计学》余松林主编
本章内容
第三节 独立性检验 第四节 趋势检验 第五节 多个四格表的联合分析 第六节 四格表的费歇尔精确概率检验
第三节 独立性检验
本节介绍应用χ2检验推断两个或两个以 上总体率(或构成比)之间有无差别及 两分类变量间有无相关关系。
一、四格表资料的χ2检验 (两个样本率的比较)
表6-4 儿童急性白血病患者与成人急性白血病患者的血型分布
分组
儿童 成人 合计
A型 30
19 49
B型 38
30 68
O型 32
19 51
AB型 12
9 21
合计 112
77 189
解:
一、建立假设,确定检验水准:
H0:儿童白血病患者与成人患者的血型分布构成比相同 H1:儿童白血病患者与成人患者的血型分布构成比不相同 检验水准α=0.05。
二、计算检验统计量:

X2检验

X2检验

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。

在分析时可以产生二维至n维列联表,并计算相应的百分数指标。

统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。

如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。

Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies 过程实现。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

x2检验第六版

x2检验第六版

第二个表显示列联表的资料,一个期望频数小于5(4.8)
皮尔逊卡方值x2(pearson chi-square)
连续校正x2(continuity correction),仅在2×2表计 算
似然比值(likelylihood ratio) 费歇尔精确检验(fisher‘s exact test) 线形组合(linear-by-linear association) 有效例数(N of valid cases)
如果想对其中的两个率进行相互比较时, 最好能够采用更加复杂的分类数据模型, 如对数线性模型或者logistic回归模型进行 分析,采用列联表分割等方法只能得到近 似的结果,最好不要使用。
四、配对设计
(一)配对设计四格表(2×2列联表)
计数资料配对设计的应用: 可用于两种检验方法、培养方法、诊断
有效例数(N of valid cases)
结论:有0个格子的期望频数小于5,最小 期望频数为6.56,符合pearson x2检验的要 求。
皮尔逊卡方值x2=4.130,p=0.042<0.05, 差别有统计学意义。
四格表校正卡方检验
例题9-3
步 骤:
1、定义变量,输入数据 设三个变量: 处理(r):即行号 状况(c):即列号 频数(f)
Rows框:sex columns框:x0 cells: percentages:选择row、column、total →continue→ok
Cells 按钮
首先是处理记录缺失情况报告,可见24例 均为有效值。
第九章 χ2 检 验(卡方检验)
χ2检验(chi square test)是以χ2 分布为理论基础的检验 方法。主要用于分类资料(列联表资料,contingency table)的假设检验。也用于频数分布的拟合优度检验 (goodness of fit).

X2检验简单教程一学就会

X2检验简单教程一学就会

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

Contingency coefficient复选框:即列联系数,其值界于0~1之间;Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。

第七章-X2检验(医学统计学)

第七章-X2检验(医学统计学)

四格表概率P的计算公式
(a+b)!(c+d)!(a+c)!(b+d)! P=────────────
a!b!c!d!n!
例8.8
表8.9 两型慢性布氏病的PHA皮试反应 ━━━━━━━━━━━━━━━━━━━
分型 阳性数 阴性数 合计 阳性率(%)
───────────────────
活动型 1(2.4) 14(12.6) 15 6.67
18.74
17.26
19.26
17.74
=10.262 ( 1 1 1 1 ) 18.74 17.26 19.26 17.74
=23.12
(2) 用专用公式计算
a=29、b=7、c=9 、d=28 、n=73
x2
(ad bc)2 n
(a b)(c d )(a c)(b d )
(29 28 7 9)2 73 23.12 36 37 38 35
3、查X2 界值表确定P值 按=1,查附表8,X2界值表得:
X20.05,1=3.84、 X20.01,1=6.63 、X20.005,1=7.88 X2 >7.88, P<0.005
4、推断结论 P<0.005, 按α=0.05,拒绝H0,接受H1,可认
为两总体阳性率有差别,铅中毒病人尿棕色素阳
x2
大。
可以根据X2分布原理,由X2值确定P值,从而作 出推论。
V=(行数-1)(列数-1)
四格表资料X2检验专用公式:
x2
(ad bc)2 n
(a b)(c d )(a c)(b d )
式中 :a、b、c、d为四个实际数,其中 a、c 为阳性数,b、d 为阴性数,n 为总例数。

x2检验

x2检验

4. 进行假设检验。如图所示,分别输入置信水平、临 界值和假设检验的结果。其中CHIINV 函数的自由度 =(第一类属性的分类数-1)*( 第二类属性的分类数1)=(3-1)*(4-1)=6。
B15 单元格的卡方概率值1.3E-07与B24 单元格的卡方统计量 42.748是表格的两个重要计算结果。 1、得到以上观察的样本的概率是0.00000013。这个概率几乎接 近于0,拒绝H0,所以可以认为总体的这两个属性不是独立的, 是显著相关的。 2、卡方统计量42.748,显著水平为0.01时的卡方临界值是 16.8117,所以P<0.01,同样拒绝H0,得出同样的结论
理论数(Ei) 312.75(E1) 104.25(E2) 104.25(E3) 34.75(E4) 556 问此豌豆性状的比率是否符合遗传分离定律的9∶3∶3∶1比例
解:理论数均大于5,df=3
315 312.752 101 104.252 108 104.252 32 34.752 2
2 =0.893+2.949=3.932 H0: O-T=0, α=0.05, df=1, 2 0.05=3.841, 2 > 2 0.05
结论:正常翅与残翅的分离比不符合3∶1
(2)矫正 正常翅 残翅
∣O-T∣-0.5 ( ∣O-T∣-0.5 )2 ( ∣O-T∣ 36.05 0.192 0.330 0.198 0.341 1.061
02.05 3.841, 2 02.05 , P 0.05
结论:接受H0,不同给药方式的治疗效果没有显著不同。
r×c列联表
例6.3称为2×2列联表,虽然在生物学问题中, 经常遇到的是2×2列联表,对于行、列大于2的 情况称为r×c列联表。 其理论数的计算与2×2列联表相同: df=(r-1)(c-1)

第09章 X2检验

第09章 X2检验

第9章 X2检验9.1 列联表统计分析1、列联表统计分析过程例9.1在二乙基亚硝胺诱发大白鼠咽癌的实验中,一组单纯用亚硝胺向鼻腔内滴注;另一组在鼻注的基础上加肌注维生素B12,问两组发癌率的差别有无统计意义。

实验结果如表9.1所示。

表9.1大白鼠鼻回癌的实验数据━━━━━━━━━━━━━━━━━━发癌数 未发癌数━━━━━━━━━━━━━━━━━━鼻注组 52 19鼻注加肌注组 39 3━━━━━━━━━━━━━━━━━━本例为两样本率之间的比较,可以采用x2检验进行分析。

1)首先建立数据文件,定义变量“组别”(n型,宽度为1,在数值标签中定义1为鼻注组,2为鼻注加肌注组)、“疗效”(N型,宽度为1,在数值标签中定义1为发癌,2为未发癌)、和“频数”并输入数据,如图9.1。

图 9.1 卡方检验数据格式由于该数据不是原始数据,而是频数表的数据。

所以要用“data”(数据)菜单中的weight cases(案例加权)来进行加权处理。

2)、单击Data(数据)菜单中的Weight Cases(案例加权)子菜单,弹出Weight Cases (案例加权)对话框,将“频数”变量单击进入Frequency Variable(频数变量)框内,按“频数”对数据进行加权,此时所有观测值相当于发生了“频数”次,如图9.1.2,单击Continue按钮返回主对话框。

图 9.2 案例加权3)、执行Analyze(统计分析)菜单|Descriptive Statistics(描述统计量)子菜单|Crosstabs…(交叉表)命令,系统弹出Crosstabs(交叉表)对话框,如图9.1.3,图 9.3交叉表对话框(1)单击变量从变量清单中选择1个(组别)或几个变量进入Row(s)(行)框中,作为交叉表的行,选择1个(疗效)或几个变量进入Column(s)(列)框中,作为交叉表的列,表示以“组别”变量为交叉表的行,以“疗效”为交叉表的列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)对于有序的R*C表资料不宜用X2检验
(五)、交叉分类2*2表的关联分析
1、 X2检验 2、列联系数r
(六)、2*2配对资料的关联性分析
1、 X2检验 注意与配对资料的四格表X2 检验(McNemar检验)不一样,是四格表 资料X2检验基本的公式
2、列联系数r
(七总体率(或构成比)
之间有无差别;两种属性的关联性(计
数资料的相关性分析)
• 4、方法:
⑴、专用公式。每一格的T值均>5且n>40;
P104,式(7-1);P105,式(7-4)
⑵、校正公式。有一格的T值<5且n>40;
P106,式(7-5);P106,式(7-6) ⑶、确切概率法。T<1或n<40时不计算X2值
(一)列联表资料的X2检验
列联表是按两种属性分类的一种频 数数据表。(表内数据为实际频数) 分类:交叉分类表
多组分类表
• 交叉分类:是以一个总体抽样后,按两种属性搭配 的类确定其个体数目而得。它需检验的是两种属性 是否独立(即计数资料的相关性或关联性)
• 多组分类:从多个总体(可视为属性X)分别抽样 后,按另一类属性Y的类确定其个体数目而得。它 需检验的是各总体按同一属性Y的类的分布概率是 否相同。
1、 X2检验 2、列联系数r
(八) 多个样本率比较的X2分割法
1、用途:当多个样本率比较的行*列表X2检验, 推论结论为拒绝,接受时,只能认为各总体之 间总的来说有差别,需要对每两个总体率之间 有无差别作出判断。其分析方法之一就是X2分 割法。
2、基本思想:
将2*k表(X2)分割成多个独立的四格表(X2) (其原理是X2分布 的可加性),并进行两两比 较。要求必须重新规定检验水准,其目的是为 保证检验假设中的第一类错误α 的概率不变
3、多个实验组间的两两比较 P114 公式(7-12)
4、实验组与同一对照组的比较 P114 公式(7-13)
(四)、行×列表资料的X2检验
• 1、用途:推断多个总体率(或构成比) 之间有无差别;两种属性的关联性(计 数资料的相关性分析)
• 2、计算公式: P111,式(7-10) • 3、注意事项: (1)、 X2检验要求理
论频数不能太小,否则将导致分析的偏 性。一般认为行×列表中不能有1/5以上 格子的理论频数小于5或有一个理论频数 小于1。
对理论频数太小有以下三种处理办法:
A、最好增加样本含量,以增加理论频数。 B、删去上述理论频数太小的行或列。 C、 将太小理论频数所在的行或列与性质相近 的邻行或邻列的实际频数合并。
(2)、当进行多个样本率(或构成比)比较 的X2检验,结论为拒绝检验假设H0时,只能 认为各总体率(或构成比)之间总的来说 有差异,但不能说它们彼此间有差异或某 两个间有差别,还需进一步进行两两比较。
• 3、观察结果: 四种形式
⑴、甲+乙+ a ; ⑵、甲+乙- b; ⑶、甲-乙+ c ; ⑷、甲-乙- d。 • 4、配对资料的专用四格表
• 5、计算公式:McNemar test
⑴、专用公式:b+c>40 P107,式(7-7)
⑵、校正公式:b+c<40 P107,式(7-8)
6、注意事项:⑴、要求资料为配对的计数资 料;⑵要注意配对资料的四格表X2检验的适用 条件
• 关联性检验的假设:H0: ij=I. ×.j H1:H0不成立。
• 多组分类资料分布概率的齐性检验 H0: 1=2=.3 H1:H0不成立
• 共同点:计算的统计量X2及计算公式均一样,自由 度也一样为(行—1)×(列—1)
X2检验(Chi—square test)概述
• 1、基本思想:基本公式(p312,式10-14) 中A为实际频数,T为理论频数。它是根据检 验假设来确定的。如作两样本率的比较,我 们先假设两组的总体率相同,均等于两组合 计的总率,再乘上每个样本的样本含量。如 果检验假设H0成立,则实际频数A和理论频 数T之差一般不会很大,出现大的X2值的概 率是很小的;若P<,我们就怀疑检验假设 H0成,立则的没可有能理性由很拒小绝,它因。而X2拒与绝P值它的;对若应P>关 系 X20可.01查,X2界值表(成反比)。X20.05, ;
(Fisher exact probabilities) • 5、注意事项:⑴、要求每个样本要分为互斥的
两类;⑵要注意区分四格表检验的X2公式及其适 用条件
(三)、配对资料的四格表X2检验
• 1、用途:对配对资料研究所获得的 计数资料进行比较。
• 2、配对设计包含:⑴、同一批样品 用两种不同的处理方法;⑵、观察对 象根据配对条件配成对子,同一对对 子内不同的个体分别接受不同的处理; ⑶、在病因和危险因素的研究中,将 病人和对照按配对条件配成对子,研 究是否成在某种病因或危险因素
• 2、应用:X2检验就是以X2分布为基础, 以X2值为统计量,推断两个或两个以上 总体率(或构成比)之间有无差别?变 量间有无相关关系?以及检验频数分布 的拟和优度。
(二)四格表的X2检验
• 1、特点:2×2列联表; 抽两个样本,
每个样本分为互斥的两类结果即可形成
这种资料。

2、四格表。
a c
相关文档
最新文档