第八章卡方检验
RC表卡方检验

(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):疗效 击Statistics按钮选择Chi-square。
2020年7月12日
输出结果
结果分析:Pearson 2 =32.736,双侧P=0.000<0.05,
2020年7月12日
R×C表2 检验应注意的问题
❖2.多组比较时,若效应有强弱的等级,如+,++
,+++,最好采用后面的非参数检验方法。 2检
验只能反映其构成比有无差异,不能比较效应的 平均水平。 ❖3.行列两种属性皆有序时,可考虑趋势检验或 等级相关分析。
❖4.多个率比较的2检验,结论为拒绝H0时、需
d f(31 )(41 )6
2 =9.60< 2 0.1,6=10.64,P>0.1,
按α=0.05水准,不拒绝H0,即不能认为三组病 人中医各型的构成比不同.
2020年7月12日
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li8-4.sav。 行变量:“疗法”,Values为:1=“生胃宁素
C k2 k(k21)
20.050.0167
3(31)
2020年7月12日
(3)新复方与降压药比较:列出表C,2=4.419
,P=0.036,按α’= 0.0167水准,不拒绝H0,不 能认为新复方与降压药治疗高血压病的效果不 同。
表C 新复方与降压药比较
药物 新复方 降压药 合计
有效 35 20 55
2020年7月12日
输出结果
卫生统计学:第八章 χ2检验

-
6(c)
54(d)
60
合计
30
90
120
配对四格表资料的χ2检验
配对设计
对子号
甲
乙
1
+
+
2
+
-
…
…
…
120
-
-
成组设计
编号 剂量组 结果
1
甲
+
2
乙
+
…
…
…
120
甲
-
甲、乙两种真菌培养基的培养结果
乙
甲
合计
(+)
(-)
(+) 24(a) 36(b) 60
(-) 6(c) 54(d) 60
合计 30
90
6
4
2
9
2.19*
0.0568*
8
7 1
3 10
3.19
0.0065
8
2
9
0
11
4.19
0.0002
* 为实际数据的四格表
d )!
!:阶乘
例8.4
表8.12 某中药制剂预防HIV垂直传播临床试验
组别
新生儿HIV阴性 新生儿HIV阳性 合计
中药制剂
6(a)
4(b)
10
对照组
2(c)
9(d)
11
合计
8
13
22
N=22<40,采用Fisher确切概率计算法 周边合计最小是8,共计可获得8+1=9种组合的四格表
Fisher’s exact probability
=2, x2 =5.99
第八章 卡方检验

最小期望值(理论值)为4.09,2cells(25%)格子的 理论值小于5。 由此可见,pearson chi-squre的结论是不可信的。
我们继续根据医学合并合理性作合理的合并, 把输血二次、三次及四次的合并,统称为输 血二次以上。
旧编码 0 1 2 3
新编码 0 1 2 2
VAR00001 * VAR00002 Crosstabulation
行变量
列变量
是在输出结果中显示聚类条图 是隐藏表格,如果选择此项,将不输出R×C 交叉表
从左侧的源变量窗口中选择两个名义变量或 顺序变量分别进入Row(s)(行)窗口和 Column(s)(列)窗口。进入Row(s)窗口的 变量的取值将作为行的标志输出,而进入 Column(s)窗口的变量的取值将作为列的标志 输出。
上述选择做完以后,单击Continue 按钮,返 回到Crosstabs 对话框。
单击Format(格式)按钮
打开Format 对话框,如图 所示。在该对话框 中可以选择在输出的交叉表中行的排列是升 序还是降序。系统默认是升序。
选择做完以后,单击Continue 按钮,返回到 Crosstabs 对话框。
行列分割的种类
多组间的两两比较; 多个实验组与同一对照组比较。
(1)多组间的两两比较
对进行行列卡方检验有统计学意义的资料, 进一步作两两比较时,不能再用原来的检验 水准作为是否拒绝H0的标准。因为重复多次 的假设检验,将使第一类错误扩大。必须重 新规定检验水准,作为拒绝H0的根据。
在多组间的两两比较时,其检验水准按下式估计: ɑ‘=ɑ / N,其中
ROW * COLUMN Crosstabulation
ROW 亚 洲 Count
第八章 卡方分析教学版

2=
i 1
fi -ei
ei
2
3.905, 在计算理论次数的过程中共用到平均数,
标准差和总数三个统计量,故本题的自由度为df 9-3=6,
2 查卡方分布表, 0.05 (6) 12.6, 2 2 0.05 , p 0.05, 故差异不显著,即552名中学生的身高分布
2 (三) 2×2 列联表 检验
因素X 因 素 Y
分类1
分类1 a
分类2
b a+b
分类2
c
a+c
d
b+d
c+d
n
nad bc ~ 2 1 a bc d a cb d
2 2
三、独立性检验
2 (三) 2×2 列联表 检验
观察频数a对应的理论频数为:
二、总体分布的拟合检验
(二)统计假设及相关计算
• H0: f0 = fe H1:
f0 ≠ fe
运用基本公式计算出卡方值 查表,比较其与临界卡方值的大小,如果„„ 注意:卡方值分布全部为正值,但f 0 -f e 可能是负值,因此, 卡方检验是双侧检验,0.05和0.01是指双侧概率而言。 拟合度检验需要先计算理论次数,这是计算卡方值的关键性 步骤。(一般根据某种理论或经验)
符合正态分布。
三、独立性检验
(一)适用材料
主要用于两个或两个以上因素多项分类的计 数资料分析。如果要研究的两个自变量之间是否 具有独立性或有无关联或有无“交互作用”的存 在,就要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意 味着对其中一个自变量来说,另一个自变量的多 项分类次数上的变化是在取样误差的范围之内。 假如两个因素是非独立,则称两变量有交互作用。
第八章卡方检验ppt课件

2 (A T )2
T
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
当n ≥40 ,且某格子出现1≤ T<5时,用校正公式:
2 ( A T 0.5)2 T
( ad bc n)2 n
2
2
(a b)(c d )(a c)(b d )
如果样本例数不是很大,计算时应先估计表中最小的T值。
17
设有k个相互独立的标准正态分布随机变量Z1、Z2…..Zν ,则Z12+Z22+…+Zν2的分 布服从自由度为ν的x2分布,记为x2(v)。 ν是指上式中包含的独立变量的个数。
当ν趋于∞时, x2分布逼近正态分布。各种自由度的x2分布右侧尾部面积为α时 的临界值记为x2(α,v)
=1 =2
=3 =4
组对象其它方面“同质”的前提下才能比较两个频率,才能进行2×2列联表 的x2检验。
26
小结
1、2检验的基本思想
2、四格表资料2检验,通常规定: (1) n ≥ 40,且T ≥ 5时,用2 检验基本公式和专用公式 (2) n ≥ 40,但有1≤ T<5时,用四格表2检验校正公式 (3) n< 40,或T<1时,改用fisher确切概率法 (4)连续性校正仅用于ν=1的四格表资料。
表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布
分组 A 型 B 型 O 型 AB 型
合计
儿童 30 38 32 12
112
成人
19 30 19
9
77
合计 49 68 51 21
2 0.005,2
10.60
32.74 2
2
• 认为因三而种P<药0物.0的05治,在疗α效=0果.05不水全准相上同拒。绝H0.00,05接,2受H1,差别有统计学意义。可以
8_八、卡方检验 PPT课件

相关问题-两个率或构成比的比较
分别指定行列 变量到Row(s) 和Columns中。
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
相关问题-两个率或构成比的比较
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
相关问题-两个率或构成比的比较
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
两分类变量间关联程度的度量
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
两分类变量间关联程度的度量
分别指定 行列变量到 Row(s)和 Columns中。
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
卡方检验基础-用途
检验某个连续变量的分布是否与某种理论分布一致,如是否符合正 态分布,Possion分布等
检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量 是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
卡方检验基础
2检验是以2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为:
H0:观察频数与期望频数没有差别
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
Odds Rati o for Newspaper subscri pti on (Yes / No) For cohort Response = Yes For cohort Response = No N of Val id Cases
《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
9第八章 卡方检验

也称卡方检验。 检验也称卡方检验 χ2 检验 也称卡方检验 。 是英国统计 学家Pearson于 1900年提出的一种应 于 学家 年提出的一种应 用范围很广的假设检验方法, 用范围很广的假设检验方法,可用于 检验两个率间的差异; 检验两个率间的差异 ; 检验多个率 (或构成比 间的差异;判断两种属性 或构成比)间的差异 或构成比 间的差异; 或现象间是否存在关联性; 或现象间是否存在关联性;了解实际 分布与某种理论分布是否吻合; 分布与某种理论分布是否吻合;判断 两个数列间是否存在差异等。 两个数列间是否存在差异等。
计算公式
(a + b)!(c + d )!(a + c)!(b + d )! P= a!b!c!d!n!
式中a、b、c、d 和n的意义同前 , !为阶乘符号。0!= 1, 为阶乘符号。 1!= 1 ,3!= 3×2×1 = 6。
(三)求P值的步骤
• 1 . 列四格表 。 使四格表周边合计数 列四格表。 不变, 不变 , 依次增减四格表中任一格子 的数据,列出所有可能的四格表。 的数据,列出所有可能的四格表。 • 列四表格的数量 = 最小合计数 + 1 。 列四表格的数量= 最小合计数+ • 如例 8 -3 , 增减 a 格的数据 ,得 9 个 如例8 格的数据, 四格表。 四格表。
χ2分布的特点
• ⑴ χ2 分布的形状依赖于 ν 的大小 : 当 ν≤2 时 , 曲线呈 L 型 ; 随着 ν 的增加 , 曲线呈L 的增加, 曲线逐渐趋于对称; →∞时 曲线逐渐趋于对称 ; 当 ν→∞ 时 , 分布 趋近于正态分布。 趋近于正态分布。 • ⑵χ2分布具有可加性:如果两个独立的 分布具有可加性: 随机变量X1和X2分别服从ν1和ν2的χ2分 那么它们的和( 也服从( 布,那么它们的和(X1+X2)也服从(ν1+ ν2)的χ2分布。 分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。
2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验。
(二) 熟悉内容频数分布拟合优度的2χ检验。
(三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
二、教学内容精要(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。
2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。
四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。
总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。
(8-3) (四)2χ检验的基本计算 见表8-1。
表8-1 2χ检验的用途、假设的设立及基本计算公式资料形式用途0H 、1H 的设立与计算公式自由度四格表①独立资料两 样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ ③配对设计cb c b +--=22)1(χ1R ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ (R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。
(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。
2.对于R ⨯C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。
对于单向有序R ⨯C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ⨯C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ⨯C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。
三、典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验( )A . 两样本均数的比较B . 两样本率的比较C . 多个样本构成比的比较D . 拟合优度检验答案:A[评析] 本题考点:2χ检验的主要用途。
2χ检验不能用于均数差别的比较。
2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )A .1<T <5,n>40B .T <5C .T 1≤或n 40≤D .T 1≤或n 100≤ 答案: C[评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。
3.2χ值的取值范围为A .∞-<2χ<∞+B .+∞≤≤20χC .12≤χ D .02≤≤∞-χ答案: B[评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B 。
(二)是非题 两样本率的比较可以采用2χ检验,也可以采用双侧u 检验。
答案:正确。
[评析]就两个样本率的比较而言,双侧u 检验与2χ检验是等价的。
(三)简答题1.四格表的2χ检验和u 检验有何联系与区别?答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2⨯2列联表资料有无关联的检验。
2.R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R ⨯C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。
当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。
但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。
(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。
表8-2 122对同胞兄弟静脉曲张发生情况正常体重 肥胖合计 发生 未发生 发 生19 5 24 未发生 12 86 98 合 计31 91122[评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。
H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--,1=ν2χ=2.11<21,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。
2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。
试对这三种措施的疗效作出评价。
表8-3 三种措施的近期有效率比较 矫治方法有效人数 无效人数 合计有效率(%)夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 18533.51[评析]0H :三种措施有效率相等1H :三种措施有效率不相等或不全相等 05.0=α)1(22-=∑cr n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。
3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?颈麻100 41 注药100 94 置栓100 89 对照100 27 [评析] 为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。
表8-5 4种镇痛方法的效果比较镇痛方法 有效例数 无效例数 合计颈麻41 59 100 注药94 6 100 置栓89 11 100 对照27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫ ⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。
四、习 题(一) 单项选择题1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2χ分布C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2χ=u D . 两样本率比较时,有22χ=t 3. 率的标准误的计算公式是: A .)1(p p - B .n p p )1(- C.1-n p D.np p )1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43⨯表进行检验时,11=ν C .对四格表检验时,ν=4D .若2,05.02,05.0ηνχχ>,则ην>5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?A .不能确定B .甲、乙法一样C .甲法优于乙法D .乙法优于甲法 6.已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:A .分性别比较B .两个率比较的2χ检验C .不具可比性,不能比较D .对性别进行标准化后再做比较 7.以下说法正确的是A .两个样本率的比较可用u 检验也可用2χ检验B .两个样本均数的比较可用u 检验也可用2χ检验C .对于多个率或构成比的比较,u 检验可以替代2χ检验D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表5. 双向有序分类资料 6. 率的标准误7. 多个率的两两比较 8. Fisher 精确概率9. McNemar 检验 10. Yates 校正 (三) 是非题四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。