卫生统计学 第十二章 卡方检验
卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。
在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。
卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。
期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。
而实际频数则是实验中观察到的实际结果。
卡方检验的步骤如下:1.建立零假设和备择假设。
零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。
2.确定显著性水平 alpha,通常取值为0.05。
3.构建卡方检验统计量。
计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。
4.根据自由度和显著性水平,查卡方分布表得到 P 值。
5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。
卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。
卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。
举个例子,某药厂要研发一种新的药物来治疗心脏病。
为了验证该药的疗效,实验组和对照组各50 人。
在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。
卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。
除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。
卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。
其中比较明显的一点就是对样本量有一定的要求。
当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。
此外,在面对非常态分布数据时,卡方检验也会出现问题。
当数据呈现正态分布时,卡方检验的准确性最高。
然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。
卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。
统计学-第十二章卡方检验

避免误用与误判的建议
充分理解卡方检验的原理 和适用条件,避免在不满 足条件的情况下使用。
结合专业知识判断观察频数与 期望频数的差异是否具有实际 意义,避免过度解读统计结果 。
ABCD
在进行卡方检验前,对数据 进行充分的描述性统计分析 ,了解数据的分布特点。
统计学-第十二章卡方检验
目 录
• 第十二章概述 • 卡方检验的基本原理 • 卡方检验的应用场景 • 卡方检验的步骤与实现 • 卡方检验的优缺点及注意事项 • 实例分析与操作演示
01
第十二章概述
章节内容与目标
01
掌握卡方检验的基本原理和假设检验流程
02
了解卡方检验在不同类型数据中的应用
能够运用卡方检验进行实际问题的分析和解决
THANK YOU
卡方分布及其性质
卡方分布的定义
若$n$个相互独立的随机变量$X_1, X_2, ldots, X_n$均服从标准正态分布$N(0,1)$,则它们的 平方和$X^2 = sum_{i=1}^{n}X_i^2$服从自 由度为$n$的卡方分布,记为$chi^2(n)$。
期望和方差
$E(X) = n$,$D(X) = 2n$,其中$X sim chi^2(n)$。
运行分析
点击“确定”按钮,运行卡方检验分 析。
结果解读与报告撰写
结果解读
根据卡方检验的结果,判断各组分类数据的 分布是否存在差异,以及差异的显著性水平 。
报告撰写
将分析结果以文字、表格和图表的形式呈现 出来,包括研究目的、数据收集与整理过程 、卡方检验结果和结论等部分。同时,需要
注意报告的规范性和可读性。
卫生统计学卡方检验

卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94
统计学卡方检验

根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
卫生统计学卡方检验

uk
2
xi
分类资料为间断的,不连续分布。故计算的
2值不连续,对于四格表资料来说,当n≥40,且 有1≤T<5时,求出的概率可能偏小,因此需进
xi u u u i 1
2 2 1 2 2 2 k k
2
下右侧尾部面积为α时2 的界值;
0.0 0 1 2 3 4 5 2 6 7 8 9
4 2 值反映了理论频数和实际频数 10 的吻合程度;
Dec 1,2009
二、四格表的专用公式
对于四格表资料,通过推导可将式9-4转换 成四格表的专用公式:
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
合计 660 640 1300
患病率(%) 13.64 21.88 17.69
A: actual value 实际数
(A T) T
2
2
T: theoretical value 理论数
Dec 1,2009
如何求各个格子的理论数T?
• H0: 1=2= • 理论数T为假设的总合计率已知的条件下, 所估计的理论频数,在目前的情况下,将 样本现有的合计患病率作为总合计率的最 佳估计,即17.69%
Dec 1,2009
H0:=0 H1:>0 单侧=0.05 本例n=500,X=95,p=0.19,0=0.097, 得:
0.19 0.097 u 7.026 0.097 (1 0.097 ) / 500
因单u0.05=1.64, u>u0.05, p<0.05,按=0.05水准, 拒绝H0,接受H1
医学统计学-卡方检验

卡方检验是一种常用的统计方法,用于比较观察值和期望值之间的差异。它 在医学研究中有着广泛的应用,可以帮助我们验证假设、推断总体特征以及 分析类别变量的相关性。
卡方检验的定义和原理
卡方检验是一种基于卡方分布的统计检验方法。它基于观察值与期望值之间 的差异来判断样本数据与理论分布的拟合程度。
卡方检验的局限性和注意事项
• 卡方检验只能验证分类变量之间的关联性,不能验证因果关系。 • 卡方检验对样本足够大和数据分类合理的要求比较严格。 • 卡方检验结果受样本选择和观察误差的影响,需要谨慎解释。 • 在进行卡方检验前,需要对数据进行充分的清洗和准备。
结论和要点
卡方检验是一种常用的统计方法
卡方检验的应用领域
医学研究
卡方检验可以用来分析疾病的发生与某个因素之间的关联性,如吸烟与肺癌。
社会科学
卡方检验可以用来研究不同人群之间的行模式和态度偏好,如性别与政治观点。
市场调研
卡方检验可以用来分析消费者的购买偏好和市场细分,如年龄与产品偏好。
卡方检验的假设和前提条件
1 独立性假设
卡方检验基于观察值和期望值之间的差异来验证两个变量之间是否存在独立性。
它可以帮助我们验证假设、推断总体特征以 及分析类别变量的相关性。
结果解读和意义
卡方检验的结果可以帮助我们了解变量之间 的关系,并为决策提供依据。
应用广泛
卡方检验在医学研究、社会科学和市场调研 等领域都有着重要的应用。
局限性和注意事项
卡方检验有一定的局限性,需要注意样本大 小和数据分类的合理性。
4
比较卡方值和临界值
判断卡方值是否大于临界值,从而做出关于拒绝或接受原假设的决策。
卡方检验的结果解读和意义
医学统计方法之卡方检验PPT课件
3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
《卫生统计学》卡方检验
α=0.05
界值表, 水准不拒绝H 查χ2界值表,P>0.05 ,按α=0.05水准不拒绝 0, 水准不拒绝 故尚不能认为甲法测定结果的概率分布与乙法测 定结果的概率分布不同。 定结果的概率分布不同。
完全随机设计两组频数分布χ 完全随机设计两组频数分布χ2检验
例7-3 将病情相似的淋巴系肿瘤患者随机分 成两组,分别做单纯化疗与复合化疗, 成两组,分别做单纯化疗与复合化疗,两组 的缓解率见表7-4, 的缓解率见表 ,问两疗法的总体缓解率是 否不同? 否不同? (1)建立检验假设 ) H0:π1= π2, 两法总体缓解概率相同 H1: π1≠π2 ,两法总体缓解概率不同 检验水准α 检验水准α=0.05
x
2
(18 − 2 −1) =
18 + 2
2
225 = = 11.25 20
ν=(2-1)(2-1)=1
P<0.05,按α=0.05水准拒绝 0,接受 1,差别 水准拒绝H 接受H , 水准拒绝 有统计学意义,可以认为, 有统计学意义,可以认为 两种培养基上白喉杆菌 生长的阳性概率不相等。 生长的阳性概率不相等。鉴于甲培养基阳性频率 为40/56=71.4%,乙培养基为 ,乙培养基为24/56=42.9%,可 , 以认为, 甲培养基阳性概率高于乙培养基。 以认为 甲培养基阳性概率高于乙培养基。
χ2检验基本思想
比较样本的实际频数 1. 比较样本的实际频数(actual frequency) 理论频数( frequency)之间的 与理论频数( theoretical frequency)之间的 吻合程度。
2.频数分布的拟合优度检验(goodness of 2.频数分布的拟合优度检验( 频数分布的拟合优度检验 test)。 fit test)。
[医学]卫统 卡方检验
3、确定P值,并做出结论
查卡方表,
2 0.05
3.84 ,
2
2
0.05
, 故P 0.05
按照 0.05水准,不拒绝 H0,两样本率的差别 无统计学意义,尚不能 认为两组工人的骨质增 生 总体发生率不等。
卡方检验的使用范围
两组及多组率的检验 两组及多组构成比分布的检验 独立性检验 拟合优度检验
45 25 35.5
综合以上思路,列联表期望频数的统一 计算公式为:
Tij
ri c j n
如果H0成立,A与T不应相差太大,x2值不应很大;
如果H0不成立,由H0为真的条件下所计算的理论频数 与样本的实际频数的差别会很大,大多数情况下的 检验统计量x2会较大或很大。 2 ( A T ) 2 理论上可以证明,若H0成立, T 服从x2分布。
表:两组工人的骨质增生发生率比较
组别 发生 井下工人 井上工人 18(14.2)a 9(12.8)c 骨质增生 未发生 22(25.8)b 27(23.2)d 40(a+b) 36(c+d) 45 25 合计 发生率
合计
27(a+c)
49(b+d)
76(n)
35.5
具体步骤
1. 建立假设
H 0 : 两组工人的骨质增生总 体发生率相等,即 1 2 H1 : 两组工人的骨质增生总 体发生率不等,即 1 2
χ2 分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2
( / 21)
e
2 / 2
医学统计学卡方检验
03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(ad bc) n χ= (a + b)(c + d )(a + c)(b + d )
2 2
校正公式为:
χ=
2
( ad bc -n / 2) n
2
(a + b)(c + d )(a + c)(b + d )
组别 甲 乙 合计
阳性 a c a+c
阴性 b d b+d
合计 a+b c+d a+b+c+d= n
�
1)实际数与理论数之间的差别等价于两 样本率的差别 2)检验假设H0:四格表的构成比相同, 等价于H0:两总体率相等 3)对实际数与理论数差值的假设检验, 等价于对两样本率差值的假设检验
6,χ2检验的基本思想(及计算步骤) 1)假设两总体率相等(构成比相同) – HO:π1=π2,即两总体阳性率相等 – H1:π1≠π2,即两总体阳性率不等 – α=0.05 – 不妨把H0看作:π1=π2=两样本合并的 阳性率 2)实际数与理论数的差值服从χ2分布,又 称pearson χ2 :
∑a n
j =1
j +j
n
r j =1
∑各疗效得分×各疗效合计人数 =
总例数
να =
(aj α )2 (n+ j ) ∑
n χs2近似服从自由度为的卡方分布 1
平均得分统计量的样本大小较容易达到: 只要主观确定一个分割点,把列分为1 ~J和J+1~r两部分,变成四格表,把新的 四格中各部分实际数相加,只要四格表 中大部分超过5即可
(O T ) χ =∑ T
2
2
– χ2值是以理论数为基数的相对误差, 它反映了实际数与理论数吻合的程度 (差别的程度).若检验假设成立,则实 际数与理论数的差别不会很大,出现 大的χ2值的概率是很小的,若P≤α,就 怀疑假设,因而拒绝它;若P>α,则尚 无理由拒绝它 – χ2值的大小随着格子数的增加而变大, 即χ2分布与自由度有关.因而考虑χ2值 大小的意义时,要考虑到格子数.当 周边合计数固定的情况下,四个基本 数据当中只有一个可以自由取值,即 自由度为1.
合计 70 135 205
其中b,c为两种培养基生长情况不同的 数字,a,b两培养基相同可不考虑
(b c) 2 2 χ = ,ν = 1 b+c ( b c 1) 2 2 χ = ,ν = 1(校正公式) b+c
当b+c ≥40时可不校正,而b+c<40时,则 一定要用校正公式
注意: 1,配对四格表中的数字为对子数 2,当a格与d格的数字都特别大,而b,c 格的数字都相对较小时,即使配对四格 表卡方检验结果有统计意义,其实际意 义也不大.因此,配对四格表的卡方检 验一般用于检验样本含量不太大的资料
1,有实际数为0的情况下,只需代入公 式计算P值即可 2,没有实际数为0的情况时,要把更加 极端的情况都算入. – 更加极端的情况是指:原来治愈率高 的治愈人数更要加多,治愈率低的治 愈人数更要减少,直至出现0为止,但 保持合计及总合计数字不变.见P157 例12-4 – 最后将几情况的概率相加得P值(单侧) – 可用查表法或计算机直接给出
– Trc=(nrnc)/n:理论数为行合计乘列合计 除总合计 – 理论数有两个特征:1)理论频数表的构 成比相同,即不但各行构成比相同, 而且各列亦相同;2)各个基本格子实际 数与理论数的差别(绝对值)相同 5,样本率的差别演绎为实际数与理论数 的差别: – 两样本率相差愈大,则实际数与理论 数的差别就愈大.若无效假设成立, 实际数与理论数之差就不会很大.
R×C表χ2检验注意事项 – 若表格有一个方向按多个等级分类, 则称为单向有序行列表,当等级数大 于3时,一般用秩和检验分析更为合适.
似然比卡方统计量
Likelihood ratio chi-square 自由度的确定及临界值与Pearson卡方一致
A i χ = 2∑Ai ×ln( ) Ti i=1
2 L
k
理论上当样本量相当大时,Pearson卡方和似然比 卡方都接近卡方分布;样本不够大时都偏离卡方 分布,两者的数值不同但接近,实践中这两个统 计量可同时使用,结合起来下结论.
第三节 四格表精确检验法
卡方检验的基本公式和校正公式有其应 用条件,且仅为近似.当四格表中有理 论数小于1或总观察例数小于40时,需改 用四格表的确切概率法exact probabilities in 2×2 table.
二,两种以上处理方法的比较 见P170~171例12-15 仅供了解
第五节 列变量为顺序变量的列联 表—行平均分差检验
一,2×C表 P163 例12-10 Pearson 卡方只能得出两组构成是否相同 的结论,不能得出哪组疗效较好的结论 人为地给各疗效一个分数,如无效为1, 好转为2,显效为3,痊愈为4,计算其均 数,称行平均分row mean score
ν=(R-1)(C-1) – R行C列时,R行中有一行数据受到列 合计的限制而不能自由变动,C列中亦 有一列数据在行合计的限制下不能自 由取值 3)查χ2分布界值表确定P值并作出推论 – χ2 =39.93,自由度为1,查附表6-7 – χ2 0.05(1)=3.84; χ2 0.01(1) =6.63; χ2 0.001(1) =10.83 – 一般类型的治愈率高于特殊类型(结合 样本率作实际推论)
Hale Waihona Puke χ2检验条件:(四格表) – 1,当n≥40且所有T≥5时,用普通的χ2 检验;若所得P≈ α ,改用确切概率法. – 2,当n≥40但有1≤T<5时,用校正χ2检 验 – 3,当n<40或有T<1时,不能用χ2检验, 改用确切概率法.
(O-T -0.5) χ= T
2
2
8,四格表专用公式 为方便起见,当基本格子的实际数命名 为a,b,c,d;行合计写为a+b,c+d,列合计 写为a+c,b+d,n为总观察数
基本思想:在四格表周边合计不变的情 况下,获得某个四格表的概率为
(a + b)!(c + d )!(a + c)!(b + d )! P= a!b!c!d !n!
a!表示factorial a 或a factorial 0!=1; 3!=3×2×1=6 该方法计算出的概率为分布中单侧的概 率,故双侧时应以0.025为显著性水平. 结合实际确定采用单侧还是双侧
第二节 行×列表的χ2检验
当行或列超过2组时通称为行×列表,或 R×C表,亦称列联表contingency table. 可用于 1,多个率的比较 可用以下简化公式(无相应校正公式)
O χ = n(∑ 1) nr nc
2
2
适用条件:不能有理论数小于1,并且1≤T≤5
的格子数不超过总格子数1/5.
aj为各疗效得分,n1j为第一行各疗效的频数,n1+ 为第一行合计 同理计算第二行平均分 再进行行平均得分差检验—χs2
f1 = ∑
j =1
4
aj n1 j n1+
( f1 α )2 2 χs = {(n n1+ ) /[n1+ (n 1)]}να
α为平均期望得分,να为方差
r
α =
两种类型胃溃疡病内科疗法治疗结果
组别 治愈 未愈 合计 80 99 179
一般类型 63(42.01) 17(37.99) 特殊类型 31(51.99) 68(47.01) 合计 94 85
– 为检验是否为第二种情况,无效假设 为两种治愈率本无不同,差别仅由抽 样误差所致. 3,理论治愈率: – 根据两组治愈率相同的假设,合计治 疗179人,总治愈94人,得理论治愈率 为 94/179=52.51% 4,理论数: – 一般溃疡患者80,按理论治愈率应治 愈80×52.51%=42.01,称theoretical value, theoretical frequency. 记为T.同理可得 其余理论数.亦可由减法求得
如果把数据排成等级rank,而不用整数评分法则 卡方检验与Spearman等级相关结果极为接近. 可任选其一
χ = r (N 1)
2 cs 2 s
第七节 多层列联表的分析
一,多层2×C表 采用扩展的Mantel-Haenszel 平均得分统 计量—χ2SMH 各层间效应的方向一致时,检验效果较 好.
条件不足时的三种处理方法: – 1)增大样本例数使理论数变大 – 2)删除理论数太小的行或列 – 3)将理论数太小的行或列与性质相近的 邻行或邻列合并,使重新计算的理论 数增大.但是此处理可能损失信息, 也会损害样本的随机性,不同的合并 方式所得的结果也不一样,因而在不 得已时慎用
2,多个构成比比较 3,双向有序分类资料的关联性检验 – 表格是按两个变量从小到大顺序分类 整理出来的,目的是研究两变量间有 无关联性.从左上角往右下角看,频 数有无集中在此对角线上的趋势,即 两变量有关联.若频数在这些格子均 匀分布,或各行分布(构成比)相同,且 各列分布(构成比)相同,则表示两个变 量无关联性了.
双侧检验时: 1)单侧概率加倍 2)加上对侧<当前四格表的概率的所有概 率. 这两种方法的结果有时可能会有所不同, 教科书建议以第二种方法为准
第四节 配对计数资料的χ2检验
一,两种处理方法的比较,P169
乙培养基 生长 不生长 合计
甲培养基 生长 不生长 36(a) 34(b) 0(c) 36 135(d) 169
– P<0.001, 按α=0.05水准,拒绝H0接受 H1,因而认为两总体的阳性率有差别 (统计学推论).结果说明,两组胃溃疡 病人治愈率的差别有高度统计意义, 7, χ2值的校正,四格表χ2检验的条件 实际上χ2值是根据正态分布中χ2 =∑[(xi) /σ]2的定义计算出来的,用前述公式算 得的值只能说近似于χ2分布,在自由度 大于1,理论数皆大于5时,这种近似较 好;自由度为1,当有理论数小于5时, 需进行(连续性)校正