9 第十二章 卡方检验(一)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四格表精确检验法P值的计算
双侧检验的P 双侧检验的P值:分别计算出两侧所 样本| 值的四格表的P 有|A-T |值≧样本|A-T |值的四格表的P值, 然后相加,合计即为所求的P 然后相加,合计即为所求的P值。因为四 格表中四个格子的| 格表中四个格子的|A-T |相等,故求出任 相等, 即可。若两样本的例数相等, 一|A-T |即可。若两样本的例数相等,可 计算出任一侧的累计P 然后乘以2 计算出任一侧的累计P值,然后乘以2, 即为所求的P 即为所求的P值; 单侧检验的P 按照研究的目的, 单侧检验的P值:按照研究的目的, 确定计算出某一侧所有| 确定计算出某一侧所有|A-T |值≧样本 |A-T |值的四格表的P值,然后相加,合 值的四格表的P 然后相加, 计即为所求的P 计即为所求的P值。
χ2检验的资料类型 检验的资料类型
1、四格表资料的χ 四格表资料的
2检验
2、配对计数资料的χ2检验 配对计数资料的 3、行×列表资料的χ2检验 列表资料的
第一节 2检验 四格表资料的 四格表资料的χ
1、四格表资料的χ2检验
⑴、基本公式法:n≥40 , 基本公式法: T≥5 校正公式法: ⑵、校正公式法:n≥40 , 1≤T<5 直接概率法( ⑶、直接概率法(精确检验 法):n<40 或 T<1
配对四格表资料的χ2检验公式推导
b+c (+,−)和(−,+)两个格子中的理论频数均为 2 ,
〉 0 基本公式: 当 b+c 4 时,基本公式:
b+c 2 b+c 2 ) (c− ) 2 (b− 2 (A−T) 2 2 + 2 (b−c) b− χ =Σ = 2 = b+c b+c T b+c ~ χ 分布 2 2
四格表精确检验法
又称四格表确切概率法,常用于四格表资 又称四格表确切概率法, 料的假设检验。适用条件: <40或有理论数 料的假设检验。适用条件:n <40或有理论数 T<1,或求得的P 值接近检验水准时采用,作 <1,或求得的P 值接近检验水准时采用, 检验的补充。检验的基本思 为四格表资料χ2检验的补充。检验的基本思 四格表资料周边合计不变的情况下, 想是:四格表资料周边合计不变的情况下,直 接计算表内四个实际频数的所有各种组合的概 其概率的合计为1 率,其概率的合计为1。表内四个实际频数的 组合数共有“周边合计中的最小值+ 组合数共有“周边合计中的最小值+1”个。 本法需要计算等于及大于样本 计算等于及大于样本| 本法需要计算等于及大于样本|A-T|各四格表的 累计概率。双侧检验取两侧累计概率, 累计概率。双侧检验取两侧累计概率,单侧检 验取一侧累计概率。 验取一侧累计概率。
四格表资料基本公式 四格表资料基本公式和专用公式 基本公式和
适用条件: 适用条件:n≥40 ,任一格理论数T≥5
基公 本式
(A−T)2 : χ2 =∑ T
2 2 2
(a+b)(a+c) (a+b)(b+d) (c+d)(b+d) a− a+b+c+d b− a+b+c+d d− a+b+c+d + +⋯ = + (a+b)(a+c) (a+b)(b+d) (c+d)(b+d) a+b+c+d a+b+c+d a+b+c+d 2 (ad−bc) ⋅n ν =1 = (a+b)(c+d)(a+c)(b+d)
A −1) χ =n(∑ nn
R C
R×C表的χ2检验通用公式推导
合 × 合 行 计 列 计 nn R C 理 频 T= 论 数 = n 总 数 例
代入基本公式 可推导出: 可推导出: 基本公式
2 2
通用公式
2
( A−T) A 2 ( ⇔ =n Σ −1) χ =Σ χ T nn R C
自由度= 行数− (列数− (列数 自由度=(行数−1) 列数−1)
R×C表χ2检验的应用注意事项
若较多格子( 的理论频数小于5 1. 对R×C表,若较多格子(1/5)的理论频数小于5 或有的个格子的理论频数小于1 则易犯第一类错误。 或有的个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办? 出现某些格子中理论频数过小时怎么办?① 增大样本 含量(最好! 删去该格所在的行或列( 含量(最好!)② 删去该格所在的行或列(丢失信息 !)③ 根据专业知识将该格所在行或列与别的行或列 合并。 丢失信息!甚至出假象) 合并。(丢失信息!甚至出假象) 多组比较时, 若效应有强弱的等级, ++, +++, 2 . 多组比较时 , 若效应有强弱的等级 , 如 + , ++ , +++ , 最好采用后面的非参数检验方法。 最好采用后面的非参数检验方法。χ2 检验只能反映其 构成比有无差异,不能比较效应的平均水平。 构成比有无差异,不能比较效应的平均水平。 3.行列两种属性皆有序时, 3.行列两种属性皆有序时,可考虑趋势检验或等级相关分 行列两种属性皆有序时 析。
χ2检验的方法选择及使用条件
一、四格表资料的χ2 检验 1、基本公式法:n≥40 ,T≥5 基本公式法: 2、校正公式法:n≥40 ,1≤T<5 校正公式法: 3、直接概率法:(精确检验法):n<40 直接概率法: 精确检验法) 或T<1 二、配对计数资料的χ2检验 1、基本公式法:b+c>40 基本公式法:b+c>40 2、校正公式法:b+c≤40 校正公式法:b+c≤40 三、行×列表资料的χ2检验 T<5的个数不能多于理论数总个数的1/5, 的个数不能多于理论数总个数的1 而且T 而且T>1。
(
(∑T) −
2
)
k
2
第四节
2检验 行×列表资料的χ
2检验 3、行×列表资料的χ
用途:比较多个样本率(或构成比) 用途:比较多个样本率(或构成比) 之间差别是否有统计学意义。 之间差别是否有统计学意义。 适用条件:T<5的格子数不能多于总 适用条件:T<5的格子数不能多于总 格子数的1 而且T>1。 格子数的1/5,而且T>1。 2 基本公式: 基本公式: 2 ( A T) − χ =∑ T 2 专用公式: 专用公式: 2
第三节
2检验 配对计数资料的χ
2、配对计数资料的χ2检验
⑴、两种处理方法的比较 ①.基本公式法:b+c>40 基本公式法:b+c>
2 2= (b−c) ,ν =1 χ b+c
②.校正公式法:b+c≤40 校正公式法:b+c≤
2 2= ( b−c −1) ,ν =1 χ b+c
⑵、两种以上处理方法的比较
χ2值、P值与统计结论
α
X2 值
P值
统计结论 不拒绝H 不拒绝H0, 差别无 差别无显著性
0.05 < χ20.05(ν) >0.05
Hale Waihona Puke Baidu
0.05 ≥χ20.05(ν) ≤0.05 拒绝H0,接受H1 拒绝H 接受H 差别有 差别有显著性 0.05 ≥χ20.01(ν) ≤0.01 拒绝H0,接受H1 拒绝H 接受H 有高度显著性 差别有高度 差别有高度显著性
确切概率法计算公式
在四格表的周边合计不变的条件 下 , 用下式直接计算表内四个数据 的各种组合之概率。 的各种组合之概率。 式中a、b、c、d为四格表的实际 频数
(a+b)!(c+d)!(a+c)!(b+d)! P= a!b c!d!n ! !
四格表资料的精确检验法基本步骤
1、建立假设 Ho:假设差别是由抽样误差引起的 H1:假设差别是本质上存在的 确定显著性水准: 2、确定显著性水准:α=0.05 3、计算确切概率P 周边合计不变,列出各种组合的四格表; (1)周边合计不变,列出各种组合的四格表; 计算各个四格表的| (2)计算各个四格表的|A-T|值; 样本| (3)求|A-T|值≥样本|A-T|值的所有四格表的Pi 值; Pi=(a+b)!(c+d)!(a+c)!(b+d)!/[a!b!c!d!n!] (4)求出确切概率P:P=ΣPi 结果判断: 4、结果判断:在事先确定的显著性水准α下作 出专业结论。 出专业结论。
行×列表资料χ2检验时的注意事项
1、行×列表资料χ2检验对资料的要求是:不宜有1/5以上 检验对资料的要求是:不宜有1 格子的理论数小于5 且理论数应大于1 格子的理论数小于 5 , 且理论数应大于 1 , 若发生上述情 可选用下述三种处理方法 三种处理方法: 况 , 可选用下述 三种处理方法 : ① 适当增大样本含量以 增大理论频数; 增大理论频数 ; ② 将理论数过小的格子所在的行或列与 性质相近的行或列中的实际数合并, 性质相近的行或列中的实际数合并 , 使重新计算的理论 数增大; 删去理论数过小的行或列。 数增大 ; ③ 删去理论数过小的行或列 。 后两种处理方法 有可能损失资料信息, 且可能破坏样本随机性, 有可能损失资料信息 , 且可能破坏样本随机性 , 故不宜 常规使用。 常规使用。 2、当试验效应按照强弱分为若干个级别,试验结果可整理 当试验效应按照强弱分为若干个级别, 为单向有序行×列表资料, 为单向有序行 × 列表资料 , 在比较各处理组间的效应有 无差别时,宜选用秩和检验、Ridit分析 趋势检验等, 分析、 无差别时,宜选用秩和检验、Ridit分析、趋势检验等, 检验只能说明各组构成比的差别有无显著性。 如作χ2检验只能说明各组构成比的差别有无显著性。 3、多个样本率或多个构成比的χ2检验,结果有显著性意义 检验, 只能认为总体率或总体构成之间总的来说有差别, 时,只能认为总体率或总体构成之间总的来说有差别, 不能说明两两之间皆有差别, 不能说明两两之间皆有差别,若要对每两个率或每两个 构成比进行比较,应采用行× 构成比进行比较,应采用行×列表的χ2分割法或者采用 其它率或构成比的多重比较。 其它率或构成比的多重比较。
χ 2检验
(chi-square test) chitest)
又称卡方检验 又称卡方检验,是用途较广 卡方检验, 的计数资料的假设检验。 的计数资料的假设检验。其基本 思想是: 思想是:判断实际数与假设的理 论数的符合程度。资料要求: 论数的符合程度。资料要求:可 用于检验两个或多个样本率之间、 用于检验两个或多个样本率之间、 两个或多个构成比之间的差异显 著性, 著性,用于检验配对计数资料的 差异显著性, 差异显著性,以及检验两类事物 间是否存在一定联系。 间是否存在一定联系。
0 同理可得当 校正公式: 同理可得当 b+c≤4 时,校正公式:
(| A−T | − .5 0 ) (| b−c| − ) 1 χ =Σ = T b+c
2 2 2
两种以上处理方法比较的计算方法
∑T T −
(
)
2
=∑ T
2
χ = k(
2 j
( ) k k−1 ∑T T −
∑fu) −(∑f u)
2
2值计算公式和理论值计算 χ
(A−T) 1 2 χ =∑ =(A−T) ∑ T T )( ) ν =(R−1 C−1
2 2
( w 计 ( lu n 计 n n 行ro )合 ×列co m )合 R C T= = n 总 数 例
2 χ
检验的基本原理
χ2值反映了实际频数和理论频数吻合 的程度。 相差越大, 的程度。A与T相差越大,则(A-T )2的值 越大,反之则越小。 成立, 越大,反之则越小。若H0成立,则四个格 子的实际频数A与理论频数T相差不应该很 统计量不应该很大。 大,即χ2统计量不应该很大。若A与T 完 全相同, 值必为零。 全相同,则χ2值必为零。除了这种情况 值永远为正, 值越大, 外,χ2值永远为正,且χ2值越大,相对 值越小, 应的P 值越小,若P≤α,则A与T 相差太 正确是个小概率事件, 大,即推断H0正确是个小概率事件,继而 拒绝H0,接受其对立假设H1,即π1≠π2。
四格表资料连续性校正公式
适用条件:n≥40 ,1≤T<5 适用条件: 校正公式: 校正公式: 2
(A T−05 − .) χ =∑ T
2
专用公式: 专用公式:
2
χ =(a+b)(c+d)(a+c)(b+d)
n n (a − c− ) d b 2
2
第二节
四格表资料的精确 四格表资料的精确检验法 资料的精确检验法
相关文档
最新文档