5. 卡方检验
《卡方检验正式》课件

卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
卡方检验皮尔逊值范围-概述说明以及解释

卡方检验皮尔逊值范围-概述说明以及解释1.引言1.1 概述在概述部分,我们将简要介绍本篇文章的主题和背景。
本文主要关注卡方检验和皮尔逊值范围的相关概念和应用。
卡方检验是一种统计方法,用于判断观察值与期望值之间的差异是否显著,常用于分析分类变量之间的相关性。
皮尔逊值是常用的统计量之一,用于衡量变量之间的线性相关程度。
在本文的正文部分,我们将详细介绍卡方检验的原理和应用场景,以及如何进行卡方检验的计算和解读结果。
同时,我们还将探讨皮尔逊值的计算方法和解读方式,以及与卡方检验的关联性。
在结论部分,我们将对本文进行总结,并阐述卡方检验和皮尔逊值的研究意义和应用前景。
卡方检验和皮尔逊值作为统计学中重要的工具和指标,对数据分析和决策具有重要的帮助和指导作用。
它们在社会科学、医学研究、市场调查等领域都有广泛的应用,在实际问题中起到了至关重要的作用。
接下来的章节中,我们将对卡方检验和皮尔逊值进行更加详细的介绍和解释,以便读者对这两个统计概念和方法有更深入的理解。
1.2文章结构1.2 文章结构本文将首先对卡方检验和皮尔逊值进行详细介绍,然后对二者之间的关系进行探讨。
具体文章结构如下:第一部分引言部分将对本篇文章的背景和意义进行说明。
首先对卡方检验和皮尔逊值在统计学中的重要性进行介绍,阐明为何研究卡方检验和皮尔逊值的范围是有意义的。
接着,明确本文的目的并概述文章结构。
第二部分正文将详细介绍卡方检验和皮尔逊值的概念、原理和应用。
首先,对卡方检验进行解释,包括其基本原理、统计量计算方法和应用场景。
其次,对皮尔逊值进行阐述,包括其定义、计算方法和在统计学中的应用。
这部分将通过数学公式和实际案例的分析,帮助读者深入理解卡方检验和皮尔逊值的概念和使用方法。
第三部分将重点讨论卡方检验和皮尔逊值之间的关系。
通过对二者的比较和分析,探讨卡方检验和皮尔逊值在统计学中的相互联系和互补性。
此外,还将讨论二者的局限性和应用上的差异,帮助读者更好地理解如何选择合适的方法来进行数据分析和推断。
5 卡方检验分析

二、 主要应用对象:检验试验数据的次数分布是否和某种理论分布 (如二项分布、正态分布等等)相符;在遗传学上常用 检验来测定 所得结果是否符合孟德尔规律、自由组合规律等。 三、 实例: 有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰色) 杂交,其 F2 代获得如表 5.2 所列的体色分离尾数,问这一资料的实际 观察数是否符合孟德尔的青∶红 =3 ∶ 1 一对等位基因的遗传规律? P73。 表 5.1 鲤鱼遗传试验 F2 观测结果 体色 青灰色 红色 总数 F2 观测尾数 1503 99 1602 这是典型的两组数据的适合性检验问题。
2 2)在自由度 df=1 时,须进行连续性矫正,其矫正的 c 为:
2 c 1
k
( O E 0.5) 2 E
当 df≥2 时,一般不作连续性矫正。
第二节 适合性检验
一、 概念:检验实际观测值与理论数是否符合的假设检验,叫适合 性检验。也叫吻合度检验 二、 主要应用对象:检验试验数据的次数分布是否和某种理论分布 (如二项分布、正态分布等等)相符;在遗传学上常用 检验来测定 所得结果是否符合孟德尔规律、自由组合规律等。 三、 实例: 有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰色) 杂交,其 F2 代获得如表 5.2 所列的体色分离尾数,问这一资料的实际
B 18 18.6
C 12 14.4
测验步骤: .提出假设: H0:消费者对不同产品的态度没有改变 HA:消费者对不同产品的态度有所改变. 2.确定显著水平.(=0.05)
3.检验计算:
(30 27) 2 (18 18.6) 2 (12 14.4) 2 0.871 27 18.6 14.4
2
4.统计推断:0.052=5.99,由于20.052,所以接受H0 而否定HA.即消费者对3种不同产品的满意程度没 有改变.
生物统计学 第五章 卡方检验

验,通过假设所观测的各属性之间没有关联, 然后证明这种无关联的假设是否成立。
同质性检验 在连续型资料的假设检验中,对一个样本方差
的同质性检验,也需进行χ2 检验。
第五章 第一节 χ2检验的原理与方法 第二节 适合性检验 第三节 独立性检验
➢ χ2检验就是统计样本的实际观测值与理论推算
离散型资料 总体分布未知
检验对象
总体参数或几个总体参 数之差
不是对总体参数而是对 总体分布的假设检验
χ2 检验的相关知识
三、χ2检验的用途 指对样本的理论数先通过一定的理论分布推算
适合性检验 出来,然后用实际观测值与理论数相比较,从
而得出实际观测值与理论数之间是否吻合。因 此又叫吻合度检验。 是指研究两个或两个以上的计数资料或属性资
(4)推断
确定自由度,df=(r-1)(c-1),查临界值 表,进行推断。
给药方式 口服 注射 总数
给药方式与给药效果的2×2列联表
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
有效率 59.2% 67.4%
1.H0 :给药方式与给药效果相互独立。 HA :给药方式与给药效果有关联。
进行计算:
2 1
n
Oi2 n pi
Oi -第 i 组的实际观测数 pi -第 i 组的理论比率 n-总次数
豌豆
F2代,共556粒
315
101 108
32
此结果是否符合自由组合规律
根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱= 9 :3 :3 :1 16 16 16 16
第五章卡方检验

χ2= ∑
(Oi-Ei)2 Ei
χ2值就等于各组观测 值和理论值差的平方与理 论值之比,再求其和。
(Oi − Ei ) χ =∑ Ei i =1
2 k
2
已经证明当k充分大时,由上式定义 的统计量近似服从����ቤተ መጻሕፍቲ ባይዱ�������2分布
χ2 检验的原理是: 应用理论推算值(E)与实际观测值 (O)之间的偏离程度来决定其χ2值的大 小。在计算理论推算值(E)与实际观测 值(O)之间的符合程度时,一般采用 ∑(E-O)2。对于k组资料采用:
∑ (O − E )
i i
2
值越大,观测值与理论值相差也就
越大,反之越小。
奖学金
200元
一等 10元
5%
70元
三 等 10元 实际得到60元
14%
实际得到190元
等级 观测值(O) 理论(E) O-E 一等 三等 190 60 200 70 -10 -10
(O-E)2 100 100
两组差数虽然相同,但其差数占理论值的比重不同。
χ2< χ20.05
P>0.05
接受H0 ,即豌豆F2分离符合9:3:3:1的自由组合规律。
方法二
315 101 108 32
黄圆:黄皱:绿圆:绿皱=
2 i
9 3 3 1 : : : 16 16 16 16
2 2 2 2 1 O 1 315 101 108 32 + + χ2 = ∑ −n = × + − 556 = 0.470 3 1 3 n pi 556 9 16 16 16 16
χ2 =0.016+0.101+0.135+0.218=0.470
卡方的检验

甲 25(26.57) 6(4.43) 31
乙 29(27.43) 3(4.57) 32
合计 54
9
63
由表可见 n>40且有1<T<5,故
应用校正公式,步骤如下:
由于理论数的计算方法是:
TRC=nR nC / n
分母大家都一样,所以最小理论数 的计算:
Tmin=行和最小*列和最小 / n
四格表卡方要不要校正,只要计算 最小理论数就可以判断了。
故每个实际数所对应的理论数 算法是,该实际数对应的行和乘 列和再除以总的N样本含量。
即 n TRC= R nC / n
卡方检验基本公式
2
A
T T
2
A: 实际数 T: 理论数
卡方检验的基本思想是看理论数 与实际数的吻合程度
上述公式中卡方统计量的大小
取决于实际数和理论数的相差大 小情况,如果无效假设成立的话, 那么实际数和理论数不应该相差 过大,所以卡方统计量应该较小, 而如果卡方统计量越大,则越有 可能推翻无效假设而得出有统计 差异得结论。
故应该用校正公式 1.建立假设:
H0:π1 = π2 H1: π1≠ π2
α=0.05
2.计算χ2
2 ( 22 6 512 45 / 2)2 45 0.61
27 18 34 11
χ2 =0.61 < χ2 0.05(1) = 3.84, P >0.05,差异无统计学意义,
认为两药疗效没有差异。
3.发病率和患病率中会超过100%的
是
()
A 发病率和患X 病1.96S 率都
B 患病率
C 发病率
D.两者都不会
计算题1
比较槟榔煎剂和阿的平驱蛲虫的效 果,对45名蛲虫患者进行治疗,结 果如下,问两药疗效有无差别?
卡方检验
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
例题 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面 神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
样本构成比的比较
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验 例题 测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统 之间是否有关联?
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验
Coxhran Armitage 趋势检验(Cochran Armitage trend test )
卡方检验
■ 有序分组资料的线性趋势 χ2检验
卡方检验
■ 有序分组资料的线性趋势 χ2检验
例 某研究者欲研究年龄与冠状动脉粥样硬化等级间的关系,将278例尸 解资料整理成下表,问年龄与冠状动脉粥样硬化等级间是否存在线性变化 趋势?
5习题-卡方检验
计数资料统计分析————习题1.220.05,n x x ≥ 则( )≥0.05 ≤0.05 <0.05 =0.05 >0.052.2x 检验中,自由度v 的计算为( )A.行×列(R ×C )B.样本含量n D.(R -1)(C -1)2.四格表卡方检验中,2x <20.05(1)x ,可认为A.两样本率不同B.两样本率相同C.两总体率不同D.两总体率相同E.样本率与总体率不同3.分析计数资料时,最常用的显著性检验方法是( )检验法 B.正态检验法 C.秩和检验法 D.2x 检验法 E.方差分析4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( )A.不变B.愈大C.愈小D.与2x 值相等E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文2x >20.01(1)x ,乙论文2x >20.05(1)x 。
若甲乙两论文的样本量相同,则可认为( )A.两论文结果有矛盾B.两论文结果基本一致C.甲论文结果更可信D.甲论文结果不可信E.甲论文说明两总体的差别大6.计算R ×C 表的专用公式是( )A. 22()()()()()ad bc n x a b a c b d c d -=++++ B. B. 22()b c x b c -=+ C . 221R C A x n n n ⎛⎫=- ⎪⎝⎭∑ D. ()220.5b c x b c --=+E. 22()A T x T -=∑7.关于行×列表2x检验,正确的应用必须是()A.不宜有格子中的实际数小于5 B.不宜有格子中的理论数小于5C.不宜有格子中的理论数小于5 或小于1D.不宜有1/5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l E.不宜有1/5 以上的格子中的实际教小于5 或有一个格子中的实际数小于1×C 表的2x检验中,P<0.05 说明()A.被比较的n 个样本率之间的差异有显著性B.样本率间差别没有显著性C.任何两个率之间差别均有显著性D.至少某两个样本率是差别有显著性E.只有两个样本率间差别有显著性9.四个样本率作比较,220.01,(3)χχ>,可认为()A.各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等D.各样本率不等或不全相等E.各总体率相等10.配对四格表资料需用校正公式的条件()<T<5 和n>40 +c<40 <1 或n<40 >1 n>40 +c<4011.配对资料2x值专用公式是()A.22()()()()()ad bc nxa b a c b d c d-=++++B.2 2()b c xb c-=+C.221R CAx nn n⎛⎫=-⎪⎝⎭∑D.()2 20.5b cxb c--=+E.2 2()A T xT-=∑12.在x2 检验中,四格表的校正公式是:A.22()()()()()ad bc nxa b a c b d c d-=++++B.2 2()b c xb c-=+C.221R CAx nn n⎛⎫=-⎪⎝⎭∑D.()220.5b cxb c--=+E.22()A TxT-=∑13.作四格表卡方检验,当N>40,且__________时,应该使用校正公式A T<5B T>5C T<1D T>5E 1<T<514.四格表资料的卡方检验时无需校正,应满足的条件是( )。
5-13-1-卡方检验的前提条件
卡方检验的前提条件
1. 卡方检验的前提条件之一是数据得是分类数据呀!就好比把人分成不同的类别,比如男人和女人,这能理解吧?
2. 样本得相互独立,这很重要哦!就像每个人都是独立的个体,不会相互影响,不是吗?
3. 期望频数不能太小啦!好比你不能指望一个小不点能挑起千斤重担呀!
4. 观测值要足够多呀!就像盖房子需要足够的砖头一样,这样结果才可靠嘛!
5. 数据得是随机抽取的呢!就好像抽奖,得是公平随机的,懂了吧?
6. 每个类别里得有一定数量的观测值哟!不能有的类别寥寥无几,那可不行!
7. 不能有太多异常值呀!这就如同一个团队里不能有太多捣蛋鬼一样!
8. 样本得代表总体呀!不然就像盲人摸象,只能看到局部,看不到全貌啦!
9. 数据得是真实可靠的吧!总不能拿假数据来糊弄呀!
10. 这些前提条件都得满足呀,不然卡方检验可就不准确喽!
我的观点结论:卡方检验的前提条件是确保检验结果准确可靠的关键,一定要重视呀!。
生物统计学第五章 卡方检验
500
512
515
542
522
514
488
497
475
487
497
493 498 502 494 499 490
500
491 494 496 518 484 496
518
506 482 494 503 517 491
508
487 482 494 503 517 491
530
486 512 488 503 506 490
三、独立性检验
原理:通过观测数与理论数之间的一致性判断事件 之间的独立性,即判断两个事件是否是独立事件或 处理间差异是否显著。
方法:将数据列成列联表,也称列联表卡方检验。
一、2×2列联表卡方检验
(一)原理:例5 青霉素可以注射,也可以口服,每天给感冒患者 口服或注射 80 万单位的青霉素,调查两种给药方 式的药效,结果如下表所示,试分析青霉素的两 种给药方式的药用效果是否有差异?
0.302 0.061 0.155 0.121 0.09 1.539
10
总计
0
100
0
590
0.0051
1
题解
1、提出假设 H0:O-E=0;HA: O-E≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ei=NPi
10 ——
167.5~170.5 ——
1 100
0.01 1.00
0.009 1.00
0.9 100
(5)Oi与Ei进行比较,判断两者之间的不符合度,检验程序 如下:①零假设:H0:O-E=0;HA: O-E≠0 ②检验统计量:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
v−v 理 论 数 编码 u= Φ(u) 组界 v−v sv = Ti u Φ(u) = ∆Φ(u) n 变 量 组界 sv (Vt) 15.7 0 0.5 -2.153 0.0157 0.5 -2.153 0.0157 41.1 1 1.5 -1.582 0.0568 1.5 -1.582 0.0568 99.4 2 2.5 -1.011 0.1562 2.5 -1.011 0.1562 173.8 3 3.5 -0.440 0.3300 3.5 -0.440 0.3300 222.1 4 4.5 4.5 0.131 0.131 0.5521 0.5521 206.6 5 5.5 5.5 0.702 0.702 0.7587 0.7587 140.0 6 6.5 6.5 1.274 1.274 0.8987 0.8987 68.8 7 7.5 7.5 1.845 1.845 0.9675 0.9675 24.7 8 8.5 8.5 2.416 2.416 0.9922 0.9922 7.8 9 1000
2
i 1
k
( O i E i 0 .5 ) Ei
2
§2. 适合度检验
1) O = E 2) 选取显著水平为0.05或0.01; 3) 检验计算: 4) 推断:根据df=k-1,
例:
体色
鲤鱼遗传试验F2观测结果
F2观测尾数
青灰色 1503
红色 99
总数 1602
显性
隐性
检验步骤: 1) 零假设:F2代符合3:1规律;备择假设:不符合 2) 选取显著水平为00.01; 3) 检验计算:由于只有二组数据,自由率为1,需要 矫正。
第一步:分组 第二步:引入编 码变量Vt,计算 出其平均值 v 和 标准差 sV 第三步:确定 编码变量的组 界
组限
编码 观测数 变 量 组界 (Oi) (Vt) 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9
3.92~3.96 4 3.97~4.01 36 4.02~4.06 129 4.07~4.11 188 4.12~4.16 211 4.17~4.21 176 4.22~4.26 142 4.27~4.31 80 4.32~4.36 30 4.37~4.41 4 和 1000
2
301 . 63
2 0 .01,1 6 . 63 301 . 63
资料数据符合二项分布的独立性检验
对于符合二项分布的资料数据,其各种组合的方式 ( 可用 ������ + ������)������ 公式来表示,而每种组合的概率也符合 ������ P x = ������������ ������ ������ ������������−������ 公式。
������
实际数 ������ = 观测值 理论数 ������ = ������������ ������������ ������������−������ ������
������������ =
������=������ ������
������������ − ������������ ������������
i 1
k
df=k-1
卡方检验的步骤:
1) 提出无效假设,O = E;备择假设,O ≠ E 2) 选取显著水平为0.05或0.01; 3) 检验计算:求得各个理论次数E,差根据各实际次 数计算出样本的卡方值。 4) 推断:根据df=k-1,从卡方表上查得其对应的卡方 值,通过对两卡方值的比较,对检验结果进行推断。
2
2:1
3:1 15:1 9:7 r:1 r:m
A 2a A 3a
3n
1 .5 3
2
2
2n
A 15 a
15 n
8
2
7 A 9a
63 n
8
2
r 1 A m 2 rn
2
m r mA ra 2 rmn
v=
Oi Vt n
sV =
( Oi Vt )2 (Oi Vt )2 − n (n − 1)
第四步:标准 化求出各组界 的标准化值和 累积概率
编码 观测数 组限 变量 (Oi) 观测数 组限 (Vt) (Oi) 3.92~3.96 4 0 3.92~3.96 4 3.97~4.01 36 1 3.97~4.01 36 4.02~4.06 129 2 4.02~4.06 129 4.07~4.11 188 3 4.07~4.11 188
������
������������ = ������
������=������
������������ − ������������ − ������. ������ ������������
������
检验两组资料与某种比率符合度的卡方公式
理论比率(显性:隐性) 1:1 卡方计算公式
Aa
n 1
50 33 0 .5 250 267 时,0.01水平的卡方值是 0 .5 33 267 6.63,而结果远大于这个值, 2 因此认为吸烟与患病是有关2 5 22 0 .5 195 178 0 .5 联的。 22 178
第五章 卡方检验
本章提要:
同质性检验
卡方检验
适合度检验 独立性检验
都适用于离散型资料的假设检验, 其基本原理是通过卡方值的大小 来检验实际观测值与理论值之间 的偏离程度。前者是比较观测值 理论值是否符合的假设检验,而 后者是判断两个或两个以上因素 之间是否具有关联关系的假设检 验。
计量资料
计数资料
2
(
i 1
k
x
2
)
1
2
(x )
i 1
2
k
2
标准离差
2
1
2
(x x)
i 1
k
又因为:
s
2
x x 2
i 1
k
k 1
2
df s
2
2
( k 1) s
2
2
基本原理
对计数资料进行卡方检验的基本原理 是应用理论值(expected valued, E)与观 察值(observed valued, O)之间的篇离程 度来决定卡方值的大小。当:
偏差越大----越不符合 偏差越小----越符合 完全相等----则表明理论值与观察值完 全符合。
简单方法: 比较两者的差数大小 卡方检验: 差数的平方和
某动物育种试验F2的分离情况
试验一 试验二
观测值O 204 24
2
理论值E 200 28
(O i E i ) Ei
2
O-E 4 -4
各种观测值的概率亦符合
实际数 ������ = 观测值 理论数 ������ = F ui n
u
F ui =
f u du
−∞
组限
例:
正态分布 检验
观测数 (Oi) 4 36 129 188 211 176 142 80 30 4 1000
3.92~3.96 3.97~4.01 4.02~4.06 4.07~4.11 4.12~4.16 4.17~4.21 4.22~4.26 4.27~4.31 4.32~4.36 4.37~4.41 和
2
其中:A为显性实 际观测值,a为隐 性实际观察值, n=A+a.
例:
实际观测数 实际观测数
豌豆杂交实验F2分离结果
黄园 黄园 315 315
黄皱 黄皱 101 101
绿园 绿园 108 108
绿皱 绿皱 32 32
理论频数
理论数 O-E (O-E)2/E
9/16
312.75 2.25 0.016
对χ2 的 贡献 8.7 0.6 8.8 1.2 0.6 4.5 0.0 1.8 1.1 1.9 29.2
对资料组数多于两组的卡方值,还可通过下面的简式进 行计算:
2
1
n
O
2 i
pi
n
其中,Oi为第i组的实际观测数,pi为第i组的理 论比率,总次数记为n。
2
16 O1 3O 2 3O 3 9 O 4
E 1 1602 E 2 1602
2
3 4 1 4
1201 . 5 400 . 5
2
i 1
k
( O i E i 0 .5 ) Ei
( 1503 1201 . 5 0 . 5 ) 1201 . 5
2
( 99 400 . 5 0 . 5 ) 400 . 5
?
在零假设成立条件下,r1组与r2组的构成则没有任何区别, 因此我们可以将他们看成一个总体。则有:
c1的频率为: Fc
1 1
O11 O 21 T C 1 R1 T
r1组中c1的例数为: Fc n
Ei j
Ci R j T
例:
不同人群 吸烟人群 不吸烟人群 总和(Cj)
不同人群患气管炎病调查结果
2 2 2
2
9n
2 2
n
2 2
16 ( 315 3 101 3 108 9 32 ) 9 556
556
0 . 470
§3. 独立性检验
1) 提出假设
2) 选取显著水平为0.05或0.01;
3) 检验计算:
4) 推断
常用的独立性检验形式: 列联表(contingency table)