第六章 卡方检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
这时需要分析灌溉方式与叶态表现是否相关,若两者彼此 相关,表明叶态表现因灌溉方式不同而异,即三种灌溉方 式对叶态表现的影响不相同;若两者相互独立,表明三种 灌溉方式对叶态表现的影响相同。
这种根据频数资料判断两类因子彼此相关或相互独立 的假设检验就是独立性检验。独立性检验实际上是基于频 数资料对因子间相关性的研究。 根据概率乘法法则,若事件A和事件A是独立的,或者 说它们之间无关联,这时事件A和事件B同时出现的概率等 于它们分别出现时概率的乘积。
P AB P APB
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
反过来,若事件A和事件B同时出现的概率等于它们分 别出现时概率的乘积,那么事件A和事件B是独立的, 两者无关联;若事件A和事件B同时出现的概率不等于 它们分别出现时概率的乘积,则这两个事件是有关联 的。
组中值 83 86 89 92 95 98 101 104 107 组分点值 84.5 87.5 90.5 93.5 96.5 99.5 102.5 105.5 组频数 3 6 12 20 23 19 10 5 2 理论频数 2.38 5.64 12.4 19.7222.6818.8811.37 4.95 1.98 偏差量 0.62 0.36 -0.4 0.29 0.32 0.12 -1.37 0.05 0.02
其理论数T1由理论频率乘以总数得出,
T1
161 547
547
481 547
161481
547
141.57
同样可以计算出另外的8种情况的理论频数。
由此推出理论频数的计算公式:
TAB
第六章 卡方检验
A的频数 B的频数 总数
太原师范学院生物系


适合性 独立性 结束放映 返回

7 -8.832
8.83

8-10.5962
10Βιβλιοθήκη Baidu596

第六章 卡方检验
183-179.392
179.39
9-11.1882
11.188

12-13.4262
13.426
152-160.042
160.04
14-9.9822
9.982
16-11.9782
16 ~ 24 ~ 32 ~ 40 ~ 48 ~ 56 ~ 20 6 84 21 28 9 92 16
王 青
36 10
44 13
52 17 116 3
60 26
64 ~ 72 ~ 80 ~ 88 ~ 96 ~ 104 ~ 112 ~ >120 100 108 8 4 0
太原师范学院生物系
适合性 独立性 结束放映 返回
解:H0:x~N(μ σ) HA: x~N(μ σ) 由于总体μ 、σ未知,故由样本去估计(采用点估计):
x 95.60, S 5.274。
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回


生物统计学
解: xi 1 xi Φ 首先算出各组的理论频率:pi Φ
生物统计学
举例(分布类型的适合性检验
• 【课本例13.10】 现有200头母猪所产仔猪1月龄窝重 (kg)的分组资料如下表,试检验该仔猪1月龄窝重是 否服从正态分布。试判断该小麦的株高表现是否遵从正 态分布。 组别 组中值 组频数 组别 组中值 组频数
第六章 卡方检验
<8 0 68 35
8~ 12 4 76 28
x 8.7308
2
生物统计学
【例】 有100棵某品种小麦株高的样本分组资料如下表表,并 且已经算得 样本x 94.8,样本S 5.2。 试判断该小麦的株高表现是否遵从正态分布。 正态分布是连续分布,没有自然的类别,为了利用卡方检 验,可先用第2章介绍的方法将数据进行分组,然后以每组作为 一个类别,再用卡方检验进行正态分布的适合性检验。
【例】考察不同灌溉方式对水稻叶子衰老是否有影响。几 种灌溉方式下的叶态表现调查结果 叶态 频数 绿叶 黄叶 枯叶 总数 灌溉方式 146 7 8 161 深水 141.57 8.83 10.596 183 9 12 204 浅水 179.39 11.188 13.426 152 14 16 182 湿润 160.04 9.98 11.978 481 30 36 547 总数 先将水稻分为3组,第一组用采用深水灌溉,第二组采用浅 水灌溉,第三组采用湿润灌溉,然后统计每种灌溉方式下, 水稻三种叶子(绿叶、黄叶、枯叶)出现的频数。
适合性检验
独立性检验
c 2
( A T 0.5) 2 T
c 2
( A T 0.5) 2 T
1 r 2 T 2 ( x1 rx2 ) ( x11x22 x21x12 ) 2 2 2 2 c c rn T1 T2 T1 T2 1 r 2 ( x1 rx2 ) 2 2 c F2分离比为 1 ∶ 1 n 1 r 2 ( x1 rx2 ) 2 c 2 F 分离比为 3 ∶ 1 2 3n 1 r 2 ( x1 rx2 ) 2 c 2 F 分离比为 1 5 ∶ 1 2 15 n 第六章 卡方检验 太原师范学院生物系 王 青
生物统计学
第六章 卡方检验
• 适合性检验
• 独立性检验
第六章
卡方检验
太原师范学院生物系


适合性 独立性 结束放映 返回
生物统计学
卡方检验:利用卡方分布进行的检验。 多用于离散型数量性状总体的抽样资料的检验
适合性检验:利用样
独立性检验:利用两种随机现象同时
本结果实测频数与理
论频数(按概率分配 的频数)的差别量服 从一定的卡方分布, 来统计推断样本所在
生物统计学
解:H0:x~N(μ σ ) HA: x 不服从正太分布 由于总体μ 、σ 未知,故由样本去估计(采用点估计):
样本 x 65.60,样本 S 22.50
x 65.60, S 22.50
首先算出各组的理论频率:


xi 1 xi pi Φ Φ
2 2列联表
适合性 独立性 结束放映 返回
生物统计学
适合性检验中的特化公式 (自由度=1)
c
2
( A T 0.5) T
2
1 r 2 ( x1 rx2 ) 2 2 c rn
式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。 本例中:k=9。 再算出各组的理论频数:E(fi)=Npi =100×pi 本例中各组的已计算出并列于表6-2中。 继而便可算出x2统计量值:




x
2
0.619 2.381
2

0.363 5.637
2

( 0.4 ) 2 12.4
2
x
2 0.05
(4) 9.488
结果推断:统计量值没有超过临界值,即没有落入否定 域,于是我们不能否定叶态表现与灌溉方式无相关的假 设,即我们应该接受:灌溉方式对水稻叶子的衰老并没 有明显影响。
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
卡方检验中的特化公式 (自由度=1)
发生时的样本结果实测频数与理论频
数(按假设两种随机现象相互独立且 同时发生时的结果概率进行分配的频 数)的差别量服从一定的卡方分布来 统计推断,两种随机现象是否相互独
总体的概论分布是否
与假定的概率分布模 型相吻合。 第六章 卡方检验
立。
独立性检验又称列联表卡方检验。
王 青 适合性 独立性 结束放映 返回
本例中的自由度df=k-1-p=12-1-2=9,查x2 值表可知, x2 < x20.05(9)=16.91 ,P>0.05,差异不显著。 因 P<0.50说明拟合的程度不是太高。只有小于50%的置 信水平,认为仔猪1月龄窝重服从正态分布这一假设。
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
11.978
5.17792
太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
确定自由度,3×3列联表的自由度是(r-1)(c-1)或者写为 (行-1)(列-1) 。 因为每一行的各理论数受该行总数的约 束,所以总的自由度只有(行-1)(列-1) 。本例中:
df (行 1)(列 1) (3 1)(3 1) 4, 取 0.05,查x 分布表可得:
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
独立性检验 通常用于对离散型数量资料的检验 随机抽样 将两种随机现象分列于列联表中
将样本所有观测值统计归类于列联表各相应组合中
在假设两种随机现象相互独立的情况下,确定各组合的概率,并 计算各组合按概率进行分配时的观测值频数
太原师范学院生物系
生物统计学
适合性检验
连续型随机变量,或结果数 量较多的离散型随机变量 随机抽样
结果数量较少的离 散型随机变量 随机抽样 将抽样的观测数据按自然结果 归类 并统计各结果观测值的频数 确定各自然结果的概率 并计算各结果按概率进行分 配时的观测值频数
2
将抽样的观测数据按人为分组 归类 并统计各组观测值的频数
式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。 本例中:k=9 再算出各组的理论频数:E(fi)=Npi =100×pi
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
生物统计学
组频数
0
4
6
9
10
13
17
26
理论频数 1.016 1.704 3.72 6.92 12.06 18.12 23.18 27.70 0.6252 0.3519 1.4467 1.6476 0.1043 1.968 x2 组频数 35 28 21 16 8 4 3 0 理论频数 28.40 24.96 20.48 14.04 8.98 4.88 2.88 1.55 1.5838 0.3703 0.0132 0.2736 0.1069 x2 0.3393
r k
2 一个描述抽样
利用公式
(Oij Eij ) 2 构造一个抽样结果的统计量, Eij
结果中实测频数与理论频数
(概率频数)差别大小的统计量。这样一个统计量恰巧服从卡方分布。
第六章 卡方检验 太原师范学院生物系 王 青 适合性 独立性 结束放映 返回
i 1 j i
生物统计学
生物统计学
如拟合优度检验那样计算x2值。若x2 < x2α ,则观测 数与理论数是一致的,灌溉方式与叶态表现间无关 联的假设可以成立。 若x2 >x2α ,则观测数与理论数 不一致,说明灌溉方式与叶态表现间是有关联的, 不同的灌溉方式影响着水稻叶子的衰老。
x
2
146-141.572
141.57
确定各分组的概率 并计算各组按概率进行分 配时的观测值频数
利用公式 2 (Oi Ei ) 构造一个抽样结果的统计量, 一个描 述抽样结果中 Ei 实测频数与理论频数(概率频数)差别 大小的统计量。这样一个统计量恰巧服从卡方分布。

第六章
卡方检验
太原师范学院生物系


适合性 独立性 结束放映 返回

0.2852 19.72

0.3162 22.68

0.1182 18.88

( 1.37) 2 11.37

0.0482 4.592

0.0192 1.981
2.7467
本例中的自由度df=k-1-p=9-1-2=6,查x2 值表可知, x2 < x20.05=3.455 ,亦即 P>0.75。说明拟合的程度还是很高的。 有75%的置信水平认为杨麦1号的株高遵从正态分布。
本例中,设灌溉方式与与叶态表现无关联,则深
水灌溉与绿叶同时出现的理论频率应为三种灌溉方式
中深水灌溉的频率与三种叶态中绿叶的频率的乘积,
P AB P APB
卡方检验 太原师范学院生物系 王 青
161 547

481 547
第六章
适合性 独立性 结束放映 返回
生物统计学
相关文档
最新文档