第5章-卡平方测验

合集下载

卡平方测验

卡平方测验

第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。

能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。

在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。

间断性变数的计数资料也可整理为次数资料。

凡是试验结果用次数表示的资料,皆称为次数资料。

次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。

本章主要介绍卡平方测验。

第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。

菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。

按1:1的性比计算,雌、雄株均应为100株。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。

表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1) 100(E1) -8 0.64雄108(O2) 100(E2) 8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。

这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。

为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

第5章 卡方测验

第5章  卡方测验
浅 水 湿 润
146
183 152
7
9 14
7
13 16
表现型 观察次数(O) 理论次数(E) 稃尖有色 稃尖有色 稃尖无色 稃尖无色 非糯 糯稻 非糯 糯稻 491 417.94 76 139.31 90 139.31 86 46.44
5.2 独立性测验
独立性测验
调查经过种子灭菌处理与未经种子灭菌处理
的小麦发生散黑穗病的穗数,得相依表,试分析
种子灭菌与否和散黑穗病穗多少是否有关。(数
据源:盖P139)
防治小麦散黑穗病的观察结果
处理项目
种子灭菌 种子未灭菌
发病穗数
26 184
未发病穗数
50 200
独立性测验
下表为不同灌溉方式下水稻叶片衰老情况的
调查资料。试测验稻叶衰老情况是否与灌溉方式
有关。(数据源:盖P141)
水稻在不同灌溉方式下叶片的衰老情深 水
第5章 卡方测验
5.1 适合性测验
5.2 独立性测验
属性资料的适合性测验
大豆花色一对等位基因的遗传研究,在289
株F2分离株中有208株开紫色花、81株开白色花。
问这一资料的实际观察比例是否符合于3∶1的 理论比值。
花 色 紫 色 白 色 总 数
表 7.3 大豆花色一对等位基因遗传的适合性测验 F2 代实际株数 理论株数 | O-E (|O-E|-1/2)2 O-E (O) (E) |8.25 -1/2 /E 208 216.75 -8.75 0.3140 81 72.25 +8.75 8.25 0.9420 289 289 0 1.2560
属性资料的适合性测验
两对等位基因遗传试验,如基因为独立分配, 则F2代的四种表现型在理论上应有9∶3∶3∶1的 比率。有一水稻遗传试验,以稃尖有色非糯品种 与稃尖无色糯性品种杂交,其F2代结果如下。试 检查实际结果是否符合9∶3∶3∶1的理论比率。

第五章卡平方检验

第五章卡平方检验

防止小麦散黑穗病的观察结果 未发病穗数 50(41.30) 行总和 76 384 460
发病穗数 26(34.70)
184(175.30) 200(208.70) 210 250
表中括号内为依据无效假设成立而计算出的理论次数。
湖南大学研究生院隆平分院
• 提出假设。H0: 种子灭菌与小麦穗部发病无关。

2 c i 1
k
A
i
Ti 0.5 Ti
2
(5-2)
湖南大学研究生院隆平分院
二、适合性检验
1. 适合性检验的意义
•Байду номын сангаас判断实际观察的属性类别是否符合已知的属性类别的分配
理论或学说的假设检验称为适合性检验。
• 在遗传学中,常用2测验法来决定所得实验结果是否与孟
德尔遗传规律或其他定律相符合。适合性检验的无效假设 一般是实际数据资料与理论假设相符合。
性、无连锁。
湖南大学研究生院隆平分院
三、独立性检测验 1. 独立性检验的意义 对于次数资料,还可分析两类因子是相互独立还是彼此 相关。例如研究玉米种子灭菌与否和果穗是否发病有无 关系,若相互独立,表示种子灭菌和果穗发病无关,处 理无效果;反之则处理有效果。 根据次数资料判断两类因子相互独立或彼此相关的假设 检验称为独立性检验。
湖南大学研究生院隆平分院
(4)统计推断
2 当自由度df=3时, 0.01(3) 11.34 ,因实际计算的2=92.71
>11.34,故p<0.01,否定H0,接受HA,表明该水稻稃尖
和糯性性状在F2的实际观察次数之比极显著不符合9:3:3:1
的理论比例。这一结果表明,该两对等位基因并非完全显
2 ( A T ) 2 T (37 49.00) 2 (49 39.04) 2 (57 59.04) 2 49.00 39.04 59.04 7.69

2020年智慧树知道网课《田间试验与统计分析》课后章节测试满分答案

2020年智慧树知道网课《田间试验与统计分析》课后章节测试满分答案

第一章测试1【多选题】(10分)试验设计的基本原则()。

A.局部控制B.唯一差异C.重复D.随机排列2【多选题】(10分)顺序排列试验设计中小区的排列方式有()。

A.对比法设计B.逆向式C.正向式D.阶梯式3【多选题】(10分)随机排列试验设计包括()。

A.拉丁方设计B.随机区组设计C.裂区试验设计D.完全随机设计4【多选题】(10分)完全随机设计应用()两个基本原则。

A.局部控制B.唯一差异C.随机排列D.重复5【判断题】(10分)随机排列方式可以避免系统误差。

A.对B.错6【判断题】(10分)在完全随机设计中,每一处理的重复数必须相等。

A.对B.错7【判断题】(10分)随机区组设计应用重复、随机排列和唯一差异三个试验设计的基本原则。

A.错B.对8【判断题】(10分)第一横行和第一纵行均为顺序排列的拉丁方称为标准方。

A.对B.错9【判断题】(10分)在拉丁方设计中,每一处理在每一横行和每一纵行可出现多次。

A.对B.错10【判断题】(10分)裂区设计是多因素试验的一种设计方法。

A.对B.错第二章测试1【单选题】(10分)总体的样本容量为()A.MB.NC.HD.I2【单选题】(10分)下列样本容量中()是大样本。

A.30B.15C.5D.103【多选题】(10分)质量性状资料的统计方法有()A.给分法B.统计次数法C.统计法D.集团法4【判断题】(10分)参数是用来描述样本的特征数()A.错B.对5【判断题】(10分)制作连续性变数资料次数分布表时,数据必须从大到小排序。

()A.对B.错6【判断题】(10分)变异数是反映一组数据变异程度的特征数。

()A.错B.对7【单选题】(10分)下列哪项为均方的正确表示方法()。

A.B.C.D.8【多选题】(10分)常用的次数分布图有()。

A.方柱形图B.条形图C.多边形图D.饼图9【多选题】(10分)平均数的种类包括以下哪几种()。

A.几何平均数B.算数平均数C.中数D.众数10【单选题】(10分)总体平均数用()表示。

五、卡平方测验

五、卡平方测验

F2代红花与白花的理论比例为3:1
于是将各差数平方除以相应的理 论次数再相加,记为 论次数再相加,记为χ2,即:
(O − E ) 2 χ2 = ∑ E
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量, 越小, 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 际观察次数与理论次数越接近 ; , 表示二者完全吻合; 越大, 表示二者完全吻合;χ2越大,表示二者相 差越大。 差越大。
各种自由度下右尾概率取α的临界
χα,df值列于附表4,供测验时查用。 值列于附表4 供测验时查用。
例如, 例如, df=10, α=0.05, , ,
χ20.05,10=18.31,表示 0.05, =18.31,
P( χ2 > 18.31)=0.05 图5.2)。 )=0.05(图 。 )=0.05
2×2表的独立性测验 × 表的独立性测验
H0:种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关 HA:种子灭菌与散黑穗病发病有关 种子灭菌与散黑穗病发病有关 显著水平 α=0.05 。
E11=460×(76/460)×(210/460)=34.7 × × 同理,O12=184相应的理论次数为 同理, 相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 × × O21=50相应的理论次数为 相应的理论次数为 E21=460×(76/460)×(250/460)=41.3 × × O22=200相应的理论次数为 相应的理论次数为 E22=460×(384/460)×(250/460)=208.7 × ×
( x i − x ) 2 = ( n − 1) S 2

田间试验与统计分析 第五章 卡平方测验

田间试验与统计分析 第五章 卡平方测验

例 3 : 某 一 杂 交 组 合 , 在 F2 得 到 四 种 表 型 , B_C_,B_cc,bbC_,bbcc, 其 实 际 观 察 次 数 分 别 为 132,42,38,14。试测验是否适合9:3:3:1的理论比率。 根据计算结果,是独立遗传还是连锁遗传? p144 7.6
第三节 独立性测验
第四节 方差的同质性测验
(一)单个样本方差的假设测验
(二)两个样本方差的同质性测验
(三)多个样本方差的同质性测验
方差的同质性测验 方差同质性是指各个总体的方差相等
1. 单个样本方差的假设测验是测验一个样本方差和某 一指定值C是否有显著差异。
2. 两个样本方差的同质性测验是测验两个抽自正态总 体的独立样本的方差所属的总体是否有显著差异。 3.测定 3 个或3个以上样本方差是否来自相同方差的总 体称为方差的同质性测验,又叫Bartlett测验。
品种 健株数 病株数 总计 A 442 78 520 B 460 39 499 C 478 35 513 D 376 298 674 E 494 50 544 总计 2250 500 2750
(一)单个样本方差的假设测验
1.两尾测验 2 H0: =C 若计算的
HA: 2 ≠C
此时,在α水平上否定H0。
2.一尾测验 测验s2是否显著大于指定值C,无效假设为: H0: 2≤C HA: 2 >C
2 2 > ,df 如果算得的 则否定H0,这是应用2 分布的右边一尾。
3.1 ,各自有自由度 4 、 5 、 11 ,试测验其是 否同质。
方差同质性测验

多个样本方差同质性测验,经常应用在多点或多年 试验的综合性分析中,对不同试验点误差方差的同

卡平方测验

卡平方测验

卡平方测验
实验目的
1.以提供的数据练习计算x2值,并测定其是否近似理论假设的期望比值。

2.依据相应自由度,检验计算所得x2值。

3.熟练掌握x2值的计算和利用x2值评估实验结果
实验原理
卡平方(x2)测验的目的是以吻合度断定所获得的资料与理论上期望的比值是否满足或近似,也就是x2测验可以测定所得数据是否偏离吻合概率。

显然,如果偏差小是因为偶然机会,偏差大则不是出于偶然机会。

卡平方x2测验试图为我们解决这个问题:“骗差小到何种程度才可以认为只是出于偶然机会。

”卡平方x2值的公式如下:
x2 =∑(O-E)2/E
这里的o是特定表现型个体的观察数目;E是这一表现型在理论上期望的数目;∑是各种表现型(O-E)2/E的累加值。

例如,高茎番茄和矮茎番茄杂交,F1全为高茎,F2有102株高茎和44株矮茎。

这些资料是否符合3:1的概率?回答这个问题必须计算x2值,把计算过程综合整理于表2-1。

2
计算所得的x值为2.0548,x值意味着什么呢?如果实际观察值(O)精确等于理论期望值(E),x2值为 0,是一个完满的好适度。

于是x2值小,表明观察结果接近期望比率;x2值大,表明观察结果与期望比率存在明显差异。

一般统计学家把P=1/20或P=0.05定为显著水平。

当两组变数自由度为1时,卡平方x2值为3.841的概率是0,05,观察值与期望值相抵触。

在刚才的实例中x2=2.0548,它小于允许最大值x2 =3.841,P>0.05。

因而可以认为偏差只是偶然机会,实验数据符合3:1的概率的假设。

卡平方检验

卡平方检验

观测值 Oi 4 36 129 188 211 176 142 80 30 4 1000
编码 Vi 0 1 2 3 4 5 6 7 8 9
V i2 0 1 4 9 16 564 844 880 852 560 240 36 4270
Oi*Vi2 0 36 516 1692 3376 4400 5112 3920 1920 324 21296
当样本的方差等于理论平均数时: 即 当样本的方差等于理论平均数时 (即: δ2 = µ) (X- 2 X-µ)2 X- U 则: X2= ∑ 由此可知: 由此可知: 1.X2分布是当样本的方差等于理论平均数时的一种特 殊形式的正态离差平方的分布. 殊形式的正态离差平方的分布. 其分布是连续的, 2.其分布是连续的,其值域的大小随着自由度的 增加 而增加。 而增加。 项数越多, 值越大)。 (即:项数越多,X2值越大)。 2、适合性检验: 、适合性检验: 已知:男女性别比例为: : 。调查某地100名新生 例:已知:男女性别比例为:1:1。调查某地 名新生 儿,得:男:58,女:42。 , 。 该地区新生儿是否符合1: 比例 比例? 问:该地区新生儿是否符合 :1比例? 假设: 符合1: 比例 比例)。 解:假设:H0:O-T=0(符合 :1比例)。 符合 HA:O-T≠0(不符合 :1比例)。 不符合1: 比例 比例)。 不符合
= = = = = =
2(|a-T|-1/2)2 + 2(|b-T|-1/2)2 n 分子分母同乘以2) (分子分母同乘以 ) 2[|a-(1/2a+1/2b)|-1/2]2+2[|b-(1/2a+1/2b)|-1/2]2 n 2[|a-1/2a-1/2b|-1/2]2 + 2[|b-1/2a-1/2b|-1/2]2 n 2[|1/2a-1/2b|-1/2]2 + 2[|1/2b-1/2a|-1/2]2 n 2×1/4[|a-b|-1]2 +2×1/4[|b-a|-1]2 × × n (|a-b|-1)2 n 一对基因 1:1分离 : 分离
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

花色 F2代实际株数(O) 理论株数(E)
白色
192
187.5
黄皮
58
62.5
总数
250
250
O-E 4.5 -4.5
1.提出假设:观察次数与理论次数的差异由抽样误 差所引起,即H0:F2代南瓜果皮色泽分离符合 3:1比率,对备择假设HA:不符合3:1。
2.确定显著水平: 0.0,50.01
184
175
.3

1 2

50

41 .3

1
2

2
2
175 .3
41 .3
200
208 .7

1 2

2 4 .267
208 .7
当df=1时,(20.05,1) 3.84,(20.01,1) 6.63
由于 2 0 .0,1 5 3 .8 4 c 2 4 .2 62 0 7 .0,1 1 6 .63
效假设或否定无效假设。
第二节 适合性测验
一、适合性 2 测验的方法
适合性测验是指测验观察的实际次数与某种 理论或需要预期的理论次数是否相符合。
例1:某项试验观察淀粉质与非淀粉质玉米杂 交的F1代花粉粒,经碘处理后有3437粒呈 蓝色反映,3482粒呈非蓝色反映。如果属于 1对等位基因控制的遗传性状,F1代花粉粒 碘反映的理论比例应该是1:1,问其遗传性 状是否符合1对等位基因控制的遗传规律。
将本例数据代入上式
26200184504602 460
c2
2 76384210250
4.267
2. 2XC表的独立性测验
2XC表是指横行分为两组,纵列分为 C大于等于3组,因为df=(r-1)(c-1) ≥ 2,因此可以不做连续性的矫正。
可先计算各理论值做表格化计算, 也可以根据下式直接计算:
2 0.0 5
,表示
H0成立,即两类现象是相互独立的;

,则否定H0,接受HA,
说明不2 独立02.0,5 处理有效。
1. 2x2表的独立性测验
是指横行和纵列都是两组的计数资料, 即r与c分组均为2,其df=(r-1)(c-
1)=1, 因此在计算 2 时,需进行连
续性的矫正。
例:调查经过种子灭菌处理与未经种 子灭菌处理的辣椒发生枯萎病的株数, 得相依表,试分析种子灭菌与否和病 株多少是否相关。
3. 2 卡平方值的连续性矫正
2是一种连续分布的理论曲线,但 是 测验所应用的次数资料是间断性 的,如果把间断性的资料作连续性 的处理,会产生很大的偏差,降低 了显著标准。特别是在自由度为1时, 需要加以矫正。其方法是将各偏差 的绝对值都减去1/2,即
OE 1 2
c2

k i1
与利用公式计算的结果一致。
例3
今调查10年生元帅苹果盛果期树3株的 枝类组成,共调查了110760枝,其 中中短枝(结果枝和叶丛枝)77021 枝,长枝(15cm以上)33739枝, 问其枝类组成是否达到中短枝占70%, 长枝占30%的丰产指标?
1.假设枝类组成达中短枝占70%,长
枝占30%丰产指标,即Ho:中短枝:长 枝=7:3,
2 OEE2
(2923.66)2 (6812.387)2 (252.53)2
23.66
12.387
52.53
15.402
本例中df=(2-1)×(3-1)=2,查附表5
2 (0.01,2)
9.21,
c 2 1.5 0 4 22 0 .0,2 1 9 .2,P 1 0 .01
2 n2

Tr1Tr2
O12j Tcj
Tnr21
例1:进行大豆等位酶的Aph的电泳分 析,193份野生大豆、223份栽培大豆 等位基因型的次数分布,试分析大豆 Aph等位酶的等位基因型频率是否因 物种而不同。
物种
等位基因
1
2
3
野生大豆 29(23.66) 68(123.87) 96(45.47)
1.提出假设:观察次数与理论次数的差异由
抽样误差所引起,即H0:花粉粒碘反应比 例为1:1,对备择假设HA:花粉粒碘反应 比例不为1:1。
2.确定显著水平:0.0,50.01
3.测验计算:
碘反应 观察次数(O) 理论次数(E) O-E
蓝色
3437
3459.5
-22.5
非蓝色
3482
3459.5
故0.01<P<0.05,否定H0,即种子灭菌 与否和枯萎病发病率相关,灭菌后的病 株数与未灭菌的病株数存在着显著的差 异,种子灭菌对防治辣椒枯萎病有一定 效果。
2X2表的独立性测验,也可以不经过计 算理论值,根据下式可直接算得值:
c2


O11O22 O12O21

n2n 2
Tr1Tr2Tc1Tc2
2 (0.01,3)
11.345,
c 2 1.2 8 92 0 .0,3 1 1.3 1,4 P 5 0 .01
所以否定H0,接受HA,即该病害的发生与 品种密切相关,品种不同,感染某病害
有极显著差异。
3. rc表的独立性测验
由于自由度大于2,故不必进行连续 性的矫正。可利用公式直接计算
第三节 独立性测验
独立性测验是探求两个计数资料之间 是否相互独立,这是次数资料的一 种相关研究。
例如,喷药保果试验,以喷清水为对照, 二者若相互独立,表明喷药与落果无关, 处理无效。若相互不独立,表明喷药与 保果有关,处理有效。
应用独立性测验时
先假设各类现象是独立的,然后计算
值,如果计算出的
2
2.确定检验水平 0.0,50.01那么:
c2
3A7a 52 21n
37702173373952

11.204
21110760
当df=1时,(20.01,1) 6.63,由于c21.120420.0,11
否定无效假设,差异非常显著。说明没有达 到7:3的丰产指标。
总计
176 10 9 195
1.提出假设,H0:叶片衰老与密度无关,二 者独立;对备择假设HA:叶片衰老情况 与密度有关。
2.确定显著水平:0.0,50.01
3.测验计算:实际数代入公式

2 n


Oห้องสมุดไป่ตู้
2 ij
TriTcj

1

195 [( 64 2 60 2 52 2 176 67 176 66 176 62

O E 1 2 2
E
这样就可以使其概率接近于 2 分布
的真实水平,矫正后的

2 常用

2 c
表示。当自由度等于2或大于2时,
一般不做连续性的矫正。
4. 2 测验的原理和显著性测验原理相同
可分为以下步骤: 1.提出假设:
2.确定检验水平: 0.0,50.01
3.测定误差概率:计算卡平方值 4.统计推断:依据试验结果决定接受无
栽培大豆 22(27.34) 199(143.13) 2(52.53)
总计
51
267
98
总计
193 223 416
1.提出假设,H0:等位基因频率与大豆种类 无关,对备择假设HA:两者有关,不同 大豆种类的等位基因频率不同。
2.确定显著水平:0.0,50.01
3.测验计算:计算出理论数代入公式
2. 2 分布具有的特点:
1. 2 无负值,因此 2 分布自0至+ ∞ 之间, 故左右不对称,向右倾斜。
2. 2分布是随自由度而改变的一组连续性曲线。
3. 2 分布的形状与样本大小及理论比率无关, 而与分组数有关。
不论理论比率为1:1,或3:1,或15:1,都是两组, 自由度均等于1;理论比率分三组1:2:1自由度 等于3-1=2,理论比率9:3:3:1,自由度4-1=3
22.5
总数
6919
6919
0
(O-E)2/E
0.1463 0.1463 0.2926
(OE1)2
c2
2 E
2.2 50.52 2.2 50.52


34.59 34.59
0.2798
当df=1时,(20.05,1) 3.84, C20.27 9(8 20.0,5 1)3.8,4

Tr1Tr2
O12j Tcj
Tnr21
218 10 7 620832 42 0 502 32 0 001 22 5 002 20 2 70 1810270
1.82903
本例中df=(2-1)×(4-1)=3,查附表5,
第五章 卡平方( 2)测验
第一节 卡平方( 2)测验的方法 1.卡平方( 2 )定义、公式和分布
1900年K.Pearson根据从属性状的分布推 导出用于次数资料(亦称计数资料)分
析的 2 公式:
2 k OE2
i1 E
上式中:
O为观察次数, E为理论次数, k为分组数。
其分布属于连续 型分布。
3.测验计算:
E11

210 76 460

34 .70
E12

250 76 460

41.3
E21

210 384 460
175 .3
E22

250 384 460
208 .7
O E

1
2


26
34 .7

1
2
相关文档
最新文档