生物统计5-卡平方测验

合集下载

卡平方测验

卡平方测验

第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。

能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。

在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。

间断性变数的计数资料也可整理为次数资料。

凡是试验结果用次数表示的资料,皆称为次数资料。

次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。

本章主要介绍卡平方测验。

第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。

菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。

按1:1的性比计算,雌、雄株均应为100株。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。

表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1) 100(E1) -8 0.64雄108(O2) 100(E2) 8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。

这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。

为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

生物统计学—卡方检验

生物统计学—卡方检验

k
cc2 i 1
Oi Ei 0.5 2 Ei
当自由度df>1时,与连续型随机变量卡方分相
近似,这时可以不做连续性矫正
注意:要求各个组内的理论次数不小于5,如某 组理论次数小于5,则应把它与其相邻的一组或 几组合并,知道理论次数大于5为止
适合性检验
适合性检验(吻合性检验或拟合优度检验) 步骤:
1. 提出无效假设,即认为观测值和理论值之间 没有差异
2. 规定显著性水平 3. 计算样本卡方值 4. 根据规定的显著水平和自由度计算出卡方值, 再和实际计算的卡方值进行比较
例:有一鲤鱼遗传试验,以荷包鲤鱼(红色,隐性)与湘江 野鲤(青灰色,显性)杂交,其F2获得下表的所列的体色分 离尾数,问这一资料的实际观测值是否符合孟德尔一对等位 基因的遗传规律?
所以卡方值是度量实际观测值与理论值偏南 程度的一个统计量
卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大 卡方值为0,表明H0严格成立,且它不会有下侧 否定区,只能进行右尾检验
卡方检验的原理和方法
由于离散型资料的卡方检验只是近似地服从连 续型变量的卡方分布,所以在对离散型资料进行 卡方检验计算的时,结果常常偏低,特别是当自 由度df=1时,有较大偏差,为此需要进行矫正:
总和Ri 300 200
T=500
分析:1)独立性检验问题 2) 自由度为df=(2-1)*(2-1)=1,需要连续性矫正
解:(1)假设 H0 : 吸烟与患气管炎无关 对 H A : 吸烟与患气管炎有关联
(2)选取显著水平 0.05
(3)检验计算: 计算联表中的各项的理论次数
不同人群 吸烟人群 不吸烟人群
需要计算分布的数字 (X>0) 自由度

生物统计学—卡方检验

生物统计学—卡方检验

CHIINV Probability Degrees_freedom
卡方分布的单尾概率 自由度
精品课件
卡方检验基础
2检验是以2分布为基础的一种假设检验 方法,主要用于分类变量,根据样本数据推 断总体的分布与期望分布是否有显著差异, 或推断两个分类变量是否相关或相互独立。
精品课件
卡方检验基础
2值的计算:
其否定 2 区 2为 和 2 : 2
1
2
2
精品课件
例:已知某农田受到重金属污染,经抽样测定铅浓度分别为:
4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为
0.150, 试检验受到污染的农田铅浓度的方差是不是和正常 浓度铅浓度的方差(0.065)相同
分析:1)一个样本方差同质性检验
由于离散型资料的卡方检验只是近似地服
从连续型变量的卡方分布,所以在对离散型资料
进行卡方检验计算的时,结果常常偏低,特别是
当自由度df=1时,有较大偏差,为此需要进行矫
正:
k c2 i1

精品课件
卡方 (c2) 分布
总体
m
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
精品课件
不同容0
2
卡方 (c2) 分布的特点
不同容量样本的抽样分布
1、 2分布是一个以自由度n为参数
的分布族,自由度n决定了分布的 形状,对于不同的n有不同的卡方 分布
如果样本确实是抽自由(P1, P2,…,Pk)代表的总体,Oi和Ei之间的差异就只
是随机误差,则Pearson统计量可视为服从卡方 分布

第5章-卡平方测验

第5章-卡平方测验

花色 F2代实际株数(O) 理论株数(E)
白色
192
187.5
黄皮
58
62.5
总数
250
250
O-E 4.5 -4.5
1.提出假设:观察次数与理论次数的差异由抽样误 差所引起,即H0:F2代南瓜果皮色泽分离符合 3:1比率,对备择假设HA:不符合3:1。
2.确定显著水平: 0.0,50.01
184
175
.3

1 2

50

41 .3

1
2

2
2
175 .3
41 .3
200
208 .7

1 2

2 4 .267
208 .7
当df=1时,(20.05,1) 3.84,(20.01,1) 6.63
由于 2 0 .0,1 5 3 .8 4 c 2 4 .2 62 0 7 .0,1 1 6 .63
效假设或否定无效假设。
第二节 适合性测验
一、适合性 2 测验的方法
适合性测验是指测验观察的实际次数与某种 理论或需要预期的理论次数是否相符合。
例1:某项试验观察淀粉质与非淀粉质玉米杂 交的F1代花粉粒,经碘处理后有3437粒呈 蓝色反映,3482粒呈非蓝色反映。如果属于 1对等位基因控制的遗传性状,F1代花粉粒 碘反映的理论比例应该是1:1,问其遗传性 状是否符合1对等位基因控制的遗传规律。
将本例数据代入上式
26200184504602 460
c2
2 76384210250
4.267
2. 2XC表的独立性测验
2XC表是指横行分为两组,纵列分为 C大于等于3组,因为df=(r-1)(c-1) ≥ 2,因此可以不做连续性的矫正。

生物统计学 第五章 卡方检验

生物统计学 第五章 卡方检验
独立性检验 料之间是相互独立的或者是相互联系的假设检
验,通过假设所观测的各属性之间没有关联, 然后证明这种无关联的假设是否成立。
同质性检验 在连续型资料的假设检验中,对一个样本方差
的同质性检验,也需进行χ2 检验。
第五章 第一节 χ2检验的原理与方法 第二节 适合性检验 第三节 独立性检验
➢ χ2检验就是统计样本的实际观测值与理论推算
离散型资料 总体分布未知
检验对象
总体参数或几个总体参 数之差
不是对总体参数而是对 总体分布的假设检验
χ2 检验的相关知识
三、χ2检验的用途 指对样本的理论数先通过一定的理论分布推算
适合性检验 出来,然后用实际观测值与理论数相比较,从
而得出实际观测值与理论数之间是否吻合。因 此又叫吻合度检验。 是指研究两个或两个以上的计数资料或属性资
(4)推断
确定自由度,df=(r-1)(c-1),查临界值 表,进行推断。
给药方式 口服 注射 总数
给药方式与给药效果的2×2列联表
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
有效率 59.2% 67.4%
1.H0 :给药方式与给药效果相互独立。 HA :给药方式与给药效果有关联。
进行计算:
2 1
n
Oi2 n pi
Oi -第 i 组的实际观测数 pi -第 i 组的理论比率 n-总次数
豌豆
F2代,共556粒
315
101 108
32
此结果是否符合自由组合规律
根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱= 9 :3 :3 :1 16 16 16 16

五、卡平方测验

五、卡平方测验

F2代红花与白花的理论比例为3:1
于是将各差数平方除以相应的理 论次数再相加,记为 论次数再相加,记为χ2,即:
(O − E ) 2 χ2 = ∑ E
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量, 越小, 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 际观察次数与理论次数越接近 ; , 表示二者完全吻合; 越大, 表示二者完全吻合;χ2越大,表示二者相 差越大。 差越大。
各种自由度下右尾概率取α的临界
χα,df值列于附表4,供测验时查用。 值列于附表4 供测验时查用。
例如, 例如, df=10, α=0.05, , ,
χ20.05,10=18.31,表示 0.05, =18.31,
P( χ2 > 18.31)=0.05 图5.2)。 )=0.05(图 。 )=0.05
2×2表的独立性测验 × 表的独立性测验
H0:种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关 HA:种子灭菌与散黑穗病发病有关 种子灭菌与散黑穗病发病有关 显著水平 α=0.05 。
E11=460×(76/460)×(210/460)=34.7 × × 同理,O12=184相应的理论次数为 同理, 相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 × × O21=50相应的理论次数为 相应的理论次数为 E21=460×(76/460)×(250/460)=41.3 × × O22=200相应的理论次数为 相应的理论次数为 E22=460×(384/460)×(250/460)=208.7 × ×
( x i − x ) 2 = ( n − 1) S 2

卡平方测验

卡平方测验

根据处理及考察指标的多少分为不同的列联表:
宜宾学院
15
第四章 孟德尔遗传
检验程序
1、提出假设 H0:O-E=0;HA: O-E≠0 2、根据概率的乘法法则计算理论数:理论数的计算方法——
E ij
3、检验统计量:
i行总数 j列总数
总数
4、统计推断
宜宾学院
16
第四章 孟德尔遗传
[例] 表5.11为不同灌溉方式下水稻叶片衰老情况的调查资料。试
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。
显著水平: 然后计算
表现型
=0.05。 值
稃尖有色非 糯 稃尖有色 糯稻 稃尖无色 非糯 稃尖无色 糯稻 总数
观察次数(O) 理论次数(E) O -E
宜宾学院
491 417.94 73.06
76 139.31 -63.31
4、依所得概率值的大小,接受或否定无效假设
在实际应用时,往往并不需要计算具体的概率值。 若实得 若实得 ≥ < 时,则H0发生的概率小于等于 时,则H0被接受。 , 属小概率事件,H0便被否定;
宜宾学院
8
第四章 孟德尔遗传
情况1:大豆花色一对等位基因的遗传研究如 下图:
P F1 F2 紫花 白花 紫花
稃尖有色 非糯 491 稃尖有色 糯稻 76 稃尖无色 非糯 90 稃尖无色 糯稻 86 总数 743
结果是否符合 9∶3∶3∶1的 理论比率?
宜宾学院
11
第四章 孟德尔遗传
二、 适合性检验
有一水稻遗传试验的适合性测验 按9∶3∶3∶1的理论比率算得各种ห้องสมุดไป่ตู้现型的理论次数E,
如稃尖有色非糯稻 E=743×(9/16)=417.94……

生物统计学 第六章 卡平方测验

生物统计学 第六章 卡平方测验

解:( 1 )列联表
第一块田 第二块田 总数
有锈病 372 ( 396*702/774=359.16 ) 330 ( 378*702/774=342.84 ) 702
无锈病 24 ( 396*72/774=36.84 ) 48 ( 378*72/774=35.16 ) 72
H 0 : 两块地发病率一致, H A : 两块地 发病率不一致
进行列联表分析,那些情况下需要进行连续 性矫正( A)。
A.2×2 表 B.2×3 表 C.2×c 表 D.r ×2 表
以红米非糯稻和白米糯稻杂交,子二代检测
179 株,数据如下:
属性 (x)
红米非糯 红米糯 白米非糯 白
株数
96
37
31
问子二代分离是否符合 9 : 3 : 3 : 1 的
规律? ( A)。
,等等。
查表,得
,所以
差异极显著,拒绝 H 0 ,这一品种已不纯。
求置信区间,首先有,
由于该表有三行三列,∴自由度 df =(3-1) ×(3-1) = 4。不须连续性矫正。查表:
,∴差异不显著,接 受 H 0 ,叶片衰老与灌溉方式无关。
所以
的置信区间为,
22. 纯种玉米株高方差不应大于 64

现测量某一品种玉米 75 株,得株高
总数 396 378 774
=0.4240+4.1334+0.4442+4.3309 =9.3325

=7.8794
9 . 3325 > 7 . 8794, 所以差异极显著, 拒绝 H 0 ,两块地发病率不一致
( 2 )百分数检验: H 0 : 两块地发病率 一致, H A : 两块地发病率不一致
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第11章 卡平方测验
次数资料的统计分析方法有二项分布的正态接近法和卡平方测验法。

例:大豆花色一对等位基因的遗传研究,F2代共289株,紫花208株,白花81,问这一资料的实际观察值是否符合3:1的理论数值? 方法一:二项资料的百分数假设测验,U 测验。

Ho :p =0.75;H A :p ≠0.75;α=0.05;U0.05=1.96
0.05
2080.7197289
0.0255
0.71970.75
1.19
0.0255
p
p u u u σ
===
=
=-=
=-=
p>0.05
接受Ho ,即实际观察值符合3:1的理论数值。

方法二:O :Observe ;E :Theory
比较理论次数与实测次数符合程度,适合性测验,可用()O E -∑来表示;但()O E -∑为0,可用2()O E -∑消除负号;但如: O1-E1=303-300=3,300次中占3次 O2-E2=18-15=3,15次中占3次 比重不同
可用
2
()O E E
-∑即将绝对数变为相对数。

1、故定义2
2
1
()
k
O E E
χ-=

,其中k 为组数。

显然,卡平方越大,越不符合;卡平方为0
时完全符合。

2、χ2分布:是一组曲线,随自由度不同而不同,呈正偏斜,不是对称分布;v =1时偏斜最厉害,v 增大时趋近于正态分布。

是连续性变数的理论分布而不是间断性变数的抽样分布。

小结:连续性变数的理论分布:正态分布 连续性变数的抽样分布:t ,F ,χ2
间断性变数的理论分布:二项分布,潘松分布 3、χ2测验
Ho :观察次数与理论次数的差异是抽样误差 H A :观察次数与理论次数的差异不是抽样误差 α=0.05
假定Ho 正确,算得χ2值,再查χ2(α,v )
推断:如实得卡平方值大于临界值,则否定Ho ,即不符合。

注意v =k -1,k 为组数,不是样本容量。

4、平方的连续性矫正
卡平方分布是连续性的,次数资料是间断性的,由次数资料算得的卡平方值偏大,易达到显著水平。

一般v =1,尤其是小样本,须矫正。

V ≥2的样本可不矫正, V ≥30时接近正态分布。

2
2
1
(0.5)
k
c O E E
χ--=

c :correct
5、适合性测验:
上例:大豆花色是否符合一对等位基因遗传规律?
2
2
1
(0.5)
k
c O E E
χ--=

=1.256<χ2(α,v )=χ2(0.05,1)=3.84,故接受Ho ,即大豆花色符合一
对等位基因遗传规律。

6、昆虫分布型的拟合(适合性测验)
随机分布:个体间相互独立,即不相互吸引,也不相互排斥。

包括潘松分布和正二项分布。

其理论次数为()!
k
m
m
NP k Ne
k -=
均匀分布:个体间相互排斥,如沙滩上水母的分布,鸟类领域筑巢等。

聚集分布:个体间相互吸引,包括核心分布和负二项分布等。

在昆虫生态及预测预报中有详细讨论。

7、独立性测验
主要探求两个变数间是否相互独立,只介绍2×2列联表。

种间关联是对两个种群间的相互关系的一个测定尺度。

正联接表明两个物种趋于在一起相互有吸引作用,或对同一环境有相同的适应,如共生、共栖、捕食者-猎物、植食者-植物等。

负联接表明两个物种趋于分离,相互有排斥干扰作用,或对相同环境有不同的适应性,如两种单寄生物对同一个寄主有排斥作用;三化螟等单食性害虫与非取食水稻的植食性害虫等。

无联接表明两物种独立存在,既不干扰,也不吸引。

例:调查460株甘蓝上蚜虫和食蚜蝇的有无,数据如下:
现在测定天敌对害虫跟随作用的强弱。

Ho :相互独立无关联;H A :有关联。

在460株中,有蚜虫的为250株,故p1=250/460 在460株中,有食蚜蝇的为76株,故p2=76/460 两者都有的概率为p1×p2
两者都有的理论株数=p1×p2×460=41.3株
同理算得其他各格的理论次数,计算卡平方值,注意要作连续性矫正。

在实际应用中一般不求理论次数,而直接由观察值求得2c χ。

2
2
112212212
1212
460
()(5018420026)460
22
76384250210
c n a a a a n
C C R R χ--
⨯-⨯-
⨯=
=
⨯⨯⨯=4.267
χ2(0.05,1)=3.84
否定Ho ,即两物种之间有关联。

再进一步判定联接方向:
11221221a a a a >,正连接,同时出现,同时不在,相互吸引; 11221221a a a a <,负连接,有我无你,有你无我,相互排斥; 11221221a a a a ,无连接,相互独立。

现1122122192005200a a a a =>=,故为正联接。

注意:只有存在关联时才进一步判定联结方向。

若考虑0.01显著水平,则:
正联结:+,++,分别代表显著和极显著 负联结:-,――, 无联结:0
对多个种同时测定两两之间的联结关系,可得下图:
也可考虑用两物种之间得协调系数来表示,可得一量化关系。

a a a a v -=
v ∈[-1,1]
v 约等于0,无协调。

V>0,正协调 V<0,负协调。

相关文档
最新文档