第六章 卡平方测验

合集下载

6-卡平方检验ppt

6-卡平方检验ppt
( Ai Ti ) 2 Ti
k
(6-1)式算得的 值均有偏大的趋势,尤其
2
是当 df 1 时,偏差较大。
上一张 下一张 主 页 退 出
F.Yates(1934)提出对 进行连续性矫
2
正。
矫正方法是,先将各组实际观察次数与理 论次数的差数的绝对值分别减去0.5,然后再平
方进行计算。矫正后的 记为 ,即
上一张 下一张 主 页 退 出
③ 类似地,独立的列约束条件有c-1个。 因而在进行独立性检验时,自由度为rc-1- (r-1)-(c-1)=(r-1)(c-1), 即 自由度 =(横行属性类别数-1)×(直 列属性类别数-1)。
是相对于理论次数232.25,相差 8.25。
上一张 下一张 主 页
退 出
如果把各组的
( A T )2
除以相应的理论次
数,即 ( A T ) 2 / T ,并记为 2 ,即

2
=

i 1
k
( Ai Ti ) Ti
2
上一张 下一张 主 页
退 出
其中, k 为组数,
Ai 为第i组的实际观察次数,
第六章 检验
2
本章介绍对次数资料进行适合性检
验和独立性检验的 检验法。
2
上一张 下一张 主 页
退 出
第一节
2
统计数
2
一、 统计数的意义
豌豆花色遗传中,红花和白花是受一 对等位基因控制的一对相对性状,杂交F2植 株的理论比例为 红:白=3:1。
上一张 下一张 主 页
退 出
孟德尔(1865)在杂交 F2群体中随机 调查了929株,其中705株为红花,224株为 白花。这一结果是否符合3:1的理论比例。

生物统计学 第六章 卡平方测验

生物统计学 第六章 卡平方测验

解:( 1 )列联表
第一块田 第二块田 总数
有锈病 372 ( 396*702/774=359.16 ) 330 ( 378*702/774=342.84 ) 702
无锈病 24 ( 396*72/774=36.84 ) 48 ( 378*72/774=35.16 ) 72
H 0 : 两块地发病率一致, H A : 两块地 发病率不一致
进行列联表分析,那些情况下需要进行连续 性矫正( A)。
A.2×2 表 B.2×3 表 C.2×c 表 D.r ×2 表
以红米非糯稻和白米糯稻杂交,子二代检测
179 株,数据如下:
属性 (x)
红米非糯 红米糯 白米非糯 白
株数
96
37
31
问子二代分离是否符合 9 : 3 : 3 : 1 的
规律? ( A)。
,等等。
查表,得
,所以
差异极显著,拒绝 H 0 ,这一品种已不纯。
求置信区间,首先有,
由于该表有三行三列,∴自由度 df =(3-1) ×(3-1) = 4。不须连续性矫正。查表:
,∴差异不显著,接 受 H 0 ,叶片衰老与灌溉方式无关。
所以
的置信区间为,
22. 纯种玉米株高方差不应大于 64

现测量某一品种玉米 75 株,得株高
总数 396 378 774
=0.4240+4.1334+0.4442+4.3309 =9.3325

=7.8794
9 . 3325 > 7 . 8794, 所以差异极显著, 拒绝 H 0 ,两块地发病率不一致
( 2 )百分数检验: H 0 : 两块地发病率 一致, H A : 两块地发病率不一致

卡平方测验

卡平方测验

卡平方测验
实验目的
1.以提供的数据练习计算x2值,并测定其是否近似理论假设的期望比值。

2.依据相应自由度,检验计算所得x2值。

3.熟练掌握x2值的计算和利用x2值评估实验结果
实验原理
卡平方(x2)测验的目的是以吻合度断定所获得的资料与理论上期望的比值是否满足或近似,也就是x2测验可以测定所得数据是否偏离吻合概率。

显然,如果偏差小是因为偶然机会,偏差大则不是出于偶然机会。

卡平方x2测验试图为我们解决这个问题:“骗差小到何种程度才可以认为只是出于偶然机会。

”卡平方x2值的公式如下:
x2 =∑(O-E)2/E
这里的o是特定表现型个体的观察数目;E是这一表现型在理论上期望的数目;∑是各种表现型(O-E)2/E的累加值。

例如,高茎番茄和矮茎番茄杂交,F1全为高茎,F2有102株高茎和44株矮茎。

这些资料是否符合3:1的概率?回答这个问题必须计算x2值,把计算过程综合整理于表2-1。

2
计算所得的x值为2.0548,x值意味着什么呢?如果实际观察值(O)精确等于理论期望值(E),x2值为 0,是一个完满的好适度。

于是x2值小,表明观察结果接近期望比率;x2值大,表明观察结果与期望比率存在明显差异。

一般统计学家把P=1/20或P=0.05定为显著水平。

当两组变数自由度为1时,卡平方x2值为3.841的概率是0,05,观察值与期望值相抵触。

在刚才的实例中x2=2.0548,它小于允许最大值x2 =3.841,P>0.05。

因而可以认为偏差只是偶然机会,实验数据符合3:1的概率的假设。

第六章 卡平方检验《试验设计与统计分析》课件

第六章 卡平方检验《试验设计与统计分析》课件

u12
u12
... u12
n i 1
ui2
( xi )2 2
❖ 自由度n= n, ( n个独立的u2之和)
由于通常未知,
用x估计, 即用( x x)2 ( x )2
又s 2
( xi n
x)2 1
,则( xi
x)2
(n
1) s 2
故2值又可表示为:
2
( xi )2 2
(n 1)s2
发病情况有显著差别。
三、r×c表的独立性检验
❖ 与2×c表检验类似。(略)
第三节 方差的假设检验
❖ 从正态总体N(,2)中,以样本容量n进行抽
样,样本观察值为x1、 x2、 … xn,每一个x可
求得一个正态离差
ui
xi
~
N (0,1)
❖ 数理统计已证明:这些u值的平方和等于c2的
值。
2
差s12、s22所属的总体方差 12、22是否有显
著差异。需采用F检验 。
❖ 如果检验H0:12=22,对HA:12≠22,则为两
尾检验,表中列出的F值应变为Fa
/
;而检验
2
时则应将大的s2作分子,小的s2作分母计算F。
这样,实得F > F / 2时,该F为在 水平上显
著。
❖ [例6.6]测量玉米A品种20株得穗位高标准差sA = 13.88(cm),测量B品种15株得穗位高标准
❖ 检验计算:
F
sB2 s A2
25.972 13.882
3.5
❖ 推断:实得F > F0.10/2=2.262,故在 = 0.10水平上
否定H0,即品种A与品种B穗位高的整齐度有显著差 异。

卡平方测验

卡平方测验

0.05
(3)测验计算: : 在假设 H 0为正确的前题下, 则可得如下求理论值的比例式,求出理论值: 300∶100=231∶E1 300∶200=231∶E2 300∶100=69∶E3 300∶200=69∶E4 所以 E1=77 E2=154 E3=23 E4=46
健株 甲品种 乙品种 合 计 O 88 143 231 E 77(E1) 154(E2) 231 O 12 57 69
病株
E 23(E3) 100 46(E4) 200 69 300
合计
当 df r 1c 1 2 12 1 1时,
O E 0.5 2 2 E


77 154 2 2 2 2 2 2 2 .34 .5 6 . 63 4 0.5 9 12 23 0 57 46 0 . 5 0 . 01 , 1 88 77 0.5 143 154 0.5 12 23 54 23 46 77 154 2
注:卡方适合性测验还经常用来测验试验数据的次 数分布是否和某种理论分布(如二项分布、正态分布等) 相符,以推断实际的次数分布究竟属于哪一种曲线类型。
(即:拟合优度检验)
单向分组计数资料:将资料列成表格后,行数 R=1,列数C≥2的计数资料。 [例] 某地进行人口调查,共有人口378万人,其
中男、女人口分别为190、188(万人),即:
2 9.34 0 .05, 1 3.84

88 77 0.5
2

143 154 0.5
2

12 23
所以 p 0.05 。 (4)推断:否定H 0 ,接受 H A ,即发病率的高低与品 种有关。

卡平方测验公式

卡平方测验公式

卡平方测验公式卡平方检验是一种常用的假设检验方法,用于检测两个变量之间是否存在统计学上的关联性。

其中,卡方分布是一种概率分布,常用于统计学分析中。

本文将从卡平方测验的定义、原理、公式、注意事项等方面进行详细介绍。

一、卡平方测验的定义卡平方测验(Chi-square test)是一种用于分析分类资料的统计方法,用来评估随机变量的频率分布与某种理论分布之间的偏离程度。

它通过比较实际观测值和理论值的差异,来判断这种差异是否显著。

二、卡平方测验的原理卡平方测验的原理是基于卡方分布的统计原理。

卡方分布是指自由度为n的卡方变量X2的概率分布,其概率密度函数为f(x) =x^(n/2-1)*e^(-x/2) / (2^(n/2)*Γ(n/2)) ,其中,Γ(n/2)为伽玛函数值。

卡方分布的特点是非对称的,取值范围为[0,+∞)。

卡平方测验的基本思路是:1.设定原假设和备择假设;2.收集样本数据;3.计算观测值的卡方值;4.确定自由度;5.查找卡方分布表,找到临界值;6.比较观测值的卡方值和临界值;7.根据比较结果,判断原假设是否成立。

三、卡平方测验的公式卡平方测验的公式如下:卡方值=Σ(观测值-理论值)²/理论值其中,Σ表示对所有分类统计量求和。

四、注意事项1.在进行卡平方测验时,样本数量应该尽可能大,否则可能会导致误差增大;2.进行卡平方测验时,要保证分类变量的独立性,即各分类变量之间应该互相独立;3.进行卡平方测验时,要注意设置显著性水平,一般取α=0.05或α=0.01;4.进行卡平方测验时,要选择合适的观测和理论值,否则可能会导致结果不准确;5.进行卡平方测验时,最好使用专业的卡平方测验软件或计算器,以提高效率和准确性。

五、总结卡平方测验是一种重要的假设检验方法,常用于分析分类数据和判断两个变量之间的关联性。

它基于卡方分布的统计原理,通过比较理论值和观测值的差异来判断原假设是否成立。

在进行卡平方测验时,需要注意样本数量的大小、分类变量的独立性、显著性水平的设置、观测和理论值的选择以及使用专业工具等因素。

12第6章卡方测验

12第6章卡方测验

HA :不符合9:3:3:1的理论比例
2 值 2、计算
理论次数
有色非糯:E1=743×9/16=417.9 有色糯性:E2=743×3/16=139.3 无色非糯:E3=743×3/16=139.3 无色糯性:E4=743×1/16=46.44
(O E ) 2 2 E (491 417.94) 2 (76 139.31) 2 (90 139.31) 2 (86 46.44) 2 417.94 139.31 139.31 46.44 92.3961
( 184-175.3 -0.5)2 175.3
3、统计推断 df=(2-1)(2-1)=1,20.05,1 3.84
c2 20.05,1 ,否定H0 ,接受HA: 种子灭
菌与否与散黑穗发病有关
【例6.5 】调查A、B、C三个大豆品种病毒病发生 情况,每个品种调查300株,结果列于表7.6。试分 析病毒病的发生是否与品种有关
2
2、计算
f(2)
2

ui (
2
定义 2 u12 u2 2 ... un 2
xi
df=1
0.5
0.4 0.3 0.2 0.1
df=3

) 2 2 ( n)
2 (
xi x

)2
(n 1) s 2
2
2 ( n 1)
表7.4 发病穗数 种子灭菌与小麦散黑穗病发病的2×2相依表 种子灭菌 26(34.7) 不灭菌 184(175.3) 总数 210
未发病穗数
总数
50(41.3)
76
200(208.7)
384
250

试验设计与分析(园艺)第六章 卡平方测验

试验设计与分析(园艺)第六章 卡平方测验
2 2 由于 χC 0 .05,1,故否定H0,接受HA 。
χ
2 C
O E 0.5
推断:种子灭菌与否和散黑穗病发病高低有相关,
种子灭菌对防治小麦散黑穗病有一定效果。
以上 C 的计算也可以不通过
2
O11 O21 C1
O12 O22 C2
R1 R2 n
理论值,而采用下面的公式
2 0 .05 3.841
3. 计算 2 值:
桃果皮 毛茸
有 无 ∑
观察株数 (O)
132(O1) 36(O2) 168
理论株数 (E) 168×0.75= 126(E1) 168×0.25= 42(E2) 168
O-E 6 -6 0
O E 0.5
E
2
0.2401 0.7202 0.9603
二、适合性测验的步骤
1. 提出无效假设:观察次数与理论次数一致,即观
察次数与理论次数的差异由抽样误差引起,备择
假设:观察次数与理论次数不一致。
2. 确定显著水平α=0.05或α=0.01 。
3. 在无效假设为正确的假定下,计算大于观察次数 值大于临界值的概率。 4. 根据所得概率值的大小,接受或否定无效假设。 5. 作出统计推断。
排列成相依表;
(2)根据两个变数相互独立的假设,算出每
一组格的理论次数;
2 ( O E ) (3)由 2 算得 2值。 E
2 此 的自由度随两个因素各自的分组数而不同。
设横行r分组,竖行c分组,那么df=(r-1)(c-1)。
2 当 2 ,df 时就接受H0而否定HA,即两个因素相
2
四、多组资料的适合性测验
多组资料指组数k≥3的计数资料,其自由度df=k-
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

D. 品种纯, 置信区间为( 74.24 , 152.03 )
品种已不纯, 置信区间为( 74.24 , 142.03 )
解:假设,
检验方差,使用 检验,有 查表,得
,所以差异极显著,拒绝 H 0 ,这一品种已不纯。
求置信区间,首先有,
所以 的置信区间为,
查表,
代入上式计算得:74.24≦σ 2 ≦142.03
总数 396 378 774
H 0 : 两块地发病率一致, H A : 两块地发病率不一致
=0.4240+4.1334+0.4442+4.3309 =9.3325

=7.8794
9 . 3325 > 7 . 8794, 所以差异极显著,拒绝 H 0 ,两块地发病率不一致
( 2 )百分数检验: H 0 : 两块地发病率一致, H A : 两块地发病率不一致
口服( B )
有效( A ) 1 = 58
无效( ) 2 = 40
行总数 98
67.4%
注射( )
3 = 64
列总数
122
Df=(2 - 1) × (2 - 1)=1
4 = 31 71
95 总数: 193
查 χ 2 分布表,得:

, ∴ 接受 H 0 ,给药方式与
药效无关。
21.为检测不同灌溉方式对水稻叶片衰老的影响,收集如下资料:
C.两块地发病率一致,两种方法结果相同 D.两块地发病率一致,两种方法结果不同
答案是:
两块地发病率不一致,两种方法结果相同
解:( 1 )列联表
第一块田 第二块田 总数
有锈病 372 ( 396*702/774=359.16 ) 330 ( 378*702/774=342.84 ) 702
无锈病 24 ( 396*72/774=36.84 ) 48 ( 378*72/774=35.16 ) 72
给药方式
有效( A )
无效( )
口服( B )
58
40
总数 98
有效率 59.2%
注射( )
64
总数
122
31
95
71
193
问给药方式对药效果是否有影响? A
A. 给药方式与药效无关 B. 给药方式与药效有关
C. 无法判断
D. 给药方式与药效关系不大
答案是:
给药方式与药效无关
解:在保持各行、列总数不变,且 A 与 B 独立的条件下,计算各格理论值 T i :
所以实测株高方差 95% 的置信区间为( 74.24 , 142.03 )
23. 两块田中调查小麦锈病发病率,第一块田有锈病 372 叶,无锈病 24 叶,第二块田有 病 330 叶,无病 48 叶,请用列联表及百分数差异显著性检验两种方法比较这两块地发病 率是否一致,并对结果加以比较。 ( )
A.两块地发病率不一致,两种方法结果不同 B.两块地发病率不一致,两种方法结果相同
第六章 卡平方测验
卡平方是连续分布,所以只能用于(c )资料的测定。 A.连续性 B.标准差 C.可用于次数资料 D.方差 下面四种说法中最准确的说法是( C)。 A.卡平方可用于方差同质性测验 B.卡平方可用于 1 个方差同质性测验 C.卡平方可用于一个和≥3 个方差的同质性测验 D.卡平方可用于 2 个方差同质性测验 卡平方分布是(C )。 A.对称分布 B.一条曲线 C.一组曲线 D.对称曲线 一般而言,方差的置信限是( B)。 A.对称的 B.不对称的 C.无法确定 D.以上均不是 Bartlett 测验,就是( A)。 A.3 个或 3 个以上的方差同质性测验 B 方差同质性测验 C.标准差测验 D.适合性测验 Bartlett 测验,容易受(C )。 A.方差大小影响 B.方差个数影响 C.非正态总体影响 D.以上说法均不正确 Test for goodness-of-fit 的中文意思是( C)。 A.精确性测验 B.准确性测验 C.适合性测验 D.显著性测验 适合性测验在什么情况下需要进行连续性矫正 (A )。 A.自由度为 1 B.所有情况 C.自由度小于 5 D.自由度太小 独立性测验的主要目的是考察次数资料的( A)。 A.相关性 B.独立性 C.同质性 D.随机性 列联表是观测数据按(B )属性(定性变量)分类时所列出的频数表 。 A.两个 B.两个或更多 C.三个 D.四个
解:根据公式
计算各格理论值。
例如 第一行第一列为: 第一行第二列为:
, ,等等。
由于该表有三行三列, ∴自由度 df =(3-1)×(3-1) = 4。不须连续性矫正。查表: ,∴差异不显著,接受 H 0 ,叶片衰老与灌溉方式无关。
22. 纯种玉米株高方差不应大于 64
。现测量某一品种玉米 75 株,得株高
37
31
15
问子二代分离是否符合 9 : 3 : 3 : 1 的规律? ( A)。
合计 179
A.符合 B.不符合 C.无法判断 D.以上全不对
测验可用于次数资料的测验是因为(C )。
A 分布是间断的 B 分布可矫正 C.次数资料服从 分布 D. 分布是连续的
用 进行独立性测验 (A )。
A. 自由度为 1 时要矫正
列联表分析最关键是计算(A )。
A.表格中的理论值 B.表格中的卡平方值 C.卡平方值 D.独立性指数
从理论角度考虑,列联表分析每个表格的理论值(B )。
A.等于格子事件出现的频率×总次数
B.等于格子事件出现的概率×总次数
C.等于边际概率×总次数
D.以上均是错误的
列联表分析中,每个表格的理论值是在(B )前提下进行计算的。
=2100cm , s = 10 cm ,问是否可说这一品种已不纯?请给出实测株高方差的 95% 置信 区间。 ( )。
A. 品种纯, 置信区间为(74.24 , 142.03 )
B. 品种已不纯, 置信区间为(74.24 , 142.03 )
C. 品种已不纯, 置信区间为(54.24 , 142.03 )
B. 无需连续性矫正
C. 自由度小于 1 时要矫正
D. 自由度小于 12 时要矫正
方差的置信限 (D )。
A. 是对称的 B. 不一定 C. 不受自由度影响 D. 是不对称的
方差的置信限 ( A)。
A. 是对称的 B. 不一定 C. 不受自由度影响 D. 是不对称的
20.下表是对某种药的试验结果:
表 6-1 给药方式与药效试验结果


u 0.05 =1.9600, u 0.01 =2.5758 u> u 0.01 , 所以差异极显著,拒绝 H 0 所以两块地发病率不一致
A.HA 为正确的 B.H0 为正确的 C.彼此相关的 D.已知分布的
进行列联表分析,那些情况下需要进行连续性矫正( A)。
A.2×2 表 B.2×3 表 C.2×c 表 D.r×2 表
以红米非糯稻和白米糯稻杂交,子二代检测 179 株,数据如下:
属性 (x)
红米非糯 红米糯 白米非糯 白米糯
株数
96
表 6-2 水稻叶片衰老情况
灌溉方式
绿叶数
黄叶数
枯叶数
总计
深水
146
7
7
160
浅水
183
9
13
205
湿润
152
14
16
182
总计
481
30
36Biblioteka 547问叶片衰老是否与灌溉方式有关?
A. 叶片衰老与灌溉方式无关 B. 叶片衰老与灌溉方式有关
C. 无法判断
D. 叶片衰老与灌溉方式关系不大
答案是: 叶片衰老与灌溉方式无关
相关文档
最新文档