基于秩次的非参数检验
医学统计学 -第10章 基于秩次的非参数检验

H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
卫生统计学试题及答案(二)

卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____. A.b无统计学意义 B.b有高度统计学意义 C.b有统计学意义 D.不能肯定b有无统计学意义 E.a有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是_____. A.符号秩和检验中,差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时,秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 【答案】B 3.随机事件的概率为______. A.P=1 B.P=0 C.P=-0.5 D.0≤P≤1 E.-0.5<P<0.5< P> 【答案】D 4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 【答案】C 5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验 D.配对秩和检验 E.两组方差齐性检验 【答案】A 6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____. A.T值越大P值越小 B.T值越大越有理由拒绝H0 C.P值与T值毫无联系 D.T值越小P值越小 E.以上都不对 【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体 【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
兰大《卫生统计学》15春在线作业1 答案

《卫生统计学》15春在线作业1
一、单选题(共15 道试题,共60 分。
)
1. 关于基于秩次的非参数检验,下列说法错误的是( )
A. 符号秩和检验中,差值为零不参加编秩
B. 两样本比较的秩和检验方法中的正态近似法为参数检验
C. 当符合正态假定时,非参数检验犯II类错误的概率较参数检验大
D. 当样本足够大时,秩和分布近似正态
E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异
正确答案:B
2. 若X的方差等于6,Y的方差等于4.X与Y独立,则X-Y的方差等于( )
A. 0
B. 5
C. 2
D. 1
E. 10
正确答案:E
3. 在同一总体随机抽样,其他条件不变,样本含量越大,则( )
A. 样本标准差越大
B. 样本标准差越小
C. 总体均数的95%可信区间越窄
D. 总体均数的95%可信区间越宽
正确答案:C
4. 比较非典型肺炎和普通肺炎患者的白细胞计数水平,若( ),可作单侧检验。
A. 已知二组患者的白细胞计数均降低
B. 已知二组患者的白细胞计数均升高
C. 不清楚哪一组的白细胞计数水平有变化
D. 已知非典型肺炎患者的白细胞计数不高于普通肺炎
E. 两组白细胞计数值的总体方差不相等
正确答案:C
5. R×C表的卡方检验的自由度为( )
A. R-1
B. C-1
C. R*C-1
D. (R-1)(C-1)
E. R*C-2
正确答案:D。
基于秩次的非参数检验

第七章基于秩次的非参数检验前言:1. 问题的提出:前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。
★大样本用Z检验(中心极限定理)。
如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?★需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念:前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。
这类检验方法称为参数检验。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。
这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。
(1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。
b. 适宜定量模糊的变量和等级变量。
c. 方法简便易学。
(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。
(3)基于秩次的非参数检验(秩和检验)的基本思想:例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。
显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。
一.配对样本的符号秩检验(Wilcoxon signed rank test):例7.1:研究出生先后的孪生兄弟智力是否存在差异?表7.3 12对孪生兄弟智力测试结果9 70 65 -5 -5.510 71 80 9 911 88 81 -7 -812 87 72 -15 -11差值一般在5左右,但个别较大,如15,可能不服从正态分布。
卫生统计学考试试题及答案(附解释)

卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题一、选择题1.两小样本均数比较,方差不齐时,下列说法不正确的是().A. 采用秩和检验B. 采用t′检验C. 仍用t检验D. 变量变换后再作决定E. 要结合正态性检验结果方能作出决定H是().2. 两样本秩和检验的A. 两样本秩和相等B. 两总体分布相同C. 两样本分布相同D. 两总体秩和相等E. 两总体均数相等3. 在统计检验中是否选用非参数统计方法().A. 要根据研究目的和数据特征作决定B. 可在算出几个统计量和得出初步结论后进行选择C. 要看哪个统计结论符合专业理论D. 要看哪个P值更小E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().A. T越大,P值越小B.T越大,P值越大C. T值在界值范围内,P值小于相应的αD. T值在界值范围内,P值大于相应的αE. T值在界值范围上,P值大于相应的α5. 成组设计两样本比较的秩和检验,其检验统计量T是().A. 为了查T界值表方便,一般以秩和较小者为TB. 为了查T界值表方便,一般以秩和较大者为TC. 为了查T界值表方便,一般以例数较小者秩和为TD. 为了查T界值表方便,一般以例数较大者秩和为TE. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表多样本定量资料比较,当分布类型不清时应选择().A. 方差分析B. t检验C. Z检验D. Kruskal-Wallis检验E. Wilcoxon检验6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后H值,则会().的cA.提高检验的灵敏度B.把一些无差别的总体推断成有差别C. 把一些有差别的总体推断成无差别D.Ⅰ、Ⅱ类错误概率不变E. 以上说法均不对二、简答题1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?3. 多组定量资料比较时,统计处理的基本流程是什么?。
非参数统计中的秩和检验方法详解(Ⅰ)

非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和展示的学科,它在各个领域都有着广泛的应用。
而在统计学中,参数统计和非参数统计是两种常见的方法。
参数统计是根据总体的参数进行推断,而非参数统计则是不对总体参数做出假设的一种统计方法。
在非参数统计中,秩和检验方法是一种常用且重要的方法。
本文将详细介绍非参数统计中的秩和检验方法。
一、秩和检验简介秩和检验是一种基于秩次的非参数检验方法,它主要用于对两个独立样本或多个相关样本的总体分布进行比较。
这种方法的优势在于对数据的分布形状没有要求,适用于各种类型的数据。
在进行秩和检验时,首先需要将样本数据进行排序,然后根据排序后的秩次进行计算。
接下来,通过比较秩和的大小来进行假设检验,从而得出结论。
二、秩和检验的应用场景秩和检验方法可以应用于诸多实际场景中。
比如,在医学研究中,可以用秩和检验方法来比较两种不同治疗方法的疗效;在工程领域,可以用秩和检验方法来比较不同生产工艺的产品质量;在市场营销中,可以用秩和检验方法来比较不同促销策略的效果等等。
总之,秩和检验方法在实际问题的解决中有着广泛的应用。
三、秩和检验的类型秩和检验包括了许多不同类型,其中最常见的包括Mann-Whitney U检验、Wilcoxon秩和检验和Kruskal-Wallis H检验。
下面将分别对这些检验进行详细介绍。
1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它基于两组数据的秩次进行比较,通过计算秩和来判断两组数据是否来自同一总体分布。
Mann-Whitney U检验的原假设是两组样本来自同一总体分布,备择假设是两组样本来自不同总体分布。
通过计算U统计量和p值来进行假设检验,从而得出结论。
2. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两个相关样本的非参数检验方法。
它与Mann-Whitney U检验类似,同样是基于秩次进行比较。
非参数统计中的秩和检验方法详解(七)

非参数统计中的秩和检验方法详解统计学作为一门应用广泛的学科,其研究对象主要是各种数据的收集、整理、分析和解释。
在统计学中,参数统计和非参数统计是两种常用的分析方法。
在本文中,我们将重点介绍非参数统计中的一种常见方法——秩和检验。
一、秩和检验的基本原理秩和检验是一种基于秩次的非参数假设检验方法,它不需要对总体分布进行任何假设,因此在数据分布未知或不满足正态分布假设的情况下,秩和检验可以很好地进行统计推断。
秩和检验的基本原理是将样本数据进行排序,然后将排序后的数据转化为秩次,再通过对秩次进行比较来进行假设检验。
秩和检验适用于两组或多组独立样本的比较,常用于检验总体的中位数是否相等或者总体分布是否相同。
二、秩和检验的步骤秩和检验的步骤主要包括数据排序、秩次转换和秩和比较。
具体步骤如下:1. 数据排序:首先对样本数据进行排序,可以按照从小到大或者从大到小的顺序进行排序。
2. 秩次转换:将排序后的数据转化为秩次,即给每个数据赋予一个秩次,通常情况下,秩次是按照数据在样本中出现的顺序进行分配的。
如果出现相同的数据,可以采取加权秩次的方法进行处理。
3. 秩和比较:对计算得到的秩次进行比较,通过比较秩和的大小来进行假设检验,得出检验统计量并进行显著性检验。
三、秩和检验的应用秩和检验方法在实际应用中有着广泛的应用,特别是在医学、生物学、社会科学和工程领域等。
下面以两组独立样本的比较为例,介绍秩和检验的应用。
假设有两组独立样本,分别记为X和Y,我们要比较这两组样本的中位数是否相等。
首先对两组样本数据进行排序,并进行秩次转换,得到秩和值RX和RY,然后对秩和值进行比较,通过比较得到的检验统计量进行显著性检验,从而判断两组样本的中位数是否相等。
四、秩和检验的优缺点秩和检验作为一种非参数方法,具有一些优点和局限性。
优点:秩和检验不需要对数据分布进行假设,因此对于不满足正态分布假设的数据具有较好的适用性;同时,秩和检验是一种较为稳健的检验方法,对异常值和极端值的影响相对较小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
4个差值每种组合发生的可能性就是:0625.021212121=⨯⨯⨯=P 。
所有可能的秩和情况和T *的分布见表7.1。
表7.1 n=4时所有可能秩和情况和T*的分布正差数的秩次负差值的秩次正秩和T+负秩和T-检验统计量T*概率P1,2,3,4 -- 10 0 0 0.0625 2,3,4 1 9 1 1 0.0625 1,3,4 2 8 2 2 0.0625 1,2,4 3 7 3 3 0.1250 3,4 1,2 7 3 31,2,3 4 6 4 4 0.1250 2,4 1,3 6 4 41,4 2,3 5 5 5 0.1250 2,3 1,4 5 5 51,3 2,4 4 6 4 0.1250 4 1,2,3 4 6 41,2 3,4 3 7 3 0.12503 1,2,4 3 7 32 1,3,4 2 8 2 0.06251 2,3,4 1 9 1 0.0625- 1,2,3,4 0 10 0 0.0625如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。
如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。
表 7.2 Wilcoxon符号秩检验的判断原则双侧检验单侧检验(1) 单侧检验(2) 检验假设H0:Md(d)=0 H0:Md(d)=0 H0:Md(d)=0 H1:Md(d)≠0 H1:Md(d)>0 H1:Md(d)<0统计决策:小样本查表法若T*≤Tα/2(n),则拒绝H0若T-≤Tα(n),则拒绝H0若T+≤Tα(n),则拒绝H0大样本正态近似法 若│Z │>Z α/2 , 则拒绝H 0 若│Z │>Z α , 则拒绝H 0 若│Z │>Z α, 则拒绝H 0当研究例数较大时(n>50),秩和T 的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于: μT =n(n +1)/424/)12)(1(++=n n n T σ 检验的公式为:24/)12)(1(5.04/)1(5.0**++-+-=--=n n n n n Z T T TT σμ具体计算步骤: a. 建立检验假设:H0: 中位数为零; H1:中位数不等于零;α=0.05b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平均秩。
分别求正号和负号的秩和,取绝对值小的为T。
c. 确定概率:查附表10,在n=11时,T0.05=11。
现24.5>11,故p>0.05。
7.2 两独立样本的秩和检验(Wilcoxon rank sum test)例7.2 在缺氧条件下,观察4只猫与12只兔的生存时间(分),结果见表7.5。
试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。
这是生存时间资料,一般不服从正态分布,样本也较小,需考虑用非参数检验---秩和检验。
秩和检验的基本思想:两组观察值共有n例,设例数较少的组有n1例,按观察值大小顺序分别编秩为1,2,…,n。
如果零假设成立,观察的结果有较大的可能出现分布在中间的结果。
如果极端的结果出现,则可能零假设不成立,我们就拒绝零假设。
表7.5 缺氧条件下猫与兔的生存时间(分)比较当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于:T*=n 1(n +1)/2⎥⎥⎦⎤⎢⎢⎣⎡---+=∑*n n t t n n n k kT 33222)(112)1(σ检验公式为:21*5.0|2/)1(|*-+-=T n n T Z σ具体计算步骤: a. 建立检验假设:H0:Md1=Md2,即两总体分布位置相同;H1:Md1≠Md2,即两总体分布位置不同;α=0.05b.编秩和计算秩和:两组混合编秩,有相同值求平均秩(仅有同组相同值可忽略)。
当n1<n2时,取较小样本的秩和为检验统计量T*=R1;当n1=n2时,取秩和较小者为检验统计量T*=min(R1,R2)。
本例求例数较少组的秩和T*=78.5。
c.确定概率:T值在表中两数字值之间时,p值大于相应界值,反之则小于。
n1=5,n2=14,n2-n1=9,查附表11,T L0.01=22,T U0.01=78,T*>T U0.01,P<0.01,故拒绝H0,可认为猫、兔在缺氧条件下的生存时间的中位数不相等。
7.3 多个样本分布位置相同的假设检验1.完全随机化设计资料分布位置的假设检验(Kruskal- Wallis test)表7.7 不同吸烟习惯母亲的新生儿体重(kg)出生体重x ij相应秩次r ijA B C D A B C D2.7 2.93.3 3.5 3 4 7 112.43.2 3.6 3.6 2 5.5 12.5 12.52.23.2 3.4 3.7 1 5.5 9 143.4 3.4 9 9n i 4 3 4 3R i15 15 37.5 37.5 计算步骤:a. 建立检验假设: H0:k个总体中位数相等;H1:k个总体中位数不等;α=0.05。
b. 计算统计量:各组混合编秩。
如不同组间出现相同值,求平均秩。
计算各组的秩和。
如果H 0:成立,第i 组秩和的期望(总体均数)Ri μ与方差2Ri σ分别为:2)1(+=n n i R iμ 12)1)((2+-=n n n n i i Riσ 在此基础上建立检验统计量:[][]∑∑==+-+-=-=ki i i i i ki RiRi i n n n n n n R R H 1212212/)1)((2/)1(σμ当H 0成立时,该检验统计量近似服从自由度为(k-1)的2分布。
为简化运算,由上式推导出如下公式:)1(3)()1(1212--+=∑=n n R n n H k i ii375.9)114(3)35.3745.37315415()114(14122222=+-++++=H 校正:)()(1313n n t t HH mp p p C ---=∑= 5018.91414)]22()33()22[(1375.93333=--+-+--=C H c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2值表得χ20.05(3)=7.815,p<0.05,故拒绝零假设,说明不同吸烟习惯对新生儿体重有影响。
2.随机化区组设计资料分布位置的假设检验(Friedman test)与配对设计的思想一样,为控制某些因素对试验效应的混杂影响,可以在设计时,将试验对象配成组,再随机地分配处理因素给每组中的各个对象,这种设计称随机化区组设计。
对于随机化区组设计资料,考虑k个处理组的分布差异时,可采用由M. Friedman在符号检验基础上扩展的秩和检验,称为Friedman检验(Friedman test)。
令x ij为第i区组(i =1,2....b)、第j处理组(j=1,2....k)的个体观察值,数据按区组(b行)与处理组(k列)排列如表7.8。
表7.8 随机化区组设计的资料格式区组处理组1 2 ... k1 x11x12... x1k2 x21x22... x2k┆┆┆┆┆b x b1x b2... x bk其检验假设为H0:k个处理组效应的中位数相等;H1:k个处理组效应的中位数不全相等。
进行Friedman检验时,首先在每区组(行)内将观察值按其数值由小到大排秩,然后再按处理组(列)求秩和,最后产生一个综合区组内差异的检验统计量。
令r ij为第i区组、第j处理组观察值x ij所对应的秩次,因为每一区组(行)内有k 个从1到k 的整数秩,所以任何区组(行)的秩和为2)1(1+=∑=k k r kj ij 令R j为第j 处理组的秩和,即R j=∑=kj ijr 1,故总秩和为2)1(1+=∑=k bk R kj i 当H 0成立时,第j 列秩和的期望与方差分别为2)1(+=k b Riμ, 12)1(22-=k b Rj σ大样本时,统计量 2RjRjj j R Z σμ-=~N(0,1)取其加权和,[]∑∑==++-=⎪⎭⎫ ⎝⎛-=kj j j kj k kb k b R Z k k 1221212/)1(2/)1(1χ 近似服从自由度为(k-1)的2χ分布,通过与2χ分布界值的比较便可作出判定。
与K-W 检验统计量的情况相似,可导出计算式)1(3)1(12122+-+=∑=k b R k bk k j j χ 例7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如表7.9所示。
问四种条件下的测量结果的差异是否具有统计学意义?表7.9 甘蓝叶核黄素浓度测量值(/g)批次测量条件甲乙丙丁1 27.2(2) 24.6(1) 39.5(4) 38.6(3)2 23.2(1) 24.2(2) 43.1(4) 39.5(3)3 24.8(2) 22.2(1) 45.2(4) 33.0(3)R j 5 4 12 9解 (1) 建立检验假设H0:四种测量条件下的测量结果的中位数相等;H1:四种测量条件下的测量结果的中位数不全相等。