经典非参数假设检验方法全
数学建模方法-非参数假设检验

两相关样本的非参数检验(2 Related Samples Test)
【例12】clinical trial.sav 比较试验药组(group=1) 治疗前血红蛋白含量(hb1)和治疗后血红蛋白含量(hb2) 有无差异.
这是两组相关计量资料的比较. 结论:P=0.018,有显著性差异.
多个相关样本的非参数检验(K Related Samples Test) 【例13】nonpara_7.sav 分析药物是否有效
两相关样本的非参数检验(2 Related Samples Test) 多个相关样本的非参数检验(K Related Samples Test)
两独立样本的非参数检验(2 Independent Samples Test) 检验两个独立样本间是否具有相同的分布. 【例8】nonpara_3.sav 比较两组人群的RD值有无差别 这是两组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-2),其它使用默认选项即可.从负二项分 布的结论.
单样本的K_S拟合优度检验
检验一计量资料是否服从某种理论分布,这里的分布可以 是正态分布(Normal),均匀分布(Uniform),泊松分布(Poisson), 指数分布(Exponential).
【例7】diameter_sub.sav 检验是否服从正态分布
多个独立样本的非参数检验(K Independent Samples Test) 【例10】nonpara_5.sav 比较三种药物的效果有无差别 这是三组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-3),其它使用默认选项即可. 结论:三组的秩和12.6,7.6,3.8,P=0.008,三种药物的 效果有显著性差异,以甲药效果最好. 【例11】nonpara_6.sav 比较三种固定钉治疗骨折的疗效 这是三组等级/频数资料的比较. 先说明频数变量, 再选择要检验的变量和分类变量,定义分类值(1-3),其它 使用默认选项即可. 结论:P=0.129,故三组无显著性差异.
非参数检验的检验方法

非参数检验的检验方法非参数检验是一种假设检验的方法,它不依赖于总体分布的具体形式,而是基于样本数据进行推断。
相比于参数检验,非参数检验更加灵活和普适,可以适用于更广泛的情况。
非参数检验的主要思想是通过对样本数据的排序或者秩次变换,来推断总体的性质。
下面将介绍几种常见的非参数检验方法:1. Mann-Whitney U检验(又称Wilcoxon秩和检验):Mann-Whitney U检验用于比较两个独立样本的总体中位数是否相等。
它的基本思想是将两组样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。
然后计算两组数据秩次和之差的绝对值,该值即为检验统计量U,根据U的大小可以进行推断。
2. Kruskal-Wallis H检验:Kruskal-Wallis H检验用于比较多个独立样本的总体中位数是否相等。
它的基本思想是将所有样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。
然后计算每个样本的秩次和,以及总体的秩次和。
根据这些秩次和的差异来进行推断。
3. 秩和检验:秩和检验是一类常见的非参数检验方法,包括Wilcoxon符号秩检验和符号秩和检验。
这两种方法都是用来比较两个相关样本的总体中位数是否相等。
基本思想是将两个样本的差的符号进行标记,并用秩次表示绝对值大小的顺序。
然后根据秩次和的大小来进行推断。
4. Friedman检验:Friedman检验用于比较多个相关样本的总体中位数是否相等。
它的基本思想是将所有样本的数据进行秩次变换,并计算每个样本的秩次和。
然后根据秩次和的差异来进行推断。
在进行非参数检验时,需要注意以下几点:1. 样本独立性:非参数检验通常要求样本之间是独立的,即样本之间的观测值不受其他样本观测值的影响。
如果样本之间存在相关性,应考虑使用相关性检验或者非参数检验的相关版本。
2. 样本大小:非参数检验对样本的大小没有严格要求,但样本大小较小时可能会影响检验的统计功效。
第三节 非参数假设检验

,由于χ = 12 > 11.07
所以拒绝H0,说明下半年各月销售量与均
匀分布有差别,这些差别尚不能完全归结为随机 原。
【例6.11】在高速公路收费站100分钟内观测到通过 收费站的汽车共190辆,每分钟通过的汽车辆 数分布如下表:
用显著性水平a=0.05检验这些数据是否来自泊松分布。 解:设
H0 :汽车通过收费站的辆数服从泊松分布;
【例6.14】为了比较两个小学贯彻素质教育的情况,现从甲学 校抽15名学生,乙学校抽25名学生,按素质教育的要求进 行测试并评分,按评分高低顺序排队并编上等级,其结果 如下:
W2 W1 为 ,第二个样本的等级和为 ,则有
第三步:计算曼-惠特尼U检验统计量
W1 + W2 = n(n + 1) / 2
从
U和 中选择较小者并称其为 U2 1
n1 (n1 + 1) U1 = n1n2 + − W1 2 n2 (n2 + 1) U 2 = n1n2 + − W2 2
。
U
第四步:作出判断 对于
2
个数。
2 χ分布表求相应的 第四步:根据显著性水平a查
临界值——
2 2
χ
2 a
χ > χ a 时,拒绝原假设,说明样本观测并非来
自该理论分布。
【例6.10】某百货公司的电器部下半年各月洗衣机 的销售数量如下:
该电器部经理想了解洗衣机的销售数量是否在各 月是均匀分布的,也就是说各月中销售数量的差别 可以归结为随机原因,这样可以为以后的进货提供 依据。要求以a=0.05 的显著性水平进行检验。
U − E (U ) Z= D(U )
近似地服从标准正态分布。
非参数假设检验方法

非参数假设检验方法
非参数假设检验方法,那可真是个超棒的统计利器!咱先说说它的步骤吧。
嘿,你想想看,就像搭积木一样,第一步得先明确问题,确定咱要检验啥。
然后收集数据,这数据就像是建筑材料,得好好收集。
接着计算检验统计量,这就如同给积木搭出形状。
最后根据统计量判断是否拒绝原假设。
这步骤简单易懂吧?
注意事项也不少呢!数据得有代表性,不然就像盖房子用了劣质材料,那可不行。
样本量也不能太小,不然就像小娃娃搭的积木城堡,风一吹就倒啦。
说到安全性和稳定性,那可是杠杠的!它不像有些方法那么娇气,对数据的分布要求不高。
就好比一辆越野车,能在各种路况下行驶,不用担心路况不好就抛锚。
应用场景那可多了去啦!当数据不满足参数检验的条件时,非参数假设检验方法就大显身手啦。
比如研究不同年龄段的人对某种产品的喜好,数据可能乱七八糟的,这时候非参数检验就像救星一样。
它的优势也很明显啊,操作简单,容易理解,不需要太多高深的数学知识。
就像玩游戏,不需要看厚厚的说明书就能上手。
给你举个实际案例吧。
有个公司想知道新推出的广告有没有效果,就用了非参数假设检验方法。
结果发现广告确实提高了产品的知名度。
这效果,哇塞,杠杠的!
非参数假设检验方法就是这么牛!它简单易用,安全稳定,应用场景广泛,优势明显。
赶紧用起来吧!。
非参数检验方法

非参数检验方法一、什么是非参数检验非参数检验(Nonparameteric Tests)是指检验假设(比如均值、方差、分布类型)不依赖样本参数的方法,也可以称为不参数检验,将数据的描述性统计量和判别量作为假设检验的基本工具,而不主张假设服从某个具体的概率分布。
二、非参数检验的优点1、可以使用描述性统计量作为假设检验的基本工具,而不主张数据服从某个具体的概率分布,使得检验更加简单。
2、非参数检验的统计量倪比较有针对性,无论样本量大小,无论是否假定样本服从某个具体概率分布,它都能比较有效计算统计量的有效性、准确性。
3、非参数检验的抽样复杂度较低,当数据量较小时,可以获得较精确的结果。
4、非参数检验可以应用于连续变量或离散变量检验假设,使得非参数检验成为一种常见的统计检验方法。
三、常见的非参数检验方法1、Wilcoxon符号秩检验:Wilcoxon符号秩检验是用于比较两组数据之间不同水平上的秩和的检验,它的统计量是组间的秩和比,假设多个样本的总体服从同一分布,可以用来检验两组数据间的均值或中位数的差异性,即表明两个样本的分布是否有差异。
2、Kruskal-Wallis H检验:Kruskal-Wallis H检验是一种无序秩检验,它能检验总体中多组数据间的均值或中位数的比较,即用来检验多个样本构成的总体是否服从同一分布,要求多组样本的体积相等。
3、Friedman检验:Friedman检验是一种用于多个样本比较的非参数检验,它的检验统计量是秩求和检验,可以检验多个样本构成的总体是否服从相同的分布,从而比较多个样本之间的均值,中位数或众数相对应的所有统计量。
4、Spearman秩相关系数:Spearman秩相关系数是一种测量两个变量相关性程度的方法,它不要求变量服从某种分布,仅要求变量是分类变量或连续变量。
5、Cochran Q检验:Cochran Q检验是变量若干观测值服从同一分布的依赖性检验,可以检验多组数据的差异性是否具有统计学意义,一般用于比较不同实验组间的得分或响应相对于对照组的得分或响应的差异性。
假设检验 - 非参数假设检验

• 确定统计量T
– T为正秩次及负秩次和中绝对值较小者
• 统计推断
– 令正负差值的总个数为n – T>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著 – T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理
差异显著 – T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著
零假设:每天心脏病猝死人数分布同预期分布相同
备择假设:每天心脏病猝死人数分布同预期分布不同
(2)构造和计算统计量
日期
周一 周二 周三 周四 周五 周六 周日 合计
怎么计算得到的 呢?
实际频数 期 望 频 差
fi
率 npi
f i - npi
55
53.5
1.5
23
19.1
3.9
18
19.1
-1.1
11
– 令n = n++n- – K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位
数差异不显著
– K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位数 与已知总体中位数差异差异显著
– K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中 位数差异差异极显著
现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55, 23,18,11,26,20,15。
现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?
解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期 分布相同,可以使用卡方检验进行处理,过程如下: (1)建立零假设和备择假设
统计学中的非参数检验方法介绍
统计学中的非参数检验方法介绍统计学是一门研究收集、分析和解释数据的科学。
在统计学中,我们经常需要进行假设检验,以确定样本数据是否代表了总体特征。
非参数检验方法是一种不依赖于总体分布假设的统计方法,它在现实世界中的应用非常广泛。
本文将介绍一些常见的非参数检验方法。
一、Wilcoxon符号秩检验(Wilcoxon Signed-Rank Test)Wilcoxon符号秩检验是一种用于比较两个相关样本的非参数检验方法。
它的原理是将两个相关样本的差值按绝对值大小进行排序,并为每个差值分配一个秩次。
然后,通过比较秩次总和与期望总和的差异来判断两个样本是否具有统计学上的显著差异。
二、Mann-Whitney U检验(Mann-Whitney U Test)Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它的原理是将两个样本的所有观测值按大小进行排序,并为每个观测值分配一个秩次。
然后,通过比较两个样本的秩次总和来判断它们是否具有统计学上的显著差异。
三、Kruskal-Wallis检验(Kruskal-Wallis Test)Kruskal-Wallis检验是一种用于比较三个或更多独立样本的非参数检验方法。
它的原理是将所有样本的观测值按大小进行排序,并为每个观测值分配一个秩次。
然后,通过比较各组样本的秩次总和来判断它们是否具有统计学上的显著差异。
四、Friedman检验(Friedman Test)Friedman检验是一种用于比较三个或更多相关样本的非参数检验方法。
它的原理类似于Kruskal-Wallis检验,但是对于相关样本,它将每个样本的观测值按照相对大小进行排序,并为每个观测值分配一个秩次。
然后,通过比较各组样本的秩次总和来判断它们是否具有统计学上的显著差异。
五、秩相关系数检验(Rank Correlation Test)秩相关系数检验是一种用于检验两个变量之间相关性的非参数检验方法。
常见的几种非参数检验方法
常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法,它不需要满足正态分布等前提条件,因此被广泛应用于实际数据分析中。
在本文中,我们将介绍常见的几种非参数检验方法。
一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号和秩来计算统计量,并通过查表或使用软件进行显著性判断。
二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号来计算统计量,并通过查表或使用软件进行显著性判断。
六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。
它基于样本数据与理论分布之间的差异来计算统计量,并通过查表或使用软件进行显著性判断。
八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本方差和均值来计算统计量,并通过查表或使用软件进行显著性判断。
九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。
它基于自助重采样技术来生成大量虚拟样本,以此估计总体参数和构建置信区间。
数理统计课件 4.3 非参数假设检验方法
§4.3 非参数假设检验方法前面介绍的各种统计假设的检验方法,几乎都假定了总体服从正态分布,然后再由样本对分布参数进行检验。
但在实际问题中,有时不能预知总体服从什么分布,从而就需要根据样本来检验关于总体分布的各种假设,这就是分布的假设检验问题,也称为非参数假设检验。
本节主要介绍2χ拟合优度检验,柯尔莫哥洛夫—斯米尔诺夫(Kolmogrov-Smirnov )检验和独立性检验。
一、2χ拟合优度检验1. 多项分布的2χ检验法设总体X 是仅取m 个可能值的离散型随机变量,不失一般性,设X 的可能值是1,2,,,m " 且(),1,2,,i P X i p i m ===" 且1 1.mi i p ==∑设12(,,)T n X X X "是从总体X 中抽得的简单随机样本,12(,,)T n x x x "是样本观察值。
用i N 表示样本12(,,)T n X X X "中取值为i 的个数,即样本中出现事件{}X i =的频数,则i N 是样本的函数,所以12(,,,)T m N N N "是随机向量,且有1.mi i N n ==∑可证明12(,,,)T m N N N "服从多项分布,其概率分布为1211221212!(,,,),,!!!m n n n m m m m n P N n N n N n p p p n n n ===="""(4.21)需要检验假设0010::(1,2,,),i i i i H p p H p p i m =↔≠=" 其中0i p 是已知数。
检验的统计量?我们知道,频数是概率的反映。
如果总体的概率分布的确是10200(,,,)m p p p ",那么当观察个数n 愈来愈大时,频率i N n 与0i p 之间的差异将越来越小,因此频率i Nn与0i p 之间的差异程度可以反映出10200(,,,)m p p p "是不是总体的真分布。
非参数假设检验方法
品牌
甲
乙
丙
所购买的人数 61
53
36
依据这些数据,是否可以断定顾客对此三种品牌的商品喜好
确实存在着显著的差异?( = 0.05 )
解 若对此三种品牌的商品喜好确实不存在着显著的差异
就意味着,对三种品牌的商品喜好比例 p1, p2 , p3相等。
上页 下页 返回
此是 m = 3, n1 = 61, n2= 53, n3 = 36,n=150
由于6.52 > 5.991 故有理由拒绝H0 认为顾客对此三种品牌的商品喜好确实存在着显著的差异.
上页 下页 返回
例2 64只某种杂交的几内亚猪的后代,其中34只红色,10只 黑色,20只白色,根据遗传模型,它们之间的比例应为 9:3:4,问以上数据在0.05的水平下体现的与遗传模型是否 吻合。 认为基本吻合
定理1
则统计量
2
m
(ni
i 1
npi0 npi0
)2渐近服从自由度为m
1的
2分布.
由此可以建立 H0 的拒绝域
只要给定一组样本观察值,代入检验统计量计算后,就 能得出结论。
上页 下页 返回
例1 某商场为了研究顾客对一类商品的某三种品牌商品的喜 好比例,以便为下次进货提供较科学的依据。现随机观 察购买此商品的150名顾客,并记录下其所买的品牌,统 计人数如下:
抽取次数X 1
2
3
4 5
试验累计数 43 31 15 6
5
解 若两色球个数相等,则每次取到白球的概率为1/2 以抽取次数X为考查对象,则X服从几何分布,即
计算得
上页 下页 返回
此是 m = 5, n1 = 43, n2= 31, n3 =15, n4 = 6,n5= 5, n=100
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
此是 m = 3, n1 = 34, n2= 10, n3 = 20,n=64
例3 验证一枚骰子是否均匀。 电话号码的数字出现的概率等等问题。 采用分组离散化方法 若X的分布函数F(x)的具有明确表达式F0(x),不含未知参数。 根据样本信息推断X的分布函数是否为F0(x).
第一步:
第二步:计算
第三步:记数
非参数假设检验方法
一、2拟合优度检验 二、柯尔莫哥洛夫 三、斯米尔诺夫检验 四、独立性检验
一、2拟合优度检验
适用范围广:一个离散、连续、正态总体都适用。
1、多项分布的2检法
离散总体
对一次抽样来说,
现在对总体X进行假设,即对X的分布律进行假设
由于频率是概率的近似表现,
那么当容量 n 较大时,
例1 某商场为了研究顾客对一类商品的某三种品牌商品的喜 好比例,以便为下次进货提供较科学的依据。现随机观 察购买此商品的150名顾客,并记录下其所买的品牌,统 计人数如下:
品 牌
甲
乙
丙
所购买的人数
61
53
36
依据这些数据,是否可以断定顾客对此三种品牌的商品喜好 确实存在着显著的差异?( = 0.05 )
为什么用非参数方法?
• 非参数检验是针对参数检验而言的。从检验步 骤上讲,二者是一致的:它们都是对总体的某 种数量特征建立相应的原假设和备择假设,都 是在给定的显著性水平下,根据实际统计量来 判断对原假设的取舍。 • 二者的不同之处在于:参数检验需要对总体分 布作限制性的假定。这种假定实际就是要求总 体的分布类型已知,所不知道的只是其中的某 个参数,如均值或方差。而非参数检验并不要 求已知总体的分布信息,而是根据数据本身来 推断总体参数。
为什么用非参数方法?
• 正是由于非参数检验要求的信息少,检验 条件比较宽松,因此它具有很强的适应性, 应用的范围比起参数检验更宽广。非参数 检验不仅可以应用于定距、定比数据的检 验而且也适用于定类、定序数据的假设检 验。对于那些不能直接进行加减乘除四则 运算的数据,运用符号检验、秩和检验都 能起到比较好的效果。
又如,某钟表厂对生产的钟进行精确性检查,抽取100 个钟作试验,拨准后隔24小时以后进行检查,将每个钟的 误差(快或慢)按秒记录下来.
问该厂生产的钟的误差是否服从正态分布?
再如,某工厂制造一批骰子,声称 它是均匀的. 也就是说,在投掷中,出现1点,2 点,…,6点的概率都应是1/6.
为检验骰子是否均匀,要把骰子实地投掷若干次,统 计各点出现的频率与1/6的差距. 问题是:得到的数据能否说明“骰子均匀”的假设是可信的?
为什么用非参数方法?
• 在实际生活中,总体的分布信息并不是容 易得到的。有时,数据并不是来自所假定 的总体;或者,数据根本不是来自同一个 总体;还有可能,数据因为种种原因被严 重“污染”。这样,在假定总体分布的情 况下进行推断的做法就可能产生错误的或 者甚至灾难性的结论。 • 于是,人们希望在不假定总体分布的情况 下,尽量从数据本身来获得所需要的信息, 这就是非参数统计的宗旨。
斯米尔诺夫检验、独立性检验方法。
除此还有:符号检验、游程检验、秩和检验等等。
为什么用非参数方法?
• 经典统计的多数检验都假定了总体的背景 分布。 • 在那里,总体的分布形式或分布族往往是 给定的或者是假定了的。所不知道的仅仅 是一些参数得知或它们的范围。于是,人 们的主要任务就是对一些参数,比如均值 和方差(或标准差)进行估计或检验。 • 如检验正态分布的均值是否相等或等于零 等等。最常见的检验是和正态总体有关的 t-检验、F-检验、X2检验和最大似然比检 验等。
按=0.05,自由度为4-1-1=2查2分布表得 由于统计量的实测值
2.43
<5的要合并,即将发生3次及4次战争的组归并为一组.
2 =2.43<5.991, 未落入否定域.
故认为每年发生战争的次数X服从参数为0.69的泊松分布.
在此,我们以遗传学上的一项伟大发现为例,说明统计 方法在研究自然界和人类社会的规律性时,是起着积极的、 主动的作用. 奥地利生物学家孟德尔进行了长达八年之 久的豌豆杂交试验,并根据试验结果,运用他 的数理知识, 发现了遗传的基本规律.
第四步:检验
其中m为分组数 H0的拒绝域为
一般有 n > 50,npi > 5最好 npi >10,否则应重新分组。 使得npi > 5最好 npi >10.
例4 在一个暗盒中存放有白色与黑色两色乒乓球,问该盒中的 白、黑球的个数是否相等?为此作以下试验,用不返回抽 取发式从此盒中取球,直到取出的球是白色球为止,并记 录下抽取的次数。共重复独立试验了100次,结果如下:
假设H0: p1=3/4, p2=1/4 H1: p1=3/4, p2=1/4至少一不成立
这里,n=70+27=97, k=2, 理论频数为: np1=72.75, np2=24.25 实测频数为70,27.
( fi npi )2 统计量 2 ( 2 1) npi i 1 按 =0.05,自由度为1,查2分布表得
为什么用非参数方法?
• 但是在总体分布形式已知时,非参数检验 就不如传统方法效率高。这是因为非参数 方法利用的信息要少些。往往在传统方法 可以拒绝零假设的情况,非参数检验无法 拒绝。 • 但非参数统计在总体未知时效率要比传统 方法要高,有时要高很多。是否用非参数 统计方法,要根据对总体分布的了解程度 来确定。
2 2
自由度为m-1=1
20.05(1) =3.841
由于统计量2的实测值
2=0.4158<3.841, 未落入否定域.
故认为试验结果符合孟德尔的3:1理论. 这些试验及其它一些试验,都显 示孟德尔的3: 1理 论与实际是符合的. 这本身就是统计方法在科学中的一 项重要应用.
用于客观地评价理论上的某个结论是否与观察结果相符, 以作为该理论是否站得住脚的印证.
非参数假设检验
在前面的课程中,我们已经了解了假设检验的基本思 想,并讨论了当总体分布为正态时,关于其中未知参数的 假设检验问题 .
然而可能遇到这样的情形,总体服从何种理论分布并 不知道,要求我们直接对总体分布形式提出种种假设,然 后利用样本信息对假设进行检验。 在统计学中把不依赖于分布形式的统计方法称为非参数 统计。对总体的分布形式的检验就是非参数检验。
为什么用非参数方法?
• 根据样本又分成
单样本检验 两独立样本检验
• 非参数检验 多个独立样本检验
多个相关样本检验 列联表某一变量各水平比例检验
在本节我们将介绍几种最常用的非参数检验方法: 符号检验、秩和检验和游程检验。
非参数检验
• • • • • • • • • • 非参数检验的方法有很多种,如下几种检验: 正态慨率纸检验; 皮尔逊(Pearson)χ2拟合检验; 柯尔莫哥洛夫与斯米尔诺夫检验; Shapiro-Wilk W检验; D’Agostion’s D检验; Wilcoxon秩和检验。 符号检验 秩和检验 游程检验。
解
若对此三种品牌的商品喜好确实不存在着显著的差异
就意味着,对三种品牌的商品喜好比例 p1, p2 , p3相等。
此是 m = 3, n1 = 61, n2= 53, n3 = 36,n=150
由于6.52 > 5.991
故有理由拒绝H0
认为顾客对此三种品牌的商品喜好确实存在着显著的差异.
例2 64只某种杂交的几内亚猪的后代,其中34只红色,10只 黑色,20只白色,根据遗传模型,它们之间的比例应为 9:3:4,问以上数据在0.05的水平下体现的与遗传模型是否 吻合。 认为基本吻合 解 若基本吻合,则p1=9/16, p2 =3/16 ,p3 =4/16
例如,从1500到1931年的432年间,每年爆发战争的 次数可以看作一个随机变量,椐统计,这432年间共爆发 了299次战争,具体数据如下: 战争次数X 0 1 2 3 4 发生 X次战争的年数 223 142 48 15 4
在概率论中,大家对泊松分布产生的一般条件已有所了 解,容易想到,每年爆发战争的次数,可以用一个泊松随机 变量来近似描述 . 也就是说,我们可以假设每年爆发战争次 数分布X近似泊松分布. 现在的问题是:上面的数据能否证实X 具有泊松分布的假设 是正确的?
第一步: 由样本进行参数的点估计后,将参数估计值代入分 布函数中,使得分布函数成为已知函数F0(x;) 。 第二步: 仿造情形 (2) 分组离散。令
第三步: 其中 m 为分组数,r 为分布函数中待估参数数.
一般有 n > 50,npi > 5最好 npi >10,否则应重新分组。 使得npi > 5最好 npi >10.
类似于以前的检验方法,取一个标准化的度量。
为此在1900年,英国统计学家 Karl Pearson 首先提出
从该统计量直观上判断有,
另外,用该统计量对总体分布律进行检验,还必须知道 其分布。 Pearson给出了其渐近分布。
定理1
由此可以建立 H0 的拒绝域
只要给定一组样本观察值,代入检验统计量计算后,就 能得出结论。
…
黄Hale Waihona Puke 纯系 子一代…绿色纯系
孟德尔
子二代
根据他的理论,子二代中, 黄、绿之比 近似为3:1, 他的一组观察结果为: 黄70,绿27 近似为2.59:1,与理论值相近. 由于随机性,观察结果与3:1总有些差距,因此有 必要去考察某一大小的差异是否已构成否定3:1理论的 充分根据,这就是如下的检验问题. 检验孟德尔的3:1理论:
解决这类问题的工具是英国统计学家K.皮尔逊在1900年
发表的一篇文章中引进的所谓 2检验法. 这是一项很重要的工作,不少人把它视 为近代统计学的开端.
2检验法是在总体X 的分布未知时,