非参数检验

非参数检验
非参数检验

非参数检验Nonparametric Tests菜单

概述

非参数统计是统计分析的重要组成部分,其优点是适用范围广(通用的统计方法),可用于等级资料和开口资料,缺点是检验效能低。目前,非参数统计的一般性统计分析的理论发展远远不及参数检验完善,比较完善的可供使用的方法也不多。比如多个样本间两两比较的非参数检验,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。

虽然这些权威的统计软件没有提供两两比较的非参数方法,但是,国产的统计软件大都提供了两两比较的方法。因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。

在SPSS中,提供了8种非参数检验方法,放入了Nonparametric Tests菜单中,分为两大类:

(一)分布类型的检验过程:

亦称拟合优度检验方法,即检验样本所来自的总体是否服从某种理论分布。

1、Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,随便举例)。请注意该检验和我们一般所用的卡方检验不太一样,我们一般作的卡方检验要用crosstable菜单来完成,见上一章,而不是这里讨论。

2、Binomial T est:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,然后按你给出的分界点一分为二。

3、Runs T est:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。

4、One-Sample Kolmogorov-Smirnov T est(1-Sample K-S..):采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。

(二)分布位置的检验过程:

用于检验样本所在的总体分布位置或形状是否相同。我们平时所说的,所用的非参数检验方法实际上指的就是这一类方法。具体包含以下几种方法:

1、T wo-Independent-Samples T ests:即成组设计的两样本均数比较的非参数检验。

2、T ests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。

3、T wo-Related-Samples T ests:配对设计两样本均数的非参数检验。

4、T ests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。

本次实习只要求掌握分布位置的检验过程

一、两独立样本非参数检验(Two-Independent-Samples Tests)

两独立样本非参数检验,用于成组设计两样本其总体是否具有相同的分布。数据形式可以是原始数据,也可以是等级/频数表资料,使用方法如下。

例 7.4 铅作业和非铅作业工人血铅含量(mg/L)如下,问两组工人的血铅值有无差异?

铅作业工人: 17 18 20 25 34 43 44

非铅作业工人:5 5 6 7 9 12 13 15 18 21

界面如下:

【操作过程】

1、建立数据文件

设定两个变量:X(输入血铅值),group(分组变量)- 铅作业工人 1 ,非铅作业工人 2。

2、统计分析过程

选择Analyze==>Nonparametic test==>Two-Independent-Samples,弹出的对话框和大家最初就接触的t检验对话框非常相似,只是在下面一共给出了四种检验方法。

Mann-Whitney U检验:默认值,该法用途广泛,实际上就是大家学过的两样本比较的秩和检验,只是换了个名称而已。其基本思想是检验两总体的分布位置是否相同。这里我们就用它。

Kolmogorov-Smirnov Z: 和K-S检验相类似,不过这里是检验两个独立样本是否取自同一总体。

Moses extreme reations:如果施加处理因素后,一些个体出现正效应,一些个体出现负效应,分析这种资料就选用该法。

Wald-Wolfowitz runs: 属于一种游程检验,检验总体分布情况是否相同。

本例的具体操作如下:

(1) Analyze==>Nonparametic test==>Two-Independent-Samples

(2)Test variable list框:选入血铅值;

(3)grouping variables框:选入工人分组(group);

单击Define groups钮

在group1框和group2框中分别输入1和2

单击continue钮

复选框组:选中Mann-Whitney U复选框

(5) 单击

【结果解释】

程序给出的结果如下:

上表输出两样本的秩和(Sum of Ranks)和平均秩和(Mean Rank)。

上表的检验结果,给出了Mann-Whitney U 统计量、Wilcoxon W 统计量和Z值(通常所用的u值)。接着给出了近似法计算的概率(P=0.003)和确切概率法计算的概率(P=0.001)。可以认为两组工人尿铅分布不同,铅作业工人血铅值(平均秩和=13.36)高于非铅作业工人血铅值(平均秩和=5.95)。

例7.5 某药治疗不同病情的老年性慢性支气管炎病人,疗效如下表,问该药对两种病情的疗效有无差别。(nonpara2.sav )

病 情 控制 显效 有效 无效

单纯性 65 18 30 13 单纯性合并肺气肿 42 6 23 11

【操作过程】 1、建立数据文件

设定三个变量:X 、group 、F 。 X 表示疗效,控制、显效、有效、无效,分别用1、2、3、4代表;group ,分组变量,单纯性 1 ,单纯性合并肺气肿 2;F 频数。

2、统计分析过程

(1) data → → 选中 Weight cases by 单选框→在Frecuency Variable 框里选入:F → 单击;

(2) Analyze==>Nonparametic test==>Two-Independent-Samples (2)Test variable list 框:X(疗效)

(3)grouping variables 框:group (病情分组); 单击Define groups 钮

在group1框和group2框中分别输入1和2 单击

(4)Test type 复选框组:选中Mann-Whitney U 复选框 (5) 单击 【结果解释】

单纯性气管炎平均秩和为 102.82;合并肥气肿平均秩和为:107.28。u=0.543,P=0.587。尚不能认为该药对不同类型的气管炎疗效有差别。

二、多个独立样本非参数检验(K-Independent-Samples Tests)

用于成组设计多个样本的总体分布是否相同的非参数检验)

界面如下:

在主对话框中,列出两种检验方法:

Kruskal-Wallis H: 这是我们平常所用的多样本比较的秩和检验;

Median : 检验多个样本中位数所在的总体中位数是否相同。

例7.5 四组大白鼠使用不同剂量的某种激素后,耻骨间隙宽度的增加量如下表,试比较四组大白鼠耻骨间隙宽度的增加量有无差别。

第1组 0.15 0.30 0.40 0.40 0.50

第2组 1.20 1.35 1.40 1.50 1.90 2.30

第3组 0.50 1.20 1.40 2.00 2.20 2.20

第4组 1.50 1.50 2.50 2.50

【操作过程】

1、建立数据文件

设定两个变量:X、group。 X代表耻骨间隙宽度的增加量;group为分组变量,输入1~4,分别代表1~4组,输入格式如下。

2、统计分析过程

(1) Analyze==>Nonparametic test==>Two-Independent-Samples (2)Test variable list 框:X(增加量) (3)grouping variables 框:group (分组); 单击Define groups 钮

在group1

框和group2框中分别输入1和4 单击

(4)Test type 复选框组:选中Kruskal-Wallis H: (5) 单击 【结果解释】

Kruskal-Wallis Test

首先指明进行 Kruskal-Wallis H 检验。第1个表给出各组的例数、平均秩和;最后一个表给出检验的结果,由于H 服从X 2分布,故以X 2值(Chi-Square )表示统计量。X 2=12.209,v=3, P=0.007,四组间差异有统计学意义,可以认为不同剂量的激素对大白鼠耻骨间隙宽度的增加量影响不同或不全相同。

例7.6 某药单方、复方对某种疾病的治疗效果如下表,试比较某药单方、复方的疗效有无差异。

某药4种配方的疗效观察

配方疗效

控制显效好转无效

单方 32 62 78 28

复方Ⅰ 34 32 26 8

复方Ⅱ 12 17 13 8

复方Ⅲ 14 18 12 6

这是成组设计等级资料,共4个药物组,欲比较4种药方的疗效有无差异,采用多样本比较的非参数检验(秩和检验)。

【操作过程】

1、建立数据文件

设定三个变量:检验变量(疗效)、分组变量(单复方型)、频数(例数)。

检验变量:输入治疗的效果,用1~4表示,1=“控制”,2=“显效”,3=“有效”,4=“无效”。分组变量:输入单复方型,用1~4表示,1=“单方”,2=“复方I”,3=“复方Ⅱ”,4=“复方Ⅲ”。

频数变量:输入例数。

2、统计分析过程

(1) data →Weight cases.. →选中 Weight cases by 单选框→在Frecuency Variable

框里选入:例数→单击;

(2) Analyze==>Nonparametic test==>K-Independent-Samples

(2)Test variable list框:疗效

(3)grouping variables框:单复方型

单击

在 Minimum框和Maxmum框中分别输入1和4

单击

(4)Test type 复选框组:选中Kruskal- Wallis H 复选框 (默认)

(5)

单击

【结果解释】

Kruskal-Wallis Test (1)各个组的例数和平均秩和;

(2)检验结果

本例检验结果:X2=14.908 ,自由度V=3,P=0.002,可以认为不同配方的疗效差异有统计学意义。

三、配对资料非参数检验

(2 Related Samples Tests)

2 Related Samples Tests 主界面如下:

Test Pair(s) List:选入检验的配对的变量;

Test Type: 检验类型

Wilcoxon :符号秩和检验(默认);

Sign: 符号检验。两组的样本含量(对子数)在25例以下时,用二项分布法;超过25例时,用正态分布法。

McNemar: 用于配对计数资料的比较。

例 7.7 16 只大白鼠按窝别、性别和体重等配成8对,将每对中的两只老鼠随机确定喂正常饲料或维生素E缺乏的饲料。喂养一段时间后,测定肝中卫生素A的含量,结果如下表。问喂养不同饲料的老鼠,肝中维生素A含量有无差异?

对子号正常饲料组缺乏维生素E组

1 3.55 2.45

2 2.00 2.40

3 3.00 1.80

4 3.9

5 3.20

5 3.80 3.25

6 3.75 2.70

7 3.45 2.50

8 3.05 1.75

【操作过程】

1、建立数据文件

设定两个变量:“正常饲料”,“缺乏维E饲料”,分别输入这两组的数据。

2、统计分析过程

Analyze==>Nonparametic test==>2 Related Samples..

Test Pair(S) List框:成对选入分析的两个变量(正常饲料和缺乏维E饲料)

Test type 复选框组:选中Wilcoxon 复选框 (默认)

单击

【结果解释】

Wilcoxon Signed Ranks Test

1、下表给出差值的负秩和(Negative Ranks),正秩和(Positive Ranks)及其平均秩和。

2、检验结果

Z(u)=-2.380, P=0.017(双侧),可以认为两种饲料喂养大白鼠,其肝中维生素A的含量差异有统计学意义。正常饲料组含量高于维生素E缺乏饲料。

四、配伍设计资料非参数检验(K- Relaed Samples Tests)

主界面如下

Test Variable: 选入所分析的变量。

Test Type(检验方法):

◇Friedman:用于单样本重复测量或配伍组设计资料的非参数检验,检验K个相关样本是否来自同一总体,系统默认;

◇Kendall’s W:该指标也称Kendall 和谐系数,它表示K个指标之间相互关联的程度(一致性程度),其取值在0~1之间。

◇Cochran’s Q: 是 Friedman检验在所有反应变量均为二分类结果时的一个特例,也是McNemar 检验在多个样本情况下的推广。

单击

□ Descriptive:对分析变量进行统计描述;

□ Quartiles:计算四分位数,输出第 25、50、75百分位数。

例7.8 将同窝、同性别、体重相近的5只大白鼠配成配伍组,共8个配伍组。将每个配伍组的5只大白鼠随机分到5种饲料组进行喂养,4周后测得增加的体重如下表资料,试比较5种不同饲料组大白鼠增重有无差别。

不同饲料组大白鼠所增加体重

配伍组甲蛋白乙蛋白丙蛋白丁蛋白骆蛋白

1 24.00 15.00 37.00 57.00 82.00

2 42.00 28.00 37.00 51.00 66.00

3 60.00 29.00 47.00 53.00 74.000

4 50.00 29.00 42.00 51.00 79.00

5 42.00 24.00 34.00 60.00 82.00

6 39.00 38.00 27.00 69.00 76.00

7 47.00 21.00 32.00 54.00 73.00

8 53.00 37.00 42.00 59.00 90.00

【操作过程】

1、建立数据文件

设定5个变量:分别是甲蛋白、乙蛋白、丙蛋白、丁蛋白、骆蛋白;分别输入这5组数据。

2、统计分析过程

Analyze==>Nonparametic test==>K Related Samples..

Test Variables框:选入所分析的5个变量;

Test type 复选框组:选中Friedman复选框 (默认)

单击

Friedman Test

1、输出各组的平均秩和

2、检验结果

选用Friedman 检验,Friedman 统计量服从X2分布。该检验X2=29.700,自由度V=4,P=0.000。可以认为不同饲料组大白鼠所增加的体重不同或不全相同。

非参数检验练习题

1、就下表资料比较两组肝炎婴儿的血清总胆红素有无差别?

总胆红素人数

(μmol/L)一般组重症组

<17 4

17~10

80~15 3

160~ 1 9

240~ 2

320~ 4

400~ 4

合计30 22

2、为研究口服二号避孕药对血液凝固的影响,随机抽取服药组12例,未服任何避孕药的对照组12例,分别测定其抗凝血酶活力(mm2)如下,问:服用二号避孕药对抗凝血酶活力是否有影响?

服药组 126 135 136 143 141 138 142 116 110 108 115 140

对照组 162 172 177 170 175 152 157 159 160 162 165 158

3、同一病人分别采用两种方法治疗扁平足效果如下,问哪种方法好?

病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

甲法好好好好差中好好中差好差好中好中

乙法差好差中中差中差中差好差中差中差

4、10名健康男子服用肠溶性醋酸棉酚片后的精液检查结果如下表,问服药前后精液中浓度有无下降?

10名健康男子服药前后的精液浓度检查结果(万/ml)

编号 1 2 3 4 5 6 7 8 9 10

服药前6000 22000 5900 4400 6000 6500 26000 5800 7800 8700

服药后660 5600 3700 5000 6300 1200 1800 2200 6400 7400

5、三组人血浆总皮质醇测定结果如下,问这三组人血浆质醇有无差异?

三组人血浆总皮质醇测定值(×102μmol/L)

正常人0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92

单纯肥胖0.17 0.33 0.55 0.66 0.86 1.13 1.38 1.63 2.04 3.75

皮质醇增多症 2.70 2.81 2.92 3.59 3.86 4.08 4.30 4.30 5.96 6.62

6、三种药物治疗某病的观察结果如下,问这三种药物疗效有无差别?

疗效药物

A B C 合计

治愈15 4 1 20

显效49 9 15 73

好转31 50 45 126

无效 5 22 24 51

合计100 85 85 270

7、就下表资料分析服用某药后不同周次SGPT含量有无差异。

血吸虫病患者服用某药后不同时间SGPT的测定值(IU/L) 患者服药前服药后1周服药后2周服药后3周

1 63 188 138 63

2 90 238 220 144

3 5

4 300 83 92

4 4

5 140 213 100

5 54 175 150 36

6 72 300 163 90

7 64 207 185 87

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

第二讲-非参数统计检验教学内容

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=??第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24N N N N E S Var S ==。拒绝域为:{}N N S S c > (2)由中心极限定理可知,当2 ,1N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α??????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n ==?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00{}{}s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2}{}{2100α =≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

第七章 非参数检验习题 医学统计学习题

第七章非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说()。 A.正秩和与负秩和的绝对值不会相差很大B.正秩和与负秩和的绝对值相等C.正秩和与负秩和的绝对值相差很大D.不能得出结论 E.以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是()。 A.把1X 和2X 的差数从小到大排序B.分别按1X 和2X 从小到大排序C.把1X 和2X 综合从小到大排序D.把1X 和2X 的和数从小到大排序E.把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点()。 A.不受总体分布的限制B.适用于等级资料C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料4.等级资料的比较宜采用()。A.秩和检验 B.F 检验 C.t 检验 D.2 检验 E.u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的()。 A.两样本均数相同 B.两样本的中位数相同C.两样本对应的总体均数相同D.两样本对应的总体分布相同 E.两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是()。 A.Friedman 检验B.符号检验C.Kruskal-Wallis 检验 D.Wilcoxon 检验 E.t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是()。 A.将两组数据统一由小到大编秩 B.遇有相同数据,若在同一组,按顺序编秩C.遇有相同数据,若不在同一组,按顺序编秩D.遇有相同数据,若不在同一组,取其平均值 E.遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。2.你学过哪些设计的秩和检验,各有什么用途?3.试写出非参数统计方法的主要有缺点。三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2 χ检验 2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何 假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2χ检验的方法主要包括适合性检验和独立性检验。 (一)2 χ检验概述 2χ是实得数据与理论数据偏离程度的指标。其基本公式为: ∑-=e e f f f 2 02 )(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2 χ。观察公式可发现,如果实际观察

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

两独立样本t检验和非参数检验的实证分析

龙源期刊网 https://www.360docs.net/doc/cc3261269.html, 两独立样本t检验和非参数检验的实证分析作者:张家骥 来源:《经营者》2013年第11期 摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。 关键词:t检验;非参数检验;显著性水平;频数分析 概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的一门重要公共基础课程,同时也是一门应用广泛,适用性强的工具课。此门课程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠定必要的数学基础,而且对培养学生的逻辑思维能力、分析判断问题能力、统计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质综合型人才的重要保证。 笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取得了明显的提高。 本文数据来源于东华理工大学所有开设了概率论与数理统计课程的学院,分别收集了2010学年第二学期(即下半年)概率成绩和2012学年第二学期概率成绩。总共十个学院,进行分层随机抽样,对每个学院随机抽取10名学生,最终获到两组样本,每组各100个样本点。下面开始进行实证分析: 一、基本统计分析 对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分析不利于对其分布形态的把握,因此先对数据分组后再进行频数分析。SPSS频数分析的操作如下:选择菜单【Analyze】→【Descriptive】→【Frequencies】,结果如下: 从上面的统计表中可以看出,进行重点课程建设后,平均分有了明显的提高,而且从频数分布表可以看出,第3组第4组即中高分数段百分数有了明显提升。从数据的角度初步说明课程建设有效果,学生成绩明显改善。

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A 总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A 反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

非参数统计第4章 两独立样本的非参数检验

第四章 两独立样本的非参数检验 在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽 油中哪一个污染更少,两种市场营销策略中那种更有效等等. 作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12): 15044 12270 5345 7730 22275 8447 9455 8136 6834 9513 4081 5500 而非沿海的为对(x1,x2,…,x18): 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 人们想要知道沿海和非沿海省市区的人均GDP 的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题. 假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验 0H :021D =-μμ;1H : 021D ≠-μμ 0H :021D =-μμ;1H : 021D <-μμ 0H :021D =-μμ;1H : 021D >-μμ 在正态假定下,这些问题化为:)2(~11)(0-++ --= m n t m n s D y x t 2 ) ()(1 2 1 2 -+-+ -= ∑∑==n m y y x x S m i i n i i t 检验并不稳健,在不知总体分布时,应用t 检验时会有风险的。 3.1 Brown-Mood 中位数检验 令沿海地区的人均GDP 的中位数为M X ,而内地的为M Y 。零假设为 0H :y x M M =;1H : y x M M > 显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样 本中位数(记为此xy M ),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12) 和(x1,x2,…,x18)中大于或小于xy M 的样本点应该大致一样多,计算他们的混合样本中位数为

第7章 非参数检验试题

第7章非参数检验试题 选择题: 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论 实验组对照组 实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩 10 7.5 7.5 10 7.5 7.5 12 9 9 8 4 5 15 10 10.5 8 5 5 15 11 10.5 6 1 2 17 12 13 6 2 2 17 13 13 6 3 2 17 14 13 8 6 5 19 17 17 19 17 17 19 17 17 20 20 20.5 19 17 17 20 21 20.5 19 17 17 21 22 22 D 要看哪个P值更小 5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?( C ) A 甲的编秩方法是错的 B 乙的编秩方法是错的 C 甲乙两人方法均对 D 甲乙两人的编秩方法均错 6、以下检验方法中,(A )不属于非参数统计方法。 A.t检验 B.H检验 C.T检验D.χ2检验 7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。 A.应该把α定得小一点 B.将增大犯I类错误的概率

SPSS的参数检验和非参数检验

S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。

非参数检验卡方检验实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验) 专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=,P(Sig)=<,表明灭螨剂A组的杀螨率极显着高于灭螨剂B组。 例 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 123 合计 治疗方法11916540 21612836 31513735合计504120111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df渐进 Sig. (双侧) Pearson 卡方 1.428a4.839

似然比4.830线性和线性组合.5141.474 有效案例中的 N111 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为。 分析:表4是卡方检验的结果。自由度df=4,表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即 X2=,P=>,差异不显着,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显着。 例 表5 灌溉方式* 稻叶情况交叉制表 计数 稻叶情况 123 合计 灌溉方式114677160 2183913205 31521416182合计4813036547 分析:表5是灌溉方式* 稻叶情况资料分析的列联表。

方差分析与非参数检验

北京建筑大学 理学院信息与计算科学专业实验报告 课程名称《数据分析》实验名称方差分析与非参数检验实验地点基C-423 日期2017.3.30 (1)熟悉数据的基本统计与非参数检验分析方法; (2)熟悉撰写数据分析报告的方法; (3)熟悉常用的数据分析软件SPSS。 【实验要求】 根据各个题目的具体要求,完成实验报告。 【实验内容】 1、附件给出某年房屋价格的相关数据,请选用恰当的分析方法,对影响房屋价格的因素进行分析。(注意数据要调整成标准的格式,变量值、组别(字符变量转换成数值变量))(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可) 2、附件给出管理才能评分的相关数据,请选用恰当的分析方法,分析该评分数据是否服从正态分布。 3、附件给出了某体育比赛的两位裁判打分数据,请选用恰当的分析方法,检验该两组评分分布是否有显著差异。(注意数据要调整成标准的格式,变量值、组别) 4、附件给出了减肥茶数据,请选用恰当方法分析,检验该减肥茶是否对减肥有显著效果。(注意数据要调整成标准的格式,变量值、组别) 【分析报告】 1、对影响房屋价格的因素进行分析。(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)。 表1-1(a) 装修状况对均价影响的单因素方差分析结果 均价 平方和df 均方 F 显著性 组间79.180 1 79.180 62.408 .000 组内230.914 182 1.269 总数310.094 183 表1-1(b) 所在区县对均价影响单因素方差分析结果 均价 平方和df 均方 F 显著性 组间91.919 3 30.640 25.279 .000 组内218.174 180 1.212 总数310.094 183 表1-1(a)是装修状况对均价影响的单因素方差分析结果。可以看到:观测变量均价的离差平方总和为310.094;如果仅考虑装修状况单个因素的影响,则均价总变差中,不同装修状况可解释的变差为79.180,抽样误差引起的变差为230.914,它们的方差分别为79.180和1.269,相除所得的F统计量的观测值为62.408,对应的概率P-值近似为0.如果显著性水平α为0.05,由于概率P-值小于显著性水平α,应拒绝原假设,认为不同装修状况对均价的平均值产生了显著影响,不同装修状况对均价的影响效应不全为0。 表1-1(b)是所在区县对均价影响单因素方差分析结果。可以看到:如果仅考虑所在区县单个因素的影响,则均价总变差310.094中不同所在区县可解释的变差为91.919,抽样误差引起的变差为218.174,

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

两个独立样本的非参数检验方法有哪四种

两个独立样本的非参数检验方法有哪四种 两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 一、Mann-Whitney U检验 主要通过对平均秩的研究来实现推断。 将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和Wx ,Wy 。 N=m+n Wx+Wy= N(N+1)/2 如果H0成立,即两组分布位置相同,Wx应接近理论秩和 m(N+1)/2; Wy 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。

最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列求游程。 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。 四、极端反应检验 从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。

非参数检验

非参数检验Nonparametric Tests菜单 概述 非参数统计是统计分析的重要组成部分,其优点是适用范围广(通用的统计方法),可用于等级资料和开口资料,缺点是检验效能低。目前,非参数统计的一般性统计分析的理论发展远远不及参数检验完善,比较完善的可供使用的方法也不多。比如多个样本间两两比较的非参数检验,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些权威的统计软件没有提供两两比较的非参数方法,但是,国产的统计软件大都提供了两两比较的方法。因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。 在SPSS中,提供了8种非参数检验方法,放入了Nonparametric Tests菜单中,分为两大类: (一)分布类型的检验过程: 亦称拟合优度检验方法,即检验样本所来自的总体是否服从某种理论分布。 1、Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,随便举例)。请注意该检验和我们一般所用的卡方检验不太一样,我们一般作的卡方检验要用crosstable菜单来完成,见上一章,而不是这里讨论。 2、Binomial T est:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,然后按你给出的分界点一分为二。 3、Runs T est:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 4、One-Sample Kolmogorov-Smirnov T est(1-Sample K-S..):采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 (二)分布位置的检验过程: 用于检验样本所在的总体分布位置或形状是否相同。我们平时所说的,所用的非参数检验方法实际上指的就是这一类方法。具体包含以下几种方法: 1、T wo-Independent-Samples T ests:即成组设计的两样本均数比较的非参数检验。 2、T ests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。 3、T wo-Related-Samples T ests:配对设计两样本均数的非参数检验。 4、T ests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。 本次实习只要求掌握分布位置的检验过程

两个独立样本的非参数检验方法有4种

两个独立样本的非参数检验方法有4种 曼-惠特尼U检验(Mann—whitney U) 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。 再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。 极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。 第1 页共1 页

第七章 非参数检验习题7

第七章 非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( )。 A .正秩和与负秩和的绝对值不会相差很大 B .正秩和与负秩和的绝对值相等 C .正秩和与负秩和的绝对值相差很大 D .不能得出结论 E .以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是( )。 A .把1X 和2X 的差数从小到大排序 B .分别按1X 和2X 从小到大排序 C .把1X 和2X 综合从小到大排序 D .把1X 和2X 的和数从小到大排序 E .把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点( )。 A .不受总体分布的限制 B .适用于等级资料 C .适用于未知分布型资料 D .适用于正态分布资料 E .适用于分布呈明显偏态的资料 4.等级资料的比较宜采用( )。 A .秩和检验 B .F 检验 C .t 检验 D .2 检验 E .u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( )。 A .两样本均数相同 B .两样本的中位数相同 C .两样本对应的总体均数相同 D .两样本对应的总体分布相同 E .两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是( )。 A .Friedman 检验 B .符号检验 C .Kruskal-Wallis 检验 D .Wilcoxon 检验 E .t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是( )。 A .将两组数据统一由小到大编秩 B .遇有相同数据,若在同一组,按顺序编秩 C .遇有相同数据,若不在同一组,按顺序编秩 D .遇有相同数据,若不在同一组,取其平均值 E .遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。 2.你学过哪些设计的秩和检验,各有什么用途? 3. 试写出非参数统计方法的主要有缺点。 三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH ),结果见表7-1。问两种仪器所得结果有无差别?

第09章 非参数检验练习题

第9章非参数检验练习题 选择题: 1. 与参数检验相比,非参数检验的主要特点是(B ) A. 对总体的分布没有任何要求 B. 不依赖于总体的分布 C. 只考虑总体的位置参数 D. 只考虑总体的分布 2. 如果要检验两个配对总体的分布是否相同,采用的非参数检验方法是(C ) A.弗里德曼(Friedman)检验 B. Kruskal-Wallis检验 C. Wilcoxon符号秩检验 D. Mann-Whitney检验 3. 如果要检验K个独立总体的分布是否相同,采用的非参数检验方法是(D ) A. Wilcoxon符号秩检验 B.弗里德曼(Friedman)检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验 4. Mann-Whitney检验主要用于检验(A ) A. 两个独立总体的分布是否相同 B. 两个配对总体的分布是否相同 C. K个独立总体的分布是否相同 D. K个配对总体的分布是否相同 5. Kruskal-Wallis检验主要用于检验(D) A. 两个配对总体的分布是否相同 B. 两个独立总体的分布是否相同 C. K个配对总体的分布是否相同 D. K个独立总体的分布是否相同 6. 下面为来自两个总体的独立样本数据,要检验两个样本是否来自同一分布的总体,采用的非参数检验方法是(C) 样本1130146124152147 样本292160164197166 A. 弗里德曼(Friedman)检验 B. Wilcoxon符号秩检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验

7. 下面是来自4个总体的独立样本数据,要检验这4个样本数据是否来自同一个总体,采用的非参数检验方法是(A ) 样本1样本2样本3样本4 14101116 1391217 1091216 10121314 A. 等方差的 B. 等均值的 C. 独立的 D. 相关的 8. K个独立样本的Kruskal-Wallis检验所对应的参数检验方法是(C ) A. 两个独立总体均值之差的检验 B. 两个配对总体均值之差的检验 C. 单因子方差分析 D. 双因子方差分析 9. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是(A ) A. 两个配对总体均值之差的检验 B. 两个独立总体均值之差的检验 C. 一个总体均值的检验 D. 单因子方差分析 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论

相关文档
最新文档