spss非参数教程

合集下载

SPSS数据统计与分析标准教程非参数检验

SPSS数据统计与分析标准教程非参数检验
第5章
非参数检验
非参数检验是统计推断的基本内容,也是统计分析方法中的重要组成部分。通过前 面章节的学习,已经了解参数检验是在总体分布形式已知的情况下,对数据进行推断分 析的一种方法。但是,在实际分析过程中,由于种种原因会造成研究者无法获知数据形 态的分布情况。此时,为了获得准确的分析数据,便需要利用非参数检验进行数据统计 分析。非参数的检验内容非常丰富,包括二项式检验、卡方检验、游程检验等多种检验 方法。在本章中,将详细介绍在 SPSS 软件中运用非参数检验方法进行数据分析的基础 知识与操作方法。 本章学习目标: 单样本非参数检验 二项式检验 卡方检验 K-S 检验 游程检验 独立样本非参数检验 相关样本非参数检验
选中
96 96
SPSS 数据统计与分析标准教程
图 5-1
设置目标类型
①选中
5.2.2
设置检验字段
图 5-2
②添加
在【单样本非参数检验】对话框中, 激活【字段】选项卡,设置用于检验分析
设置检验字段
的字段,如图 5-2 所示。 在【字段】选项卡中,主要包括下列选项: “ 使用预定义角色 该选项表示使用现有的字段信息, 在检验过程中需要最少一个 检验字段。另外,所有预定义角色为“输入” 、 “目标”或“两者”的字段将用作 检验字段。 “ 使用定制字段分配 该选项表示可以覆盖字段角色。 选中该选项后, 需要指定 “检 验字段” 。 “ 字段 用于显示不参与检验的字段。当选中【使用定义字段分配】选项后,数据 文件中的所有变量将都显示在该列表框中。单击【排序】下拉按钮,可以按照字
95 95
5.2.1
设置检验目标
在使用单样本非参数检验之前,用户还需要先设置检验的目标,以完成不同数据类 型与不同分析结果的分析目的。 在 SPSS 软件中,执行【分析】|【非参数检验】|【单样本】命令,弹出【单样本非 参数检验】对话框。在【目标】选项卡中,设置单样本非参数检验的目标类型,如图 5-1 所示。 在【目标】选项卡中,主要为用户提 供了下列 3 种目标类型: “ 自动比较观察数据和假设数据 该目标表示对仅具有两个类别的 分类字段应用二项式检验,对所有 其他分类字段应用卡方检验,对连 续 字 段 应 用 Kolmogorov-Smirnov 检验。 “ 检验随机序列 该目标表示使用 游程检验来检验观察到的随机数 据值序列。 “ 自定义分析 选中该选项可以手 动修改“设置”选项卡上的检验设 置。另外,当在“设置”选项卡上 更改了与当前选定目标不一致的 选项时,系统将会自动选择该 设置。

SPSS学习笔记之——两独立样本的非参数检验

SPSS学习笔记之——两独立样本的非参数检验

一、概述
Mann-Whitney U 检验是用得最广泛的两独立样本秩和检验方法。

简单的说,该检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t 检验的要求时,可以使用该检验。

其假设基础是:若两个样本有差异,则他们的中心位置将不同。

二、问题
为了研究某项犯罪的季节性差异,警察记录了10年来春季和夏季的犯罪数量,请问该项犯罪在春季和夏季有无差异。

下面使用Mann-Whitney U检验进行分析。

SPSS版本为20。

三、统计操作
SPSS变量视图:
SPSS数据视图:
进入菜单如下图:
点击进入如下的界面,“目标”选项卡不需要手动设置
进入“字段”选项卡,将“报警数量”选入“检验字段”框,将“季节”选入“组”框中。

再进入“设置”选项卡,选中“自定义检验”单选按钮,选择“Mann-Whitney U(二样本)”检验。

点击“运行”即可。

四、结果解读
这是输出的主要结果,零假设是“报警数量的分布在季节类别上相同”,其P=0.009<0.05,故拒绝原假设,认为报警数量在季节上有统计学差异。

双击该表格,可以得到更多的信息,不再叙述。

SPSS 非参数检验

SPSS 非参数检验

Step07单击【OK】按钮,结束操作,SPSS软件自动输
出结果。
实例图文分析:人员结构的调动
• 1. 实例内容 某公司经营多年,形成了一套成熟的企业文化和管理体系, 例如根据多年的运营经验,经理层、监察员、办事员三种职务 类别人员比例大约在15:5:80为宜,这样运行效率最高。目 前公司进行人事调整,公司人员结构发生变动,有员工担心是 否人事调整已经导致职务类型比例的失调。请利用数据文件61.sav来解决该问题。 三种职务的期望构成比为15%、5%和80%。而目前样本中 观察到的三种职务的人数比为84:27:363,构成比分别是17. 7%、5.7%和76.6%,和理论值有差异。那么这种差异是由随 机误差造成的,还是真的构成比和以前有所变化?该问题就可 以用χ2检验来实现。相应的假设检验如下。 H0:目前三个职业的总体构成比仍然是15%、5%和80%。 H1:目前三个职业的总体构成比不再是15%、5%和80% 。
实例结果及分析
(1)频数表
SPSS的结果报告中列出了期望频数和实际频数。 显然残差值越小,说明实际频数与期望频数越接近。
Observed N-Expected N
Observed N Clerical 363 27 84 474 Expected N 379.2 23.7 71.1 Residual -16.2 3.3 12.9
0.63 0.95 0.95 0.95 0.91 没有可比较的基 础
1 SPSS 在卡方检验中的应用
1.使用目的 卡方检验(Chi-Squar Test)也称为卡方拟合优度检验,是K.Pearso n给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某 种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分 布的样本的问题。 2.基本原理 H 0样本X来自的总体分布服从期 进行卡方检验时,首先提出零假设 : 望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望 c 2,它描述了观察值和理论值之间的 频数之间的差异来构造检验统计量 偏离程度。 3.软件使用方法 SPSS会自动计算出χ2统计量及对应的相伴概率P值。

第5讲SPSS非参数检验

第5讲SPSS非参数检验
二、操作
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值

7、spss第七章 非参数检验

7、spss第七章 非参数检验

左表是频数分布情况表,第 二列为实际观察值出现次数, 第三列为理论上每天应出现 的次数,第四列为残差 左表是计算的卡方统计量 及对应的相伴概率值,由 于Sig.=0.014<0.05。说明 应拒绝每个工作日出现的 次品率相等的原假设。即 次品数出现是不均匀的。 10
工作日 Chi-Square df Asymp. Sig. 12.556a 4 .014
双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无 显著性差异。
16
西南财经大学出版社
SPSS16.0与统计数据分析
主要内容
7.0 非参数检验概述 7.1单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两相关样本的非参数检验 7.5 多相关样本的非参数检验
17
西南财经大学出版社
SPSS16.0与统计数据分析
7.2 两独立样本的非参数检验
9
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.1卡方检验 第5步 主要结果及分析
1 2 3 4 5 Total Observed N 25 15 8 16 26 90 Expected N 18.0 18.0 18.0 18.0 18.0 Residual 7.0 -3.0 -10.0 -2.0 8.0
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 18.0.
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.2 二项分布检验

SPSS操作:多个相关样本的非参数检验(CochransQ检验)

SPSS操作:多个相关样本的非参数检验(CochransQ检验)

SPSS操作:多个相关样本的⾮参数检验(CochransQ检验)点击Settings→Customize tests,勾选Cochran's Q (k samples)。

点击Define Success,在Cochran's Q: Define Success对话框中,点击Combine values into success category,在Success框中填⼊1(这⾥是“成功”对应的编码,本例中即为通过体能测试,“Passed”对应的是1,所以这⾥填“1”)。

点击OK→Run,输出结果。

3.4 不符合假设4的“精确”Cochran's Q检验当不符合假设4时,需要使⽤“精确”Cochran's Q检验。

在主界⾯点击Analyze→Nonparametric Tests→Legacy Dialogs→K Related Samples,出现Tests for Several Related Samples对话框。

将变量initial_fitness_test、month3_fitness_test和final_fitness_test选⼊Test Variables框中。

在Test Type 下⽅去掉Friedman,然后勾选Cochran's Q。

(如果数据符合假设4,则此时点击OK,结果与3.3部分的操作结果⼀致)点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。

3.5 “精确”Cochran's Q检验后的两两⽐较对于符合假设4的Cochran's Q检验(3.3部分),事后的两两⽐较将在结果解释部分展⽰(4.2部分)。

对于不符合假设4的“精确”Cochran's Q检验(3.4部分)事后的两两⽐较,可采⽤经Bonferroni法校正的多重McNemar检验。

在主界⾯点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Related Samples。

第6章 SPSS的非参数检验

第6章 SPSS的非参数检验

6.1.2 非参数检验的特点
和参数方法相比,非参数检验方法的优势如下: (1)稳健性。因为对总体分布的约束条件大大放宽, 不至于因为对统计中的假设过分理想化而无法切合实际 情况,从而对个别偏离较大的数据不至于太敏感。 (2)对数据的测量尺度无约束,对数据的要求也不 严格,什么数据类型都可以做。 (3)适用于小样本、无分布样本、数据污染样本、 混杂样本等。
6.3 SPSS 在二项分布检验中的应用
6.3.1 二项分布检验的基本原理 1.方法概述 事件要服从二项分布,则应该具备下列基本的条件。 (1)各观察单位只能具有相互对立的一种结果。 (2)已知发生某一结果(阳性)的概率为π,其对立结果 的概率为1-π。 (3)n次试验在相同条件下进行,且各个观察单位的观察 结果相互独立,即每个观察单位的观察结果不会影响 到其他观察单位的结果。
• Step02:选择检验变量 在左侧的候选变量列表框中选择“time”变量作为检验 变量,将其添加至【Test Variable List(检验变量列表)】 列表框中。
• Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中点选 【Cut point(割点)】,以指定断点。接着在其文本框中输入 “960”,表示以它作为分界点将原始样本分为两组。 • Step04:指定检验概率值 在【Test Proportion(检验比例)】文本框中输入指定概率值 “0.05”。
6.2.2 卡方检验的SPSS操作详解
Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】 →【Nonparametric Tests (非参数检验)】→【Legacy Dialogs(旧对话框)】→【Chi-Square (卡方)】命令,弹出【Chi-Square Test(卡方检验)】对话框。

利用SPSS进行非参数检验

利用SPSS进行非参数检验

利用SPSS进行非参数检验(卡方检验)
一、启动SPSS
二、建立数据文件
1、定义两个数值型变量:组限L和频数f(先确定变量名称,
变量类型的默认值为数值型)。

2、输入组限L和频数f的实际数据。

3、用Data菜单中的Weight cases将f变成Frequency(频率)。

三、单击Analyze s菜单,选择Nonparametric Test中的
Chi-Square选项,打开相应的对话框。

选择要进行检验的变量L。

四、根据需要选择相应的选择项:
1、在Expected Range中选择Get from data或Use specified
range,后者需指定Lower(下限)和Upper(上限)。

2、在Expected Values指定期望值:如检验总体是否服从均匀分
布,只需选定All categories equal项;如检验总体是否服从某
个给定的分布,需选定Values,并键入相应各组所对应的由
给定分布计算而得的期望值。

五、选定所需的各项后,单击Ok即可得所需结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实际上,方法近年来发展极

第十三章 非参数统计分析方法―― Nonparametric Tests菜单详解

非参数检验最大的缺点就是检验效能较低,实际上根据国外的一项研究, 有些方法的检验效能大约在参数检验方法的95%左右,并非低得不能接受。 ――张文彤

平时我们使用的统计推断方法大多为参数统计方法,他们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本章要讨论的是另一大类统计分析方法,它的着眼点不是总体参数,而是总体的分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在总体的分布位置/形状是否相同。由于这一类方法并不涉及总体参数,因而被称为非参数方法。

非参数方法这个名称的含义指的是他的推断过程和结论均与原总体参数无关,并非说他在推断中什么分布参数都不利用,实际上,最常用的秩和检验就是基于秩次的分布特征推导出来的,即可能会利用到秩分布的参数。 SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,他们可以被分为两大类: 1.分布类型检验方法:亦称拟合优度检验方法,即检验样本所在总体是否服从已知的理论分布。具体包括检验二项/多项分类变量分布的Chi-Square过程;检验二项分类变量分布的Binomial过程;检验样本序列随机性的Runs过程;以及检验样本是否服从各种常用分布的1-Sample K-S过程。 2.分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同,我们平时说的最多的非参数检验方法实际上指的就是这一类方法。具体包括用于成组资料分布位置检验的2 Independent Samples与K Independent Samples过程;以及用于配伍资料分布位置检验的2 Related Samples与K Related Samples过程。

除以上两类现成的方法外,本章还将专门向大家介绍基于非参数检验原理的秩变换分析方法,它可以作为现有方法的补充和有效扩展,大家会发现这种方法将在实际工作中非常有用。

- 242 - Weight Cases by: Frequency Variable框:num 频数变量为num OK Analyze!Nonparametric Tests!Chi-Square Test Variable List框:type 要检验的变量为type Exact: Exact:Continue 要求计算确切概率 OK

§13.1 分布类型检验方法 这一大类方法的原理都是计算出实际分布和理论分布间的差异大小,然后根据某种统计量来求出P值。实际上,这些方法应用的非常广泛,比如说卡方检验就是属于这一类方法的,而它已被广泛应用于分类资料的统计推断中。

13.1.1 Chi-Square过程 许多朋友都以为这里进行的就是常用的行×列表卡方检验,这是一个不大不小的误解。行×列表卡方检验的确是属于卡方检验系列的一种,但它的分析目的是比较两个分类资料样本所在的总体分布是否相同,在SPSS中应当使用Crosstabs过程来拟合。此处的Chi-Square过程其分析目的是检验分类数据样本所在总体分布(各类别所占比例)是否与已知总体分布相同,是一个单样本检验。 具体在做法上,卡方检验是先按照已知总体的构成比分布计算出样本中各类别的期望频数,然后求出观测频数和期望频数的差值,最后计算出卡方统计量,利用卡方分布求出P值,以得出检验结论。大家只要翻翻统计书上四格表卡方检验的原理,就会明白了。 例13.1 某公司准备推出一个新品牌的矿泉水,现已万事俱备,就是在新产品的名称上几位董事意见尚未统一。董事会屡议不决之后,最终决定进行抽样调查。在受访的200人中,52人更喜欢名称A,61人更喜欢名称B,87人更喜欢名称C,请问ABC三种名称受欢迎的程度有无差异?

图14.1 数据示意 解:董事说话自然是要听的,无论他们出于什么原因选择某种名称,如果要说服他们,就必须拿出有力的证据来才行,统计结果就是最好的证据。如果以统计学的角度来看待该问题,实际上就是检验三种品牌的构成比是否均等于已知总体的33%。这可以用Chi-Square过程来完成。本例数据录入如右图所示,操作如下:

分析中用到的界面如下: 【主对话框】 1.Test Variable List框:指定需要进行检验的变量,可以同时指定多个,系统会分别进行分析。

- 243 - 图13.3 Exact子对话框 图13.4 Options子对话框

2.Expected Range单选框组:设定需要检验的变量的取值范围,在此范围之外的取值将不进入分析。默认为使用数据文件中的最大和最小值作为检验范围,可使用Use specified range框组自行指定。 3.Expected Values单选框组:指定已知总体的各分类构成比,默认为各类别构成比相等,可以使用下方的Values自行定义,注意定义时有几个类别,就应输入几个数值,并且数值的排列次序和数据文件中记录的排列次序应当相同,因为它们之间存在着一一对应的关系。

图13.2 主对话框 【Exact子对话框】 用于设定是否进行确切概率的计算,以及具体的计算方法。共有只计算近似概率、采用蒙特卡罗模拟方法计算确切概率、直接计算确切概率三种选择,具体情况我们已经在卡方检验一章中学习过了,这里不再重复。

【Options子对话框】 1.Statistics复选框组:一些可供输出的统计量。 " Descriptive:常用描述统计量,包括均数、最小值、最大值、标准差。 " Quartiles:输出四分位数。

- 244 - 第十三章 非参数统计分析方法――Nonparametric Tests菜单详解 2.Missing Values单选框组:选择对缺失值的处理方式,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases test-by-test),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。 分析结果如下: NPar Tests Chi-Square Test Frequencies

Test Statistics

9.9102.007.007.000Chi-SquareadfAsymp. Sig.Exact Sig.Point Probability

TYPE

0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 66.7.

a.

TYPE5266.7-14.76166.7-5.78766.720.32001.002.003.00Total

Observed NExpected NResidual

上面的两个表格即为分析结果:Type表显示的是三个类别的观察频数、期望频数和残差。Test Statistics表为最终的检验结果,给出了卡方值、近似的P值和确切P值。结果显示确切P值为0.007,因此结论为拒绝无效假设,认为三种名称受欢迎的程度不同。表中最后一行为点概率值,即在总体中抽得当前样本的概率,本例中没有实际意义。 上面的结论显示的是三者总体有差异,如果要进行两两比较,就需要调整α水准,此处不再详述,最终的分析结论应当为三者两两有差异。这个结果拿到董事会上去,大家应当不会有什么意见了吧。

13.1.2 Binomial过程 匆匆吃完晚饭,小王心神不宁的向晚自习的教室走去,那个女孩今天还会坐在我旁边吗? 不知从什么时候起,小王开始注意起教室中一个上自习的女孩,她长的文静可人,穿着素雅,浑身洋溢着特有的青春魅力,不可否认,小王在心底里已经喜欢上了她。但生性腼腆的他不敢向对方表白,只是每天默默的欣赏着那种醉人的美丽。 那个女孩一般都只坐最后一排左侧或右侧的两个角落中的位置,小王则习惯坐在倒数第二排的右侧,不知那女孩感觉到他了没有。上周忽然就消失了几天,等重新回来后一直都坐在小王的后面,已经连续六天了。小王真的希望这是一种暗示,可他又害怕是一种误解,害怕自己的行为导致连仅有的希望也不复存在。 其实小王并不知道,呆板乏味的统计方法在这里可以助他一臂之力:那个女孩以前总是随意坐两个位置中的一个,即概率各为0.5。现在连续6天都坐在同一个位置,相当于取得了一个样本量为6的样本,只要利用二项分布的原理计算一下,就可以知道现在她选

- 245 - 统计之星示例文档:第三部份 基础统计分析方法 择位置的概率是否发生了改变,从而可以做出是否出击的正确判断,以更大的概率得到秋天的菠菜,而不是否决的媚眼。

说句老实话,在这个问题上统计方法真正能起的作用其实不大,相反另一条准则更加有效:撑死胆大的,饿死胆小的。 好了,罗曼蒂克够了,现在我们来用一个不那么罗曼蒂克的例子来看看Binomial过程的操作过程是怎样的。

图14.5 数据格式 例13.2 根据以往经验,新生儿染色体异常率一般为1%,现某医院观察了当地共400名新生儿,只发现一例染色体异常,该地新生儿染色体异常率是否低于一般? 解:染色体是否异常可以被认为是服从二项分布,由于问题问的是“是否低于一般”,需要求得的是单侧概率,这正是Binomial过程的拿手好戏。本例数据录入极为简单,如右图所示,注意ill的取值顺序,Binomial过程计算的是第一项的概率,如果两条记录顺序颠倒,则相应设置的总体率也应改为0.99。本例操作如下: Data!Weight Cases Weight Cases by: Frequency Variable框:num 频数变量为num OK Analyze!Nonparametric Tests!Binomial Test Variable List框:ill 要检验的变量为ill Test Proportion框:0.01 已知总体概率为0.01 Exact: Exact:Continue 要求计算确切概率 OK 分析中用到的界面如下:

图13.6 主对话框 【主对话框】 1.Test Variable List框:指定需要进行检验的变量,可以同时指定多个,系统会分别进行分析。

- 246 -

相关文档
最新文档