正态性检验和正态转换的方法以及在SPSS中的实现

正态性检验和正态转换的方法以及在SPSS中的实现
正态性检验和正态转换的方法以及在SPSS中的实现

正态性检验的方法以及在SPSS中的实现

本文将汇总正态检验常用的方法以及各种方法的适用条件和在SPSS中的实现,此外,还将提及将非正态分布转化为正态分布的方法,以及选择转化方法的依据。

一、正态检验方法

1.1观察分布,预先判断

先做直方图看看是否大概符合正态分布,Graph-->legacy dialogs-->histogram-->选入变量--》OK.如果距离正态分布的样子太远了,就不要做以下工作了。

1.2计算偏度(Skewness)和峰度(Kurtosis) ,当它们接近0时,为正态

这是一种比较直观的方法,用于初步判断。

1)在SPSS中通用菜单栏Analyze—Reports—Case Summaries分析过程Statistics的选择项中计算

偏度(Skewness)和峰度(Kurtosis) ;

2)通过Analyze—Reports—Report Summaies in Row s分析过程Report 的Summary 的选择项

计算偏度、峰度;或者通过Reprts—Report Summaries in Columns 分析过程的Summary 选择项计算偏度和峰度;

3)通过Analyze—Descriptive Statistics—Frequencies分析过程的Statistics的选择项Distribution

中计算偏度、峰度;

4)通过Analyze—Descriptive Statist ics—Descr iptives分析过程的Opt ions的选择项Distribution

中计算偏度、峰度;

5)通过Analyze—Compare means—means 分析过程的Options 的选择项Statistics 中选择统计

量Skewness (偏度)、Kurto sis (峰度)来对数据资料进行正态性检验。

附偏度和峰度统计意义:

偏度主要是研究分布形状是否对称:

约等于0 则可以认为分布是对称的;>0 则可以认为右偏态,此时在均值右边的数据更为分散;<0 则可以认为左偏态,此时在均值左边的数据更为分散。

峰度它是以正态分布为标准,比较两侧极端数据分布情况的指标:

等于0说明该变量分布的峰态正合适,不胖也不瘦(正态分布),>0 此说明该变量的分布峰态太陡峭(瘦高个);反之,如果Kurtosis为负值,该变量的分布峰态太平缓(矮胖子)。

1.3用正态概率图的P-P 或Q-Q 法对数据资料进行正态性检验。

P-P图和QQ图可以判断的分布很多,对于正态分布的检验也不仅限于标准正态分布。P-P 图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地检测样本数据是否符合某一概率分布。如果被检验的数据符合所指定的分布,则代表样本数据的点应当基

本在对角线上。

Q-Q图的结果与P-P图非常相似,只是P-P图是用分布的累计比,而Q-Q图用的是分布的分位数来做检验。和P-P图一样,如果数据为正态分布,则在Q-Q正态分布图中,数据点应基本在图中的对角线上。

1.4 用非参数分析方法(Nonparametr ic Tests)对数据资料进行正态性检验

正态检验属于非参数检验(分布类型未知的检验),原假设是“样本来自的总体与正态分布无显著性差异,即样本符合正态分布”。正态分布的非参数检验具体方法有两种,依据样本大小选择合适的检验:大样本(50个样本以上)用K-S检验,小样本(50个样本以下)用Shapiro-Wilk 检验。

在SPSS中的实现有两处,一处是使用Descriptive Statistics->Explore(Shapiro-Wilk检验只在这里),点Plot按钮,选中Normal plot with test这样就可以对选择的变量进行正态性检验了,读取结果时,sig.>0.05(0.01,0.1)时说明显著,即符合正态分布;一种是使用Non-parametic Test->1 Sample K-S Test。

注意以上两处进行K-S检验的区别:在‘Explore’里出现的Kolmogorov-Smirnov检验,它的右上角有一个a的注释号,下面的介绍表明它是经过Lilliefors改进或纠正的结果,它将Kolmogorov-Smirnov检验改进用于一般的正态性检验;而在‘非参数检验’里出现的Kolmogorov-Smirnov检验,是没有经过纠正或改进的,该正态性检验只能做标准正态检验。由以上区别的本质原因是:Kolmogorov-Smirnov检验是通过样本的经验分布函数与给定分布函数的比较,推断该样本是否来自给定分布函数的总体。由于需要给定分布函数,所以当用于正态性检验时只能做标准正态检验。

下面说明在非参数检验中进行K-S检验的步骤:

1)步骤1:在spss中打开数据,怎么打开就不介绍了,打开数据以后,在菜单栏上执行:analyze--

非参检验--legacy disalogs--1 sample k-s。

2)步骤2:将你要检验正态的变量放到test variables list,勾选下面的normal,这是标准正态分

布的意思。

3)步骤3:点击exact,进入选择检验方法的对话框,

4)步骤4:这里有三个选项可以选择,第一个asymptotic的意思是基于渐进分布的显著性水平

的检验指标,适于大样本,如果样本过小或者分布不好,就会影响检验的效力;monte carlo 适用于精确显著性水平的无偏估计,如果样本过大,数据处理过程太长,就应该使用这个选项;exact精确计算概率值,可以设定数据处理的时间,如果数据处理时间超过了你设定时间30分钟,就应该使用monte carlo。

5)回到k-s检验对话框,点击options按钮,设置输出的参数

6)步骤6:勾选descriptive和quartiles,这两个的意思分别是输出描述性统计和四分位数,点

击continue按钮。

7)步骤7:我们可以看到对数据的检验结果,最后的显著性检验值为0.000,小于显著性水平

0.05,所以不能接受原假设,即不符合正态分布。

二、正态转换方法

相关主题
相关文档
最新文档