方差分析与非参数检验

合集下载

多样本比较方差分析与非参数方法的公式整理

多样本比较方差分析与非参数方法的公式整理方差分析是一种常用的统计方法，用于比较多个样本之间的平均值差异。

在实际应用中，我们常常需要比较多个样本的方差，以确定它们之间是否存在显著的差异。

本文将介绍多样本比较方差分析的公式整理，并对非参数方法进行概述。

一、多样本比较方差分析多样本比较方差分析是一种常用的统计方法，用于比较多个样本的方差是否存在显著差异。

通常情况下，我们希望通过方差分析来确定样本所属的总体是否有明显的差异。

方差分析的基本假设是各组样本都来自于具有相同方差的总体，也就是说，样本之间的差异只是由于随机误差引起的。

我们可以使用方差分析来检验各组均值之间是否存在显著差异，进而判断它们所属的总体是否有明显不同。

多样本比较方差分析的公式如下所示：H0：各组均值之间没有显著差异H1：各组均值之间存在显著差异计算公式为：F = (SSB / (m-1)) / (SSE / (n-m))其中，SSB表示因组别引起的平方和，m表示组别的个数；SSE表示由于误差引起的平方和，n表示总样本数。

二、非参数方法除了上述介绍的多样本比较方差分析，还存在一种非参数方法，用于比较多个样本的位置参数差异。

与方差分析不同，非参数方法对于数据的分布不作要求，更加灵活。

下面列举一些常用的非参数方法：1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数方法。

它的基本思想是将两个样本的所有观测值进行合并，然后对合并后的观测值进行排序，并计算两个样本的秩和。

通过比较秩和的大小，可以得出两个样本的位置差异是否显著。

2. Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本的非参数方法。

它的基本思想是将所有样本的观测值进行合并，然后对合并后的观测值进行排序，并计算各组的秩和。

通过比较秩和的大小，可以得出各组样本的位置差异是否显著。

3. Friedman检验Friedman检验是一种用于比较多个相关样本的非参数方法。

16种统计分析方法

16种常用的数据分析方法汇总2015-11-10 分类：数据分析评论(0)经常会有朋友问到一个朋友，数据分析常用的分析方法有哪些，我需要学习哪个等等之类的问题，今天数据分析精选给大家整理了十六种常用的数据分析方法，供大家参考学习。

一、描述统计描述性统计是指运用制表和分类，图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。

1、缺失值填充：常用方法：剔除法、均值法、最小邻居法、比率回归法、决策树法。

2、正态性检验：很多统计方法都要求数值服从或近似服从正态分布，所以之前需要进行正态性检验。

常用方法：非参数检验的K-量检验、P-P图、Q-Q图、W 检验、动差法。

二、假设检验1、参数检验参数检验是在已知总体分布的条件下（一股要求总体服从正态分布）对一些主要的参数(如均值、百分数、方差、相关系数等）进行的检验。

1）U验使用条件：当样本含量n较大时，样本值符合正态分布2）T检验使用条件：当样本含量n较小时，样本值符合正态分布A 单样本t检验：推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别；B 配对样本t检验：当总体均数未知时，且两个样本可以配对，同对中的两者在可能会影响处理效果的各种条件方面扱为相似；C 两独立样本t检验：无法找到在各方面极为相似的两样本作配对比较时使用。

2、非参数检验非参数检验则不考虑总体分布是否已知，常常也不是针对总体参数，而是针对总体的某些一股性假设（如总体分布的位罝是否相同，总体分布是否正态）进行检验。

适用情况：顺序类型的数据资料，这类数据的分布形态一般是未知的。

A 虽然是连续数据，但总体分布形态未知或者非正态；B 体分布虽然正态，数据也是连续类型，但样本容量极小，如10以下；主要方法包括：卡方检验、秩和检验、二项检验、游程检验、K-量检验等。

三、信度分析检査测量的可信度，例如调查问卷的真实性。

分类：1、外在信度：不同时间测量时量表的一致性程度，常用方法重测信度2、内在信度；每个量表是否测量到单一的概念，同时组成两表的内在体项一致性如何，常用方法分半信度。

ancova(协方差分析)非参数和随机方法

第7章ANCOV A（协方差分析）：非参数和随机方法Peter S. PetraitisSteven J. BeaupreArthur E. Dunham7.1生态学问题生态学参数往往不能满足参数假定的要求。

当这种情况发生时，随机方法是更常用的参数方法，比如协方差分析（ANCOV A）和回归分析的一个很好的替代选择。

使用随机方法很简单，并且由于标准参数ANCOV A为生态学家所熟知，我们用它来激发对非参数和随机方法的优点和存在问题的讨论。

我们通过对检验随机和非参数方法分析性别和生境影响响尾蛇种群的个体大小来进行讨论，年龄在这里被作为一个混淆（confounding）因素考虑。

个体大小的变异常见于许多动物中（即, 无脊椎动物: Paine 1976; Lynch1977; Sebens 1982; Holomuzki 1989; 两栖动物: Nevo 1973; Berven1982；Bruce和Hairson 1990; 有鳞的爬行动物：Tinkle 1972；Dunham 1982; Schwaner 1985; Dunham等1989; 哺乳动物：Boyce 1978；Melton 1982; Ralls和Harvey 1985）, 并且由于其与许多繁殖特征, 比如成熟年龄，子代个体的数量和大小，和亲代对子代的投入, 有协变关系，从而引起进化生态学家的极大兴趣，（Stearns 1992; Roff 180, 1992）。

对个体大小变异的解释包括资源的季节性，质量和可利用性（如，Case 1978; Palmer 1984; Schwaner和Sarre 1988）, 基于个体大小的捕食性（Paine 1976）, 种群密度（Sigurjonsdottir 1984）, 特性替代（Huey和Pianka 1974; Huey 等1974）和生长速率的渐变变异（Roff 1980）。

然而个体大小的地理变异可能常由于个体大小决定的生长速率和种群年龄结构的相互作用所致。

参数检验与非参数检验的区别与应用

参数检验与非参数检验的区别与应用统计学中的参数检验和非参数检验是两种常用的假设检验方法。

本文将详细介绍参数检验和非参数检验的区别以及它们在实际应用中的具体场景。

一、参数检验参数检验是建立在对总体分布形态有所假定的基础上，通过对样本数据进行统计推断，来对总体参数进行假设检验。

它通常要求总体分布服从特定的概率分布，如正态分布。

参数检验的常见方法有：1. 单样本t检验：用于检验样本均值是否与已知总体均值有显著差异。

2. 独立样本t检验：用于比较两个独立样本的均值是否存在显著差异。

3. 配对样本t检验：用于比较同一组样本在不同条件下的均值是否存在显著差异。

4. 方差分析：用于比较多个样本组之间的均值是否存在显著差异。

参数检验的优势在于其具有较高的效率和灵敏度，适用于对总体分布形态有所了解的情况。

但它也有一些限制，如对分布形态的假设可能不成立，以及对样本量和数据类型的要求较高。

二、非参数检验非参数检验是对总体分布形态没有具体假设的情况下，通过对样本数据进行统计推断，来对总体参数进行假设检验。

非参数检验不少于参数检验的分析方法，常见的包括：1. Wilcoxon符号秩检验：用于比较两个相关样本的差异是否存在显著差异。

2. Mann-Whitney U检验：用于比较两个独立样本的中位数是否存在显著差异。

3. Kruskal-Wallis检验：用于比较多个样本组的中位数是否存在显著差异。

非参数检验的优势在于对总体分布形态没有具体要求，适用于对总体分布了解较少或不了解的情况。

它相对于参数检验来说更具广泛的适用性，但由于其推断效果较差，需要更大的样本量才能达到相同的检验效果。

三、参数检验与非参数检验的区别1. 假设要求：参数检验对总体分布形态有假设要求，如正态分布假设，而非参数检验对总体分布形态没有具体要求。

2. 统计量选择：参数检验基于已知概率分布，可以选择特定的统计量如t值、F值等；而非参数检验使用秩次统计量，如秩和、秩和秩二样序差等。

方差分析与非参数检验

方差分析与非参数检验方差分析和非参数检验是两种常见的统计分析方法，用于比较不同组之间的差异或关联。

本文将详细介绍方差分析和非参数检验的原理、应用场景以及各自的优缺点。

方差分析（Analysis of Variance，ANOVA）是一种用于比较多个组之间均值差异的统计方法。

它基于总体均值与组内个体的个体值之间的差异，将总方差拆分为组内方差和组间方差，通过比较组间与组内方差的大小来判断组间均值是否显著不同。

方差分析一般分为单因素方差分析和多因素方差分析两种类型。

单因素方差分析适用于只有一个自变量（即因素）的情况，用于比较不同水平的因素是否对因变量（即观测值）有显著影响。

多因素方差分析适用于有多个自变量（即因素）的情况，用于比较各个因素及其交互作用对因变量的影响。

方差分析的优点主要有以下几点：1.可以同时比较多个组之间的差异，提供了一种全面且有效的统计方法。

2.可以通过比较组间与组内方差来判断差异是否显著，更加客观。

3.可以用于不同水平的因素对因变量的影响程度排名，帮助进一步探究因素的影响机制。

然而，方差分析也存在一些限制：1.方差分析对数据满足正态分布和方差齐性的要求比较严格，如果数据不满足这些要求，结果可能不准确。

2.方差分析只能对均值差异进行比较，不能揭示具体的分布差异。

3.方差分析本身不能进行推断和预测，只能判断差异是否显著。

非参数检验（Nonparametric Test）是一种不依赖于总体分布的统计方法，适用于数据不满足正态分布或方差齐性的情况。

与方差分析不同，非参数检验基于样本的秩次或次序，通过比较统计量来判断组间差异是否显著。

非参数检验包括了多种方法，如Wilcoxon秩和检验、Mann-WhitneyU检验、Kruskal-Wallis H检验等。

它们在样本较小或数据不满足正态分布的情况下具有较高的灵活性和鲁棒性。

非参数检验的优点有以下几点：1.不依赖于总体分布的参数，对数据的要求较低，尤其适用于数据不满足正态分布的情况。

临床研究中常用统计分析方法及选择

临床研究中常用统计分析方法及选择临床研究是评估医学干预措施效果的重要方法，而统计分析则是临床研究中不可或缺的一环。

有效的统计分析方法可以帮助研究者解读数据，得出可靠的结论，从而为临床实践提供科学依据。

本文将介绍临床研究中常用的统计分析方法及选择。

1. 描述性统计分析描述性统计分析是对研究数据进行总结和描述的方法，其主要手段是计算各种统计量，如均值、中位数、标准差等。

通过描述性统计分析，我们可以直观地了解数据的集中趋势、离散程度等特征。

在临床研究中，描述性统计分析通常是作为开始的步骤，用于了解研究对象的基本情况。

2. 推论统计分析推论统计分析是根据样本数据得出总体参数估计和假设检验的统计方法。

常用的推论统计分析方法包括参数检验和非参数检验。

参数检验是基于总体参数的假设进行的，其目的是判断样本数据是否支持或反驳某一总体参数假设。

参数检验中最常用的方法是t检验和方差分析。

t检验适用于比较两组均值是否存在差异，方差分析则用于比较多个组的均值差异。

在临床研究中，参数检验常用于分析治疗组与对照组之间的差异。

非参数检验是在不对总体参数假设进行前提的情况下进行的统计方法，其目的是根据样本数据推断总体的分布特征。

在非参数检验中，最常用的方法有Wilcoxon秩和检验、Mann-Whitney U检验和Kruskal-Wallis检验。

非参数检验通常适用于数据不满足正态分布或样本量较小的情况。

3. 生存分析生存分析是研究事件发生时间的统计方法，其主要应用于临床研究中评估治疗效果、预测疾病进展等方面。

生存分析的核心是生存函数和生存曲线的估计，常用的生存分析方法包括Kaplan-Meier法和Cox 比例风险模型。

Kaplan-Meier法是一种用于估计生存概率的非参数方法，适用于单个事件发生时间的研究。

该方法可以根据观察到的数据计算出生存曲线，了解不同因素对生存时间的影响。

Cox比例风险模型是一种常见的生存分析方法，可用于评估多个危险因素对生存时间的影响。

两组有效率对比的统计学方法

两组有效率对比的统计学方法有效率对比是指在两个或多个组之间比较效率的统计学方法。

这些方法帮助我们确定哪个组更加有效率，并提供了可靠的证据支持我们的结论。

以下是两组有效率对比的几种常用的统计学方法。

1.t检验：t检验是最常用的有效率对比方法之一、它用于比较两组均值是否有显著差异。

首先，我们计算出每组的均值和标准差。

然后，我们使用t检验来计算t值和P值。

如果P值小于设定的显著水平（通常为0.05），我们可以得出结论，说明两组之间存在显著差异。

2.ANOVA：ANOVA（方差分析）适用于比较多个组之间的有效率。

它可以帮助我们确定哪个组之间存在差异，并计算出这些差异的统计显著性水平。

ANOVA的基本思想是将总体方差分解为组内方差和组间方差。

我们可以根据组间方差与组内方差之间的比较来确定差异是否显著。

3. 非参数检验：非参数检验方法适用于数据不满足正态分布假设的情况。

Mann-Whitney U检验是最常见的非参数检验方法之一、它用于比较两组中位数的差异。

对于多个组的比较，Kruskal-Wallis检验可以使用。

4. 效应量：除了进行假设检验以确定显著差异外，我们还可以计算效应量来衡量两组之间的差异大小。

效应量可以提供关于实际差异的信息，而不仅仅是统计学差异的存在与否。

常见的效应量指标包括Cohen's d和Eta-squared。

Cohen's d衡量两组均值之间的标准化差异，而Eta-squared衡量方差解释程度。

5. 多重比较校正：在比较多个组时，我们需要考虑多重比较的问题，以减少犯错误的概率。

Bonferroni校正是一种常见的多重比较校正方法，它通过将显著性水平除以组数来调整P值的阈值。

其他常见的多重校正方法包括Holm校正和Benjamini-Hochberg校正。

综上所述，以上是两组有效率对比的几种常用的统计学方法。

这些方法可以帮助我们确定哪个组更加有效率，并提供了可靠的证据支持我们的结论。

SPSS的参数检验和非参数检验

SPSS的参数检验和非参数检验SPSS是一种非常常用的统计分析软件，可以用于参数检验和非参数检验。

参数检验是假设检验的一种方法，用于判断统计样本是否代表总体。

而非参数检验则是用于检验数据是否满足一些分布假设，或判断两个或多个群体是否具有差异。

参数检验主要有t检验、方差分析和回归分析等。

其中，t检验用于比较两个样本均值是否有显著差异，包括独立样本t检验和相关样本t检验。

方差分析用于比较三个或更多样本均值是否有显著差异，可以进行单因素方差分析或多因素方差分析。

回归分析用于建立预测模型，可以通过线性回归或多项式回归进行。

非参数检验通常适用于数据不满足正态分布或方差齐性的情况，如Wilcoxon符号秩检验、Kruskal-Wallis H检验、Mann-Whitney U检验等。

Wilcoxon符号秩检验用于比较两个配对样本的差异是否有显著差异，Kruskal-Wallis H检验用于比较三个或更多独立样本的差异是否有显著差异，Mann-Whitney U检验用于比较两个独立样本的差异是否有显著差异。

在SPSS中进行参数检验和非参数检验一般需要进行以下步骤：1.导入数据：将数据导入SPSS软件，可以通过选择文件-导入功能进行操作。

2.设定分析变量：定义需要进行分析的变量，并将其添加到分析列表中。

3.选择统计方法：根据实验设计和数据分布情况，选择合适的参数检验或非参数检验方法。

4.执行分析：点击运行按钮进行分析，在分析结果中可以查看得到显著性水平、均数、方差等指标。

5.结果解释：根据分析结果进行假设检验，判断是否存在显著差异，并解释其结果。

无论是参数检验还是非参数检验，在进行分析前需要注意数据的合理性、样本的选择和实验设计的合理性等，以保证分析结果的可靠性。

同时，还应根据不同的研究目的和数据特点选择适当的方法，并合理解释分析结果。

在SPSS软件中，可以通过图表、表格和描述性统计等形式展示和解释结果，并通过结果进行科学判断和相关推断。

统计学中各种检验的核心内容

统计学中各种检验的核心内容参数检验与非参数检验统计检验可分为两大类：参数检验和非参数检验。

参数检验假设数据来自具有特定分布的总体，例如正态分布。

非参数检验则无需此假设。

假设检验大多数统计检验涉及假设检验。

假设检验遵循以下步骤：设定零假设和备择假设计算检验统计量确定临界值根据检验统计量和临界值做出决策统计检验的类型t检验用于比较两个独立样本的均值参数检验，假设数据来自正态分布 ANOVA（方差分析）用于比较多个样本的均值参数检验，假设数据来自正态分布卡方检验用于检验分类变量之间的关联非参数检验Wilcoxon秩和检验用于比较两个独立样本的中位数非参数检验Mann-Whitney U检验用于比较两个独立样本的均值非参数检验Kruskal-Wallis检验用于比较多个样本的中位数非参数检验相关性分析用于度量两个变量之间的线性关系皮尔逊相关系数：用于度量连续变量之间的相关性（-1到1）斯皮尔曼等级相关系数：用于度量序数变量之间的相关性（-1到1）回归分析用于预测一个变量（因变量）基于另一个变量（自变量）线性回归：因变量是自变量的线性函数Logistic回归：因变量是自变量的逻辑函数，用于二分类问题显著性水平显著性水平（α）是犯第一类错误（拒绝真实零假设）的概率通常设定为0.05或0.01显著性水平越小，犯第一类错误的可能性越小，但犯第二类错误（接受虚假零假设）的可能性越大检验统计量检验统计量是用于计算检验结果的度量不同检验使用不同的检验统计量，例如t值、卡方值或U值临界值临界值是检验统计量的阈值，用于做出决策如果检验统计量大于或等于临界值，则拒绝零假设临界值通过查表或使用统计软件确定决策基于检验统计量和临界值，做出以下决策之一：拒绝零假设接受零假设拒绝零假设表明备择假设更有可能是真的，而接受零假设表明没有足够的证据拒绝它注意事项统计检验只是做出明智决策的工具，不能替代对数据的批判性思考了解检验的假设和限制对于正确解释结果至关重要有时可能需要执行多个检验来全面了解数据。

方差分析与非参数检验方法的基础知识

非参数检样本服从某一特定的总体分布，而非参数检验则不涉及有关总体分布的参数。因此，非参数检验又被称为不受分布限制检验优势和劣势
非参数检验的优势因为一般参数检验必须满足的条件，在非参数检验中并不严格要求满足，所以非参数检验的适用范围更为广泛非参数检验适用的数据类型要比参数检验的多。
方差分析与非参数检验方法的基础知识
方差分析
单因素方差分析单因素方差分析的基本概念定义单因素方差分析用于检验三个或三个以上总体的均值是否相等。单因素方差分析可以用一个因素对数据进行分类。单因素方差分析目标检验三个或三个以上总体的均值是否相等条件总体近似服从正态分布各总体的方差相同。只要所有的方差近似相等即可样本为随机选取的数据样本间相互独立，不是配对样本不同样本来自的总体仅有一个因素用于分类检验统计检验量和p值方差分析检验为右侧检验判断 p值≤α：拒绝原假设，至少有一个总体的均值与其他均值不同 p值＞α：不能拒绝原假设方差分析中p值与检验统计量的关联检验统计量越大，对应p值越小，因此方差分析检验为右侧检验 F检验统计量为组间变异量和组内变异量的比值组间变异量：基于样本均值的方差组内变异量：基于样本的方差
非参数检验的劣势非参数检验通常把定量数据转换为定性数据，从而浪费了部分信息非参数检验的效率较低，通常需要更多的证据用于拒绝原假设
秩次定义：数据可以通过某种准则进行排序，秩次是根据单个样本值在排序列表中的顺序为其分配的一个数字平均秩次：如果数据值相等，则一般会取其平均秩次，并将该平均秩次分配给所有相等的数据值。
符号检验符号检验大致过程：先将数据值转换为正负符号，再检验其中一个符号的个数是否显著高于另一个符号的个数符号检验的基本概念：通过使用正负符号对如下类型的命题进行假设检验：配对样本/具有两个分类的名目数据/单个总体的中位数符号检验目标配对样本：计算每对数据的差值，记录差值的符号并舍去所有差值为0的数据具有两个分类的名目数据：将其中一类归为正，另一个类归为负单个总体的中位数：高于中位数的数据符号为正，低于中位数的数据符号为负，舍去所有等于中位数的数据条件样本数据是简单随机样本检验统计量如果n≤25，检验统计量为x 如果n＞25，检验统计量z=[(x+0.5)-n/2]/(n^2/2)

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

北京建筑大学
理学院信息与计算科学专业实验报告
课程名称《数据分析》实验名称方差分析与非参数检验实验地点基C-423 日期2017.3.30
（1）熟悉数据的基本统计与非参数检验分析方法；
（2）熟悉撰写数据分析报告的方法；
（3）熟悉常用的数据分析软件SPSS。

【实验要求】
根据各个题目的具体要求，完成实验报告。

【实验内容】
1、附件给出某年房屋价格的相关数据，请选用恰当的分析方法，对影响房屋价格的因素进行分析。

(注意数据要调整成标准的格式，变量值、组别（字符变量转换成数值变量）)(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)
2、附件给出管理才能评分的相关数据，请选用恰当的分析方法，分析该评分数据是否服从正态分布。

3、附件给出了某体育比赛的两位裁判打分数据，请选用恰当的分析方法，检验该两组评分分布是否有显著差异。

(注意数据要调整成标准的格式，变量值、组别)
4、附件给出了减肥茶数据，请选用恰当方法分析，检验该减肥茶是否对减肥有显著效果。

(注意数据要调整成标准的格式，变量值、组别)
【分析报告】
1、对影响房屋价格的因素进行分析。

(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)。

表1-1（a）
装修状况对均价影响的单因素方差分析结果
均价
平方和df 均方 F 显著性
组间79.180 1 79.180 62.408 .000
组内230.914 182 1.269
总数310.094 183
表1-1（b）
所在区县对均价影响单因素方差分析结果
均价
平方和df 均方 F 显著性
组间91.919 3 30.640 25.279 .000
组内218.174 180 1.212
总数310.094 183
表1-1（a）是装修状况对均价影响的单因素方差分析结果。

可以看到：观测变量均价的离差平方总和为310.094；如果仅考虑装修状况单个因素的影响，则均价总变差中，不同装修状况可解释的变差为79.180，抽样误差引起的变差为230.914，它们的方差分别为79.180和1.269，相除所得的F统计量的观测值为62.408，对应的概率P-值近似为0.如果显著性水平α为0.05，由于概率P-值小于显著性水平α，应拒绝原假设，认为不同装修状况对均价的平均值产生了显著影响，不同装修状况对均价的影响效应不全为0。

表1-1（b）是所在区县对均价影响单因素方差分析结果。

可以看到：如果仅考虑所在区县单个因素的影响，则均价总变差310.094中不同所在区县可解释的变差为91.919，抽样误差引起的变差为218.174，
它们的方差分别为30.640和1.212，相除所得的F统计量的观测值为25.279，对应的概率P-值近似为0。

如果显著性水平α为0.05，由于概率P-值小于显著性水平α，应拒绝原假设，认为不同所在区县对均价的平均值产生了显著影响，不同所在区县对均价的影响效应不全为0。

对比表1-1（a）和表1-1（b）容易发现：如果从单因素的角度考虑，装修状况对均价的影响比所在区县大。

表1-2（a）
表1-2（a）表明，在2个不同装修状况下分别有84、100两个样本。

“1”，即“精装修”的平均均价高于“0”“毛胚”。

可在图1-3（a）中得到印证。

表1-2（b)
方差齐性检验
均价
Levene 统计量df1 df2 显著性
28.807 1 182 .000
图1-3（a）不同装修状况下均价均值折线图
表1-2（b）表明，不同装修状况下均价的方差齐性检验统计量的观测值为28.807，概率P-值为0。

如果显著性水平α为0.05，由于概率P-值小于显著性水平α，因此应拒绝原假设，认为不同装修状况下
对均价的总体方差有显著差异，满足方差分析的前提。

表1-2（c）
不同区县位置下均价的基本描述统计量及95%置信区间均价
N 均值标准差标准误均值的 95% 置信区间
极小值极大值下限上限
1 58 4.021 1.6360 .2148 3.591 4.451 2.0 8.6
2 38 2.837 .6395 .1037 2.626 3.047 1.7 4.3
3 52 3.285 .8749 .1213 3.041 3.528 1.8 5.6
4 36 2.051 .5719 .0953 1.858 2.24
5 .8 3.5
总数184 3.183 1.3017 .0960 2.993 3.372 .8 8.6
表1-2（c）中，“1”“2”“3”“4”分别对应区县“朝阳”“丰台”“海淀”“通州”在4个区县中各有58、38、52、36个样本。

朝阳的均价最高，丰台区与海淀区居中，通州区最低。

这些结论同样可在图1-3（b）中印证。

方差齐性检验
均价
Levene 统计量df1 df2 显著性
15.627 3 180 .000
图1-3（b）不同所在区县均价均值折线图
表1-2（d）表明，如果显著性水平α为0.05，由于概率P-值小于显著性水平α，因此应拒绝原假设，认为不同所在区县下对均价的总体方差有显著差异，满足方差分析的前提。

表1-3
均价多因素方差分析的非饱和模型-主体间效应的检验
因变量:均价
源III 型平方
和df 均方 F Sig.
校正模型139.280a7 19.897 20.501 .000
截距1254.722 1 1254.722 1292.814 .000
装修状况24.181 1 24.181 24.915 .000
所在区县40.804 3 13.601 14.014 .000
误差170.814 176 .971
总计2174.020 184
校正的总计310.094 183
a. R 方 = .449（调整 R 方 = .427）
表1-3中，可以看到：观测变量的总变差SST为310.094，它被分解为三个部分，分别是：由装修状况不同引起的变差24.181，由所在区县引起的变差40.804，由随机因素引起的变差170.814。

这些变差除以各自的自由度后，得到各自的方差，并可计算出各F检验统计量的观测值和一定自由度下的概率P-值，均为0。

如果显著性水平α为0.05，由于其概率P-值小于显著性水平α，所以应拒绝原假设，可以认为不同装修状况、所在区县下的均价总体均值存在显著差异，对均价的效应不同时为0，各自不同的水平给均价带来了显著影响。

该结论与单因素方差分析是一致的。

2、分析该评分数据是否服从正态分布。

表2-1
单样本 Kolmogorov-Smirnov 检验
管理才能评分
N 90
正态参数a,b均值487.6778
标准差88.28005
最极端差别绝对值.066
正.066
负-.041
Kolmogorov-Smirnov Z .630
渐近显著性(双侧) .822
a. 检验分布为正态分布。

b. 根据数据计算得到。

表2—1表明，数据的均值为487.6778，标准差为88.28005。

最大绝对差值为0.066，最大正差为0.066，最小负差为-0.041，概率P-值为0.822。

如果显著性水平α为0.05，由于其概率P-值大于显著性水平α，所以不应拒绝原假设，没有充分理由推翻该评分数据的总体分布为正态分布的假设。

3、检验该两组评分分布是否有显著差异。

表3-1（a）
2 29 28.36 822.50
总数60
表3-1（b）
检验统计量a
得分等级
Mann-Whitney U 387.500
Wilcoxon W 822.500
Z -.962
渐近显著性(双侧) .336
a. 分组变量: 组别
表3—1（a）和3—1（b）中，可以看到：从1、2两组中，即中美裁判中分别抽取了31和29个样本，两个秩和分别为1007.50和822.50；W统计量应采取中国裁判的秩和W X；U，Z统计量分别为387.500和-0.962。

由于是小样本，因此采用U统计量的精确概率。

如果显著性水平α为0.05，由于其概率P-值大于显著性水平α，所以不应拒绝原假设，认为中美裁判打分不存在显著差异。

4、检验该减肥茶是否对减肥有显著效果。

表4-1（a）
频率
N
喝后体重 - 喝茶前体重负差分a44
正差分b 1
结c0
总数45
a. 喝后体重 < 喝茶前体重
b. 喝后体重 > 喝茶前体重
c. 喝后体重 = 喝茶前体重
表4-1（b）
检验统计量a
喝后体重 - 喝
茶前体重
Z -6.261
渐近显著性(双侧) .000
a. 符号检验
由表4-1（a）和4-1（b）可知，喝茶后体重低于喝茶前体重的有44人，远高于喝茶前的有1人。

双侧的二项分布累计概率为0。

如果显著性水平α为0.05，由于其概率P-值小于显著性水平α，所以拒绝原假设，喝减肥茶后的体重分布有显著差异，喝减肥茶有显著效果。

【实验总结】
通过这次的实验，我熟悉了数据的基本统计与非参数检验分析方法，数据分析报告的方法，熟悉了常用的数据分析软件SPSS。