非参数分析

合集下载

经济统计学中的非参数模型与分析

经济统计学中的非参数模型与分析

经济统计学中的非参数模型与分析经济统计学作为经济学的一个重要分支,旨在通过对经济数据的收集、整理和分析,揭示经济现象和规律,为经济决策提供科学依据。

在经济统计学中,非参数模型是一种重要的分析工具,它与传统的参数模型相比,更加灵活和适用于复杂的经济现象。

一、非参数模型的基本概念和原理非参数模型是指在建模过程中,对模型的形式和参数的分布没有做出具体的假设。

相比之下,参数模型需要对模型的形式和参数的分布进行明确的假设,从而限制了模型的灵活性和适用性。

非参数模型的基本原理是通过对数据的直接分析和模式识别,来推断出经济现象的规律和特征。

二、非参数模型在经济统计学中的应用1. 非参数回归模型非参数回归模型是非参数模型中的一种重要应用,它可以用来研究变量之间的非线性关系。

传统的参数回归模型假设变量之间的关系是线性的,但是在实际经济中,很多变量之间存在着复杂的非线性关系。

非参数回归模型通过对数据的拟合和分析,可以更准确地描述这种非线性关系,从而提高模型的预测能力和解释力。

2. 非参数分类模型非参数分类模型是非参数模型的另一个重要应用,它可以用来研究经济现象的分类和分组。

在经济统计学中,经常需要对经济主体进行分类和分组,以便进行更深入的研究和分析。

传统的参数分类模型需要对分类变量的分布和参数进行假设,但是在实际应用中,往往无法满足这些假设。

非参数分类模型通过对数据的聚类和分类,可以更准确地划分经济主体,从而提高研究的精度和可靠性。

3. 非参数时间序列模型非参数时间序列模型是非参数模型在时间序列数据分析中的应用。

在经济统计学中,经常需要对经济数据进行时间序列分析,以揭示经济现象的演变和趋势。

传统的参数时间序列模型需要对时间序列的分布和参数进行假设,但是在实际应用中,往往无法满足这些假设。

非参数时间序列模型通过对数据的时间演化和趋势的分析,可以更准确地描述经济现象的动态变化,从而提高时间序列分析的准确性和可靠性。

三、非参数模型的优势和局限性非参数模型相比于传统的参数模型,具有以下优势:1. 灵活性:非参数模型不对模型的形式和参数的分布做出具体的假设,因此更加灵活和适用于复杂的经济现象。

统计学中的非参数统计分析

统计学中的非参数统计分析

统计学中的非参数统计分析统计学作为一门研究数据分析和推断的学科,涉及到各种统计方法和技术。

其中,非参数统计分析是一种常见且重要的方法,它不依赖于数据的特定分布假设,而是利用数据本身的特征进行分析和推断。

本文将介绍非参数统计分析的基本概念、应用场景和常用方法。

非参数统计分析是相对于参数统计分析而言的。

参数统计分析通常需要对数据的分布做出假设,如正态分布、指数分布等,并利用参数估计方法来推断总体参数。

然而,在实际应用中,我们往往无法确定数据的真实分布,或者分布假设不成立。

这时,非参数统计分析就成为一种有力的工具。

非参数统计分析的一个重要应用是在样本比较中。

假设我们想比较两组样本的均值是否有显著差异,但无法确定数据是否符合正态分布。

这时,可以使用非参数的Wilcoxon秩和检验来进行推断。

该方法将两组样本的观测值按大小排序,并计算秩次和。

通过比较秩次和的大小,可以判断两组样本的均值是否有显著差异。

除了样本比较,非参数统计分析还可以用于回归分析。

在传统的线性回归中,我们通常假设自变量和因变量之间的关系是线性的,并利用最小二乘法来估计回归系数。

然而,在实际应用中,变量之间的关系可能是非线性的,或者无法确定具体的函数形式。

这时,非参数的局部回归方法就可以派上用场。

该方法通过在每个数据点附近拟合局部线性模型,来估计变量之间的关系。

这种方法不依赖于具体的函数形式,能够更好地适应数据的特点。

在实际应用中,非参数统计分析还有许多其他的方法,如Kolmogorov-Smirnov 检验、Mann-Whitney U检验等。

这些方法都不依赖于数据的分布假设,能够更加灵活地适应不同的数据类型和场景。

尽管非参数统计分析在某些方面具有优势,但也存在一些限制。

首先,由于不依赖于分布假设,非参数方法通常需要更多的样本来获得可靠的推断结果。

其次,非参数方法往往比参数方法计算量更大,需要更多的计算资源和时间。

此外,非参数方法对异常值和缺失值的鲁棒性较差,需要进行适当的数据处理。

参数方法 非参数方法

参数方法 非参数方法

参数方法非参数方法参数方法和非参数方法是统计学中两种常用的数据分析方法。

参数方法是指在数据分析过程中,需要预先对数据的分布做出假设,并基于假设建立参数模型。

参数模型可以用来估计总体参数,并使用统计推断方法进行假设检验。

常见的参数方法包括t检验、方差分析、回归分析等。

t检验是一种用于比较两个样本均值是否有显著差异的参数方法。

在t检验中,我们需要预先假设样本数据服从正态分布,并且方差齐性成立。

通过计算样本均值的差异与预期均值差异之间的差异大小,得出结论是否拒绝原假设。

方差分析是一种用于比较两个或多个样本组均值差异是否显著的参数方法。

它假设样本数据服从正态分布,且不同样本组的方差相等。

通过计算组间均方与组内均方之间的比值,得出结论是否拒绝原假设。

回归分析是一种用于探究变量之间关系的参数方法。

它假设因变量与自变量之间存在线性关系,并且误差项服从正态分布。

通过最小化误差平方和,估计出回归系数,从而得到模型的偏回归系数。

参数方法的优点是可以对总体参数进行估计和推断,结果具有精确性。

然而,参数方法对数据的分布假设要求较高,如果数据偏离了假设的分布,会导致统计推断结果的失真。

与之相反,非参数方法则不依赖于总体的分布假设,基于样本数据进行推断和分析。

非参数方法主要通过排序和秩次转换的方法,来对比样本之间的差异。

常用的非参数方法包括Wilcoxon符号秩检验、Kruskal-Wallis检验、Spearman相关分析等。

Wilcoxon符号秩检验是一种用于比较两个相关样本均值差异是否显著的非参数方法。

它将样本数据转换为秩次,通过对比秩次差异的大小,得出结论是否拒绝原假设。

Kruskal-Wallis检验是一种用于比较多个无关样本组均值差异是否显著的非参数方法。

它将样本数据转换为秩次,通过对比不同样本组秩次和的大小,得出结论是否拒绝原假设。

Spearman相关分析是一种用于探究变量之间关系的非参数方法。

它基于秩次转换的数据,计算出秩次之间的相关系数,从而推断变量之间的相关性。

经济统计学中的非参数统计方法与分析

经济统计学中的非参数统计方法与分析

经济统计学中的非参数统计方法与分析经济统计学是研究经济现象的统计学科,它运用统计学的方法和技术,对经济数据进行收集、整理、分析和解释,从而揭示经济规律和发展趋势。

非参数统计方法是经济统计学中的一种重要工具,它与参数统计方法相对应,主要用于处理那些无法用参数模型刻画的经济现象。

本文将介绍非参数统计方法的基本原理和应用,并探讨其在经济统计学中的意义和局限。

一、非参数统计方法的基本原理非参数统计方法是一种不依赖于总体分布形态的统计分析方法。

与参数统计方法相比,非参数统计方法不对总体的概率分布进行任何假设,而是通过对样本数据的排序、秩次变换等非参数化处理,来进行统计推断。

其基本原理是利用样本数据的内在结构和顺序信息,从而获得总体的分布特征和统计性质。

二、非参数统计方法的应用领域非参数统计方法在经济统计学中有广泛的应用。

首先,它可以用于经济数据的描述和总结。

例如,通过计算样本数据的中位数、分位数等非参数统计量,可以更准确地描述和解释经济现象的分布特征和变异程度。

其次,非参数统计方法可以用于经济数据的比较和推断。

例如,通过非参数的秩次检验方法,可以判断两个总体是否存在显著差异,从而进行经济政策的评估和决策。

此外,非参数统计方法还可以用于经济模型的估计和验证。

例如,通过非参数的核密度估计方法,可以对经济模型的参数进行非线性估计和模型检验,从而提高经济模型的拟合度和预测能力。

三、非参数统计方法的意义和局限非参数统计方法在经济统计学中具有重要的意义和价值。

首先,它能够更好地应对数据的非正态性和异方差性等问题,从而提高统计推断的效果和准确性。

其次,非参数统计方法能够更好地适应不完全信息和有限样本的情况,从而减少模型假设和参数估计的不确定性。

然而,非参数统计方法也存在一些局限性。

首先,由于非参数统计方法不假设总体的分布形态,因此通常需要更大的样本量才能获得稳健的统计推断结果。

其次,非参数统计方法在处理高维数据和复杂模型时,计算复杂度较高,需要更多的计算资源和时间。

参数方法和非参数方法

参数方法和非参数方法

参数方法和非参数方法引言在统计学中,参数方法和非参数方法是两种常用的统计分析方法。

参数方法是基于某些假设条件下,通过对总体分布进行近似推断的方法;而非参数方法则是不对总体分布作出任何假设,通过对样本数据进行直接分析的方法。

本文将从定义、应用范围、优点和缺点等方面对参数方法和非参数方法进行综合探讨。

一、参数方法1.1 定义参数方法是一种基于总体分布假设的统计分析方法。

在参数方法中,我们假设总体服从某种特定的分布(如正态分布、二项分布等),并通过样本数据进行推断,从而得到总体参数的估计值。

1.2 应用范围参数方法在许多领域中得到广泛应用,如市场调研、医学研究等。

通过参数方法,我们可以对总体的特性进行准确、精确的估计,并进行统计推断。

1.3 优点参数方法的优点主要体现在以下几个方面: - 精确性高:通过对总体分布的假设,参数方法可以得到对总体参数的精确估计。

- 推断性强:参数方法可以利用参数估计的结果,进行统计推断和假设检验,得到较为可靠的结论。

1.4 缺点参数方法的缺点主要体现在以下几个方面: - 对总体分布的假设:参数方法要求对总体分布做出合理的假设,如果假设不合理,可能导致估计结果的失真。

- 复杂性:参数方法在推断过程中可能涉及到复杂的统计理论和计算方法,需要一定的专业知识和技能。

二、非参数方法2.1 定义非参数方法是一种不对总体分布作出任何假设的统计分析方法。

在非参数方法中,我们通过直接对样本数据进行计算和分析,得到对总体分布的估计。

2.2 应用范围非参数方法在一些场景中具有优势,例如样本数据不满足参数方法假设条件、总体分布未知等情况下,非参数方法能够给出相对可靠的结果。

2.3 优点非参数方法的优点主要体现在以下几个方面: - 数据分布要求低:非参数方法不对总体分布作出任何假设,因此适用范围更广,对样本数据的分布要求较低。

-灵活性高:非参数方法可以灵活地应对各种数据类型和样本规模的情况,并给出相对稳健的结果。

非参数统计分析

非参数统计分析

非参数统计分析是指不需要任何假设的情况下,对数据进行分析和处理的方法。

相对于参数统计分析,更加灵活和适用于更广泛的数据集。

在中,我们通常使用基于排列和重抽样方法的统计分析,这些方法在处理离散和连续的数据集时都十分有效。

如何进行1. 非参数检验非参数检验方法不要求数据满足特定的分布,通常分为两类:①秩和检验秩和检验是比较两组数据的中位数是否相等。

对于小样本来说,一般采用Wilcoxon签名检验。

而对于大样本,通常会使用Mann Whitney U检验。

②秩相关检验秩相关检验是比较两个或多个变量的相关性关系。

这种类型的检验最常用的是Spearman秩相关系数和Kendall Tau秩相关测试。

2. 非参数估计器由于非参数统计方法不依赖于任何先验假设,因此非参数估计器在数据少或均值和方差无法准确估计的情况下较为常用。

在非参数估计器中,常用的方法有:①核密度估计核密度估计通常是数据分析和可视化的首选。

它能够获得不同分布的概率密度函数的非参数估计器。

②基于距离的方法基于距离的方法通常使用K近邻算法或半径最邻近算法来估计密度。

这种方法特别适合于计算高维数据的密度估计。

3. 非参数回归非参数回归是一种灵活的模型,他用于数据挖掘过程中的最复杂部分。

与标准回归技术不同,非参数回归方法不需要数据满足任何特定分布。

在非参数回归中,主要的方法有:①核回归在核密度估计和非参数回归中使用的是相同的核函数。

相对于线性回归方法,核回归更加灵活,适用于非线性分布的数据。

②局部回归局部回归的本质是计算小范围或子集内的平均值,并在这些平均值上拟合局部模型。

这种方法特别适用于非线性回归和数据样本集的大小不规则的情况。

非参数统计优势非参数统计方法的最大优势在于能够在没有特定假设下应用于任何样本集,这使得无需预先了解数据的分布和性质。

此外,非参数统计方法还有其他的优势,如:1. 不受异常数据的影响:统计方法通常受异常数据的影响较大,但非参数统计方法不会使结果发生显著的变化。

非参数回归分析

非参数回归分析

非参数回归分析非参数回归分析是一种无需对数据分布做出假设的统计方法,它通过学习数据的内在结构来建立模型。

与传统的参数回归分析相比,非参数回归分析更加灵活,适用于各种复杂的数据分布。

本文将介绍非参数回归分析的基本原理和应用场景,并通过实例来说明其实际应用。

一、非参数回归分析的原理非参数回归分析是通过将目标变量与自变量之间的关系建模为一个未知的、非线性的函数形式,并通过样本数据来估计这个函数。

与参数回归分析不同的是,非参数回归模型不需要表示目标变量与自变量之间的具体函数形式,而是通过样本数据来学习函数的结构和特征。

在非参数回归分析中,最常用的方法是核密度估计和局部加权回归。

核密度估计使用核函数对数据进行平滑处理,从而得到目标变量在不同自变量取值处的概率密度估计。

局部加权回归则是通过在拟合过程中给予靠近目标变量较近的样本点更大的权重,从而对目标变量与自变量之间的关系进行拟合。

二、非参数回归分析的应用场景1. 数据分布未知或复杂的情况下,非参数回归分析可以灵活地适应不同的数据分布,从而得到较为准确的模型。

2. 非线性关系的建模,非参数回归分析可以对目标变量与自变量之间的非线性关系进行拟合,从而获得更准确的预测结果。

3. 数据量较小或样本信息有限的情况下,非参数回归分析不需要对数据分布做出假设,并且可以通过样本数据来学习模型的结构,因此对数据量较小的情况下也具有一定的优势。

三、非参数回归分析的实际应用为了更好地理解非参数回归分析的实际应用,以下通过一个实例来说明。

假设我们有一组汽车销售数据,包括了汽车的价格和其对应的里程数。

我们希望通过这些数据预测汽车的价格与里程数之间的关系。

首先,我们可以使用核密度估计方法来估计汽车价格与里程数之间的概率密度关系。

通过对价格和里程数进行核密度估计,我们可以得到一个二维概率密度图,显示了不同价格和里程数组合的概率密度。

接下来,我们可以使用局部加权回归方法来拟合汽车价格与里程数之间的关系。

常见的几种非参数检验方法

常见的几种非参数检验方法

常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法,它不需要满足正态分布等前提条件,因此被广泛应用于实际数据分析中。

在本文中,我们将介绍常见的几种非参数检验方法。

一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号和秩来计算统计量,并通过查表或使用软件进行显著性判断。

二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号来计算统计量,并通过查表或使用软件进行显著性判断。

六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。

它基于样本数据与理论分布之间的差异来计算统计量,并通过查表或使用软件进行显著性判断。

八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本方差和均值来计算统计量,并通过查表或使用软件进行显著性判断。

九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。

它基于自助重采样技术来生成大量虚拟样本,以此估计总体参数和构建置信区间。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。

比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。

本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。

由于这一类方法不涉及总体参数,因而称为非参数统计方法。

SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。

即检验样本所在总体是否服从已知的理论分布。

具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。

Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。

Runs Test:用于检验样本序列随机性。

观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。

一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。

One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。

2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。

具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。

Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。

Two-Related-Samples Tests:配对设计的两样本秩和检验。

Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。

一、分布位置检验方法1、Two Independent Samples Test与 K Independent Samples Test用于检验两独立样本/多独立样本所在总体是否相同。

Two-lndependent-Samples Test对话框:(1)Test Variable框,指定检验变量。

(2)Grouping Variable框,指定分组变量。

Define Groups对话框,Groupl和Groupl后的栏中,可指定分组变量的值。

(3)TestType框,确定用来进行检验的方法。

Mann-Whitney U:默认值,相当于两样本秩和检验。

Kolmogorov-Smimov Z:K-S检验的一种。

Moses extreme reactions:如果施加的处理使得某些个体出现正向效应,而另一些个体出现负向效应,就应当采用该检验方法。

Wald-Wolfowitz runs:游程检验的一种,检验总体分布是否相同。

(4) Options对话框,选择输出结果形式及缺失值处理方式。

多个独立样本检验中不同之处:Define Range对话框,定义分组变量值范围。

Minimum:分组变量范围的下限。

Maximum:上限。

Test Type框,确定用来进行检验的方法。

Kruskal-WallisH:默认值,单向方差分析,检验多个样本在中位数上是否有差异; Median:中位数检验,检验多个样本是否来自具有相同中位数的总体。

2、Two Related Samples Test与 K Related Samples TestTwo Related Samples Test是考察配对样本的总体分布是否相同,或者说差值总体是否以0为中心分布;K Related Samples Test则用于检验多个配伍样本所在总体的分布是否相同。

Two-Related-SamplesTests对话框:(1)Test Pair(s)List框,指定检验变量对。

可有多对。

(2)TestType框,确定检验的方法。

Wilcoxon:默认值,配对设计差值的秩和检验,利用次序大小。

Sign:符号检验,利用正负号。

McNemar:配对卡方检验,适用于两分类资料,特别适合自身对照设计。

Marginal Homogeneity:适用于资料为有序分类情况。

(3)Options对话框中,选择输出结果形式及缺失值处理方式,K Related SamplesTest 用于多组间的非参数检验,不同之处在于:A、比较方法不同:☆ Friedman:系统默认值,即最常用的随机区组设计资料的秩和检验,也被称为M检验。

☆ Kendall's W:该指标也被称为Kendall和谐系数,它表示的是K个指标间相互关联的程度(一致性程度),取值在0~1之间。

☆ Cochrarl's Q:是两相关样本McNemar检验在多样本情形下的推广,只适用于二分类变量。

B、Statistics对话框: Descriplive,描述统计量。

Quartiles,四分位数。

二、分布类型检验方法原理:计算实际分布与理论分布间的差异,根据某种统计量求出P值。

1、Chi-square test与行×列表卡方检验区别:Chi-square test是检验分类数据样本所在总体分布(各类别所占比例)是否与已知总体分布相同,是一个单样本检验。

行×列表卡方检验是比较两个分类资料样本所在的总体分布是否相同,在spss中要用crosstable菜单来完成。

具体做法:先按照已知总体的构成比分布计算出样本中各类别的期望频数,然后求出观测频数与期望频数的差值,最后计算出卡方统计量,利用卡方分布求出P值,得出检验结论。

例5.1 某地一周内各日死亡数的分布如表所示,请检验一周内各日的死亡危险性是否相同?周日一二三四五六日死亡数 11 19 17 15 15 16 19数据文件为death.sav:day 周日,death 死亡数。

Chi-Square Test对话框:(1)Test Variable List框,指定检验变量,可为多个变量。

(2)ExpectedRange栏,确定检验值的范围。

Get from data选项,即最小值和最大值所确定的范围,系统默认该项。

●Use specified range选项,只检验数据中一个子集的值,在Lower和Upper参数框中键入检验范围的下限和上限。

(3)ExpectedValues栏,指定期望值。

●All categories equal选项,系统默认的检验值是所有组对应的期望值都相同,这意味着你要检验的总体是否服从均匀分布。

●Values选项,选定所要检验的与总体是否服从某个给定的分布,并在其右边的框中键人相应各组所对应的由给定分布所计算而得的期望值。

“Add”按钮,增加刚键入的期望值,必须大于0。

“Remove”按钮,移走错误值。

“Change”按钮,替换错误值。

(4)Options对话框。

A、Statistics栏,选择输出统计量。

Descriptive:输出变量的均值、标准差、最大值、最小值、非缺失个体的数量。

Quartiles 复选项,输出结果将包括四分位数的内容。

显示第25、50与75百分位数。

B、在MissingValues栏中选择对缺失值的处理方式。

具体操作如下:Data →Weight Case → Weight Case by:→ Frequency Variable: death→OK;Analyze→Nonparametic Test→Chi-Square→Test variable list:day→OK。

卡方值X2=2.875,自由度(DF)=6,P=0.824,可认为一周内各日的死亡性是相同的。

2、Binomial Test(二项分布检验)调用Binomial过程可对样本资料进行二项分布分析,检验二项分类变量是否来自概率为P的二项分布。

例5-2 某地某一时期内出生40名婴儿,其中女性12名(Sex=0),男性28名(sex=1)。

问该地出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?数据文件为sex.sav。

Binomial Test对话框:(1)Test Variable框,指定检验变量。

(2)Define Dichotomy栏,定义二分值。

●Get from data选项,适用于指定的变量只有两个有效值,无缺失值。

●Cut point选项,如果指定的变量超过两个值,选择该项,并在参数框中键入一个试算点的值。

(3)Test参数框,指定检验概率值。

默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。

(3)Options对话框,选择输出结果形式及缺失值处理方式。

具体操作如下:Binomial TestTest → Test Variable List →sex→ Test Proportion →0.50→OK。

二项分布检验表明,女婴12名,男婴28名,观察概率为0.7(即男婴占70%,检验概率为0.5,二项分布检验的结果是双侧概率为0.018,可认为男女比例的差异有高度显著性,即与通常的0.5的性比例相比,该地男婴比女婴明显多。

3、Runs Test(游程检验)一个游程是指某序列中同类元素的一个持续的最大主集,或者说一个游程是指依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分。

游程检验用于检验样本或任何序列的随机性。

例5-3 某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为1,非发病住户为0,共26户,如下表所示。

0 1 1 0 0 0 1 0 0 1 0 O 0 0 1 1 O 0 1 0 0 0 01 0 l数据文件为run.sav:住户变量为epi。

Runs Test 对话框:(1) Test Variable框,指定检验变量。

(2) Cut Point栏,确定划分二分类的试算点。

中位数、众数、均数及用户指定临界割点。

(3) Options对话框,选择输出结果形式及缺失值处理方式。

具体操作如下:Runs Test → Test Variable →epi→1→ OK从检验结果可见,本例游程个数为14,小于1有17个案例;而大于或等于1有9个案例。

Z=0.325,双尾检验概率P=0.746。

所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。

相关文档
最新文档