非参数统计论文
非参数统计在科技创新中的应用(Ⅱ)

非参数统计在科技创新中的应用统计学作为一门应用广泛的学科,其在科技创新中的应用备受重视。
而非参数统计作为统计学中的一种重要分支,在科技创新中也发挥着重要的作用。
本文将探讨非参数统计在科技创新中的应用,并探讨其在不同领域中的具体应用案例。
一、医学领域在医学领域,非参数统计方法被广泛应用于临床试验和疾病研究中。
传统的参数统计方法往往受限于对数据分布的假设,而在临床试验中,往往难以满足这些假设。
非参数统计方法则能够更加灵活地处理不满足正态分布假设的数据,从而更好地适应实际临床数据的特点。
以临床试验中的药效评价为例,由于药物的作用机制复杂,临床试验数据往往呈现出非正态分布。
在这种情况下,传统的参数统计方法可能无法准确地评估药物的疗效。
而非参数统计方法,如Wilcoxon秩和检验、Mann-Whitney U检验等,能够有效地处理这类数据,从而更加真实地评估药物的疗效。
因此,非参数统计方法在医学领域的应用,为临床试验和疾病研究提供了重要的统计工具。
二、金融领域在金融领域,非参数统计方法被广泛应用于风险评估和金融建模中。
由于金融市场的复杂性和不确定性,传统的参数统计方法往往无法充分捕捉市场的波动性和风险特征。
非参数统计方法则能够更加灵活地处理金融数据中的非线性、非正态分布等问题,从而更好地识别市场的风险和机会。
以金融风险评估为例,传统的参数统计方法往往基于对数据分布的假设,而这些假设在金融市场中往往难以满足。
非参数统计方法,如核密度估计、分位数回归等,能够更加准确地评估金融市场中的风险分布,从而更好地指导投资决策和风险管理。
因此,非参数统计方法在金融领域的应用,为金融风险管理和金融建模提供了重要的统计工具。
三、工程领域在工程领域,非参数统计方法被广泛应用于可靠性分析和质量控制中。
传统的参数统计方法往往依赖于对数据分布的假设,而在工程实际中,往往难以满足这些假设。
非参数统计方法则能够更加灵活地处理工程数据中的非正态分布、样本量小等问题,从而更好地评估产品的可靠性和质量。
非参数统计在心理学研究中的应用(Ⅰ)

非参数统计在心理学研究中的应用在心理学研究中,统计分析是不可或缺的一部分。
而非参数统计方法在心理学研究中的应用也日益受到重视。
传统的参数统计方法对数据的分布形态有严格的要求,而非参数统计方法则无需对数据的分布形态做出假设,因而更加灵活和适用于各种类型的心理学数据。
本文将探讨非参数统计在心理学研究中的应用,并讨论其优势和局限性。
一、非参数统计方法的基本原理非参数统计方法是指不对总体概率分布作出假设的统计方法。
在心理学研究中,许多变量的分布并不服从正态分布,因此采用非参数统计方法能够更好地处理这些数据。
常用的非参数统计方法包括Wilcoxon符号秩检验、Mann-Whitney U检验、Kruskal-Wallis H检验等。
这些方法不仅能处理非正态分布的数据,还能处理序数变量或等级变量,因此在心理学研究中具有广泛的应用价值。
二、非参数统计方法在心理学研究中的应用1. 实验结果的分析在心理学实验中,研究者常常需要对不同条件下的实验结果进行比较。
如果数据符合正态分布且满足方差齐性假设,可以使用t检验或方差分析等参数统计方法。
然而,如果数据不符合这些假设,就需要采用非参数统计方法进行分析。
例如,对于两组实验数据的比较,可以使用Mann-Whitney U检验;对于多组实验数据的比较,可以使用Kruskal-Wallis H检验。
2. 调查问卷数据的分析在心理学研究中,调查问卷是常用的数据收集方法。
然而,由于受访者的主观性和个体差异,问卷数据往往不符合正态分布。
因此,采用非参数统计方法对问卷数据进行分析能够更好地反映实际情况。
例如,对于两组问卷数据的比较,可以使用Wilcoxon符号秩检验;对于多组问卷数据的比较,可以使用Friedman检验。
三、非参数统计方法的优势1. 不受数据分布形态的限制非参数统计方法不对数据的分布形态作出假设,因此更加灵活和适用于各种类型的心理学数据。
无论是正态分布、偏态分布还是其他类型的分布,非参数统计方法都能够进行有效的分析。
非参数统计在企业管理中的应用(Ⅲ)

非参数统计在企业管理中的应用随着全球经济的不断发展和企业竞争的日益激烈,企业管理者在决策过程中需要更科学的方法来分析和解决问题。
非参数统计作为一种灵活、适用范围广的统计方法,逐渐在企业管理中得到了广泛的应用。
本文将从样本分布的假设检验、质量管理、市场营销和风险管理等方面探讨非参数统计在企业管理中的应用。
一、样本分布的假设检验在企业管理中,经常需要对样本数据进行假设检验。
传统的参数统计方法通常要求样本数据服从特定的分布,而非参数统计方法不对数据的分布假设,因此更加灵活。
例如,在市场调研中,企业需要对产品的市场占有率进行检验,而市场数据往往不服从正态分布,这时可以使用非参数统计方法,如Mann-Whitney U检验或Kruskal-Wallis检验来进行假设检验,从而得出更为准确的结论。
二、质量管理在企业的生产过程中,质量管理是至关重要的环节。
非参数统计方法能够在没有对总体分布进行假设的情况下,对生产过程中的质量进行分析。
例如,在汽车零部件的质量控制中,如果数据不服从正态分布,传统的参数统计方法可能不适用,而非参数统计方法的质量控制图则可以更加准确地判断生产过程中是否存在异常。
三、市场营销在市场营销中,企业需要对市场需求、消费者行为等进行分析。
非参数统计方法可以在数据分布未知的情况下,对市场营销数据进行分析。
例如,在对用户偏好进行调查时,如果数据的分布未知,可以使用非参数统计方法对用户偏好进行分析和比较,从而为产品定位和市场推广提供更可靠的依据。
四、风险管理在企业管理中,风险管理是一个重要的议题。
非参数统计方法可以在没有对数据分布进行假设的情况下,对风险进行分析和评估。
例如,在金融风险管理中,对投资组合的收益率进行分析时,如果数据不服从正态分布,可以使用非参数统计方法来评估风险,从而更好地规避风险。
综上所述,非参数统计在企业管理中具有广泛的应用价值。
在样本分布的假设检验、质量管理、市场营销和风险管理等方面,非参数统计方法能够更好地处理实际问题,为企业的决策和管理提供科学依据。
非参数统计在社会发展中的应用(Ⅲ)

非参数统计在社会发展中的应用一、引言统计学作为一门应用广泛的学科,对于社会发展起着至关重要的作用。
而非参数统计作为统计学的一个重要分支,在社会发展中也有着不可或缺的应用。
本文将对非参数统计在社会发展中的应用进行探讨。
二、非参数统计概述非参数统计是一种不依赖总体参数分布形式的统计方法,其主要特点是不对总体的分布函数进行具体的假设。
相对于参数统计来说,非参数统计更加灵活,适用于各种类型的数据分析。
在社会科学、环境科学、医学等领域,非参数统计都有着广泛的应用。
三、社会调查在社会发展中,对于社会现象的调查和分析是非常重要的。
而非参数统计可以帮助研究人员对于调查数据进行分析,无需对数据的分布做出任何假设。
例如,社会民意调查中的数据分析,可以利用非参数统计方法来进行样本调查的分析,更加客观和准确地了解社会民意的动向。
四、经济学领域在经济学领域,非参数统计同样有着广泛的应用。
例如,对于不同地区的经济数据进行比较分析时,可以利用非参数统计方法来进行非参数假设检验,从而得出更加客观的结论。
此外,在金融风险管理中,非参数统计方法也可以用于对风险数据进行分析和预测,帮助金融机构更好地进行风险管理。
五、医学与生物学医学和生物学领域对于数据的分析要求严谨和准确,而非参数统计方法的灵活性和准确性使得它在这两个领域有着广泛的应用。
例如,在临床试验数据的分析中,非参数统计方法可以用来进行试验结果的推断,对于治疗效果和药物疗效的评估提供科学依据。
六、环境科学随着环境污染和气候变化问题的日益严重,环境科学领域对于数据的分析和预测也变得越发重要。
非参数统计方法可以用来对于环境数据进行分析和建模,为环境保护和治理提供科学依据。
例如,对于空气质量、水质监测数据的分析,可以利用非参数统计方法来进行环境数据的分析和预测。
七、结语综上所述,非参数统计在社会发展中有着重要的应用价值。
从社会调查到经济学、医学、环境科学等领域,非参数统计方法都发挥着不可或缺的作用。
非参数统计小论文(范本模板)

常用非参数统计方法上饶师范学院[摘要]本文就非参数统计分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。
[关键词]两样本比较多样本比较秩和检验在统计学中,最基本的概念是总体、样本、随机变量、分布、估计和假设检验等,其中很大一部分食与正态理论相关的.在我们已经学过的知识里,总体的分布形式往往是给定的或已经假定了的,我们只需要在总体分布已知的基础上对参数进行估值或者进行检验。
但是实际上,对总体的分布的假定并不是能随便做出的,数据可能并不是来自假定的总体分布,或者根本不是来自同一个总体。
在这种假定下进行推断就可能产生错误的结论。
于是,人们希望能在不假定总体分布的情况下,尽量从数据本身来获得所需的信息,这就是非参数统计的宗旨.在统计学的方法中,非参数方法只是在具体情况下更适用、更准确完整表示数据的信息。
接下来,我将就非参数统计分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。
非参数统计(nonparametric statistics)不依赖总体分布类型,不对参数进行估计或检验,通过样本观察值推断总体分布位置是否相同非参数检验又称任意分布检验(distribution—free test)优点:资料分布特征要求较低,适用范围广,收集资料方便;对不满足参数方法的资料,效率高。
缺点:宜用参数方法的资料,若用非参数法处理,没有充分利用资料提供的信息,导致检验效能下降。
秩和检验(rank sum test)1.秩(rank):观察值从小到大排序,该序号在统计学上称为秩/秩次;2.秩和:秩次求和得到;3.秩和检验:用秩和进行假设检验的方法。
适宜作非参数检验的资料1.计量资料,总体偏离正态性或总体分布未知2.等级资料:痊愈、显效、有效、无效;-、±、+、++、+++; 心功能分级;烧伤程度…3.边界不确定的资料:如出现>50mg或0。
5mg以下两样本比较秩和检验例测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有无差别?铅作业组(1)秩次(2)非铅作业组(3)秩次(4)0。
非参数统计论文推荐信模板

非参数统计论文推荐信[单位名称(公章)][日期][杂志编辑部/学术期刊名称][地址]尊敬的编辑:您好!我谨以此信向您强烈推荐我院[作者姓名]撰写的论文《[论文题目]》,该论文拟投稿至贵刊。
作为[作者姓名]的导师,我有幸全程参与了该论文的研究与撰写过程,对论文的质量和学术价值有深入了解。
以下是对该论文的详细评价:一、论文选题具有现实意义[论文题目]选题紧扣当前[研究领域]的热点问题,结合实际应用背景,具有重要的理论意义和实践价值。
非参数统计方法作为一种不依赖于总体分布形式假设的统计方法,在处理实际问题中具有广泛的应用前景。
该论文的研究将非参数统计方法应用于[具体应用领域],为相关领域的研究提供了新的思路和方法。
二、研究方法科学严谨论文在研究过程中,采用了[具体研究方法]等非参数统计方法,对[研究对象]进行了深入分析。
作者在研究过程中,遵循科学严谨的研究态度,严格遵循统计学原理,确保了研究结果的可靠性和有效性。
三、论文结构完整,论述清晰论文结构完整,层次分明,逻辑严密。
论文首先对非参数统计方法进行了概述,然后详细介绍了研究背景、研究目的、研究方法、结果与分析、结论等部分。
论文语言流畅,论述清晰,易于读者理解。
四、论文创新点突出论文在以下方面具有创新性:1. 首次将[非参数统计方法]应用于[具体应用领域],拓展了非参数统计方法的应用范围。
2. 针对传统参数统计方法在[具体应用领域]中的局限性,提出了[具体创新方法],为相关领域的研究提供了新的思路。
3. 通过实证分析,验证了所提出方法的有效性和优越性。
五、论文具有较高的学术价值和应用前景该论文的研究成果不仅为[研究领域]提供了新的理论依据,还为实际应用提供了有益的参考。
论文具有一定的学术价值和应用前景,值得贵刊予以关注。
综上所述,我认为[作者姓名]的论文《[论文题目]》具有较高的学术价值和应用前景,特此向您强烈推荐。
衷心希望贵刊能够审阅并予以发表。
此致敬礼![单位名称(公章)][推荐人姓名][推荐人职称/职务][联系电话][电子邮箱]。
非参数统计小论文

不同百分比纤维的棉花抗拉强度的研究罗林霞摘要:研究不同百分比纤维的棉花抗拉强度,先根据数据做出的折线图的特性来:不同棉花百分比的纤维的平均抗拉强度是一样的,然提出原假设,原假设为H后计算混合排序后各观察值的秩,根据公式计算Kruskal-Wallis统计量的值H 为28.6857,其次查相应的卡方分布表的到临界值c为9.488,由于H>c,故以故以5%的显著性水平拒绝原假设,即认为不同棉花百分比的纤维的平均抗拉强度不是一样的。
同时也可以运用SPSS进行Kruskal-Wallis检验,结果也是拒绝原假设。
关键词:不同百分比纤维的棉花抗拉强度;Kruskal-Wallis检验;SPSS引言:快速纺纱技术的迅速发展,对原棉纤维品质提出了新的要求。
现代纺织工业对原棉品质的要求是在一定绒长的基础上侧重强调纤维强度和麦克降值等内在品质,我国大部分地区生产的原棉还难以满足这种要求。
因此,大力改进我国原棉内在品质、提高纤维强度已成为当前棉花生产上亟待解决的问题。
一、问题的提出与解答对5种含有不同百分比棉花的纤维各作8次抗拉强度测试,结果如下(单位:g/cm2):表1 不同百分比棉花纤维抗拉强度试验结果棉花百分比(%)15 20 25 30 35411 1268 1339 1480 986705 846 1198 1198 775493 1057 1339 1268 493634 916 1198 1480 775634 1057 1339 1268 352846 1127 916 986 352564 775 1480 1127 564705 634 1268 1480 423试问不同棉花百分比的纤维的平均抗拉强度是否一样。
问题解答:作出该数据的折线图如图1:图1从图1中可以看到不同的百分比纤维的棉花的抗拉强度是有差别的,因此可以提出假设组H 0:不同棉花百分比的纤维的平均抗拉强度是一样的 H 1:不同棉花百分比的纤维的平均抗拉强度不是一样的首先计算混合排序后各观察值的秩以及不同百分比纤维的棉花的秩的和,计算结果如表2、表3:表2 混合排序后各观察值的秩棉花百分比(%)15 20 25 30 35 3 31.5 35 38.5 21.5 12.5 17.5 28 28 15 5.5 23.5 35 31.5 5.5 10 19.5 28 38.5 15 10 23.5 35 31.5 1.5 17.5 25.5 19.5 21.5 1.5 7.5 15 38.5 25.5 7.5 12.51031.538.54表3 不同百分比纤维的棉花的观察值的秩之和棉花百分比(%)15 20 25 30 35 R 78.5 166 250.5 253.5 71.5 n j 88888根据公式计算Kruskal-Wallis 统计量6857.2841385.715.2535.2501665.78414012)1(3)1(122222212=⨯-++++⨯⨯=+-+=∑=N n R N N H k j jj其中自由度为k-1=5-1=4,n j =8>5,是大样本,所以根据显著性水平α=0.05,差得卡方分布表得临界值c=9.488,由于H>c,故以5%的显著性水平拒绝原假设,即认为不同棉花百分比的纤维的平均抗拉强度不是一样的。
非参数统计论文推荐信模板

尊敬的编辑部:我谨以此信向您推荐一篇非参数统计领域的优秀论文,该论文由我国某高校的梁增聪教授及其团队撰写。
论文题目为“非参数统计的运用”,旨在探讨非参数统计在实际应用中的优势和局限性。
我相信这篇论文会对贵刊的读者带来新的启示,并丰富非参数统计领域的研究成果。
梁增聪教授是一位在非参数统计领域有着深厚研究基础的学者,他在非参数估计、非参数检验等方面取得了丰硕的研究成果。
这篇论文是其团队近期的一项研究成果,不仅具有较高的理论价值,还具有很强的实践指导意义。
论文首先对非参数统计的基本概念和方法进行了梳理,明确了非参数统计的适用场景和优势。
随后,论文通过具体案例分析,展示了非参数统计在实际应用中的优异性能,如在数据分布未知、数据质量不佳等情况下的 robust 性。
此外,论文还探讨了非参数统计方法的局限性,以及如何在这些局限性下进行有效的统计推断。
在论文的实证分析部分,作者以小白鼠为对象,研究了正常肝核糖核酸(RNA)对癌细胞的生物作用。
通过对比三种不同处理方法的诱导结果,作者发现酚层RNA组的诱导效果最为显著,水层RNA组次之,对照组最差。
这一结果从实践中验证了非参数统计方法在生物统计领域的应用价值。
此外,论文还进行了正态性检验,以验证样本数据是否符合非参数统计方法的要求。
结果表明,样本数据并不服从正态分布,进一步证实了非参数统计方法在处理此类数据时的必要性。
我认为这篇论文具有以下几个特点:1. 论述清晰,逻辑严谨。
论文从基本概念到具体应用,再到局限性分析,层次分明,易于理解。
2. 实证分析丰富,具有实际意义。
通过对小白鼠实验数据的分析,使读者更好地理解非参数统计在实践中的应用。
3. 文献综述全面,体现了非参数统计领域的研究动态。
论文在论述过程中,充分引用了国内外相关研究成果,展示了非参数统计方法的发展历程。
4. 结构合理,论述充分。
论文在阐述非参数统计的优势和局限性时,既有理论分析,又有实践佐证,具有较高的可信度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数统计方法与实例在统计学中,最基本的概念是总体、样本、随机变量、分布、估计和假设检验等,其中很大一部分食与正态理论相关的。
在我们已经学过的知识里,总体的分布形式往往是给定的或已经假定了的,我们只需要在总体分布已知的基础上对参数进行估值或者进行检验。
但是实际上,对总体的分布的假定并不是能随便做出的,数据可能并不是来自假定的总体分布,或者根本不是来自同一个总体。
在这种假定下进行推断就可能产生错误的结论。
于是,人们希望能在不假定总体分布的情况下,尽量从数据本身来获得所需的信息,这就是非参数统计的宗旨。
在统计学的方法中,参数方法与非参数方法没有谁优谁劣之说,有的只是在具体情况下,谁更适用、谁更准确完整表示数据的信息。
接下来,我将就参数统计与非参数统计分别分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。
1、参数统计与非参数统计非参数统计方法和参数统计方法共同组成统计分析方法,它们都是统计推断的基本内容。
参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
就上文我们可以看出,参数统计和非参数统计分别针对不同的数据来使用。
参数统计方法的适用范围是很好确定的,它适用于数据分布已知或者可以做出比较正确的假定的数据,对这些数据进行检验、估计,得出数据总体的均值、方差等参数来描述数据特征。
这样的数据一般都有这三个要求:1、抽样总体为正态分布或近似正态分布;2、各抽样总体为等方差或方差齐性;3、各变量值间是相互独立的。
而非参数统计,顾名思义,是不用估计参数来描述数据特征的方法,只通过对数据作一些诸如分布连续、有密度、具有某阶矩等一般性的假定来揭示数据特征,这也就赋予了非参数统计方法特别的适用数据范围,一般总结为以下四种:1、待分析数据不满足参数检验所要求的假定,因而无法应用参数检验;2、仅由一些等级构成的数据,不能应用参数检验。
例如,在一些经济数据中,通常是将一个特征数据分级而不是采用具体数据,这样的数据时没办法做参数检验和估计的,因此非参数统计也就适用了;3、所提的问题的数据中并不包含的参数,也不能用参数检验;4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。
因为一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来更为方便快捷,因此这种情况下采用非参数统计是一个正确的选择。
接下来,将分析参数统计方法与非参数统计的优缺点并进行比较。
一般来说,它们两者的优缺点是相对的。
非参数统计与参数统计相比具有很多优点,比如说:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。
那么这一点相对的也就是参数统计的缺点,参数统计可以适用的数据一定是总体已知或可以知道的,并且一旦需要计算统计量就意味着数据时需要精确测量的,因此,参数统计适用的范围是很窄的;2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。
3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。
4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。
当然,非参数统计方法也有缺点。
首先,由于方法简单,用的计量水准较低,使用非参数统计方法时就不如参数统计方法敏感,可能准确度上会有偏差,因为毕竟非参数统计方法只使用了样本的信息,而未使用总体信息。
这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。
这也相对的是参数统计方法的优点,一旦数据可以使用参数统计,那么相比非参数统计得出的结果更精确,更有效。
2、非参数统计方法下面,我将介绍非参数统计方法,主要是介绍非参数检验的方法。
非参数检验的方法是非常多的,有针对独立样本的检验,也有针对配对样本的检验;有针对单样本的检验,有针对两个样本的检验,也有针对多样本的检验。
我选取了两种比较常用的检验方法,即针对两配对样本的Wilcoxon检验和针对两独立样本的曼-惠特尼U检验。
2.1两配对样本的Wilcoxon检验在处理两配对样本的检验中,还有一种检验是符号检验,但因为在符号检验中,只考虑到了差异的符号,而没有考虑到数据包含的信息,因此在符号检验的基础上选取考虑到数据大小的Wilcoxon秩检验。
在Wilcoxon秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。
它适用于t检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。
检验成对观测数据之差是否来自均值为0的总体(即产生数据的总体是否具有相同的均值)。
Wilcoxon秩检验与符号检验相比优点更多,它在符号检验利用了观测值和零假设的中心位置之差的符号进行检验的基础上,利用这些差的大小(体现于差的绝对值大小)所包含的信息来进行检验。
这样在符号检验中利用每个观测值点相应的正号或负号仅仅代表了该点在中心位置的哪一边的基础上,用绝对值差的大小来表示该点距离中心的远近。
这样加入了各观测值距离中心远近的信息的Wilcoxon秩检验自然比仅仅利用符号要更有效。
这也是wilcoxon秩检验的中心思想。
2.2两独立样本的曼-惠特尼U检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。
曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的。
它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。
曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。
由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。
它的主要思想是假定要检验两组数据之间有没有差异。
首先,不管分组把所有数据排序。
按照数值大小给定一个值叫做秩。
最小的值秩为1,最大的为N(假定两个样本总共有N个观察值)。
如果有相同的值,就得到相同的秩。
相同的值的秩是他们的秩的平均值。
如果两组的秩的和差距比较大,就会得出较小的p值,认为这两组间有显著差异。
根据曼-惠特尼U检验的公式可以看出它比较的是两个样本中位数,并且曼-惠特尼U检验只用于两组数据的比较。
如果要比较多组数据,可以用Kruskal-Wallis检验。
用几次Mann-Whitney 检验来比较多个组间的差异是不适合的,就如同ANOVA不能用多次t检验代替一样。
因此,曼-惠特尼U检验只适用于两独立样本的检验。
3、实例3.1 目的及意义在进行实例分析时,我选取了股票市场的数据。
选取了40个st上市公司的每股收益和40个非st上市公司的每股收益指标,对它们进行分析,看每股收益指标是否存在显著性的差异。
我们都知道st表示被特别处理的上市公司,由于其财务状况出现问题,交易所要对投资者的投资进行提醒,因此会在公司前加上st表示警惕。
但是企业出现st并不是意味着企业的财务状况永久出现问题,它可能在st之后变好,也可能在st之后变坏。
而未被st的企业也不是不可能出现问题。
那么在这种情况下,综合全盘的对st企业和非st企业财务状况进行分析,看它们是否存在显著差异是有意义的。
基于此,我在中国经济与发展统计数据库中《中国证券业年鉴》中找到2012年深圳主板年度财务指标,其中有净利润、每股净收益和每股净资产等财务指标。
由于每股净收益是测定股票投资价值的重要指标之一,也是分析每股价值的一个基础性指标,它综合反映公司的获利能力。
因此,我选取了每股净收益作为进行分析的财务指标。
在报表中我选取了40个st 上市公司的数据,由于st企业数明显比非st企业数量少,因此我从中随机抽取了40个非st 企业进行分析。
希望分析结果能够对投资者的投资决策有一定的参考价值。
3.2 选取的方法及该方法的优缺点由于st企业和非st企业本质上来说没什么联系,因此可以将它们看成两独立样本的参数检验,因此选取了曼-惠特尼U检验。
曼-惠特尼U检验的目的是检验这两个总体的均值是否有显著的差别。
曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。
由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,所以该检验具有比符号检验更优的特性,并且其计算比较简便,能够很快的得出检验结果。
但它也有不足,因为曼-惠特尼U检验比较的是两样本的中位数,所以它其实漏掉了一些信息,这可能导致检验的不准确,可能会得出错误的结论。
3.3 SPSS分析过程数据:曼-惠特尼U检验:可以看出,st企业每股收益的秩均值为36.34,秩和为1453.5;非st企业每股收益的秩均值为44.66,秩和为1786.5。
这样看来,st和非st的每股收益似乎是有明显差异,下面用检验表来确定是否存在差异。
可以看出渐进显著性和精确显著性差距并不大,这里的80个数据可以将它看成大样本,这样我们就可以得出结论。
由于渐进显著性(双侧)值为0.110>0.05,所以不能拒绝原假设,而原假设为st和非st上市公司的每股净收益无差异,因此得出结论,st和非st的每股收益可以看做无差异的。
3.4 结论在对st和非st上市企业的每股收益做曼-惠特尼检验后,我们得出了一个出人意料的结果,即这两种企业的每股净收益是无差别的。
这样的结果确实好像是难以接受,一个财务出现过状况的企业和一个正常健康的企业的怎么可能是一样的呢?但现实是,这里我们只使用了曼-惠特尼U检验来进行检验,根据曼-惠特尼检验的缺点,很有可能出现了偏差。
另一方面,衡量一个企业营运状况的财务指标是很多的,这里选取的每股净收益很可能没有反映出st与非st企业的差别。
这告诉我们,经济问题是非常复杂的,做出结论也非常的困难,应当尽可能多的分析以便做出准确的结论。