环境科学领域学术论文中常用数理统计方法的正确使用问题

合集下载

统计学方法在环境科学研究中的应用分析

统计学方法在环境科学研究中的应用分析

统计学方法在环境科学研究中的应用分析随着环境问题的日益凸显,环境科学研究变得越来越重要。

而统计学作为一门重要的科学方法,被广泛应用于环境科学研究中。

本文将从不同角度探讨统计学方法在环境科学研究中的应用。

首先,统计学方法在环境数据分析中起着重要的作用。

环境科学研究中常常需要收集大量的数据,并进行分析和解读。

统计学方法可以帮助研究人员对数据进行合理的整理和归纳,从而得出准确的结论。

例如,在大气污染研究中,研究人员可以使用统计学方法对不同地区和时间段的空气质量数据进行比较和分析,以了解污染程度的差异和变化趋势。

其次,统计学方法在环境模型建立中具有重要意义。

环境模型是研究环境问题的重要工具,可以帮助研究人员预测和评估环境变化的影响。

统计学方法可以用来对环境数据进行建模和拟合,从而构建出准确的环境模型。

例如,在气候变化研究中,研究人员可以使用统计学方法对气温、降雨等气象数据进行建模,以预测未来的气候变化趋势。

此外,统计学方法还可以在环境监测中发挥重要作用。

环境监测是对环境质量进行实时监测和评估的过程,可以帮助研究人员及时发现和解决环境问题。

统计学方法可以用来分析和解读监测数据,从而提供准确的环境评估结果。

例如,在水质监测中,研究人员可以使用统计学方法对水样的各项指标进行分析,以评估水质的优劣程度。

此外,统计学方法还可以在环境风险评估中发挥重要作用。

环境风险评估是对环境中潜在风险的识别、评估和管理的过程,可以帮助研究人员制定有效的环境保护措施。

统计学方法可以用来分析和解读环境数据,评估环境风险的概率和程度。

例如,在土壤污染评估中,研究人员可以使用统计学方法对土壤样本中的重金属含量进行分析,以评估土壤污染的程度和范围。

综上所述,统计学方法在环境科学研究中具有重要的应用价值。

通过对环境数据的分析、环境模型的建立、环境监测的实施和环境风险的评估,统计学方法可以帮助研究人员更好地理解和解决环境问题。

因此,我们应该进一步加强对统计学方法的学习和应用,以推动环境科学研究的发展和进步。

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究1.引言环境监测是指对环境中各种因素的监测和分析,旨在了解环境状况和变化趋势,为环境保护和治理提供科学依据。

数理统计法是一种应用数学和统计学原理的方法,可以有效地应用于环境监测分析中。

本文将探讨数理统计法在环境监测领域的应用研究。

2.1 基于样本的总体参数估计环境监测中需要对总体参数(如污染物的平均浓度、标准差等)进行估计。

通过对采样数据的分析,可以使用统计推断方法对总体参数进行估计。

常见的估计方法包括点估计和区间估计。

点估计是指通过样本数据计算得到总体参数的一个估计值,区间估计是指通过样本数据计算得到一个区间,该区间内包含总体参数的真实值的概率较高。

2.2 假设检验在环境监测中,需要对研究对象的属性进行比较,评估差异性是否显著。

此时,可以使用假设检验方法。

假设检验的基本思想是在假设总体参数符合某种分布情况的条件下,根据样本数据对假设进行检验,进而得出结论。

常见的假设检验包括t检验、χ²检验等。

2.3 方差分析方差分析是一种通过对数据的方差分解,来评估不同因素对总体参数的影响程度的方法。

环境监测中,可以使用方差分析方法评估各种因素(如不同时间、空间、处理方法等)对污染物浓度的影响程度。

通过方差分析可以有效判断影响因素的显著性。

在环境监测中,需要对不同因素(如温度、湿度、气压等)与污染物浓度之间的关系进行研究。

此时可以使用相关分析方法。

相关分析是一种通过计算两个变量之间的相关系数,来研究它们之间关系的方法。

3.应用案例3.1 某市PM2.5污染物的空气质量监测通过对某市PM2.5污染物的监测,得到7天的空气质量数据,使用t检验方法分析不同天数下PM2.5的浓度是否存在显著差异。

结果显示,95%置信水平下,不同天数下PM2.5的浓度存在显著差异,研究结果得到认可,同时表明需采取更加严格的措施进行PM2.5污染防治。

3.2 某厂区大气污染治理效果评估某厂区通过采取一系列措施实现了大气污染治理,使用方差分析方法评估了不同治理措施对空气质量的影响。

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究
高等数学、统计学和计算机科学在环境监测分析中已经发挥了巨大的作用,尤其是数理统计学的应用,它能够带来更为有效和有效的方法,从而更好地获得环境数据的有效和可靠的信息。

本文旨在研究在环境监测分析中数理统计学的应用。

随着现代社会的发展,空气污染和水质恶化等环境问题对人类生活的影响日益增大。

环境管理亟待有效地获取正确的环境数据,从而开展必要的环境改善措施,保护环境。

数学和计算机科学技术在此事项上可算得上极大的帮助。

数理统计学是环境监测分析的一项重要组成部分,它提供了用于环境数据分析的有效和有效的方法。

例如,统计方法可以有效地分析环境样品,如水、空气和土壤,计算污染物的量和其他相关变量,并为形成有效的环境改善策略提供有力的科学依据。

一些关键环境污染指标也可以通过数理统计学方法计算,环境监测数据分析中的许多方法也可以通过数理统计学方法实现,如贝叶斯网络、支持向量机和回归分析等。

除此之外,统计学在空气污染模型建模和排放估算以及数据收集和分析方面也发挥了重要作用。

综上所述,数理统计在环境监测分析中已经发挥了重要的作用,其在分析环境样品、分析环境污染指标、建模排放估算以及数据收集和分析等多个方面都受到了广泛应用,其更新的方法也在不断地提出和开发。

同时,不断发展的环境污染问题和复杂环境系统需求也更多地使用了数理统计学方法,让更切实可行的结果出现。

统计学方法在环境科学中的应用

统计学方法在环境科学中的应用

统计学方法在环境科学中的应用统计学作为一门研究数据的收集、整理、分析和解释的科学,广泛应用于各个领域。

在环境科学中,统计学方法可以帮助我们全面、客观地认识和解决环境问题。

本文将探讨统计学方法在环境科学中的应用,并介绍一些具体的案例。

一、数据收集和整理环境科学研究往往需要大量的数据支持。

统计学方法可以帮助我们设计合理的样本调查方案,确保数据的可靠性和代表性。

同时,在数据收集过程中,统计学方法也可以帮助我们判断和纠正数据的误差,提高数据的准确性。

例如,在调查某地区水质的研究中,我们可以利用抽样调查的方法,选择一定数量的水样作为代表,通过对这些水样进行测试,得出水质状况的整体情况。

通过统计学方法,我们可以计算出抽样调查的置信区间和显著性水平,评估调查结果的可靠性。

二、数据分析和建模统计学方法在环境科学数据分析中扮演着重要的角色。

通过对数据的分析,可以揭示数据之间的相关性和规律,并且帮助我们预测和解释环境现象。

统计学方法还可以建立数学模型,通过模型挖掘数据背后的信息。

例如,在大气污染研究中,我们可以利用回归分析的方法,分析大气污染物浓度与气象因素、人口密度等之间的关系。

通过建立回归模型,我们可以预测不同因素对大气污染的影响程度,并且提出相应的治理措施。

三、风险评估和决策支持环境科学研究不仅要了解环境问题的现状,还要评估潜在的风险和制定科学合理的决策方案。

统计学方法可以帮助我们对环境风险进行定量评估,并提供科学依据,支持环境政策的制定和决策的实施。

例如,在环境影响评价方面,我们可以利用概率论和统计学方法,对潜在环境影响因素的发生概率和影响程度进行评估。

通过数据的模拟和分析,可以得出不同决策方案下可能出现的环境风险和影响范围,帮助决策者做出科学合理的决策。

结语统计学方法在环境科学中具有广泛的应用前景。

通过数据的收集和整理,数据的分析和建模,风险评估和决策支持等方面的应用,可以更好地认识和解决环境问题。

未来,随着技术的不断进步,统计学方法在环境科学中的应用将会更加深入和广泛,为环境保护和可持续发展提供重要的支持。

学术论文中数理统计方法的正确使用问题[整理版]

学术论文中数理统计方法的正确使用问题[整理版]

环境科学领域学术论文中常用数理统计方法的正确使用问题张利田,卜庆杰,杨桂华,刘秀兰《环境科学学报》编辑部,北京 100085在环境科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题。

而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计。

由于能否正确使用各种数理统计方法关系到能否得出客观和可信的结论,所以,来稿中使用的数理统计方法是否正确是学术期刊编辑们极为重视的问题。

针对近年来《环境科学学报》作者稿件中常见的数理统计方法方面的错误,我们对环境科学领域学术论文中常用数理统计方法(主要是相关分析和回归分析)的正确使用问题进行了初步分析,希望能对《环境科学学报》的作者们有所帮助。

1 统计软件的选择在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。

因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊要求作者采用专门的数理统计软件进行统计分析。

我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析。

由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件。

目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTICA等。

其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

目前,国际学术界有一条不成文的约定:凡是用SPSS和SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究一、引言环境污染是当前全球面临的重要问题之一。

随着工业化的快速发展和人类活动的增加,大气、水、土壤等环境资源受到了严重的破坏和污染。

为了保护环境和人类健康,环境监测变得至关重要。

而在环境监测中,数理统计法在数据分析和模型建立中发挥着重要作用。

本文将围绕数理统计法在环境监测分析中的研究展开讨论。

二、数理统计法在环境监测中的应用1. 数据收集与处理在环境监测中,数据的准确性和可靠性对于分析结果的可信度至关重要。

而数理统计法可以帮助我们在数据收集过程中进行质量控制,剔除异常值和处理缺失值,提高数据的质量。

数理统计法可以对大量的监测数据进行分析和整合,发现数据之间的关联性和规律性,为后续的环境分析提供基础。

2. 空间分布分析环境监测数据通常具有空间关联性,例如大气污染物的浓度在城市内的分布不均匀。

数理统计法可以通过空间插值技术对监测数据进行空间分布分析,揭示环境因素的空间变化规律,为环境治理和规划提供科学依据。

3. 趋势分析环境监测数据通常包括长期的时间序列数据,例如气象数据、水质数据等。

数理统计法可以通过时间序列分析技术对数据进行趋势分析,识别环境质量的长期趋势和周期性变化,为环境保护政策的制定提供科学参考。

4. 风险评估环境监测数据的分析不仅可以帮助我们了解环境质量状况,还可以帮助我们评估环境风险。

数理统计法可以通过概率统计模型对环境风险进行定量分析,评估环境事件的可能性和影响程度,为环境管理和决策提供科学依据。

以PM2.5为例,研究者收集了多个城市的大气监测数据,并利用克里格插值法进行了空间分布分析。

结果显示,PM2.5的浓度在城市内存在较大的空间差异,且存在明显的空间相关性。

通过数理统计法的帮助,研究者发现了不同区域的污染状况,并为相关城市的环境管理提出了合理的建议。

2. 水质监测数据趋势分析研究者利用时间序列分析方法对某一江河水质监测数据进行了趋势分析。

结果表明,该江河水质存在着逐渐恶化的趋势,并且在特定月份存在周期性的波动。

浅谈环境统计工作存在的问题及改进对策[推荐五篇]

浅谈环境统计工作存在的问题及改进对策[推荐五篇]

浅谈环境统计工作存在的问题及改进对策[推荐五篇]第一篇:浅谈环境统计工作存在的问题及改进对策浅谈环境统计工作存在的问题及改进对策监督检测中心环保站杜杨论文摘要:本文主要阐述了环境统计工作中存在的一些问题,以及自己对改进这些问题的一些简单的看法。

关键词:环境统计,时效性,统计能力,准确性一、环境统计现状环境统计是我国国民经济和社会发展统计的重要组成部分。

环境统计数据是环保工作的基础和依据,具有法律权威性。

随着环保事业的快速发展,对环境信息质量要求越来越高。

然而现行的体制和统计方法使统计工作难抗干扰,违法统计屡禁不止。

虚假数字误导了公众和决策者,给宏观管理造成巨大损失,并影响了政府的声誉。

各级环保部门都认识到数据失实的危害性,改革势在必行。

但是,体制改革极其复杂,过程是漫长的、艰难的。

二、环境统计工作存在的问题1、指标体系设置不合理不同企业的工作方向不同,产生的污染也不同,但是却采用相同的环境统计报表格式,这样就难免存在一些不合理的设置,譬如混淆指标名称,格式过于死板不灵活等,还有一些数据在环保方面并无意义,却仍需要填报,无形中增加了环境报表的上报速度。

2、数据时效性较差现在我们向环保局报送的环境统计报表主要是季度报表和年报表以及申报表。

这三种报表是互相关联的,也存在数据的重复填报。

然而污染物本身就存在一定的瞬时性,一份监测报告甚至需要用于全年的环境统计报表,时效性确实比较差,并不能反映实际的污染状态。

三、环境统计工作存在问题的原因1、环境统计能力不强从事环境统计的人员应当深入实际调查研究,而不是坐在办公室用电话要几个数据汇总上报, 既要核实数据的真实性, 也应潜心做环境统计分析。

但是各单位的环境统计人员一般都身兼多职,不是专门负责环保,所以不能够把精力全部投入到环境统计工作中。

目前我们的环境统计手段还相对落后, 能力比较薄弱, 环境统计的计量较难处理。

规定污染源排放量以监测数据为准, 但监测站的六个人面对几十家单位污染源每月监测, 另外再加上其它常规监测任务,压力太大。

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究【摘要】本文主要探讨了数理统计法在环境监测分析中的应用。

首先介绍了研究背景和研究意义,随后详细阐述了数理统计法在环境监测中的应用和优势。

具体分析了数理统计法在空气污染、水质和土壤污染监测中的实际应用情况。

最后对数理统计法在环境监测分析中的未来发展进行了展望,并总结了当前研究的成果和不足之处。

本文旨在为环境监测领域的研究提供参考,并促进数理统计法在环境监测中的进一步发展和应用。

【关键词】数理统计法、环境监测、空气污染、水质监测、土壤污染、未来发展、总结、展望1. 引言1.1 研究背景在过去的研究中,传统的环境监测方法往往只能提供静态的数据,难以全面反映环境变化的动态过程。

而数理统计法能够通过建立模型,预测未来的环境变化趋势,为环境管理和政策制定提供更科学的依据。

对数理统计法在环境监测分析中的研究具有重要意义。

通过深入研究数理统计法在环境监测中的应用,可以更有效地提高环境监测的准确性和可靠性,为有效防治环境污染提供技术支持和决策依据。

在这样的背景下,开展数理统计法在环境监测分析中的研究具有重要意义和广阔的发展前景。

1.2 研究意义数统计、格式要求等。

谢谢!环境监测是人类社会发展的重要组成部分,随着工业化和城市化的不断加快,环境污染问题日益突出,给人类健康和生态安全带来了严重威胁。

数理统计法在环境监测分析中的应用具有重要的意义,通过对环境监测数据进行统计分析,可以揭示环境污染的时空分布规律,为环境保护决策提供科学依据。

数理统计法在环境监测中的优势显著,能够更准确地评估环境质量,为监测结果的准确性和可靠性提供保障。

深入研究数理统计法在环境监测中的应用对于改善环境质量、保障人类健康和促进可持续发展具有重要的现实意义和深远影响。

希望通过本文的探讨,能够进一步推动数理统计法在环境监测领域的应用和发展,为构建美丽中国、实现可持续发展贡献力量。

2. 正文2.1 数理统计法在环境监测中的应用数理统计法在环境监测中的应用是非常重要的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

环境科学领域学术论文中常用数理统计方法的正确使用问题张利田,卜庆杰,杨桂华,刘秀兰《环境科学学报》编辑部,北京 100085在环境科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题。

而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计。

由于能否正确使用各种数理统计方法关系到能否得出客观和可信的结论,所以,来稿中使用的数理统计方法是否正确是学术期刊编辑们极为重视的问题。

针对近年来《环境科学学报》作者稿件中常见的数理统计方法方面的错误,我们对环境科学领域学术论文中常用数理统计方法(主要是相关分析和回归分析)的正确使用问题进行了初步分析,希望能对《环境科学学报》的作者们有所帮助。

1 统计软件的选择在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。

因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊都要求作者采用专门的数理统计软件进行统计分析。

我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析。

由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件。

目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTICA等。

其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

目前,国际学术界有一条不成文的约定:凡是用SPSS和SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。

由此可见,SPSS和SAS软件已被各领域研究者普遍认可。

我们建议《环境科学学报》的作者们在进行统计分析时尽量使用这2个专门的统计软件。

目前,有关这2个软件的使用教程在书店中可很容易地买到。

2 均值的计算在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。

此时,多数作者会不假思索地直接给出算术平均值和标准差。

显然,这种做法是不严谨的。

在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等。

何时用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定,而要根据随机变量的分布特征确定。

反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其总体的数学期望就是其算术平均值。

此时,可用样本的算术平均值描述随机变量的大小特征。

如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。

在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。

如果服从对数正态分布,则可用几何平均值描述该随机变量总体的大小。

此时,就可以计算变量的几何平均值。

如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。

退而求其次,此时可用中位数来描述变量的大小特征。

3 相关分析中相关系数的选择在相关分析中,作者们常犯的错误是简单地计算Pearson 积矩相关系数,而且既不给出正态分布检验结果,也往往不明确指出所计算的相关系数就是Pearson 积矩相关系数。

常用的相关系数除有Pearson 积矩相关系数外,还有Spearman秩相关系数和Kendall秩相关系数等。

其中,Pearson 积矩相关系数可用于描述2个随机变量的线性相关程度(相应的相关分析方法称为“参数相关分析”,该方法的检验功效高,检验结果明确);Spearman或Kendall秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势,而不考虑其变化的幅度(相应的相关分析称为“非参数相关分析” ,该方法的检验功效较参数方法稍差,检验结果也不如参数方法明确)。

各种成熟的统计软件如SPSS、SAS等均提供了这些相关系数的计算模块。

在相关分析中,计算各种相关系数是有前提的。

对于二元相关分析,如果2个随机变量服从二元正态分布,或2个随机变量经数据变换后服从二元正态分布,则可以用Pearson 积矩相关系数描述这2个随机变量间的相关关系(此时描述的是线性相关关系),而不宜选用功效较低的Spearman或Kendall秩相关系数。

如果样本数据或其变换值不服从正态分布,则计算Pearson 积矩相关系数就毫无意义。

退而求其次,此时只能计算Spearman或Kendall秩相关系数(尽管这样做会导致检验功效的降低)。

因此,《环境科学学报》编辑部要求作者在报告相关分析结果时,还应提供正态分布检验结果,以证明计算所选择的相关系数是妥当的。

需要指出的是,由于Spearman或Kendall秩相关系数是基于顺序变量(秩)设计的相关系数,因此,如果所采集的数据不是确定的数值而仅仅是秩,则使用Spearman或Kendall秩相关系数进行非参数相关分析就成为唯一的选择。

4相关分析与回归分析的区别相关分析和回归分析是极为常用的2种数理统计方法,在环境科学及其它科学研究领域有着广泛的用途。

然而,由于这2种数理统计方法在计算方面存在很多相似之处,且在一些数理统计教科书中没有系统阐明这2种数理统计方法的内在差别,从而使一些研究者不能严格区分相关分析与回归分析。

最常见的错误是,用回归分析的结果解释相关性问题。

例如,作者将“回归直线(曲线)图”称为“相关性图”或“相关关系图”;将回归直线的R2(拟合度,或称“可决系数”)错误地称为“相关系数”或“相关系数的平方”;根据回归分析的结果宣称2个变量之间存在正的或负的相关关系。

这些情况在《环境科学学报》的来稿中极为普遍。

相关分析与回归分析均为研究2个或多个随机变量间关联性的方法,但2种数理统计方法存在本质的差别,即它们用于不同的研究目的。

相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度),回归分析的目的则在于试图用自变量来预测因变量的值。

在相关分析中,两个变量必须同时都是随机变量,如果其中的一个变量不是随机变量,就不能进行相关分析。

这是相关分析方法本身所决定的。

对于回归分析,其中的因变量肯定为随机变量(这是回归分析方法本身所决定的),而自变量则可以是普通变量(规范的叫法是“固定变量”,有确定的取值)也可以是随机变量。

如果自变量是普通变量,采用的回归方法就是最为常用的“最小二乘法”,即模型Ⅰ回归分析;如果自变量是随机变量,所采用的回归方法与计算者的目的有关---在以预测为目的的情况下,仍采用“最小二乘法”,在以估值为目的的情况下须使用相对严谨的“主轴法”、“约化主轴法”或“Bartlett法”,即模型Ⅱ回归分析。

显然,对于回归分析,如果是模型Ⅰ回归分析,就根本不可能回答变量的“相关性”问题,因为普通变量与随机变量之间不存在“相关性”这一概念(问题在于,大多数的回归分析都是模型Ⅰ回归分析!)。

此时,即使作者想描述2个变量间的“共变趋势”而改用相关分析,也会因相关分析的前提不存在而使分析结果毫无意义。

如果是模型Ⅱ回归分析,鉴于两个随机变量客观上存在“相关性”问题,但因回归分析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段,因此,若以预测为目的,最好不提“相关性”问题;若以探索两者的“共变趋势”为目的,建议作者改用相关分析。

需要特别指出的是,回归分析中的R2在数学上恰好是Pearson积矩相关系数r的平方。

因此,这极易使作者们错误地理解R2的含义,认为R2就是“相关系数”或“相关系数的平方”。

问题在于,对于自变量是普通变量(即其取值具有确定性)、因变量为随机变量的模型Ⅰ回归分析,2个变量之间的“相关性”概念根本不存在,又何谈“相关系数”呢?(说明:二元回归可决系数符号用小写r2)5 显著性水平相关分析及正态分布检验等均为基于假设检验的统计分析方法。

而显著性水平的确定是假设检验中至关重要的问题。

显著性水平反映了拒绝某一原假设时所犯错误的可能性。

通常,拒绝客观上正确的原假设的几率用α值表示,该值被称为假设检验的显著性水平(Significant level)。

α值一般在进行假设检验前由研究者根据需要确定,常用的取值是0.05或0.01。

对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能性为95%;对于后者,则研究者接受事实上正确的原假设的可能性为99%。

显然,降低α值可以减少拒绝原假设的可能性。

因此,在报告统计分析结果时,必须给出α值。

在进行统计分析时,各种统计软件通常在给出检验统计量的同时,也给出该检验统计量取值的相伴概率(即某特定取值及更极端可能值出现的准确概率,用p表示)。

p 值是否小于事先确定的α值,是接受或拒绝原假设的依据。

如果p值小于事先已确定的α值,就意味着原假设成立的可能性很小,因而可以拒绝原假设。

相反,如果p值大于事先已确定的α值,就意味着原假设成立的可能性较大,因而不能拒绝原假设。

在计算机软件尚不普及的情况下,计算检验统计量并与特定显著性水平的临界值比较是简洁的方法,但在计算机软件很普及的今天,建议直接使用p值进行统计推断,并在结果中给出p,以表达精确错误率。

以二元相关分析为例,相关分析中的原假设是“相关系数为零”(即2个随机变量间不存在显著的相关关系)。

如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),就可以认为“相关系数为零”的可能性很低,2个随机变量之间存在明显的相关关系。

与相关分析不同,在正态分布检验时,原假设是“样本数据来自服从正态分布的总体”。

此时,如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),则表明数据不服从正态分布。

在本刊来稿中,作者在描述相关分析结果时常有的失误是仅给出相关系数的值,而不给出显著性水平。

这就无法判断2个随机变量间的相关性是否显著。

此外,作者在论文中常常用“显著相关”和“极显著相关”来描述相关分析结果,即认为p值小于0.05就是显著相关关系(或显著相关),小于0.01就是极显著相关关系(或极显著相关)。

显然,这也是不规范的。

在假设检验中,只有“显著”和“不显著”,没有“极显著”这样的提法(令人遗憾的是,有些统计软件教程中也有此种提法)。

只要计算出的检验统计量的相伴概率(p值)低于事先确定的α值,就可以认为检验结果“显著”(相关分析的原假设是“相关系数为零”,故此处的“显著”实际意味着“相关系数不为零”,或说“2个随机变量间有显著的相关关系”);同样,只要计算出的检验统计量的相伴概率(p 值)高于事先确定的α值,就可以认为检验结果“不显著”。

相关文档
最新文档