数据统计分析实验指导书

合集下载

《数据分析》课程标准

《数据分析》课程标准

《数据分析》课程标准1000字《数据分析》课程标准一、课程简介《数据分析》是一门针对数据分析领域的计算机类课程。

本课程主要介绍数据分析的基本概念、方法和工具,并利用大量实例向学生介绍如何使用相应的软件工具来分析数据。

本课程旨在培养学生的数据分析能力和信息素养。

二、课程目标本课程的目标是让学生从以下三个方面能够掌握数据分析的基础知识:1. 熟悉数据分析的基本概念和方法,并能够运用它们分析数据。

2. 掌握数据分析相关的软件工具,如Excel、SPSS等,并能够运用这些工具进行数据分析。

3. 进一步提高学生的信息素养,让他们能够更好地应对信息化时代的挑战。

三、教学内容1. 数据分析的基本概念和方法:介绍数据类型、样本和总体、统计量等基本概念,以及数据的可视化、统计推断、假设检验、回归分析等基本方法。

2. 数据分析软件工具:介绍Excel、SPSS、R等数据分析软件的基本操作和功能。

3. 实例分析:结合具体的实例,让学生练习使用相应的软件工具进行数据分析。

4. 数据挖掘:介绍数据挖掘的基础知识和算法,并以实例为基础练习数据挖掘技术。

四、教学方法1. 理论讲授:通过课堂讲解和PPT展示,向学生介绍数据分析的基本概念和方法。

2. 实践教学:通过实践练习,让学生熟练地掌握数据分析软件工具的操作和应用。

3. 课堂互动:通过课堂提问、讨论等方式,促进学生对知识的理解和掌握。

五、教学评估1. 平时成绩:平时成绩包括作业和参与度两部分,其中作业占60%,参与度占40%。

2. 期末考试:期末考试采用闭卷形式,考查学生对数据分析的理解和应用能力。

3. 综合评价:根据学生的平时表现和期末考试成绩,综合评价学生的课程成绩。

六、教学资源本课程的教学资源主要包括教师PPT、实验指导书、实验数据等。

同时,学生也可以通过网络、书籍等途径加强自学。

本课程鼓励学生应用网络、图书馆等资源,提高信息检索与利用的能力。

七、课程时间分配本课程一般分配为32个学时,时间分配如下:1. 数据分析基础(8学时),包括数据类型、样本和总体、统计量等基本概念。

多元统计分析实验指导书——实验一-均值向量和协方差阵检验

多元统计分析实验指导书——实验一-均值向量和协方差阵检验

实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。

同时能够掌握对均值向量和协方差阵进行检验。

【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。

【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。

【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。

2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。

4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。

5.上机时间,禁止使用计算机从事与课程无关的工作。

【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。

表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男156.42 47.54 75 79 345.00200202 许兆辉男155.73 37.83 78 76 435.00200203 王鸿屿男144.6 38.66 65 88 643.50200204 江飞男161.5 41.68 79 82 235.50200205 袁翼鹏男161.3 43.36 82 77 867.00200206 段燕女158 47.35 81 74200207 安剑萍女161.5 47.44 77 69 1233.00200208 赵冬莉女162.76 47.87 67 73 767.80200209 叶敏女164.3 33.85 64 77 553.90200210 毛云华女144 33.84 70 80 343.00200211 孙世伟男157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00200213 欧阳已祥男168.55 50.67 79 79 657.40200214 贺以礼男164.5 44.56 75 80 1863.90200215 张放男153 58.87 76 69 462.20200216 陆晓蓝女164.7 44.14 80 83 476.80200217 吴挽君女160.5 53.34 79 82200218 李利女147 36.46 75 97 452.80200219 韩琴女153.2 30.17 90 75 244.70200220 黄捷蕾女157.9 40.45 71 80 253.00 要求:1)变量名同表格名,以“()”内的内容作为变量标签。

SPSS统计分析及统计图表的绘制指导书11

SPSS统计分析及统计图表的绘制指导书11

实验三SPSS统计分析与统计图表的绘制一、实验目的要求学生能够进行基本的统计分析;能够对频数分析、描述分析和探索分析的结果进行解读;完成基本的统计图表的绘制;并能够对统计图表进行编辑美化与结果分析;能够理解多元统计分析的操作(聚类分析和因子分析)。

二、实验内容与步骤2.1 基本的统计分析打开“分析/描述统计”菜单,可以看到以下几种常用的基本描述统计分析方法:1.Frequencies过程(频数分析)频数分析可以考察不同的数据出现的频数与频率,并且可以计算一系列的统计指标,包括百分位值、均值、中位数、众数、合计、偏度、峰度、标准差、方差、全距、最大值、最小值、均值的标准误等。

2.Descriptives过程(描述分析)调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,包括:均值、合计、标准差、方差、全距、最大值、最小值、均值的标准误、峰度、偏度等。

3.Explore过程(探索分析)调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。

它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。

Descriptives:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;Confidence Interval for Mean:平均值的%估计;M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;Outliers:输出五个最大值与五个最小值;Percentiles:输出第5%、10%、25%、50%、75%、90%、95%位数。

4.Crosstabs过程(列联表分析)调用此过程可进行计数资料和某些等级资料的列联表分析,在分析中,可对二维至n维列联表(RC表)资料进行统计描述和χ2 检验,并计算相应的百分数指标。

统计实验指导书(1)某企业职工收入抽样调查数据的描述性分析

统计实验指导书(1)某企业职工收入抽样调查数据的描述性分析

实验1 数据的整理与显示
某企业职工收入抽样调查数据的描述性分析
一、实验目的
通过本次实验,使学生逐步熟悉EXCEL的基本操作,并学会利用EXCEL 进行统计数据的整理和描述性统计分析。

基本的数据整理包括录入统计数据、建立数据清单、按照关键字对数据进行排序,以及对排序结果加以分析。

学会统计分组的几种方法,尤其要掌握统计分组函数FREQUENCY的使用。

掌握常见统计表与统计图的绘制方法。

二、实验要求
1、数据录入
2、数据排序与数据分组
3、统计表与统计图
三、实验内容
假设你在某市场调研公司工作,现打算对某企业进行一次关于员工收入的调查。

调查的主要变量是年收入,被调查者的特征变量有性别、年龄、学历和职业等。

抽样调查的数据见附表1。

问题
(1)要求学生利用本案例的数据,利用描述统计方法对数据进行分组汇总和整理;
(2)根据数据的特点和类型,选择适当的图形展示数据。

(至少要有三种图形)
附表1:X公司员工收入基本状况调查表。

环境监测数据分析作业指导书

环境监测数据分析作业指导书

环境监测数据分析作业指导书一、背景介绍环境监测是对环境中各种物质、能量和生物的定性和定量观测、记录和评价,旨在了解环境质量状况,为环境保护和管理提供科学依据。

环境监测数据分析是对收集到的环境监测数据进行处理和分析,以得出合理的结论和建议。

本次作业指导书将为你提供环境监测数据分析的指导方法和步骤。

二、数据处理1. 数据清洗环境监测数据的准确性和完整性对于后续的分析非常重要。

在进行数据分析之前,需要先对数据进行清洗,包括去除异常值、填补缺失值等。

异常值可能是由于设备故障或人为因素引起的,需要通过合理的方法进行判断和处理。

对于缺失值,可以通过插值法进行填补,如线性插值、多重插补等。

2. 数据转换某些数据的分布可能不满足正态分布的要求,为了满足分析的前提条件,可以对数据进行转换。

常用的数据转换方法包括对数转换、平方根转换、指数转换等。

根据数据的实际情况选择合适的转换方法,并进行相应的操作。

三、数据分析1. 描述统计分析描述统计分析是对环境监测数据进行总结和描述的方法。

通过计算均值、标准差、最小值、最大值等统计指标,可以对数据的集中趋势和离散程度进行描述。

此外,还可以通过绘制直方图、箱线图等图表来展示数据的分布情况。

2. 相关性分析相关性分析可以用来研究环境监测数据之间的相关程度。

通过计算相关系数(如Pearson相关系数、Spearman相关系数等),可以判断两个变量之间的线性关系是否显著。

此外,还可以利用散点图来直观地表示两个变量之间的关系。

3. 回归分析回归分析是用来研究自变量与因变量之间关系的方法。

通过建立数学模型,可以预测因变量的取值。

在环境监测数据分析中,可以利用回归分析来研究环境因素对某个指标的影响程度。

常用的回归方法包括线性回归、多项式回归、逐步回归等。

四、结果解释与评估在进行数据分析后,需要对结果进行解释和评估。

解释分析结果时,要注意结果的可靠性和可解释性。

要针对问题提出合理的解释,并结合实际情况给出相应的建议。

SPSS统计分析实验指导

SPSS统计分析实验指导

>1000
图 1-4 变量值标签定义对话框
2 数据的输入
(1)直接从数据编辑窗口的输入数据:先将变量定义好后,变量名就会在每列的上面显示,可以看到 其格式如 Excel,其实输入及编辑方法也和 Excel 相当。请同学们自己练习。数据输入及编辑窗口如图 1-5 所示(见 Excel 表 1-2),是将表 1-2 所示数据建立成 SPSS 文件。
(二)信息的输入和输出 1 统计变量的定义
(1)变量:SPSS 中的变量与数学中的变量定义相同,即其值可变的量称为变量。SPSS 中变量的属性 主要有四个:变量名、变量类型、变量标签、变量长度。定义变量时至少要有变量名和变量类型。变量定义 窗口如图 1-2 所示。
图 1-2 变量定义窗口
(2)变量类型:SPSS 中有三种基本类型:Numeric(数值型),String(字符型),Date(日期型)。数 值型变量按不同要求可分为五种,再加上自定义型,所以可以定义的类型变量有八种。系统默认的变量类型 为标准数值型,长度为 8,小数占两位。变量类型对话框如 1-3 所示,每种变量的具体定义请参阅相关参考 资料。
2) 变量值标签(Value Labels) 变量值标签是对变量的取值所附加的进一步说明。对分类变量往往要定义其取值的标签。如对收入以 500 的间距进行分类,如表 1-1 定义变量的值标签:
表 1-1 变量值标签的定义实例
变量名
变量值
变量值标签
1
<=500
C
2
501-1000
3
定义变量值标签的对话框如图 1-4 所示
图 1-1 SPSS 11.5 for Windows 主环境
3 SPSS for Windows 功能介绍

实验指导书

实验指导书

实验指导书一、实验目的本实验旨在帮助学生掌握实验室基本操作技能,提高实验仪器的使用水平,培养实验设计和实验数据处理的能力。

二、实验器材本实验所需器材如下:1. 显微镜2. 高压电源3. 量筒4. 试剂瓶5. 称量瓶6. 烧杯7. 导线8. 静电仪9. 板卡三、实验步骤1. 实验前准备a. 检查所需实验器材是否准备齐全。

b. 清洗实验器材,确保没有污染物。

c. 与实验小组成员分工合作,确定实验计划和操作流程。

2. 实验操作a. 根据实验要求,配置实验所需试剂。

b. 根据实验要求,进行量筒、称量瓶等设备的校准工作。

c. 进行实验样品的制备或准备好实验样品,保证实验数据的准确性。

d. 启动实验仪器,根据仪器指南进行操作。

e. 记录实验过程中的操作步骤以及观察到的现象。

f. 根据实验数据,进行相应的统计和处理。

3. 实验结果分析a. 对实验结果进行详细的数据分析,包括数值计算和统计处理。

b. 根据实验结果,结合实验目的,进行合理的结论推理。

4. 实验报告编写a. 撰写实验报告,按照规定的格式进行排版。

b. 在实验报告中清晰地介绍实验目的、实验原理、实验步骤和实验结果。

c. 分析实验结果,展示数据处理方法和结果。

d. 提出实验中存在的问题和改进方案。

e. 根据实验所得结果,进行相关的讨论和思考。

四、实验注意事项1. 实验过程中要佩戴实验手套、实验眼镜等个人防护装备,确保实验安全。

2. 实验前请仔细阅读实验指导书,并熟悉实验原理和操作方法。

3. 操作实验仪器时要小心谨慎,避免操作失误和仪器损坏。

4. 实验过程中要注意环境卫生,保持实验台面的整洁。

5. 实验结束后,将实验器材进行清洗归位,保持实验室的整洁。

五、实验安全提示1. 实验过程中要避免接触有毒有害物品,如酸碱溶液等。

2. 实验操作时要注意电源的正确使用,以避免触电事故的发生。

3. 实验中如遇到异常情况,应立即停止操作并向实验室管理员报告。

六、实验评分标准1. 实验仪器的正确使用和操作流程的掌握程度。

数据与分析实验报告

数据与分析实验报告

数据与分析实验报告1. 引言数据分析是一种通过分析和解释数据来确定模式、关系以及其他有价值信息的过程。

在现代社会中,数据分析已经成为各个领域中不可或缺的工具。

本实验旨在通过对一个特定数据集的分析,展示数据分析的过程以及结果的解读和应用。

本实验选择了一组关于学业表现的数据进行分析,并探讨了学生的各项指标与其学习成绩之间的关系。

2. 数据集描述本次实验所使用的数据集是一个包含了1000名学生的学术成绩和相关指标的数据集。

数据集中包含了每位学生的性别、年龄、是否拥有本科学历、成绩等信息。

数据集以CSV格式提供。

3. 数据清洗与预处理在进行数据分析之前,首先需要进行数据清洗和预处理的工作,以保证后续分析的准确性和可靠性。

本实验中的数据集在经过初步检查后,发现存在一些缺失值和错误值。

为了保证数据的完整性,我们采取了以下措施进行数据清洗:- 删除缺失值:对于存在缺失值的数据,我们选择了删除含有缺失值的行。

- 纠正错误值:通过对每个指标的合理范围进行了限定,排除了存在明显错误值的数据。

此外,还进行了数据的标准化处理,以确保各项指标具有可比性。

4. 数据探索与分析4.1 性别与学习成绩的关系为了探究性别与学习成绩之间的关系,我们进行了如下分析:- 绘制了性别与学习成绩的散点图,并使用不同的颜色进行了标记。

通过观察散点图,我们可以初步得出性别与学习成绩之间存在一定的关系。

但由于性别只是一个二分类变量,为了更加准确地探究性别与学习成绩之间的关系,我们使用了ANOVA分析进行了验证。

4.2 年龄与学习成绩的关系为了探究年龄与学习成绩之间的关系,我们进行了如下分析:- 将学生按年龄分组,计算每个年龄组的平均成绩,并绘制了年龄与学习成绩的折线图。

通过观察折线图,我们可以发现年龄与学习成绩之间存在一定的曲线关系。

年龄在一定范围内的增长会对学习成绩产生积极影响,但随着年龄的增长,学习成绩会逐渐下降。

4.3 学历与学习成绩的关系为了探究学历与学习成绩之间的关系,我们进行了如下分析:- 计算了不同学历组的平均学习成绩,并绘制了学历与学习成绩的柱状图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据统计分析》实验指导书彭志捌编写适用专业:信息与计算科学安徽建筑大学数理系(部)2012年10月前言本指导手册作为《数据统计分析》课程中部分的实验内容,因而对涉及的多元统计知识一般只做简要的概括而不作详细解释。

也不是SPSS 的使用说明书,并假设使用者已经掌握了基本的Windows和MS Office的操作知识,对基础的操作以及超出统计学原理范围的功能一般未作介绍。

涵盖了大部分常用的统计方法,包括了基本的数据处理技巧、描述统计、统计图和统计表、方差分析、回归分析、主成分分析、因子分析、判别分析、聚类分析等方面的内容。

为了使学生更好地理解和深刻地掌握这些知识,需要学生上机实际操作SPSS应用统计软件。

实验环境使用SPSS 版本为18.0系统或以上。

实验一描述性统计分析一、实验目的与要求统计分析的目的在于研究总体特征。

但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。

因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。

通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。

本本实验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。

二、实验原理描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。

集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。

其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。

离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。

其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。

分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。

三、实验内容与步骤下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。

1.频数分析(Frequencies)1基本统计分析往往从频数分析开始。

通过频数分析能够了解变量取值的状况,1频数分析多适用于离散变量,其功能是描述离散变量的分布特征。

对把握数据的分布特征是非常有用的。

比如,在某项调查中,想要知道被调查者的性别分布状况。

频数分析的第一个基本任务是编制频数分布表。

SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值落在某个区间中的次数。

(2)百分比(Percent)即各频数占总样本数的百分比。

(3)有效百分比(Valid Percent)即各频数占有效样本数的百分比。

这里有效样本数=总样本-缺失样本数。

(4)累计百分比(Cumulative Percent)即各百分比逐级累加起来的结果。

最终取值为百分之百。

频数分析的第二个基本任务是绘制统计图。

统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。

频数分析中常用的统计图包括:条形图,饼图,直方图等。

频数分析的应用步骤在SPSS中的频数分析的实现步骤如下:选择菜单“【文件】—>【打开】—>【数据】”在对话框中找到需要分析的数据文件“SPSS/Employee data”,然后选择“打开”。

选择菜单“【分析】—>【描述统计】—>【频率】”。

如图1.1所示询问是否输出频数分布表图1.1 Frequencies对话框确定所要分析的变量,例如年龄在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图1.2所示,选择统计输出选项。

图1.2 统计量子对话框图1.3 Charts子对话框结果输出与分析点击Frequencies 对话框中的“OK”按钮,即得到下面的结果。

表1.4 描述性统计量Statistics表1.4中给出了总样本量(N),其中变量Gender的有效个数(Valid)为474个、缺失值(missing)为0。

表1.5中,Frequency是频数,Percent是按总样本量为分母计算的百分比,Valid Percent是以有效样本量为分母计算的百分比,Cumulative Percent是累计百分比。

图1.5变量Gender的条形图,图1.6变量Gender的饼图。

图1.5 变量gender的条形图图1.6 变量gender的饼图2.描述统计(Descriptives)2SPSS的【描述】命令专门用于计算各种描述统计性统计量。

本节利用某年国内上市公司的财务数据来介绍描述统计量在SPSS中的计算方法。

具体操作步骤如下:2描述统计主要对定距型或定比型数据的分布特征作具体分析。

选择菜单【分析】→【描述统计】→【描述】,如图1.7所示图1.7 描述对话框将待分析的变量移入Variables列表框,例如将每股收益率、净资产收益率、资产负债率等2个变量进行描述性统计,以观察上市公司股权集中度情况和负债比率的高低。

Save standardized values as variables,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。

其变量名为相应变量名前加前缀z。

标准化计算公式:s xxi Zi -=单击【选项】按钮,如图1.8 所示,选择需要计算的描述统计量。

各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。

图1.8 选项子对话框在主对话框中单击ok执行操作。

结果输出与分析在结果输出窗口中给出了所选变量的相应描述统计,如表1.6所示。

从表中可以看到,我国上市公司前两大股东持股比例之比平均高达102.9,说明“一股独大”的现象比较严重;前五大股东持股比例之和平均为51.8%,资产负债率平均为46.78%。

另外,从偏态和峰度指标看出,前两大股东持股比例之比的分布呈现比较明显的右偏,而且比较尖峭。

为了验证这一结论,可以利用Frequencies命令画出变量z的直方图,如图1.9表1.6 描述统计量表Descriptive Statistics图1.9 变量Z的直方图3.探索分析(Explore)调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。

它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步。

探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。

一般以图形方式输出,直观帮助研究者确定奇异值、影响点、还可以进行假设检验,以及确定研究者要使用的某种统计方式是否合适。

在打开的数据文件上,选择如下命令:选择菜单“【分析】—>【描述统计】—>【探索】”,打开对话框。

因变量列表;待分析的变量名称,例如将每股收益率作为研究变量。

因子列表:从源变量框中选择一个或多个变量进入因子列表,分组变量可以将数据按照该观察值进行分组分析。

标准个案:在源变量表中指定一个变量作为观察值的标识变量。

在输出栏中,选择两者都,表示输出图形及描述统计量。

选择【统计量】按钮,选择想要计算的描述统计量。

如图所示对所要计算的变量的频数分布及其统计量值作图打开“Plots对话框”,出现如下图。

结果的输出与说明(1)Case Processing Summary 表在Case Processing Summary 表中可以看出female 有216个个体,Male258个个体,均无缺失值。

(2)Descriptives 表DescriptivesGender Statistic Std. Error Current Salary Female Mean $26,031.92 $514.25895% Confidence Interval for Mean Lower Bound $25,018.29 Upper Bound$27,045.555% Trimmed Mean $25,248.30Median $24,300.00Variance 57123688.268Std. Deviation $7,558.021Minimum $15,750Maximum $58,125Range $42,375 Interquartile Range $7,013Skewness 1.863 .166 Kurtosis 4.641 .330Male Mean$41,441.78 $1,213.96895% Confidence Interval for Mean Lower Bound $39,051.19 Upper Bound$43,832.375% Trimmed Mean $39,445.87Median $32,850.00Variance 380219336.303Std. Deviation $19,499.214Minimum $19,650Maximum $135,000Range $115,350Interquartile Range $22,675Skewness 1.639 .152Kurtosis 2.780 .302 (3)职位员工薪水直方图显示(4)茎叶图描述茎叶图自左向右可以分为3 大部分:频数(Frequency)、茎(Stem)和叶(Leaf)。

茎表示数值的整数部分,叶表示数值的小数部分。

每行的茎和每个叶组成的数字相加再乘以茎宽(Stem Width),即茎叶所表示的实际数值的近似值。

Current Salary Stem-and-Leaf Plot forgender= FemaleFrequency Stem & Leaf2.00 1 . 5516.00 1 . 666666666677777714.00 1 . 8888999999999931.00 2 . 000000000000011111111111111111135.00 2 . 2222222222222222222223333333333333338.00 2 . 4444444444444444444444444455555555555522.00 2 . 666666666667777777777717.00 2 . 888888999999999997.00 3 . 00011118.00 3 . 222333338.00 3 . 444445555.00 3 . 667772.00 3 . 8811.00 Extremes (>=40800)Stem width: 10000Each leaf: 1 case(s)(5)箱图图中灰色区域的方箱为箱图的主体,上中下3 条线分别表示变量值的第75、50、25百分位数,因此变量的50%观察值落在这一区域中。

相关文档
最新文档