SPSS第三章 描述统计

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

利用SPSS进行统计描述

第三节利用SPSS进行统计描述 一、统计描述方法 在教育技术研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总体水平与分布状况做出评价判断。因此,必须采用一些适当的方法对这些资料进行处理,使之简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做出客观的评价。 统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。 (一)数据资料的整理和表示 在教育技术研究中,我们用各种方法搜集来的资料,一般是零散的,它只反映个别现象的个别特征,必须经过整理加工,使之系统化,才能计算统计指标,进行统计分析,为进一步研究提供有用的信息,首先要进行的是统计整理,它包含以下几部分内容: 1.数据检查 主要检查数据的完整性与正确性。统计资料完整性的检查,就是要根据调查项目检查是否填写齐全,避免遗漏,删去重复。正确性检查,就是检查搜集的资料是否真实可靠。特别是统计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。 数据检查可分为逻辑检查和计算检查两种方法。逻辑检查,是从理论和一般常识上来检查资料内容是否合理,指标之间是否矛盾。计算检查是检查统计数字在计算方法和计算结果上有否错误。 2.数据分类 数据分类就是把搜集来的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混淆,一般又可分为品质分类和数量分类。 品质分类:是按事物性质划分为不同的组别、种类。如以性别为标志可分为男与女;按“理解能力”、“学习态度”等为标志,又可分为好、较好、一般、差等几种水平,每种水平可看成类,每一类可给以相当的数量。可以通过各类所包含的数据再进行数量化的比较和分析。 数量分类:是按数量的属性分类。有顺序排列法、等级排列法和次数分布法等。 ⒊数据的排序

spss基本描述性统计实验指导

一、实验目的 1.熟悉SPSS软件其它数据预处理; 2.掌握数据的频率分析与基本统计分析; 二、实验内容 1、对“职工数据”进行转置; 2、对“居民储蓄数据”中户口和职业作出频数统计,并画出饼图 3、对“居民储蓄数据”中存款金额分成五组分别为小于500元、501~2000元、2001~3500 元、3501~5000元、5000元以上,形成新的变量,并做出频数统计与直方图。 4、“居民储蓄数据”中“存款金额”对城镇户口与农村户口分别做出平均值、标准差、偏 度与峰度统计量。 三、实验步骤 1、对“职工数据”进行转置; 1)通过菜单“数据” “转置”如图一所示,进入图二所示的界面, 2)把“关键变量”职工号选入“名称变量”框中,使职工号成为变量名称,其余变量选入“变量”框中如图三所示 3)点击“确定”按钮,出现如图四所示结果。 图一进入转置界面

图二转置界面 图三转置操作 图四输出结果 2、对“居民储蓄数据”中户口和职业作出频数统计,并画出饼图 1)如图五所示进入频率分析界面 2)在图六所示的界面中,选择频率分析变量“户口”与“职业”,并选中左下角的“显示频率表格”

3)点击图六的“图表”按钮,出现如图七的界面,选择“饼图”4)点击“确定”按钮,出现如图八分析结果。 图五进入频率分析

图六选择频率分析变量 图七选择输出图表

图八频率分析输出结果

3、对“居民储蓄数据”中存款金额分成五组分别为小于500元、501~2000元、2001~3500 元、3501~5000元、5000元以上,形成新的变量,并做出频数统计与直方图。 1)打开菜单Transform→record→into different variables, 给分组变量a5新的名称a51 2)点击“旧值和新值”按钮,出现如图十界面,给每一范围一新值,并点击“添加”按钮,直到所有范围都输完后,点击“继续”按钮。 3)点击图九所示“确定”按钮,则得到新的变量a51 4)打开菜单Analyze→Descriptive→Frequencies,出现图十一,选中“显示频率表格”,点击“图表”后,选择“直方图”后,点击“确定”按钮即得到结果。 图九数据分组界面 图十输入分组起始值

(参考)SPSS基本统计图表的制作

基本统计图表的制作 1 P-P图和Q-Q图 P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似呈一条直线。如果P-P图中各点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。 Q-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。 由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异,SPSS17.0中用于做出P-P图的对话框和用于做出Q-Q图的对话框完全一致,下面将对两者统一加以说明。 具体操作步骤如下: 打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descript ive Statistics)命令下的【P-P图】(P-P Plots)或【Q-Q图】(Q-Q Plots)命令。“P-P图”(P-P Plots)、“Q-Q图”(Q-Q Plots)的对话框分别如图3-20和图3-21所示。 图3-20 “P-P图”对话框

图3-21 “Q-Q图”对话框 在“P-P图”(P-P Plots)或“Q-Q图”(Q-Q Plots)对话框中,最左边的变量列表为原变量列表,通过单击按钮可选择一个或者几个变量进入位于对话框中间的“变量”(Variables)列表框中。根据这些变量数据可创建P-P图或Q-Q图,并进行分布检验。 “P-P图”或“Q-Q图”对话框的中下方和右方有5个选项栏,选项栏中各选项的意义如下: (1)转换(Transform)栏(复选项): l 自然对数转换(Natural log transform):选择此项,对当前变量的数据取自然对数,即将原有变量转换成以自然数e为底的对数变 量。 l 标准值(Standardize values):选择此项,将当前变量的数据转换为标准值,即转换后变量数据的均值为0,方差为1。 l 差分(Difference):选择此项,对当前变量的数据进行差分转换,即利用变量中连续数据之间的差值来转换数据。选择此项以后,后面 的文本框变为可用,在其中输入一个正整数,以确定转换的差分度, 默认值为1。

SPSS统计分析最全中英文对照 表

SPSS 专业技术词汇、短语的中英文对照索引% of cases 各类别所占百分比 1-tailed 单尾的 2 Independent Samples 两个独立样本的检验 2 Related Samples 两个相关样本检验 2-tailed 双尾的 3-D (=dimensional) 三维-->三维散点图 A Above 高于 Absolute 绝对的-->绝对值 Add 加,添加 Add Cases 合并个案 Add cases from... 从……加个案 Add Variables 合并变量 Add variables from... 从……加变量 Adj.(=adjusted) standardized 调整后的标准化残差 Aggregate 汇总-->分类汇总 Aggregate Data 对数据进行分类汇总 Aggregate Function 汇总函数 Aggregate Variable 需要分类汇总的变量 Agreement 协议 Align 对齐-->对齐方式 Alignment 对齐-->对齐方式 All 全部,所有的 All cases 所有个案 All categories equal 所有类别相等 All other values 所有其他值 All requested variables entered 所要求变量全部引入 Alphabetic 按字母顺序的-->按字母顺序列表 Alternative 另外的,备选的 Analysis by groups is off 分组分析未开启 Analyze 分析-->统计分析 Analyze all cases, do not create groups 分析全部个案,不建立分组Annotation 注释 ANOVA Table ANOVA表

用SPSS生成统计图

用SPSS生成统计图 第五章:SPSS统计绘图功能详解 5.1 常用统计图 5.1.1 操作界面介绍(条图) 5.1.1.1 条图的通用界面 5.1.1.2 复式条图与分段条图的界面 5.1.2 其他常用统计图 5.1.2.1 散点图 5.1.2.2 线图 5.1.2.3 饼图 5.1.2.4 面积图 5.1.2.5 直方图 5.1.2.6 其他 5.1.3 常用统计图编辑方法详解 5.2 交互式统计图 5.3 统计地图 在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。 EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗? 这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。 §5.1 常用统计图 在SPSS 10.0版中,除了生存分析所用的生存曲线图被整合到ANALYZE菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分: ?Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。 ?Interactive:交互式统计图,这是SPSS 9.0版新增的内容。 ?Map:统计地图,这是SPSS 10.0版新增的内容。 市面上所能见到的SPSS 10.0 D版由于执照不全,并不能安装统计地图模块。 ?下方的其他菜单项是我们最为常用的普通统计图,具体来说有:

管理同学SPSS描述统计分析实验报告

描述统计分析 一、实验目的与要求 1. 了解统计描述的常用工具及SPSS 中的统计描述模块。 2. 掌握分类变量和连续变量的统计描述方法及指标。 二、实验内容提要 1.根据CCSS_Sample.sav 数据,分析受访者的年龄分布情况,尝试分城市/合并描述。 2.根据SPSS 自带数据Employee data.sav ,分析员工性别、受教育程度、少数民族、职位类别的分布情况,并尝试分析这些属性之间的关系以及这些属性和工资之间的关系。 三、实验步骤 根据CCSS_Sample.sav 数据 在数据栏中找到拆分文件,点击,将城市添加到分组方式中,对城市进行拆分,点击确定。 在分析中选择描述统计下的描述,点击确定。 描述统计量 S0. 城市 N 极小值 极大值 均值 标准差 100北京 S3. 年龄 378 18 65 36.43 13.129 有效的 N (列表状态) 378 200上海 S3. 年龄 387 18 65 37.76 13.674 有效的 N (列表状态) 387 300广州 S3. 年龄 382 18 65 34.87 11.544 有效的 N (列表状态) 382 根据SPSS 自带数据Employee data.sav 在分析一栏中的描述统计下找到频率,点击确定。 性别分析表 Gender 频率 百分比 有效百分比 累积百分比 有效 Female 216 45.6 45.6 45.6 Male 258 54.4 54.4 100.0 合计 474 100.0 100.0

受教育程度分析表 Educational Level (years) 频率 百分比 有效百分比 累积百分比 有效 8 53 11.2 11.2 11.2 12 190 40.1 40.1 51.3 14 6 1.3 1.3 52.5 15 116 24.5 24.5 77.0 16 59 12.4 12.4 89.5 17 11 2.3 2.3 91.8 18 9 1.9 1.9 93.7 19 27 5.7 5.7 99.4 20 2 .4 .4 99.8 21 1 .2 .2 100.0 合计 474 100.0 100.0 少数民族分析表 Minority Classification 频率 百分比 有效百分比 累积百分比 有效 No 370 78.1 78.1 78.1 Yes 104 21.9 21.9 100.0 合计 474 100.0 100.0 2.选择分析,描述统计下的交叉表,点击确定,分析性别和受教育程度之间的情况,将性别添加到行,将受教育程度添加到列中,点击确定。

SPSS教程统计图的绘制

SPSS教程第十六课:统计图的绘制 信息来源:本站原创更新时间:2004-7-12 21:52:00 第五节高低区域图 15.5.1主要功能 调用Graphs菜单的High-Low过程,可绘制高低区域图。高低区域图用于表现多种形式的数据区域,如一组测定值的范围(最小值—最大值)、95%可信区间值(低 限—高限)、±1.96·SD(低值—均值—高值)等,形象直观。 15.5.2实例操作 [例15-5]为了解水体污染情况,某市测定三种水源中放射性元素锶(90Sr)的含量(10-2Bq·L-1),资料如下,试绘制高低区域图。 15.5.2.1 数据准备 激活数据管理窗口,定义变量名:数据的变量名为DATA,将范围的低值与高值以及均值一并输入;设一变量为CAT,用于定义低值、高值和均值,低值为1、高值为2、均值为3;水源点变量名为GROUP,依次输入1、2、3。

15.5.2.2 操作步骤 选Graphs菜单的High-Low...过程,弹出High-Low Chart定义选项框,高低区域图有5种,即: Simple High-Low-Close:简单线型高低区域图; Clustered High-Low-Close:复式线型高低区域图; Simple Range Bar:简单直条型高低区域图; Clustered Range Bar:复式直条型高低区域图; Difference Line:差异线区域图。 本例选用简单线型高低区域图。然后点击Define钮,弹出Define Simple High-Low-Close:Summaries for Groups of Cases对话框(图15.6),在左侧的变量列表中选data点击 钮使之进入Bars Represent栏的Other snmmary function 选项的Variable框,选cat点击 钮使之进入Category Axis框, 选group点击 钮使之进入Define High-Low-Close by框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“某市测定不同水体放射性元素锶的含量比较”,点击Continue钮返回Define Simple High-Low-Close:Summaries for Groups of Cases 对话框,再点击OK钮即完成。

SPSS统计描述几个重要的统计指标

均值(平均值、平均数): 表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 计算公式如下。 中位数: 定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性 计算公式:一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第+1位置上两个数值的平均数 众数: 定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。 计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。 全距: 定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值-最小值。 方差(Variance)和标准差(Standard Deviation): 定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。

频数(Frequency): 定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。 变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。 峰度(Kurtosis): 定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布平顶峰。具体的计算公式 为

相关文档
最新文档