SPSS基本统计分析资料

合集下载

第四章 SPSS的基本统计分析知识讲解

多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的：
通过列联表分析，检验行列变量之间是否独立。
方法：
– 卡方检验：对品质数据的相关性进行度量
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项，选择所需要的图形
计算描述统计量
目的
– 精确把握变量的总体分布状况，了解数据的集中趋势、离散趋势、对称程度、陡峭程度。
– 菜单选项:analyze->multiple response->crosstabs
频数分析
目的
粗略把握变量值的分布状况。
例：研究被调查者的特征（如：性别、年龄、收入）研究被调查者对某个问题的总体看法（如：教学方式、选修课程）研究被调查者某方面的状态（如：购买家电的类型、居民月支出状况）
采用的方法
– 计算频分布表：包括计算频数、累计频数、百分比、累计百分比

spss4-2(基本统计分析)

频数分析表
Central tendency: 用于定义描述集中趋势的一组指标：均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。
频数分析表
Dispersion:定义描述离散趋势的一组指标： Std.deviation:标准差 Variance:方差 Range :全距 Minimum:最小值 Maximum:最大值 S.E.mean:标准误
众数
(不唯一性)
无众数原始数据: 8 10 5 9 12 6
一个众数原始数据:
6
5
9
8
5
5
多于一个众数原始数据: 25 28 28 36 42 42
中位数
(median)
1. 排序后处于中间位置上的值
50%
2. 不受极端值的影响
Me
50%
3. 主要用于顺序数据，也可用数值型数据，但不能用于分类数据 4. 各变量值与中位数的离差绝对值之和最小，即
8
9
1
2
3
4
5
6
7
n 1 9 1 位置 5 2 2 中位数 1080
数值型数据的中位数
(10个数据的算例)
【例】：10个家庭的人均月收入数据
排序: 660 750 780 850 1630 2000 位置: 960 1080 1250 1500
9
10
n 1 10 1 位置 5.5 2 2
2 众数(Mode)：出现频率最高的数 3 中位数(Median)：将数据排序后位于正中间的数值。适合于所有分布类型的数据 4 总和(Sum)
众数
(mode) 1. 出现次数最多的变量值

SPSS统计基础数据分析

《SPSS统计基础》课程数据分析报告（2016— 2017学年度第二学期）题目：关于381名大学生学习适应情况的分析报告班级：14小教2班学号：姓名：2017年6月381名大学生学习适应性调查数据分析报告姓名：学号：班级：一、数据分析目的及内容（一）数据分析的目的通过对师范学院学生学习适应现状及其影响因素的调查研究，了解我院学生对自己所学专业在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素、适应总分六个维度的基本情况。

本文拟在以往研究的基础上对大学生学习适应状况进行调查,并探讨影响大学生学习适应的因素，从而让大学生能更快更好地适应大学生活。

（二）数据分析的内容1. 381名大学生在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素五个维度的得分及适应总分.2.对年级、专业、生源地变量的容量等数据分布指标的描述，了解数据分布的全貌。

3.对适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素五个维度的极大值、极小值、均值和标准差的统计。

4.学习适应各因子之间的相关分析。

5.学习适应五因子及适应总分的相关性分析。

二、数据库介绍（一）数据来源：1被试分布：总容量为381、年级（大一156人、大二136人、大三89人）、专业（小学教育140人、学前教育本科113人、学前教育专科128人）、生源地（城镇145人、农村236人）等方面的人数分布；2、调查工具：《大学生学习适应量表》由冯廷勇等人编制，共29 个题目，量表采用Likert5 点计分法，即完全不符合计 1 分，比较不符合计 2 分，不确定计 3 分，较符合计4 分，完全符合计 5 分。

各维度和总量表分数越高，表明适应状况越好。

总分低于58分，表明学习适应状态较差需要做较大调整；总分在59到87分之间，表明学习适应状态中等，需要做适当的调整；总分在88到116分之间，表明学习适应状态良好；总分在117到145分之间，表明学习适应状态良好。

SPSS复习资料

第一章SPSS统计分析系统软件简介1）SPSS的几种基本运行方式：①菜单操作方式：这种方法图形用户界面友好、操作简单、形象直观，能够一步步引导用户完成对数据的描述和模型的建立。

②程序运用方式：是在Syntax编辑窗口输入程序。

也可以用任何文本编辑器中输入，也可以在相应菜单操作的对话框中，用“Paste”按钮可以把相应的操作转化为Syntax语言。

选择所有的语法命令行，单击“Run”运行程序。

或者在SPSS的语法编辑器窗口输入语法。

③ Include运行方式：在编写Syntax命令中，如果要调用其他语法文件时，除了复制粘贴现有的资源外，还可以用Include的命令。

④ Production Facility方式：Production Facility生产作业方式提供了以自动化方式运行SPSS Statistics 的功能。

2）SPSS界面提供的五个窗口：①数据编辑窗口：这个窗口主要用来处理数据和定义数据字典，它分为两个视图。

一个是用来显示数据的数据视图（数据视图用来显示数据集中的记录或个案），另外一个是变量视图（变量视图的功能是定义数据集的数据字典）。

②结果管理窗口：也称为结果视图或者结果浏览器，该窗口用于存放SPSS软件的分析结果。

分为左边目录区，是SPSS分析结果的目录；右边是内容区，显示与目录相应的内容。

③结果编辑窗口：是编辑分析结果的窗口。

选中要编辑的内容，双击或者点击右键选择“编辑内容”，选中的图形就会出现在“图表编辑器”中，可以开始编辑。

④语法编辑窗口：语法编程方式，能够完成窗口操作所能完成的所有任务，还可以完成许多窗口操作所不能完成的其他工作。

在这个窗口中，还可以调用开源软件R中的任何程序。

⑤脚本窗口：是用Sax Basic 语言编写的程序。

脚本可以使SPSS内部操作自动化，可以自定义结果格式，可以连接VB和VBA应用程序。

第二章数据文件的建立和管理1）数据管理的特点：数据编辑器的每一行数据称为一个个案，每一列数据代表个体属性，即变量。

(可视化整理)spss统计分析-实例分析

众数（Mode）统计学名词，在统计分布上具有明显集中趋势点的数值，代表数据的一般水平（众数可以不存在或多于一个）。修正定义：是一组数据中出现次数最多的数值，叫众数，有时众数在一组数中有好几个。用M表示。理性理解：简单的说，就是一组数据中占比例最多的那个数。
全距也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小的一组数据更为分散。计算公式：最大值－最小值。
1.2 描述分析
计算基本描述统计量的操作
（1）分析—描述统计—描述（2）将分析变量选择到变量框中（3）单击选项按钮指定基本统计量
1.2 描述分析
1.2.2 应用例一
案例1－3：计算人均住房面积的基本描述统计量，并对本市户口和外地户口家庭的情况进行比较。操作步骤：
• 调用命令Analyze\Descriptive Statistics \Descriptives
1.1频数分析
1.1频数分析
输出结果
1.1 频数分析＿例1
例1－1 分析住房状况调查数据中户主的从业状况和目前所住房屋的产权情况思路：利用频数分布表及图形条件：都是分类变量，直接分析步骤：
• 调用命令：
• Analyze\Descriptive Statistics\Frequencies
常用统计量：均值、中位数、众数
1.2 描述分析
刻画离散程度的统计量
离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围，数据的离散程度较小，说明这个“中心值”对数据的代表性好；相反，如果数据仅是比较松散地分布在“中心值”的周围，数据的离散程度较大，则此“中心值”说明数据特征是不具有代表性的。

《SPSS统计分析方法及应用》第四章--基本统计分析课件

（3）众数（Mode）：即一组数据中出现次数最多的数据值。如生产鞋的厂商在制定各种型号鞋的生产计划时应该运用众数。
学习交流PPT
17
（4）均值标准误差（Standard Error of Mean）：描述样本均值与总体均值之间的平均差异程度的统计量。其计算公式为：
S.E.of .Mean ( x X )2 n
按Variables框中的排列顺序输出
按各变量的字母顺序输出按均值的升序排列按均值的降序排列
Options 对话框
学习交流PPT
28
在上面窗口中，用户可以指定分析多变量时结果输出的次序（Display Order）。其中，Variable list表示按变量在数据窗口中从左到右的次序输出； Alphabetic表示按字母顺序输出；Ascending Means 表示按均值升序输出；Descending Means表示按均值降序输出。
至此，SPSS便自动计算所选变量的基本描述统计量并显示到输出窗口中。
学习交流PPT
29
• 5.2.3 计算基本描述统计量的应用举例
1. 利用商品房购买意向的调查数据，对月住房开销变量计算基本描述统计量。
有以下分析目标：计算月住房开销的基本描述统计量，并分别对不同居住类型进行比较分析：首先按居住类型对数据进行拆分（Split file），然后计算月住房开销的基本描述统计量。
学习交流PPT
19
常见的刻画离散程度的描述统计量如下：
（1）全距（Range）：也称极差，是数据的最大值（Maximum）与最小值（Minimum）之间的绝对离差。
（2）方差（Variance）：也是表示变量取值距均值的离散程度的统计量，是各变量值与算数平均数离差平方的算术平均数。其计算公式为：

SPSS数据的基本统计分析

SPSS数据的基本统计分析SPSS（统计软件包用于社会科学）是一种广泛使用的统计分析软件，它提供了一系列功能强大的工具，可以对数据进行基本的统计分析。

在本文中，将介绍SPSS数据的基本统计分析方法，包括数据导入、数据描述统计、数据绘图和假设检验。

数据导入SPSS可以导入多种数据格式，如Excel、CSV、TXT等。

在导入数据时，需要设置数据类型和变量属性，并进行数据清洗。

数据清洗包括处理缺失值、异常值和离群值等。

数据描述统计一旦数据导入SPSS，可以使用描述统计方法来了解数据的基本情况，包括数据的中心趋势、离散趋势和分布情况。

中心趋势：中心趋势是指一组数据的集中程度。

常见的中心趋势度量包括均值、中位数和众数。

SPSS可以计算这些统计量，并提供了描述统计分析的结果。

离散趋势：离散趋势是指一组数据的分散程度。

常见的离散趋势度量包括方差、标准差和极差。

SPSS可以计算这些统计量。

分布情况：了解数据的分布情况可以帮助研究人员判断数据是否满足正态分布或其他分布假设。

SPSS可以绘制直方图、箱线图和正态概率图等来展示数据的分布情况。

数据绘图数据绘图是一种可视化数据的方法，可以更直观地了解数据之间的关系和趋势。

SPSS提供了多种数据绘图方法，包括柱状图、折线图、散点图和饼图等。

可以通过简单的菜单选择来创建相应的图表，并设置图表的格式和风格。

假设检验假设检验是统计分析中非常重要的一步，可以帮助研究人员验证研究假设是否成立。

SPSS提供了各种假设检验方法，如t检验、方差分析、卡方检验和相关分析等。

t检验：用于比较两个样本均值是否存在差异。

SPSS可以进行独立样本t检验和配对样本t检验。

方差分析：用于比较多个样本均值是否存在差异。

SPSS可以进行单因素方差分析和多因素方差分析。

卡方检验：用于比较观察频数与期望频数之间是否存在差异。

SPSS 可以进行卡方检验和列联表分析。

相关分析：用于分析两个变量之间的相关性。

SPSS可以计算皮尔逊相关系数和斯皮尔曼等级相关系数。

SPSS基本统计分析（二）：探索分析

SPSS基本统计分析（⼆）：探索分析1、主要功能：
此分析⽅法可检查数据是否有错误，对样本分布特征以及样本分布规律作初步了解。

剔除奇异值和错误数据。

探索性分析过程将提供在分组和不分组的情况下常⽤的统计量和图形。

2. SPSS操作
2.1操作步骤
对30名10岁少⼉（15男15⼥）的⾝⾼（cm）进⾏探索性分析。

注意：录⼊数据时，对不同分组需要定义新的组值，这⾥，0代表男孩，1代表⼥孩。

点击统计，出现如下对话框：
点击图，出现如下对话框：
点击选项，出现如下对话框：
2.2输出结果
（1）个案处理摘要：由表中可以看出不同性别的有效个案数、缺失个案数和总计个案数。

（2）下表中包含了所有的描述性统计指标。

（3）M估计量：给出的是4种集中趋势的稳健估计量，表格下⽅还给出了不同⽅法计算估计量的加权常量。

当数据中存在极端值或异常值时，M估计量是很好的均值和中位数的替代者，能够更好的反映数据的集中程度。

在描述统计中，如果均值和中位数与M估计量的差距很⼤，说明数据中存在异常值。

（4）百分位数
（5）正态性检验
给出了KS和SW两种正态检验⽅法的结果，P值均⼤于0.05，因此认为数据服从正态分布。

（6）⽅差齐性检验
表格所⽰为莱⽂⽅差齐性检验的结果，并列举了计算莱⽂统计量的4种算法，由结果得，P值均⼤于0.05，认为不同性别的⾝⾼⽅差是齐性的。

（7）箱图与极端值
由箱图可以看出，编号为24的⼥孩⾝⾼在箱图外，属于离群点。

极值表格中输出的是每个变量的5个最⼤值和5个最⼩值。

spss基本分析

统计分析往往是从了解数据的基本特征开始的。

描述数据分布特征的统计量可分为两类：一类表示数量的中心位置，另一类表示数量的变异程度（或称离散程度）。

两者相互补充，共同反映数据的全貌。

这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。

1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图，以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

下面我们通过例子来学习单变量频数分析操作。

1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。

2)调用分析过程在主菜单栏单击“Analyze”，在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上，在出现的次菜单里单击“Frequencies”项，打开如图3-4所示的对话框。

图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。

在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。

4)输出频数分布表Display frequency tables，选中显示。

5)设置输出的统计量单击“Statistics”按钮，打开图3-5所示的对话框，该对话框用于选择统计量：图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏：Quartiles：四分位数，显示25%、50%和75%的百分位数。

Cut points for 10 equal groups：将数据平分为输入的10个等份。

Percentile(s):：用户自定义百分位数，输入值0—100之间。

选中此项后，可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。

② 选择变异程度的统计量“Dispersion”：（离散趋势）Std.deviation 标准差Minimum 最小值Variance 方差Maximum 最大值Range 极差S.E.mean 均值标准误③ 选择表示数据中心位置的统计量“Central Tendency”：（集中趋势）Mean 均值Median 中位数Mode 众数Sum 算术和④ 选择分布指标“Distribution”：Skewness 偏度Kurtosis 峰度6) 统计图形输出设置单击“Charts”按钮，将弹出如图3-6所示的对话框：图3-6 “Charts”对话框① Chart Type 图形选择栏：○ None：不输出图形；○ Bar charts：输出条形图；○ Pie char ts：输出饼图；⊙ Histograms：输出柱状图。

SPSS统计分析—描述性统计分析

• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平, 试按地区对各省城乡消费水平之比进行分析, 并比较不同地区之间城乡消费水平是否有较大差异。
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】命令, 弹出如下图所示对话框
• 结果解读
SPSS统计分析—描述性统计分析
描述性统计量
集中趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
Variance
峰度
Kurtosis
众数
Mode
极小值
Minimum
和
Sum
极大值
Maximum
Range
均值的标准误差
S.E.mean
• 【Descriptive Statistics】子菜单
• ⑤ Ratio: 计算两个变量相对比的统计量特征。
• ⑥ P-P Plots: 绘制P-P图，检验数据服从的分布情况。
• ⑦ Q-Q Plots: 绘制Q-encies
• 频数分析简介 • 频数分析表是描述性统计中最常用的方法之一，它主要包括以下几
• 结果解读
• 1、列联表 • 2.卡方检验结果
3.条图
相对比描述——Ratio
• 在实际问题中，研究者有时除了希望了解变量自身的统计特征，还希望得到两个变量相对比之间的统计描述。
• 法一: 通过对两个变量作除法形成一个新变量，然后分析新变量的统计特征来得到。
• 法二: 直接通过【Ratio】过程来分析两个变量之间的相对比关系，并且可以得到多于第一种方法的信息。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

❖ 计算分位数：变量在不同区段内的取值情况、数目（Percenticle Values）
❖ 注意：分位数的分位范围为0~100， ❖ 作用：描述数据离散程度，差越大，说明在相应
位段上的离散程度越大 ❖* 拆分会对以后的分析操作一直起作用，即，都
会是在每个拆分的组上分别进行分析！
5
频数分析过程（ Frequencies）
100.0
Cu mu l ati ve Percent 23.9 37.9 40.0 47.1 95.8 96.1 100.0
8
9
10
11
12
Statistics
平均数
家庭收入 N
中位数众数
M ea n M ed i an M od e
标准差 Std. Deviation
方差偏度系数
房屋产权
Va li d
无产权部分产权二手房经济适用房多层商品房高层商品房其它 T o ta l
Frequency 715 420 61 214
1456 9
118 2993
Percent 23.9 14.0 2.0 7.2 48.6 .3 3.9
100.0
Valid Percent 23.9 14.0 2.0 7.2 48.6 .3 3.9
▪ 频数，只针对单个变量进行！
3
（二）基本分析步骤
❖ 1.选择菜单 AnalyzeDescriptive StatisticsFrequencies ❖ 2.选择分析对象变量 ❖ 在Variable(s)框中，放置要进行频数分析的变量；可放置多个，但分
析是分别进行的 ❖ 3.调正输出分布表中数据的输出顺序 ❖ Format…按钮，可按变量值的升降，频数Counts的升降进行排序 ❖ 4.选择输出图形 ❖ Chart…按钮，可选择显示的内容：频数Frequencies，百分比
❖ 1、对资料进行分组
Transform
Recode
Into Different Variable
2、对已分组的资料进行频数分析（1）、对频数进行加权 Data Weight Cases （2）、求分组数据的频数分析表和描述统计量
Analyze
❖
￫Descriptive Statistics
❖
￫ Frequencies
25 50 75
2993 0
17696.16 15000.00 10000.00 15298.80
2E+008 5.546 .045
55.425 .089
248800.00 1200.00
250000.00 5E+007
10000.00 15000.00 20000.00
描述统计量表
13
次级数据资料分析—扩展分析
Va ri a n ce Skewness Std. Error of Skewness
峰度系数 Kurtosis
Std. Error of Kurtosis
全距（极差） Range
最小值最大值
M in i mu m M axim u m Sum
百分比 Percentiles
Va li d M issin g
第四章 SPSS基本统计分析
对样本数据的刻画与描述
提要
❖ 频数分析 ❖ 计算基本描述统计量 ❖ 交叉分组下的频数分析 ❖ 多选项分析 ❖ 比率分析要求： ❖ 掌握每种方法的基本功能、作用 ❖ 掌握每种方法的基本操作方法 ❖ 掌握每种方法的适用范围
2
一、频数分析
频数分析，用于了解变量取值的状况，有利于把握数据的分布特征（一）基本概念 ❖ 频数：频率，变量值落在给定区间的次数（数目） ❖ 百分比：各频数占总样本数的百分比 ❖ 有效百分比：各频数占有效样本数的百分比 ❖ 有效样本数：不包含缺失值的样本的个数=总样本数-缺失样本数 ❖ 累积百分比：各百分比逐级累加起来的结果 ❖ 注意：
Percentanges ❖ 5.输出裁剪 ❖ 可视分析的具体情况，对结果做必要的裁剪（去掉某些变量的分析
结果） ❖ 图形可被编辑：双击图形，出现Chart Edit图形编辑窗口
4
（三）扩展功能Statistics
❖计算分位数（Percenticle Values）、计算集中趋势（Central Tendency）、计算离散趋势（Dispersion）、描述分布形态（Distribution）等
14
案例4-2
分组后的人均面积
Va li d
10平米以下 10~20平米 20~30平米 30平米以上 T o ta l
Frequency 337
1342 835 479
2993
Percent 11.3 44.8 27.9 16.0
100.0
Valid Percent 11.3 44.8 27.9 16.0
100.0
Cu mu l ati ve Percent 11.3 56.1 84.0 100.0
Statistics
人均面积
N
Va li d
2993
Mi ssin g
0
Percentiles 25
13.6667
50
19.6250
75
26.6667
15Байду номын сангаас
本市户口
人均面积 N
Pe rcen ti l es
❖ 该过程可计算数据资料的各种描述统计指标、给出变量简单频数分布表、绘制几种变量分布图。
❖ Analyze
❖ ￫Descriptive Statistics
❖
￫ Frequencies 出现对话框
6
案例4-1：住房状况分析
选择频数表选择柱状图
打开对话框
7
从业状况
Va li d
行政事业单位国营企业私营企业大专院校科研单位失业其它 T o ta l
Va li d Mi ssin g 25 50 75
2825 0
13.6667 19.4000 26.6667
外地户口
人均面积 N
Pe rcen ti l es
Va li d Mi ssin g 25 50 75
Frequency 504
1300 467 142 285 295
2993
Percent 16.8 43.4 15.6 4.7 9.5 9.9
100.0
Valid Percent 16.8 43.4 15.6 4.7 9.5 9.9
100.0
Cu mu l ati ve Percent 16.8 60.3 75.9 80.6 90.1 100.0