SPSS统计分析第3章 描述性统计分析新
《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)第三章:统计分析与SPSS的应用(第五版) 课后练习答案第一节:描述性统计在本章的课后习题中,我们将通过SPSS软件进行一系列的统计分析。
本节将提供第三章的课后习题答案,通过展示实际的数据和分析结果,帮助读者更好地理解统计分析的应用和SPSS软件的操作。
1. 描述性统计分析题目:使用某城市2019年1月至12月的气温数据,计算月平均气温、最高气温和最低气温的描述性统计指标。
答案:通过SPSS导入数据,选择变量"月份"和"气温",并进行描述性统计分析。
结果显示,2019年1月至12月的气温数据的月平均气温、最高气温和最低气温的描述性统计指标如下:月平均气温:- 平均值:20°C- 标准差:2°C- 最小值:15°C- 最大值:25°C最高气温:- 平均值:28°C- 标准差:3°C- 最小值:22°C- 最大值:35°C最低气温:- 平均值:12°C- 标准差:2°C- 最小值:8°C- 最大值:18°C根据以上结果,我们可以得出结论:2019年该城市的月平均气温在20°C左右,最高气温在28°C左右,最低气温在12°C左右。
气温的变化范围相对较小,波动性较小。
这些结果可以帮助我们对该城市的气候情况进行初步了解。
2. 相关性分析题目:使用某企业2018年1月至12月的销售额和广告投入数据,计算销售额和广告投入之间的相关性。
答案:通过SPSS导入数据,选择变量"销售额"和"广告投入",并进行相关性分析。
结果显示,2018年1月至12月的销售额和广告投入之间的Pearson 相关系数为0.85,表明二者呈现强正相关关系。
SPSS统计分析--第3章--基本统计分析

3.2.1 频数统计的主要功能
• “频率”过程可以产生频数分布表,以对数据按组进行归 类整理。还可以生成各种描述性统计指标,以及条形图、 饼图、直方图等常用的统计图。通过选择SPSS中的“分析 ”︱“描述统计”︱“频率”命令,可以对各变量的数据 分布特征有一个概括的整体的认识。
.
3.2.2 频数统计的操作过程
.
3.2.3 实例分析:大学新生的心理健康状况(1)
【例3.1】某大学为了了解学生的心理健康状况,要对初 入学的大一新生进行心理测评,并建立心理档案。现要对 某班学生的生活事件量表进行分析。请用SPSS做出此测试 结果的频数分布情况。
解:本例中,主要通过“频率”过程对本班生活事件量表 的总分进行描述,并得出全班学生此量表总分各分数的频 数情况及其百分比和累积百分比,可以从中了解到学生整 体得分的高低水平,也可以由此注意到需要给予较多关注 的个体或群体。下面将介绍具体的操作过程。
• 均值标准误差:描述样本均值与总体均值之间的平均差异程度 的统计量。
• 全距:也称极差,是数据的最大值与最小值之间的绝对离差。 • 方差:也是表示变量取值离散程度的统计量,是各变量值与算
数平均数离差平方的算术平均数。
.
• 标准差:表示变量取值距离均值的平均离散程度的统计量。标 准差值越大,说明变量值之间的差异越大,距均值这个“中心 值”的离散趋势越大。
• 均值:即算术平均数,是反映某变量所有取值的集中趋势或平 均水平的指标。如某企业职工的平均月收入可用均值。
• 中位数:即一组数据按升序排序后,处于中间位置上的数据值 。如评价社会的老龄化程度时,可用中位数。
• 众数:即一组数据中出现次数最多的数据值。如生产鞋的厂商 在制定各种型号鞋的生产计划时应该运用众数。
SPSS统计分析第3章 描述性统计分析(新 )

变量“教育”的频率分布表
教育 频率 有效 1 2 3 4 5 6 合计 缺失 系统 合计 8 39 114 165 456 53 835 1 836 百分比 1.0 4.7 13.6 19.7 54.5 6.3 99.9 .1 100.0 有效百分 累积百分 比 比 1.0 1.0 4.7 5.6 13.7 19.3 19.8 39.0 54.6 93.7 6.3 100.0 100.0
5.百分位数(Percentile Value)
3.1 基本描述性统计量的定义及计算 3.1.2 描述离散程度的统计量
1.样本方差(Variance)
2.样本标准差(Std. deviation)
3.极差(Range)
4.均值标准误差(Standard Error of Mean)
3.1 基本描述性统计量的定义及计算 3.1.3 描述总体分布形态的统计量
表中显示了变量“教育”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
3.2 频数分析
变量“收入”的频率分布表
收入 频率 有效 0 1 2 3 4 5 6 7 8 9 10 11 合计 2 87 152 157 137 88 85 52 27 9 8 32 836 有效百分 累积百分 比 比 百分比 .2 .2 .2 10.4 18.2 18.8 16.4 10.5 10.2 6.2 3.2 1.1 1.0 3.8 100.0 10.4 18.2 18.8 16.4 10.5 10.2 6.2 3.2 1.1 1.0 3.8 100.0 10.6 28.8 47.6 64.0 74.5 84.7 90.9 94.1 95.2 96.2 100.0
第1步 数据组织:定义2个变量,分别为:“科目”、“成 绩”,“科目”的度量标准为“名义”,“成绩”的度量标 准为“度量”。 第2步 探索分析设置: 选择菜单“分析→ 描述统计 → 探索”,打开“探索” 对 话框,,将“成绩”字段移入“因变量列表”,“科目”移 入“因子列表”。
spss 第3章

主要内容
3.1 频数分析 3.2 描述分析 3.3 求分组平均数 3.4 求交叉分组平均数(列联表分析) 3.5 统计分析图的制作
3.1 频数分析
• 频数分布表 知识回顾 • 统计量 – 分位数(四分位数、百分位数) – 离散趋势指标(标准差、方差、全距、 最小值、最大值) – 集中趋势指标(算术平均数、中位数、 众数、总和) – 分布参数 • 统计图:条形图、饼图、直方图
3.2 描述分析
• Descriptives:计算变量的描述性统 计量(均值、总和、标准差等)
3.2.2 例题
结果分析
3.3 求分组平均数
3.3.1 主要参数
3.3.2 例题
结果分析
3.4 交叉分组描述(卡方检验)
• 检验两个变量是否有关联 • 列联表分析 • 知识回顾
某集团公司打算进行一项改革,但此项改革涉及
Graphs
3.5.1 条形图(Bar)
1、条形图的类型 – 3种形状 – 3种统计量综述方式 – 9种组合方式构成9种 类型的条形图
例题1 简单条形图-个案分组
• 问题:对不同顾客类型(X1)的满意 度(X19)平均数进行统计作图。
例题2 简性的平均 数统计图,按照不同地区分列。
描述分析
求分组平均数
• 按照某个变量分组统计某个或多个变 量值对应的统计量。
求交叉分组平均数
• 检验两个变量是否有关联 • 列联表分析 2 • 检验
H0:两个变量独立
H1:两个变量不独立
统计分析图的制作
• • • • • • • • • • • 条形图 三维条形图 线图 面积图 饼图 高低图 盒式图 误差图 总体锥图 散点图 直方图
SPSS数据处理与分析教案-数据的描述性统计分析

(项目,任务)
项目二SPSS Statistics数据创建与数据预处理
任务4图表分析
教学目标:
1.掌握交叉表格的制作方法。
2.掌握柱形图和饼图的绘制方法。
教学重点、难点:
重点:能够绘制交叉表格、柱形图、饼图。
难点:理解数据的各种图形的特点。
教学内容及过程设计
时间分配
一、制作交叉表格
子任务1:“手机销售统计.sav”文件记录了某淘宝店铺某日手机的销售数据,通过交叉表格分析消费者的性别与手机品牌的关系。
2.箱图
子任务2:打开“满意度测评.sav”文件,绘制不同营业厅的满意度的箱图,并在图中标注个案。
【步骤1】~【步骤3】
二、数据的正态性检验
1.通过直方图进行正态性检验
子任务3:在“满意度测评.sav”文件中,绘制不同营业厅的满意度的直方图。
【步骤1】~【步骤3】
2.通过正态QQ图进行正态性验证
子任务4:在“满意度测评.sav”文件中,利用正态QQ图判断不同营业厅的满意度是否服从正态分布。
【步骤1】~【步骤3】
3.通过正态性验证指标进行正态性验证
子任务5:在“满意度测评.sav”文件中,判断不同营业厅的满意度是否服从正态分布。
【步骤1】~【步骤4】
任务实训
在“成绩.sav”文件中,判断不同性别的成绩是否服从正态分布。
(20分钟)
(20分钟)
(10分钟)
(10分钟)
(15分钟)
课后总结分析:
【步骤1】~【步骤8】
2.中位数
子任务3:某公司员工工资数据存放在“工资统计.sav”文件中,根据此数据文件计算平均值与中位数,并比较哪一个指标更能体现工资的集中趋势。
第三章描述性统计分析

描述性统计分析指标
统计量可分为两类
一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式
用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies
在交叉列联表中,除了频数外还引进了各种百分 比。例如表中第一行中的33.3%, 33.3%, 33.3 %分别是高级工程师3人中各学历人数所占的比例 ,称为行百分比(Row percentage),一行的百 分比总和为100%;表中第一列的25.0%,25.0% ,50.0%分别是本科学历4人中各职称人数所占的 比例,称为列百分比(Column percentage), 一列的列百分比总和为100%,表中的6.3%,6.3 %,12.5%等分别是总人数16人中各交叉组中人 数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为 100%。
例子
假设我们有以下的三组观测值:
观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20
这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%
SPSS数据分析—描述性统计分析

SPSS数据分析—描述性统计分析描述性统计分析是一种针对数据本身的分析方法,通过使用统计学指标来描述数据的特征。
这种分析方法看似简单,但实际上却是许多高级分析的基础工作。
很多高级分析方法都对数据有一定的假设和适用条件,这些可以通过描述性统计分析来判断。
我们也会发现,许多分析方法的结果中都会穿插一些描述性分析的结果。
描述性统计主要关注数据的三个方面:集中趋势、离散趋势和数据分布情况。
描述集中趋势的指标包括均值、众数和中位数,其中均值包括截尾均值、几何均值和调和均值等。
描述离散趋势的指标包括频数、相对数、方差、标准差、标准误、全距、四分位间距、四分位数、百分位数和变异系数等。
需要注意的是,连续型变量和离散型变量的指标有所不同。
由于许多统计分析都有一个正态分布的假设,因此我们经常关注数据的分布特征。
常用峰度系数和偏度系数来描述数据偏离正态分布的程度。
也可以使用Bootstrap方法计算出结果与经典统计学方法计算出的结果进行对比,如果差异明显,则说明原数据呈偏态分布或存在极值。
SPSS用于描述性统计分析的过程大部分都在分析-描述统计菜单中,另有一个在比较均值-均值菜单。
虽然这几个过程用途不同,但基本上都可以输出常用的指标结果。
分析-描述统计-频率过程可以输出连续型变量集中趋势和离散趋势的主要指标,还可以输出判断分布的直方图、峰度值和偏度值。
此外,该过程最主要的作用是输出频数表。
分析-描述统计-描述过程输出的内容并不多,也没有统计图可以调用,唯一特别的是该过程可以对数据进行标准化变换,并保存为新变量。
分析-描述统计-探索过程是在原有数据进行描述性统计的基础上,更进一步的描述数据。
与前两种过程相比,它能提供更详细的结果。
分析-描述统计-比率过程主要用于对两个连续变量间的比率进行描述分析。
输出的结果比较简单,只是指标的汇总表格。
分析-描述统计-交叉表过程主要用于分类变量的描述性统计。
它可以完成频数分布和构成比的分析,也经常被用来做列联表的推断分析。
SPSS统计分析—描述性统计分析

SPSS统计分析—描述性统计分析描述性统计分析(Descriptive statistics analysis)简介描述性统计分析是统计学的一个领域,主要目的是通过对样本数据进行总结、整理和分析,揭示数据中的模式、趋势和关联。
它可以通过计算和展示各种统计指标来帮助我们更好地理解和解释数据。
SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,可以用于进行各种描述性统计分析。
本文将介绍一些常用的描述性统计分析方法和在SPSS中的应用。
1.数据摘要数据摘要是描述性统计分析的基础,主要目的是对数据进行概括性的总结。
常用的数据摘要方法包括计数、频数、百分比、均值、中位数、标准差等。
在SPSS中,可以使用“Frequencies”命令对数据进行频数分析。
该命令可以列出每个变量的频数、百分比以及累积百分比。
此外,使用“Descriptives”命令可以计算各个变量的均值、中位数、标准差等统计量。
2.绘制图表图表可以帮助我们更好地理解和展示数据的特征和分布。
常用的图表包括直方图、饼图、箱线图等。
在SPSS中,可以使用“Graphs”菜单下的不同选项来绘制各种图表。
例如,使用“Bar Chart”选项可以绘制柱状图,使用“Pie Chart”选项可以绘制饼图,使用“Boxplot”选项可以绘制箱线图。
3.相关分析相关分析可以帮助我们研究数据之间的关联关系。
它可以通过计算相关系数来评估两个变量之间的线性关系。
在SPSS中,可以使用“Correlations”命令进行相关分析。
该命令可以计算出各个变量之间的相关系数,并提供了相关系数矩阵和散点图来展示结果。
4.因素分析因素分析是一种常用的数据降维方法,可以帮助我们理解并提取潜在的数据结构和变量之间的关系。
在SPSS中,可以使用“Factor Analysis”命令进行因素分析。
该命令可以根据指定的变量,自动提取主成分或因子,并计算出因子载荷矩阵和因子得分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主要内容
3.1 基本描述性统计量的定义及计算 3.2 频数分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉列联表分析 3.6 多选项分析
3.2 频率分析
3.2.1 基本概念及统计原理
频率就是一个变量在各个变量值上取值的个案数,分析 时不考虑其实际取值。基本统计分析往往从频率分析开始。 通过频率分析能够了解变量取值的状况,对把握数据的分布 特征是非常有用的。
1. 偏度( Skewness ):是描述取值分布形态对称性
的统计量;偏度系数大于0,表示其数据分布形态有一条长 尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据 分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数 的绝对值越大,与正态分布相比越偏斜。
2. 峰度( Kurtosis ):是描述变量取值分布形态陡缓
4
5
面的复选框
3.2 频率分析
第3步 主要结果及分析:
?统计量表
统计量
教育
收入
N
有效
缺失
众数
百分位数 30
60
90
835 1 5
4.00 5.00 5.00
836 0 3
3.00 4.00 7.00
?变量“教育”的频率分布表
有效 1 2 3 4 5 6 合计
缺失 系统 合计
教育
有效百分 累积百分
频率 百分比
的统计量;峰度系数等于0,表明数据分布的陡峭程度与正 态分布相同。峰度系数大于0时为尖峰分布,表明数据分布 的陡峭程度比正态分布大,峰度系数小于0时为平峰分布, 表明数据分布的陡峭程度比正态分布小。
3.1 基本描述性统计量的定义及计算
3.1.3 描述总体分布形态的统计量
来自于正态总体的偏度及峰度均近似为0,可以利用偏 度和峰度的值是否接近0作为检验是否是正态分布的重要依 据。
5000-5999……6
6000-6999……7
7000-7999……8
8000-8999……9
9000-9999……10 10000及以上…11
2、 您的教育程度:(指您受过过正式教育/小学……….1
初中……………………..………2
高中/中专/技校… ……… ……..3
比
比
8
1.0
1.0
1.0
39
4.7
4.7
5.6
114
13.6
13.7
19.3
165
19.7
19.8
39.0
456
54.5
54.6
93.7
53
6.3
6.3 100.0
835
99.9 100.0
1
.1
836 100.0
表中分别显示两个分析变量“教 育”及“收入”的有效个案数、 缺失值个数、及两个分析变量的 “众数”及对应于30%、60%及 90%的百分位数 。
3.2 频率分析
3.2.2 SPSS实例分析
【例3-1】以下是调查问卷中针对被调查人设置的两个问题:
1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人 民币为单位)单选
500-1000……..1
1000-1999……2
2000-2999……3
3000-3999……4
4000-4999……5
第2步 频率分析设置:
3
5
1
5
?选择菜单:“分析→ 描述统计 → 频率”,
2
5
打开“频率(F)”对话框,将“教育”和
“收入”加入到“变量”列表框中。
1
5
1
5
?打开“统计量”对话框,选中“百分位数”
…
…
“众数”,并在“百分位数”中添加30.0、
6
4
60.0、90.0;
10
5
?打开“图表”对话框,选中“直方图”及后
大专/大学非本科/高职高专……4
大学本科……………………….5
研究生及以上…………………..6
从问卷中收集到的数据如表4.1所示 , 试对收集到的数据进行频数分析
3.2 频率分析
第1步 数据组织:根据表3.1生成SPSS
数据文件,建2个变量:“收入”、“教
表4.1
育”, 度量标准均为序号。
家庭月收入 受教育程度
18.2
18.2
28.8
157
18.8
18.8
47.6
137
16.4
16.4
64.0
88
10.5
10.5
74.5
85
10.2
10.2
84.7
52
6.2
6.2
90.9
27
3.2
3.2
94.1
9
1.1
1.1
95.2
8
1.0
1.0
96.2
32
3.8
3.8 100.0
836 100.0 100.0
表中显示了变量“收入”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
表中显示了变量“教育”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
3.2 频数分析
?变量“收入”的频率分布表
有效 0 1 2 3 4 5 6 7 8 9 10 11 合计
收入
有效百分 累积百分
频率 百分比
比
比
2
.2
.2
.2
87
10.4
10.4
10.6
152
3.2 频数分析
?变量“教育”的直方图
?变量“收入”的直方图
表中显示了变量“教育”的直方 图,从图上可以看出受访者教育 程度同正态分布相比左偏,不具 备明显的正态分布。
表中显示了变量“收入”的直方 图,从图上可以看出受访者家庭 收入同正态分布相比右偏,不具 备明显的正态分布。
第三章
描述性统计分析
主要内容
3.1 基本描述性统计量的定义及计算 3.2 频数分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉列联表分析 3.6 多选项分析
3.1 基本描述性统计量简介
3.1.1 描述集中趋势的统计量
1.均值(Mean ) 2.众数(Mode ) 3.中位数(Median ) 4.总和(Sum ) 5.百分位数( Percentile Value )
3.1 基本描述性统计量的定义及计算
3.1.2 描述离散程度的统计量
1.样本方差( Variance ) 2.样本标准差( Std. deviation ) 3.极差(Range ) 4.均值标准误差( Standard Error of Mean )
3.1 基本描述性统计量的定义及计算
3.1.3 描述总体分布形态的统计量
例如,调查消费者拥有数码产品的数量,首先分析受访 者的总人数、家庭收入情况、受教育程度、性别等,获取样 本是否具有总体代表性、抽样是否存在系统偏差等信息。这 些可以通过频率分析来实现,经过频率分析可以得到如下结 果: (1)频率分布表:该表中包含频率、各频率占总样本数的 百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频率分析 中提供的统计图形可以是条形图、饼图或者直方图。