第一讲 spss数据文件的建立和管理
统计SPSS数据文件的建立和管理

第2章 SPSS数据文件的建立和管理学习目标1.明确SPSS数据的基本组织形式和数据行列的含义。
2.掌握应从哪些方面描述SPSS数据文件的结构特征。
3.熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作。
4.熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。
建立SPSS数据文件是利用SPSS软件进行数据分析的首要工作。
没有完整且高质质的数据,也就没有值得信赖的数据分析结论。
2.1 SPSS数据文件建立SPSS数据文件,应首先了解SPSS数据文件的特点、数据组织的基本方式和相关概念等。
只有这样才能够建立一个完整且全面的数据环境,服务于以后的数据分析工作。
2.1.1SPSS数据文件的特点SPSS数据文件是一种有别于其他文件(如Word文档、文本文件)的有特殊性的文件。
从应用角度理解,这种特殊性表现在两方面。
第一,SPSS数据文件的扩展名是.sav;第二,SPSS数据文件是一种有结构的数据文件。
它由数据的结构和内容两部分组成。
其中,数据的结构记录了数据的类型、取值说明、数据缺失情况等的必要信息,数据的内容是那些待分析的具体数据。
SPSS数据文件与一般文本数据的不同在于:一般文本文件仅有纯数据部分,而没有关于结构的描述。
正是如此,SPSS数据文件不能像一般文件那样可以直接被大多数编辑软件读取,而只能在SPSS软件中打开。
基于上述特点,建立SPSS数据文件时应完成两项任务,第一,描述SPSS数据的结构;第二,录入编辑SPSS的数据内容。
这两部分工作分别在SPSS数据编辑窗口的变量视图中完成。
2.1.2 SPSS数据的基本组织方式SPSS的数据将直观地显示在数据编辑窗口中,形成一张平面二维表格。
待分析的数据将按原始数据方式和计数数据方式组织。
一、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,那么这些数据就可按原始数据的方式组织。
薛薇-《SPSS统计分析方法及应用》第2章-SPSS-数据文件的建立和管理

2.4 SPSS数据的录入与编辑 (1)录入 在数据视图中,输入数据。 (2)编辑 在数据视图中,进行编辑数据。
2.5 SPSS数据的保存 文件保存或另保存选择目录路径选择文件类 型(.sav,.xls,.dbf,.dat)输入文件名 保存
11
2.6 读取数据文件
文件打开数据选择目录路径选择文件类型( .sav,.xls,.dbf,.dat)选择文件名打开
2.2.7 结构定义的基本操作 步骤:1、打开SPSS编辑窗口 新建数据单击“变量视图” 2、输入:变量名称、类型、宽度、标签、值等。
9
2.3 SPSS结构定义的应用案例 1、设计调查问卷 标题、引言部分、主体部分、结束语。如,表2-3。 2、建立数据文件结构 调查问卷中,一份卷为一个个案,一个题目作为一个 变量(也称指标)如,表2-4。 (度量水平:有序(序号、定序)、名义(定类)、 定距(度量) ) 3、录入数据 单选择题录入、多选题的录入
变量值标签
对变量取值含义的2)解。释说明信息。 如,1表示男,2表注示意女,。相应列的数据只显
缺失值
示的个数为显示宽度(如 明计显量错尺误度或(明即显度不量合标理,准、2)存。分在三漏大填类的:数定据距。型
计量尺度
(度量)、定序型(数序据号类)型、有定:类数型值(型名、字
义)。
符串型、日期型。
8
2.2 SPSS数据的结构和定义方法
个
变量
案
5
2.1 SPSS数据文件
(2)频数数据的组织方式
频数数据的组织:分组汇总后的汇总数据作为待分析数 据。
频数数据的组织分为:行与变量。如,在研究职称和年龄 的关系时得到下表数据(表2-1)
年龄段
第章:SPSS数据文件的建立和管理PPT课件

b) 数据的排序,方便的得到变量的最大值、最小值,计 算出数据的全距,了解数据的离散程度。
1/11/2020 10:14 AM
浙江树人大学管理学院
1
c) 数据的排序,可以快速发现异常值,以便及时对其进 行处理。
数据,即相同取值的个案 只录入一次,另加一个频数变量用于记录该数值共出现了
多少次,这样就需要在 分析时使用“加权个案” 对话框将数据指定为频 数格式(加下页)。
1/11/2020 10:14 AM
浙江树人大学管理学院
9
点击【数据】→【加权个案】
观察其描述性统计:
1/11/2020 10:14 AM
96.60 90.11 81.94
合计
481
51 532
90.41
1/11/2020 10:14 AM
浙江树人大学管理学院
12
SPSS操作过程(行×列表卡方检验)
①建立数据文件 数据格式:包括6行3列的频数格式,3个变量分别为
行变量、列变量和频数变量。 ②说明频数变量:数据 加权个案
浙江树人大学管理学院
11
加权个案用在卡方检验上的案例
例 某医师研究物理疗法、药物治疗和外用膏药三
种疗法治疗周围性面神经麻痹的疗效,资料见表。 问三种疗法的有效率有无差别?
疗法
三种疗法有效率的比较
有效 无效 合计 有效率(%)
物理疗法组 199 药物治疗组 164 外用膏药组 118
7 206 18 182 26 144
“过滤掉未选定的个案”:未选定的个案不包括在分析中, 但保留在数据集中,使用该选项会在数据文件中生成名为 filter_$的变量,对于选定个案该变量的值为1,对于未选定
SPSS数据文件建立与管理

在变量选择窗口及结果输出时,均显示变量标签的内容,以便 识别。
《卫生统计学》
SPSS软件应用
2. 定义变量
变量值标签(Value) 即分类变量赋值
对变量值的解释
《卫生统计学》
SPSS软件应用
2. 定义变量
定义缺失值 (Missing):有3种
不定期检查上课情况,到课1次计10分,最后计算总得分,并 按照50%比例折算后计入总成绩。
《卫生统计学》
SPSS软件应用
课堂测验题: SPSS数据文件的变量类型共有8种,常用的有哪3种?
角色(Role):
输入(Input) 目标(Target) 两者(Both) 无(None) 分区(Partition) 拆分(Split)
《卫生统计学》
SPSS软件应用
编号 哥特里-罗建紫法立数脂据肪文酸水件解法
差值d
(1)
(2)
(3)
(4)=(2)(3)
1
0.840
《卫生统计学》
SPSS软件应用
建立SPSS数据文件
定义变量
定义变量名的原则:
长度不超过64字节(32个汉字) 首字符必须是字母或汉字,不能以“_” 或“.”结尾 不能有空格或一些特殊符号如“!?* ”等 不能与SPSS关键字相同,如“ALL, AND, OR…” 变量名中英文字母不区分大小写 如不命名,依次默认为var00001、 var00002 …
《卫生统计学》
SPSS软件应用
设置数据文件的读写属性
File ↓ Mark File Read Only / Mark File Read Write
《SPSS数据分析与应用》SPSS数据文件的建立与管理

2. 变量类型
变量类型
说明
数字 逗
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
1.使用Excel向导读入Excel文件
2.使用文本向导导入文本文件
第二步:在“文本导入向导-第1/6步”对话框中,需要观察文本文件与预定义 的格式是否匹配,如果不匹配,则需要设置文本导入格式,如图所示,单击向导导入文本文件
第三步:在弹出的“文本导入向导-第2/6步”对话框中,主要需要关注数据文件的第一 行是否有变量名,如果有,则需要在【文件开头是否包括变量名?】框内勾选【是】,设置 【包含变量名称的行号(L)】为“1”,如图所示,单击【下一步(N)】按钮。
2.2.1 SPSS数据的录入
第二步:单击数据编辑器窗口左下角的【变量视图】按钮,切换到变量视图 窗口,根据要录入的数据定义变量属性。
2.2.1 SPSS数据的录入
第三步:在左下角单击【数据视图】按钮,就可以直接在SPSS数据编辑器窗口 里以电子表格的方式直接录入数据,建立SPSS文件,录入样例如图所示。
第一步:准备好需要合并的数据文件,注意,个案合并的SPSS数据文件的变量数量必须完 全一致。两个数据文件均包含9个变量,如图所示。
spss教程第一章--数据文件的建立及基本统计描述

第一章数据文件的建立及基本统计描述在社会各项经济活动和科学研究过程中,经常获得许多数据,而这些数据中包含着大量有用的信息。
若要准确地、科学地提取这些信息,就要应用各种统计分析方法,其中最基本的方法是数据的基本统计描述。
通过数据的基本统计描述,可以得到数据的分布状况,数据的主要特征值,时间序列的趋势性,是否存在异常值以及数据的大致图形等。
当然,要实现对数据的统计分析和描述,首先要从建立数据文件开始。
这一章主要介绍数据文件的建立和数据的基本统计描述方法。
§1.1 SPSS的启动及数据库的建立§1.1.2 SPSS简介SPSS(Statistics Package for Social Science )for Windows是一种运行在Windows系统下的社会科学统计软件软件包。
SPSS软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。
从1968年由美国斯坦福大学开发使用至今,已经拥有全球数以万计的用户,分布在通信、医疗、银行、证券、保险、制造、商业、市场研究、科学教育等众多的行业领域,成为世界上应用最广泛的专业统计软件之一。
SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类,每个类中还有多个专项统计方法。
SPSS设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。
一.S PSS的运行方式SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行方式。
程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自己的SPSS命令程序,通过语句直接运行。
第2章:SPSS 数据文件的建立和管理

(3) 定类数据(Nominal)
定类数据只能互相区别,不能进行排序,可以用数值或
字母表示。 例如性别可以用男、女表示;民族可以用汉、回、满等
表示,它们可以和数值、字母表示,无法进行排序。
(4) 变量之间的关系与设置
定距变量包含定序变量包含定类变量。
根据分析的需要,可以将变量定义成相应的尺度。计量
建立数据集例:姓名,字符型;生日,日期型;学历,
数值(0中学,1大学,2研究生);工资x,数值。
2.数据宽度
每种数据的类型都有数据宽度和列宽,数据宽度为存储
变量值的最大位数。需要注意的是对于数值型变量,录入数
据的宽度可以大于设置好的宽度,但对于字符型变量却不是 这样。对于字符型变量,你设置几位数,它就显示几位数。
计量尺度:定序变量 列宽: 标签值: 1 小学 2 中学 3 大学 4 研究生 a5. 存款金额 计量尺度:定距变量 列宽: 8 2 显示位置:居中
3) 凡是可以用数值1、2、3表示的变量定义成数值型,
将更有利于数据分析。
4) 不同的数据根据其实际的意义与取值定义计量尺度。
5) 变量标签的作用主要用于变量的解释说明。
5.缺失数据
(1) 数据缺失在数据处理过程中不可避免
在数据分析的过程中,有时某一项数据是空的,没有填; 有时有的数据明显是错误的,例如误将年龄的20岁填成了200 岁。这两种情况在数据处理中是经常遇到的。
(2) 缺失值的种类
SPSS的缺失值有两类:系统缺失值和用户缺失值。
称没有数据的单元格为系统缺失值,用点儿“.”表示;
尺度在变量定义窗口完成。 演示:姓名,定类;学历,定序;工资,定距。
SPSS应用案例
银行为了发展储户,扩大业务范围和业务量,委托咨询 公司对本企业的发展进行评估,设计了居民储蓄调查问卷.
实验报告一.SPSS数据文件的建立和管理操作以及数据预处理操作

广东金融学院实验报告课程名称:市场调查与预测
四、实验结果(包括程序或图表(截图)、结论陈述、数据记录及分析等,可附页)
1.①变量视图截图(zc和zcl合并为zc)
②数据视图的截图(“职工数据.sav”的变量中多了income)
2. 数据视图的截图(户口状况和现住面积都是按升序排的,且先排户口状况再排现住
面积)
3.数据视图的截图(户口状况=2,即属于外地户口的都被划掉了,从而筛选出本市户口,
此外后面的filter_$为1是被选中的数据)
4. 数据视图的截图(由图看出本市户口人均面积的均值为48.93,外地户口人均面积的
均值为34.03,两者在人均面积上有较大的差异,但本市户口和外地户口计划面积的均值都为90.00,所以两者在计划面积上没有较大的差异)
五、实验总结(包括心得体会、问题回答及实验改进意见,可附页)
1.通过实验,我熟练掌握了SPSS数据文件的合并,排序筛选个案和分类汇总的具体操
作。
2.实验的过程必须要自己亲自练习才有效果,所以即使有步骤,也不要怕麻烦,多练几
次。
3.SPSS是一个数据统计的强大工具,我们必须好好学习。
六、教师评语
1.□优秀(90~100分):完成所有规定实验内容,实验步骤正确,结果正确;
2.□良好(80~89分):完成绝大部分规定实验内容,实验步骤正确,结果正确;
3.□中等(70~79分):完成绝大部分规定实验内容,实验步骤基本正确,结果基本正确;
4.□及格(60~69分):基本完成规定实验内容,实验步骤基本正确,完成结果基本正确;
5.□不及格(< 60分):未能完成规定实验内容或实验步骤不正确或结果不正确。
教师签名:
2013年12 月8 日。