2015-第2章-SPSS数据文件的建立和管理
SPSS统计分析- 第2章 数据文件建立和管理

4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
SPSS数据文件的建立与管理

变量;
Width:变量宽度,默认为8; Decimals: 小数位数,默认为2; Label :变量名标签,对变量名作进一步解释; Values :变量值标签,对变量取值进行解释; Missing :缺失值; Columns :列宽,默认为8; Align :对齐,默认为右对齐(Right); Measure :测量尺度:定类型变量 (Nominal )、
数据导入-电子表格数据(*.xls )
表格第一行是否为变量名? 选择数据表
2.6 数据文件的合并
纵向合并(追加)
【数据D】【合并文件G】【添加个案C】
横向合并(对接) 【数据D】【合并文件G】【添加变量V】
纵向合并(追加)——P37 案例2-3
与已打开的数据集合并
从外部打开数据集合并
002 003
女 男
95 98
Active dataset is key table
学号 001 002 003
性别 男 女 男
成绩 90 95 98
专业 MIS Finance **
数据文件中的个案 必须按升序排列
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月
王强
李霞 王涛 刘海 赵晓薇 董俊 Biblioteka 2. 变量可以分为
离散变量:取有限个值 连续变量:可以取无穷多个值
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月 年龄
王强
李霞 王涛 刘海 赵晓薇 董俊
男
女 男 男 女 男
1995.1
1994.3 1995.10 1997.6 1994.2 1995.6
20
21 20 18 21 20
SPSS数据分析教程-2-数据文件的建立和管理

最新课件
14
数据的输入操作(2)
ID号(id) 性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到 个案来匹配,则该个案于第二个文件的变量上的取 值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两 个或者两个以上的个案来匹配,则该个案只取第二 个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图:一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念; 了解SPSS数据编辑器的特点,熟悉SPSS的变
量视图和数据视图,掌握SPSS常用的工具按 钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的 数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典; 学习合并两个数据文件的方法; 明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”(客户工作单 位的类型)进行合并文件。选择【数据】→ 【排序个案】 ,首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变 量】 进行合并。
最新课件
43
2.7 数据的拆分
第二章-SPSS数据文件的建立和管理(ppt文档)

教授(1)
0
15
8
副教授(2)
10
20
1
讲师(3)
20
10
1
助教(4)
35
2
0
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述, 它的定义是通过数据编辑窗口中的变量视图实现的。
一、变量名 二、数据类型 三、变量名标签 四、变量值标签 五、缺失数据 六、计量尺度
一、变量名(Name)
变量名是变量存取的惟一标志。在定义SPSS数据文件结构 时应首先给出每列变量的变量名。为了方便记忆,变量名最好 与代表的数据含义相对应。
变量名一般的起名规则: 1、变量名的字符个数不多于8个;变量名不区分大小写字 母。允许汉字作为变量名,汉字总数不能超过4个;
2、首字符应以英文字母开头,后面可以跟除了!,?,*之 外的字母或数字。下划线、圆点不能为变量名的最后一个字母;
3、变量名不能与SPSS内部特有的具有特定含义的保留字 相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它 以字母“VAR”开头,后面补足5位数字,如VAR00001, VAR00012等。
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数 据类型,分别为数值型、字符型和日期型。相应的类型会有 默认的列宽或小数位数等。
3、日期型(Date) 日期型用来表示日期或者时间数据,如生日、成立日期 等变量可以定义为日期型。
三、变量名标签(Label)
1、 变量名标签是对变量名含义的进一步解释说明,它 可增强变量名的可视性和统计分析结果的可读性。
spss数据文件的建立与管理

SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位 如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他: 如:圆点数值型(dot)、用户自定义型(customer) 注意:显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为 合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共 同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
(二)变量的类型(type)和显示宽度(width) 1、数值型:
标准数值型(Numeric):默认类型 列宽8位;小数点2位 如: 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号 如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 如:1.2E+05 带美元符号(Dollar):表示货币 格式很多,如:$12.30
事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等
3、SPSS缺失值 用户缺失值 系统缺失值:点 (•)
SPSS数据文件的结构
(七)变量计量尺度(Measurement)
第二章.SPSS数据文件的建立和管理

候选品牌列表:1、长虹 2、海尔……
2.2.3 SPSS数据的编辑
一、数据的定位
人工定位,人工浏览数据。适用于数据较少的情况 系统定位,系统按照用户指定的条件自动寻找数据单 元。适用于数据量较大的情况 按个案号码定位,Data-Go to case 按变量值定位,Edit-Find
2.3 SPSS数据的录入与编辑
2.3.1 SPSS数据的录入—调查问卷的录入
开放题
原则上按照字符变量自由录入 注意适情况适当放大变量宽度(Width)
单选题
按照选项设定标签,采用数字代码录入
多选题P103
多重二分法(简称:二分法) 多重分类法(简称:多分法)
半开放题
使用两个变量对其进行定义,在第一个变量中,“其他, 请指出”作为选项中的一个进行录入;第二个变量将“其 他,请指出”看作一个独立的开放题进行数据录入将没有 选择该选项的被访者作为缺失值处理
2.4.1 SPSS支持的数据格式
SPSS文件格式(.sav),完整但通用性差; Excel格式(.xls),dbf文件格式(.dbf),文本 文件格式(.dat),变量格式信息丢失但可被相 应软件直接读取
2.4.2 保存SPSS的操作
File-Save/Save as 文件名、文件类型及选择保存变量
2.2.3 变量名标签
对变量名含义的进一步说明,它可增强变 量名的可视性和统计分析结果的可读性。 可用中文,总长度达120个字符。 可省略,但建议给出。 2.2.4 变量值标签 是对变量取值含义的解释说明信息,对定 类型和定序型数据尤为重要。
2.2.5 缺失数据
数据中明显错误或明显不合理的数据以及 漏填的数据都可看作缺失数据。 用户指定缺失值
第二章SPSS数据文件的建立和管理

第二章SPSS数据文件的建立和管理目的1、明确SPSS数据的基本组织方式和数据行列的含义2、掌握应从哪些方面描述SPSS数据文件的结构特征3、熟练掌握建立SPSS数据文件以及管理SPSS数据文件的基本操作4、熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。
系统的运行及主屏幕介绍开始→程序→SPSS for windowFile文件edit编辑view视图data数据transform转换analyze分析graphs图形utilities实用windows窗口help帮助N3,N7N2,N62.1 SPSS数据文件2.1.1 SPSS数据文件的特点第一,SPSS的数据文件扩展名是.sav.第二,是一种有结构的数据文件。
在建立数据文件时,要做好两方面的任务①描述SPSS的数据结构;②录入编辑SPSS的数据内容。
2.1.2 SPSS数据的基本组织方式一、原始数据的组织方式数据编辑窗口中的一行称为一个个案,所有个案组成SPSS的数据。
一列称为一个变量,每个变量都有一个名字,称为变量名。
它是访问和分析SPSS每个变量的唯一标识。
例2.1:二、计数数据的组织方式有时采集的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据。
2.2 SPSS数据的结构和定义方法通过variable view定义文件结构2.2.1变量名P72.2.2数据类型、列宽、小数位宽P8-P122.2.3变量名标签P13变量名标签是对变量名含义的进一步解释说明,总长度可达120个字符。
2.2.4变量值标签P142.2.5缺失数据P15-172.2.6计量尺度P19变量结构定义的基本操作,P202.3 SPSS数据的录入与编辑2.3.1录入2.3.2编辑P24-302.4 SPSS数据的保存2.4.1 SPSS支持的数据格式P312.4.2基本操作P322.5读取其他格式的数据文件P332.5.1直接读入其他格式的数据文件P34,基本操作2.5.2使用文本导向读入文本文件P38,基本操作2.6 SPSS数据文件合并2.6.1纵向合并数据文件例2-3:职工数据.sav,追加职工.savP45-47Data—merge file—add case左边显示不同的变量,右边显示相同的变量2.6.2 横向合并数据文件例2-4:职工数据.sav,职工奖金.sav P48-50Data+Merge Files+Add Variables。
第二章SPSS数据文件的建立和管理

SPSS数据文件的特点
SPSS • 其扩展名为.sav • 是一种有结构的数据文件,由结构和内容 两部分组成 • 只能被SPSS软件打开
SPSS
结 构
SPSS
内 容
SPSS
SPSS数据的基本组织方式
• 原始数据的组织方式
• 频数数据的组织方式
原始数据的组织方式
SPSS
第二节SPSS数据的结构和定义方法 SPSS
SPSS
第五节SPSS数据的保存
• SPSS支持的数据格式 • 保存SPSS数据的基本操作
SPSS支持的数据格式
SPSS
• • • •
SPSS文件格式 Excel格式文件 Dbf格式文件 文本格式文件
扩展名
.sav
.xls
.dbf
.dat
SPSS
• 保存SPSS数据的基本操作
• 选择菜单文件
保存或另存为
SPSS
SPSS
添加 完 后 按 确 定
SPSS
得到合 并后 的数 据文 件
SPSS
横向合并数据文件
• 指将数据编辑窗口中的数据与另一个SPSS数 据文件的数据依据个案进行左右对接。 横向合并数据文件应注意:
两个数据文件必须至少有个名称相同的变量; 两个数据文件必须事先按关键变量进行了升序排序
SPSS
SPSS
第三节SPSS结构定义的应用案例
SPSS
第四节 SPSS数据的录入与编辑
• SPSS数据的录入 • SPSS数据的编辑
SPSS • • • •
SPSS数据的录入
按单元格输入数据 按变量输入数据 按个案输入数据 输入带有变量值标签的数据
SPSS数据的编辑
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
38
2.3 SPSS结构定义的应用案例
• SPSS数据文件的建立--练习(第26页)
• 根据居民储蓄调查问卷,建立SPSS
格式的数据文件。
39
2.4 SPSS数据的录入与编辑
• 2.4.1 SPSS数据的录入 • 2.4.2 SPSS数据的编辑
SPSS数据的定位 插入和删除一条个案 插入和删除一个变量 数据的移动、复制和删除
33
3. 数值型数据(metric data)
– 对事物的精确测度 – 结果表现为具体的数值,是最常见的数据类型 – 例如:身高为175cm、168cm、183cm;还有体重 、收入等等
34
35
2.2.7 结构定义的基本操作
单击Variable View 进入; 定义 变量 名
定义显 示宽度
定义 对齐 方式
11
定义时直接 录入即可
2.2.1 变量名(Variable name)
变量名是变量访问和分析的唯一标志。 在定义 SPSS数据结构时应首先给出每列变 量的变量名。
12
定义时直接 录入即可
2.2.1 变量名(Variable name)
变量的命名规则如下:
1. 以前版本的首字符应以英文字母开头, 20 版本的可以直接是汉字开头。后面可以跟 除了!、?、*之外的字母或数字。下划线、 圆点不能为变量名的最后一个字符。 SPSS 允许用汉字作为变量名。
26
• 指定用户缺失值。用户缺失值可以是:
o 对字符型或数值型变量,用户缺失值可以 是1至3个特定的离散值(Discrete missing values); o 对一个数值型变量,用户缺失值可以在一 个连续的闭区间内并同时再附加一个区间 以外的离散值(Range plus one optional discrete)。
15
2.2.2-1 数据类型(Type)
数据类型是指每个变量取值的类型。SPSS中 有三种基本数据类型:数值型、字符型和日期型。
•数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) •字符型(String) •日期型(Date)
18
字符型(String)
字符型也是SPSS较常用的数据类型,由 一个字符串组成。如职工号码、姓名、地址 等变量都可以定义为字符型数据。字符型数 据的默认显示宽度为 8 个字符,不能够进行 算术运算,区分大小写字母。字符型数据在 SPSS 命令处理过程中应用一对双引号括起 来,但在输入数据时不应输入双引号,否则 双引号将会作为字符型数据的一部分。
变量值标签是对变量取值含义的解释 说明信息,对于品质型数据(定性数据包括 分类和顺序数据)尤为重要,比如1代表男
性,2代表女性,它不但明确了数据的含义,
也增强了最后统计分析结果的可读性,变
量值标签可以用中文。
23
鼠标单击再单击右边的省略号 弹出值标签定义窗口逐个添加
24
2.2.5 缺失数据(Missing values)
13
2.变量名的字符个数最好不多于8个;变量 名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开 头,后面补足5位数字,如VAR00001, VAR00012等。变量名不能与SPSS内部特有 的具有特定含义的保留字同名,如ALL, BY,AND,NOT,OR等。
14
4.变量名最好与其代表的数据含义相对应, 每个变量名必须具有唯一性。
7
(2)频数数据的组织方式
例:
职称 年龄段
分组汇总 后的数据
35岁以下(1) 36-49岁(2) 50岁以上(3) 教授(1) 副教授(2) 讲师(3) 助教(4) 0 10 20 35 15 20 10 2 8 2 1 0
频数数据的组织方式中: 一行为变量的一个分组(或多 个变量交叉分组下的一个分组),所有行囊括了该变量 的所有分组情况,一列仍为一个变量,代表某个问题 (或某个方面)及频数。 8
50
2.4.2.3 插入和删除一个变量
• 插入一个变量:
选择菜单菜单 编辑Edit插入变量Insert Variable
• 删除一个变量,在欲删除的变量名上单击鼠 标左键,于是待删除的数据全部反向显示; 单击鼠标右键,从弹出菜单中选择清除cut 选项。
51
2.4.2.4 数据的移动、复制和删除
• 输入定位变量值并确认
于是, SPSS自动对指定的变量进行搜索,并 将当前单元定位于定位变量值相等的第一个个 案上。
48
49
2.4.2.2 插入和删除一个个案
• 插入一个个案,选择菜单 编辑Edit插入个 案Insert Case
• 删除一个个案 ,在欲删除的个案号码上单 击鼠标左键;单击鼠标右键,从弹出菜单中 选择清除cut选项。
19
日期型(Data)
日期型数据用来表示日期或者时间, 如生日、成立日期等变量可以定义为日期 型数据。显示格式:dd-mmm-yyyy; mm/dd/yyyy。
20
2.2.2-2 变量宽度(Width)、显示 宽度(Columns)
每种类型的变量都有自己的变量宽度、小
数位和显示宽度,其中变量宽度是变量允 许的最大字符位数,列宽度是数据编辑窗 口中显示每列的字符位数。通常这两个宽 度是一致的。
数据的移动、复制和删除:与一般的应 用程序相同
统计应用软件
授课教师:邹小林
1
第二章 SPSS数据文件 的建立与管理
2.1 SPSS数据文件 2.2 SPSS数据的结构和定义方法 2.3 SPSS结构定义的应用案例 2.4 SPSS数据的录入和编辑 2.5 SPSS数据的保存
2015-6-22 2
2.1 SPSS数据文件
• 2.1.1 数据文件的特点
频数数据的组织方式—SPSS格式
职称 年龄段 人数
1
1 1 2 2 2 3 3
1
2 3 1 2 3 1 2
0
15 8 10 20 2 20 10
3
4 4
3
1 2
1
35 2
4
3
0
9
2.2 SPSS数据的结构 和定义方法
SPSS数据的结构是对SPSS每列变量 及其相关属性的描述,主要包括变量 名、数据类型、变量宽度、变量名标 签、变量值标签、显示宽度、缺失值、 对齐方式、度量尺度等信息。
• 数据中存在明显错误或明显不合理的数据 或漏填数据项时统计学上称为不完全数据 或缺失数据。 • 数据中如果存在缺失数据,分析时通常不 能直接采用,要进行说明。
25
• SPSS中说明缺失数据的方法是指定用户缺 失值。这样,SPSS在分析时,就能够将这 些缺失值与正常的数据区分开来,并依据 用户指定的缺失值处理策略对其进行处理 或分析。 • SPSS还有一类默认的缺失值,称为系统缺 失值,数值型变量用圆点表示,字符型用 空格表示。
21
定义时直接 录入即可
2.2.3 变量名标签(Variable label)
• 变量名标签是对变量名含义的进一步解释说
明,它可以增强变量名的可视性和统计分析
结果的可读性。
• 变量名标签可用中文,总长度可达 120 个字
符,但在统计分析结果的显示中一般不能显
示如此长的变量名标签信息。
22
2.2.4 变量值标签(Value label)
4
数据 结构
数据 内容
5
基于上述特点,建立SPSS数据文
件时应完成两项任务:
• 描述SPSS数据的结构(变量视图) • 录入编辑SPSS数据的内容(数据视图)
6
2.1.2 SPSS数据的组织方式
(1) 原始数据的组织方式
直接的问 卷数据
• 数据编辑窗口中的一行称为一个个案或记 录(Case),所有个案组成SPSS数据文件 的内容。数据编辑窗口的一列称为一个变 量(Variable),每个变量都有一个名字, 称为变量名,它是访问和分析SPSS每个变 量的唯一标志。 SPSS数据文件的结构就是 对每个变量及相关特征的描述。
27
SPSS用户缺失值定义窗口
鼠标单击再单击右边的省略号 弹出缺失值定义窗口逐个添加
28
SPSS用户缺失值定义窗口
29
变量对齐格式(Align)
• 定义显示对齐方式,对齐方式分为右对齐、 左对齐和中间对齐; • 系统中,数值型变量默认为右对齐,字符 型变量默认为左对齐。
30
2.2.6 度量标准(Measure)
定义变 量类型
变量值 定义变量名标签 定义度量尺度 标签
定义变量类 型对话框
定义变量值标 签对话框
定义变量缺省值 36 对话框
• 通常建立SPSS数据文件时应首先定义 数据的结构部分,然后再输入数据, 但实际应用中,边录入、边分析、边 修改数据结构的情况也是常见的。数 据的结构定义完成之后,可以在变量 视图(Variable View)卡片中浏览,也可 以通过菜单选项实用程序(Utilities) 变量 (Variable)来实现。
10
• 2.2.1 变量名(Name) • 2.2.2 数据类型(Type)、宽度 (Width) 、列宽度(Columns) • 2.2.3 变量名标签(Label) • 2.2.4 变量值标签(Values) • 2.2.5 缺失数据(Missing) • 2.2.6 计量尺度(Measure) • 2.2.7 结构定义的基本操作
40
2.4.1 录入
• 定义好SPSS数据结构后,可将具体的数据 输入到 SPSS 中,最终形成 SPSS 数据文件。
• SPSS数据的录入操作在数据编辑窗口中的 数据视图(Data View)卡片中实现。其操作 方法与EXCEL基本类似,也是以电子表格 的方式进行录入。