spss第二章变量计算及转换

合集下载

SPSS-教程-----第二章2.数据编辑与整理

二、数据编辑与整理1 数据整理在主菜单中点击Data菜单命令，弹出数据文件子菜单，如下图。

主要功能有：定义时间，插入变量或记录，到某一记录，观测值排序，数据转置，合并文件，数据分类汇总，正交设计方案，折分文件，选择观测值单位，变量加权等。

1.1 定义时间变量（Define Dates..）在菜单中选中Data- Define Dates..命令，弹出日期格式设置对话框，在对话框中选中需要的格式。

例如，我们要定义一个以天数为单位的日期变量，就在“Cases Are:”栏里选中“Days”,在“First Case ls”的“Day”输入框输入“1”。

然后单击 ?OK ?按钮。

这样系统就在数据编辑窗口新添加了“DAY_”和“DATE_”两个变量，“DAY_”变量为数值型，“DATE_”变量为字符型。

1.2 插入变量（Insert Variable）在数据编辑窗口选定要插入变量位置的后一个变量，可以从工具条直接点击插入变量按钮，或从菜单中选择Data-Insert Variable命令。

数据编辑窗口产生一个新的变量列。

1.3 插入记录（Insert Case）在数据编辑窗口选定要插入记录位置的后一个记录，可以从工具条直接点击插入记录按钮，或从菜单中选择Data-Insert Case命令。

数据编辑窗口产生一个新的记录行。

1.4 观察值排序（Sort Cases）从菜单中选择Data- Sort Cases命令，弹出观测值排序对话框。

Sort by:选择排序变量。

对所选变量的观测值排序。

如果选择了两个以上的变量，其排序结果将按变量在本栏的选入顺序依次排序。

Sort Order:排序方式：⊙ Ascending:升序排列。

数值型变量由小到大排列，字符型变量按ABCD 字母顺序排列。

系统默认项。

○ Descending:数值型变量由大到小排列，字符型变量按ZYX字母顺序由后向前排列。

1.5 数据转置（Transpose）将工作区数据的行和列互换，使新文件的行是原数据的列，新文件的列是原数据的行。

第2章 SPSS 17.0 基本操作与数据管理PPT教学课件

2020/12C/1C1 E，这只是5种命名，用户可以自行设定这5种类型。
6
(2)字符型: 字符型编变量由字符串组成，可以包含数字、字母和一些特殊符号。字符型变量的默认长度为8，大于8个字符的称为长字符型变量，少于8个字符的称为短字符型变量，字符型变量最长为32767个字符。他不能参与运算，区分大小写字母。 (3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。
(2)菜单栏
菜单栏，包括 “文件”、“编辑”、“视图”、“数据”、 “转换”、“分析”、“图形”、“实用程序”、“附加内容”、 “窗口”和“帮助” 菜单，这些菜单可以实现编辑数据与变量、定义系统参数、设计显示方式、绘制图形、进行各项数据分析和查阅帮助等功(3能)数。据单元格信息显示栏
该显示栏用于显示单元格位置和单元格的内容等信息。灰色显示的区域为提示区，显示单元格的位置，空白区域为数据编辑器，该区域内显示当前选中的单元格的内容，用户可以在该区域输入或修改相应的内容。
如：1-12-2009、29.12.99等
2020/12/11
7
二、变量名与变量标签
变量名和变量标签是用户用于识别变量的标志。
1.变量名
变量名用于区分不同的变量。
起名规则：
• 不能超过64个字符
• 不区分大小写
• 默认变量名为VARn，如：var00001
• 首字符必须是字母、中文或特殊符号“@” 、“$” 、“#” 。
2020/12/11
3
(4)数据编辑显示区
在窗口的中部是编辑显示区，该区最左边列显示单元序列号，最上边一行显示变量名称。选定的单元格呈反色显示，其内容将出现在数据和单元格信息显示栏中。用户可以在该区域内输入或修改单元格内容。

SPSS第二章

们的目的是将这两个数据合并到一起。
• 增加变量有两种方式:
一是两个数据文件按观测量顺序一对一地横向合并；二是按关键变量合并，即要求两个数据文件必须有一个共同的关键变
量，两个数据文件中关键变量值相同的观测量合并为一个观测量。
1、打开数据a2-1.sav与数据a2-2.sav，我们来演示打开多个数据文件合并数据的方式。
“变量名称是否包含在文件的顶部？”选项：如果变量名称包含在文件的顶部选择“是”；没有选择“否”。本例中变量名称包含在文件顶部，选择“是”。
点击“下一步”
5、进入第3步。这里有三个选项需要设置
“第一个数据个案从哪个行号开始？”选项：该输入框用于选择数据读取的起始行，如果数据文件中包含标签，那么该数据文件的起始行就不是第一行。本例中由于第一行包含标签故输入 “2”。
– 变量名最多可包含 64 个字节，并且第一个字符必须是字母或字符 @、# 或 $ 之一。后续字符可以是字母、数字、非标点字符和句点 (.) 的任意组合。在双字节语言（例如中文）中，64 个字节通常意味着 32 个字符。
• 定义变量包括：变量名、变量类型、变量宽度、小数位数、变量标签、数值标签、缺失值、变量栏宽度、数据对齐方式、变量的度量标准。
– 度量标准，分为度量、有序和名义。这对应于统计上所讲的等距与等比、顺序、称名变量。
• 在SPSS的数据视图中，数据文件是按个案（行）和变量（列）组织的。
• 个案表示各个调查对象。
• 变量表示对调查中提出的每个问题的回答。
例子
• 问卷的组成： –指导语 –人口统计学资料 –各个分问卷
例子
在本例中，数据a2-1.sav与数据a2-2.sav的顺序是一一对应的，我们可以直接按照增加变量的第一种方式，直接点击确定合并；也可以按照关键变量来进行合并，在正式合并之前我们已经把数据按照关键变量进行升序排列。我们下面演示的是第二种按关键变量合并的方法。

2.4 SPSS数据的计算和变换

【Old and New Value】按钮被激活，单击此按钮，弹出如下图所示的对话框。
Step04：选择样本赋值如果用户不是对所有的候选变量进行赋值，而是选择其中符合某些条件的变量值进行赋值操作，此时需要单击【If】按钮进行操作。按照具体要求指定观察量的选择条件进行操作。 Step05：最后单击【OK】按钮，此时操作结束。
在数据分析中，经常要根据一些已知的数据变量计算新的变量。例如，根据历年的产量数据资料计算产量的发展速度，根据人口数据计算人口出生率、死亡率等。不仅如此，还需要进行不同类型变量之间的转换，如将数值型变量转化为字符型变量。这些工作都需要利用【Transform( 转换)】菜单中的相关命令。
变量计算是数据分析中的重要内容之一。有些时候，收集到的原始数据并不能直接提供给我们许多有用的信息，此时，我们需要将原始数据进行计算变换，生成有用的新的变量。例如，根据职工的基本工资、各类保险、公积金等，计算职工的实际月收入；根据购房客户的贷款总额和按揭方案评价客户的潜在风险等。
在【Numeric Expression( 数值表达式 )】文本框中输入计算表达式“a=第一产业/国内生产总值”。
单击【OK(确定)】按钮，操作完成。此时，原数据文件新增加了“a”变量。
SPSS 的【Transform( 转换 )】菜单中有【Recode into Same Variable( 重新编码为相同变量 )】和【Recode into Different Variable(重新编码为不同变量)】两个命令可以实现重新赋值功能，它们分别表示重新赋值到同一变量或不同变量。下面以【Recode into Different Variable(重新编码为不同变量)】命令为例说明重新赋值功能。

非常详细的SPSS实用教程

06
2.3.8 数据次序确定
选择“Transform”菜单中的“Rank Cases”命令，弹出“Rank Cases”对话框，如图2-18所示，在该对话框中可以改变数据排序的次序。
图2-18 “Rank Cases”对话框
图2-19 “Rank Cases:Types”对话框
01
排序类型如下。
2.3.3 数据的排序
图2-10 “Sort Cases”（排序）对话框
在数据文件中，可根据一个或多个排序变量的值重排个案的顺序。
2.3.4 数据的行列互换
图2-11 “Transpose”对话框
2.3.5 选取个案子集
在数据统计中可从所有资料中选择部分数据进行统计分析。
图2-12 “Select Cases”对话框
图2-7 保存为另外的数据格式文件
SPSS Portable(*.por)
用户确定盘符、路径、文件名以及文件格式后单击“Save”按钮，即可保存为指定类型的数据文件。SPSS支持的常见的数据文件存放格式如下。
SPSS/PC+(*.sys)
SPSS(*.sav)
Tab delimited(*.dat)
2
图2-23 “Compute Variable”（计算变量）对话框
图2-24 条件表达式对话框
2.4.4 产生计数变量
在统计过程中，往往需要进行一些计数工作。产生计数变量就是实现计数功能，它对所有个案或满足一定条件的个案，计算若干个变量中有几个变量的值落在指定的区间内，并将计数结果放入一个新变量中。
定义变量
01
启动SPSS后，出现如图2-1所示数据编辑窗口。由于目前还没有输入数据，因此显示的是一个空文件。

spss第二章变量计算及转换

2.5 变量重新赋值
Range:[ ]through [ ]:
连续取值的变量与编码的对应关系
Range:Lowest through[ ]: 变量值的上限
Range:[ ]through highest: 变量值的下限
All other value:
剩下的尚未指定的变量可以指定为同
2.4 特定变量值计数
(2)从源变量中选择准备计数的变量移至Numeric栏中 (3)选中Numeric Variable 框中的变量，单击 Define
Values 按钮：打开Count Values within Cases: Value to Count对话框
2.4 特定变量值计数
Define Value
(1) Value: 输入要计数的特定的变量值 (2)System-missing:系统缺损值出现的次数 (3)System-or use-missing:系统缺损值或用户自定义缺损值出现的次数 (4)Range:[ ]through[ ] : 针对数值连续可变的数值型变量的计数 (5)Range: Lowest through :
标变量名，type & label 按钮定义变量类型与标签
2.2 变量计算及其运用
（4）条件表达式（if) 在 Compute Variable对话框中单击if按钮，打开if Cases 条件对话框
实习：
打开数据文件“第二章数据文件/变量计算.sav” 选择飞行员时要选择那身高与体重的比值在一
2.选择进行编码的变量名，送入input Variables——output 矩形框
3.在Output Variable 输入存放编码的新变量名和标签，点击change按钮， 4.点击old and new values按钮

spss2-数据管理和数据转换

SPSS函数
练习:大学生心理调查数据
请对SCL90量表进行计分。
SCL90计分方法及步骤:
第一步：统计总分和总均分
总分：将所有项目分相加总均分：总分／90。
第二步：统计各因子分
参照记分键，将各因子的项目评分相加并除以项目数得因子分。
SCL-90各因子记分键1
因子
项目序号
项目数
19、44、59、60、64、66、89
7
Count 对话框
用于计算某个值或某些值在某个变量中出现的次数
指定记录变量值是否出现的变量名
定义变量值
练习:
请对SCL90量表的阳性项目数和阳性症状均分进行计数。
阳性项目数：题项选择≥1的题目数阳性症状均分：总分／阳性项目数
Recode
打开其他格式的数据文件
保存数据文件
File菜单中的其他条目
新建数据文件
第一步：定义变量属性具体步骤:
选择Variable View选项卡；定义变量名(Name)；定义变量类型(Type)；定义宽度(Width)和小数位数（Decimals）；定义变量标签（Label）和值标签(Values)；定义用户缺失值(Missing)；定义变量的显示格式(Columns和Align)；定义变量测度类型(Measure)。
定义用户缺失值对话框：
无缺失值选项，为系统默认
离散缺失值选项
范围并附加一个范围外值
可供选择的变量测度类型:
Scale
(定距定比测量)
Ordinal
（定序测量）
Nominal
（定类测量）
对等间隔测度的变量或表示比值的变量选此项，如身高、体重；

spss第二讲数据整理data、transform

演示：根据数据transform.sav中学生的性别变量对英语的平均成绩进行汇总。
38
SPSS统计软件
变量清单
将汇总变量加入当前数
据替代当前数
据文件创建汇总文件
分组变量
汇总统计量
汇总统计量清单
39
SPSS统计软件文件级数据整理 4.文件的拆分
操作提示：Data →Split File…
2）按班号对技能成绩大于60分的成绩进行汇总，另存为新的数据文件。
3）以姓名定义新变量名，进行行列转置，另存为“转置.sav”。
48
SPSS统计软件
数据管理练习
3、数据：新医学生成绩.sav 要求：1）描述不同班级（号）学生的妇科和儿科平均成绩与标准差,结果保存为“新成绩.spv”。 2）选出内科成绩大于18的学生，描述其外科成绩平均水平,结果保存为 “外科成绩.spv”。
Recode可以用于字符型变量
23
SPSS统计软件
演示：将数据transform.sav中字符型“city”变量转化为数值型变量“newcity”。（按照字母排序）
24
SPSS统计软件变量级数据整理：4.Rank Cases
编秩变量分组变量
操作提示： Transform →Rank Cases
SPSS统计软件
第二讲 SPSS数据整理
课前复习
1
SPSS统计软件
SPSS的特点
SPSS操作界面----三个窗口 SPSS的保存
（新医学生成绩）
2
SPSS统计软件
SPSS数据格式
1.一条记录占一行（反映某个研究对象具体特征的一组观测值。） 2.一个变量占一列（测量指标） 3.SPSS数据分析时特殊数据格式（配对设计、重复测量资料数据）最终的数据集应当包含原始数据的所有信息

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(1) Value: 输入要计数的特定的变量值 (2)System-missing:系统缺损值出现的次数 (3)System-or use-missing:系统缺损值或用户自定义缺损值出现的次数 (4)Range:[ ]through[ ] : 针对数值连续可变的数值型变量的计数 (5)Range: Lowest through :
59赋值为1，60～69赋值为2，70～79赋值为3，80～89赋值为4，大于90分的赋值为5。 2.大于59分小于80分的取原值，其余值定义为缺失值
2.6 连续变量离散化
(1)执行Transform---Categorize 命令，打开Categorize 对话框
(2)从源变量列表中选择一个或几个连续的变量移入 Create Categorize，在Number of Categorize输入整数
A 经常见,到处都是 B一般 C 很少见到 D 从来没见过
11．您认为分类垃圾筒上的分类标记容易理解吗?
A非常容易理解 B比较容易理解 C一般 D比较不容易理解 E非常不理解
12．您对现在投入使用的分类垃圾箱满意吗？ A非常满意 B比较满意 C一般 D比较不满意 E 非常不满意
一、在学号变量的后面加入下面两个新的变量， 13.您的性别 A男性 B女性 14.您的出生地区：A 省会城市 B地级市 C小城镇
变量值上限 (6)Range:[ ] through highest:
变量值下限
2.4 特定变量值计数
（4）如果按指定的条件计数，单击If按钮，在设置条件单击Continue返回主对话框，单击OK执行计数。
实习：
打开数据文件“变量计算.sav” 计数观测量中政治课成绩与英语成绩均
大于80分的同学有哪些同学。
（2）出勤15－21天的按照“日基本工资*出勤天数＋工龄*1.2－应扣水电费”计算
（3）出勤14天及以下的按照“日基本工资*出勤天数＋工龄－应扣水电费”计算。
（4）计算不同车间工人的月实发工资的平均值与总量。
并将平均工资与总工资分别按照在一张表格与分车间的形式分别输出。
综合实习
下面是一份关于垃圾分类现状的调查，请根据调查问卷建立一个数据文件，然后做后面的练习。
3. SPSS内部函数(180个) (1) 算术函数 (2) 统计函数 (3) 概率函数
2.2 变量计算及其运用
Compute 命令（1）打开数据文件，执行Transform—Compute命令
2.2 变量计算及其运用
（2）输入计算表达式。（3）定义新变量以及类型。在Target(目标）框中定义目
D 农村二、到网络课堂的电子课间处下载“垃圾分类”文件
夹，把自己回答问卷的信息以一个观测量的形式录入到“垃圾分类调查.sav”数据文件中，并以学号为文件名保存起来，发送到网络课堂的作业“垃圾分类综合练习”中。进入网络课堂——主题——垃圾分类综合练习第二步，下载其他同学输入的信息，并将其他同学的信息合并到你的数据文件中，至少合并10个观测量。
一个编码
(2)输入原始变量值对应的编码
Value:
原始变量值对应一个具体的编码
System-missing：原始变量值对应的编码是系统缺损值
(3)单击Continue返回主对话框
5.主对话框中单击“OK”，执行编码操作
2.5.2 变量重新赋值给新的变量
1.主菜单Transform选择Recode-Into Different Variable
A 环保意识差 B 生活习惯投垃圾 E 其它________
C 国家相关法律法规不健全 D 别人也是乱
9．您认为能促使您将垃圾分类投放的因素是？ A环保意识 B生活习惯 C 国家相关法律法规 D 别人是否乱投垃圾 E其它________
10．您在平时生活中经常见到分类垃圾筒吗?(若选D则直接跳到第12题)
6.排秩的类型，单击Rank Type
2.7 观测量求秩
(1)Rank:
普通秩
(2)Savage score: 基于指数分布规律计算出的一种秩
(3)Fractional rank: 分数形式的秩
(4)Fractional rank as %: 百分比形式的秩
(5)Sum of weights: 加权观测量的总和
2.5 变量重新赋值
Range:[ ]through [ ]:
连续取值的变量与编码的对应关系
Range:Lowest through[ ]: 变量值的上限
Range:[ ]through highest: 变量值的下限
All other value:
剩下的尚未指定的变量可以指定为同
6．是否会自己尝试搜集并学习有关垃圾分类的知识？ A会 B看情况 C不会 D无
7．您认为影响你将垃圾分类投放的因素是？
A 我认为没有必要将垃圾分类 B不方便，垃圾分类标准不明确 C找不到分类垃圾箱 D对分类垃圾箱的标记不理解 E没有这方面的规定 F 其他
8．您认为影响垃圾分类深入人心的最重要的因素是什么?
2.选择进行编码的变量名，送入input Variables——output 矩形框
3.在Output Variable 输入存放编码的新变量名和标签，点击change按钮， 4.点击old and new values按钮
4.建立变量值与编码的对应关系
5.单击弹出对话框
(1)Old Value: 原始变量值
标变量名，type & label 按钮定义变量类型与标签
2.2 变量计算及其运用
（4）条件表达式（if) 在 Compute Variable对话框中单击if按钮，打开if Cases 条件对话框
实习：
打开数据文件“第二章数据文件/变量计算.sav” 选择飞行变量重新赋值
4.单击Old and New value 弹出对话框
(1)建立变量值与编码的对应关系
Value: System-missing: System-or user-missing:
输入原始的变量值系统缺损值与自定义编码的对应关系系统缺损值或用户自定义的缺损值与编码的对应关系
(6)若选Convert numeric string to numbers 中选项，则可将字符型转换为数值型
(7)可以同时对多个变量值进行编码
5.通过条件表达式建立参与编码的观测量子集
6.单击OK执行编码
实习：
打开数据文件“变量重新赋值与求秩.sav” 1.将统计学成绩“stat”重新赋值：小于
二、打开数据文件“变量计算.sav”
1.对所有学生的总成绩进行按降序求秩。
2.对学生的总成绩分班级排列名次。
1.打开数据文件“机械厂数据文件.sav”
公司财务规定，工资按照下列原则发放
（1）出勤满22天或以上者，按照“日基本工资*出勤天数＋工龄*1.8－应扣水电费”计算，
其中应扣水电费：工龄小于10年的工人为50元，工龄在11－15年的为45元，工龄在16年以上的为40元。
第2章变量计算及转换
2.1 SPSS内部函数 1、SPSS基本运算
算术运算符及意义关系运算符及意义逻辑运算及意义
+
加法 =
等于
&(AND) 与
-
减法 >
大于
|(OR) 或
*
乘法 <
小于
~(NOT) 非
/
除法 ≥ 大于等于
**
乘幂 ≦ 小于等于
( ) 括号 ≠ 不等于
第2章变量计算及转换
2. SPSS表达式 (1) 算术表达式 A+B (2) 关系表达式 A>B (3) 逻辑表达式 A>b&C=6 逻辑运算中优先级的顺序为：最高级为not，其次为and，最后为or。
定范围内的人员，因此需要计算身高与体重的比例。前提条件是选择身高在175——185cm 之间的男生即可。选择所有男生中身高与体重的比值大于2.5的观测量，并计算每个学生8门成绩总和。对总成绩进行降序排列。
2.3 设定随机数种子
Transform---Random Number seed(随机数种子)命令, 打开Random Number seed对话框
(6)Ntiles:
按百分比进行分组
结的处理方式选择： Ties
(1)Mean: 出现同秩变量时，新变量的值取平均值
(2)Low: 出现同秩变量时，新变量的值取最小值 (3)High: 出现同秩变量时，新变量的值取最大
值 (4)Sequential ranks to value:
出现同秩变量时，新变量连续取值ties
2.4 特定变量值计数
(2)从源变量中选择准备计数的变量移至Numeric栏中 (3)选中Numeric Variable 框中的变量，单击 Define
Values 按钮：打开Count Values within Cases: Value to Count对话框
2.4 特定变量值计数
Define Value
2.6 连续变量离散化
实习：连续变量离散化
打开数据文件“变量计算.sav” 将所有观测量按照身高分成等比例的四
组。统计四组不同身高同学的平均身高，请
在同一张表格中输出平均身高的值以便于比较。
2.7 观测量求秩
1.执行Transform ----Rank cases
观测量求秩主对话框
8.单击OK，执行给变量排秩的操作
Mean Low
High
Sequential ranks to unique values
90 1 1
1
1
1

spss第二章 变量计算及转换

SPSS-教程-----第二章2.数据编辑与整理

第2章 SPSS 17.0 基本操作与数据管理PPT教学课件

SPSS第二章

2.4 SPSS数据的计算和变换

非常详细的SPSS实用教程

spss第二章变量计算及转换

spss2-数据管理和数据转换

spss第二讲数据整理data、transform

spss第二章变量计算及转换