常用统计分析方法--SPSS应用_杜志渊)

常用统计分析方法--SPSS应用_杜志渊)
常用统计分析方法--SPSS应用_杜志渊)

§1.2 数据的编辑与整理

当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。

§1.2.1 数据窗口菜单栏功能操作

数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括:

图1.4 SPSS主菜单

1.File:文件操作。

2.Edit:文件编辑。

3.View:视图编辑。

4.Data:数据操作。

5.Transform:数据转换。

6.Analyze:统计分析方法。

7.Graphs:图形编辑。

8.Utilities:实用程序。

9.Windows:窗口控制。

10.Help:帮助。

在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操作。

§1.2.2 Date数据功能

数据编辑窗口的Data菜单为用户创建和定义数据提供了方便的功能,如图1.5

所示。这个菜单是SPSS 统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。

这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。

一、定义和编辑变量、观测量的命令

Define Variable Properties 用于定义变量属性;

Copy Data Properties 由外部文件和工作文件拷贝数据变量和属性; Define Dates 定义或编辑日期变量格式; Insert Variable 在数据编辑窗口插入一个变量; Insert Case 在数据编辑窗口插入一个观测量; Goto Case 光标跳转到某一指定观测量。 二、变量数据变换的命令

Sort Cases 对观测量进行排序; Transpose 对观测量进行转置;

Restructure 对现有的观测量进行重新构造,形成新格式的数据文件; Merge File 把外部文件数据合并到工作文件中;

Aggregate 对数据进行分类或不分类汇总,产生新文件或代替工作文件。 Identify Duplicate Cases 标识重复观测量; Orthogonal Design 进行正交设计。 三、观察量数据整理的命令

图1.5 Data 菜单项示意图

Split File 拆分数据文件的观测量,观测量进行条件分组; Select Cases 选择观测量;

Weight Cases 对观测量进行加权处理。 通过选择上述命令,可以实现对数据的整理编辑。

§1.2.3 Transform 变换及转换功能

数据编辑窗口的Transform 菜单为用户创建和定义复杂的数据提供了方便的功能,如图2.3所示。它与Data 菜单共同使用,可对基本的数据进行重新编辑,形成新的变量和观测量。这个菜单主要对变量进行操作,分为三部分的功能。这些功能也为各种统计分析要求提供极其灵活了数据处理功能。

一. 通过基本变量创建各种新变量;

Compute 计算产生新变量,SPSS 提供了

10类100多个函数,通过该菜单可以用表达式产生一个新变量;

Random Number Seed 创建随机数种子; Create Times Series 创建时间序列变量; 二. 创建各种参数变量;

Count 创建一个计数变量,用于统计计数; Recode 对变量值重新编码;

Rank Cases 为观测量排秩,求得的秩在数据窗口作为一个新变量保存; Categorize Variables 建立新的分组变量,使数据分成若干个组; Automatic Recode 对变量值自动编码,产生一个连续的变量值编码; Replace Missing Values 创建替代缺失值变量; 三.运行其它自定义的转输程序。

Run Pending Transform 运行其它转换程序。

图1.6 Transform 菜单项示意图

在一般的情况下,通过Date菜单和Transform菜单的操作就可以实现对原始数据的整理和变换。

§1.2.4 数据的编辑

在Data View中,用鼠标左键单击数据表左边框的观测个体序号,这一行值就会被选中,用鼠标左键单击上边框的变量名,这个列就被选中,和其它Windows中的操作类似,也可以用鼠标对选中一部分单元格,选中的行、列、单元格后,单击鼠标右键,可以对它们进行复制、删除、剪切等操作。

如果需要对已经输入的数据进行修改,就要对已经存在的数据进行编辑,SPSS 有许多数据编辑功能。下面介绍几种常用的数据编辑功能。

一、插入一个新观测量(Case)

插入一个新观测量(数据)的命令是Insert Cases。

在数据窗口主菜单上单击Date→Insert Cases命令,可以在光标所在位置的前上一行插入一行新的观测个体,可以输入新的观测数据。

二、查找指定的观测量(数据)

查找指定的观测数据的命令是Go to Case。

在数据窗口单击Data→Go to Case,弹出一个对话框,如图1.7所示:输入要找的观测量的序号后,点OK按钮,数据表中光标就会指到选定的观测量个体。

图1.7 Go To Case对话框

三、观测数据排序

给观测量数据排序的命令是Sort Cases。

在数据窗口单击Date→Sort Cases,打开Sort Cases对话框(见图1.8 )。

图1.8 Sort Case对话框

从对话框左侧的变量列表中选择排序变量,点击右箭头按钮加入Sort by框中,

然后在Sort Order栏中选择排序顺序:

Ascending 观测个体按照选定的排序变量值由小到大的升序排列;

Descending 观测个体按照选定的排序变量值降序排列。

注意:观测个体.排序变量可以是一个或多个,当选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。

注意在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信息,最好自己定义一个变量来记录观测个体的序号。

四、在数据中选取子集

如果需要从数据文件中选取一部分数据,可以在数据编辑窗口单击Data →Select Case,打开Select Case对话框,如图1.9所示:

图1.9 Select Case对话框

在该对话框的Select栏中选择挑选数据子集的方式(单选):

●All case:选择所有数据;

●If condition is satisfied: 按指定条件选择数据。

单击If按纽,打开Select Case:If对话框,如图1.10所示,先选择变量,然后定义条件。

●Random Sample of cases:对观察值进行随机抽样。单击Sample 按纽,打

开Select Case:Random sample对话框。如图1.11所示。

图1.10 Select Case:If对话框

在Sample Size栏中有两种选择方式,一种是大概抽样(Approximately),即键入抽样比例后由系统随机抽样;另一种是精确抽样((Exactly),要求输入从第几个观察值起抽取多少数据。

图1.11 Select Case:Random Sample对话框

●Based on time or case range:顺序抽样。单击Range按纽,打开Select

Case: Range对话框,用户自行定义从第几个观察值开始抽到第几个观察值

结束。

●Use filter variable:用指定变量作过滤。先选择一个变量,系统自动在

数据管理器中将该变量值为0的观测单位标上删除记号,系统对标有删除记

号的观测单位不作分析。

选择了挑选数据子集的方式后,单击OK,在数据窗口可看到新的变量filter_s。如在数据文件SY-1中,选择年龄大于48岁的人作为选择子集。则满足条件的年龄大于48岁的相应的新变量数据为1,否则为0。

五、数据分类汇总(数据分组汇总)

用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以数据库SY-2两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现。具体操作如下。

1.指定分类变量和汇总变量。

打开数据库SY-2,在数据窗口单击Date Aggregate命令,打开Aggregate Date

对话框。如图1.12所示:

图1.12 Aggregate Date对话框

2. 在变量名列表框中选择分类变量”性别”进入Break Variable(s)。

3. 在变量名列表框中选择汇总变量”Math”进入Aggregate Variable(s)。

4. 单击Function按纽,打开Aggregate Date:Function对话框,如图1.13所示。在此对话框中可以选择平均值、数据和、标准差的形式,特别值形式,百分数形式、频数形式等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回Aggregate Date对话框中。

图1.13 Aggregate Date:Aggregate Function对话框

5. 在Aggregate Date对话框中指定汇总文件的保存路径。有两种选择:一种是选中创建新数据文件,通过File按纽,重新指定结果文件名。一种是替代原来数据文件,用分类汇总结果覆盖当前编辑窗口的数据。

6. 单击Name&Label按纽,可以重新指定结果文件中的变量名并加入变量标签。SPSS默认的结果文件中的变量名为原变量名最后加上_1.

7. 如果希望在结果文件中保存各分类组的数据个数,可以选择Save number of case in break group as variable项。最后单击OK,可得相应的数据文件。

六、缺失值的替代方式

如果用户希望对缺失值进行定义,可以采用以下的操作:

在数据窗口点击Transform→Replace Missing Values,打开Replace Missing Values,对话框,如图.1.14.所示:

图1.14 Replace Missing Values对话框

在变量中选择具有缺失值的变量进入New Variable框内,系统可以自动产生替代缺失值的新变量,也可处定义新变量。然后在Method的下拉菜单中选择缺失值的替代方式。五种方式依次是:

Series mean 用该变量所有非缺失值的平均值替代缺失值;

Mean of nearly point 用缺失值相邻点的的非缺失值的平均数据替代缺失值;

Median of nearly point 用缺失值相邻点的的非缺失值的中位数替代缺失值;

Linear interpolation 用缺失值相邻点的的非缺失值的中点值替代缺失值;

Linear trend at point 用线性拟合方式替代缺失值。

七、数据秩(序)的确定

如果用户需要对已有的数据变量排秩(序),如对数据SY-1中两个班的数学成绩分别排出名次,可以在数据窗口采用以下操作。

1. 单击Transform→Rand Cases,打开Rand Cases对话框,如图1.15所示:

图1.15 Rand Cases对话框

2. 从左边变量名列表框中选择变量”数学”(也可选择多个变量)进入Variable(s)框中,选择变量”班级”进入By框中,则系统排序时将按照进入By的变量值“班级”进行分别排序。

3. 单击Ties按纽,选择Ties(Ties是指两个或两个以上的数据相等的情况)的处理方式。由于秩与数据个数是一一对应的,当数据有相同的时,确定它们相应的秩有三种处理方式:对应秩的Mean平均值、Low最小值和high最大值。如本例选择最大值。选择后返回在主对话框。点击OK,就可以在数据窗口看到排序结果。

Rank Types按纽提供排秩方式。单击Rank Types按纽,打开types对话框,从中选择排秩类型,排秩类型从左到右依次是:Rank普通排序(系统默认),新变量的值就是秩;Fractional rank as% 累计百分数排序;Savage score以指数分布为基础的原始分排序;Sum of Case weights 以分组例数之和的权重排序;Fractional rank 以秩变量除以分组例数之和排序;Ntile先给定一个大于1 的整数,系统按照此数的范围确定秩。

§1.2.5 SPSS对变量的编辑

一、插入一个新变量

插入一个新变量的命令是Insert Variable。

在数据窗口单击Data→Insert Variable,会在光标所在位置的前一列插入一个新的变量,变量名字和属性可以在Variable View窗口中定义。

二、已存在的变量生成新变量

对于已存在的数据变量,根据需要进行计算生成新变量的命令是Compute。

在数据窗口单击Transform Compute,打开Compute Variable对话框,如图1.16所示。

在对话框左上方Target Variable栏中,键入即将生成的新变量的名称,并单击Type & Lable按纽确定变量标签及数据类型。对话框的左下栏中给出了数据文件中所有可用的变量列表,我们可以用右箭头按钮从中选取所需的变量进入右上方的Numeric Expression栏中,该栏存放运算表达式,运算表达式中所需要的常用函数

可以从下的Functions列表中直接选取。这些常用函数(见附录2)和其它语言中的函数名称类似,在框中按字母顺序排列,用鼠标选中某个函数,用Functions右面的上箭头按钮加入数值表达式中,对话框中间是一个小键盘,可以用来输入数字、运算符号等。Compute Variable对话框的下面还有一个if按钮,可以选一部分满足某种条件的观测个体来做运算,不满足条件观测,其新变量值缺失。

图1.16 Compute Variable对话框

如图 1.16表示的是数据SY-2中每个学生的数学和物理总成绩。在Compute Variable对话框中填好新变量名称和运算表达式后,点击OK按钮,就可以在数据文件中看到,已经生成了一个新变量Total。

三、产生计数变量

如果用户需要对满足某项条件的数据进行计数,可以使用Count命令。以学生成绩数据SY-1为例,说明具体操作步骤:

在数据窗口单击Transform Count,打开Count Occurrence of Value within Cases对话框,如图1.17所示:

图1.17 Count Occurrence of Value within Cases对话框

先在Target Variable中指定一个变量(可以是已经存在的变量或新变量),并定义变量标签,然后指定要统计的变量加到Numeric Variables框中,再单击Define Values按纽,打开Value to Count对话框。如图1.18所示:

图1.18 Count Values within Cases:Value to Count对话框

在上面的对话框中,确定需要计数的数值,其Value值的设置项依次是:

Value:输入某个值为清点对象;

System-missing:以系统的缺失值为清点对象;

System-or user missing:以系统或用户指定的缺失值为清点对象;

Range:指定数值的计数区域:其中包括:

()through()在框内指定下限和上限

lowest through(): 在框内只指定上限;

()highest through: 在框内只指定下限。

图中给出的是计算达到优良标准,即学生达到80分以上课程数。确定了计数数值后,单击Add,使选择结果进入Values to count 框内。单击Continue按纽,返回主对话框中。如果需要,可以单击If按纽确定计数条件。最后点OK可在数据窗口得到计数变量。

四、变量分组(编码)与自动分组(编码)

Transform菜单下还有以上两条分组(编码)命令。对变量数据的重新分组(编码),是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一组。比如,可以对年龄重新分组,19岁及以下年龄赋予一个编码1,20-29岁的年龄码赋予2,30-39岁年龄码赋予3,依此类推,这些码只能取正整数值。从某种程度上来讲,编码也可以看做分组:一个组对应一个组号,这样就把这些人按年龄分为几个组,一目了然。

变量重新编码命令为Recode,自动重新编码命令为Automatic Recode。Automatic 两者的区别是:Automatic Recode命令是SPSS系统自动设定码为正整数,而Recode 可以根据用户的需要指定特别的码值。自动编码的具体操作为:

在数据窗口单击Transform Automatic Recode打开Automatic Recode。对话框,从左侧的变量列表中选出被将重新编码的原变量,在New Name按钮右边空白栏

中输入新的码值的变量名,点New Name按钮放到上面的栏中。对话框底下有两个选项,以确定编码是从最小的开始,还是从最大的开始,点OK执行这条命令。需要注意的是,码与秩是不同的,请读者在学习时注意它们的区别。

如果用户需要自定义分组的条件,可选择Recode命令。Recode命令有两个选项,分别是:

Into Same Variables:数据编码后新的码值直接放到原来的变量中;

Into Different Variables:数据编码后新的码值存到一个新变量中。

为了避免数据丢失,尽量不要轻易选择前者。选择后者的Recode命令对话框如图1.19所示,

图1.19 Recode Into Different Variables对话框

选择需要重新分组(编码)的变量进入Numeric Variable Output框中,并在右边的Output Variable框中定义新的变量名及变量标签,单击Old and New Values 按纽,打开对话框,Old and New Values对话框最左侧有六个选项,用来确定原变量的取值区间(或单个变量值),它们将被赋予一个相同的新码值,新的码值在右上方的New Value栏中填入。填好后Add按钮就被激活了,单击此按钮,就把这个旧的变量区间(值)以及新的码值到Old->News栏中。重复以上步骤,把所有的区间一个一个都输入后,点Continue按钮回到Recode Into Different Variables菜单,点OK按钮执行命令,即在数据窗口可得到需要的分组赋值变量。

§1.3 基本统计描述

在建立了数据文件之后,需要对数据作进一步的考察,如了解数据的基本特征,如数据的均值、标准差、四分位点,数据的分布形态等,这个过程称为对数据进行基本统计描述。所以说,数据的基本统计描述的目的是:了解数据的基本特征和基本分布形状,为进一步分析做好充分准备。

本节主要内容:数据的基本统计描述方法:频数分析、探索分析及交叉列联表分析等。

§1.3.1 描述统计分析过程

描述统计分析是对数据进行基础性描述。可以得出数据的平均值(Mean)、和

(sum)、标准差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、极差(range)、平均值标准误(S.E.Mean),峰度(Kurtosis)、偏度(Skewness)等统计量。

以2002年全国职工平均工资表为例(数据库SY-2),介绍描述统计分析的具体操作步骤如下:

1、首先打开数据表SY-2,按照Analyze→Descriptives Statistics→Descriptives打开Descriptives对话框,如图1.20所示

图1.20 Descriptives 主对话框

2、从左边源变量中选择一个或者几个变量进入右框中,单击Options按钮,打

开Options对话框,如图1.21所示:

图1.21 Descriptives Options对话框

在对话框中最上面一行是Mean:均值,sum:算术和

Dispersion离差栏

Std.Deviation 标准差 Minimum 最小值

Variance 方差 Maximum 最大值

Range 极差 S.E.mean 均值的标准误

●Distribution分布状态栏

Skewness 偏度 Kurtosis 峰度

●Display Order栏,选择输出方式:

Variable List 按变量表次序;

Alphabetic 按字母顺序;

Ascending Meas 按平均值升序;

Descending Means 按平均值降序。

如在此例中选择按平均值升序项,返回主对话框,单击OK,在输出窗口得描述统计分析输出表。

表1.1 Descriptive Statistics基本描述统计表

Descriptive Statistics

§1.3.2 频数分析

对于一组数据,考察不同的数据出现的频数,或者是数据所落入指定的区域内的频数,可以了解数据的分布状况。数据文件SY-3是一个公司职员表,其中有性别、年龄,受教育年限等五个变量,具体操作如下:

1、打开数据文件SY-3后,单击Analyze→Descriptive Statistics→Frequencies 打开频数分析对话框如图1.22所示。

图1.22 频数分布主对话框

2、在左边的变量框中选中一个或多个变量送入Variable(s)。

3、选中Display frequency tables要求输出分布表。

4、单击Statistics按钮,得到对话框图1.23。

在Frequencies: Statistics对话框中选择要求输出的统计量。

图1.23 Frequencies: Statistics对话框

●Percentile Values百分数选择项栏(复选项)

Quartile四分位数,

Cut points equal groups等分位点百分位数(取值范围在2 100之间)。

Percentile(s)自定义百分数。

●Dispersion 离差栏(见§1.3.1基本统计描述过程)

●Central Tendency 中心趋势栏

Mean 算术平均值(均值), Median 中位数, Mode 众数, Sum 算术和.

●Distribution分布状态栏

在本例中选择四分位点、10等分的百分位点;标准差、方差、最大、最小值;全距、均值、均值的标准误,中位数、偏度、峰度等复选项。

5、单击Chart按钮,得到Frequencies: Chart对话框图1.24. 在对话框中有

●Chart Type图形栏(单选),选择输出的图形类型。

None 不输出图形(系统默许) Bar charts 条形图

Pie charts 饼图 Histograms 直方图

With normal curve直方图中显示正态曲线(只有选择直方图时才能选择)。

●Chart Values栏,选择图形中分类值的表现形式。

Frequencies直方图纵轴为频数,饼图中每块表示属于该组观测值频数;

Percentage直方图纵轴为百分比,饼图中每块表示该组的观测量数占总数的百分比。

图1.24 Frequencies: Chart对话框

6、单击Format按钮,得到对话框图1.25。

图1.25 Frequencies: Format 对话框

在Frequencies: Format 对话框中:

●Order by 排序栏,表示频数分布表的排列顺序。(单选)

Ascending values 按变量值升序排列(系统默许)。

Descending values 按变量值降序排列。

Ascending counts 按变量各种取值发生的频数升序排列。

Descending counts按变量各种取值发生的频数降序排列。

如果设置了直方图,频数表将按照变量值顺序排列。

●Multiple Variables多变量输出表格设置(单选)。

Compare variables 将所有变量的结果输出在一个表中。

Organize output by variables 为每一个变量输出一个表。

●Suppress tables with more than _ categories控制频数表输出的分类数复选项。Maximum number of categories 分类数最大参数值,默许值是10. 本例中均选择系统默认项。点击OK,得到输出表1.2.

表1-2(a) Statistics统计分析表

年龄

表1-2(b)频数表

年龄

表1.2(c)直方图

F r e q u e n c y

从上面的表和直方图中可以观察到该公司32岁至47岁之间的人数最多,占到总

人数的60%以上。

§1.3.3 探索分析过程

探索分析是对数据进行初步的观察分析,主要的分析项目有:

◆ 观察数据的分布特征:可通过绘制箱图和茎叶图等图形直观地反映数据的

分布形式和数据的一些规律性,包括考察数据中是否存在异常值等。 ◆ 正态分布检验:检验数据是否服从正态分布。

◆ 方差齐性的检验:用Levene 检验比较各组的方差是否相等。

以数据库SY-1提供的两个班的学习成绩数据为例,对两个班的数学成绩按照性别进行数据的分布、按照性别检验其数学成绩的方差是否相等。打开数据库SY-1,具体操作步骤:

1、单击Analyze->Descriptive statistics->Explore ,打开Explore 主对话框:如图1.26所示:

图1.26 探索分析主对话框

(1)从左侧的变量列表中选出变量”数学”,送入Dependent List栏;

(2)选择”性别”作为因子变量,送入Factor List栏。有了因子变量,SPSS 会把所有的观测个体按照因子变量的取值分成若干各组,再分组考察

Dependent List中的各个变量,如果不选择因子变量,SPSS会对全部观

测来做探索分析。

(3)选择”班级”标识变量送入Label Case栏,当输出涉及到观测量时,使用该变量值标识各观测量。

(4)在Display栏中选择输出项,依次是Both选择项,输出图形与描述统计量(系统默认),只输出描述统计量和只输出图形。本例中选择默认项。

2、单击Statistics统计量按钮,打开Statistics对话框,选择统计输出量。有四个选择项,分别是:

Descriptives基本统计描述。同时指定均值的置信区间的置信度,系统默认为95%。

M-估计(M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而变化);

Outliers输出分析数据中五个最大值和五个最小值;

Percentiles输出百分数。

本例中选择Descriptives和Outliers后,返回主对话框。如图1.27所示。

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

【免费下载】统计分析与SPSS的应用

广东海洋大学 统计分析与spss 的应用实习报告 姓名: 班级: 学号: 学院(系)职业技术学院专业名称会计电算化使用班级102实习地点软件七室起止时间2012.12.3—2012.12.14路敷设各类管资料腐跨接线槽口不盒处,调试全部高料试卷验;工作;设备与验方设备于调试试卷技在最大障高行自动绝动作资料试于差

统计分析与s p s s的应用实习报告 学院(系)职业技术学院专业会计电算化班级102 学生姓名学号实习地点软件七室201 实习要求: 1、掌握spss软件的使用基础和数据文件的建立和管理操作; 2、掌握spss数据的排序、变量计算、数据选取、计数、分类汇总、数据分组等预处理功能操作; 3、掌握spss的频数分析、计算基本描述统计量、多选项分析、比率分析等基本统计分析操作及解读; 4、掌握spss的参数检验操作及解读; 5、掌握spss的方差分析操作及解读; 6、了解spss的非参数检验操作及解读; 7、掌握spss的相关分析操作及解读; 8、掌握spss的一元线性回归分析操作及解读,了解其它回归分析。 实习目的: 本实习是《统计学原理》课程的实习环节。统计学是社会科学与管理学各专业的基础课程,重点介绍定量研究社会经济现象的基本方法。本课程是为具备一定统计学基础知识的高年级本科生和专科生开设的。通过实习掌握spss软件的统计分析功能和操作技能,把统计分析的基本原理和方法通过spss软件来实现,并能对结果进行解读,主要包括如下内容:SPSS 软件使用基础、用SPSS 进行描述统计、频数分析、交叉列联表分析、多选项分析、参数检验、方差分析、非参数检验、相关回归分析等。 实习时间: 2012.12.3—2012.12.14 实习地点:软件七室 实习内容: 本次实习中老师主要对以下六个方面的内容进行较为详细地讲解和我们进行了相应内容的操作。 1、数据文件的建立和管理 建立SPSS数据文件首先应了解SPSS数据文件的特点、数据的组织形式的基本方式和相关概念,这样才能建立一个完整且全面的数据环境,服务于以后的数据分析工作。数据

《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第 2 章第7 题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在职业年龄 地 N Valid 282 282 282 Missing 0 0 0 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市200 70.9 70.9 70.9 Valid 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0 公交建筑业15 5.3 5.3 39.4 Valid 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1 一般农户35 12.4 12.4 63.5 种粮棉专业 户 4 1.4 1.4 64.9

种果菜专业 10 3.5 3.5 68.4 户 工商运专业 34 12.1 12.1 80.5 户 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9 现役军人 3 1.1 1.1 100.0 Total 282 100.0 100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下 4 1.4 1.4 1.4 20~35 岁146 51.8 51.8 53.2 Valid 35~50 岁91 32.3 32.3 85.5 50 岁以上41 14.5 14.5 100.0 Total 282 100.0 100.0

统计分析与SPSS的应用考试

《统计分析软件》试(题)卷 班级姓名学号 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.”

(2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。 男生数学的均值为82.25高于女生的均值78.5。女生的的标准差7.09930高于男生的标准差3.77492。 2.

3.

优共有4人,良具有12人中有4人。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:<1> (1) (2)

SPSS统计分析练习及答案

SPSS 统计分析练习题目 -2012-10-26 学号:________________________ 姓名:___________________________ (注:将本文件以学号+姓名.doc 的形式另存为一个文件,例2008144154葛爽.doc ,然后以附件形式发送至 all689@https://www.360docs.net/doc/63166714.html, ,时间截止到2012年10月31日。没有指明数据文件名称的题目需自行在SPSS 中建立数据文件并录入相应数据,回答问题时应将SPSS 中的主要输出结果粘贴于答案中。) 1.一所国际新闻学校每年从各大高校中招募刚刚毕业的本科生参加培训,进而作为记者参加新闻工作。大多数刚刚毕业的学生以前没有任何做记者的经验,所以在正式成为一名记者之前,必须进行一段时间的学习,作为职业的预备课程。该国际新闻学校于是设计了两种培训方案: 方案A :学生参加为期15周的全天课程听课学习,随后参加预备课程考试; 方案B :学生直接先参加6个月的记者实习,再进行为期15周的全天课程听课学习,最后进行预备课程考试。 为了评估两种方案各自的有效性,学校随机选出了20名学生参加实验。事前还根据他们的文学等相关学科的成绩对这20人进行了分组,20人分成10组,每组中2人的成绩相近,然后随机地将2人分配去参加方案A 和方案B 的培训。 下表是这20人预备课程本学期的成绩单: 1 2 3 4 5 6 7 8 9 10 A 50 68 72 54 42 60 56 72 63 61 B 62 62 58 74 60 66 64 64 78 66 请问上面的数据是否证明了先参加实践对提高平均测试分数的效果显著? Independent Samples Test 1.843.1911.54518.140.60006239921373013731.5455.331.143.6000623993098710987 Equal varia Equal varia assumed X F Sig.vene's Test f ality of Varian t df g. (2-taile Mean ifferenc td. Erro ifferenc Lower Upper 5% Confiden nterval of the Difference t-test for Equality of Means 因p=0.140>0.05,故不能证明先参加实践对提高平均测试分数的效果显著。 2.早在1990年,美国巴维利亚的6个省报道了他们的婴儿死亡率(每1000名活着出生的婴儿的死亡数)以及母乳喂养率(母乳喂养婴儿的比例)的数据如下: 省号码 死亡率(每1000名婴儿中的死亡人数) 母乳喂养率(%) 1 250 60 2 320 30 3 170 90 4 300 60 5 270 40

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用 摘要:为对统计分析与spss应用分析所学知识进行巩固和检验,特运用所学知识进行简单的统计分析应用,下文以某校学生学期成绩进行模拟分析。 一:原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

统计分析与SPSS的应用

统计分析与SPSS的应用 第1章SPSS统计分析软件概述 常用的统计软件:SAS、SPSS、TSP、STATISTICA、EViews、MINITAB、Excel等。 1.1 SPSS使用基础 数据编辑窗口是SPSS的主程序窗口,在软件启动时自动打开,并一直保持打 开状态直到退出SPSS。在运行时只能打开一个数据编辑窗口,它是由数据视图和变量视图组成的。 主要功能是:定义数据结构、录入编辑和管理待分析的数据。 结果输出窗口,主要功能是显示管理SPSS统计分析结果、报表和图形,与数 据编辑窗口不同的是:结果输出窗口允许同时创建和打开多个窗口,目的是将同一批数据的不同分析结果指定输出到不同的输出窗口。 1.2 SPSS的基本运行方式 SPSS的三种基本运行方式是:完全窗口菜单运行方式、程序运行方式、混合运行方式。 完全窗口菜单运行方式:所有的分析操作通过菜单、按钮、输入对话框等方式完成。 适合一般的统计分析人员和SPSS初学者。 程序运行方式:首先根据分析需要,将数据分析的步骤手工编写成SPSS命令程序, 然后将编写好的程序一次性提交给计算机执行。 适合大规模的统计分析工作。 混合运行方式:完全窗口菜单运行方式和程序运行方式的综合。 1.3 利用SPSS进行数据分析的基本步骤 一、数据分析的基本步骤 1、明确数据分析的目标 2、正确收集数据 3、加工整理数据 4、选择恰当的统计分析方法进行探索分析 5、读懂统计分析结果 二、利用SPSS进行数据分析的一般步骤 1、SPSS数据的准备阶段 在数据编辑窗口中定义SPSS数据的结构,录入和修改SPSS数据等。 2、SPSS数据的加工整理阶段 对数据编辑窗口中的数据进行必要的预处理。 3、SPSS数据的分析阶段 选择正确的统计分析方法,对数据编辑窗口中的数据进行分析建模。 4、SPSS分析结果的阅读和解释阶段 读懂SPSS结果输出窗口中的分析结果,明确其统计含义,并结合应用背景知识做出切合实际的合理解释。

统计分析与SPSS应用教案.doc

第一章统计学及SPSS概述 教学重点:本章是全课程的总纲,主要讲述统计学的含义、统计的作用和统计学的基本概念以及SPSS的基本概述。 教学难点:统计学概念的理解以及SPSS的基本运行。 教学目标:通过统计理论与案例的学习,了解为什么要学习统计、统计的作用以及掌握SPSS如何与统计学进行完美的结合。 教学手段:通过大量生活中的案例导入我们为什么要学习统计学,统计的目的与意义。通过实验室操作SPSS软件,让学生自己动手操作软件。达到理论与实践的双重认知。 第一节统计的含义及意义 导入新课: 提问:同学们举例生活中你见到的统计现象。(与学生互动,讨论5分钟)教师总结:列举生活中常见的统计现象。(举例3分钟) 1.买彩票:你想不想中五百万的彩票? 2.你的工资被平均了:利用2017年各城市的平均工资讲解平 均数意义。 3.选手得分如何计算?为什么要去掉一个最高分和一个最低 分。 4.其他一些生活中与统计相关的小案例。 一、什么叫统计学?(讲解5分钟,包括学生记笔记) 在日常生活中,我们经常会接触到“统计”这一术语。一提到统计,很多人可能首先想到的是统计工作,这种理解是不全面的。统计作为一种社会实践活动,已有悠久的历史,可以说,自从有了国家就有了统计实践活动。最初,统计只是一种计数活动,为统治者管理国家的需要而搜集资料,通过统计计数以弄清国家的人力、物力和财力,作为国家管理的依据。然而在今天,“统计”一词已被人们赋予多种含义,在不同的场合、不同的语言环境中已有许多种不同的解释。统计在不同的场合下,有不同的含义,统计工作:即统计实践,它是对社会自然现象客观存在的现实数量方面进行搜集,整理和分析的过程。即统计资料,是指统计实践活动过程所取得的各项数字资料以及与之相关的其它实际资料的总称。统计学(理论),是指关于认识客观现象总体数量特征和数量关系的科学。

《统计分析与SPSS的应用总结归纳(第五版)》课后测试答案(第2章)

精心整理《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ?原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。 ?计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS 统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 体重变化情况 产品类型 明显减轻无明显变化

第一种产品27 19 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS 数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,

《统计分析与SPSS的应用(第五版)》课后练习

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

统计分析与SPSS的应用实习报告

统计分析与S P S S的应用实习报告 学院(系) 专业会计电算化班级 学生姓名学号实习地点 实习要求: 1、掌握SPSS 软件使用基础; 2、熟练使用 SPSS 进行描述统计、频数分析; 3、使用SPSS进行参数估计,假设检验; 4、使用SPSS进行方差分析; 5、使用SPSS进行相关分析——包括相关图和相关系数; 6、使用SPSS进行一般的回归分析——理解模型的选定、估计、系数及方程的显著性检验、简单的残差分析、预测。 实习目的: 本课程从加强基础、培养学生动手能力、提高素质的教学目标出发,建立一个科学的、合理的统计分析与SPSS的应用这一实验教学课程体系。使学生通过本课程实验教学,不只是加深理解和巩固所学理论知识,而且更能切实掌握各种统计分析方法在统计软件SPSS中的实现,并能正确解释SPSS的运行结果。在实验教学中,同时加强对学生进行科学素质和良好的实验室工作习惯的训练,培养学生的时间意识,为培养具有创新精神和实践能力的高素质人才奠定良好的基础。 实习时间:13-14周 实习地点:综合楼软件7室 实习内容: 经过上个学期的学习,我们在老师的指导下进行了两个星期的统计分析与spss 的应用的操作学习。我们结合统计分析和spss软件的操作程序和方法进行了全方位,全仿真性的了解。我们做的实训内容大概是这样的一个过程: 《实验一》 我们学习了spss统计分析软件的使用基础,其中包括: 1、软件的安装; 2、spss数据的结构和定义方法,spss数据的录入与编辑,数据的保存,读取 其他格式的数据文件和spss数据文件的合并; 3、spss数据的预处理:数据的排序,变量计算,数据选取,分类汇总等。 《实验二》 我们学习了基本的统计分析方法,主要计算基本描述统计量和频数分析 描述统计量以均值和均值标准误差为例 【步骤一】单击“分析”菜单“描述统计”项中的“频率”命令。 【步骤二】弹出“频率”对话框,在对话框左侧的便利列表中选择变量,单击“变量”框中按钮使之添加 【步骤三】单击“频率”对话框右侧的“统计量”按钮,弹出对话框。选择要统计的项目,在“集中趋势”中选择“均值”,在“离散”中选择“均值的标准误”,选好后单击“继续”按钮返回频率对话框,单击“确定”

spss统计分析软件概述

s p s s统计分析软件概述 Prepared on 24 November 2020

第一章 spss 统计分析软件概述 练习题 1. spss 的中文全名和英文全名是什么 答:statistical package for the social science 社会科学统计软件包 Statistical product and service solutions 统计产品与服务解决方案 2. spss 有哪两个主要窗口他们的作用和特点各是什么 答:spss 数据编辑器窗口与spss 结果查看窗口 Spss 数据编辑器窗口:作用:定义spss 数据结构、录入编辑和管理待分析的数据。 特点:SPSS 运行过程中自动打开;SPSS 中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据文件以.sav 存于磁盘上;两个视图:数据视图和变量视图。 Spss 结果查看窗口:作用:显示管理spss 统计分析结果、报表及图形。 特点:在进行第一次分析时自动打开,也可手工打开;输出窗口可以关闭,窗口内容以.spv 存于磁盘上;两个视图:目录视图和内容视图。 3. 什么是spss 的数据集什么是spss 的活动数据集 答:数据集:spss 各数据编辑器窗口分别显示不同的数据集合。 活动数据集:按打开的先后顺序,各数据集依次自动命名为:数据集0、数据集1、数据集2等等,其中只有一个数据集为当前数据集,称为活动数据集,用户只能对某一时刻活动数据集中的数据进行分析。 4. spss 有哪三种主要使用方式各自的特点是什么 答:SPSS 的运行方式有三种,分别是完全窗口菜单运行方式、程序运行方式、混合运行方式。 完全窗口菜单运行方式的特点:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS 的初学者。 程序运行方式的特点:手工编写SPSS 命令程序;一次性提交计算机运行;适用于大规模的分析工作和熟练的SPSS 程序员。 混合运行方式的特点:在使用菜单的同时编辑SPSS 程序,是完全窗口菜单方式和程序运行方式的综合。 5. .sav,.spv,.sps 分别是spss 哪类文件的扩展名 答: .sav 是 spss 中数据文件的扩展名 .spv 是 spss 中输出文件的扩展名 .sps 是 spss 中语法文件的扩展名 spss 统计分析软件概述 【最新资料,WORD 文档,可编辑修改】

统计分析与SPSS应用

四川师范大学数学与软件科学学院 实验报告 课程名称:统计分析与SPSS的应用 指导教师:吕王勇 班级:2008级7班 学号:2008060738 姓名:王梅 总成绩:______________

数学与软件科学学院实验报告 实验编号:一实验项目__数据文件的建立与管理 一、实验目的及要求 实验目的: 熟练掌握建立数据文件的步骤,能解决数据文件结构建立中的细节问题。 实验要求: 熟练掌握建立数据文件的步骤,能解决数据文件结构建立中的细节问题。 二、实验内容 进入SPSS程序菜单窗口,新建一个数据文件,按照要求定义数据文件结构,录入数据。 三、实验步骤(该部分不够填写.请填写附页) 1.,进入SPSS程序菜单窗口 2,新建一个数据文件 3,按照要求定义数据文件结构 4,录入数据。 实验报告附页 四、实验结果分析与评价(该部分不够填写.请填写附页)

注:实验成绩等级分为(90-100分)优,(80-89分)良,(70-79分)中,(60-69分)及格,(59分)不及格 数学与软件科学学院实验报告 实验编号:二实验项目__数据文件的基本加工和处理 一、实验目的及要求 实验目的: 熟练掌握数据文件的整理、加工熟练掌握数据的分组。 实验要求: 熟练掌握数据文件的整理、加工熟练掌握数据的分组。 二、实验内容 练习题4题:将“学生成绩表一.sav”和“学生成绩表二.sav”进行横向合并。练习题6题 三、实验步骤(该部分不够填写.请填写附页) 1.分别把“学生成绩表一.sav”和“学生成绩表二.sav”排序。 2.打开“学生成绩表一.sav”. 3.选择菜单:DATE——MERGE FILE——ADD V ARIABLES 4.选择“学生成绩表二.sav”,以学号为关键变量进行横向合并。 5.把合并后的文件保存并命名为“学生成绩”。

SPSS Statistics 统计分析软件简介

SPSS Statistics 统计分析软件简介 SPSS Statistics 统计分析软件是一款在调查统计行业、市场研究行业、医学统计、政府和企业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于1968年研制,1984年SPSS首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。 迄今SPSS Statistics软件已有40余年的成长历史。全球约有28万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。 在2009年IBM收购SPSS公司后,现在在中国国内市场上推出的最新产品,是IBM SPSS Statistics 19.0多国语言版。 即时切换多国语言界面的统计分析软件,中文界面清晰友好 SPSS软件界面操作语言齐备,使用者可以自行设置英文或简体中文操作界面。

在国内统计应用中,很多使用者在学习时会遇到英文统计专业名词的困难,因此很希望软件有中文版。SPSS可以自行切换软件语言界面,很好地满足了很多人希望使用中文版的要求。SPSS软件的中文界面具有清新、友好的中文界面;全新的中文帮助文档,使使用者的学习更轻松;具有简洁、清晰的中文输出,结果一目了然,共享和发表结果更方便。 功能全面的统计分析软件 SPSS Statistics非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。特别适合设计调查方案、对数据进行统计分析,以及制作研究报告中的相关图表。对于阅读统计分析报告的用户来讲,也已经非常熟悉由SPSS Statistics软件制作完毕的图表。 快速、简单地为分析准备数据 在您进行数据分析之前,需要根据分析目的及分析技术,对数据进行准备和整理工作。SPSS Statistics内含的众多技术使数据准备变得非常简单。不同于其他统计分析软件,您不需要为了完成重要的数据准备工作购买其他产品。SPSS Statistics给出变量值的列表,以及值的数量,您能够根据这些添加信息。一旦建立了数据词典,您可以使用“拷贝数据属性”工具,更快地为分析作数据准备。 SPSS Statistics可以同时打开多个数据集,方便研究时对不同数据库进行比较分析和进行数据库转换处理。软件提供了更强大的数据管理功能帮助用户通过SPSS Statistics使用其它的应用程序和数据库。支持Excel、文本、Dbase 、Access、SAS等格式的数据文件,通过使用ODBC(Open Database Capture)的数据接口,可以直接访问以结构化查询语言(SQL)为数据访问标准的数据库管理系统,通过数据库导出向导功能可以方便地将数据写入到数据库中等等。

统计分析与SPSS的应用第五版课后练习答案第章

统计分析与S P S S的应用第五版课后练习答案 第章 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第3章SPSS数据的预处理 1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款 <5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点

击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。 方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在第2章第7题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对第2章第4题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 8、利用SPSS的变量计算功能,随机生成服从标准正态分布的100个样本数据。 ⑴在空表中先列100个序号,激活表。 ⑵转换随机数生成器设置起点勾选“随机”

统计分析与SPSS的应用学生复习题

1、SPSS的数据编辑窗口分为Data wiew和Vairable view两个视图子窗口。 2、SPSS最基本的变量类型有数值型、字符型和日期型。 3、SPSS有两类缺失值:系统缺失值和用户缺失值。 4、SPSS的测量尺度主要有标度测量、有序测量和名义测量。 5、SPSS有四种创建数据文件的方法: 6、从其它数据文件导入数据主要三种方法: 7、如果只需保存部分变量可使用选择性保存功能。 8、姓名、性别、年龄、身高、体重分别是那种变量? 9、SPSS有两种定义缺失值的方式:和。1)可以定义3个单独的缺失值。 2)可以定义一个缺失值范围和一个单独的缺失值。 10、数据进行排序时,选择菜单下的命令。Data菜单下sort case 11、spss进行数据的行列互换时,选择菜单下的命令。Data菜单下transpose. 12、数据文件的合并有两种方式:和。 13、SPSS的系统运行管理方式有哪三种? 答:1)批处理方式;2)完全窗口菜单运行方式;3)程序运行方式。 14、SPSS数据文件的扩展名是。.sav 15、SPSS的输出结果编辑窗口分成左右两部分: 16、输入变量名,为了避免与老版本及其它软件出现不兼容问题,变量名一般控制在8位以内且尽量避免采用中文。 17、下面是每周去图书馆学习次数的编码方案:1=每周去1次;2=每周去2次或2次以上;3=每周去3次或3次以上;4=每周去4次或4次以上。问:1)如此编码有无错误?2)请写出正确的编码方案。 19、数据一旦拆分之后,如果没有取消拆分,在以后的统计分析过程中拆分一直存在。 20、数据一旦加权之后,如果没有取消加权,在以后的统计分析过程中加权一直存在。 21、对于缺失值,如何利用SPSS进行科学替代。(见课件) 22、SPSS数据文件的特点及监理SPSS数据文件时应完成的两项任务是什么?P16-17 23、简述SPSS数据文件的基本组织形式。 24、统计学依数据的计量尺度将数据分为哪三类 CH5 参数检验(均值比较与t检验) 1、什么是t检验,简述t检验的一般步骤。 2、在统计学中,通常将t检验分为4类:样本均值与总体均值比较的t检验、独立两样本 均值比较t检验、配对设计的差数均值与总体均值0的t检验以及独立两样本几何均值比较的t检验。 3、简述单样本t检验的一般步骤。 4、两独立样本T检验的零假设H0是两总体均值之间不存在显著差异。两配对样本T检验 的零假设H0是两总体均值之间不存在显著差异 5、面是学生数学成绩的单样本检验。

SPSS统计分析教程独立样本T检验

独立样本T检验 下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>Compare Means==>Independent-Samples T test,系统弹出两样本t检验对话框如下: 将变量X选入test框内,变量 group选入grouping框内,注意这时 下面的Define Groups按钮变黑,表示 该按钮可用,单击它,系统弹出比较组 定义对话框如右图所示: 该对话框用于定义是哪两组相比,在两 个group框内分别输入1和2,表明是 变量group取值为1和2的两组相比。 然后单击Continue按钮,再单击OK 按钮,系统经过计算后会弹出结果浏览 窗口,首先给出的是两组的基本情况描 述,如样本量、均数等(糟糕,刚才的 半天工夫白费了),然后是t检验的结 果如下: Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper X Equal variances .032 .860 2.524 22 .019 .4363 .1729 7.777E-02 .7948

差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

统计分析与SPSS的应用

统计分析与SPSS的应用

广东海洋大学 统计分析与spss的应用实习报告 学院(系)职业技术学院 专业名称会计电算化 使用班级102 实习地点软件七室 起止时间2012.12.3—2012.12.14 姓名:

班级: 学号: 统计分析与s p s s的应用实习报告 学院(系) 职业技术学院专业会计电算化班级102 学生姓名学号实习地点软件七室201

实习要求: 1、掌握spss软件的使用基础和数据文件的建立和管理操作; 2、掌握spss数据的排序、变量计算、数据选取、计数、分类汇总、数据分组等预处理功能操作; 3、掌握spss的频数分析、计算基本描述统计量、多选项分析、比率分析等基本统计分析操作及解读; 4、掌握spss的参数检验操作及解读; 5、掌握spss的方差分析操作及解读; 6、了解spss的非参数检验操作及解读; 7、掌握spss的相关分析操作及解读; 8、掌握spss的一元线性回归分析操作及解读,了解其它回归分析。 实习目的: 本实习是《统计学原理》课程的实习环节。统计学是社会科学与管理学各专业的基础课程,重点介绍定量研究社会经济现象的基本方法。本课程是为具备一定统计学基础知识的高年级本科生和专科生开设的。通过实习掌握spss软件的统计分析功能和操作技能,把统计分析的基本原理和方法通过spss软件来实现,并能对结果进行解读,主要包括如下内容: SPSS 软件使用基础、用 SPSS 进行描述统计、频数分析、交叉列联表分析、多选项分析、参数检验、方差分析、非参数检验、相关回归分析等。 实习时间: 2012.12.3—2012.12.14 实习地点:软件七室 实习内容: 本次实习中老师主要对以下六个方面的内容进行较为详细地讲解和我们进行了相应内容的操作。 1、数据文件的建立和管理 建立SPSS数据文件首先应了解SPSS数据文件的特点、数据的组织形式的基本方式和相关概念,这样才能建立一个完整且全面的数据环境,服务于以后的数据分析工作。数据文件的管理的管理包括SPSS数据的录入与编辑、数据的保存、读取其他格式的数据文件和数据文件的合并。 2、数据的预处理

spss统计分析软件概述

第一章 spss 统计分析软件概述 练习题 1. spss 的中文全名和英文全名是什么 答:statistical package for the social science 社会科学统计软件包 Statistical product and service solutions 统计产品与服务解决方案 2. spss 有哪两个主要窗口他们的作用和特点各是什么 答:spss 数据编辑器窗口与spss 结果查看窗口 Spss 数据编辑器窗口:作用:定义spss 数据结构、录入编辑和管理待分析的数据。 特点:SPSS 运行过程中自动打开;SPSS 中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据文件以.sav 存于磁盘上;两个视图:数据视图和变量视图。 Spss 结果查看窗口:作用:显示管理spss 统计分析结果、报表及图形。 特点:在进行第一次分析时自动打开,也可手工打开;输出窗口可以关闭,窗口内容以.spv 存于磁盘上;两个视图:目录视图和内容视图。 3. 什么是spss 的数据集什么是spss 的活动数据集 答:数据集:spss 各数据编辑器窗口分别显示不同的数据集合。 活动数据集:按打开的先后顺序,各数据集依次自动命名为:数据集0、数据集1、数据集2等等,其中只有一个数据集为当前数据集,称为活动数据集,用户只能对某一时刻活动数据集中的数据进行分析。 4. spss 有哪三种主要使用方式各自的特点是什么 答:SPSS 的运行方式有三种,分别是完全窗口菜单运行方式、程序运行方式、混合运行方式。 完全窗口菜单运行方式的特点:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS 的初学者。 程序运行方式的特点:手工编写SPSS 命令程序;一次性提交计算机运行;适用于大规模的分析工作和熟练的SPSS 程序员。 混合运行方式的特点:在使用菜单的同时编辑SPSS 程序,是完全窗口菜单方式和程序运行方式的综合。 5. .sav,.spv,.sps 分别是spss 哪类文件的扩展名 答: .sav 是 spss 中数据文件的扩展名 .spv 是 spss 中输出文件的扩展名 .sps 是 spss 中语法文件的扩展名 6. spss 的数据加工和管理功能主要集中在哪些菜单中统计绘图和分析功能主要集中在哪些菜单中 答:SPSS 数据的加工和管理功能主要集中在 Data (数据操作和管理)和 Transform (数据基本操作)菜单中,统计绘图和分析功能主要集中在 Graphs (制作统计 图形)和 Analyze (统计分析)菜单中。 7. 请查阅相关资料,解释概率抽样和非概率抽样中各具体抽样方法的特点和使用场合。 答:非概率抽样: spss 统计分析软件概述 【最新资料,WORD 文档,可编辑修改】

相关文档
最新文档