SPSS数据分析报告
S P S S数据分析报告 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】
SPSS期末报告
关于员工受教育程度对其工资水平的影
响统计分析报告
课程名称:SPSS统计分析方法
姓名:汤重阳
学号:
所在专业:人力资源管理
所在班级:三班
目录
一、数据样本描述
分析数据来自于“微盘——SPSS数据包 data02-01”。
本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。
二、要解决的问题描述
1 数据管理与软件入门部分
分类汇总
以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据汇总。
个案排秩
对受教育水平程度不同的职工起始工资和现工资进行个案排秩。
连续变量变分组变量
将被调查者的年龄分为10组,要求等间距。
2 统计描述与统计图表部分
频数分析
利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
描述统计分析
以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。
3 假设检验方法部分
分布类型检验
正态分布
分析职工的现工资是否服从正态分布。
二项分布
抽样数据中职工的性别分布是否平衡。
游程检验
该样本中的抽样数据是否随机。
单因素方差分析
把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。
卡方检验
职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。
相关与线性回归的分析方法
相关分析(双变量相关分析&偏相关分析)
对受教育程度和现工资两个变量进行相关性分析。
线性回归模型
建立用受教育程度预测现工资水平的回归方程
4 高级阶段方法部分
对该样本数据进行信效度检测
三、具体步骤描述
1 数据管理与软件入门部分
分类汇总
以受教育水平为分组依据,对职工的起始工资和现工资进行数据汇总。
图分类汇总数据
由图所示,受教育等级以年为单位划分可分为8年、12年、14年等图中所示10个等级。以等级为8年为例,现工资均值为美元,起始工资均值为美元,统计量为53人。经比较可知,教育年限为12年和15年的职工在公司中占大多数,教育年限为20年和21年的职工在公司中的初始工资平均水平较高,但教育年限为19年的职工现工资平均水平较高。
个案排秩
对受教育水平程度不同的职工起始工资和现工资进行个案排秩。
表现工资水平个案排秩统计量
统计资料
Rank of salary by educ N
有效 遗漏
474 0 平均数 中位数 标准偏差 范围 最小值 最大值
表 1.2-2 初始工资水平个案排秩统计量
统计资料
Rank of salbegin by educ N
有效 遗漏
474 0 平均数 中位数 标准偏差 范围 最小值 最大值
连续变量变分组变量
将被调查者的年龄分为5组。
根据表所示,该公司474名职员年龄几乎全部在33岁以上、73岁以下,年龄层分布集中
在已有工作经验的人当中,其中33~43岁的员工为该公司的主体。 2 统计描述与统计图表部分 频数分析
利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
由表可知,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。
下面对该公司员工受教育程度进行频数分析:
表职工受教育程度频数统计表
Educational Level (years)
次数百分比有效的百分比累积百分比
有效
8
12
14
15
16
17
18
19
53
190
6
116
59
11
9
27
20 2 .4 .4
21 1 .2 .2 总计474
图职工受教育程度频数分布直方图
表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占总人数的%。且接受过高于20年的教育的人数只有1人,比例很低。
描述统计分析
以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。(由于输出结果较长,为了便于解释,仅截取职工受教育水平年限为8年的分析结果)
图职工起始工资描述统计表(部分)
图职工起始工资描述统计直方图(部分)
图给出的就是以受教育年限为8年时职工起始工资的描述统计,由此得出结论如下:(1)集中趋势指标:由图可知,职工起始工资均值为$,5%截尾均数为$,中位数为$,三者差异较大,说明数据分布的对称性较差。
(2)离散趋势指标:起始工资方差为,其平方根即标准差为,样本中极小值为$9750,极大值为美元18750,两者之差为全距(范围)$9000,中间一半样本的全距为四分位间距$4875。
(3)参数估计:职工起始工资的标准误差为$,相应的总体均数95%可信区间为$$。
(4)分布特征指标:根据描述统计数据可知,该样本数据中偏度为>0,曲线右偏;峰度
为<3,曲线较为平缓(该结论也可从图的直方图及其曲线中看出)。
3 假设检验方法部分
分布类型检验
正态分布
分析职工的现工资是否服从正态分布。
H0:职工的现工资服从正态分布
H1:职工的现工资不服从正态分布
α=
表职工现工资正态分布检验结果
单一样本 Kolmogorov-Smirnov 检定
Current Salary
N 474
常态参数a,b
平均数$34, 标准偏差$17,
最极端差异
绝对.208
正.208
负
测试统计资料.208
渐近显着性(双尾).000c
a. 检定分配是常态的。
b. 从资料计算。
c. Lilliefors 显着更正。
图 K-S检验详细模型输出结果
P=
P<α
接受H1,认为职工的现工资统计量不服从正态分布。
二项分布
抽样数据中职工的性别分布是否平衡。
H0:抽样数据中职工性别比例无差异
H1:抽样数据中职工性别比例有差异
α=
P=
接受H0,认为抽样数据中职工性别比例无差异。
游程检验
该样本中的抽样数据是否随机(检测数据均以均值为分割点)。
(1)性别:
H0:抽样数据中性别序列为随机序列
H1:抽样数据中性别序列不为随机序列
α=
表性别序列游程检验
连检定
gender
测试值a.46
观察值 < 检定值258
观察值 >= 检定值216
总箱数474
连个数110
Z
渐近显着性(双尾).000 a. 平均数
图性别序列游程检验详细模型输出
P=
P<α
接受H1,认为样本数据中性别序列不是随机序列。
(2)年龄:
H0:抽样数据中年龄序列是随机序列
H1:抽样数据中年龄序列不是随机序列
α=
表年龄序列游程检验结果
连检定
Years
测试值a
观察值 < 检定值298
观察值 >= 检定值175
总箱数473
连个数196
Z
渐近显着性(双尾).012 a. 平均数
图年龄序列游程检验详细模型输出结果
P=
接收H1,认为年龄序列不是随机序列。
单因素方差分析
把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。
(1)起始工资对现工资的影响分析
H0:认为起始工资对现工资没有显着影响
H1:认为起始工资对现工资有显着影响
α=
表起始工资对现工资的影响分析结果
变异数分析
Current Salary
平方和df 平均值平方 F 显着性
群组之间89 .000
在群组内384
总计473
P=
P<α
接受H1,认为起始工资对现工资有显着影响。
(2)受教育水平对现工资的影响分析
对受教育水平与现工资之间进行方差齐性检测,其结果如下:
P=<,认为该样本方差不齐的要求,因此下面进行的方差分析结论的稳定性较差。
单因素方差检验:
H0:认为受教育水平对现工资没有显着影响
H1:认为受教育水平对现工资有显着影响
α=
表受教育水平对现工资的影响分析结果
变异数分析
Current Salary
平方和df 平均值平方 F 显着性
群组之间9 .000
在群组内464
总计473
P=
接受H1,认为职工受教育水平对现工资有显着影响。
卡方检验
职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。
(1)
H0:起始工资水平与受教育程度之间不存在关联性
H1:起始工资水平与受教育程度之间存在关联性
α=
表起始工资与受教育程度的分析结果
卡方测试
数值df 渐近显着性(2 端)皮尔森 (Pearson) 卡方801 .000 概似比801 .811 线性对线性关联 1 .000
有效观察值个数474
a. 878 资料格 %) 预期计数小於 5。预期的计数下限为 .00。
P=
P<α
接受H1,认为起始工资与受教育程度之间存在关联性。
(2)
H0:现工资与起始工资之间不存在关联性
H1:现工资与起始工资之间存在关联性
α=
表现工资与起始工资的分析结果
卡方测试
数值df 渐近显着性(2 端)皮尔森 (Pearson) 卡方19580 .000 概似比19580
线性对线性关联 1 .000
有效观察值个数474
a. 19890 资料格 %) 预期计数小於 5。预期的计数下限为 .00。
P=
P<α
接受H1,认为现工资与起始工资之间存在关联性。
相关与线性回归的分析方法
相关分析
(1)双变量相关分析
对受教育程度与现工资之间进行相关性分析。
表 受教育程度与现工资间相关性检测
相关
Educational
Level (years)
Current Salary
Educational Level (years) 皮尔森 (Pearson) 相关 1 .661**
显着性 (双尾) .000
N 474 474
Current Salary 皮尔森 (Pearson) 相关 .661**
1
显着性 (双尾) .000
N 474 474
**. 相关性在 层上显着(双尾)。
(2)偏相关分析
由于上述检测数据无法说明相关系数中有多少是反映“受教育程度-初始工资水平-现工资水平”这样一种简介的链条影响,也就是说,在控制了初始工资水平之后,受教育程度与现工资水平之间的相关性不确定,因此,下面采用偏相关分析对这三个因素进行分析。
表 受教育程度与现工资水平偏相关分析
相关
控制变数
Current Salary
Educational Level (years) Beginning Salary
Current Salary
相关 .281
显着性(双
尾) . .000 df 0
471 Educational Level
(years)
相关 .281 显着性(双
尾) .000 . df
471
线性回归模型
建立用受教育程度预测现工资的回归方程。
图 受教育程度与现工资水平散点图
表 回归方程模型汇总
2
=,说明在对现工资水平的影响因素中,受教育程度起到一定的作用,但是并非决定性作用。
表 回归模型方差分析结果
表 回归方程常数项及回归系数检验结果
现工资水平=+*受教育程度(年)
由该方程可得出如下信息:
(1)当受教育年限是0年时,在该公司内的现工资水平为$。
(2)受教育年限每增加一个单位,在该公司内的现工资水平将增加$。 4 高级阶段方法部分
对该样本数据进行信效度检测。 信度
表 样本数据信度检测
项目总计统计资料
尺度平均数(如果项目已删除) 尺度变异数(如果项目已删除)
更正後项目总
数相关
Cronbach 的
Alpha (如果项
目已删除)
Educational Level
(years)
.669 .802 Current Salary
.880 .001 Beginning Salary
.880
.000
由表可得出结论:该样本数据总体α=,信度良好。
由表可得出结论:当信度检测中除去受教育程度后的α=,大于总体信度,说明该项目的信度对总体信度检测产生负向影响。 效度
表 效度分析数据描述
Employment Category .791 Current Salary .900
Beginning Salary .888
Months since Hire .999 Previous Experience (months) .944 撷取方法:主体元件分析。
表效度分析结果
说明的变异数总计
元件
起始特徵值撷取平方和载入
总计变异的 % 累加 % 总计变异的 % 累加 %
1
2
3
4 .414
5 .247
6 .099
撷取方法:主体元件分析。
由表可以看出,该样本数据中第一项的累计百分比为%,大于50%,因此可以认为该样本数据中的效度较高。