spss的数据分析案例
spss的数据分析报告范例

spss的数据分析报告范例一、引言数据分析是科学研究过程中不可或缺的一部分。
针对一项研究项目,本报告将借助SPSS软件对收集的数据进行详尽分析,并提供相关结果和结论。
本报告的目的是帮助读者更好地理解数据,提供决策和制定战略所需的支持。
二、研究方法本研究的数据来源于一份问卷调查,共收集了500份有效问卷。
在问卷设计中,我们采用了随机抽样的方法,以保证样本的代表性。
该问卷包括了参与者的基本背景信息、满意度评价等方面的问题。
三、数据分析1. 受访者基本背景首先,我们对受访者的基本背景信息进行了统计分析。
其中包括性别、年龄、教育水平和职业等因素。
以下是相关结果的总结:(1)性别分布:男性占65%,女性占35%。
(2)年龄分布:年龄在18-24岁的受访者占40%;25-34岁的占30%;35-44岁的占20%;45岁及以上的占10%。
(3)教育水平:高中或以下占20%;本科占50%;研究生及以上占30%。
(4)职业:学生占25%;职员占40%;自由职业者占20%;其他占15%。
2. 满意度评价为了了解受访者对某产品的满意度,我们设计了一套评价体系。
通过SPSS软件进行数据分析,得到以下结果:(1)整体满意度:根据赋分制度,平均满意度得分为4.2(满分为5),表明受访者对该产品整体上持较高满意度。
(2)各项指标:通过因子分析,我们得到了几个影响满意度的关键因素。
其中,产品质量、价格和售后服务被认为是受访者最关注的方面。
3. 相关性分析在数据分析过程中,我们还进行了一些相关性分析,以探究不同变量之间的关系。
以下是一些值得关注的相关性结果:(1)性别与满意度之间的关系:经过卡方检验,我们发现性别与满意度之间存在一定的相关性(p < 0.05),女性对产品的满意度略高于男性。
(2)年龄与满意度之间的关系:通过相关系数分析,我们发现年龄与满意度呈现出弱相关关系(r = 0.15,p < 0.05),年龄越小,满意度越高。
SPSS分析实例

[例1]一个品牌的方便面面饼的标称重量是80克,标准差应该小于2克。
现从生产线包装前的传送带上随机抽取部分面饼,称重数据记录在数据文件data中。
问这批面饼重量是否符(1)检验方法:(2)原假设和备择假设:(3)通过上面两个表格中数据分析所得出的结论:[例2]为评价两个培训中心的教学质量,对两个培训中心学员进行了一次标准化考试,分析(1)检验方法:(2)原假设和备择假设:(3)通过上面两个表格中数据分析所得出的结论:[例3]某康体中心的减肥班学员入班时的体重数据和减肥训练一个月后的体重数据记录在数据文件data中,试分析一个月的训练是否有效。
(1)检验方法:(2)原假设和备择假设:(3)通过上面两个表格中数据分析所得出的结论:(4)可以绘制_________图,直观显示前后体重的变化趋势。
[例4]为了解非计算机专业对计算机课程教学的意见,在金融系和统计系本科生中进行了一次抽样调查,得到了390名学生的调查数据。
试据此推断两系本科生对计算机课程教学的意见是否一致。
(1)检验方法:(2)原假设和备择假设:(3)通过上面两个表格中数据分析所得出的结论:(4)可以通过_________图直观地比较不同系别的满意度。
[例5]为了试验某种减肥药物的性能,测量11个人在服用该药以前以及服用该药1个月后、2个月后、3个月后的体重。
那么请问在这4个时期,11个人的体重有无发生显著的变化?(1)通过上面输出结果表格,可判断使用的检验方法:(2)原假设和备择假设:(3)结论:[例6]数据文件“Employee data.sav”记录了474名职工的基本信息(1)绘制复式条形图来表示不同性别的雇佣类别情况;(2)对起始薪金绘制茎叶图,说明图中信息;(3)通过箱图描绘不同雇佣类别的职工当前薪金情况,得出结论;(4)分析起始薪金的确定与什么因素有关,说明下面两表分别用的分析方法,并比较两表的结果。
控制变量起始薪金教育水平(年)雇佣类别 & 经验(以月计)起始薪金相关性 1.000 .461显著性(双侧). .000df 0 470 教育水平(年)相关性.461 1.000显著性(双侧).000 .df 470 0[例7]考察数码相机成像元器件像素数是否会对产品销量产生显著影响(设显著性水平α=0.05)。
spss案例分析报告(精选)

spss案例分析报告(精选)本文通过分析一份 SPSS 数据,展示 SPSS 在统计分析中的应用。
数据概述本数据为一家咖啡馆的销售数据,共有 200 条记录,包括 7 个变量:日期、时间、收银员、商品名、销售价格、数量和总价。
SPSS 分析1. 描述性统计使用 SPSS 的描述性统计功能,可以获取数据的基本信息,如均值、标准偏差、最大值、最小值等。
其中,销售价格的均值为 44.71 元,标准偏差为 13.29 元,最小值为 23 元,最大值为 78 元。
数量的均值为 1.62 个,标准偏差为 0.51 个,最小值为 1 个,最大值为3 个。
总价的均值为 73.25 元,标准偏差为 21.89 元,最小值为 23 元,最大值为 156 元。
2. 单样本 t 检验假设一杯咖啡的平均售价为 50 元,我们可以使用单样本 t 检验对这个假设进行检验。
首先,我们需要用 SPSS 的数据透视表功能,计算出每杯咖啡的平均售价。
然后,使用单样本 t 检验功能,输入样本均值、假设的总体均值(50 元)、样本标准差、样本大小以及置信度水平。
在这个数据集中,单样本 t 检验得出的 t 值为 -2.36,P 值为 0.019,显著性水平为 0.05,因此我们可以拒绝原假设,认为该咖啡馆的咖啡售价不是 50 元。
4. 相关分析假设我们想要了解商品数量和销售额之间的关系,我们可以使用 SPSS 的相关分析功能来进行分析。
首先,我们需要使用数据透视表功能,计算出每个订单的总价和数量。
然后,使用相关分析功能,输入这两个变量的值,得出相关系数和显著性水平。
在这个数据集中,商品数量和销售额之间的相关系数为 0.749,P 值为 0,显著性水平非常显著。
因此,我们可以认为商品数量和销售额之间存在极强的正相关关系。
结论本文通过 SPSS 对一份咖啡馆销售数据进行分析,展示了 SPSS 在统计分析中的应用。
通过描述性统计、单样本 t 检验、双样本 t 检验和相关分析等功能,我们可以获得数据的基本信息,检验假设,分析变量之间的关系,从而帮助企业更好地决策和管理。
SPSS数据分析实例

• 例2.1:某克山病区测得11例克山病患者与13名健康人 的血磷值(mmol)如下,问该地急性克山病患者与健康人 的血磷值是否相同
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80
1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20
t检验的假设如下: H0:两总体均数相同,μ1 =μ2
H1:两总体不均数相同,μ1 ≠μ2
两样本t检验对数据的要求: 1.小样本时要求分布不太偏 2.小样本时要求方差齐
∴应该先判断该数据是否符合t检验要求,即对数据进行简单描述
2.2.1 数据的简单描述
选择菜单项 分析
பைடு நூலகம்
描述统计
描述
,
系统弹出对话框
选择描述变量
取消文件拆分,不然会影响以后的统计分析
选择菜单项 数据 拆分文件 ,选择 分析所有个案,不创建组
2.2.2 绘制直方图
选择菜单项 Graph Histogram ,系统弹出对话框
将变量x选入Variable选择框内,单击ok,结果浏览窗口绘制出直方图
数据的分布不是特别偏, 没有十分突出的离群值 t检验具有一定的耐受性,稍稍偏离要求一点不 会影响统计分析结果
∴可以直接采用参数分析方法来分析,因是两样本均数的比较,确定采用 成组设计两样本均数比较的t检验来分析
2.3 按题目要求进行统计分析
用SPSS来做两样本均数比较的t检验,选择
分析
均值比较
独立样本T检验
出现t检验对话框
将变量x选入test对话框, 变量group选入grouping Variable对话框,Define Groups钮变黑,在Define Group两个框内分别输入1 和2,在这ok
spss地大数据分析资料报告案例

spss地大数据分析资料报告案例spss 的大数据分析资料报告案例在当今数字化时代,数据已成为企业和组织决策的重要依据。
SPSS (Statistical Product and Service Solutions)作为一款功能强大的统计分析软件,在处理和分析大数据方面发挥着重要作用。
本文将通过一个实际的案例,展示如何运用 SPSS 进行大数据分析,并从中得出有价值的结论。
一、案例背景假设我们是一家电商公司,拥有大量的用户交易数据。
我们希望通过对这些数据的分析,了解用户的购买行为、偏好以及市场趋势,以便优化产品推荐、营销策略和供应链管理。
二、数据收集与整理首先,我们从数据库中提取了相关的数据,包括用户的基本信息(如年龄、性别、地域等)、购买记录(产品类别、购买时间、购买金额等)以及浏览行为等。
这些数据量庞大,可能达到数百万甚至数千万条记录。
在将数据导入 SPSS 之前,我们需要对数据进行预处理,包括数据清洗、缺失值处理和异常值检测。
例如,删除重复的记录、填充缺失的关键信息,并剔除明显不符合常理的异常值。
三、数据分析方法1、描述性统计分析通过计算均值、中位数、标准差等统计量,对用户的年龄、购买金额等变量进行概括性描述,了解数据的集中趋势和离散程度。
2、相关性分析分析不同变量之间的相关性,例如用户年龄与购买金额之间、购买频率与产品类别之间的关系。
3、分类分析使用聚类分析将用户分为不同的群体,以便针对不同群体制定个性化的营销策略。
4、时间序列分析对于购买时间等变量,运用时间序列分析方法预测未来的销售趋势。
四、SPSS 操作与结果解读1、描述性统计分析结果例如,我们发现用户的平均年龄为 30 岁,购买金额的中位数为 500 元,标准差为 200 元。
这表明大部分用户年龄较为年轻,购买金额分布相对较为集中。
2、相关性分析结果发现用户年龄与购买金额之间存在较弱的正相关关系,即年龄较大的用户可能购买金额相对较高。
大学生spss数据分析案例

大学生spss数据分析案例大学生SPSS数据分析案例。
在大学教育中,数据分析是一个非常重要的环节,尤其是对于社会科学和商业管理专业的学生来说。
SPSS(Statistical Package for the Social Sciences)是一个专业的统计分析软件,广泛应用于学术研究和商业决策中。
本文将以一个大学生SPSS数据分析案例为例,介绍如何使用SPSS进行数据分析。
案例背景:某大学社会科学专业的学生对大学生活满意度进行了调查,并收集了相关数据,包括学生的性别、年级、专业、宿舍类型、课程质量、宿舍环境、社交活动等方面的信息。
现在需要对这些数据进行分析,以了解不同因素对大学生活满意度的影响。
数据准备:首先,需要将调查所得的数据录入SPSS软件中,确保数据的准确性和完整性。
在录入数据时,要注意将不同的变量分别录入不同的列中,以便后续的分析和处理。
数据分析:1. 描述统计分析。
首先,可以对各个变量进行描述统计分析,包括计算均值、标准差、频数分布等。
通过描述统计分析,可以直观地了解各个变量的分布情况,为后续的分析提供基础。
2. 相关性分析。
接下来,可以进行各个变量之间的相关性分析,通过相关系数的计算来了解不同变量之间的关联程度。
例如,可以分析学生的性别、年级、专业与大学生活满意度之间的相关性,以及宿舍类型、课程质量、社交活动等因素对大学生活满意度的影响程度。
3. 方差分析。
针对分类变量,可以进行方差分析,比较不同组别之间的均值差异是否显著。
例如,可以分析不同年级、不同专业的学生对大学生活满意度的差异情况,以及不同宿舍类型对大学生活满意度的影响是否显著。
4. 回归分析。
最后,可以利用回归分析来探讨不同因素对大学生活满意度的影响程度。
通过建立回归模型,可以了解各个自变量对因变量的影响情况,以及它们之间的关系强度和方向。
结论与建议:通过以上的数据分析,可以得出不同因素对大学生活满意度的影响程度,为学校和相关部门提供决策建议。
统计学课SPSS数据分析实战案例
统计学课SPSS数据分析实战案例SPSS(统计分析系统)是一款常用的统计软件,被广泛应用于社会科学、商业、医学等领域的数据分析工作中。
通过这个案例,我们将运用SPSS软件进行数据分析,以展示统计学课的实战应用。
案例背景假设你是一位市场研究员,你的公司正在调查消费者对某产品的满意度。
你已经收集了一份随机抽样的数据集,包含了消费者的满意度评分以及他们的一些个人信息。
你的任务是对这些数据进行分析,以了解消费者满意度与个人信息之间是否存在关联。
数据集说明数据集包括了500个消费者的信息,具体变量如下:1. 变量1:满意度评分(连续变量,取值范围从1到10);2. 变量2:性别(分类变量,取值为男性和女性);3. 变量3:年龄(连续变量);4. 变量4:收入水平(分类变量,取值为低、中、高三个层次);5. 变量5:购买次数(连续变量,表示过去一年内购买该产品的次数)。
数据分析步骤以下是对这份数据集进行分析的步骤:1. 数据清洗和准备首先,我们需要检查数据集中是否存在缺失值或异常值,并进行数据清洗。
在SPSS中,我们可以使用数据查看和数据清洗的功能来完成这一步骤。
确保数据集中的每一列都没有缺失值,并且所有的异常值已经得到恰当的处理。
2. 描述性统计分析接下来,我们可以使用SPSS的描述性统计分析功能,对数据集进行描述性统计分析。
我们可以计算满意度评分、年龄和购买次数的平均值、标准差、最小值、最大值,并生成频数分布表和柱状图。
3. 相关性分析为了确定满意度评分与其他个人信息变量之间的关联性,我们可以使用SPSS的相关性分析功能。
通过计算满意度评分与性别、年龄、收入水平和购买次数之间的相关系数,我们可以评估它们之间的相关性。
4. 单因素方差分析我们可以使用SPSS进行单因素方差分析,以了解不同收入水平的消费者在满意度评分上是否存在显著差异。
通过观察方差分析表和显著性水平,我们可以得出初步结论。
5. 多元线性回归分析最后,我们可以使用SPSS的多元线性回归分析功能来建立一个回归模型,以预测满意度评分。
spss数据分析报告案例
SPSS数据分析报告案例1. 研究背景本研究旨在调查大学生是否存在晚睡现象,并探究晚睡与健康问题之间的关系。
通过采集大学生的睡眠时间、就寝时间以及健康状况等数据,利用SPSS软件进行数据分析,进一步了解大学生的睡眠状况与健康问题的关联。
2. 数据概况本研究共收集了200名大学生的数据,其中包括性别、年级、每晚睡眠时间、平均就寝时间、是否存在健康问题等变量。
下面是对数据的描述统计分析结果:•性别分布:男性占50%,女性占50%。
•年级分布:大一占25%,大二占30%,大三占25%,大四占20%。
•每晚睡眠时间:平均睡眠时间为7.8小时,标准差为1.2小时。
最小值为5小时,最大值为10小时。
•平均就寝时间:平均就寝时间为23:30,标准差为0.5小时。
最早就寝时间为22:00,最晚就寝时间为01:00。
•健康问题:共有45%的大学生存在健康问题。
3. 数据分析结果3.1 性别与睡眠时间的关系首先,我们探究性别与睡眠时间之间的关系。
利用独立样本T检验,得出以下的结果:•假设检验:男性和女性的睡眠时间是否存在显著差异?•结果:独立样本T检验显示,男性平均睡眠时间为7.6小时,女性平均睡眠时间为8.0小时。
T值为-2.14,P值为0.034,意味着男性和女性的睡眠时间存在显著差异。
3.2 年级与睡眠时间的关系我们进一步探究年级与睡眠时间的关系。
使用单因素方差分析(ANOVA),得出以下结果:•假设检验:各年级的睡眠时间是否存在显著差异?•结果:单因素方差分析显示,大一、大二、大三和大四的平均睡眠时间分别为7.7小时、7.9小时、8.1小时和7.6小时。
F值为2.75,P值为0.043,说明各年级之间的睡眠时间存在显著差异。
3.3 睡眠时间与健康问题的关系最后,我们分析睡眠时间与健康问题之间的关系。
利用相关分析,得出以下结果:•假设检验:睡眠时间与健康问题之间是否存在相关性?•结果:相关分析结果显示,睡眠时间和健康问题之间存在显著负相关(r = -0.25,P值 = 0.001),即睡眠时间越少,存在健康问题的可能性越大。
spss案例大数据分析报告
spss案例大数据分析报告SPSS 案例大数据分析报告在当今数字化时代,数据已成为企业和组织决策的重要依据。
通过对大量数据的分析,可以揭示隐藏在其中的规律和趋势,为决策提供有力支持。
本报告将以一个具体的案例为例,展示如何使用 SPSS 进行大数据分析。
一、案例背景本次分析的对象是一家电商企业的销售数据。
该企业在过去一年中积累了大量的销售记录,包括商品信息、客户信息、订单金额、购买时间等。
企业希望通过对这些数据的分析,了解客户的购买行为和偏好,优化商品推荐和营销策略,提高销售业绩。
二、数据收集与整理首先,从企业的数据库中提取了相关数据,并进行了初步的清理和整理。
删除了重复记录和缺失值较多的字段,对数据进行了标准化处理,使其具有统一的格式和单位。
在整理数据的过程中,发现了一些问题。
例如,部分客户的地址信息不完整,部分商品的分类存在错误。
通过与相关部门沟通和核实,对这些问题进行了修正和补充。
三、数据分析方法本次分析主要采用了以下几种方法:1、描述性统计分析计算了数据的均值、中位数、标准差、最大值、最小值等统计指标,以了解数据的集中趋势和离散程度。
2、相关性分析分析了不同变量之间的相关性,例如商品价格与销量之间的关系,客户年龄与购买金额之间的关系。
3、聚类分析将客户按照购买行为和偏好进行聚类,以便更好地了解客户群体的特征。
4、因子分析提取了影响客户购买行为的主要因素,为进一步的分析和建模提供基础。
四、数据分析结果1、描述性统计分析结果商品的平均价格为_____元,中位数为_____元,标准差为_____元。
销量的最大值为_____件,最小值为_____件,均值为_____件。
客户的平均年龄为_____岁,中位数为_____岁,标准差为_____岁。
购买金额的最大值为_____元,最小值为_____元,均值为_____元。
2、相关性分析结果商品价格与销量之间呈现负相关关系,相关系数为_____。
这表明价格越高,销量越低。
spss案例分析报告精选文档
s p s s案例分析报告精选文档TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-S p s s分析身高与体重的相互影响一、案例介绍:这是某幼儿园学生的身高体重数据,数据中主要包括编号,学生姓名,性别,学生年龄,每个学生的体重以及身高数值。
主要是看下幼儿园学生体重与身高的相互关系。
二、研究案例的目的:分析幼儿园学生身高体重的相互关系和影响。
三、下面是数据来源:四、研究的方法:主要是使用spss中的描述统计分析和线性回归分析;在描述统计分析中主要是分析出身高体重的最大值和最小值、均值,在图表中可以看出身高的最大值;在线性回归分析中主要是采用身高为自变量,体重为因变量来进行分析的。
五、研究的结果:1)描述分析:打开文件“某班23名同学的身高、体重、年龄数据”,通过菜单兰中的分析选项,进行描述性分析,选择体重和身高,求最大值最小值和均值,得到如下结果:从结果看出,该班学生样本数为23,体重最小值为13.7kg,最大值为23kg,平均体重为17.7167kg。
身高最小值为105cm,最大值为116cm,平均身高为108.85cm。
以身高为例子,选择描述中的频率选项可以得出分布,在频率对话框的图形选项中,选择条形图,即可用图形直观看到结果。
从图形中可以很直观的看出不同身高段的人数分布情况,其中108cm左右的人数最多。
从表格中则可以清楚地看到具体数目。
2)线性回归分析:选择分析——回归——线性,在弹出的对话框中,以身高作为自变量,体重作为因变量,结果如下:从表中可以得出。
R=0.223,即两者具有弱相关性。
从图表中,可以看出它们之间的线性关系大概可以表示为y=-0.139x+2.617 六、研究结论:从描述分析和回归分析可以身高和体重的相关性是相对比较弱的,也就是弱相关性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
spss的数据分析案例
关于某公司474名职工综合状况的统计分析报告一、数据介绍:
本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别就是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。
通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。
二、数据分析
1、频数分析。
基本的统计分析往往从频数分析开始。
通过频数分
析能够了解变量的取值状况,对把握数据的分布特征非常有用。
此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
Statistics
首先,对该公司的男女性别分布进行频数分析,结果如下:
上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45、6%与54、4%,该公司职工男女数量差距不大,男性略多于女性。
其次对原有数据中的受教育程度进行频数分析,结果如下表 :
Educational Level (years)
上表及其直方图说明,被调查的474名职工中,受过12年教育的职工就是该组频数最高的,为190人,占总人数的40、1%,其次为15年,共有116人,占中人数的24、5%。
且接受过高于20年的教育的人数只有1人,比例很低。
2、描述统计分析。
再通过简单的频数统计分析了解了职工在性别
与受教育水平上的总体分布状况后,我们还需要对数据中的其她变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。
下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势与离散趋势。
Descriptive Ststistics
如表所示,以起始工资为例读取分析结果,474名职工的起始工资最小值为$9000 ,最大值为$79980,平均起始工资为$17016,标准差为$7870、638,偏度系数与峰度系数分别为2、853与12、390。
其她数据依此读取,则该表表明474名职工的受教育水平、起始工资、现工资、先前工作经验、现在工作经验的详细分布状况。
3、Exploratory data analysis。
(1)交叉分析。
通过频数分析能够掌握单个变量的数据分布情况,但就是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下
的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影
响与关系。
就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。
现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):
单因素分析用来研究一个控制变量的不同水平就是否对观测变量产生了显著影响。
下面我们把受教育水平与起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平与起始
工资对现工资的影响进行分析。
分析结果如下:
上表就是起始工资对现工资的单因素方差分析结果。
可以瞧出:F统计量的观测值为33、040,对应的概率P值近似等于0,如果显著性水平为0、05,由于概率值P小于显著性水平q,则应拒绝原假设,认为不同的起始工资对现工资产生了显著影响。
同理,上表就是受教育水平对现工资影响的单因素分析结果,其结果亦为拒绝原假设,所以不同的受教育水平对现工资产生显著影响。
4、相关分析。
相关分析就是分析客观事物之间关系的数量分析法,
明确客观事物之间有怎
样的关系对理解与运用相关分析就是极其重要的。
函数关系就是指两事物之间的一种一一对应的关系,即当一个变量X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。
另一种普遍存在的关系就是统计关系。
统计关系就是指两事物之间的一种非一一对应的关系,即当一个变量X取一定值时,另一个变量Y无
法根据确定的函数取一定的值。
统计关系可分为线性关系与非线性关系。
事物之间的函数关系比较容易分析与测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。
如何测度事物之间的统计关系的强弱就是人们关注的问题。
相关分析正就是一种简单易行的测度事物之间统计关系的
有效工具。
上表就是对本次分析数据中,现工资、起始工资、本单位工作时间、以前工作时间、年龄五个变量间的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0、01时,仍拒绝原假设。
一个星号(*)表示显著性水平为0、05就是仍拒绝原假设。
先以现工资这一变量与其她变量的相关性为例分析,由上表可知,现工资与起始工资的相关性最大,相关系数为0、880,而与在本单位的工作时间相关
性最小,相关系数为0、084。
5、参数检验。
首先对现工资的分布做正态性检验,结果如下:
由上图可知,现工资的分布可近似瞧作符合正态分布,现推断现工资变量的平均值就是否为$3,000,0,因此可采取单样本t检验来进行分析。
分析如下:
One-Sample Statistics
One-Sample Test
由One-Sample Statistics可知,474名职工的现工资平均值为¥34,419、57,标准差为$17,075、661,均值标准误差为$784、311。
图表One-Sample Test中,第二列就是t统计量的观测值为5、635;第三列就是自由度为473(n-1);第四列就是t统计量观测值的双尾概率值;第五列就是样本均值与检验值的差;第六列与第七列就是总体均值与原假设值差的95%的置信区间为($2,878、40 , 5,960、73)。
该问题的t值等于5、635对应的临界置信水平为0,远远小于设置的0、05,因此拒绝原假设,表明该公司的474名职工的现工资与$3,000,0存在显著差异。
6、非参数检验。
对本数据中的年龄做正态分布检验,结果如下:
由上图两图可知,474名职工的年龄分布并不完全符合正态分布,所以现推断其职工年龄的平均数在40-45岁之间,可对其采用非参数检验的方法进行检验。
检验结果如下:
Chi-Square Test
上面的第一个表为卡方检验的频率表,输出有关频率统计。
从表中可知,职工年龄为40岁的有41名,期望值为23、5,残差为17、5,其余读取方式相同。
第二个表就是卡方检验统计表,显示检验的卡方值,自由度与渐进显著性水平分别就是28、489、5、0。
因为显著性水平0小于0、05,因此拒绝原假设,即474名职工的平均年龄不在40到45岁之间。