SPSS多重比较方法

SPSS多重比较方法
SPSS多重比较方法

SPSS 多重比较方法

(信息摘自网络,仅供参考)

(一)常用方法总结

1.LSD 法最小显著差异法 ,公式为 :

它其实只是 t 检验的一个简单变形 ,并未对检验水准做出任何校正 ,只是在标准误

的计算上充分利用了样本信息 , 为所有组的均数统一估计出了一个更为稳健的标

准误 ,其中 MS 误差是方差分析中计算得来的组内均方 ,它一般用于计划好的多重

比较。由于单次比较的检验水准仍为α,因此可认为 LSD 法是最灵敏的。

2.Bonferroni 法

该法又称 Bonferroni t 检验 ,由 Bonferroni 提出。用 t 检验完成各组间均值的配

对比较,但通过设置每个检验的误差率来控制整个误差率。若每次检验水

准为α′,共进行 m 次比较 ,当 H0为真时 ,犯Ⅰ类错误的累积概率α不超过 mα′,既有 Bonferroni 不等式α≤ mα′成立。

3.Sidak 法

它实际上就是 Sidak 校正在 LSD 法上的应用 ,即通过 Sidak 校正降低每两次

比较的Ⅰ类错误概率 ,以达到最终整个比较的Ⅰ类错误概率为α的目的。即α′ =

1 - (1 - α )

2 / k ( k- 1) ,计算 t 统计量进行多重配对比较。可以调整显著性水

平,比 Bofferroni 方法的界限要小。

4.Student-Newman-Keuls 法 ( SNK 法)

它实质上是根据预先制定的准则将各组均数分为多个子集, 利用 Studentized

Range 分布来进行假设检验 ,并根据所要检验的均数的个数调整总的Ⅰ类错误概

率不超过α。用 student range 分布进行所有各组均值间的配对比较。如果各组

样本含量相等或者选择了(差异较小的子集)的均值配对

比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的

差异。

5.Dunnett 检验

常用于多个试验组与一个对照组间的比较,根据算得的t 值,误差自由度ν误差、试验组数 k - 1 以及检验水准α查 Dunnett-t 界值表 ,作出推断。

6.Duncan 法 (新复极差法 )( SSR )

指定一系列的“range值”,逐步进行计算比较得出结论。

7.Tukey 检验

使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有

成对比较的集合的误差率。 Tukey 的应用指征:(1)所有各组的样本数相等;

( 2)各组样本均数之间的全面比较;( 3)可能产生较多的假阴性结论。

8.Scheffe 检验

为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布。

可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。Scheffe 的应用指征:(1)各组样本数相等或不等均可以,但是以各组样本数不相等使用较多;( 2)如果比较的次数明显地大于均数的个数时, Scheffe 法的检验功效可能优于 Bonferroni 法和 Sidak 法。如均数的个数等于或小于比较的次数,Bonferroni 方法较 Scheffe 方法佳。

(二)各种方法简介 -1

1.方差齐时,可选用以下方法:

LSD :least significant difference检验法,指用t检验对各组均值间进行配对比较。对多重比较误差率不进行调整。

Bonferroni :用 t 检验对各组间均值进行配对比较,通过设置每个检验的误差率来控制整个误差率。

Sigdk :为计算 t 统计量进行多重配对比较。可以调整显著性水平,比 Bonferroni 方法的界限要小。

Scheffe :为对所有可能的配对组合进行同步配对比较。可以同时检验所有均数的线性组合。不单纯是配对均值的比较。

R-E-G-W F:为作Ryan-Einot-Gabriel-Welsch F检验法,用 F 检验进行多重比较检验。

R-E-G-W Q:为作Ryan-Einot-Gabriel-Welsch检验法,用t 化极差进行多重配对比较。

S-N-K :为 Student-Newman-Keuls检验法,用t化极差分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了用所有各组样本含量的调和平均数进行样本量估计时,用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。在该比较过程中,各组均值从大到小的顺序排列。最先比较极端的差异。

Tukey :为作 Tukey's honestly significant difference检验法,用t化极差统计量

进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。

Tukey's-b :用 t 化极差分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。

Duncan :为作 Duncan's multiple range检验法指定一系列的t 化极差值,逐步进行计算比较得出结论。

Hochberg's GT2 :用正态最大系数进行多重比较。

Gabriel :用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。

Waller-Duncan :用 t 统计量进行多重比较检验。使用Bayesian 逼近。

Dunnett :用于多个处理组与一个对照组配对比较。选定此方法后,激活下面的Control categories 框,选择对照组,有两个选项 Lase(默认选项)和 First 。

Test 框内选择检验的单双侧。选项 2-side 表示双侧检验(默认选项);选项control 为单侧检验表示处理组均数大于对照组均数。

2.方差不齐时可以选用以下方法:

Tamhane's T2 : t 检验进行配对比较。

Dunnett's T3 :t 化最大值下的配对比较。

Games-Howell :方差不具齐次性时的配对比较,方法较灵活。

Dunnett's C :t 化极差下的配对比较。

注:在 LSD 以及 Duncan 法的计算结果的表示方法为把差异没有显著性意义的比较组列在同一列里。没有列出的其余各比较组之间差异均有显著性意义。

(三)各种方法简介 -2

1.假定方差齐性

?LSD. 使用 t 检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。LSD 法侧重于减少第二类错误,此法精度较差,易把不该判断为显著的差异错判为显著,敏感度最高。 LSD 法的使用:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例

如,在一个试验中共有 4 个处理,设计时已确定只是处理 1 与处理

2、处理 3 与处理 4(或 1 与

3、2 与 4;或 1 与

4、2 与 3)比较,而其它的

处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,

所以不会增大犯 I 型错误的概率。

?Bonferroni. Bonferroni 提出,设 H0为真,如果进行 m 次显著性水准为α的假设检验时,犯Ⅰ类错误的累积概率α’不超过 mα,即有 Bonferroni 不等式α’

≤ mα成立。所以令各次比较的显著性水准为 a=0.05 /m, 并规定 P≤ 0.05/ m 时拒绝 H0,基于这样的做法,就可以把Ⅰ 类错误的累积概率控制在 0.05 。这

种对检验水准进行修正的方法叫做Bonferroni 调整(Bonferroni adjustment) 法,简称 Bonferroni 法。使用 t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误

差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。换句话来说, Bonferroni 法由 LSD 修正而来,通过设置每个检验的α水准来控制总的α水准。但是比较的次数越多,比较的结果越保守。 Bonferroni 法的应用指征:(1)各组的样本数无论相等还是不等;(2)计划好的某两个组间或几个组间作两两比较;(4)当比较次数不多时, Bonferroni 法的效果较好;(5)但当比较次数较多 (例如在 10 次以上 )时,则由于其检验水准选择得过低,结论偏于保守,犯Ⅱ类错误的概率增加,即出现较多的假阴性结果;(6)

Bonferroni 法比 LSD 法、 Duncan 法、 SNK 法偏于保守,不过,它

比 Tukey 法、 Scheffe 法要敏感。

?Sidak. 基于 t 统计量的成对多重比较检验。 Sidak 调整多重比较的显著性水平,并提供比 Bonferroni 更严密的边界。

?Scheffe. (最常用,不需要样本数目相同)为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布。可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。 Scheffe 的应用指征:(1)各组样本数相等或不等均可以,但是以各组样本数不相等使用较多;(2)如果比较的次数明显地大于均数的个数时, Scheffe 法的检验功效可能优于 Bonferroni 法

和 Sidak法。如均数的个数等于或小于比较的次数,Bonferroni方法较Scheff ’e 方法佳。

? R-E-G-W F.基于 F 检验的Ryan-Einot-Gabriel-Welsch多步进过程。

? R-E-G-W Q. 基于学生化范围的Ryan-Einot-Gabriel-Welsch多步进过程。

?S-N-K. 使用学生化的范围分布在均值之间进行所有成对比较。它还使用步进式过程比较具有相同样本大小的同类子集内的均值对。均值按从高到低排

序,首先检验极端差分。

?Tukey. (最常用,需要样本数目相同)使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有成对比较的集合的误差率。Tukey 的应用指征:( 1)所有各组的样本数相等;(2)各组样本均数之间的全面比较;

(3)可能产生较多的假阴性结论。

?Tukey's b. 使用学生化的范围分布在组之间进行成对比较。临界值是 Tukey's

真实显著性差异检验的对应值与Student-Newman-Keuls的平均数。

?Duncan. 使用与 Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较,但要为检验的集合的错误率设置保护水平,而不是为单个检验的错

误率设置保护水平。使用学生化的范围统计量。

? Hochberg's GT2. 使用学生化最大模数的多重比较和范围检验。与Tukey's 真实显著性差异检验相似。

?Gabriel. 使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比Hochberg's GT2更为强大。当单元大小变化过大时,Gabriel

检验可能会变得随意。

? Waller-Duncan.基于t 统计的多比较检验;使用Bayesian方法。

? Dunnett.将一组处理与单个控制均值进行比较的成对多重比较t 检验。最后一类是缺省的控制类别。另外,您还可以选择第一个类别。双面检验任何水

平(除了控制类别外)的因子的均值是否不等于控制类别的均值。 <控制检验任何水平的因子的均值是否小于控制类别的均值。 >控制检验任何水平的因子的均值是否大于控制类别的均值。

2.未假定方差齐性

?Tamhane's T2 . 基于 t 检验的保守成对比较。当方差不相等时,适合使用此检验。

?Dunnett's T3 . 基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。

?Games-Howell . 有时会变得随意的成对比较检验。当方差不相等时,适合使用此检验。

?Dunnett's C. 基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。

?

spss多选题录入与分析

spss多选题录入与分析1 -----不限定选择项的录入及分析 2011-03-12 20:57 在市场调查和社会学调查等问卷设计过程中,通常会设计各种多选题,甚至排序而这些多选题或排序题又是必不可少的,因此就需要对各种多选题、排序题进行录入和入和分析为例,来讨论下多选题和排序题的录入及分析。 1多选题的录入和分析 分析时,由于var001-var005是一个多选题的答案,因此需要先进行多重响应设计,

如下所示 或者在“分析”---“表”----“多响应集”中,如下所示 两者弹出的窗口相差不大,我们以第一种“定义变量集”来进行,点击之后,弹出 在“设置定义”对话框会列出所有的需要设置的变量,其中包括多选题的变量,将移入右边“集合中的变量”,然后下方的“将变量编码为”“二分法”,计数值输入“1的频率,然后名称中输入该多选题的题目名称之后,“添加”到“多响应集”,点击定义好之后,再点击“多重响应”,可以看到,多出两个菜单选项,如下所示

spss多选题的录入及分析

spss多选题录入与分析1 不限定选择项的录入及分析 在市场调查和社会学调查等问卷设计过程中,通常会设计各种多选题,甚至排序题,来进行信息的搜集,而这些多选题或排序题又是必不可少的,因此就需要对各种多选题、排序题进行录入和分析,在这里以spss的录入和分析为例,来讨论下多选题和排序题的录入及分析。 1多选题的录入和分析 多选题一般有三种情况,一种是任选几项,不限定选择项数;一种是限定最多选择几项,比如最多选择三项等;第三种也是是限定选择的项数,但与排序相结合,比如依次选择三项,最重要,其次重要,第三重要。 第一种情况:不限定选择项数时。 二分类方式的编码为0和1,即将每一个选项拆分为一个独立变量,如果选中的则录入1,没有选择的则录入为0.有多少个选项则拆分出多少个变量来,因此选项异常多的情况下此种方法有点麻烦。 例如下表所示:假设var001-var005是一个多选题的选项,共五项,让被访者任选,不限定,录入方式如下表,1表示被访者选中,0表示被访者未选的。

分析时,由于var001-var005是一个多选题的答案,因此需要先进行多重响应设计,在“分析”—“多重响应”如下所示 或者在“分析”---“表”----“多响应集”中,如下所示 两者弹出的窗口相差不大,我们以第一种“定义变量集”来进行,点击之后,弹出窗口如下

利用SPSS 进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

论文的一般数据分析方法 spss AHP DEA

DEA数据包络分析: 在人们的生产活动和社会活动中常常会遇到这样的问题:经过一段时间之后,需要对具有相同类型的部门或单位(称为决策单元)进行评价,其评价的依据是决策单元的“输入”数据和“输出”数据,输入数据是指决策单元在某种活动中需要消耗的某些量,例如投入的资金总额,投入的总劳动力数,占地面积等等;输出数据是决策单元经过一定的输入之后,产生的表明该活动成效的某些信息量,例如不同类型的产品数量,产品的质量,经济效益等等.再具体些说,譬如在评价某城市的高等学校时,输入可以是学校的全年的资金,教职员工的总人数,教学用房的总面积,各类职称的教师人数等等;输出可以是培养博士研究生的人数,硕士研究生的人数,大学生的人数,学生的质量(德,智,体),教师的教学工作量,学校的科研成果(数量与质量)等等.根据输入数据和输出数据来评价决策单元的优劣,即所谓评价部门(或单位)间的相对有效性。 AHP层次分析法: AHP层次分析法(Analytical Hierarchy Process, 简称AHP)是个很有趣又很有用的东西,它提供一个有效的方法去进行复杂的决策,无论在一般生活、商业或学术研究上,都有很精采的应用。 例如:一般生活上之应用---- 例如本章所举的例子,想找一个理想的工作,其所谓理想的评选标准有三:钱多、事少、离家近。那么就可以利用AHP方法来从多个工作机会中评选出一个比较合乎理想的工作了。 简而言之,AHP是将复杂的决策情境切分为数个小部份,再将这些部分组织成为一个树状的层次结构。然后,对每一个部份的相对重要性给予权数值,然后进行分析出各个部份优先权。对决策者而言,以层次结构去组织有关替代方案(alternative)的评选条件或标准(criteria)、权数(weight)和分析(analysis),非常有助于对事物的了解。此外,AHP可协助捕捉主观和客观的评估测度,检验评估的一致性,以及团队所建议的替代方案,减少团队决策之失误,如失焦、无计划、无参予等。AHP将整个问题细分为多个较不重要的评估,但还维持整体的决策。 Spss软件介绍: SPSS for Windows是一个组合式软件包,它集数据整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

SPSS分析报告

SPSS 分析报告 ——基于spss对大学生网购情况的调查研究 基于spss对大学生网购情况的调查研究 摘要: 在科学技术飞速发展的今天,网购已经成为一种潮流。越来越多的人选择去网上购买自己所需要的物品。为了研究大学生的网购情况,本次调查以北京理工大学珠海学院的学生为例,首先设计调查问卷,然后按照分层抽样调查的方法共发放了50份调查问卷,然后通过得来的数据运用spss软件,采用描述性统计分析,交叉列联表分析,多重反应分析和因子分析等方法进行分析,从而得出大学生网上消费的情况以及存在的问题,最后给出总结和建议。 关键词:大学生网购多重响应反应分析交叉列联表分析因子分析条形图 目录 摘要 (2) 第一章引言 (3) 1.1调查背景 (3) 1.2调查目的 (3) 1.3调查方式 (3) 1.4研究大学生网购的意义 (3) 1.5调查方案的设计 (3) 第二章大学生网购的基本情况 (4) 数据处理 (4) 2.1__大学生男女年级分布情况 (4)

2.2__大学生网购金额与性别、年级区别分析 (5) 2.3对于各个年级在网上购物的消费金额的分析 (6) 2.4卡方检验计算 (7) 2.5网购商品类别分析 (8) 第三章结论及建议 (9) 3.1大学生网购的优点与不足 (9) (一)网上购物的优点主要包括以下几个方面: (9) (二)网上购物的不足主要包括以下几个方面: (9) 3.2对网上购物的商家所提的建议 (10) 3.3网购前景............................... ..... ..... .. (10) 3.4调查感受: (11) 第一章引言 1.1 调查背景 在互联网进一步发展普及并且迅速发展的今天,网购作为一种新兴的购物方式,越来越受到广大大学生的青睐。大学生作为没有固定收入的群体,更加喜欢快捷,廉价的商品,因此省时省力的网络成为了他们最好的购物方式,它以非传统的方式占据了大学生的心,网上购物势必成为大学生今后最主要的购物方式。 1.2 调查目的 为了进一步了解在大学生网络购物的消费心理,熟悉大学生的消费情况,最终引导大学生健康的网上购物消费,同时,对大学生正确网购作出正确的引导,了解网络购物的未来情景。 1.3 调查方式 本次抽样按照男女比例1:1来进行调查,确定了各个样本量之后,主要通过QQ、微信等网络方式进行一对一问卷调查,此次调查共发放了50份调查问卷,回收问卷为50份,实际有效问卷为50份,有效率为100%。 1.4 研究大学生网购的意义

多重响应分析SPSS例析

多重响应分析 多重响应分析又称多重应答分析或者多选题应答分析。在我看来该分析仅仅只是相当于一个summary。仅仅是一个频率的统计性描述。 例1.已知一个“辅食添加”的多重二分法记录(45个个案)数据文件mulres1.sav,其中area(地区):1-北京,2-广州;sex(性别):1-男,2-女;辅食添加:x1(蛋)、x2(肉类)、x3(豆类)、x4(面食)、x5(水果)与x6(其他),试建立多重响应数据集。 数据格式如下 Analyze---->Multiple response--->define variable set 进行多重响应集的定义,必须先定义才能进行后续的分析;否则Multiple response 下面的Frequency 以及Cross table就是灰色的,因为没有可用的多重响应集可用;在进入定义界面后如下,集合中的变量即时响应变量,选入右边框中,本题中响应变量均是0-1值,所以本例采用计数值(count value)值为1;如果不设置的话,右边的添加项就是灰色的;无法继续进行;如果响应值不是0—1这样的二值数据,而是1到5这样的情况,则选用下面的类别,并输入范围值。 定义多重响应集的名称和lable,单击添加生成多重响应即food; 至此定义好了一个名称为food 的多重响应集合。 Analyze ---->Multiple response--->frequency 进行多重响应频率分析 将定义好的多重响应集food添加到右边的表格中来分析;缺失值用来处理又却是数据的情形,本例不存在缺失值; Analyze ---->Multiple response--->cross table 进行多重响应的交叉表分析 将area添加到行row,将food 添加到列column; 点击选项(options) $food 频率 响应个案百分比

第4章 SPSS基本统计分析(课后练习参考)

第三章 1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 第四章

SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)

SPSS-多重响应-频率和交叉表案例分析(问卷调查分析) 2011-09-29 16:35 马上要国庆了,公司待遇不错,一口气放10天假,真是太高兴了,已经买了飞机票,飞机票贵的一滚,来回居然要2000多,伤不起啊!! 在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点 在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示: 这份问卷调查总更有35人参与,样本容量偏少,其中 1:选择 A :3G资费过高的有 14人 2:选择 B: 网络覆盖率低,信号不稳定的 15人 3:选择 C:买手机太麻烦的 15人 4:选择 D: 换手机号麻烦 15人 5:选择 E: 3G功能用处不大 9人 6:选择F: 朋友使用后,觉得不好 10人 第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法” 在SPSS中进行数据编码后,如下所示:

点击“分析-多重响应---定义变量集---进入如下所示页面:

根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”再点击”添加“ 添加成后,点击”关闭“按钮 再点击”分析-多重响应--频率分析----分析结果如下所示:

上图结果很直观,结果,我就不分析了 百分比=N/总计 =14/78=17.9% 个案百分比=N/参与人数(有效人数)=14/33=42.4% 下面来进行“交叉表”分析,如下所示:

spss学习总结

Spss学习心得 Spss软件是一款用来分析数据的软件。在我们的日常生活中存在着好多数据。如果要把这些数据统计起来,并作分析,这一定是一个很大的任务。Spss利用的是计算机的计算优势将复杂的数学计算问题很方便的解决了。几乎可以这么说Spss软件里的每一个按钮或选项都蕴含了一个数据计算或一个数学原理。Spss通过简单的鼠标操作将复杂的数学问题得以解决,他可以让不了解数据分析原理的人也能迅速的学会对数据的分析和处理。 Spss的功能很强大,主要分析功能(如图1所示)有报告分析、描述统计、表、比较均值、一般线性模型、广义线性模型、混合模型、相关分析、回归分析、对数线性模型、神经网络、分类、降维、度量、非参数检验、预测、生存函数、多重响应、缺失值分析、多重归因、复杂抽样、质量控制、ROC曲线图等。Spss还可以通过数据绘制不同的图形如直方图、茎叶图、聚类分析图。下面对几个常用的分析方法做个总结。 图1 一、Spss之描述性统计 统计常分为描述性统计和推断性统计(概率统计)。前者往往多用于社会科学,后者多用于自然科学,两者相互渗透。其中,描述性统计是统计学中最基本、最常用的统计方法。基本数学模型:集中趋势、离散趋势、偏度和峰度。 描述集中趋势的统计量有 (1)算术平均值(Mean),但易受极端值影响 (2)中位数(Median,Me)将样本数据进行升序或降序排列后,处在中间位置上的数称为中位数。比较稳定,不受极端值影响。

(3)众数(Mode,Mo)样本数据中出现次数最多的数。可能有多个众数,也可能没有。不受极端值影响。 (4)调整的平均数(Trimmed Mean)将样本数据进行排序后,按照一定比例去掉两端的极大、极小值,对剩下的数据求平均。在“Explore”菜单中5%的调整平均数指分别去掉前后2.5%的数据。较少受极端值得影响。 (5)几何平均数(Geometric Mean)主要用于计算平均发展(增长)速度。 (6)调和平均数(Harmonic Mean)分母包含倒数的平均数,主要用于计算平均价格等指标。 (7)四分位数,最低数与中位数之间的中位数是25分位数,原中位数与最高数之间的中位数是75分位数。 ●描述离中趋势的统计量 (1)极差(Range)样本数据中最大值与最小值的差值。 (2)平均差(Average Difference)指各样本数据与均值间差异绝对值的均值,也称为平均绝对差。 (3)方差(Variance) (4)标准差(Standard Deviation,Std Dev) 是方差的算术平方根。 (5)标准误(Standard Error of Mean ,S.E.Mean)是样本平均数的标准差。 ●偏度和峰度 偏度(Skewness)是反映数据分布不对称性的一个数字特征。 偏度为0表示该变量的数据分布形态为对称分布; 偏度 > 0表示其分布形态为右偏分布,有一条长尾托在右边; 偏度 < 0表示其分布形态为左偏分布,有一条长尾托在左边; 偏度的绝对值越大,表示数据的分布形态的偏斜程度就越大 峰度(Kurtosis)是描述分布形状为陡峭还是平坦的数字特征。 峰度为0表示其数据分布与正态分布的陡缓程度相同; 峰度 <0表示比正态分布的高峰要平坦,为平顶峰; 峰度>0表示比正态分布的高峰要陡峭,为尖顶峰。 Spss的操作过程: [Analyze]=>[Descriptive Statistics] =>[Frequencies...],弹出[Frequencies]主对话框。在对话框的变量列表中选择变量,单击按钮进入[Variable(s)]列表框,并选择[Display Frequency Tables]显示频数分布表。单击[Statistics...],弹出[Frequencies:Statistics]子对话框,选择均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),单击[Continue]返回[Frequencies] ,再单击[OK]按钮即可得到各种统计量的计算结果。

spssau问卷多选题处理之多重响应(multiple-response)

多重响应 SPSSAU系统中多重响应可以研究单选题(X)和多选题(Y)之间有关系情况。 如果不放置单选题(X),仅放置多选题(Y),则时直接对多选题进行统计。 多重响应时涉及两个术语名词,分别是响应率和普及率。 ●响应率分析多选题(Y)各选项的相对选择比例情况;比如共100个样本,平均 每个样本选择3项,则总共100个样本共选择了300个选项。如果某某个选项 有60个人选择,则时响应率为60/300=20% ●普及率分析多选题(Y)各选项的选择普及情况;比如共100个样本,某个选项 有60个人选择,则时普及率为60/100=60% ●响应率和普及率的区别在于被除数不一样。响应率加和一定为100%,普及率 加和通常会高于100% ●绝大多数情况下是对普及率进行分析,如果想深入分析,则可以对响应率也进 行分析; 分析结果如下(SPSSAU同时会生成饼图/圆环图/柱形图/条形图/拆线图等): 交叉汇总表 项 性别(%) 汇总(N=177)男(N=149)女(N=28) 多选题选项1 92(61.7)20(71.4)112(63.3)多选题选项2 107(71.8)17(60.7)124(70.1)多选题选项3 85(57.0)18(64.3)103(58.2)多选题选项4 68(45.6)11(39.3)79(44.6)

多重响应表格 项 响应 普及率(N=177)N 响应率 多选题选项1 112 26.8% 63.3% 多选题选项2 124 29.7% 70.1% 多选题选项3 103 24.6% 58.2% 多选题选项4 79 18.9% 44.6% 汇总418 100% 236.2% SPSSAU操作如下: (正常情况下,1代表选中,SPSSAU也默认设置1代表选中。如果数字‘0’代表选项被选中,可设置“计数值”为2)

用SPSS对问卷调查中的多选题数据进行的卡方检验

用SPSS对问卷调查中多选题数据进行的卡方检验 福建省教育科学研究所林斯坦 多选题,又叫复选题、多重应答题或多重响应题,计算此类问卷题时,用SPSS处理比单选题稍复杂,都要先定义变量集,然后才能进行频率的统计和交叉分析。如下图。 但是,SPSS对多重响应虽然能进行频率统计和交叉表分析,却不能在其操作界面上直接进行卡方检验。现将解决这个问题的方法介绍如下。 一、多重应答题整体分析的卡方检验 下面一问卷题有五个选项,可多选。现在想了解对这个问题选项的不同选择频率之间是否存在显著的差异。 例:您认为,中小学教师职称聘任的主体最好应当是:[多选题] A.学校; B.中心校或学区; C.县级教育行政部门; D.设区市级教育行政部门; E.省级教育行政部门 如同一般多选题的频率统计,把这个五个选项定为五个二分变量,每个变量的取值为0或1,以表示该项是否被选中。 第一:把这个五个选项定义为一个变量集。“分析”--“多重响应”---“定义变量集”。 在“将变量编码为”方框中选择“二分法”,“计数值”输入“1”;“名称”和“标签”输入相应的内容,点击“添加”到“多响应集”。 第二:对变量集进行频率分析。“分析”---“多重响应”---“频率”。将“多响应集”中的相应名称添加到“表格” 第三:把得到的五个选项各项的频率,重新制成SPSS表格。一个变量命名为“聘任主体”,数值为1,2,3,4,5,分别表示这五个选项,另一变量命名为“频率”,即刚得到的变量集

的频率。 可分别对“聘任主体”的五个选项1,2,3,4,5赋予标签。 第四:个案加权频率。“数据”--“加权个案”--“频率加权”。(这一步很重要) 第五:可以对五个选项被选中的频率进行分析。“分析”--“非参数检验”--“卡方检验”,(SPSS第19版要选择“旧对话框”)把变量(聘任主体)选入检验变量中即可。 结果说明,对这五个选项被选中的频次存在着显著的差异。 二、多重应答题交叉分析的卡方检验 例:您认为教师绩效考核主体最好是:(可多选) A、教育行政部门 B、教育督导部门 C、学校领导层 D、教代会 E、家长委员会 F、

SPSS多重比较方法

SPSS 多重比较方法 (信息摘自网络,仅供参考) (一)常用方法总结 1.LSD 法最小显著差异法 ,公式为 : 它其实只是 t 检验的一个简单变形 ,并未对检验水准做出任何校正 ,只是在标准误 的计算上充分利用了样本信息 , 为所有组的均数统一估计出了一个更为稳健的标 准误 ,其中 MS 误差是方差分析中计算得来的组内均方 ,它一般用于计划好的多重 比较。由于单次比较的检验水准仍为α,因此可认为 LSD 法是最灵敏的。 2.Bonferroni 法 该法又称 Bonferroni t 检验 ,由 Bonferroni 提出。用 t 检验完成各组间均值的配 对比较,但通过设置每个检验的误差率来控制整个误差率。若每次检验水 准为α′,共进行 m 次比较 ,当 H0为真时 ,犯Ⅰ类错误的累积概率α不超过 mα′,既有 Bonferroni 不等式α≤ mα′成立。 3.Sidak 法 它实际上就是 Sidak 校正在 LSD 法上的应用 ,即通过 Sidak 校正降低每两次 比较的Ⅰ类错误概率 ,以达到最终整个比较的Ⅰ类错误概率为α的目的。即α′ = 1 - (1 - α ) 2 / k ( k- 1) ,计算 t 统计量进行多重配对比较。可以调整显著性水 平,比 Bofferroni 方法的界限要小。 4.Student-Newman-Keuls 法 ( SNK 法) 它实质上是根据预先制定的准则将各组均数分为多个子集, 利用 Studentized Range 分布来进行假设检验 ,并根据所要检验的均数的个数调整总的Ⅰ类错误概 率不超过α。用 student range 分布进行所有各组均值间的配对比较。如果各组 样本含量相等或者选择了(差异较小的子集)的均值配对 比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的 差异。 5.Dunnett 检验 常用于多个试验组与一个对照组间的比较,根据算得的t 值,误差自由度ν误差、试验组数 k - 1 以及检验水准α查 Dunnett-t 界值表 ,作出推断。 6.Duncan 法 (新复极差法 )( SSR ) 指定一系列的“range值”,逐步进行计算比较得出结论。

SPSS分析报告

SP S S 分析报告 ——基于spss对大学生网购情况的调查研究 基于spss对大学生网购情况的调查研究 摘要: 在科学技术飞速发展的今天,网购已经成为一种潮流。越来越多的人选择去网上购买自己所需要的物品。为了研究大学生的网购情况,本次调查以北京理工大学珠海学院的学生为例,首先设计调查问卷,然后按照分层抽样调查的方法共发放了50份调查问卷,然后通过得来的数据运用spss软件,采用描述性统计分析,交叉列联表分析,多重反应分析和因子分析等方法进行分析,从而得出大学生网上消费的情况以及存在的问题,最后给出总结和建议。 关键词:大学生网购多重响应反应分析交叉列联表分析因子分析条形图

目录 摘要 (2) 第一章引言 (3) 1.1调查背景 (3) 1.2调查目的 (3) 1.3调查方式 (3) 1.4研究大学生网购的意义 (3) 1.5调查方案的设计 (3) 第二章大学生网购的基本情况 (4) 数据处理 (4) 2.1__大学生男女年级分布情况 (4) 2.2__大学生网购金额与性别、年级区别分析 (5) 2.3对于各个年级在网上购物的消费金额的分析 (6) 2.4卡方检验计算 (7) 2.5网购商品类别分析 (8) 第三章结论及建议 (9) 3.1大学生网购的优点与不足 (9) (一)网上购物的优点主要包括以下几个方面: (9) (二)网上购物的不足主要包括以下几个方面: (9) 3.2对网上购物的商家所提的建议 (10) 3.3网购前景...................... ..... ..... .. . (10) 3.4调查感受: (11)

第一章引言 1.1 调查背景 在互联网进一步发展普及并且迅速发展的今天,网购作为一种新兴的购物方式,越来越受到广大大学生的青睐。大学生作为没有固定收入的群体,更加喜欢快捷,廉价的商品,因此省时省力的网络成为了他们最好的购物方式,它以非传统的方式占据了大学生的心,网上购物势必成为大学生今后最主要的购物方式。 1.2 调查目的 为了进一步了解在大学生网络购物的消费心理,熟悉大学生的消费情况,最终引导大学生健康的网上购物消费,同时,对大学生正确网购作出正确的引导,了解网络购物的未来情景。 1.3 调查方式 本次抽样按照男女比例1:1来进行调查,确定了各个样本量之后,主要通过QQ、微信等网络方式进行一对一问卷调查,此次调查共发放了50份调查问卷,回收问卷为50份,实际有效问卷为50份,有效率为100%。 1.4 研究大学生网购的意义 统计资料表明,目前在网上购物的群体中,绝大多数是年轻人,24岁以下的学生目前所占的比例最高,达到51.1%,其次是24岁至30岁之间的上班族,占群体总数的40.3%。这两类人群都是最有潜力的未来网上消费者。刘颖博士说,随着经济的发展和人们对网络认识的深入,网上购物以它便捷的服务更能适应人们未来生活的高节奏,从而得到人们的认可。 随着互联网应用的普及以及大学生网民数量的增加,大学生的消费习惯也正发生着巨大的变化,现今网络购物在大学生中已经逐渐成为了一种潮流与时尚。而网络购物对大学生所带来的各方面影响也理应受到广大大学生的重视。针对这一状况,我们运用SPSS软件进行了分析,以帮助大学生进行更为满意的网上消费活动。 1.5 调查方案的设计 1、问卷的结构及其内容 第一部分是学生的性别年级等个人信息; 第二部分是被调查者是否进行网购及其花费在网购上的金额; 第三部分是围绕网购的经历展开调查,包括被调查者选购网购的网站、网购的原因、网购时喜欢的各类促销、网购的满意程度、可信度、网购时所选择的快递、网购的支付方式等问题 2、问卷设计的特点 问卷设计以研究目的为基础进行,由于调查的对象是各大高校的在校生,所以提问的方式和所选的设计都符合在校生的特点,与在校生网购时面临的问题有一定的一致性。在问卷的编排上,从调查对象对网购整体认识到对每一个影响因素的测量,思路清晰明确,易于被调查对象所接受,问卷的系统性也为后期的数据分析统计提供了便利条件,也保证了调查结果的真实性和有效性。

03SPSS中多项选择题的处理

SPSS中多项选择题的处理 前几天受同学之托,继续琢磨SPSS中关于多项选择题的统计处理方法。 (一)多项选择题变量的定义方式: 主要有两种:一种二分法编码,一种是分类法编码。 1.所谓二分编码,即对该多项选择题下的每一个选项分别看作不同的变量, 用“1”表示被调查者选择了该项,用“0”表示未选择该项。 2.所谓分类法编码,首先应该估计该问题最多被选择的可能性,并给每一种 选择建立一个新的变量。从最终要分析的结果来看,两种定义方式具有相同的功能。 例如:以下哪类商品更容易引起您购物的冲动性?[多选题] A食品包括零食 B电子产品 C学习用品书籍等 D生活用品 E服装 F饰品、化妆品 其中一位被调查者选择A、C、E、F (二)编码与录入: 1.使用二分编码情况如下: 定义6个变量,变量名分别为food、electronic product、school suppli es、vital commodity、clothes、decoration,值标签分别定义为0=“未选”,1=“选中”。以上被调查者的数据录入为:1 0 1 0 1 1 。 2.使用分类法编码如下:因为最多情况下,被调查者会选择6种选项,因此,仍需建立6个新变量,分别定义为shopping1、shopping2、shopping3、sh opping4、shopping5、shopping6,每一变量下的值标签定义为:1=“A”,2=“B”,3=“C”,4=“D”,5=“E”,6=“F”,9=“未选或缺省”。以上被调查者的数据录入为:1 9 3 9 5 6 。 (三)定义多重响应: 所有有效数据录入完毕后就可以进行统计分析了,在此我使用SPSS17.0进行统计数据的描述与分析。比较困惑的一点是该版本的SPSS17.0中不能使用工具栏中的“数据”下的“定义多重响应集”,此处定义的集在多重响应频率和交叉表中不可用。需要使用工具栏中“分析”下的“多重响应”—“定义变量集”,可将上述两种情况各自分别定义为多重变量。 1.对应上述第一种情况:选中上述二分法编码下的6个变量,将变量编码设置为“二分法”,计数值为“1”(表示统计选中的情况),多响应集名称定义为“impulse shopping kinds”,标签为“冲动购物商品种类”,添加到“多响应集”中即可。 2.对应上述第二种情况:选中上述分类法编码下的6个变量,将变量编码设置为“分类”,范围1-9(根据分类定义情况),多响应集名称定义为“impu

相关主题
相关文档
最新文档