spss数据分析教程之SPSS信度分析和效度分析

spss统计分析报告期末考精彩试题

《统计分析软件》试（题）卷班级xxx班xxx 学号xxx 说明：1.本试卷分析结果写在每个题目下面（即所留空白处）； 2.考试时间为100分钟； 3.每个试题20分。一、（20分）已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件，学生成绩一.sav；学生成绩二.sav。要求：（1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并，并保存为“成绩.sav.” （2）对所建立的数据文件“成绩.sav”进行以下处理： 1）按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2）计算每个学生的总成绩、并按照总成绩的大小进行排序 3）把数学成绩分成优、良、中三个等级，规则为优(X≥85)，良(75≤X≤84),中(X≤74)，并对优良中的人数进行统计。

分析：（2）描述统计量性别N 极小值极大值均值标准差男数学 4 77.00 85.00 82.2500 3.77492 有效的N （列表状态） 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N （列表状态）16

注：成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得，成绩为优的同学有4人，占总人数的20%；良的同学有12人，占总人数的60%；中的同学有4人，占总人数的40%。二、（20分）为了解笔记本电脑的市场情况，针对笔记本电脑的3种品牌，进行了满意度调查，随机访问了30位消费者，让他们选出自己满意的品牌，调查结果见下表，其中变量“职业”的取值中，1表示文秘人员，2表示管理人员，3表示工程师，4表示其他人；3个品牌变量的取值中，1表示选择，0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题（1）将所给数据的Excel文件导入到SPSS中，要求SPSS数据文件写出数据结构（包括变量名，变量类型，变量值标签等）命，并保存为：“调查. Sav”。（2）试利用多选项分析，利用频数分析来分析消费者对不同品牌电脑的满意度状况；分析不同职业消费者对笔记本品牌满意度状况。

spss统计分析期末考试题

《统计分析软件》试（题）卷班级 xxx班姓名 xxx 学号 xxx 说明：1.本试卷分析结果写在每个题目下面（即所留空白处）； 2.考试时间为100分钟； 3.每个试题20分。一、（20分）已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件，学生成绩一.sav；学生成绩二.sav。要求：（1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并，并保存为“成绩.sav.” （2）对所建立的数据文件“成绩.sav”进行以下处理： 1）按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2）计算每个学生的总成绩、并按照总成绩的大小进行排序 3）把数学成绩分成优、良、中三个等级，规则为优(X≥85)，良(75≤X ≤84),中(X≤74)，并对优良中的人数进行统计。

分析：描述统计量性别N极小值极大值均值标准差男数学477.0085.0082.2500 3.77492有效的 N （列表状态）4 女数学1667.0090.0078.50007.09930有效的 N （列表状态）16

注：成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得，成绩为优的同学有4人，占总人数的20%；良的同学有12人，占总人数的60%；中的同学有4人，占总人数的40%。二、（20分）为了解笔记本电脑的市场情况，针对笔记本电脑的3种品牌，进行了满意度调查，随机访问了30位消费者，让他们选出自己满意的品牌，调查结果见下表，其中变量“职业”的取值中，1表示文秘人员，2表示管理人员，3表示工程师，4表示其他人；3个品牌变量的取值中，1表示选择，0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题（1）将所给数据的Excel文件导入到SPSS中，要求SPSS数据文件写出数据结构（包括变量名，变量类型，变量值标签等）命，并保存为：“调查. Sav”。（2）试利用多选项分析，利用频数分析来分析消费者对不同品牌电脑的满意度状况；分析不同职业消费者对笔记本品牌满意度状况。分析：

spss 期末题库

课程名称:《SPSS分析方法与应用》课程号: 2007422 一、单项选择题(共112小题） 1、试题编号：1000110,答案：RetEncryption(D)。 SPSS的安装类型有（） A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号：1000310,答案：RetEncryption(D)。数据编辑窗口的主要功能有（） A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出和B 3、试题编号：1000410,答案：RetEncryption(A)。（）文件格式是SPSS独有的，一般无法通过Word，Excel等其他软件打开。 4、试题编号：1000510,答案：RetEncryption(D)。（）是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号：1000810,答案：RetEncryption(D)。（）是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号：1000910,答案：RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号：1001010,答案：RetEncryption(B)。数据编辑窗口中的一行称为一个（） A.变量 B.个案 C.属性 D.元组 8、试题编号：1001110,答案：RetEncryption(C)。

变量的起名规则一般：变量名的字符个数不多于（） A. 6 B. 7 C. 8 D. 9 9、试题编号：1001210,答案：RetEncryption(A)。统计学依据数据的计量尺度将数据划分为三大类，它不包括（） A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号：1001310,答案：RetEncryption(A)。在横向合并数据文件时，两个数据文件都必须事先按关键变量值（） A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号：1001810,答案：RetEncryption(A)。 SPSS算术表达式中，字符型（）应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号：1001910,答案：RetEncryption(A)。复合条件表达式又称逻辑表达式，在逻辑运算中，下列（）运算最优先。 B AND C OR D都不是 13、试题编号：1002010,答案：RetEncryption(A)。数据选取的方法中，（）是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号：1002110,答案：RetEncryption(B)。通过（）可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号：1002210,答案：RetEncryption(A)。 SPSS的（）就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号：1002310,答案：RetEncryption(B)。 SPSS软件是20世纪60年代末，由（）大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号：1002710,答案：RetEncryption(D)。 SPSS中进行参数检验应选择（）主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号：1002810,答案：RetEncryption(A)。 SPSS中进行输出结果的保存应选择（）主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号：1002910,答案：RetEncryption(C)。 SPSS中进行数据的排序应选择（）主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查学院：教育学院专业：课程与教学论学号：201411000156 姓名：李平 2014年12月13日

目录一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) （一）回收情况 (5) （二）信度分析 (5) 五、数据统计与分析 (6) （一）数据输入 (6) （二）数据分析 (7) 1.描述统计 (7) （1）多选题描述统计 (7) （2）单选题描述统计 (9) 2.推断统计 (12) （1）独立样本T检验 (12) （2）单一样本T检验 (15) （3）单因素方差分析 (17) （4） X2检验 (21) 3.相关分析 (22) （1）变量间相关分析 (22) （2）维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议，并希望能引起学校对这一系列问题的关注，最终希望大学生对其大学的满意度有所提升，大学生是一个庞大的群体，特别是近几年，随着高校的扩招，我国越来越多人能够上大学。上大学是很多人的梦想，他们都憧憬着大学校园的生活，然而当他们进了大学后才发现大学生活并非所想的美好，取而代之的却是对校园生活的不满，大学生是十分宝贵的人才资源，他们对校园生活的体验和感受，与他们的更好的学习。二、研究内容与方法 (一)研究内容了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制本研究采用自编问卷，问卷共由两部分组成：基本情况部分包括被调查者的性别、年级等，问卷主体部分包括师资水平、学校环境、日常管理三大维度，细分为12个三级指标（见表2-1），问卷采用五点制计分法，即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”，分别赋值5分、4分、3分、2分、1分。表2-1 某大学学生对本校的满意度测评指标体系一级指标二级指标（潜在变量）三级指标（观测变量）对自己师资水平对教师教学方法、对教师工作态度、对教师人品修养、对师资配备学校的意学校环境对学习环境、对就餐环境、对居住环境、对校园绿化环境满度指数日常管理对专业课时安排、对收费标准、对奖、助学金制度、对学校治安

SPSS期末考试整理

●一。变量的赋值 1.乘方（**），例如二的三次方：2**3 2.不同规则的赋值：转换→计算变量（如果），每一个规则的赋值都要重新进行此步骤（但注意每一遍的变量名都不变，并且他都会问你要不要替换成新的变量，你选是就行了） 3.不同规则的赋值：（1）转换→重新编码为不同变量：输入变量，输出变量，要点击“变化量”才可保存输出变量→新值和旧值：值（直接选取取值）、范围（最大到最小的范围，包含端点值），点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定，则在变量视图多出一个新变量（2）若不想包含端点值，可以采取小数的方式变换，eg. 899.9（小数位比该变量属性的小数位多一位就行了）（3）这种要先把BMI按照男女分开，然后再分组的，可以在对话框中点击“如果”选项进行设置，并且要分别对男女进行上述操作（一共做两遍）。二。离散化 1可视离散化：转换→可视分箱，分割点：所以想生成几组，就定义几个分割点；填写第一个分割点的时候就必须填写最小值；一定要选中上端点排除。三。排序 1.转换→自动重新编码：不分组，从头到尾排序 2.转换→个案排秩（1）多层次数据：基于A变量对B变量进行排序。（例如，基于职称对收入进行排序，就是不同职称各自组内排工资的高低）（2）设置秩1；绑定值四。时间序列：转换→变动值五。查找与计数：转换→对个案内的值计数（查找“基本工资800-900女职工”，生成新变量，满足这个条件的标为1，不符合这个标准的标为0，男职工标为缺失。范围：包含上限下限） ●六。数据→个案排序：把变量顺序完全按照你想要的标准排序，所有的变量顺序都会改变七。拆分文件：要分男女进行数据统计：数据→拆分文件→比较组/按组输出，分组依据。不分男女进行数据统计：数据→拆分文件→分析所有个案八。选择个案（例如只选择三年级的变量进行分析）：数据→选择个案→如果条件满足：如果；随机个案样本；基于时间或个案范围；使用过滤变量（例如要把身高为缺失值和值为0的剔除）→输出：过滤（不符合条件的数据会画上“/”，原始数据并未删除）；将选定个案复制到新数据集（形成一个新的SPSS数据文件，原始数据并未删除）；删除未选定的个案（删除原始数据，不建议使用）→之后在分析的时候就只会分析三年级的变量。不想只分析三年及，记得重新做这一步。九。加权个案：数据→加权个案（例。100分的有5人）。不想加权了，记得重新做这一步。十。分类汇总（1）例如算不同年级的人的身高的均值、方差…（只能计算函数）（2）数据→汇总，分界变量（分类标准变量），变量摘要（计算变量），函数：选择计算变量函数，变量名称与标签：定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据：索引变量消失变成score的尾缀（1）数据→重组（重构）→个案重组为变量，标识变量，索引变量，电脑会自动帮你选出是xx xx要重构（不同疗程值不同的变量）。选完上述这些之后就一直点下一步&完成&立即重构&确定即可（2）注意：当有多个变量需要重构时要自己决定“新变量组的顺序”。（A1A2B1B2;A1B1A2B2） 2.宽数据变长数据：score的尾缀消失变成索引变量（1）数据→重组（重构）→变量重组为个案，个案组标识：使用选定变量，固定变量（手动选择，电脑不会自动帮你选出了），要转置的变量即值不固定的要重构的变量（手动选择，电脑不会自动帮你选出了）。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了（2）当有多个变量需要重构时，这块的操作要特别注意：○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”（在本题中，即对于kidid目标变量定义一遍要转置的变量；对于age目标变量在定义一遍要转置的变量。其中，这两个要转置的变量必须是完全不同的）。但只需要定义一次“个案组标识”&“固定变量”（固定变量是相对于kidid & age都固定的那些变量；而不是说在对kidid进行转置的时候，age就是固定变量了；因此，固定变量只用定义一次且固定变量可以为空）。并且，你要特别注意，“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

spss 信度分析

第九章第九章信度分信度分析析?6?1一再测信度·用同一个测验对同一组被试前后两次施测两次测验分数所得的相关系数为再测信度·因为它能反映两次测验结果有无变动也就是测验分数的稳定程度故又称稳定性系数·计算再测信度应满足一下几个假设①所测量的特质必须是稳定的②遗忘与练习的效果相同③两次施测期间被试的学习效果没有差别···。·根据一组被试在两个平行等值测验上的得分计算的相关数。因为它反映的是两个测验之间的等值程度因此又叫等值性系数。·采用此法一定要注意①两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似②两次测验的时间间隔要适当·复本信度的局限①复本法只能减少而不能完全排除练习和记忆的影响②对于许多测验来说建立复本是相对困难的?6?1按正常的程序实施测验然后将全部项目分成相等的两半根据各人在这两半测验的分数计算其相关系数?6?1斯皮尔曼—布朗校正公式弗朗那根估计信度公式。?6?1使用奇偶分半法一定要注意两个问题①如遇到有牵连的项目或一组解决同一问题的项目时这些项目应放在同一半否则将会高估信度的值②当试卷中存在任选题或试卷为速度测试时不宜采用分半法·同质性也称内部一致性指的是测验内部所有题目间的一致性。1、测量同质性的基本公式2、库德—理查逊公式估计测验的信度估计同质性信度·适用于答对一题得分答错无分3、克伦巴赫系数·适

用于项目多重记分的测验·评分者之间的变异是产生误差的重要原因之一·考察评分者信度的方法是随机抽取部分试卷由两个或多个评分者独立按评分标准打分然后求其间的相关。如果是两个评分者则采用积差相关或等级相关的方法一般认为结果训练的成对评分者之间的一致性达到0.90以上评分才是客观的。如果是多个评分者则采用和谐系数来估计信度。一评价测验·信度系数是衡量测验好坏的一个重要技术指标·一般能力与成就测验的信度系数常在0.90以上·性格、兴趣、态度等人格测验的信度系数通常在0.80-0.85之间二解释分数1、个人测验分数的误差·个人在两次测验中分数的差异就是测量误差据此可得出一个误差分数的分布这个分布的标准差就是测量的标准差它是测量误差大小的指标。2、两种测验分数的比较·来自不同测验的原始分数是无法直接比较的只有参照同一团体的平均分数将它们转换成相同尺度的标准分数才能进行比较。一被试的样本·团体的异质程度与分类的分布有关一个团体越是异质其分数分布的范围也就越大信度系数就越高。·信度系数不仅受样本团体的异质程度的影响也受样本团体平均水平的影响。因为对于不同水平的团体项目具有不同的难度每个项目在难度上的变化累积起来便会影响信度。这种影响不能用统计公式来推估只能从经验中发现。二测验的长度·一般来说测验越长信度值越高。因为①测验加长可能改进项目取样的代表性从而能更好地

spss统计分析期末考试题

《统计分析软件》试（题）卷班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩说明：1.本试卷分析结果写在每个题目下面（即所留空白处）； 2.考试时间为100分钟； 3.每个试题20分。一、（20分）已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件，学生成绩一.sav；学生成绩二.sav。要求：（1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并，并保存为“成绩.sav.” （2）对所建立的数据文件“成绩.sav”进行以下处理： 1）按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2）计算每个学生的总成绩、并按照总成绩的大小进行排序 3）把数学成绩分成优、良、中三个等级，规则为优(X≥85)，良(75≤X ≤84),中(X≤74)，并对优良中的人数进行统计。

注：成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得，成绩为优的同学有4人，占总人数的20%；良的同学有12人，占总人数的60%；中的同学有4人，占总人数的40%。二、（20分）为了解笔记本电脑的市场情况，针对笔记本电脑的3种品牌，进行了满意度调查，随机访问了30位消费者，让他们选出自己满意的品牌，调查结果见下表，其中变量“职业”的取值中，1表示文秘人员，2表示管理人员，3表示工程师，4表示其他人；3个品牌变量的取值中，1表示选择，0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题（1）将所给数据的Excel文件导入到SPSS中，要求SPSS数据文件写出数据结构（包括变量名，变量类型，变量值标签等）命，并保存为：“调查. Sav”。（2）试利用多选项分析，利用频数分析来分析消费者对不同品牌电脑的满意度状况；分析不同职业消费者对笔记本品牌满意度状况。分析：

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级姓名学号 - 广东财经大学答题纸（格式二）课程数据处理技术与SPSS 20 15 －20 16 学年第 1 学期成绩评阅人评语：＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝（题目）关于本部学生对收费代课现象支持度的调查报告（正文）一、调查背景如今，大学生逃课现象屡见不鲜，随之衍生了“收费代课”的现象。据了解，在全国近百所高校中，存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业，成为有领导、有组织、有规模、有纪律的机构，不仅仅应当引起社会的关注，更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象，有其存在的社会土壤，其原因有多方面，值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时，我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为，同学们褒贬不一，每个人都有自己的看法。然而，这种行为经常在我们的身边发生着，无疑应该引起我们的关注，并引发我们的深思，形成一定的判别能力与认知能力。

二、调查目的我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因，以及对本专业学习、实习实践的认知程度，是否支持放弃学习去实习或者做自己的事情，是否支持收费代课。同时，我们也希望通过这份调查报告揭露出的一些情况，一方面，帮助学生更好地权衡学习与实习的利弊，更加理性地对待收费代课的行为，做出对自己正确合适的选择；另一方面，引起学校对这种收费代课现象的重视，给学校提一些建议，希望学校采取一些措施改善这种不良校风。三、调查方法从可行性角度出发，本次调查采用非概率随机抽样的街头拦截法，集中对象为本部大三大四的同学，以自愿形式对本部同学分发调查问卷，总共发出80份问卷，回收80份，有效问卷80份。收集问卷之后，利用spss软件进行数据整理与分析，最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有：频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。四、描述统计 1、对样本性别作频数分析从上表可以看出，这次填写问卷的女生较多，占了样本的66.3%，这与我们学校男女比例不均衡有很大的关系，样本的男女比例不相等，也可以较好地接近学校的实际情况，有利于我们得到更为准确的结论。 2、对样本年级作频数分析从上表可知，参加问卷调查的大三大四学生比例明显比较高，这与一开始我们预期相符，样本中大三大四学生所占比例较多，有利于我们得到更为有针对性的结论。

SPSS期末大作业-完整版

第1题：基本统计分析1 分析：本题要求随机选取80%的样本，因而需要选用随机抽样的方法，在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下：数据→选择个案→随机个案样本→大约（A）80 所有个案的%。 1、基本思路：（1）由于存款金额为定距型变量，直接采用频数分析不利于对其分布形态的把握，因而采用数据分组，先对数据进行分组再编制频数分布表。此处分为少于500元，500~2000元，2000~3500元，3500~5000元，5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。（2）进行数据拆分，并分别计算不同年龄段储户的一次存取款金额的四分位数，并通过四分位数比较其分布上的差异。操作步骤：（1）数据分组：【转换→重新编码为不同变量】，然后选择存取款金额到【数字变量→输出变量（V）】框中。在【名称（N）】中输入“存取款金额1”，单击【更改（H）】按钮；单击【旧值和新值】按钮进行分组区间定义。存取款金额1 频率百分比有效百分比累积百分比有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 （2）【分析→描述统计→频率】；选择“存款金额分组”变量到【变量（V）】框中；单击【图标（C）】按钮，选择【直方图】和【在直方图上显示正态曲线】；选中【显示频率表格】，确定。

（3）【数据→拆分文件】，选择“年龄”变量到【分组方式】框中，选中【比较组】和【按分组变量排序文件】，确定；【分析→描述统计→频率】，选择“存款金额”到【变量】框中，单击【统计量】按钮，选择【四分位数】→继续→确定。统计量存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述：频数分布表表明，有一半以上的人的一次存取款金额少于2000元，且有34.6%的人的存取款金额少于500元，19.8%的人的存取款金额多于5000元，下图为相应的带正态曲线的直方图。

spss统计软件期末课程考试题

《SPSS统计软件》课程作业要求：数据计算题要求注明选用的统计分析模块和输出结果；并解释结果的意义。完成后将作业电子稿发送至 1. 某单位对100名女生测定血清总蛋白含量，数据如下：计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度，并给出均值的置信水平为95%的置信区间。解：描述统计量标准误血清总蛋白含量均值.39389 均值的 95% 置信区间下限上限

5% 修整均值中值方差标准差极小值极大值范围四分位距偏度.054.241 峰度.037.478 样本均值为：；中位数为：；方差为：；标准差为：；最大值为：；最小值为：；极差为：；偏度为：；峰度为：；均值的置信水平为95%的置信区间为：【，】。 2. 绘出习题1所给数据的直方图、盒形图和QQ图，并判断该数据是否服从正态分布。解：

正态性检验 Kolmogorov-Smirnov a Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 血清总蛋白含量 .073 100 .200* .990 100 .671 a. Lilliefors 显著水平修正 *. 这是真实显著水平的下限。表中显示了正态性检验结果，包括统计量、自由度及显著性水平，以K-S 方法的自由度sig.=,明显大于，故应接受原假设，认为数据服从正态分布。 3. 正常男子血小板计数均值为9 22510/L , 今测得20名男性油漆工作者的血小板计数值（单位：9 10/L ）如下： 220 188 162 230 145 160 238 188 247 113

SPSS数据分析报告

SPSS期末报告关于员工受教育程度对其工资水平的影响统计分析报告课程名称：SPSS统计分析方法姓名：汤重阳学号：1402030108 所在专业：人力资源管理所在班级：三班

目录一、数据样本描述 (1) 二、要解决的问题描述 (1) 1 数据管理与软件入门部分 (1) 1.1 分类汇总 (1) 1.2 个案排秩 (1) 1.3 连续变量变分组变量 (1) 2 统计描述与统计图表部分 (1) 2.1 频数分析 (1) 2.2 描述统计分析 (1) 3 假设检验方法部分 (1) 3.1 分布类型检验 (2) 3.1.1 正态分布 (2) 3.1.2 二项分布 (2) 3.1.3 游程检验 (2) 3.2 单因素方差分析 (2) 3.3 卡方检验 (2) 3.4 相关与线性回归的分析方法 (2) 3.4.1 相关分析（双变量相关分析&偏相关分析） (2) 3.4.2 线性回归模型 (2) 4 高级阶段方法部分 (2) 三、具体步骤描述 (3) 1 数据管理与软件入门部分 (3) 1.1 分类汇总 (3) 1.2 个案排秩 (4) 1.3 连续变量变分组变量 (4) 2 统计描述与统计图表部分 (5) 2.1 频数分析 (5) 2.2 描述统计分析 (7) 3 假设检验方法部分 (8) 3.1 分布类型检验 (8) 3.1.1 正态分布 (8) 3.1.2 二项分布 (10) 3.1.3 游程检验 (10) 3.2 单因素方差分析 (12) 3.3 卡方检验 (13) 3.4 相关与线性回归的分析方法 (14) 3.4.1 相关分析 (14) 3.4.2 线性回归模型 (15) 4 高级阶段方法部分 (17) 4.1 信度 (18) 4.2 效度 (18)

SPSS期末数据分析

1.为研究某合作游戏对幼儿合作意愿的影响，将18名幼儿随机分到甲、乙、丙3个组，每组6人，分别参加不同的合作游戏，12周后测量他们的合作意愿，数据见表，问不同合作游戏是否对幼儿的合作意愿产生显著影响？单因素分析单因素方差分析：因变量—合作意愿得分；自变量—不同合作游戏（3种不同的水平）显著性水平为0.541，大于0.05，说明这三组数据总体方差相等，适合方差齐性检验从上表可以看出组间离差平方和为2.528，组内离差平方和为4.035，组间方差检验F=4.698，对应的显著性水平0.026，小于显著性水平0.05，说明3组中至少有一组与另外一组存在显著性差异。

由上表可以看出甲组与乙组的显著性为0.184 大于0.05，说明这两组的合作意愿得分没有显著差异，，但是甲组和乙组的相伴概率为0.008，说明这两组的合作意愿得分有显著性差异。

2.现有10名男生进行观察能力的训练，训练前后各进行一次测验，结果如下表所示。解答：两配对样本T检验从上表可以看出样本有10个，训练前10个男生的观察能力的样本均值是71，标准差是10.477，训练后观察能力的均值是79.50，标准差是9.823 由上表可以得出训练前后的相伴概率为0.028小于显著性水平0.05，说明训练前后能力的相关性较高由上表可以得出t统计量为-3.341，相伴概率为0.009，小于0.05，说明训练能够是10个男生的观察能力有显著性的变化 3．某教师为考察复习方法对学生记忆单词效果的影响，将20名学生随机分成4组，每组5人采用一种复习方法，学生学完一定数量单词之后，在规定时间内进行复习，然后进行测试。结果见表。问各种方法的效果是否有差异？并将各种复习方法按效果好坏排序

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用摘要：为对统计分析与spss应用分析所学知识进行巩固和检验，特运用所学知识进行简单的统计分析应用，下文以某校学生学期成绩进行模拟分析。一：原始数据：10级市场营销2班成绩分析一：综测成绩四分位数上表表明：综测成绩的最小值为68.61分，最大值为89.15分。其中25%的学生综测成绩为74.4100分，50%的学生综测成绩为80.3740分，75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二：综测成绩直方图上图表明：该班学生的综测成绩均分为80.07分，标准差为5.62。从图中可以看出，综测成绩呈左偏性分布，在85分左右的学生人数最多，70分左右的学生人数最少。分析三：综测成绩的基本统计量分析上表表明：综测成绩的极差为20.55分，意味着数据相对较分散。另外，综测成绩的最小值和最大值分别为68.61分和89.15分，平均分为80.0734分，标准差为5.61963。从偏度系数可以看出，系数小于0，偏度标准误差为0.421，因而该班综测成绩呈左偏分布，。从峰度系数可以看出，峰度值小于0，峰度标准误差为0.821，因而数据的分布比标准正态分布更加平缓，称

为平峰分布。分析四：各科成绩的统计量分析比较各科成绩统计量结果分析表由上表可知：宏观经济学的全距最大，而生产与运作管理的全距最小，表明宏观经济学的成绩离散程度最高，而生产与运作管理的成绩离散程度最低；同时，对于标准差而言，也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩，平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布，其他各科成绩均呈左偏分布。另外，各科成绩中，只有宏观经济学的成绩呈尖峰分布，其他各科呈平峰分布。

spss统计分析方法应用期末作业

1.作业1（基本统计+参数检验+方差分析1）利用城际出行行为数据，从中随机选取90%的样本，实现以下分析目标： (1)分析出行时间的分布，需做直方图。 (2)分析不同性别的出行方式是否一致。 (3)检验老年人(≥60)与其他人的出行时间是否有显著差异。 (4)检验是否老年人和出行目的两因素对其它时间的影响（考虑交互作用）。 1.1 分析出行时间的分布，需做直方图 1.1.1 解题思路首先，根据题目要求在城际出行行为数据中随机选择90%的样本；由于出行时间分布数据是定距变量，且出行时间数据数量较多，不宜使用频数进行分析。因此在分析之前先对出行时间进行分组，再进行频数分布。根据公式（1- （1-1）中n为数据个数，对结果四舍五入取整后为理论分组数目。原样本数为235，随机选择之后剩余样本是n为213个，根据公式（1-1）计算得到分组数目为9。选中的数据中出行时间的最大值为150，出行时间的最 1.1.2操作步骤数据选择：【数据→选择个案】，选择【随机个案样本】→【样本】→在【大约】中填入“90%”→选择【删除未选定的个案】，点击确认。剩下的即为随机选择之后的数据。数据分组：【转换】→【重新编码为不同变量】→将“出行时间”加入到有边框中，输出变量名称改为“城市出行时间分组”，点击【更改】，在点击【旧值和新值】，按照60-70、70-80、80-90、90-100、100-110、110-120、120-130、

130-140、140-150，分别对应1,2,3,4,5,6,7,8,9。点击【完成】。频数分析：【分析】→【描述统计】→【频率】，将“城市出行时间分组”加入到【变量】中。点击【图表】→【直方图】→选中【在直方图上显示正态曲线】→【确定】。 1.1.3输出结果与分析总计213 100.0 100.0 图1-1城市出行时间分布直方图从表1-1中可以看出，出行时间分布中，出行时间在60-70分钟的比较少，占比为4.7%，出行时间在120-130分钟、130-140分钟和140-150分钟的都比较少，三组总和占比仅为6.1%。出行时间在70-120分钟之间的人数最多，

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析数据计分方法说明类别小分类对应题项每题计分方法维度计分方法题项职业倦怠情感枯竭 1-3题正向计分全部题项直接加总 3 去个性化 4-6题正向计分全部题项直接加总 3 个人成就感 7-10题逆向计分全部题项取倒数后加总 4 心理资本 11-18题正向计分全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分，其余题项正向计分 21题取倒数后与其余题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分，其余题项为正向计分 27和31题取到术后与其余题项加总 5 整体问卷以上各个维度的总分直接加总 31 讲问卷调查的数据进行如上表的数据预处理后，接下来再进行如下分析。 1 信度分析这里有63份问卷，首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图，问卷中的各个问题是否测量了相同的内容和信息；同时，对于调查问卷所得到的数据是否具有可靠性，就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关，它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言，如果问卷的信度系数达到0.9以上，该问卷调查的信度就较好；信度系数在0.8以上，是不错的；一般认为试卷信度在0.5至0.9以内是合理的，如果信度系数低于0.5，则此问卷的调查结果就不可信了。将以上63份问卷的数据用SPSS21.0先进行标准化处理，再进行信度分析，其结果如表一所示：表一信度分析表

类别Cronbach's Alpha项数整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示，整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6，所以可以推断此问卷的可信度一般，该评价问卷只具有很较高的内在一致性。 2 效度分析具备信度的问题不一定具备效度，因此做完信度分析，再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型，在运用因子模型分析之前，首先要对问卷数据进行因子模型适应性分析，分析结果如下表所示：表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知，问卷数据的KMO值为0.657，并且通过了显著性水平为0.05的巴特利球型检验，说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后，接下来就进行因子分析，其结果如下：表三方差贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入

SPSS分析报告实例

SPSS与数据统计分析期末论文影响学生对学校服务满意程度的因素分析

一、数据来源本次数据主要来源自本校同学，调查了同学们年级、性别、助学金申请情况、生源所在地、学院、毕业学校、游历情况、家庭情况、升高、体重、近视程度、学习时间、经济条件、兴趣、对学校各方面的评价、与对学校总评价以及建议等共41条信息，共收集数据样本724条。我们将运用SPSS，对变量进行频数分析、样本T检验、相关分析等手段，旨在了解同学们对学校提供的满意程度与什么因素有关。二、频数分析可靠性统计克隆巴赫 Alpha 项数 .985 62 对全体数值进行可信度分析

本次数据共计724条，首先从可靠性统计来看，alpha值为0.985，即全体数据绝大部分是可靠的，我们可以在原始数据的基础上进行分析与处理。其中，按年级来看，绝大多数为大二学生填写（占了总人数的67.13%），之后分别依次为大二（23.76%）、大四（4.14%）、大一（4.97%）。而从专业来看，占据了数据绝大多数样本所在的学院为机械、材料、经管、计通。三、数据预处理拿到这份诸多同学填写的问卷之后，我们首先应对一些数据进行处理，对于数据的缺失值处理，由于我们对本份调查的分析重点方面是关于学生的经济情况的，因此对于确实的部分数据，升高、体重、近视度数、感兴趣的事等无关项我们均不需要进行缺失值的处理，而我们可能重点关注的每月家里给的钱、每月收入以及每月支出，由于其具有较强主观性，如果强行处理缺失值反而会破坏数据的完整性，因此我们筛去未填写的数据，将剩余数据当作新的样本进行分析。而对于一些关键的数据，我们需要做一些必要的预处理，例如一些调查项，我们希望得到数值型变量，但是填写时是字符型变量，我们就应该新建一个数字型变量并将数据复制，以便后续分析。同时一些与我们分析相关的缺省值，一些明显可以看出的虚假信息，我们都需要先进行处理。而具体预处理需要怎么做，这将会在其后具体分析时具体给出。

SPSS期末复习笔记.docx

2 SPSS四种输出结果：枢轴表/轻量表、文本格式、统计图表、模型 SPSS四种窗口：语法窗口、输出窗口、数据窗口、脚本窗口 SPSS三种运行方式：命令行方式、批程序方式、菜单对话框 SPSS默认文件类型：数据文件*.sav：此为SPSS软件默认的数据文件格式，双击可由SPSS直接读取。命令文件*.sps：可在语法编辑程序(syntax)中先编写或贴上欲执行之分析指令，并将其存贮起来，供日后重复使用或检查之用。输出文件*.spo: 允许直接加以编辑或转贴到其他编辑软件，SPSS 16.0版之后将输出文件的默认格式改为*.spv。数据文件清洗——多余重复的数据筛选清楚，将确实的数据补充完整，将错误的数据纠正或删除。数据→标识重复个案标识异常个案问题的答案被称作变量的取值。将答案转变成可用于统计分析的数据，需要经过一个被称作“编码coding”的过程。数据阵/数据文件：n个案例、m个变量构成的阵列 SPSS对数据的处理是以变量为基础的。所以，数据录入前一定先定义变量及其属性，包括指定名称、（存储）类型、宽度、小数、标签、值、缺失、列（宽）、对齐、度量标准和角色。这也被称作建立数据框架。变量名必须以字母、汉字或字符@开头，数字不可以，其他字符可以是任何字母、数字或_、@、#、$等符号。变量名中不能有空白字符或其他特殊字符（如“！”、“？”、“*”等）。变量名最后一个字符不能是英文句号（.）。在SPSS中不区分大小写。例如，HXH、hxh或Hxh对SPSS而言，均被视为同一个变量。SPSS的保留字不能作为变量的名称，如ALL、AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH等。 SPSS中变量有3种基本类型：数值型、字符型（区分大小写）和日期型。但根据不同的显示方式，数值型又被区分成：数值、逗号、圆点、科学计数法、美元、（用户）设定货币等6个子类型。不过，只有数值(N)最为常用。默认状态下，所有变量的类型均为数值型，且宽度是8位、小数位是2位。对话框界面可修改宽度和小数位，然后“确定”，但宽度必须大于小数位。变量标签是对变量名的进一步描述，可长达120个字符 SPSS有两类缺失值：系统默认缺失值和用户定义缺失值。对于数值型变量值，系统默认缺失值为圆点“.”，而字符型变量值的系统默认缺失值为空字符串（什么也没有）。指定“列”实际上是设定变量的显示宽度，默认为8个字符的宽度。统计学中，按照对事物描述的精确程度，将度量标准从低到高区分为4种类型：定类尺度：仅能测定类别差，不能比较大小，各类之间没有顺序和等级，只能计算频数频率百分比，可以使用数值型变量，也可以是字符型变量。要符合穷尽和互斥的原则。定序尺度：可比较优劣或排序，但数值不代表绝对数量大小，可以是数值型变量，可以是字符型变量。可以计算频数、频率和累计频率、累计频数。定距尺度：不仅能区分不同类型并排序，还能指出类别之间的差距是多少，最典型的是温度。严格来说只能加减。其0值没有物理含义，没有绝对的“0”点，故不能做乘、除运算。定比尺度：测算两个测度值之间比值，与定距变量相比差别是有一个固定的绝对“零点”。0在定距变量中仅是一个测量值，而定比变量真正表示没有。可以加减乘除。E.g.重量、年龄