数据分析作业
数据分析作业

《数据处理与实验设计》考试答卷1.答:根据题意,可用格鲁布斯法或者拉依达准则判断该可疑数据x p=82.6的取舍。
法1:采用格鲁布斯法①将浓度值按照从大到小顺序排列59.9,60.3,60.4,61.4,63.5,64.8,65.7,67.8,68.9,69.4,70.6,73.6,74.1,74.7,76.3,76.8,77.9,78.3,79.3,80.5,81.5,82.6②计算包括可疑值82.6在内的平均值及标准偏差s:=71.3,s=7.487为可疑值,则T=1.51③查表可知T(0.05,22)=2.60:T< T(0.05,22)=2.60可疑数据x p=82.6不应该舍去。
法2:拉依达准则①计算包括可疑值82.6在内的平均值及标准偏差s:=71.3,s=7.487②计算、2s和3s:===11.32s=27.487=14.973s=27.487=22.46③比较与2s和3s:<3s且<2s所以,依据拉依达准则,当显著性水平α=0.05和0.01时,可疑数据x p=82.6不应该舍去。
2.答:(1) 利用Excel工具对已知数据进行回归分析,利用“数据分析”中的“回归”功能,对x和y值之间进行回归分析,求得x与y值之间的相关系数r=0.843。
检验x与y值是否线性相关,有如下方法:①相关系数检验法:当α=0.05,n=10,m=1时,查得相关系数临界值r min=0.632。
所以,>r min,即当显著性水平α=0.05,x与y线性相关。
② F检验(方差分析):根据以上的Excel表格的计算,可得方差分析表如下:表1 方差分析表差异源df SS MS F F0.05(1,8) 显著性回归 1 6.801515 6.801515 19.72537 5.3177 *误差8 2.758485 0.344811总和9 9.56由于F> F0.05(1,8),所以,当显著性水平α=0.05,x与y线性相关,即x与y 有显著的线性关系。
学生作业情况分析

学生作业情况分析一、作业情况分析:我班同学本学期基本能够按时完成英语作业,但质量非常参差;为此我作了以下调查,并进行数据的分析:1、完成作业时间:从数据显示36%同学能在30分钟内完成作业,这部分同学有班上学习成绩好的,也有学习成绩很差的;为什么走两个极端呢这是因为有部分学习成绩差的同学对待作业的态度大都是很随便的,书写马虎,没有认真思考,只为应付老师的检查,所以这部分同学的作业老师批改起来会相当吃力,有时会了看清他写得什么字还得花功夫;当然在这36%里边大都是学习成绩好的同学,他们认真听讲,所以完成作业时毫不吃力,做得又快又好,书写让老师看得舒心;46%同学能在40分钟内完成作业,这部分同学比较有耐心,这其中不乏一些学习成绩较好的同学,他们对待作业非常认真,书写一笔一画,相当工整,而且有时会超出老师的要求;还有18%同学会花上一小时甚至以上的时间来做作业,通过与他们的家长联系,得到的答案几乎是一致的,就是边玩或边看电视边做作业,结果事倍功半,一检查对作业所要巩固的内容基本没有掌握;2、作业类型完成情况统计从上面数据看出大部分学生不喜欢做动脑筋的作业,对于“思考性作业”与“作文”大部分学生觉得非常困难,比如作文:没有注意平时积累素材,找不到话题等等;对于阅读分析类的题目,很多同学没有认真思考,总说很难,要么不写,要么为了应付老师随便写写;对于预习、复习这类的作业反正老师看不到,所以索性不做,只有34%的同学能认真地完成,在与家长联系的过程中,很多家长表示孩子回到家除了完成作业以外,很少会复习和预习;有的家长甚至说从未见过孩子在家里拿起英语读课文;三、对于作业情况引起的反思:1、习惯差,这是孩子身上的原因从上面情况分析的数据来看,学生不认真完成家庭作业的情况比较严重,他们并不是不做作业,而是在态度上不重视;小学生往往都是缺乏学习的自觉性,他们不善于利用时间完成作业,常敷衍了事;我班就有几个不做家庭作业的,或胡乱一通的学生;他们的成绩个个很差;但是我并不觉得是他们的智力有问题,而是从小没有把学习的习惯培养起来,经常要老师、同组同学督促才做作业,对于思考性的作业更是敬而远之;这种长期不做作业不思考问题的习惯他们的大脑缺乏灵活性及思维能力;久而久之,学习成绩自然就下降了;2、作业布置缺乏层次性,这是老师身上的原因一个巴掌拍不响,孩子对待作业的习惯没有培养好,身为老师的我也责无旁贷;英语作业通常都是一些抄写、背诵、阅读练习、作文等,这样的重复性的作业比赛枯燥乏味,调动不起学生的积极性、主动性,再加上学生之间的个体差异也很大,学习能力也高低不同;对于后进生难度大的作业造成了他们缺少成功的体验和喜悦,久而久之他们对待家庭作业的态度就会变的极为消极甚至不做作业;3、督促不及时,这是家长身上的原因孩子的家庭作业一般在家里完成,老师无法直接控制,因而家长既是小学生按时完成家庭作业的督促者,也是提高作业效率的配合者;如果家长不能每天有效督促孩子认真完成,自己忙于看电视或在外应酬,那么孩子做家庭作业时就容易养成一种漫不经心、敷衍了事的作业态度;这其中还不乏上补习班做作业的,部分家长由于工作原因,自己没有时间辅导,把孩子送上补习班,以为给孩子提供了很好的学习环境;结果把孩子培养得更具依赖性,都六年级了,也无法自觉得完成家庭作业;三、改进措施1、增强作业的趣味性,提高学生做作业的兴趣我们常说“兴趣是最好的老师;”为什么电脑游戏对学生有如此大的吸引力呢这源于电脑游戏的设计者抓住孩子的特点,给他们创设了生动的、刺激的、自由的虚拟世界,闯了一关又一关,孩子在这虚拟的世界里得到了满足;家庭作业作为课堂教学的补充,如果提高学生的兴趣,我们确实要向这此游戏的设计者学习,把枯燥的学习过程盘活,少布置机械重复的抄写作业,多做一些实践操作的作业,使家庭作业更具趣味性;①设计一些闯关类的作业;学生都爱刺激,比如一些抄写作业可用这个办法让学生进行过关练习,每过一关可以获得相应的奖励;②给学生自由选择的权利;当学生在闯关的过程中,得到相应的等级就可以获得自己布置家庭作业的特权,这样可以吸引他们做家庭作业的兴趣;有的学生不喜欢写作业,这与他的学习兴趣有关,他想做的事就感兴趣,相反,让他抄抄词语、背背课文等之类的作业对他就没有吸引力;③多给学生实践操作的作业;高年级的孩子一般都具有一定的学习能力;对于一些独立阅读的课文我们可以尝试让学生以小组为单位,自主学习,并把理解的内容通过PPT的形式向同学们展示;这样让枯燥的预习作业,变成了自主的实践操作内容,既让孩子们对课文内容有更深入的了解,又培养他们的自学能力;2、家庭作业目标分层,提高学生做作业的积极性不同层次的学生都有训练的起点,并发展其能力,依托课程标准、教材、学生身心认知规律而设计的作业应有层次、有弹性、有梯度;我把学生作业分成三个级别:一星级为基础级,难度最少,多为抄写、巩固、模仿类的作业;二星级为发展级,难度增大,多为迁移应用类的作业,要求掌握一定的方法,在一星级的基础上,增加思考性的问题;三星级创新级,难度最高,主要是综合实践、自主学习类的作业,这类作业更考验学生的自主创新的能力;以作文为例:一星级的目标我会设定为:根据老师提供的材料,依照本组单元课文写一篇350字左右的文章,注意语句较通顺;二星级的目标为:根据老师提供的材料,把内容想具体,字数不少于400字,把本组课文的写法,运用到自己的习作中去;注意有顺序地把事情的经过记叙详细,表达自己的真情实感,语句通顺,记叙清楚;三星级目标为:根据本单元习作要求,选取材料,注意选取独特的视角,展开合理想象,写出自己的真情实感,注意运用学过的写作手法,把内容写具体,字数在450字左右,在习作中要融入自己的联想和想象;3、家校联手形成合力,提高学生做作业的效率家庭顾名思义是在家里完成的作业,没有家长的配合,久而久之学生缺乏督促,就会形成惰性,从而影响家庭作业的质量;虽然说家庭作业是在家里的学习任务,家长负责任的,但是当学生的作业习惯不好时,我们老师也不能袖手旁观,而是要老师与父母应该共同教育,互相联系,督促学生们纠正不做家庭作业的坏习惯;我们应该及时发现孩子作业中的问题,与家长沟通,共同商讨帮助孩子养成良好作业习惯的方式、方法;我们可以通过校讯通平台、家校联系手册、家访、家长会等等方式,与家长取得联系,架起老师、家长沟通的桥梁,这样就能让家长更了解学生,让作业评价真正的鼓励学生,调动学生的积极性,促进学生扬长避短,有效提高作业质量;。
数据分析考试题

数据分析考试题一、选择题1. 数据分析的目的是什么?A. 发现数据中的模式和趋势B. 验证假设和推断数据之间的关系C. 帮助管理决策和业务优化D. 所有选项都是正确的2. 哪种图表最适合用于展示时间序列数据?A. 饼图B. 条形图C. 散点图D. 折线图3. 以下哪个指标可以用于衡量数值型数据的集中趋势?A. 方差B. 标准差C. 中位数D. 相关系数4. 以下哪个指标可以用于衡量分类变量之间的关联性?A. 方差分析B. 卡方检验C. 盖尔回归D. 多元回归5. 如果数据集中有缺失值,下面哪个方法可以用来处理缺失值?A. 删除包含缺失值的观测B. 用平均值或中位数填充缺失值C. 使用回归模型预测缺失值D. 所有选项都是正确的二、简答题1. 请说明数据清洗的步骤或过程。
数据清洗的步骤包括以下几个方面:1) 检查数据的完整性,确保数据集没有缺失值或错误的数据项。
2) 处理数据中的异常值,通常采用删除或替换的方法对异常值进行处理。
3) 对缺失值进行处理,可以选择删除包含缺失值的观测,或者用平均值、中位数等填充缺失值。
4) 标准化数据,将数据统一按照一定规则进行转换,以提高数据的比较性和可解释性。
5) 去除重复值,确保数据集中不含有重复的数据项。
6) 对数据进行转换和处理,如对时间数据进行格式化、对分类数据进行编码等。
2. 请说明相关系数的作用和计算方法。
相关系数用于衡量两个数值型变量之间的线性关系强度,其取值范围为-1到1。
相关系数越接近于1或-1,表示两个变量之间的线性关系越强;相关系数接近于0则表示两个变量之间无线性关系。
计算相关系数的方法常用的有皮尔逊相关系数和斯皮尔曼相关系数。
皮尔逊相关系数适用于两个连续变量之间的关系,并假设数据呈正态分布;斯皮尔曼相关系数适用于两个有序变量或者两个非连续变量之间的关系。
3. 请简述回归分析的原理及其在数据分析中的应用。
回归分析用于研究一个或多个自变量对一个因变量的影响程度。
学生作业情况分析

学生作业情况分析一、作业情况分析:我班同学本学期基本能够按时完成英语作业,但质量非常参差。
为此我作了以下调查,并进行数据的分析:1、完成作业时间:从数据显示36%同学能在30分钟内完成作业,这部分同学有班上学习成绩好的,也有学习成绩很差的。
为什么走两个极端呢?这是因为有部分学习成绩差的同学对待作业的态度大都是很随便的,书写马虎,没有认真思考,只为应付老师的检查,所以这部分同学的作业老师批改起来会相当吃力,有时会了看清他写得什么字还得花功夫。
当然在这36%里边大都是学习成绩好的同学,他们认真听讲,所以完成作业时毫不吃力,做得又快又好,书写让老师看得舒心。
46%同学能在40分钟内完成作业,这部分同学比较有耐心,这其中不乏一些学习成绩较好的同学,他们对待作业非常认真,书写一笔一画,相当工整,而且有时会超出老师的要求。
还有18%同学会花上一小时甚至以上的时间来做作业,通过与他们的家长联系,得到的答案几乎是一致的,就是边玩(或边看电视)边做作业,结果事倍功半,一检查对作业所要巩固的内容基本没有掌握。
2、作业类型完成情况统计从上面数据看出大部分学生不喜欢做动脑筋的作业,对于“思考性作业”与“作文”大部分学生觉得非常困难,比如作文:没有注意平时积累素材,找不到话题等等;对于阅读分析类的题目,很多同学没有认真思考,总说很难,要么不写,要么为了应付老师随便写写。
对于预习、复习这类的作业反正老师看不到,所以索性不做,只有34%的同学能认真地完成,在与家长联系的过程中,很多家长表示孩子回到家除了完成作业以外,很少会复习和预习。
有的家长甚至说从未见过孩子在家里拿起英语读课文。
三、对于作业情况引起的反思:1、习惯差,这是孩子身上的原因从上面情况分析的数据来看,学生不认真完成家庭作业的情况比较严重,他们并不是不做作业,而是在态度上不重视。
小学生往往都是缺乏学习的自觉性,他们不善于利用时间完成作业,常敷衍了事。
我班就有几个不做家庭作业的,或胡乱一通的学生。
语文作业数据分析报告(3篇)

第1篇一、引言随着教育信息化的发展,教育数据在教育教学过程中扮演着越来越重要的角色。
通过对语文作业数据的分析,我们可以了解学生的学习情况、教学效果以及改进教学策略。
本报告旨在通过对某校语文作业数据的分析,探讨语文教学中的问题,为教师提供教学改进的参考。
二、数据来源与处理1. 数据来源本报告所使用的数据来源于某校2019年度的语文作业数据,包括学生姓名、班级、作业类型、作业完成时间、作业得分等。
2. 数据处理(1)数据清洗:剔除无效数据,如姓名缺失、班级错误等。
(2)数据分类:按照作业类型、年级、班级进行分类。
(3)数据统计:计算作业完成率、平均分、优秀率、及格率等指标。
三、数据分析1. 作业完成情况(1)总体完成情况:根据数据统计,该校语文作业的完成率达到了95%,说明大部分学生能够按时完成作业。
(2)班级差异:不同班级的作业完成率存在一定差异,其中一年级完成率最高,达到98%,而六年级完成率最低,为90%。
2. 作业得分情况(1)总体得分:该校语文作业的平均分为78分,及格率为85%,说明学生的整体水平尚可。
(2)年级差异:各年级的平均分存在一定差异,其中一年级平均分为82分,六年级平均分为75分。
3. 作业类型分析(1)课堂作业:课堂作业的平均分为79分,及格率为86%,说明学生在课堂作业方面的掌握情况较好。
(2)课后作业:课后作业的平均分为77分,及格率为84%,说明学生在课后作业方面的掌握情况相对较弱。
4. 学生个体差异分析(1)优秀学生:优秀学生的作业完成率和得分率均较高,说明他们在语文学习方面具有较好的基础。
(2)后进学生:后进学生的作业完成率和得分率较低,说明他们在语文学习方面存在一定的困难。
四、问题与建议1. 问题(1)部分学生作业完成率较低,尤其是六年级。
(2)课后作业的完成率和得分率相对较低。
(3)部分学生个体差异较大,后进生在语文学习方面存在困难。
2. 建议(1)加强作业管理,提高作业完成率。
八年级下册数学期末复习《数据的分析》作业

第二十章数据的分析作业卷一、选择题1、在端午节到来之前,儿童福利院对全体小朋友爱吃哪几种粽子作调查,以决定最终买哪种粽子.下面的调查数据中最值得关注的是()A、方差B、平均数C、中位数D、众数2、下列选项中,能够反映一组数据离散程度的统计量是()A、平均数B、中位数C、众数D、方差3、某校有21名同学们参加某比赛,预赛成绩各不同,要取前11名参加决赛,小颖已经知道了自己的成绩,她想知道自己能否进入决赛,只需要再知道这21名同学成绩的()A、最高分B、中位数C、极差D、平均数4、要调查某校八年级学生周末的阅读课外书籍的时间,选取调查对象最合适的是()A、选取该校一个班级的学生B、选取该校50名学生C、随机选取该校50名八年级男生D、随机选取该校50名八年级学生5、图中是交警在一个路口统计的某个时段往来车辆的车速情况(单位:千米/小时),则大多数车速和中间车速分别为()A.52,52 B.52,52.5 C.53,52.5 D.53,526、为了考察甲、乙两种小麦的长势,分别从中抽取10株麦苗,测得苗高如下:(单位:cm)甲12 13 14 15 10 16 13 11 15 11乙11 16 17 14 13 19 6 8 10 16下列说法中正确的是()A.甲种小麦长势比乙种小麦整齐B.乙种小麦长势比甲种小麦整齐C.两种小麦长势一样整齐D.无法判断哪种小麦长势更整齐二、填空题7、为了检查一批零件的质量,从中抽取10件,测得它们的长度如下(单位:毫米)22.36 22.35 22.33 22.35 22.3722.34 22.38 22.36 22.32 22.35根据以上数据,计算这批零件的平均长度8、在青年歌手电视大奖赛中,采用10位评委现场打分,每位选手的最后得分为去掉一个最低分,去掉一个最高分后的平均分,已知10位评委给某位歌手的打分分别是:9.5 9.5 9.3 9.8 9.48.8 9.6 9.5 9.2 9.6则这位歌手的最后得分为9、为了解某一路口的汽车流量,调查了10天中同一时段通过该路口的汽车数量(单位:辆),结果如下:183 209 195 178 204 215 191 208 167 197在该时段中,平均约有辆汽车通过这个路口。
数据分析作业指导

数据分析作业指导数据分析是一项关键任务,它可以帮助我们从大量的数据中提取有用的信息和见解,以便作出明智的决策。
在进行数据分析的过程中,有一些关键步骤和技巧是值得我们注意和掌握的。
本篇文章将为您提供一份数据分析作业指导,帮助您更好地完成数据分析任务。
一、数据收集与整理在开始数据分析之前,首先需要收集和整理相关的数据。
数据可以来自各种渠道,如调查问卷、网站访问数据、销售记录等。
在收集数据时,要确保数据的准确性和完整性。
同时,如果数据量庞大,需要进行适当的筛选和清洗,以排除异常值和错误数据。
二、确定分析目标在进行数据分析之前,需要明确自己的分析目标。
分析目标可以包括回答某个具体问题或解决某个业务难题。
确定分析目标有助于我们更好地选择合适的分析方法和工具,并避免在分析过程中迷失方向。
三、数据探索与可视化数据探索是数据分析的重要步骤,它可以帮助我们深入了解数据,找出其中的规律和趋势。
在进行数据探索时,可以使用统计学方法、可视化工具等。
通过数据可视化,我们可以更直观地展示数据之间的关系,并从中发现潜在的模式和趋势。
四、数据分析与建模根据分析目标和数据特点,选择合适的数据分析方法和建模技巧。
常用的数据分析方法包括描述统计、推断统计、回归分析、分类与聚类分析等。
在进行数据分析时,要合理选择变量并构建适当的模型,以便更准确地解读数据和做出预测。
五、解读结果与报告撰写在完成数据分析后,要对结果进行解读并撰写报告。
报告应该简明扼要地概述分析目的、方法和结果,以及相应的见解和建议。
在撰写报告时,要注意语言通顺、结构清晰,避免使用过多的专业术语和公式,以确保读者能够轻松理解和阅读报告。
六、反思与改进在完成数据分析作业后,要进行反思和总结。
回顾整个分析过程,思考自己在数据收集、分析和报告撰写等方面的不足之处,并寻找改进的方法。
通过反思与改进,我们可以不断提升自己的数据分析技能,为未来的工作提供更有价值的支持和见解。
总结:数据分析是一项复杂而重要的任务,它需要我们具备扎实的统计学和编程基础,以及灵活运用各种数据分析工具和方法的能力。
作业数据分析报告模板(3篇)

第1篇一、报告概述报告名称:[班级名称]作业数据分析报告报告时间:[报告生成日期]报告目的:通过对[班级名称]学生作业数据的分析,了解学生作业完成情况,发现存在的问题,为教师改进教学方法和提高教学质量提供参考。
二、数据来源与处理1. 数据来源本次作业数据分析报告所采用的数据来源于[学校名称]教务管理系统、教师布置作业记录、学生作业提交情况等。
2. 数据处理(1)数据清洗:对收集到的数据进行筛选和整理,剔除无效数据,确保数据质量。
(2)数据分类:根据作业类型、难度、完成时间等因素对数据进行分类。
(3)数据分析:运用统计方法、图表等对数据进行处理和分析。
三、作业完成情况分析1. 作业完成率分析(1)总体完成率:[班级名称]学生作业总体完成率为[完成率],其中优秀率为[优秀率],良好率为[良好率],及格率为[及格率],不及格率为[不及格率]。
(2)分学科完成率:[班级名称]学生在[学科名称]作业完成率为[完成率],其中优秀率为[优秀率],良好率为[良好率],及格率为[及格率],不及格率为[不及格率]。
2. 作业完成时间分析(1)平均完成时间:[班级名称]学生作业平均完成时间为[平均时间]。
(2)最快完成时间:[班级名称]学生作业最快完成时间为[最快时间]。
(3)最慢完成时间:[班级名称]学生作业最慢完成时间为[最慢时间]。
3. 作业质量分析(1)作业正确率:[班级名称]学生作业正确率为[正确率]。
(2)作业抄袭率:[班级名称]学生作业抄袭率为[抄袭率]。
四、问题与建议1. 问题(1)作业完成率较低,部分学生存在拖延现象。
(2)作业质量不高,正确率有待提高。
(3)学生作业抄袭现象较为严重。
2. 建议(1)加强学生作业管理,提高作业完成率。
教师可采取以下措施:①明确作业要求,提高作业质量。
②合理安排作业量,避免学生产生厌学情绪。
③关注学生作业完成情况,及时给予指导和反馈。
(2)提高作业质量,加强学生自律意识。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、第4题方差分析1.1 建立数据文件由题意可知,在同一浓度和温度下各做两次实验,将每一次的实验结果看作一个样本量,共342=24⨯⨯个样本量。
(1) 在“变量视图”下,名称分别输入“factor1”、“factor1”、“result”,类型设为“数值”,小数均为“0”,标签分别为“浓度”、“温度”、“收率”,factor1的值“1=A1,2=A2,3=A3”,factor2的值“1=B1,2=B2,3=B3,4=B4”,对齐选择“居中”。
(2) 在“数据视图”下,根据表中数据输入对应的数据。
数据文件如图1所示,其中“factor1”表示浓度,“factor2”表示温度,“result”表示收率。
三种不同浓度分别用1、2、3表示,四种不同温度分别用1、2、3、4表示。
图1.1 SPSS数据文件格式1.2 基本思路,利用单因素方差分析,对(1) 设“浓度对收率的影响不显著”为零假设H该假设进行判定。
,则可(2) 设“它们间的交互作用对收率没有显著影响”分别依次为假设H是否成立。
以通过多因素方差分析工具,利用得出的结果即能证明假设H1.3 操作步骤(1) 单因素的方差分析操作①分析—比较均值—单因素;因变量列表:收率;因子:浓度;②两两比较:选中“LSD”复选框,定义用LSD法进行多重比较检验;显著性水平:0.05,单击“继续”;③选项:选中“方差齐次性检验”,单击“继续”;④单击“确定”。
(2) 有交互作用的两因素方差分析操作①分析—一般线性模型—单变量;因变量:收率;固定因子:温度、浓度;②绘制。
水平轴:factor1,选择浓度作为均值曲线的横坐标,单图:factor2,选择温度作为曲线的分组变量;单击添加—继续。
③选项。
显示均值:factor1,定义估计因素1的均值;显著性水平:0.05;单击“继续”;④单击“确定”。
1.4 结果分析(1) “浓度对收率有无显著影响”结果分析执行上述操作后,生成下表。
表1.1 方差齐性检验表1中Levene统计量的取值为0.352,Sig.的值为0.708,大于0.05,所以认为各组的方差齐次。
表1.2 单因素方差分析从表2可以看出,观测变量收率的总离差平方和为119.58;如果仅考虑浓度单因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,它们的方差分别为19.542、3.851,相除所得的F统计量的观测值为5.074,对应的概率P值为0.016,小于显著性水平0.05,则应拒绝原假设,认为不同浓度对收率产生了显著影响,它对收率的影响效应不全为0。
表1.3 多重比较表3是各种浓度之间显著性差异两两比较的结果。
从表3可以看出,浓度A2同其他任意两种浓度比较,其Sig.值都小于0.05,所以认为浓度A2与其他浓度在收率上有显著差异。
而其他两种浓度,可以认为其浓度的不同对收率的影响不大。
(2) “浓度、温度及其相互作用对收率的影响”结果分析执行上述操作后,生成下表。
表1.4 两因素方差分析表表4为两因素方差分析表,表中第一行“校正模型”代表对方差分析模型的检验,Sig值为0.23>0.05,说明模型不适用。
观测变量的总方差119.958,它被分解为五个部分,分别由浓度不同引起的变差39.083,由温度差异引起的变差13.792,由浓度和温度的交互作用引起的变差17.583,由随机因素引起的变差为49.500。
这些变差除以各自的自由度后,得到各自的均方,并可计算出F统计量的观测值和对应的概率p值。
Ffactor1、Ffactor2、Ffactor1,factor2的概率p值分别为0、0.382、0.648。
由于Ffactor1的概率p值小于显著性水平0.05,则应拒绝零假设,认为不同浓度对收率有显著影响。
而Ffactor2、Ffactor1,factor2的概率p值均大于0.05,因此不应拒绝原假设,可以认为不同温度对收率的影响没有显著差异,浓度和温度的交互作用对收率的影响也不显著。
表5代表浓度在各水平下的均值、标准误均值及95%的置信区间。
表1.5 浓度的均值图1.2 两因素交互影响的均值图上图为两因素交互影响的均值图,横坐标代表浓度,纵坐标代表收率均值,且按温度绘制不同的折线。
从图形上看,这些折线近似平行,可以认为两因素的交互作用不显著。
1.5 结论综上,不同浓度对收率有显著影响,而不同温度对收率的影响没有显著差异,浓度和温度的交互作用对收率的影响也不显著。
二、第9题回归分析42.1 基本思路本例中被解释变量为课题总数X5,解释变量为投入人年数X2、投入科研事业费X4、论文数X7、获奖数X8。
建立多元回归模型,利用回归方程的统计检验对建立的多元回归模型进行检验,首先对解释变量采取强行进入策略,分析他们之间的线性关系以及多重共线性;然后对解释变量采用向前筛选策略,做方差齐性和残差的自相关性检验。
2.2 操作步骤(1) 分析—回归—线性;因变量:课题总数X5;自变量:投入人年数X2、投入科研事业费X4、论文数X7、获奖数X8;方法:进入;(2) 统计量:选中回归系数“估计”、模型拟合度、共线性诊断、残差Durbin-Watson;(3) 单击“确定”,生成表2.1、表2.2、表2.3、表2.4;(4) 同步骤(1);(5) 点击“绘制”,X坐标为标准化预测值ZPRED,Y坐标为DRESID,在标准化残差图中选“正态概率图”,点击“继续”按钮,进行残差均值和方差齐性检验;点击“保存”中选择保存标准化预测值、标准化残差;(6) 菜单—分析—相关—双变量,在变量框选择标准化残差、标准化预测值—相关系数—Spearman;(7) 点击“确定”按钮。
2.3 结果分析表2.1 模型汇总b由上表可看出,该方程中有多个解释变量,依次应参考调整的判断系数。
由于调整的判定系数0.927较接近于1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,未能被解释的部分较少。
并且Durbin-Watson为1.776在1.5和2.5之间,因而可以用线性回归模型来拟合数据。
表2.2 Anova a上表是立项课题数多元线性回归分析的结果。
可以看出,被解释变量的总离差平方和,回归平方和及均方分别为21076810.000,19741985.311和1334824.689,检验统计量的观测值为96.135,对应的概率p值近似为0.依据该表可进行回归方程的显著性检验,若显著性水平α为0.05,由于概率p值小于α,应拒绝回归方程显著性检验的假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的。
表2.3 系数a依据表2.3可以进行回归系数显著性检验,从表中可以看到,若显著性水平α为0.05,除了投入人年数外,其余变量的回归系数显著性t检验的概率p值均大于0.05,因此不应拒绝零假设,故认为他们与被解释变量的线性关系是不显著的,不应该保留在方程中。
表2.4 共线性诊断a.273000100012.3693.401.54.00.13.00.003.2773.925.14.00.09.00.544.0677.987.31.07.59.13.415.01318.195.00.93.17.87.04a. 因变量: 课题总数依据表2.4可以进行共线性检测。
从方差比来看,第5个特征根既能解释投入人年数方差的93%,也可以解释论文数方差的87%,因此有理由认为这些变量之间是存在多重共线性的;再从条件指数来看,第5个条件指数大于10,说明变量间确实存在多重共线性。
(1) (2)(3)图2.3 课题总数表2.5 相关系数从表2.5中对标准化残差进行检验,Durbin-Watson(1.747)在1.5和2.5之间,因而残差序列相对独立。
从图(1)中看到数据点围绕基准线还存在一定的规律行,可利用非参数检验方法对标准化残差再进行检验。
从图(2)中可以看出,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。
从表2.5中可以看到,残差与预测值的spearman等级相关系数为-0.176,且检验并不显著,因此认为异方差现象并不明显。
2.4 结论根据以上分析结果,可知影响高校课题总数的因素,如投入人年数、投入科研事业费、论文数、获奖数等因素间存在多重共线性。
三、第12题聚类分析23.1 求解思路因为要在相似变量中选择少数具有代表性的变量参与其他分析,因此选用SPSS层次聚类的R型聚类进行分析。
个体距离采用欧式距离,类间距离采用平均组间链锁距离,并输出树状图、冰柱图。
3.2 操作步骤(1) 选择菜单分析—分类—系统聚类;(2) 将8个变量添加到变量框中,在聚类方法中选择变量,采用R型聚类;(3) 在“统计量”对话框中,选择合并进程表和相似性矩阵,并在聚类成员中选择方案范围为最小聚类数2,最大聚类数4;(4) 在“绘制”对话框中勾选上“树状图”;(5) 在“方法”对话框中聚类方法选择“组间联接,区间采用Euclidean距离;(6) 单击“确定”,进行层次聚类分析。
3.3 结果分析表3.1 群集聚类表表3.2 群集成员表由表3.1可看出,第一步将2和4合并为一组,此组将在第三步中出现;第二步将3和5合并为一组,此组将在第四步中出现;其他同理;最后在第七步,将所有组合并为一组。
由表3.2可看出,分成4组的话,第一组为意大利;第二组为韩国、法国、美国;第三组为罗马尼亚、中国、俄罗斯;第四组为热心观众。
其他群集同理。
图3.1 冰柱图由冰柱图可看出,当聚成7类时,法国和韩国为一类,其他裁判各为一类;当聚成6类时,法国韩国为一类,中国和罗马尼亚为一类,其他裁判各为一类;当聚成5类时,美国、法国、韩国为一类,中国和罗马尼亚为一类,其他裁判各为一类;当聚成4类时,美国、法国、韩国为一类,俄罗斯、罗马尼亚、中国为一类,意大利和热心观众各为一类;当聚成3类时,热心观众为一类,美国、法国、韩国为一类,其他国家为一类;当聚成两类时,热心观众为一类,其他国家为一类。
图3.2 树状图由树状图可看出:第一步(2,4)以及(3,5)各合并为一组;第二步(2,4)和6合并为一组,(3,5)和7合并为一组;第三步(3,5,7)和1合并为一组;第四步(2,4,6)和(1,3,5,7)合并为一组;第五步,所有裁判合并为一组。
3.4 结论由以上结果可看出,若将裁判分成4组,意大利裁判独自分成一组,说明了其打分标准与其他裁判存在很大的差异性;热心观众也是独自分成一组,其打分标准也与其他裁判存在很大的差异性;韩国、美国、法国分成一组,说明这三个国家的裁判打分具有相似性;罗马尼亚、中国、俄罗斯分成一组,说明这三个国家的裁判打分也具有相似性。