《教学评价与测量》试题
教育评价与测量(整理好)

教育评价与测量简答题:1、信息的描述包括哪几个要素?答:⑴经过审核、整理及汇总的资料;⑵研究对象;⑶描述的技术和手段。
2、评价信息解释的特性是什么?答:⑴可检验性;⑵不完全性;⑶有效性3、定性分析的特点是什么?答:⑴定性分析关注事物发展过程以及相互关系。
⑵定性分析的对象是质的描述性资料。
⑶定性分析无严格的分析程序,有较大的灵活性。
⑷定性分析主要采用逻辑分析及哲学思辨方法。
⑸定性分析容易受主观因素的影响并对背景具有敏感性。
4、影响评价效度的因素是什么?答:⑴评价指标和工具的科学性⑵评价实施的质量⑶效标特征⑷被评价者的特性和样本的代表性5、评价信度鉴定的方法?答:⑴评价指标的信度鉴定方法⑵评价工具的信度鉴定方法⑶评分者信度鉴定方法6、影响信度的因素?答:⑴被评价对象的情况⑵评价指标和评价工具⑶实施评价过程中的各种因素7、设计双向细目表包括几个基本步骤?答:⑴考核的内容抽样与考核认知水平的确定⑵题型和题量的确定⑶试题的平均难度和难度分布的确定⑷试题赋分与测验期望分的预估8、学生思想品德评价的意义是什么?答:⑴实施学生思想品德评价,是提高学生思想道德水平,促进向素质教育转轨的重要措施。
⑵是促进德育管理科学化的重要手段⑶有利于激励先进,鞭策后进。
9、思想品德评价的方法答:⑴操行评语法⑵等第法⑶评等评分测评法⑷操作加减评分法⑸加权综合测评法⑹模糊综合测评法⑺评等评分评语综合测评法10、表现性评价的基本特点答:⑴评价的问题情境具有开放性、真实性、综合性⑵评价的方案具有灵活性⑶评价主体具有多元性⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题11、当前思想品德评价中存在的主要问题答:⑴品德测评指标的设计问题⑵品德测评的量化问题⑶思想品德测评方法实践可行性的问题12、课堂教学评价中教师自我反思的策略与途径答:⑴在自我评价中反思⑵在他人评价中反思⑶在评价学生中反思⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题13、课堂教学评价中教师自我反思的形式答:⑴自我提问法⑵行动研究法⑶教学诊断法⑷交流对话法⑸案例研究法⑹观摩分析法⑺总结记录法14、班主任工作过程评价的内容答:⑴了解和研究学生⑵组织和培养班集体⑶班级日常管理及思想教育⑷协调各方面教育力量⑸制定班级工作计划和总结,搞好期末的鉴定和评优工作15、班主任工作评价的方法答:⑴定量积分评价法⑵定性讨论分析法⑶综合法16、教育评价按评价功能分为哪几类?答:一、诊断性评价二、形成性评价三、终结性评价。
教育测量与评价试题

西南大学教育学院《教育测量与评价》课程试题【A】卷阅卷须知:阅卷需用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在相对应的分数框内;统一命题的课程应当进行集体阅卷,流水作业;阅卷后需要进行复核,发现漏评漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。
特别提醒:考生必须遵守课程考核纪律,违者将受到严肃处理一、选择题(本大题共15小题,2分×15=30分)1、考试制度的发源地是(),其中一个制度的建立对世界文化发展和考试制度的建立起过重要的影响A、中国B、美国C、英国D、日本2、20世纪初,美国的教育测量运动轰轰烈烈的开展起来,美国的()是教育评价的催生剂。
A、五年研究B、六年研究C、七年研究D、八年研究3、下面哪种教育测量与评价属于按测量与评价被试行为表现的性质分类的()A、智力测量与评价B、典型行为测量与评价C、能力倾向测量与评价D、成就测量与评价4、根据资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为:()A、同时效度和结构效度B、结构效度和预测效度C、同时效度和预测效度D、结构效度和内容效度5、李秉德提出:“教育目标分类的三维结构模型”,下面()不属于三个维度之一。
A、教育目标的组成部分B、学生的个性心理因素C、学生的健康程度D、各类组成的发展水平6、以下关于测验常模的说法,错误的是()A、有代表性的样组B、针对某种人群C、根据整理统计来获得资料D、是已知的、规定的数据7、标准分数是以标准差为单位表示测验成绩与平均分数之间的距离,下列选项中,()不属于标准分数在我国高考中的试点应用A、建立标准分数制度是高考标准化的重要环节B、在高考中使用原始分数不具局限性C、高考标准分数制度由常模量表分数、等值量表分数组成D、高考标准分数有单科标准分数转换方法及高考综合分的转换方法8、在以下标准参照测验的定性标准-测验内容领域规范模式中,()包括说明、实例指导与题目样本、内容范围、答案范围A、汉布莱顿模式B、美国IOX模式C、英国GCSE模式D、我国高中毕业会考标准的建立模式9、教育测量与评价方案的可用性可以从()几个方面进行阐述。
《教育测量与评价》试题与答案

一、选择题(每题1分,共15题)1、根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是(A )A. 测量B. 评价C. 测验D. 统计2、衡量、判断人物或事物的价值,这一概念是( B )A. 测量B. 评价C. 测验D. 统计3、被称为教育评价的催生剂的是美国的一项著名研究,它是(D )A. 教育研究B. 教育测量理论研究C. 心理测验研究D. 八年研究4、于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是(B )A. 国际教育成就评价协会B. 国际教育评估协会C. 国际教育评价协会D. 国际教育成就评估协会5、测量结果的稳定性程度是指( C )A. 效度B. 稳定性C. 信度D. 可信度6、用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是(B )A.复本信度B. 重测信度C. 同质性信度D. 分半信度7、一个测验或量表实际能测出其所要测量的特性的程度,这一概念是(A )A. 效度B. 稳定性C. 信度D. 可信度8、一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是( C )A.同质性信度B.复本信度C.效标关联效度D.重测信度9、衡量测量题目质量的两个重要指标是(D )A.信度与区分度B.效度与信度C.难度与效度D.难度与区分度10、表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是(D )A.评价指标B.评价标准C.指标权数D.指标权重11、在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是(C )A.头脑风暴法B.理论推演法C.因素分解法D.典型研究法12、一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是(B )A. 模型B. 常模C. 量规D. 参照物13、我国高考标准分数采用了一种方案,这种方案是(A )A. 正态化转换方案B. 对比参照方案C. 百分等级方案D. 常模参照方案14、最早的测验理论是( A )A.经典测验理论B.题目反应理论C.心理测验理论D.智力测验理论15、在现代测验理论的诸多模式中,最具有优越性的是(B )A. 经典测验理论B. 题目反应理论C. 心理测验理论D. 智力测验理论客观题部分:一、选择题(每题1分,共15题)参考答案:1.A2.B3.D4.B5.C6.B 7.A 8.C 9.D 10. D11. C 12. B 13. A 14. A 15. B主观题部分:一、简答题(每题2.5分,共2题)1、教育测量的含义与特点是什么?答案要点:含义:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
《教育测量与评价》试题与答案

一、选择题(每题1分,共15题)1、根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是(A )A. 测量B. 评价C. 测验D. 统计2、衡量、判断人物或事物的价值,这一概念是( B )A. 测量B. 评价C. 测验D. 统计3、被称为教育评价的催生剂的是美国的一项著名研究,它是(D )A. 教育研究B. 教育测量理论研究C. 心理测验研究D. 八年研究4、于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是(B )A. 国际教育成就评价协会B. 国际教育评估协会C. 国际教育评价协会D. 国际教育成就评估协会5、测量结果的稳定性程度是指( C )A. 效度B. 稳定性C. 信度D. 可信度6、用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是(B )A.复本信度B. 重测信度C. 同质性信度D. 分半信度7、一个测验或量表实际能测出其所要测量的特性的程度,这一概念是(A )A. 效度B. 稳定性C. 信度D. 可信度8、一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是( C )A.同质性信度B.复本信度C.效标关联效度D.重测信度9、衡量测量题目质量的两个重要指标是(D )A.信度与区分度B.效度与信度C.难度与效度D.难度与区分度10、表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是(D )A.评价指标B.评价标准C.指标权数D.指标权重11、在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是(C )A.头脑风暴法B.理论推演法C.因素分解法D.典型研究法12、一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是(B )A. 模型B. 常模C. 量规D. 参照物13、我国高考标准分数采用了一种方案,这种方案是(A )A. 正态化转换方案B. 对比参照方案C. 百分等级方案D. 常模参照方案14、最早的测验理论是( A )A.经典测验理论B.题目反应理论C.心理测验理论D.智力测验理论15、在现代测验理论的诸多模式中,最具有优越性的是(B )A. 经典测验理论B. 题目反应理论C. 心理测验理论D. 智力测验理论客观题部分:一、选择题(每题1分,共15题)参考答案:1.A2.B3.D4.B5.C6.B 7.A 8.C 9.D 10. D11. C 12. B 13. A 14. A 15. B主观题部分:一、简答题(每题2.5分,共2题)1、教育测量的含义与特点是什么?答案要点:含义:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
《现代教育测量与评价》考试题库附答案(含A.B卷)

《现代教育测量与评价》考试题库附答案(含A.B卷)A卷:单选题1.儿童努力摆脱掌握原则的集团或个人的权威,且不把自己和这种集团视为一体,从而确定有效的和可用的道德价值和原则,这是科尔伯格的()A、前习俗水平B、习俗水平C、后习俗水平D、阶段零参考答案:C2.测评者在测评过程中要注意发挥思想品德测量与评价的教育作用,使思想品德测评成为一项教育活动。
指的是学生思想测评的()原则。
A、方向性B、教育性C、客观性D、有效性参考答案:B3.世界观开始萌芽,逐渐能用道德信念自觉调节行为的发展阶段是()A、小学阶段B、初中阶段C、高中阶段D、大学阶段参考答案:B4.以下哪一项不是信度估计的方法()A、重测信度B、复本信度C、同质性信度D、标准信度参考答案:D5.评价者已有的知识、经验、认知模式等对评价可靠性影响,是指评价者和被评者的OA、意识倾向性B、情意心理C、认知倾向D、个性心理特征参考答案:C6.两个变量都是连续变量,但其中一个变量因为某种原因被人为地分成两类,这种数据类型适合的计算区分度的方法是计算()相关系数。
A、点二列B、二列C、积差D、高低分组法参考答案:B7.智力结构的“三重智力论”的提出者是()A、吉尔福特B、斯皮尔曼C、斯腾伯格D、瑟斯顿参考答案:C8.影响智商的最为主要的因素是()A、遗传和环境B、种族C、学习成绩D、性别参考答案:A9.以下哪一项不是美国耶鲁大学斯滕伯格教授提出的成功智力理论所包含的内容OA、分析性B、创造性C、操作D、实践性参考答案:C10.教育测量专家格兰朗德认为,一个完整的评价计划,可用公式形象地表达,其公式是()。
A、评价=测量+评定+价值判断B、评价二测量+定量描述+定性判断C、评价二测量+非测量+价值判断D、评价二测量+非测量+统计推断参考答案:C11.适合于某些用于选拔和分类的职业测验的效度是()A、时间效度B、内容效度C、效标关联效度D、结构效度参考答案:B12.智力测验在社会历史舞台上获得第一个稳固的立足点是为()A、智力正常的儿童进行测试B、智力超常的儿童进行测试C、弱智者提供诊断和帮助有关D、生理缺陷者提供诊断有关参考答案:C13.下列量尺中,属于最高水平测度的是()。
2020年教师招聘考试教育心理学第十四章教学测量与评价章节试题及答案

2020年教师招聘考试教育心理学第十四章教学测量与评价章节试题及答案一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,把所选选项前的字母填在题后的括号内。
1.采用性格量表对学生进行测量,他们在一个月后的结果与六个月前和三个月前的得分大致相等,这表明测验的( B )较高。
A.效度 B.信度 c.区分度 D.相关度2.关于教学测量与评价的分类,按教学评价的功能分类可分为( C )。
A.形成性评价和诊断性评价 B.常模参照评价和标准参照评价c.配置性评价和诊断性评价 D.正式评价和非正式评价3.教学评价的目的是对课程、教学方法以及学生培养方案( D )。
A.做出分析 B.做出判断 c.进行评估 D.做出决策4.常用的非测验的评价技术有案卷分析、观察和( A )。
A.情感评价 B.轶事记录. c.等级评价量表 D.行为检查单5.如果将期末考试结果的解释视为总结性评价,那么对在教学过程中实施测验的解释就是( D )。
A.定性评价 B.考察性评价 C.定量评价 D.形成性评价6.以学生所在团体的平均成绩为参照标准,根据其在团体中的相对位置来报告评价结果的评价方式称为( A )。
A.常模参照标准B.正式评价 C.标准参照评价D.非正式评价7.通过对学生的家庭作业或课堂练习、论文、日记、手工制作的模型绘画等各种作品进行考察、分析并形成某种判断和决策的过程称为( C )。
A.个案研究 B.观察分析 C.案卷分析 D.事务记录8.一个测验能够测量出所要测量的东西的程度称为( B )。
A.信度 B.效度 C.难度 D.区分度9.( A )被称为“教育测验之父”,拉开美国教育史上著名的测验运动的序幕。
A.桑代克 B.斯金纳 c.泰勒 D.梅伊10.通常在一门课程或教学活动结束后,对一个完整的教学过程进行的测定称为( D )。
A.配置性评价 B.形成性评价 C.诊断性评价 D.总结性评价11.测验是测量一个行为样本的( )。
《教育测量与评价》自己出的试题并说明了原因
《教育测量与评价》试题一、单选题(本题共10个小题,每小题2分,共20分。
)1.测量的要素是()。
A.单位 B.参照点 C.量表 D.以上皆是分析:出题选项应该尽量避免“以上皆是”、“以上皆非”的选项。
当测验编制人员很难找出足够的选项时,常用“以上皆是”、“以上皆非”来作为最后一个选项。
这种特殊选项的应用绝大部分场合均不恰当,不仅无法达到预期的功能,反而会降低题目的有效性。
2.科举制在我国实行了( B )年。
A.5 B.1300 C.2 D.3分析:每一个试题中除正确答案外,还要有足够多的干扰答案,而且要求这些干扰答案与提干应有相当的逻辑联系和似真性,本题其他三项答案与真实答案不具有干扰性。
3.标准化考试产生于( C )。
A.21世纪末 B.21世纪初 C.20世纪40年代 D.21世纪60年代分析:每一个试题中除正确答案外,还要有足够多的干扰答案,而且要求这些干扰答案与提干应有相当的逻辑联系和似真性,本题其他三项答案与真实答案不具有干扰性。
4.主观经验性考试的弊端是()A.命题的主观性 B.评分的误差较大 C.分数解释的片面性 D.以上都对分析:出题选项应该尽量避免“以上皆是”、“以上皆非”的选项。
当测验编制人员很难找出足够的选项时,常用“以上皆是”、“以上皆非”来作为最后一个选项。
这种特殊选项的应用绝大部分场合均不恰当,不仅无法达到预期的功能,反而会降低题目的有效性。
5.把被评价者的过去和现在比较,或将评价对象的不同方面进行比较,这是什么评价方法?()A.绝对评价法 B.相对评价法 C.个体内差异评价法 D.分析评价法分析:题干中要尽可能简明,尽量不要使用过于复杂的字词与语句结构,也不要使用过长的语句。
6.影响智商的最为主要的因素是( A )A.遗传和环境 B.种族 C.学习成绩 D.性别分析:所有选项都应与题干有一定的逻辑联系,选项中的干扰答案应具有很高的似真性和似乎合理性,不能错的太明显。
教育心理学练习题-第十四章---教学测量与评价
第十四章教学测量与评价一、单选题1.形成性评价通常发生在()。
A.教学过程之前B.学生毕业时C.教学过程之中D.教学过程之后2.从实施教学评价的时机来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价3.教学评价的目的是对课程、教学方法以及学生培养方案()。
A.做出决策B.做出判断C.作出分析D.进行评估4.测量首先要根据某种标准和一定的程序将学生的学习行为与结果确定为()。
A.一种题型B.一种量值C.某种题型D.多种题型5.根据教学评价的严谨程度来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价6.教师评分的相对标准对应的评价方式是()。
A.标准参照评价B.常模参照评价C.诊断性评价D.形成性评价7.通常在一门课程或教学活动结束后进行,对一个完整的教学过程进行的测定称为()。
A.形成性评价B.配置性评价C.总结性评价D.诊断性评价8.根据教学评价的功能来分,教学评价可分为()。
A.总结性评价和形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价9.根据教学评价资料的处理方式来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价10.美国心理学家布朗认为,测验是测量一个行为样本的()。
A.基本过程B.系统程序C.主要过程D.全部过程11.标准化成就测验是指由专家或学者们按一定测验理论和技术,根据全国或地区所有学校的共同教育目标来编制的适用于大规模范围内评定个体学业()。
A.智力发展的测验B.结构的测验C.能力形成的测验D.成就水平的测验12.()可用来考察学生对知识的回忆,且可将学生的猜测可能性降到最小。
A.是非题B.选择题C.论问题D.填空题13.()不是标准化成就测验的优越性。
《教育测量与评价》习题与答案
《教育测量与评价》习题与答案(解答仅供参考)一、名词解释1. 教育测量:教育测量是指运用科学的方法和标准,对学习者在知识、技能、态度、情感等方面的发展水平或学业成就进行量化测定的过程。
2. 信度:信度是评价测量工具稳定性和一致性的指标,反映的是同一份测验或者不同时间重复同一测验所得结果的一致程度。
高信度意味着测量结果具有较高的可靠性。
3. 效度:效度是指测量工具能够准确测出其所要测量内容的程度,即测量结果与实际要考察的目标之间的符合程度。
它是评价测量工具质量的最重要指标之一。
4. 标准参照评价:标准参照评价是一种基于预先设定的标准或目标来进行评价的方式,主要关注个体是否达到了特定的学习标准或发展目标,而不是将个体之间的表现进行比较。
5. 形式效度:形式效度是指测量工具在形式上是否与预定的测量目的和理论构想相一致,包括题目的编制、题目难度分布、题目类型的选择等是否恰当合理。
二、填空题1. 教育评价的核心任务是对教育活动的______进行价值判断。
答案:质量和效果。
2. 常见的教育测量方法有纸笔测验、观察法、访谈法和______等。
答案:项目反应理论(IRT)。
3. 评价学生的认知发展时,皮亚杰的认知发展阶段理论是一种常用的______。
答案:内容效度依据。
4. 教育评价中,______是指评价系统对所有被评价对象公平对待的程度。
答案:评价的公正性。
5. 在进行教育测量时,为了确保分数的稳定性,我们通常会通过计算______来评估测量工具的质量。
答案:信度系数。
三、单项选择题1. 下列哪种评价方式主要关注学生在学习过程中的进步与成长?()A. 形成性评价B. 总结性评价C. 配置性评价D. 标准参照评价答案:A2. 在教育测量中,若一个测验的信度系数为0.85,这意味着该测验的可靠性()。
A. 较低B. 一般C. 较高D. 不确定答案:C3. 关于效度,下列说法错误的是()。
A. 效度反映的是测量工具能否准确测出所要测量内容的程度B. 内容效度是指测验题目对整个待测内容范围的代表性程度C. 结构效度只能通过实证方法验证D. 同一测验的效度是固定不变的,不受被试者群体变化的影响答案:D4. 下列关于项目难度和区分度的说法正确的是()。
教育测量与评价
《教育测量与评价》习题(一)填空题1. _桑代克_的论著《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了著名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。
2. 按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。
3. 某道论述题满分12分,所有考生在这道题上的平均得分为3.6分,则此题的难度为0.3。
4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。
5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。
(二)判断题(√)1. 测验的信度受许多因素的影响。
一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。
(√)2. 标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。
(×)3. 假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。
(×)4. 等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。
因此,等距变量可以作加减乘除运算。
(×)5. 教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。
(√)6. 测验试题的难度影响着测验分数的分布。
(×)7. 现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。
(√)8. 发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。
(三)简答题1. 常见的指标权重分配方法有哪几种?【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、方法一:利用列联表检验我班男生和女生的数学学习情况,检验男生女生数学学习情况的差异。
假设0H :我班数学学习情况与性别无关 备选假设1H :我班数学学习情况与性别有关 计算n
n n E j
i ij ++⨯=
其中17,11,15,18,61,28,33,32,29222112111121=========++++n n n n n n n n n
∴
61332911⨯=
E 61282912⨯=
E 61333221⨯=
E
61283222⨯=
E
计算统计量:
∑∑
==--=2
12
1
22
)5.0(i j ij ij ij E E n χ
455.261
5.061283217615.061333211615.061282915615.0613329182
222=⎪⎭⎫ ⎝⎛-⨯-+⎪⎭⎫ ⎝⎛-⨯-+⎪⎭⎫ ⎝⎛-⨯-+⎪⎭⎫ ⎝
⎛-⨯-
=
自由度1)12)(12(=--=k ,在临界值查表84.3)1(05.02=χ,因为84.3455.22<=χ,
所以应该接受原假设0H ,即认为在概率为)05.0%(95=α的情况下,本班数学学习情况与男女性别无关;
论述:利用列联表这种方式,过程简单,且可以计算两者之间的相关关系的大小,通过查表就可以知道有多少的概率这两个变量是相关的,不足之处在于计算比较大,公式也比较复杂,教学评价主要是通过数学方法去评价,而不是考复杂的数学知识,因此这种方法操作简单,但计算量大,评价起来比较费时;
方法二:除了列联表检验,还可以采用独立性检验,即检验性别与成绩两者是否相互独立
设)61,17,11,15,18(=====n d c b a
计算相关841.3414.132
292833)11151718(61)])()()([()(2
22
<=⨯⨯⨯⨯-⨯⨯=++++-=
d b c a d c b a bc ad n k 故可以认为性别与数学成绩无关;
论述:采用独立性检验这种方法,是高中选修里面的知识,即高中生就可以采用这种方法进行调研,简单易操作,结论也比较清楚,而且可以计算相关系数,即不仅知道这两个变量是否相关,还直到这两个变量的相关性有多大;
点评:得出来的结论比较出乎意料,因为在平时的教学当中,我自身明显感觉男生比女生的接受能力要好一些,然后得出来的接结论是我们班男生女生的数
学学习情况不存在差异。
探讨原因有如下几个方面:
1:我班男女生数学学习情况不存在差异是一个好现象,说明老师讲课可以被男生,女生同样接受,而不存在侧重的一方;
2:数据分析只是分析了一次的考试成绩,是否具有足够的代表性还有待商榷;
3:数据得出来的结果之所以出乎教学者意料,是因为评价角度不同,这次是以是否及格作为标准,若是以是否优秀作为标准,可能结果会不一样;
4:教学者之所以认为男生的数学学习情况比女生好,很多情况下是以高分层或者前几名作为参考,而没有纵观全局,因此容易犯经验性的评价错误;
5:本次评价选取的概率为95%,并不能说明本班的数学学习情况完全与性别无关,若是将概率调整为99%,结果可能会改变,不过99%的概率太过于精确也不具有现实参考价值;
2、例1:从岳阳市一中高一年级896个学生随机抽取20个学生来计算数学期末考试17题的区分度:
利用随即数表选取相应学号的学生的数学成绩制作成下表:
方法一:用二列相关系数计算区分度
通过查表可得7580.0=y (y 为正态分布中7.0所对应的高) 计算7580
.03
.07.0989.983.6814.108⨯⨯
-=⨯⨯
-=
y q p x x t
q
p ζγ 得090.1=γ 计算074.820
3.07.07580.01090
.11
=⨯=
=
n
pq y
Z γ
由于2
05.096.1074.8||Z Z =>=
所以我们有理由认为第17题区分度达到了显著性水平;
论述:利用二列相关系数来计算区分度,可以直接由最后的数据得到直接的结论,其中各项数据可以通过不同的数学软件进行计算,操作比较简单,但是公式太过于复杂,各项数据也必须通过查表得到,验证的过程太过于机械;
点评:17题为第一道大题,原则上来说不应该有太大的区分度,可是通过计算表明区分度超过95%,这说明命题者没有把握好学情。
一方面,本次命题
者由高三老师负责出题,该老师并不了解高一学情;其次17题虽考察的是集合方面的知识,但是却要用到解不等式的知识,这些知识根据进度来看,高一学生还未学,因此部分学生会感到吃力。
因此区分度就此拉开。
例2:从岳阳市一中高一年级896名学生当中随机抽取40名学生,并按总成绩由高到低进行排列,利用这40名学生18,19题的小题分来计算18,19题的区分度.
上表中,满分为150分,18题和19题的满分都为12分; 方法一:用高低分组区分度指数计算这两个题的区分度
分别计算总数25%的高分端低分段平均得分率,其中H X 为总数25%的高分端得分率,L X 25%为总数的低分段得分率; 计算第18题的区分度:
4
.51
211122112215141122826,
6.81
1621
411268211=++++++⨯+⨯+⨯+⨯+⨯+⨯+⨯==+++⨯+⨯+⨯+⨯=
∴L H X X
267.
012
4
.56.8=-=
∴D 计算第19题的区分度:
1
1
12612162160,
4.51
114121
111210461327=+++⨯+⨯+⨯+⨯==+++++⨯+⨯+⨯+⨯+⨯+⨯=
∴L H X X
367.012
1
4.5=-=
∴D 参考高低分组区分度指数的临界值表 综合以上的计算,我们有理由相信第19题的区分度比第18题的区分度要好,
而18题的命题应该修改;
论述:采用高低分组区分度指数来计算17题,18题区分度,可以很快计算出这两题的区分度,从而反映命题者对学情的把握情况,计算量小,操作简单,结果清晰明了;但是却没办法计算两道题的难度,难度与区分度显然不是一个概念;
评价:按照临界值表,第18题的区分度太小,应该修改,按照高低分组区分度指数来计算的话,可以计算区分度,但是判断不一定必须参考表格,应按照实际情况来定。
第18题为解答题的第二道大题,旨在考察基础,而非在这一道提上拉开差距。
而且作为一个命题者,不单单只是命一道题,而应该把握整张试卷的区分度,因此,单看一道题或者两道题并不能反映整张试卷的区分度,也没办法体现不同层次学生的学习情况。
而一张试卷的区分度又不是每道题的区分度简单的相加或者运算,因此如何根据每道题的区分度来计算整张试卷的区分度是一个问题;
但并不能说计算区分度就毫无意义,比如说进行专题检测,一张试卷考察的是单一的内容,这总情况每道题的区分度就有现实的指导意义,或者单一评价某道题,利用区分度来评价命题者的水平也具有一定的现实指导意义;
感谢下载!
欢迎您的下载,资料仅供参考。