教育测量与评价黄光扬

教育测量与评价黄光扬
教育测量与评价黄光扬

一、概念理解:2题,10分

1、测量:测量是按照某种规律,用数据来描述观察到的现象,即对事物

作出量化描述。测量是对非量化实物的量化过程。

2、教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的

规定上予以确定和描述的过程。教育测量是为了了解学生的发展,关注学校的教学效果,反馈关于课堂教与学两方面信息的测量活动。

3、评价:泛指衡量、判断人物或事物的价值。评价活动的过程是对人物

或事物的价值进行分析、衡量和判断的过程。

4、教育评价:是对教育活动满足社会与个体需要的程度做出判断的活动。

是对教育活动现实的(已经取得的)或潜在的(还未取得,但可能取得的)价值做出判断,以期达到教育价值增值的过程。

5、教育测量与教育评价的关系:

教育测量与教育评价既有区别又有联系:

区别:教育测量是针对教育效果或者针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。而教育评价是根据一定的标准,对教育事物或现象进行系统地调查,以获取足够多的资料事实。

教育评价的根本特征是做出价值判断,而教育测量的完结不一定都要做出价值判断。

联系:教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价是教育测量过程的延续,是对教育测量结果的解释与运用,并朝着价值判断与释放功能的方向发展。

6、标准化考试:也称标准化测验。是指由测量专家严格按照测验编制程

序而编成的一种测验。通常具有一定的编制程序,包括试题的抽样,难度、区分度指标分析,明确的施测指导语和施测程序,计分标准,常模以及信效度等指标资料。

标准化考试一般包括命题标准化、施测过程标准化、评分标准化和分数报告与解释标准化等四个环节。

7、教育评价表的编制步骤、原则、要素:

步骤:

(1)、确定教育评价的对象和目标;

(2)、初拟评价指标;

(3)、筛选评价指标(经验法调查统计法等);

(4)、确定评价指标权重(关键特征调查法、两两比较法、专家评判平均法、倍数比较法等);

(5)、设计教育评价标准;

(6)、整合、修改与完善教育评价表等。

教育评价表要素:评价指标、指标权重、评价标准

制定教育评价表基本原则:

(1)、教育规律性和导向性原则;

(2)、科学性和可操作性原则;

(3)、超前性和发展性原则

二、课程名人文化随笔:25分(名人、名言、名作等)

1、高尔顿与皮尔逊:

高尔顿,英国心理测量学上生理计量法的创始人。高尔顿在研究人类身长的遗传时,通过测量父母与子女身高,发现了“向均数回归”这一现象,并提出了回归思想。高尔顿引进了回归直线、相关系数的概念,创始了回归分析。

皮尔逊:英国现代统计学创始人之一,被称为统计学之父。他在年轻时,受到高尔顿的影响,开始对统计学产生兴趣,他完善了高尔顿提出的相关系数,并证明了回归中的负相关系数。

2、格兰朗德:

评价是为了确定学生达到教学目标的程度。收集、分析和解释信息的系统过程。一个完整的评价计划将包括测量与非测量两种方法,用公式:评价=测量(定量描述)+非测量(定性描述)+价值判断

格朗兰德认为:评价是所有成功教学的基础。

3、斯塔费尔比姆:

他强调评价最重要的意图不是为了证明,而是为了改进。

他的评价观在很大程度上影响了美国教育评价标准联合会。这个联合会给评价下的定义是:“评价是对某些现象的价值,如优缺点的系统调查。”

4、泰勒:

美国著名教育学家、课程理论专家。他是现代课程理论的重要奠基者,是科学化课程开发理论的集大成者。泰勒被美誉为“当代教育评价之父”、“现代课程理论之父” 。泰勒提出了课程编制的四个步骤或阶段:可进一步归纳为“确定教育目标”、“选择教育经验”、“组织教育经验”、“评价教育计划”,这就是“泰勒原理”的基本容。

5、布鲁姆:美国当代著名的心理学家、教育家,是国际教育评价协会评价和课程专家,是世界教育评价联合会的终身会长,提出掌握学习策略和教育目标策略。他把教育目标分为认知、情感、动作技能三大领域,认为思维有六种级别:识记;领会;应用;分析;综合;评价。

5、王维:唐代著名诗人、画家。二十一岁考中进士,本有积极政治抱

负,不料贼臣当道,安史之乱被捕入狱,后因政局变化无常,最终

归隐终南山,写下“采菊东篱下,悠然见南山”等脍炙人口的名句。

因曾在被贬边塞做官,固有大量边塞诗篇,如(使至塞上)中名句

“大漠孤烟直,长河落日圆”,因而既有田园诗人之称又有边塞诗人

之称。

6、王勃:唐代诗人,与炯、卢照邻、骆宾王齐名,世称“初唐四杰”,

王勃是“初唐四杰”之首。著有《滕王阁序》等名篇,落霞与孤鹜

齐飞,秋水共长天一色。勃曾有过“海存知己,天涯若比邻”的感

叹。14岁对策高第,入朝为官,但其恃才傲物的个性最终断绝仕途,不幸于英年早逝,当年只有28岁。

7、杜甫:唐代诗人,与白合称杜。曾有远大政治抱负,但因屡试不中,

仕途失意,壮志难酬,终因战乱颠沛流离。但其一种著有大量名诗,为唐诗做出的极大贡献。因其诗风紧紧联系当年战乱生活,被称为

史诗。著有名句:会当临绝顶,一览众山小;朱门酒肉臭,路有冻

死骨等。

8、白:字太白,唐代著名诗人。被后人誉为“诗仙”。他的诗歌总体

风格清新俊逸,既反映了时代的繁荣景象,也揭露了统治阶级的荒

淫和腐败,表现出蔑视权贵,反抗传统束缚,追求自由和理想的积

极精神。著有如《早发白帝城》、《静夜思》等大量名篇。与杜甫合

称杜。其生于科举逐步发展之时,但一身从未参加过科举考试,这

与其恃才傲物的个性有关。

长风破浪会有时,直挂云帆济沧海。天生我材必有用,千金散尽还复来。

9、白居易:唐代诗人,字乐天,号香山居士。有诗魔之称。代表诗作有《长恨

歌》、《卖炭翁》、《琵琶行》等。曾任翰林学士、江州司马、刺史等官职,

一生为官,早年兼济天下,晚年独善其身。离离原上草,一岁一枯荣。野

火烧不尽,春风吹又生。

10、清照:宋代著名女词人,婉约派代表人物。清照出生书香门第之家,

才华横溢。曾因丈夫明诚仕途被害,颠沛流离。著有大量名词,如

(如梦令)等。寻寻觅觅,冷冷清清,凄凄惨惨戚戚。乍暖还寒时候,最

难将息。

11、文天祥:宋代爱国诗人、政治家,抗元名臣,因科举取仕,宝祐四

年(公元1256年)状元及第,官至右丞相,封信国公。一生从事政

治生涯。著有《诗集》、《正气歌》等。人生自古谁无死,留取丹心

照汗青

三、问答题,知识理论体系:7题,42分

1、评价学生发展的目标体系

(1)、学校“五育”:德、智、体、美、劳;

(2)、我国古代沿用的知、情、意、行;

(3)、布鲁姆把教育目标分为认知、情感、动作技能三大领域;

(4)、梶田睿一提出的:到达性目标、发展性目标、体验性目标;

(5)、新课程改革下的三维目标:知识与技能、过程与方法、情感态度与价值观;(6)、个体一般性发展目标、学科学习发展目标、个体独特发展目标。包括:A、学科理论知识与学科能力发展;B、思维技能与品质发展;C、研究与学习技能的发展;D、创新精神与实践能力的发展E态度观念与兴趣

的发展;F、欣赏与审美的发展;G、适应与习惯的发展、H、体育技能与素质发展I、个体独特性发展。

2、教育测量与评价的质量指标体系:

信度:测量结果的稳定程度,也就是说,如果用同一测量工具反复测量同一种特质对象,则多次测验结果间的一致性程度就叫信度。

效度:就是一次测验的有效程度,严格的说,效度是指一个测验或量表实际能测出其所要测量的特性的程度。

难度:被试完成题目或项目任务时所遇到的困难程度。

区分度:题目区别被试水平能力的量度。

3、评价学生课业发展的参照点体系:

(1)、评价学生课业发展进步的个人发展参照法:1)、个人发展纵向参照;2)、个人发展横向参照;3)、个人潜力发展参照

(2)、评价学生课业发展进步的教育目标参照法:1)、专题容领域参照、2)、课程目标或标准参照;3)、整体教育改革性试验的阶段性目标参照(3)、评价学生发展进步的教育常模参照法

4、教育测量与评价的主要类型:

(1)按测量与评价在教学中运用的时机分类:

A形成性测量与评价 B诊断性。。。 C终结性。。。。

(2)按解释测量结果或评价结果时的参照点分类:

A常模参照测量与评价; B标准参照。。。 C潜力参照。。。

(3)按测量与评价被试行为表现的性质分类:

A最佳行为。。。 B典型行为。。。

(4)按测量评价的容分类:

A智力。。。 B能力倾向。。。 C成就。。。 D人格。。。。

(5)教育测量与评价的其他分类:

A按测量对象:个别测量与评价;团体测量与评价

B按测验材料可分为文字测验与非文字测验

C按量具的标准化程度可分为标准化测验和非标准化测验

5、教育测量与评价的主要功能:

(1)实现教育判断的功能(测量评定的功能;事实判断的功能;价值判断的功能;问题诊断、区分选拔的功能。)

(2)改进教师教学的功能(了解学生的起点行为;作为改进教学的参考;作为补救教与学的依据;确保教学目标的达到)

(3)促进学生学习的功能(明确目标,增加学习动力;了解自我,调整学习计划)

(4)行使教育管理的功能(对教师的管理;对学生的管理;对教育目标和质量的管理;对教育过程的管理;对学校的管理)

6、多元评价理论体系:为了使学生获得全面发展,对学生学习评价应该是多方面的。多元评价理论主要包括:主体多元化,容多维化,方法多样化。

方法:

(1)、客观评价法与主观评价法;

(2)、表现性测验评价法(口头测验、论问题测验、实验技能教学考试评价)

(3)、评定量表评价法

(4)、档案袋评价法

(5)、动态评价法

7、标准分数理论体系:

标准分数是以标准差为单位表示测验成绩与平均成绩之间的数据。

8、命题双向细目表:(P105-106)

四、计算题:8分

1、标准分数:P136

2、确定评价指标权重:P119-123 (1)、关键特征调查法:

(2)、两两比较法:

(3)、专家评判平均法:

(4)、倍数比较法:

五、论述题(小论文):15分

(关键词:教育、考试、文化、古代、现代等)

1教师应该成为人类文化的拥有者,为什么?如何做?

具有深厚的文化底蕴

要完成教书育人的历史使命,就必须使“教师成为人类优秀文化的拥有者”。文化修养对教师的专业发展起着潜移默化的作用,能够不知不觉地提升教师的教育机智,使教师在执行教育教学任务过程中得心应手。因此,当今世界许多发达国家和地区在教师教育过程中高度重视提升未来教师的文化修养。具有深厚的文化底蕴应当是教师专业发展要达成的一项基本品质。

教师的文化底蕴特性指的是教师的文化涵养性,它是教育智慧和生活智慧的文化基础。综观许多发达国家的教师教育课程设置,教师的文化修养主要包括四个方面,即哲学文化、政治历史文化、科学技术文化和文学艺术文化。

一位学识渊博、言出精辟、有着深刻思想和灵动智慧的教师,更能赢得学生的敬佩与爱戴。为此,许多国家在教师教育课程结构中加大文化修养课程的比例。1995年俄联邦国家高等教育委员会发表的《高等职业教育国家教育标准》,确定了培养教师的最低标准,其教

师教育课程容和要求“已超过学科知识、教育理论和教学能力的围,扩展到作为教师的所有方面”,明确提出决心要把未来教师培养成“人类整个优秀文化的拥有者”。

如何有效地促进教师专业发展是一个有待于进一步深入研究与实践的课题,我们应当站在时代发展的高度,放眼世界、立足国情,与时俱进、创新发展,重新审视和丰富教师专业发展的品质特性,加快促进我国教师教育改革进程,切实提高我国教师的专业化水平。

2、科举制与文化的重要关系:

3、中国人科学素养与外国人科学素养的差异:

教育测量与评价自考资料(整理打印版)

《教育测量与评价复习纲要 6、教育测量的特点有测量结果的间接性,度量单位的相对性,测量对象的复杂性,测量目的的针对性。 第二节:教育评价概述 1、2.、3、4、国外学者关于教育评价的观点:①泰勒:确定教育目标在实际上被理解到何种程度的过程;②克龙巴赫:评价是为决策提供信息的过程;③斯克里文和豪斯:评价是一种对优缺点和价值的评估,是一种既有描述又有判断的活动;④大桥正飞夫:教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断。 4、5、教育评价具有导向功能、监督检查功能、激励功能、筛选择优功能、诊断改进功能。 6、7、在教育、教学活动开始之前,为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。 8、形成性评价指在教育、教学活动计划实施的过程中,对计划、方案执行情况进行的评价。 9、总结性评价指某一教育、教学活动项目,是告一段落或完成以后进行的 评价。 第三节:教育测评的发展阶段 ⑩美国的教育测验运动分三个时期:1904-1915开拓期,1915-1930为兴盛期,1930-1940为批判期。 1931年塞蒙兹主人格测量应用评定发、问卷法、交谈法、轶事记录法等。 2、1904年桑代克发表了《精神与社会测验学导论》,标志着教育测验运动的开始。 3、 4、1963年,克龙巴赫发表了《通过评价改革课程》。 第一节:信度 2、计算信度的几种常用的方法:①稳定性系数:又称为重测信度,它是指用同一测验试卷,在先后两个不同时间同一组被试进行测验,两次测验实得分数的相关系数。这是估量信度最简单的方法。②等值性系数:先实施第一次测验,然后在最短的时间实施第二份等值的测验,再求他们得分的相关系数,这个相关系数就是信度的等值性系数。③部一致性系数:把一次测验人为地分成两部分,比较两个部分的一致程度,从而估计信度系数。估计方法有两种:分半信度和库德尔-理查森公式法。④论文式测验信度系数;⑤评分者信度。 4、测量误差的来源基本可分为三类:第一类误差产生于测验的本身;第二类误差与特定的实施条件有关;第三类误差包括被试本身的变化。 1、2、效度分为三大类:容效度、效标关联效度、结构效度。 3、容效度是指测验目的代表所欲测量的容和引起预期反应所达到的程度。估计容效度的方法有:逻辑分析的方法和用测验题目与教材容比较的方法。 45、结构效度是指一个测量能实际测量出理论上的狗年或者心理特性的程度。 6、影响效度的因素:测验的组成;测验的实施;被试主观状态方面;估计效度所依据的效标;样本方面。 7、提高效度的方法:控制系统误差;精心编制量表;妥善组织测验;扩充样本的容量和代表性;合理处理效度和信度的关系;适当增加测验的长度。 1、2、难度对测验的影响:影响测验分数的分布形态;影响测验分数的离散程度;影响测验的鉴别能力。 3、影响题目难度的因素:①考查知识点的多少;②考查能力的复杂程度或层次的高低; ③考生对题目的熟悉程度;④命题的技巧性。

大学《教育测量与评价》试题库及答案

瑞文测验中哪一项是适用于高智力成人的() 收藏 A. B 瑞文彩图推理测验 B. A 瑞文标准推理测验 C. D联合瑞文推理测验 D. C 瑞文高级推理测验 回答错误!正确答案: D 对人的智力进行的一种客观、标准化的度量,叫做()收藏 A. D 智力测验 B. B 情商 C. C 智力 D. A 能力 回答错误!正确答案: A WAIS 的计分是() 收藏 A. A 先计算标准分 B. B 先计算智商 C. D答对1题得1分 D. C原始分转化为标准二十分 回答错误!正确答案: D 测验所要达到的某种具体的目的,叫做() 收藏 A. B测验目标 B. D 行为目标 C. C 教学目标

A 教育目标 回答错误!正确答案: C 在评价对象的集合内选择一个或若干基准,各个评价对象和基准进行比较,叫做() 收藏 A. A 绝对评价法 B. C 教育评价方法 C. D 定量分析法 D. B 相对评价法 回答错误!正确答案: D 在编制试题时,题型的分类中填空题、改错题、名词解释、简答题都属于()收藏 A. B 选择型 B. D 常用题型 C. A 提供型 D. C 开放式 回答错误!正确答案: C WISC主要测验的年龄范围是() 收藏 A. B 6-16岁 B. D 4-75 C. A 4-6.5岁 D. C 16岁以上 回答错误!正确答案: A 忧郁、淡漠、悲观、思想与行动缓慢,分数太高可能会自杀。是哪种临床表现() 收藏

A 疑病 B. B 抑郁 C. D 精神病态 D. C 癔症 回答错误!正确答案: B 由反映评价对象内涵的指标集、评价标准和量化符号构成的是()收藏 A. B 模型 B. A 框架 C. D 体系 D. C 教育评价指标体系 回答错误!正确答案: D 以班级的平均成绩为标准对学生学习成绩进行的评价为() 收藏 A. B 相对评价 B. D 需要性的评价 C. C 比较性评价 D. A 绝对评价 回答错误!正确答案: A 我国教育工作者创造的认知领域目标分类法是() 收藏 A. C 五分法和四分法 B. B 三分法 C. A 六分法 D. D 二分法

教育测量与评价》作业

一、选择题(每题1分,共15题) 1、根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是(A ) A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值,这一概念是(B ) A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究,它是(D ) A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是(B ) A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指(C ) A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是(B ) A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度,这一概念是(A ) A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是(C ) A.同质性信度 B.复本信度 C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是(B ) A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是(D) A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是(C )

教育测量与评价教案

教育测量与评价教案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

《数学教育测量与评价》教案 第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。[教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别 [2]教育评价与教育评估有什么联系与区别

教育测量与评价试题

西南大学教育学院 《教育测量与评价》课程试题【A】卷 阅卷须知:阅卷需用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在相对应的分数框内;统一命题的课程应当进行集体阅卷,流水作业;阅卷后需要进行复核,发现漏评漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。 特别提醒:考生必须遵守课程考核纪律,违者将受到严肃处理 一、选择题(本大题共15小题,2分×15=30分) 1、考试制度的发源地是(),其中一个制度的建立对世界文化发展和考试制度的建立起过重要的影响 A、中国 B、美国 C、英国 D、日本 2、20世纪初,美国的教育测量运动轰轰烈烈的开展起来,美国的()是教育评价的催 生剂。 A、五年研究 B、六年研究 C、七年研究 D、八年研究 3、下面哪种教育测量与评价属于按测量与评价被试行为表现的性质分类的() A、智力测量与评价 B、典型行为测量与评价 C、能力倾向测量与评价 D、成就测量与评价 4、根据资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为:() A、同时效度和结构效度 B、结构效度和预测效度

C、同时效度和预测效度 D、结构效度和内容效度 5、李秉德提出:“教育目标分类的三维结构模型”,下面()不属于三个维度之一。 A、教育目标的组成部分 B、学生的个性心理因素 C、学生的健康程度 D、各类组成的发展水平 6、以下关于测验常模的说法,错误的是() A、有代表性的样组 B、针对某种人群 C、根据整理统计来获得资料 D、是已知的、规定的数据 7、标准分数是以标准差为单位表示测验成绩与平均分数之间的距离,下列选项中,()不属于标准分数在我国高考中的试点应用 A、建立标准分数制度是高考标准化的重要环节 B、在高考中使用原始分数不具局限性 C、高考标准分数制度由常模量表分数、等值量表分数组成 D、高考标准分数有单科标准分数转换方法及高考综合分的转换方法 8、在以下标准参照测验的定性标准-测验内容领域规范模式中,()包括说明、实例指导与题目样本、内容范围、答案范围 A、汉布莱顿模式 B、美国IOX模式 C、英国GCSE模式 D、我国高中毕业会考标准的建立模式 9、教育测量与评价方案的可用性可以从()几个方面进行阐述。 A、科学性、公平性、稳定性、针对性、区分性、简洁性 B、科学性、公平性、可行性、针对性、区分性、简洁性 C、经济性、公平性、稳定性、针对性、区分性、简洁性 D、经济性、公平性、稳定性、针对性、区分性、简洁性 10、确定测验目标应该注意() A、大概分析课程目标 B、正确选择目标

2015教育测量与评价网络作业1

一、什么是教育测量?什么是教育评价? 答:教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。 教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。 二、分别按教学运用的时机和解释结果的参照点,测量和评价可分为哪几个类别?分别是什么? 答:(1)按测评在教学中运用的时机分类:形成性测量与评价、诊断性测量与评价、终结性测量与评价。 (2)按解释测评结果时的参照点分类:常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。 三、某次高考模拟试卷高一的5名学生做所用时间分别为170、120、110、160、130分钟;高三的5名学生做所用时间分别为50、70、90、55、45分钟;问高一和高三哪一组离散程度大? 答:答:高一用时平均值:x1=(170+120+110+160+130)÷5=138 高三用时平均值:x2=(50+70+90+55+45)÷5=62 高一用时离差平方和:∑1 =(170-138)2+(120-138)2+(110-138) 2+(160-138) 2+(130-138)2= 1024+324+784+484+64=2680 高三用时离差平方和:∑2 =(50-62)2+(70-62)2+(90-62) 2+(55-62) 2+(45-62)2 =144+64+784+49+289=1330 高一用时标准差:S1=Sqrt(2680÷5) =23.15167 高三用时标准差:S2=Sqrt(1330÷5)=16.30950 两者对比,高三标准差比高一用时标准差差距较小所以高一用时离散程度较大。

10试谈语文教育与测量评价的原则

试谈语文教育测量与评价的原则 王萍1 摘要:制定体现新课程理念的语文教育测量与评价方案,是当前语文教学改革面临的一个重要课题。为了保证语文教育测量与评价方案的可用性,必须遵循科学性原则、简洁性原则、区分性原则、公平性原则和可行性原则。 关键词:语文教育测量与评价方案;信度;效度;可行性原则 教育测量与评价有许多重要的功能,如评定的功能、判断的功能、选拔的功能、反馈的功能、导向的功能和预测的功能等,但这些功能否得到很好的发挥依赖于我们能否制定出科学的方案,能否正确地认识和使用测量与评价手段。如同任何教育一样,语文教育的效果究竟如何,也需要测量,需要评价。制定体现新课程理念的语文教育测量与评价方案,是当前面临的一个重要课题。为了保证方案的可用性,必须遵循如下原则: 一、科学性原则 语文教育测量与评价方案的质量性能要做到可靠稳定,必须遵循科学性原则。从测量与评价的结果来说,科学性是指测评结果能准确地反映被测对象的真实情况,达到测量的目的,即测量要具有较高的信度和效度。 信度即测量结果的可信程度。也就是说如果用同一测量工具测量同一种特质对象,多次测量的一致性程度就叫信度。教育测量与评价运用到语文教学,与其他学科相比情况更复杂。最典型的就是对学生作文水平的测评。高考语文科作文题是高考所有科目中赋分值最大的试题,占语文科全卷赋分的40%。然而,当两位老师同判一份卷,或者同一老师不同时间判一份卷,其结果往往会大相径庭。有人在1983年高考作文试卷中取出一个考生的作文《一幅漫画的启示》,连同教育部规定的评分标准,复印后寄给近百名的中学教师评分,收回的67位教师的评分统计表明,这篇作文所评分数从6分到25分之间,分数达17种之多,最高与最低分相差19分。[1]为了提高信度,广西率先实现了无纸化阅卷,在阅卷过程中设置了可允许误差范围。试卷经两位阅卷人员评阅后,分值在误差范围内的则取平均值作为最后成绩;分值超出误差范围,则将该试卷交第三阅卷人评判。若仍出现较大误差,则将该试卷交第四人——核心专家评判,并由其作出最终评判。 效度,顾名思义就是一次测量的有效程度。严格的说,效度就是一个测验或量表实际能测出其所要测量的特性的程度。例如,为了测量学生的语文水平,总是用分辨错字、作文之类的试题,不会用数学题目。效度是测量质量的一个极其重要的方面,测量工具如果无效或效度太低,就失去了存在的价值。在处理信度与效度的关系问题上,首先要保证高的效度。由于命题的质量将直接影响到测量结果的效度,笔者对历年来的语文高考试题进行了仔细的分析,并在分析过程中发现了语文高考试题存在的一些效度较低的题目。 例:1994年全国普通高考语文试题第七小题: 7、下列句子在修辞运用上与其他三句不同的一句是(2分)() A.这几天跟过节一样热闹。 B.那里的蔬菜跟水果一样贵。 *本文为湖南文理学院人文社科项目“基于网络的作文评价系统研究”(JJQD05020)的研究成果之一。 作者简介:王萍(1979—),女,湖南郴州人,湖南文理学院讲师,广西师范大学语文课程与教学论硕士研究生,主要从事语文教学评价研究。

最新教育测量与评价考试试卷

《教育测量与评价》试卷 总分:100分考试时间:50分钟 姓名:______________ 学号:______________ 考试分数______________ 一、单选题(2*13) 1、下列哪类题型不属于客观题() A填空题B判断题C选择题D论述题 2、同一量表,同一被试群体,在不同时间,两次施测,求其相关。这样得出的信度是()A复本信度B分半信度C重测信度D同质性信度 3、名称量表上的数字具有什么特性() A等比性B等距性C等级性D区别性 4、用测验来寻找被试某种能力上的特殊优点或缺点,这种测验是() A普通测验B诊断测验C预测测验D成绩测验 5、把总体中各个个体按照一定标志分为不同类型或层次,然后从各类型中随机抽取若干个个体,从而构成样本的抽样方法叫做() A整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的() A计算分半信度先要对测验分半 B要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C测验越长、项目越多,两半分数的相关就越可能高 D不同的分半法可能会得到不同的信度值 7、下列关于区分度的描述哪一项是不正确的() A区分度是测验对被试实际水平的区分程度 B取值范围为0到1 C区分度越高时,试题的质量越好 D区分度是作为评价项目质量、筛选项目的主要指标与依据 8、区分度与难度之间的关系是() A 题目越难,区分度越高B题目越难,区分度越低 C 难度为1时,区分度为0 D难度为0时,区分度为1 9、测验工具是否测到了要测的东西,即测到了被试的某种心理特性、特质、结构,这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10、通常是以问卷的形式,提出一系列题目的人格测验的方法是( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A、B都对 12、发展常模就是某类个体正常发展进程各特定阶段的( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平

教育测量与评价

教育测量与评价 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《教育测量与评价》习题(一)填空题 1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了着名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。 2. 按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。 3. 某道论述题满分12分,所有考生在这道题上的平均得分为分,则此题的难度为。 4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。 5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。 (二)判断题 (√)1. 测验的信度受许多因素的影响。一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。 (√)2. 标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。 (×)3. 假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。 (×)4. 等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。因此,等距变量可以作加减乘除运算。

(×)5. 教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。 (√)6. 测验试题的难度影响着测验分数的分布。 (×)7. 现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。 (√)8. 发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。 (三)简答题 1. 常见的指标权重分配方法有哪几种 【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么,二是简单说明这五种方法的操作步骤。 相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。 2. 衡量测验质量的四个指标分别是什么 【答题要点】:(1)衡量测量质量的四个指标分别是信度、效度、难度和区分度。(2)在答案中需阐述清楚这四个指标分别的定义是什么。(3)一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度。(4)指出这四个指标对于测量质量的意义,即前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。 相关内容可参考第三章“教育测量与评价的质量特性”。 3. 在现代社会中,具有健康人格的学生具有哪些特征

中学数学教育测量与评价

数学测量与评价 洪梅 一、举例分析中学数学各种类型试题命制的方法与技巧?(总分:25分) 答:在此以选择题、填空题、解答题为例来分析我自己对中学数学试题命制的方法与技巧的一些认识。 1、选择题 选择题由题干和多个(备用)选择项组成。数学的选择题一般备有4个选项,这些信息或多或少具有“提示”与“迷惑”双重作用. 题干往往包含两部分:题设与提问指导语句. 提问可以是定性提问、定量提问或者定性、定量兼具的提问.而选择项,通常是所提问题的结论或答案. 选择题型较为适合考查概念的理解、性质的运用、公式的变形、数值的计算、思维的切换,等等方面的情况. 运用选择题型编制试题时应该注意下列事项: 在题干中,要用精练、明确的语言把题设(已知条件)和问题述清楚; 每一个选择项的表述必须明确清楚,它与题干连接在一起,读起来应当顺畅,并且应当成为一个完整的语句,或者是一个完整的命题. 几个选择项之间,通常应当具有同类性(即类型相同)、相近性(即形式相近)和匀称性(即容量彼此相称). 正确的选择项多一点隐蔽的色彩,而错误的选择项尽量多一些迷惑的因素,要针对学生的弱点和可能失误的情形设置起干扰作用的选择项; 题设与结论之间的关联词、提问的指导语,既要合乎逻辑,又要无歧义,而且一般情况下应放在题干中. 2.填空题 填空题的一般形式是给出若干个条件,要求推断出一个结论,或者计算出一个结果. 也有的是给一个命题要求补充条件或结论,使之成为正确的、完整的命题. 填空题的特点是只考查结果而不考查获得结果的过程. 适合编为填空题的容有:较简单的推理运算问题;容易由概念、性质或图形做出判断而严格地演绎出结果却是很难或冗繁的问题;貌似计算,实则运用概念或性质容易揭示出其中某些数量关系的问题. 填空题的进一步发展,出现了填写答案不惟一的填空题. 这类问题具有较好的辨析性、探索性或开放性,是对传统填空题具有创新意义的应用. 填空题命题的关键是材料的取舍和空位的设置,以及述方式的处理. 编制填空题应该力求做到: 取材合理,涉及的容不宜多; 考查中心突出、鲜明、集中; 发问明确,指导语贴切,不会产生歧义,不会引发误解; 述简洁、精炼,规. 3.解答题 解答题是要求完整地写出解题过程的题目. 它的特点是容量较大,能直接考查多个知识点,以及综合考查多种数学思想、方法和数学能力. 由于这类题目要求考生完整地写出解题过程,因此较之选择题和填空题更能考查考生的解题思路和解题过程,也能更好地对不同水平的考生进行多层次的区分. 在一个大前提(已知条件)下,提出若干问题,要求学生解答,这是数学解答题的常见呈现方式. 从一个基本数学事实出发,研究其变形、扩、发展,形成

北师大网络教育2017年春季《教育测量与评价》在线作业

北师大网络教育2017年春季《教育测量与评价》在线作业 作业题目列表 单选 1.根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是() A. 测量 B. 评价 C. 测验 D. 统计 参考答案:A.测量 2.衡量、判断人物或事物的价值,这一概念是() A. 测量 B. 评价 C. 测验 D. 统计 参考答案:B.评价 3.在现代测验理论的诸多模式中,最具有优越性的是() A. 经典测验理论 B. 题目反应理论 C. 心理测验理论 D. 智力测验理论 参考答案:B.题目反应理论 4.被称为教育评价的催生剂的是美国的一项著名研究,它是() A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 参考答案:D.八年研究 5.于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是() A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 参考答案:B.国际教育评估协会 6.测量结果的稳定性程度是指() A. 效度 B. 稳定性 C. 信度 D. 可信度 参考答案:C.信度 7.用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是() A. 复本信度

B. 重测信度 C. 同质性信度 D. 分半信度 参考答案:B.重测信度 8.一个测验或量表实际能测出其所要测量的特性的程度,这一概念是() A. 效度 B. 稳定性 C. 信度 D. 可信度 参考答案:A.效度 9.一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是() A. 同质性信度 B. 复本信度 C. 效标关联效度 D. 重测信度 参考答案:C.效标关联效度 10.衡量测量题目质量的两个重要指标是() A. 信度与区分度 B. 效度与信度 C. 难度与效度 D. 难度与区分度 参考答案:D.难度与区分度 11.表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是() A. 评价指标 B. 评价标准 C. 指标权数 D. 指标权重 参考答案:D.指标权重 12.在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是() A. 头脑风暴法 B. 理论推演法 C. 因素分解法 D. 典型研究法 参考答案:C.因素分解法 13.一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是() A. 模型 B. 常模 C. 量规 D. 参照物 参考答案:B.常模 14.我国高考标准分数采用了一种方案,这种方案是() A. 正态化转换方案 B. 对比参照方案

教育测量与评价

第一章、教育测量与评价的学科发展 填空 用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,这个起点叫参照点。 量表,指的是确定了测量单位和参照点并具有取值系统的测量工具。 泰勒指出 英国剑桥大学直到1720年才开始使用笔试。20世纪初,在桑代克的影响下 名词解释 教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。 教育评价:是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实基础上,作出价值分析和价值判断。 简答题 教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性,结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么,即在教育计划中,应当帮助学生发展哪些思维、感觉和行动 的方式。 ②为了帮助学生达到教育目标,应当提供什么学习经验,即怎样帮助学生学习预期的东 西。 ③怎样组织学习经验,以使这些经验的累计效果最大,即怎样的学习顺序和学习经验的 整体计划会有助于学生内化他们所学之物,并将其应用于适当的环境。 ④怎样评价方案效果,即随后采取什么步骤,以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的,不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度,但对于质的妥当性已不足以说明。 ③测验是教科书主义,测验内容关注记诵教材中的知识,是片面的,不能反映学生的全 面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。 第二章、教育测量与评价的类型和功能 填空 教育测量评价可大致分成常模参照、标准参照和潜力参照。 教育测量与评价所指向的被试的行为表现,按其性质分成最佳行为和典型行为。 名词解释 1、形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的,对教育而言是藉此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考。 2、常模参照测量与评价:是将被试水平与测验常模相比较,以评价被试团体中的相对地位的一种测量与评价类型。也就是说,常模参照评价对学生学习成就的解释,是采用了相对的观点。 3、标准化测验:是指由测量专家严格按照测验编制程序而编成的一种测验,通常标准化测

中学数学教育测量与评价审批稿

中学数学教育测量与评 价 YKK standardization office【 YKK5AB- YKK08- YKK2C- YKK18】

数学测量与评价 李洪梅 一、举例分析中学数学各种类型试题命制的方法与技巧(总分:25分) 答:在此以选择题、填空题、解答题为例来分析我自己对中学数学试题命制的方法与技巧的一些认识。 1、选择题 选择题由题干和多个(备用)选择项组成。数学的选择题一般备有4个选项,这些信息或多或少具有“提示”与“迷惑”双重作用. 题干往往包含两部分:题设与提问指导语句. 提问可以是定性提问、定量提问或者定性、定量兼具的提问.而选择项,通常是所提问题的结论或答案. 选择题型较为适合考查概念的理解、性质的运用、公式的变形、数值的计算、思维的切换,等等方面的情况. 运用选择题型编制试题时应该注意下列事项: 在题干中,要用精练、明确的语言把题设(已知条件)和问题陈述清楚; 每一个选择项的表述必须明确清楚,它与题干连接在一起,读起来应当顺畅,并且应当成为一个完整的语句,或者是一个完整的命题. 几个选择项之间,通常应当具有同类性(即类型相同)、相近性(即形式相近)和匀称性(即容量彼此相称). 正确的选择项多一点隐蔽的色彩,而错误的选择项尽量多一些迷惑的因素,要针对学生的弱点和可能失误的情形设置起干扰作用的选择项; 题设与结论之间的关联词、提问的指导语,既要合乎逻辑,又要无歧义,而且一般情况下应放在题干中. 2.填空题

填空题的一般形式是给出若干个条件,要求推断出一个结论,或者计算出一个结果. 也有的是给一个命题要求补充条件或结论,使之成为正确的、完整的命题. 填空题的特 点是只考查结果而不考查获得结果的过程. 适合编为填空题的内容有:较简单的推理运算问题;容易由概念、性质或图形做出 判断而严格地演绎出结果却是很难或冗繁的问题;貌似计算,实则运用概念或性质容易 揭示出其中某些数量关系的问题. 填空题的进一步发展,出现了填写答案不惟一的填空题. 这类问题具有较好的辨析性、探索性或开放性,是对传统填空题具有创新意义的应用. 填空题命题的关键是材料的取舍和空位的设置,以及陈述方式的处理. 编制填空题 应该力求做到: 取材合理,涉及的内容不宜多; 考查中心突出、鲜明、集中; 发问明确,指导语贴切,不会产生歧义,不会引发误解; 陈述简洁、精炼,规范. 3.解答题 解答题是要求完整地写出解题过程的题目. 它的特点是容量较大,能直接考查多个 知识点,以及综合考查多种数学思想、方法和数学能力. 由于这类题目要求考生完整地 写出解题过程,因此较之选择题和填空题更能考查考生的解题思路和解题过程,也能更 好地对不同水平的考生进行多层次的区分. 在一个大前提(已知条件)下,提出若干问题,要求学生解答,这是数学解答题的 常见呈现方式. 从一个基本数学事实出发,研究其变形、扩张、发展,形成一系列的题

教育测量与评价作业和答案

教育测量与评价作业和答案 主观题: 1、简述难度及其计算方法2、论述几种常用的人格测量量表客观题:1、以题型为顺序,易到难、客观到主观、短答案题到长答案题,是什么的原则A 检核 B 测验顺序 C 表述合理 D 拼卷2、从评价对象所承担的责任和完成任务角度提出的标准叫做 A 效能标准B职责标准 C 素质标准 D 科学标准3、每个分测验的各项得分相加,称为分测验的 A 总分 B 量表分 C 原始分 D 标准分4、标准化考试的大样本团体的成绩的平均数,叫做 A 标准化成绩 B 常模 C 参照点 D 平均成绩 5、细致的观察,评价者对被评者的实际行动进行直接的观察和记录,然后把评价结果和意见反馈给被评价者,两者一起讨论改进措施的评价方法,叫做

A 定性分析方法 B 定量分析法 C 行为目标评价法 D 临床督导评价法6、卡特尔16种人格因素量表,适用于什么样的人群 A 各种人群 B 小学以上文化程度的人群 C 高中以上文化程度的人 D 初中以上文化程度的人群7、将原始分于平均分的距离以标准差为单位表示出来的分数称为A 平均数 B 加权平均数 C 标准差 D 标准分8、如果男生用“1”表示,女生用“2”表示,这种变量称为A 等级变量 B 类别变量 C 等距变量 D 等比变量9、教育测量数据的单位不等值,不能进行加减乘除运算,大部分属于 A 类别变量 B 等级变量 C 等距变量 D 比率变量10、下列选项中哪项在教育测量中较少见 A 类别变量 B 等级变量 C 等距变量 D 比率变量11、评价者和被评价者对评价现实的体验或反映,叫做 A 评价心理B 评价现实 C 评价活动 D 评

高中语文的常规测量与评价

高中语文的常规测量与评价 华中师大一附中袁汉杰 一、教育测量与评价概述 教育测量是根据测量学原理和方法对教育现象及其属性进行数量化研究的过程。教育测量理论的建立和完善主要得益于西方心理学理论的发展,特别是得益于20世纪初美国教育测验运动的兴起。其代表人物是美国心理学家桑代克(E·L·Thorndike),他于1904年出版了《心理与社会测量》一书,介绍了心理统计与测量的基本原理,提出“凡是存在的东西都有数量, 凡是有数量的东西都可测量”的著名论断。桑代克的心理测量理论促进了学力测验、智力测验和人格测验的发展。随后他又编写出了“书法”、“拼字”、“作文”、“图画”等一系列标准化量表,使教育测量走上了科学化的道路。 教育评价则是对教育效果进行的价值判断。教育评价是教育科学一门独立的分支学科,以1940年美国发表“史密斯——泰勒报告”为标志,较为系统的教育评价理论逐渐建立起来。在报告中,泰勒(R·W·Tyler)系统地总结了教育评价思想, 第一次提出了教育评价概念,阐明了教育评价的指导思想、目的和原理,形成了以教育目标为核心的教育评价原理,从而把教育评价与教育测量区分开来。人们评论此报告为“划时代的教育评价宣言”。泰勒首先把评价纳入教学过程,强调评价对教学的反馈功能并认为对学生进行成绩测验是教学过程的有机环节。泰勒原理是教育评价理论和方法的开端,因此泰勒被尊称为“教育评价之父”。 从专业理论的角度看,教育测量和教育评价的内涵十分广泛。教育测量以教育心理学和现代教学论等学科理论为背景;而即便是狭义的教育评价概念也包含了学校评价、教师评价和教学质量评价等内容。但在实际教学中,人们往往将“测量”、“测试”、“评价”、“考试”、“评估”、“评比”、“评定”等概念等同起来,习惯以“考试”、“测试”来笼而统之,而且经常将通过考试(测试)获得的量化数据作为教学评价的主要依据。其实,测量(考试)与评价之间既有联系又有区别。测量(考试)、评价同属于人们的认识判断方式。测量包含考试,而考试的结果只有通过评价的解释才能揭示其实际意义;评价必须以测量(考试)为依据,是测量(考试)的具体体现。测量(考试)与评价的不同之处在于,测量(考试)主要是描述事物的客观状况,属于事实判断,而评价是在描述属性的基础上所作的价值评判,属于价值判断的范畴。

数学教育测量与评价

数学教育测量与评价 专题讲座第一章均值和方差的检验题一、参数假设检验的几个基本因素关于什么是参数假设检验,我们先看一个实际例子。“某班语文课教学采用研讨式方法后,对其中10名同学测验,平均成绩为85分。已知这个班过去测验成绩服从正态分布,其均值保持在82分左右,这意味着总体平均分是给定的,那么现在问采用研讨式方法后,其平均成绩是否和原来一致?” 如果我们假设采用研讨式方法后的平均成绩和采用研讨式方法前的平均成绩一致,则需要判断这种假设对不对? 如果对,对的把握性有多大? 如果不对,那么平均成绩比原来是增加还是减少? 当然,我们不能只看到85分高于82分就认为比原来高了,这是因为抽取样本时受到随机因素的干扰,我们不能以样本参数对总体参数进行单纯比较而简单地下结

论。这个例子所反映问题的是: 总体分布已知,对总体参数作假设,用统计理论来判断这一假设正确与否,统计学上称为参数假设检验。一般说来,进行假设检验应重点关注以下几个基本因素:其一,假设。假设分为参数假设和非参数假设.参数假设指总体分布已知,关于未知参数的假设,教育研究中用的最多的是已知总体服从正态分布,对总体均值某校五年级学生期末语文成绩,方差,总体方差做出假设。例如,在过在原有状况下不变,而均值去常规教学下为82分。为了提高教学质量,采用新的教学法后抽测10名同学,其平均成绩为85分,这时我们提出采用新教学法后总体均值称为原假设或零假设,相对于为82分的假设,记为,还要给出一个备选假设,记为对这个例子我们不提本均值85大于82。小于82这样的假设,这是因为这样的假设是没有根据的,原因在于样其二,假设检验。

教育测量与评价考试题目汇总

测量题目汇总 一、单选题(本题共15个小题,每小题1分,共15分。将答案填入下表) 1.与物理测量相比,以下属于教育测量特点的是( )。 A.它一般是间接测量 B.它的度量单位是绝对的 C.它的目的是特为测量服务的 D.它的作用是单一的 2. 下列量尺中,属于最高水平测度的是()。 A.类别量表 B.等级量表 C.等距量表 D.等比量表 3. 一个主试在同一时间,只测量一个被试的测验称为()。 A.难度测验 B.速度测验 C.预测测验 D.个别测验 4.区分度指数D的取值围为()。 A.[-1,0] B.[0,1] C.[-1,1] D.[-2,2] 5.提出“凡有数量的东西都可以测量”的测验学者是()。 A.桑代克 B.麦柯尔 C.王书林 D.萨蒂 6.测验难度系数P值在0.8—1.0为( D )。 A、难题 B、较难题 C、中等题 D、易题 7.测题基本上分为选择题和()。 A.是非题 B.供答题 C.论述题 D.客观题 8.原则上区分度水平()以下的题必须淘汰。 A.0.19 B.0.4 C.0.30—0.39 D. 0.20—0.29 9.下列教育测量类型属于按照测量的功能分类的是()。 A.常模参照测验和标准参照测验 B.智力测验和能力倾向测验 C.难度测验和速度测验 D.标准化测验和教师自编测验 10.下列有关信度解释正确的是()。 A.信度是有关测量结果的可信程度 B.信度越高,测验结果越是真实的 C.信度追求测量中的系统误差的最佳控制程度的估计 D.测验的项目少,测验的信度高 11.测量项目的难度为0.5时,项目的区分度值最大为()。 A.0.8 B.1.5 C.1 D.-1 12.通常所用的时限是使大约()%的被试在规定时间完成全部测验。 A.90 B.80 C.95 D.100 13.人的身高与学业成就、相貌与人的行为等现象的关系都属于()。 A.积差相关 B.零相关 C.正相关 D.负相关 14.下列估计测验信度的方法中,对信度最严格的检验方法是()。 A.再测信度 B.在一致性信度 C.复本信度 D.评分者信度 15.项目分析时一般将总分最高和最低的()的被试划分为高分组和低分组。 A.7% B.17% C.27% D.37% 二、多项选择题(本题共8个小题,每题2分,共16分。将答案填入下表)

比较教育、教育测量与评价、教育科学研究方法参考答案

比较教育参考答案 一、单项选择题) 1.D 2.C 3.C 4.C 5.D 6.A 7.C 8.A 9.A 10.D 11 B 12 C A D c 英国教育管理的特点有哪些? 英国教育管理的特色是中央和地方密切合作。英国式教育管理信念为最佳的教育管理则是充分授权于具体实施者,并依其风格处理教育事务以求实效;除非出现明显的偏差,否则不应予以干涉。2001年,作为英国中央教育行政机构的“教育就业部”被改称为“教育技能部”。现在教育技能部与地方教育当局以一种协调合作的关系,通过沟通的方式来行使教育管理职能。教育技能部正在有意扩大其权限与职能,以有利于国家教育政策得到贯彻落实,而中央教育行政部门与地方教育行政当局应当彼此沟通与协调的精神并没有因此而改变。 世界主要国家对教育督导人员的基本要求有哪些? 结合实际,谈谈在比较教育管理研究中应如何避免常见的偏差 试分析美国教育管理改革与发展的趋势 当今世界教育,无论是实行以中央集中管理为主的国家(如中国、俄罗斯、法国、新加坡等),还是实行以地方管理为主的国家(如美国、英国、德国等),都在进行改革。各个国家教育管理改革的思路和重点虽然各不相同,采用的方法也互有区别,但相互学习、相互借鉴是基本趋势。 教育实行以中央集中管理为主的国家,强调国家对教育的集中领导,政令统一,行政管理效率较高;强调统一的教育教学标准,教育质量相对均衡;教育制度规范,学校管理严格,教育教学秩序比较稳定;强调共性,强调全面发展,强调国家至上,强调集体主义精神,学生为社会服务的意识较浓;教学中强调基本知识、基本技能的传授,学生学习的知识比较系统、扎实;重视定性分析和终结性评价,考试考核比较严格。但是,这类国家的教育也存在重大缺陷,例如地方的办学积极性和学校的办学主动权发挥不够;教育教学过程中学生的个性很难得到充分自由发展;学生的创新精神和实践能力相对较弱;考试压力大,学生学习负担过重;忽视发展性评价和定量分析,教育评价不够全面等。 针对以上状况,此类国家教育管理改革的重点是:下放中央教育行政权力,改变教育行政机关职能,适当淡化行政对教育业务的干预,强化社区、家长对学校的监督;体现以人为本,提升学生在教育教学中的主体地位,促进学生个性充分发展;加强师生情感交流,注重教育教学与社会生活的联系,丰富学校生活内容;强调知识的综合性,提倡研究性学习,加强教学与生产的联系,培养学生创新精神和实践

教育测量与评价试卷及答案

卷号:A 二O 一九---二O 二O 学年第 一 学期期末考试 教育测量与评价 试题 题号 一 二 三 四 五 六 七 八 九 十 题分 30 16 28 26 得分 一、单选题( 2*15 ) 1 、下列哪类题型不属于客观题( ) A 填空题 B 判断题 C 选择题 D 论述题 2 、同一量表,同一被试群体,在不同时间,两次施测,求其相关。这样得出的信度是( ) A 复本信度 B 分半信度 C 重测信度 D 同质性信度 3 、名称量表上的数字具有什么特性( ) A 等比性 B 等距性 C 等级性 D 区别性 4 、用测验来寻找被试某种能力上的特殊优点或缺点,这种测验是( ) A 普通测验 B 诊断测验 C 预测测验 D 成绩测验 5 、把总体中各个个体按照一定标志分为不同类型或层次,然后从各类型中随机抽取若干个个体,从而构成样本的抽样方法叫做( ) A 整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的( ) A 计算分半信度先要对测验分半 B 要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C 测验越长、项目越多,两半分数的相关就越 可能 高 D 不同的分半法可能会得到不同的信度值 7、 下列关于区分度的描述哪一项是不正确的( ) A 区分度是测验对被试实际水平的区分程度 B 取值范围为 0 到 1 C 区分度越高时,试题的质量越好 D 区分度 是作为评价项目质量、筛选项目的主要指标与依据 8、 区分度与难度之间的关系是( ) A 题目越难,区分度越高 B 题目越难,区分度越低 C 难度为 1 时,区分度为 0 D 难度为 0 时,区分度为 1 9 、测验工具是否测到了要测的东西,即测到了被试的某种心理特性、特质、结构,这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10 、 通常是以问卷的形式,提出一系列题目的人格测验的方法是 ( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11 、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A 、 B 都对 12 、发展常模就是某类个体正常发展进程各特定阶段的 ( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平 13 、一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是( ) A. 模型 B. 常模 C. 量规 D. 参照物 14 、我国高考标准分数采用了一种方案,这种方案是 ( ) A. 正态化转换方案 B. 对比参照方案 C. 百分等级方案 D. 常模参照方案 15 、 有一满分值 K=5 的试题,测试 10 名被试,实得成绩为 5 , 3 , 4.5 , 2 , 5 , 0 , 3.5 , 1 , 3 , 4 ,其难度指数 P 为 ( ) A . 3.1 B . 1.3 C . 0.26 D . 0.62 二、名词解释( 4*4 ) 1 、 量表 总分 核分人 姓 名 一?密封线内不准答题? 二?姓名?准考证号不许涂改?否则试卷无效? 三?考生在答题前应先将姓名?学号?年级和班级填写在指定的方框内? 四?试卷印刷不清楚?可举手向监考教师询问? 学 号 所在年级、班级 密 封 注意

相关文档
最新文档