(完整版)教育测量与评价
教育测量与评价

3.填空题类型
(1)简释题就是通常的名词解释题,要求被试用简单,明了的词语将名词或概念解释清楚。
(2)直接问答题就是让被试对所提出的问题进行解答。例如,“文化大革命”的实质是什么?
(3)列举题就是要求被试根据要求范围列举出事或物,并略作说明。例如,请列出教育测验中常见的选择题型。
简答
制定教育评价表的方法
(1)确定教育评价的对象和目标
(2)初拟评价指标
(3)筛选评价指标
(4)确定评价指标权重
第六章、教育测验的常模及其建立方法
名词解释
1、常模:它是指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上得分的分布情况与结构模式。
填空
测验的常模可分成两类,一是发展常模,二是组内常模。
第一章、教育测量与评价的学科发展
填空
用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,这个起点叫参照点。
量表,指的是确定了测量单位和参照点并具有取值系统的测量工具。
泰勒指出
英国剑桥大学直到1720年才开始使用笔试。20世纪初,在桑代克的影响下
名词解释
教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
2为了帮助学生达到教育目标,应当提供什么学习经验,即怎样帮助学生学习预期的东西。
3怎样组织学习经验,以使这些经验的累计效果最大,即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物,并将其应用于适当的环境。
4怎样评价方案效果,即随后采取什么步骤,以不断检查期望的学习活动所发生的变化。
美国的“八年研究”对传统的教育测验提出的一些批评
教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。
(史蒂文斯)测量:客观事物及其属性;所依据的规则或方法;数量化的结果。
2、教育测量:广义:对于教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依据一定的规则将考核的结果予以数量的描述。
狭义:是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测量。
又称成就测量、学业成绩测量或学科测量。
3、教育测量的特点:1.间接性和推断性2.测量对象的模糊性和测量误差的不可避免性3.量表具有多样性,结果具有相对抽象性4.测量目的的针对性二.教育评价评价:评:评定;价:价值——教育价值教育评价:注重效果:美国的泰勒;注重资料的获得:美国的克龙巴赫、斯塔弗尔比姆;注重评价方法、手段:中国的张秀理、日本的长谷川容1、教育评价的概念:教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程,其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。
三.教育测量与评价的关系联系:教育测量就是指根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程教育评价是对教育现象状态和价值的判断,这一判断是以对评价对象的客观描述为前提的,没有对评价对象的客观描述,就不会有对评价对象价值的客观判断教育测量是教育评价的基础,教育评价要在教育测量所获得的客观信息的基础上进行.同时,教育测量的结果要通过评价才能获得实际意义.教育测量与评价的区别:第一,测量是对事物数量特征的获得。
而教育评价则是对教育现象客体的价值进行判断。
第二,教育测量是一种纯客观的过程,其突出特点是客观性。
而教育评价则具有两种属性,即客观性和主观性第三,测量的任务是对事物的量的认识,而评价作为一种认识活动,是人的意识对实践活动及其结果的综合反映,它反映的是活动的过程和终点,又是新的实践活动的起点。
教育测量与评价的产生与发展过程:一.教育测量的产生1904年以前(教育测量的萌芽期)中国的科举制(隋炀帝大业二年,公元606年)科举制的特征:逐级考核、制度完备、考场严格、命题规范科举制的考核方法:口试、贴经、墨义、策间、诗赋产生在中国、发展在西方美国贺拉斯曼1845年将“笔试”引入美国英国费舍在1864年《作业量表集》美国赖斯在1897年的《拼字实验》1904—1915年教育测量的开拓期:美国桑代克的巨着《精神与社会测量导论》问世。
(完整版)教育测验与评价

第一节教育测验一、教育测验的概念(一)概念界说测量是给事物的某种属性给定数值的过程,回答了“有多少”的问题。
教育测量包括了从身体身体素质到兴趣态度等多个方面。
测验是对于知识水平、情意状态、运动技能等的数量化测定,有广义和狭义之分。
狭义的测验仅指一份测验卷子,而广义的测验指编制试题、施测、评分到报告成绩的全过程。
在教育领域,测验只是测量的一种形式,主要用来测量学生的学业成绩和心理特点。
如果说测量回答了“有多少”的问题,只考察量的大小,测验则回答了“某个人做的怎么样”的问题,包含了对测验结果的解释和评判。
规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程,如期中、期末考试。
它与测验的区别有两种看法。
第一种是从教育测量学中引出,认为测验更为规范,从试题编制、实施测验测验到评分过程都有严格的程序,而考试则是教师可自行安排,相对灵活,技术要求不高的测验形式。
另一种观点与第一种正好相反,认为测验比较随意,而考试则较为正式。
本书主要采用第一种观点。
评价是对某种教育活动的价值判断。
评价包含定性描述或价值判断,更多的时候是两者兼而有之。
(二)测验的功能测验具有以下功能:(1)激励功能;(2)诊断功能。
诊断性测验主要考察两个方面,一个是看基础打得好不好,可否满足学习某种新知识的需要,另一个是看理解和掌握上有什么错误及其原因所在,它为教学提供了丰富的反馈信息,使教师能及时调整教学;(3)区分和选拔功能。
升学考试就体现了测验的选拔功能,如高考;(4)评定功能。
二、测验的类型从测验目的上考虑,可以分成安置性测验、形成性测验、诊断性测验和总结性测验。
从测验内容上考虑,可以分成成就测验和学能测验。
从规范程度上区分,可以分成标准化测验和教师自编测验。
从结果解释所参照的标准区分,又可以分成常模参照性测验和标准参照性测验。
(一)安置性测验、形成性测验、诊断性测验和总结性测验安置性测验的根本目的是分班、分组。
安置性测验涉及的范围比较窄,难度也比较低。
《教育测量与评价》教案

《教育测量与评价》教案第一章:教育测量与评价概述1.1 教学目标了解教育测量与评价的基本概念理解教育测量与评价的重要性掌握教育测量与评价的基本方法1.2 教学内容教育测量的定义与分类教育评价的定义与分类教育测量与评价的关系1.3 教学过程引入教育测量与评价的概念讲解教育测量的分类和特点介绍教育评价的分类和特点探讨教育测量与评价的关系1.4 教学资源教育测量与评价相关的教材和文献教育测量与评价的实际案例1.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估2.1 教学目标掌握教育测量的基本方法理解教育测量工具的设计与实施学会教育测量结果的分析与解释2.2 教学内容教育测量的方法:问卷调查、观察法、实验法等教育测量工具的设计原则与步骤教育测量结果的分析与解释方法2.3 教学过程讲解教育测量的方法及其特点介绍教育测量工具的设计原则与步骤演示教育测量结果的分析与解释方法学生进行小组讨论与实践操作2.4 教学资源教育测量与评价相关教材和文献教育测量工具设计案例教育测量结果分析软件2.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估3.1 教学目标掌握教育评价的基本方法理解教育评价工具的设计与实施学会教育评价结果的分析与解释3.2 教学内容教育评价的方法:目标评价、过程评价、成果评价等教育评价工具的设计原则与步骤教育评价结果的分析与解释方法3.3 教学过程讲解教育评价的方法及其特点介绍教育评价工具的设计原则与步骤演示教育评价结果的分析与解释方法学生进行小组讨论与实践操作3.4 教学资源教育测量与评价相关教材和文献教育评价工具设计案例教育评价结果分析软件3.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估4.1 教学目标理解教育测量与评价在实际教育领域的应用分析教育测量与评价案例的特点与方法学会教育测量与评价的应用实践4.2 教学内容教育测量与评价在不同领域的应用案例教育测量与评价案例的特点与方法教育测量与评价应用实践的注意事项4.3 教学过程讲解教育测量与评价的应用案例及其特点分析教育测量与评价案例的方法与过程学生进行小组讨论与实践操作分享教育测量与评价应用实践的经验与教训4.4 教学资源教育测量与评价相关教材和文献教育测量与评价应用案例教育测量与评价实践经验与教训的分享4.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估5.1 教学目标了解教育测量与评价的伦理与道德问题理解教育测量与评价的伦理原则与规范学会处理教育测量与评价中的伦理与道德问题5.2 教学内容教育测量与评价中的伦理与道德问题:隐私保护、公正性、标准化等教育测量与评价的伦理原则与规范:诚信、尊重、公平、透明等处理教育测量与评价中的伦理与道德问题的方法与技巧5.3 教学过程讲解教育测量与评价的伦理与道德问题及其重要性介绍教育测量与评价的伦理原则与规范讨论处理教育测量与评价中的伦理与道德问题的方法与技巧学生进行小组讨论与实践操作5.4 教学资源教育测量与评价相关第六章:教育测量与评价的数据分析6.1 教学目标掌握教育测量与评价数据的基本分析方法理解教育测量与评价数据分析的重要性学会使用数据分析软件进行教育测量与评价数据分析6.2 教学内容描述性统计分析:平均数、中位数、标准差等推断性统计分析:t检验、方差分析等相关与回归分析:皮尔逊相关系数、线性回归等教育测量与评价数据可视化:图表制作与解读6.3 教学过程讲解描述性统计分析的方法与作用介绍推断性统计分析的方法与步骤演示相关与回归分析的操作与结果解读学生利用数据分析软件进行教育测量与评价数据分析实践6.4 教学资源数据分析软件的使用教程教育测量与评价数据集统计学教材与参考书籍6.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估第七章:教育测量与评价的反馈与改进7.1 教学目标理解教育测量与评价反馈的重要性掌握教育测量与评价反馈的方法与技巧学会利用评价结果进行教育改进7.2 教学内容教育测量与评价反馈的定义与目的教育测量与评价反馈的方法:个体反馈、集体反馈等教育测量与评价反馈的技巧:有效沟通、积极倾听等利用评价结果进行教育改进的步骤与策略7.3 教学过程讲解教育测量与评价反馈的定义与目的介绍教育测量与评价反馈的方法与技巧讨论利用评价结果进行教育改进的步骤与策略学生进行小组讨论与实践操作7.4 教学资源教育测量与评价相关教材和文献教育测量与评价反馈案例教育改进的策略与方法资料7.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估第八章:教育测量与评价在政策制定中的应用8.1 教学目标理解教育测量与评价在政策制定中的作用掌握教育测量与评价在政策制定中的应用方法学会利用教育测量与评价数据参与政策制定8.2 教学内容教育测量与评价在政策制定中的重要性教育测量与评价数据在政策制定中的应用方法教育测量与评价在政策制定中的案例分析学生参与教育测量与评价数据收集与分析的实践8.3 教学过程讲解教育测量与评价在政策制定中的作用介绍教育测量与评价数据在政策制定中的应用方法分析教育测量与评价在政策制定中的案例学生进行小组讨论与实践操作8.4 教学资源教育测量与评价相关教材和文献教育测量与评价在政策制定中的应用案例政策制定相关的软件与工具8.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估第九章:教育测量与评价的国际视角9.1 教学目标理解教育测量与评价在国际领域的应用掌握教育测量与评价国际案例的分析方法学会借鉴国际经验进行教育测量与评价9.2 教学内容教育测量与评价在国际领域的应用案例教育测量与评价国际案例的特点与方法借鉴国际经验进行教育测量与评价的注意事项9.3 教学过程讲解教育测量与评价在国际领域的应用案例及其特点分析教育测量与评价国际案例的方法与过程学生进行小组讨论与实践操作分享借鉴国际经验进行教育测量与评价的经验与教训9.4 教学资源教育测量与评价相关教材和文献教育测量与评价国际案例教育测量与评价实践经验与教训的分享9.5 教学评估学生参与度评估学生理解程度评估学生应用能力评估第十章:教育测量与评价的未来发展趋势10.1 教学目标理解教育测量与评价的发展趋势掌握教育测量与评价的创新方法学会适应教育测量与评价的未来发展10.2 教学内容-重点和难点解析1. 第五章中关于教育测量与评价的伦理与道德问题。
教育测量与评价全套共534张

教育测量与评价全套共534张1. 什么是教育测量?教育测量是指用科学的方法和技术对教育活动进行测量和评价的过程。
它是一种评价和监督教育工作的手段,能够帮助教育工作者更好地了解学生的学习情况和掌握教学的效果,从而提高教育质量。
2. 教育测量的分类教育测量按照测量目的、测量方法、测量内容等不同方面可以分为多种类型。
其中,按测量目的可分为诊断性测量和决策性测量;按照测量方法可分为定量测量和定性测量;按照测量内容可分为成绩测量和非成绩测量。
此外,还有基于大数据和人工智能等技术的新型测量方法。
3. 教育测量的实施步骤教育测量要求有明确的实施步骤。
一般来说,包括以下几个方面:确定测量目的,制定测量计划,确定测量内容和方法,筛选受测对象,进行测量操作,分析测量结果,提出评价意见和建议。
4. 教育测量的评价标准在进行教育测量时,需要依据一定的标准来评价受测对象的学习状态和教育活动的效果。
评价标准应当具有科学性、客观性、公正性、准确性和实用性等特点。
5. 教育测量的意义与价值教育测量对于提高教育质量、促进教育公平、优化教育资源配置等方面都具有积极的意义和价值。
通过科学的测量和评价,可以帮助教育工作者更好地了解学生的学习情况和教学的效果,并据此进行相应的教育改革和优化,提升教育质量和教学效果。
6. 教育测量领域的发展趋势随着社会的不断进步和科技的飞速发展,教育测量也不断朝着多样化、智能化、数字化等方向发展。
未来,教育测量将更加注重多维、综合的测量与评价,同时借助大数据、人工智能等技术,加强对于学习和教学过程的监控和预测。
总之,教育测量将成为教育改革和创新的重要支撑。
教育测量与评价第一章

单位
–理想测量单位的条件: (1)具有确定的意义; (2)
具有相等的价值,即等距,它是进行加减运算的必 要条件。
测量的结果是用数字来表示,这样在同一个属 性上,如和长度上,不同的物体所得到的数字 不同,比如有的是160cm,有的是170cm…… 这些不同的数字可以组成一个连续的序列,这 个序列就叫量表。有了量表,我们就可以看个 体在量表中所处的地位,从而得到这个人的身 高。 同样,我们有了智力量表,就可以根据个体在 智力量表中的分数,可以知道它的智力水平的 高低。
教育测量与评价
导入课程
量体温、称体重这类活动有什么共同特点?
– 都有一定的对象:量体温的对象是人的体内温度属
性;称体重的对象是人的重量属性。 – 最终都用数字来表示结果。如身高是160cm,体重 是50kg。 – 都要采用一定法则编制的工具,量体温是采用热胀 冷缩的原理做成的体温计进行,称体重是采用杠杆 原理做成的秤进行。 – 包含上述事物、数字和法则三个主要元素的活动就 是测量活动。
– 蓬勃兴起阶段:1864-1940年。
• 1864年,费舍《量表集》,客观标准化测量萌 芽。 • 1897年,莱斯的拼字测验。 • 1882年,高尔顿和皮尔逊教育测验的统计方法 。1905年,比内-西蒙智力量表。
• 20世纪20年代,美国教育测验运动蓬勃发展。 三个阶段:①开拓期(1904-1915年),卡特尔 与桑代克《精神与社会测验学导论》,标志着 教育测验运动的开始;②兴盛期(1915-1930年 ),发展了学力测验、智力测验和人格测验等 不同性质的测验;③批判期(1930-1940),教 育测量运动逐步过渡到教育评价时期。
(三)测量量表
定义
数字连续体。
– 指具有一定参照点和单位的事物特征数量化的
教育测量与评价教案

教育测量与评价教案第一篇教育评价的基本原理与方法第一章教育测评概述第一节教育测量概述一、测量的定义一般认为,测量系根据法则给事物分派数字。
这里包含了测量三个方面的特性:法则,指测量的标准,也就是测量的依据和准则,即我们根据什么原理来进行测量。
法则也有好坏之分,使用好的法则可以得到比较理想的测量结果,而较差的法则只能导致不准确的测量结果。
要寻找和建立较好的测量法则是一件极为困难的事情。
但不管什么法则的建立都是一个渐进的过程。
事物,指测量的对象,也就是对什么进行测量,更明确地说,就是引起我们兴趣的事物的属性或特征。
不同的事物具有不同的属性或特征,所测量的事物是否具有一致性,这是影响测量结果是否精确的一个重要原因。
数字,这是测量结果的表现形式,是区别测量与定性评价的一个标志。
数字大多时候具有量的意义,这样它是代表一定的数值。
这些数值具有自然数的特点,如区分性、序列性或等级性、等距性和可加性。
这些性质是我们进行运算的基础。
必须指出,在测量中,我们是根据事物的属性和属性的大小来分派数字的,因此,必须考虑数字是否具有如上性质,同时还要考虑事物的性质和指派数字的原则。
二、测量的三要素1、单位。
是我们用于计算的标准。
理想的单位必须具备两个条件:一是要有确切的意义,即对同一单位,所有人的理解意义要相同,不能出现不同的解释;二是要有相等的价值,即等值性,也就是相邻两个单位点之间的差别是相等的。
2、参照点。
是计算的起点。
一般分为绝对零点和相对零点。
绝对零点指客观地存在着“0”这个数字,即完全没有;相对零点则是人们为了区分或分出等级人为地指定出一个零点,即即使在“0”这个位置,也不说明事物的属性是不存在的。
3、量表。
这是测量的工具,是具有一定单位和参照点的连续体。
由于制订量表的单位和参照点不同,量表的种类也不同,一般从低到高,分为四种水平:类别量表水平(称名量表)、顺序量表水平(等级量表)、等距量表水平(等距量表)、比率量表水平(比率量表)。
《教育测量与评价》教案

《教育测量与评价》教案第一章:教育测量与评价概述1.1 教育测量与评价的定义1.2 教育测量与评价的目的和意义1.3 教育测量与评价的基本类型1.4 教育测量与评价的发展历程第二章:教育测量与评价的基本理论2.1 教育测量理论2.2 教育评价理论2.3 教育测量与评价的方法论2.4 教育测量与评价的信度和效度第三章:教育测量与评价的设计与实施3.1 教育测量与评价的设计原则3.2 教育测量与评价的设计流程3.3 教育测量与评价的实施步骤3.4 教育测量与评价的数据收集与分析第四章:学生评价4.1 学生评价的定义和意义4.2 学生评价的类型和方法4.3 学生评价的指标体系4.4 学生评价的实施与反馈第五章:课程与教学评价5.1 课程评价的定义和意义5.2 课程评价的类型和方法5.3 教学评价的定义和意义5.4 教学评价的类型和方法第六章:教师评价6.1 教师评价的定义和意义6.2 教师评价的类型和方法6.3 教师评价的指标体系6.4 教师评价的实施与反馈第七章:教育政策与法规7.1 教育政策的定义和意义7.2 教育政策的基本类型和制定过程7.3 教育法规的定义和意义7.4 教育法规的制定和实施第八章:教育测量与评价的应用8.1 教育测量与评价在教育决策中的应用8.2 教育测量与评价在教育质量保障中的应用8.3 教育测量与评价在教育研究中的应用8.4 教育测量与评价在教育公平与均衡发展中的应用第九章:现代教育测量与评价技术9.1 现代教育测量与评价技术的概述9.2 计算机化教育测量与评价技术9.3 网络化教育测量与评价技术9.4 大数据在教育测量与评价中的应用第十章:教育测量与评价的发展趋势10.1 教育测量与评价的国际发展趋势10.2 我国教育测量与评价的发展现状与挑战10.3 教育测量与评价的未来发展趋势10.4 教育测量与评价的发展策略与建议重点和难点解析一、教育测量与评价的定义及目的意义:重点关注教育测量与评价的概念区分及其在教育实践中的重要性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育测量与评价期末复习题一、简答1.简述教育测量的基本要素及四种水平包括哪些?答:(1)教育测量的基本要素包括:参照点和单位。
参照点:计算事物数量的起点,也叫零点。
绝对参照点: 绝对零点, ,如长度, , 重量。
相对参照点: 相对零点, ,如海拔高度、温度。
单位:计量事物标准量的名称。
理想的单位要符合两个条件:同一个单位意义相同, 即确定的意义;相邻两个单位间的差别相等。
(2)教育测量的四种水平四、教育测量的水平(第二章25页未找到准确答案)从所使用的参照点来说,教育和心理测量的参照点均为相对参照点。
从所使用的单位来说,教育和心理测量所使用的单位意义不太明确, 单位常常不等值。
从本质上讲,教育和心理测量的量表属于等级量表。
无论是对智力,还是对能力倾向或人格的测量,都只具有等级量表的特征。
由于多数心理特征具有常态分布的特征,无绝对零点,所以我们也可把测量后直接得到的原始分数转化为常态分布下的标准分数,把这些量表当作等距量表来处理。
2.简述教育测验编制的基本程序有哪些?答:一、确定编制测验的目标二、制定编题计划三、设计测验项目四、预测与项目分析五、合成测验六、测验的标准化七、搜集信度、效度资料八、编写测验手册3.简述实施教育测验应注意的问题。
答:第三节、测验的实施(第4章92页未找到准确答案)(一)测试开始前的准备主试方面:•首先,主试在测试前要熟悉测验的结构和内容以及使用方法。
•其次,测验实施者要熟练测验指导语并能口语清楚而流利地说出来。
•有时还要对施测者进行必要的训练。
训练的内容包括:1 、熟悉测验内容;2 、掌握施测步骤;3 、掌握记分方法;4 、掌握解释分数的技术。
测试方面:•主试在测验前要把测验材料准备好,以免短缺而临时寻找。
(二)测试过程中应注意的事项1、指导语2、测验情景3、施测顺序4、测验焦虑(三)主试和被试的良好合作关系•主试保证测验结果绝对保密•对被试加以积极的鼓励4.简述区分度的相对性包括哪些方面?答:1. 不同的计算方法,所得的区分度的值不同。
两种相关值的比较。
2. 样本容量的大小影响相关法区分度值的大小3. 分组标准影响鉴别指数。
4.被试样本的同质性程度影响区分度值的大小。
5.简述信度的几种估计方法?答:信度种类及估计方法(第六章6页只有估计同质性信度的方法)重测信度复本信度分半信度同质性信度评分者信度估计同质性信度的方法库德- 理查逊方法K-R20公式(仅适用于以1 、0 记分)公式:公式K - R20 中:K 为构成测验的题目数;P i为通过第i 题的人数比例;qi 为未通过第i 题的人数比例;Sx为测验总分的标准差。
K-R21 公式(适用于以1 、0 记分,各题难度近似)公式:公式K - R21 中:X杠为测验总分的平均分;其它符号同上。
α系数或克伦巴赫公式适用于一切非0 、1 记分和连续记分(即多重记分)的情况公式:式中:K K 为测验的题目数;S i 为第i 题分数的标准差;Sx 为测验总分的标准差。
6.简述提高信度的方法有哪些?答:(1)适当增加测验的长度(2)使所有题目的难度接近正态分布(3)努力提高测题的区分度(4)选取恰当的被试团体7.简述效度的性质有哪些?答:(1)效度具有相对性任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。
(2)效度是针对测验结果的,即测验结果的有效性程度。
(3)效度具有连续性测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。
也就是说我们评价一个测验时,不应该说“ 有效”或“无效”,而应该用效度较高或较低来评价。
8.简述影响效标效度的因素有哪些?答:(一)测验的长度(二)效标的选择(三)预测源与效标测量的信度(四)受测者样本的特征(五)基础率(六)录取率二、论述9.论述教育测验的分类。
答:(一)按测验功能能力测验成就测验人格测验能力测验包括: : 实际能力测验与潜在能力测验( ( 能力倾向测验) ) ;普通能力测验(智力)与特殊能力测验。
实际能力:指个人当前“ 所能为者”, , 代表个人已有的知识、经验与技能, , 是正式与非正式学习或训练的结果。
潜在能力:是指个人将来“ 可能为者”, , 是在给予一定的学习机会时,某种行为可能达到的水平。
成就测验:主要用于测量个人( ( 或团体) ) 经过某种正式教育或训练之后对知识和技能掌握的程度。
人格测验:主要用于测量性格、气质、兴趣、态度、品德、情绪、信念、价值观等方面的个性心理特征。
(二)按测验方式分类纸笔测验: :测验所用的是文字或图形材料, 实施方便, 团体测验多采用此种方式。
操作测验: 操作测验项目多属于对图片、实物、工具、模型的辨认和操作,无需使用文字作答,所以不受文化因素的限制。
(二)按测验方式分类口头测验:测验项目为言语材料。
主试口头提问,被试口头作答。
电脑测验:测验项目可以是文字、图形,在电脑上显示,被试按键作答。
(三)按测验的对象人数个别测验:每次仅以一位被试为对象,通常是一位主试与一位被试在面对面的情形下进行。
团体测验:是在同一时间内由一位主试对多数人施测。
个别测验优点:获得的信息多;容易建立融洽的合作关系;特殊被试(幼儿、盲人)缺点:费时、复杂、对主试要求高。
团体测验优点:节省时间、短期内可收集大量的数据缺点:被试的行为不易有效控制,容易产生测量误差。
(四)按应用领域分:学业测验职业测验临床测验(五)按测验的性质分:构造性测验投射测验(六)按测验要求分类:最高作为测验:此种测验要求被试尽可能做出最好的回答,主要与认知过程有关,有正确答案。
(能力测验、成就测验)典型作为测验:此种测验要求被试按通常的习惯方式作出反应,没有正确答案。
(人格测验)(七)按测验的目的分类:描述性测验:测验的目的在于对个人或团体的能力、性格、兴趣、知识水平等进行描述。
诊断性测验:目的在于对个人或团体的某种行为问题进行诊断。
预示性测验:目的在于通过测验分数预示一个人将来的表现和所能达到的水平。
(八)按测验解释常模参照测验:此种测验是将一个人的分数与其他人比较,看其在某一团体中所处的位置。
标准参照测验:此种测验是将被试的分数与某种标准进行比较来解释。
(九)按测验难度分类速度测验:此种测验题目比较容易,但数量多,时间短,几乎每个被试都不能作完所有题目。
测量的是反应速度。
难度测验:包含各种不同难度的题目,由易到难排列,其中有一些极难的题目,几乎所有被试都解答不了。
但时间较充裕,测量的是解答难题的最高能力。
10.论述教育测量工作者的素质要求与道德准则。
答:(1)教育测量工作者的素质要求专业理论知识专业技能对心理测验的科学态度错误观念:万能论无用论心理测验就是智力测验(心理测验= 智力测验= 智商= 遗传决定论)对待测验的正确态度:心理测验是研究心理学的重要方法之一,是决策的辅助工具;心理测验作为研究方法和测量工具尚不完善;防止乱编和滥用心理测验。
(2)心理测量工作者的道德准则(一)测验的保密和控制使用测验信息和样题的公布有助于消除公众对心理测验的神秘感及误解有关测验的技术程序以及信度、效度和其他测验属性应向所有人公开让受测者熟悉测验,以消除焦虑,保证测验结果的准确性对测验结果的反馈(二)测验中个人隐私的保护11.论述如何正确解释测验分数的意义。
(一和二哪一个是正确答案)答:一、如何看待测验分数的意义1. 应根据教育和心理测量的特点进行分析。
应该把测验分数视为一个范围而不是一个确定的点。
2. 不能把分数绝对化,绝不能根据一次测验的结果下定论,应参考其他有关资料。
其他有关资料包括:•个人在测验前的经历•测验情境也是一个需要考虑的因素3. 为了对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料。
4. 对于来自不同测验的分数不能直接加以比较。
为了使不同测验的分数可以比较,必须将二者放在统一的量表上。
二、如何向受测者报告测验分数正确解释1. 不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议。
2. 避免使用专业术语,使用当事人理解的语言。
3. 要保证当事人知道这个测验测量或预测什么。
4. 如果测验是以常模为参考的,就要使当事人知道他是和什么团体在进行比较。
5. 要使当事人知道如何运用他的分数。
6. 要考虑测验分数将给当事人带来什么影响。
7. 要让当事人积极参与测验分数的解释。
12.论述影响测量信度的主要因素。
答:(一)样本特征1. 样本团体异质性的影响一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
2. 样本团体平均能力水平的影响测验的信度会由于不同团体间平均能力水平的不同而不同。
因为对于不同水平的团体,项目具有不同的难度,每个项目在难度上的变化累积起来便会影响信度。
(二)测验长度1. 测验越长,测验的测题取样或内容取样就越有代表性。
2. 测验越长,被试的猜测因素影响就越小。
(三)测验难度难度对信度的影响,只存在于某些测验中。
如智力测验、成就测验、能力倾向测验等;对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。
就难度与信度的关系而言,并没有简单的对应关系。
从理论上说,只有平均难度水平为50% 时,才能使求得的信度最高。
事实上,难度为0.50 只适合于简答题,对于选择题由于存在猜测因素,难度值应提高。
洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五选一测题:0.70四选一测题:0.74三选一测题:0.77是非题:(四)时间间隔时间间隔只对重测信度和不同时测量时的复本信度有影响。
以再测法和复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越长,信度系数越低。
13.论述中国古代的教育测量思想与实践。
答:(1)中国古代的教育测量思想心理特征差异性的思想孔子——教育测量的思想“ 性相近,习相远”孔子说:人( ( 或生命) ) 先天具有的纯真本性,互相之间是接近的,而后天习染积久养成的习性,却是互相之间差异甚大“中人以上可以语上也,中人以下不可以语上也”孔子说:“具有中等资质或道德水平以上的人,可以告诉他较高的学问或道理;而具有中等资质或道德水平以下的人,不可以告诉他较高的学问或道理。
”心理特征差异性的可测量性的思想孟子:“ 权,然后知轻重;度(( ( duó ),然后知长短;物皆然,心为甚”( ( 孟子) ) 说:“ 用秤称一称,才能知道轻重; ; 用尺量一量,才能知道长短。
什么东西都是这样,人的心更需要这样。
(2)中国古代的教育测量实践教育测量的实践活动( ( 人才的评定和选拔) )1. 科举取士制度---- 欧洲文官考试制度商周时代: : 礼、乐、射、御、书、数等六艺汉代:法律、军事、农业、税收和地理等五经隋唐:儒学经典( ( 形式多样: : 帖经、墨义、口义、策论等) )2. 民间的智力型游戏周岁试儿: : 到现在,婴幼儿的动作测量七巧板九连环——古代测智力水平的器具国外著名的-- 河内塔问题六艺九连环的设计精巧性可与现代的魔方、魔棍等操作性玩具相媲美,也可被视为较之现代认知心理学中的河内塔任务更为复杂的操作性问题解决任务。