教育测量与评价
教师资格证考试教育测量与评价

教师资格证考试教育测量与评价教育测量与评价是教育领域中一个重要的概念,并在教师资格证考试中占据了重要地位。
教育测量与评价旨在客观地测量学生的学习成果,并评估教育活动的有效性。
通过测量与评价,教育工作者可以了解学生的学习进展,为学生提供有针对性的教学和支持。
在教育测量与评价中,测量是指通过收集和分析学生的学习数据来确定学生的学术水平和知识技能。
这包括使用各种评估方法和工具,如考试、作业、问卷调查和观察等来获取学生的学习成果。
评价则是对测量结果进行解释和判断,以便了解学生的学习进展和教学的有效性。
教育测量与评价对于教师资格证考试来说至关重要。
教师资格证考试旨在评估教师的专业知识和教学能力,确保他们具备成为合格教师的必要条件。
而教育测量与评价则是考核教师的一种重要方法。
在教师资格证考试中,教育测量与评价通常以选择题、试卷分析、案例分析等形式出现。
通过这些考试形式,考生需要根据学生的学习情况和教育实践,回答与教育测量与评价相关的问题。
这些问题旨在测试考生对教育测量与评价理论和方法的理解,并展示他们在实际教学中应用教育测量与评价的能力。
在考生回答这些问题时,他们需要展示对教育测量与评价核心概念的理解。
例如,他们需要说明什么是测量和评价,以及它们在教育中的作用;他们还需要讨论不同的测量和评价方法,并解释每种方法的优缺点;此外,他们还需要说明如何根据测量和评价结果来调整教学策略和提供个性化的学习支持。
除了理论知识,考生还需要举例说明实际教育测量与评价的情况。
例如,他们可以描述自己设计和实施的教学评估活动,或者讨论一些实际教育测量与评价案例。
这些实例可以帮助考生展示他们在教育测量与评价方面的实际经验和应用能力。
综上所述,教育测量与评价在教师资格证考试中扮演了重要的角色。
考生需要在考试中展示对教育测量与评价核心概念的理解,并能够将其应用于实际教学情境中。
通过合理的论述和举例,考生可以展示他们在教育测量与评价方面的专业能力,从而提高通过教师资格证考试的机会。
教育测量与评价专业的就业方向

教育测量与评价专业是一个既重要又具有挑战性的领域,在许多不同的领域中都有着广泛的应用。
学生在选择这个专业之后,需要对将来的就业方向有清晰的认识。
以下将对教育测量与评价专业的就业方向进行详细的探讨和分析。
一、教育测量与评价专业的就业方向1. 教育机构教育测量与评价专业的毕业生在教育机构中有着广泛的就业机会。
他们可以在中小学、高等学府和教育研究方面工作。
在这些机构里,他们可以参与教育评估、课程设计和学校管理等方面的工作,为教育改革和发展做出贡献。
2. 政府部门政府部门也是教育测量与评价专业毕业生的就业主要出路之一。
他们可以在教育部门、统计局及其他相关部门从事教育政策研究、数据分析、综合评价等工作,为政府决策提供专业的数据支持。
3. 教育科研机构教育科研机构也是教育测量与评价专业毕业生的主要就业方向之一。
在这些机构中,他们可以进行教育测量方法研究、评价工具开发、教育统计分析等工作,为教育研究领域做出贡献。
4. 教育科技公司随着教育科技的发展,教育测量与评价专业的毕业生可以进入教育科技公司从事教育数据分析、上线教育评价、教育产品研发等工作,为教育科技行业的发展提供专业支持。
5. 自由职业教育测量与评价专业的毕业生也可以选择从事自由职业,如教育培训、交流顾问等工作,为不同的教育机构和个人提供专业的测量与评价服务。
他们可以利用自己的专业知识和技能,开展教育测量与评价的实践工作。
二、发展趋势和就业前景随着教育事业的不断发展和教育改革的深入推进,教育测量与评价专业的就业前景越来越广阔。
教育测量与评价专业的毕业生具备丰富的教育测量理论和实践经验,能够熟练运用统计分析工具和评价方法,在教育管理、政策研究、教育科研和教育科技等领域中有着广阔的发展空间。
随着大数据和人工智能技术的发展,教育数据分析和教育评价成为了热门的研究方向和就业领域。
教育测量与评价专业的毕业生可以利用自己的专业知识和技能,参与教育大数据分析、个性化教育评价、智能教育系统开发等工作,为教育领域的创新与发展贡献力量。
教育测量与评价第二讲

24
❖ (1)任何现象只要是存在的总有数量 ❖ 这个原则是由美国心理学家桑代克(E.L.
Thorndike) 提出的。他说:“凡物的存在必 有其数量。”人的心理现象虽然看不见,摸 不着,但它是客观存在的现实,是脑这块高 级物质的属性,它也有数量的差异。 ❖ 例如,人的智力有高低之分,学生的学习成 绩有优劣之别。这高低之间、优劣之间,存 在着程度的不同。所谓程度不同,就是数量 的不同。
9
❖ 在数学上,函数就是把某一集合中的事物分 派到另一集合事物之上的规则。可以说,任 何测量都呈现函数关系,而任何函数关系都 是建立一种顺序配对的集合。
❖ 一般来说,具体且稳定的事物属性,如性别、 身高、体重等,其测量的规则就易于建立和 使用;抽象且易变的事物属性,如人的智力、 知识、技能、人格、态度等心理属性,其测 量规则就难以制定和使用。
测量的事物属性的不同,有时并不需要让数 的各种特性同时具备。当然,能多具备一些 更好,因为测量中运用数的效果,确实也与 这些数所包括的特性多少相关联。
7
❖ 假如我们能用数合理地描述事物的属性,并 且在允许的条件下,对数进行运算,我们就 可以通过运算的结果,对所要测量的属性进 行推测。如果事物的属性和数的系统之间, 在性质上或形式上存在着高度的类似性,我 们就可以用数来描述事物的真实情况。
10
(二)四种测量量表
❖ 量表一般称为测量工具。 ❖ 1、名称量表—(类别量表)最低水平的一
种量表 ❖ 它只是用数字表明事物的类别或性质不同而
已,没有任何数量大小的意义,不能作数量 化分析,也不能将之进行加减乘除运算。 ❖ 即属于同一类的事物用同一个数字表示,属 于另一类的事物用另一个数字表示。用来描 述各类事物的数字仅仅是事物的名称:它只 具有相同与不同的特性,没有数量大小的含 义。用这类数字表示的量表叫名称量表。
教育测量与评价

教育测量与评价(简答题部分)什么是表现性评价:一种性质的评定方法新型的更加直接的考察学生综合运用的知识、解决实际问题能力的方法,在促进学生发展和改进教学方面有显着作用表现性评价 1优点:有助于测查学生综合运用所学知识解决实际问题的能力优化教学过程,使学生的能力尽可能得到发展激发学生的学习动机,为终身学习打基础注重知识技能的整合与综合运用复杂的任务表现教学性评价与教学活动有密切的联系2缺点:信度问题效度问题实用性问题耗时过多不能评价所有类型的学习目标高利害评使用表现性评价就要十分谨慎品德测试的意义:有利于学生思想上的自我教育和学校德育工作的顺利进行激励先进和鞭策后进有利于学生德育管理德育和行为科学研究的重要手段品德测评的类型:诊断性形成性总结性品德测评的基本要求:外显行为测评和道德认识测评相结合单项测评和整体测评相结合定向性测评和定量测评相结合测评指标体系确立的依据:社会的需要德育大纲德育结构学生年龄特征测评基本要求:重视指标体系的开放性教育性处理好普遍性和特殊性的关系稳定性和发展性的关系统一性的灵活性的关系品德测评的方法、运用:定时考核(学生成绩测量)问卷测评(问卷或量表测试)项目评分(设置一些测试的项目,给予一定的分数,对学生的思想和行为表现进行测量)情景测验(设计情景,展开活动)社会关系测量(通过学生回答,来了解学生的人际关系)意向测评法(Q技术、和语义分析)行为观测法(有目的有计划的考察学生思想行为)教师评价的特点:是一个活动过程,一个特殊的连续活动,包括一系列的方法和步骤有目的有计划的活动过程根本目的在于形成价值判断,进而做出选择评价者与被评价者是同一的教师评价的主体:行政部门、学校、教师参评(教育行政部门依法对教育人力支援进行管理对教师的考核人工作进行指导和督导有助于提高教师的信度与效度)学生参评(是教学过程中的主体,直接承受着教师教学效能的影响)家长参评(家长是教育的投资方,间接的把学生的意见反馈给教师的有效手段)教师自评的意义:鼓励教师积极主动的进入评价角色增加教师评价的信度自我评价其实是教师自我反思、自我教育、激发内在动因的过程和自我提高的过程教育评价的模式:实证范式评价(行为目标评价操作主意模式)人文范式(发展性评价模式自主性评价模式团体性评价模式教师校本)教师评价程序:确定目的确定评价者制定指标体系确定评价方式评价过程的实施指标体系的构成:素质评价指标(教师实施教育教学的基础)职责评价指标(实施教育教学的关键)绩效评价指标(最终目标教师评价过程:教师自我评价和学校评价教师评价主要工具:工作评估报告(1工作评估报告表:教师个人资料评价专家资料目的评定签字2评估具体内容3观察、总结)教师评价案例:日本1教师与校长、教导主任会面,确定自己的教学目标、教学方向,并就完成程度做自我评价2教导主任做第一次评估,校长通过观摩教师授课进行最终评估3评估综合评估过程中参考家长和学生的意见。
教育测量与评价的基本理论

教育测量与评价的基本理论教育测量与评价是指对教育活动进行系统观察、衡量和评估的过程,通过对学习者、教学内容和教学环境的测量,用于了解教育目标的达成情况、教学质量的提高与改进以及教育政策的制定和调整。
它是教育领域中的重要理论和实践,为教育决策提供科学依据。
1.测量理论:测量理论是教育测量与评价的基础,它研究如何将可量化的教育目标转化为能被测量的指标。
测量理论主要包括传统测量理论和现代测量理论两个方面。
传统测量理论强调测验的可靠性和效度,可靠性是指一个测验在确定条件下能得到相似结果的程度,效度是指测验能否真实地反映被测对象的特征或能力。
传统测量理论通过统计方法对测试结果进行分析,包括计算信度系数、相关系数等。
现代测量理论强调以潜在变量为中心,认为教育目标不同于一般的观测指标,而是通过观测指标的背后的潜在变量来描述的。
现代测量理论包括因素分析、结构方程模型等方法,能够更准确地描述教育目标和评价对象之间的关系。
2.评价理论:评价理论是研究如何对测量结果进行综合和判断的理论体系。
评价理论主要包括定性评价和定量评价两个方面。
定性评价注重对教育活动进行质性分析,通过观察、访谈、文献分析等方法获取和理解相关信息,从而对教育活动进行综合评价。
定性评价强调了对于教育过程的深入了解和真实反映。
定量评价注重对教育活动进行数量分析,通过数据收集和统计分析来评估教育活动的效果。
定量评价通过数值化的方法对数据进行处理和解释,能够进行更加准确的比较和判断。
3.教育测量与评价模型:斯兰贝格模型是对教学质量进行综合评价的模型,它将教育目标、教学过程和学生学习效果三个方面的指标进行综合评价,从而得出教学质量的综合评定。
塔伦斯模型是对教师教学能力进行评价的模型,它将教师的知识和技能、教学过程和学生学习结果三个方面的指标进行评价,从而得出教师教学能力的评估结果。
布鲁姆分类模型是对学习者学习效果进行评价的模型,它将学习者的认知、情感和技能等方面的指标进行评价,从而得出学习者的学习效果。
《教育测量与评价》习题与答案

《教育测量与评价》习题与答案(解答仅供参考)一、名词解释1. 教育测量:教育测量是指运用科学的方法和标准,对学习者在知识、技能、态度、情感等方面的发展水平或学业成就进行量化测定的过程。
2. 信度:信度是评价测量工具稳定性和一致性的指标,反映的是同一份测验或者不同时间重复同一测验所得结果的一致程度。
高信度意味着测量结果具有较高的可靠性。
3. 效度:效度是指测量工具能够准确测出其所要测量内容的程度,即测量结果与实际要考察的目标之间的符合程度。
它是评价测量工具质量的最重要指标之一。
4. 标准参照评价:标准参照评价是一种基于预先设定的标准或目标来进行评价的方式,主要关注个体是否达到了特定的学习标准或发展目标,而不是将个体之间的表现进行比较。
5. 形式效度:形式效度是指测量工具在形式上是否与预定的测量目的和理论构想相一致,包括题目的编制、题目难度分布、题目类型的选择等是否恰当合理。
二、填空题1. 教育评价的核心任务是对教育活动的______进行价值判断。
答案:质量和效果。
2. 常见的教育测量方法有纸笔测验、观察法、访谈法和______等。
答案:项目反应理论(IRT)。
3. 评价学生的认知发展时,皮亚杰的认知发展阶段理论是一种常用的______。
答案:内容效度依据。
4. 教育评价中,______是指评价系统对所有被评价对象公平对待的程度。
答案:评价的公正性。
5. 在进行教育测量时,为了确保分数的稳定性,我们通常会通过计算______来评估测量工具的质量。
答案:信度系数。
三、单项选择题1. 下列哪种评价方式主要关注学生在学习过程中的进步与成长?()A. 形成性评价B. 总结性评价C. 配置性评价D. 标准参照评价答案:A2. 在教育测量中,若一个测验的信度系数为0.85,这意味着该测验的可靠性()。
A. 较低B. 一般C. 较高D. 不确定答案:C3. 关于效度,下列说法错误的是()。
A. 效度反映的是测量工具能否准确测出所要测量内容的程度B. 内容效度是指测验题目对整个待测内容范围的代表性程度C. 结构效度只能通过实证方法验证D. 同一测验的效度是固定不变的,不受被试者群体变化的影响答案:D4. 下列关于项目难度和区分度的说法正确的是()。
教育测量与评价黄光扬

-.概念理解:2题,10分1、测量:测量是按照某种规律,用数据来描述观察到的现象,即对事物作出量化描述。
测量是对非量化实物的量化过程。
2、教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定上予以确定和描述的过程。
教育测量是为了了解学生的发展,关注学校的教学效果,反馈关于课堂教与学两方面信息的测量活动。
3、评价:泛指衡量、判断人物或事物的价值。
评价活动的过程是对人物或事物的价值进行分析、衡量和判断的过程。
4、教育评价:是对教育活动满足社会与个体需要的程度做出判断的活动。
是对教育活动现实的(已经取得的)或潜在的(还未取得,但可能取得的)价值做出判断,以期达到教育价值增值的过程。
5、教育测量与教育评价的关系:教育测量与教育评价既有区别又有联系:区别:教育测量是针对教育效果或者针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
而教育评价是根据一定的标准,对教育事物或现象进行系统地调查,以获取足够多的资料事实。
教育评价的根本特征是做出价值判断,而教育测量的完结不一定都要做出价值判断。
联系:教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价是教育测量过程的延续,是对教育测量结果的解释与运用,并朝着价值判断与释放功能的方向发展。
6、标准化考试:也称标准化测验。
是指由测量专家严格按照测验编制程序而编成的一种测验。
通常具有一定的编制程序,包括试题的抽样,难度、区分度指标分析,明确的施测指导语和施测程序,计分标准,常模以及信效度等指标资料。
标准化考试一般包括命题标准化、施测过程标准化、评分标准化和分数报告与解释标准化等四个环节。
7、教育评价表的编制步骤、原则、要素:步骤:(1)、确定教育评价的对象和目标;(2)、初拟评价指标;(3)、筛选评价指标(经验法调查统计法等);(4)、确定评价指标权重(关键特征调查法、两两比较法、专家评判平均法、倍数比较法等);(5)、设计教育评价标准;(6)、整合、修改与完善教育评价表等。
第二章 教育测量与评价的类型与功能

请查询相关资料:
英语四级、六级考试分数计算方式; 高考分数计算方式;
潜力参照测量与评价:是将被试实际水平 与其自身潜在水平(潜力)进行比较,以 评价被试有没有充分发挥自身潜力为目的。 比如动态评价法。
(三)按照测量与评价被试行为 表现的性质
最佳行为测量与评价; 典型行为测量与评价;
(二)按照对测量结果解释的参照点
常模参照测量与评价:将被试水平与测验常模进 行比较,以评价被试在团体中的相对地位的一种 测量与评价类型。比如平均分的相对比较方法、 英语46级考试分数和高考分数。
标准参照测量与评价:将被试的表现与既定的教 育目标或行为标准相比较,以评价被试在多大程 度上达到该标准。比如正确百分数、得分百分数、 英国GCSE(中等教育普通证书)考试。可以独 立描述学生的成绩。
1.激励学生的学习动机; 2.帮助学生的记忆和促进迁移; 3.促进学生自我评价;
(四)行使教育管理的功能
1.对教师的管理; 2.对目标的管理; 3.对过程的管理;
(一)实现教育判断的功能
1.测量评定的功能; 2.事实判断的功能; 3.价值判断的功能; 4.问题诊断的功能; 5.区分选拔功能;
(二)改进教师教学的功能
1.了解学生的起点行为; 2.作为改进教学的参考; 3.作为补救教与学的依据; 4.确保教学目标的达到;
(三)促进学生学习的功能
第二章 教育测量与 评价的类型和功能
一、教育测量与评价的主要类型
(一)按照其在教学中运用的时机
形成性测量与评价:在教育过程中经常实 施的,在性质上相当于现在的中小学单元 测试。
诊断性测量与评价:对经常表现出学习困 难的学生开展测量与评价,其目的是对个 人的问题行为及其原因进行诊断。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育测量与评价文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)《教育测量与评价》习题(一)填空题1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了着名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。
2. 按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。
3. 某道论述题满分12分,所有考生在这道题上的平均得分为分,则此题的难度为。
4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。
5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。
(二)判断题(√)1. 测验的信度受许多因素的影响。
一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。
(√)2. 标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。
(×)3. 假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。
(×)4. 等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。
因此,等距变量可以作加减乘除运算。
(×)5. 教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。
(√)6. 测验试题的难度影响着测验分数的分布。
(×)7. 现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。
(√)8. 发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。
(三)简答题1. 常见的指标权重分配方法有哪几种【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。
答题时一是要阐述清楚这五种方法各自的内涵是什么,二是简单说明这五种方法的操作步骤。
相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。
2. 衡量测验质量的四个指标分别是什么【答题要点】:(1)衡量测量质量的四个指标分别是信度、效度、难度和区分度。
(2)在答案中需阐述清楚这四个指标分别的定义是什么。
(3)一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度。
(4)指出这四个指标对于测量质量的意义,即前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。
相关内容可参考第三章“教育测量与评价的质量特性”。
3. 在现代社会中,具有健康人格的学生具有哪些特征【答题要点】:在现代社会中,青少年学生所具有的健康人格应是:能客观地认识自我和外部世界;开放的;对所承担的学习和其他活动有胜任感;充分发挥自己潜能;对父母、朋友有显示爱的能力;有安全感;喜欢创造;有能力管理自己的生活;有责任感等。
相关内容可参考第八章“学生评价”中第五节“学生人格心理发展的测评”。
4. 制定教育评价表需要遵循哪些原则【答题要点】:教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。
它是进行教育测量与评价的工具,为了使评价的结果更为可靠,需要对教育评价表进行更深入的研究,制定教育评价表应遵循以下的原则:(1)科学性与导向性原则(2)完备性与独立性原则(3)发展性与整体性原则(4)操作性与可测性原则(5)可行性与可比性原则作答时需对以上五个原则分别展开阐述,说明其各自内涵。
相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第一节“制定教育评价表的意义与原则”。
(四)论述题1. 现代学生评价具有那些特点如果您是一名评价者,您将从哪些方面评价学生【答题要点】:(1)在回答现代学生评价的特点是,注意结合以下几点进行阐述,注意把握它们的内涵并结合实践进行说明。
强调了评价功能的形成性。
重视评价内容的全面性。
重视评价类型的多样性。
(2)现代学生评价的这些特点也反映在现代学生评价的原则与操作方法上。
现代学生评价的基本原则包括:发展性原则、全面性原则、明确性原则和过程性原则。
(3)可从综合的角度出发,提出学生课业发展的内容框架。
这个内容框架,除了学生的健康与体能发展目标外,还可包括如下九个方面:学生个体一般性发展学科理论知识和学科能力或技能的发展思维技能与品质的发展研究与学习技能创新精神与实践能力的发展态度、观念与兴趣的发展欣赏与审美的发展适应与习惯的发展个体独特性的发展阐述上面九个方面时,同样需要把握实践对它们的内涵进行阐述。
2. 简述教师评价的方法,并重点论述如何处理不同评价方法之间的关系。
【答题要点】:教师评价方法包括:(1)教师自评(2)学生评教(3)同行评议(4)观察与会谈(需阐明每种评价方法的具体含义、优势等以及如何处理不同评价方法之间的关系)1. 信度的定义信度,简单地说就是测量结果的可信程度,指的是测量结果的稳定性或一致性程度。
2. 信度的估算方法(一)重测信度重测信度也叫稳定性系数,指的是用同一个量表,对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。
(二)复本信度复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
(三)同质性信度同质性信度也叫内部一致性信度指测验内部所有题目间的一致性程度。
题目间的一致性有两层意思:其一是指所有题目测的是同一种心理特质;其二是指所有题目得分之间都具有较高的正相关。
(1)分半测验指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
反映了测验内两半题目间的一致性。
用斯皮尔曼—布朗公式加以校正。
(2)库德—理查逊信度适合于测验题目全部为二分计分题。
两种公式。
(3)克龙巴赫系数当测验题型较多,并且都是二分计分题时,估计测验信度可采用克龙巴赫系数。
(4)荷伊特信度1941年提出用方差分量比来估计测验内部一致性的方法。
(四)评分者的信度定义:指的是多个评分者给同一批被试的答卷进行评分的一致性程度3. 提高测验信度的方法(1)适当增加测验题目的数量(2)测验的难度要适中(3)测验的内容应尽量同质(4)测验的程序应统一(5)测验的时间要充分(6)评分要尽量做到客观化、减少评分误差(7)应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。
引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。
4. 效度的定义效度(validity)指的是一个测验或量表实际能测出其所要测量的特性的程度,记为rxy。
顾名思义,效度就是一次测量的有效程度。
效度分为:内容效度、效标关联效度和结构效度。
5. 内容效度、效标关联效度和结构效度(1)内容效度内容效度是指测验目的代表所欲测量的内容和引起预期反应所达到的程度。
也就是测量内容的代表性程度。
在编制测验时,内容效度是一个相当复杂和不易解决的问题。
以成绩测验来说,固然要求测验题目能代表所学习过的全部内容,但仅仅在形式上做到这一点还不能保证足够的内容效度,因为学习成绩的高低要从学习内容的巩固程度、理解程度和应用能力几种行为反应去考察,如果测验题目大多是只需牢记教材就可以回答的问题,那么,对全面测验学生的成绩这一目的来说,内容效度仍然不够高,也就是说,还没有完全测验到所想测量的特性和功能。
(2)效标关联效度效标关联效度又可称为经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验的效度的高低的。
效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的变量,作为检定效度的参照尺度。
效标关联效度又可分为同时效度和预测效度。
同时效度是指测验与当前效标之间的关联程度;预测效度是指测验与将来的效标之间的关联程度。
例如,用全国高考的成绩作为效标来检验高中毕业会考的成绩,计算两者之间的相关系数就是会考的同时效度;而用大学一年级的成绩作为效标来检验高考的成绩,计算两者之间的相关系数就是高考的预测效度。
(3)结构效度所谓结构效度,是指一个测量能实际测量出理论上的构念或心理特性的程度。
它的目的在于用心理学的概念来说明分析测验分数的意义,也就是说从心理学的理论观点就测验的结果加以解释和探讨。
这里的结构的含义是心理学理论所涉及的抽象而属假设性的概念、特性或变量,如智力、焦虑、机械能力倾向、成就、动机等。
6. 提高效度的方法(1)控制系统误差(2)精心编制量表(3)规范测验程式(4)扩充样本的容量和代表性(5)合理处理效度和信度的关系(6)适当增加测验的长度7. 信度与效度的关系信度高是效度高的必要但非充分条件。
测验的效度受制于它的信度,即效度系数不会大于信度系数的平方根。
8. 难度难度指被试完成测验或量表时所遇到题目的难易程度记为P。
难度的计算(1)难度对测验的影响影响测验分数的分布状态。
影响测验的鉴别能力。
(2)影响题目难度的因素考查知识点的多少考查能力的复杂程度或层次的高低考生对题目的熟悉程度命题的技巧利用经验判断或者通过预测调整难度9. 区分度区分度指测验或量表题目区别被试水平能力的量度,记为D。
区分度的高低直接影响到测验的信度和效度。
具体关系如下:(1)提高区分度可以达到理想的测验信度;(2)难度适中,可使区分度达到最大值。
区分度的计算(1)相关法。
区分度的实质是题分与总分的相关。
计算方法:点双列相关系数(适应用于0\1计分的题目或二分变量,总分是连续变量)二列相关系数(适用于两个变量都是正态连续变量,但其中一个变量被人为分为两类)积差相关系数(适应于非二分变量项目)(2)高低分组法。
1. 确定评价指标的方法提出初拟评价指标的方法主要有以下几种:(1)头脑风暴法:利用头脑积极思维,进行智力碰撞,激发智慧灵感,从而提出评价指标。
根据人数的多少,可分为个人头脑风暴法和多人头脑风暴法。
还可以分为直接头脑风暴法和质疑头脑风暴法。
直接头脑风暴法是指按照统一要求从正面论述自己的观点;质疑头脑风暴法是连续召开两个会议,第一个会议按直接头脑风暴法要求进行讨论,而第二个会议则对第一个会议提出的指标进行质疑。
(2)因素分解法:将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标。
分解出来的因素,从高到低逐层次缩小内涵,越往下层次的指标越明确、越具体、范围越小、越可以观测。