20世纪教育测量学发展的回顾与现状评析(张敏强)

合集下载

教育测量与评价的发展历史

教育测量与评价的发展历史教育测量与评价作为一门学科，其发展历史可以追溯到古代。

在古代，教育测量与评价的目的是为了评估学生的学习成果，帮助教师了解学生的学习情况，以便更好地教学。

然而，在古代教育测量与评价的方法相对简单，主要是通过口试和答题来评估学生的学习成绩。

随着教育的进步和发展，教育测量与评价的研究逐渐深入，并形成了一套完整的理论体系和研究方法。

20世纪初，教育心理学家开始研究教育测量与评价的基本原理和方法。

他们提出了许多经典的测量理论，如克鲁格-卡尔巴赫理论和检验理论。

这些理论不仅为教育测量与评价的研究提供了理论支持，而且在实践中也产生了重要的影响。

在20世纪中叶，随着计算机技术的进步，教育测量与评价研究进入了一个崭新的时代。

计算机辅助测量技术的应用使得测量工作更加高效和精确。

研究者可以使用计算机自动生成试题、收集数据和分析结果，大大提高了工作效率。

此外，计算机辅助测量技术还可以实现个性化评价，根据学生的特点和需求，为其量身定制学习计划和教育资源。

近年来，教育测量与评价的研究逐渐与教育改革相结合，成为教育改革的重要组成部分。

教育测量与评价被广泛运用于学校教育、职业培训、人才选拔和教育政策制定等领域。

通过科学准确的测量和评价，可以全面了解学生的学习情况、能力水平和发展潜力，为教育决策提供依据。

同时，教育测量与评价也促进了教学的改进和创新，帮助教师更好地了解学生的学习需求，因材施教，提高教学质量。

然而，教育测量与评价也面临着一些挑战。

例如，如何选择合适的测量工具和评价方法，如何在不同文化背景下进行有效评价，如何解决测试的难度和容易度的不同等等。

这些问题需要教育测量与评价研究者深入探讨，并寻找合适的解决方案。

综上所述，教育测量与评价作为一门学科，其发展历史丰富多样。

从古代简单的口试和答题，到现代复杂的测量理论和计算机辅助测量技术，教育测量与评价不断推动教育的发展和改革。

希望未来的教育测量与评价研究者能够继续探索创新，为教育事业做出更大的贡献。

教育测量与评价(第二版)课件：现代教育测量与评价的发展趋势

四、经典测验理论与现代测验理论的比较
• 参数稳定性 • 能力的比较 • 平行复本 • 预测力 • 测量标准误
五、现代教育测量与评价的发展趋势
• 教育测量与评价的政治性得到加强 • 教育测量与评价的教育功能得到强化 • 教育测量与评价的理论研究得到突破性进
展
—完—
潜在特质理论
• 研究潜在特质的目的：探清结构和性质，将其量化；测量个体特质变量值，预测个体行为
• 测量单维定义：如果制约某种任务行为的空间既是一维的，又是完备的，则称这一任务行为的测量具有单维性。单维IRT模型是最为人们熟悉的。
项目特征曲线
• 原理：编制质量良好的试题，随着被试水平的提高，其正确作答的概率会越来越大。
• 与经典测量理论项目特征曲线的区别
– 经典测量理论Байду номын сангаас目特征曲线实质：被试正确作答概率对测验总分的回归曲线。
• 项目反应理论的优点
– 题目难易度的估计不因样本的不同而不同； – 考生能力的估计不因测验的改变而改变； – 测量误差的估计因考生程度不同而不同；
– 为多种形式测验的实施提供了更为完美的理论和方法
• 项目反应理论的主要局限性
– 对数学模型与实测数据的拟合要求较高； – 题目反应理论的一维性假设是一个强假设。
• 我国教育工作者在使用过程和实践中不断形成和完善了一套适合国情的具体应用方法和应用原则
二、经典测量理论的主要局限性
• 通过统计方法得到的各项指标依赖于特定的被试样本，求得的参数会受到不同样本组能力水平的影响；
• 无法建立考生得分与测验题目参数之间的函数关系；
• 两个重要的假设条件（严格平行测验和误差，与真分数不相关）在实际操作中难以做到。

我国工程测量技术发展现状与成就

我国工程测量技术发展现状与成就工程测量技术是现代化社会基础设施建设的重要保障，其水平和质量直接关系到国家经济发展和社会稳定。

随着我国经济的高速发展和城市化进程的加速，工程测量技术在基础设施建设、房地产开发、交通运输、资源管理等方面发挥越来越重要的作用。

本文将从我国工程测量技术发展的现状和成就两个方面进行阐述。

在全球范围内，工程测量技术一直是技术革新和进步的重要方向。

在我国，自20世纪初引进西方测绘技术以来，我国工程测量技术得到了快速发展。

随着综合国力和科技实力的不断提升，我国工程测量技术的发展水平日益提高，国内测绘科技取得了诸多成果。

1. 数字化测绘技术的发展与应用数字化测绘技术是当前国际上测绘技术的主流。

我国在这方面也开展了一系列的技术研究，逐步掌握了数字地形数据获取、处理、分析和应用的核心技术，促进了测绘技术的数字化转型和产业升级。

数字化应用广泛，如在城市建设、环境监控、资源调查、军事防卫、地震预警等方面已经得到广泛的应用。

2. 遥感技术的高度发展和应用我国在遥感技术的研究和应用方面也取得了突破性进展。

自20世纪60年代以来，我国一直在探索遥感技术的应用，先后在土地利用、水资源管理、林业、城市规划、海岸带开发等方面进行了广泛应用。

尤其是进入21世纪以来，卫星遥感测绘技术已经得到广泛应用，已经成为了国家地理信息资源公共服务体系建设的重要工具。

3. 工程测量在基础设施建设领域的应用近年来，我国基础设施建设蓬勃发展，工程测量技术也有了巨大进展。

特别是高速公路、高铁、机场、港口等基础设施建设，需要大量精细的工程测量工作。

我国工程测量技术在这些领域的应用已经达到国际领先水平。

4. 测量数据融合技术的应用在大数据时代，测量数据融合技术越来越受到重视，我国也在这方面展开了研究和应用。

例如，将不同测量方法的数据进行融合处理可以有效提高数据的准确度和可靠性。

在许多工程测绘应用中，这种方法已经得到很好的应用。

我国在工程测量技术方面取得了很多值得骄傲的成果，这些成就不仅为国家建设起到了重要作用，同时也在国际上获得了广泛的认可。

教育测量与评价(第二版)课件：教育测量与评价的学科发展

• 教育评价
概念：按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统地收集资料信息，对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。
内涵：
（1）强调以教育目标为标准的价值判断过程；
（2）强调用多种方法（测量和非测量）系统收集资料与信息；
教育测量与评价的学科发展
本章内容
• 教育测量与评价的概念与内涵 • 教育测量与评价的发展历史 • 教育测量与评价的学科地位和作用
一、概念与内涵
• 测量与教育测量
• 测量的含义：根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程。
• 测量的要素
• 量具 • 测量单位 • 参照点
（4）特点：
力、实践能力、创造能力……
教育测量是精神特性的测量，涉及学生德育、智育、体育、美育、劳动技能及个性、心理素质等许多方面
• 评价（evaluation）与教育评价
• 评价
（1）衡量、判断人物或事物的价值；
（2）一种划定、获取和提供叙述性和判断性信息的过程；
（3）对某些现象的价值如优缺点的系统调查，是为教育政策提供依据的过程；
• 教育测量与评价在教育改革中的作用
• 教育改革常以教育测量与评价的改革作为突破口 • 考试与评价改革成为基础教育改革的重要内容
• 教育测量与评价是教师的专业素养和能力
• 正确评价学生的发展是教师职业能力的重要组成部分 • 国外教师教育普遍开设“教育测量与评价”类课程
—完—
• 量表（scale）：确定了测量单位与参照点并具有取值系统的测量工具
二、发展历史
（一）我国考试制度的演变
– 西周：考试制度初见端倪

教育测量与评价的学科发展

教育测量与评价的学科发展
• 教育测量与评价的概述 • 教育测量与评价的理论基础 • 教育测量与评价的方法和技术 • 教育测量与评价的实践应用 • 教育测量与评价的未来发展 • 教育测量与评价的挑战与对策
01
教育测量与评价的概述
定义与目的
定义
教育测量与评价是一门研究如何量化评估教育领域表现和成就的学科。它运用数学和统计方法，对教育活动、教育过程和教育结果进行定量描述和评估。
评价指标应涵盖学生的知识、技能、态度等多个方面，以确保全面、客观地评价学生的表现。
数据安全与隐私保护
加强数据安全防护
通过采用加密技术、权限控制等手段，确保教育测量与评价数据的安全性和保密性。
保护学生隐私
在收集和处理学生个人信息时，应严格遵守相关法律法规，确保学生的隐私权益得到充分保护。
THANKS
01
创新评价方法
借鉴其他领域的方法和技术，创新教育评价方法，提高教育评价的科学性和有效性。
02
03
培养跨学科人才
加强跨学科人才培养，培养具备多学科背景和创新能力的高素质人才，推动教育测量与评价的持续发展。
06
教育测量与评价的挑战与对策
信度与效度问题
信度问题
信度是指测量的一致性，由于教育环境的复杂性和动态性，教育测量工具的信度往往难以保证。为解决这一问题，需要定期对测量工具进行校准和修订，确保其一致性和稳定性。
格的标准和程序。
教育评价理论
评价目的的明确性
教育评价旨在促进学生的学习和发展，提高教育质量，评价目标应明确、具体。
评价标准的制定
制定科学、合理的评价标准是教育评价的关键，标准应反映教育目标和教育价值观。

20世纪90年代至今我国教育实验研究方法的回顾与反思

20世纪90年代至今我国教育实验研究方法的回顾与反思【摘要】20世纪90年代至今，我国教育实验研究方法经历了持续发展和创新。

在此过程中，受到多方面因素的影响，面临着一系列问题和挑战。

但也不断有方法的创新与应用，以及成功的案例分析。

通过对这些内容的回顾与反思，我们可以更好地总结经验教训，展望未来发展方向。

本文旨在探讨20世纪90年代至今我国教育实验研究方法的历程和现状，分析影响因素，挑战和问题，并重点关注方法创新以及案例分析。

通过这些内容的论述，旨在为未来教育实验研究提供借鉴和启示。

【关键词】教育实验研究方法、20世纪90年代、回顾、反思、影响因素、问题、挑战、方法创新、案例分析、总结、展望未来1. 引言1.1 背景介绍20世纪90年代至今，我国教育实验研究方法经历了持续不断的发展和改进。

随着教育领域的不断进步和需求的不断增长，教育实验研究方法也逐渐受到重视。

教育实验研究方法的不断完善与创新，为教育领域提供了更多的可能性和选择。

在这个时期，我国的教育实验研究方法逐渐从传统的文献研究和调查研究转向实证研究和定量研究，注重数据的收集和分析，倡导科学化与客观化的研究方法。

教育实验研究方法也逐渐融入新技术、新工具的应用，提高了研究效率和质量。

随着社会的快速变化和教育的不断改革，教育实验研究方法也面临着新的挑战和问题。

对于教育实验研究方法的回顾与反思具有重要的意义，有助于总结经验、发现问题、探索解决之道，为未来的发展提供借鉴和指导。

1.2 研究目的研究目的是对我国教育实验研究方法在20世纪90年代至今的发展历程进行全面回顾和深入分析，以揭示其在不同阶段的变化和演进，探讨其存在的问题和挑战，总结方法创新与应用的经验和启示，以及通过案例分析展示具体实践情况。

通过对这些内容的系统研究与总结，我们旨在全面了解我国教育实验研究方法的发展路径和实践特点，为今后的教育实验研究工作提供借鉴和参考，促进我国教育实验研究的进一步发展和提升。

现代教育测量与评价的发展趋势

现代教育测量与评价的发展趋势随着社会的快速发展和教育的不断改革，教育测量与评价作为教育领域的重要组成部分也在不断发展。

本文将探讨现代教育测量与评价的发展趋势，并分析其对教育的影响。

现代教育测量与评价趋向多样化。

传统的教育测量主要依赖于考试和测验，但这种方式在评估学生知识和能力方面存在局限性。

现代教育测量与评价不仅关注学生的学科知识，还注重培养学生的综合能力和素质。

因此，现代教育测量与评价的形式也更加多样化，包括项目作业、实践考核、口头表达等，以全面了解学生的学习状况和能力水平。

现代教育测量与评价趋向个性化。

每个学生都有自己的学习特点和发展需求，因此，个性化评价成为现代教育的重要趋势。

个性化评价可以更好地满足学生的学习需求，发现并发挥每个学生的潜能。

通过采用不同的评价方式和工具，教师可以更准确地了解学生的学习进展，并根据学生的实际情况进行针对性的教学。

第三，现代教育测量与评价趋向综合性。

传统的教育测量主要关注学生的学科知识，而现代教育测量与评价更加注重学生的综合素养和能力发展。

综合性评价不仅考察学生的学科知识，还包括学生的创新能力、实践能力、沟通能力等。

这种综合性评价可以更全面地了解学生的发展状况，促进学生的全面发展。

第四，现代教育测量与评价趋向科技化。

随着科技的迅猛发展，教育测量与评价也逐渐运用科技手段进行创新。

例如，通过在线测评、电子作业等方式，可以更快速、准确地获取学生的学习数据。

同时，人工智能技术的应用也为教育测量与评价提供了更多可能性。

通过人工智能技术，可以对学生的学习数据进行深度分析，为教师提供更具针对性的教学建议。

现代教育测量与评价趋向公正性。

传统的教育测量与评价存在一些公平性问题，例如评价标准的主观性和评分者的个人偏见等。

现代教育测量与评价更加注重公正性，通过建立科学的评价标准和规范化的评分程序，减少主观因素的影响，确保评价结果的客观性和公正性。

现代教育测量与评价的发展趋势呈现出多样化、个性化、综合性、科技化和公正性等特点。

测量技术的发展历史和现状

浅谈测量技术的发展历史和现状摘要：测量技术的发展也同其他技术一样，由原始的、落后的方式，经漫长的人类社会发展历程，一步步的发展起来。

生产力的发展促进了测量科学的发展，同时测量技术的应用又为生产力的发展创造了条件，最终服务于科学研究、国防建设和国民经济建设。

关键词：测量技术；发展历史；现状；高新技术1 引言科学的产生和发展是由生产力决定的。

测量科学也不例外，它是人类长期以来在生产、生活方面与自然斗争的结晶。

测量技术的发展也经历了一个长期的、艰难的历程，且至今仍处在不断发展之中。

本文主要对这一历程进行了总结概述。

2 测量技术的发展历史2.1 地图测绘方面目前见于记载最早的古地图是西周初年的洛邑城址附近的地形图。

战国时管仲著有《管子》一书，书中第十卷专门论述了地图的重要用途和内容。

但遗憾的是，秦代以前的古地图都已失传。

长沙马王堆三号墓出土的公元前168年陪葬的古长沙国驻军图和地形图是现在能见到的最早的古地图。

图上有军事要素、道路、河流、山脉和居民地等。

西晋时裴秀编制了《方丈图》和《禹贡地域图》，并创立了《制图六体》的地图编制理论。

此后，历代都编制过各种地图，如明代郑和下西洋绘制的《郑和航海图》；清代康熙年间绘制的《皇舆全览图》；1934年，上海申报馆出版的《中华民国新地图》等。

在我国历史上，能绘制出如此水平的地图，与测量技术的发展是密切相关的。

我国古代测量长度的工具有记里鼓车、步车、测绳和丈杆等。

测量高程的工具仪器有水平(相当于现在的水准仪)和矩。

测量方向的仪器有指南针和望筒。

测量技术的发展离不开数理知识的支撑。

公元前问世的《九章算术》和《周髀算经》都记载有利用相似三角原理进行测量的知识。

之后，三国时期刘徽所著的《海岛算经》，介绍了利用丈杆进行两次、三次甚至多次测量的方法求解河宽、山高的实例，极大地推动了我国测量技术的发展。

2.2 研究地球大小和形状方面早在公元前就已经有人提出通过丈量子午线上的弧长来推断地球大小和形状的方法。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

２０世纪教育测量学发展的回顾与现状评析(张敏强)作者：张敏强主题类号：G1教育学【文献号】1-629 【原文出处】教育研究【原刊地名】京【原刊期号】199911【原刊页号】32～37【分类号】G1【分类名】教育学【复印期号】200001【标题】２０世纪教育测量学发展的回顾与现状评析【作者】张敏强【作者简介】张敏强，中山大学高教所所长、教授。

广州510275【正文】20世纪是教育测量学兴起并得到迅速发展的世纪。

在理论上，经典测量理论不断得到完善，现代测量理论亦得以发展。

在应用上，由于计算工具的飞速发展，使教育测量学的应用上了更高的层次并拓展至各个领域，反过来又促进了理论的研究和发展。

本文对本世纪教育测量学的发展作了回顾，并对现状作出评析。

一、教育测量学简史教育测量学是在本世纪二三十年代兴起、四五十年代定型、六七十年代迅速发展起来的一门教育学科。

回顾与展望教育测量学的历史，可以使我们进一步了解和确认教育测量产生与发展的历史必然性和合理性。

作为教育测量的基本形式的考试和测验最早可以追朔到隋炀帝大业二年（公元606年）的科举制。

科举制的特征是：逐级考试选拔人才；制度相当完备，考场规定相当严格；有一套命题、保密、封存、评卷的措施及违者的处罚规定。

科举制在唐朝极盛，所用的方法有口试、贴经、墨义、策问、诗赋等五种。

宋、元、明、清各朝基本沿袭了科举制，至清末，程式严格的八股文成了经义考试的主要形式，使考试成了僵死的东西，科举制由此走向衰败。

19世纪末20世纪初，实验心理学和心理测验的发展推动了教育测量的发展。

1904年，被誉为教育测量之鼻祖的美国心理学家桑代克，出版了《心理与社会测量（Mental and Social Measurements）》一书，该书首次系统介绍了统计方法和编制测验的基本原理。

教育测量的客观化、标准化问题受到了极大的重视，教育测量由此走上科学化的道路。

1909年桑代克又用统计学上的“等距原理”编制了首批标准化的教育测检量表，如《书法量表》、《拼字量表》、《作文量表》等。

从1909年到1915年，教育测验逐渐增多，并且从单独的学科测验扩展至综合测验的编制，即由几种主要学科的测验组合而成。

同时，教育测验不再限于小学的学科测验，中等学校以上的各科测验大都一一编制出来。

不仅学科测验有了发展，诊断测验和练习测验也陆续有所编制。

当时在西方已兴起利用教育测量进行教育调查研究的风气。

辛亥革命后，教育测量学随着西方的科学技术被引进我国。

1918年，俞子夷根据桑代克《书法量表》的编制程序，编制了《小学国文毛笔书法量表》，开我国教育测量编制的先河。

1919年，廖世承和陈鹤琴在南京高等师范学校讲授测验，为我国高校设置测验课程之始。

1922年，美国测验学专家麦柯尔（McCall,W.A. ）应中华教育改进社之邀来华讲学，并主持编制各种应用测验。

至1925年前后，编成的中小学教育测验不下几十种，例如廖世承的《中学国文常识测验》、《中学文法测验》，陈鹤琴的《小学默读测验》、《小学文法测验》等。

1931年中国教育测验学会在南京成立，1932年《测验》杂志创刊。

1935年，中央大学教育学院编制了《小学国语默读测验》、《小学算术测验》、《小学中年级常识测验》等。

抗日战争爆发后，中央大学西迁重庆，艾伟组织与指导中央大学一些师生继续编制教育测验，如《中学语文理解力量表与汉字测验》等。

同时，我国一些从事教育测量研究和教学的学者，出版了有关专著和教材，如孟宪承的《测验之学理研究》、王征葵的《态度测验法》、沈有乾的《心理与测验》等。

全国各高校教育学系和中等师范学校开设了教育测量或心理与教育测量的课程。

1949年到1978年之间的30年，由于受原苏联教育理论的影响，教育测量学遭到否定。

自从1978年党的十一届三中全会召开以后，教育和心理测量重新开始受到重视。

张术祖在《教育研究》1979年第5 期发表了《论教育测量的重要性和教育测量的一些基本概念》，被认为是建议恢复教育测量学研究和教学的第一篇论文。

1982年，在叶佩华等的主持下，翻译了桑代克、哈根合著的《心理与教育的测验和评价（Measurement and Evaluation in Psychology and Education）》（1977年版），这是自1979年以来的第一本有影响的教育测量译著。

随后，教育测量学被列为高校教育系的必修课。

1988年，经中国教育学会批准，中国教育学会教育统计与测量研究会正式成立，由张厚粲任第一届理事长，叶佩华任名誉理事长。

在研究会成立以后，多次举办高层次的讲习班。

研究会的部分会员自1985年以来积极参加全国高考标准化改革实验，在全国高考命题标准化、施测标准化、评卷记分标准化、分数报告标准化等方面的策划和实践中作出了积极的贡献。

在上述这段时间，除教材以外，还出版了不少教育测量学方面的论著，如张厚粲等的《标准化考试简介》、桂诗春的《标准化考试的理论与实践》、张敏强等的《标准化考试》、郑日昌等的《教育测量学的基础》等等。

这些论著的出版及高考标准化改革实验的成功，加上舆论的支持，在全国真正打开了宣传教育测量学、重视教育测量学的新局面。

1988 年，我国正式加入国际教育成就评价协会（InternationalAssociation for Educational Assessment, IAEA）。

可以说，1979年以来的20年中，我国的教育测量学的教学与研究工作者以优良的成绩，使教育测量学在教育科学领域中占据了重要的一席。

二、教育测量学基本理论与方法的评析下面对20世纪主要的教育测量理论：经典测量理论与题目反应理论作出比较与评析。

（一）经典测量理论的优点与不足经典测量理论经过几十年的发展，形成了以真分数理论作为其理论基础，并具有完善、可操作的对题目和测验进行统计分析的方法。

经典测量理论的优点在于：（1）以弱假设作为理论基础。

这些弱假设条件容易被绝大多数测验数据资料所满足。

所以，从实用的意义上说，其应用具有广泛性。

（2）具有明了简单的统计分析方法，且这些统计分析方法都有数学上的实际意义，易于掌握和理解。

（3 ）我国教育测量工作者对经典测量理论及方法有深刻的认识，其应用具有基础性。

其不足之处有：（1 ）经典测量理论的方法所求得的题目参数（如题目难度、题目区分度）会受到不同考生样本组能力水平的影响。

所以，选取的考生样本不同，就有可能得出不同的题目难度和题目区分度，故在考生样本选取方面要做到非常精确有一定的困难。

（2 ）在经典测量理论的条件下，题目参数与考生得分量是在不同的基础上分别求得的，所以无法建立考生得分与测验题目参数之间的函数关系，即考生能力的估计会由于测验的改变而改变。

（3 ）经典测量理论中有两个重要的假设条件，即严格的平行测验和测验误差与真分数相关为零，这在实际操作中是难以做到的。

（二）经典测量理论的质量评估测量工具决定着测量结果的准确性。

所以，良好的测验也决定着测量结果的准确度，评价一份测验的优良性，主要有以下内容。

1.效度。

它是指测验是否测出了所要测的东西。

效度分为：（1 ）内容效度，即测验的题目与内容是否与教学内容与目的相适应。

（2 ）构想效度，即测验的分数是否达到了某一预想的特质。

（3 ）效标关联效度，用测验所得分数与标准测验所得的分数的相关来制定这次测验的效度，称之为效标关联效度，而标准测验则被称之为“效标”，在此起到预测作用。

2.信度。

信度是反映测量的一致性程度的指标。

计算信度的方法主要有：（1）再测信度，即对同一被试总体进行重复测量而得到的两组数据，以相关系数的大小表示一致性程度，相关系数高，则说明信度高。

（2）复本信度，即建立两个在内容、质量各方面都相等的测验，并对实施后的两个测验分数求相关。

（3）分半信度，把一个测验分为质量相等的两部分，求这两部分所得的分数的相关。

要提高信度，可以加长测验。

但信度是效度的必要条件，而不是充分条件，即信度低，效度不可能高，但信度高，效度不一定高。

3.区分度。

区分度是测验题目对被试者能力高低的鉴别能力。

不同的测验要求有不同的区分度指标，如高考对区分度的要求就比中学会考高。

4.难度。

难度是指测验题目的难易程度。

显然，难度大，通过率低；难度小，通过率高。

难度指标的高低直接影响到区分度指标，因为难度太大或太小，都将使题目的鉴别能力受到影响。

（三）经典测量理论的评价工具评价是把测验结果放在一定的参照标准上来评定其高低、优劣。

评价工具是按参照标准编制出来的，评价工具也与物理测量的量具同理，须具备以下的要素。

（1）参照点。

这是计算的起点，参照点不同，测量结果就会因其所代表的意义不同而无法进行比较。

（2）单位。

这是测量的基本要求。

教育测量也须有相应的单位，但教育测量的单位却往往不等距或等距不等值。

比如，在同一数学测验上，两考生分别得100分与80分，另两考生分别得70分与50分，分数差相等但却不能认为差距相同。

教育测量的评价工具所参照的标准，主要有以下两种。

（1 ）标准参照测验。

标准参照测验是以被试对测验目标或内容的掌握程度作为标准。

按照参照标准的不同，可将标准参照测验的分数分为两种：1 ）内容参照分数。

这种分数是依据被试对某个确定的内容或技能的掌握和熟悉程度来表示的，因而，建立内容参照分数的前提是测验内容范围的确定；2）结果参照分数。

用效标行为的标准来解释测验分数，称为结果参照分数。

由此可知，标准参照测验是一种使用广泛的测验形式，如会考、课程考试等等。

（2）常模参照测验。

这是以全体考生在某一大规模测验中所得到的成绩分布为标准，衡量被试在这一测验上所得到的成绩在全体成绩分布中所处的地位。

因而，将被试在这类测验上所得到的分数作单独解释是毫无意义的，只能将它放在被试团体中作比较。

这个团体的分布则称为模团体，而对常模参照测验的测验分数作解释的参照则称为常模。

（四）题目反应理论的评析题目反应理论是现代测量理论中最具代表性的一种。

题目反应理论是建立在潜在特质理论基础之上的。

题目反应理论认为，潜在特质指的是所要测的内在能力，定量地估计个体在每一种特质上的位置是心理测验的任务。

但是，由于心理特质的潜在性，心理学家只能依据可观测变量来鉴别和定义这些特质，并希望能探明：哪些特质所起的作用是重要的，哪些特质对人的行为发展产生重大影响，等等。

题目反应理论的最大特点就是它找到了一条题目特征曲线（ItemCharactteristic Curve简称ICC），并且以多种数学表达式（或数学模型）来描述它和逼近它。

题目特征曲线的数学模型一般都包含两个方面的参数：（1）对测验题目的特征进行刻画的题目参数；（2）对考生的特征进行刻画的潜在特质或称为能力参数。