基础教育中学业测评的测量学取向

合集下载

2024年《测量学》学习心得(二篇)

2024年《测量学》学习心得在2024年的测量学课程中, 我深深地感受到了测量学的重要性和广泛应用的范围。

通过课程的学习, 我不仅理解了测量学的基本概念和原理, 还学会了如何进行测量、如何处理误差以及如何分析测量数据。

下面是我对这门课程的学习心得, 总结了我在测量学方面的收获和体会。

首先, 在课程中我学习了测量学的基本概念和原理。

测量学是研究测量对象的空间位置、方向、形状和大小等性质的科学, 它主要研究测量的目的、方法和结果的准确性。

通过学习测量学, 我了解到测量学在各个领域都有着广泛的应用, 如地理信息系统、工程测量、建筑测量等。

同时, 我也了解到测量学的本质是确定和表示测量对象的属性, 并通过这些属性来比较和评估不同对象之间的差异。

其次, 在测量学的学习过程中, 我掌握了测量的基本方法和技术。

课程中, 我学习了测量的种类和分类, 如直接测量和间接测量、绝对测量和相对测量等。

我还学习了测量仪器的使用方法和技巧, 如经纬仪、水准仪、全站仪等。

通过实际操作和练习, 我熟练掌握了这些测量仪器的使用方法, 并且能够灵活运用于实际测量中。

此外, 我在测量学课程中还学习了测量数据的处理和分析方法。

测量数据的处理和分析是测量学中非常重要的一部分, 它能够帮助我们准确、可靠地获取测量结果。

在课程中, 我学习了误差的来源和分类, 以及误差的传递和传播规律。

我还学习了对测量数据进行处理的方法, 包括求平均值、标准偏差、置信度等。

通过学习这些方法, 我能够对测量数据进行准确、科学的分析, 得到可靠的测量结果。

最后, 在测量学的学习中, 我也深刻认识到了测量的重要性。

测量是现代科学技术的基础, 它不仅在科学研究中起着重要作用, 也广泛应用于工程和生活中。

测量能够帮助我们了解和认识客观世界, 为科学研究和工程设计提供准确的数据和依据。

同时, 测量也能够提高生产效率和质量, 为各个领域的发展做出贡献。

综上所述, 通过《测量学》课程的学习, 我深入了解了测量学的基本概念和原理, 掌握了测量的基本方法和技术, 学会了测量数据的处理和分析方法。

第十一章学习结果的测量与评定

第十一章学习结果的测量与评定第一节概述众所周知，学生在学校里的学习效果以及他们的智力水平和个性特征等诸方面的情况，都需通过测量来进行评定。

只有运用科学的方法去进行测量，才能了解是否真正达到了预定的教学目标，才能了解学生的学习结果及其心理发展的水平，并明确教学中存在的问题，以便今后合理地组织学生进行新的学习，进一步激发他们的学习动机。

因此，测量与评定作为一种手段是学校教育过程中不可缺少的一个重要环节。

一、什么是学习测量与评定(一)什么是测量和测验测量是用数学方式对人的行为的描述。

教学过程中的测量是用数学的方式对学生学习行为的描述，主要是借助于测验来进行。

测验是通过一系列的科学程序(如编制题目、施测和评分等)对学生某一方面的学习行为进行测量。

例如，给一个学生班一项100个题目的测验，其中一位学生得了70分，他的测验分数就是一种测量，也就是对于他的作业水平的一种描述。

(二)什么是评定教学过程中的评定是根据一定的标准对学生的学习行为进行估价的过程。

例如，前例中的那一位得了70分，家长问教师他属于哪一个等级，教师说70分是乙等，这就是给这位学生的一个评定。

可见，评定与测量有密切关系，但也有区别。

评定是在测量的基础上作出的，测量是—种客观的描述，评定是一种主观的判断，但主观判断要以客观描述为依据，否则主观判断就是武断的判断。

二、学习测量和评定的主要功能(一)诊断功能测量和评定不但可以用来了解与评价学生的学习及智力发展水平，还可用来评价教师的教学，评价一个班级、一所学校或一个地区的教育、教学质量；不仅可以作跨区域的横向比较，还可作跨年代的纵向分析。

但在学校中，教师更多的是通过测量的评定来了解每个学生的学习状况，分辨优劣，诊断学生在知识掌握和能力发展上的不足及问题所在，以便因材施教和个别指导。

(二)反馈与鞭策功能测量与评定的反馈和鞭策功能可以从教与学这两个方面体现出来。

1．为教师的教学提供反馈信息教师总是以测验为工具并通过评定从中分析自己的教学与学生的学习情况，以达到改进教学的目的。

教育学专业教育测量学研究

教育学专业教育测量学研究教育测量学属于教育学专业的一门重要学科，主要研究教育领域中的测量技术、测验设计和评估方法。

它的研究对象包括学生的学习成果、教师的教学水平以及课程和学校的效果评估等。

本文将探讨教育学专业中教育测量学的研究内容和方法。

一、研究内容教育测量学的研究内容主要包括测量理论、测验设计、评价方法和教育数据分析等方面。

1. 测量理论测量理论是教育测量学的基础和核心内容，它研究如何通过测量来获取可靠和有效的信息。

测量理论涉及测量的基本概念、测量属性的分类和测量尺度的建立等。

在教育领域中，测量理论被广泛应用于考试和评估中，帮助评估学生的学习成果以及教育质量。

2. 测验设计测验设计是教育测量学的重要内容之一，它涉及测验的出题原则、试题类型和题目难度等。

合理的测验设计可以有效地反映学生的学习水平和能力，提供可靠的测量结果。

在测验设计中，研究者需要考虑到测验的目的、受试者特点和评分方法等因素，以保证测验的信度和效度。

3. 评价方法评价方法是教育测量学的重要研究内容之一，它涉及教育活动、教学过程和教学效果的评估。

常用的评价方法包括观察法、问卷调查法和考试测验法等。

研究者通过运用不同的评价方法，可以对教育活动进行全面和客观的评估，提供有针对性的改进意见。

4. 教育数据分析教育数据分析是教育测量学的重要研究方法之一，它通过运用统计学和量化研究方法对教育数据进行分析，得出相关结论。

教育数据分析可以帮助研究者理解教育现象、发现规律和探索解决方法，为教育改革和决策提供科学依据。

二、研究方法教育测量学的研究方法主要包括实证研究、实验研究和问卷调查等。

1. 实证研究实证研究是教育测量学中常用的研究方法之一，它通过搜集大量的数据，并进行统计分析和模型构建，来验证或推翻研究假设。

实证研究通常采用定量研究方法，使用科学的数据收集和分析工具，如问卷调查和统计分析软件等。

2. 实验研究实验研究是教育测量学中用于探究因果关系的重要方法之一，它通常采用实验组和对照组比较的方式，通过人为的实验操作来研究教育活动对学习成果的影响。

基础教育质量监测与评价的测量工具研究

基础教育质量监测与评价的测量工具研究基础教育质量监测与评价是指对教育系统中各个层次的基础教育质量进行定期监测和评价的一项工作。

在此过程中，测量工具起着至关重要的作用，它用于收集学生、教师、学校、家庭等各个层面的数据，以评估教育质量的现状和趋势。

测量工具的研究是为了确保测量工具的有效性和可靠性。

在研究中需要关注以下几个方面：首先，测量工具的建立需要明确评价的目标。

教育质量是一个复杂的概念，需要将其细化为具体的评价指标。

这些指标可以包括学生成绩、学生的学习兴趣和动机、教师的教学能力、学校的师资力量和设施条件等。

通过对这些指标的量化测量，可以更好地评价教育质量的水平。

其次，测量工具的研究需要考虑到不同层次的测量对象。

基础教育质量的评价需要综合考虑学生、教师、学校和家庭等多个层次的因素。

因此，测量工具必须能够全面而准确地反映不同层次的情况，以便进行全面的评价。

第三，测量工具的研究需要关注工具的可靠性和有效性。

可靠性是指测量工具是否能够稳定地反映被测量对象的真实情况。

有效性是指测量工具是否能够准确地评价被测量对象的特征。

为了确保工具的可靠性和有效性，需要进行实证研究，通过对大样本的测试和验证,确定工具的稳定性和准确性。

最后，测量工具的研究还需要关注工具的实施和操作。

在实施测量工具时，需要培训测量工具的管理员，确保其正确使用工具并准确记录数据。

此外，还应建立完善的数据管理和存储体系，使得数据更加有效、安全、可靠。

同时，还需要制定相关政策和法规，明确测量工具的使用范围和目的，确保测量工具的正当合理使用。

总之，基础教育质量监测与评价的测量工具研究是一项复杂而重要的工作，需要充分考虑评价目标、测量对象、工具的可靠性和有效性以及实施和操作等因素。

只有通过科学的研究和实践，才能提高测量工具的质量，更好地评估基础教育质量的水平和趋势。

试论基础教育领域中教育测量与评价的理念问题分析

试论基础教育领域中教育测量与评价的理念问题分析作者：陆晓梅来源：《新课程学习·下》2013年第09期一、测量与评价在我国基础教育领域的研究现状1.小学阶段的研究如今，小升初已经取消了，基本上是按学区就近入学，仅在进入小学和小学毕业会组织一个简单的面试或笔试，这项举措在开始阶段的效果是不错的。

不让孩子输在起跑线上，很多家长在孩子还未出生时就开始早教，对所谓的“名校”越来越关注，学生学习成绩优秀的学校就是“名校”，这就迫使学校和老师片面地追求高分数、高效率。

2.初中阶段的研究初中阶段的招生虽然也是就近入学，但择“名校”现象使初中也面临“升学”的压力。

学校不再对成绩进行直接的排序，但家长仍关注升入重点高中的学生人数和比例，以此作为选择所谓“名校”的依据。

这是一种终结性评价，这样不利于学生、学校资源的平均分布，也使得一些学生由于转换到新的环境，需要调整很长一段时间。

3.高中阶段的研究随着近几年高校自主招生比例的上升，许多重点高中有意识地培养学生的综合素质，但他们选择的对象比较窄，往往是在实验班、重点班中选择，绝大部分学生还是传统高考大军中的一员，对他们来说，素质教育只是一句空话。

因此，老师和学校真正落实素质教育的就更少。

4.对教师的测量与评价改革开放以前的学生需要下乡劳动，在劳动实践中学习了许多实用的技能。

现在教育上级部门、家长、社会对教师的评价是，所带的班考了几个清华、北大？本科上线率多少？与同类学校相比怎么样？这种评价只重视教师教学的效果，或者说重视教师的教学能力，而不注重教师对学生综合能力的培养，更不注重老师采用什么样的方法，也不注重对于教师来说非常重要的、需要不断提升的专业素质。

二、学生的终身发展如何实现1.过程与结果的辩证关系过程与结果的辩证关系在很短的时间是显现不出来的，但是如果我们能坚持下去，每天进步一点点，在学习的低潮时想，这么困难的情况都能克服，那以后还有什么可怕的呢，在坚持到一定程度时，虽然量变引起质变的结果可能我们暂时不需要，但困难终归被你克服了，而即使失败了，谁能保证这不是一个新的开始，只要我们坚信，总有一天可以看到风雨之后的彩虹。

基础教育中学业测评的测量学取向

管我们打破了传统的统一教材一统天下的局面，制定『了访谈，确定了项目以及项目所占的权重，然后组成两套平行题本。根据题本通过小样本预试，用难度、区了一个共同的课程标准，但现行的考试制度还是抹不：分度的指标来筛选题目，最后确定正式施测题本。采去学业成就测验内容选择的主观色彩；四是学科专家ｆ
系统地收集学生在教学和自学的影响下认知行为上ｔ学生能力的发展。
的变化信息和证据，并对学生的知识和能力水平进行『
二、学业成就测评的经典测量学基础
价值判断的过程。它在教育中起着非常重要的作用。Ｉ经典测量理论（Ｃｌａｓｓｉｃａｌｔｅｓｔｔｈｅｏｒｙ，ｃｙｒ）起始于从微观的课堂教学活动来看，对学业成就的测量与评Ｉ２０世纪中叶之前，其主要特点是以真值理论为基础，价是一个重要环节，可以帮助老师了解学生的学习情Ｉ以信度、效度、难度和区分度为指标，它的基本假设是
和心理测量学专家之间的联系不够紧密，导致学科专ｆ取分层整群抽样，进行施测收集数据，分析数据，从而
对什么家在成就测评的实施过程中，缺乏心理测量学的理论根据数据分析的结果来评价学生学会了什么，是了解、知道、理解、应用［３１。指导，而心理测量学专家对学科知识和课程标准也吃｝
一
ｌ
自２００１年国家教育部提出课程改革以来，教育
、
当前学业成就测评所面临的技术难题
心理学工作者和学科专家在新课程下学业成就测评

教育学中的教育测量与评估

教育学中的教育测量与评估教育测量与评估是教育学中的重要领域，旨在通过科学的测量和评估方法，了解学生的学习成绩、能力和发展，并基于评估结果提供针对性的教育改进和教学指导。

本文将从测量与评估的定义、常见的测量方法、评估的目的与策略以及评估的挑战等方面阐述教育学中的教育测量与评估。

一、测量与评估的定义教育测量与评估是指通过收集、分析和解释有关学生学习和发展的信息，以便作出有关学生能力和知识水平的判断和决策的过程。

测量是指使用合适的工具和方法来收集和分析学习者的定量数据，如考试成绩、测试得分等；评估则是对学习者的整体学习情况进行综合性的判断和评价。

二、常见的测量方法1. 定量测量：通过数字化的方式来收集和分析学生的学习数据，如标准化考试、测试问卷等。

这种方法能够提供较为客观的学习结果，但其仅涵盖了学生的知识和技能层面。

2. 定性测量：通过观察和访谈等方式，采集学生的非数字化数据，如学习过程中的行为、态度和动机等。

这种方法能够更全面地了解学生的学习情况，但其评估结果较为主观，难以进行量化比较。

三、评估的目的与策略教育评估的目的是为了改进和提高教学质量，促进学生的学习成长。

在评估过程中，可以采取以下策略：1. 形ative评估：在学习过程中进行多次、连续性的评估，以提供及时的反馈和指导。

教师可以根据评估结果调整教学策略，帮助学生更好地学习和发展。

2. Summative评估：在学习结束后进行一次总结性的评估，通常采用考试或综合性评价的方式，以评估学生的综合能力和知识水平。

四、评估的挑战教育测量与评估也面临一些挑战，包括以下方面：1. 客观性与主观性的平衡：评估过程中需要平衡客观性和主观性，既要关注学生的定量数据，也要充分考虑学生的非数字化数据。

2. 标准化与个性化的兼顾：评估结果应该既考虑到学生的整体水平，又关注到学生的个体差异。

需要制定合理的评价标准，以保证评估公正性。

3. 多元化评估方式：评估应该采用多种方法和工具，以全面了解学生的学习情况。

教育学专业的教育测量学

教育学专业的教育测量学教育测量学是教育学专业中的一门重要课程，旨在帮助教育学专业的学生掌握评估和测量学习成果的理论与方法。

本文将深入探讨教育测量学的概念、目的和应用，并介绍其中的一些核心概念和方法。

一、教育测量学概述教育测量学是研究学习成果评估和学生能力测量的学科。

它通过收集、分析和解释学生的学习成果，从而帮助教育者做出关于学生学习与教学效果的决策。

二、教育测量学的目的1. 评估学习成果：教育测量学的一个主要目的是评估学生的学习成果。

通过测量学生的知识、技能和能力，教育者可以了解学生在不同学科领域的学习水平和成就。

2. 诊断学生需求：教育测量学还可以帮助教育者更好地了解学生的学习需求和问题所在。

通过评估学生的学习成果，教育者可以发现学生的弱点和困惑，并采取相应的教学措施来促进学生的学习和成长。

3. 改进教学方法：教育测量学的另一个重要目的是改进教学方法和教学质量。

通过分析学生的学习成果，教育者可以了解不同教学方法对学生学习的影响，从而根据实际情况进行调整和优化教学策略。

三、教育测量学的应用1. 学业评估：教育测量学在学校教育中广泛应用于学生的学业评估。

通过进行考试、测验和项目评估等方式，教育者可以了解学生在各学科领域的学习情况和业绩表现。

2. 教育政策制定：教育测量学的研究成果和方法也对教育政策的制定和实施起到重要的支持作用。

政府和教育机构可以通过教育测量学的数据和分析结果，制定针对学生和学校的政策和措施。

3. 教学改进：教育测量学的成果可以帮助教育者改进教学方法和教学质量。

通过分析学生的学习成果和评估结果，教育者可以了解自己的教学效果，发现问题并进行改进。

四、教育测量学的核心概念和方法1. 测量工具：教育测量学使用各种测量工具来评估学生的学习成果，如测验、问卷调查和观察等。

这些测量工具需要具备良好的信度和效度，以确保其测量结果的准确性和可靠性。

2. 信度和效度：信度和效度是教育测量学中的两个重要概念。

教育学中的评估和测量方法探讨

教育学中的评估和测量方法探讨评估和测量是教育学中重要的研究领域，涉及到对学生学习成果、教学效果以及教育体制的评定和衡量。

通过评估和测量，可以更好地了解学生的学习状况、教学质量以及教育政策的有效性。

然而，不同的评估和测量方法适用于不同的教育环境和目标。

本文将探讨教育学中常见的评估和测量方法，并分析其优缺点。

1. 标准化考试标准化考试是一种普遍采用的评估和测量方法，用于衡量学生的学习成就和能力水平。

这种方法通常以客观题为主，如选择题、填空题和判断题等，答案具有明确的标准。

标准化考试能够提供快速、简便的评估结果，可以进行大规模的数据分析。

然而，标准化考试忽视了学生的个性差异，可能无法全面评价学生的综合能力，也容易导致教学内容的单一化。

2. 问卷调查问卷调查是一种常见的评估方法，通过设计合适的问题，收集学生和教师的意见和反馈。

问卷调查可以获取参与者的主观感受和看法，反映他们对教学环境和学习体验的评价。

此外，问卷调查也可以用于收集定量数据，进行统计分析。

然而，问卷调查存在许多问题，如参与者的回答可能不准确或受主观偏见影响，样本选择可能存在偏差。

因此，在设计问卷调查时，需要仔细考虑问题的设计和样本的代表性。

3. 课堂观察课堂观察是一种直接观察和记录教学现场的评估方法。

评估者可以通过观察学生的行为和参与程度，评估教学效果和学生的学习状况。

课堂观察可以提供详细的信息，了解学生与教学内容之间的互动情况。

然而，课堂观察存在一定的主观性，评估者的观察角度和背景可能会影响评估结果，同时，观察者可能无法观察到学生在课堂外的学习情况。

4. 学科测验学科测验是一种针对特定学科的评估方法，用于衡量学生对某一特定学科知识和能力的掌握程度。

学科测验可以体现学生在特定领域的学习成果，并可以根据不同的学科设置不同的评估标准和评分体系。

然而，学科测验通常只能评估学科知识和能力的一部分，对综合能力的评估可能不够全面。

5. 综合评价综合评价是一种综合考虑多种评估方法和指标的评估方法。

高中学业倾向测试解读

高中学业倾向测试解读在高中学习阶段，每个学生都会面临着不同的选择和决策。

为了帮助学生更好地了解自己的兴趣和倾向，高中学业倾向测试成为一个非常有用的工具。

本文将通过解读高中学业倾向测试，帮助读者更好地理解自己的学业倾向，并为未来的学习规划提供一些建议。

一、测试背景和目的高中学业倾向测试是一种评估学生学习倾向的测试工具。

通过了解学生的兴趣、能力和学习风格，测试能够提供宝贵的参考资料，辅助学生制定适合自己的学业发展计划。

二、测试流程和内容高中学业倾向测试通过一系列问题和任务，测量学生在不同学科、学习方式和职业方向上的兴趣和能力。

测试内容包括数学、语言、科学、艺术等多个领域，通过评估学生对不同领域的偏好，帮助学生了解自己的学科特长与不足。

三、测试结果解读高中学业倾向测试的结果包括学科偏好与能力评估。

学科偏好反映了学生在不同学科领域的兴趣程度，从而为有志于某个特定领域发展的学生提供了倾向性的选择指导。

能力评估则是通过测试数据分析学生在不同学科上的潜力，帮助学生针对性地制定学习计划。

四、学科偏好的影响学科偏好是指学生对不同学科的兴趣程度和发展意向。

学科偏好的影响范围包括大学专业选择、职业规划和学术发展方向等。

学生可以根据自己的学科偏好来选择适合自己的专业和职业方向，从而在未来的学习和就业中更有动力和成就感。

五、能力评估的意义能力评估是衡量学生在不同学科上的能力和潜力。

通过准确了解自己的学科能力，学生可以有针对性地进行学习规划，提高自己在弱势学科上的表现。

此外，能力评估也可以帮助学生认识到自己的长处和优势，从而更好地发展自己的学术能力。

六、学习风格分析除了学科偏好和能力评估外，高中学业倾向测试还会评估学生的学习风格。

学习风格是指学生在学习过程中的工作方式和喜好，如视觉型、听觉型、触觉型等。

了解自己的学习风格有助于学生选择适合自己的学习方法和资源，提高学习效果和自我管理能力。

七、学业倾向与素质教育高中学业倾向测试不仅仅关注学生的学科成绩和能力评估，也注重学生的综合发展和素质教育。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基础教育中学业测评的测量学取向学业成就，指个体在某一学科领域所具有的知识、技能或者取得成绩的水平[1] 。

学业测评是以国家教育教学目标为依据，运用恰当的、有效的工具和途径，系统地收集学生在教学和自学的影响下认知行为上的变化信息和证据，并对学生的知识和能力水平进行价值判断的过程。

它在教育中起着非常重要的作用。

从微观的课堂教学活动来看，对学业成就的测量与评价是一个重要环节，可以帮助老师了解学生的学习情况，指导教学活动，同时还可以帮助学生达到教学目标，促进其能力的发展；从宏观的教育活动来讲，学业成就的测量与评价可以给学校或教育机构提供更多的教学效果信息，从而起到监控教学质量的作用。

然而，在新课程改革背景下，学业成就的测量与评价存在很多的技术难题与弊端。

一、当前学业成就测评所面临的技术难题随着基础教育改革的不断深入，对学生学业成就的测评工作已经取得很大进展，但我们仍然无法忽视其中存在的问题：一是现行的学业成就测评仍然摆脱不了对学生进行排队的嫌疑，通过测评所挖掘的学生的信息仍然不够深，从而导致对学生的能力不能很好地诊断和指导[2] ；二是囿于测评技术的发展局限，现行的学业成就测评还是主要考查学生对知识的掌握程度，对学生能力的掌握还不够深；三是学业成就测量与评价的非标准化，导致了测评内容缺乏客观性。

尽管我们打破了传统的统一教材一统天下的局面，制定了一个共同的课程标准，但现行的考试制度还是抹不去学业成就测验内容选择的主观色彩；四是学科专家和心理测量学专家之间的联系不够紧密，导致学科专家在成就测评的实施过程中，缺乏心理测量学的理论指导，而心理测量学专家对学科知识和课程标准也吃不透；五是在我国现状下，大规模的学业成就测评的形式非常单一，主要采取纸笔的形式，这也导致人们对测评的客观性和公正性存有质疑。

综合上述五个问题的出现，分析其根本原因，主要原因还是心理测量学的基本理论还没有完全融入到学业成就测量与评价的实践中去，所以，要解决学业成就测评面临的问题，还得从心理测量学的理论与技术的实施中寻找答案，加强心理测量学专家与学科专家之间的联系与交流，从而做到学业成就测评的客观、公正与公平，促进学生能力的发展。

二、学业成就测评的经典测量学基础经典测量理论（Classical test theory , CTT起始于20 世纪中叶之前，其主要特点是以真值理论为基础，以信度、效度、难度和区分度为指标，它的基本假设是考生的分数并不是一个绝对的值，而是其真实能力或技能的反映与测量误差的和，所以称为真值理论。

根据经典测量理论，人们逐步建立并完善了测验发展的标准化程序，通过标准化的程序提高所编制的测验的信度和效度。

自2001 年国家教育部提出课程改革以来，教育心理学工作者和学科专家在新课程下学业成就测评工具的研发上，下了不少工夫。

经典测量理论在学业成就测评中也得到了一定的应用。

某地区初中数学成就测验在编制过程中，首先是依据初中数学课程标准，确定初中数学涉及 4 个领域的内容：数与代数、空间与图形、统计与概率以及综合应用。

同时结合美国教育学家 B.S.Bloom 的教育目标分类法，选择记忆能力、理解能力、运算能力、推理能力、综合应用能力为教育目标，确定测量目标。

根据教学内容和教学目标，制定了双向细目表，之后对该区的数学教学专家进行了访谈，确定了项目以及项目所占的权重，然后组成两套平行题本。

根据题本通过小样本预试，用难度、区分度的指标来筛选题目，最后确定正式施测题本。

采取分层整群抽样，进行施测收集数据，分析数据，从而根据数据分析的结果来评价学生学会了什么，对什么是了解、知道、理解、应用[3] 。

在大规模的学业测评中，试题往往要全面覆盖基础教育的各个学科，测试题目非常多，如果要将这些题目让全部学生作答，测试的时间会大大超过学生所能承受的限度，这也是不可能实现的，矩阵取样技术化解了这个难题。

将覆盖多个学科的所有题目按照一定原则分配到多套测验中，学生随机分配，每个学生只需完成一套测验中的试题，这样的设计叫做完全矩阵取样设计。

采用这种设计解决了测验时长的问题，但是不同学生测试结果的比较又成了新的问题。

针对这一问题，发展出不完全矩阵取样设计，就是每一个题本中都有一部分共同题，利用学生在共同题部分作答的情况，将学生在整个题本中的作答结构等值到同一个量尺上，就可以解决个体之间的比较问题。

即便如此，经典测量理论下的学业成就测验，采用总分指标来评价能力，对个体在总体中的相对位置进行排序，不能指出被试具体掌握了哪些内容，更无法诊断其题目作答错误的原因，仍然摆脱不了还只是对学生知识点考查的怪圈，在注重能力培养的素质教育背景下，它缺乏对学生能力的掌握；用难度与区分度的指标来分析学生的反应，保留了一些反映学生能力的题目；在实际的教学过程中，教师一般也都是自出题目，对题目的难度和区分度只做一个主观的估计，同时，它也缺乏避免曝光的理论技术指导，从而造成学业成就测验的标准化程度很低；另外，如果涉及到语文成就测验时，主观题目的设计以及结果的分析又会面临统计学的难题。

三、学业成就测评的现代测量学指导基于经典测量理论下成就测验只能测查知识点的致命缺点，教育与心理学工作者围绕经典测量理论的一些问题展开了讨论，促进了测量理论的新发展，注重表现学生能力的项目反应理论(Itemresponse theory , IRT)产生了，该理论起始于20世纪60 年代，其特点是：采用严格的数学模型来反映不同能力水平的测试者对测试题目的反应模式。

项目反应理论相对于经典测量理论来说取得了巨大的进步，但也并非没有缺点[4] ，它的 3 个基本假设非常严格——( 1)单一维度假设，即假定测验的所有题目只测查同一种能力或潜在特质。

但实际上，很少有测验只测查单一的能力或特质。

( 2)局部独立性假设，即当控制所测量的能力或特质之后，被试在不同题目上的反应是相互独立的。

换一句话讲，就是被试对题目的反应只受该题目所测的能力的影响。

( 3)单调递增假设，即被试对题目正确反应的概率随其能力水平的增加而单调递增。

这 3 条非常严格的假设，使其应用受到很大的限制。

从20世纪90年代至今，围绕项目反应理论产生了很多新的研究和新的动向，如：多维项目反应理论(Multi-dimensional IRT , MIRT)、非参数项目反应理论(Non-parametric IRT, NIRT)等。

多维项目反应理论为成就测验中所涉及的每个维度引入能力和项目区分度参数，进而模拟测验题目和被试之间的交互作用，它是一个非线性的用来表征题目参数、被试的多维潜在能力以及其正确作答概率之间关系的数学函数，通过这个模型，我们可以对被试的多个特质进行分别推断。

换一句话说，利用多维项目反应模型能同时估计被试在多个维度上的能力参数，并且考虑各能力维度之间的关系，因此，如果测验数据是多维的，则多维模型就能更有效地估计被试及项目参数。

这使我们能更深入地了解被试，结合多方面的信息，为对被试的评估或诊断提供帮助。

在实际应用中，一个总的学业成就测验可以分为多个子测验，如果子测验测量了不同的内容领域或认知技能，则这些项目就有可能代表了不同的维度，这时，对每个项目能够正确作答所需要的内容领域或认知技能进行分析是非常必要的，在传统测验中一个知识点的考查可能涉及到对多个能力的考查，用经典测量理论的假设，一个题目对应一个能力，这显然是有很大的误差。

另外，多维项目反应理论能够提供项目在每个能力维度上的区分度参数，可以据此来选择对多维能力差异具有敏感性的项目。

在教育中，课堂上学科教师给学生出的小测验比比皆是，这种测验不仅题目少，而且受测的对象也仅仅是本班的学生，即样本小，这时，非参数项目反应理论就给我们提供了模型，这至少削弱了我们对经典测验中样本分布正态和在参数项目反应理论中关于特质分布正态假设的依赖。

四、学业成就测评的认知诊断技术前沿认知诊断理论（Cognitively diagnostic theory ）非常值得我们关注。

随着认知心理学的发展，关于知识与技能的认知理论为我们研发成就测验工具提供了理论基础。

认知诊断理论就是以现代测量学为基础，结合认知科学对学习理论的研究与发现，采用更精致的数学模型，来研究如下问题，（1）学生在答题时，经历哪些认知过程？（2）这些认知过程如何发展？以及能力高的学生与能力低的学生在这些方面有哪些差异？认知诊断可以通过学生对试题的作答反应，推论出其认知过程与知识结构的可能状态。

在学业成就测评中，经典测量理论和项目反应理论，都是根据理论中的一些指标来筛选题目，将学生按顺序排列在特定能力（或特质）的连续体上。

这并不能给学生或教师有用的诊断信息，不能帮助学生或教师理解需要学习或教学的知识与技能。

而运用认知诊断理论，我们能更深入地理解隐含在考生总分背后其认知技能之间的差异。

这为我们深入挖掘受测者信息提供了一个有力的工具。

认知诊断理论中比较有代表性的有Mislevy 的以概率为基础的推理( the probability based inference )、Corbett 和Anderson 等人的学生思维模拟( student modeling )、Britton 和Tidwell 的认知结构诊断( cognitive structure testing ) 以及Tatsuoka 的规则空间模型( rule space model ) [5] 。

Tatsuoka 的规则空间模型最初是用来诊断小学生在解决四则运算问题时答对或者答错的原因，进而发现学生使用错误的规则来解题，因此会产生系统化的错误，这种系统化的错误，他们称之为“失误”。

该模型的方法包括两个阶段[6] ：第一阶段是抽取某个领域的认知特征并根据这些认知特征确定潜在的知识结构；第二个阶段是把学生的反应模式划分到所确定的各个知识结构中去，并且计算被试的属性掌握概率。

在构建规则空间的过程中使用了项目反应理论中参数估计的方法，所以严格来讲，规则空间模型的建构方法是项目反应理论的继承与发展。

用规则空间模型的方法编制成就测验时，通过可达到矩阵的距离来澄清各属性之间的关系，使得矩阵中的项目属性关系清晰且符合逻辑。

同时，由于属性间的逻辑关系很清晰，所以在项目的反应上就能很清楚地知道学生掌握了哪些属性，或者未掌握哪些属性，或者是因为失误而造成的反应错误，这样就能给教师和学生提供更深层的信息，从而进行补救性的教学[7] 。

在实际工作中开展认知诊断测评，需要进行一系列的系统化工作：（1）确定诊断目标。

必须明确要诊断的具体学科内容，如小学数学分数诊断，中学语文句法诊断等。

（2）确定诊断目标所涉及的认知属性及属性间的阶层关系。

这项工作需要认知心理学家、学科专家和教育测量学专家共同完成。