测验等值

合集下载

戴海崎《心理与教育测量》笔记和课后习题详解(测验等值)

戴海崎《心理与教育测量》笔记和课后习题详解(测验等值)

第9章测验等值9.1 复习笔记一、测验等值概述(一)测验等值来源于测量实践的需要在心理与教育测量实践中,经常遇到一个测验需要配备多个测验形式的情况,特别是那些测验内容易受记忆或针对性训练影响的测验,在测验之前需严格保密,测验之后不能再用,必须配备多个不同形式供不同次施测所用。

(二)测验等值的实质从本质上来讲,测验等值就是通过对考核同一种心理品质的多个测验形式做出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性。

在实际操作中,测验等值可使各个不同形式的测验分数均对应起来,测验主持者可以任意指定其中的一个分数形式作为基准,而使所有其他形式的分数都转化到这个基准形式上。

测验等值中所讲的测量分数系统的转换与测验原始分数与导出分数之间的转换是不同的。

寻找测验等值关系与寻找两测验之间预测关系也是不相同的。

(三)测验等值的条件测量学所提出的测验等值的条件主要有以下几个方面:同质性、等信度、公平性、可递推性、对称性、样本不变性。

(四)测验等值的一些基本概念1.经典理论等值与项目反应理论等值两种等值的区别在于等值时以何种测验理论作指导。

以经典理论为指导的等值称为经典理论等值,以项目反映理论为指导的等值称为项目反映理论等值。

2.测验分数等值与项目参数等值(1)这是根据测验等值的直接操作对象不同而构成的一对概念:①测验分数等值:如果等值的直接操作对象是测验的原始分数,结果是直接找到两测验分数的转换关系,称为测验分数等值。

②项目参数等值:如果等值的直接操作对象是测验项目参数,找到的等值转换关系是两测验项目参数之间的转换关系,则称其为项目参数等值。

项目参数等值可以是终极目的,但更多的是中间目的,在项目参数等值的基础上可以进一步找到测验分数的转换关系。

(2)项目参数等值特别适用于大型题库建设。

利用项目参数等值可以把不同批次采集计算的项目参数,确定在一个统一的度量系统上,所有项目合并成一个大型题库。

从这样的题库中抽题组成的不同试卷进行测试,可获得一致的评价结果,不必再进行等值计算。

测验等值的比较研究(北京翻译学院)

测验等值的比较研究(北京翻译学院)

摘要本文对测验等值的几种设计和方法进行分析比较,并讨论如何使用这些设计和方法,同时指出一些尚待进一步研究的问题。

关键词测验等值等值设计等值方法一、等值的意义和作用人们有种种理由要求比较、解释不同时间、不同地点、不同考生的测验分数,以便对试卷或试题的质量,对不同学年的考生水平作出公正的评价、合理的解释,特别是高考、自考这种规模大、影响广的全国统一考试,它决定数百万考生的命运因而备受社会各界关注。

人们当然想知道,各年度试卷的难度水平是否有变化?各年度考生的实际水平是否有提高?不同年度考试之间的考试分数究竟有何关系?如果我们能够把不同年度、不同考生的考试成绩转化到同一个单位系统上去,则上述问题就能得到解决。

在教育与心理测量中,把测量同一种心理特质的不同测验分数,通过一定的数学模型转换成同一单位系统中的过程就称为测验的等值,可见测验等值是心理与教育测量中一个重要的研究领域。

根据等值对象的不同,测验等值包含两方面的内容,如果我们想把不同次测验所得到的分数进行等值,这种等值称为测验分数等值,例如在自学考试中,我们想知道去年的高数考试成绩60分究竟等同于今年的高数成绩多少分。

如果我们想对测验题目的参数如难度、区分度进行等值,这种等值就称为项目参数等值,本文主要讨论测验分数等值,项目参数等值的思想方法与之相似。

二、等值的条件等值是有条件的,不是任意两个测验都可以进行等值。

首先,要求等值的两个测验必须是测量同一心理物质的。

很难想象可以把数学测验的分数等值转换成语文测验的分数,但数学测验分数却可能转换成另一次内容难度近似的数学测验分数。

其次,只有当测量同一特质的两次测验的信度即可靠性相同或相近时才能进行等值。

信度值相差太大的两次测验不能进行等值,第三,测验等值转换关系应具有公平性。

公平性的意思是:若两个或多个测验可以进行等值,则无论以其中任何一个作为基准来进行转换都是可行的,这样考生接受其中任何一个测验,其分数经等值变换后都不会低估或高估其实际水平。

心理测量-第九章

心理测量-第九章

5.等值偏差
• 等值处理方法不当也会引起等值误差,测 量学上把这种等值误差称为等值的系统误 差,也称为等值偏差。
六、测验等值结果的表示方法 表列法 公式法 图示法
第二节 测验等值关系计算的基本方法 一、等百分位等值
• 原理:两个分数,一个在测验形式X上,另 一个在测验形式Y上,如果这两个分数对于 任何一个被试群体都有相同的百分等级, 那么这两个分数就被认为是等值的。
测验等值
第九章 测验等值
测验等值概述 测验等值关系计算的基本方法 常用测验等值设计介绍 心理测量工作者的要求
第一节 测验等值概述
一、测验等值来源于测量实践的需要
二、测验等值的实质
• 测验等值就是通过对考核同一种心理品质 的多个测验形式作出测量分数系统的转换, 进而使这些不同形式的测验分数之间具有 可比性。 • 主试可以任意指定其中的一个分数形式为 基准,从而使具有其他形式的分数都转换 到这个基准形式上。
1.测量同一心理品质的多 个测验形式间的转化。
两测验间预测关系
1.预测关系的两测验可以 是测不同心理品质的。
2.各个形式间是平等的。
2.预测源与预测目标之间 的关系是不平等的。
三、测验等值的条件
1. 2. 3. 4. 5. 6. 同质性 等信度 公平性 可递推性 对称性 样本不变性
四、测验等值的一些基本概念 1.经典理论等值与项目反应理论等值
–区别在于等值时以何种测验理论为指导。
2.测验分数等值与项目参数等值
–根据测验等值的直接操作对象不同而构成的一 对概念。
3.水平等值与垂直等值
– 根据测验试卷的难度和被试能力分布是否有差 异而区分的一对概念。
五、测验等值中的一些专用技术名词 1.测验等值设计

第九章-测验等值

第九章-测验等值
▪ 采用这种设计的优点是,如果测验顺序对等值结果没有影 响,就可以只用一个样本完成测验等值,使得一些被试难 寻的测验有可能在较大样本下完成测验的等值。
▪ 无法克服练习效应和测验时间太长的缺点。 ▪ (1)线形等值法 ▪ (2)等百分位等值法
设计三 随机分组——每组各实施一个测验, 锚测验向每组实施
七、测验等值的工作过程大致包括:
▪ (1)确定等值目标。 ▪ (2)进行等值设计。 ▪ (3)施测并采集测验数据。 ▪ (4)选择一个等值的操作定义。 ▪ (5)进行等值计算,获取结果。 ▪ (6)评价等值结果。对可靠性和准确性进行论证。
第二节 测验等值计算的基本方法
▪ 在单组设计或随机等组设计下的两个分数,一个在测验形
▪ (3)估计等值关系时所用的被试组与实际使用这两测验 的被试组有实质性的差异,此时将所估等值关系应用于实 测群体,系统误差也就产生了。
▪ (4)某些等值数据处理技术的使用也可能引进系统误差。
六、测验等值结果的表示方法
1.表列法 ▪ 应用最普遍的等值结果表示方法 2.公式法 ▪ 常见的等值结果公式形式y=Ax+B ▪ 式中x与y处于平等地位 3.图示法 ▪ 形象生动但精确度有限
▪ 要求:同质性;等信度;长度不小于原测验的1/5。
3.数据平滑法 比较实用的两种数据平滑法: ▪ 一种叫对数线性平滑法 ▪ 一种叫β二项式平滑模式
▪ 等值完成之后必须对等值结果进行评价。评价的目标是所 估等值关系的可靠性与准确性,其指标是等值关系中所包 含的等值误差的大小。
▪ 关于等值标准误差、等值偏差:
▪ 控制办法:数据平滑法
▪ 测验等值误差是一个变量,随等值分数的大小而变,其总 趋势是等值分数越趋于分布的两端,等值的标准误差越大。

ch10 测验等值

ch10 测验等值

设计四 非随机分组——每组各实施一个测 验,锚测验向每组实施
应用背景: 在实际工作中还会出现这样的情况: 既不可能采集一个样本让被试施测两个不 同形式的测验,又不可能获得两个总分分 布相同的样本来分别接受两个测验的施测。 例子:两个年度的高考试卷等值
设计四 非随机分组——每组各实施一个测 验,锚测验向每组实施
测验等值的条件
D
测验等值结果的表示方法
心理测量学
一、测验等值的含义
将具有不同难度、分数分布的试卷的分数
转换到一个统一的量尺之上,采用统一的量尺
对应考者进行测量。 这种将一个测验的不同版本的分数统一在 一个量表上的过程即等值(Equating)。

将不同测验(考察同一特质)上的分 数(特质水平值)和项目(试题)参数做 出单位系统转换,从而使之能相互比较的 过程,叫做测验等值。


上述要求满足极为困难,除了心理现象复 杂,测验技术发展不成熟外,测量理论框 架本身的局限也是原因。
三、测验等值的一些基本概念
(一)成对出现的概念 1。经典测验理论等值与项目反应理论 等值 经典测验理论(CTT)、项目反应 理论(IRT)、概化理论(GT) 区别在于等值时以何种测验理论为 指导。 2。测验分数等值与项目参数等值 根据测验等值的直接操作对象不同 而构成的一对概念。
二、测验等值的条件
(1)同质性 要求等值的两个测验必须是测量同一心理特质的。 很难想象可以把数学测验的分数等值转换成语文 测验的分数,但数学测验分数却可能等值转换成另一次 内容难度近似的数学测验分数。 (2)等信度 (3)公平性 (4)对称性 (5)样本不变性 等值测验是两个或多个测验之间客观存在的实际关系。 (6)可递推性 如果f(x) =y,g(y)=z,那么h(x)=g[f(x)]=z

《测验等值》

《测验等值》

测验等值一、为什么进行测验等值研究测验、考试被作为一种尺度来对人的心理特质进行测量。

这种尺度应该具有稳定性。

不同的考试版本之间应该具有一致性。

对于同一个测量对象,不能用这个版本测量得到一个度量,用另一个版本测量却得到相差很大的另一个度量。

尽管我们在命题过程中总是尽量保持考试难度的稳定性,但不同试卷之间在难度、信度、分数分布方面的差别很难完全避免的。

这种差别不仅会影响到测验的质量,影响到评价标准的客观性,而且会使参加考试时间不同、使用试卷不用的考生受到不公平的对待。

这样,就需要将具有不同难度、分数分布的试卷的分数转换到一个统一的量尺之上,采用统一的量尺对应考者进行测量。

这种将一个测验的不同版本的分数统一在一个量表上的过程即等值(equating)。

如果不进行等值处理化,不同时间举行的考试的成绩之间不具备可比性,评价标准或证书授予标准会受到试卷难度起伏的影响。

一些水平不高的考生可能会由于运气好遇到较容易的试卷而通过考试获得相应资格,一些水平较高的考生可能会由于运气不好遇到较难的试卷而未通过考试并未能获得相应资格。

这种状况,不仅影响到选拔效率和人员素质,而且对考生也是很不公平的。

等值研究的意义并不局限于保证考试公平。

今天,为了避免命题和试卷编制中的盲目性和偶然性,许多考试机构都在致力于建设题库。

实现基于项目反应理论(Item Response Theory,简称IRT)的题目参数等值是建设科学化、大规模题库的前提。

基于经典测验理论(Classical T esing Theory,简称CCT)之上的等值方法只能实现不同试卷之间的等值,满足“试卷库”建设的需要,很难实现在统一的量尺上标定试题难度和区分度的任务,很难满足大规模题库建设的需要。

实现计算机化自适应性考试是许多考试的发展方向,也是摆在许多考试机构面前的重要课题。

计算机化自适应性测验开发中的一个核心环节就是在统一的量表上标定试题参数,实现各个考生所回答的不同题目之间的等值。

第七章测验等值


等值误差
心理测量学
等值完成后必须对等值结果进行评价。评 价等值关系可靠性与准确性的指标是等值关 系中所包含等值误差的大小。等值误差有两 类:随机等值误差与系统等值误差。测验误 差不可避免一样,等值误差也是不可避免的。
等值误差
❖随机误差发生在用样本统计量来预测总 体参数的情况下。
❖系统误差是由于违背了数据收集设计或 等值方法的假设或者条件所造成的。
测验等值
心理测量学
1
测验等值概述
2 常用等值资料采集方法设计
3 测验分数等值关系计算的基本方法
1
测验等值概述
心理测量学
心理测量学
测验等值概述
A
测验等值的含义
B
测验等值的条件
C
等值误差
测验等值的含义
心理测量学
什么是测验等值? 为什么进行测验等值? 所有测验都可以进行等值么? 理论基础是什么? 测验等值如何进行?
测验所测心理结构或特性的同一性 等信度 测验等值转换关系的公平性 测验等值转换关系的可递推性
测验等值的条件
心理测量学
测验等值必须满足的要求与条件(续) 测验等值转换关系的对称性 测验等值转换关系对总体的惟一性或称样
本不变性
在测验等值处理中,如果待等值测验能 完全符合上述6个条件,则等值的结果将 令人满意。
测验等值的含义
❖我们想要知道数学能力在小学一年级和二年级的差 异情况。应该怎么比较他们的数学成绩?
❖研究生入学考试某个地区的英语泄题了,最后采用 了副卷进行考试,那么,最后算总分的时候,依然 采用几门科目成绩之和算总分?
❖我们要建立一个题库,希望试测数百个乃至成千个 试题。显然、这些试题决不能同时在一个考生组上 来试测,我们可能要同时测许多考生组。虽然其中 的第一组跟第二组,或第二组跟第三组间是有若干 共同试题的,但每一组的考生都只接受很少一部分 试题的测试。这样得到的难度和区分度可以直接应 用吗?

测验等值关系计算的基本方法

测验等值关系计算的基本方法测验等值关系计算就像是搭建一座稳固的桥梁,让不同的测验能够相互比较。

那到底咋算呢?首先,得收集数据呀!就像盖房子得有砖头一样,没有足够的数据可不行。

这数据得从不同的测验版本或者不同的施测场合中收集来。

你想想,要是数据不全面,那得出的等值关系能靠谱吗?
然后呢,选择合适的等值方法。

这就跟选工具似的,不同的工具干不同的活。

常用的有等百分位等值法、线性等值法啥的。

每种方法都有自己的特点,得根据实际情况来挑。

哎呀,要是选错了方法,那可就麻烦啦!
在计算过程中,安全性和稳定性也很重要呢!就好比走钢丝,得小心翼翼,不能有一点闪失。

数据得保密吧,不能让别人随便看到。

计算过程也得准确无误,不能出一点差错。

不然,得出的结果谁信呢?
那测验等值关系计算有啥用呢?应用场景可多啦!比如在教育领域,不同学校的考试要比较成绩,就得用到等值关系计算。

企业招聘的时候,不同场次的测试也需要等值。

这多方便呀!优势也很明显,能让不同的测验结果具有可比性,就像有了一把统一的尺子。

你说棒不棒?
咱举个实际案例吧。

有两个学校进行了同一场考试,但是试卷不一样。

通过测验等值关系计算,就可以把两个学校的成绩进行比较。

结果发现,
虽然试卷不同,但是学生的水平差不多。

这就说明等值关系计算很有用嘛!
测验等值关系计算就是这么厉害!它能让不同的测验变得可以比较,为教育和其他领域提供了有力的支持。

咱可得好好利用它。

第九章测验等值

第九章测验等值
whitetu1995@
第一节 测验等值概述
一测验等值的实质 就是通过对考核同一种心理品质的多个测 验形式作出测验分数系统的转换,进而使 得这些不同测验形式的测验分数之间具有 可比性。
Hale Waihona Puke 测验等值与导出分数 等值转化是为了比较两个测验形式之间的 实测分数 导出分数是为了将一个实测分数转换到一 个可评价个体相对位置的分数系统上
测验等值和预测关系 测验等值是测量同一种心理品质的多个不 同测验形式、测验分数之间的转化关系, 各形式之间是出于平等的地位。 预测关系是测同种心理品质,也可以是测 相近的甚至是不同的心理品质
二、测验等值的条件 1、同质性 2、等信度 3、公平性 4、可递推性 5、对称性 6、样本不变性
三、测验等值的一些基本概念 1、经典理论等值与项目反应理论等值 2、测验分数等值与项目参数等值 3、水平等之与垂直等值
四专用技术名词 1、测验等值设计 为了寻找不同测验形式之间的等值关系而预先对 数据的采集方法、等值实现的途径、等值的计算 方法进行周密的设计。 2、锚测验 在测验等值设计中,有时会采用一组测验试题来 关联两个待等值的测验形式,以便寻找两形式的 等值关系,这些测验试题被称为
五 测验等值结果的表示方法
一、列表法 二、公式法 三、图示法
第二节 测验等值计算的基本方法
一、等百分位等值 二、线性等值
第三节 常用测验等值设计介绍
设计一 随机分组——每组实施一个测验 1、线性等值性 2、等百分位等值法3
设计二 随机分组——各测验对每组都实施 1、线性等值法 2、等百分位等值法
设计三 随机分组——每组各实施一个测验, 锚测验向每组实施
设计四 非随机分组——每组各实施一个测 验,锚测验向每组实施

测验等值(自编试题)

测验等值一,选择题1. (D)的目的是为了比较两个不同测验形式之间的实测分数A. 导出分数转换B.测验形式转换C. 数据平滑D. 等值转换2. 两个不同形式的测验之间进行测验等值是必须具备一定条件的,其中不包括(B)A. 同质性B. 样本可变性C. 等信度D. 可递推性3. 数据的采集方法,等值实现的途径,等值的计算方法进行周密的设计,称为(A)A. 测验等值设计B. 锚测验C. 数据平滑法D. 等值标准误差4. 测验等值结果是两个不同测验形式分数或项目参数间的转换关系,有三种表示方法,其中不包括( C )A. 表列法B. 公式法C. 对应法D. 图示法5. 线性等值用数学公式表示为,可以改写为y=Ax+B,其中A=(A)A. B. Sx / Sy C. y-Ax D. Fb+Lb二,填空题6. 经典测验理论下,测验等值关系的计算方法主要分为两类:百分位等值,线性等值7. 在等百分位等值方法的公式中PR代表:百分等级8. 锚测验的要求:与原测验测量同种心理品质,与原测验有相同的测验质量,长度不短于原测验1/59. 测验等值的需要源于:测量实践的需要三,简答题10. 为什么需要测验等值?答:在心理与教育测量实践中,经常遇到一个测验需要配备多个测验形式的情况,特别是那些测验内容易受记忆或针对性训练影响的测验,在测验之前需严格保密,测验之后不能再用,必须配备多个不同形式供不同次施测所用。

对于这种情况,测验编制者显然希望这些不同形式的测验结果分数应该是“相等”的,也就是说,如果是对同一个被试施测,通过各个不同形式所测得的结果应该是完全一样的。

为达此目的,测验编制者在测验编制的技术上作了许多努力,但在实际施测后,不同形式之间分数的差异依然存在,这就会引起评价的不公正。

这种结果在需要对参加不同形式施测的被试作统一评价时,就会造成些明显的失误。

避免这种失误的一条途径是寻找到不同测验形式之间分数的转换关系,把所有不同形式测验的分数你转换到同个分数系统上,就不会再出现上述不公正现象。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机等组 设计 铆测验 —非等组 设计
样本
P1 P2 样本 P1
X
q1
心理测量学
3
测验分数等值关系计算的基本方法
心理测量学
测验分数等值关系计算的基本方法
线性等值 等百分位等值 铆测验非等组设计下的等值关系计算
方法
心理测量学
线性等值
在单组设计或随机等组设计下的两个分 数,一个在测验形式x上,另一个在测验形
心理测量学
测验等值的含义
尽管我们在命题过程中总是尽量保持考试 难度的稳定性,但不同试卷之间在难度、信 度、分数分布方面的差别很难完全避免的。 这种差别不仅会影响到测验的质量,影响到 评价标准的客观性,而且会使参加考试时间 不同、使用试卷不同的考生受到不公平的对 待。
心理测量学
测验等值的含义
这样,就需要将具有不同难度、分数分布 的试卷的分数转换到一个统一的量尺之上, 采用统一的量尺对设计
铆测验—非等组设计:在测验编制时另外编 制一组测验试题,这些试题被称为共同题, 也称为铆(anchor)题。在数据采集时, 铆测验题即对第一组被试施测,又对第二组 被试施测。
心理测量学
等值设计方法图示
样本 P 测 验
单组设计
X
✓ 测 X ✓ 验
Y
✓ Y ✓ 测 验 V ✓ ✓ ✓ ✓ Y
心理测量学
等值步骤 两测验形式之间的等值关系,必须依据 等值条件去寻找这一隐性等值关系,并用 某种形式将其显示出来。
揭示两测验形式的等值关系,实现测验 等值应该按一定步骤进行。
心理测量学
等值步骤
测验等值步骤(七步)
确定等值目的 编制测验复份 选择一种数据采集的设计方法 贯彻数据采集设计方案
这种将一个测验的不同版本的分数统一在 一个量表上的过程即等值(Equating)。
心理测量学
测验等值的条件
测验等值必须满足的要求与条件
测验所测心理结构或特性的同一性
等信度
测验等值转换关系的公平性
测验等值转换关系的可递推性
心理测量学
测验等值的条件
测验等值必须满足的要求与条件(续) 测验等值转换关系的对称性 测验等值转换关系对总体的惟一性或称样 本不变性 在测验等值处理中,如果待等值测验能 完全符合上述6个条件,则等值的结果将 令人满意。
要找到与 x 分数有相等百分等级的y分数就
可以。
心理测量学
等百分位等值
对于测验x的每个一分数,可根据公式 在x测验分布中先求出与其对应的百分等级, 然后在y测验上求取具有该百分等级的分数。 即在两个测验上就有相同百分等级的分数就 是等值分数。
心理测量学
百分等级计算公式为:
根据百分等级计算测验分数公式为:
差不可避免一样,等值误差也是不可避免的。
心理测量学
等值误差
影响等值误差的主要因素
被等值测验的同质性 被等值测验之间的难度差别 被等值测验分数的分布特点,包括偏度、峰度等 被等值测验的单维性
心理测量学
等值误差
影响等值误差的主要因素(续)
铆题对测验的代表性,或锚题分数与测验分数的 相关 用于等值估计的考生样本的容量 用于等值估计的考生样本分数分布的相似性
心理测量学
等值误差
影响等值误差的主要因素(续)
测验长度 铆题数量
铆题在测验中的位置
实际的影响因素可能更多。等值还会受到
测验所关注的分数段、测验目的对分数精确性
的要求水平、测验分数的应用、计算条件等多
种因素的影响。
心理测量学
2
常用等值资料采集方法设计
常用等值资料采集方法设计
1
2 3
单组设计
随机等组 设计
铆测验— 非等组 设计
心理测量学
单组设计
单组设计:即把拟予等值的两个或多个测验 同时向同一被试组施测,然后借助于同一被 试组把拟予等值的测验联系起来,这时两组 测验分数的差异主要是由于两个测验的难度 不同而引起的,因而从理论上来说这种等值 设计既简单又无抽样误差。但实际上由于练 习效应、疲劳及厌倦等因素的影响,会给等 值结果带来误差。
心理测量学
1
测验等值概述
2
常用等值资料采集方法设计
3
测验分数等值关系计算的基本方法
心理测量学
1
测验等值概述
心理测量学
测验等值概述
测验等值的含义
A B C
等值步骤
测验等值的条件
D
等值误差
心理测量学
测验等值的含义
测验、考试被作为一种尺度来对人的心理 特质进行测量。这种尺度应该具有稳定性。 不同的考试版本之间应该具有一致性。对于 同一个测量对象,不能用这个版本测量得到 一个度量,用另一个版本测量却得到相差很 大的另一个度量。
式y上,如果它们的标准分数相等,这两个
分数就被认为是等值的。
心理测量学
线性等值
用数学公式表示,所谓测验分数x等值于
测验分数y,即有下式成立:
改写为:
其中:
心理测量学
等百分位等值
在单组设计或随机等组设计下的两个分 数,一个在测验形式 x上,另一个在测验形 式 y上,如果这两个分数有相同的百分等级, 那么这两个分数就被认为是等值的。按照这 个原理,寻找与 x 分数等值的 y 分数,只
心理测量学
随机等组设计
随机等组设计:从同一总体中随机抽取两组 考生,这两组考生被认为在能力分布上是相 同的或很接近,让这两组考生分别接受两份 不同测验X和Y,然后估计两测验形式的等值 关系。这种设计方案可克服练习效应和疲劳 等因素的不利影响。这种数据采集设计有一 个假设,即两被试样本的总体分布是相同的 。由于从同一总体抽样,因此,不考虑其间 的抽样误差,这一假设比较容易得到满足。
心理测量学
等值步骤
选择一个或多个等值的操作性定义,以确
定拟予等值的测验形式之间存在什么关系。
选择一种或多种统计估计方法
评价等值结果
测验等值的步骤一般依据以上七步完成,
有时个别步骤的顺序可能会有所调整,但总
体上不会有很大变化。
心理测量学
等值误差
等值完成后必须对等值结果进行评价。评 价等值关系可靠性与准确性的指标是等值关 系中所包含等值误差的大小。等值误差有两 类:随机等值误差与系统等值误差。测验误
心理测量学
铆测验非等组设计计算
让两个被试组分别参加两个形式的测验, 在两个测验中有部分项目是共同的——铆题,
这样两组被试被铆题铆接在一起。使用该设
计可以采用线性等值方法来完成等值计算。
心理测量学
铆测验非等组设计计算
铆测验非等组设计线性等值方法计算公式如下:
其中, 是x测验向全体被试t施测时的平均 数与标准差的估计值, 是y测验向全体 被试t施测时的平均数与标准差的估计值。
相关文档
最新文档