项目反应理论及其应用

合集下载

[心理测验]IRT理论(ItemResponseTheory)

[心理测验]IRT理论(ItemResponseTheory)

IRT理论(Item Response Theory)IRT理论概述IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质理论(Item Response Theory)是一系列心理统计学模型的总称。

IRT是用来分析考试成绩或者问卷调查数据的数学模型。

这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。

目前广泛应用在心理和教育测量领域。

项目反应理论的意义在于可以指导项目筛选和测验编制。

项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。

项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。

通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。

项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用。

项目反应理论的特点(1)独立性。

被试特质水平不依赖于被试样本的代表性;被试水平参数不依赖于测验项目组;项目特征参数不依赖于所测被试组的参数不变测验项目组。

(2)项目理论中被试水平和项目难度可以直接比较;(3)正视了测量误差和项目性能是否与被试水平相关这一事实;(4)提供了计算机化自适应测验这一策略;(5) 从计量学角度提出了自己的新观点与新技术。

历史发展IRT理论发端于20世纪50年代,它同时被丹麦统计学家Georg Rasch和美国心理统计学家Frederic M. Lord在各自的国家发展起来。

尽管采取的研究方法不同,但是他们的结果却非常相似。

F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT 理论的开端之作。

8.项目反应理论简介

8.项目反应理论简介


IRT则认为被试的能力与其对某一特定项目 的反应(以正确或错误反应概率表示)有 某种函数关系存在,确定这种关系就是IRT 的基本思想和出发点。
所以IRT可以被理解为一种探讨被试对项目 的反应与其潜在特质间关系的概率性方法。


用θ(theta)表示被试的潜在特质或能力, 用Pi(θ)表示其对项目i正确反应概率,项目 反应理论的关键就是确定θ与Pi(θ)间的函数 关系。


(二)项目反应理论的发展

由于项目特征曲线(ICC)对项目反应理论 的产生具有重要意义,所以在讲项目反应 理论的产生和发展问题时,一般都追溯到 1905年比奈和西蒙编制第一个智力量表时 的工作,他们当时所使用的作业成绩随年 龄增长而提高的散点图与现在的ICC曲线十 分类似。

IRT的真正创立者是美国心理测量学家洛德 (Lord)。1952年,洛德发表博士论文《一个 测验分数的理论》,提出了IRT的第一个数 学模型(Two-parameter Normal Ogive Model,双参数正态卵形曲线模型)及其参 数的估计方法,并把该模型应用到了学业 成绩和态度测量工作之中。

如何理解局部独立性假设呢? 由于这种独立性是针对特定的θ值的被试而 言的,所以称为“局部”。

例:假设1000名能力相同的被试参加某一能 力测验,600名被试答对了项目i,400名答 错了;这1000名被试对项目j的正确反应概 率与对项目i的正确反应概率统计上是独立 的。 总之,同一特质水平的被试回答某一项目时 不受其他项目的影响。
1.00
正确 反应 的概 率: Pi(θ)
0.50
0.00
潜在特质: θ
表1
某个项目假设的项目特征曲线

IRT项目反应理论

IRT项目反应理论
在招聘、选拔过程中,IRT可以帮助组织更准确地 评估候选人的能力。
主题研究背景
早期研究
早期研究主要集中在理论 模型的建立和验证。
当前研究
当前研究更加关注实际应 用,如在线测验、自适应 测验等。
未来展望
未来研究将进一步探索IRT 与其他技术的结合,如人 工智能、大数据等。
02
IRT项目反应理论概述
定义与概念
定义
IRT项目反应理论,也称为潜在特质理论或潜在特质模型,是一种心理测量理 论,用于描述个体在特定测验项目上的潜在特质水平与其行为表现之间的关系。
概念
IRT假设个体在某个潜在特质上的水平是连续的,并且个体在某个测验项目上的 表现是由其潜在特质水平决定的。
发展历程
起源
IRT起源于20世纪50年代,由美国心理学家伯恩斯和 金纳德提出。
THANKS
感谢观看
IRT通过建立与能力水平相对应的难度参数,能够准确地衡量学生在不同 学科领域的能力水平,从而为个性化教学和辅导提供依据。
IRT还可以用于评估学生的认知能力、学习能力和情感能力等,帮助教师 全面了解学生的发展状况,为制定教学计划和干预措施提供依据。
课程设计与优化
IRT在课程设计与优化方面也具有重要应用。通过分析学生的能力分布和项目难度参数,教师可以对课 程进行针对50年代, 随着计算机技术的发展而 逐步完善。
应用领域
广泛应用于教育、心理学、 人力资源等领域。
主题重要性
提高测验精度
IRT可以帮助研究者更准确地测量个体的能力水平, 从而提高测验的精度。
个性化教学
通过IRT,教师可以了解学生的学习需求和能力水 平,从而进行个性化教学。
人才选拔
03

项目反应理论在试题库系统中的应用

项目反应理论在试题库系统中的应用
信度 是 指 测 试 所 测 得 的结 果 的一 致 性 或 稳 定性 .稳 定 性 越 时 , 把 a bc的 初 始 值 当成 已知 , 先 、、 代入 方 程 式 估 计 能 力参 数 0 , 直 大 , 致 的程 度 越 高 , 意 味 着 测 评结 果 越 可 靠 。 一 就 一般 来 说 . 试 再 将 0作 为 已知 去 估 计 项 目参数 . 到迭 代 程 序完 成 。 测 要 求 的 信 度 应 该在 O7以 上 。信 度可 以用 再 测 信 度 、 本信 度 和 4 试 题 库 系统 的设 计 . 复 、 内部 一 致 信 度 三种 方 法 来 进 行 评 估 建 立 试 题 库 是 一个 复杂 的系 统 工 程 , 先 要 根 据 功 能 需 求 , 首 效 度 是 指 测 试 的 有 效性 和正 确 性 .即 测试 是否 达到 它 所 预 确定 试 题 的 属性 指 标 . 建立 题 库 的数 学 模 型 , 下 来 组织 大量 优 接 定 的测 评 目标 。 效度 是 一 个 相 对 概 念 . 而不 是 一 个 绝 对 概 念 . 即 秀 的在 该 领 域有 特 长 的专 家 编 写 试 题 为 了保 证 试 题 的 科学 性
指标 参 数 。 它和 区分 度 共 同 影 响并 决 定 考 生 答 题 的正 确 性 。 度 难
一ห้องสมุดไป่ตู้
LX,: . ) 丌 P 0 Q(), (l , . l = i) . , X (’ ,
j1 =

般 用 以 下公 式 计 算 : = / P代 表 试 题 的难 度 系 数 , P R N( R代 表试
12 5




21 0 0年 第 1 期
项 目反应理论在试题 库 系统 中的应用

项目反应理论的模型

项目反应理论的模型

项目反应理论的模型项目反应理论是心理学领域中的一种模型,用于量化测试者的能力水平。

该模型基于测验者对测试项目的反应,通过一些统计模型来衡量被测试者的能力水平。

项目反应理论的模型是一种非常有效的评估个人能力的工具,尤其是在教育、招聘等领域。

项目反应理论的模型是基于以下基本假设来构建的:1.每个测试项目都有一个固定的潜在难度水平,被称为难度参数。

2.每个被测试者也有一个能力水平,被称为斯洛班参数。

3.测试项目的正确反应由被测试者的能力和测试项目的难度水平共同决定。

基于这些假设,项目反应理论的模型将测试项目和被测试者的参数结合在一起,来推断受试者的能力水平。

该模型的核心是估计被试者的斯洛班参数,也称为能力水平,并将其与测试项目的难度参数进行比较。

为了实现这一目标,项目反应理论的模型采用了以下几个主要方程式:1.二项式分布方程式:用于计算测试项目正确的可能性。

2.逻辑斯蒂回归方程式:用于计算斯洛班参数和测试项目的难度参数之间的关系。

3.变异斯特林公式:用于比较测试项目的难度参数和斯洛班参数。

通过这些公式,项目反应理论的模型可以在测试被试者时精确地预测他们的能力水平。

这种方法可以应用于各种不同测试,从标准化考试到心理测试,以便评估特定领域或技能中被试者的表现。

但是,需要注意的是,项目反应理论的模型仅适用于具有可测量性的特定领域或技能。

如果测试测量的特定领域或技能不常规或难以厘定,那么这种模型是不可行的。

总的来说,项目反应理论的模型可以为教育、招聘等领域提供极具价值的工具,以量化被试者的能力水平。

这个模型的关键是能够将-test项目和被测试者的参数结合在一起,从而逐步推导出能力水平。

如果能够正确地实现这一目标,那么这种模型可以作为应用于许多各种测试和评估中的可靠而有效的工具。

项目反应理论及计算机自适应测验在临床心理评估中的应用

项目反应理论及计算机自适应测验在临床心理评估中的应用
1 1 性 和准确性得 到 了广2泛认证 1 O O O 大量研究 的开展 。I T 发 了相应 的计算机 自适 应检测 ( A )系统 ,也 得到 了较理想 。而且 随着 R CT 1 8 5 2 9 6 3 O
和 C T在非 智力测验 领域也 已在 很多 方面开 始得 到重视 和应 的结果 。例 如 ,Wa A r e等 [ 7 ]成功地利用题库 和计 算机 自适应检 用 ,包括 临床心理评估 [ s 3和人格测验领域 [ 。 ”] 测系统测量 了头痛程 度 .结果发现他们 只用测不 多于 5个条 目
Ap l a o s o e s o s e r n mp t r z d Ad p v s n i i a s c o o i a s s me t p i t n fI m Re p n e Th o y a d Co u e ie a t e Te t g i Cl c lP y h l g c lAs e s n ci t i i n n XI fn d ni MI E i g a 一, A0 Da mi n n”, ANG Y bn Y e igl
通讯作者 :苗丹民 ,E ma :pyh ̄ - i sc C mmu d . 。 l / . uc e n

3 4- 2
临春 医 程 21年2 第l卷 期 学工 0 2 月 9 第2
一》r gI1 l 。a I J 0g l J 皿龋
R 国征 兵心理检测系统也 已开 始应 用这一新兴测验方式 ,其实用 用到了临床心理评估领域 .而且还有一些研究基 于 I T分析开
q ik y I r e o p o t p l ai n fi m e p n e t e r d c mp trz d a a t e t si g i i a d v lp p a t a e t g u c l . n o d r t r mo e a p i t s o e r s o s o a o u e e d p i e t Ch n , e e o r c c l si c o t h y n i v n n i t n s s m sa d p o i ep t n s g n r l s c o o i a t t sf rc i iin , h sp p r e iwe e d v lp n si i a e d p i t d o t y t n r v d a i t’ e e a y h l g c l au o l ca s t i a e v e d t e eo me n t s r aa o e u e e p s n r h t h n n t ed r ci n . h i t s e o

项目反应理论(IRT)在小学数学成就测验中的应用

项目反应理论(IRT)在小学数学成就测验中的应用


2 o fl月 o8 0
为相应的三个分测验 。分测验及内容范围如表 1
示。
表 1 分 测验 及 测 验 范 围
trT re P rm t o i i Mo e ) 般 来 说 , e ,he— a ee L gsc d l 。一 a r t s 模
型 选 择必 须有 一 定 的理 论 依 据 和实 证研 究 。H m— a beo 认 为 ,三参 数模 型 比单 参数 和 双参数 模 型能 ltn 更 好 的拟合 测 验所 得数 据 ; 三 参数 模 型是 目前 大 团
实践五部分 ; 根据教学要求把考查 目 标分为知道 、 理
解 、掌 握 以及应 用 四个层 次 。本研 究 着重考 评 学生
的能力或特质水平与测验条件下被试对项 目 所作反 应之间的关系的描述和假设也不 同。项 目反应理论 是通过建立一定 的项 目反应模 型来描述这种关 系
的 , 的基 本假 设 主要 有 以下 三种 : 维性 假 设 、 它 单 局
分测验
测试 内容范围
撕 今 整数 、 数 、 数的概念或 定义 的认 识理 解 , 式 、 小 分 公 定 姒 理 数量关系的认识理解

家公认 的最有效且应用最广的二级评分 的 IT模 R 型, 适合于选择题和是非题 , 与实际测验结果匹配相 当好l 17 年,ohm等人经过实证研究发现, 3 9 8 Pp a 】 。 数 学成就测验能更好的拟合三参数模型 ,使测量误差
项 目反应理论(RT) I 在 小 学 数学 成就 测 验 中 的应用
李 映红 张绍 军
【 要】目 : 摘 的 尝试在项 目 反应理论的指导下 , 编制四年级数 学成就测验 , 为学科评 价提供辅助 工具 。方法 : 用贝佳方 法检验 试测数据 的单 维 } 利用A O E 生, N T 软件估计项 目参 数 , 用基 于题 目分类下的经验判 断法建立一个划界 分数 , 再接 合项 目信息量和双向细 目表编制成卷 。结果: 四套试卷均符合单维性要 求, 基本拟合三参数逻辑斯蒂克模型 , 目拟合 项

项目反应理论原理与当前应用热点概览

项目反应理论原理与当前应用热点概览
1 . 1 测 验 分 数 对 具 体 测 验 的 依 赖 性
此, 这两个参数 的量表是不一致的, 是不可匹配比较 的 。在 实 际使 用 中 , 不利于 针对性 地选题 施测 。
1 . 4 测验误 差估 计的 不精 确性
在 经典测 验理 论 中 , 测验 的误 差值 是 由测 验 的
热 点 内容 。
关键词 : 项 目反 应 理 论 ; 原理 ; 基 础模 型 ; 应 用热 点 中图 分 类 号 : B 8 4 1 . 2 文献标识码 : A 文章编号 : 1 0 0 3— 5 1 8 4 ( 2 0 1 3 ) 0 5— 0 3 9 2— 0 4
1 经典 测验 理论 的局 限性 经典 测验 理论 ( C l a s s i c a l T e s t T h e o r y , C r I T I 1 ) 是在
1 . 5 测量 结果拓 广 的有限性
在测 量实践 中有这 样 的 一对 矛 盾 : 我 们 既希 望
测量 的结 果是准 确 的 , 又希 望 该 测量 的结 果 可 以在
任何 环境 下使用 。但 是 , 测 量又宛 如实验 , 结果 的准 确性 依赖 于 对 环 境 的 控 制 , 控制得越好 , 结 果 越 准

验” 的概念才获得实际可求 的“ 信度” , 而实践中严 格平行的测验是不存在的, 因此 , 在这一假设基础上 估得 的信度 是不精 确 的 , 从 而 导致 测 验误 差 的估值 也是不精确 的。其次 , 经验 告诉 我 们 , 同一测 量对 不 同被试施测有不 同的误 差。在经典理论 中, 测验 的误 差估值只有 一个 , 是 非 常笼 统 的。其三 , 经典 理论 的 误差估值是相 对 于整份 试卷 的。至 于某 一具 体项 目 对某一具体被 试施 测 , 其 误差将 会 是 多大 , 其 与 总测 验误差是什么关系 , 在经典测验理论 中根本未曾涉 及, 这 同样 给测 验编制选择和组合项 目带来 了不便 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


概化理论认为,测量的总方差可以分解为代表目标测量的 方差成分和构成误差的种种方差成分。测量工作中要加以 认识和予应用的心理特质水平是测量目标。而构成测量条 件与具体情境关系的因素,称为测量侧面(Facets of Measurement)。如学生阅读能力测验,• 其目的是对学生阅 读能力的测量,因此,阅读能力就成为测量目标,除此外 试题的水平和评分者等因素也会影响测验的总变异。这两 个因素就是测量侧面。这里对学生阅读能力的测量是在双 侧面情境的条件下进行的。测量侧面中的单个事例叫侧面 的水平,如有两个评分者甲和乙,则评分者这一侧面就有 两个水平。测量侧面又分为随机侧面和固定侧面。随机侧 面是指测量侧面中所包含的各水平中是类似水平的随机样 本,而非固定不变的侧面,如大规模考试中评分者每次都 有可能不同,由这样变化的评分者所组成的测量侧面就称 为随机侧面。固定侧面是指在各次实施中测量侧面的所在 水平一直保持不变的测量侧面,如标准化的心理测验中测 验的项目总是一样,这样的侧面就叫固定侧面。
项目反应理论及其应用
中国水利水电出版社
概化理论

凡测量都有误差,误差可能来自测量工具的不标准或不适合所测 量的对象,也可能来自工具的使用者没有掌握要领,也可能是测 量条件和环境所造成,也可能是测量对象不合作所引起。总之产 生测量误差的原因是多种多样的,而CTT理论仅以一个E就概括了 所有的误差,并不能指明哪种误差或在总误差中各种误差的相对 大小如何。这样对于测量工具和程序的改革没有明确的指导意义, 只能根据主试自己的理解去控制一些因素,针对性并不强。鉴于 此种情况,二十世纪六十至七十年代初,克伦巴赫(Cronbach)等 人提出了概化理论(Generalizability Theory)简称GT理论。

概化理论强调,测量目标是具体的,并不是绝对固 定不变的。因而全域分数也就不固定,可以有多种。 一方面,当固定侧面时,侧面本身会转化为测量目 标的一部分(如对一般阅读理解能力的测量转变为 对科技说明文的测量),测量目标要局限化;另一 方面,当测量中考察目的与应用需要改变时,测量 目标对象就可能完全转移。比如,当作文考试结果 是要对考生作判断时,测量目标就是考生的作文能 力,若要把评分严与评分宽的评分者区分开,评分 者的能力就成了测量目标,也即测量目标就完全发 生了转移。显然,测量目标不同时,标志测量目标 的分数也就不同。测量目标在具体关系条件下的分 数叫全域分数。这样,有时对同一批测量资料来说, 当测量工作的具体关系变化时全域分数也会变。即 同一测验资料就可能有多种全域分数。
IRTP主要具有如下功能: 可同时计算IRT二级评分项目和多级评分项目的项目参 数及考生的能力参数,并将能力参数转换成人们习惯 的“分数”。 可绘制项目特征曲线、项目信息函数曲线、测验分数 分布直方图、最优分数分布直方图和能力分数分布直 方图等各种相关图形。 可对逻辑斯蒂模型和测验数据集进行卡方拟合检验。 可计算经典测量理论的项目参数(难度、区分度)、 信度系数以及测验标准误。
1Ui i
(9-4)
式中 Qi =1— Pi ,其中 Pi 由(9-3)式 确定
联合极大似然估计
若有N个被试,经过n个试题的测试, 根据作答的反应矩阵,我们可以应用联合 极大似然方法,同时,估计出所有被试的 能力(特质)水平和所有试题的参数 值 ai ,bi,ci 。
9.3 项目和测验的信息函数
测验信息函数
测验信息函数是项目反应理论中非常 有用的一个特征,它能从根本上告诉研究 者一项测验在整个能力分数范围内对被试 能力水平进行估计的精确程度。
[ Pi ( )] I ( ) Qi ( ) i 1 P i ( )
N ' 2
(9-12)
项目反应理论参数计算软件IRTP简介
c
9.2 项目反应模型的参数估计
9.2.1 项目参数已知的能力参数估计 9.2.2 联合极大似然估计
9.2 项目反应模型的参数估计
项目反应理论用项目特征曲线表示被 试的潜在特质与其对项目的正确反应的概 率之间的关系,再用一定的数学模型拟合 项目特征曲线,从而为估计被试的潜在特 质奠定了基础。
项目参数已知的能力参数估计



概化理论把全域分数方差对总变差的比称为为概括力系数(简称G系 数)。而总方差可以分成全域分数方差(δ2 (p)和误差分数方差(δ2(δ)), 如果测验是常模参照性测验,则G系数E2ρ是评价测验稳定性程度的最 佳指标: 即: E2ρ=(δ2(p))/[ δ2(p) +(δ2(δ))] 若该测验是标准参照性测验,则其依存性j指标是测验稳定一致性的最 好指标。 j=(δ2(p))/[ δ2(p) +(δ2(△))] 上两式中,误差方差δ2(δ)可能是很多项的和,如上例中考生的阅读 理解能力的方差是标志测量目标的方差,即为全域分数方差记为 (δ2(p)),而试题、评分者及三个主效应间的交互作用方差(共有7种 方差成分)都不应包括在全域分数方差之中,作为误差方差(δ2(δ))的 一部分,是构成总方差的成分之一。由此可见,当全域分数方差不变, 而误差分数方差增大时,概括力系数值降低,信度降低。反之,当全 域分数方差增大,而误差分数方差不变,则概括力系数增大,信度提 高。所以,随着测量情境关系的变化,测量目标与侧面的变动,概括 力系数即信度也就会不同。同一批资料就可能有多种不同含义与取值 的概括力系数。一般说来,增大概括力系数的方法有两种:第一种是, 固定测量侧面(如固定试题)。第二种是增加侧面所包含的水平数 (如增加试题或评分者数目)。(漆书青,1993)
目录
1 2 3 4 项目反应理论概述 项目反应模型的参数估计 项目和测验的信息函数 项目反应理论的应用
9.1 项目反应理论概述
9.1.1 9.1.2 9.1.3 9.1.4 项目反应理论的产生 项目反应理论的含义 项目反应理论的发展 项目反应理论基础模型例举
项目反应理论的产生
1.经典测量理论的局限和不足,其不足表 现在以下几方面: 按经典测量理论所求出的难度、区分度、 信度和效度等质量指标,严重依赖于样 本,样本的代表性好坏直接影响着这些 参数。
3.选题策略 项目反应理论指导下的选题策略有两 种: 自动组卷的选题策略 自适应测验的选题策略。
题目参数等值
题库的题量很大,项目参数的估计都 要分批进行,在不同批次获得的参数值, 一定要使用等值技术转换到同一量表系 统上去。在项目反应理论中,由于题目 参数估计具有跨群体不变性和潜在特质 参数估计具有可选择性,使来自不同群 体施测的题目参数可以用参数等值方法 将它们统一于同一个单位系统中,这就 保证了题目参数的准确性。



概化理论是用方差分析的方法来全面估计出各种方差成分的相对大小, 并可直接比较其大小。虽然真分数理论也可以分别地估出某一方差成 分的大小,如代表试题侧面的内部一致性系数,代表评分者侧面的评 分者信度等,正因为是单独估出的,这些值之间不能直接比较,也只 有对主效应作估计,而不能对交互作用进行估计。而概化理论却能做 到这一点。它既能估计出主效应,也能估计出交互作用效应,并能对 各估计值的大小进行直接比较。在概化理论中,理论估出各方差成分 相对大小的过程,叫概化理论的概括分研究阶段或称G-研究阶段。 概化理论并不内静止地分析各种误差来源,还要在G-研究的基础上, 通过实验性研究,进一步考察不同测验设计条件下的概括力系数的变 化状况,如固定侧面或增加侧面水平下的变化状况,从而探求到最佳 的控制误差的方法,作出最佳的设计决策,从而改进测验的内容、方 式方法提供了有价值的信息。这一阶段称作决策研究或称D-研究阶段。 GT在研究测量误差方面有更大的优越性,它能针对不同测量情境估计 测量误差的多种来源,为改善测验,提高测量质量有用的信息。其缺 陷是统计计算相当繁杂,如果借助一些统计分析软件可以解决这一问 题。GT理论目前在我国还处于实验研究阶段,在面试、考核等主观性 测评中有一些应用何测量都处在 一定的情境关系之中,应该从测量的情 境关系中具体地考察测量工作,提出了 多种真分数与多种不同的信度系数的观 念,并设计了一套方法去系统辩明与实 验性研究多种误差方差的来源。并用 “全域分数”(Universe Score)代替“真 分数”(True Score)• ,• 用“概括化系数, • G系数”(Generalizability Coefficent)代 替了“信度”(Reliabilty)。
项目反应理论基础模型例举
逻辑斯蒂模型有单参数、双参数及三 参数之分,其函数表达式分别为:
P i ( )
1 1 e
D ( bi )
(9-1)
Pi ( )
1 1 e
Dai ( bi )
(9-2)
项目反应理论基础模型例举
1 ci Pi ( ) ci Dai ( bi ) 1 e
将题目参数已知的测验施测后,我们 要根据被试所得分数矩阵估计出被试的能 力(特质)参数,为了方便,首先考虑一 个被试。 若能力(特质)水平为的被试在第题 上的反应变量为,如果为1或0取值的二分 变量,则该被试在第 i 题上的答对率为:
项目参数已知的能力参数估计
P(Ui / ) P i Q
Ui
(9-3)
式中, Pi ( ) 表示能力为的被试在项目上正确作答的概率; 表示被试的能力;bi 表示项目i 的难度参数; e 表示自然对数之底=2.71828; D表示量表因D=1.7; ai 表示项目 i 的区分度参数; i 表示项目i 的伪随机水平 参数,习惯称猜测参数。 上述三个模型中以三参数逻辑斯蒂模型应用最为广泛。
项目反应理论的产生



经典测量理论中测验信度的估计是真分数方差 与测验总方差之比,但这是建立在两个前提假 设的基础之上,即个体的测验总分仅线性分解 为真分数和误差分数两部分,并且这两个部分 是相互独立的。 经典测量理论认为人的测验总分是这个人在些 特质上的真分数和测量误差之和。 经典测验理论多是使用匹配和随机化来进行误 差控制 。
相关文档
最新文档