心理测量课件-项目反应理论
IRT项目反应理论

首先
自尊是一个很普通的测量结构,大部分 现有的测量工具多是多维的。这可能说 明了IRT模型不是很适合数据。
Reality
[Image information in product] ● Title Image : ● Note to customers: This image has been licensed to be used within this PowerPoint template only.
You may not extract the image for any other use.
Gray-Little也发现i1参数(最低反应类别的阈限参数)很难估计, 因此说明很少应试者选择这一极端。 在检查10个项目中的7个的ICC图时 :
LOGO
第12章
IRT
在人格和态度测量中的应用
组员:雷晓鸣 丁凌云 指导老师:曹亦薇
目录
Company
L/O/G/O
用IRT分析人格和态度量表 评估维度 用IRT进行量表分析 态度测量中的IRT Add Your Text in here
引言
在成就和才能测验中,IRT程序已经能很好的运用了。 但是将IRT模型应用于typical performance(例如,人 格、态度) 是很困难的。
IRT项目参数和项目特征曲 线的主要优势在于他们可以
转变为项目信息曲线。
优势 一
优势 二
优势 三
项目难度和项目区分度, 都不是依赖于样本的 。 IRT会提供更少的含糊不
清的解释。
《心理测量学课件》课件

心理测量的伦理原则
尊重被试者权利
公正性原则
确保被试者在心理测量中的权益,不侵犯 其隐私和尊严。
对待所有被试者一视同仁,确保测量结果 的客观性和公正性。
诚信原则
保密原则
对被试者提供准确、全面的测量信息,避 免误导或欺骗。
对被试者的个人信息和测量结果进行严格 保密,防止泄露。
心理测量的法律规范
法律法规遵守
招聘流程优化
心理测量可以简化招聘流程,提高招聘效率。通过标准化测试和评估,企业可以快速筛选出符合要求的候选人, 减少面试和试用期的时间和成本。
教育评估与诊断
学生评估
心理测量可以用于评估学生的学习能力、性格特点、兴趣爱 好等,帮助教师了解学生的个性差异,为个性化教育提供依 据。
诊断与干预
心理测量可以为教育机构提供诊断工具,识别学生的学习困 难和行为问题,进而制定相应的干预措施,提高教育效果。
误差来源识别
通过统计分析方法,识别误差的主要来源,为改进测量方法和提高 测量精度提供依据。
03
心理测量的常用工具
智力测验
总结词
智力测验是一种评估个体智力水平的工具。
详细描述
智力测验通常包括语言、逻辑、数学、空间等方面的测试,通过一系列问题或 任务来评估个体的智力水平。常见的智力测验有斯坦福-比奈智力量表、韦氏智 力量表等。
随着心理测量学研究的深入,心理测验将更加标 准化和客观化,以提高测验的准确性和可靠性。
跨文化比较
心理测量将更加注重跨文化比较研究,以了解不 同文化背景下人们的心理特征和行为差异。
3
动态评估
心理测量将逐渐从静态评估转向动态评估,以更 好地反映个体心理状态的变化和适应性。
心理测量在人工智能领域的应用
项目反应理论简介

经典测量理论的测验编制
• 假设被试的特质是正态分布,从而 测验总分的分布也是正态
• 测验分数尽可能区分被试,因此测 验总分的变异程度越大越好
• 测验中试题的难度中等为好,区分 度越大越好
经典测量理论的缺陷
• 参数依赖于样本 • 能力量表与难度量表不统一 • 对于所有被试的测量误差相等 • 无法反应潜在特质与被试作答之
参数估计时标尺的建立
P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,-0.15,0.2)
P
0.2
1
1 0.2 e 1.710.5( 0.8)
0.2
1
1 0.2 e 1.71( 2 0.7 )
间的关系 • 在测验编制问题上的困惑
准备知识
• 标准分数
Z XX S
• Z>0,高于平均,Z<0,低于平均 • P(-1.96<Z<1.96)=0.950 • P(-3<Z<3)=0.997
A1 1 1 0 1 0 0 0 1 16 B0 1 0 1 1 1 1 0 1 0 6 C1 0 1 0 1 1 0 1 1 1 7 D1 1 1 0 0 0 0 0 0 14 E11110110107 F11000010115 G1 1 1 0 1 1 0 0 1 17 H0 1 1 1 1 0 1 1 1 18 I 10001001104 J 01100010014 总7 8 7 3 6 4 5 3 8 7
1
c3
1
1 c3 e1.7a3 ( b3 )
心理测量学(项目分析)PPT课件

2021/3/12
心理测量学 郭志峰 7
难度公式(通过率)
公式3:
CP KP1 K 1
CP为校正后的通过率,P为实 得通过率,K为备选答案数目。
相关的显著性检验:Z大于1.96为显著相关
Z rb
1 • pq yN
2021/3/12
心理测量学 郭志峰 21
项目特征曲线
❖item characteristic curve, ICC
❖ 项目特征曲线描述了效标分数不同的被试在该 项目上的通过率。
❖ 曲线坡度越陡,鉴别力越好,预测的误差越小。
正
区分度的计算
❖ 注意: ▪ 要求二分变量的分布是正态。 ▪ 要求连续变量分布是单峰对称
2021/3/12
心理测量学 郭志峰 17
区分度的计算
(2)皮尔逊积差相关 适用于两个连续变量。如
语文科分数与总考分(不划分)
r xy
x•
Sx
N
y
Sy
rxy
xy N Sx Sy
2021/3/12
心理测量学 郭志峰 18
❖ 当题目之间正相关时,题目难度值应分布的广 些但平均难度应以0.50为好。
❖ 对于选择题来说,难度一般应大于猜测概率; 当题目有猜测可能时,题目的 P 值应适当加大。
2021/3/12
心理测量学 郭志峰 10
测验难度水平的确定
❖ 效标参照测验、掌握测验:不考虑难度; ▪ P=1.0或P=0有可能也是好题
69
7 8
心理测量理论上 PPT课件

25
纠正错误的测验观
错误的测验观 测验万能论:IQ 99分与100分的差别 测验无用论 心理测验即智力测验
正确的测验观 心理测验是重要的心理学研究方法之一,是决策 的辅助工具 心理测验作为研究方法和测量工具尚不完善
2019年11月
深圳市精神卫生中心 临床心理科 位照国
26
心理测验在心理咨询中的应用
智力测验
常用的有 吴 天 敏 修 订 的 中 国 比 内 量 表 龚 耀 先 等 修 订 的 W A I S - R C 、 C - W I S C 、 C WYCSI,林传鼎修订的WISC-CR 张 厚 粲 等 修 订 的 瑞 文 标 准 型 测 验 S P M , 李 丹 修 订的联合型瑞文测验CRT。
10
测量量表
等比量表
有单位 有绝对零点 比较大小 加减乘除 如长度、重量等
心理测量?
2019年11月
深圳市精神卫生中心 临床心理科 位照国
11
心理测验的基本概念
依据心理学理论,使 用一定的操作程序, 通过观察人的少数有 代表性的行为,对于 贯穿在人的全部行为 活动中的心理特点做 出推论和数量化分析 的一种科学手段(科 学测量)
测验
2019年11月
深圳市精神卫生中心 临床心理科 位照国
23
高考
2019年11月
深圳市精神卫生中心 临床心理科 位照国
24
按测验要求分类
最高作为测验 要求被试做出最好的回答,有正确答案 智力测验、教育成就测验
典型行为测验 没有正确答案 各种人格测验
2019年11月
深圳市精神卫生中心 临床心理科 位照国
21
TAT
( 主 题 统 觉 测 验 )
项目反应理论

项目反应理论项目反应理论(item response theory)也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。
项目反应理论假设被试有一种―潜在特质‖,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。
项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。
通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。
项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用。
一、项目反应理论的概念项目反应理论(Item Response Theory, IRT)是一系列心理统计学模型的总称,是针对经典测量理论(Classical Test Theory,简称CTT) 的局限性提出来的。
IRT是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。
目前广泛应用在心理和教育测量领域,基于IRT理论的计算机自适应测试(CAT)是CAA 常用的测试方法。
潜在特质模型(latent trait model)认为,在被试样本可观察到的测试成绩和基于该成绩不可观察的特质或能力之间存在着联系。
二、IRT的理论体系(三条基本假设)–假设一:能力单维性假设——指组成某个测验的所有项目都是测量同一潜在特质;–假设二:局部独立性假设——指对某个被试而言,项目间无相关存在;–假设三:项目特征曲线假设——指对被试某项目的正确反映概率与其能力之间的函数关系所作的模型。
IRT最大的优点是题目参数的不变性,即题目参数的估计独立于被试组。
它假定,被试在某一试题上的成绩不受他在测验中其他试题上的成绩影响;同时,在试题上各个被试的作答也是彼此独立的,仅由各被试的潜在特质水平所决定,一个被试的成绩不影响另一被试的成绩,这就叫做局部独立性假设。
项目反应理论
项目反应理论任何一种理论都不可能是完美无缺的,作为测量初期发展起来的理论更是不可避免地存在着一些缺陷。
项目反应理论(Item Response Theory, IRT)则是在反对和克服传统测量理论的不足之中发展起来的一种现代测量理论。
无论是CTT还是GT,其测验内容的选择、项目参数的获得和常模的制定,都是通过抽取一定的样本(行为样本或被试样本),因此可以说二者都建立在随机抽样理论基础之上。
它们的局限性主要表现在以下几个方面:(1)信度估计的精确性不高测量的重要目标就是降低测量误差,提高测量的精度。
在经典测量理论中,信度被定义为真分数的方差与实得分数(原始分数)的方差之比。
然而,在此定义中,真分数的方差和误差的方差都无法求取。
为了估计信度,CTT又提出了平行测验的概念,并在此基础上推演出了若干个信度估计公式。
但是严格的平行测验是不存在的,等价测验也很难获得的,在此基础上估计的测验信度很难达到比较高的精确程度。
另外,经典测量理论中的信度估计值也是一个笼统值,即假定对不同能力水平的被试来说,测量的误差是相同的。
而事实是,一份测验只有在施测于能力水平与测验难度相当的被试时容易获得比较高的测量精确度。
当测验施测于能力水平高于(或低于)测验难度的被试时就容易产生较大的测量误差。
而且测量误差值会随着被试水平与测验难度距离的增加而变大。
(2)各种测量参数的估计依赖于被试样本经典测量理论构造了一个完整的理论体系,同时设计了一套参数指标来刻划测量各方面的特性。
如信度、效度、项目的难度、区分度等。
但是这些参数的估计对样本的依赖性是很大的。
如项目难度,对于同一题目,若样本的群体水平较低,就有较高的难度估计值。
测验的信度和效度采用相关分析法,同样受到样本的影响。
为避免抽样误差对参数估计的影响,经典测量理论特别强调样本对总体的代表性。
但经典理论所用的是随机抽样,随机抽样总有一定偏差存在。
何况在实际工作中,由于客观条件的限制,还不能做到随机抽样。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.8
0.6
0.4
0.4
0.2
0.2
0
-3
-2
-1
0 Scale Score
1
2
3
0
-3
-2
-1
0 Scale Score
1
2
3
28
心理测量
心理测量
测量信息函数和测量误差
测量误差等于信息的开方的倒数。 测验信息等于组成测验的各个项目的信息之和。
Test Information and Measurement Error
2012/5/25
心理测量
第十五讲 项目反应理论
黄飞 博士
华中师范大学心理学院
主要内容
一、经典测验理论的缺陷 二、项目反应理论的简介 三、项目反应理论的优点 四、项目反应理论的应用
1
2
心理测量
心理测量
学习目标
了解经典测量理论的局限
领域 心理 教育 医学 管理 社会 体育 资料库 PsycInfo Eric Medline ABI/INFORM Global Sociological Abstracts SportDiscus 数目 1968 1654 801 133 62 51
9
是概率模型,因为被试对于测验项目的反应除了 受到某种特定“特质”的支配外,还受到许多随机 因素的影响。从某种意义上讲,IRT的核心就是数 学模型的建立和对模型中各个参数的估计。
10
心理测量
心理测量
两种学派
Rasch学派(怀疑数据):利用测量模式检验数 据,如果数据不吻合模式预期,检查数据(题意 不清?考生乱答?);修正后,重新检验之,期 望能得到客观等距量尺。代表人物: G. Rasch; G. Fischer; B. Wright. Non-Rasch学派(怀疑模型):利用IRT模式描述 数据,如果模式不吻合数据,换一复杂的模式,
项目反应函数IRF
项目特征曲线对应的函数
逻辑斯蒂函数
15 16
心理测量
心理测量
确定ICC形态的参数
b: 项目定位,项目难度 a: 项目区分度 c: 低渐近线,猜测度参数 d: 高渐进线,项目天花板参数 : 个人参数
参数b的含义
17
18
3
2012/5/25
心理测量
心理测量
参数a的含义
参数c的含义
12
2
2012/5/25
心理测量
心理测量
潜在特质与观测反应之间的关系
逻辑斯蒂函数和正态分布的累积分布函数
13
14
心理测量
心理测量
项目特征曲线和项目反应函数( ICC/IRF)
项目特征曲线 ICC和对应的函数
项目特征曲线,记作P(θ)
用反映被试水平的稳定潜在特质变量作为回归曲 线的自变量,预测题目正确作答概率的回归曲线。 然后根据实际作答的正确概率推测其特质的水平
– is assumed to be a unidimensionality random variable and not a multidimensionality random vector.
直到吻合为止。代表人物 : F. Lord; A. Birnbaum;
F. Samejima.
11
(Yij ji j ) 2 2 2 j
) Linear
Model
Normal
25
26
心理测量
心理测量
2PL和1PL
Pj (i ) exp[1.7 j ( i j )] 1 exp[1.7 j ( i j )]
Pj ( i )
exp( i j ) 1 exp( i j )
2-Parameter Logistic (Logistic Metric)
特质水平的差异的相对重
要性、项目的难度取决于 项目的区分度。 1.7的加入是使得 L模型与 正态卵形模型接近。
1.4
1.4
1.2
1.2
1.0
1.0
Infor mation
差为1的分布。
27
0.6
Infor mation
0.8
Item Information C urve: 4
2-Parameter Logistic (Logistic Metric)
量表中各个项目的斜率允 许不同。
量 表 中 所 有 项 目 的 的 区分度均等。 潜 在 能 力 值 常 常 被 假 定满足均值为 0,标准
Item Information C urve: 3
7
项目反应理论简介
• 项目反应理论( Item response theory, IRT )是一 组理论,即应用数学模型拟合数据的一组理论。 • IRT模型应用数学函数来阐明不同反应结果的概率。 • IRT 理论为我们评价测量工具和其中的具体的项目性能如 何提供了一个基础。心理测量学家使用 IRT 以达成不同的 目的,如开发和修订测验,维护测验项目库,测验等值。 • IRT 常常被称为潜在特质理论,强真分数理论,或现代心 理测验理论。
5 6
年份 2006 2007
数量 235 286 301 350 388 449 163
9.72% 8.98% 8.52%
2008 2009 2010
8.29%
2011
6.31% 4.60% 3.91%
2012
注:以item response theory为主题词 在Web of Knowledge中检索。
31
模型拟合检验
考察模型假设与实际数据是否吻合
Set j to 1
2PL
Pj ( i )
23
exp( i j ) 1 exp( i j )
1PL, Rasch
24
4
2012/5/25
心理测量
心理测量
多级计分数据的IRT模型
Pj ( X ij k | i ) P ( X ij k ) P ( X ij k 1)
Pj ( i )
exp( i j ) 1 exp( i j )
Pj ( i )
exp[ ( i j )] 1 exp[ ( i j )]
h* exp( jk i c jk ) hd k exp( jk i c jk )Multiple
8
心理测量
心理测量
潜在特质理论
项目反应理论又称潜在特质理论( latent trait theory) 基本思路是:确定被试的心理特质值和他们对于
项目的反应之间的关系,这种关系的数学形式就是
“项目反应模型”。
基本思想:和心理学中关于潜在特质的一般理论 有关。假设被试对于测验的反应是受某种心理特 质的支配,那么我们首先就要对这种特质进行界 定,然后根据特质分数的高低来预测和解释其对 于项目或测验的反应。因为这种特质无法直接测 量,故称作潜在特质。
经典测验理论的局限
测验属性参数估计依据样本,会因抽样变动大 对被试的能力估计与对项目的难度估计难比较 所有被试的测量误差相等的假设禁不住检验 潜在特质与观测分数之间的线性关系的假设禁不 住检验 复本难实施,信度概念不利于操作 特质估计取决于测验的项目构成 测验编制中的困惑:难度不同项目对特质估计相同
Frequency
引言
项目反应理论在各领域的应用趋势(1980~2005)
140 120 100
了解项目反应理论的基本思想
了解项目反应理论的应用前景 掌握项目反应理论的分析思路
80 60 40 20 0
19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05
exp(
s 1
js i
c js )
Response Model
量 表 中 所 有 项 目 的 难 度 参数b之和为0。 所有项目的斜率均为1。
量 表 中 所 有 项 目 的 的 区分度均等。 潜 在 能 力 值 常 常 被 假 定满足均值为 0,标准 差为1的分布。
Pj (Yij yij | i ) ( 2 j ) 0.5 exp(
Set
4PL
j to 1
Pj (i ) j (1 j )
exp( j (i j )) 1 exp( j (i j ))
Set
3PL
j to 0
Pj ( i )
exp( j ( i j )) 1 exp( j ( i j ))
项目反应理论的三个假设
• 局部独立性假设(local independence)
–
I J
P( X x | ) P( X ij xij | )
i 1 j 1
• 单调性假设(Monotonicity)
– , P。 – 潜在特质和观测到的反应之间的关系有特定的形态
• 单维性(Unidimensionality)
Year
注:摘要中含有item response theory。
3 4
心理测量
心理测量
2006~2012
项目反应理论在各领域的应用趋势(2006~2012)
PSYCHOLOGY MATHEMATICS MATHEMATICAL METHODS IN SOCIAL SCIENCES PSYCHIATRY PUBLIC ENVIRONMENTAL OCCUPATIONAL HEALTH HEALTH CARE SCIENCES SERVICES EDUCATION EDUCATIONAL RESEARCH NEUROSCIENCES NEUROLOGY SUBSTANCE ABUSE REHABILITATION 1034 271 264 211 195 185 180 137 100 85 47.61% 12.48% 12.16%