心理测量 第六章 项目分析

合集下载

第六章 测验的项目分析

第六章 测验的项目分析
难度 区分度 猜测问题 多选题的项目分析
• 信度和效度分析是对测验质量的整体评价。 • 项目分析是对测验中每一个测题的质量进 行的分析。 • 项目分析的目的是通过分析改进项目统计 量进而提高测验的信度和效度。 • 项目分析包括分析质的分析和量的分析。
第一节 项目的难度
一、难度的意义
• 难度一般是指测验项目的难度,当然 也可指一个测验的难度。后者是其所 包含的所有测题难度的综合指标。我 们这里所讲的是项目的难度。 • 从心理学角度看,难度是被试在作答 项目时心智操作感到的难易程度。
• 提出者 – 美国测验学家:伊贝尔(L. Ebel)
测题鉴别指数与评价标准
区分度(D) 0.40以上 0.30-0.39 评 价
非常良好 良好,如能改进则更佳
0.20-0.29
0.19以下
尚可,仍需再改进
劣,必须淘汰或加以修改
极端组的划分
• 高低组的比率介于25%---33% • 标准化测验采用27% • 样本人数过少时,可以用50%作为分界点。 • 此方法只利用了一部分信息,精确性差一 些。
(二)非0、1记分项目
X P X max
某题的 平均得分
该题的 满分值
例4-4:某试卷中一 论述题为20分,10 名参加测验者得分为 10、18、14、8、 18、3、14、10、 9、8。试问该题的 难度是多少?
112 X 11 .2 10 11 .2 P 0.56 20
• 2、极端分组法
三、区分度与难度的关系
• 难度是区分度的必要条件
– 难度愈接近.50,试题区别作用愈大。 – 较难项目,对高水平被试区分能力高 – 较易项目,对低水平被试区分能力高
– 中等项目,对中等水平被试区分能力高

心理测量学第六节 心理测验的编制程序

心理测量学第六节 心理测验的编制程序

❖ 常用的心理测验常模有百分位常模,标 准分常模,发展常模及商数等。
例:16PF成人的男常模
编制测验说明书
❖ 测验的目的与功用 ❖ 测验的理论依据 ❖ 测验实施方法 ❖ 测验的标准答案和计分方法 ❖ 常模资料 ❖ 测验的基本特征(信度、效度等)
瑞文标准推理测验(目的与功用)
❖ (Raven's Standard Progressive Matrices简称 SPM)是英国心理学家瑞文(J.C.Raven)1938年设 计的非文字智力测验。
能力。 ❖ (5)机械记忆——对事物进行强记的能力。 ❖ (6)知觉速度——准确迅速观察和识别事物的能力。 ❖ (7)一般推理——根据已知判断推出未知判断的能力。
目标分析三种情况
❖ 工作分析 ❖ 对特定概念下定义 ❖ 确定测验的具体内容
描述性的显示 测验,目标分 析的主要任务 是确定显示的 内容和技能, 从中取样。
二、预测和项目分析
❖ (一)预测 ❖ (二)项目分析
预测应注意问题
❖ (1)预测对象应取自将来正式测验时准备施用 的群体,虽然人数不必太多,但要具有代表 性。
❖ (2)预测的情境应力求同正式测验的情境一致。 ❖ (3)预测的时限可以适当延长,以便每一受测
者都能将题目做完。 ❖ (4)施测者应对受测者的反应加以记录。
目标分析三种情况
对于选拔和预测功
❖ 工作分析 (job analysis)
用 的预测性测验. 两个步骤:一是确 定哪些心理特征和
行为可能使要预测
❖ 对特定概念下定义 的活动成功,二是
建立衡量被试是否
❖ 确定测验的具体内容 成功的标准。
目标分析三种情况
❖ 工作分析 ❖ 对特定概念下定义 ❖ 确定测验的具体内容

心理测量学第六章-测验题目性能与题目编写(项目分析).PPT

心理测量学第六章-测验题目性能与题目编写(项目分析).PPT
根据题干从备选项中选出正确选项的题目。单项 选择题指只有唯一正确选项的选择题。 2、特点功能: ①评分标准明确,评分客观,有利于减少评分带来 的评分误差。 ②有利于对基础知识和基本技能进行考查。
③选择题适合考查较低层次的能力,如识记能 力、较低的理解能力等,而不宜考查较高层 次的能力,如综合能力、创造性和独立思维 能力。
一、区分度的定义
(一)定义 ❖ 测验项目对所测量的心理特性水平差异的区分能力或鉴别。 (二)作用 ❖ 测验是否有效度的“指示器”。 ❖ 若区分度高,则水平高者得分高,水平低者得分低;若区分
⑤行为情景判断题设问方式一般有四种形式: 一是要求受测者选择最优行为项,二是要求 受测者选择最差行为项,三是要求受测者同 时选择最优和最差行为项,四是要求受测者 针对每一行为项的有效性做出评价。应根据 实际选择具体方式。
第二节 测验题目的难度与难度控制
一、难度的定义 二、难度的计算 三、测验难度水平的确定 四、难度的等距变换 五、测验的难度对测验分数分布的影响
的差异等于第2题和第3题间的差异。 (二)解决方式:等距变换,即把难度P转换成标准分数Z。 ❖ Z分数(0,+1σ)约占全体人数的34%,(1σ,2σ)间占全体人数的
13.5%。 ❖ 项目A通过率为84%(难度为0.84),难度值为-1σ。 ❖ 项目B通过率为16%(难度为0.16),难度值为+1σ。 ❖ 项目C通过率为50%(难度为0.50),其难度为0。
②论述题和计算题不仅能够考查考生较低层次的能 力目标,而且能够比较好地考查较高层次的能力 目标。
③论述题和计算题能够反映考生的思维过程,因而能 比较有效地考查考生接受信息、鉴别和选择信息的 能力,分析、推理、综合应用知识的能力,能鉴别 出考生对问题解决的程度。

心理测量学 第六章 项目分析

心理测量学 第六章  项目分析
CV 9 . 80 14 . 44 0 . 22 ;

题目B的方差为3.88,
3 . 88 6 . 89 0 . 29 ;
CV

由于题目满分较高,所以,题目A的方 差大于题目B的的方差,但变异系数却 是题目B大于题目A。题目B的区分能 力优于题目A,这一点可以直观地从这 一组简单的数据中看出。当数据数目 较多的时候,就难以直观地看出,需 要借助统计手段。
AD - BC

A B C
D A C B D


A=在测验和效标中均通过的人数 B=在测验上通过而在效标未通过的人数 C=在测验上未通过而在效标上通过的人数 D=在测验和效标中均未通过的人数。

φ相关系数的显著性考验公式为:
0 . 05
1 . 96 N



(一) 方差 方差是标准差的平方,是反映一组数据离散程度的指 标。一个题目得分的离散程度越高,鉴别能力自然也 较高,因此,方差可以作为区分度的一种指标。 请看题目和题目的得分: A:6 5 4 4 3 3 3 3 3 2 2 1 0 B:4 3 3 3 3 3 3 3 3 3 3 3 2

难度差的计算公式
D Ph Pl

D=鉴别指数 Ph=高分组难度(通过率) Pl=低分组难度(通过率)
(六)题目特征曲线

另一种简单、形象的题目区分度分析方法是绘 制题目特征曲线。题目特征曲线反映了题目的 通过率与效标(或测验总分)之间的关系。
第三节 难度与区分度的关系

我们以通过率P作为难度的指标,以方差


一、难度定义与计算 难度是题目的难易程度 的指标。难度(Df)以正 确回答的人数在全体受 测者中的比例来定义。

《心理测量学》全套精品课件 第六章

《心理测量学》全套精品课件 第六章
CP=(KP-1)/(K-1)(6.11) 或
CP=P-q/K-1
(6.11')
式中CP为校正后通过率,P为实际通过率,K为
备选答案数目;q=1-p。
如果要比较两个选项数目不同的测题难度, 必须应用公式(6.11)分别将两个测题的难度 进行校正,然后才能进行比较分析。
例:有A、B两个测题,项目A为四重选择题, 通过率为0.58;项目B为五重选择题,通过率 为0.56;试比较两题的难度。
3.φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
4.积差相关

三、区分度与难度的关系
难度(P) 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
区分度(D) 0
0.20 0.40 0.60 0.80
1 0.80 0.60 0.40 0.20
四、对选择项的反应模式注意从 以下几个方面进行分析:
(一)如果正确的备选答案被所有的受测者所选择, 说明该项目太容易或者可能是项目中提供某种暗示, 使正确答案过于明显。
(二)如果某个错误答案没有任何被试选择,则说 明该项目不具有迷惑性,错得过于明显,除增加阅读 时间外,不起任何作用。一般说来,除非有2%以上的 人选择,否则该备选答案应该修改或删掉。
公式(6.11)是对全体被试而言的,即根据被试团体 在某项目上的通过率而计算校正难度。
若对某个被试来说,参加由多个项目所组成的测验, 同样有必要对他们的得分进行校正,以求出能反映出 他真实水平的校正分数,校正公式只需将公式(6.11) 稍作变换即得下式: S=R-W/(K-1) (6.12) 式中S为校正后的得分,R为被试答对的项目数,W为 被试答错的项目数,K为项目的选项数目。

第六章心理健康与社会适应能力的测量与评价

第六章心理健康与社会适应能力的测量与评价

第二节 心理健康测量工具的编制
? 虽然从事心理健康测量工作并不一定要编制心 理健康测量工具,因为测量用的工具可向专门 机构订购或直接从市场上购买,但如果想使心 理健康测量工作开展的有声有色,就少不了测 量工具的制作。
? 心理健康测量中典型的测量工具是测验或量表。
一、编制心理健康测验的操作流程
一般地,编制心理健康测验的流程主要由以下6个环节构成。 1.确定测验的目的; 2.确定测验的性质; 3.确定测验的内容; 4.建立测验的指标体系; 5.编写和筛选题目; 6.对测验的标准化处理; 7.对测验的技术分析和鉴定; 8.编写测验指导书。
1.从统计的角度来确立标准; 2.从症状角度来确立标准; 3.从内心体验的角度来确立标准; 4.从解决问题能力的角度来确立标准。
由此看来,单从某一种角度来确 立心理健康的评判标准,是很难满足 心理健康测量的需要的。比较明智的 做法是,多变换些角度,用多种标准 来考察,效果将会好得多。
二、不同年龄阶段心理健康的测量
?
心理症状发生率与外在压力成正比,而与个体的自我强度成反比。
综上所述,社会适应与心理健康具有密切关系。
二、社会适应能力测量
社会适应能力测量的目的旨在了解被试者 在自然条件下所表现出来的对社会成熟度、与 学习能力有关的行为等。测量的方法主要有: 临床谈话法、实验法、社会测量法和问卷调查 法。前两种主要用于低龄儿童和有生理缺陷人 群的研究,用得比较普遍的是社会测量法和问 卷调查法。
? 适应行为量表;
? 卡特尔十六种人格因素量表;
三、社会适应能力的评价
(一)心理健康的模式 (二)社会智力的模式 (三)社会胜任力的模式 (四)自我监督的模式 (五)压力应对的模式
四、社会适应不良及自我调节

心理测量 第6章 项目分析

心理测量 第6章 项目分析
错率(用符号Q来表示)代表难度。
Q=1-P
二、难度的计算方法
(一)二分法记分的项目
PH PL P 2
高分组——总分前27%的人组成的小组 低分组——总分最后27%的人组成的小组
(二)非二分记分的项目
X P 100% X max
难度的校正公式
在是非题或选择题中,由于有猜测的 成分,被试的得分可能被夸大,不能真 正反映测验的难度,为平衡机遇对难度 的影响,可用吉尔福特的公式矫正:
第一节 项目的难度
一、定义
难度( difficulty ),顾名思义,是指 项目的难易程度。难度分析主要用于最高 作为测验。在典型作为测验中,不存在难 易问题,一般称“通俗性”。
R P 100 % N
P值越大,表示题目越简单;数值大小
与实际的含义恰好相反,准确地说,应该
叫“易度”。因此有人用未通过率或者答
DP i Pu
说明:PH为高分组在某项目上的通过率
PL为低分组在该项目上的通过率
确定的标准,测验结果只与既定标准比较
而不在被试之间作比较。因此,测验分数
的变异性不是标准参照测验的必要条件。
所以,常模参照测验的项目分析方法不完全适用ຫໍສະໝຸດ 标准参照测验。1.难度分析
由于标准参照测验的目的是为了考察被 试对某方面的知识技能的掌握情况,因此, 只要能反映教育目标或者教育者认为重要 的内容,无论其难度为多少,都可以编入 测验。 例如,我们在教学开始之前,为了了解 学生的准备状态所进行的前测,多数题目 将产生很低的通过率,但这些题目应该保 留,因为它们表明了哪些东西需要学习。
如果高分组对正确答案的选择与低分组相
等或者低于后者,说明所考察的东西与水 平无关;

心理测量的复习大纲

心理测量的复习大纲

心理测量的复习大纲心理测量大纲.第一章:第一节一般测量概述1、测量的概念:依据一定的法则使用量具对事物的特征进行定量描述的过程。

2、影响测量精确的因素:一、测量对象本身的性质。

①确定型(物体的长度)。

②随机型(人的短时记忆容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)二、测量的精确度取决于测量工具的精确性。

3、根据测量的性质和不同的特点,可以将不同形式的测量大致分为4种类型。

①物理测量:及对事物物理特征的测量。

长度,重量等。

②生理测量:对机体生理特征的测量。

如对动植物各种化学成分含量的测量。

③社会测量:即对社会现象的测量,如人口普查。

④心理测量:对人的心理特征的测量。

如智力、人格测量。

4、任何测量都必须具备两个基本要素:参照点和测量的单位。

其中参照点分为绝对参照点和相对参照点。

5、测量的量表:能够使事物的特征数量化的数字的连续体就是量表。

量表可以分为四种:①命名量表:用数字代表事物或用数字对事物进行分类。

命名量表又分为名称量表(用数字指代个别事物)和类别量表(用数字指代事物种类)。

②顺序量表:按照事物的大小,等级,程度而排列数字的量表。

③等距量表:不仅能够指代事物的类别,等级而且具有相等的单位。

等距量表的数字是一个真正的数量,这个数量中各个部分的单位是相等的。

因此可以对其进行加减运算。

等距量表没有绝对的零点。

它的零点是人们假定的相对零点。

对于等距量表的两个数不能进行乘除运算。

④比率量表:除了具有类别、等级、等距的特征外,还有绝对的零点。

第二节心理与教育测量的性质1.、心理与教育测量的定义:依据一定的心理学和教育学原理,使用测验对人的心理特质和教育成就进行定量描述的过程。

其独特的性质:①心理与教育测量依据的法则在很大程度上只是一种理论,很难达到如同物理测量依据的法则那样普遍被人们接受的水平。

②心理与教育测量的对象是人的心理特质和教育成就。

③心理与教育测量的量具市有关领域的专家编制,经过长期的试用,修订,完善而逐渐形成的标准化测验。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

确定方法(续)

鉴别指数
比较两个极端效标组通过一个项目的个案的比例 当效标测量是个连续变量(如学业分数、产品数量) 时,可从分布的两端选出高分组和低分组。两组的 通过率的差异提供了题目区分度的指标 鉴别力指数D:D=PH-PL 条件:假定项目和效标之间是直线关系


极端组的划分:


正态分布中,最佳划分点为上下27%,以此划分, 可以使两个对比组之间的差异尽可能大,又使两组 人数尽可能多。 团体较小时,25%~33%之间的数字均可作分界点 被试数量N<100时,也可取50%为分界
3.难度水平的确定



难度水平的确定取决于测验的目的、性 质及项目的形式 教育测验(掌握性测验)或标准参照测 验可不考虑难度水平 选拔测验中选取难度值接近录取率的项 目。此外选择题目时,难度值应大于随 机答题概率。
4.测验的难度

测验难度是对整个测验的难度的综合性 检验,可由分数分布提供


分数分布为正偏态,即分数密集在低端时, 测验难度偏高 分数分布为负偏态,即分数密集在高端时, 测验难度偏低

最好用前测-后测结果比较来进行项目分析
根据测验目的,选择或淘汰能引起一定团体 显著差异的项目

项目-团体的相互作用


有效性与可靠性的矛盾
第六章
内容提要 概述 难度 区分度
项目分析
一、什么是项目分析?


项目分析:根据被试的反应对组成测验的各个 题目(项目)进行分析,从而评价其功用的程 序的方法。 两类项目分析:


定性分析 效性等 定量分析
考虑内容效度,题目编写的恰当性和有
主要是难度和区分度

作用:通过项目分析,研究者可以选择和修改 测验题目,从而提高测验的信度和效度
以鉴别指数评价试题(L.EBel)
D 0.40以上 0.30~0.39 试题评价 非常优良 良好,如能修改更佳
0.20~0.29
0.19以下
尚可,仍需修改
劣,必须淘汰
3.区分度与难度的关系

难度影响区分度,难度大或小,区分度 均低。中等难度水平,区分度较高。
三、项目分析的特殊问题

备选答案的反应模式 速度测验的项目分析 标准参照测验的项目分析
பைடு நூலகம் 1.确定方法

项目与效标的相关




以项目分数与效标分数(或测验总分)的相关作为 项目区分度的指标,相关越高,区分能力越好。 据变量的性质选择以下不同相关系数:二列相关/点 二列相关/四分相关/φ 相关 实际上,选择不同相关系数仅是用于编制测验取舍 项目时。不同的系数对相同的项目产生同样的等级 次序。 使用前提:当每一项目的变异数相同或项目很多, 每一项目所贡献的变异数比例都很小时,才能使用 项目和总分的相关。否则项目本身包含于总分中, 若变异数贡献太大,这个重叠(伪因素)本身就可 引起某种正相关。
2.区分度的相对性


不同计算法区分度估计值不同 受样本大小影响。一般样本数目越大,估计越 可靠,但贡献遵循报酬递减原则。 受分组标准影响 区分度大小与样本的同质性有关

样本同质性越高,区分度值越小;区分度小的项目, 施测于较大差异性的团体,也可能具有很高鉴别力

此外,还要考虑测验的目的、性质和功能。例 如教育成就测验,要求项目与总分相关>0.20, 高低分组通过率之差达到0.15~0.20以上
三、区分度



区分度指测验项目对所测量的心理特性的区分 程度或鉴别能力,也是项目的效度。 区分度指标和估计方法,都是以受测者对项目 的反应与某种参照标准之间的差异为基础的。 当外在效标难以得到时,通常用测验总分(即 所有项目的分数之和)代替。 假定测验总体是对该特征的一个适当测量,项 目越多,误差互相抵消的越多。
二、难度
1.界定 难度即题目的难易程度。难度指标通常 以通过率来表示。P=R/N*100% 难度主要用于能力测验,非能力测验中 类似的指标是:“通俗性”、应答率、 同一类人在关键方向上回答的人数
2.难度的计算



二分法计分的项目,被试人数少时 P=R/N*100% 二分法计分,被试人数多时,分三组 高分组27%,低分组27%,中间组46% P=(PH+PL)/ 2 非二分法计分的项目 P=X/Xmax *100%,式中X为全体被试在该题 上的平均分, Xmax为该题满分

当难度接近0.5时,表明多数被试正确回 答50%的题,此时对被试有最大程度的 区分。
5.常态化等距难度量表




以通过率(百分比)作为难度指标,实际上是 以顺序量表来表示难度,它仅能指出难度的顺 序或相对难度高低,无法得知差异大小 当被试在所测特性上呈正态分布,则可以根据 正态曲线次数表,用以标准差为单位的等距量 表(即Z分数)来表示。 将难度转换成具有相等单位的等距量表,此等 距难度量表可指出不同难度间差异数值 以标准差为单位的项目难度常常有负值和小数, 使用不便。ETS的转换方法:△ =13+4X
相关文档
最新文档