心理与教育测量第六章(1)

合集下载

(整理)心理与教育测量重点全部

第一章心理与教育测量概论1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。

所谓一定的法则，是指任何测量都要建立在科学规则和科学原理基础之上，并通过科学的方法和程序完成测量过程。

所谓事物的特征，是指所要测量的事物的特定属性。

所谓量具，是指测量中所使用的工具。

所谓定量描述，是指任何测量的结果总是对事物特征的量的确定。

2、任何测量都必须具备两个基本要素，即测量的参照点和测量的单位。

参照点有两种，一种是绝对参照点，即以绝对的零点作为测量的起点。

另一种是相对参照点，即以人为确定的零点为测量的起点。

理想的测量单位应当具备两个条件：一是要有确定的意义，二是要有相等的价值。

3、测量量表分为4种：1）命名量表，是最低水平的量表，它只是用数字代表事物或对事物进行分类；2）顺序量表，如第1名，第2名；3）等距量表，不仅能代表事物的类别，等级，而且具有相等的单位，等距量表没有绝对的零点；4）比率量表，是最高水平的测量量表，有绝对的零点。

心理与教育测量的量表属于顺序量表。

心理与教育测量属于顺序量表。

★4、心理测验实质上是对行为样本的客观的和标准化的测量。

编制一个测验应当具备下列4个基本条件：1）行为样本。

从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量，并依据对这一组行为的测量结果推断其心理特质和教育成就。

这一组被抽取出来的，作为直接的测量对象的行为就是行为样本。

2）标准化标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。

测验的标准化要具备下列条件：a、测验内容的标准化；b、施测条件的标准化；c、评分规则的标准化；d、测验常模的标准化。

3）难度或应答率4）信度和效度5、心理与教育测验的种类：按测量对象：智力测验、能力倾向测验、成就测验、人格测验。

按测量方式：个别测验，团体测验。

按测验内容的形式：文字测验，非文字测验按测验功能：成就测验与预测测验，难度测验与速度测验，描述测验与诊断测验。

心理测量学第六章-测验题目性能与题目编写(项目分析).PPT

根据题干从备选项中选出正确选项的题目。单项选择题指只有唯一正确选项的选择题。 2、特点功能： ①评分标准明确，评分客观，有利于减少评分带来的评分误差。 ②有利于对基础知识和基本技能进行考查。
③选择题适合考查较低层次的能力，如识记能力、较低的理解能力等，而不宜考查较高层次的能力，如综合能力、创造性和独立思维能力。
一、区分度的定义
（一）定义 ❖ 测验项目对所测量的心理特性水平差异的区分能力或鉴别。（二）作用 ❖ 测验是否有效度的“指示器”。 ❖ 若区分度高，则水平高者得分高，水平低者得分低；若区分
⑤行为情景判断题设问方式一般有四种形式：一是要求受测者选择最优行为项，二是要求受测者选择最差行为项，三是要求受测者同时选择最优和最差行为项，四是要求受测者针对每一行为项的有效性做出评价。应根据实际选择具体方式。
第二节测验题目的难度与难度控制
一、难度的定义二、难度的计算三、测验难度水平的确定四、难度的等距变换五、测验的难度对测验分数分布的影响
的差异等于第2题和第3题间的差异。（二）解决方式：等距变换，即把难度P转换成标准分数Z。 ❖ Z分数(0，+1σ)约占全体人数的34%,(1σ,2σ)间占全体人数的
13.5%。 ❖ 项目A通过率为84%(难度为0.84)，难度值为-1σ。 ❖ 项目B通过率为16%(难度为0.16)，难度值为+1σ。 ❖ 项目C通过率为50%(难度为0.50)，其难度为0。
②论述题和计算题不仅能够考查考生较低层次的能力目标，而且能够比较好地考查较高层次的能力目标。
③论述题和计算题能够反映考生的思维过程，因而能比较有效地考查考生接受信息、鉴别和选择信息的能力，分析、推理、综合应用知识的能力，能鉴别出考生对问题解决的程度。

教育与心理统计学第六章方差分析考研笔记-精品

第六章方差分析第一节方差分析概述一.方差分析的定义［用途］定义:用途方差分析也称为变异数分析，是在教育与心理研究中最常用的变量分析方法，其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小，从而确定测量或实验中因素对反应变量是否存在显著影响。

即用于置信度不变情况下的多组平均数之间的差异检验。

它既可以比较两个以上的样本平均数的差异检验，也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。

二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析，同时匕徽两个以上的样本平均数，推断多组资料的总体均数是否相同，也即检验多组数据之间的均数差异是否有统计意义。

在这个意义，也可以将其理解为平均数差异显著性检验的扩展。

当我们用多个t检验来完成这一过程时，相当于从t分布中随机抽取多个t值，这样落在临界范围之外的可能大大增加，从而增加了I型错误的概率，我们可以把方差分析看作t检验的增强版。

方差分析一次检验多组平均数的差异，降低了多次进行两组平均数检验所带来的误差。

在进行方差分析时，设定的假设是综合虚无假设，即假设样本所归属的所有总体的平均数都相等。

如果检验的结果是存在显著性差异，只能说明多组平均数之间存在显著性差异，但是无法确定究竟哪些组之间存在显著性差异，此时需要运用事后检验的方法来确定。

三.方差分析的相关概念一（一）数据的变异（1）变异:统计中的变异是普遍存在的7一般意义上的变异是指标志（包括品质标志和数量标志）在总体单位之间的不同表现。

可变标志的属性或数值表现在总体各单位之间存在的差异，统计上称之为变异,这是广义上的变异，即包括了品质标志和数量标志，有时仅指品质标志和在总体单位之间的不同表现。

注：随机性，即变异性。

（2）组间变异［组间差异］:组间变异表示处理间变异，主要指由于接受不同的实验处理（实验处理效应）而造成的各组之间的变异，可以用两个平均数之间的离差来表示，可将组间离差平方和记为SS AO组间差异可用组间方差来表征，用符号MS B表示。

心理与教育测量学-戴海琦-第三版-重点问答题及答案

第一章、心理测量概述1、心理测量的含义、特点;测量的含义;要素；以及测量的量表(1）心理测量的含义：依据一定的法则，对人的心理特质进行定量描述的过程.（2）心理测量的特点–间接性：与物理的直接测量不同，从外显行为推测,以间接了解人的心理属性;–相对性：测量的结果是与其所属团体比较而言。

–客观性：即测验的标准化，是对一切测量的基本要求。

（3)什么是测量:测量是根据法则给事物分派数字（S。

S。

Stevens）事物：测量对象，在心理测量中，想测量的当然是心理能力和人格特点；数字：代表某一事物或事物某一属性的量;法则：测量所依据的规则和方法.（4）测量的要素：参照点:①测量工作中测量对象的数量的固定原点②绝对参照点：以绝对的零点作为测量起点，如长度/高度③相对参照点:相对零点，如温度[水冰点]、海拔［海平面]单位①理想的单位一是要有确定的意义,不能有不同解释②其次应有相同的价值，即两个单位点之间差异相等。

（5）测量的量表：量表：任何可以使事物数量化的值或量的渐进系列.①命名量表：数字仅仅代表分类，无任何意义；不可比较,如男女②顺序量表：可比较，没有相同单位和零点，不能加减；如名次③等距量表：可比较，有相同单位无绝对零点，可加减，不可乘除；适用多种统计方法：平均数、标准差等,如温度④比例量表：最理想的量表，有等距的的单位和绝对零点，有倍数关系；如年龄.2、什么是心理测验,如何理解心理测验？心理测验的类型；心理测量的功能；（1)什么是心理测验：心理测验实质上是行为样本的客观的和标准化的测量.①行为样本：有代表性的题目②标准化：测验的编制、实施、计分和分数解释的一致性。

③难度的客观测量：测验的编制、实施等过程中减少主试和被试的随意性程度即标准化，测验的难度水平应确定④信度：测验结果的一致性⑤效度：测验结果的有效性和正确性.（2）、心理测验的类型：①测验对象分：智力测验、能力倾向测验、成就测验、人格测验②按测量方式分：个别测验和团体测验③按测验材料性质分:文字测验和非文字测验④按测验功能分：成就测验与预测测验，难度测验与速度测验,描述测验与诊断测验。

心理健康与社会适应能力的测量与评价课件

第六章心理健康与社会适应能力的测量与评价
学习交流PPT
1
• 主要内容：健康的含义与标志、心理健康测量的本质、心理健康测量工具的制作与使用、不同人生阶段的心理健康测量常用量表类型、社会适应能力及其常用测量量表类型等。
• 重点、难点：心理健康测量的方法、社会适应能力测量量表与评价方法。
学习交流PPT
2
第一节心理健康测量概述
学习交流PPT
3
一、心理健康的基本含义与标准
• 1、健康与健康标准 • 2、心理健康与心理健康标准
学习交流PPT
4
二、测量与心理健康测量
• 1、测量 • 2、心理健康测量
学习交流PPT
5
三、心理健康的可测性
• 1、弄清测量的本质，看它对被测对象的要求是什么； • 2、查明心理健康特质的属性，看它能否满足测量所
• （10）幻想性
• （11）世故性
• （12）忧虑性
• （13）实验性
• （14）独立性
学习交流PPT
27
二、社会适应能力测量
• 3、陈建文《中学生社会适应性量表》（2004） • 4、傅宏《幼儿社会适应状况量表》（2000） • 5、内外向性格类型量表 • 6、中国人社交关系量表（CSRSV1.0）
学习交流PPT
19
常见的中学生心理测量的类别与量表有
• (1)中学生学习的适应性测量：如福建师大吕冠编制的中学生学习方法问卷、中学生学习动机测量问卷、意志测量问卷、中学生考试心理得健康状况检测。
• （2）中学生价值观自测的问卷：如中国科学院心理研究所编制的中学生价值观自测问卷、中学生成熟程度测量。
发展的核心因素； • 4、小学生具有情绪不稳定的特点； • 5、小学生的自我监控能力还处于比较微弱的状态。 • 中国常用的小学生心理健康的测量：小学生心理健康评定量

(2021年整理)心理测量学重点

心理测量学重点编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（心理测量学重点）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为心理测量学重点的全部内容。

心理测量学第一章概论一、测量:根据一定的法则使用量尺对事物的属性进行定量描述的过程.二、测量的精确度决定于测量对象本身的性质（确定型、随机型、模糊型）和测量工具的精密性。

三、测量的基本要素 :1。

参照点(1）绝对参照点(有绝对的零点,可进行乘除运算）（2）相对参照点（以人确定的零点，只可加减）2。

单位：条件：要有确切的意义和相等的价值四、测量的量表 : 称名量表、顺序量表、等距量表（可进行加减运算)、比率量表（可进行加减乘除）五、心理与教育测量的定义：根据心理学和教育学法则给人的心理特质和教育成就指派数字，或者根据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。

六、编制一个测验应当具备下列四个基本条件:（1)行为样本.（2）标准化:指测验的编制、实施、记分以及测量分数解释的程序的一致性。

标准化条件:测验内容、施测条件、评分规则和测验常模的标准化。

（3）难度或应答率。

（4）信度和效度。

七、1918年，桑代克提出“凡客观存在的事物都有其数量”。

1939年，麦柯尔进一步提出“凡有其数量的事物都可以测量"作业补充题:1、为什么说心理与教育测验的分数本质上是顺序量表上的分数？答：从本质上讲，心理与教育测量的量表属于顺序量表。

（1)从使用的参照点来说，教育测量和心理测量领域的参照点均为相对零点；（2)从使用的单位来说，教育与心理测量的单位远没有其他测量的单位成熟完善.第二章简史一、现代心理与教育测量的起源：(1）1879年德国心理学家冯特在莱比锡大学建立了世界上第一个心理实验室.（2）高尔顿把统计方法应用到对个别差异资料的分析之中.学生皮尔逊创立了积差相关公式。

第六章心理健康与社会适应能力的测量与评价

第二节心理健康测量工具的编制
? 虽然从事心理健康测量工作并不一定要编制心理健康测量工具，因为测量用的工具可向专门机构订购或直接从市场上购买，但如果想使心理健康测量工作开展的有声有色，就少不了测量工具的制作。
? 心理健康测量中典型的测量工具是测验或量表。
一、编制心理健康测验的操作流程
一般地，编制心理健康测验的流程主要由以下6个环节构成。 1.确定测验的目的； 2.确定测验的性质； 3.确定测验的内容； 4．建立测验的指标体系； 5.编写和筛选题目； 6.对测验的标准化处理； 7.对测验的技术分析和鉴定； 8．编写测验指导书。
1.从统计的角度来确立标准； 2.从症状角度来确立标准； 3.从内心体验的角度来确立标准； 4.从解决问题能力的角度来确立标准。
由此看来，单从某一种角度来确立心理健康的评判标准，是很难满足心理健康测量的需要的。比较明智的做法是，多变换些角度，用多种标准来考察，效果将会好得多。
二、不同年龄阶段心理健康的测量
?
心理症状发生率与外在压力成正比，而与个体的自我强度成反比。
综上所述，社会适应与心理健康具有密切关系。
二、社会适应能力测量
社会适应能力测量的目的旨在了解被试者在自然条件下所表现出来的对社会成熟度、与学习能力有关的行为等。测量的方法主要有：临床谈话法、实验法、社会测量法和问卷调查法。前两种主要用于低龄儿童和有生理缺陷人群的研究，用得比较普遍的是社会测量法和问卷调查法。
? 适应行为量表；
? 卡特尔十六种人格因素量表；
三、社会适应能力的评价
（一）心理健康的模式（二）社会智力的模式（三）社会胜任力的模式（四）自我监督的模式（五）压力应对的模式
四、社会适应不良及自我调节

心理测量—常模与分数解释

52
5
若已知被试在群体中的排名R，则百分等级可以用一下公式计算：
PR 100 - 100R - 50 N
R是个体由高至低之排名，N是总人数。
例：某团体共100人，试问第15名的百分等级是多少？若团体人数分别为50人，40人，20人时，其百分等级是多少？
P15
100 10015 50 100
（4）常模团体测量的近时性。
四、常模的特性
1.常模的相对性常模的作用在于表明个体在团体中的相
对位置，常模并不是标准。常模与标准的区别：
常模是以一个群体中人们的实际操作为基础而制定的，并不是事先确定的。
标准是在测验前提出的，是要求测验结果应该达到的水平。
2.常模的时效性
由于人的心理水平和特征会随着社会、文化的发展而出现变化，所以常模是具有时效性的，一个常模分数只能在一定时间内作为测验的解释标准。
使用年级当量时要注意：
许多学校科目并不连年授课，所以无法求年级当量。
年级当量容易引起误解。
如：一个2年级的学生在数学测验中得到了一个4的年级当量，是否意味着他会做4年级的数学题了？
3.顺序量表
通过描述儿童在诸如运动、感觉辨别力、言语、概念形成等方面随年龄发展的典型行为，将儿童的行为与这些典型行为相比较来鉴别儿童所达到的发展阶段，这样得到的量表就是顺序量表。
第六章常模与分数解释
一、原始分数与量表分数
从测验中直接评定出来的分数称为原始分数。
原始分数只说明被试做答的情况或正确程度，不能反映出被试间相比较后所处的位置，也不能说明被试在其他等值测验上应获得的分数。
为使原始分数具有意义，必须把它转换到一个具有参照点和相等单位的量表上，使不同的原始分数可以相互比较。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

※因此不能将区分度作为筛选试题的绝对标准。
五、提高题目区分度方法
• (1)控制好题目难度。将题目难度在0.5左右时，区分能力理论上会比较高。 • (2)保证题目所测心理特质与全卷所测心理品质的一致性。 • (3)题干及答案无歧义。 • (4)语言准确规范。 • (5)借助选项分析提供的信息对不良选项进行修改，以提高题目区分能力。
五、难度对测验的影响
• 测验难度影响到测验分数的分布形态。
– 测验难度太大，测验分数将呈正偏态分布。 – 测验难度太小，测验分数将呈负偏态分布。 – 测验难度中等，测验分数将呈正态分布。
• 测验项目的难度分布影响到测验分数的离散程度，进而影响到信度。
– Ebel的实验。如下一幻灯片所示。 – Ebel的研究结论：项目的难度集中在0.5左右为最佳。
综合练习
• 一试卷施测于十一名被试，结果如附表。
• 请求取：
– （1）第二、第五两题的难度。 – （2）第三题的区分度（点二列相关）。 – （3）第六题的区分度（高低分组法）。 – （4）全卷信度α系数。 – （5）试卷实证效度。
第三节猜测问题与猜测率
• 客观测验题中的猜测问题与猜测率 • 项目难度受猜测影响的校正
二、区分度的计算
• 高低分组法（也称鉴别指数法）
– 适用范围：二分法记分的测验项目。 – 计算公式： D PH PL – 评价标准：Ebel的研究结果
D 0.40以上 0.30—0.39 0.20—0.29 0.20以下评价
优良良好，修改更好合格，必须修改差，淘汰
• 相关系数法
高
低
–
特式：P
H
PH PL 2
L
= (RH/NH+RL/NL)/2
• 其中P 和 P 分别代表高分组与低分组的通过率。 RH和RL分别代表高低分组答对人数，NH和NL分别代表高低分组总人数。
举例：请分别用通过率法和高低分组法计算下列两题难度
二、测验难度水平确定
• 取决于测验的目的
– 目标参照性测验可以不过多考虑项目难度，只要客观标准要求掌握的内容均应适用。 – 常模参照测验应使项目平均难度为0.5，项目难度范围为0.5±0.2。 – 选拔性考试应将项目难度控制在录取率附近分布，或使对选拔点附近的被试有0.5的难度，或难度为录取率。
二、项目难度的计算
• 得分率法
– 通式（所有项目都适用）：P X / F
X 为全体被试在项目上的平均得分，F为项目满分
值。
– 特；N为全体被试数；R为答对通过该项目的人数。
• 高低分组法
– 通式：
其中 X 、X 分别为总分排名在前27%的高分组和后 27%低分组被试在要计算难度的项目上的平均分。 F为满分值。
一、客观测验题中的猜测问题与猜测率
• 客观测验题中的猜测问题
– 测验分数确实反映了被试的真实特质水平还是因为猜测而获得成功？
• 猜测误差的来源
– 猜相对于不猜引起的误差 – 是否猜得对引起的误差
• 猜测率
– 是指被试全凭随机猜测而答对题目的概率。 – 猜测行为主要出现在客观题（如选择题、是非判断题、配对题等）
– 综合观点：如果答题时间充裕，选择题的备选答案数目在四个或四个以上，则没有必要校正记分。
第四节多重选择题的项目分析
• 多重选择题项目分析的作用与内容
– 项目能否测到要测的心理特质； – 项目难度是否恰当； – 项目的区分度能否达到要求； – 正答选项选答率是否恰当；
• 正答选项在高低分组上选答率是否正差？差距是否足够大？
– 第2题，正确答案和干扰项B的两两组平均选答率基本一致，且正确答案上高分组的被试选择人数要少于低分组被试，而在非正确选项B、D上，高分组的被试选择人数要多于低分组被试，这均不符合实际情况，且高分组被试中选择人数最多的为选项B，则要考虑该是否有2个正确选项，因此该题选项设置较差，因此整题质量较差。
– 诱答选项选答率是否恰当；
• 诱答选项在高低分组上选答率是否是负差？差距是否足够大？
• 具体分析步骤：
–1、根据被试的测验总分，对被试进行排序 –2、确定高分组和低分组被试 –3、分别登记高分组被试和低分组被试在每个备选项的人数及未作答人数（也可以是人数百分比），最终整理成类似下表中的数据资料
• 区分度标准：
– 本来应找客观外界标准，也即类似于效标的测量，但因比较困难，故转而在测验内部找，实际以测验总分为标准，称其为内部效标。
• 区分度的实质：
– 项目得分与总分的一致性程度。
• 区分度取值范围：
– ［-1，1］，D为0无区分作用，D值为正，表示积极区分，越大区分效果越好，D<0表示消极区分。
–4、根据第3步整理好的数据资料，进行具体分析
• 选项分析的方法及选项修改原则
– 1、首先分析两组平均选答率
• 正确答案的平均选答率（即难度）最佳值为：
• 每个干扰项应该平均分剩余的选答率。 • 如果正确答案的选答率过高或过低，这都不利于区分高分组和低分组被试。 • 如果某干扰项选答率特低，则说明该干扰项错的过于明显应加以淘汰； • 若某干扰项选答率特高，则要考虑该题正确答案是否错误或有两个正确答案。
心理与教育测量
主讲：邓稳根（博士）赣南师范学院教育科学学院 E-Mail: dwengen@
第六章测验的项目分析
• • • • 测验项目的难度测验项目的区分度分析猜测问题与猜测率多重选择题的项目分析
第一节测验项目的难度
• • • • • 难度的意义项目难度的计算测验难度水平的确定难度的等距变换难度对测验的影响
– 2、对于正确答案
• 主要考察高分组和低分组被试在正确答案上的选答率是否是正差，及这一差距是否足够大。只有当高分组和低分组被试在正确答案上的选答率是正差，且这一差距足够大时，这时题目质量较佳。
–3、对于干扰项
• 考察高分组和低分组被试在干扰项上的选答率是否是负差，及这一差距是否足够大。只有当高分组和低分组被试在正确答案上的选答率是负差，且这一距差足够大时，这时干扰项的设置比较合理，否则干扰项设置不合理，应对干扰项进行删除或修改。
举例
• 下表为一个由370人参加的英语测验中四道选择题的统计结果，试分析每题难度、区分度是如何计算出来的？并对这四题的选项质量进行评价。
• ③选项分析：
– 第1题，正确答案和干扰项的两组平均选答率都基本正常，在正确答案上高分组的被试选择人数要多于低分组被试，且在非正确选项上，高分组的被试选择人数要少于低分组被试，这符合实际情况，四个选项的设置均较合理；
– 使用检验，其中自由度df=1。 – 检验公式为：
举例：请计算该题的区分度
（四）积差相关
• 例子：请用积差相关法计算下列论述题的区分度。
三、区分度与难度的关系
• D的最大值与项目难度的关系（理论上）
• 题目的综合分析和筛选
– ①整个测验的平均难度应保持在0.5左右。 – ②测验中各项目之间有一定相关，为了使成绩分布均匀，项目难度的应广一些，梯度大一些，最好成正态分布。 – ③每项题目理想的区分度都应在0.3以上，至少是0.2。
举例：请计算该题区分度
（二）二列相关
• 适用范围
– 题分和总为均为连续变量，但人为地将其中一个变量（既可以是总分，也可以是题分）区分为二分变量（例如，将总分为及格和不及格两类）。
• 计算公式
• y是标准正态曲线下 p与q交界处的Y轴高度（曲线高），要查正态分布表。
• 二列相关的显著性检验
• 测验项目的难度会影响到项目的区分度。（区分度这节再讲）
第二节测验项目的区分度
• • • • 项目区分度的意义区分度的计算区分度与难度的关系区分度的相对性
一、项目区分度的意义
• 定义：
– 区分度指测验项目对被试心理特质水平差异的区分能力。通常用D表示。
• 区分度价值：
– 将优劣被试准确区分是测验项目的职能，区分度是对项目这项职能高低的评价指标，是评价项目质量，选择优秀项目的依据。
• 取决于测验的性质
– 速度测验难度不宜太高，项目难度值基本相等。 – 难度测验要求难度值在0.5左右。 – 无论速度还是难度测验，都要防止被试得满分。
四、难度的等距变换
• 难度转换的目的
– 难度为通过率，属于等级量表水平，需要转换为等距量表水平才能进一步进行加减运算。
• 难度到Z分数的转换。
– 以通过率P在标准正态分布表中查得对应的Z分数。由于Z分数存在负数和小数点，需要将Z分数作进一步的线性变换。 – ETS常采用下列换算公式：Δ =4*Z+13。 Δ 越大，难度越大。
–4、其它
• ①如果高分组被试的选答集中在两个答案上，且人数又相近，说明此题可能有两个正确答案，或者在某种意义上另一个选择项也有一定道理。应考虑题目本身是否存有歧义或有两个正确答案。
• ②如果高分组对正确答案的选答率与低分组相等或低于后者，说明该题所考察东西与被试水平无关，即不具有鉴别力，此题应作大修改或删除。 • ③如果一个题目被试未作答的人数较多（速度测验除外），或选择各个备选项答案的人数相等，说明该题目过难或题意不清，被试无法作答或全凭猜测。应修改或删除本题。
四、影响区分度的因素
• 效标不同，区分度不同。
– 应选择较好的效标。
• 不同的计算方法，所得区分度不同
– 在分析同一个测验时，各个项目的区分度值要采用同一种指标。
• 样本容量大小影响相关法区分度值的大小
– 样本容量越小，区分度的计算值越不可靠。 – 采用相关法计算的区分度要进行显著性检验和计算统计检验力。
• 猜测校正的争议