戴海崎《心理与教育测量》(第3版)课后习题(第4章 测量信度——第6章 测验的项目分析)【圣才出品】

合集下载

戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣

戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣

第10章目标参照测验1.请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。

答:从表10.3的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容l而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5);同理,第4、12、5、11题的内容效度亦得到很高的评价。

因此,这七道题目无疑可以原封不动地保留下来。

再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。

(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。

(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。

如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24,说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。

2.目标参照测验的题目区分度可以通过哪些方法来确定?答:测验项目的区分度一般采取两类指标:难度差值和相关系数。

(1)难度差值①掌握组——未掌握组鉴别指数(D)a.分别计算掌握者和未掌握者两组在某项目上的平均通过率,记为P A和P B,则该项目的鉴别指数为:K=P A-P B。

b.鉴别指数D的大小,可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。

D值从-1.00到+1.00之间变化,越接近于+1.00,题目区分度越高。

戴海崎《心理与教育测量》笔记和课后习题详解(测验等值)

戴海崎《心理与教育测量》笔记和课后习题详解(测验等值)

第9章测验等值9.1 复习笔记一、测验等值概述(一)测验等值来源于测量实践的需要在心理与教育测量实践中,经常遇到一个测验需要配备多个测验形式的情况,特别是那些测验内容易受记忆或针对性训练影响的测验,在测验之前需严格保密,测验之后不能再用,必须配备多个不同形式供不同次施测所用。

(二)测验等值的实质从本质上来讲,测验等值就是通过对考核同一种心理品质的多个测验形式做出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性。

在实际操作中,测验等值可使各个不同形式的测验分数均对应起来,测验主持者可以任意指定其中的一个分数形式作为基准,而使所有其他形式的分数都转化到这个基准形式上。

测验等值中所讲的测量分数系统的转换与测验原始分数与导出分数之间的转换是不同的。

寻找测验等值关系与寻找两测验之间预测关系也是不相同的。

(三)测验等值的条件测量学所提出的测验等值的条件主要有以下几个方面:同质性、等信度、公平性、可递推性、对称性、样本不变性。

(四)测验等值的一些基本概念1.经典理论等值与项目反应理论等值两种等值的区别在于等值时以何种测验理论作指导。

以经典理论为指导的等值称为经典理论等值,以项目反映理论为指导的等值称为项目反映理论等值。

2.测验分数等值与项目参数等值(1)这是根据测验等值的直接操作对象不同而构成的一对概念:①测验分数等值:如果等值的直接操作对象是测验的原始分数,结果是直接找到两测验分数的转换关系,称为测验分数等值。

②项目参数等值:如果等值的直接操作对象是测验项目参数,找到的等值转换关系是两测验项目参数之间的转换关系,则称其为项目参数等值。

项目参数等值可以是终极目的,但更多的是中间目的,在项目参数等值的基础上可以进一步找到测验分数的转换关系。

(2)项目参数等值特别适用于大型题库建设。

利用项目参数等值可以把不同批次采集计算的项目参数,确定在一个统一的度量系统上,所有项目合并成一个大型题库。

从这样的题库中抽题组成的不同试卷进行测试,可获得一致的评价结果,不必再进行等值计算。

戴海崎《心理与教育测量》(第4版)笔记和课后习题考研真题详解

戴海崎《心理与教育测量》(第4版)笔记和课后习题考研真题详解

戴海崎《心理与教育测量》(第4版)笔记和课后习题考研真题详解戴海崎《心理与教育测量》(第4版)笔记和课后习题(含考研真题)详解完整版>精研学习网>无偿试用20%资料全国547所院校视频及题库资料考研全套>视频资料>课后答案>往年真题>职称考试第1章心理与教育测量概论1.1复习笔记1.2课后习题详解1.3典型题(含考研真题)详解第2章心理与教育测量简史2.1复习笔记2.2课后习题详解2.3典型题(含考研真题)详解第3章经典测验理论的基本假设3.1复习笔记3.2课后习题详解3.3典型题(含考研真题)详解第4章测量信度4.1复习笔记4.2课后习题详解4.3典型题(含考研真题)详解第5章测量效度5.1复习笔记5.2课后习题详解5.3典型题(含考研真题)详解第6章测验的项目分析6.1复习笔记6.2课后习题详解6.3典型题(含考研真题)详解第7章心理与教育测验的编制与实施7.1复习笔记7.2课后习题详解7.3典型题(含考研真题)详解第8章常模参照测验8.1复习笔记8.2课后习题详解8.3典型题(含考研真题)详解第9章目标参照测验9.1复习笔记9.2课后习题详解9.3典型题(含考研真题)详解第10章测验等值10.1复习笔记10.2课后习题详解10.3典型题(含考研真题)详解第11章学绩测验11.1复习笔记11.2课后习题详解11.3典型题(含考研真题)详解第12章能力测验(上)12.1复习笔记12.2课后习题详解12.3典型题(含考研真题)详解第13章能力测验(下)13.1复习笔记13.2课后习题详解13.3典型题(含考研真题)详解第14章人格测量14.1复习笔记14.2课后习题详解14.3典型题(含考研真题)详解第15章其他心理与教育测验15.1复习笔记15.2课后习题详解15.3典型题(含考研真题)详解第16章测量应用实务16.1复习笔记16.2课后习题详解16.3典型题(含考研真题)详解第17章测量理论与应用的新发展17.1复习笔记17.2课后习题详解17.3典型题(含考研真题)详解。

戴版《心理与教育测量》课后习题及解答11

戴版《心理与教育测量》课后习题及解答11

练习与思考第一章心理与教育测量概论>>练习与思考1.与物理测量相比较,阐明心理测量的特点。

2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。

(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。

(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。

3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。

(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。

第二章心理与教育测量的产生与发展>>练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。

2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点?(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。

一、在测验实践方面的贡献。

1、在能力测量方面。

早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。

董仲舒已论及到注意测验。

刘邵把人的才能划分为12种类型。

6世纪中叶,中国江南出现了类似现在的婴儿发展测验的"周岁试儿"习俗。

出现于清代的益智图、九连环可以认为是最早的创造力测验。

2、在人格测量方面。

孔子把人分为狂者、狷者和中行3种。

刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。

3、在教育测量方面。

世界上最早的教育测量出现于中国西周奴隶时期。

据记载,在西周的"国学"中已经建立具有相当系统性的教育测量制度。

戴海崎心理与教育测量第4版课后习题答案

戴海崎心理与教育测量第4版课后习题答案

第1章心理与教育测量概论1.掌握以下基本概念和术语:(1)测量答:测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。

“一定的法则”是指任何测量都要建立在某种科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。

“事物的属性”是指所要测量的客体或事件的特定特征。

“量尺”是指测量中所使用的度量工具。

“定量描述”是指测量的结果总是对事物属性的量的确定。

(2)心理测量答:心理测量是指依据一定的心理学理论在测验上对人的心理特质进行定量描述的过程。

心理测量依据的法则在相当程度上是一种理论,很难达到如同物理测量依据的法则那样普遍被研究者共同接受的科学水平。

心理测量的对象是人的心理特质。

心理测量的量尺是由有关领域的专家经过长期的编制、试用、修订、完善而逐渐形成的标准化测验,它的编制是一项高度专门化的系统工作,要达到科学所要求的水平绝非易事。

心理测量的目标虽然是对人的心理特质进行定量分析,但这种定量分析的精确度远不及物理测量的精确度。

(3)绝对参照点答:测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。

参照点可分为绝对参照点和相对参照点。

绝对参照点以绝对的零点作为测量的起点。

绝对参照点是最为理想的测量参照点,因为它的意义最为明确。

(4)相对参照点答:测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。

参照点可分为绝对参照点和相对参照点。

相对参照点以人为确定的零点作为测量的起点。

最为理想的测量参照点当然是绝对参照点,因为它的意义最为明确。

在人们难以找到绝对参照点的情况下,就必须改用相对参照点。

这种情况是很常见的。

(5)称名量表答:量表是指能够使事物的特征数量化的数字连续体。

斯蒂文斯根据测量中使用的不同参照点和单位,区分出四种不同水平的测量量表:称名量表、顺序量表、等距量表和比率量表。

其中称名量表只是用数字代表事物的成分或用数字对事物进行分类。

称名量表又可细分为两种形式:一是命名量表;二是类别量表。

戴海崎心理与教育测量第4版课后习题答案

戴海崎心理与教育测量第4版课后习题答案

第1章心理与教育测量概论1.掌握以下基本概念和术语:(1)测量答:测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。

“一定的法则”是指任何测量都要建立在某种科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。

“事物的属性”是指所要测量的客体或事件的特定特征。

“量尺”是指测量中所使用的度量工具。

“定量描述”是指测量的结果总是对事物属性的量的确定。

(2)心理测量答:心理测量是指依据一定的心理学理论在测验上对人的心理特质进行定量描述的过程。

心理测量依据的法则在相当程度上是一种理论,很难达到如同物理测量依据的法则那样普遍被研究者共同接受的科学水平。

心理测量的对象是人的心理特质。

心理测量的量尺是由有关领域的专家经过长期的编制、试用、修订、完善而逐渐形成的标准化测验,它的编制是一项高度专门化的系统工作,要达到科学所要求的水平绝非易事。

心理测量的目标虽然是对人的心理特质进行定量分析,但这种定量分析的精确度远不及物理测量的精确度。

(3)绝对参照点答:测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。

参照点可分为绝对参照点和相对参照点。

绝对参照点以绝对的零点作为测量的起点。

绝对参照点是最为理想的测量参照点,因为它的意义最为明确。

(4)相对参照点答:测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。

参照点可分为绝对参照点和相对参照点。

相对参照点以人为确定的零点作为测量的起点。

最为理想的测量参照点当然是绝对参照点,因为它的意义最为明确。

在人们难以找到绝对参照点的情况下,就必须改用相对参照点。

这种情况是很常见的。

(5)称名量表答:量表是指能够使事物的特征数量化的数字连续体。

斯蒂文斯根据测量中使用的不同参照点和单位,区分出四种不同水平的测量量表:称名量表、顺序量表、等距量表和比率量表。

其中称名量表只是用数字代表事物的成分或用数字对事物进行分类。

称名量表又可细分为两种形式:一是命名量表;二是类别量表。

戴海崎《心理与教育测量》笔记和课后习题详解(测验的项目分析)

第6章测验的项目分析6.1 复习笔记一、测验的难度(一)难度的定义难度是指测验项目的难易程度。

(二)难度的计算测验的计分方法不同,项目难度的计算方法也有所不同。

1.二分法记分项目的难度(1)通过率如果不考虑被试作答是猜测成功的机遇,二分法记分测验项目的难度通常以通过率来表示,即以答对或通过该项目的人数的百分比来表示:。

式中,P代表项目难度,N为全体被试数,R为答对通过该项目的人数。

以通过率表示项目的难度时,通过人数越多,P值越大,其难度越小;通过人数越少,P值越小,难度越大,题目越难。

(2)极端分组法当被试人数较多时,则可以先将被试依照测验总分从高到低排列,分成三组,总分最高的27%被试称为高分组(),总分最低的27%被试为低分组(),分别计算高分组和低分组的通过率,然后求项目的难度。

式中分别表示高分组和低分组的通过率;表示高分组和低分组通过该项目的人数;分别代表高分组和低分组的人数。

2.非二分法记分项目的难度对于论述题,每个项目不只有答对和答错两种可能结果,而是从满分至零分之间有多种可能结果。

对这类项目,常常用下面的公式来计算其难度。

式中x为被试在某一项目上的平均得分,为该项目的满分。

(三)测验难度水平的确定进行难度分析的主要目的是为了筛选项目,项目的难度水平取决于测验的目的、项目形式以及测验的性质。

(1)如果测验的目的是为了了解被试在某方面知识技能的掌握情况,可以不必过多地考虑难度,只要教育者认为重要的内容就可以选用,甚至那些100%通过或通过率为0的项目都可以采用。

(2)如果测验的目的是用于选拔录用人员,就应该将项目的难度控制在接近录取率左右,即较多地采用那些难度值接近录取率的项目。

(四)难度的等距变换通过率P无法指出难度之间差异的大小,对于作进一步的难度分析带来了困难,必须设法将它转换成等距量表。

(1)当样本容量很大时,测验分数将接近正态分布。

此时,可以根据正态分布曲线表,将试题的难度P作为正态曲线下的面积,转换成具有相等单位的等距量数,即Z分数。

戴版《心理与教育测量》课后习题及解答11

戴版《心理与教育测量》课后习题及解答11 练习与思考第一章心理与教育测量概论>>练习与思考 1.与物理测量相比较,阐明心理测量的特点。

2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。

(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。

(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。

3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。

(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。

第二章心理与教育测量的产生与发展>>练习与思考 1.简述古代中国对心理与教育测量的贡献及其特点。

2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点?(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。

一、在测验实践方面的贡献。

1、在能力测量方面。

早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。

董仲舒已论及到注意测验。

刘邵把人的才能划分为12种类型。

6世纪中叶,中国江南出现了类似现在的婴儿发展测验的\周岁试儿\习俗。

出现于清代的益智图、九连环可以认为是最早的创造力测验。

2、在人格测量方面。

孔子把人分为狂者、狷者和中行3种。

刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。

3、在教育测量方面。

世界上最早的教育测量出现于中国西周奴隶时期。

据记载,在西周的\国学\中已经建立具有相当系统性的教育测量制度。

戴海崎《心理与教育测量》笔记和课后习题详解(测量效度)

第5章测量效度5.1 复习笔记一、效度概述(一)效度的概念(1)效度是指一个测验或量表实际能测出其所要测的心理特质的程度。

关于效度的概念,要特别注意以下几点:①效度是一个相对的概念。

这种相对性表现在两个方面:效度是相对于一定的测量目的而言的;心理特质是较隐蔽的特性。

②效度是测量的随机误差和系统误差的综合反映。

③判断一个测量是否有效要从多方面收集证据。

(2)一组测验分数的总变异包括三部分:真实的(稳定的)、与测量目的有关的变异;真实的、但出自无关来源的变异;随机误差的变异。

在测量理论中,效度被定义为:在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,即:这里单位代表测量的效度系数,代表有效变异数,代表总变异数。

(二)效度与信度的关系信度高是效度高的必要而非充分的条件,测验的效度受它的信度制约。

二、效度的估计(一)内容效度1.内容效度的含义内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。

估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。

2.内容效度的应用范围内容效度主要应用于成就测验,用来测量被试掌握某种技能或学习某门课程所达到的程度。

在这种测验中,题目取样的代表性问题是内容效度的主要考察方面。

内容效度也适合于某些用于选拔和分类的职业测验。

这种测验所要测的内容就是实际工作所需的知识和技能,编制这种测验应首先对实际工作做较细的分析。

内容效度不适合用于能力倾向测验和人格测验。

3.内容效度的确定方法(1)逻辑分析法内容效度的确定方法主要是逻辑分析法,其工作思路是请有关专家对测验题目与原定内容范围的吻合程度做出判断。

其具体步骤是:①明确欲测内容的范围,包括知识范围和能力要求两个方面。

②确定每个题目所测的内容,并与测验编制者所列的双向细目表(考试蓝图)对照,逐题比较自己的分类与制卷者的分类,并做记录。

③制定评定量表,考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异,还要考察各种题目数量和分数的比例以及题目形式对内容的适当性,等等,对整个测验的有效性作出总的评价。

戴海崎《心理与教育测量》(第3版)章节题库(第16章测量的综合应用——第17章心理与教育测量理论

戴海崎《⼼理与教育测量》(第3版)章节题库(第16章测量的综合应⽤——第17章⼼理与教育测量理论第16章测量的综合应⽤⼀、单项选择题1.在评价中⼼技术中,⽆领导⼩组、⽂件框等测验属于()。

[统考2010研] A.情境测验B.评定量表C.投射测验D.⾃陈测验【答案】A【解析】评价中⼼技术是现代⼈事测评的⼀种主要形式,被认为是⼀种针对⾼级管理⼈员的最有效的测评⽅法。

⼀次完整的评价中⼼通常需要两三天的时间,对个⼈的评价是在团体中进⾏的。

⽆领导⼩组、⽂件框等测验属于情境测验。

2.关于⼼理测量在⼼理咨询中的应⽤,正确的看法是()。

A.是必不可少的B.可有可⽆C.是没有必要的D.应根据情况选⽤【答案】D【解析】⼼理测验在咨询和⼼理治疗过程中并不是必不可少的⼀个环节,应根据情况选⽤。

如果通过与咨询或治疗对象的交谈,对其问题已形成明确的看法,就可放弃不必要的⼼理测验。

有时过多的使⽤还会影响咨询、治疗的过程和效果。

⼆、论述题⼼理测量在我国⼼理咨询、⼈事测评及教育评价这三⼤领域有哪些主要应⽤?答:⼼理测验在实际应⽤⽅⾯,主要可⽤于选拔⼈才、岗位安置、诊断、预测、评价、辅助咨询等,在⼼理咨询、⼈事测评和教育评价三⼤领域的应⽤分别如下:(1)⼼理测验在⼼理咨询中的应⽤⼼理咨询包括三个核⼼过程:分析诊断过程;帮助指导过程;效果评估过程。

不同形式的⼼理测验在其中⼜有不同的应⽤:①在⾃我认识、⼈⽣规划咨询中,⽐较常⽤的⼈格测验有卡特尔⼈格问卷、YG性格问卷等。

②能⼒⽅⾯的测验有智⼒测验,如韦克斯勒智⼒测验和瑞⽂标准推理测验、能⼒倾向成套测验和单项特殊能⼒测验。

③在神经症、⼈格障碍等咨询中,常⽤的诊断和评估⼯具有明尼苏达多相⼈格调查表、艾森克⼈格问卷、症状⾃评量表以及部分焦虑测验量表。

(2)⼼理测验在⼈事测评中的应⽤⼈事测评是指根据职业或⼯作的要求,通过各种测量⼿段,对⼈的素质适合事的程度进⾏评价的过程,其⽬标是实现⼈与事的最佳匹配。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章测量信度
1.各种信度系数所对应的误差来源是什么?
答:信度主要包括重测信度、复本信度、分半信度、同质性信度、评分者信度,各种信度系数所对应的误差来源分别简述如下:
(1)重测信度系数对应的误差来源
重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。

除去主试,施测环境和被试等方面的误差,它的独特误差来源主要有:
①施测过程中所产生的遗忘和练习效应;
②在两次施测的间隔时间内,被试在所要测查的心理特质方面获得了学习机会。

(2)复本信度系数对应的误差来源
复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

它的误差来源有:
①不能获得严格意义上的平衡测验;
②施测过程中产生的顺序效应和迁移效应;
③在两次施测的间隔时间内,被试在所测量的心理特质上获得了学习机会。

(3)分半信度系数对应的误差来源
分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

它的误差来源是:不同的分半方法的分半信度不同,可能是由于将测验分为相平行的两半的方法不同而产生误差。

(4)同质性信度系数对应的误差来源
同质性信度也称内部一致性系数,它是指测验内部所有题目之间的一致性程度。

克龙巴赫α值还是所有可能的分半信度的平均值,它只是测量信度的下界的一个估计值。

即,α值大,必有测量信度高;但α值小时,却不能断定测量信度不高。

它的误差来源产生于题目是否同质,这包括两个方面:
①所有题目都测的是同一种心理特质;
②所有题目得分之间都具有较高的正相关。

(5)评分者信度系数对应的误差来源
评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。

在心理与教育测量工作中,客观题的评分很少出现误差,但主观题的评分常常会造成误差。

它的误差来源主要是多个评分者之间的个体差异,对相同答案的不同评定,这种个体差异不可能完全消除,只能最大程度低依赖正规的测查程序和统计方法来减小它。

2.已知16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。

答:由题目可得,题目中涉及的信度是分半信度,可以采用分半信度来求解。

由于被试在基数题和偶数题上得分的标准差不同,所以不能采用斯皮尔曼—布朗公式,分半信度可以用弗朗那根公式和卢仑公式。

具体算法如下:
(1)弗朗那根公式
式中分别表示所有被试在两半测验
上得分的变异数,表示全体被试在整个测验上的总得分的变异数。

S a =5.48;S b =5.58;S x =10.76
代入数值得,r xx =0.943。

(2)卢仑公式
式中表示同一组被试在两半测验上得分之差的变异数,其他
符号的含义与弗朗那根公式中的含义相同。

S d =2.56;S x =10.76
代入数值得,r xx =0.943。

3.已知某态度量表有6道题,被试在各题上得分的方差分别是0.80,0.8l ,0.79,0.78,0.80,0.82,测验总分的方差为16.00,求α值。

答:根据题意,代入数据得:
2260.80.810.790.780.80.82(1)(1)0.8416116
i x S K K S α+++++=-=-=--∑ 因此,α值为0.84。

4.怎样提高测量信度?
答:提高测量信度的常用方法有以下几种:
(1)适当增加测验的长度
提高测量信度的一个常用方法是增加一些与原测验中项目具有较好的同质性的项目,增大测验长度。

但是增加测验长度时应当注意:
①新增项目必须与试卷中原有项目同质;
②新增项目的数量必须适度,避免出现报酬递减的效应。

(2)使测验中所有试题的难度接近正态分布,并控制在中等水平。

(3)努力提高测验试题的区分度。

(4)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。

(5)主试者严格执行实测规程,评分者严格按标准给分,实测场地按测验手册的要求进行布置,减少无关因素的干扰。

5.试证信度三个定义的等价性。

答:信度的三个等价操作定义为:
(1)定义1:信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比。

即:,式中代表测量的信度,代表真分数变异,代表总变异数,即实得分数的变异。

(2)定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。

即:。

(3)定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”(B卷)的相关系数。

即:。

6.不同能力水平的人在接受同一测验时,为什么会有不同的测量误差?
答:就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度,如果被试的能力水平相差很大时,此时的测量误差就会偏大。

这是因为,所计算的信息估计值大都是以相关为基础的,而相关系数的大小往往取决于全体被试得分的分布情况:(1)当被试团体异质(即团体内能力水平彼此差异大)时,全体被试的总分分布必然
较广,那么分布位于两个端点的值可能相互抵消,以相关为基础计算出来的信度值必然会大。

这就很有可能高估实际的信度值而产生测量误差。

(2)当团体内部水平相差不大(即能力水平差不多的被试位于同一水平)时,其得分分布必定会较窄,以相关为基础计算出来的信度值必然会小。

这时又有可能低估真正的信度值而产生测量误差。

(3)此外,若团体的平均水平太高(大家都得高分)或太低(大家都得低分),同样会使测验总分的分布变窄,低估测量的真正信度而产生测量误差。

第5章测量效度
1.什么是测量效度?它与信度的关系怎样?
答:(1)测量效度
效度是指一个测验或量表实际能测出其所要测的心理特质的程度,是测量的随机误差和系统误差的综合反映。

一组测验分数的总变异包括3部分:
①真实的(稳定的)、与测量目的有关的变异;
②真实的、但出自无关来源的变异;
③随机误差的变异。

在测量理论中,效度被定义为:在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,即:
这里单位代表测量的效度系数,代表有效变异数,代表总变异数。

(2)测量效度与信度的主要关系
①信度高是效度高的必要而非充分的条件;
②测验的效度受它的信度制约。

2.什么是内容效度?测验编制者和使用者应分别从哪几个方面来把握内容效度?
答:内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。

估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。

内容效度主要应用于成就测验,用来测量被试掌握某种技能或学习某门课程所达到的程度。

在这种测验中,题目取样的代表性问题是内容效度的主要考察方面。

内容效度也适合于。

相关文档
最新文档