第五章心理测量工具的评价指标
心理与教育测量学 戴海琦 第三版 重点问答题及答案

第一章、心理测量概述1、心理测量的含义、特点;测量的含义;要素;以及测量的量表(1)心理测量的含义:依据一定的法则,对人的心理特质进行定量描述的过程。
(2)心理测量的特点–间接性:与物理的直接测量不同,从外显行为推测,以间接了解人的心理属性;–相对性:测量的结果是与其所属团体比较而言。
–客观性:即测验的标准化,是对一切测量的基本要求。
(3)什么是测量:测量是根据法则给事物分派数字(S.S.Stevens)事物:测量对象,在心理测量中,想测量的当然是心理能力和人格特点;数字:代表某一事物或事物某一属性的量;法则:测量所依据的规则和方法。
(4)测量的要素:参照点:①测量工作中测量对象的数量的固定原点②绝对参照点:以绝对的零点作为测量起点,如长度/高度③相对参照点:相对零点,如温度[水冰点]、海拔[海平面]单位①理想的单位一是要有确定的意义,不能有不同解释②其次应有相同的价值,即两个单位点之间差异相等。
(5)测量的量表:量表:任何可以使事物数量化的值或量的渐进系列。
①命名量表:数字仅仅代表分类,无任何意义;不可比较,如男女②顺序量表:可比较,没有相同单位和零点,不能加减;如名次③等距量表:可比较,有相同单位无绝对零点,可加减,不可乘除;适用多种统计方法:平均数、标准差等,如温度④比例量表:最理想的量表,有等距的的单位和绝对零点,有倍数关系;如年龄。
2、什么是心理测验,如何理解心理测验?心理测验的类型;心理测量的功能;(1)什么是心理测验:心理测验实质上是行为样本的客观的和标准化的测量。
①行为样本:有代表性的题目②标准化:测验的编制、实施、计分和分数解释的一致性。
③难度的客观测量:测验的编制、实施等过程中减少主试和被试的随意性程度即标准化,测验的难度水平应确定④信度:测验结果的一致性⑤效度:测验结果的有效性和正确性。
(2)、心理测验的类型:①测验对象分:智力测验、能力倾向测验、成就测验、人格测验②按测量方式分:个别测验和团体测验③按测验材料性质分:文字测验和非文字测验④按测验功能分:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
心理测量学复习重点方案

心理测量与测验期末复习整理第一章心理测量的历史1.中国古代心理测量方法:观察法、访谈法、自然实验法2. 冯特1879年在莱比锡大学建立第一所心理实验室。
最先倡导测验运动的是优生学创始人高尔顿。
他开创了个别差异心理学研究,并采用定量研卡特尔1890年在《心理》杂志上发表的论文《心理测验与测量》,这是心理测量第一次出现在文献上。
艾宾浩斯1885年发表《记忆》,开了用实验方法研究记忆的先河,使他成为第一位对记忆这种理过程进行科学定量研究的心理学家。
比奈是发明智力测验常模量表的第一1人90。
5年,比奈与西蒙合作,编制世界上第一个智力测验—比奈-西蒙量表。
美国斯坦福大学的推孟教授年修订了斯坦福b奈量表,首次采用智商)概念。
美国心理学家桑代1克904年出版《心理与社会测量导论》,是关于测验理论的第一部著作。
人格测验的先驱是克雷佩林1,8于92年最早使用自有联想测验诊断精神病人。
3.心理测验的发展,主要受了发面影响:心理学理论的发展、统计学方法的进步。
第二章心理测量概述1、测量就是根据一定的法则用数字对事物加以确定。
2、测量的三要素:事物、数字、法则。
3、测量的两个要素:参照点、单位(参照点是确定事物的量时计算的起点,参照点有两种,绝对零点和相对零点。
0° C'属于相对零点,并不意味着没有温度。
/好的单位要有确定的意义(即对同一单位),还要有相等的价值。
但心理、教育测量所用单位不等值)4、量表:要测量某个事物,必须有一个定有参照点和单位的连续体,将要测量的每个事物放在这个连续体的适当位置上,看它距离参照点的远近,以此得到一个测量值,这个连续体就叫量表。
探 根据测量的精确程度(测量单位的理想不理想,量表分为四类:(1)命名量表:只能按照事物的某种属性对其进行分类或分组。
如性别(男、女)、 学历、企业性质、职业、地区等。
(2) 顺序量表:是对事物之间等级差别或顺序差别的一种测度。
它不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。
心理测量(戴海琦版)课后习题答案

心理测量(戴海琦版)课后习题答案第一章心理与教育测量概论练习与思考练习与思考:1.与物理测量相比较,阐明心理测量的特点。
2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。
(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。
(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。
3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。
(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。
第二章心理与教育测量的产生与发展>>练习与思考练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。
2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点?(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。
一、在测验实践方面的贡献。
1、在能力测量方面。
早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。
董仲舒已论及到注意测验。
刘邵把人的才能划分为12种类型。
6世纪中叶,中国江南出现了类似现在的婴儿发展测验的\周岁试儿\习俗。
出现于清代的益智图、九连环可以认为是最早的创造力测验。
2、在人格测量方面。
孔子把人分为狂者、狷者和中行3种。
刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。
3、在教育测量方面。
世界上最早的教育测量出现于中国西周奴隶时期。
据记载,在西周的\国学\中已经建立具有相当系统性的教育测量制度。
第五章 态度测量技术

3 4 7 10 13 16 13 10 7 4 3 3 2 1 0
4、Q分类量表(续)
Q分类量表是可说是等级顺序量表的一种复杂形式。人们根据事 先规定的具体评价标准,将一组客体——口头陈述、语句、产品 特点、潜在的客户服务等进行分类整理。
Q分类量表要求受测者把所比较的对象或特征按照一些标准分成
(一)配对比较量表 (二)等级顺序量表 (三)常量和量表 (四)Q分类量表
(一)配对比较量表
1、配对比较量表要求被调查者对一系列对 象两两进行比较,并根据某个标准在两个 被比较的对象中做出选择。 举例(1): 下面是三对牙膏的品牌,对于每一品牌, 请指出您更喜欢其中的哪一个。在选中的 品牌旁边的“ ”处打钩。 (1)华夏 双面针 (2)华夏 靓 妹 (3)华夏 洁齿灵
3、等距量表(又称区间量表)
举例: 请按你的喜欢给下列品牌的手机打分, 最高为100分,最少为1分。
步步高 诺基亚 摩托罗拉 三星 联想 金立 80 70 90 85 50 60
3、等距量表(又称区间量表)[续]
在等距量表中,量表上相等的数字距离代表所测量的变 量相等的数量差值。
等距量表的特点:
等距 拥有类别量表与顺序量表所有 判断间距的 的性质,还可比较对象间差别 相等性 的大小,但原点不Байду номын сангаас定
等比 综合了上面3种类型量表的所 有性质,并有固定原点 判断比例的 相等性
温度、品牌认知水 平等复杂概念和偏 好的测量
均值、方差、极 差、z检验、t检 验、因子分析
销售量、市场份额、 几何平均数、调 产品价格、家庭收 和平均数、变异 系数 入等精确数据的测 量
第一节
态度测量及测量量表
第五章 效度

ˆ 这里, Y 为预测的效标分数;
S X 和 SY 分别为效标分数与测验分数的标准差.
X为测验得分。
效标关联效度的关键是选择好效标。一个好的效标必 须具备以下几个条件:(1)可靠性,即效标测验必须具有 较高的信度,如果效标测验不稳定,就不能与本测验有恒 定的关系.相关系数也就不能科学地解释同时或预测效度; (2)有效性,即效标测验本身必须是有效的,如果效标测 验本身缺乏有效性,则无法准确确定本测验的同时效度或 预测效度;〔3)客观性,即效标测验必须尽量客观 标准化.力求排除主观偏见,特别是防止效标污染的影响; (4)实用性.即效标应尽量使其用法简单、省时、花费少、 讲究经济实用。
三、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间 的一致性程度。一般是用本测验与效标测验去测同一组被试得到的 两组分数的相关系数表示。 所谓效标,是检验测验效度的参照标准。效标实际上是本测验 所想测量或要预测的特性或功能,这些特性和功能通常以另一独 立测验的结果来表示。因此,效标是估计效标关联效度的主要根 据,所以效标必须确实能反映某个方面的特性和功能,才能成为估 计测验效度的依据。在运用效标进行测验时.还要避免效标污染。 所谓效标污染,是指由于主试知道某个人(或某个集体)的原来测验 成绩,存有成见,凭印象给分.影响了在效标测验中对某个人(或 某个集体)的成绩评定。
第一节 效度的估算
效度的估算与效度的类型相关,对于测验效度 的类型,不同学者有不同的分类方法。美国心理 学会1974年发行的《教育和心理测验的标准》一 书,正式采用将效度分为内容效度、构想效度和 效标关联效度三大类的方法。目前在教育与心理 测量中,应用最广泛的就是这种效度分类方法。
一、内容效度
内容效度是指测验内容与预定要测的内容之间 的一致性程度。也可以说是指测验内容对所要测 验的全部内容的取样代表性程度。取样代表性是指 测验题目能最大限度地代表预测的内容范围。因 此,一个测验要具有较高的内容效度必须具备两个 条件,其一是测验内容范围明确,其二是取样具有 代表性。
[健康评估]第五章第一节 心理评估[护理学]
![[健康评估]第五章第一节 心理评估[护理学]](https://img.taocdn.com/s3/m/3d2193ab58fb770bf78a55fb.png)
4.调查法
❖ 调查法是通过全面收集了解个体的各方面情 况,如过去和现在的身体健康情况、生活情 况、家庭病史、家庭背景、婚姻状况、工作 环境等情况,对被评估者进行心理评估的一 种方法。
5.医学检测法
❖ 医学检测法包括各种实验室检查和身体状况 评估,如测量血压、呼吸、心率、血浆肾上 腺激素水平等
❖ 可为心理评估提供辅助的客观资料
9同.意我(能A多)一、点不自同尊意就(好D)了、很不同意(SD非)常。同凡意选﹡标有A﹡﹡号的D答案表SD
1示0自.尊我低总下以。积极的态度看待自己
非常同意
A
D﹡
SD﹡
(三)认知评估
1.认知的定义 2.认知的组成 3.认知的评估
1.认知的定义
❖认知是人们推测和判断客观事物的心理过程 ❖是在过去的经验及对有关线索进行分析的基础上
心理活动的概念
❖ 心理活动:心理过程 人格心理
❖ 心理过程是指人的心理活动发生、发展和消失的过程, 包括认知过程、情绪情感过程和意志与行为过程
❖ 人格是具有一定倾向性和比较稳定的个性心理特征的总 和,反映了一个人独特的心理品质
❖ 自我概念作为人格结构的重要成分,与个体的健康密切 相关
❖ 对个体的心理评估应涵盖上述心理活动和心理现象,即 人的自我概念、认知水平、情感与应激等。
2)语言障碍的类型及特点
2)语言障碍的类型及特点
失语 ❖ 因皮质与语言功能特别有关区域的损害所引起,不同的
与语言功能有关的皮质区域损害导致不同类型的失语 ❖ 包括运动性失语、感觉性失语、失写、失读、命名性失
语等 构音困难 ❖ 主要由于发音的肌肉麻痹、共济失调或肌张力增高所致 ❖ 与失语发音准确而用语不正确不同,构音困难者发音不
第五章测量与操作化

注意操作化的伦理问题
尊重被研究者的 隐私和权益
避免对被研究者 的心理和生理造 成伤害
遵循研究伦理和 法律法规
确保研究的公正 性和客观性
注意操作化的实际应用问题
操作化定义要明确:确保操作化的定义清晰、具体,避免产生歧义。 操作化过程要规范:遵循统一的标准和程序,确保操作化的准确性和可靠性。 操作化结果要可验证:提供足够的证据来支持操作化的结果,确保其科学性和可信度。 操作化应用要灵活:根据实际情况调整操作化的应用,使其更好地适应不同的情境和需求。
测量精度
定义:测量结 果与真实值之 间的接近程度
影响因素:测 量工具、方法、 环境条件和操
作人员技能
提高方法:选 择高精度测量 工具、采用标 准操作流程、 控制环境因素 和培训操作人
员
意义:保证测 量结果的准确 性和可靠性, 为后续分析和 决策提供可靠
依据
测量误差
定义:测量误差是指测量结果与真实值之间的差异
在心理学研究中的应用
测量与操作化在心 理学研究中用于描 述、评估和解释人 的心理特征和行为
通过测量与操作化, 可以确定研究变量 之间的关系,建立 理论模型并进行实 证研究
测量与操作化在心 理学研究中有助于 提高研究的客观性 和准确性,减少主 观偏见和误差
测量与操作化在心 理学研究中具有广 泛的应用,如人格 测量、能力测量、 态度测量等
产生原因:仪器误差、操作误差、环境误差等
减小误差的方法:选用精度高的仪器、规范操作、多次测量求平均值等 对结果的影响:误差越大,测量结果越不准确,对分析结果的可靠性影 响越大
操作化的基本步骤
第三章
定义操作边界
确定研究主题和变 量
确定操作化方法和 工具
心理测量学

(4)對來自不同測驗的分數,不能簡單比較,而要進行等值變 換後進行比較。
返回 目錄
報告分數時需要注意的問題
(1)不向被試及相關人員直接報告測驗分數,而是應報告分 數所能說明的意義及相應的建議,以免造成誤解; (2)避免使用專業術語; (3)要保證當事人理解測驗測量或預測的是什麼; (4)要使當事人知道他是在和什麼樣的團體進行比較; (5)要使當事人知道如何運用測驗分數。 (6)要估計到測驗可能給被試帶來的消極影響; (7)要讓被試積極參與測驗分數的解釋。
返回 目錄
3. 測量量表及其種類
如將事物某一屬性的可能值全部列出並按其相對位置排 列,就構成一個測量尺規,這一尺規也叫測量量表。可以將 測量量表劃分為四種:
(1)命名量表 ; (3)等距量表;
(2)順序量表; (4)等比量表
這裏需要注意:各種量表值的意義、量化水準、測量值 允許的運算都不同,具有的測量功能也一樣。2. 心理測量的基本要素
測量有兩個基本要素:參照點和單位 。其中參照點包 括絕對和相對參照點;單位是測量中的等值單元,它必須 具備兩個條件:有確定的意義、有相同的價值。
就心理測量來說:第一,幾乎沒有絕對零點,大多是 以相對零點來進行的;第二,很少有相等單位,所以在對 測量值進行解釋時更多看其相對意義。
(4)與受測者建立良好的協調關係
主試的一個重要素質,就是要取得被試的合作,使 他們按照要求進行測驗。能力或成就測驗,發揮最 佳水準;人格測驗,真實反映情況。
友好、愉快、放鬆的自然態度,真誠、鼓勵又有些 權威感的人格特質。
測驗方式與年齡:年齡小的被試更多要通過遊戲、 口語化的提問和圖片來進行測驗,年齡大一些的被 試更多通過競賽精神來激發測驗動機。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。
在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。
因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。
第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。
任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。
一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。
也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。
我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。
测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。
因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。
一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。
稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。
二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。
测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。
测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。
测量误差通常包括两种不同类型的误差,即系统误差和随机误差。
系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。
系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,而不会使测量值上下波动。
随机误差是由与测量目的无关的偶然因素引起而不易控制的误差,这类误差的方向和大小的变化完全是随机的,无规律可循。
它使多次测量产生不一致的结果,从而降低信度。
因此,信度就是对随机误差的一种测量,随机误差越小,信度越高,如果随机误差为零,就认为测量是完全可信的,这时信度最高。
但是我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。
下面的公式可以用来表示真实值和测量值之间的关系:X=T+E其中X 表示测量值,或称为观察分数(observed score ),它是指在某一次测量中所得的分数值。
T 表示真实值或真实分数(true score),指做无数次测量得到的一个理想的平均值。
E 表示误差分数。
如果我们讨论一组测验分数的特性时,可用方差代表具体分数,得到公式:222E T X S S S += (5.1)即测量分数的方差等于真实分数的方差与误差方差的和数。
此外,我们可以用信度系数来表示信度的大小。
信度系数是同一样本或个体在两种不同时间、不同情境条件下的测量结果之间的相关系数。
信度系数越大,说明测量工具或评价方法的可信程度越强;信度系数越小,则说明可信程度越弱。
在测量理论中,信度系数是指一组测验分数的真实分数方差与测量分数方差的比率,它是一种特殊的相关。
22XT XX S S r = (5.2) 由于真实分数的方差是无法统计的,该公式可转化为:222221XE X E X XX S S S S S r -=-= (5.3) 因此,信度系数也可以看成是总方差中非测量误差的方差所占的比例。
三、信度的作用信度系数的作用是可以解释测量分数中有多少的比例是真正反映被试者真实分数的部分。
信度系数是一个介于0和1之间的数,它代表了从缺乏信度到完全可信的所有状况。
当然,最理想的信度系数值是1,但在实际上是达不到的,因为误差总会存在的。
那么究竟信度系数为多少才算合适呢?对于信度的高低,并没有绝对的评判标准。
一般来说,对于被试间比较而言,当信度系数小于0.70时,不能用测评结果对个人之间做评价,也不能在团体间做比较;当信度系数大于0.7时,可以将测验结果进行不同团体间的比较;当信度系数大于0.85时,测验结果才能应用于个人之间的比较和评价。
四、信度的类型信度的高低由于随机误差的大小而有所不同,由于造成测量的随机误差的来源形式多样,所以评估信度的方法有很多种。
大体有两种途径可循,一种是估量测验结果的稳定性;另一种是估量测验题目的内部一致性,两种途径各有多种方法可以使用。
在这里主要介绍重测信度、复本信度、内部一致性信度、评分者信度四种不同的信度类型和相应的评估方法。
(一)重测信度信度中比较常用的是重测信度(test-retest reliability),又称稳定性信度,它是根据信度的定义而来的,是指用同一种测量工具或测评方法在不同的时间对同样的被试或被试群体施测两次所得结果之间的相关关系。
重测信度是衡量一个测验的结果是否可靠的标准之一。
重测信度最大的特点是用同样的测量工具对测试对象施测两次,但有时候实施重复测量几乎是不可能的,例如学前儿童的识字量、测量消费者对某种新产品的态度。
所以它只能在允许重测的情况下才能进行,其次,测量的心理特质必须是稳定的,这样才能说明结果的不一致是测量工具的影响,而不是被测的心理特质本身的变化造成的。
第三,练习要与遗忘的影响相互抵消。
我们知道第一次测量时被试会留下印象,在下次测验用同样的量表时会受到练习和记忆的影响,但是如果测量的间隔时间合适,那么这种影响就会被遗忘抵消。
第四,要尽量保证两次测验的条件相同,尤其是容易受环境影响的心理特质,以减少随机误差。
最后,所选取的样本应该具有代表性,而且样本量要够大。
通常进行再次测评需要注意以下几个问题:第一是两次测量的间隔时间。
由于重测信度考察的误差来源是时间的变化所带来的随机影响,所以间隔的时间长短必须适度,间隔时间太长或太短都会影响再测信度系数的高低。
不同的测量工具进行再测的时间间隔也是不同的,通常对于人格测评重测时间在两周到6个月之间比较合适;智力测验的间隔时间一般是6个月左右。
第二,第一次的测量可能会改变测量对象的特征。
比如被试在重测时总是试图回忆先前测试时给出的答案。
可以适当增加题目数量来弥补这种影响。
第三,同样的测量工具由于重测的时间不同得到的重测信度也可以是不相同的。
也就是说一模一样的量表重测信度也可以是不同。
所以,在报告重测信度时,不仅要说明相关系数、被试人数、被试基本情况等,还应同时说明施测间隔的时间。
第四,重测信度系数可能会由于被测项目自身之间的相关而偏高。
第五,重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化,而且不同的行为受随机误差的影响不同。
因此我们必须事先分析测量的行为特征。
另外,重测信度的优点是能够提供测量数据随时间变化而改变的结果,为预测被试将来的行为提供依据。
缺点则容易受第一次测验的影响,练习和记忆的效应比较大。
(二)复本信度复本信度(Alternate-form reliability)是用两个平行的测验来测量同一群体,然后求得被试在这两个测验上得分的相关系数,这个相关系数就称为复本系数。
当一个测验没有办法施测两次时,就要通过两个平行的测验来计算测验的信度。
这里谈到的平行测验不仅内容、形式、数量、效度相同,还要求难易度和差异度也相同,即有相同的平均数和标准差。
如果两份测验是同时连续施测,则这时求出来的相关系数称为等值性系数;若两份测验不是同时实施,即隔一段时间再施测,这样得出来的相关系数为稳定性与等值性系数。
复本是针对原测量工具而言的,两个等值的测验互为复本。
复本信度的高低反映了这两个测验复本在内容上的等值性程度,如果两个测验考察的内容侧重不一样,那么两者之间的相关性肯定不会很高,即复本信度低。
计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值,同时复本信度也考虑两个复本实施的时间间隔。
等值系数既可以用来代表测评跨评价角度的一致性,又可以用来表示测评跨时间的一致性和变化。
复本信度的优点:1.它是测量信度的一种好办法,能够考察信度在不同时间和不同内容上的结果。
2.能够避免重测信度的一些问题,如记忆效果和练习效应等。
3.适用于进行长期追踪研究或研究某些干涉变量对测量结果的影响。
4.减少了作弊的机会。
复本信度的局限性在于:1.如果测量的行为易受练习、记忆、成长的影响,则复本信度只能减少而不能消除这种影响。
2.有些测验的性质会由于重复而发生改变。
3.编制测验复本相当困难;不但费时而且费钱,而且也很难够造出内容上完全等价的量表。
从严格的意义上说,两个量表的测量项目应具有相同的均值、方差和相关性,但即使这些条件都满足了,还是有可能出现内容不等价的情况。
这时候相关系数过低可能是量表的信度不够造成的,也可能是由于量表不等价而造成的。
4.测量误差的相关性比重测法低。
(三)内部一致性信度重测信度和复本信度都是建立在信度的基本概念基础上,具有逻辑清晰,易于理解的特点。
但由于两者都需要进行第二次测量,操作成本高,干扰因素多,有时候在实际工作中实施比较困难,那么在无副本只有一次测量结果的情况下,内部一致性信度系数就能较好地解决以上问题。
它是把一个测验的项目分成不同的样本,计算样本间的相关系数,从而间接地得出信度系数的评估方法。
内部一致性信度主要反映的是测验内部题目之间的关系,考察测验的各个题目是否测量了相同的内容或特质。
内部一致性信度包括分半信度和同质性信度。
分半信度是测量内部一致性的简单方法,也是最早的指标。
分半信度(split-half reliability)是通过将测验的项目分成对等的两半,计算这两半测验之间的相关系数而获得的。
这两半相关系数高,则说明量表内部一致性高。
量表的项目可按题号的单数、双数分为两半,也可以随机地划分。
对等两半测验的的内容性质、难易程度最好尽可能一致。
此外,测验愈长,分半信度系数愈高。
分半信度通常在测试只进行一次而且没有复本的情况下使用,要注意以下几点:第一,分半信度系数也会受到分半方法的影响,划分分半的方法不同,得到的信度系数也不同。
第二,分半信度系数的估计要求两半是等值的,如果两半不等值就会产生估计的偏差,等值性越低,偏差越大,因此当一个测验不能分成等值的两部分时不能选用分半信度。
第三,对测验进行分半时,如遇到上下有联系的题目时,应把这些题目放在同一半测验中,这样可以避免高估信度值。
第四,测验为速度型测验或题目中有任选题时,不适合选用分半法评估信度。