第七章 人员测评的信度与效度

合集下载

【推荐下载】论人才测评的效度与信度研究

【推荐下载】论人才测评的效度与信度研究

论人才测评的效度与信度研究本文讲述了关于人才测评的效度与信度的内容,供大家参考,接下来一起具体阅读下吧。

 【摘要】人才测评在现代人力资源管理中的广泛运用,为企业人才选拔提供了参考依据。

然而,其效度和信度一直是企业最关心的问题。

本文将用数量分析方法解来检验企业测评的信度和效度,进而修正和完善自身测评与选拔体系。

 【关键词】人才测评效度信度 一、基本概念 人才测评也叫人才素质测评,是指测评者采用科学的方法,收集被测评者在主要活动领域中的表征信息,针对人才素质测评标准体系做出量值或价值判断的过程;或者从表征信息中引发与推断某些素质特征的过程。

综合运用心理学、管理学、测量学、系统论、行为科学和计算机技术等多种学科的原理和方法,对社会各行各业所需人才的知识水平、能力结构、道德品格、个性特点以及职业倾向和发展潜力等多种素质进行测量和评价的一种选才方法。

 二、问题引述 人才测评往往是一项复杂的工作,尤其是面对大规模招聘和核心人才的选拔,企业需要投入大量的时间、精力。

然而,许多企业随着业务规模的不断扩大,期望构建自己完整的测评与选拔体系,这样的测评体系可以真正反映公司对特定人才的需求,以便做出正确的决策。

调查显示,效度和信度是许多企业关心的核心问题。

一个完善的测评与选拔体系并不是一蹴而就的,完备的测评体系,都是不断修正的结果。

 人才测评的方法是取得被考核人员有关考评数据的手段,经常使用的主要有以下几种:履历档案分析、笔试、心理测量、面试和评价中心技术。

在实际操作中,不同类型人才往往采取不同的测评技术,而企业普遍关心的问题是如何提高测评的信度和效度。

 三、解决方案 1、测评与选拔的可靠性分析 在人员测评与选拔中,结果的可靠性是由测评信度来鉴定,所谓信度是指人员测评与选拔结果的准确性或一致性程度。

按照衡量测评信度程度的方法不同,信度可分为再测信度、复本信度、内在一致性信度和评分者信度。

 (1)再测信度。

指以同样的测评与选拔工具,按照同样的方法,对于相同的对象再次进行测评与选拔,所得先后结果的一致性程度。

信度与效度分析ppt课件

信度与效度分析ppt课件
相关是否显著判断是否有效。
聚合效度
聚合效度也称为收敛效度,是指运用不同测量方法测定同一特质所得结果的相似
5
程度,即对同一特质的两种或多种测定方法间应有较高的相关性。
判别效度 判别效度,是指运测定不同特质和内涵时,测量结果之间不应有太大的相关性。
可编辑课件
8
效度分析的应用
《组织结构、创新与企业绩效》 李忆等 管理工程学报 2009年 收敛效度:较好的收敛效度,是指例如在企业绩效量表,运用不同的市
6
可编辑课件
10
谢谢!
可编辑课件
11
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
重测信度法是指用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两 次施测结果的相关系数。
复本信次填答两份问卷复本,计算两个复本的相关系数。
折半信度法(内在一致性系数)
折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量 表的信度。常用于态度、意见式问卷。
信度分析的方法33信度分析的应用内部一致性?组织结构创新不企业绩效李忆等管理工程学报2009年以企业绩效量表为例系数均大于07内部一致性信度高则表示量表中的市场份额营业额盈利能力等六个方面在得分间的一致性
信度与效度分析
企业管理 王梦茜
可编辑课件
1
目录
一、什么是信度? 二、信度分析的方法 三、信度分析的应用 四、什么是效度? 五、效度分析的指标与方法 六、效度分析的应用
G. 理查德·谢尔
可编辑课件
2
1
什么是信度?
定义:信度是指调查统计结果的稳定性或一致性,也就是对同一调查 对象多次重复进行调查或测量,所得结果的一致程度.

《人力资源开发与管理》:什么是测试的信度与效度

《人力资源开发与管理》:什么是测试的信度与效度

《人力资源开发与管理》:什么是测试的信度与效度第一篇:《人力资源开发与管理》:什么是测试的信度与效度MBA课程名称:《人力资源开发与管理》题目:什么是测试的信度与效度?正文:在人才测评中,要注意信度和效度。

信度和效度是对测试方法的基本要求,只有信度和效度达到一定水平的测试,其结果才适于作为录用决策的依据,否则将误导主试者,影响其作出正确的决策。

一、信度信度主要是指测试结果的可靠性或一致性。

可靠性是指一次又一次的测试总是得出同样的结论,它或者不产生错误,或者产生同样的错误。

信度主要有四类:重测信度、复本信度、内部一致性信度、评分者信度。

1.重测信度又称为稳定性系数,它是指用同一种测试方法对一组应聘者在两个不同时间进行测试的结果的一致性。

一致性可用两次结果之间的相关系数来测定。

重测信度的高低既与测试方法本身有关,也跟测试因素有关。

2.复本信度又称等值性系数,它是指用两个测验复本(功能相同但题目内容不同)来测验同一群体,被试在这两个测验上得分的相关性。

复本信度的高低反映了这两个测验复本在内容上的等值性程度。

3.内部一致性信度。

这一信度主要反映同一测试内部不同题目的测试结果是否具有一致性。

4.评分者信度。

这是指不同评分者对同样对象进行评定时的一致性。

二、效度效度即有效性或精确性,是指实际测到应聘者的有关特征与想要测的特征的符合程度。

效度主要有三类:内容效度、校标关联效度、构想效度。

1.内容效度即测试方法能真正测出想测的内容的程度。

例如,如果某测试工具旨在测量求职者的交流技能,那么高分就意味着此人有很强的交流能力。

2.校标关联效度也可叫做标准相关有效性,是指选择工具能否根据重要标准准确预测工作表现,或根据测试标准得到的测试分数与根据实际工作标准得到的标准分数之间的关系。

其中一个例子是认知能力测试。

这种测试应使分数与人的工作表现精确相关。

有效相关系数范围为-1.00~+1.00。

相关系数越接近1.00,测试工具越有效。

人才测评的信度与效度

人才测评的信度与效度


计算复本信度的主要目的在于考察两个测验复本的题
目取样或内容取样是否等值。复本信度也考虑两个复本实
施的时间间隔。

复本信度的主要优点在于:⑴能够避免重测信度的一
些问题,如记忆效果、练习效应等;⑵适用于进行长期追
踪研究或调查某些干涉变量对测验成绩影响;⑶减少了辅
导或作弊的可能性。
• ☆复本信度的局限性在于:⑴如果测量的行为易受练习的 影响,则复本信度只能减少而不能消除这种影响;⑵有些 测验的性质会由于重复而发生改变;⑶有些测验很难找到 合适的复本。
验信度 , 测验内容应尽量同质。 ( 4 )测验的时间要充分 : 对某一测验而 言 , 应保证绝大多数被试在规定时间内完成 测验 ; 否则 , 如果被试不能从容回答所有问 题 , 就不能反映被试的真实水平。
• ( 5 )测验的程序要统一 : 包括测验的题目统一 , 指导语、回答问题的方式、分收试卷的方法、测 验时间等都要统一。
• (6) 适当增加测验的长度 : 增加测验的长度 可提高测验的信度 , 也可以提高效度 , 但增 加测验的长度对信度的影响大于对效度的 影响。
三、测评手段有效度
切忌以点代面,比如:韩复榘的选任方法
过分依赖一个情景也会降低面试效度 比如:某商场老总招聘员工的方法
员工未来工作绩效预测方法的有效性系数
• ( 2 )测验的难度要适中 : 难度即测验的难 易程度 , 当测验难度太大时 , 被试得分普遍 太低 , 呈负偏态分布 ; 当测验难度太小时 , 被试得分普遍较高 , 呈正偏态分布。太难太 易的测验都使被试得分差异减小 , 使实得分 数方差减小 , 从而降低测验信度。
• ( 3 )测验的内容尽量同质 : 性质相同的测 验内容 , 对被试也要求相同的能力、知识和 技能 ; 而内容不同质的测验 , 则要求被试不 同的能力、 知识和技能。因而为了提高测

《信度和效度测量》课件

《信度和效度测量》课件

外部信度是指 测量工具或方 法与其他测量 工具或方法的 相关性,如重 测信度、复本 信度等
效度是指测 量工具能够 准确地测量 出被测对象 的真实水平 的程度
效度包括内 容效度、结 构效度和信 度效度
内容效度是 指测量工具 的内容是否 符合被测对 象的实际需 求
结构效度是 指测量工具 的结构是否 符合被测对 象的实际需 求
目标
市场调研:通 过信度和效度 测量,提高调 研结果的准确
性和可靠性
应用场景:产 品定位、市场 细分、消费者
行为分析等
招聘与选拔:通 过信度和效度的 测量,可以更准 确地评估应聘者 的能力和素质, 提高招聘和选拔
的准确性。
绩效评估:通过 信度和效度的测 量,可以更准确 地评估员工的工 作表现,为绩效 评估提供科学依
预测效度:测量结果是否能预测未来行 为
区分效度:测量结果是否能区分不同群 体
概念:衡量预测变量与实际结 果之间的相关性
优点:简单易行,易于理解
缺点:可能存在偏差,不能完 全反映实际情况
应用:常用于预测市场趋势、 消费者行为等
PART FIVE
信度:测量工具 的稳定性和可靠 性,确保测量结
果的一致性
应用:广泛应用于 社会科学、教育学 等领域
优点:简单易用, 结果直观
PART FOUR
内容效度法是一种测量 效度的方法,用于评估 测量工具的内容是否与 理论或概念相符合。
内容效度法通常通 过专家评审、问卷 调查等方式进行评 估。
内容效度法可以评 估测量工具的覆盖 范围、准确性和代 表性。
内容效度法可以帮 助研究者确定测量 工具是否适合用于 特定的研究目的。
PART THREE
重测信度法的定义:通过在不同时 间对同一组受试者进行相同的测量, 比较测量结果的一致性来评估信度。

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度什么是测试的信度和效度,如何保证测试的信度和效度棋盘中小张倩倩在教育研究中,信度与效度是很常见的两个概念。

但每次看到或听到这两个名词,我的脑袋老反应不过来,看来基础就是不扎实。

我在这里就谈谈我浅显的认识。

一、信度所谓的信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。

如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化;反之亦然。

根据测量过程中不同的误差来源,可分为再测信度、复本信度和折半信度。

再测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测量分数的相关系数,相关系数越大说明两次测量的一致性越高。

相隔的时间不应该太长。

复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。

如考试中使用的A、B卷折半信度,只用一个测量工具对同一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数。

二、效度所谓的效度,是指测量工具能够测出其所要测量的特征的正确性程度。

效度越高,即表示测量结果越能显示其所要测量的特征。

如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。

常用的有变面效度、内容效度和效标效度。

表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度高,表面效度就高。

内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义的内容越多,内容效度就越高。

效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表示被测概念。

三、信度与效度的关系信度是效度的必要条件,但不是充分条件。

一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。

人才测评的信度与效度

人才测评的信度与效度
人才测评的信度与效度
目录
• 引言 • 信度与效度的概念及关系 • 人才测评的信度分析 • 人才测评的效度分析 • 提高人才测评信度与效度的策略 • 信度与效度在人才测评中的实践应用 • 总结与展望
01 引言
目的和背景
应也日益迫切,人才测 评作为企业选拔人才的重要手段,其信度和效度直接关系 到企业人才选拔的效果。
测评者内部一致性
检验测评者在不同时间或不同情境下 对同一被测评者的评分一致性。
被测评者的信度检验
被测评者稳定性
检验被测评者在不同时间或不同情境下测评结果的稳定性。
被测评者反应一致性
检验被测评者对于相同或相似题目的反应一致性程度。
04 人才测评的效度分析
内容效度
内容覆盖度
测评内容是否全面覆盖所需评估的知识、技能、能力等维度。
通过人才测评,可以更全面地了解应聘者 的特点和优势,为企业实现人岗匹配提供 科学依据。
提升企业绩效
推动个人发展
选对人才能用好人,优秀的人才可以为企 业创造更大的价值,提升企业绩效和竞争 力。
人才测评不仅可以帮助企业选拔人才,也可 以帮助个人更好地了解自己的优势和不足, 为个人的职业发展提供指导。
02 信度与效度的概念及关系
在绩效评估过程中,使用信度和 效度高的测评工具对员工的工作 表现进行评估,确保评估结果的 客观性和准确性。
提供反馈和改进建议
根据员工的测评结果,为员工提 供有针对性的反馈和改进建议, 帮助员工提升工作表现。
07 总结与展望
研究结论回顾
人才测评信度的重要性
信度是人才测评的基础,它确保了测评结果的一致性和稳定性。高信度的 测评工具能够提供可靠的数据支持,有助于准确评估人才的潜力和绩效。

网上人才测评的信度与效度问题

网上人才测评的信度与效度问题

网上人才测评的信度与效度问题网上人才测评的信度与效度问题网上人才测评的信度与效度问题人才测评的信度与效度既是一个理论问题,又是一个技术应用科学性的指标问题。

它是人才测评技术与应用的结合部,而且能对实际考试测评的质量提供保证。

我国人才测评技术的引进和开发在信度和效度方面反映出的问题,概括起来大致有以下几个方面:一是信度、效度理论与有效应用问题主要涉及公务员录用考试测验的信度、效度指标、测评目标的模糊性和效度的解释等问题;二是信度、效度的先导性与可操作性问题,涉及信度、效度与量表编制的关系,效度的可操作性等问题;三是效标效度的时效性问题,主要涉及预测度的准确性、同时效度的功能,预测效度与同时效度的分离状况等问题。

信度(credibility)是指测验结果的可靠性、稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。

这种可靠性体现在:测验结果跨时间的一致性??被测者在不同时间所测结果一致;测验内容的一致性??同一测验内的各部分题目所测的是同一种行为或行为特征;不同评分者之间的一致性??不同评分者对同一测验结果的评分一致。

一项成熟的心理测验都具有比较理想的信度。

信度较低的测验其测验分数的稳定性较差,往往不能反映被测者的真实水平。

计算信度系数的公式和方法很多,通常有这么几种:(1)折半法。

将测验的项目分为两部分,分别计算这两部分的分数,以这两部分分数的相关系数作为折半信度系数。

这种方法简单易行,省时省力。

在把测验的项目进行折半时,可以按奇项--偶项划分,也可以按其它的标准折半。

由这种方法得出的数值仅计算了测验一半项目的信度系数,还要进行修正才能得出整个测验的信度系数。

(2)复本法。

复本是指研究人员同时编制两份量表,它们在内容、形式、难度等方面等同,请被试分别接受两次测验,一次做一份,然后把被试的两次测验得分的相关系数作为复本信度系数。

如果两次测验几乎在同一个时间内完成,则该系数为复本系数,如果间隔的时间较长,则得出的相关系数为稳定或等值系数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.常见的确定构想效度的指标 (1)发展变化 (2)与其他测评的相关 (3)因素分析 因素分析是分析行为资料内部关系、结构 特性的一种统计技术。 (4)内部一致性 如果测评的所有题目被验证为具有很高的 内部一致性,说明它们都是关于同一内容的, 属于同一种构想。 用来考察内部一致性的方法主要有三种: 1)考察总分数较高和较低两类人在各
6.2 .3影响效度的因素 测评本身带来的影响因素 1.测评题目的质量 2.实施测评时的于扰因素 3.被试的影响因素 4.测评的长度 样本团体的性质 效标的性质 如果其他条件相同,所测评的行为或心理 特质与效标行为或特质越相似,效度系数就越 高。
概念与思考题: 重测信度、复本信度、内部一致性、信度、 分半信度、同质性信度、评分者信度、内容效 度、效标关联效度、构想效度、效标效度、相 容效度、预测效度、同时效度、会聚效度、观 念效度、区分效度、效标测评 1.什么是测评的系统误差和随机误差? 2.重测信度和复本信度考察的内容有区别吗? 3.什么是内部一致性信度?它的意义是什么? 4.用分半法求信度为什么通常要进行修正? 5.怎样检查评分者评定的可靠性?
方差:即每个被测评者得分与其算术平均 数差的平方和与总个数之商。公式:
Sx
标准差公式:
2
x x
N
2
Sx
x x
N
2
还可通过分析个人分数再测时的变化(误 差)来考察信度。两次测评分数的差异越大, 信度就越低。 在人员测评中,对信度系数进行确定通常有 以下两方面的作用:
6.1.2 信度的作用 信度高低的指标通常以相关系数表示,称 为信度系数。信度系数一般是同一样本所得的 两组资料的相关,在理论上表示为实得分数与 真实分数相关的平方。信度系数公式:
rxx rxr
2
ST SX
2 2
ST 其中: rxr SX
它是
真实分数标准差与实得分数标准差的比率。 其中,rxr 有时也称为信度指数,它是真实分数 标准差与实得分数标准差的比率。
W
i i
19 11 6 8 17 23 84
2
192 112 6 2 82 172 232 1400 224
S 1400 842 / 6 224 1 4 2 63 6 12


0.80
6.1.5 影响信度的因素 1.样本团体的性质 1)样本团体的分数分布 分数分布越广,信度系数就相对越高,分 数分布越窄,信度系数就会越低。
1.解释真实分数与实得分数的相关性 总的方差(即标准差的平方的缩略语)中 有多少比例是由真实分数的方差决定的。 2.说明可以接受的信度水准 一般的能力与成就测评的信度系数在0.90 以上;人格、兴趣等测评的信度系数通常在 0.80-0.85之间。 rxx<0.70时,不能用测评 对个人作评价,也不能在团体间作比较; 当rxx>0.70时,可用于团体间比较;rxx>0.85 时,可用于鉴别个人情况。 6.1.3 如何评估人员测评的信度 1.重测信度又称为稳定性系数 用同一测评,在不同时间对同一群体施测
W
S 1 K2 N3 N 12



Ri
i 1
N
2
Ri i 1 N
N
2
1 K2 N3 N 12


其中,K为评分者人数,N为被评定的人数 或答卷数;Ri为评分者给某人(或某一答卷) 评分之和。
S Ri i 1
N 2
1 N

分半法经常会低估信度,必须进行修正。斯皮 尔曼一布朗公式可以估计增长或缩短一个测评 对其信度系数的影响,用这个公式进行修正的 前提条件为:两半测评的方差相等。 分半法中的斯皮尔曼一布朗修正公式为:
2rhh rxx 1 rhh
其中, rhh 为两半测评的相关系数, rxx 为估 计或修正后的信度。 当两半测评的方差不同时,应采用卢伦公 式或弗拉纳根公式进行修正。
题目上通过率的大小 ,如果通过率低,应淘汰 或修改。 2)计算题目与总分的相关,如未达显著 水准,应予淘汰。 3)求分测评与总分的相关。各分测评与 总分有显著相关,如果不是,则应予删除。 (5)会聚效度和区分效度 会聚效度:测评与测评相同特质或构想等 理论上有关的变量高相关; 区分效度:测评与测评不同特质或构想等 理论上无关的变量低相关。 如,一个数学推理能力测评与数学课成绩 的相关就是会聚效度;而该测评与阅读理解能 力测评的相关显著低,就是区分效度。
时,还应注意以下两个重要问题: 1)重测信度一般只反映由随机因素导致的变化, 而不反映被试行为的长久变化。 2)不同行为受随机误差的影响不同。
2.复本信度又称等值性系数。 它是以两个测评复本(功能等值但题目内 容不同)来测评同一群体,然后求得应试者在 这两个测评上得分的相关系数(积差相关)。 复本信度的高低反映了这两个测评复本在内容 上的等值性程度。两个等值的测评互为复本。 3.内部一致性信度 内部一致性信度主要反映的是测评内部题 目之间的关系,考察测评的各个题目是否测评 了相同的内容或特质。 1)分半信度 分半信度系数是通过将测评分成两半,计 算这两半测评之间的相关性而获得的信度系数。
i 1
N
Ri
2
为每一个对象被评等级。
例如,有4名评分者,对6份答卷进行评分,所 评等级如下: 评分者 甲 乙 丙 丁 Ri 一 二
答卷编号 三 四 1 2 2 1 6 2 1 3 2 8


4 5 4 6 19
3 3 1 4 11
5 4 5 3 17
6 6 6 5 23
R R
6.2人员测评的效度 测评的效度就是指测评的有效性,即能测 评到所要测评目标的程度。效度是评价测评好 坏、选择测评的重要标准之一。 效度的作用比信度的作用更为重要。强调 测评目标、工具与测评对象的统一。 6.2 .1人员测评的有效性 效度的理论定义:与测评目标有关的真实 分数方差与总分方差的比率。 公式:
第七章 人员测评的信度与效度
6.1人员测评的可靠性——信度 6.1.1信度的定义 信度主要是指测评结果的可靠性或一致性。 由测评工具否精确引起的误差叫系统误差。 由操作是否到位引起的误差叫随机误差。 信度考虑两方面的问题。 一是稳定性:不同时间、不同测评条件下所 得分数之间的一致性有多大;一个人的所得分 数与“真实分数”之间接近程度有多大;是否 可以达到实际应用的程度等。 二是影响稳定性的原因:什么因素造成了这 种差异;这些影响的相对作用有多大。
Sa2与Sb2为两个分测评分数的方差;Sx2为总分方差。
2
2)同质性信度 同质性是指所有测评题目测评的只是单一 特质或内容,表现为所有测评题目得分的一致 性。乐观情绪特质和外向特质、预测和决策、 监督与控制等都是不太容易区分的。 如果需要在一个测评中测评不同的内容, 就应该将测评设计为几个分测评,每个分测评 测评一种内容。例如,16PF人格测评就是包含 16个分量表的测评,每个分量表只对一种人格 特质进行测评。 常用的同质性信度计算方法是库德—理查 逊估计方法。计算公式有库德—理查逊20号公 式(简称(KR20)和21号公式(KR21)。
两次,这两次测评分数的相关系数即为重测系 数。一个测评的重测信度越高,说明测评的结 果越一致、越可靠。积差相关公式:
r
N x x N y
2 2
N xy x y
2
y
2

N为两次测评结果数据配对总数;x被分析的测评结果; y为重复测评得到的结果。在进行重测信度的评估
rxx 为取样的信度;Sx 其中, r ' xx 为估计的信度; SX 为取样团体的标准差;Sx ' 为估计团体(取样的 总体)的标准差。
3)不同团体间能力水平的差异 2.测评的长度 信度还会受测评长度(即题目的多少) 的影响。一般来说,测评越长,信度值 越高。 3.测评的难度 测评的难度也会对信度产生影响。 如果一个测评的难度太低,出现天花板 效应;如果难度太大,出现地板效应,
卢伦公式只要求将被试在两半测评的分数 之差的方差(Sd2)和测评总分的方差(Sx2)代入 如下公式即可直接计算分半信度:
Sd rxx 1 2 Sx 其中Sd2为两测评分数之差的方差;Sx2为 测评总分的方差。 也可以采用弗拉纳根公式直接计算分半信 度: S a 2 Sb 2 rxx 2 1 2 Sx
2.内容效度的评估方法 ·测评内容范围明确; ·测评内容的取样有代表性。 采用如下步骤: 1)确定总体范围; 2)编制双向细目表; 3)制定评定量表。 还可采用经验的方法、统计分析方法。 3.内容效度的应用 内容效度最适合于评估教育和职业成就测评。 也适合于某些用于人员选拔和分类的测评。
6.2 .2 .2效标关联效度 效标关联效度,也称效标效度,它反映的 是测评分数与外在标准(效标)的相关程度, 即测评分数对个体的效标行为表现进行预测的 有效性程度。 效标是考察测评效用的外在参照标准。效 标关联效度往往用于预测性测评。 1.预测效度和同时效度 预测效度的效标资料往往是测评结束后隔 一段时间才获得,它反映被试行为表现的预测 程度。 同时效度的效标材料可以和测评分数差不 多同时搜集。
3.常用的效标 (1)学术成就 (2)特殊训练成绩 (3)实际工作表现 (4)团体对照 (5)等级评定 (6)先前有效的测评 6.2 .2 .3构想效度 构想效度是指测评能够测评到理论上的构 想或特质的程度。所谓构想通常指一些抽象的、 假设性的概念或特质,如智力、创造力、言语 流畅性、焦虑等。
1.确定构想效度的步骤 ·建立理论框架,以解释被试在测评上的表现; ·依据理论框架,推演出各种有关测评成绩的 假设; ·以逻辑和实证的方法来验证假设,根据累积 材料决定这种理论是否能恰当地解释现有材料; 如果不能做出恰当解释,则应该修正上述假设, 直到能做出恰当的解释为止。 如:创造力测评构想效度。以测评分数与 根据创造力的心理学理论观察被试行为所做出 的判断做相关分析。
相关文档
最新文档