人才测评的信度与效度

合集下载

信度与效度的关系

信度与效度的关系

研究信度与效度的关系一、信度与效度的定义信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。

效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系(一)教育科学研究中信度与效度的关系信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。

一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的.效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。

把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。

研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。

(二)人力资源招聘信度与效度的关系影响测评信度的因素有很多,主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、环境的稳定性等都会影响测评的可信度。

影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。

在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。

信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8—l .图8-2和图8—3所示。

所以,:高信度是高效度的必要条件,但非充分条件.即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高,(三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效度的关系当我们用结构式问卷来测量家长“溺爱孩子”的行为时,可以得到相对较高一些的测量信度,用同样的问题反复询问同样的对象时,所得到的结果的一致性程度会比较高,但是,这种测量方法的效度往往会比较低,因为家长们在培养孩子方面的认识、态度和具体做法远比问卷中的五个问题丰富多彩,我们在问卷中所能够测量的只是其中的很少、很表面、很有限的一部分,反之,如果我们用深入到每一个家庭、实地去考察、与家长仔细交谈的方法来进行测量,那么,所得到的资料的效度会比较高,我们实实在在地看到和感受到家长们是如何培养孩子的,但是,此时,我们却降低了观察的一致性程度.一个测量工具要有效度就必须有信度,没有信度就没有效度,但是有了信度不一定有效度,信度低,效度不可能高,因为如果测量的数据不准确,也并不能说明所研究的对象,所以不可能存在唯有效度而没有信度的情况.但同时,信度高,效度未必高,如果我们测量出某人的经济收入,也未必能够说明他的消费水平,然而,效度低,信度很有可能高。

《人才测评技术及应用》期末复习题及答案.docx

《人才测评技术及应用》期末复习题及答案.docx

《人才测评技术及应用》期末复习题及答案一、名词解释题(每小题5分,共30分)1.测评的信度是指测评结果的可靠性和稳定性,或者说是同一测评对同一被试前后前后几次施测的结果之间的一致性程度。

2.职业兴趣人们对某类职业或工作所抱的态度积极性。

3.非结构化面试也叫“随意面试”,其没有既定的模式,框架或程序。

招聘者可以“随意”地向应聘者提出问题,而且对应聘者来说也没有固定的答题标准。

4.晕轮效应对应聘者的某一方面优点或长处看得过重或特别欣赏,从而误认为该人员在其他方面必然也很出色。

5.文件筐测验通常又叫公文处理测验,是情景模拟测验中最常用和最核心的技术之一,一般是让应聘者在限定时间内处理备忘录、函电、报告、声明、请示及无关材料等文件,内容涉及人事、资金、财务、工作程序等方面。

6.性格是指个人对现实的一种稳固的态度以及与之相对应的习惯的行为方式。

7.情绪特征性格的情绪特征表现在人的反应有块有慢,体验有深有浅,表现或强或弱,保持或长或短,心平气和与焦躁激怒,乐观开朗与抑郁低沉,慷慨激昂与冷淡消沉等差异。

8.适应能力适应能力是人的一种综合心理特征,是人适应周围环境的能力。

9.情景面试是让应聘者处于某种具体情景中,根据应聘者在该情景中的一些行为来观察他的各方面能力的面试形式。

10.信度是指测评结果的可靠性和稳定性,或者说是同一测评对同一被试前后几次施测的结果之前的一致性程度。

11.构想人才测评总是要涉及对一些抽象的素质特征的测量,如能力,性格,兴趣,动机等,这些理论上的,抽象的,假设性的素质特征,就被称作构想。

12.胜任特征模型是指承担某一特定的职位角色所应具备的胜任特征要素的总和,即针对该职位表现优异者要求结合起来的胜任特征结构。

13.人才测评又叫人才素质测评,它是一门融合应用心理学、管理学、测量学、社会学及计算机技术于一体的综合性科学,通过履历分析、笔试、心理测验、面试、操作技术、情景模拟等方法,对各类人员的知识技能、工作能力、人格特质等方面进行测量和评估的人力资源管理活动。

自考06090人员素质测评理论与方法_重点复习资料-张羽桐

自考06090人员素质测评理论与方法_重点复习资料-张羽桐

第一章人员素质测评概述一、名词解释1.人力资源:指能够作为生产性要素投入社会经济活动的全部劳动人口总和。

它分为现实的人力资源和潜在的人力资源两部分。

2.人力资本:是指个人所拥有的知识和行为的生产潜能。

3.选拔性测评:是一种以选拔优秀人员为目的的测评。

4.配置性测评:是一种以人力资源合理配置为目的的测评。

5.开发性测评:是一种以开发素质潜能与组织人力资源为目的的测评。

6.诊断性测评:是一种以了解组织人力资源现状或诊断组织在人力资源管理方面的问题为目的的测评。

7.考核性测评:是一种以验证是否具备素质或具备程度为目的的测评。

二、填空1.2.3.4.5.6.三、简答1.人员素质测评的特点:(1)人员素质测评主要针对心理属性(2)人员素质测评属于间接测量(3)人员素质测评的结果不是绝对的2.选拔性测评的特点:(1)特别强调测评的区分功能(2)测评标准的刚性最强,一旦实施绝不允许有丝毫变动(3)测评指标具有选择性(4)选拔性测评的结果或是分数或是等级3.诊断性测评的特点:(1)测评内容相对深入(2)测评结果不宜公开(3)测评具有较强的系统性4.人员素质测评的基本原则:(1)主观与客观相结合的原则(2)静态与动态相结合的原则(3)分项与综合相结合的原则(4)自陈与投射相结合的原则第二章人员素质测评原理一、名词解释1.信度:指的是可靠性程度,通过某项测试所得结果的稳定性和一致性。

2.效度:是指测评工具所测到的是否反映了测量目标的程度,简而言之就是测评有效性程度。

3.项目分析:在编制人员素质测评量表时,首先就面临着需要挑选测评项目的问题,即哪些项目适用于对被测评者进行测评,哪些项目不适用于对被测评者进行测评,这就是项目分析。

4.内部一致性信度:具体表现为被测评者在各个题目上所得成就的一致性。

二、填空1.2.3.三、简答1.人员素质测评的认知演变:(1)从绝对的人到相对的人(2)从静态的人到动态的人(3)从孤立的人到系统的人2.人员素质测评的理论演变:(1)“黑箱理论”(2)“人—岗匹配”理论帕森斯最早提出“人—岗匹配”理论,分为两种类型:条件匹配和特性匹配(3)“人—组织匹配”理论3.影响信度的因素:(1)随机误差:测验内容的自身、施测过程、被测评者自身(2)受测团体的范围(3)测验的长度(4)测验的难度4.心理测评的优点(特点):(1)信度和效度高(2)标准化程度高(3)心理测评的客观性强5.评价中心技术主要包括:(1)无领导小组:是指由一组应聘者组成一个临时工作小组,对一个给定的问题进行讨论并最终做出决策的一种集体面试方法。

《人才测评》 第2章 人才测评原理

《人才测评》 第2章 人才测评原理
(2)个体生理差异。
个体生理差异表现在性别、年龄上。 ① 性别差异。男女两性之间的差异是客观存在的。一般情况下,在能力特征上,男 性在空间知觉、分析综合能力、实验观察和推理方面优于女性;女性在语言表达、 短时记忆方面优于男性。在性格特征上,男性敢于冒险、进取心强、好争斗;女性 比较柔和、富于同情心、更具有审美观念。② 年龄差异。年龄的变化引起了人在各 个方面的差异。一般来说,年轻人体力、知觉、记忆力很好,进取心强,职业感受 性高,接受新知识、新技术快,但是判断能力差、情绪不稳定、缺乏经验。老年人 判断能力强、经验丰富、老练、情绪稳定,但记忆力衰退,体质下降,接受新技术 、新知识欲望不强。处在这两个年龄段之间的中年人,是智力最佳时期。中年人体 质好,既有年轻人思维敏捷、敢于突破、有热情、奋发向上的特点,又有老年人经 验丰富、情绪稳定、富于判断力的长处,这个阶段被称为最佳年龄区。
11
人才测评
第一节 人才测评基本理论
人才测评基本原理: 1.个体差异性原理
(1)个体心理差异
2)个性倾向性差异。 个性倾向性是推动人进行活动的动力系统,是个性结构中最活跃的因素,包括需要 、动机、兴趣、态度、理想、信念、价值观等。
12
人才测评
第一节 人才测评基本理论
人才测评基本原理:
1.个体差异性原理
8
人才测评
第一节 人才测评基本理论
人才测评基本原理:
1.个体差异性原理
(1)个体心理差异
1)个性心理特征差异。 个性心理特征差异表现在能力、气质和性格3个方面。个性心理特征差异表现之一是 个体的能力差异。人与人之间的能力差异是显而易见的。主要表现在能力的类型、 水平和发展早晚3个方面:①能力类型的差异。能力类型的差异一方面表现在一般能 力性向差异。比如,有人长于形象思维,有人善用抽象思维;有人擅长综合概括, 有人喜欢细节分析。另一方面表现为特殊能力不同和能力组合不同。例如,有人音 乐能力强,有人绘画能力强;销售能力同样强的两个员工,一个可能主要靠出色的 人际沟通能力,另一个可能主要靠市场调查分析能力和正确进行销售决策的能力。 ②能力水平差异。能力水平差异在智力上表现最为明显。心理学上将智力水平由低 到高分为许多等级,如智力缺陷、临界状态、中下、中等、中上、优秀、非常优秀7 等。③能力发展早晚的差异。人与人之间在能力发展早晚上也各不相同,有的人少 年早慧,有的人大器晚成,总的来看,大部分9 人在中青年时期表现出能力的最高水 平。

人才测评的信度与效度

人才测评的信度与效度


计算复本信度的主要目的在于考察两个测验复本的题
目取样或内容取样是否等值。复本信度也考虑两个复本实
施的时间间隔。

复本信度的主要优点在于:⑴能够避免重测信度的一
些问题,如记忆效果、练习效应等;⑵适用于进行长期追
踪研究或调查某些干涉变量对测验成绩影响;⑶减少了辅
导或作弊的可能性。
• ☆复本信度的局限性在于:⑴如果测量的行为易受练习的 影响,则复本信度只能减少而不能消除这种影响;⑵有些 测验的性质会由于重复而发生改变;⑶有些测验很难找到 合适的复本。
验信度 , 测验内容应尽量同质。 ( 4 )测验的时间要充分 : 对某一测验而 言 , 应保证绝大多数被试在规定时间内完成 测验 ; 否则 , 如果被试不能从容回答所有问 题 , 就不能反映被试的真实水平。
• ( 5 )测验的程序要统一 : 包括测验的题目统一 , 指导语、回答问题的方式、分收试卷的方法、测 验时间等都要统一。
• (6) 适当增加测验的长度 : 增加测验的长度 可提高测验的信度 , 也可以提高效度 , 但增 加测验的长度对信度的影响大于对效度的 影响。
三、测评手段有效度
切忌以点代面,比如:韩复榘的选任方法
过分依赖一个情景也会降低面试效度 比如:某商场老总招聘员工的方法
员工未来工作绩效预测方法的有效性系数
• ( 2 )测验的难度要适中 : 难度即测验的难 易程度 , 当测验难度太大时 , 被试得分普遍 太低 , 呈负偏态分布 ; 当测验难度太小时 , 被试得分普遍较高 , 呈正偏态分布。太难太 易的测验都使被试得分差异减小 , 使实得分 数方差减小 , 从而降低测验信度。
• ( 3 )测验的内容尽量同质 : 性质相同的测 验内容 , 对被试也要求相同的能力、知识和 技能 ; 而内容不同质的测验 , 则要求被试不 同的能力、 知识和技能。因而为了提高测

人才测评的信度与效度课件

人才测评的信度与效度课件

信度的评估方法
重测信度法
对同一组被测评者进行两次测评 ,计算两次结果的相关系数。
复本信度法
设计两份内容相似、难度相当的测 评工具,对同一组被测评者进行测 评,计算两份测评结果的相关系数 。
内部一致性信度法
计算测评内部各题目之间的相关系 数,以评估整体的一致性。
提高信度的措施
增加测评的次数
通过多次测评来提高结果的稳定性。
业发展建议。
多元化和个性化的测评方法
多种测评工具
除了传统的笔试和面试,还可以采用 心理测试、情境模拟等多种测评工具 ,全面评估人才的综合能力。
个性化评估
针对不同岗位和行业,制定个性化的 测评标准和方法,提高人才选拔的针 对性和准确性。
测评结果的反馈和改进
及时反馈
测评结果应及时反馈给被测评者和相关负责人,以便及时了解自己的优势和不 足,制定改进计划。
从实际应用角度出发,对测评工具的实用 性、可操作性和可靠性等方面进行评估。
提高效度的措施
明确测评目的和要求
在设计和开发测评工具时,要明确测评的目的和要求,确保测评工具 与实际需求相符合。
选取合适的测评方法和指标
根据测评目的和要求,选取合适的测评方法和指标,确保能够全面、 准确地反映被测评者的能力和素质。
筛选优秀人才
通过人才测评,筛选出在 知识、技能、潜力等方面 表现优秀的应聘者,降低 招聘风险。
优化招聘流程
通过人才测评,评估应聘 者的适应性和稳定性,优 化招聘流程,降低招聘成 本。
在培训中的应用
确定培训需求
通过人才测评,评估员工的技能 、知识和能力水平,确定培训需
求和重点。
制定培训计划
根据员工的能力和需求,制定个 性化的培训计划,提高培训效果

人才评价结果的分析

人才评价结果的分析

人才评价结果的分析首都经济贸易大学经济系2003级硕士研究生郝兆丽人们对人才测评的信任感是建立在一定的可靠性和有效性基础之上的,作为评价体系的组成部分,对人才测评的信度和效度进行鉴定是正确解释和应用测评结果的保证,它是对测评本身的测评,是对人才评价工作的评价。

在实际的测验编制过程中,为了改善和提高测验的信度和效度,应对每个测题进行分析,这就是项目分析,主要包括难度分析和区分度分析。

我们将在下面作详细的介绍。

一、信度分析(一)信度的基本概念信度又叫可靠性程度,用于分析一种测评方法所得结果的前后一致性水平,并以这种一致性程度为指标来判断测评的可靠性。

测验结果的可靠性与测验结果受误差影响的程度密切相关。

在人才测评中误差是不可避免的,我们只能尽可能追求高的精度,把误差控制在一个有规律的范围以内,这样测量得到的结果才比较稳定可靠。

信度实际上就是随机误差的一种度量。

(二)信度系数及估计方法一般条件下,信度指标都用信度系数的形式呈现。

信度系数是同一样本在两种不同时间、不同情境条件或两组不同评价材料评定结果之间的相关系数。

针对不同的误差来源,信度可以有不同的确定方法。

一般有以下几种类型:重测信度、复本信度、内部一致性信度、评分者信度。

1.重测信度重测信度又称为稳定性系数,它是估计测评跨时间的一致性程度,即用同一测验,在两个不同时间里对同一群体施测两次,这两次测验分数的相关系数就是重测系数。

一个测验的重测系数越高,说明测评的稳定性越好,测评受随机因素的影响越小。

重测信度所考察的误差来源是时间的变化所带来的随机影响。

在获得重测系数时,最需要注意的是我们必须根据测验的性质和目的来控制合理的时间间隔,这样才有可能获得较好的稳定系数。

时间间隔长了,被试的心理特征就会因为学习、经历、教育培训等因素而发展变化,使相关系数降低;时间间隔短了,又会使首次测评时的练习效果和记忆效果的影响增大,从而造成了假性的高相关。

2.复本信度复本信度又称为等值性系数,它是代表测评跨形式的一致性,即在对被试进行测评以后间隔一定的时间,运用复本再测评一次所获得的复本相关系数。

人才测评的信度与效度

人才测评的信度与效度
人才测评的信度与效度
目录
• 引言 • 信度与效度的概念及关系 • 人才测评的信度分析 • 人才测评的效度分析 • 提高人才测评信度与效度的策略 • 信度与效度在人才测评中的实践应用 • 总结与展望
01 引言
目的和背景
应也日益迫切,人才测 评作为企业选拔人才的重要手段,其信度和效度直接关系 到企业人才选拔的效果。
测评者内部一致性
检验测评者在不同时间或不同情境下 对同一被测评者的评分一致性。
被测评者的信度检验
被测评者稳定性
检验被测评者在不同时间或不同情境下测评结果的稳定性。
被测评者反应一致性
检验被测评者对于相同或相似题目的反应一致性程度。
04 人才测评的效度分析
内容效度
内容覆盖度
测评内容是否全面覆盖所需评估的知识、技能、能力等维度。
通过人才测评,可以更全面地了解应聘者 的特点和优势,为企业实现人岗匹配提供 科学依据。
提升企业绩效
推动个人发展
选对人才能用好人,优秀的人才可以为企 业创造更大的价值,提升企业绩效和竞争 力。
人才测评不仅可以帮助企业选拔人才,也可 以帮助个人更好地了解自己的优势和不足, 为个人的职业发展提供指导。
02 信度与效度的概念及关系
在绩效评估过程中,使用信度和 效度高的测评工具对员工的工作 表现进行评估,确保评估结果的 客观性和准确性。
提供反馈和改进建议
根据员工的测评结果,为员工提 供有针对性的反馈和改进建议, 帮助员工提升工作表现。
07 总结与展望
研究结论回顾
人才测评信度的重要性
信度是人才测评的基础,它确保了测评结果的一致性和稳定性。高信度的 测评工具能够提供可靠的数据支持,有助于准确评估人才的潜力和绩效。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.53 工作实例测试 0.44 智力测验 0.37 同事评价 0.26 以往工作绩效评价 0.18 专业知识测验 0.14 评价中心 0.13 0.11 0.10 0.10 0.01
资料来源:Wayne F. Casio, Managing Human Resources, (McGraw-Hill, 1986)中文版 第 173 页。
• (6) 适当增加测验的长度 : 增加测验的长度 可提高测验的信度 , 也可以提高效度 , 但增 加测验的长度对信度的影响大于对效度的 影响。
三、测评手段有效度
切忌以点代面,比如:韩复榘的选任方法
过分依赖一个情景也会降低面试效度 比如:某商场老总招聘员工的方法
员工未来工作绩效预测方法的有效性系数 招聘新雇员并进行培训时的预测方法 智力测验 工作试用 个人简历 背景调查 实际工作 面试 培训和实际工作成绩 学术成果 教育背景 兴趣 年龄 根据当前绩效预测未来绩效时的方法 0.54 0.53 0.49 0.49 0.48 0.43
• (3) 严格按照测验程序进行测量 , 防止测量 误差 : 要严格按照测验手册进行测量 , 不能 作过多的解释 , 按标准评分 , 两次测验间隔 要适当。
• (4) 样本容量要适当 : 当样本容量增大时 , 样本对总体的代表性提高 , 样本大 , 被试的 内部差异增大 , 扩大了真分数的方差 , 使效 度提高。样本容量一般不应低于 30 。另外 , 抽样方法也很重要 , 一般用随机抽样 , 当群 体很大时 , 可分层抽样 , 样本容量扩大时 , 其代表性才随之增大。


错误拒绝
正确拒绝
预测不好
• 在进行测量时,误差是难免的,这就使得 真实值和测量值之间是不可能完全一致。 我们可以这样来表示真实值和测量值之间 的关系。 • X=T+B+E • T表示真实值,B表示偏差即系统误差,E表 示测量误差即随机误差。
一、信度
• 测试信度(test reliability)也叫测试的可靠性,指测 验结果的一致性、稳定性及可靠性,一般多以内 部一致性来加以表示该测验信度的高低。 • 信度系数愈高即表示该测验的结果愈一致、稳定 与可靠。 • 系统误差对信度没什么影响,因为系统误差总是 以相同的方式影响测量值的,因此不会造成不一 致性。反之,随机误差可能导致不致性,从而降 低信度。 • 信度可以定义为随机误差R影响测量值的程度。 如果R=0,就认为测量是完全可信的,信度最高。
• (5) 正确处理好信度与效度的关系 : 信度是效度的 必要条件 , 但信度高的测验 , 效度不一定高 ; 而效 度高的测验 , 信度却比较高。但是 , 既要有高效 度 , 又要有高信度是不容易做到的。“最大可靠 度(信度)要求测验项目之间有高度的组间相关; 最大预测有效度却要求低度的组间相关。最大可 靠度(信度)要求项目等同的难度;最大预测有 效度却要求项目的难度有所区别。中等程度的组 间相关( 0.10 ─ 0.60), 通常可产生良好的效度 (0.30 ─ 0.80), 并且产生满意的信度 (0.90) 。”


3)编制效度(construct validity)。指一 套测试题的诸项目对编制该测试所依据的 理论的各个基本方面的反映程度。例如, 以结构主义语言理论为基础,认为系统的 语言习惯是通过句型而获得的,那么,强 调词汇和语法环境的测试题目就失去了编 制效度。


4)经验效度(empirical validity)。经验效度 是一种衡量测试有效性的量度,通过把一次测试 与一个或多个标准尺度相对照而得出。经验效度 可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相 近的有效测试的结果相比较,或同教师的鉴定相 比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能 力相比较,或是同教师后来对学生的鉴定相比较 而得出的系数。
第十章、人才测评的信度与效度
人才测评的核心价值在于预测的有效性
预测好 错误接受
正确接受


实际好
实际不好


(四)评分者信度,是指不同评分者对 同样对象进行评定时的一致性。最简单的 估计方法就是随机抽取若干份答卷,由两 个独立的评分者打分,再求每份答卷两个 评判分数的相关系数。这种相关系数的计 算可以用积差相关方法,也可以采用斯皮 尔曼等级相关方法。

提高测验信度的方法
• 影响测验信度的误差归纳起来主要有 : (1) 抽样误差 : 简单说 , 这是在抽样过程中由于被试间的差 异所造成的误差。被试间的差异可以用全距和方差大小来 表示。全距是指某一心理量最大值与最小值之差。全距大 说明被试间差异大 , 全距小说明被试间差异小。被试间在 某一心理量上参差不齐 , 差别悬殊 , 则该心理量的方差大 ; 反之 , 方差小。对于方差小的样本 , 被试间在某一心理特 征上相差较小 , 则前后两次测验结果的一致性较低 , 即降 低了信度。 因为被试之间的差别越小其同质性越高 , 被试 的分数只要发生小的变化 , 其名次就可能改变 , 从而降低 信度。 (2) 随机误差 : 由于各种偶然因素的影响而产生的误差 , 表 现为用同一方法多次测量同一对象时结果上不一致。随机 误差是由许多因素造成的 , 如量标的质量 , 测量的程序 , 被试的身心状态 , 测量的环境等。
• 根据影响测验信度的因素 , 可从以下几方面来提高测验的 信度 : 一是从测验本身考虑 , 如测验的长度、难度、区分 度、速度、程序、环境条件与计分方法等 ; 一是从被试自 身考虑 , 如被试在被测心理特征上的差异大小 , 参加测验 的动机水平 , 对测验的态度和积极性等。在此主要介绍如 下几种提高测验信度的方法 : ( 1 )适当延长测验的长度 : 测验的长度主要指量表所包含的题目多少。对一个测 验来说 , 测验的题目越少 , 得分越容易受偶然因素的影响 , 故测验的信度越低。反之如果测验题目较多 , 即测验长度 延长 , 扩大了被试得分范围 , 可在一定程度上排除偶然因 素的影响 , 从而提高测验信度。但是测验信度的增加并不 是等比例提高信度系数。当信度系数较小时 , 延长测验长 度信度系数增加较大 ; 当信度系数已经较大时 , 延长测验 长度对信度系数的影响就较小了。而且 , 在延长测验长度 时 , 还需考虑其他因素的影响 , 如被试在回答问题时是否 疲倦或产生厌烦情绪 , 是否节省时间、物力和财力 , 测题 是否附合测验目的等。
二、效度
• 效度(Validity)即有效性,它是指测量工 具或手段能够准确测出所需测量的事物的 程度。效度是指所测量到的结果反映所想 要考察内容的程度,测量结果与要考察的 内容越吻合,则效度越高;反之,则效度 越低。效度分为三种类型:内容效度、准 则效度和结构效度。
• 从内容效度﹐到准则效度﹐再到构念效度 ﹐可视为一种累进﹐即构念效度需要比准 则效度更多的信息﹐准则效度需要比内容 效度更多的信息。 • 效度比信度有更高的要求﹐信度是效 度的必要条件﹐没有信度的测量工具就谈 不上具有效度﹐但信度高的测量工具未必 具有高的效度。
• ( 2 )测验的难度要适中 : 难度即测验的难 易程度 , 当测验难度太大时 , 被试得分普遍 太低 , 呈负偏态分布 ; 当测验难度太小时 , 被试得分普遍较高 , 呈正偏态分布。太难太 易的测验都使被试得分差异减小 , 使实得分 数方差减小 , 从而降低测验信度。
• ( 3 )测验的内容尽量同质 : 性质相同的测 验内容 , 对被试也要求相同的能力、知识和 技能 ; 而内容不同质的测验 , 则要求被试不 同的能力、 知识和技能。因而为了提高测 验信度 , 测验内容应尽量同质。 ( 4 )测验的时间要充分 : 对某一测验而 言 , 应保证绝大多数被试在规定时间内完成 测验 ; 否则 , 如果被试不能从容回答所有问 题 , 就不能反映被试的真实水平。
• 测试维度 • 1)表面效度(face validity)。指测试 应达到的卷面标准,即一套测试题从表面 看来是否是合适的。例如,若一次阅读理 解力的测试包括许多受试者没有学过的方 言词汇,则的一种 保证因素。 •

2)内容效度(content validity)。指一套测试 题是否测试了应该测试的内容或者说所测试的内 容是否反映了测试的要求,即测试的代表性和覆 盖面的程度。例如,如果某一套发音技能测试题 仅仅考查发音所必须具备的某些技能,如只考单 一音素的发音,而不考查重读、语调或音素在词 语中的发音,那么,该测试的内容效度就很低。
信度评估的方法
• (一)重测信度,又称为稳定性系数,它的计量方法是 采用重测法:用同一测验,在不同时间对同一群体施测两 次,这两次测量分数的相关系数即为重测系数。 • 重测信度所考察的误差来源是时间的变化所带来的随 机影响。在评估重测信度时,必须注意重测间隔的时间。 对于人格测验,重测间隔在两周到6个月之间比较合适。 • 在进行重测信度的评估时,还应注意以下两个重要问 题:⑴重测信度一般只反映由随机因素导致的变化,而不 反映被试行为的长久变化。⑵不同的行为受随机误差影响 不同。 •
• ( 5 )测验的程序要统一 : 包括测验的题目统一 , 指导语、回答问题的方式、分收试卷的方法、测 验时间等都要统一。 ( 6 )评分要客观 : 评分是否客观对测验信度有 直接的影响。对于客观性题目 , 评分标准明确 , 评 分容易做到客观 ; 但对于主观性题目 , 受评分者影 响较大 , 不易做到客观。为了尽可能客观评分 , 应 制定明确而易掌握的评分标准 , 尽量做到一卷多 评 , 或一人只评一题等。

(三)内部一致性信度,主要反映的是测验内部题目之 间的关系,考察测验的各个题目是否测量了相同的内容或 特质。内部一致性信度又分为分半信度和同质性信度。 • 分半信度系数是通过将测验分成两半,计算这两半测 验之间的相关性而获得的信度系数。测验愈长,信度系数 愈高。 • 同质性信度是指测验内部的各题目在多大程度上考察了同 一内容。同质性信度低时,即使各个测试题看起来似乎是 测量同一特质,但测验实际上是异质的,即测验测量了不 止一种特质。同质性分析与项目分析中的内部一致性分析 相类似。 •
相关文档
最新文档