第七章 效度
2018考研心理学考研心理测量知识要点:效度

1、效度是指:测验能测量到所要测量的对象的程度。
这⼀定义包含着两层含义:测验测量什么?测验对测量⽬标的测量精确度和真实性是多少? 2、效度的公式为:rxy = SV2/SX2它是与测量⽬标有关的真实分数⽅差与总⽅差的⽐率。
其中rxy是常⽤的效度表⽰法;SV2是“有关的真实⽅差”,也就是由测验所要测量的⼼理变量引起的⽅差,也叫有效⽅差;SX2是总⽅差。
3、信度和效度的差别是:两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的⽐例,效度则还包括与测验⽆关的但稳定的测量误差。
(1)信度是效度的必要⽽⾮充分条件。
(2)效度是受信度制约的。
4、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。
(1)效度具有相对性。
(2)效度具有连续性。
测验的有效性只有程度上的差别。
(3)效度也不是直接就可以测量到的,它是从已有的证据推理⽽来的。
5、效度的种类:内容效度、构思效度和效标关联效度。
6、效标关联效度是指:测验总分数与外在标20、准(效标)之间的相关程度,反映的是⽤测验预测个体在某种情境下⾏为的表现如何的有效性程度。
由于外在标准成了考察测验有效性的参照标准,因此简称为效标。
7、阿斯丁把效标分为两个层次:⼀是理论描述⽔平的“观念效标”,⼆是操作定义⽔平的“效标测量”。
(1)观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。
(2)效标测量的⼀个重要特征是客观性。
为此因做到: 1 避免偏见影响效标测量,特别是以等级评定为效标4 测量时,评分者的主观偏见会有很⼤影响。
2 防⽌效标污染,即指个⼈的效标因评定者知道个体的测验分数(也叫预测源分数)⽽受到影响。
8、常⽤的效标:学业成就、临床诊断、实际⼯作表现、特殊训练成绩、效标团体⽐较、先前有效的测验、等级评定。
9、同时效度:它的效标资料是和测验分数差不多同时搜集的。
⼀般情况下,它可以代替预测效度。
护理学研究,知识点讲义,第七章 研究工具性能的测定

第七章研究工具性能的测定学习目标掌握1.信度的概念2.信度的不同特征与测量方法3.效度的概念;效度的多种表达形式熟悉计算信度的方法熟悉建立和测量效度的方法了解国外量表的翻译步骤第一节研究工具的信度(reliability)一、基本概念:定义:使用研究工具所获得的结果的一致程度或准确程度信度的三个主要特征1、稳定性用同一工具两次或多次测定同一研究对象,所得结果的一致程度。
一致程度越高,工具的稳定性越好。
2、内在一致性组成研究工具的各项目之间的同质性和内在相关性。
内在相关性越大或同质性越好,工具的内在一致性越好,信度越高。
3、等同性不同评定者使用相同工具同时测量相同对象时,评定者间的一致程度;或大致相同两个研究工具同时被用于研究对象,工具的一致程度。
二、信度的测量方法稳定性测量——重测信度内在一致性测量——折半信度Cronbach’α系数KR-20值等同性测量——评定者间信度复本信度1、重测信度(test-retest reliability)定义: 用同一工具两次或多次测定同一研究对象所得结果的一致程度。
常表示研究工具的稳定性。
一致程度越高,重测信度越高,研究工具的稳定性越好。
计算方法:使用研究工具对研究对象施行第一次测试,间隔一段时间后使用同一工具对同一研究对象进行重测,然后计算两次资料的相关系数,该系数反映研究工具重测信度的高低。
相关系数在0~1之间,越接近1,说明重测信度越高。
研究对象第一次测试(X)第二次测试(Y)例:人格问卷重测数值表例: 第一次测试和第二次测试数据间的相关系数即为人格问卷的重测信度。
公式如下:X ∑ :第一次测试10名研究对象各得分之和 Y ∑ :第二次测试10名研究对象各得分之和2X ∑ :第一次测试10名研究对象各得分平方之和 1 23 272 44 383 35 374 53 495 44 466 26 287 32 348 28 259 38 341039 362Y :第二次测试10名研究对象各得分平方之和使用重测信度需考虑的问题两次测量之间的间隔时间1)使第一次测量对第二次测量的结果不会造成影响;2)在客观情况未发生改变时进行;测量环境的一致尽量保证测量环境的一致,如相同的测试者、相同的测量程序、相同的测量时间、相同的测量环境等工具所测量的变量的性质:1)对性质相对稳定的问题,如个性、价值观、生活质量等进行测量,适宜用重测信度来表示研究工具的信度如何;2)对性质不稳定的问题,如情感、态度、知识等进行测量,则不宜使用重测信度来表示研究工具的信度如何。
效度[教学教程课件

第一节 效度的概述
一、效度的定义
效度是衡量测验结果有效性的重要 指标,它是指一个测验是否能准确地测 量出它所要测量的特质或功能的程度。
对于物理、化学等自然科学,效度 的问题并不是很突出的,因为科学家们 很清楚他的工具所测量的是什么。例如, 天平,测到的肯定是重量;米尺,测到
的肯定是长度。但是在教育和心理的测 量中,由于被测试的对象非常复杂,只 能采用间接测量的方法,由此就产生了 效度的问题。测量的有效性是良好测验 的最基本条件,一个缺乏效度的测量是 毫无价值的。
2、根据各项教材重点和各类行为改 变的相对重要性而决定它们的权重。
3、编制一个命题双向细目表 4、根据命题双向细目表来编制测验。
A、成就测验的效标,可以是学年的平均成 绩,教师的评定结果,学习量,对所学知 识的应用能力,评判知识的批判能力,自 学能力等等。
B、智力测验的效标,可以是学科的成绩, 教师的评定结果,学生的总成绩等等。
(3)训练差异评定内容效度:先给一组 被试进行先期测量,这组人必须对测验 与包含的内容具有最少量的知识,然后 让这组人参加训练活动,再给以后期测 量,这样可以发现测验是否测量了课堂 上所教的知识,如果后期测量的结果显 著优于前期,就说明该测验对课程内容 范围的测量是有效的。
第三节 效标关联效度
效度的形式化定义是指与测验目的
有关的真实变异数 Sv2 和实得分数变异 数 Sx2 之比,即效度。
rxy= Sv2 / Sx2
二、效度的种类
美国心理学会1974年发行的《教育和心理 测验的标准》一书中将效度区分为内容效度、 效标关联效度和结构效度。
内容效度是指测验的试题能否充分代表其 所要测量的内容范围,它的检验方法一般是靠 专家来评测。
效度的名词解释

效度的名词解释
效度是指一个测试或测量工具的有效性和准确性。
在心理学、教育学、医学等领域中,效度是评估测量工具的重要指标之一。
它是指测量工具所测量的内容是否与被测量的现象相对应。
如果一个测量工具具有高效度,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。
效度分为内部效度和外部效度两种。
内部效度是指测量工具的各项指标之间的相互关系,包括信度、稳定性、一致性等。
信度是指测量工具的稳定性和一致性,即测量结果的可靠性。
稳定性是指测量工具在不同时间、不同环境下所得到的结果是否一致。
一致性是指测量工具的各项指标之间是否相互协调和一致。
外部效度则是指测量工具与被测量现象之间的关系,包括相关效度、预测效度、构效度等。
相关效度是指测量工具所测量的内容与被测量现象之间的相关性。
预测效度是指测量工具能否准确地预测被测量现象的变化趋势。
构效度是指测量工具所测量的内容是否与被测量现象的内在结构相一致。
测量工具的效度是评估其是否具有正确性和准确性的重要指标。
一个测量工具的效度高,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。
因此,在选择和使用测量工具时,必须考虑其效度,以保证测量结果的准确性和可靠性。
同时,在测量过程中,也应该注意对测量工具的效度进行监测和评估,以确保测量结果的正确性和准确性。
总之,效度是测量工具的一个重要指标,它关系到测量结果的准
确性和可靠性。
在选择和使用测量工具时,必须考虑其效度,并对其进行监测和评估,以确保测量结果的正确性和准确性。
第七章 - 效度和信度

三、改善信度的途径
改善评价者的信度 例:在汉语测试的主观题阅卷工作中,为了提高评价者信度,要使
用有汉语教学经验并接受过汉语教学评价训练的汉语教师担任评 价者。
改善评价对象的信度 例:应该在多个不同的场合评价同一对象 改善评价工具的信度 例:创造理想的评价条件,如安静的考场,良好的录音听力设备等。
第二节 汉语教学评价信息的效度
2. 有害的反拨效应 3. 有益的反拨效应
相互依存又相互排斥 -没有信度不可能有效度。 -没有效度,信度也就毫无意义。 -高信度可能会带来低效度;高效度也可能会带 来低信度。 例如:客观题能满足信度要求,却不符合效度要 求;主观题符合效度要求,却不符合信度要求。
例:看拼音,写汉字。 chējié guǒkū jìnyě ( )( ) ( ) 分析:低信度,低效度。换言之,没有信度, 分析:低信度,低效度。换言之,没有信度,不 可能有效度。 可能有效度。
影响效度的因素
汉语测试本身的构成 汉语被试的特点
精心编制测试或量表 试题要很好的地代表想测的内容或结构。例外,题目指令要清楚,题 目不宜太难或太简单,题量也不宜太少,题目顺序安排也要得当。 创造规范的应试环境 汉语考试者的应试动机,时间,态度,身体状态都会影响效度。 学生要遵守指令,评分者也要认真评分。 严密组织和安排测试
可行性指用来收集汉语教学评价信息的某 种评价方案是否便于实际投入施行。
可行性的相关因素
思考:在计划评价和收集信息的时候,我们应该 考虑什么? 1. 资金投入 2. 时间耗费 3. 收集者资格 4. 可接受性 5. 反拨效应
反拨效应
1.概念
测试对教学和学习所产生的影响被称为反拨效应。 测试对教学和学习所产生的影响被称为反拨效应。
效度分析

内容效度的应用
• 是编制任何测验都要考虑的基本方面; • 适合于教育和职业成就测验;
– 作用一:该测验是否是应该考察的某种技能和 知识的代表性样本;
– 作用二:测验的成绩是否与其他无关内容无关。
效标(实证)效度
•效标效度指测验分数与外在标准(效标)的相关程 度。测验分数对个体的效标行为表现进行预测的有效 性程度。 •效标:考察测验效用的外在参照标准。被预测的行 为是检验测验效度的标准,就是效标。 •实证(效标)效度强调的是效标行为,因此,测验 内容是次要的,测验题目不需要与效标有明显关系, 只要测验分数能预测效标行为。
t xs x f ss2 s f 2 NS N f
确定实证效度的方法
• 命中率
– 总命中率:正确决定数目对总数目的比率 – 正命中率:所选择的人成功的比例,选择效率
效标成绩 测验预测
成功(+)
失败(-) (A)失误
成功(+) (B)命中
失败(-)
(C)命中
(D)失误
命中率种类
总命中率
命中 命中+失误
信度与效度的关系
▪ 信度是效度的必要条件,但非充分条件
▪ 测量的信度只受随机误差因素的影响, 不受系统误差因素的影响 ▪ 测量的效度既受随机误差因素的影响, 又受系统误差因素的影响 ▪ 因此,测量的效度总低于信度
信度与效度的关系
SX2
SV2
SI2
SE2
ST2
SV2 代表有效变异; ST2代表信度变异; SI2代表系统变异; SE2代表随机误差变异; Sx2 代表总变异。
内容效度的确定方法
• 专家判断法
– 确定测验内容的总体范围和边界; – 确定每个指标是否具有代表性; – 编制双向细目表,确定内容的具体细节各自所
教育统计与测量 第7章 效度

结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。 当实际测量的资料无法证实我们的理论假设时 ,并不一定就表明该测验结构效度高。因为还 有可能出现理论假设不成立,或者该实验设计 不能对该假设作适当的检查等情况,这就使得 结构效度的获取更为困难。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
同时效度:用于标准化测验的建立 预测效度:常用于评定原测验的预测功能。
可靠性:较高的信度 有效性 客观性 实用性
28
通过因子分析,可以找出少数的几个因子 来代替原来的变量做回归分析、聚类分析、判别
分析等。
29
因子分析可以通过下面的数学模型来表示:
独特因子
公共因素
30
因子分析把每个原始变量分解成两部分:一部分是由所 有变量共同具有的少数几个因子所构成的,即所谓公共因
素部分;另一部分是每个变量独自具有的因素,即所谓独
Байду номын сангаас
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。 (2)统计分析法。 科隆巴赫法:从同一个教学内容总体中抽取两套独立的 平行测验,用这两个测验来测同一批被试,求其相关。 若相关高,表明测验内容效度较高;若相关低,表示测 验的内容效度较低。 评分一致性考查法:不同评分者之间评分的一致性程度 前后测比较法:训练前后测验的差异 内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。 内容效度不适合用于能力倾向和人格测验。
07第七章 社会测量

1、定类测量 (nominal measurement)
也称类别测量或定名测量 本质:(分类体系)将调查对象的不同属性或特征加
以区分,标以不同的名称或符号,以确定其类别。
数学特征:等于、不等于(或者属于与不属于); 定类尺度是社会测量的最低层次;不能类比大小和按
排顺序,更不能进行加减、乘除运算。
实例:对人们的性别、职业、等变量特征的测量,都 是常见的定类尺度的测量。 遵循原则:互斥、穷尽等
量表可根据他的测量内容分类 分为:态度量表、能力量表、智力量表、人 格量表等类型。
量表还可以分为调查量表与测验量表
1、总加量表
总加量表:就是用不同的回答构成一个简单 累加的分数。它是由一组有关事物的态度或 看法的陈述构成,回答者分别对这些陈述发 表同意或不同意的意见,然后按照某种标准 将回答者在全部陈述上的得分加起来,就得 到了该回答者对这一事物态度化的量化结果。
定比测量与定距测量的差别:是否有绝对零点
定比测量是一种能够测定事物之间比例、倍数关 系的测量尺度。 (1)定比尺度是测量中的最高层次,它除了定类、 定序、定距尺度的特征之外,还具有实在意义的 真正零点。 (2)定比尺度下的数字是可以进行四则运算的, 运算的结果都有实在意义。 (3)一个变量能否以定比尺度测量,关键在于零 点是否绝对。 定比测量可以进行乘除运算。如:一群人的平均 年龄是可以计算的,但其平均宗教信仰是不可以 计算的,因为宗教信仰是定类变量。
这个分数是其态度的量化结果,它的高低就代 表了个人在态度量表上的位置。
总加量表
总加量表也称为李克特量表(Likert Scaling)是社会调查问卷中用的最多的一种 量表形式,它最初形式是给出一组问题,请被 调查者做出 “同意”或 “不同意”的回答.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教案课题:《第七章效度》课型:新授课课时:3学时教学目标:1.了解效度的意义。
2.掌握效度的类型及各种估算方法。
3.了解提高测验效度的方法教学重难点:∙教学重点:效度估算的各种类型,提高测验效度的六种方法。
∙教学难点:效度估算各种类型的计算方法。
教学方法:读书指导法、讲授法、练习法。
教学过程:一、导入:列举效度的意义,激发学生的学习动机。
二、感知:引导学生感知学习内容。
三、讲授:通过具体内容的讲授分析,促进学生进一步理解学习内容。
讲授主要内容如下:一、内容效度(一)内容效度的概念内容效度是指测验内容与预定要测的内容之间的一致性程度。
也可以说是测验题目所涉及的内容对所要测验的全部内容的取样代表性程度。
取样代表性是指测验题目能最大限度地代表欲测的内容范围。
因此,一个测验要具有较高的内容效度必须具备两个条件:其一是测验内容范围明确,即必须明确界定所要测验的内容范围;其二是取样具有代表性,即测验题目对所有测验内容的覆盖面要大。
在理解测验的内容效度时,不要与测验的表面效度相混淆。
表面效度是指从外表直观地看,测验题目与测验目标的一致性程度。
表面效度从严格意义上讲不能算作一种效度的,但在实际测验中却是不能忽视的。
(二)内容效度的估计方法1.逻辑分析法用逻辑分析法估计内容效度,主要是指依据教材内容、课程标准的范围以及教学目标分析测验内容,检查测验内容究竟在体现教材内容和教学目标方面达到多大的程度。
用逻辑分析法估计内容效度实际上是在进行定性分析。
这种方法的缺点主要表现在:没有数量指标来描述教材内容、教学目标与测验试题的一致性程度;内容效度一般采用专家主观性评判,因而很难做到客观、准确,不同判断者的判断标准不同,可能导致批评结果的不一致。
因而,对内容效度的估计必须谨慎,而且对内容效度的估计值也应当一分为二的看待。
2.统计分析法统计分析法主要是采取定量分析手段来描述测验的内容效度,其方法主要有以下几种:(1)克龙巴赫法克龙巴赫曾提出估计内容效度可以用同一教学内容范围的总体中抽取两套独立的测验试题,用这两套测验试题对相同的被试分别进行测验,测验之后求得两次得分的相关系数,如果相关系数大,就可推论内容效度高,若相关系数小,则说明这两套试题中至少有一套测验的内容效度比较低。
(2)评分一致性考查法内容效度的确定也可以计算不同评分者之间评分的一致性程度,即考查评分者的信度。
虽然它代表的是测验信度,但由于来自两个独立的评判者,因此符合程度越高就反映测验的内容效度也越高。
(3)前后测比较法这种方法是,先对一组被试进行前期测验,这一组被试对测验的内容知之甚少,然后对这一组被试进行有关内容的教学与训练,经过一定时间后,再对这一组被试进行后期测验,这样可以看出测验是否测验出课堂上进行的教学与训练的效果。
二、构想效度(一)构想效度的概念构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度,构想效度主要适用于心理测验效度的确定。
所谓构想,是指心理学理论所涉及的抽象而属假设性的概念、特质或变量,如智力、能力倾向、行为习惯、成就动机、人格结构等。
(二)确定构想效度的步骤和方法确定构想效度的步骤和方法是:首先根据一定的心理学理论建立某种心理品质的理论结构;然后根据这一理论结构提出有关测验成绩的假设;最后用逻辑和实证的研究由果求因来验证提出的假设。
三、效标关联效度(一)效标关联效度的概念效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度,一般是用本测验与效标测验去测同一被试得到的两组分数的相关系数表示。
所谓效标,是检验测验效度的参照标准。
效标实际上是奔测验所想测验或要预测的特性或功能,这些特性或功能通常以另一独立测验的结果来表示。
效标关联效度分为两种:1.同时效度同时效度是一种测验的结果与另一大约同时获得的测验结果之间的一致程度,同时效度的高低用两次测验结果的相关系数来估计。
它常用于标准化测验的建立,用它作为检验所建立测验能否成为标准化测验的一种手段。
2.预测效度预测效度是指测验分数与将来的效标之间的关联程度,或者说预测效度是测验是预测被试将来从事某种学习或工作能够达到应有水平的有效程度,预测效度的高低用两次测验结果的相关系数来估计。
预测效度常用于评定原测验的预测功能,在实际中预测效度的高低由预测的准确程度来决定。
效标关联效度的关键是选好效标,一个好的效标必须具备以下几个条件:(1)可靠性,即效标测验必须具有较高的信度;(2)有效性,即效标测验本身必须是有效的;(3)客观性,即效标测验必须尽量客观标准化,力求排除主观偏见,特别是防止效标污染的影响;(4)实用性,即效标应尽量使其用法简单、省时、花费少,讲究经济实用。
预测效度与同时效度都是把测验分数和一种效标分数相比将,用求得的相关系数来表示。
但是,两种效度的意义是有区别的。
同时效度主要用于查明自编测验的效度,以便有效地研究、编制和使用新的测验;预测效度主要是用于评价原测验的预测能力,而且预测效度的效标要在原测验之后隔相当长的时间才能获得。
(二)效标关联效度的计算1.相关法相关法是确定效标关联效度最为普遍的方法。
其基本思想是求得测验分数与效标分数之间的相关系数,所求得的相关系数称为效度系数。
相关法既可以用积差相关公式求相关系数,也可以用等级相关、点二列相关等公式来求其相关系数。
2.分组法分组法是先将效标分数按规定的分数线分组,分成成功组和失败组,然后考查组与组之间原测验分数的差异是否显著。
如果经检验差异不显著,则可认为原测验的效度还未达到要求;如果经检验结果差异显著,就可以认为原测验的效度达到了要求,也可以说原测验的预测效度是较高的。
利用分组法确定预测效度时,若样本容量n 大于等于30,则用大样本Z 检验法,其公式为:nqS npS qX p X qp22Z +-=若n <30,则用小样本t 检验法,其公式为:)11(2)1()1(t 22qp q p qq p p n n n n S n S n qX p X +-+-+--=2-+=q p n n df在这里,p X 为成功组的平均分数;q X 为失败组的平均分数;S p 为成功组的标准差; S q 为失败组的标准差;n p 为成功组的人数; n q 为失败组的人数; d f 为自由的度。
3.预期表法预期表是一种双向列联表,表的左边是原测验分数,表的右边是效标分数,这两种分数都以等级类别排列。
表中间的数字不是绝对数而是相对数,即以原测验得若干分的人数除其中列入各种等级的人数所得的百分数。
预期表从左下角至右上角对角线上的数字越大,其他数字越小,则测验的效标关联效度就越高。
所以,可用从左下角至右上角对角线上的数字所占的百分比表示效标关联效度的高低。
例如,240人在学期开始参加数学推理测验和期末的代数测验成绩所制成的预期表如下表所示。
预期表本例对角线上的数字比较大,可以直观判断效度系数比较大。
我们可以这样确定对角线数字,B A 4060−−→−−−→−)()(,良优,中−−→−+5020与D 、差−→−20E 。
因此效度系数为:%792401902402050204060==++++)(4.命中取舍法当测验是用来作取舍的依据时,其测验有效性的指标就是正确决定的比例。
具体地说,预测与效标之间有四种情况:预测成功而且事实上成功;预测成功但事实上不成功;预测不成功但事实上成;预测不成功而且事实上也不成功。
我们称一、四两种正确的预测为命中,二、三两种不正确的预测为失败,这样,可以计算以下两种指标来表示预测效度的高低。
总预测数目命中失败命中命中总命中率=+=预测成功人数人数预测成功且事实成功的正命中率=以上两种指标的值越大,说明测验越有效。
第二节 提高测验效度的方法 一、控制系统误差考虑测验效度时,假设随机误差足够小而且不变,那么系统误差方差越小,则有效方差就越大,因此达到测验目标的程度也就越大,即效度越高。
所以,效度也就可以定义为有效方差与实得方差之比,即:22vS xS r =由此可知,随机误差方差和系统误差方差都会对效度产生影响。
而事实上,影响测验效度高低的主要因素是系统误差的大小。
比如测验题目和指导语有暗示性、答案组型有规律性等都影响测验效度。
所以,控制系统误差可以提高测验效度。
二、精心编制量表量表是形式和内容都会影响测验长度,所以测验量表在形式上必须表述清楚、明了,排列应由易到难,长度适中,应在形式上就引起被试的兴趣,特别是量表印刷必须清楚而且精美。
测验量表在内容上必须保证测验的目的性,力求测量出所要测量的东西,而且测验项目难度应合适,并保证有足够的区分度,所有这些都有助于提高测验的效度。
三、有效组织测验测验的实施情况对测验的效度有很大的影响。
首先要确保有良好的施测环境(包括物理环境和心理环境)。
其次,在测验过程中掌握好时间,统一测验程序,评分时要客观准确,避免错误。
并且应把握好测验之间的间隔时间,间隔时间的长短一定要按测验目的合理安排。
四、扩大样本的容量扩大样本的容量,可以增加样本对总体的代表性,增加代表性便可以抵消测验的随机误差,使测验更稳定可靠。
扩大样本容量可以扩大有效分数的方差,从而使效度22vS xS r =增大。
所以,要提高测验效度应扩大样本容量。
一般而言,样本容量应大于30才可靠。
另外,为了提高测验效度,获得样本的方法也是很重要的,要根据测验的目的选择最能代表研究总体的样本,比如,通过随机抽样获得的随机样本,代表性强,这也有助于提高测验的效度。
五、合理处理信度与效度的关系测验效度要受测验信度的限制,事实上,效度的最大值受它的信度所制约,有公式:信效r ≤r 。
比如说,一个测验的信度是0.49,那么它的效度不会高于0.7,即0.70.49=。
由此可知,信度是效度的必要条件,虽然信度高的测验效度不一定高,但效度高的测验,信度一定比较高。
还应注意效标信度与信度的关系。
如果效标的测量误差较大,则信度就较低,其效度也会就较低。
如果选一个不大可靠的测验成绩作效标,效度系数是不会大的。
如果所选用的效标信度系数不理想,则可按下列公式校正,以免影响测验结果的效度。
YYXY 'XYr r =r在这里,'XY r 为校正后的效度系数; XY r 为效度系数; YY r 为效标的信度。
六、适当增加测验的长度测验的题目数即长度对测验的效度有一定的影响。
因为测验的题目数增加,可提高试题的代表性,从而提高测验的信度。
又由于效度系数的最大值与测验信度有关,因此增加试题的数目也能提高测验的效度。
不过,增加测验长度对信度的影响大于对效度的影响。
关于测验长度与信度、效度的关系,如表所示。
从上表可以看出,当测验题数增加到6倍时,信度系数增加到2.4倍,而效度系数只增加到1.55倍;当测验长度增加到48倍时,信度增加到3.18倍,而效度只增加到1.78倍。