正式评量应具备的测验认知

合集下载

心理测量学评量工具的设计与应用

心理测量学评量工具的设计与应用

心理测量学评量工具的设计与应用什么是心理测量学评量工具心理测量学评量工具,是指用来测量和评估个体心理特征、心理状态或心理行为的工具。

它们可以通过定量的方式对个体的心理特征进行测量,为心理学研究和实践提供客观的数据支持。

心理测量学评量工具包括各种测试、问卷调查、观察表、评分表等,它们能够帮助心理学家更好地了解个体的心理特征,也能够用于临床诊断、心理干预和教育评估等方面。

设计心理测量学评量工具的基本原则信度:即测量工具的稳定性和一致性,也就是测试结果的稳定程度和准确性。

在设计测量工具时,需要通过重测法、内部一致性法等来检验其信度。

效度:指测量工具是否能够准确地反映被测变量的实际特征。

在设计过程中,需要通过内容效度、构成效度、判别效度等方法来检验其效度。

客观性:测量工具需要尽量避免主观因素的干扰,以保证结果的客观性和科学性。

标准化:测量工具的使用需要有统一的操作程序和标准化的评分规范,以确保结果可比性和解释的一致性。

常见的心理测量学评量工具智力测验:如韦氏智力量表、Raven进阶逻辑推理测试等,用于评估个体的智力水平。

人格问卷:如MMPI-2(明尼苏达多项人格测验)、16PF(16种因素人格问卷)等,用于评估个体的人格特征。

焦虑与抑郁量表:如汉密尔顿焦虑量表、贝克抑郁自评量表等,用于评估个体的焦虑和抑郁水平。

应激事件检查表:如创伤后应激事件检查表(TESI)、创伤后压力障碍事件检查表(PDS)等,用于评估个体的创伤后压力障碍情况。

自尊自信问卷:如罗森伯格自尊感标度、甘地威尔士自我概念问卷等,用于评估个体的自尊自信水平。

心理测量学评量工具在临床与教育中的应用在临床领域,心理测量学评量工具被广泛应用于各类心理疾病诊断与干预。

通过使用不同的测试仪器,医生可以从患者获得关于患者心境、思维活动及人格特征等多方面信息。

这些信息可以有效帮助医生了解患者所患疾病状况,并作出相应治疗计划。

此外,在治疗期间还可以使用这些器材追踪和记录患者情况变化情况。

评估心理测评量表的标准

评估心理测评量表的标准

评估心理测评量表的标准评估心理测评量表的标准摘要量表是心理测评用来度量人的心理特征的测量工具,评价量表好坏的标准应该受到人们的重视,其重要性自然不言而喻。

在系统地介绍评价心理测验量表的标准的基础上,详细介绍了信度和效度的分析方法,包括重测信度法、复本信度法、分半信度法、α信度系数法、内容效度分析、校标效度分析和结构效度分析。

根据量表用于判别、预测或评定等不同用途,需要选取不同的检验方法。

一个好的量表应该具有客观性、定量性、可交流性和经济性的特点。

关键词量表;信度;效度;评价标准1 前言测量是人们日常生产和生活中的一种普遍现象。

从与人们平时生活紧密相连的衣、食、住、行四个方面来讲,穿什么尺寸的衣服和裤子需要对人的身体进行身高臂长和三围的测量;到市场买菜需要对蔬菜或者肉类进行称重的测量;盖楼建房或者装修需要对土地或者房间进行面积的测量;修建铁路或者搭建桥梁需要对地面进行长度和高度的测量。

以上提到的测量均属于物理测量,人们能够实实在在地测出需要的数据或者指标。

除物理测量以外,根据测量的对象和性质还有生理测量,即对有机体生理特征的测量;社会测量,即对社会现象的测量;心理测量,即对人类的心理特征的测量。

心理测量又叫心理测评,现今被人们普遍认同的含义是指依据一定的心理学理论,使用一定的操作程序,给人的能力、人格以及心理健康等心理特征和行为确定出一种数量化的价值。

现阶段的心理测评是以心理测评量表为主要测评手段。

心理测评是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。

量表指的是能够使事物特征数量化的数字的连续体。

制定量表的单位和参照点不同,编制出的量表就不同;不同的量表具有不同的测量水平,因此其测量的精度也不尽相同。

目前用于心理测量的各种心理测验和心理量表有二三百个,但是临床上和心理咨询工作中常用的只有一二十多种。

这些常用量表中许多不对非专业人员公开,通常需要花费几百甚至上千元购买。

针对非专业人员研究和学习心理学,对国内外常用的100多种心理测验量表和测量工具进行优化选择,并将其中在心理咨询工作中经常用到的一些测验和量表编制成计算机软件或测量表,这就是人们说的常用心理测评量表。

教育心理学考试重点第十四章教学测量与评价演示教学

教育心理学考试重点第十四章教学测量与评价演示教学

教育心理学考试重点第十四章教学测量与评价演示教学教育心理学考试重点提示:第十四章教学测量与评价重点提示统观近几年全国各省的教师资格认证教育心理学考试,本章的考查重点是:(1)标准化成就测验的含义和特点。

(2)自编测验的含义和特征。

(3)非测验评价技术。

(4)教学评价结果的处理与报告。

考纲链接1.教学评价的概念:指系统地收集有关学生学习行为的资料,参照预定的教学目标对其举行价值推断的过程,其目的是对课程、教学办法以及学生培养方案做出决策。

2.教学评价包括确定评估目标、搜集有关的资料、描述并分析资料、形成价值推断以及做出决定等步骤。

3.教学评价与测量及测验的关系:(1)测量和测验是对学习结果的客观描述,而教学评价是对客观结果的主观推断与解释,以客观描述为基础;(2)测量与测验所得到的结果,惟独经过教学评价,才干推断这种客观描述的实际意义,才有实际价值。

4.依照发生的时机,教学测评可分为:(1)诊断性评价;(2)形成性评价;(3)总结性评价。

5.依照对测验解释时所采纳的标准,教学测评可分为:(1)常模参照评价;(2)标准参照评价。

6.依照严谨程度,教学测评可分为:(1)正式评价;(2)非正式评价。

7.教学测量与评价的功能:(1)鞭策和促进学生的学习;(2)是学校鉴不学生学业成绩、家长了解学生学习事情的要紧方式;(3)是教学过程的一具重要组成部分;(4)作为教育评价和决策的依据。

8.标准化成就测验:指由专家或学者们所编制的适用于大规榜样围内评定个体学业成就水平的测验。

9.标准化成就测验的特点:(1)由特意机构或专家学者编制;(2)施测条件、计分手段、分数的解释彻底相同;(3)测验都有常模为依据,且有信度、效度的资料可查;(4)测试规模大,整个地区、国家以至在国际上都可统一使用。

10.测验标准化的程序:(1)制定测验目的;(2)修改测验项目;(3)扩大样本;(4)确定常模。

11.标准化测验的优点:(1)客观性,比教师自编测验更加客观;(2)可比性,使得别同考试的分数能够举行比较。

《心理咨询师 理论知识》第五章 心理测量学知识(精华版)

《心理咨询师 理论知识》第五章  心理测量学知识(精华版)

第一节概述第一单元测量与测量量表(P348-350)一、测量的定义:测量就是依据一定的法则用数字对事物加以确定。

该定义包括三个主要的元素:事物(指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征)、数字(是代表某一事物或事物某一属性的量)、法则(代表的是测量所依据的规则和方法)。

二、测量要素:参照点、单位参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。

1绝对零点(全无)2相对零点(人为);单位:是测量的基本要求,没有单位就无法进行测量;好的单位必须具备的两个条件:有确定的意义、相同的价值。

三、测量量表:斯蒂文斯测量表的四水平:命名量表、顺序量表、等距量表、等比量表(心理测量为顺序量表)种类功能基本特征运算举例1.命名量表代号或分类无相等单位无绝对零点不能+-×÷性别、学号⋯2.顺序量表1+等级无相等单位无绝对零点不能+-×÷品德、名次、⋯3.等距量表2+差异决策和比较有相等单位无绝对零点可+-温度、分数⋯4.比率量表3+比值决策和比较有相等单位有绝对零点可+-×÷身高、体重⋯第二单元心理测量的基本概念(P350-352)一、心理测量的定义:心理测验的定义:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

1、心理测验测量的是人的行为。

2、心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。

3、为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。

4、个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。

二、心理测验的性质:间接性(心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的心理特质);相对性(心理测量的相对性我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列);客观性(1、测验的刺激是客观的2、对反应的量化是客观的3、对结果的推论是客观的)第三单元心理测验的分类(P352-354)分类标准分类定义智力测验按功能分特殊能力测验人格测验文字测验按测验材料的性质分操作测验客观测验按测验材料的严谨程度分投射测验个别测验按测验的方式分团体测验最高作为测验要求受测者尽可能做出最好的回答,与认知过程有关,有正确答案;如智力测验、成就测验按测验的要求分典型行为测验要求受测者尽按通常的习惯方式做出反应,没有正确答案;如人格测验第四单元纠正错误的测验观(P354)错误的测验观:万能论、无用论、心理测验即智力测验正确的测验观:重要的心理学研究方法之一;是决策的辅助工具;作为研究方法和测量工具尚不完善第五单元心理测验在心理咨询中的应用(P355-356)在我国的心理门诊中应用较多的三类心理测验:智力测验(可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用);人格测验(有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作);心理评定量表(用于检查求助者某方面心理障碍的存在与否或其程度如何)。

教育心理学题库1000道

教育心理学题库1000道

教育心理学题库1000道60 桑代克的试误说。

桑代克是现代教育心理学的奠基人。

他以动物为对象研究学习过程,创立了著名的试误说。

(1)学习的实质在于形成一定的联结。

通过对动物和人类的实验研究,桑代克认为,学习过程在于形成一定的联结。

所谓联结,指的是某种情境仅能唤起某些反应,而不能唤起其他反应的倾向。

学习的作用就在于将与生俱来的原本联结或永久保存,或消除,或改变。

(2)一定的联结需要通过试误建立。

桑代克认为,一定的联结是通过盲目尝试、逐步减少错误而形成的,即通过试误开成。

(3)学习的基本规律主要有:效果律准备律练习律。

61 简述奥功伯尔所指出的学校情景中成就动机的几种内驱力。

(1)奥苏伯尔认为,学校情境中的成就动机主要由三个方面的内驱力组成,即认知内驱力、自我提高内驱力和附属内驱力。

(2)认知内驱力是一种要求理解事物、掌握知识、系统地阐述并解决问题的需要。

它以求知作为目标,从知识的获得中得到满足,是学习的内部动机。

(3)自我提高内驱力是指个体由自己的学业成就而获得相应的地位和威望的需要。

(4)附属内驱力是指个体为了获得长者(如教师、家长等)的赞许和同伴的接纳而表现出来的把工作、学习搞好的一种需要。

自我提高和附属的内驱力都不直接指向学习任务本身,是一种间接的学习需要,属于外部动机。

认知内驱力、自我提高内驱力和附属内驱力在动机结构中所占的比重并非一成不变,通常是随着年龄、性别、个性特征、社会地位和文化背景等因素的变化而变化。

在儿童早期,附属内驱力最为突出。

到了儿童后戎和少年期,赢得同伴的赞许就百为了一个强有力的动机因素。

而到了青年期,认知内驱力和自我提高内驱力成为学生学习的主要动机。

62 影响问题解决的因素有哪些?(1)已有的知识经验。

已有的知识经验的质与量都影响着问题解决。

与问题解决有相关的经验越多,解决该问题的可能性也就越大。

知识经验在头脑中的储存方式决定了问题能否有效地解决。

(2)定势与功能固着。

认知功能障碍评定的操作与结果(1--1)

认知功能障碍评定的操作与结果(1--1)
正数数字距=4(异常)
注意障碍评定
注意广度评定要求: 1、令被试者按照检查者所给予的数字顺序进行复述。 2、检查者以1位数/秒的速度说出一组数字。 3、通常从2位数开始。 4、每一个水平做两次测试。 5、一个水平的检查通过后进入下一个水平的测试。 6、如果两次测试均失败,则检查结束。 7、数字距检查结果取最后通过的数字水平。 8、注意排除由于听觉或言语障碍对复述的影响。
799 等划完上行中的3后讲:以下正式开始,仅划掉“3‖字(开
始 计时)
注意障碍评定
划销测验操作完毕后要求:
1、分别统计正确划销数字与错误划销数字。 2、记录划销测验的时间。 3、用公式计算患者的注意持久性或稳定性指数。 注意的持久性指数=(总查阅读数字/划销时间){(正确划
销数字-错误划销数字)/应划销数字}

1、0
3、今天是几号?
1、0
4、今天是星期几?
1、0
5、现在是几月份?
1、0
6、你现在在哪一省份(市)? 1、0
7、你住在哪一县(区)?
1、0
8、你住在哪一乡(镇、街道)? 1、0
9、我们现在是几楼?
1、0
10、这里是什么地方?
1、0
11、复述:皮球
1、0
12、复述:国旗
1、0
13、复述:铅笔
1、0
注意障碍评定
结果分析:
1、正常人正数数字距为7±2。 ① 对于年轻的知识分子,其数字距至少为6。 ② 对于老人或文化水平较低者,数字距5应属于正常。 ③ 数字距为4时则提示患者可能处于临界状态或异常。 ④ 数字距等于3时,无疑确定损伤存在。
2、正常人倒数数字距为6±2。 ① 数字距为3时提示患者为临界状态或异常。 ② 数字距为3时则可确诊异常。

韦氏儿童智力测试 译码测试

韦氏儿童智力测试译码测试1. 引言1.1 概述韦氏儿童智力测试是一种常用于评估儿童智力水平的测试工具。

它旨在通过对儿童进行一系列综合性的认知和智力测量,帮助评估他们在不同领域的能力和潜力。

本文将详细介绍韦氏儿童智力测试及其其中一个组成部分——译码测试。

韦氏儿童智力测试是一种经过多年研究和发展的心理测量工具,它采用标准化的测试方法和评分标准,被广泛应用于临床心理学和教育领域。

它对儿童智力进行全面评估,包括智力水平、语言能力、思维能力、记忆力、推理能力等多个方面。

通过进行这些测试,评估者可以获得一个关于儿童认知发展水平的客观测量结果,并根据测试结果来做出有针对性的干预和教育决策。

译码测试是韦氏儿童智力测试中的一个重要组成部分。

它主要评估儿童在解决问题、理解信息、推理判断以及应用语言和数学等方面的能力。

译码测试通过给儿童呈现一系列需要解码、理解和回答的问题或任务,来测量他们的认知和智力水平。

这些问题可能涉及文字、图形、符号、数字等不同形式的信息,测试者需要根据儿童的回答来评估他们的推理和问题解决能力。

本文将从两个方面对韦氏儿童智力测试和译码测试进行详细介绍。

首先,我们将探讨韦氏儿童智力测试的内容和方法,包括测试所涉及的各个领域和具体测试项目的设计。

其次,我们将重点介绍译码测试,包括测试内容和方法,并讨论其在评估儿童智力水平和认知能力方面的意义。

通过本文的阅读,读者将能够了解韦氏儿童智力测试及其译码测试的基本概念和原理,并对其在评估儿童智力和认知能力方面的应用有一个全面的了解。

最后,本文还将对韦氏儿童智力测试和译码测试的有效性进行评估,并讨论译码测试对儿童认知发展的意义。

希望通过这篇文章的撰写和阅读,可以为读者对韦氏儿童智力测试和译码测试的理解和应用提供一定的帮助。

1.2 文章结构本文共分为三个主要部分,分别是引言、正文和结论。

引言部分主要对本文的研究主题进行概述,介绍了韦氏儿童智力测试和译码测试两个主要内容,以及本文的目的。

情绪智力测验EQ-i(评分标准)

情绪智力测验EQ-i(评分标准)情绪智力测验(EQ-i)是一种衡量个体情绪智力水平的工具。

该测验采用一系列问题和情境,评估个体的情绪认知、情绪表达、情绪理解和情绪管理等方面的能力。

以下是EQ-i的评分标准:1. 情绪认知(Emotional Self-Awareness):个体对自己的情绪状态和情绪变化有清晰的认知。

评分高低可根据个体对不同情绪的辨识能力和对情绪反应的敏感度来判断。

情绪认知(Emotional Self-Awareness):个体对自己的情绪状态和情绪变化有清晰的认知。

评分高低可根据个体对不同情绪的辨识能力和对情绪反应的敏感度来判断。

2. 情绪表达(Emotional Expression):个体能够有效地表达自己的情绪,包括通过语言、面部表情、肢体语言和声音表达出内心情绪状态。

高分表示表达能力较强。

情绪表达(Emotional Expression):个体能够有效地表达自己的情绪,包括通过语言、面部表情、肢体语言和声音表达出内心情绪状态。

高分表示表达能力较强。

3. 情绪理解(Emotional Understanding):个体对他人的情绪状态和情绪变化有较好的理解能力。

评分高低可根据个体对他人情绪的观察和推断能力来判断。

情绪理解(Emotional Understanding):个体对他人的情绪状态和情绪变化有较好的理解能力。

评分高低可根据个体对他人情绪的观察和推断能力来判断。

4. 情绪管理(Emotional Management):个体能够有效地管理自己的情绪,包括对负面情绪的应对、情绪调节和情绪控制等方面的能力。

高分表示个体具备较好的情绪管理能力。

情绪管理(Emotional Management):个体能够有效地管理自己的情绪,包括对负面情绪的应对、情绪调节和情绪控制等方面的能力。

高分表示个体具备较好的情绪管理能力。

5. 情绪应对(Emotional Coping):个体在面对挑战、压力和困难时,能够以积极的方式应对和调整自己的情绪。

《人员素质测评》复习思考题

《人员素质测评》复习思考题本电子稿由杨泽、陆军同学依据打印稿整理而成,在此谢谢两位同学,预祝全班考试顺利! 第一章:1、试从人的心理实质分析人才测评为什么是可行的?答:我们从剖析人的心理实质可以看出,我们从剖析人的心理实质可以看出,人作为社会存在物,人作为社会存在物,人作为社会存在物,其素质通过言语和非言语行为其素质通过言语和非言语行为及对外部世界的反映表现出来,我们通过测评人的素质与心理现象作为思维对客观世界的反映形式就可知了。

首先,作为个体的人的素质差异及绩效差异是实施人才测评的前景和根据,是进行人才测评的客观基础。

是进行人才测评的客观基础。

其次,其次,现代心理学,行为科学及人才测评其他相关科学的发展证实了马克思主义的理论揭示,使人才素质及绩效由可测评的变成能测评的。

证实了马克思主义的理论揭示,使人才素质及绩效由可测评的变成能测评的。

2、论述人岗匹配原理与素质可测原理 ?答:所谓人岗匹配就是按照人适其事、所谓人岗匹配就是按照人适其事、事宜其人的原则,事宜其人的原则,根据个体间不同的素质将其安排在各自最合适的岗位上,即保持个体素质与工作岗位的同构性,从而做到人尽其才、物尽其用。

如果说工作分析对不同岗位进行描述,如果说工作分析对不同岗位进行描述,可以明确工作环境、可以明确工作环境、工作内容、工作职责和对人的基本要求;那么人力资源测评对个体进行素质测量和评价,那么人力资源测评对个体进行素质测量和评价,则可以明确个体素质结构、则可以明确个体素质结构、素质水平和各自适宜的工作。

平和各自适宜的工作。

原理1:个人的每一个行为(先天性的条件反射行为除外)表现,都是其相应心理素质在特定环境中的特定表现定环境中的特定表现原理2:素质是一种相对稳定的组织系统,各个体不尽相同,它可以综合不同环境下的刺激,是个体对这些不同的刺激作出一致的反映行为。

是个体对这些不同的刺激作出一致的反映行为。

3、素质与素质测评的含义?答:素质是,指个体完成一定活动与任务所具备的基本条件和基本特点,指个体完成一定活动与任务所具备的基本条件和基本特点,是行为的基础与根是行为的基础与根本因素,分为生理素质与心理素质两个方面,具体包括感知、技能、能力、气质、性格、兴趣、动机等个人特征。

职业生涯规划 自我探索之认识能力


取得的结果(Results)
试分析其中所反映的个人技能。
社团活动拉到一笔赞助
我是一个学生社团的干部。社团的宗旨是 为学生的职业生涯规划服务。我本人也非 常关注职业信息的搜集,订了一本相关的 杂志,每期必看。我觉得这本杂志可以为 社团成员开阔视野,启发思路。于是我从 杂志上找到公司的联系方式,希望对方为 社团提供一些赞助。经过协商,对方愿意 为每位成员提供全年杂志的合订本共260 本,但要求得到不少于50%社团成员的 Email并完成一份有关杂志内容的问卷调 查。我向社团主要干部通报了这一情况, 并发动他们去征集成员的意见,是否同意 将我们已经掌握的Email地址交给对方。 最后在一天内得到了50%成员的授权,并 与杂志社签订了赞助合同。最终,我拉到 了这笔价值5200元的赞助,杂志受到了社 团成员的欢迎,杂志社也很满意。
可迁移技能
就是你所能做的事,也称为通用技能。
可以在生活的方方面面,特别是工作之 外得到发展。 可以在工作内外,工作之间通用。
它是用人单位最看重的部分。
动词 来表示。 一般用______
可迁移技能的发现
你都会做什么?
你参加过哪些社会实践?
请用5-10个动词来概述你的工作能力。
美国EQ大师丹尼尔〃戈尔曼认为,人类的IQ有80%来 自遗传,而EQ有80%来自后天努力,而人的成功80%依 赖EQ。 ……
兔子想取笑乌龟,于是要跟乌龟比赛,结果兔子 输了。兔子不服:“这次是我睡着了,你敢再比 一次吗?” 于是乌龟与兔子比了第二次,这回兔 子赢了。 乌龟说“我们还能再比一次吗?这回由我选择目 的地。”于是它们开始了第三次比赛。兔子领先 跑到一半的时候被一条大河挡住了,但终点却在 河的对面,这次 乌龟又赢了。从此,兔子再也不 敢小看乌龟了。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二.標準化
標準化是指建構測驗材料、 標準化是指建構測驗材料、實施步 是指建構測驗材料 驟、計分方法及測驗結果解釋的技 巧。 標準化使鑑定和評量人員在控制的 標準化使鑑定和評量人員在控制的 情況下,實施、 情況下,實施、計分和解釋測驗的 可能性,以降低無法預測的結果。 可能性,以降低無法預測的結果。
「效標關聯效度」 包含「預測效度」--測量測驗 包含「預測效度」--測量測驗 在預測未來成就表現上的成 效和 同時效度」--測驗與另一可 「同時效度」--測驗與另一可 供比較的測驗或其他已具有 效度測量的相關。 效度測量的相關。
三.構念效度 構念效度 「構念效度」(construct 構念效度」(construct 」( validity) validity)要比其他型式的信度 更為抽象, 更為抽象,它是指測驗測量理 論性構念或概念多好的程度。 論性構念或概念多好的程度。 智力、自我概念、 智力、自我概念、粗大動作能 力和推理能力是幾種難以界定 和測量的抽象構念。 和測量的抽象構念。
步驟一: 步驟一:依據完整的內容領域評論來發展 測驗細目 步驟二: 步驟二:編製測驗項目以求符合測驗項目 步驟三: 步驟三:針對仔細選擇的一組對象進行預 試 步驟四:根據預試結果來修正測驗項目] 步驟四:根據預試結果來修正測驗項目] 步驟五: 步驟五:編製成最後的測驗
表面效度 是一種非技術性的效度型式, 是一種非技術性的效度型式, 包括快速評論測驗以決定其 在表面上是否有效的程度。 在表面上是否有效的程度。 現金效度關心的是商業性測 現金效度關心的是商業性測 驗的銷售量。 驗的銷售量。
(四)標準分數常模(standsrd 標準分數常模( norm) score norm)
標準分數常模乃是將原始分 標準分數常模乃是將原始分 數用相同的平均數與標準差 加以轉換得來的, 加以轉換得來的,用來表示 個人的分數落在平均數之上 或之下的距離。 或之下的距離。
標準分數常模
最為常見的有下列三種: 最為常見的有下列三種: 分數;( ;(2 分數; (1)Z分數;(2)T分數; 離差智商。 (3)離差智商。
二.測驗分數的解釋
(一)側面圖的分析 一旦測驗使用者想直接比較 個人在各項測驗分數的高低 時,分析側面圖將會是一種 良好的選擇。 良好的選擇。
凡是一種測驗 包括有若干分測驗的, 包括有若干分測驗的,均適合 運用這種方法來解釋測驗分數, 運用這種方法來解釋測驗分數, 例如魏氏兒童智力量表 WISC-III)、 )、視覺動作統整發 (WISC-III)、視覺動作統整發 展測驗(VMI) 展測驗(VMI)或行為與情意 評量表(BERS) 評量表(BERS)等。
norm) (二)年級常模(grade norm) 年級常模(
年級常模是依據各個不同年 級而建立的標準化樣本, 級而建立的標準化樣本,在 測驗上所得的平均數而建立。 測驗上所得的平均數而建立。
(三)百分等級常模 norm) (percentile rank norm)
百分等級是一種相對地位量 百分等級是一種相對地位量 數,它是指落在個人原始分 數下面分數( 數下面分數(標準化樣本所 決定的)百分比的指標。 決定的)百分比的指標。
二.效標關聯效度
「效標關聯效度」(criterion-related 效標關聯效度」 criterionvalidity)係指個人在某測驗的分數 validity) 與一項標準測量的關聯( 與一項標準測量的關聯(通常是個 人在另一項測驗上的分數) 人在另一項測驗上的分數) 此種比較所產生的相關係數稱為效 此種比較所產生的相關係數稱為效 度係數。它們的範圍由-1.00( 度係數。它們的範圍由-1.00(完全 負相關) 1.00(完全正相關)。 負相關)至1.00(完全正相關)。
通常
構念效度的建立包括仔細 構念效度的建立包括仔細 的鑑定和界定構念, 的鑑定和界定構念,然後 引出和驗證有關構念的測 驗成就表現的假設。 驗成就表現的假設。
由於建立構念效度 需要較長的歷程, 需要較長的歷程,大多數測驗 很少提供此種效度型式的資料。 很少提供此種效度型式的資料。 除多數非正式測驗外, 除多數非正式測驗外,都提供 有關兩種其他效度型式( 有關兩種其他效度型式(內容 和效標關聯)的資料。 和效標關聯)的資料。
第四章
正式評量應具備的測驗 認知
第一節 效度
效度(validity)
乃是評量工具的成效, 乃是評量工具的成效,是測驗最 為重要的技術性特色。基本上效度 為重要的技術性特色。 是關心「 是關心「測驗所欲測量的內容到底 有多好?」 ?」或 有多好?」或「測驗能測量到所欲 測量的範圍嗎 ?」。 在探討評量工具上包括下列三種 主要的測驗效度型式: 主要的測驗效度型式:
1.主試者的偏見 1.主試者的偏見 2.主試者的文化和語言 2.主試者的文化和語言 3.測驗實施和解釋上的差異 3.測驗實施和解釋上的差異 4.計分錯誤 4.計分錯誤
(三)測驗本身方面
1.測驗的基礎和天花板效應 1.測驗的基礎和天花板效應 2.可能的測驗偏見 2.可能的測驗偏見 Reschly(1980) Reschly(1980)曾指出這些偏 見分別是「平均-差異偏見」、 見分別是「平均-差異偏見」、 項目偏見」、「心理計量偏見」 」、「心理計量偏見 「項目偏見」、「心理計量偏見」 因素分析偏見」。 及「因素分析偏見」。
二.複本信度 複本信度
「複本信度」(alternate-form 複本信度」(alternate」(alternate reliability) reliability)又稱為等量信度 equivalentreliability), ),也可 (equivalent-form reliability),也可 稱作互替形式97 108信度 97的 信度, 稱作互替形式97的108信度,它是 一種比較同一測驗兩種型式的分數, 一種比較同一測驗兩種型式的分數, 來估計其正確性的過程。 來估計其正確性的過程。
表示信度統計的是
信度係數( 信度係數(reliability r),它包括由0 ),它包括由 coefficient, r),它包括由0至 的數值。 =0表示完全無信 1的數值。r =0表示完全無信 度可言, =1則代表完美 度可言,而r =1則代表完美 的信度。 的信度。
一.重測信度 重測信度 「重測信度」(test-retest 重測信度」(test」(test reliability )乃是一種估計正確 性的歷程, 性的歷程,包括針對仔細選擇 的一組對象施予兩次測驗, 的一組對象施予兩次測驗,並 使用所得分數來計算信度係數, 使用所得分數來計算信度係數, 以描述這兩組分數間的一致性。 以描述這兩組分數間的一致性。
近年來傾向於
採用區間形式( form) 採用區間形式(interval form) 區間形式 來解釋側面圖, 來解釋側面圖,也就是將原 始分數上下各加減一個標準 誤,然後根據常模對照表將 其轉化為各種衍生分數。 其轉化為各種衍生分數。
(二)解釋測驗分數的基本原則
下面所列舉的是一些解釋測驗 分數的基本原則(如表4 分數的基本原則(如表4-9), 可作為解釋分數的參考。 可作為解釋分數的參考。測驗 使用者若能嚴格遵守, 使用者若能嚴格遵守,將可大 大減少測驗分數解釋的謬誤及 誤用的情形。 誤用的情形。
一.內容效度 內容效度 validity) 「內容效度」(content validity) 內容效度」 係指測驗正確地測量行為樣本 的範圍。 的範圍。 擁有良好內容效度的測驗, 擁有良好內容效度的測驗,包 括範圍或學習領域上具有代表 性的行為樣本。 性的行為樣本。
至於建立內容效度可以包括下列 幾項步驟:
一.常模參照與標準參照測驗
常模參照測驗(norm常模參照測驗(normNRT) referenced testing, NRT)與標 準參照測驗( 準參照測驗(criterion CRT) referenced testing, CRT)代表 著兩種基本上不同解釋成就 表現的方法。 表現的方法。
NRT
包括相較於他人的成就表現 常模組或對照組) (常模組或對照組)來解釋 學生的成就表現。 學生的成就表現。
至於CRT
是指依據某些功能 性水準或 標準來解釋學生的成就表現。 標準來解釋學生的成就表現。 它與教學和測量學生小且各 自獨立的知識單元有密切相 關。
在心理與教育評量中較為 常用的常模有: norm) (一)年齡常模(age norm) 年齡常模( 年齡常模是依據各個不同年齡 而建立的標準化樣本, 而建立的標準化樣本,這可由 個體在不同年齡層正確回應測 驗項目的百分比來加以決定。 驗項目半信度」(split-half reliability) 折半信度」(split」(split 是一種決定正確性的程序, 是一種決定正確性的程序,包括同 一測驗兩個部分的相關。 一測驗兩個部分的相關。 也就是說,將測驗項目分成兩半, 也就是說,將測驗項目分成兩半, 並比較這兩半測驗項目的相關係數。 並比較這兩半測驗項目的相關係數。
測量標準誤 (stardard error of measurement, SEM)代表企圖說明可能的變 異性或測驗計分和解釋上所 涉及的錯誤。測驗的信度愈 大,SEM就會愈小。
四.評分者間信度 「評分者間信度」(inter-rater 評分者間信度」(inter」(inter reliability) reliability)通常是指觀察者間 信度(interreliability), 信度(inter-observer reliability), 有時又稱為計分者間信度 reliability)。 (Interscorer reliability)。 它關心測驗如何計分一致或由 兩位評分者者評定行為。 兩位評分者者評定行為。
第四節
實用性
實用測量概念著重評量工具 的應用性和功能性特色。 的應用性和功能性特色。
第五節 其他有關測驗的認知 一.測驗結果的影響因素 (一)受試者方面 1.焦慮與動機 1.焦慮與動機 2.健康和情緒狀況 2.健康和情緒狀況 3.障礙類型 3.障礙類型 4.練習效果 4.練習效果
相关文档
最新文档