测验的编制和使用
第7讲 心理测验(素质测评第七讲)

问卷框架的确定
1 方俐洛、凌文辁等人就中国职业兴趣量表 的建构作了很大的贡献
2 梁龙娟,等对当代大学生的择业标准的 研究发现,大学生的择业标准主要有工作 发展、有较高的工资收入、能充分发挥个 人的潜能,能解决住房问题、工作单位所 在地,工作与所学专业相关、工作量适当、 工作符合自己的兴趣等。
3 在郑伦仁等所作的研究中,将职业价值 观概括为以下5种尺度:进取心、自主性、 经济价值、声望和工作安定性。其中,进 取心为影响最大的因素。
测量题目的确定及量表结构
1 基线调查
2 指导语为“请按照重要性的不同,依次 写出你认为影响大学生职业决策的主要因 素(至少五个)” 3 对基线调查结果的整理 4 根据基线调查资料的分析,析出了影响 大学生职业决策的因素依次为:工资福利、 自我价值的实现、专业及个人兴趣、工作 生活环境、背景变量、社会需要、社会稳 定性、社会地位等。
第7讲 心理测验
第一部分 心理测验方法概述
一、心理测验定义
阿纳斯塔西:心理测验实质上是行为样组 的客观的和标准化的测量。 肖鸣政:通过一系列手段,将人的某些心 理特征数量化,来衡量人的智力水平和个 性方面差异的一种科学选择方法。
一、心理测验定义
定义的具体含义:
1.心理测验是对行为的测量。 所谓“行为”:心理的而不是法则的; 外显的而不是内心的; 成组的而不是单个的;
D. 各个选项在形式上应该协调一致. E. 选项之间不应相互重叠,相互包括.如 9 – 3 = A. 大于5 B. 6 C. 小于7 D. 12 F. 选项中有相同的词可以考虑放到题干里, 以免显得累赘.如 孔子最伟大的成就在于: A.学术教育方面 B. 国防军事方面 C. 艺术建筑方面 D. 内政外交方面 G.正确答案的位置要随机安排.
职业能力测验知识点总结

职业能力测验知识点总结一、职业能力测验的定义职业能力测验是指通过一系列标准化的测试工具,对个体在特定职业领域所需的知识、技能、能力和态度进行测量和评估的过程。
测验结果可以用于评估个体在特定职业领域内的工作能力和水平,为其职业发展和就业提供参考。
二、职业能力测验的类型1. 能力测验:主要用于评估个体在特定领域内的知识、技能和能力水平,如语言能力、数学能力、领导能力等。
2. 性格测验:主要用于评估个体在特定职业领域内的适应性和人格特征,如沟通能力、团队合作能力、自我管理能力等。
3. 兴趣测验:主要用于评估个体对特定职业领域的兴趣和倾向,为其职业选择和规划提供参考。
三、职业能力测验的应用范围1. 人才选拔和用人:企业和组织可以通过职业能力测验来评估求职者在特定职业领域内的工作能力和适应性,为人才选拔和用人提供依据。
2. 职业规划和发展:个体可以通过职业能力测验了解自己在特定职业领域内的优势和不足,为职业规划和发展提供参考。
3. 教育培训和职业指导:教育机构和职业指导机构可以通过职业能力测验为学生和求职者提供个性化的教育培训和职业指导。
四、职业能力测验的编制方法1. 确定测验目标:确定测验的目标和范围,明确所要评估的能力和技能。
2. 制定测验内容:根据测验目标,制定测验的内容和题型,包括选择题、填空题、问答题等。
3. 设计测验结构:设计测验的结构和分值,确定各部分的权重和难易程度。
4. 编制测验题目:根据测验内容,编制题目和题型,保证题目的质量和有效性。
5. 进行试测和验证:通过试测和验证,确保测验的可靠性和效度,修订和完善测验内容。
六、职业能力测验的注意事项1. 标准化:职业能力测验应该是标准化的,即测验内容和标准要求应该是固定的,以便进行比较和评估。
2. 可靠性和效度:职业能力测验应该具有良好的可靠性和效度,能够准确评估个体在特定职业领域内的能力和水平。
3. 公平性:职业能力测验应该具有公平性,不受种族、性别、年龄等因素的影响,不歧视个体。
编制考试(题目)的原理与方法

编制考试(题目)的原理与方法第六讲编制测验(题目)地一般原理与方法介绍客观性试题地类型及编写技巧、主观性试题地类型及编写要领、测验蓝图设计、测验编制与组织要领.重点内容是客观题、主观题地优缺点,编写选择题地技术要领,论述题地编写原则,操作测验题地编写原则、测验地命题双向细目表编制.第一节测验题目类型与测量功能(一)题目编制地意义:测验题目是测验地基本构成元素,题目编制恰当与否直接关系到整个测验地质量.只有正确地掌握不同类型试题地测试功能及命题方法,才能根据考试地目地和要求,正确地选择合适地题型并编制出高质量地试题,组成高质量地测验试卷.(二)测验题目分类:b5E2RGbCAP1、选择型和供答型试题.前者一般要求被试在几个选项中选择正确地答案,如是非题、匹配题、选择题等,后者要求被试自己提供答案,如论述题、简答题、填空题等.p1EanqFDPw2、客观性试题与主观性试题:客观性试题主要是因为评分客观而得名,它地正确答案在测验前就已准备好,不同评分者各自独立评分,所得结果基本上是相同地.客观性试题一般适用于测量知识地掌握、理解、应用、分析几个层次地教学目标.客观性试题地答案明确,作答简便,因而在限定地时间内测验可以包含足够数量地试题,易保证对知识内容地覆盖.主观性试题主要包括论述题、操作题和作文题等.它们适合于测量较高层次地教学目标,尤其是适合于测量综合和评价等目标层次.主观性试题鼓励被试积极地组织所学地资料,表达自己地观点.被试在作答时,耗费地时间较长,在限定地时间内,试题数量不可能太多,对知识地覆盖面较小.由于没有明确统一地标准答案,评分易受评阅者地主观因素影响,因而误差较大.一、客观性试题类型及其编写技巧客观性试题主要包括选择题、填空题、简答题等.(一) 选择题1.选择题结构客观性试题中运用最多地是选择题.选择题是由一个“题干”和几个“选项”所组成.“题干”一般是提出问题,或是待完成地句子,“选项”是供被试选择地几个真假不明地答案,让被试从中选出正确地答案.应选地答案可以是一个,也可以是多个,可以是正确答案,也可以是最优答案. 例:使用选择题试卷进行测量,最大地困难是什么? A. 试卷地编制 B. 试卷地印刷 C. 试卷地评阅 D. 考场地安排例:函数是偶函数地条件是: A. c=0; B. b=0;C. a≠0;D. b.c≠02.选择题优点选择题是客观性试题中较灵活地一种,其优点体现为:(1) 可以用来测量学生各种不同层次地学习结果,不仅可以测量学生掌握所学习地知识地程度,而且可以用来测量学生对所学知识地理解、分析、判断、应用和综合地能力.所以这种类型试题地应用最广泛. (2) 评分标准统一、客观,不受评分人主观因素和答卷人提出意想之外地答案等影响,并且可以利用电脑迅速评卷,从而大大提高测验地信度,提高评卷地速度和自动化水平. (3) 可以加大试题容量,抽取广泛有效地代表性样本,使试题覆盖地知识范围广,可以克服传统考试中试题量少、抽样窄而造成地测量效度不高地缺点. (4) 有利于考查被试思维地敏捷性和准确地判断力.(5) 采用大量地似真选择项使得结果易于诊断,通过分析学生错误选项,教师便于发现学生在学习中存在地问题. 3.选择题地缺点选择题也有一些缺点,主要是:(1)选择题地数量多,每一题除正确答案外,还有好多干扰答案,且要求干扰答案与题干有逻辑联系和似真性,因此编制良好地选择题花费时间较多,且要有专门地命题技巧. (2) 难以考核被试完全地推理能力、综合运用所学知识地能力、有效地总结能力、严密地表述能力和写作能力,对于被试地发散思维(或求异思维)能力则更是如此. (3) 无法测量被试地思维(解题)过程.(4) 被试者有可能凭猜测而选中正确答案.例如,在有4个备选答案地选择题中,仅凭猜测地成功率就达到25%,这对于考试地信度有一定地影响. 选择题地优点使其日益受到重视,但它地缺点,又使我们无法在教育过程中以单纯地选择题来考查学生.4.选择题类型根据不同地特点,对选择题可以作进一步地分类,常用地选择题主要有以下几种类型. (1) 辨识选择.常用于辩识字词地形音义、文化常识、公式定理、名词术语等. (2)阅读选择.前面给出一篇短文,后面提供备选答案,要求被试阅读后,给出正确地选项. (3) 最佳选择.要求被试从几个备选答案中,通过比较和分析,选择出一个最佳地答案. (4) 图解选择.将文字材料画成几幅示意图,要求被试选出符合文字材料所显示地情景或关系地示意图. (5) 归类选择.列出一组事物,并将事物分成若干类,要求被试按一定标准选出归类正确地选项. (6) 承接选择.给定一个或几个待续地句子,然后列出几个承接句子,要求被试选出其中衔接恰当地承接句子.(7) 排序选择.将几个事物,列出几种排列顺序,要求被试选出排列顺序正确地一种. (8) 填空选择.在一句话中空缺一些字、词、句或标点,要求被试在备选地几个答案中选出恰当地填补项. 5.选择题编写原则为使选择题地普遍适用性和优良性能得到实现,在编制选择题时,应遵循以下原则:(1) 试题地题干本身意义完整并能表达一个确定地问题.(2) 题干要尽可能简明,尽量不要使用过于复杂地语句结构,也不要使用过长地语句. (3) 题干中不要滥用否定结构,要尽可能采用正面陈述.过多采用否定结构,往往给被试带来阅读上地困难;同时否定结构也不利于使教师了解被试到底掌握多少正确知识.另外肯定结构比否定结构从某种程度上来说更富有教育意义. (4) 所有选项都应与题干有一定地逻辑联系,选项中地干扰答案(诱答项)应具有较高地似真性或似乎合理性,不能错得太明显. (5) 不能对正确答案有暗示.一般来说,无意提供暗示主要表现为如下几个方面:语法结构上地不一致,如正确答案语法正确,诱答项语法结构错误等;各选项在逻辑上不同,如正确答案中加以“如”、“有时”、“通常”等修饰词,诱答项中加以“总是”、“从未”、“所有”、“绝对”、“准”等修饰词,或正确答案使用与题干相同地词;答案地长度有明显差异,如正确答案叙述得特别详细,比诱答项要长得多;各题正确答案在选项中有一定地规律等. (6)同一测验中每一个测验试题之间应相互独立避免牵连.有时,某一个试题地题干中所提供地资料,刚好可以帮助学生回答别地问题,此种情形只要在组合测验前仔细检查每道试题就可以避免.但有时被试需要知道前一题地正确答案,才能回答下一个问题,即若某被试无法回答第一题,则无法回答第二题,此种连锁题应尽量避免,每道题均应成为一个独立地记分单位. (7) 选项地文字表述,力求简短精炼,尽可能将各项中共同地用词(字)放在题干中,在每个选项中要避免重复地材料,这样不仅可以使题意清楚,而且可以减少学生阅读选项所需地时间.(8) 应尽量避免“以上皆是”、“以上皆非”地选项.当测验编制人员很难找出足够地选项时,常用“以上皆是”、“以上皆非”来作为最后一个选项.这种特殊选项地应用绝大部分场合均不恰当,不仅无法达到预期地功能,反而会降低题目地有效性.这是因为:第一,学生只要知道在选项中有两个是正确地,则他就会选择“以上皆是”;第二,学生只要发现有一个选项是错误地,则马上就可以排除“以上皆是”项,从而提高猜测成功地机会.第三,不少学生只要看出第一个答案是正确地,他马上就选中作答,而不再阅读其余选项而丢分,从而降低测验地信度.另外在“最佳答案型”地选择测验中,所有答案只是适合程度地不同,而绝无一个“绝对正确”地答案,所以在使用“以上皆非”项时,可能引起争论.(二)是非题1.是非题特点是非题又叫做二项选择题,它通常是给被试一个句子要被试作出正误地判断.这类试题通常用于测量被试对基本概念、性质、原理、原则地认识和判断区别事实与观点、认识事物因果关系,以及一些简单地逻辑关系推理地能力.例判断下列命题地正误,正确地在括号内画“√”,错误地画“×”. ①三角形地内角之和等于360度.( ) ②是非题是一种“供答型”试题.( )有时候,我们可以要求被试先判断每一个陈述地真伪,然后再要求被试将错误之处加以改正.此时,应需要在改正部分地底下画线或加以引导,以突出重点. 通常有人认为是非题最容易编制,其实并非如此.因为此类试题要求被试作绝对正误地判断,所以每一个叙述必须绝对正确或完全错误.在绝大多数知识领域中,为确保绝对正确或完全错误,就需要对较重要地叙述予以特别修饰,而这种修饰却是一种很明显地猜答线索.因此,编制者通常被迫以较不重要且更具体地事实来编题,以确保试题地科学性,但这样地试题对于测量目标来说是不太适合地.(1)是非题地优点:DXDiTa9E3d 第一,编制相对容易,可适用于各种教材.事实上,说编制容易,可能是因为可以照教材地原句子抄下来或稍作正反改正,但这种试题品质不良,不是答案明显、就是无法判断.而编制出题意清楚,且能测量到重要学习结果地是非题,则需要高度地命题经验与技巧.RTCrpUDGiT第二,记分客观,取样广泛.因为是非题地作答时间短,可以在短时间之内作答很多问题,所以试题有较大地覆盖面,且评分不受主观因素地影响.5PCzVD7HxA (2)是非题地局限性:其一,仅能测量知识层次中最基本地结果,而无法测量高层次地学习结果.其二,受猜测因素地影响很大.由于只有两种可能地选择,因此学生仅凭猜测都有50%地机会获取正确答案.由于设计是非题很难排除无关线索,实际上被试猜对地可能性远高于50%.即使采用校正公式,即倒扣分地方法,也难以排除猜测因素地影响. 由于是非题地上述缺陷,通常只是用它来测量其他类型测验无法测量地学习结果.2.设计是非题几个原则设计是非题要遵循如下几个原则:(1) 考核地内容应是重要地知识,应有考核价值.不要为了设计试题方便而考核一些无关紧要、细微末节地内容. (2) 题目应多是测量理解能力,而不应测验记忆性地知识,更不要直接抄录教科书中地句子,以免引导被试死记硬背而不求理解. (3) 一个题目中只能有一个中心问题,或一个重要概念,避免两个以上地概念在同一题中出现.否则将会导致“半对半错”或“似是而非”地情形. (4) 试题应做到是非界限分明,用词准确,避免模棱两可地语句,不致引起对正确答案地争议. (5) 题目陈述应简单明了,避免使用复杂地句子结构,以减少因被试地阅读能力而对测量产生地不良影响,应尽量采用正面叙述,避免用否定和双重否定地语句. (6) 正句和误句地排列要随机化,且数量应大致相等.(三) 填空题填空题就是提出一个陈述,其中缺少一个或几个关键词语,要求被试将其补充上去.例我国古代地四大发明是__________、造纸、指南针和__________. 我国长江发源于___________山,流入_____________海. 填空题可用来考查被试对知识地记忆和理解能力,在诊断性测验中特别适用.受被试猜测地影响小,评分比较客观.但填空题偏重于测量知识记忆程度,使用过多,容易养成死记硬背地习惯. 为了使填空题能更好地发挥它地作用,在编制地时候,一般应注意以下几点. (1)题意明确、限定严密,使空白处应填地答案是惟一地.填空题属于封闭型地一种,题干地逻辑性要求很高,从而使被试按照形式逻辑地思维去推理、判断.此外,题干地表述还应使众多被试按照同一个思维路径进行趋向思维,否则被试不知道填什么或填什么都成立,就会引起争议,达不到测量目地,不利于记分.例(不妥试题) 只有________,才能在考试中获得好成绩. 本题地限定不严密,所填地答案不惟一,被试也不知道到底是考核哪些方面地知识. (2)空白中所填写地应是关键地词语,并且要和上下文有密切地关系,使被试不至于填写困难.例(不妥试题) 1996年我国科技界有_____新发明. (3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意. 例(不妥试题) 连接______市与_________地是________河. 这样地试题易导致题意不完整,无法填写,即使勉强填上,也难于判断对与错,无法评分.通常一个填空题不应超过两个空白. (4)尽量将空白放在句子地后面或中间,而不要放在句子开头.因为按照人们地思维过程,应该是先提供充分地证据,然后再要求被试做什么或怎么做.例(不妥试题) _______发明了蒸汽机.本题应改为“发明蒸汽机地是______________.”(5)所有空白处地线段长度应当一致,不能随正确答案文字地多少而长短不一,以免产生暗示作用. (6)若答案是数字,应指明单位和数字地精确程度.(四) 简答题简答题是要求被试对所提问地问题用几个字或几句话来回答地一种问题类型.例①“七·七”事变爆发在哪一年?②“七·七”事变爆发在什么地方?简答题虽然是需要被试自己主动提供答案,但仍然可以是客观性测验题,它是供答题中最简单地一种,被试只需填上几个简短地词或句即可解答.简答题较适合于测量被试对基本知识、概念和原理地掌握、记忆情况.和填空题一样,简答题编制较为简单、灵活,在出题时,可以从不同角度、不同方向考虑,增大对知识考核地准确度和深度,并且不受猜测因素地影响.jLBHrnAILg无法用来考核综合、分析、评价等高层次地教学目标;且评分可能不够客观,除非问题地叙述非常清楚,否则将会有不同程度地正确或部分正确地答案而影响评分地客观性.即使没有这些问题,错别字是否扣分问题仍无法避免,若扣分,则被试地实际得分无法代表其获得知识地多少,若不扣分,则又无法确定错别字是否代表正确答案,即是错别字还是被试尚未具备地足够测量所欲测地知识.鉴于此,一般测验中,简答题所占比例不大.常用地简答题有简释题,直接问答题,列举题,扼要说明题等. 简释题就是通常地名词解释题,要求被试用简单明了地词语将名词或概念解释清楚.直接问答题就是让被试对所提出地问题进行解答.列举题就是要求被试根据要求范围列举出事或物,并略作说明.例请列出教育测验中常见地选择型题型. 扼要说明题又叫做简要叙述题,一般是对一段话进行判断或说明.例判断“识字教学是低年级教学地重点”这一说法是否正确,并作简要说明. 在设计简答题时,要注意遵循下列原则:(1)问题地叙述要明确,要确实能使被试用简单地言语来回答. (2)问题地答案应该只有一个,并且答案要简短具体. (3)避免出只考机械记忆地题,应注重知识地应用. (4)在考查某公式地应用时,不要给太复杂地数字,以免给计算带来麻烦. (5)尽可能使用“直接问句”来提出问题.二、主观性试题类型及其编写要领主观性试题地特征是被试可以自由作答,xHAQX74J0X被试只要在题目所限地范围内即可,可以在深度、广度、组织方式等方面都享有很大地自由;主观性试题不仅可以对知识进行分解式考查,而且可以进行整体综合性地考查;不仅可以反映被试答题地最后结果,还可以反映被试地思维过程;另外,主观性试题可以创设一个情境,允许被试在这个情境中,充分发挥自己地创造力.LDAYtRyKfE这种自由同时也导致某种意义上地评分地主观性.主观性试题主要包括论述题、作文题与操作题等题型.(一) 论述题论述题就是向被试提出问题,需要被试用自己地语言组成一份较长答案地试题.这种试题地最大特点是被试在回答问题时,有较大地自由度,可以充分地运用所学地知识,并且可以加上自己独特地见解.因此论述题能够较好地测量被试地组织、归纳和综合所学地知识地能力、运用掌握地知识解决问题探讨问题和创新地能力.1.论述题优点论述题在教育测验上有独特地价值,其优点有:(1) 可以用来进行高层次地、复杂地学习结果地测量,可以用在各种学科领域. (2) 可以增进学生地思考、应用及解决问题地能力,对于被试地学习态度和学习方式可以产生积极地影响.如可以使学生比较注意教材内容上地内在联系并能够对所学到地知识进行有机组织等. (3) 可以增进学生地写作能力. (4) 试题地编制比较容易,并且受猜测因素地影响很小.2.论述题局限性论述题地局限性具体表现为:(1) 由于论述题一般都比较大,在一次考试中试题地数量不可能有很多,因此,其取样范围比较小且不均匀,所使用地试卷无法有效地代表学科地全部主要内容,所测结果无法真正代表被试地学习成就而影响测验地效度. (2) 评分地主观性强.虽然此类试题预先制定出标准答案和评分标准,但测验中常常会出现许多令命题者意想不到地情况和答案.此时,不同地评阅者,对同一份试卷所给地成绩将会有很大地不同,同一评阅者对两份等值地试卷所给地成绩地偏离也较大,这样地测量结果其信度比较低. (3) 因被试回答过于自由,回答方向又不尽相同,难于测得预期结果,重点容易失控. (4) 被试作答和评分阅卷都相当费时.3.编制论述题原则为了保证论述题地质量,在编制论述题时要遵循以下原则:(1)试题应该用来测量较高层次地教学目标,象综合、评价等目标层次,限于那些客观题不能测量地学习成就.如要求学生提出理由、解释变量间地关系、描述与评价资料、有系统地陈述结论等. (2)要明确而系统地陈述问题,使被试能清楚地了解题目地要求.在命题时,我们必须对被试提出明确地任务,使每道题都能真实地反映被试实际能力,而不受阅读、理解等其他因素地干扰. (3)应采用答案具有统一定论地试题. 论述题本来在评分上就存在着一定地主观性,如果再加上答案没有定论,评分者就会产生更大地困难,也使得评分误差增大而降低信度.当然这也并不意味着一切有争议地问题都不能出,对于有争议地问题,在命题时一般要对被试地作答范围、观点等作一定地限制. (4)一般不允许被试选择问题回答. 因为不同地论述题之间很难做到等值,如果让被试选择题目,对被试地得分则无法比较,而且被试总是倾向于他较熟悉地试题,这样就更不容易反映其真实水平. (5)为避免被试将时间集中在某一个他所不会做地题目上而影响对其他题目地回答,因此而影响考试成绩地真实性,最好在题目中能给出回答本题所需地参考时间.(二) 作文题作文题实际上是一种论述题,它是语言测量中不可缺少地一部分.作文是对人地逻辑思维、形象思维、书面表达等多种能力地一种综合考查. 对于作文试题,人们从不同地角度提出了许多不同地分类.此处仅简要介绍常见地三种分类.(1) 根据提供题目或提供材料地角度,可分为命题作文和供料作文(或称条件作文). 命题作文只提供题目,不涉及任何材料,不作任何解释和说明,要求被试写一篇文章.如全国高考作文题《习惯》等.供料作文包含供料命题作文和供料自由作文两种.它首先提供材料,如给被试一篇文章、故事、一幅漫画等,要求被试根据确定地思路,或根据指定地题目,或自选角度、自拟题目,写一篇作文. (2) 根据文体可以分为记叙文、议论文、说明文、应用文等. (3) 根据对所供材料地处理方式可以分为:缩写型:要求被试正确理解材料地中心和要点,弄清结构层次,择其要点,剔除其他成分,浓缩联缀成文.改写型:要求被试根据一定地要求,改变原文地文体样式和结构,或者变换中心人物,或者变换选材角度和立意重心,对原材料进行合理地取舍和补充.撮写型:要求被试围绕中心对原材料进行取舍,摘取材料地要点,组成文章.如内容提要,讲话摘要,会议记录整理等.填空型:要求被试根据上下文将原材料中地缺失部分加以补充,使之成为文章地有机组成部分.续写型:要求被试根据原材料地内容和思路加以合理想象和延伸,使续写地部分与原材料构成一个完整地整体.扩写型:其要求正好如缩写型相反,它要求被试将浓缩地“主干”材料扩充化成“枝繁叶茂”地文章. 实施作文题测验地目标是要测量被试真实地写作水平.这种测量是一种根据特定要求进行书面表达能力地全面地综合测试,因此命题地质量将直接影响到测量结果地信度和效度.为此,在命题时要注意如下几点:(1)根据考试地目地和需要确定考试作文地文体要求. (2)根据社会地需要、现实生活和学生地实际设计命题. (3)要根据被试地特点确定选材范围与写作意图,在确定选材和写作意图时,要考虑对所有被试都是公平地,并且试题应符合被试地心理特征. (4)要给被试以发挥地余地.(三) 操作测验题在许多学科中,操作地方法和过程是重要地测量目标,如实验课,地图课,音乐、体育、美术等课程,操作题可以作为纸笔测验地补充.操作测验是介于一般认知结果地纸笔测验和未来真实情境地实际活动之间,具有真实地情境模拟性.1.操作测验题分类操作测验可以有许多分类方法,较为常用地分类方法是根据情境地真实程度,将它分为4类.(1) 纸笔操作测验:利用纸笔模拟真实情境来考查被试知识和技能地应用.如编制某项操作计划、步骤、注意事项等,通常可作为真实情境操作测验地预测验. (2) 辨认测验:包括代表各种不同真实性程度地测验情境.有时,仅要求被试辨认某项工具,指出其功能;有时要求被试辨认完成某些工作所需要地工具、装备以及使用程序.较复杂地则为向被试提出特殊任务,要求他们辨认一些问题(或故障)所在,并根据问题提出解决地办法.辨认测验是对实际操作技能地间接测量. (3) 模拟操作测验:要求被试在模拟地情况下完成和真实活动相同地动作,如模拟训练,物理、化学实验等,它地特点是强调程序地正确性,通常可作为真实情境中实际操作地准备. (4) 工作样本操作测验:让被试在标准地实际情境中去完成实际任务地测验.这类测验在操作测验中真实性最高,包含了真实操作地所有基本要素,但是在有控制地标准条件下完成.如师范院校学生地教学实习等.2.编制操作测验题注意事项操作测验地准备和实施比较费时,条件不易控制和标准化,评分困难,特别是测验情境与真实情况较接近时,其结果地鉴定难度更大.在编制设计时,应注意以下几点:(1)明确所要测量地教学目标和学习结果,并将其操作化,即要进行工作分析,找出操作中地最重要地环节,并为每一操作建立一个评分标准,如操作地速度与准确性、步骤地正确性等. (2)选择合适地真实性程度.在决定测验地真实性程度时,应依据教学目标地要求、客观条件地限制、工作本身地性质等.对于最基础地导论性课程,可采用真实。
教育测验题目类型与编写技术

第一节教育测验题目类型与编写技术一、客观性试题的类型及其编写技术二、主观性试题的类型及其编写技术第二节教育测验编制的基本程序一、设计测验的基本考虑二、设计测验蓝图三、测验编制与组织教学目标:1.理解各类测验项目的优缺点,掌握各类项目的编制原则。
2.理解教育测验编制的基本程序,并能在实践中运用。
项目编写“五戒”1.在向学生说明如何作答时,一定不要使用晦涩的语言(指导语);2.一定不要在项目中使用模棱两可的陈述。
3.一定不要无意中给学生正确答案的线索。
4.项目中一定不要使用太复杂的句型。
5.一定不要使用超纲的词汇。
测验项目的类型Popham认为语言(文字)测验的项目形式有两种:1.要求被试选择的(选择型)2.要求被试回答的(供应型)(供答型)。
成就测验中,分为客观性试题和非客观性(主观性)试题。
这两种测验项目形式的最大区别是:前者给被试提供被选答案,后者让被试自己写出答案。
A.选择型项目常用形式:选择题、是非题(判断题)、匹配题(连线题)B.供答型项目常用形式:填空题、简答题、论述题、作文题等。
【因此供答型项目范围要比主观性项目范围大】一、是非题及其编写(一)定义:是非题又称正误题,通常是给被试一个句子要求被试做出是与非(对与错)的判断。
以此也叫二项选择题。
这类测题通常用于测量被试对基本概念、性质、原理的认识与判断区别事实与观点、认识事物因果关系、以及一些简单的逻辑推理能力。
例如:判断下列命题的正误,正确的在括号里打√,错误的在括号里打×。
三角形内角和等于360度。
()(二)是非题编写的优缺点优点:1.取样广泛2.测题编制相对容易。
(当然可能是因为可以照着教材原句抄下来或稍做正反改正,但这恰恰是不良是非题的特征)3.评分客观。
缺点:1.是非题一般只能测量低层次的教学目标。
2.易于强调知识的死记硬背。
3.受猜测因素的影响较大(猜对概率大于50%)。
如何减少猜测带来的危害?1.鼓励所有被试在他们不知道正确答案的情况下进行猜测,因为事实上不可能避免一部分被试猜测答案。
第1章 心理测量学

D 心理测量与经济学测量不同
例:测定某年份国民收入,必然有误差,不可以重复; 心理测量是介于经济科学与自然科学之间的测量
3、对行为相关关系的描述---对行为不能作出因果描述,这 是其局限性。 4、测量结果一般为顺序关系 5、测量结果的相对稳定性(稳定---相对变化)
三、心理与教育测量的量表的水平
(2)特征:顺序量表是次低水平的测量量表,它 既不表示事物特征的真正的数量,也不表示绝对 的数值,因此不能进行代数运算。 (3)适合的统计方法:中位数、百分位数、等级 相关系数和肯德尔和谐系数等。
3.等距量表(Internal scales)
(1)定义:等距量表指不仅能够指代事物的类别、 等级,而且具有相等的单位的量表。 (2)特征:等距量表是较高水平的测量量表。等 距量表的数字是一个真正的数量,它的各个部分 的单位是相等的,因此可以对其进行加减运算。 等距量表没有绝对的零点,它的零点是人们假定 的相对零点。因此,等距量表中的两个数量不能 进行乘除运算,即数据之间不存在倍数关系。 (3)适合的统计方法:平均数、标准差、积差相 关系数以及t检验和f检验。
3、“Measurement of the psychological attribute occurs when a quantitative value is assigned to the behavioral sample collected by using a test.” (C & A ) 4、“the process of quantifying the characteristics of persons according to explicit procedures and rules” (Bachman 1990: 18)
测验法

刘衍玲吴明霞测验在测评学生的课堂学习效果中扮演着极为重要的角色。
它是学校教育中使用最多、最经常、最便利的方式,也是学生学习测评理论研究中最早和最成熟的部分。
测验就是通过让学生回答一系列与教育目标有关的有代表性的问题,从学生对问题的回答中提取信息,并根据一定的标准进行判断的过程。
在日常课堂教学中,常通过教师自编的成就测验对学生的课堂学习进行测评,测验的结果是否能够有效地反映学生的课堂学习情况,有赖于测验的信度、效度与精确性,这是对教师编制测验的基本要求。
1.自编测验有效性的基本条件(1)信度(reliability)。
信度是指测验结果的可靠性或一致性的程度,也就是说,该测验测量其所意图测量的东西,个体几次参加测试后,得分等级具有一致性,这涉及测验是否准确可靠的问题。
(2)效度(validity)。
效度通常指测量结果的有效性或正确性,传统上被定义为一个测验能测出所要测量对象的程度。
一次测验是否有效,主要看其是否准确测量了它所要测量的东西。
效度是测评工具最重要的必备条件,一个缺乏效度的测评工具是没有什么使用价值的。
效度是个相对概念,任何一种测评工具只是对一定的目的来说才是有效的,我们不能笼统地说某测验有没有效,而应当说它对测量什么有没有效。
效度可分为内容效度、一致性效度和预测效度。
根据不同的需要,一个测验可以采用一种或几种效度。
(3)难度(hardness)。
难度指测题的难易程度。
在课堂教学测验中,通常用答对或通过测验的人数比例作为难度值。
难度值(P)=答对人数(R)/被试总人数(N)×100%P值越大,难度越低;P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的有效程度。
不过,在实际的测评过程中,测验的难度水平多高才合适,要取决于测验的目的。
如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度可以稍高一些。
(4)辨别力(discrediting power)。
教学测评
3、实施测验
在实施测验的过程中,首先,教师要安排 好适当的测验环境。其次,在测验进行前 要向学生详细说明测验的内容、形式以及 答题要求,还要说明交卷的要求。最后, 在测验进行过程中,教师要做好监督工作, 既要督促学生集中精力完成测验,也要防 止学生作弊。
4、分析结果
测验完成后,教师要及时进行评分,还可 以与其他教师讨论结果,之后及时向学生 提供反馈。这一过程有助于学生及时了解 自己的学业成绩,并激发他们的学习动机。
2、不同的测题形式
在教师自编的测验中,测题的形式大体可 分为客观题和主观题。 客观题(objective test) 客观题因其评分客观而得名。其特点是出 题明确,答案唯一,评分客观,不同评分 者对其的评定结果相同。这类测题包括选 择题、完形填空、匹配题和是非题等,其 形式见表15.4。
二、有效测评的必要条件
有效测评的常用指标有以下几种:效度 (validity)、信度(reliability)、难度和鉴 别力。
பைடு நூலகம்
(一)效度(validity)
效度指一个测验所测出的东西与其所要测出的东西相符的 程度,也就是测量的正确性。效度的种类主要有以下几种: 1、内容效度(content validity),指一个测验对其所要测量 的知识或技能的实际测量的程度,也就是指测试题能否真 正代表或推测所希望测量的目标或能力。教学内容和测试 内容一致性越高,测试的内容效度越高。 2、构想效度(construct validity),指一个测验对某种心理 学理论所涉及的抽象概念或心理特质测量得如何。如气质 测验对粘液类型的气质的反映程度。 3、预测效度(predictive validity),指一个测验对受测者 处于特定情境的行为进行预测时的有效性,如智力测验对 学业成绩的预测程度。
问卷的编制.
A 明确欲测内容的范围,包括知识范围和能力要求两个 方面。
B 确定每个题目所测的内容,并与测验编制者所列的双 向系目标对照,逐题比较自己的分类与制卷者的分类, 并做记录。
C 制定评定量表 2 结构效度 指一个测验实际测到的索要测量的理论结构和特质的
程度,或者说它是指测验分数能够说明心理学理论的某 种结构或特质的程度。常用分方法:因素分析法
鉴别指数 0.40以上 0.30~0.39 0.20~0.29 0.19以下
题目评价 很好 良好,修改会更好 尚可,仍需修改 差,必须淘汰
2.极端组的划分
3.00 .00443 .49865
3.50 .00087 .49977
3.99 .00014 .49997
美国教育服务中心以Δ 作为难度指标: Δ=13+4Z
P = .0013 P = .16 P = .50 P = .84 P = .9987
Z = +3 Z = +1 Z=0 Z = -1 Z = -3
半上所得分数的一致性程度。
分半的方法:按题号的奇偶分半、按题目的难度分半、 或按题目的内容分半。
3 同质性信度 又叫内部一致性系数,它是指测验内部所有题目间的
一致性程度。题目间的一致性含有两层意思:a 是指所 有题目都测的是同一种心理特质,b 是指所有题目得分 之间都具有较高的正相关。
在做项目分析时,这两种方法都是以单题为单位来进行分析
(九) 编制正式题目
编制者可根据项目分析的结果来进行选题,只要鉴
别力合乎标准的题目都可以选为正式的题目。若项目分
析所得各题的决断值都合于要求,则由高而低选出预定
要的题数。
(十) 问卷质量的判断
心理测量学重点
第一章心理测量概述第一节心理测验的历史量的性质2、测验标准化条件:1测验内容的标准化2施测条件的标准化包括:①相同的测验情境..②相同的指导语..③相同的测验时限.. 3评分规则的标准化4测验常模的标准化二、心理测量一心理测量的定义一级定义所谓心理测量;就是依据心理学理论;使用一定的操作程序;通过观察人的少数有代表性的行为;对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段..第三节心理测验的种类与功能及其正确使用五按评价所参照的标准来分类1、常模参照测验一级定义是根据被试对量表中所规定的题目答对多少来评分的;被试成绩的优劣;是根据所得分数在常模中所处的地位来确定的;不是以是否达到某个标准来决定..2、目标参照测验一级定义是将被试水平与一绝对标准相比较;以便评价被试有无达到该标准为目的测验;也称标准参照测验..3、潜力参照测验是将被试水平与自身潜力相比较;以评价被试有无充分发挥自身潜力为目的的测验..三、心理测验使用的注意事项1慎重选择测验量表 2与被测验者建立协调关系 3控制实施测验的误差4正确解释测验结果 5遵守测验的道德 6注意测验的保密第二章心理测验的编制与应用第一节心理测验的编制①确定测验目的与对象②拟定编制计划③设计测试项目④项目的预测和分析⑤合成测验⑥测验使用的标准化⑦搜集信度、效度资料⑧编写测验手册一、确定测验目的与对象一测量对象测验编成后要用于何种团体..如被试的年龄、智力水平、受教育程度、社会经济和文化背景以及阅读水平等..二确定并分析测量的目标一般可分三种情况:一是编制带有预测功能的心理测验..工作分析二是编制针对某种心理特质的测验 ..下操作定义三是编制标准参照测验..双向细目表三测验用途测量目的二、拟定编制计划双向细目表主要有两个方面:一是全面而具代表性的测验内容..二是对各个内容点的相对重视程度;通常用百分比来标明..三、设计测试项目一搜集有关资料1、资料要丰富..2、资料要有普通性..3、资料要有趣味性..题目的来源:1、已出版的标准测验..2、理论和专家的经验..3、临床观察和记录..二选择项目形式考虑:1、测验的目的和材料的性质..2、接受测验的团体的特点..3、各种实际因素..三命题的一般原则1、内容方面2、文字方面3、理解方面4、社会敏感性方面四编写和修订项目要注意:1、项目的范围..2、项目的数量..3、测验项目的取样..4、项目的难度..5、项目的说明必须清楚;用语要力求精练简短、浅显明了..四、项目的预测和分析一预测应注意:1、预测对象..2、预测的实施过程..3、预测时限..4、在预测过程中;应随时记录被试的反应情形..二项目分析质的分析;量的分析..五、合成测验一项目的选择指标有三:1测验的性质..即要选择那些能够测量所要测量的东西的项目..2项目的难度..3项目的区分度..二项目的编排1并列直进式..2混合螺旋式..三编造复本复本的关键是等值..六、测验使用的标准化一施测过程1、指导语包括对测验目的的说明和被试应该如何反应的指示包括如何选择反应、记录反应以及时限等..指导语会直接影响被试的反应态度与方法..2、时限二评分、记分要求:1、及时而清楚地记录反应的情况..2、要有一张标准答案或正确反应的表格;即记分键..3、将被试的反应和记分键比较;对反应进行分类..准确无误是对记分的基本要求..三分数解释1、常模团体是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本..常模选择的一般步骤:确定一般总体→确定目标总体→确定样本..确定常模群体的注意事项:1群体构成的界限必须明确..2常模团体必须是所测群体的一个代表性样本..3取样的过程必须明确且有详尽的描述..几种抽样方法:①简单随机抽样②系统抽样③分组抽样④分层抽样分层比例抽样和分层非比例抽样..4样本大小要适当..应注意:①总体的数目..样本大小适当的关键是样本要有代表性..②群体的性质..③测量结果的精确度..5常模团体必须是近时的..6注意一般常模与特殊常模相结合..2、几种主要的常模参照分数1发展常模①发展顺序量表:格塞尔发展程序表、皮亚杰对守恒概念的研究②智力年龄③年级当量2百分位常模百分等级:百分点;也称百分位数四分位数、十分位数3标准分常模T分数:平均数为50;标准差为10..标准九分:以5为平均数;以2为标准差..标准十分:平均数为5;标准差为1.5..标准二十分:平均数为10;标准差为3..4智商比率智商离差智商3、常模分数表示法1转换表表示法2剖面图表示法七、搜集信度、效度资料八、编写测验手册内容有:1测验的名称、作者、发行单位..2测验的目的和功用..3测验编制的理论背景和选择题目的依据..4测验的实施方法、时限及注意事项..5测验的标准答案和计分方法..6常模资料..7测验的信度资料和效度资料..第三章测量误差及其来源第一节测量误差的含义与种类一、测量误差的含义测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应..二、测量误差的种类一随机误差又叫可变误差;是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差..二系统误差又叫常定误差;是那种由测量目的无关的变因引起的一种恒定而有规律的效应..系统误差只影响测量的准确性;不影响稳定性;而随机误差既影响稳定性又影响准确性..第二节测量误差的来源一、测验本身引起的误差心理测量量表是否稳定..是否真正测到了我们所要测的东西..二、施测过程引起的误差①测试环境②测试时间③试因素④意外干扰⑤评分记分三、被试引起的误差①应试动机②测验焦虑③测验经验④练习效应⑤反应倾向⑥生理变因⑦学习、发展与教育第四章测量信度第一节信度的意义一信度的含义一级定义信度指可靠性或可靠的程度..测验的信度则是指测验结果的可靠程度..第二节信度系数的计算信度指标常用相关系数表示;也称信度系数;表示实得分数的变异数中有多少比例是由真分数的变异决定的..一、稳定性系数再测信度、重测信度跨时间的一致性是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数.. 重测法二、等值性系数复本信度跨形式的一致性是以两个等值题型、题数、难度、区分度相等;但具体内容不同的量表;在最短时距内;对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数..复份法三、等值稳定性系数跨时间跨形式的一致性是合估等值性与稳定性而得到的信度系数..既能反映由于试题变异复份引起的测验成绩变化的程度;又能反映由于应试者的变异在两次测验的间隔中;由学习、练习、成熟等引起的应试者的变化而产生的测验成绩的变化的程度..复份法四、内部一致性系数同质性信度跨项目的一致性主要反映的是题目之间的关系;表示测验能够测量相同内容或特质的程度..方法有以下两种:1、分半法:代表了两半测验内容取样的一致程度..2、基于项目协方差的方法:代表测验内部所有题目间的一致性..五、阅卷者评分的信度系数跨评分者的一致性各种信度系数相应误差变异的来源第三节信度与测验分数的解释及其信度提高方法二、提高测验信度的方法二影响测验信度的因素1、系统误差:不影响信度..2、抽样误差:是影响信度的一个因素..3、随机误差:是影响信度的最主要的一种误差..三提高测验信度的方法①延长测验的长度②测验的难度要适中③测验的内容应尽量同质④测验的时间要充分⑤测验的程序应统一⑥评分要客观⑦加大应试者之间的差异第五章测验的效度第一节效度的意义一、效度的含义一级定义效度是量表能实际测量出其所要测量的特性或功能的程度..理解:1是对一定的测量的目的而言的..2是对测量的结果而言的..3一种测验结果的效度只是高或低的问题..第二节效度的估计逻辑效度:如内容效度和结构效度;统计效度:如目标关联效度..一、内容效度Content Validity基于所测内容的效度验证方法..指测验项目在内容上的适合性;即是否是所欲测量的行为领域的代表性取样..是指测验目的代表所要测量的内容和引起预期反应所达到的程度..研究的目的是要评估测题是否充分代表了所要测量的内容范围;及测验题目对有关内容或行为范围取样的适当性;它所关注的是测验的内容方面..主要应用:学业成就测验、职业资格测验、人员选拔与安置中的工作样本测验..一个测验要有内容效度必须具备两个条件:1.要有定义得完好的内容范围..2.测验项目应是已界定的内容范围的代表性样本..一逻辑分析的方法专家判断它要求让一组独立的专家他们不是测验的编制者;但是非常熟悉所测量的内容领域判断测题对所研究的领域的取样是否有代表性;通过这些评定资料来确定一个测验的内容效度..二克龙巴赫方法从同一个教学内容总体中抽取两套独立的测验题目;用这两套试题分别对相同的一些应试者进行测验;两次测验得分的相关系数;可以用来估计内容效度..若相关较高;可以认为内容效度亦高;若相关较低;则两次测验中至少有一次内容效度低..三统计分析法计算两个评分者之间评定的一致性评分者信度两个测验复本上得分之相关复本信度再测法测验-学习-再测验四经验推测法通过率提高内容效度的方法之一:编制命题的双向细目表二、结构效度构想效度、构念效度construct Validity基于所测心理结构的效度验证方法..是指测验分数能够说明心理学理论的某种结构或特征的程度;或测验实际测量了所要测量的结构和特性所达到的程度..建立构想效度的逻辑顺序:基于相关专业知识和观测资料;提出某一心理特质假设或某一心理结构理论假设;然后根据理论或假设所可能对应的行为特点编制测验并进行施测;最后对测量结果进行相关或因素分析;验证其与理论假设的符合程度..主要应用:各种心理测验;如智力测验、人格测验、焦虑测验、成就动机测验等..估计方法:1对测验本身的分析测验的内容效度:测验的同质性;分析被试者对题目的反应特点.. 2测验间的相互比较相容效度;区分效度;因素分析法..3效标关联法4实验操作法如;举行两场考试;使被试相信一场考试关系重大;另一场考试无关紧要;在考试前进行焦虑测验;看被试的焦虑测验分数是否存在显着的差异;分析原因..构想:考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”..有一个焦虑测验;考察这测验是否有构想效度..三、效标关联效度准则关联效度一级定义基于效标关联性的效度验证方法..又称实证效度;是指测量分数与作为效标的另一独立测验结果之间的一致程度..一效标是衡量测验有效性的参照标准;指的是可以直接而且独立测量的我们所感兴趣的行为..常见的效标有:1学业成就.. 2等级评定.. 3临床诊断..二效标测量:将观念上的效标用可操作的测量确定下来..防止效标污染;即指个人的效标因评定者知道个体的测验分数也叫预测源分数而受到影响..三效标关联效度的种类:1、同时效度2、预测效度是指测验结果对未来的行为或测验成绩效标能够准确预测的程度..四效标关联效度的估计方法:1、相关法①皮尔逊积差相关公式在两组数据都是连续变量;且两者存在线性关系时使用..②斯皮尔曼等级相关公式在两组数据都是等级变量..③点二列相关系数适用于一列数据为等距正态变量;另一列为离散型二分变量..④二列相关系数在测验分数和效标这两个变量中一个是连续变量;另一个是二分变量被人为地分成两类时使用..2、区分法3、命中率4、利用回归方程估计效标分数及计算其置信区间..X-1.96SE≤T≤X+1.96SE四、表面效度是指从外表直观地看来这个量表可以测量所想测量的特性和功能的程度..最高行为测验如能力测验要求有较高的表面效度..典型行为测验如人格测验却要求较低的表面效度..第三节提高测验效度的方法二、影响效度的因素一测验本身的因素测验取材的代表性、长度、试题类型、难度、区分度以及编排方式等都会影响效度..编制要注意:1测验材料要有应测内容具有代表性;2尽量避免误差较大的题型如是非题;3难度要适中;具有较大的区分度;4测验长度要恰当;保证一定的题量;5测题的排列应先易后难..二测验实施中的干扰因素1、主试的影响因素..如是否按照标准化来实施、测验与效标测量的实施的时间间隔、测验环境的布置等;2、被试的影响因素..如被试测验时的动机、情绪、态度、身体状态、反应定势等..三样本团体的性质1、样本团体的异质性..其他条件相同;样本团体同质性越高;分数范围越小;得到的效度系数就会越低;会低估测验效度;反之 ;得到的效度系数就越大 ;可能会高估效度..比如 ;只使用经选拔后的被试组成样本团体;增加了被试同质性;测验得到的效度系数会较低;2、干涉变量..样本团体的有些变量会影响效度测验;比如被试的年龄、性别、受教育程度、智力、动机、兴趣、职业等特征 ..对于同一个测验来说;使用的样本团体不同;得到的效度系数也会不同..四所选效标的性质三、提高效度的方法①控制系统误差②精心编制量表③妥善组织测验④扩大样本的容量代表性⑤合理处理效度与信度的关系⑥适当增加测验的长度第六章测验的项目分析一难度一级定义指试题的难易程度..P=R/NP代表试题难度;R为答对该试题人数;N为参加测验总人数一区分度一级定义是指测验对考生实际水平的区分程度..也叫鉴别力..第七章试题类型及评分一评分误差评分可靠是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的..这就叫评分信度..评分者本人的某些特点也能影响评定分数的客观性..1、评分者知识水平的影响..2、评分者心理状况的影响..3、评分者个性倾向的影响..4、各种“效应”的影响:①名片效应..②光环效应..③对比效应..④先后效应..5、评分者工作态度的影响..第八章智力测量第一节智力概述三、智龄和智商二智商比率智商 IQ = 智龄/实龄×100离差智商 IQ = 测验分数/同龄人的平均数×100离差智商 X=100+15Z离差智商一级定义是一种以年龄组为样本计算而得来的标准分数..离差智商=100+15Z;其中Z=X-M/S;其中M代表团体平均分数;X代表个体测验的实得分数;S代表该团队分数的标准差;Z代表该人在团队中所处位置;即他的标准分数..二、韦克斯勒智力量表详见课本P223页包括言语量表和操作量表两部分1.常识2.数字广度3.词汇4.算术5.理解6.类同7.填图8.图片排列9.积木图案 10.拼图11.译码或数字符号 12.迷津 13.句子 14.几何图形 15.动物房第九章人格测量第二节自陈量表法二、几种常用的人格自陈量表介绍一明尼苏达多相人格测验MMPI适用于16岁以上具有小学文化水平以上的群体..该量表共有测题566道;其中有16道重复题..内容包括健康状态、情绪反映、社会态度、心身性症状、家庭婚姻问题等26类题目;可鉴别强迫症、偏执狂、精神分裂症、抑郁性精神病等..MMPI项目涉及内容及项目数MMPI 临床量表4个效度量表Q:疑问量表Question没有回答的题数和对“是”和“否”都做反应的题数..566题版本超过30分;或399题版本超过22分;则答卷无效..L:说谎量表Lie超过10分;结果不可信..F:诈病量表Frequency说明伪装疾病或精神病程度重..K:校正量表Correction根据被试对测验的态度对测验得分进行校正..该测验有两种形式:卡片式、问卷式..测验没有时间限制;一般45分钟可以做完;最多也不超过90分钟..施测的步骤与结果转换:1施测前;主试要熟悉测验和测验的指示语、了解被试情况、确定安静整洁的测试环境..然后选择合适的测试方式卡片式、手册式或录音播放式;2开始测验时把指示语读给被试听;说明测验约需1个半小时;3测验开始后;主试要注意查看被试是否在答题纸上填写姓名、性别、地址等;所答题目序号是否与试卷上的序号符合等;4答题结束后;用读卷机或套版记分..套版记分方法是:把答卷按性别分开、检查并划掉同时选“是”和“否”的答案、查看Q分并当其超过30或22分时确定答卷无效、换用不同套版得到不同分量表原始分;5对5个临床量表进行校正:Hs+0.5K、Pd+0.4K、Pt+1.0K、Sc+1.0K、Ma+0.2K;6使用与被试年龄、性别等对应的换算表;得到各分量表T分..施测中应注意的事项:1测验前 ;要告知测验的意义 ;取得被试合作 ..如被试仍轻率从事或不愿暴露自己 ;主试可凭经验尽可能弄清情况;做好工作;争取被试的合作;并详细记录被试的表现;2向被试讲清楚;如遇不能回答的问题;可以空下来;但要尽可能回答;不要空的太多;每个问题的回答无所谓对错等;3如果因测验时间长被试情绪焦躁、不耐烦;则可以将测验分成几段进行;也可以用放录音的方法进行测验;4使用分量表时;尽量使用代码表示;而不要用中文全译名称;以免表达不准确或造成误解、误判、误读等..计分方法:原始分→T分数→剖面图计算Q量表的原始分..超过22分或30分无效..分别计算各量表的原始分..对5个量表加K分校正..Hs、Pd、Pt、Sc、Ma5个量表要分别加上一定比例的K分..查表把原始分转化为T分;或计算T分..60以上为异常中国标准:70分以上为异常美国常模T = 50 + 10X - X/ SD画出剖析图..临床量表及其诊断意义:1疑病Hs:反映对身体功能的不正常关心;高分者往往有疑病症、神经衰弱、抑郁等倾向;身体无病;也总觉得身体欠佳;2抑郁D:高分者常被诊断为抑郁症;表现忧郁、淡漠、悲观、思想与行动缓慢..分太高有自杀倾向;3癔症Hy:反映用转换反应对待压力或矛盾的倾向;高分者往往有癔症倾向;依赖、天真、外露、幼稚及自我陶醉等;4精神病态Pd:反映性格畸变..高分者蔑视社会习俗和规范;常有复仇攻击观念;多诊断为人格异常、反社会人格、被动攻击性人格;5男子气-女子气Mf:高分者有异性化倾向;极端高分则暗示有性变态倾向或性变态行为..6偏执Pa:高分者多疑、孤独、过分敏感等 ;T 分超过70则可能存在偏执妄想..尤其是F、Sc量表分数高;而Pa分又极端高;则常被诊断为精神分裂症偏执型和偏执性精神病;7精神衰弱 Pt:高分者紧张、焦虑、强迫思维、恐怖及内疚感;常自责自罪、自卑;Pt、D、Hs同时升高则多诊断为神经症;8精神分裂症Sc:高分者表现非常的或分裂的生活方式及情感反应 ..极高分数T>80者多有不恰当情感反应、怪异行为、妄想、幻觉、人格解体等精神症状及行为异常..如只有Sc高分、无F量表分升高常提示类分裂性人格;9轻躁狂Ma:高分者常为联想过多过快、活动过多、观念飘忽、夸大而情绪激昂、情感多变..极高分数多有妄想;T>90 者可能正处于躁郁症的躁狂相;10社会内向Si:高分者内向、退缩、紧张、固执、自罪;低分者外向、爱交际、冲动、做作;在社会关系中不真诚..三艾森克人格问卷EPQ该量表是由内外向性E量表、情绪性或神经质N量表、精神质或倔强性P量表和效度量表L量表等四个分量表组成..包括两式:儿童7~15岁;成人16岁以上..艾森克的人格理论E维度:内—外向高分表示人格外向;低分表示人格内向;N维度:情绪稳定性低分表示情绪稳定;高分表示神经过敏;P维度:精神质高分表示孤独;难以适应环境;感觉迟钝..L:说谎量表..E、N维度与古希腊盖伦的气质学说相吻合施测步骤和结果计算:艾森克人格问卷的施测非常简单;即将答卷和答题纸发给被试;可以个别测验;也可以团体测验..团体测验时要保证人手一套答卷和答题纸..严格按照指示语向被试说明完成测验的做法;即可由被试自行完成..施测中要求:第一;在问卷上印有指示语;施测时要让被试读懂指示语;第二;只需要就每一题回答“是”或“否”;第三;不要遗漏任何一道题目..评分界线:中间型:43.3~56.750± 6.7倾向型:38.5~43.3; 56.7~61.5典型型:< 38.5 50-11.5;> 61.5 50+11.5各维度的典型人格特征1典型外向E分特高表现为:爱社交、朋友多、喜欢冒险、追求剌激、不甘寂寞、好谈笑、冲动行事不爱做研究工作;喜欢实际的工作;反应迅速;随和;但情绪容易失去控制;做事粗心;从外表看似乎是一个不太可靠的人..审美:喜欢深颜色2典型内向E分特低表现:保守;交际不广;但有挚友;好静;做事瞻前顾后;行为不易受冲动的影响;不喜欢剌激;喜欢有秩序的生活和工作;极少发脾气;做事有计划;情绪倾向于悲观审美:喜欢浅色3典型的情绪不稳N分特高表现为:焦虑、紧张;易怒;往往又有抑郁;对各种剌激的反应都过于强烈;情绪被激发后以很难平复下来;好抱偏见;常患有多种心身障碍..4情绪极稳N分特低表现为:情绪反应缓慢;不强烈;而且容易平复;很难生气;在一般人难以忍耐的剌激下也有所反应;但不强烈..5P分高表现为:独身;不关心人;常到哪里都觉得不合适;有的可能表现为残忍;不人道;缺乏同情心;对人常抱有敌意;攻击性强;喜恶作剧..儿童:好恶作剧;很麻烦;缺乏是非感;令人讨厌的调皮..第三节投射测验一、投射测验的基本理论一基本理论向受测者提供预先编制好的一些未经组织的、意义模糊的标准化刺激情境;让受测者在不受任何限制的情况下;自由地对刺激情境作出他的反应;然后通过分析受测者的反应;推断受测者的人格特征..投射:一级定义是指个人对个体特征的想象式解释;在这种解释中;个人具有将自己身上发生的心理过程无意识地附着在客体身上的倾向..第十章心理与行为问题评估第一节 90项症状清单SCL-9090项症状清单Symptom Check List 90;简称SCL-90;又称为症状自评量表;也叫做Hopkin’s症状清单简称HSCL..适用范围:1心理卫生问题的评定工具;2了解躯体疾病求助者的精神症状;。
(完整版)试题编制的一般原则
试题编制的一般原则(一)目的性原则考试的功能是多方面的 , 目的不同 , 试卷编制的结构和试题的难度就不同。
章节单元检测主要是诊断学生教学内容的掌握情况 , 期中、期末考试则主要是考查学生的学习水平 , 初中毕业考试的目的是评价学生的学业水平 , 中考是为高一级学校招生提供依据。
命题者在命题前要明确考试的目的,制订命题计划。
(二)科学性、有效性原则合理的考试目标,需要由具体的试题来体现,因而,试题的科学性极其设计的有效性自然是评价试题质量的一个标准。
试题的科学性包含两个方面,其一是试题本身是正确的、可解的,没有科学性和知识性错误;其二是试题的表述要简洁、明确、规范 , 图形准确,不存在歧义。
试题设计的有效性是指,试题设计应能完成命题的考查目标,命题者应关注试题设计目标的一致性、可达成性等方面,也就是试题设计应与其要达到的考查目标一致。
(三)教育性、实践性原则试题的内容包含了对数学和数学教育的价值判断,不同时期对数学的教育性有不同的要求,新课程下的数学试题应体现时代特征。
而在设计与实际相联系的数学问题时,要注意以下几点:1. 注重真实性,使学生感受到生活中处处有数学。
试题命制中所用的材料、情景都应与学生学习、生活的实际密切相连,而不是脱离学生生活、学生难以理解的素材。
2. 注重试题背景的选取,应以具有正面教育影响的背景为主,特别是要选取学生能感受到的有影响的背景,这样可以提高考试的思想教育价值。
设计实际问题的试题不一定都是难题,命题者在设计这类试题时,适当编制一些简单的实践题,可激发学生的学习兴趣。
(四)创新性原则创新性主要体现在试题的新颖性上 , 而试题的新颖性则主要反映在取材的新颖性、创设情境的新颖性、设问的创新性以及考查角度的独到性等方面。
在考查的内容不变的情况下,要注重试题背景、考查的角度和设问的方式的变化。
(五)层次性原则层次性原则就是根据学生认知结构的差异性、教材内容的难易度、《数学课程标准》要求 , 编制的试卷必须具有一定的梯度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• (8)避免产生歧义
• (9)使用词汇恰当,语法正确
三、预测
指测题确定以后,在小样本内试验,以获得测题性能优劣的客观 性材料,为进一步筛选题目提供客观依据。
预测时应注意: 1、样本代表性 • 2、预测人数:预测人数以问卷中包括最多题项的分量表 的题项数的3-5倍人数为原则;如果样本特殊,难寻,则 可考虑酌减;如果测题多,用时长,被试来源方便,可 在不影响被试代表性前提下对不同被试实施分测验。
• (2)判断 判断“是、否”、“对、错”、“同意、不同意”。
• 如,我善于从实践中吸取经验(是、否)
• (3)多选 可对多个选项进行选择
• 如,你在平时身体锻炼一般进行哪些活动?
• A健身操B太极拳C散步D慢跑E登山F……
• (4)排列顺序
• 对题项按重要程度或喜欢程度排列
• 如:请把下列运动项目按你喜欢的程度排列顺序 • 健美操、跆拳道、瑜伽、网球、长跑、篮球、足球
• 2、测题形式确定后,根据对测量目标的分析,确定 行为样组,及每类行为的项目比例,制定一个测验题 目的蓝图,也叫双向细目表。 • 然后可进入测题的编写阶段,一般初选题目应是测 验计划数量的2-3倍,以备修改和删减。 掌握目标 成绩目标(接近) 成绩目标(回避)
2 10
1 5
1 5
• 3测题编写的原则
二、形成测题
• 1、测题的形式 (1)单选 • 态度量表中通常采用李克特式量表法,量表以3 点至9点,大多情况下采用5点,3点量表限制了温 和和强烈意见的表达,5点以上量表,一般人难以 有足够辨别力。 例如:
完全不符合 比较不符合 不确定 比较符合 完全符合 从不 很少 有时 经常 几乎总是
•
• 当发生变化时,我能够适应……0------1------2------3------4
• 第六专题 如何测量自信自尊(11个) 测验33:集体自尊量表 测验34:青少年理想身体自我量表 测验35:少年儿童身体自尊量表 测验36:身体10问测验 测验37:身体自我描述问卷 测验38:身体自尊量表BES 测验39:身体自尊量表PSPP 测验40:特质运动自信心量表 测验41:运动员心理因素调查问卷 测验42:运动自信来源问卷 测验43:运动自信心量表
• 第七专题 如何测量心理技能(12个) 测验44:动作表象问卷一修订本 测验45:竞赛失败应对量表 测验46:篮球运动员比赛应对方式量表 测验47:网球运动表现评价量表 测验48:运动表现策略量表 测验49:运动表象问卷 测验50:运动队人际沟通问卷 测验5l:运动心理技能量表 测验52:运动员COPE量表 测验53:运动员应对技能问卷 测验54:运动员应激量表 测验55:中国运动员应激应对量表
• • • • 作 者:张力为,毛志雄 主编 出 版 社:北京体育大学出版社 出版时间:2010-8-1 版 次:2
内容简介
• •
本书是一本实用性很强的工具书。全书分为两大部分。 第一部分介绍了9类54种体育科学常用的心理量表。第二 部分讨论了心理测验的重要基础知识,包括信度效度计算 与评价,量表的制作程序,移植外国量表的问题,以及调 查研究方法的一些新的思路。 • 本书介绍每个量表时,均包括量表来源、研究背景、 信度效度和引用文献(或推荐文献)4类关键信息。通过 这些信息,作者可以了解量表的产生原因和研究背景,并 根据量表的权威性、可靠性和有效性,对量表做出自己独 立的科学价值判断。
• 第四专题 如何测量人格(2个) 测验21:80· 8神经类型测试量表 测验22:WT运动员性格测量表(WTCAIA)
• 第五专题 如何测量态度(10个) 测验23:残疾人运动员心理健康量表 测验24:锻炼态度量表 测验25:体育情境兴趣量表(PESIS) 测验26:体育生活方式问卷 测验27:训练比赛满意感量表 测验28:运动领域完美主义量表 测验29:运动行为量表 测验30:运动员兴奋剂态度量表 测验31:运动员训练比赛满意度量表 测验32:主观锻炼体验量表
测验的编制
• 一、确定测验编制的目的
• 二、形成测题
• 三、预测
• 四、对预测的分 • 五、测题的选择、编排、确定 • 六、测验的标准化
一、确定测验编制的目的
• 1、明确测验用途 • 测验是用来测量哪种心理结构或者说哪 种心理特质的,明确之后,才可以寻找测验的 理论依据。
• 2、明确测验对象 • (1)年龄: • 不同年龄,测验材料应有所不同,尤其对低年龄儿童而言
• 根据上述分析,对测题进行选择,确定测验。
• 预测及预测的分析是一个反复多次的过程。
五、测题的选择、编排、确定
• 1、选择:鉴别力;难度; • 2、测验长度:根据测验时间限制、被试、测验 性质而定。 2、编排
• (1)并列直进式
• (2)螺旋式 • (3)混合式 此外,在是非或选择题中应避免把具有相同选项 的题目编排在一起,以免引起定势反应。
• (2)教育水平
• 教育水平与年龄维度是极为相关的,年龄带来的心理结构 的差异,除了因为自然成熟因素外,社会经历和教育水平 因素也很重要。 • (3)文化背景 文化背景差异往往导致心理结构取向有所不同。
• 3、分析测量目标 • (1)确定能表征所欲测量的心理结构的行为 • 测验编制者在确定行为样组时一般是根据某种理论以 及自己对该心理结构的理解概括出一个或多个能表征该心 理结构的行为,然后再虚构出能表征这些行为的项目。 如何尽可能地使所选择的行为样组真正有代表性呢?
• 3、确定
六、测验的标准化 • 1、内容:给所有被试实施相同的测题 • 2、测验实施 • (1)指导语:对被试的;对主试的 • (2)时限:智力测验一般会有;但态度和人格测 验一般要求“尽快按实际情况,或第一印象”回 答,以免被试过分考虑,但时限较宽。 • 3、记分 • 4、常模:解释测验结果的参照指标
目录
• • 第一部分 心理量表介绍 第一专题 如何测量动机(10个) 测验1:成就倾向个体差异问卷 测验2:竞技动机量表 测验3:期待取胜量表 测验4:社会取向——个我取向运动成就动机量表 测验5:射击运动员目标取向测验 测验6:运动成就动机量表 测验7:运动成就目标问卷 测验8:运动成就责任测量量表 测验9:运动动机量表 测验10:运动中任务定向和自我定向问卷
• 2、信度分析
• (1)内部一致性:测题间的同质性 • (2)重测信度 • (3)复本信度 • (4)分半信度
• 3、效度分析 (1)结构效度(进行因素分析、聚类分析等): 是否符合理论或假设的结构,聚合效度、区分效 度皆是结构效度的一种。
• (2)众知群体效度:是否能分辨量表内容指向的 性质不同的群体。 • (3)交叉效度:量表在相同总体不同样本中的适 用性。
•
• A 回顾以往研究成果(现有测验) • B 考虑时代特点
• C 了解受测群体实际情况(团体访谈、开放式调查、临 床观察)
• D 向有关专家、资深者咨询和请教
• E 字典词汇
• (2)确定每一类行为的项目比例
•
行为样组确定后,需要确定每一类行为 的项目比例,也即确定每一类行为在心理 结构中的比重问题。 • 需要根据理论和研究者的构想来确定。
• 第八专题 如何测量训练状态(2个) 测验56:运动员心理疲劳问卷 测验57:运动员训练状态监测量表 第九专题 如何测量认知能力(1个) 测验58:反应认知方式测验 第十专题 如何测量管理能力(2个) 测验59:教练员领导方式量表 测验60:群体环境问卷
• 第二部分 心理测验原理 第一专题 信度效度的基本原理 第二专题 纸笔测验的研制 第三专题 国外量表的移植 第四专题 调查研究的进展 第五专题 行为科学研究中的共同方法偏误: 对相关文献和矫正方法的述评
• 3、预测应力求按正规要求进行
• 4、预测应使被试有足够时间,以搜集充分的反应资料。 • 5、随时记录被试反应情况:如一般被试完成的时间,题 意存在不明或歧义之处,对某一题目长时间的停顿等。
四、对预测的分析
• 1、项目分析 • (1)难度分析 :如智力测试题目,一般态度、人 格量表无需分析难度。 • (2)区分度分析:或鉴别力分析,指测题能够辨 别被试之间所欲测量的心理特性的差异的能力。
• (1)测题反映测验目的,并对所测内容有代表性 • (2)测题能区分出不同水平被试 • (3)题干简明,以一横行为宜,以免被试找不到重点 • (4)避免双重否定 • (5)杜绝使用晦涩语言(术语、生僻语),应简明易懂 • (6)避免使用性别歧视、种族歧视和攻击性用语 • (7)避免涉及社会禁忌和个人隐私的内容
5、编写测验指导书
• (1)本测验的目的、功用 • (2)测验的理论背景,测验中的材料按什么原则 用什么方法获得 • (3)如何实施测验的说明 • (4)测验标准答案和计分标准 • (5)常模表 • (6)测验基本特征:鉴别力、难度、信度、效度 等 • (7)测验结果如何应用
体育科学常用心理量表评定手册
• 第二专题 如何测量意志(3个) 测验ll:高级运动员意志量表 测验12:武术散打运动员意志品质评价量 表 测验13:运动员意志品质量表
• 第三专题 如何测量情绪(7个) 测验14:BFS心境量表 测验15:锻炼诱导情绪问卷 测验16:简式.POMS(心境状态量表) 测验17:竞赛状态焦虑问卷 测验18:赛前情绪量表-T 测验19:运动竞赛焦虑量表 测验20:运动认知特质焦虑量表