第四章-测验题目性能与题目编制PPT课件
第四章教育测验编制的一般步骤与方法

〔三不同类型选择题的命题原则 选择题的编制
要求被试从测验所提供的选项中选出正确 答案的测题成为选择题.选择题在结构上包括两 部分:题干和选项.
目前主要的选择题型有:比较、因果、类推、 多项、多选、多项多选、最佳、最差等
编制题目需遵循的原则: 1.每个题干仅问一个明确的问题. 例3:三角几何共八角,三角三角,几何几何? ①2角 ②3角 ③4角 ④5角
第二节 测验题目编制技术
一、客观性测验题目的编制
〔一客观题的优、缺点
客观题因其评分客观而得名. 优点:
1.适于测量知识、理解、应用、分 析几个层次的认知目标;不适和测量综合、
评价两级认知目标.
2.答案明确、回答简便,在一个测验 中的数量较多,可保证对知识内容的覆盖率.
3.有明确的标准答案,评分准确、简 单、可靠,利用计算机阅卷可节省人力、物
缺点: 1.不易编制,且花费时间较多. 2.易受考生阅读能力的影响. 3.难以排除考生对试题的随机猜测. 〔二客观题命题的一般原则 1.试题能反映教学内容的重点或知识点. 2.题目之间的相关性越低越好. 3.试题的文字力求浅显易懂、题意明确. 4.答案应该是明确、唯一的. 5.试题应按教育目标的要求,内容不能超过 超过受测团体的知识和能力.
察对基本概念、性质、原理、定则等的认知和判断.
编制题目需遵循的原则:
1.每一题只能包含一个核心概念.
例10:北京是我国最大的政治、文化和经济中心.
2.试题应是非界限分明,避免模棱两可的语句.
例11:我国南方的天气很热.
3.避免使用具有暗示性的字词和特殊点限定 性词句,如全都、绝不、都、可能、大概等.
1
1
7
5
云
2
2
第四章 心理测验的信度与效度

(公式5-5)
y
❖
SE
为差异的标准误
d
,S为相同尺度的标
准分数
的标准差
,
r r Z分数为1,T分数为10。 、 分别为两个测验的信度系 xx yy
数。
❖ 先将原始分数化成标准分数,然后将两个标准分数的差异
与1.96SEd(0.05显著性水平)进行比较,如果其绝对值
大于此值,则差异显著,否则差异不显著。
信度乃是一个被试群体的真分数与实得分数的相关系数 的平方。
信度乃是一个测验X与它的任意一个平行测验Y的相关系 数。
信度只受随机误差影响,系统误差不影响信度
5
二、信度的指标
信度以信度系数为指标,常用相关系数表示,表示实得 分数的变异数中有多少比例是由真分数的变异决定的,
❖信度系数以相关系数为指标,rxx=rxT2=ST2/SX2 ❖信度的平方根就是信度指数,rxT=ST/SX
27
❖ 2、确定信度可以接受的水平
一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情 况是rxx=1.00,但实际上是办不到的。根据多年的研究结果,一般 的能力测验和成就测验的信度系数都在0.90以上,有的可以达0.95; 而人格测验、兴趣、态度、价值观等测验的信度一般在0.80~0.85或 更高些。一般原则是:当rxx<0.70时,测验不能用于对个人做出评 价或预测,而且不能作团体比较;当0.70≤rxx<0.85时,可用于团 体比较;当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。
❖
41
五、影响信度的因素
❖ 样本的影响
样本团体的异质性高,信度就高 样本团体平均能力水平的影响
❖ 测验长度的影响
可以通过增加测验长度的方式提高信度值。 ❖ 新增项目必须与试卷中的原有项目同质。 ❖ 新增项目的数量必须适度。
ppt章节练习题

ppt章节练习题1. 打开素材文件夹“第4章练习/练习/练习4-1.ppt”文件,请完成下列操作后保存到考试文件夹中。
在最后添加一张幻灯片,设置其版式为“标题幻灯片”,在主标题区输入文字“The End”。
设置页脚,使除标题版式幻灯片外,所有幻灯片的页脚文字为“国宝大熊猫”。
将“大熊猫现代分布区”所在幻灯片的文本区,设置行距为1.2行。
将“活动范围”所在幻灯片中的“因此活动量也相应减少”字体设置为隶书,字号为32。
将“作息制度”所在幻灯片中的表格对象,动画效果设置为鼠标单击时水平方向中速的“百叶窗”效果。
操作提示:设置文本区行距,选择该幻灯片中的文本区,选择系统菜单中“格式”→“行距”,在打开的“行距”对话框中做相应设置。
操作要求中,首先使用“查找”以“作息制度”找到相关幻灯片,然后选择幻灯片中的表格,在“自定义动画”窗格中设置相应动画“添加效果”→“进入”“其他效果”→“百叶窗”。
2. 打开素材文件夹“第4章练习/练习/练习4-2.ppt”文件,按以下要求编辑后保存到指定文件夹。
将所有幻灯片的切换效果设置为“水平百叶窗”, “中速”。
将第 1 张幻灯片中艺术字对象“自由落体运动”动画效果设置为鼠标单击时“自顶部飞入”方式进入。
将第张幻灯片标题文本框内容“自由落体运动”改为“自由落体运动的概念”字体名称为“楷体”。
在最后插入一张“标题,文本与剪贴画”版式的幻灯片。
在新插入的幻灯片中添加标题,内容为“加速度的计算”,字体为“隶书”字号为60 。
3. 打开素材文件夹“第4章练习/练习/练习4-3.p pt”文件,按以下要求编辑后保存到指定文件夹。
将第1 张幻灯片的背景纹理设置为“绿色大理石”。
将第张幻灯片中的标题字体设置为黑体,字号60。
删除第张幻灯片中所有一级文本的项目符号。
对第张幻灯片中的图片建立超级链接,链接到第一张幻灯片。
隐藏最后一张幻灯片中幻灯片中的一级文本通常是指文本区添加了项目符号和编号的最靠左侧的文本条目,如果有二级文本、三级文本应是递进排列的,如图4- 1所示为包含一级文本和二级文本的幻灯片页面。
第四章 测验信度、效度、区分度及难度

课堂教学规范化培训内容之三教学测验及其分析河南中医学院教务处2005-5-25第一部分测验题目类型及编制测验总是由一系列的题目构成的,测验题目可以说是测验的基本构成元素。
在一个测验中,题目编制恰当与否直接关系到整个测验的质量与效果。
只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。
教师的工作就是进行教学,善于利用测验的教师才是更好的教师。
有效的测验能改善一位教师的教学效果。
测验题目基本上分为两大类:选择――反应型和建构――反应型。
前者一般要求被试者在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试者自己提供答案,如作文题、简答题、填空题等。
若根据被试作答的范围和评分方法不同,又可称为主观性试题和客观性试题。
客观性试题是因为客观评分而得名,在测验前就已准备好了正确答案,不同评分者的独立评分,所得结果基本上是相同的。
主观性试题主要包括论述题、操作题和作文题等。
它们适合于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次的内容。
一、选择――反应性试题测验总是与题目有关,教师选择的题目类型一定切合他们打算做的推论,同时也要确保这些推论和教师的教育决策直接相关。
编制选择――反应测验题目的方法主要涉及编写选择题、判断题、多重判断题、匹配题等。
这些题型可以帮助教师有效地了解学生的认知状态――也就是对所教授的知识和技能的掌握情况。
选择――反应性试题一般就是我们所说的客观性试题。
从客观性试题角度来看,一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。
客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。
㈠选择题选择测验题(multiple-choice test item)一直主导着各个国家的学业成就测验。
选择题可以用来考查学生知识的掌握或更高层次的思维能力。
第四章编制试题

一、试题及其分类
(一)试题的内涵
试题是呈现考试内容、传递测试信息的载体,
制造测评量具的构件,主试与被试形成交互的 媒介。
试题是引起刺激—反映的一种刺激反映源。 明确试题是什么?是编制试题的前提。
(二)常用试题的分类
△ 呈现形态分类
文字试题 言语试题 图形试题 实物试题 笔试试题 面试试题
改例1:经济基础相对于上层建筑是易变的, 这种情况存在于
A.封建主义社会 C.社会主义社会 B.资本主义社会 D.整个人类社会
(5)不机械照搬教材、教参、辅导材料上的内 容 编选项
例题1:下列几种物质,在体内新陈代谢时产生热量最大 的一种是 A.脂肪 C.淀粉 B.砂糖 D.蛋白质
修 改
改例1:下列几种食物,排除哪一种将引起体内新陈代谢
单项选择题 双项选择题 多项选择题 不定项选择题
范畴
客观性试题 性质:
结构:双层结构
题干——问题陈述
题肢——供答选项
编制要领:干精; 肢妙
编制特点:技术难度大,讲求编制技巧
突出优点:扩大考试内容的覆盖面;增强考试 内容的代表性、针对不易检测高层能力
标准卷:也称“母本卷”,是印制正式考试试卷 的原始卷或标准样卷。 (一)标准卷的规范
1.标准卷的格式规范:
Δ第一类:社会性重大考试的标准卷格式规范
(1) 分 卷 格 式 模 式
(2)合卷格式模式
Δ第二类:学校课程考试的标准卷格式规范
高校本科课程考试试卷格式模式:
2.标准卷的编排规范
(1)全卷各大题,应按先简后繁的序次编排 (2)各大题中的小题,应按先易后难的顺序编排 (3)全卷小题序号从第1题到最后一题应排通码 (4)同一选择题的题干和选项不能转页排 (5)同一图表的表名和图标应连排,不能分开 (6)大题、小题的题文应顶格排,选择题的选项应退后一 格起排 (7)判断、选择题的作答处应全卷统一 (8)同一填空题中的填写空格,应长短大体一致 (9)各大题的答题指导语应简明易懂,并统一放在各大题 题型名称后的括号内 (10)主观性试题的作答处应留有余地 (11)试卷每一页下方,应居中标示“第 页 共 页”
第4章心理测验

(2)斯坦福-比内量表:因美国斯坦福大学 的推孟修订而得名。他使用比率智商和离 差智商概念,以IQ作为个体智力水平的指 标,将适用年龄扩展到1· 5-18岁,选取了 2100名常模样本。(吴天敏修订) • 比率智商的计算方法是用智力年龄(MA)和 实际年龄(CA)之比乘以100,即 • 智商(IQ)=(MA/CA)*100 • 离差智商:IQ=100+15Z • 其中Z是指被试者分数标准化后的分数。Z 的计算公式为:Z=(X+)/S
第四章 心理测验 在人事测评中的应用
第一节 心理测验的一般原理
一、心理测验的定义 • 肖鸣政:通过一系列手段,将人的某些心 理特征数量化,来衡量人的智力水平和个 性方面差异的一种科学选择方法。
阿纳斯塔西(A. Anastasi):心理测验实质上是行为样组的客观 的和标准化的测量。
1.行为样组(是对行为的测量,且是一组典型,有代表性的行为样本) 行为样组要典型,具有代表性。测验题目的性质和数量要有代表性,能 获得所要预测的心理行为。例如,音乐能力测试中,对音高、音色、音 量、节拍的辨别判断等题目能体现某个人在音乐方面的基本能力。 2.标准化(题目、实施过程、记分、结果解释、常模) • 测验的编制、实施、记分以及对测验结果的解释都要有严格的标准,必 须一致,要保证测验的条件对所有的被试相同、公正。还要建立常模, 给测验分数提供比较的标准,从而对测验分数进行解释。 3. 难度客观测量(保证区分度) • 测验题目乃至整个测验的难度水平必须客观。自制的心理测验都要经过 试测,从试测中通过项目的人数多少来确定难度。 4.信度(可靠性) • 测验要可靠,同一组被试使用同一测验施测两次后得到的分数应该一致, 或者同一组被试经过一次测验以后再用一个等同形式的测验再测一次, 两次所得的分数应一致。 5.效度(有效性) • 测验是有效的,测验应该确实能测量到它所要测量的东西。必须严格按 照测量目标选择测验材料,测验内容丰富、难度适当,排除无关因素的 影响。
最新第四章-心理测验的难度与区分度ppt课件
所在,找出问题的关键点、从而提出解决问题的思路和对策。
理论分析的特征
理论分析的突出特点有:
(1)概括性和揭示性。 (2)解释性和系统性。 (3)间接性和抽象性。
二、理论分析在社会调查中的作用
四、区分度与测验信度、难度的关系
区分度与难度关系
难度(P)
1.00 0.90 0.70 0.50 0.30 0.10 0.00
区分度的最大值 0.00 0.20 0.60 1.00 0.60 0.20 0.00
由上表可知,难度适中,可使区分度达到 最大值。
五、影响题目区分度的因素
(1)题目难度 (2)被试群体的同质性 (3)全卷各题所测心理品质的一致性。 (4)题目本身的文字与内容的质量也会
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
心理与教育测量第四章
当前您浏览的位置是第七页,共四十六页。
真分数估计举例
• 在一个人格测验中,某个被试的外向性得 分为20分,已知该分测验的标准差为10, 信度系数为0.91。试问该被试外向性的真 实水平处于什么范围(α=0.05)?如果对 该被试重新施测,他的分数将不会落在什 么范围外?
其中 p 为所有题平均答对率, q 为所有题目平均答 错率。
当前您浏览的位置是第二十九页,共四十六页。
– 克龙巴赫系数(适用所有题目):
K [1 K 1
S
Si2
2 x
]
其中,Si2为每个题目的方差。 • 注意: 大,信度必高,但小,信度不一定低。
– 荷伊特信度(采用方差分量比方法):
rXX
1 MS人X题 MS人
当前您浏览的位置是第十五页,共四十六页。
• 使用条件
– ①所测心理品质相对稳定,否则无法判断是量 具信度低,还是品质本身稳定性差。
– ②前后间隔时间要恰当,遗忘和练习的效果基 本上相互抵消。时间间距依问题的性质和测量 目的而定。通常,以2-4周为宜。智力测验的间 隔一般在6个月左右。
– ③间隔期间被试在所测品质方面无更多学习和 训练。
语文考试里的作文,就没办法分半;分半方法 很多,所估信度很可能有差异。
当前您浏览的位置是第二十六页,共四十六页。
四、同质性信度
• 定义
– 测验内部所有题目间的一致性程度。 一致性包 含两重含义:
• 所有题目都是测同一种心理特质。 • 所有题目得分之间都有较高的正相关。 • 两者的关系:正相关高是同质性高的必要而非充分
当前您浏览的位置是第三十一页,共四十六页。
荷伊特信度举例
心理测验的编制和使用PPT共73页
(二)难度的计算
1、原始定义法 2、极端分组法
1、原始定义法
(1)客观试题(二分法记分):
P R
R:答对该题的N人数;N:参加测验的总人 数
(2)0、1计分多重选择题难度校正
CP kP1 k 1
k:每个测题可供选择的答案; P:未校正测题的难度; CP:校正测题难度。
例题:假定某题有75%的被试通过,若该题 有5个备选答案,则校正后的通过率为:
2、极端分组法
(1)客观题的极端分组法 根据测验分数按高低排序,用两个极端组在
某项目上的平均通过率表示项目的难度 PH、PL分别为高分组与低分组的通过率。
步骤:
A、按测验总分由高到低排序
B、从高分段向下选出全部试卷的27%作为 高分组
C、从低分段向上选出全部试卷的27%作为 低分组
D、按照上述公式计算项目难度值
双向细目表
制定编题计划(双向细目表)
1、全面而具有代表性的测验内容,不致使 测验偏离了应测的范围
2、对各个内容点的相对重视程度通常用百 分比来标明
三、编辑测验项目
(一)搜集有关资料 1、资料要丰富 2、资料要有普遍性 (二)选择项目形式 1、测验的目的和材料性质 2、接受测验的团体的特点 3、各种实际因素:时间,人数、经费等
想性以及表达是否清楚等方面加以分析。 量的分析是对预测结果进行统计分析,确定