第九章测量与量表非比较量表技术
测量与量表

SEARS IS: Powerful --:--:--:--:-X-:--:--: Weak Unreliable --:--:--:--:--:-X-:--: Reliable Modern --:--:--:--:--:--:-X-: Old-fashioned
负面的形容词有时出现在左边,有时出现在右边,这可防止某些有极端 倾向的调查对象不读标示就全部在左端或右端做上标记。
语义差异 Stapel量表
带两极标志的 7分制量表
品牌、产品 和公司形象
单极10分制 量表,从-5 到+5,没有 中立点。
对态度和形 象的测量
精选ppt
使用方便 易构建
对数据是否 定距有争议
难以应用
23
23
分项评分量表的设计
1) 量表中类别的数目 2) 平衡还是非平衡量表 3) 类别数目是奇数还是偶数 4) 强制还是非强制选择 5) 类别描述情况 6) 量表的外观形式
Strongly agree
1. 巴黎春天销售高品质的商品. 1
2X 3
4
5
2. 巴黎春天店内服务很差.
1
2X 3
4
5
3. 我喜欢在巴黎春天购物
1
2
3X 4
5
分析可以逐项(轮廓分析)进行,也可以通过对项 目加和计算总评分分析。 在加总时,要注意对负面陈 述的评分倒置过来计算。
精选ppt
17
17
收集2、大构量建与测步量骤的概念相关的陈述语句;
等比量表(ratio scale)。
精选ppt
5
5
1、量表的类型
量表类型
尺度特性
基本实证操作
范例
类别量表 只能描述(description)
市场调研之市场调查的测量与量表

构造李克量表的步骤
收集和编写大量围绕研究问题的陈述或说法 随机抽取样本一个样本进行试调查 根据试调查的数据进行量表的信度和效度分析。
在分析中需要对负说法的的得分作逆向处理 根据信度和效度分析,去除影响信度和效度的陈
述和说法,从而得到较高信度和效度的李克量表
李克量表例子:测量观众对名人引导时 尚的看法
测量的效度
测量的效度是测量的有效性,即测量工具能否准 确、真实、客观地度量事物属性的程度,主要表 现在测量项目和欲测量的测量属性相一致的程度、 概念的操作化定义反映概念的本质定义的程度等。
内容效度:表面效度,从表面上来观察和判断所 测量的是否就是应该测量的项目。首先要清楚了 解被测概念的定义,其次要判断所测量的变量是 否与之紧密相关
语意差别量表是定距量表,把要测量的名字和概念先分 解出若干个描述角度,然后用一系列的7级或9级量表从 这些角度进行描述,量表的两端代表两极化的态度
步骤:1确定描述、判断或评价研究对象的角度,然后 在每个角度上找出一对反义词。要尽量全面有意义。
2将各对形容词分别置于一系列有7个或9个刻度的标尺 的两端,将正反形容词之间的差距分成7等分,中间的 一级表示中立态度
态度量表的类型
1李克量表:也叫累加量表,是市场调查最常用 的量表,常用于测量观念、态度或意见。它的形 式是给出一组问题,请被调查者做出“非常同 意”、“同意”、“说不准”、“不同意”、 “非常不同意”五种回答,然后给各种回答分别 记为1、2、3、4、5或5、4、3、2、1。这样每 个被调查者对各道题目的回答分数的加总就得出 一个总分,这一个总分就说明了被调查者的态度 强弱
2舍史东量表
主要用于测量被访者对特定事物的态度
收集和编写大量与所测事物有关的陈述或说法,其表述应有正向的、 中间的和负面的
第九章量表编制

2.选择题:结构上包括两部分:题干和选
项
请你选择一种喜欢的颜色? 绿色 茶色 紫色 蓝色 红色 橘色 白色 黄色 智力测验(主要是测量推理能力)编制中使用 的选择题 (1)猫头鹰是鸟正如白鲨是—— a 动物 b 鱼类 c 鸟类 d 爬行动物 (2)平地与土丘的关系就如同峡谷与——的 关系。 a 沟壑 b 山谷 c 丛林 d 河流 e 高山
优点:适用范围广,既可以适用于文字 和数字的材料,也可以适用于图形的材 料;评分简单、省时、客观;相比于判 断题更少受猜测因素的影响。 缺点:编拟迷惑答案比较困难;无法测 量出被试的言语表达能力和概括、组织 能力,这与简答题、论述题相比是不足 的;尽管选择题减少了机遇的影响,但 猜测的影响仍然不能完全排除。
(三)初步组成测题 测验编制经验丰富者在编制测题时,往 往会考虑以下几个测题的来源: 直接选自国内外优秀的相关的测验; 修改前人的测验中的有关的测题; 自己编写
1.编写测验项目时应注意以下几点 (1)测验项目的取样应当具有代表性
(2)测验项目的取材范围要同编题计划所列 项目范围一致。 (3)测验项目的难度应该有一定的分布范围 (4)编写测验项目的用语要力求精练简短, 浅显明了。 (5)初编题目的数量要多于最终所需要的数 量,以便筛选和编制复本
3 2 1 3 2 1 1 13
2 1 0 2 2 0 1 8
1 0 1 1 0 0 0 3
20 10 12 25 13 12 8 100
编制计划有三个用途:
1.在测验的编制阶段,可以知道每个项 目应该编多少题目,编哪些种类的题目 2.题目编好后,可以用来核对,测题是 否全面,是否真正代表了所要测量的领 域,核对重要的方面有没有遗漏 3.根据表中百分比确定每类项目的分数 back
企业研究方法9 第9章测量量表信度效度

9.4信度 1.项目间一致性信度 项目间一致性信度是用来检验在同一个量表中受试者对所有题 项答案的一致性。假使这些题项是对相同概念的独立测量单位,那么 题与题之间应有一定的相关程度。而在项目间一致性信度指标中 ,最 普遍使用的检验是Cronbach 's a系数(Cronbach,l946),它适用于多 重评分量表的题项(multipoint-scaled items)。另外,库李法则适用 于二分法的题项(dichotomous items),上述系数愈高,测量工具愈好。
另外,信度在量表质量的检验中是一个必要条件而非充分条件。例如, 某个量表具有高度稳定性与一致性,因此能可靠地测量某个概念,但是 它衡量到的也许不是研究者想要测量的概念。而效度就是用来确保 量表具有能够测量到想要测量的概念的能力。以下我们将讨论效度 的概念。
9.4信度 9.4.3复本信度 针对同一概念,有两组同质且相当的测量工具,这两组工具测量出 的结果高度相关时,即可认为具有复本信度。一般而言,这两种版本的 量表会有相似的题项与填答格式,唯一不同的是叙述的语法与问题呈 现的顺序。在此我们将尝试找出因为题项的语法与顺序所造成的误 差。如果这两组复本所得出的分数之间高度相关(高于8以上),我们就 可确定该份量表是相当可靠的,而且由语法、排序或其他因素所造成 的误差是相当小的。 9.4.4量表的内部一致性 量表的内部一致性是指在测量某一概念时题项间的一致性指标。 换句话说,这些题项应该是“被当成具有同样性质的组合”,而且都能 够独立测量相同概念。也就是说受试者对这些题项都有一个整体的 且同样的看法。一致性可通过检查量表中题项与题项之间,或子题项 之间是否高度相关来确定。一般来说,一致性指标包括项目间一致性 信度与折半信度。
912类别量表类别量表通常使用多重选项来标记单一答案同样地它一般也是采用定类尺度91评定量表913李克特量表李克特量表被设计为五点量表如下所示定位点anchors是用来代表受试者对叙述句的赞成或不赞成程度有多强烈
教育统计与测量评价新编教程-第09章

第一节 测验题目类型与测量功能
二、课业考评存在的问题
在推进素质教育的过程中,近几年来,校内考试制度与方法有许多重要的改 进,但就学校教育整体来看,课业考评仍存在一些较严重的问题,主要表现在如 下几个方面:
第一,课业考评指导思想与学校教育理念、目标不相适应,在考试设计及考 试结果的使用过程中过分强调区分和选拔功能。
教育统计与测量评价 新编教程
第九章
学生课业发展的测量与评价
内容导读
本章探讨的重要内容有:学生课业考评的意义与 作用;国外课业考评改革的主要经验与趋势;学校课 业考评改革的目标;学生课业发展的主要内容及参照 点类型;评价学生课业发展进步的主要方法。学习本 章后要求做到:深刻认识学生课业考评的意义与作用 ;了解基础教育课程改革对学生课业考评的要求;把 握学校课业考评改革的目标;掌握评价学生课业发展 进步的主要方法及其新进展。本章的难点是档案袋评 价技术原理和动态评价技术原理的理解和应用。
第一节 课业考评改革的基本认识与目标
一、课业考评的主要作用
课业考评对促进学生发展起着重要的作用,尤其是以现代教育理念和教育评 价理论为指导而建立起来的课业考评制度与方法,更是如此。 ➢ 首先,合理的课业考评制度为学生发展提供了较明确的目标和努力的方向。 ➢ 其次,合理的课业考评制度将有助于评价学生的发展进步,从而对教与学双 方活动起着重要的控制、调节和促进等作用。 ➢ 再次,课业考评为学生心理发展和学习进步创造了必要的背景和空间,诱发 学生的学习动机和自主发展的动力。 ➢ 最后,课业考评在中小学生个体社会化进程中起着控制、调节、促进和加速 的作用。
(一)课业考评改革要实现考试观向发展性评价观的转变 (二)课业考评内容要从认知领域转变到涵盖学习结果的更广泛的教育目标 领域上来 (三)课业考评要努力实现从表征性分数机制到实质性内容机制的转变,贯 彻定量与定性相结合、过程与结果相结合、静态与动态相结合、教学与评价相结 合的原则
第九章心理测验技能分必得

第九章心理测验技能第一节:人格测验第一单元.明尼苏达多相人格测验(MMPI)★★★MMPI基本信息测验功能:人格编制方法:经验效标法(选取大量题目进行测验,选取可以与控制组明确区分开的题目作为问卷题目)题目数量:566个自我报告形式的题目,其中16个题目为重复题。
如果只为精神病临床诊断使用,可做前399题。
适用范围:年满16岁、具有小学毕业以上的文化水平施测形式:卡片式、手册式(个别、团体)。
中国:T>60:美国:T>70T分在40~60分是正常范围;在30分以下或70分以上则是显著异常;在30~40分和60~70分之间是轻度异常MMPI的四个效度量表:Q量表:D名称:用?表示,疑问量表2构成:由未反应项目和矛盾反应项目构成3功能:高分者逃避现实566版,原始分超过30,测验无效;前399,原始分超过22,测验无效L量表:D名称:说谎量表2构成:15题,由过分尽善尽美的项目构成3功能:高分者想让别人把自己看得比实际情况更好原始分超过10分,测验不可信。
F量表D名称:诈病量表2构成:由荒唐古怪(稀有认同)的项目构成B功能--高分解释:A.(当测验有效)分数越高,反应精神病的严重程度越高B.(当测验无效,即临床量表表现为一组无关症状)反应受测者可能诈病c.(当测验无效)还可能反应受测者答题不认真,理解错误(因智力低下).K量表:D名称:校正量表@构成:由反应自我控制和家庭问题及人际关系的项目构成3功能:A.反应受测者态度,是隐瞒的或防卫的B.计算某些临床量表原始分的K矫正分--K矫正分=X+nkMMPI十个临床量表的形成:量表1/2/3/4/6/7/8/9:根据当时流行的精神疾病分类确定了这八个临床量表再根据正常人和病人对同一题目的差别反应形成量表内容量表5(男子气-女子气):根据男女受测者对同一题目的差别反应形成量表内容量表0(社会内向):根据大学生内向和外向对同一题目的差别反应形成量表内容Hs疑病:功能:反映受测者对身体功能的不正常的关心参考诊断:疑病症,躯体化障碍,神经衰弱D抑郁:功能:与忧郁、淡漠、悲观、思想与行动缓慢有关参考诊断:抑郁性神经症或抑郁症Hy癌症:功能:转换反应来应对压力的倾向一一依赖、天真、外露、幼稚及自我陶醉参考诊断:症(转换性痘症)Pd社会病态:功能:反应受测者性格的偏离一一蔑视社会习俗,常有攻击复仇观念参考诊断:人格异常,包括反社会人格和被动攻击人格Mf男子气-女子气:功能:反映性别色彩,男性高分女性化,女性高分男性化,参考诊断:极端高分,考虑同性恋倾向或同性恋行为Pa偏执:功能:高分者多疑、孤独、烦恼及过分敏感参考诊断:极高分者,精神分裂症偏执型或偏执性精神病(妄想性障碍)Pt精神衰弱:功能:高分者紧张、焦虑、反复思考、强迫思维、恐怖以及内疚Sc精神分裂症:功能:高分者表现异乎寻常的或分裂的生活方式,以及不恰当的情感反应参考诊断:精神分裂症Ma轻躁狂:功能:高分者联想过多过快、活动过多、观念飘忽而情绪高昂参考诊断:躁狂症或双相障碍的躁狂症Si社会内向:功能:高分者内向,胆小退缩不善交际、低分者外向,富于表情爱交际MMPI的评价优点:1、临床诊断的符合率较高2、首次将效度量表纳入人格测验,提高了测验的诊断价值3、不但可以提供医疗诊断,,也可以用于正常人的个性评定缺点:1、题目太多,做题时间太长2、受文化背景影响MMPI的注意事项第一,进行测验之前,要让受测者知道测验的重要性以及对他的好处,取得合作。
Ch09 测量和量表:非比较量表(Ray)

-非常柔和
非常刺手 刺手 略微刺手 既不刺手也不柔和 略微柔和
柔和
5.
-3 -2 -1 0 1 2 3
非常刺手
既不刺手也不柔和
非常柔和
5、多项量表
开发理论 产生最初的项目库: 理论、二手数据和定性研究 在定性判断的基础上选择一套简化的项目 从一个大的预测试样本处收集数据 进行统计分析 开发提炼后的量表 从一个不同的样本处收集更多的数据 评价量表的信度、效度和可推广性 准备最终的量表
(2)平衡量表和非平衡量表
平衡量表(Balanced Scale):赞成的类别和 不赞成的类别数目是相等的;反之,则成 为非平衡量表。 一般来讲,为了获得可观数据,量表应该 是平衡的。 但是,如果答案的分配有可能发生倾斜, 或者偏向正面,或偏向负面,那么一个倾 斜方向上有较多类别的非平衡量表或许是 合适的。
(4)强制式还是非强制式的评分量表
强制式评分量表(Forced Rating Scale)强制 要求调查对象表达一种意见,因为没有提 供“没有意见”的选项。 在这种情况下,没有意见的调查对象可能 会在量表的中间位置坐上标记。
在预料调查对象没有意见的情况下,数据 的准确性可以通过一个非强制性量表得到 改善,其中包括“没有意见”的类别。
②复本信度
复本信度(Alternative-forms Reliability): 构建两个等价的量表形式。同一个调查对 象在两个不同的时间被进行测试,通常间 隔2-4周。对执行重复的量表形式得来的分 支进行相关分析以评价信度。
它的问题是:第一,构建一个量表的等价 表格耗费时间且成本昂贵;第二,构建一 个量表的两个等价表格很困难。
非比较量表由连续评分量表和分项评分量 表组成。
Ch09 测量和量表:非比较量表(Ray)

-非常柔和
非常刺手 刺手 略微刺手 既不刺手也不柔和 略微柔和
柔和
5.
-3 -2 -1 0 1 2 3
非常刺手
既不刺手也不柔和
非常柔和
5、多项量表
开发理论 产生最初的项目库: 理论、二手数据和定性研究 在定性判断的基础上选择一套简化的项目 从一个大的预测试样本处收集数据 进行统计分析 开发提炼后的量表 从一个不同的样本处收集更多的数据 评价量表的信度、效度和可推广性 准备最终的量表
(2)平衡量表和非平衡量表
平衡量表(Balanced Scale):赞成的类别和 不赞成的类别数目是相等的;反之,则成 为非平衡量表。 一般来讲,为了获得可观数据,量表应该 是平衡的。 但是,如果答案的分配有可能发生倾斜, 或者偏向正面,或偏向负面,那么一个倾 斜方向上有较多类别的非平衡量表或许是 合适的。
(5)物理形式或结构
量表的形式和结构可以有许多选择: 许多量表结构可以被用来测量Cheer牌清洁剂的柔和性: Cheer牌清洁剂是: 1.非常刺手-- -- -- -- -- -- 非常柔和 2.非常刺手1 2 3 4 5 6 7 非常柔和 3. 。非常刺手 。 。 。既不刺手也不柔和 。 。 。非常柔和 4. ------
除非计算机化, 否则评分会很 麻烦
语义差异
对数据是否定 距有争议 使人迷惑,难 以应用
斯坦普尔量表 单级10份制量 表,-5到+5, 没有零点
(1)Likert量表
Rensis Likert命名的Likert量表(Likert Scale)是一个 被广泛使用的评分量表,它调查对象对关于刺激物 体的一系列陈述中的每一个,指出同意或不同意的 程度。 一般量表项目有5个反应类别,从“强烈反对”到 “强烈赞成”。 Likert求和方法最为频繁,因此Likert 量表也被称为 求和量表。 Likert量表的优点:易于构建和执行;调查对象很容 易理解如何使用量表,因而使它适合邮件访谈,电 话访谈或人员访谈。 Likert量表的缺点:比其他分项评分表要花费更长时 间完成,因为调查对象必须阅读每个陈述。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A relatively new research tool, the perception analyzer, provides continuous measurement of “gut reaction.” A group of up to 400 respondents is presented with TV or radio spots or advertising copy. The measuring device consists of a dial that contains a 100-point range. Each participant is given a dial and instructed to continuously record his or her reaction to the 2011/2/17
Version 2 形式2
Probably the worst - - - - - - -I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Probably the best
2011/2/17
第九章测量与量表非比较量表技术
Perception Analyzer 感知分析仪
多项量表
2011/2/17
第九章测量与量表非比较量表技术
Chapter Outline 学习内容
量表的评价
测量的准确性
信度
效度
信度和效度的关系
推论性
量表技术选择
数学推导的量表 8.9 SPSS窗口
小结
2011/2/17
Reliable? Valid? Generalizable?
3. 讨论评价量表时所用的标准,并解释如何评估信度、效度和可 推论性
4. 讨论在国际背景下执行非比较量表时所要考虑的问题
5. 理解在构造非比较量表时所涉及的伦理道德问题
6. 讨论因特网和计算执行连续评分量表和分项评分量表时的应用
2011/2/17
第九章测量与量表非比较量表技术
Chapter Outline 学习内容
连续评分量表也称为图示评分量表。调查对象通过在一条直线上的适当 位置做出标记为物体评分。
The form of the continuous scale may vary considerably. 连续量表的形式可 能变化相当大。
How would you rate Sears as a department store? 就百货商店而言,你将如 何斯尔斯评分?
概要 非比较量表技术 连续评分量表 分项评分量表
Likert 量表 语义差异量表 斯坦普尔量表
2011/2/17
第九章测量与量表非比较量表技术
Chapter Outline 学习内容
非比较分项评分决策 量表类别的数目 平衡量表与非平衡量表 类别的奇偶数 强制性评分量表与非强制性评分量 语言描述的性质和程度 物理形式或结构
2011/2/17
第九章测量与量表非比较量表技术
Continuous Rating Scale 连续评分量表
Respondents rate the objects by placing a mark at the appropriate position on a line that runs from one extreme of the criterion variable to the other.
Version 1 形式1
Probably the worst - - - - - - -I - - - - - - - - - - - - - - - - - - - - - - Probably the best
可能最差 - - - - - - -I - - - - - - - - - - - - - - - - - - - - - - 可能最好分量表
The respondents are provided with a scale that has a number or brief description associated with each category.
The categories are ordered in terms of scale position, and the respondents are required to select the specified category that best describes the object being rated.
第九章测量与量表非比 较量表技术
2020/12/9
第九章测量与量表非比较量表技术
Chapter Objectives 学习目标
1. 描述非比较量表技术,区分连续链表技术和分项评分量表,并 解释Likert量表、语义差别量表和斯坦普尔量表
2. 讨论在构造分项评分量表时所涉及的有关量表类别数目、平衡 量表与非平衡量表、奇偶数类别、强制与非强制性选择、语言 描述程度及量表的物理形式等决策问题
第九章测量与量表非比较量表技术
Noncomparative Scaling Techniques 非比较量表技术
• 使用非比较量表的调查对象采用任何他们认为合适的评分标准, 不对被评价的物体与另一物体或一些指定的标准进行比较。
• 调查对象一次只评估一个对象,因此非比较量表经常被单胞量 表。
• 非比较量表由连续评分量表和分项评分量表组成
As the respondents turn the dials, the information is fed to a computer, which tabulates second-bysecond response profiles. As the results are recorded by the computer, they are superimposed on a video screen, enabling the researcher to view the respondents' scores immediately. The respons第e九s章测a量re与量a表l非s比o较量表技术