语言测试的信度和效度及其关系

合集下载

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,及影响。

一.效度是指测量的有效性,也就是看考试是否考查了想要考查的内容。

二.信度是指考试结果准确,稳定,可靠的程度。

这要求有不同的评卷人阅卷,所得分数大致相同;同一评卷人在不同的时间阅卷,分数大致相同。

三.区分度就是可以进行比较。

四.实用性是指要便于使用。

试题清晰,醒目,措辞简洁,避免拼法错误或遗漏,尽量少涉及各种器材设备。

五.影响分为积极和消极两种。

积极影响:帮助学生发现问题,积极督促。

消极影响:会造成考什么学什么的结果。

试题要体现新一轮基础教育课程改革的基本理念,落实《英语课程标准》所确立的考试指导思想。

考试要有利于全面贯彻国家教育方针,推进素质教育;有利于体现九年义务教育的性质,全面提高教育质量;有利于英语课程改革,提高英语教学质量, 培养学生的创新精神和实践能力,减轻学生过重的课业负担,促进学生生动活泼、主动学习。

英语试题要落实知识与能力、过程与方法、情感态度与价值观三维课程目标,要依据《英语课程标准》来确定考查内容和标准,既重视考查学生对英语基础知识与基本技能的掌握情况,更重视考查学生在具体情境中综合运用语言的能力,考试内容不应与任何教材的具体内容直接挂钩。

在试卷设计上要遵循教育测量的基本原理,坚持以交际语言测试为主,分离测试、综合测试等多种测试并存,力求在语篇层次上,在尽可能真实情景中,以互动的形式测试学生的综合语言运用能力;不仅要关注试卷信度,更要注重试卷的效度;在力求试卷结构简约的同时,确保考查内容的覆盖面,杜绝繁、偏、旧试题,科学控制题量和难度。

要坚持“以能力立意为主、知识立意为辅”的原则,根据语言实际使用情形命题,适当增大主观性、开放性试题的比重,尽可能避免命制以词或句为语言单位的试题,不应在脱离语境的情况下单独考查微观语言知识。

在选择语言素材时,要充分考虑学生的实际生活和身心发展水平、地域以及文化差异,选用真实、地道、形式多样的语言素材。

语言测试的信度效度

语言测试的信度效度

测 试效 度是 指语 言测 试 的真 实 性 和 准确 性 ,也 就 是 此 测 验
与 旨在测量的 目的相 符合 一致 的程度 。也 就是说 该测试是否有
效 度 在 于 它 是 否 真 实 地测 试 出它 想 要 考 察 的 内 容 。如 果 测 试 和
四、 结 语
效度和信度的测试 是评定语 言测试 中必不可少 的两个重 要 指标 , 它反 映的是语言测试 的本质性 问题 , 对评定是 否达 到预期 理 的平衡 , 相 互补充 , 才能保证考 试的可靠性 和准确性 , 从 而达 到测试 目的, 提高测试 质量 。 参考文献 :


信 度
( 一) 什 么是 信 度
面 的发挥 ; 6 ) 测试选项 不合理 : 如 多想选择 里 , 正确答 案很容 易 被 考 生 以 某 种技 巧识 别 。
信度是指测试结 果的可信程度 , 是衡量测验稳定性 , 可靠性 的重要指标 。语言测试 信度主要 衡量语 言测试结果对语言受试
所有对测试准确性和真实性构成偏差 的因素都对效度有影
受试 者 语 言 能 力 所 引 起 。
语言测试 的每个环节都不可避免 的会受到一些偶然 因素的 影响, 这些 偶然 因素必然 会对测试 的信度 有影响 , 影响越 大 , 信 度就越低 。 因此在组织与实施 测试 过程 中 , 对全部的受试者都应 该保 持环 境与条件 的一致 , 以取得 比较 高的信度 ; 在测试 的评 分 环节中 ,同一项测 试的评分标准 应该客 观 ,必须保 持一致且稳 定, 这样 才能保证取得较高信度 ; 另外评分 者同样是影响语言测 试信度 的重要因素 ,因为评 分者会将 自己的主观意愿移植到评
受试者 的真实语言水平如果保持一致 , 则此考试 的信 度最 大 , 反

信度和效度的关系口诀

信度和效度的关系口诀

1、信度即测量结果的稳定性或可靠性,指用同一种方法对同一个对象进行重复测量,所得结果与之前测量结果相一致的程度,即测试方法不受随机误差干扰的程度。

包括同质性信度、分半信度、复本信度、重测信度、评分者信度等。

2、效度即准确性和真实性,指测量工具或手段能够准确测所需测量的事物的程度。

例如,某问卷调查医生的工作负荷,则效度指该问卷能否准确地、真实地调查出医生的工作负荷。

效度和研究目标有关。

包括内容效度、效标关联效度、结构效度等。

信度和效度的关系:
信度与效度见的关系并非对称的,其中信度是效度的前提和基础,效度是信度的目的和归宿。

任何测量,只有做到两者的辩证统一才会具有科学性。

信度是效度的基础。

测量要有效度必须有信度,没有信度就没有效度。

一项测量如果信度低,则效度也低,因为若测量不能稳定地测量所需测量的对象,就不能有效地说明测量对象;如果信度高,效度可能高也可能低。

一项测量如果效度高,则信度一定高;但是,如果效度低,信度可能高也可能低。

值得注意的是,信度与效度二者缺一则测量无效。

语言测试的信度与效度之间的关系

语言测试的信度与效度之间的关系

语言测试的信度与效度之间的关系
李翌豪
【期刊名称】《江苏师范大学学报:哲学社会科学版》
【年(卷),期】2016(042)005
【摘要】测试的信度和效度是用来衡量一门考试是否有效和可靠的两个关键因素,任何测试的开发与评估都应当把二者纳入到重点考虑范围之内。

然而,一些研究者
对于测试信度的定义往往过于理论化,甚至把其成立的基础建立在某些理想化的客
观条件之上;同时他们在测量信度时所采取的过于机械化的统计方法,也导致了其结
果不能准确地反映出试题的客观稳定性。

考虑到信度与效度之间不可避免的逆反关系,为了满足语言测试的首要目的,测试的开发者应当首先给予效度最大限度的重视。

由于“套题”中包含了复杂的“题内相关性”,所以它并不利于测试在数据上达到
令人信服的“可靠性系数”值;但如果以此为依据就盲目地将其排除在外,我们就忽
略了其在考查被测能力方面的作用,从而忽视了对测试整体效度的把握。

【总页数】5页(P88-92)
【作者】李翌豪
【作者单位】江苏师范大学外国语学院,江苏徐州221116
【正文语种】中文
【中图分类】H08
【相关文献】
1.论信度与效度关系下语言测试的取向
2.语言测试的信度与效度之间的关系
3.对外汉语听力题型和语言测试信度、效度的关系研究
4.语言测试信度、效度和医学英语题型关系研究
5.对外汉语听力题型和语言测试信度、效度的关系研究
因版权原因,仅展示原文概要,查看原文内容请购买。

信度和效度概念

信度和效度概念

信度和效度概念
信度是衡量测量工具的一个属性,指的是测量工具能够稳定且准确地测量同一现象的能力。

一个具有较高信度的测量工具,其测量结果在多次应用时应该是一致的。

效度是衡量测量工具测量所针对的概念或现象的准确性的属性。

一个具有较高效度的测量工具,应该能够准确地反映出实际研究对象的特征或变化,而不是产生误导或无效的测量结果。

信度和效度都是评价测量工具质量的重要指标,它们在研究设计和数据分析中至关重要。

高信度的测量工具可以提供可靠和一致的测量结果,而高效度的测量工具可以确保测量结果与研究对象的实际情况相关联。

语言测试中的效度与信度

语言测试中的效度与信度

- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。

本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。

【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。

Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。

”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。

同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。

评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。

”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。

它是测试最基本的出发点。

“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。

”1.内容效度。

内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。

如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。

内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。

2.标准相关效度。

标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。

谈语言测试的信度与效度_赵成发

谈语言测试的信度与效度_赵成发

2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi'an F oreign Languages University M ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05 信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。

60年代,以La-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。

可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。

一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。

语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。

影响信度的因素很多,它们存在于语言测试的每个环节中。

对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。

这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。

第二,充分发挥连云港市的桥头堡作用。

我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。

上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。

陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。

连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。

连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。

进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。

语言测试的信度和效度

语言测试的信度和效度
试 法 和平 行 卷 测试 法 因施 考 两次 所 带 来 的 问题 . 只 需 一 份 试 卷 , 且 只 需 测 试 一 次 l。 是 同 一 份 试 卷 而 5但 】
有 变 化 . 管 施 考 多 少 次 . L , 各 次 的测 试 成 绩 不  ̄J<X 象 - . t
应 该 一 致 。 之 . 果 测 试 成 绩 忽 高 忽 低 就 说 明 该 测 反 如 试 的 信 度 不 高 。 此 可 见 。 试 要 成 为 有 效 的 测 量 手 由 测 段 . 度 是其 关键 因素 之一 。 信
教 学 中发挥 积极 的反 拨作 用 , 测 试 能否是 客 观 的 、 而 公 正 的 、甚 至 是 权 威 的 评 估 ,也 都 取 决 于 测 试 的 质
果 间 隔 时 间 太 长 .受 试 者 可 能 由于 学 习 导 致 语 言 水
平 变 化 . 而 造 成 两 次 测 试 成 绩 的 不 一 致 . 果 相 关 从 结
个 测 试 具 有 较 高 的 信 度 . 只 要 被 测 量 的 对 象 本 身 没
两 个 相 互 独 立 的 并 行 子 试 卷 .然 后 对 两 个 部 分 分 数 的 比 较 以 获 得 整 份 试 卷 的 信 度 . 通 过 这 种 方 法 得 到 的 相 关 系 数 就 叫 分 半 信 度 。 两 个 部 分 的 分 数 一 致 性 越 高 . 卷 的 信 度 也 就 越 高 。 种 方 法 避 免 了重 复 测 试 这
上 反 映 了 受 试 者 的 真 实 语 言 水 平 【。 言 之 . 果 一 ”换 如
问 题 .在 设 计 试 卷 时 我 们 无 法 确 信 两 套 试 卷 在 难 度 及 内 容 上 是 否 完 全 相 同 . 此 操 作 起 来 很 困 难 。 就 因 也
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。

其中, 以信度和效度最为重要。

一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。

即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。

信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。

同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。

影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。

试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。

与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。

2. 考试条件不一样。

同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。

3. 监考施策。

不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。

4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。

5. 保密工作做的不好, 泄题事件发生。

6. 评分。

主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。

7. 样品数量太小, 样本不足。

8. 身体及心理状态不好等等, 这些因素都会影响到信度。

因此, 为了提高信度, 我们必须对症下药, 采取各种措施。

例如:提供统一规范的考试环境、规范监考、题目必须做到明了易懂等等。

通常, 用来检测信度最常用的有三种方法:1. 考后复测法。

在考试后再让学生做同一套试卷, 如果几次考试的结果是一致的, 这份试卷就是有信度的。

但是在实际操作过程中, 学生在不断的学习提高, 而且记忆因素也会影响复测的结果,因此用这一方法很难检测考试的信度。

2. 平行测试法。

设计试卷时, 设计两份难度一样的试卷, 在不同的时间给学生做, 如果结果一致, 则有效。

但是, 在设计试卷时我们无法确信两套试卷在难度及内容上是否完全相同,因此操作起来很困难。

这种方法常用在补考试题的设计中。

3. 分半法。

设计一套试题让学生做, 然后把结果分为奇数和偶数题进行分析评判, 并算出它们之间的相关性。

二、语言测试的效度效度, 即有效性, 是指试题是否考了出题者想考的内容或多大程度上考了出题者想考的内容。

效度是语言测试的最重要的一个指标, 或者说是语言测试的基本出发点, 效度不高的测试是没有意义的。

效度可分为以下五种:1. 表面效度。

表面效度就是说, 一套试卷看起来是否合适, 像不像一套试卷。

具有表面效度的测试容易引起人的兴趣。

Alan Davies 曾说, 表面信度是可以达到的, 但却不是必要的, 表面的但却又是有用的。

他可以让别人相信试卷是有效的。

2. 内容效度。

内容效度是指是否符合大纲的要求, 是否与测试目的有关。

例如:老师教了一个学期想看看学生对于所教内容掌握得如何, 但是在选题时, 所出的题目与学生学的内容无关, 则这套试卷没内容效度。

在有内容效度的测试中考查的语言要素和技能都能有所体现。

成绩测试和诊断测试尤其要注意符合教学内容。

3. 同期效度。

同期效度就是一次测试的结果与另一次时间相近的有效测试的结果相比较,或同教师对学生的评估相比较而得出的系数。

4. 预测效度。

它是指试卷结果是否, 或者在多大程度上可以预测将来的考试成绩。

5. 结构效度。

即从理论上说, 试卷的各个部分是否出的有道理。

结构效度测试是说一套测试要以一定的语言学习理论为依据。

Alan Davies 在论述语言测试的信度时说,信度的种类与运用有关。

例如:成绩考试既要表面效度又要内容效度; 能力测试要有表面效度、结构效度和内容效度特别依靠内容效度; 水平测试必须要有表面效度、预测效度和同期效度。

语言测试的种类不同, 对各种效度的要求也就不同。

语言潜能测试多基于某种语言行为理论和语言学习理论, 因此重视编制效度。

水平测试强调共时效度和预示效度。

成绩测试和诊断测试要受教学大纲的限制, 因此首先要看内容效度。

提高效度的常用方法有:明确考试的目的、决定与目的相反的考试内容、决定考试的方法以及增加考试的信度四种。

三、信度和效度的关系通常, 我们把信度和效度看成是不同的, 但是却在测试中两者又是具有相互联系的特征。

尽管效度是最重要的特征, 但是信度却是效度必不可少的条件。

但在涉及到测试的方法时, 两者的差异就变的模糊了。

Campbell , Lyle F. Bachman 和 Fiske 都曾对信度和效度的关系做过经典的论述。

Lyle F. Bachman 认为:在研究影响分数的因素时, 信度和效度是互为补充的两个方面。

信度回答的是引起考试结果不一致的原因有多少是由测量误差所引起的; 然而, 效度则是找出考试结果中那些导致有效的不一致的因素, 即考试结果有多少是由考生的某种特殊语言能力的程度而引起的。

因此, 我们可以说信度是考查考试结果哪些是由想考的内容以外的因素引起的, 效度则是看考试结果的差异哪些是由语言能力所引起的。

信度和效度有密切的联系, 但它们的关系是单方面的。

效度是信度的前提, 但有信度的试卷可能是高效度的, 也可能是效度较低的, 即效度较高不能保证信度也一定较高。

一项测试有信度 , 它的效度有可能高 , 也有可能低; 但是如果一项测试没有信度, 则这次测试必然是无效的。

信度差效度就差, 但效度差不一定信度就差。

信度是效度必不可少的条件, 试卷如果没有信度根本不可能对测试进行(下转第 214页语言测试的信度和效度及其关系曹桂花(孝感学院外国语学院湖北孝感 432000【摘要】语言测试是对语言教学的评价。

通过对语言知识或语言技能及语言能力的测试, 老师可以了解教学效果, 了解到学生对知识的掌握程度, 看到他们的进步与不足, 有利于教学的调整。

要达到这个目的, 就必须有好的试卷, 我们一般从信度、效度、区分度、实用性、全面性、公正性及后期效应来对试卷进行评价。

本文讨论了其中极其重要的两个标准信度和效度以及它们之间的关系。

【关键词】语言测试; 信度; 效度The relationship between validity and reliability of language testingCao Gui-hua(school of foreign language, Xiaogan University【 Abstract 】 Language testing is a way to value the language teaching. From language testing, the teachers can know whether the students master what they have taught, the students ’ weaknesses and strengths and improvement, which is helpful to the language teaching. To achieve this purpose a well-designed paper is needed. Usually, we think good qualities of good test include:validity, reliability, discrimination, practicality, and backwash effect. This paper is mainly validity and reliability and the relationship of these two.【 Key words 】 language testing ; validity ; and reliability○ 高校讲坛○182科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION(上接第 182页有效的解释。

例如:我们希望对学生进行一次期中测试, 检查一下学生半学期以来对所学知识的掌握程度。

假如试卷本身设计得不合理, 有些题目好学生不会做而基础较差的学生却做得出来, 或者由于外界的条件较差, 非常吵闹, 气温很高, 或者评卷人的主观评卷等, 都会影响测试的信度, 那么的测试结果就根本达不到检测学生的目的, 因为评判的条件没有达到, 此次测试就是无效的了, 也无从判断试卷本身的效度。

只有我们确信测试是有效的了之后, 对效度做出判断才是有意义的。

在确信了测试是有效的之后, 我们才可能从内容、结构共时、预测和表面等几个方面来判断测试是否达到了考试的目的,即是否考了想考内容。

又如, 我们想了解学生的写作能力, 可是给他们考的题型却是多项选择题、听力和阅读, 根本没有设计写作的题型。

这样的考试虽然是有效的, 但却偏离了考试的初衷, 因此不能很好的检测学生的写作能力, 因此此次考试无效的。

反之, 我们确信试卷的效度很低, 即没考想考的内容, 那么我们说其信度可能高也可能低, 因为影响信度的因素主要是我们上文提到, 与效度没有多大关系。

需要指出的是, 高效度和高信度是测试者的目标, 但是这只是一种理想, 一项测试既有高信度, 又有高效度是不可能的。

四、结论语言测试的信度及效率问题一直是语言测试专家关注的问题, 也是教师所关心的。

了解了测试中的信度和效度这两个最重要的标准及其关系后, 试卷的设计者在设计试卷时一定要注意试题的本身的科学性, 紧扣考试的目的; 而监考者在测试的过程中也应尽量减少来自于外界的影响测试的效度和信度的因素,以期测试能更好的服务于教学。

【参考文献】[1]李筱菊 . 语言测试科学与艺术 [M]. 湖南教育出版社 ,1997.[2]刘润清, 韩宝成 . 语言测试和它的方法 [M]. 外研社 ,2000.[3]Davies, Alan. 1990. Principles of Language Testing . Oxford:Basil Blackwell.[4]Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing . Oxford University Press.[5]Bachman, L. F. &Adrian S. Palmer . 1996. Language Testing in Practice. Oxford University Press.作者简介:曹桂花(1979— , 女, 湖北荆州人, 孝感学院外国语学院讲师, 英语语言文学硕士。

相关文档
最新文档