浅谈语言测试的信度与效度
谈语言测试的信度与效度

2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi an F oreign Languages U niversityM ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。
60年代,以L a-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。
可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。
一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。
语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。
影响信度的因素很多,它们存在于语言测试的每个环节中。
对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。
这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。
第二,充分发挥连云港市的桥头堡作用。
我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。
上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。
陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。
连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。
连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。
进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。
浅析语言测试中信度与效度两者之间的关系

浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
现代语言测试的信度和效度的分析

( 江 阴职业技 术学 院 外 语 系 , 江苏 江 阴 2 1 4 4 0 5 )
摘 要: 信度和效度是语言测试的两个极其重要的评价标准。信度指的是考试结果的可靠性 , 效度 是 指考试 达 到预 定 目的的程度 。从 宏观 角度进 行分 析 , 并对 现代 语 言 测试 中效度 和 信度 的取 向进
Ab s t r a c t : Re l i a b i l i t y a n d v a l i d i t y a r e t wo i mp o r t a n t c it r e r i a f o r e v a l u a t i o n i n l a n g u a g e t e s t i n g . Re l i a b i l i t y me a n s t h e q u a l i t y
此, 近些 年来 , 语 言测试 的信 度与效 度受 到 了广 大 国
内外语言学者 的关注。作为外语教学工作者 , 要想
了解学 生对所 学 知识 的掌 握 程度 , 主要 通 过 定期 的 测 试 的方式来 进行 。而有效 的测试 对教 师才有 真正 的指导 作用 。如何 验 证 是 否 是 有 用 而 有效 的测 试 , 那 就需 要综合 考查 它 的效度 , 信度 , 真实性 , 互 动性 , 考 试 的冲击 力和 可行性 。而语 言测 试 的标 准其 中最 重 要 的是考虑 测试 的信 度和效 度 。
一
、
语 言测试 效度 和信度 的概 念及 分类
测 试效度 是指 测试 是否考 查 了原定需 要考 查 的
度上与一些外在标 准相关 , 故又称标准参照效度 。 简 单地说 就是 考试结 果能 够在某 种程 度上 预测学 生
语言测试中的效度与信度

- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
语言测试的信度和效度

有 变 化 . 管 施 考 多 少 次 . L , 各 次 的测 试 成 绩 不  ̄J<X 象 - . t
应 该 一 致 。 之 . 果 测 试 成 绩 忽 高 忽 低 就 说 明 该 测 反 如 试 的 信 度 不 高 。 此 可 见 。 试 要 成 为 有 效 的 测 量 手 由 测 段 . 度 是其 关键 因素 之一 。 信
教 学 中发挥 积极 的反 拨作 用 , 测 试 能否是 客 观 的 、 而 公 正 的 、甚 至 是 权 威 的 评 估 ,也 都 取 决 于 测 试 的 质
果 间 隔 时 间 太 长 .受 试 者 可 能 由于 学 习 导 致 语 言 水
平 变 化 . 而 造 成 两 次 测 试 成 绩 的 不 一 致 . 果 相 关 从 结
个 测 试 具 有 较 高 的 信 度 . 只 要 被 测 量 的 对 象 本 身 没
两 个 相 互 独 立 的 并 行 子 试 卷 .然 后 对 两 个 部 分 分 数 的 比 较 以 获 得 整 份 试 卷 的 信 度 . 通 过 这 种 方 法 得 到 的 相 关 系 数 就 叫 分 半 信 度 。 两 个 部 分 的 分 数 一 致 性 越 高 . 卷 的 信 度 也 就 越 高 。 种 方 法 避 免 了重 复 测 试 这
上 反 映 了 受 试 者 的 真 实 语 言 水 平 【。 言 之 . 果 一 ”换 如
问 题 .在 设 计 试 卷 时 我 们 无 法 确 信 两 套 试 卷 在 难 度 及 内 容 上 是 否 完 全 相 同 . 此 操 作 起 来 很 困 难 。 就 因 也
论语言测试中的信度与效度

出 了以下几 点要 求 , 即在 设 计 测试 内容 时要 充 分 考 虑 题 目是 否适合 每 一 位 受试 者 的经 验 或 水 平 ; 就 测 试 内容本 身来 说 , 是 否存 在选 择项 表述模 糊 、 过难 或 偏 易 的 问题 等 。诸 如此类 客 观存 在 的人 为 因素都 会 影 响 考试 效度 本身 的有 效性 _ 6 J 。
二、 信 度
( 一) 概 念及 测量 方法
一
致化 , 使 之更 容 易让 受 试 者接 受 并 真 正 理 解题 目的 要求 ; 对 于 那 些 模 棱 两 可 的 选 项 也 要 尽 量 避 免 出 现 J 。此外 , 考生 在考 试 前 应充 分 熟 悉 考 试题 型并 训 练相 应应 对技 巧 , 使 之 表 现 能 达 到 预期 效 果 。 更
一
效度 。表面效度 , 就是指测试表面上 的可信程度 , 特 点是 会对 受试 者 的 回应有 一定 的影 响作 用 。如果 一 项测试表面上不可信 , 就很难吸引受试者 的注意力 ,
更 不 用说 用积 极 的心 态 应 试 , 这 样 得 到 的测 试 效 度
必 将 大打 折扣 。内容 效 度 , 通 常评 估 的是 与 所 测 试 项 目相关 的领 域 , 包 括 测试 的 内容 、 主题 以及评 分 标 准等 。一项 测 试 的 内容 效 度 越 高 , 结 果 就 越会 接 近 最 初 的测试 目标 。结构 效度 中的结构 指 的是语 言 能 力 理论 中假 设 的 基 础 能 力 或 特 征 J 。如 果 一 种 考 试 表 明能够 测 试某 个 能 力 结 构 , 比如 阅读 能力 或 写 作 能力 , 它 就具 有 结 构 效 度 J 。尺 度 关 联 效 度 主要
浅谈语言测试中的效度问题

英 语 教学 大 纲 》 规定 的 教 学 目标 考 核 修完 大 学 英 语
。
以
。
大 学 英语 课 程 的 教
,
经 验 效 度 是指 语 言测 试 的 结 果 与对 应 试者 语 言 能 力 的 评估 在 多 大程 度 上相 一 致 为两 种 一 种 是共 时效 度
种 是 预 示 效度
,
学 目的 是 培 养 学 生 具 有 较 强 的 阅 读 能 力 和 一 定 的 听 说 写 译能 力 使学 生 能 以 英语 为 工 具 获 取 专 业 所 需 信 息 并 为 进一 步 提 高英 语水 平 打 下 较好 的
。
信度 但这 只 是 个 理想 化 的 目 标 因 为做 到这 一 点
往往 是不 可 能 的
。
在 编制试 题时 既 不 能为 了追 求
,
水平 测 试用来 衡量 学生 的 语 言 能 力 即 看学 生
是 否 达 到 某 一 水 平 从 而 决定其 是 否 能胜 任 某 一 任
,
,
信度 而忽 视 效 度 也 不 能 为 了 追 求 效 度 而 放 弃 信
学 习 语 言的 潜 力
度
。 。
高 的 信度 但 它却 能够考 查学生 实际 应 用 语 言的 能
力 具 有 较高 的 效 度
, 。
语 言潜 能 测 试 以 某种 语 言 行 为
,
因 此 一 套好 的 试题 应 包 括
, 。
,
理 论和 学 习 理 论 为 依 据 因 此 首 先 要 考 虑 编 制 效
,
标准
容
。
。
效 度 指测 试 是否 考查 了设 计 者想 要 考查 的
,
浅论语言测试的效度

浅论语言测试的效度[摘要] 信度与效度是语言测试两大基本要求,信度与效度的关系问题是语言测试的根本问题。
考试的效度指的是考试在多大程度上测出预期要测量的东西,信度指的是考试结果的可靠性。
本文重点介绍了效度的含义,对效度的测量方法以及效度与信度的关系等问题做了详细的阐述。
[关键词] 语言测试效度信度[Abstract] As a branch of applied linguistics, language testing has developed into a relative independent subject. Validity and reliability is the most important two criteria of language testing and the relationship of both is the ultimate issue. This article makes comments on the two criteria in detail. Validity is concerned with if a test measures accurately what it is intended to measure. Reliability means the quality of being reliable on consistency. This article puts emhasis on validity and also explains the testing methods of validity as well as the relation between validity and reliability.[Key words] Language testing validity reliability一、引言语言测试学作为应用语言学的一个分支,现已发展成一个相对独立的学科。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、信度与效度的相互关系
语言测试以语言能力为测量目标,而语言能力是抽象的,是通过具体的语言行为体现出来的,所以难以直接测量。另外任何测试都不必要,更不可能测量所有的语言行为,因此语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力。语言测试涉及两方面的内容:首先作为一种测
量工具,它必须保证测量结果的可靠性,也就是信度要求。显而易见,用一把本身具有很大伸缩性的尺子来测量物体的长度,其结果必然不可信;同时,语言测试以语言能力为测量目标,它的内容和形式与语言能力应有最大的相关性,亦即效度要求。语言测试的信度说明考试结果与语言行为的关系,语言测试的效度反映所测试的语言行为与语言能力的关系。没有信度意味着测试结果不可信,不是受试
者语言行为的真实反映,我们就难以藉此测量任何东西。没有效度只有信度的测试也毫无意义,因为它准确地测量了与语言能力不太相关或毫不相关的东西。在此情况下,我们同样无法从考试结果中推测受试者真正的语言能力。要实现一个语言测试的目的,信度与效度缺一不可,这是二者关系的统一性一面。另一方面矛盾和对立构成了二者关系的主要特征。
・2009年第1
期・
5
陈静
浅谈语言测试的信度与效度
收稿日期:2008-09-24作者简介:陈静(1981-),女,吉林华桥外国语学院科研处,讲师,长春130117
[摘
要]本文通过测试的信度与效度的对比分析,结合其发展过程分析了信度与效度的相互关系对语言测试及语
言教学的影响。正确、科学的现代语言测试的取向应该是效度重于信度。提高测试的效度可以提高语言测试的正面反拨作用,即促进语言教学的质量。
效度使语言测试注重语言的整体性、艺术性,所以题目要多样化,内容和形式尽量接近语言运用的实际。信度要求则使语言测试强调语言的科学性,将语言进行分割处理,注重测试题目的同质性,使语言测试的内容与形式脱离语言运用的实际。因此,任何测试,任何测试题型都难以兼有极高的信度和极高的效度。
以离散型测试为主要特征的结构主义语言测试能保证高信度;而强调以真实的语言为测试内容的交际测试能保证高效度。三、语言测试的效度应重于信度
测试理论经过了科学前语言测试时期、心理测量——结构主义语言测试时期、社会语言测试阶段,发展到现代的交际语言测试时期,人们逐步意识到语言的使用过程是一个动态的互动过程,从而
使外语教学的重点转移到培养语言交际能力上,与之相应的测试则是要求学习者借助所学的语言完成现实生活或类似的活动或任务,
旨在考察其对语
・2009年第1
期・
7
浅谈语言测试的信度与效度
言的实际运用。因此,语言交际功能的培养是语言教学的首要目标,同时衡量语言交际能力也成为,即一个语言测试效度的高低不仅在于它是否考了它要考的,还在于它考的是什么。测试的内容和形式越接近实际使用中的语言就越有效度。
语言测试的信度是指测试结果的可靠程度。
浅谈语言测试的信度与效度
吉林华桥外国语学院学报
6
即当被测试对象发生变化,用同样的“尺子”去重复测量时,总是获得类似的结果。影响信度的因素很多,它们存在于语言测试的每个环节中,就试卷本身来说主要是样本的大小和区分度等。取样大,样
本具有广泛性,测试的信度就高,反之信度就低。另外试题太难或太易,考试分数集中于某一点或某一区域测试也失去信度。在测试的组织、实施这个环节中,一方面考试的环境和条件要对考试有利。另一方面考试的环境和条件对所有的受试者是否一致也影响到考试的信度。在测试评分的环节上,评分标准是否一致对信度影响很大,尤其是主观题的评分很难能达到很高的标准。
[关键词]语言测试;信度;效度[中图分类号]H087[文献标识码]A [文章编号](2009 01-0005-04
语言测试学,作为应用语言学的一个分支,现已发展成一个相对独立的学科。作为对语言教学进行测量和评估的一个重要手段,语言测试愈来愈受到广大外语教学工作者的重视。Bachman (2004:54曾说:“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。”通过测试可以检查学生对知识的掌握情况和教学中存在的问题,对今后的教学提供指导和帮助;同时,通过测试可以衡量教学任务和教学大纲的执行情况。不科学的测试不仅不能起指挥棒的作用,有时反而会误导教学,将学生和教师引向歧途。因此我们主张的是科学的,符合教育原理的测试,这样的测试会对教学产生积极
的反拨作用。一套设计比较科学的测试,一般认为应该有四点特征,即效度,信度,实用性和良好的反拨作用。其中信度与效度是后两者的基础,是语言测试的永恒主题,信度与效度孰重孰轻,也是现代语言测试学家一直争论不休的话题。本篇论文通过测试信度与效度的研究,旨在帮助教师设计合理的测试,并在测试后对试题总结、归纳,以加大测试力度,提高测试效果。一、信度与效度的概念
科学、公正的测试具有较高的信度和效度。测试的信度越高,就越能客观、准确地反映受试者的语言能力;而测试的效度越高,就越能有效地反映被测试者的语言运用和交际能力。但二者之间存在固有的矛盾。信度要求使测试强调语言的科学性,即将语言分割处理,趋向于测试题目的同质性,往往导致测试在内容和形式上脱离真实的语境;效度要求使测试偏重于语言的艺术性、整体性,题目趋向多样性,测试在内容和形式上紧密联系实际。这就决定了同时具有高信度和高效度的语言测试是不存在的。