浅析语言测试中信度与效度两者之间的关系
浅谈语言测试的信度与效度

二、信度与效度的相互关系
语言测试以语言能力为测量目标,而语言能力是抽象的,是通过具体的语言行为体现出来的,所以难以直接测量。另外任何测试都不必要,更不可能测量所有的语言行为,因此语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力。语言测试涉及两方面的内容:首先作为一种测
量工具,它必须保证测量结果的可靠性,也就是信度要求。显而易见,用一把本身具有很大伸缩性的尺子来测量物体的长度,其结果必然不可信;同时,语言测试以语言能力为测量目标,它的内容和形式与语言能力应有最大的相关性,亦即效度要求。语言测试的信度说明考试结果与语言行为的关系,语言测试的效度反映所测试的语言行为与语言能力的关系。没有信度意味着测试结果不可信,不是受试
者语言行为的真实反映,我们就难以藉此测量任何东西。没有效度只有信度的测试也毫无意义,因为它准确地测量了与语言能力不太相关或毫不相关的东西。在此情况下,我们同样无法从考试结果中推测受试者真正的语言能力。要实现一个语言测试的目的,信度与效度缺一不可,这是二者关系的统一性一面。另一方面矛盾和对立构成了二者关系的主要特征。
如何区分信度与效度之间的关系

如何区分信度与效度之间的关系
信度与效度两者间的关系是历年来的重要考点也是同学们做题时候的难点,常以单选、填空和简答来考察大家,理解性去做题就比较容易得分,今天中就来为大家解读一下这部分知识点。
1、信度
信度是表明评价工具质量的又一重要指标,主要指测验结果的前后一致性程度。
2、效度
效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。
效度是对测量的准确性程度的估计,而信度则是对测量的一致性或可靠性程度的估计。
研究表明,效度和信度是交叠的,即有时一个测量工具对于某一个目的具有一定的信度,但并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。
这正如拿一把米尺去量身高是有效的,也是可信的。
他们两者之间的关系是信度高效度不一定高、效度高信度高、信度低效度一定低、效度低信度不一定低。
那么我们如何有效的去记忆他们呢?老师教大家一个秘诀。
效度达到最高点的时候,必然超越了信度,因此效度高信度一定高。
而信度达到最高点的时候,效度不一定达到了,因此信度高效度
不一定高。
反过来,效度低的时候,信度可能超越了最高点,因此效度低信度不一定低。
而信度低必然就达不到效度的最高点,因此信度低效度一定低。
通过图形分析同学们就能快速回忆起这部分知识点,进行答题,希望同学们看完以上讲解,能顺利掌握这部分知识点。
谈语言测试的信度与效度

2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi an F oreign Languages U niversityM ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。
60年代,以L a-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。
可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。
一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。
语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。
影响信度的因素很多,它们存在于语言测试的每个环节中。
对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。
这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。
第二,充分发挥连云港市的桥头堡作用。
我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。
上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。
陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。
连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。
连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。
进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。
语言测试的信度效度

测 试效 度是 指语 言测 试 的真 实 性 和 准确 性 ,也 就 是 此 测 验
与 旨在测量的 目的相 符合 一致 的程度 。也 就是说 该测试是否有
效 度 在 于 它 是 否 真 实 地测 试 出它 想 要 考 察 的 内 容 。如 果 测 试 和
四、 结 语
效度和信度的测试 是评定语 言测试 中必不可少 的两个重 要 指标 , 它反 映的是语言测试 的本质性 问题 , 对评定是 否达 到预期 理 的平衡 , 相 互补充 , 才能保证考 试的可靠性 和准确性 , 从 而达 到测试 目的, 提高测试 质量 。 参考文献 :
一
、
信 度
( 一) 什 么是 信 度
面 的发挥 ; 6 ) 测试选项 不合理 : 如 多想选择 里 , 正确答 案很容 易 被 考 生 以 某 种技 巧识 别 。
信度是指测试结 果的可信程度 , 是衡量测验稳定性 , 可靠性 的重要指标 。语言测试 信度主要 衡量语 言测试结果对语言受试
所有对测试准确性和真实性构成偏差 的因素都对效度有影
受试 者 语 言 能 力 所 引 起 。
语言测试 的每个环节都不可避免 的会受到一些偶然 因素的 影响, 这些 偶然 因素必然 会对测试 的信度 有影响 , 影响越 大 , 信 度就越低 。 因此在组织与实施 测试 过程 中 , 对全部的受试者都应 该保 持环 境与条件 的一致 , 以取得 比较 高的信度 ; 在测试 的评 分 环节中 ,同一项测 试的评分标准 应该客 观 ,必须保 持一致且稳 定, 这样 才能保证取得较高信度 ; 另外评分 者同样是影响语言测 试信度 的重要因素 ,因为评 分者会将 自己的主观意愿移植到评
受试者 的真实语言水平如果保持一致 , 则此考试 的信 度最 大 , 反
浅析外语口语测试的信度与效度

一一一一一一一考试英语本栏目责任编辑:唐一东浅析外语口语测试的信度与效度李燕(桂林理工大学外国语学院,广西桂林541006)摘要:作为语言五大技能之一,口语对于外语学习的重要性不言而喻,外语口语测试是衡量语言技能高低的重要手段。
结合当前外语口语测试存在的问题,从信度、效度在测试各阶段的表现出发,对二者关系进行研究,有利于为今后外语口语测试提供借鉴,保证测试的结果的真实性。
关键词:口语测试;信度;效度中图分类号:H09文献标识码:A文章编号:1009-5039(2016)20-0053-02外语技能的衡量标准主要体现在听、说、读、写、译五个方面,“说”(口语)作为其衡量指标之一,在整个外语学习过程中占重要地位,口语测试则是衡量该指标的手段之一。
随着经济全球化进程的加快,对外语口语的人才的需求也呈逐渐上升趋势,外语口语测试成绩的真实性也得到愈来愈多人的关注,如何保证口试信度与效度的平衡,是当前口语测试的重要问题。
1信度与效度信度与效度在语言测试中是两个重要概念,是衡量语言测试质量的重要依据。
1.1信度李筱菊(2001)提出测试的信度,指它的结果分数对受试者的表现而言的可靠程度。
换言之,信度指的是测试结果的可靠性和稳定性,有信度的试题在任何时间地点环境下进行测试,结果都是一致的;然而,测试的绝对一致性是难以达到的,我们能做到的只能是达到相对的一致性。
对考试信度的验证,有一系列的方法,较常见的有考后复考法、试题分半法、平行试题法。
相比于这三种间断性使用的考试信度验证方法,更为重要的是经常性验证方法,即对每场测试结果都进行分析研究汇总,并公布数据,从而提高测试信度。
1.2效度衡量考试的另一个标准是考试效度。
所谓效度是指“成功地实现测试目的程度”(Clark,1979:35~49)。
李筱菊(2001)提出“效”不是效率的效,效度指是否站得住脚、是否能成立的意思。
而语言测试的效度,亦称有效性,指测试所考的,是否就是所要考的,或者说,在多大程度上,是为了目的所要考的。
语言测试中的效度与信度

- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
信度和效度的关系和区别 公式

信度和效度的关系和区别公式
信度和效度是评估研究或测量工具的两个重要指标。
信度指的是测量工具的稳定性和一致性,即重复使用同一工具是否能得到相似的结果。
效度则是指测量工具是否能够真实地衡量所需测量的概念或变量。
信度和效度之间的关系可以用以下公式进行描述:
效度 = 信度× 相关性
其中,相关性表示测量工具与所需测量的概念之间的相关程度。
具体来说,信度是通过测量工具的重复性或一致性来评估的。
例如,如果一个问卷调查在不同时间或不同样本中得到的结果是一致的,那么就可以说该问卷具有较高的信度。
信度可以通过计算相关系数、内部一致性系数等进行评估。
效度则是评估测量工具是否能够准确地衡量所需测量的概念或变量。
例如,如果一个心理测量工具能够准确地衡量一个人的抑郁程度,那么就可以说该测量工具具有较高的效度。
效度可以通过与其他已经被广泛接受的测量工具进行比较,或通过专家评估等方法进行评估。
总结起来,信度和效度是评估测量工具质量的两个重要指标。
信度评估的是测量工具的稳定性和一致性,而效度评估的是测量工具是
否能够准确地衡量所需测量的概念或变量。
这两个指标在评估研究结果的可靠性和有效性时都非常重要。
论语言测试中的信度与效度

出 了以下几 点要 求 , 即在 设 计 测试 内容 时要 充 分 考 虑 题 目是 否适合 每 一 位 受试 者 的经 验 或 水 平 ; 就 测 试 内容本 身来 说 , 是 否存 在选 择项 表述模 糊 、 过难 或 偏 易 的 问题 等 。诸 如此类 客 观存 在 的人 为 因素都 会 影 响 考试 效度 本身 的有 效性 _ 6 J 。
二、 信 度
( 一) 概 念及 测量 方法
一
致化 , 使 之更 容 易让 受 试 者接 受 并 真 正 理 解题 目的 要求 ; 对 于 那 些 模 棱 两 可 的 选 项 也 要 尽 量 避 免 出 现 J 。此外 , 考生 在考 试 前 应充 分 熟 悉 考 试题 型并 训 练相 应应 对技 巧 , 使 之 表 现 能 达 到 预期 效 果 。 更
一
效度 。表面效度 , 就是指测试表面上 的可信程度 , 特 点是 会对 受试 者 的 回应有 一定 的影 响作 用 。如果 一 项测试表面上不可信 , 就很难吸引受试者 的注意力 ,
更 不 用说 用积 极 的心 态 应 试 , 这 样 得 到 的测 试 效 度
必 将 大打 折扣 。内容 效 度 , 通 常评 估 的是 与 所 测 试 项 目相关 的领 域 , 包 括 测试 的 内容 、 主题 以及评 分 标 准等 。一项 测 试 的 内容 效 度 越 高 , 结 果 就 越会 接 近 最 初 的测试 目标 。结构 效度 中的结构 指 的是语 言 能 力 理论 中假 设 的 基 础 能 力 或 特 征 J 。如 果 一 种 考 试 表 明能够 测 试某 个 能 力 结 构 , 比如 阅读 能力 或 写 作 能力 , 它 就具 有 结 构 效 度 J 。尺 度 关 联 效 度 主要
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
信度和效度是语言测试中的两个最重要的方面,两者之间既相互依存又相互对立,可以说二者是存在于对立统一的一个整体中。
语言测试是以语言能力为测量目标的,而语言能力又是抽象的,是通过具体的语言行为体现出来的,很难直接测量,因此在语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力,在语言测试中效度反映所测试的语言行为和语言能力之间的关系,信度则是说明考试结果与语言行为的关系,没有信度只有效度的语言测试并不能真实反映应试者的语言能力,没有效度只有信度的语言测试也是毫无意义的,由此可见,信度和效度不仅在语言测试中扮演着重要的角色,而且二者之间的关系也是相互依存,密不可分的。
信度与效度在语言测试中二者是缺一不可的,这是两者之间的统一性。
但是另一方面,信度与效度在一定程度上又是相互对立,相互矛盾的,两者具有相互排斥的作用。
首先是量和质之间的矛盾,量的测量容易保持高信度,但是语言测试要实现效度,这就要求质的测量,量的测量要求测量对象必须是可数的,而我们所测量的语言不仅是语言形式结构的运用,而且还包括不可数不可见的语言运用能力,因此从本质上来讲,信度与效度之间就是对立的,矛盾的。
如果语言测试偏重信度,那么测试就可以设置为定量型,但忽略了效度;反之测试设置为定性型,那么就忽视了效度。
其次是有限的语法和无线运用之间的矛盾,一种语言的语法总是有限的,如果将它作为语言测试的目的,很容易保证语言测试的信度,但是语言测试又不能仅仅测试语言的语法,也要测试运用语言的能力,语言运用的能力又是不可见不可数的,将其作为语言测试的目标能力就很难去把握信度,因此这就是信度与效度的又一大矛盾。
最后是抽象的行为和具体的行为之间的矛盾,行为是目标能力的表征,如果把言语行为置身于没有真实语境的情况下,这种行为便是抽象的,语法规则越抽象,其概括性就越强,概括性强,抽样的外推性就越强,那么测试的可信度就高;反之,如果把言语行为置身于真实语境的情况下,那么这种行为就是具体的,行为越具体,作为抽样的外推行就越欠缺,那么信度自然也就不高,但是语言的测试的效度就会相应高很多。
关于语言测试中信度与效度之间的矛盾并不是只有这三点,应该有很多矛盾,如两分判断和连续判断的矛盾,分割法和整体法的矛盾,单维观和多维观的矛盾等等,但在论文中只参考课本罗列了三种说明论点即可。
语言测试中信度和效度存在着多方面的矛盾,在语言测试中应该如何正确处理两者之间的矛盾便成了需要解决的问题,查询资料后发现现在有四种不同的处理方式,分别是保证高效度,忽略信度;保证高信度,忽略效度;消极妥协和积极平衡,用信度高的形式测试效度高的内容,但是在这四种处理方式中都存在不同程度的问题,在目前的语言测试中采用的最多的方式是积极平衡,从而在科学的发展中不断在积极探索新的方法去完善语言测试中的不足。
在信度和效度难以
兼得的情况下,我觉得语言测试应首先考虑效度要求,然后在此基础上再追求信度的提高。
参考文献:
齐沪杨,陈昌来主编的《应用语言学纲要》
外语教学与研究出版社《语言测试的设计与评估》
上海外语教育出版社《语言测试要略》
温俭,杨华《论语言测试的效度与信度》。