论英语语言测试的信度和效度
英语师范生语音水平测试信度和效度验证

Vo 1 . 2 9
第 5期
J OU RNAL OF C HE NGD U NORMAL UN I VE RS I T Y
成都师范学院学 报
2 0 1 3年 5月 Ma y2 ’ 0 1 j 。
.
英语 师 范 生语 音水 平测试 信 度 和效 度 验证 8 1 一) , 女, 广 东河源人 , 讲师 , 硕 士, 研究方向: 语言教学研 究; 沈
1 0 2
晓( 1 9 6 7 一) , 女, 广 东汕头人 , 副教授 , 硕士 , 研 究方 向: 语言教 学研究。
第2 9卷 ( 总第 2 4 3期 )
曾密群 , 沈
晓: 英语师范生语音水平测试信度和效度验证
语 音水 平测试 成 绩 作 为研 究 对 象 , 检 验 这项 测 试 的 信 度 和效度 。
( 一 )信 度 验证
出推 断 的合适 性 、 有意 义 性 和 有用 性 。 _ l 4 简言 之 , 即 看它是 否能 够准确 地测 出想 测 的。效度 的高低 是衡
( 广东 外语 艺术职业 学院 外语 系, 广州 5 1 0 5 0 7 ) 摘 要: 衡量语言测试的关键是看它的信度和效度 。原 有英语师 范生语音测试信度 、 效度较低 , 为此 , 笔者提
倡 引进数 字平 台, 建立更加规 范的英语 师范生语 音水平标准参照性考试体 系, 并通过该测试施 测的数据 , 分析 和验
反拨 作用 不强 , 根据语 言测试 理论 和发展 潮流 , 将 数
目前 英语 师范生语 音测试 信度 、 效度较 低 , 正面
收 稿 日期 : 2 0 1 3 - 0 3 — 1 2
基金项 目: 2 0 1 1年广东省 高等职业技术教育研 究会课题( 粤 高职研[ 2 0 l 1 ] 1 0号)
英语测试中的效度、信度和真实性

【 摘要 】 英语考试种类繁 多, 有 国家四六级 , A B级 , 还有面向社会 的 P E T S考试 出国试 命 题 的 角度 出发 , 分 析 一份 试 卷 的 效 度 、 信 度 和 真 实性 , 对 一 线 的教 学工 作 者 而 言 知 道 如 何 确 定 试 卷 的质 量 , 在 以后 的 教 学 中会 有很 重要 的应 用 价值 。
一
它指 的是 考 生 在 完 成 某一 测 试 任务 时 . 其语 言 能 力 的哪 些 方 面 参 与 了完成 该 测 试 任 务 的 活 动 . 参 与 的 程 度 如何 . 与 情 景 真 实性 真 实性 不 同 . 交 际真 实性 强 调 的 是 考 生 与 测试 任 务 之 间
无 所 知 的 学 生 而言根 本测 不 出他 们 的 写作 能 力 。所 以 . 这 个 的 交 际 关 系 。 题 目对后 者 而言 效 度很 低 . 因 为我 们 要 测 的是 他 们 的写 作 能 力 4 . 3如 何 提 高 语 言 测试 交际 真 实性 而不 是摄 影 知 识 能 力 需要 指 出的是 . 语 言测 试 的 效度 是 一 个 般 来说 . 提 高测 试 的 情 景 真 实性要 容 易些 . 而提 高 交 际 相 对 概 念 例 如 . 把 剑桥 商务 英 语 证 书 考 试 来 测试 非 英 语 专 业 的真 实性 要 难 些 B a c h e r ma n 提 出用 以提 高语 言 测 试 交 际 真 实 的 学生 英语 水平 效 度 就很 低 性 的 四 项 措施 H : 在 设 计 考题 时 可 以具 体 说 明考 生 只 有 使 用何 2 . 信 度 种 策略 才能 完 成任 务 提 供 机会 即给 考 生提 供 充足 的 时 间 、 必 信 度 是 指 考试 结 果 的 可 靠性 和 稳 定 性 . 它 通 常 以 两 次考 试 要 的信 息 和 _ T - 具 等 考试 任 务 要得 当 任务太难会影响考生的 结 果 相 关 系数 来 表 示 . 系数 越 高 , 信 度 也 就越 高 影 响信 度 的 因 策略 的 应 用 。考试 任 务 要 有 趣味 性 。 通 过 提 高考 试 的情 景 真 实 素很 多, 主要 有 外部 环 境 和 个 人 因素 , 同 时试 卷 的 量是 否足 够 性 可 以提 高 考试 任 务 的趣 味 性 大, 区分 度 是 否 高 , 难 易度 是 否适 中 , 评 分是 否客 观 等 因素 也 影 4 . 4编 写 试 题 的 真 实 性 原 则 响 着信 度 、 语 言 的测 试 目的 就是 为教 学服 务 的 . 要 考察 考 生在 实 际的 3 . 信 度 和 效 度 的关 系 环境 下使 用 语 言 的 能 力 . 所 以试 题 的 编 写要 遵 循 试 题 的真 实性 信 度 和 效度 是 衡 量 测 试质 量 最 重要 的 两个 指 标 . 他 们 之 间 原 则 例如 . 下 面 的例 子 中 : 是 相 互依 从 . 相 互排 斥 的 关 系 从 方 向 而言 它们 是 单 方 向 的 . 即 1 wo u l dt a k e a r t u mb r e l l awi t hme
高职高专英语A级测试试卷的信度与效度探讨

高职高专英语A级测试试卷的信度与效度探讨摘要:高职高专英语A级测试试卷是衡量学生英语水平的一种有效的评估工具,本文以心理统计学中的信度和效度概念为基础,对该测试试卷进行了探讨。
在信度方面,本文采用了内部一致性法和测试-重测法进行测量,结果表明该测试试卷具有较好的信度,可以满足测量结果的可靠性要求。
在效度方面,本文采用了内容效度和结构效度进行测量,结果表明该测试试卷具有较好的效度,可以满足测量结果的准确性和有效性要求。
最后,本文提出了进一步完善该测试试卷的建议和措施。
关键词:高职高专英语A级测试试卷;信度;效度;一致性法;测试-重测法;内容效度;结构效度。
IntroductionMethods1.Internal consistency method在内部一致性方法中,通过对测试试卷中不同题目的相互关系进行分析,以计算测试试卷的整体可靠性。
本文选取了该测试试卷中的20个不同题目,通过计算它们的平均分、标准差和相关系数,确定测试试卷的内部一致性。
结果表明该测试试卷的Cronbach's alpha系数为0.85,表明该测试试卷具有很好的内部一致性。
在测试-重测法中,采用同样的测试试卷对同一群体进行两次测试,并通过比较两次测试结果来确定测试试卷的可重复性。
本文选取了60名学生进行两次测试,并用Pearson 相关系数计算两次测试分数之间的相关性。
结果表明测试-重测法的相关系数为0.79,表明该测试试卷具有良好的可重复性。
内容效度法是评估测试试卷内容是否与被测量对象的特征相关。
该方法通过领域专家的意见和建议,对测试试卷中各项问题的有效性进行评估。
本文选择了10名领域专家进行评估,他们认为该测试试卷中的题目和内容与被测群体的英语能力和水平密切相关,因此该测试试卷具有较好的内容效度。
4.Structural validity method结构效度法用于评估测试试卷的组成结构是否符合被测对象的本质特征。
英语测试中的效度、信度和真实性

英语测试中的效度、信度和真实性作者:陈莉燕王军来源:《课程教育研究·上》2014年第01期【摘要】英语考试种类繁多,有国家四六级,AB级,还有面向社会的PETS考试出国人员的GRE\TOFEL等。
本文从各种英语考试命题的角度出发,分析一份试卷的效度、信度和真实性,对一线的教学工作者而言知道如何确定试卷的质量,在以后的教学中会有很重要的应用价值。
【关键词】英语测试效度信度真实性【中图分类号】G718.5 【文献标识码】A 【文章编号】2095-3089(2014)01-0096-01如何评判一份试卷的质量?如何测试各种语言技能和如何设计各种测试题目?我们知道一套试卷最终设计好了之后,我们更应该知道它的质量如何?也就是它是否符合语言测试的要求?所以,需要对试卷质量进行评估,评估的主要标准是什么?一般就是它的效度、信度和真实性。
下面分别讨论之。
1.效度效度,又称有效性。
它是指一套测试卷所考的是否就是设计人所要考的内容,或者说,在多大程度上考了想要考的。
所以,效度的高低是衡量一套语言测试卷最重要的指标,它是语言测试的出发点,是基点,因为一项效度很低的语言测试是没有实际意义的。
例如,测试听力的考试中出现了写作,这种测试效度是很低的。
例如,Is photography an art or science?这种题目效度很低,因它似乎是对有摄影知识的学生才起作用,对摄影一无所知的学生而言根本测不出他们的写作能力。
所以,这个题目对后者而言效度很低,因为我们要测的是他们的写作能力而不是摄影知识能力。
需要指出的是,语言测试的效度是一个相对概念。
例如,把剑桥商务英语证书考试来测试非英语专业的学生英语水平效度就很低。
2.信度信度是指考试结果的可靠性和稳定性,它通常以两次考试结果相关系数来表示,系数越高,信度也就越高。
影响信度的因素很多,主要有外部环境和个人因素,同时试卷的量是否足够大,区分度是否高,难易度是否适中,评分是否客观等因素也影响着信度。
大学英语成绩测试的信度与效度关系探析

大学英语成绩测试的信度与效度关系探析陈哲【摘要】信度和效度是第二代语言测试体系提出的两个不同的概念,处理好两者之间的关系,有利于教师正确把握大学英语测试的科学性.以第二代语言测试体系理论为基础,利用Gitest数据统计软件,进行一项针对大学英语成绩测试的信度与效度分析时发现,测试信度的实现以效度为代价,严重影响了测试的质量.而信度与效度的平衡关键在于测试目的的明确和测试方式的灵活处理.%Reliability and validity are two major concepts of the second testing theories, the balance of which contributes to improving the quality of College English test.This paper is intended to make an analysis of the validity and reliability of a College English final achievement test based on the second testing ing the software developed by Guangdong University of Foreign Study, the paper discovers that in the current context of College English achievement test, high reliability comes with the price of low validity,which causes great damage to test qualities.The keys to the balance of reliability and validity come down to clear test objectives and flexible test methods.【期刊名称】《广东海洋大学学报》【年(卷),期】2011(031)002【总页数】4页(P98-101)【关键词】大学英语;成绩测试;信度;效度;考试质量【作者】陈哲【作者单位】湛江师范学院外国语学院,广东,湛江,524048【正文语种】中文【中图分类】H310.4+G642.4741 语言测试的信度、效度无可否认,在一定程度上测试分数并不能总是反映学习者获得的能力,但通过不断完善考试质量,我们可使测试结果不断接近学习者真实的能力水平。
国内英语测试信度与效度研究述评

U ie st ,Gu nv ri y …n ,Gu g i 4 0 4,Ch R an x 5 1 0 ia)
Ab ta t Th sp p r r ve o si t d f t e r l b l y a d v l iy o g i h t s v r s r c : i a e e iws d me t s u y o h ei i t n a i t fEn l e to e c a i d s
.
r s a c r o os d e e r h a e pr p e .
Ke r s En ih t s ;t s e i b lt y wo d : gls e t e tr la iiy; t s a i iy e t v ld t
一
、
引
信度 、 效度 和可行 性是语 言测 试 的三个 根本 问题 , 中效度 最 为重 要 , 其 因为效 度 是语 言 测 试 的基本 出发点 ( 惠 中 ,9 8 5 ) 杨 1 9 :5 。信 度则是 效度 的前提 条件 。信度 (ei it ) 指测 试分 数 的稳 定性 和 一致性 程 度 , rI bly 是 a i 它所
l iy a d r l b l y o g ih t s e eo s s e d l n t e p s y a s o ih t e s u y i i t n e i i t f En l e td v l p t a i i h a t 1 e r , f wh c h t d n d a i s y 1
关 键 词 : 英 语 测 试 ; 试 信 度 ; 试 效 度 测 测
大学英语网络测试的信度与效度分析
2 测试 的信 度
有关结构 效度的定义 . 很多 的研究学者给出了比较复杂且相对不 同的定 义。 首先 A i d e r s o n , e t a 1 . ( 1 9 9 5 ) 将结构效度看作是“ 测试能够在何 种程度 上检测 出某种特性或性质” 。 所 谓的构成效度 。 并不是一个具体 的东西 , 而是一个抽象 的心理学概念。 它所测试 出的这种特性 . 是经过 多次实际考试 . 综合分析考试结果与预测结果之后所得 出的 效度 的概念 曾经一度被划分为许多详细的分 支 . 现在有有 被众 多 学者的研究 主流又转变为将其进 行统一 。本文之前 所提到 的 . A P A 、 A E R A和 N C M E联合委员会的定义“ V a l i d i t y i s a u n i t a r y e o n c e p t . ” 换句 话说 . 诸 多被 细分 的效度概念我们可以用一个结构效度来统一联 系起 来。 3 _ 3 效度 的验证 目前, 不 同学者对结构效度的验证方法有着不 同的见解 比如 . L . J . C r o n b a c h 和P . E . M e e h l 提 出了五种验证方法 . 即分组区分法( g r o u p d i f f e r e n c e s ) 、 相 关矩 阵 与 因素 分 析法 ( e o r r e l a t i o n ma t r i c e s a n d f a c t o r a n l a y s i s ) 、 内部 结构研 究 ( s t u d i e s o f i n t e r n a l s t ue r t u r e ) 、 不 同场合 下 的 变 化研 究 ( s t u d i e s o f c h a n g e o v e r o c c a s i o n s ) 、 过 程研 究 ( s t u d i e s o f p r o .
大学英语网络测试的信度与效度分析(全文)
大学英语XX络测试的信度与效度分析0 引言20XX年,教育部实施大学英语四级机考试点改革。
从此,大学英语四级无论是从形式上还是从内容上都有了较大的变化。
由于整个社会对大学英语四级的认知度都比较高,而且考生只有在大学就学期间才可以参加这项考试。
因此,各个学校的大学英语教学也纷纷以大学英语四级考试为目标,制定相应的教学计划,对教学活动进行调整。
辽宁工业大学从20XX年开始,进行大学英语XX络测试实践以来,已经进行了23场全校范围的测试,参加人数超过了二万人次。
目前,已经形成了较为完善的测试硬件系统,和较为成熟的测试机制与体系。
基于以上背景,本文通过分析辽宁工业大学英语XX络测试的实施过程与结果,考察这项测试的效度与信度,为今后大学英语教学的组织与进行,大学英语XX络测试的创新与完善提供相应的依据。
1 高质量考试的标准大学英语四级考试是一项由专家团队精心打造的考试,经过多年的验证,被社会广泛认可,可以当之无愧地称作“高质量考试”。
那么,辽宁工业大学的大学英语XX络测试,是否也是一项“高质量考试”呢?Bchmn & Plmer将以下六大要素作为决定测试质量优劣条件,分别为信度(relibility)、效度(construct vlidity)、真实性(uthenticity)、交互性(interctiveness)、影响性(impct)、可行性(prcticlity)。
所谓真实性,是指考生在测试过程中能够正确解答某个问题,是否等于其在实际场合下也具备与之相对应的能力。
所谓交互性,是指考生在完成测试任务过程中个人特征的参与程度和形式。
所谓影响性,是指测试对于这个社会、教育制度、或是此项制度中的个人所造成的影响,同时还包括测试的波及效应(wshbck effect)。
最后的可行性与前面几项要素不同,它包括测试以何种方式实施、甚至于最初的测试能否能够实施的问题。
但是,正如Bchmn & Plmer所说,决定测试质量的最主要因素应属信度和效度。
大学英语测试中多项选择词汇题和阅读选词填空信度、效度比较
词汇是语 言的重要 要素 , 词汇测试是语 言测试 的重要 组成部
分, 大部分标准测试 中都有词汇项 目。通过何种词汇测试形式 有 效地 衡量 学生 的词汇水 平是 测试设 计者必 须仔 细考虑 的 问题 。
试 最流行 的题型是 “ 四选一” 多项选择 。在 题 目下提供几个答案 ,
Байду номын сангаас
项 选择词汇题 由于难 易度 合适 , 区分度 良好 , 与其它题型得 分相 关性 显著 , 因此表 现出较高 的信 度。相 比而言 , 阅读 选词填空 难
度 系数较高 , 响了此 题的 区分 度和相关 系数 , 影 因此 信度系数 要
大学英语词汇测试 主要有两种题 型 : 多项选择题 和阅读选词填 空
的平均分 ) 的相关 系数 为 06 , . 而阅读选词 填空 与总成绩 的相 关 5 系数只有 0 , 过计算答对 率获得 的难度 系数值分别 为 : 31通 多项 选择词 汇题 ,.1阅读选 词填空 , . 。双列相关 系数计算 得出 0 ; 7 03 3 的数据表明多项选择词汇题 中有 1 道题 ( 2 题 ) 共 0 区分度未达标 ,
分 布数 据 ; ④此 次试题 与 以往 试题相 比的等值数 据等 ( 筱菊 , 李
3 ) 7。
率普遍较低 , 这直接导致 了该题型信度不高 。
3 多项选择词汇题和 阅读选词填空效度 比较
测试 的效度是指考试在 多大程度上 测出预期 要测量的东西 ,
或者说考试在多 大程度上完成 了预期 的测量 任务 , 到了预期测 达
语言测试中的效度与信度
- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论英语语言测试的信度和效度
摘要:信度和效度是英语语言测试中两个比较重要的评价标准,也是衡量测
试是否有效且可靠的重要因素。
信度是指测试结果的可靠性,可信性以及稳定性;效度是指语言测试的科学性和有效性,即考试达到预定目标的程度。
本文将深入
探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
关键词:英语语言测试;信度;效度;
语言测试是一门具有语言教学的综合性科学,并运用一系列科学而又具有实
践性的方法来客观评估学生的语言运用能力。
语言测试的标准包括信度,效度,
真实度,区分度,实用性等。
在这些衡量标准中,信度和效度是两个非常重要的
衡量维度,也是必须在英语语言测试中应用到的两个衡量标准。
信度和效度这两个概念最初于1930年引进到语言测试这个领域中的。
以
Lado为代表的结构主义测试者,他系统地阐述并论证了信度和效度这两个概念,
认为语言测试已经形成了一个科学体系,成为一个独立的学科。
从整体上看,语
言测试在理论和实践上都偏向于信度和效度。
此外,信度和效度是评价学业测试的重要依据。
两者之间的关系是学术考试
的基本问题,学术考试的最终目标是为语言教学服务。
因此,两者的作用在于是
否对英语教学产生重要影响,是否能够支撑英语教学,是否能够实现教学目标,
又是否能和学习的过程相契合。
语言测试不仅能够检查学生掌握知识的能力和水平,还能够发现学生学习中存在的潜在问题,并能够为教师之后的教学提供有效
的指导和帮助。
鉴于此,本文将深入探讨信度和效度的两个概念,并进一步阐述
两者之间的关系。
1.
语言测试中的信度和效度
信度又称有效性,是指测试结果的可靠性、可信性和稳定性,要求其结果不
受受试群体和试题的干扰,从而反映被测试者真实的语言行为。
简而言之,测试
结果应当客观真实地反映,不受其他因素影响。
如果一份英语试卷了信度,也就
不能客观公正地反映被测试者的语言行为,那么这份试卷就失去了它的使用价值。
因此,同一份测试题在不同场合下测试,得到的结果在很大程度上保持一致,则
该测试的信度是比较高的(冯彤,2003)。
语言测试的效度被称之为有效性,且
具有科学性,专注于被测试者的成绩在多大程度上和其语言能力相关,进而反映
学生实际运用语言的能力。
具体而言,主要涉及是不是达到了预期的目标,又或
是测试中是否考到了需要考的内容。
英语语言测试中的信度衡量标准主要反映测
试成绩与被测试者的语言行为之间的联系,而效度主要是反映被测试者的测试行
为和语言能力水平之间的关系。
对此,Bachman 和Palmer认为信度和效度对语言测试至关重要,被称为基
本测量标准。
正是因为这些标准提供了使用考试分数作为推论和决定的主要理由。
另外,他们还把信度定义为测量的一致性,即一个可靠的测试在不同的测试特性
中是保持一致的。
在效度方面,结构效度是指我们根据考试分数所作的解释的意
义和适当性。
总而言之,这两个标准对于任何语言测试的有用性都是至关重要的,缺一不可。
2.信度和效度之间的关系
信度和效度既相互依存,又相互排斥,是既统一又对立的矛盾关系。
信度是效度
的前提,效度比信度更重要。
任何的语言测试都很难同时具备极高的信度或是极
高的效度。
Arthur Hughes做了进一步的研究,清晰地解释了两者之间的关系。
如果一个测试能连续地给出更准确的测量结果,它是可靠的。
然而,一个可靠的
测试可能根本无效。
Heaton认为测试的有效性是为了提供一个真实的衡量特定技
能的标准,目的是为了衡量。
他将效度分为四个部分:面子、内容、结构和经验
效度。
Moss和Messick证明了用纸笔测验的方法在语言测试中的有效性是非常重
要的。
因此,他们认为人们应该强调有效性。
之后对内容效度、结构效度和信度
进行了研究,分析了效度与信度的关系。
Moller认为效度在语言测试中起着重要作用。
信度和效度是相互排斥的要素。
但理论上说,效度比信度更重要。
Weir继续指出,如果语言测试首先确保较高的
信度,效度则不可避免地会降低,甚至无效。
相反地,如果先考虑效度,那么信
度只会受到一点点损害。
也就是说,信度差的效度也会差,但效度差的信度比一
定差。
语言测试更偏向于效度,在把握好效度的基础上,再更大化地追求一定的信度。
现阶段英语语言测试在很大程度上忽略了效度,也就是忽视了反拨效应。
如
果语言测试中忽略了良好的反拨效应,将会产生一定的消极影响。
而这种消极影
响会使教学双方和教学目标之间产生隔阂,并耗费大量的时间和精力。
然而现阶
段教学是无法承担不使用良好的反拨效应的测试结果(赵成发,2008)。
尽管两者在语言测试中的作用和影响程度不同,但信度和效度在语言测试中
都是必不可少的。
因此,平衡好两者之间的关系是非常重要的。
3.结束语
英语语言测试的目的是服务于英语语言教学。
当前,英语语言测试仍存在学
生的实际能力和成绩得分相差异的情况。
考虑到测试测出的仅仅只是学生当前学
习和接受的知识,不能完全反映出学生现有的语言水平和能力。
因此,在测试题
编制过程中应当把握好信度和效度以及其他评价标准的关系,发挥好效度和信度
对语言教学的积极促进作用,科学合理地设计测试题,并且尽可能最大化地提高
英语语言测试的质量,使其测试更趋向于合理化,有效化,从而进一步推动英语
教学的不断发展。
Bibliography
1.
Bachman, L. F. & A. S. Palmer. 1996. Language Testing in
Practice[M]. Oxford: Oxford University Press.
2.
Heaton, J. B. 1988. Writing English Language Tests [ M]. London: Longman.
3.
Hughes, A. Testing for Language Teachers. Cambridge: Cambridge University Press, 1989.
4.
Messick, S. The interplay of evidence and consequences in the validation of performance assessments[J]. Educational Researcher, 1994, 23( 2): 13-23.
5.
Moss, P. Can there be validity with out reliability? [J]
Educational Researcher, 1994, 23( 2): 5-12.
6.
Weir, C. Communicative Language Testing. Prentice Hall, 1990.
7.
冯彤.论语言测试效度与信度矛盾的统一——评交际语言测试PETS5[J].长沙
铁道学院学报(社会科学版),2003(Z1):37-40.
8.
赵成发.谈语言测试的信度与消毒[J].西安外国语学院学报,2008,8(1):11。