语言测试构念效度研究
语言测试中结构效度的实现

语言测试中结构效度的实现【语言学研究】沈阳师范大学学报(社会科学版)Journal of Shenyang Normal University(Social Science Edition)2012年第1期第36卷(总第169期)№1,2012Vol.36General,№169语言测试中结构效度的实现马蓉(辽宁省文化艺术职工大学基础部,辽宁沈阳110180)[摘要]作为一门独立学科,语言测试是检验和评估教学效果和学习效果的重要手段。
结构效度是实现语言测试目的的基础,决定了测试的目的和收集证据检验测试的有效性。
而针对不同的受试者测试会有所倾向,产生测试偏见,影响结构效度的实现。
科学性的语言测试要求测试者在测试始终合理有效的规避测试偏见,实现结构效度,使语言测试更科学。
[关键词]语言测试;结构效度;测试偏见[中图分类号]H0-0[文献标识码]A[文章编号]1674-5450(2012)01-0117-02[收稿日期]2011-11-10[作者简介]马蓉(1977-),女,辽宁沈阳人,辽宁省文化艺术职工大学讲师,教育学硕士。
语言测试是检验语言水平和能力的重要途径,既受测试信度、效度和区分度的影响,也与受试者个人的特征密切相关。
而效度即是考查测试者想要测量的内容,是实现测试的重要方面。
在构建测试效度时应避免受试者个人特征对测试表现的影响,也就是避免测试偏见,才能测试出受试者语言能力的真实水平。
一、语言测试中的结构效度(一)结构效度的概念Lyle F.Bachman 在他的Language Testing in Practice (《语言测试实践》)一书中指出:所谓结构效度,从属于对语言测试分数所作的解释的意义性和合理性,这就意味着对测试分数的解释就是对受试者语言能力的评估[1]。
Bachman 认为通过结构效度,我们不仅可以评估想要测量的受试者的语言能力,还可以通过对测试分数的解释来判断测试所采用的目标语使用语域是否合理。
基于口语任务的语言测试效度实证研究

这种 以任务 为 核心 的语 言 测试 与传 统测 试 有着 极 大 的 区别 , 目标 是 诱 导 和 评 价 学 习 者 在 以意 义 为 中心 其 并有 明确交 际 目的 的语 言 使 用环 境 下 的交 际行 为 , 真实 世 界 的需 要 成 为任 务 设 计 的驱 动力 。 TL B A的发 展 是依 据 当前 颇 为流 行 的 “ 构 主义 ” cnt c v m) 交 际 语 言 测试 。建 构 主 义 认 为 知 建 (osuti 和 r is 识 是 暂 时 的 、 展 的和 非 客观 的 , 经过 学 习者 内心构 建 并 受社 会 文 化影 响 的 , 的认 知 与 经 验 共 同发 发 是 人 展 , 识 与经 验 的重 新 构建 是 体验 、 现 和创 造 的过 程 。 因 而 真 实 自然 的任 务 有利 于 激 活 学 习者 已 有 的 知 发 知 识结 构 和认 知 图式 , 进 自身知 识 的重 组 与构 建 , 现 语 言知 识 的 内化 。基 于 上 述 理论 , 务 型语 言测 促 实 任 试 将测 试 目标 指 向学 习 者在 实 际 生 活 中有效 运 用 语 言完 成 特 定 交 际 任 务 的 能 力 。相 对 于 以语 言知 识 为 纲 的结 构 主义 测试 和 以 意义 为纲 的综合 测 试 , 类测 试 是 以交 际任 务 为纲 , 真 实性 和交 互 性 为 特 性 。
关 键 词 : 言测 试 ; 务 ; 度 语 任 效
中 图分 类 号 : 0 H9
文 献 标 识 码 :C
文 章 编 号 : 0 8 1 8 2 1 ) 4— 0 8—0 10 —8 4 ( 0 0 0 0 0 3
2 0世 纪 8 0年代 , 任务 型语 言 教 学 T L (akb sdln ug a hn ) B T ts—ae g aet c ig 已成 为 国际 英 语 教 育 的主 流 模 a e 式 。作 为 交 际法教 学 的延 续 , 它将 任务 的设 计 、 制 和 完 成 置 于 交 际 环 境 之 中 , 导 以 体 验 、 践 、 与 、 控 倡 实 参 交 流和 合作 的学 习方式 实 现 目标 并 感 受 成 功 。新 的语 言 学 习 观 和教 学 法 理 论 必 然 催 生 相 应 的 测 试模 式 与之 匹 配 。近 年来 , 正是 在 T L B T理 论 的推 动 下 , 于任 务 的语 言 测 试 (akb sdl g a eass n ) 基 ts —ae a u g ses t 迅 n me 速发 展并 成 为测 试 界关 注 的 热点 。2 0 0 0年在 加 拿 大温 哥 华 召开 的 第 2 2届 国际语 言测试 研 讨 会 主题 之 一 就 是 “ ut gt k ets 。语 言测 试 权威 杂 志 L n u g et g于 2 0 P tn sst t t i a oh e ” a g aeT sn i 0 2年第 4期 专 刊讨 论 基 于任 务
对语言测试效度及其证据来源的一些认识和思考

对语言测试效度及其证据来源的一些认识和思考作者:陈雨珣来源:《青年文学家》2009年第16期摘要:效度是语言测试最重要的准则之一,本文考查了效度概念中传统习惯划分的四个类别:标准效度、表面效度、内容效度和结构效度。
发展至今,结构效度成为其中最被广泛接受和最受研究的效度证据。
随着概念的发展,效度的证据来源也有了新的诠释,文章对五种证据来源作了说明。
关键词:效度结构效度表面效度内容效度标准效度证据来源【中图分类号】H31【文献标识码】A【文章编号】1002-2139(2009)-16-0075-01一、语言测试中的效度语言测试的首要目的是为研究者提供一个测量个体语言能力的指标。
效度是测试的有效性最重要也是最必要的准则,它体现了实现测试结果的有效程度。
效度通常被定义为一个研究对研究者所意图测量的特定概念所能反映或评测的程度。
语言测试中,效度关系到测量被测试者语言能力的研究是否成功,可用来判断某一项评分的解释是否合理,而这个解释也涵括了测试的意义及合理性。
这就要求测试中应充分考虑作为基础的评分指向的证据来源,以及评分应用的社会影响。
因而效度并非测试或测评的附属产物,而是测试结果涵义的产物。
二、效度的四个类型效度传统习惯上被分为四个类别:表面效度,内容效度,标准效度和结构效度。
表面效度涉及测量方法及其过程是如何呈现的。
包括它是否以合理的方式获取研究员试图得到的信息,它看起来是否设计良好,以及它看起来能否可靠地动作。
不同于内容效度,表面效度不需要架设理论来获得支持。
表面效度仅仅意味着表面的有效性。
由于表面效度的模糊性和主观性,心理测试学者们很久前便放弃了这个概念。
内容效度以测量方法所能反映的测量领域的程度为基础,找出测试内容是否反映了测试的要求。
乍看之下。
内容效度似乎类似于表面效度,但二者是有区别的。
在内容效度中,证据是在考官评判的协商中获得的。
简而言之,表面效度可以由~个人确立。
而内容效度需要一个专家小组来检测。
十一语言测试的效度

十一语言测试的效度1 效度(validity)● A measure is valid if it does what it is intended to do, which is typically to act as an indicatorof an abstract concept (for example height, weight, time, etc.) which it claims to measure.The validity of a language test therefore is established by the extent to which it succeeds in providing an accurate concrete representation of an abstract concept (for example proficiency, achievement, aptitude).●效度就是测验测到它打算测的东西的程度,或者说,是根据测验分数所作出的推论的恰当性程度。
一项语言测试,它测的到底是什么;对设计者打算测量的某种心理属性,它测得的程度如何;根据测试的结果,可以作出怎样的推论与解释。
诸如此类的问题都与测试的效度有关。
2 效度的种类效度通常有如下几种:●结构效度/构念效度/构想效度(construct validity)●内容效度(content validity)●效标关联效度(criterion-related validity),包括⏹同期效度/同时效度(concurrent validity)⏹预期效度(predictive validity)●表面效度/表层效度(face validity)(1)结构效度/构念效度/构想效度(construct validity)●概念构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度。
语言测试中的构念效度研究

知识文库 第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。
那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?2.构念及构念效度 2.1构念要想理解什么是构念效度,首先要明白什么是构念(construct)。
从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。
在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。
Ebel 和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。
”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。
《标准》(APA,1999)将构念视为一个测验拟测的概念或特征。
这是从广义上将构念来指测验所涉及测量的概念或特征。
实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。
2.2 构念效度如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。
语言测试者认为这种把构念效度作为整体观点是一种新的发展。
理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981) 。
Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。
在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。
其中影响最大的是 Messick 的“效度整体观”。
Messick (1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。
语言测试构念效度

根据测试结果和反馈,对测试进行持续改进,优化试题设计、评分标 准和考试流程,进一步提高语言测试的构念效度和实用性。
05
结论和展望
主要结论汇总
语言测试构念效度是评估语言测试结 果是否真实反映被测者语言能力的重 要指标。
研究表明,有效的语言测试应该具备 清晰的目标、真实的任务、可靠的评 分方法等特征。
03
语言测试构念效度的 实证研究
研究设计
明确研究目标
首先,需要明确语言测试构念效 度的具体目标,例如,是要验证 某一特定语言测试的构念效度, 还是要比较不同语言测试的构念
效度。
选择适当的受试者
受试者的选择应当代表语言测试 的目标人群,以确保研究结果的 普遍性。同时,受试者的数量也 应足够,以满足统计分析的要求
。
设计测试任务
测试任务应能全面反映语言能力 的各个方面,包括听、说、读、 写等。任务的难度和长度应适中 ,以避免受试者产生疲劳或厌倦
。
Hale Waihona Puke 数据收集和分析方法数据收集
收集受试者在语言测试中的表现数据,包括得分、反应时间、错误类型等。同时,也可以收集一些背景信息,如 受试者的年龄、性别、母语等。
数据分析
可以采用定量和定性两种分析方法。定量分析可以通过统计方法,如相关分析、回归分析等,来探究语言测试和 语言能力之间的关系。定性分析可以通过对受试者的表现进行深入观察和分析,来获取更丰富的信息。
构念的理解
构念可以是理论构念,也可以是经验构念,它们都是对某一现象或事物的抽象描 述。
构念效度的评估方法
内容效度评估
通过检查测验内容是否充分、 全面地反映了所要测量的构念
来进行评估。
结构效度评估
语言学习潜能测试构念的研究

语言学习潜能测试构念的研究卜杰民(浙江广厦建设职业技术学院经贸外国语学院,浙江东阳 322100)*摘 要:语言学习潜能测试构念(L a n g u a g eL e a r n i n g Po t e n t i a lT e s tC o n s t r u c t )是语言学习潜能测试试卷编制的语言学和认知科学的基础㊂文章界定了语言学习潜能测试构念的概念,建立了语言学习潜能测试构念的分类框架,论述了其因子的表征,进行了因子表的结构效度验证㊂文章是对语言学习潜能测试构念所进行的理论探索,以为语言学习潜能测试试卷的编制提供一种理论架构㊂关键词:语言学习潜能;语言能力;学习能力;测试构念;结构效度验证d o i :10.3969/j.i s s n .2095-5642.2020.06.011中图分类号:H 08 文献标志码:A 文章编号:2095-5642(2020)06-0071-10语言学习潜能(L a n g u a g eL e a r n i n g Po t e n t i a l )是指学习者为完成语言学习任务所具有的潜在或者可能的能力㊂它是语言能力(L a n g u a g eA p t i t u d e )和学习能力(L e a r n i n g A pt i t u d e )的综合㊂语言学习潜能在第二语言习得中起着至关重要的作用,是因为语言学习潜能既是第二语言习得的个体差异变量之一[1],也是预测第二语言习得的学习结果的因素之一[2],同时具有语言学习普适性的属性[3]㊂国内外学者从不同的角度从以下几个方面对语言学习潜能进行了研究,相关研究文献包括:语言学习潜能测量结果和学习结果的相关数达0.50[4]㊁语言学习潜能和第二语言语法水平的相关性[5-7]㊁语言学习潜能和语言知识的相关性[8]㊁语言学习潜能在外显学习和内隐学习条件下的作用[9-14]㊁语言学习潜能对第二语言习得的影响[15]㊁语言学习潜能研究范式[16]及语言学习潜能和学习任务之间关系的实证研究[17]㊂这些研究文献主要回答了以下四个问题:(1)语言学习潜能和语言知识的相关性问题;(2)语言学习潜能在不同的教学环境和学习任务中的作用问题;(3)语言学习潜能对语言学习水平的预测性问题;(4)语言学习潜能的研究范式问题㊂这些相关研究文献奠定了语言学习潜能测试理论建构的基础㊂语言学习潜能测试旨在测试学习者的语言学习潜能,或者说测试学习者的语言能力倾向,其理论建构的核心问题是语言学习潜能测试构念概念的建构㊁因子表征和因子表的结构效度验证㊂为了简洁之便,语言学习潜能测试构念这个术语取其英文单词首字母,下文通称L L P T C ㊂有鉴于L L P T C 理论建构的核心问题,本研究探讨三个问题:(1)概念的建构;(2)因子的表征;(3)因子表的结构效度验证㊂概念的建构旨在解决L L P T C 范畴的问题,其因子表征旨在解决L L P T C 范畴在语言学层面和认知层面的构成成分表征的问题,因子表的结构效度验证旨在解决L L P T C 因子有效性的问题㊂在汉语语境下研究中国语言学习者L L P T C 概念的建构㊁因子的表征和结构效度验证,必须要了解第二语言习得的语言学习能力模块㊂17*收稿日期:2019-12-30基金项目:浙江省教育考试2018年度研究课题 基于多元智力理论的学生语言学习潜能动态评估研究与实践 (2018Z J K S 229)部分研究成果 作者简介:卜杰民(1962 ),男,浙江东阳人,副教授,硕士,研究方向:语言学和语言习得㊂成都师范学院学报2020年6月一㊁语言学习能力模块语言学习能力(潜能)与第二语言习得有着相互联系㊂S k e h a n[18]把语言能力进行了分解,分为听觉加工模块㊁语言加工模块和记忆模块㊂听觉加工模块对应语音编码能力,语言加工模块对应语法感知力和语言归纳能力,记忆模块对应记忆(即时记忆和延时记忆)能力和检索能力㊂在此基础上S k e h a n[19]把这些语言学习能力模块和信息处理过程进行了对应:(1)语音编码能力与输入加工相联系;(2)语言分析能力与中间处理相联系;(3)作为检索的记忆与输出和流利相联系㊂Dör n y e i与S k e h a n[2]对语言习得加工步骤和语言学习能力模块的联系进行了细化,具体情况见表1㊂表1二语习得步骤与语言学习能力模块联系表二语习得加工步骤相应的语言学习能力模块语言输入的加工策略注意力的控制,工作记忆注意语音编码能力,工作记忆语言结构的识别语音编码能力,工作记忆,语法感知力,归纳性语言学习能力语言结构重构和操纵语法感知力,归纳性语言学习能力语言结构的控制自动化,融合记忆语言结构的融合组块能力,检索记忆表1中所列出的语言学习能力模块反映语言学习者的语言学习潜能㊂从语言学的层面来看,语言学习潜能是一种与生俱有的天资,固存于人们的大脑中,体现为语言学习者大脑中的语言学习能力的初始状态,具体表现为以下潜在的能力:(1)能够说出或理解以前未接触到的㊁合乎语法的语句;(2)能够辨析有歧义的语句;(3)能够判别表面形式相同而实际语义不同,或者表面形式不同而实际语义相似的语句;(4)听㊁说㊁读㊁写㊁译等语言技能㊂语言学习潜能具有三个特点:(1)对于语言习得而言,语言学习潜能具有普适性属性;(2)对于语言学习者而言,语言学习潜能具有个体差异性属性;(3)对于语言测试而言,语言学习潜能具有可测性属性㊂从心理学的层面来看,语言学习潜能以心理特质的形式存在于人们的大脑中㊂心理特质指的是心理活动进行时所表现出来的稳定特点㊁反映意识倾向,体现心理活动的独特性㊂语言学习潜能就是这样一种语言学习方面的心理特质,体现语言学习的能力倾向㊂但是如何测试这种语言学习潜能心理特质呢?语言学习潜能心理特质的测试可以通过测试构念这个概念来加以体现,测试构念可以通过因子表征的方法来加以实现㊂下面先讨论L L P T C概念的建构㊂二㊁L L P T C概念的建构测试构念(T e s tC o n s t r u c t)是一个心理测量学的概念,指的是人们所具有的某种心理特质通过间接的方式所表现出来的测试点[20]㊂测试构念奠定了语言学习潜能测试的基础,在心理学层面测试构念以心理构念(P s y c h o l o g i c a l C o n s t r u c t)的方式体现㊂这种心理构念根据G a r d n e r多元智力理论的理解,不是单一的而是多维度的心理构念,是语言潜能和学习潜能的综合体现,其测试构念(测试点)可以用范畴的方式表征㊂此处的范畴(C a t e g o r y)是指反映语言学习潜能本质属性和普遍联系的基本概念㊂但是测试构念如何以范畴的方式表征呢?在现实世界里,其范畴的表征要通过范畴化(C a t e g o r i z a t i o n)的过程来实现㊂所谓L L P T C范畴化是指认知主体对其范畴进行分类的过程,是构建L L P T C范畴的基础㊂综合C h o m s k y的语言天赋论理论[21]和G a r d n e r的多元智力理论[22],L L P T C范畴可以分解为L L P T C知识范畴(L L P T CK n o w l e d g eC a t e g o r y)和L L P T C认知范畴(L L P T CC o g n i t i v eC a t e g o r y)㊂知识范畴对应于表1中的语音编码能力㊁语法感知力和相应的语言学习能力模块,属于C h o m s k y界定的语言能力范畴;认知范27第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究畴对应于表1中的工作记忆和归纳性语言学习能力,属于G a r d n e r界定的智力范畴㊂L L P T C范畴的二分法较好地体现了语言学习潜能的本质属性,是建立L L P T C分类框架的一种途径㊂L L P T C知识范畴折射语言学习者的语言能力倾向测试点类型,体现他们的语言学习潜能在语言学层面的测试构成要素,反映他们在未来语言学习前的大脑中语言习得(学习)机制中语言能力的初始状态㊂其知识范畴包括语音辨析能力(P h o n e t i cR e c o g n i t i o n)㊁语素辨析能力(M o r p h e m eR e c o g n i t i o n)㊁语法感知力能力(G r a mm a t i c a l S e n s i t i v i t y)和语义辨析能力(S e m a n t i cA n a l y s i s),分别对应语音学/音系学㊁语素学㊁句法学和语义学范畴㊂语音辨析能力是指识别不同语音的能力,它以语音符号联想能力为特征,在语音和代表它们的符号之间建立联想;语素辨析能力是指识别构成最小意义单位语素的能力;语法感知力能力是指把语言形式与其特定的语境分离,从语言材料中推断出语言规则的能力;语义辨析能力是指分辨词的意义和词与词意义之间逻辑关系的能力㊂L L P T C认知范畴体现语言学习者的语言学习元认知能力,反映他们在未来语言学习前的大脑中语言习得(学习)机制中学习能力的初始状态,包括配对联想能力(P a i r e d A s s o c i a t i o n)㊁归纳分析能力(I n d u c t i v e A n a l y s i s)和记忆能力(M e m o r y)㊂配对联想能力是指把刺激和反应联系在一起的能力,迅速而有效地学习语音和意义之间联系的能力[23]㊂归纳分析能力是指根据已知语言材料推断㊁归纳及支配一组语言材料规则的能力㊂记忆能力是指保存语音和意义之间联系和语言规则的能力㊂L L P T C知识范畴和L L P T C认知范畴共同构成L L P T C范畴㊂它们两者之间的关系是:认知范畴是知识范畴的认知基础,知识范畴是认知范畴的加工对象,认知范畴蕴含知识范畴,知识范畴表征认知范畴㊂知识范畴构成L L P T C语言因子,其加工对象和表征属性反映语言因子的属性;认知范畴构成L L P T C学习因子,其认知基础和蕴含属性反映学习因子的属性㊂L L P T C的分类框架及关系如图1所示㊂图1 L L P T C分类框架及关系图在理解了L L P T C分类框架和它们之间关系的基础上,下面讨论在测试中实现这种分类框架的方法,即研究L L P T C因子的表征㊂三、L L P T C因子的表征所谓L L P T C因子(L L P T CF a c t o r)指的是其范畴的构成成分㊂如图1所示,L L P T C知识范畴相对应的有四个组成成分,分别是语音辨析㊁语素辨析㊁语法感知力和语义辨析㊂这四个组成成分体现了大的L L P T C语言学属性,称为L L P T C共同语言因子(L L P T CC o mm o nL a n g u a g eF a c t o r)㊂L L P T C认知范畴相对应的有三个组成成分,分别是配对联想㊁归纳分析和记忆㊂这三个组成成分包含了大的L L P T C认知学习属性,称为L L P T C共同学习因子(L L P T C C o mm o n L e a r n i n g F a c t o r)㊂L L P T C的因子表征就是把L L P T C共同因子((L L P T CC o mm o nF a c t o r)所代表的L L P T C大范畴分解成具有测试可操作性的L L P T C 特殊因子(L L P T CS p e c i f i cF a c t o r)所代表的L L P T C小范畴,形成语言学习潜能测试点㊂L L P T C各个因子形成一个因子表,如表2所示㊂37成都师范学院学报2020年6月表2 L L P T C因子表L L P T C共同因子L L P T C特殊因子表征信息L L P T C 共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号根据所听到的语音辨识音节符号语音分辨根据所听到的句子辨识所含的单词重音辨识根据所听到的单词语音辨识重音相异的单词语素分析辨识名词构词㊁动词构词㊁形容词构词和副词构词句子中的单词根据例示辨识单词在句子中的语法功能词汇同义词㊁近义词辨析词语类比辨识词语之间的逻辑语义关系L L P T C 共同学习因子配对联想拼写提示根据意义把语音和符号联系在一起归纳分析语言分析分析语言规则,翻译句子记忆词汇记忆根据提示记忆词汇如表2所示,共同因子由其所属的各特殊因子组合而成㊂具体讲就是:共同因子表征由其所属的各特殊因子共同的抽象属性,特殊因子不但表征其所属的共同因子的抽象属性,而且还表征其本身的具体属性㊂换句话讲共同因子是各个特殊因子所共有的因子,是对某个集合成员所有因子的概括,特殊因子是共同因子所概括的某个集合成员中的一个因子㊂表2所示的因子表体现其范畴结构,反映其本质属性㊂共同因子和特殊因子构成L L P T C结构效度验证的对象㊂结构效度验证就是看看在多大程度上这些因子能够测试出所要测试的语言学习潜能㊂下面讨论L L P T C因子表的结构效度验证的问题㊂四、L L P T C因子表的结构效度验证(一)结构效度验证的理论假设L L P T C因子表的结构效度验证采用因子分析法(F a c t o rA n a l y s i s)㊂因子分析法所依据的原理是检验表2所示的L L P T C因子表中特殊因子在其所属共同因子下的聚合效应(C o n v e r g e n tE f f e c t)及各个共同因子间的区分效应(D i s c r i m i n a n tE f f e c t)㊂如果能够证明L L P T C因子表具有较好的聚合效应和区分效应,则说明L L P T C因子表具有较好的结构效度㊂聚合效应反映因子表中特殊因子在其所属共同因子下相互紧密联系的程度,其相互紧密联系的目的是保证共同因子所属的特殊因子都具有其共同因子的属性㊂其紧密联系的程度用特征值(E i g e n v a l u e)㊁因子负荷((F a c t o rL o a d i n g)和共同性(C o mm u n a l i t y)三个指标来度量㊂(1)特征值指的是共同因子解释其所属特殊因子的程度㊂特征值越大,说明共同因子解释其特殊因子的程度越高㊂(2)因子负荷指的是共同因子和其所属各个特殊因子之间的相关系数㊂因子负荷越大,说明共同因子和特殊因子的相关程度越高㊂(3)共同47第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究性指的是特殊因子能被共同因子解释的程度㊂共同性越大,说明特殊因子能被共同因子解释的程度越高㊂区分效应反映因子表中各个共同因子之间互不重复㊁相对独立的程度,其相对独立的目的是保证不同的共同因子具有不同的属性㊂(二)结构效度验证的方法L L P T C因子表的聚合效应验证是通过特征值㊁因子负荷㊁共同性的统计值和其相应参数临界值的比较来进行的㊂L L P T C因子表的聚合效应验证的参数临界值是[24]:(1)特殊值达到可接受值1.0或者1.0以上;(2)因子负荷达到可接受值0.3或者0.3以上;(3)共同性达到可接受值0.7或者0.7以上㊂如果L L P T C因子分析的统计值满足以上三个条件,则可以推断:(1)共同因子解释其所属特殊因子的程度较高;(2)共同因子与其所属的特殊因子有较高的相关程度;(3)特殊因子被共同因子解释的程度较高㊂由此证明本研究的L L P T C因子表中共同因子和其所属的特殊因子具有较好的聚合效应㊂较好的区分效应通过采用因子分析中的直角旋转法(O r t h o g o n a lR o t a t i o n)来达到㊂直角旋转的作用是使各个L L P T C共同因子相对独立,以保证每个共同因子在解释L L P T C因子表结构效度中起到应该起的独特作用㊂(三)结构效度验证的任务L L P T C因子表的结构效度验证的任务是:(1)检验L L P T C因子的特征值;(2)检验L L P T C因子的因子负荷;(3)检验L L P T C因子的共同性㊂(四)结构效度验证的被试本研究的被试为某高校在新生入学时从参加语言学习潜能测试的全体大一新生中随机抽取的120名学生,其中,有60名男生和60名女生㊂之所以从全体测试新生中随机抽取120名学生,是因为全体大一新生能够保证:(1)有足量的被试;(2)有异质的被试(即含有语言水平和认知水平高㊁中㊁低的被试)㊂足量的被试保证随机抽取的测试样本量足够大,能够保证数据检验有统计意义;异质的被试作为一个整体样本反映自然状态下所测试的语言学习者的语言能力和认知能力初始状态分布的情况,即含有语言能力和认知能力高中低的被试并按正态分布,保证随机抽取的测试样本是反映自然状态的真实样本㊂本研究的被试满足这两个条件,因此L L P T C因子表的结构效度的数据检验具有统计意义,从而保证了本研究的信度和效度㊂(五)测试样卷结构信息和样题信息本研究的测试样卷分七个大部分㊁十个小部分㊂每一个小部分10道题,共100道题;每题1分,总分100分㊂七个大部分对应七个测试构念共同因子,十个小部分对应十个测试构念特殊因子㊂样卷结构信息和样题信息如附录所示㊂(六)数据收集与分析运用语言学习潜能测试样卷,在大一新生入学时在全体大一新生中进行语言学习潜能测试,其性质是诊断性的,其目的是了解学生的语言学习潜能,以便开展分层分类教学㊂同时利用该测试数据进行本研究的L L P T C因子表的结构效度验证㊂测试时间为120分钟㊂在测试开始前,参加语言学习潜能测试的全体大一新生进行随机抽取编号㊂随机抽取编号的目的是为了便于评分结束后的随机抽取样本试卷㊂在测试时要求每位学生在试卷上填上姓名㊁性别㊁年龄和编号㊂测试结束后,教师按照评分规则评分,统计出每位学生试卷上的每一小部分的分数㊂评分结束后,随机抽取120份答卷(60份男生答卷㊁60份女生答卷),形成被试样本试卷,以备数据录入分析㊂因为数据是以分数的方式呈现,所以所分析的L L P T C因子表是定距测量,满足因子分析的前提条件㊂数据录入分两部分进行㊂第一部分录入被试样本试卷每位被试的姓名㊁性别㊁年龄和编号㊂第二部分录入每位被试答卷的每一小部分成绩,它们分别对应于语音符号㊁语音分辩㊁重音辨识㊁语素㊁句子中的单词㊁词汇㊁词语类比㊁拼写提示㊁语言分析和词汇记忆的分数㊂这十个分数变量对应十个L L P T C特殊因子,如表2所示㊂前三个特殊因子对应第一个L L P T C共同因子 语音辨析;第四个特殊因子对应第二个L L P T C共同因子 语素辨析;第五个特殊因子对应第三个L L P T C共同因子 语法感知力;第六个和第七个特殊57成都师范学院学报2020年6月因子对应第四个L L P T C共同因子 语义辨析;第八个特殊因子对应第五个L L P T C共同因子 配对联想;第九个特殊因子对应第六个L L P T C共同因子 归纳分析;第十个特殊因子对应第七个L L P T C共同因子 记忆㊂前四个共同因子表征被试语言学习潜能的语言(知识)属性特征,后三个共同因子体现被试语言学习潜能的学习(认知)属性特征,被试的语言(知识)属性特征和学习(认知)属性特征共同勾画出其语言学习潜能特征㊂数据录入完毕后,运用S P S S统计软件对已录入的数据进行验证性因子分析(C o n f i r m a t o r y F a c t o rA-n a l y s i s),其因子旋转选择V a r i m a x旋转,计算出相关系数㊂五㊁结果与讨论(一)KMO测度和B a r t l e t t球体检验在作因子分析以前,先进行KMO测度和B a r t l e t t球体检验,以检查数据是否适用于因子分析,结果见表3㊂表3 KMO测度和B a r t l e t t球体检验表KMO测度值(K a i s e r-M e y e r-O l k i n M e a s u r eO f S a m p l i n g A d e q u a c y)0.897B a r t l e t t球体检验值(B a r t l e t t sT e s tO fA p p r o x.C h i-S q u a r eS p h e r i c i t y)677.638方差值(d f.)9显著水平值(S i g.)0.000注:显著水平值(S i g.)ʈ0.000<0.05,数据具有统计意义㊂表3列出了KMO测度值㊂KMO测度值表明全部变量的方差比例,也就是说该方差比例可能是由潜在的因子造成的㊂一般来说,KMO测度值越高(接近于1.0),表明变量间的共同因子越多,数据越适合用因子分析㊂KMO测度值的可接受值为0.7[24]㊂表3所示的KMO测度值为0.897,大于0.7可接受值,数据适合做因子分析㊂表3也列出了B a r t l e t t球体检验值㊂B a r t l e t t球体检验值说明相关矩阵是否为单位矩阵㊂如果是单位矩阵,不适宜用因子分析㊂如果显著水平值(S i g.)大(>0.05),说明变量间相关性低,相关矩阵是单位矩阵,不适宜用因子分析[24];如果显著水平值(S i g.)小(<0.05),说明变量间相关性高,相关矩阵不是单位矩阵,适合用因子分析[24]㊂表3所示的B a r t l e t t球体检验中,显著水平值(S i g.)ʈ0.000<0.05,表明变量间有显著的关系,变量间存在着共同因子,适合用因子分析㊂(二)特征值㊁因子负荷和共同性的检验表4列出了因子的特征值㊂特征值是所有特殊因子值在某一共同因子上的负荷值的平方总和,解释的是相关矩阵中的方差,可接受值是1.0,特征值越大,共同因子解释其特殊因子的程度越高㊂表4因子的特征值㊁解释方差和累计方差表L L P T C共同因子标签(L a b e l)特征值(E i g e n v a l u e)方差(V a r i a n c e)累计方差(C u m u l a t i v eV a r i a n c e)L L P T C 共同语言因子因子1语音辨析2.5327.05158.065因子2语素辨析2.2115.38252.194因子3语法感知力3.7212.45650.183因子4语义辨析2.4518.57554.02367第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究(接上表)L L P T C 共同因子标签(L a b e l)特征值(E i ge n v a l u e )方差(V a r i a n c e )累计方差(C u m u l a t i v eV a r i a n c e)L L P T C共同学习因子因子5配对联想2.1425.75357.564因子6归纳分析2.0811.07850.056因子7记忆2.2612.64750.195表5列出了因子负荷和共同性㊂因子负荷反映特殊因子和共同因子之间的相关程度,解释的是特殊因子值对共同因子的贡献率,可接受值是0.3,因子负荷越大,相关程度越高㊂共同性是每个特殊因子值在每个共同因子上的负荷值的平方总和,从共同性的大小可以判断特殊因子和共同因子之间的关联程度,可接受值是0.7,共同性越大,特殊因子能被共同因子解释的程度越高㊂表5 因子负荷和共同性表L L P T C 共同因子L L P T C 特殊因子因子负荷(F a c t o rL o a d i n g)共同性(C o mm u n a l i t y)L L P T C共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号0.8050.704语音分辩0.8240.852重音辨识0.8360.736语素0.7420.719句子中的单词0.8680.758词汇0.8560.795词语类比0.7230.703L L P T C共同学习因子配对联想拼写提示0.7010.767归纳分析语言分析0.8470.824记忆词汇记忆0.8710.875从表4和表5可以看出,各因子的特征值介于2.08-3.72之间,各因子的因子负荷介于0.701-0.871之间,各因子的共同性介于0.703-0.875之间,都大于可接受值,L L P T C 因子表具有较好的聚合效应㊂较好的区分效应通过V a r i m a x 旋转得到了保证㊂因此可以得出结论:本研究的L L P T C 因子表具有较好的结构效度㊂六、结语本研究梳理了语言学习潜能相关研究文献,界定了L L P T C 的概念,研究了L L P T C 的分类框架和L L P T C 因子的表征,进行了L L P T C 因子表的结构效度验证㊂本研究成果为语言学习潜能测试试卷的编制提供了一种理论架构和命题依据㊂把该研究成果大规模地应用到语言学习潜能测试工作中去,还需要建设试题库,保证有足量试题以供抽题㊂只有做好了这项工作,才能成功地实施语言学习潜能测试工作,取得它应该有的效果㊂77成都师范学院学报2020年6月附录T h e I n f o r m a t i o n f o rL a n g u a g eL e a r n i n g P o t e n t i a l S a m p l eT e s tP a p e r(语言学习潜能测试样卷结构信息和样题信息)P a r t I.P h o n e t i cR e c o g n i t i o n(语音辨析)S e c t i o nA.P h o n e t i cS c r i p t(语音符号)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.b e e kB.b e e vC.b u tD.b u vS e c t i o nB.S o u n dD i s c r i m i n a t i o n(语音分辩)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.r i n g e rB.h a n g e rC.f i n g e rD.s i n g e rS e c t i o nC.S t r e s sP a t t e r n I d e n t i f i c a t i o n(重音辨识)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h e s t r e s sw h i c h i s d i f f e r e n t f r o mt h e o t h e r t h r e e o n e s A.N a v y B.A r m y C.B u r g e r D.R e p l a c eP a r t I I.M o r p h e m eR e c o g n i t i o n(语素辨析)S e c t i o nA.M o r p h o l o g y(语素)D i r e c t i o n s:A c c o r d i n g t ot h es e n t e n c e m e a n i n g f i l l i nt h eb l a n k w i t ht h e p r o p e rf o r m o f t h e w o r d m a r k e dA,B,Ca n dD.1.T h e f a i l u r e h i mf r o mk e e p i n g o n t r y i n g a n d a t l a s t h eb e c a m e a r e a l f a i l u r e.A.e n c o u r a g e dB.c o u r a g eC.d i s c o u r a g e dD.c o u r a g e o u sP a r t I I I.G r a m m a t i c a l S e n s i t i v i t y(语法感知力)S e c t i o nA.W o r d s i nS e n t e n c e s(句子中的单词)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m e g r a mm a t i c a l f u n c t i o na s t h e c u ew o r d(提示词).1.J O H Nt o o ka l o n g w a l k i n t h ew o o d s.T h e c u ew o r dC h i l d r e n i nb l u e j e a n sw e r e s i n g i n g a n dd a n c i n g i n t h e p a r k.A B C DP a r t I V.S e m a n t i cA n a l y s i s(语义辨析)S e c t i o nA.V o c a b u l a r y(词汇)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m em e a n i n g a s t h e c u ew o r d(提示词).1.p r o l o n g e d(t h e c u ew o r d)A.p r o m p tB.d e c r e a s e dC.d i f f i c u l tD.e x t e n d e dS e c t i o nB.W o r dA n a l o g y(词语类比)D i r e c t i o n s:A c c o r d i n g t o t h e s e m a n t i c r e l a t i o n s b e t w e e n t h e c u ew o r d s(提示词)c h o o s e t h e b e s t a n s w e r.1.m o u n t:h o r s e::t r a i n(t h e c u ew o r d s)A.s t a b l eB.s h o eC.r i d eD.b o a r dP a r tV.P a i r e dA s s o c i a t i o n(配对联想)S e c t i o nA.S p e l l i n g C u e(拼写提示)D i r e c t i o n s:A c c o r d i n g t o t h em e a n i n g o f t h e c u ew o r d(提示词)p r o n o u n c e db y t h e d i s g u i s e dw o r d(伪装词)c h o o s e t h eb e s t a n s w e rw h i c hh a s t h e s a m em e a n i n g a s t h e c u ew o r d.1.r e s t r n t(t h e c u ew o r d/t h e d i s g u i s e dw o r d)A.f o o dB.s e l f-c o n t r o lC.s l e e pD.s p a c e e x p l o r e r87第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究P a r tV I.I n d u c t i v eA n a l y s i s(归纳分析)S e c t i o nA.L a n g u a g eA n a l y s i s(语言分析)D i r e c t i o n s:A n a l y s e t h e l a n g u a g e r u l e s f o r t h e c u es e n t e n c e(提示句)a n d t r a n s l a t e t h es e n t e n c e i n t oE n g l i s h.提示句 T h e c u e s e n t e n c e汉语E n g l i s h一个英俊的男孩喜欢一条跑着的狗㊂Ah a n d s o m eb o y l i k e s a r u n n i n g d o g.T h e l a n g u a g e r u l e s(语言规则)汉语E n g l i s h男孩,一个男孩b o y,ab o y狗,一条狗d o g,ad o g英俊的,跑着的h a n d s o m e,r u n n i n gT h e s e n t e n c e t ob e t r a n s l a t e d(翻译句子)汉语一条英俊的狗喜欢一个跑着的男孩㊂E n g l i s h t r a n s l a t i o n.P a r tV I I.M e m o r y(记忆)S e c t i o nA.V o c a b u l a r y M e m o r y(词汇记忆)D i r e c t i o n s:F i r s t l o o k a t t h eE n g l i s hw o r d s,t o g e t h e rw i t h t h e i rC h i n e s e e q u i v a l e n t s,a n d t h e n c h o o s e t h eb e s t a n s w e r a c c o r d i n g t o t h e c u ew o r d(提示词).汉语E n g l i s h桔子汁j u i c e公牛o x儿子s o n1.公牛(t h e c u ew o r d)A.a n i m a lB.s t i c kC.j u m pD.o x参考文献:[1] C O C H R A NJL,M C C A L L UM RR,B E L LSM.T h r e eA s:H o wd o a t t r i b u t i o n s,a t t i t u d e s,a n d a p t i t u d e c o n t r i b u t e t of o r e ig n l a n g u a g e l e a r n i n g[J].F o r e i g nL a n g u a g eA n n a l s,2010,43:566-582.[2] DÖR N Y E I Z,S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[C]//D o u g h t y CJ.T h eH a n d b o o ko f s e c-o n d l a n g u a g e a c q u i s i t i o n.O x f o r d:B l a c k w e l l,2003:589-63.[3] C A R R O L LJB.I m p l i c a t i o n s o f a p t i t u d e t e s t r e s e a r c h a n d p s y c h o l i n g u i s t i c t h e o r y f o r f o r e i g n l a n g u a g e t e a c h i n g[J].I n t e r-n a t i o n a l j o u r n a l o f p s y c h o l i n g u i s t i c s,1973(2):5-l4.[4] S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n:275-298.[5] A B R A HAM S S O N N,H Y L T E N S T AM K.T h e r o b u s t n e s s o f a p t i t u d e e f f e c t s i nn e a r-n a t i v e s e c o n d l a n g u a g e a c q u i s i t i o n[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n,2008,30(4):481-509.97成都师范学院学报2020年6月[6] D E K E Y S E RR,A L F I-S HA B T A YI,R A V I DD.C r o s s-l i n g u i s t i c e v i d e n c e f o r t h e n a t u r e o f a g e e f f e c t s i n s e c o n d l a n g u a g ea c q u i s i t i o n[J].A p p l i e d p s y c h o l i n g u i s t i c s,2010,31(3):413-438.[7] G R A N E N A G.A g ed i f f e r e n c e s a n dc o g n i t i v e a p t i t u d e s f o r i m p l i c i t a n de x p l i c i t l e a r n i n g i nu l t i m a t e s e c o n d l a n g u a g ea t-t a i n m e n t[D].U n p u b l i s h e dP h Dd i s s e r t a t i o n,M a r y l a n d:U n i v e r s i t y o fM a r y l a n d,2012.[8] G R A N E N A G,L O N G M.A g e o f o n s e t,l e n g t h o f r e s i d e n c e,l a n g u a g e a p t i t u d e,a n du l t i m a t eL2a t t a i n m e n t i n t h r e e l i n-g u i s t i c d o m a i n s[J].S e c o n d l a n g u a g e r e s e a r c h,2013,29(3):311-343.[9] E R L AM R.L a n g u a g e a p t i t u d e a n d i t s r e l a t i o n s h i p t o i n s t r u c t i o n a l e f f e c t i v e n e s s i n s e c o n d l a n g u a g e a c q u i s i t i o n[J].L a n-g u a g e t e a c h i n g r e s e a r c h,2005,9(2):147-171.[10] S H E E N Y.T h e e f f e c t o f f o c u s e dw r i t t e n c o r r e c t i v e f e e d b a c k a n d l a n g u a g e a p t i t u d e o nE S L l e a r n e r s a c q u i s i t i o no f a r t i-c l e s[J].T E S O L q u a r t e r l y,2007,41(2):255-283.[11] HWU F,S U N S.T h ea p t i t u d e t r e a t m e n t i n t e r a c t i o ne f f e c t so nt h e l e a r n i n g o f g r a mm a r r u l e s[J].S y s t e m,2012,40(4):505-521.[12] V A N P A T T E N B,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a m m a t i c a l s e n s i t i v i t y i n p r o c e s s i n g i n s t r u c t i o n:n o m i n a-t i v e a c c u s a t i v e c a s em a r k i n g a n dw o r d o r d e r i nG e r m a nL2[J].F o r e i g n l a n g u a g e a n n a l s,2012,45(1):92-109. [13] V A NP A T T E NB,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a mm a t i c a l s e n s i t i v i t y i n t h e p r o c e s s i n g o f c l i t i c d i-r e c t o b j e c t p r o n o u n s a n dw o r do r d e r i nS p a n i s hL2[J].H i s p a n i a,2012,95(2):270-284.[14] Y I L MA ZY.R e l a t i v e e f f e c t s o f e x p l i c i t a n d i m p l i c i t f e e d b a c k:t h e r o l e o fw o r k i n g m e m o r y c a p a c i t y a n d l a n g u a g e a n a l y t-i c a b i l i t y[J].A p p l i e d l i n g u i s t i c s,2013,34(3):344-368.[15]戴运财.语言学能对二语习得的影响[J].外语教学与研究,2006(6):451-459.[16]戴运财,蔡金亭.二语习得中的语言学能研究:回顾㊁现状㊁思考与展望[J].外国语,2008(5):80-89.[17]顾伟勤.重谈语言学能 外语学习中个体差异的一个重要构成[J],中国外语,2008(6):62-67.[18] S K E HA NP.Ac o g n i t i v e a p p r o a c h t o l a n g u a g e l e a r n i n g[M].O x f o r d:O x f o r dU n i v e r s i t y P r e s s,l998.[19] S K E HA NP.T h e o r i s i n g a n du p d a t i n g a p t i t u d e[C]//R O B I N S O NP.I n d i v i d u a l d i f f e r e n c e s i n i n s t r u c t e d l a n g u a g e l e a r n-i n g.P h i l a d e l p h i a:J o h nB e n j a m i n sP u b l i s h i n g C o m p a n y,2002:69-94.[20] C R O N B A C H LJ,M E E H LPE.C o n s t r u c t v a l i d i t y i n p s y c h o l o g i c a l t e s t s[J].P s y c h o l o g i c a l b u l l e t i n,1955(52):281-302.[21] C HOM S K Y N.A s p e c t s o f t h e t h e o r y o f s y n t a x[M].C a m b r i d g e:M I TP r e s s,1965.[22] G A R D N E R H.F r a m e s o fm i n d:t h e t h e o r y o fm u l t i p l e i n t e l l i g e n c e s[M].N e w Y o r k:B a s i cB o o k s,1983.[23] V I C O R Y AC,A S H E RJ J.T h e p a i r e d a s s o c i a t e t a s k a s a p r e d i c t o r o f f o r e i g n l a n g u a g e f l u e n c y[J].T h e j o u r n a l o f p s y-c h o l o g y,1966(64):29-32.[24]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2003.O nL a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c tB UJ i e m i n(F o r e i g nL a n g u a g e sS c h o o l,Z h e j i a n g G u a n g s h aC o l l e g eO fA p p l i e dC o n s t r u c t i o n,D o n g y a n g,Z h e j i a n g322100,C h i n a)A b s t r a c t:L a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c t(h e r e i n a f t e r r e f e r r e d t o a sL L P T C)i s t h e b a s i s o f l i n g u i s t i c s a n d c o g n i t i v e s c i e n c e o f t h e c o m p i l a t i o no f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.T h i s p a p e r d e f i n e s t h e c o n c e p t o fL L P T C,e s t a b l i s h e s t h e f r a m e w o r kf o r t h ec l a s s i f i c a t i o no fL L P T C,d i s c u s s e s t h e r e p r e s e n t a t i o no fL L P T Cf a c t o r s a n d p e r f o r m s t h e v e r i f i c a t i o no f t h e s t r u c t u r ev a l i d i t y o fL L P T Cf a c t o r s. T h i s p a p e r i s a t h e o r e t i c a l e x p l o r a t i o n o f L L P T C,a n d p r o v i d e s a t h e o r e t i c a l f r a m e w o r k f o r t h e c o m p i l a t i o n o f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.K e y w o r d s:l a n g u a g e l e a r n i n g p o t e n t i a l;l a n g u a g e a p t i t u d e;l e a r n i n g a p t i t u d e;t e s t c o n s t r u c t;v e r i f i c a-t i o no f s t r u c t u r e v a l i d i t y(责任编辑:赵华责任校对:罗布) 08。
语言测试中的效度与信度

- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语言测试构念效度研究
2005年的英语专业八级考试是根据2004年新的八级考试大纲设计和施测的第一次考试,考试的性质、构念领域、任务要求、分数权重等都发生了较大变化。
作为全国唯一的测量英语专业学生高年级英语水平的大规模考试,这些变化对个人、团体和社会将产生重大影响。
测试界认为,越是高风险考试,越要对考试的技术和应用方面进行评价,对考试的效度验证要求越高。
因此,运用先进的效度理念、分析技术和行业规范对我国的八级考试进行研究,不仅有理论价值,也具有现实意义。
在对测验的评价中,效度是最重要的考虑因素。
然而,在过去近一个世纪以来,效度的概念从多类效度发展到统一构念效度。
与效度概念发展相联系,效度验证的范式和方法也产生了变化。
因此,全面和准确地理解效度,具有十分重要具有理论意义。
而掌握效度验证的科学方法具有运用价值。
本研究的目的有二:一是对统一效度概念从本体论、认识论、方法论视角进行较全面的评述,旨在为八级考试效度验证提供一个理论和方法框架;二是在统一效度概念下,对八级考试的客观试题从实证的角度进行效度验证。
验证的问题包括四个:八级考试客观试题的测量学属性如何?客观题目实际测量的维度与考试设计的理念是否一致?客观试题分数的意义在不同的群体中是否具有类似的解释?新增加的人文知识分测验在是否存在考试偏差? 针对两个目的,采用两种研究方法。
对构念效度的理论和方法讨论采用文献综述方式;针对八级考试客观题目的效度验证是用定量的方式提供解释依据。
构念一致性问题是本研究中关于分数解释的切入点,解决的是测验所测
量的构念在不同背景的考生的意义是否具有可比性问题。
当一个测验在一个组别(群体)中所测量的假设特质(或者心理构念)与另一组别相同,或者当一个测验在测量相同的特质而测量的准确程度相似时,构念具有可比性。
构念一致属于分数结构和效度概化问题。
它与考试偏差分析一起,为分数的可解释性和考试公正提供依据。
本研究的对象是446所大学参加2005年TEM 8考试的96696名考生。
分析的数据是由上海外国语大学四、八级考试中心提供的全体考生在客观题目上的原始反应数据以及已经对反应进行判断过的数据。
针对不同的研究问题,使用了不同的统计分析手段:描述统计用于基本数据探索;相关方法分析题目同质性、题目区分度、聚合和区别效度、构念一致性检验;因子和谐系数用于检验不同群体因子负荷之间的相似程度;单因素方差分析进行跨群体均值比较;因子分析用于因子维度探索和验证;标准。