2第一章语言测试的性质,目的及其类别概述

合集下载

应用语言学语言测试理论知识点整理

应用语言学语言测试理论知识点整理在应用语言学领域，语言测试理论是一个重要的分支，它对于评估语言学习者的语言能力、指导教学实践以及推动语言教育的发展都具有关键意义。

以下将对应用语言学语言测试理论的一些重要知识点进行整理。

一、语言测试的定义与目的语言测试是对语言学习者的语言能力进行测量和评估的一种手段。

其主要目的包括：1、为教育决策提供依据，例如确定学生的升级、留级或毕业。

2、评估教学效果，帮助教师了解教学方法的有效性和学生的学习进展。

3、为学生提供反馈，让他们了解自己的语言水平和不足之处，以便进一步改进学习策略。

二、语言测试的类型1、水平测试（Proficiency Test）旨在测量考生对某种语言的整体掌握程度，不考虑考生之前的学习经历或特定的课程内容。

常见的水平测试如雅思（IELTS）、托福（TOEFL）等。

2、成绩测试（Achievement Test）侧重于检测考生在特定课程或学习阶段所掌握的语言知识和技能，与教学内容紧密相关。

比如学校的期末考试、单元测验等。

3、诊断测试（Diagnostic Test）主要用于发现考生在语言学习中存在的具体问题和薄弱环节，以便为后续的教学和学习提供针对性的指导。

4、潜能测试（Aptitude Test）预测考生学习语言的潜力和能力，而非对现有语言水平的评估。

三、语言测试的质量评估标准1、效度（Validity）指测试能够准确测量出其所要测量的语言能力或语言知识的程度。

效度分为内容效度、结构效度、预测效度等。

内容效度：测试内容是否涵盖了所要考查的语言技能和知识点。

结构效度：测试结果是否与语言能力的理论结构相一致。

预测效度：测试成绩能否有效地预测考生在未来语言学习或实际语言运用中的表现。

2、信度（Reliability）反映测试结果的稳定性和一致性。

包括重测信度、复本信度、分半信度等。

重测信度：对同一批考生在不同时间进行相同测试，两次测试结果的相关性。

复本信度：使用两份内容相似但不完全相同的试卷对同一批考生进行测试，两次结果的相关性。

测试的目的和类别

2）综合性测试指将各种汉语知识和语言技能综合在一份试卷或一个试题中，以全面地考查汉语学习者的语言能力的一种测试。优点：可以全面考查汉语学习者的语言能力，尤其是综合运用汉语的能力。不足：评分标准不好掌握，实施过程费时费力。
3、判卷评分方式
（1）主观性测试指试题的答案比较灵活，可能不止一个，评分时需要评卷人对考生的做大情况做出主观性判断的测试。比如：留学生的写作测试、口语测试。优点:便于深度性的汉语考查，命题方便，题量少，耗时短;利于防止猜测得分。不足：考查范围受到限制；评阅工作量大；评分结果难以达到高度一致。（2）客观性测试指试题有固定的标准答案，评分客观可靠，不受评阅人主观因素影响的测试。比如：多项选择题、判断题。
2、测试命题方式
（1）分离性测试指将汉语分离成语音、词汇、语法、汉字等各个构成要素，把言语技能分离成听、说、读、写等分项技能，逐一进行测试。优点：考查汉语项目和分项技能多，测试成绩容易进行量化分析，测试结果能准确反映学生的具体困难，便于教师对症下药，有针对性地帮助学生。不足：孤立地考查汉语学习者的某一项汉语知识或技能，难以反映他综合运用汉语的水平，特别是汉语交际水平。
测试的目的和类别
—史聪101120212
一、测试的目的对外汉语测试的目的，概括的讲，就是为考查
汉语作为第二语言的应试者是否具备完成某项特定任务所需的汉语能力。不同类型的测试有着不同的测试目的，比如潜能测试的目的，在于预测汉语作为第二语言的学习者是否具备学习汉语的潜在素质，即看他是否具备学习汉语的潜力和天赋。成绩测试的目的，在于衡量学习者对某一汉语课程内容的掌握程度。水平测试的目的，则是考查学习者的汉语能力是否达到了规定的标准和要求。

汉语语言测试方法1

（1）语音编码解码能力。（2）语法敏感性。（3）强记能力。（4）综合归纳能力。还有人提出：语言表达能力、性格等。
已有的学能测试：
① 卡罗尔和萨彭：1959. 现代语言学能测试
② 卡罗尔和萨彭：1967. 初级现代语言学能测试 ③ 平斯勒：1966. 语言学能考试开发语言学能测试的意义（1）为语言教学解决问题；
论文写作式的短文写作，翻译统一的客观
评估标准，测试结果完全凭考官的主观判断来决定。
缺乏科学性、系统性，是语言测试发展的雏形时期。
2、心理测量—结构主义时期（科学时期）（1950s-1970s）
（1）理论体系：以结构主义语言学为理论基础；
心理学的行为主义理论以及心理测量学的原则和方法对语言测
4、语言测试的定义：
语言测试是根据一定的评估目的，以抽样方式通过有限试题来诱导出受试者的言语行为，然后借助于定量描述来推断受试者所掌握的语言知识和能力。
5、测试的任务：
设法有效地诱导出体现受试者语言知识和能力的言语行为，并对这种行为进行量化和说明解释。
6、影响测试科学性的因素：
（1）间接性。语言知识和能力无法直接测量，只能通过诱导出的言语行为来测量。测试提供一种条件或刺激，使掌握了某种语言规则或语言结构的受试者能立即使用出来，而没掌握的则使用不出来。制造这样的条件——命题，是进行测试
（4）偶然性。测试的命题、受试者的临场发挥以及评卷等过程中总有一些偶然性的因素。特别是学校的一般性考试，常出现命题不合理、受试者猜中试题，或受试者自身原因，临场未能正常发挥，使具有相同语言能力的人言语表现出了差异。
二、语言测试的环节
1、规划设计阶段 2、操作实施阶段 3、阅卷评分 4、后效研究

2第一章语言测试的性质,目的及其类别

15
诊断测试和成绩测试
诊断测试可以用来考查单个的语言项目（如语序），也可以是综合性的，其目的是为了改进教学，调整教学计划，进行个别指导。

成绩测试是回顾以前，水平测试主要是展望未来，同时也注意过去，而潜能测试只是预见未来。
16

3.按考试方式来分：
分离式测试（discrete-point test）:把知识和能力分解为若干小的单位，如集中考查语言的某一方面，或考查学生单方面的技能。综合性测试（integrative test）：听写、完形填空、写作、翻译。
在外语教学领域我们感兴趣的是学生的语言能力而学生的语言能力属于人的心理特征是无法直接测量的但是人的心理活动语言能力属于人的心理特征是无法直接测量的但是人的心理活动会在人的具体活动和行为中体现出来所以只能通过测量其外显行为会在人的具体活动和行为中体现出来所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低或外在表现特征来推论一个学生语言能力的高低指派数字或符号
语言测试及方法
李君丽
● 湖南涉外经济学院外国语学院 ● 2017.02.16
一、语言测试的性质、目的

作为老师，几乎天天和测试打交道。如：讲新课之前，要抽出几分钟的时间复习一下上一课学过的内容，或者听写单词或者听写句子等；每学完一课书，要检查学生对本课掌握的情况；学期中间，一般要进行期中考试，期末有期末考试，等等。因此，教学离不开测试。
11
1.2 语言测试的目的

具体用途：
1.诊断及反馈 2 . 筛选或选拨 3 .编班 4 .科研或调查 ......
12
1.3 语言测试的类别

语言测试教案1

一语言测试的性质1 测量语言测试是一种测量1．1测量的要素：测度、数字系统、测量单位、零点、手段●测度测量的对象所具有的可测量的属性。

如，方桌可以测量其长度、宽度、高度；西瓜可以测量其大小或重量。

●数字系统测量事物所得的结果必须用某个数字来表示，可以是正数、负数、零，也可以是小数。

●测量单位测量对象的性质不同，测量所得的数字往往用不同的单位来表示。

测量长度可以用米、公分等做单位，测量重量则用千克、克等做单位，商品的价格用元、角等做单位。

●零点测量事物计算数量的起点（不等于“没有”或“无”）。

两条不知起点的道路是不能测量长短的，也是不能比较长短的。

●手段测量事物所凭借的工具、方法。

测量长度用尺子（“一箭之地”），测量重量用天平（“重如泰山”），测量语言水平用什么？以上诸要素中，测度是本质、根本，是所有的测量所必需的。

1．2四种量表（scale）：称名量表、顺序量表、等距量表、比率量表●称名量表（nominal scale）把测量对象分成不同的类别。

●顺序量表（ordinal scale）不仅把测量对象分成不同的类别，而且要将不同的对象进行排序，建立起大小、高低的顺序关系。

●等距量表（interval scale）不仅把测量对象分成不同的类别、进行排序，而且表示出不同对象之间距离的大小，距离用一定的数量单位表示，还须要规定一个相对的零点。

●比率量表（ratio scale）比率量表与其他量表的最大区别是它具有绝对的零点。

测量重量、长度、面积或体积所得到的量表就是比率量表。

四种量表性质的比较：property nominal ordinal interval ratio Distinctiveness ＋＋＋＋Ordering －＋＋＋Equal interval －－＋＋Absolute zero point －－－＋2 语言测试的对象语言测试所测的是人的语言能力，它表现为人使用（包括接受和产出）语言时的心理活动及其表现。

语言测试类型知识点总结

语言测试类型知识点总结语言测试的种类有很多，比如笔试、口试、听力测试、阅读测试等。

在进行语言测试时，需要根据测试的目的选择合适的测试方法和评分标准。

不同的语言测试项目需要测试不同的语言技能，比如词汇、语法、听力、口语、阅读、写作等。

下面我们将逐一介绍这些语言测试中的知识点。

一、词汇词汇是语言的基本组成部分，它是语言运用的基础。

在语言测试中，词汇测试通常包括词义、词性、词组、短语、语境等方面的考察。

测试者需要掌握词汇的拼写、发音、用法和搭配等方面的知识。

1、词义：词义是词汇的基本含义，它是词汇测试的重点内容之一。

测试者需要掌握词汇的基本含义，了解常用词汇的多种含义和用法。

2、词性：词性是词汇的重要属性，它决定了词汇的用法和搭配。

测试者需要掌握各种词性的词汇，理解它们在语言中的作用和用法。

3、词组和短语：词组和短语是语言中常用的固定搭配，它们在语言测试中也是重点内容之一。

测试者需要掌握常用的词组和短语，了解它们的意义和用法。

4、语境：语境是词汇使用的重要依据，它可以帮助理解词汇的含义和用法。

测试者需要在不同的语境中运用词汇，理解它们的具体含义和用法。

二、语法语法是语言的基本规则，它决定了语言的结构和用法。

在语言测试中，语法通常包括句子结构、时态、语态、语气、语序、主谓一致、形容词和副词的比较级和最高级、连词、代词等方面的考察。

1、句子结构：句子结构是语法的基本内容之一，它是语言表达的基本单位。

测试者需要掌握不同类型的句子结构，了解它们的构成和用法。

2、时态：时态是表示动作发生时间的一种语法形式，它在语言测试中也是重点内容之一。

测试者需要掌握各种时态的用法，理解它们的差异和应用场合。

3、语态：语态是表示句子主语和谓语之间关系的一种语法形式，它在语言测试中也是重点内容之一。

测试者需要掌握各种语态的用法，了解它们在句子中的作用和区别。

4、语气：语气是表示说话者的语气和情绪的一种语法形式，它在语言测试中也是重点内容之一。

语言测试主要内容资料讲解

语言测试主要内容考试信度：考分的一致性。

考试效度：考试达到其预期测试意图的程度。

交互性：指在考试所设计的任务中学生的参与程度。

直接考试：学生被要求直接运用被试的技能或能力。

间接考试：测试那些相关技能、以达到评估能力的目的。

诊断考试：此类考试旨在了解学生在某个阶段中学习上的长处与短处，其最终目的是为了给教师提供教学效果或质量方面的信息。

整体评分法：把作文视作一完整的篇章，根据对其总体印象打分。

原始分数：未经处理或未加权重的分数。

考试：用来获取某些行为的方法，其目的是从这些行为中推断出个人具有的某些特征。

1.根据考试的方式，考试的分类：1直接考试(①侧重考试形式的真实性②便于从总体上考查产出性技能，如口语能力、写作能力、翻译能力等③从命题人员的角度出发,直接考试具有比较明确的测试目标)2间接考试(①不强调考试形式上的真实性,即考试形式无需与实际语用环境相一致②由于不受语用环境的限制,所选择测试的技能可以更具有代表性和概括性③间接考试可选用多项选择题型,可以提高考试信度。

)2.常用的口试形式及特点：①朗读：学生事先在规定时间里浏览朗读材料，然后朗读。

材料的长度视考试难度或学生水平而定，可以是单句，也可以是段落。

但是，朗读作为口试形式只测试学生的语音语调等，无法检查整体口语能力。

②看图说话：给学生一幅或多幅图片，让他们描绘或叙述图中所发生的事件。

③简短说话：是一种弹性口试形式，即在难度上有伸缩性，可以是一个三言两语的形式，也可以是一个时间较长的形式。

④对话：在一个假设情景中进行，学生之间或学生与考官之间根据情景要求进行对话。

对话者既要运用一些常用会话技能，同时还要运用解决沟通问题的技能。

⑤小组讨论：学生们就一个话题展开交流，一般控制在三四个人左右。

⑥面试型口试：基本上采取问答形式，但又不同于简单的一问一答形式。

考官通过各种提问技巧，从多个层面来观察学生的口语能力。

3.如何评阅作文，特点？⑴整体评分法①节省评阅时间②阅卷人员注重作文的整体质量③它的问题主要表现在阅卷人员对标准的理解和掌握上，以及所定档次标准瑜现实作文之间的吻合性。

测试的目的和类别

一、测试的目的对外汉语测试的目的，概括的讲，就是为考查
汉语作为第二语言的应试者是否具备完成某项特定任务所需的汉语能力。不同类型的测试有着不同的测试目的，比如潜能测试的目的，在于预测汉语作为第二语言的学习者是否具备学习汉语的潜在素质，即看他是否具备学习汉语的潜力和天赋。成绩测试的目的，在于衡量学习者对某一汉语课程内容的掌握程度。水平测试的目的，则是考查学习者的汉语能力是否达到了规定的标准和要求。
二、测试的类别
不同的分类标准有: 1、测试目的 2、测试命题方式 3、判卷评分方式 4、反应成绩的方式其中最主要的划分标准是测试目的。
1、测试目的
（1）成绩测试成绩测试是考查学生学习学习某一汉语课程一段时间后，对所学课程内容掌握程度的测试。其突出特点是测试内容不超过教学大纲、教学计划及所用教材范围，教什么，考什么。（2）水平测试水平测试的内容和范围不受某一课程教学大纲、教学计划化和使用教材的限制，也不考虑不同学习者学习时间、学习地点和学习程度的不同。它关心的是学习者现有的汉语熟练程度能否保证他在未来完成特定的汉语交际任务。测试内容广泛，涉及汉语的语音、词汇。语法、汉字等各语言要素和汉语的听、说、读、写等各项技能。
2）综合性测试指将各种汉语知识和语言技能综合在一份试卷或一个试题中，以全面地考查汉语学习者的语言能力的一种测试。优点：可以全面考查汉语学习者的语言能力，尤其是综合运用汉语的能力。不足：评分标准不好掌握，实施过程费时费力。
3、判卷评分方式
（1）主观性测试指试题的答案比较灵活，可能不止一个，评分时需要评卷人对考生的做大情况做出主观性判断的测试。比如：留学生的写作测试、口语测试。优点:便于深度性的汉语考查，命题方便，题量少，耗时短;利于防止猜测得分。不足：考查范围受到限制；评阅工作量大；评分结果难以达到高度一致。（2）客观性测试指试题有固定的标准答案，评分客观可靠，不受评阅人主观因素影响的测试。比如：多项选择题、判断题。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

3

测量这一定义包含三个要素
1) 事物及其属性。
这是测量的对象或目标。上面提到的对桌子的高度进行测量，属于对物体进行测量，其属性——高度，是可以观察到的，可以进行客观测量的。在外语教学领域，我们感兴趣的是学生的语言能力，而学生的语言能力属于人的心理特征，是无法直接测量的，但是人的心理活动会在人的具体活动和行为中体现出来，所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低
语言测试及方法
李君丽
● 湖南涉外经济学院外国语学院 ● 2017.02.16
一、语言测试的性质、目的

作为老师，几乎天天和测试打交道。如：讲新课之前，要抽出几分钟的时间复习一下上一课学过的内容，或者听写单词或者听写句子等；每学完一课书，要检查学生对本课掌握的情况；学期中间，一般要进行期中考试，期末有期末考试，等等。因此，教学离不开测试。
4

3) 法则

法则是指测量所依据的规则和方法，是测量的关键。法则不好或不可靠，得到的测量结果就会出偏差，失去测量的意义。简单来说，尺子不准，测量的结果就无法使人信服。对客观世界的物体进行测量时，由于有公认的测量法则或尺度，如测量物体的高度、重量等；一般不会出现大的偏差。而对人的某些特性（心理特征）进行测量时，则往往会出现较大的偏差。举例来讲，有几个评委对某学生的英语口语进行评定。评委A认为一个人的口语要好，必须发音准确，而该学生的发音好，所以他给打了个5分。评委B认为流利性最能体现一个人的口语水平，该同学尽管发音不错，但流利性差一些，所以她给他3分。同一名学生，让不同的评委去打分，成绩出现了偏差。这也很自然，原因是他们没有按照一个评定口语成绩的统一法则（rules）去给这名学生打分，结果造成了偏差。这个例子提醒我们，在对人的某些心理特征，如口语表达能力、阅读理解能力等等进行测量时，首先要制定一个便于操作的，稳定的法则或标准。这样得到的测量结果才可靠，才具有可比性。

1.1 几个基本概念

1.测量 (Measurement) 2.考试（Test） 3. 评价( Evaluation )
1．测量。什么是测量？ Stevens（195）认为，“广义而言，测量（measurement）就是根据法则赋予事物数量。”也就是说，按照一定的规则给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲，要测量一下桌子的高度，我们可以拿尺子来量一量，看看它有多高。尺子是人们根据一定的法则制定的量具，利用它就可以把事物的属性，即桌子的高度用数字表示出来，如，0.75米。这种测量属于客观测量，因为它基本上不受观察者的主观判断的影响。

2) 指派数字或符号。
所谓指派数字或符号，就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87分，李四得了92分，我们说李四比张三多考了5分。数字本身没有意义，只是一种符号。我我们用它来代表考生的阅读成绩，这时它就变成了量化的数，可以对其进行解释和分析。在一定的条件下，还可以对数据进行运算从而对事物的属性进行推测。
8
测量，测试和评价的关系？
评价 1 测量
2
测试 3 4
5
9
测量，测试和评价的关系？
源自1.我们在对某教育目标（或学生的行为）作出评价时不一定用到测试或测量（如面积1所示），这种评价属于质量评价，或叫定性评价。 2.如指出学生在学习方面存在的问题。有时在作出评价时只需测量，而无需测试（如面积2所示），对学生的口头表达能力定出级别就属于这种性质的评价。 3.如果要检查学生学习的进步情况，通常就要对学生实施测试，这又是另一种性质的评价，即只通过测试对学生的成绩作出评价（如面积3所示）。 4.许多情况下，测试只是作为一种科研的工具或手段，而不是用来作出评价（如面积4所示）， 5.在外语教学、第二语言习得研究领域，我们经常拿水平测试作为研究的工具。不用测试便可进行测量的情况（如面积5所示）
5

2．测试测试（test）又称测验。
不同的心理学家对此下的定义不同。Anastasi（1982）认为，“测试实质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公认的最权威的定义，它包含以下三个基本要素：
1) 行为样本

语言测试的目的是要测量受试者的语言能力。上面提到，语言能力是无形的，如何测量？只能测量它的有形表现，这里所说的有形表现，是指语言表现，如说出来的话，写出来的句子，对测试题目所做的各种反应等等、这些行为，都是无形的语言能力的有形表现，用心理学术语叫“表征”（manifestation）。所谓行为样本，是指对语言能力表现行为的有效的抽样。我们知道，一个人的语言能力的表现行为会有各种各样的形式，测试时不可能也没有必要把它的全部表现行为都测到，只能选取一部分有代表性的抽样进行测量，然后据此对受试者的语言能力作出推测。

7

3．评价
Weiss（1972）认为，“评价（evaluation）是指为作出某种决策而收集资料，并对资料进行分析，作出解释的系统过程。”与测量、测试相比，评价的含义更广、综合性更强。Bachman（1990）指出，决策的正确与否，一方面取决与决策者本身的能力，另一方面则取决于收集到的信息的质量。在其它条件等同的情况下，如果收集到的信息越可靠，相关性越强，那么，作出正确决策的可能性就越大。所以说，评价的一个很重要的方面就是要获得可靠的、相关的信息。在谈到评价与测量及测试的关系时，Bachman 指出，在对个体（学生）作出评价时，我们可以从质量和数量两个方面进行描述，或只描述其中一个方面。所谓质量方面的描述是指对学生的行为作出定性的描述，如某某学生的口头表达能力优秀，书面表达能力优等；数量方面的描述则是指某次测验的分数等。
6

2 ) 客观的测量所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价：⑴ 测试题目的难易度和区分度如何；⑵ 测试结果的可靠性程度如何？⑶ 测试结果的有效性如何？这几项指标是衡量一项测试质量的重要指标。 3) 标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样，测试才有统一的标准，对不同人的测量结果才有可比性。凡是不标准化的测量，都没有可比性。