语言测试主要内容.docx

考试信度：考分的一致性。考试效度：考试达到其预期测试意图的程度。交互性：指在考试所设计的任务中学生的参与程度。直接考试：学生被要求直接运用被试的技能或能力。间接考试：测试那些相关技能、以达到评估能力的目的。诊断考试：此类考试旨在了解学生在某个阶段中学习上的长处与短处，其最终目的是为了给教师提供教学效果或质量方面的信息。整体评分法：把作文视作一完整的篇章，根据对其总体印象打分。原始分数：未经处理或未加权重的分数。考试：用来获取某些行为的方法，其目的是从这些行为中推断出个人具有的某些特征。

1.根据考试的方式，考试的分类：1直接考试(①侧重考试形式的真实性②便于从总体上考查产出性技能，如口语能力、写作能力、翻译能力等③从命题人员的角度出发,直接考试具有比较明确的测试目标)2间接考试(①不强调考试形式上的真实性,即考试形式无需与实际语用环境相一致②由于不受语用环境的限制,所选择测试的技能可以更具有代表性和概括性③间接考试可选用多项选择题型,可以提高考试信度。)

2.常用的口试形式及特点：①朗读：学生事先在规定时间里浏览朗读材料，然后朗读。材料的长度视考试难度或学生水平而定，可以是单句，也可以是段落。但是，朗读作为口试形式只测试学生的语音语调等，无法检查整体口语能力。②看图说话：给学生一幅或多幅图片，让他们描绘或叙述图中所发生的事件。③简短说话：是一种弹性口试形式，即在难度上有伸缩性，可以是一个三言两语的形式，也可以是一个时间较长的形式。④对话：在一个假设情景中进行，学生之间或学生与考官之间根据情景要求进行对话。对话者既要运用一些常用会话技能，同时还要运用解决沟通问题的技能。⑤小组讨论：学生们就一个话题展开交流，一般控制在三四个人左右。⑥面试型口试：基本上采取问答形式，但又不同于简单的一问一答形式。考官通过各种提问技巧，从多个层面来观察学生的口语能力。

3.如何评阅作文，特点？⑴整体评分法①节省评阅时间②阅卷人员注重作文的整体质量③它的问题主要表现在阅卷人员对标准的理解和掌握上，以及所定档次标准瑜现实作文之间的吻合性。⑵分析评分法①阅卷人员明确具体评分方面②组成部分之间的评分不相互干扰或影响③其存在的第一个问题是把写作能力人为地分割成互不关联的部分④第二个问题起源于第一个问题，写作能力划成单独的部分后就涉及分值分配，即某个部分占总分的比例，这样的比例分配值得进一步商榷。两种评分标准的使用场合：要考虑三个因素：阅卷时间、阅卷方式、阅卷人员的经验。在阅卷时间较紧的情况下，最好采用整体评分法，比较省时。集中阅卷时用整体评分法较合适，因为便于两人或三人交换打分。分散阅卷最好使用分析评分法，分项评分可以减少评分盲目性和任意性。如果阅卷人员经过培训，并且有过去阅卷的良好记录，则可采用整体评分法。若阅卷人员大都没有阅卷经验，采用分析评分法较为妥当。四种语言测试方法：写作-翻译法, 主要特征：Ａ、对测试的技能或专长没有特殊的要求，主要依靠教师的主观判断力；Ｂ、试卷通常包括翻译、写作和语法分析等项目；Ｃ、试卷内容带有较浓厚的文学或文化色彩；Ｄ、试题一般采用书面回答形似，试卷需人工评阅。由于写作-翻译法全以教师或命题人员的经验和主观判断来确定，没有什么科学理论依据，故20世纪40年代以前的测试统称为科学前语言测试。结构主义/心理测试法, 主要特征：Ａ、一道题可以单独测试一个语言成分或技能：以结构主义语言学为其理论基础；强调不同的语言成分可以分别测试，比如语音、语法和词汇都可以脱离上下文进行单独的测试；Ｂ、采纳了心理测量学的一些方法，强调语言测量的可靠性和客观性。

代表题型：多项选择题，一题测一分，适合进行考后统计分析。综合测试法, 主要特征：Ａ、语言测试要在一定的上下文（context）中进行；Ｂ、不在测试中可以追求区分各单项语言成分、技能或能力、强调两项或两项以上的综合评代表题型：完形填空交际测试法Ａ、考试内设计“信息沟”，要求学生通过各种已溃入的信息来获取未知信息；Ｂ、考试任务或项目之间存在关联性，即一个项目要在另一个项目的基础上完成；Ｃ、考试强调针对性，根据学生的具体需要设计考试内容；Ｄ、侧重更广泛地测试语言能力，包括语言知识、语言功能、语言使用的合适性等Ｅ、考试采用定性评估方式，以取代纯粹的定量评估方式或作为补充。交际法与综合法在某种程度上有相似之处，即两者都强调语言的意义而不是语言的形式和结构；区别在于交际法更注重语言在交际中的使用。

测量：根据明确的程序和规则量化研究对象特征的过程。评估：为决策而系统地收集信息的过程。考试功能：教学功能，科研功能根据考试目的分类：水平考试，学业考试，分级考试，诊断考试根据语言测量形式分类：分离式考试，综合式考试测试考试信度的方法：①重复测试法②平行卷测试法③对半分析法表面效度：表面可信度或公众可接受度。效度与信度的关系：一个考试要具有效度的话，首先必须具有信度。信度是保证考试效度的必备条件之一。考试要素：考试信度，考试效度，真实性，交互性，后效作用，可操作性正误判断题：通过正误判断来检查学生对某一细节的理解,或对某一概念的掌握等。

匹配题：可用来考核词汇知识、语法知识、对概念的理解、事实或观点之间的关联等。多项选择是目前考试中用途最广，最常见的考试形式。组成：题干，备选项补全句子：语法，交际能力完形填空题：一般按照两条原则删除单词或词组，固定删除(按照固定间隔删除-每隔6个单词删除一词)和选择删除(无提示型，提示型，首字母提示型，多项选择型，混合选择型) 转换题：1排序题(考查①学生对英语句子基本概念的掌握②对篇章的理解和篇章知识的运用) 2句型转换题(特点：①侧重在句子与段落层次上检查学生的语言水平②着重测试英语书面表达能力的某些方面) 阅读目的：生存目的,学习需要,休闲需要阅读方式：泛读，精读，跳读，寻读阅读技能包括：词汇知识，语法知识，以及各种篇章理解技能。选择答题类评估方法：1.正误判断题：可用来测试mechanical skills和language use 2.匹配题：可用于测试language use和organizational skills 论述题：由3部分组成：提示.题目.要求整体评分法：把作文视作一完整的篇章，根据对其总体印象打分。hearing指无意识地听到周围的声响或信息。listening指有意识地去听周围的声响或信息。听写：单句听写，段落听写口语活动的特点：①交互性②目的性③准语言性④非语言性⑤听力与口语的不可分割性口试评分标准：整体评分法+分析评分法成绩报告形式：百分制，等级制算术平均数，中位数，众数三者之间的关系：①当频数分布呈正偏态时(即平均数以下的分数多于平均数以上的分数)，算术平均数＞中位数＞众数②当频数分布呈负偏态时(即平均数以上的分数多于平均数以下的分

数)，算术平均数＜中位数＜众数区分度表明该题目能区分高分组和低分组学生的程度。

考试环境（1）考生对考试场地、使用的设备等是否熟悉。如果考生对考试的场地熟悉就会有安全感。如果考生熟悉使用的设备（如耳机）答题效果可能比使用不熟悉的设（如计算机）要好一些（2）考试涉及到的人员。如果监考人员是考生熟悉的老师等，考生一般都不会感到太紧张。3）考试时间。一般情况下，考生在早上比在午后或傍晚答题发挥的要好一些。（4）实施考试的条件。如考试周围有无噪音，气温、湿度的高低、座位的安排、光线的强弱等对考生都会有影响。考试指导语（1）试卷的组织结构。多数考试有几个部分组成，每一部分又包括许多项目和问题。题目的安排一般是由易到难。（2）时间的分排。在有些考试（如“速度测试”）中，时间安排得很紧，并非所有的考生都能完成所有的题目。这样，考生的分数一部分是由考生的水平决定的。另一部分则是由考生答题速度决定的。（3）题目要求。它是以母语还是目标语言的形式出现，用口头还是书面语的方式，或二者兼有。研究发现，题目要求不清楚或不准确都会使考生产生焦虑感，从而影响考生的水平发挥。考试语言馈入性质（1）语言材料是通过听觉还是视觉渠道输入的。还是两者方式都有2）输入的是语言材料还是非语言材料（如看图作文）（3）材料是否经过改写。4）输入材料的速度（如听力速度的快慢）。5）问题表达的明确与否。6）使用权用语言的性质，即语言的长度、信息的分布（紧缩的还是分散的）、信息的类型（抽象的还是个体的，事实性的还是非事实性的，肯定地还是否定的）。考试预期回答性质考试预期回答性质就是指答题方式。（1）采取什么样的形式（选择还是填空）。（2）回答的方式（语言的还是非语言的，还是两者兼有）。（3）使用语言的性质（母语还是目标语言溃入与回答的关系1）相互型(reciprocal)。指一个考生的语言对另一个考试的影响。如口试中两个考生为一组进行测试时，口语好的考生对口语差的考生有一定影响。（2）非相互型(non-reciprocal)。指语言使用者之间无相互影响。如在阅读考试中，考生对作者通常没有任何信息反馈（3）相互顺应型(adaptive)。指答题影响到试题的输入，但无反馈。在电脑顺应性测试中，电脑提供给考生的题目其难易程度是由考生完成前一个题目的好坏情况决定的。

英语测试的发展阶段

1 Pre-scientific stage This stage refers to the period that lasted to 1950s. At that time the foreign language teaching put emphasis on the written form rather than on the communicative aspect of the language. No special skill or expertise in testing was required: the subjective judgment of the teacher was considered to be of paramount importance. Test usually consisted of essay writing, translation, grammatical analysis and sometimes oral tests. Spolsky calls the traditional approach pre-scientific because it paid no attention to such matters as reliability and objectivity and didn’t use statistical methods.

2 Psychometric--structure stage The dominant testing form in the 1950s and 1960s was psychometric--structural approach. American linguist, Robert Lado, one of the first testing scholar, stressed on two points with an aim to establish an objective aspect of measuring human language proficiency: First, test should test language usages and not knowledge about language. Second, the structures to be tested should be valid structures in colloquial language use. The structural sentence-based view of language fitted in quite well with the psychometric quest for samples of individual elements to be tested. This resulted in standardized tests with an emphasis on discrete point items, which can be further divided into subtests. The tests are characterized by the conviction that testing can be objective, precise, reliable and scientific. The multiple-choice format was regarded as a satisfactory instrument in measuring the proficiency in the comprehension of written English.

3 Psycholinguistic—sociolinguistic stage This stage is a period that covers the 1960s and 1970s when Noam Chomsky’s linguistics theory swayed the basis of structuralism. This involves the testing of language in context and is thus concerned primarily with meaning and the total communicative effect of the discourse. As early as 1961, John B. Carroll emphasized that, in addition to discrete point tests, integrative tests should be used, these are tests which are not so much aimed at testing separate elements but measuring the total communicative effect of an utterance. The integrative test does not seek to separate the language skills into neat divisions to improve test reliability; instead, they are often designed to assess the learner’s ability to use two or more skills simultaneously. Integrative test is best characterized by the use of close testing and of dictation. Oral interview, translation and essay writing are also included in integrative tests.

4Communicative pragmatic stage The communicative pragmatic period began to occur corresponding with the global shift since 1970s to the communicative aspect of language in the international educational circle. The rise of the sociolinguistics has brought about a shift to the interest from linguistic competence to communicative competence. The communicative test aims to measure candidates’ communicative competency. Communicative competency is associated not only with the linguistic competence, but also with the communicative competence. The communicative test is characterized by the strong emphasis on actual use of language in real-life settings which have to be based on the communicative needs of the learners.