语言测试的分类

语言测试的分类
语言测试的分类

第一章语言测试的分类

语言测试的分类决定着测试的形式,题目的类型。语言测试大体上可以从用途、构建、考察重点、评分方式、对测试分数的解释等方面进行分类。正如Henning(2001)指出的,语言测试有多少个目的,就会有多少种测试类别。语言测试的分类能够帮我们弄清“为什么测试?”、“测试什么?”、“怎样测试?”等问题。对于语言测试类型的了解能够帮助教师更有效地组织测试,更好地实现英语语言测试的信度和效度,更科学地根据测试的目的权衡信度、效度之间的关系。

第一节以测试用途为标准的分类

从测试用途角度进行分类,大致可以将语言测试分为五种测试形式,即水平测试(proficiency tests)、成绩测试(achievement tests)、分级测试(placement tests)、潜能测试(apititude tests)和诊断性测试(diagnostic tests)。

1. 水平测试(proficiency tests)

水平测试是用来测量人们的某一语言能力,往往与被测试者先前所受的语言训练无关。水平测试多针对于来自不同学校,不同国家,不同语言背景的受试者,因此水平测试与他们过去的学习内容、课程目标、课程大纲等没有直接联系。这里的水平更强调以某一特定目标为基础的,对于语言的充分驾驭。水平测试的目的之一是用来选拔。这种选拔可以是为某一工作岗位进行的招聘,此时的测试目标着重于受试者能否胜任某一工作,测试内容往往与这一工作中的实际场景相关,如联合国译员考试。这种选拔也可以是升学选拔,此时的测试内容是向前看的,如测量学生是否具有足够的语言能力来跟上大学中的课程和学业,如美国的托福考试,英国的剑桥英语水平证书测试(University of Cambridge Certificate of Proficiency in English)等。大多数试题内容来自国外大学本科生教材。升学选拔水平测试在范围上有所区分,有的只是针对于大学中某一具体专业,如艺术专业;而有的则是针对于所有专业,如牛津EFL考试。现以雅思考试为例对水平测试做一具体说明。雅思即国际英语水平测试(International English Language Testing System),简称IELTS。IELTS的考试中心遍布全球105个国家。考试可分为两种类型,学术类和培训类。学术类IELTS(Academic IELTS)适合于计划申请报读国外高校本科或研究生课程的考生,专门测试考生是否具备一定的英语语言能力完成本科或研究生课程。因此如果计划出国留学深造或接受高等教育,应选择学术类IELTS考试。普通培训类IELTS(General Training)是针对去英语国家完成中学教育,学习非学位培训课程,以及赴加拿大、澳大利亚、新西兰等国移民定居的人员,主要测试在一般的社会和教育情景下的基本生存技能(basic survival skills)。因此如果计划完成初级教育,接受非学术类培训,工作或移民到英语国家,应选择培训类IELTS考试。IELTS考生需要参加听力、阅读、写作和口语四项测试。每项测试不同的技能。听力要求考生理解日常生活中的口语和非正式场合的口语,比如在讲座,研讨时使用的口语,雅思的听力部分就是测试考生在这方面做得如何;阅读部分主要考察考生从许多信息来源中快速、准确地收集找到主要信息的能力,此部分主要针对日后学习中常面对的问题,即在学习中没有时间阅读书单上所有的书。写作部分测试考生在收集和组织信息后,以文章或报告的形式表述想法的能力;口语部分测试考生谈论自己的情况,表达对各种问题看法的能力。总之,雅思的所有考试都面对今后学习中常出现的情况,即在时间紧迫的情况下寻找信息,快速思维,并恰当地做出反应。

我国的水平测试主要是全国公共英语等级考试,教育部和许多单位派遣出国留学人员的标准之一就是通过全国公共英语等级考试的第五级。

水平测试往往事关重大,因此在水平测试试卷的设计上一定要有信度和效度。很多水平测试都往往委托于专业的考试机构。同时水平测试的出题机构应广泛吸收应试者的见意,使水平测试具有正面的“回波效应”(backwash effect)。

2. 成绩测试(achievement tests)

成绩测试用来测量学生对于所学知识的掌握,与所学课程直接相关,目的在于评价学生个体、小组或班级在学习目标实现方面的成功度。成绩测试一般包括:终结性成绩测试(final achievement tests)和进程性成绩测试(progress achievement tests)。

终结性成绩测试在学科结束时进行。试卷命题一般由年级组、学校教务部门、教育部官方命题机构等负责。考试内容与教学内容相关。就考试内容而言可分为基于教学大纲的内容模式和基于教学目标的内容模式。前者的考试内容多数是学生所熟悉的,但问题在于如果大纲设计不合理或教材选取不当,考试结果将会误导师生。例如,某一课程目标是发展学生的口语能力,但是课程本身和测试内容是要求学生在充分的准备下发表对家乡、对天气的看法,那么测试结果就不能反映出学生是否达到了课程目标所要求的程度。基于教学目标的内容模式使测试内容与课程目标直接相关,其优势在于首先使课程设计者更精细地描述目标;其次使测试结果更好地反映学生是否达到了课程目标所要求的程度;同时对于大纲的制作和教材选择有更好地规范作用。Hughes认为:“它能为个人和群体的成绩提供更精确的信息,并为教学提供更有益的‘回波效应’(backwash effect)”(Hughes 2000:11)。

终结性成绩测试的试题一般是主观性和客观性试题相结合,试卷制作较为规范。每学年的期末考试、我国的中考及高考,严格来说都应属于终结性成绩测试,因为这些测试都是以教学大纲为内容的测试,并且试题多是检验学生对已学知识的掌握。

进程性成绩测试,顾名思义,是测量学生在学习过程中的进步。对于进程的衡量可以通过建立短期目标来实现。教师多采用突击测验的形式来检查学生的学习进程,并使学生时刻保持警觉。因此进程性成绩测试的试卷制作相对不太严格,每一份试卷都具有其独特性,并且多根据具体任课教师对班级成员的了解及其自身制定的阶段性目标为命题依据。进程性成绩测试作为一种有效的测试方法,能够对教学和学习动机产生有益的回波效应。好的进程性成绩测试能够鼓励学生学习目标语言并获得自信,还能推动学习并巩固已学知识。

成绩测试方法应当与教学中所使用的方法相一致。例如,教学中使用的是交际能力教学法,那么成绩测试的方法也应为交际能力测试方法而不是结构主义测试方法,否则就会导致考试不公平的问题。近年来对于标准化试题的争议多源自于测试方法与教学方法的分歧。目前,自我评估(self-assessment)测试方法逐渐融入到成绩测试中。所谓的“自我评估测试方法”就是鼓励学生参与到评估中,能对自己在不同情景中所表现出的语言能力给予评价。

3. 分级测试(placement tests)

分级测试是根据学生的不同能力将学生分为不同的等级或不同的班级。分级考试的试卷设计应当量体裁衣,即在分级测试前要弄清不同级别的主要教学特点,然后根据这些教学特点设计具体的测试内容。分级测试的试题难度应包括不同难度水平的题目,即遍布从最简单到最难题目的两极之间。对于百分制的测试而言,最好以10分为一个段,每个分数段都有学生,以便于分班。分级测试符合现代教育理论所强调的因材施教,即针对不同水平的学生采取不同的教学方法和教学内容。但是分级测试也应考虑学生的心理承受能力,避免挫伤学习者的学习积极性。分班分级所导致的压力不仅影响到学习能力较弱的学生,也会影响到尖子班里的优秀生。心理学研究表明,压力大造成的过强学习动机反而会使学习者心情过分紧张、焦虑、影响记忆理解能力。因此如何恰当地使用这一测试方法,还有待于进一步的探讨。

4. 潜能测试(apititude tests)

语言潜能测试也叫做预测性测试(prognostic tests),是通过衡量学生在一门陌生语言中的语言表现,以预测其是否有学好这门语言的潜力。语言学习潜力受到多方面因素的影响,如智商、年龄、动机、记忆力、语言敏感度和语法结构敏感度等。语言潜能测试与之前所学的知识无关,很多情况下是学生以前从未接触过的语言。一些专家认为在实际操作中不太可能对应试者的语言潜能进行全面的测试,因此多数测试只是衡量考生某一部分的潜能如听、译领域的潜能。词汇测试常被认为是有效的潜能测试方法,因其与智商紧密相连并且能反应出应试者对这一领域的兴趣。测试语言多采用人工语言,多关注音位区分能力和系统运用语言结构的能力,潜能测试题目数量较多,如The Modern Language Aptitude Test。

5. 诊断性测试(diagnostic tests)

诊断性测试用来识别学生在学习方面的优势和劣势,从而确定未来的教学走向。诊断性测试较关注于学生在哪些方面犯了错误,并借此找出补救的办法。从广义上说,诊断性测试可以帮助改进教学,调整教学计划,进行个别指导。

现行课堂中采用的诊断性测试多是教师根据教学重点、难点及本班实际情况自行进行的小测验,从而及时发现学生的问题,尤其是普遍性问题,以此给教师提供依据,对前一阶段的教学进行反思,对今后的教学给予指导。这种诊断性测试得分应在平均80%以上,以鼓励学生的学习。“诊断性测试可以作为形成性评价的组成部分,将一个学期的试卷存入学习档案就会使学生清楚地看到自己的学习进展情况”(武尊民2008:32)。

这种课堂上的诊断性测试,从本质上来说,与成绩测试尤其是进程性成绩测试相吻合。正如Heaton所说:“尽管诊断性测试的术语被广泛使用,但几乎没有什么测试是只被做为诊断性测试而构建的”(Heaton 2000:173)。成绩测试和水平测试经常被用于诊断性测试之中。原因在于,从大的方面,例如从语言技巧的角度而言,一套综合性试卷就可以帮助我们判断某一学生在听说读写译五个方面哪个方面最强,哪个方面最弱。在写作和口语方面,在现有的成绩测试和水平测试中,我们也可以根据测量标准,很容易地判断出学生在写作或口语中较弱的方面,例如词汇匮乏,或是不能较好地使用连接手段等。但是对于非常具体的内容,现有的测试手段和模式很难构建出真正具有诊断性特征的测试内容。例如,对于语法方面的考察,就缺少真正意义上的诊断性测试。假设我们想诊断学生是否具有对某两种相似语法结构或时态进行区分的能力,那么数量太少的题目尤其是选择题则不能实现诊断的信度和效度,因为样本过少则不能排除运气及猜题之嫌。此时的样本应尽可能的丰富,并应包含每一种它们能够实际应用的情景。但是,大量的样本之需常常使试题出题人和使用者避而远之。那么,是不是因此就要遗弃单纯的诊断性测试呢?显而易见,诊断性测试本身的意义就已否认了这种观点。尤其是在现代社会,人们大力提倡终生学习,自主学习。诊断性测试对于自主学习的意义是巨大而又明显的。对于这种矛盾的解决方法就要向计算机系统寻求帮助了。

第二节以测试构建为标准的分类

从测试构建的角度进行分类,英语语言测试可以分为直接测试(direct tests)和间接测试(indirect tests)。换句话说,这种分类形式取决于测试者是想直接地测量语言实际运用能力,还是想间接地反映出某种语言能力。

1. 直接测试(direct tests)

当某一测试使应试者精确并直接地表现出我们想要测量的能力时,那么该测试就被视为直接测试。直接测试的结果能够直接反映应试者在某一方面的语言能力。如我们想考察学生的写作能力,就可以让他写一篇作文。再比如我们想考察学生的语音语调,就可以让他读一

小段文章。直接测试较适用于产出性的语言技能,如阅读和写作。

直接测试的优势在于:首先,如果我们很清楚想要测量的语言能力有哪些,那么就可以相对直接地创造出相应的情景,使考生产出的行为在该能力所要求的行为范围之内;其次,对于产出性技能,很容易直接地给予评估和阐释;此外,对于直接测试的准备则会督促考生多次训练相应的技能,对教学和学习有很好的回波效应。

直接测试的选材要求尽可能真实,最理想的考试环境应当是现实中的实际环境而非人为策划出来的交际环境。因此这也是直接测试的瓶颈所在。因为任何的现行的直接测试从本质上来说都不可能是完全真实的。McNamara(2003)曾举过这样的例子来说明这个问题,在为移民健康从业人员进行的英语口语测试中,所设置的对话、角色扮演都发生在医生和患者之间,场景相对真实,但是显而易见这种行为本身并不存在,医生并不是真正地在向患者提供服务。McNamara进一步引用一位著名作家的话来解释这一点,即“每个人都意识到评估口语能力的对话只是一种测试而不是真的发生在茶话会上(tea party)”(McNamara 2003:9)。Henning也曾指出:“许多语言测试都应被视为自然场景(natural-situational)到非自然策划场景(unnatural-contrived)所构成的连续体(continuum)当中的一点”(Henning 2001:5)。因此,测试的直接性只是相对而言,例如口语中的采访形式要比完形填空直接;语境化的词汇测试要比同义词匹配自然直接。

就信度和效度而言,直接测试效度好而信度差。直接测试能更为直观地反映出考生的语言能力,接近真实生活中的语言表现,因此效度好。但是由于直接测试的题目往往是主观性测试题目,因此评分所具有的主观性相对较高,导致其信度较差。

直接性测试要避免场景构建失真,同时要注意简化的评分方式也会影响有价值的直接语言能力数据。

2. 间接测试(indirect tests)

间接地观察言语行为的测试称为间接测试。间接测试的结果不能直接反映语言能力,但是可以提供判断语言能力的信息。Lado在1961年提出了间接测试语言能力的一种方法,即让学生判断所给出的词汇中哪些词汇可以构成同音词汇对。这种题型在我国初、高中英语测试中广泛应用,即给出一个词,然后让学生从四个选项中选出一个与所给出词汇发音相同的词。

间接性测试的优势在于适用范围较广,并且其结果也更具概况性。但问题在于如何判断某一能力的构成成分,这些构成成分的测试分数是否能够真正反映出考生对该能力的掌握程度。在实际操作中,如语法知识的考察中,间接性测试只能从语法单项中进行取样测试,考试结果只能反映所取样的内容,而不能说明所有语法知识的掌握程度。间接性测试与直接性测试相比较效度差,但信度高,这主要是由于间接性测试多采用客观性试题。

对于直接性测试和间接性测试的选择受成本效益、信度和效度等因素的影响。

第三节以考察重点为标准的分类

John. B. Carroll(1961)首先提出了分立式测试(discrete point tests)和综合性测试(integrative tests)之分。这两种测试的差别在于考察重点的不同。

1. 分立式测试(discrete point tests)

分立式测试是将知识和能力分成若干小的单元,然后一项一项地进行测量。因此分立式测试具有诊断性的意义。分立式测试受到结构主义理论的影响,即语言有许多成分组成,掌握一种语言就是要掌握这些组成成分。分立式测试的每个题目一般只考查一个语言点,而且多采用单项选择的形式。

例如:Before the first non-stop flight was made in 1949, it ___ necessary for all planes to land for refuelling.

A.would be

B. has been

C. had been

D. would have been

(1996年1月CET-4:25题)

这道题主要考察如果before引导的时间状语从句是一般过去时,那么主句的时态应为过去完成时态。

分立式测试试题应避免在单项选择中设置两个以上的考点。

例如:Research findings show we spend about two hours ____ every night, no matter what we ____ during the day.

A. dream, must have done

B. dreaming, should have done

C. dream, would have done

D. dreaming, may have done

对于这道题,学生如果答对,则可以判断出学生掌握了spend sth doing sth的用法,同时又掌握了虚拟语气中may have done的用法。但是如果答错,则很难判断学生知道什么不知道什么。

2. 综合性测试(integrative tests)

综合性测试用来同时测量学生的多种语言能力,需要考生综合多种语言能力来完成某一语言任务。因此综合性测试不具有诊断性的意义。综合性测试是一种较为流行的测试形式,包括无选项完形填空、听写、口语面试、写作、记笔记、翻译等

例如:PETS5级第二部分中的英语知识应用部分就属于综合性测试。这部分采用无选项完形填空的形式,在一篇250-300词的文章中留出20个空白,要求考生根据短文内容填空,使补全后的文章意思通顺、前后连贯、结构完整。其中约有12题考查语法和语段结构,8题考查词汇。考试大纲中明确了这部分的考查目的,即该部分不仅考查学生对诸如连贯性和一致性等语段特征的辨识能力,还考查学生对用于一定语境中规范的语言成分的掌握,这些规范的语言成分主要是词汇和语法结构。

现举一小段为例:

Mrs. Thomas believes that the ___ between older and younger writers is ___ too dramatic to be accounted for simply by the possibility that people get better at writing as they grow ___. She attributes it to a failure to teach the most effective methods, pointing out that the differences between ___ groups coincides with the abandonment of formal handwriting instruction in classrooms in the sixties. “The 30-year-olds showed a huge range of grips, ___ the over 40s group all had a uniform …tripod? grip.”(全国英语等级考试考试大纲第五级1999:27)考生要得分就必须首先读懂文章,因此会使用一定的阅读技能。考生要对文章所处的语境有一定的背景信息,在填空的过程中,考生要考虑所填词汇的形式,与前后文的搭配,还要考虑整篇文章的逻辑结构,连接手法等。考生还要掌握介词短语、转折词汇等的使用方法。在此段中,考生只有明白上文意义才能做出正确的判断。

第四节以评分方式为标准的分类

Pilliner(1968)指出,按照试卷评分方式的不同,英语语言测试可分为主观性测试(subjective tests)和客观性测试(objective tests)。

1. 主观性测试(subjective tests)

主观性测试和客观性测试的区别在于评分方式的不同。主观性测试需要评分人对答案做出观念性判断,这种判断往往基于评分人的经验和所受过的相关训练。主观性测试的题目主

要有简述题、翻译题、作文、口试等。但这些题目在主观性的程度上有所不同,例如自由写作比基于阅读的简答题明显具有更高的主观性。主观性测试由于需要评分人做出主观性的判断,因此在信度上明显稍差。一篇作文,让不同的评分人去评阅,就会出现不同的分数,甚至相差很多的分数,这主要是由于评分人的观点、知识背景等各不相同。信度是主观性测试一直追求的目标。实现主观性测试的信度主要要考虑以下几点:①对评分人给予足够的培训。主观性测试的评分人最好要有相关的经验,在每次评分前,都要针对本次测试的主观性试题进行培训,以熟悉试题内容、评分标准。同时还要进行试评,每轮试评后,应对每一位评分人的评分结果进行分析,如果某位评分人的分数总是与标准分数相差甚远或不符合标准,则应不再使用该评分人。以雅思为例,根据《IELTS评分、分数报告和解释》,对于受考官主观性影响较强的写作和口语考试部分,IELTS官方强调:考官均须按照已制定的明确标准进行招聘及培训,且须每两年接受检验证明其评分符合标准。②在评分初始,就要确定可接受的答案,考试结束后应该立即选样。例如作文测试,应当选取不同层次的样本,供评分人进行讨论,当所有评分人意见一致后,才可以进行大规模评阅。对于简述题、翻译题等,考试结束后也应当立即选取一定数量的样本,在试评中应注意把握不准是否给分的语言点,尤其是共性的问题,然后进行讨论订立标准,并告知所有评分人引起他们的注意。③使用多名独立评分人。一般来说,对于主观题应至少有两名独立评分人,两人应在不知道对方所给分数的前提下进行各自的评分,最后由他人汇总两位评分人的分数,进行比较。如果相差太大,则退回重评或交予权威专家进行评判。④避免给予应试者过多选择的权利。在主观性测试中,应避免让考生从一系列题目中选取某一题目回答。例如,在写作中提供多个题目,让学生从中选取一个题目进行写作,这只会干扰测试的信度,并有不公平之嫌。

主观性测试的效度较好,因其能够直接地考查考生的语言应用能力,同时命题相对简单。但是主观性测试对考生的回答内容缺少控制,尤其是当考生掌握了一些语言策略之后。比如在口语考试中,考生可能会采用迂回策略来避免使用自己不会的单词或表述方法。因此就无法判断考生是否已掌握了某些测试所要考查的内容。主观性测试需要较多的人力和物力,因此更适用于小规模测试,如班级测试等。对于大规模测试,则应根据具体情况安排好主观性测试试题的数量,使主观性测试题目数量适当,避免过多。

在实际教学中,很多教师不太清楚主观性测试具体的题型,认为只要是写单词就是主观性测试题。教师应当对此进行有效的区分才能保障试题的效度和信度。教师应当明确主观性试题应涉及学生的语言产出,应当使学生展示实际运用语言的能力。武尊胜等人在1999年对长江以北地区初中毕业、升学考试英语试卷进行评价时就发现一些自认为主观题占到40%的试卷实际上一个主观性试题也没有。“有的安排在书面表达部分的题目,实际上只是控制性写作题目,留有10个空,让学生在读了短文之后填写”(武尊胜2008:27)。由于该题目不涉及语言产出,应属于客观性试题。因此,教师有必要学习此方面的知识。

2. 客观性测试(objective tests)

客观性测试是指不需要评分人主观判断、答案唯一或固定的测试形式。客观性测试不需要对评分人进行培训,也不需要评分人的专业性判断,甚至直接使用阅卷机就可以完成阅卷工作。客观性测试的典型题目是单项选择题。但是单项选择题不是唯一的客观性测试题型,单词拼写、动词填空、正误判断、配伍题等都是客观性试题。客观性测试内容较为广泛,比较适合分离式测试。但这也使客观性测试只能间接反应考生语言能力,同时加强了考试内容取样的主观性。客观性测试效度差,它往往只要求考生涂卡、打钩等,答题存在猜测性因素,无法考察考生的实际语言应用能力。客观性测试信度好,唯一或固定的答案保持了评分标准的准确性。客观性测试能够对语言点有所控制,阅卷省时省力。但有一点我们需要注意,客观性测试并不是完全客观的,决定考点的过程、制作试题的过程本身就是主观的。

很多教师倾向于使用单项选择题,认为出题容易,评分省力。但事实上单项选择题的命题十分困难,并耗时耗力。单项选择题由题干、答案和干扰项组成,每一个项目的编写都要求命题人精心地考虑。单项选择题要符合多种条件,如每一个单选题都应只有一个答案,每道题只能测试一个语言点,每个选项放入题干中都能保证语法正确,这看似简单,但实际做起来却很难。对题干内容也有很多要求,如,题干必须准确,不可有无关的、混淆所测试问题的内容,否则考生就无法明白题干,无法做出选择,也就无法判断考生对所要测试的问题的掌握程度。此外,能放到题干中的词就不能在选项中重复出现。干扰项则要求即不能太难,又能起到干扰的作用,此外还要保障考生只能通过直接选择来回答,不能通过排除等手段来答对。

对于客观性试题的争论一直都有,Fry曾经用这样的一段话来批评客观性测试中的单项选择题:“所谓猩猩的分数(orangoutang score)就是指一只训练有素的猩猩在标准化阅读测试中所得到的分数。一只饥饿的猩猩被放在了配备长方形窗户和四个按钮的小笼子里,来接受这样的训练,即每次当阅读教师将工整打印的阅读测试单项选择题放在长方形窗户上时,大猩猩如果想要得到香蕉,所要做的就是任意地按任何一个按钮。这些按钮上都分别标有A、B、C、D四个字母”(Fry 1971:360)。当然这是对客观性测试尤其是单项选择题的极端看法。Heaton(Heaton 2000:26-27)曾就客观性测试的两种误解进行了澄清,他认为第一种误解源自于客观性测试的外观形式,从这个角度看,客观性测试似乎很简单。但实际上并不简单,出题人不仅需要选择和构建试题项目,而且还要分析学生在每一项目上的表现,并且据此重新书写项目,直到测试具有广泛的区分辨别能力(discrimates widely)。第二种误解是认为单项选择题鼓励猜题。Heaton认为选项的数量可以有助于降低猜题的几率,此外从经验上来说,即使考生在回答时有猜题的行为,但是这种猜测大多是基于所掌握的部分知识。

第五节以对测试分数的解释为标准的分类

不论举行任何测试都是有目的的,测试结果可以用来反应这一目的。常模参照性测试(norm-referenced tests)和标准参照性测试(criterion-referenced tests)正体现了对于测试结果进行解释的不同参照标准。

1. 常模参照性测试(norm-referenced tests)

所谓“常模”,刘润清认为:“常模是指一群类型相同的人在一类考试中的成绩,这个

常模一般用该考试的平均分与标准差来表示”(刘润清2000:13)。因此,常模参照性测

试是指对同一次测试的结果进行比较,参照考试目的与要求设定合格分数线。合格分数线

的设定主要以平均分数为依据。现以四、六级大学考试为例,自2005年6月起,大学英

语四、六级考试的原始分数在经过加权、等值处理后,参照常模转换为均值为500、标准

差为70的常模正态分数。四、六级考试报道总分计算公式为:

公式中X表示每个考生加权、等值处理后的原始分数,Mean表示常模均值,SD表示常模

标准差。

常模正态分数的特点是能够报道考生在常模群体中所处的百分位置。如某考生四级报

道总分是550分,则根据大学英语四级考试(CET-4)报道分数百分位对照表,可判断其

在常模群体中的百分位是76%,表示这名考生的英语成绩优于常模群体中76%的人。如某

考生六级报道总分是600分,则根据大学英语六级考试(CET-6)报道分数百分位对照表,可判断其在常模群体中的百分位在87%~92%之间,表示这名考生的英语成绩至少优于常模

群体中87%的人,但不会优于92%的人。

常模参照性测试以与其他考生的分数进行比较来衡量某一考生的成绩,确定其在全体

考生中的位置,因此常模参照性测试适用于选拔性测试,我国比较重要的考试大都是常模

参照性测试,如中考、高考、研究生入学考试等。常模参照性测试的选拔性目的决定了其

独有的特点,从命题角度而言,命题内容覆盖面宽,命题难易度离散程度较高,有助于拉

开分数段;分数主要采用百分或标准分数的形式。

常模参照性测试的优点在于对于大多数考生来说较为公平,因为通过考试与否的标准是以与其他考生公平竞争的结果来确立的,尤其是中国学生比较习惯于这种测试模式,他们较习惯于从自我位置的确定中找到前进的目标。常模参照性测试的不足在于常模的效度往往受到受试人群的影响,常模随着受试人群的变化而变化。其次,学生在常模参照性测试中的表现不能直接说明其在语言中的实际表现。此外,常模参照性测试的回波作用有待商榷,在实际操作中,如果大多数学生没有通过考试,那么责任往往推卸给试卷内容,而不是首先考虑教学目标和教学质量是否出现了问题。

2. 标准参照性测试(criterion-referenced tests)

Carrol, Cronbach, Glaser在1963年发表了三篇论文,提出了标准参照性测试的概念。与常模参照性测试不同,标准参照性测试在考试之前就已经预先定好了衡量标准,然后根据这些标准来判断学生是否通过和不通过。在标准参照性测试中学生的表现并不取决于与其他学生所做的比较。标准参照性测试根据考生能否令人满意地完成某些任务来划分档次。

例如,雅思中的学术类作文考试,如果某一学生得到6分,那么与这一分级对应的写作水准如下:

(A)在任务完成方面,达到写作任务各项要求、能确切选择有用信息进行全面评述、呈现并强调主要特点或要点,但细节可能与要点无关、不恰当或不准确。

(B)连贯及衔接方面,信息和分论点安排连贯,论证过程清楚,有效使用衔接手段,但句内或句间衔接有错误或显机械呆板,有时指代不清晰或不恰当。

(C)词汇量方面,相对写作任务而言,所运用的词汇量充足,尝试运用非常见词汇但有时出现错误,拼写和构词出现一些错误,但不影响交流。

(D)句式多样性及语法准确性方面,混合使用简单和复合句,语法和标点出现一些错误但基本不影响交流。

同样在口语部分,考官会以流利度及连续性,词汇内容丰富性及语法标准性与语音作为评分标准。如果一名考生得到6分,那么他已达到的相应的口语标准如下:(A)流利度及连贯性方面,愿意进行详细描述,但有时因重复、自我更正或停顿而造成不连贯,运用不同的连接词和语篇标记但有时不恰当。

(B)词汇方面,尽管有时词汇运用不恰当,但词汇量足以详细表述主题,表意清楚;总体上能成功地变换措辞进行复述。

(C)句式多样性及语法准确性方面,混合使用简单和复合句式,但不够灵活;经常在使用复合句式时出错,但很少因此给理解带来障碍。

(D)语音方面,总体能听懂,偶尔因发音错误给听者理解造成负担。

再比如,全国公共英语等级考试,也是根据国际英语测试规范设定的标准参照性测试。共设五个等级。其试题难度不以考生群体的水平差异为转移。“PETS的各级考试大纲对级别定位等有关标准都给出了尽可能详尽的文字描述,并详细、具体地列出了交际话题、功能意念、语法项目、语言技能和词汇等,这对规范命题、考生应考和教师辅导有着实际的指导意义”(全国英语等级考试考试大纲第五级1999:前言2)。各级别都对语言知识和语言运用的能力做出了描述,现以PETS五级的语言应用为例。

PETS第五级考生应具备的互动、接受和产出能力如下:

(1)互动能力

能够就广泛的社会问题以及在学术和专业方面用英语与外国人交谈,且其语言符合英语的文化习惯。

能积极主动地参加学术研讨或导师主持的课堂讨论。

(2)接受能力

能够听懂英文讲座、学术发言、讨论或争论,同时还能听懂英文广播节目。

能够分析性、评议性地阅读,并从具体目的出发确定有关资料的价值。

(3)产出能力

能够较好地写出专业文章,诸如科研论文、试验报告、并能准备实用性文件。

在学术研讨中,能够清楚地表达或论证与自己学科相关的内容。

标准参照性测试与常模参照性测试相比较具有以下优势:首先,它以实际语言要求为标准确定衡量标准,从而更倾向于直接反映并描述语言能力;其次,标准参照性测试能够激励学生实现标准。考生以事先确定的标准做为目标,不用担心自己比别人差,就一定会被淘汰。标准参照性测试不以淘汰多少考生为目的;此外,标准参照性测试与教学目标紧密相连。考生的表现可促进课程、教学方法、教学目标的改进。标准参照性测试的缺点在于:首先,考试内容范围狭窄,只涉及标准规定的内容;其次,考生不能够通过与他人比较知道自己在考试人群中所处的地位。尤其对于好学生而言,缺少获得更高成绩的动力;此外,标准的设定难免有随意性之嫌。Popham曾指出:“对于这类测试,信度(reliability)和效度(validity)的评估技术才刚刚开始,因此大多数情况下,仍不能清楚某一考试,从科学的角度来说,是不是具有信度和效度”(Popham 1978:15)。

在美国,标准参照性测试受到了普遍的欢迎,除了上述提到的原因外,一个很有意思的原因是标准参照性测试避免了对于学生人权的违反。Guy, Chambers曾指出,常模参照性测试构成了对学生人权的违反,因为在这种考试中学生的排名被公开发表,会使学生感到羞耻。Wood在《评估与测试:研究综述》一书中写到了常模参照性测试所涉及的法律问题,在美国,尤其是在佛罗里达州(Florida),法院听取了一系列的标准参照性测试违反人权的案件,但法院判诉讼人败诉,这也许是鼓励标准参照性测试的一个有意思的例子。

第六节语言测试的其它分类

除以上谈到的测试类型,近年来比较流行的测试还包括交际性测试(communicative testing)和计算机辅助测试(computer-assisted testing)。

1. 交际性测试(communicative testing)

自从Hymes提出了交际能力理论,语言教学开始注重学生交际能力的培养,因此交际性测试也就应运而生。Hymes的语言交际能力框架由possible(可能)、feasible(可行)、appropriate(恰当/得体)、done(完成)组成,换句话说语言能力不仅包括语言知识(词汇、语法知识)而且也包括交际能力,即有能力使用这些语言知识来得体地完成交际任务。之后Oller在70年代中期提出“单一语言能力假想”(unitary competence hypothesis),即“这种假设认为语言水平(language proficiency)是一种单一能力(single unitary ability),而不是分立的技能(skills)和成分(components)”(Bachman 2006:48)Oller的这一理论提倡完形填空这一测试项目。Canale 和Swain将交际能力定义为“语法能力(语法规则的知识)和社会能力(语言使用规则的知识)的相互作用与相互关系”(Bachman 2006:49)。此后他们又将策略能力(strategic competence)列入交际能力中,所谓的策略能力是指“用来弥补交际中断(breakdowns)的言语(verbal)和非言语性(non-verbal)的交际策略,交际中断由行为变化(performance variables)或能力不足(insufficient competence)引起”(Bachman

2006:50)。1983年Canale又将话语分析能力纳入交际能力中,Swain在1985年提出了交际语言测试的四条概括性准则即①从高处而言②集中于内含③偏倚最好部分④有助于回波。

1995年Bachman对语言能力进行了概括,即语言能力包括组织能力(organizational competence)和语用能力(pragmatic competence)。组织能力二分为语法能力(grammatical competence)和语篇能力(textual competence);语用能力二分为施为能力(illocutionary competence)和社会语言能力(sociolinguistic competence)。

交际能力的发展对于交际性测试有很大的推动作用。例如,Bachman的社会语言能力包括方言能力。方言的使用符合交际性测试对语言材料的要求,即语境的真实性。在英国剑桥大学地方考试委员会的熟练英语证书考试(CPE,五级水平考试中的最高级)听力材料中就有带地方口音的讲话。

McNamara提出交际语言测试应具有两种特征(McNamara 2003:16-17):

(1)交际语言测试是语言表现测试(performance tests),其评价需要在学习者从事交际的扩展行为时进行。这种扩展行为可以是接受性的,也可以是产出性的,或两者兼而有之。

(2)交际语言测试侧重参与者在实际场景中可能扮演的社会角色,并提供具体说明这些角色需要的方法。

Weir在《Communicative Language Testing》一书中提到了交际语言测试的一些主要特征:①重点是意义②语境化③语言活动带有可接受的目的性④有实际意义的言语⑤使用真实的语言材料⑥文本处理有真实性⑦考试结果不可预见⑧以互动为基础⑨考生在真实心理状态下展示语言能力⑩根据实际结果判断成绩。(Weir 1990:167)

正如McNamara所说:“交际能力理论代表了对语言的研究已从心理角度研究深刻地转移到社会角度的研究。心理角度研究将语言视为内在的现象,而社会角度研究则注意语言的外在社会作用”(McNamara 2003:17)。

交际性测试在英国和澳大利亚等国家很受欢迎,例如,澳大利亚为以英语为第二语言的健康从业人员设计的考试。在考试中,任务的设计以真实诊所常见的场景为背景,包括:与病人交流,为同事提供病例等。分数以交际的复杂性、流利性做为标准。我国的交际语言测试主要是全国英语等级测试,其考试大纲中就明确了该考试是交际性语言测试,即“其语言运用能力的分类和定义建立在交际性语言活动模式的基础上”(全国英语等级考试考试大纲第五级1999:7)。其不同的级别描述了不同的交际能力,及这些能力所能应付的语言需要。例如:该考试对三级水平的描述“通过该级考试的考生,其英语已达到高等教育自学考试非英语专业本科毕业水平或符合普通高校非英语专业本科毕业的要求,基本符合企事业单位行政秘书、经理助理、一般管理人员或科技工作者、外企职员的工作要求,以及同层次其他工作在对外交往中的基本需要”(全国英语等级考试考试大纲第三级2003:11-12)。五级水平为“通过该级考试的考生,其英语水平基本满足在国外攻读硕士研究生非英语专业或从事学术研究工作的需要。该水平的英语也能满足他们在国内、外从事专业和管理工作的基本需要”(全国英语等级考试考试大纲第五级1999:8-9)。

交际性测试典型的测试形式是要求考生选择语法准确并符合社会规范的句子。

例如:You were applying to a university and needed a letter of recommendation. You went to a professor, who was also your friend, and said:

A.“I?d appreciate it if you could write a letter of recommendation for me.”(正确,得2分)

B.“I want to ask you to write a letter of recommendation for me.”(语法正确,不够得体,得1

分)

C.“I wonder if you could write a letter recommending me.”(还算得体,但语言有误,得1

分)

D.“Hey, give me recommendation letter.”(语言有误,又不得体,不给分)(刘润清2000:

15)

2. 计算机辅助测试(computer-assisted testing)

计算机辅助测试(computer-assisted testing, CAT),是指利用计算机协助对于学生的学习效果进行测试和对学生的能力进行评估。它以现代教育测试测量理论——项目反应理论(item response theory)为基础,以计算机和网络技术为依托,力图快速准确地测量考生的潜在语言能力。计算机辅助测试有联机测试与单机测试两种方法。著名的Educational Testing Service于1998年设计出了TOEFL的CAT,并于2006年开始全部在互联网上进行测试。The University of Cambridge Local Examinations Syndicate开发了不同语种,不同用途计算机辅助语言测试,并与剑桥大学出版社共同开发了Quick Place Test(computer based version, QPT)以便于学生的分级、分班。

计算机辅助测试可以使用先进的测试模式,如计算机自适应性语言测试(computer adaptive language testing, CALT)和网络化语言测试(Internet-based test)。网考的典型性代表就是新托福考试,它通过网络技术实现了试题和答案的双向传输,它对试题题目给出了详细的分析并为考生提供了人性化的成绩报告单。

计算机自适应测试是“量体裁衣测试”(tailor test)的变体。它根据考生答对、答错情况自动生成接下来的题目。如果考生答对某一题目,那么计算机自动生成更高难度的试题,如果考生答错某一题目,那么计算机自动生成较低难度的题目,直到搜集到足够信息以评判学生的能力。Henning曾指出计算机自适应测试的优缺点:首先计算机自适应测试能够减少个体测试时间及挫败感和厌倦感,因其避免了考生多次面对相同级别的试题或高于、低于其能力水平的试题。其次,该测试评分快速、具有快速的诊断回馈性。此外,试题的安全度也大幅提高。当然计算机自适应测试也有一些缺点:如果考生对计算机操作不熟悉或不能接受这种非传统的测试模式,那么就不能考查出受试者的真实语言能力;其次如何避免大规模使用客观性试题也是其遇到的一个问题。(Henning 2001:136-137)

我国的CALT运用还处于理论阶段,但是我国目前现存的考试制度和规模迫切需要这种考试模式。我国外语学习者众多,各种类型的外语考试星罗棋布。“随着现行外语测试中的漏题、替考、人性化不足等种种弊端日益显现,CALT的研发在我国变的越来越迫切”(杨安良2008:77)。虽然“自20世纪90年代初期开始,全国大学英语四、六级考试委员会一直致力于项目反应理论和机助自适应测验的研究和开发”(田文燕2007:65),虽然“全国大学英语四、六级考试委员会已完成‘计算机化的大学英语自适应考试’的理论研究,并已启动使用系统的开发工作”(朱正才2001:139),但是并没有真正运用。不容否认CALT 是测试的必然趋势,并将受到越来越大的重视。我们期待着有识之士们在这一领域做出更大的贡献。

参考文献

教育部考试中心《全国英语等级考试考试大纲第五级》,北京:高等教育出版社,1999。教育部考试中心《全国英语等级考试考试大纲第三级》,北京:高等教育出版社,2003。刘润清韩宝成《语言测试和它的方法》,北京:外语教学与研究出版社,2000。

田文燕张震宇《计算机化语言测试的应用:问题与展望》,《外语电化教学》,2007(2)。

武尊民《英语测试的理论与实践》,北京:外语教学与研究出版社,2008。

杨安良田少华《我国计算机化调适性语言测试(CALT)研究现状》,《Foreign Language World》,2008(2)。

朱正才杨惠中《关于机助自适应大学英语四、六级考试—考试效度、信度和施测效率新的平衡》,《外语教学与研究》,2001(2)。

Bachman, L. F. What is the construct? The dialectic of abilities and contexts in defining constructs in language assessment. In J. Fox, M. Wesche, & D. Bayliss (Eds.), What are We Measuring? Language Testing Reconsidered. Ottawa, Canada: University of Ottawa Press, 2006. Fry, E. “The orangoutang score.” Reading Teacher, 1971(24).

Heaton, J. B. Writing English Language Tests. Foreign Language Teaching and Research Press, 2000.

Henning, G. A Guide to Language Testing: Development, Evaluation and Research. Foreign Language Teaching and Research Press , 2001.

Hughes, A. Testing for Language Teachers. Foreign Language Teaching and Research Press, 2000. Lado, R. Language Testing. Longman, 1961.

McNamara, T. Language Testing.上海外语教育出版社, 2003.

Popham, W. J. Criterion-referenced Measurement. Englewood Cliffs, Prentice-Hall, 1978. Weir, C. J. Communicative Language Testing. Prentice Hall, 1990.

Witt, R. D. How to Prepare for IELTS. Beijing Language and Culture University Press, 2007. Wood, R. Assessment and Testing: A Survey of Research.Foreign Language Teaching and Research Press & Cambridge University Press, 2001.

语言测试理论

语言测试理论(Language Assessment) 定义(definition) Anastasi (1982)认为“测试实质上是对受试者的某种能力所做的客观的标准化测量”。Carroll 则认为测试是一套程序,旨在诱发受试者的行为反应, 并以此推导出他的相关特征(a procedure designed to elicit certain behavior from which one can make inferences about certain characteristics of an individual)。 二、英语语言测试理论 (一)英语语言测试类型 Hughes(1989:9-19)依据测试目的、测试方法和方式、测试题型、测试成绩判别标准和判卷标准进行分类, 将英语测试分为五大类。 1.依据测试目的进行分类 ( 1 )水平测试(proficiency test) 语言水平测试是为了测试人们语言能力而设计的。( 2 )学业成绩测试(achievement test)学业成绩测试是用来考查被试在学习英语某一阶段或最终阶段的成功程度。 (3)诊断测试(diagnostic test): 诊断测试是用来鉴别学生的优势和不足之处,用来确定什么样的教学是必要的。(4)能力测试(aptitude test) 能力测试不以任何教学大纲为基础,目的在于检验测试者是否具备了学习某种语言的潜力。 2.依据测试方法和方式进行分类 (1)直接测试(direct testing) 直接考察学生某一方面语言能力的测试称为直接测试。 (2)间接测试(indirect testing) 间接测试即通过测试某一技能所具备某种能力来发现学生这方面的语言能力。 3.依据测试题型进行分类:分散点测试指每次只测试一个项目的测试,每道试题只测试某一特定的语法结构等,属于间接测试。 4.依据测试成绩判别标准进行分类 (1)常模参考型测试(norm-referenced testing) (2)标准参考型测试(criterion-referenced testing) 以某种特定的语言能力标准作为判别标准的测试称为标准参考测试。 5.依据判卷标准进行分类 (1)客观测试(objective testing) (2)主观测试(subjective testing) Proceeding from or taking place within a person's mind such as to be unaffected by the external world. (二)测试基本要素:效度 效度是一个单一而又整体的概念(a single, unitary concept) 是指测试的内容及其方式是否符合测试的目的和要求。即测试所能取得某些目标的有效程度。一项测试只有能够准确测试它所希望测试的内容才具有效度。 1.内容效度(content validity) 内容效度指测试内容。包括所要测试的语言技能、语言结构等方面有代表性的要素 2.标准效度(criterion-related validity)作为对比的其他测试结果就成了检验现有测试的效度标准。 标准效度主要包括同期效度(concurrent validity)和预测效度(predictive validity)

高考语文语言表达题型训练(含答案)

高考语文语言表达题型训练(含答案) 高考第二轮复习是进行专题训练,分模块掌握高中所学知识。在高 考语文语言表达题型训练中,大家首先要把基本概念理解到位,然后配合题 型训练更好地掌握模块精髓。下面是小编整理的《2017高考语文语言表达题 型训练(含答案)历年语文语言表达真题》,供参考。 1高考语文语言表达题型训练真题及答案语言表达题型训练1.【课标 全国卷1】在下面一段文字横线处补写恰当的语句,使整段文字语意完整连贯,内容贴切,逻辑严密。每处不超过l5个字。(5分)二氧化碳是最主要的大气保温气体之一。大气中的二氧化碳浓度升高会导致全球变暖,造成天气 干旱或旱涝不均,甚至可能造成海洋水位上升,淹没大量沿海城市, _______________。然而,也有研究指出,_______________:比如增加的二 氧化碳可以给植物“施肥”,有利于植物的生长。但这必须有个前提,植物还 活着!如果土壤被污染,_______________,我们就失去了这些向大气中释放氧气的“氧气工厂”和“空气净化器”。【答案】①给人类带来巨大的灾难②二氧 化碳增加会带来好处③植物就会生病甚至死亡(写出一句,给1分;写出两句,给3分;写出三句,给5分)【解析】本题考查的是语言表达连贯的能力。主要根据上下文语境来填写,本语段本段主要谈“二氧化碳”的利与弊。第一 个空是对前面“全球变暖”“干旱或旱涝不均”“海洋水位上升”“淹没大量沿海城 市”等情况的总结,这是二氧化碳带来的灾难,因此可写“给社会及人类带来 了巨大灾难”;第二个空是对“给植物‘施肥’”现象的总结,也是对前面“灾难” 的转折,因此可填写“二氧化碳也会带来好处”;第三处根据前后语境可填写

国家职业汉语能力测试真题

阅读理解 第一部分(第1----20题) 说明:第1----20题。每道试题提供一段文字,并带有一个问题,请你阅读后根据提问在四个备选项中选出最恰当的答案。答题参考时限为20分钟。 1.发展中国家在发展过程中不能东施效颦,看到发达国家经济发展靠技术推动就以劳动密集型产业为耻,看到发达国家都是大银行,自己也只要大银行。外国的大银行早期也都是从一些地区性的中小银行发展起来的……小孩子穿大鞋,鞋子虽然很漂亮,但是走路却不好走。 这段文字主要是说: A.发达国家经济发展主要靠技术推动 B.发展中国家须以劳动密集型产业为荣 C.发展中国家宅基地有应根据实际情况选择发展模式、 D.发达国家的大银行是从中小银行发展起来的 2.现代人看起来太忙了,读多人在这忙碌的世界上生活,手脚不停,就好像在旅行,乘汽车匆匆忙忙地过去,没有时间回一回头,或者停一停步子,欣赏一下风景,结果,使这原本丰富美丽的世界,在我们眼中空无所有,只剩下匆忙和紧张、劳碌和忧愁。 A.人们应懂得去欣赏美丽的世界 B.人们为了工作而无暇顾及周围世界的变化 C.人们除了工作外,对其他事情都不太感兴趣 D.美丽的世界对于工作繁忙的人而言没有太大意义 3.世界范围的啤酒消费,根据推算,恰好为人均24升。该平均数字还在稳步增长。到2015年,预计可达到26.2升左右。全球饮料销售公司的专家们预测,2008年还会维持在24升这个数字上,并估计世界范围的啤酒产量那时将为1600亿升。然而,巴斯报告预测:“2005年也可达到这个水平。而1998年全球啤酒产量仅为1290亿升。 A.24升B.26.2升C.1290升D.1600亿升 4.上个世纪90年代,一部叫做《熊的故事》的电影曾感动过许多人。影片从动物的视角,表现了北美落基山地区的灰熊与猎人之间的斗争,让许多人认识到灰熊这种濒危动物的生存危机。令人欣慰的是,2005年11月15号,美国政府宣布,经过30年努力之后,黄石公园的重要象征灰熊的数量已经得到了有效恢复,可以把灰熊的名字从“濒危动物”的名单上去掉了。 这段文字主要介绍: A.保护野生动物的重要性 B.美国动物保护工作的成就 C.经过努力灰熊不再面临生存危机 D.《熊的故事》对保护灰熊起了作用 5.目前,由于劳动力过于廉价,在中国的厂家宁愿通过降低自己生产体系中的技术含量来追求效益.波士顿一家咨询公司的研究表明,在中国制造业中,降低技术投入,依赖廉价劳工可以带来更大的赢利. 这段文字主要说明: A.降低技术投入可以为这些厂家带来利润 B.这些厂家通过廉价劳动力获得了更大的利润 C.这些厂家可通过降低技术投入追求更大利润 D.过于廉价的劳动力制约了这些厂家的赢利空间 6.从神经心理学和神经语言学的观点看,拼音文字是偏向大脑左半球的“单脑文字”,而汉字是大脑左右半球并用的“复脑文字”;拼音文字认知中“语音编码”方式起主要作用,而汉字认知中则是利用“多重编码”方式,语音、字形和语义编码兼用。由于拼音文字偏重开发左脑。西文人因此提出“开发右脑”的理论和方法,这并不完全适合使用汉字的中国人。 这段文字主要说明的是:

基本的英语测试设计和评价能力

基本的英语测试设计和评价能力 一、新时期中小学英语测试与评价的基本要求 《英语课程标准》(实验稿)指出,测试与评价的三个主要目的是:“使学生在英语课程的学习过程中不断体验进步与成功,认识自我,建立自信,促进学生综合语言运用能力的全面发展;使教师获取英语教学的反馈信息,对自己的教学行为进行反思和适当的调整,促进教师不断提高教育教学水平;使学校及时了解课程标准的执行情况,改进教学管理,促进英语课程的不断发展和完善。”《英语课程标准》(实验稿)主张建立能激励学生学习兴趣和自主学习能力发展的评价体系,评价体系应由形成性评价(formative assessment)和终结性评价(summative assessment)构成。 《英语课程标准》(实验稿)建议终结性评价(如期末考试、结业考试等)要注重检测学生综合运用语言技能和语言应用能力。终结性评价是反映教学效果、学校办学质量的重要指标之一,要客观、科学、全面考查学生在经过一段时间学习后所具有的英语水平。测试应包括口试、听力考试和笔试等形式。《英语课程标准》(实验稿)同时指出形成性评价是教学的重要组成部分和推动因素。在英语教学过程中,应以形成性评价为主,注重培养和激发学生学习的积极性和自信心。一线英语教师应善于将形成性评价有机地融入教学过程,营造开放宽松的评价氛围,形成生动、活泼、开放的学习气氛。同时应了解和熟悉终结性评价的要求和形式,观察两种不同形式的评价结果,分析和研究两种评价的相关程度,以全面评价学生学习效果并反思教师教学工作。

二、英语测试与评价的主要作用 英语测试和评价在英语教学中的作用和功能,主要有以下六个方面,分别是: (1)诊断语言程度主要是了解学生现有语言水平,发现和诊断语言学习中的问题,英语中称为“diagnostic test”,如:新生入学后的“摸底考试”。教师可根据测试的成绩和信息,修订或调整教学计划,或根据学生的水平进行分班。 (2)检查学习进度主要是检查和评价学生在某一阶段或某一课程学习中对所学内容的掌握情况,英语中称为“achievement test”,如:期中考试、期末考试。考试内容应是学什么,考什么。教师可根据学生的成绩,发现问题,制定相应的补救措施,改进教学。 (3)衡量英语水平主要是测量学生英语语言知识和综合运用英语的总体水平,英语中称为“proficiency test”,如:美国的托福考试(TOEFL)。考试内容不针对任何教材和课程。主要用来筛选和选拔人才,试题难易有跨度,以利于区分考生的优劣程度。 (4)预测外语学习主要是预测学生是否具有学习外语的天赋或潜在能力,英语中称为“aptitude test”。考试不太关注学生已掌握了多少东西,主要关注考生识别、理解、模仿、记忆、归纳和学习一门新的语言的能力。这种考试主要用来帮助选拔人才或选择专业。 (5)激励学生学习前四项作用和功能是四种主要的测试类型。从教师的角度来看测试。还可以再列出一种功能,就是激励学生学习。如果期望学生在英语学习的某一方面有

语言测试与评价复习范围(修改)(1)

《语言测试与评价》课程期末复习范围 1,理解基本概念 Proficiency test Achievement test Direct test Indirect test Discrete point test Integrative test Validity Reliability Authenticity Washback effect Structuralist-psychometric approach Communicative approach Test specification Constructed-response assessment Selected-response assessment Item discrimination Facility value 2,计算 能进行平均分、标准差、标准分、难度、区分度的基本计算。 3, 题项分析 对于设计上有问题的题项,能指出问题所在。 4,试题设计 能根据所给段落和拟考查的微技能,设计双向细目表和设计相关题项(选择题和非选择题都可以)。 I. Defining the following terms. (20%) 1.indirect test 2.subjective test 3.face validity 4.washback effect 5.placement test II. Calculating. (20%) 1.Students’ scores are given as the follows. Work out the mean score. 67, 72, 86, 60, 95,77, 35, 70, 64, 71 2.Work out the index of facility value. Your answers should be rounded to two digits after the decimal point when necessary.

语言测试的发展历史

语言测试的发展历史 测试的起源 测试是人类社会发展的结果,是人们为了适应社会发展的需求而设计的,并逐渐发展起来的。人类在劳动的过程中,感到有必要确定物体的属性,例如数量、大小、重量之类的物理属性,于是就产生了测量,并研究用测量的方法来了解这些属性。随着人类文明的发展,测量的围越来越广,测量的工具越来越多,测量的方法也越来越多。测量的对象逐渐从物扩大到人,从对人的形体测量扩大到对人其他方面的测量,例如对人的能力和知识的测量。 对人的知识和能力的测量,始于原始社会后期。当时,生产水平日益提高,氏族、部落之间的交往增多,冲突也逐渐加剧。为了维持氏族、部落的生存和发展,要向年轻一代传授生产技能、军事技术、知识,于是产生了教育。为了检验教育的成果,开始用骑马、射箭、搏斗等演示活动来考察技艺。青少年一般要经过严格的考核之后才能被承认是氏族、部落的正式成员。 后来,随着生产力水平的提高,社会出现了阶级,社会分工更明确了,教育逐渐从生产、劳动中分化出来,出现了专门从事教育的人和专门从事教育的机构,也就是说,出现了教育和学校。随着教育的发展,测量受教育者的方法日趋完善。人们在教学过程中不仅把测量作为一种手段,而且开始研究教育测量(educational measurement),因此出现了教育测量学。 世界各国的考试制度 (一)、中国是测试的故乡 中国是考试的故乡。就出现大规模的、严格管理考试而言,中国早于西方各国。我国的考试制度在奴隶社会末期就初步形成了。《礼记》比较详细地介绍了汉以前贵族的教育制度、教学容和教学方法;同时显示出,在西周的时候就有定期考查学生作业的考试制度,而且当时的“国学”中的大学,每隔一年必须考一次。 考试制度到了封建社会得到进一步发展、运用。据记载,早在公元前165年的时候,汉献帝就使用正式的考试来选官职候选人。到了隋朝,这一做法发展成为系统的科举制度。唐代继续实行科举制度。那时,科举大体可分为两类:一类是常科,有秀才、明经、进士、明书、明法、明算等基本科目,每年定期举行;另一类是制举,由皇帝根据需要临时下令举行。宋代科举的办法,大体上用的是唐代的老办法。明代做了一些变更,其中最为突出的是宪宗成化年间(1465----1487)开始盛行所谓的“八股文”。这种特殊文体,对于明清两朝的教育和文风都有重大影响。 科举考试的方法,同现代的考试有相似之处。例如,题型之一是贴经,这种题型多少有点像今天的填空题。所谓贴经,就是从经书中任揭一页,留出一行,其余的文字都盖起来。留出的一行,要用纸贴盖三个字。考生得把这三个字说出来,或者写出来。又如,考试常常用策问。策问就当时的政治、经济、军事、生产等方面的问题提问,要考生书面答题,阐述自己的意见。与今天的政治课的问题颇有类似之处。 中国的科举考试不仅有笔试,还有口试。例如,唐代有一种考试方法,称为口义,要应考者口述经义。《新唐书?选举志上》有这样的记载:“凡明经,先贴文,然后口试经文大义十条……元和二年……明经停口义,复试墨义十条。”“口义”是口试经义;“墨义”是将所答容,录于纸上,“直书其义,不假文言”。 封建帝王用科举考试来选拔官员,具有一定的积极的意义。首先,科举制度有利于加强中央集权权制,把选择官员的权利从世家大族手里夺过来。其次,科举制度可以确保封建帝王根据考试成绩广泛地从下层吸收、选拔人才。这种做法,不仅可以提高官员的文化素质,还调动了知识阶层,特别是中小地主阶层子弟的学习积极性。历代以科举入仕的人,有才识的人

2020年高考语言表达与运用新题练习(含答案)

2020年高考语言表达与运用新题练习 一、阅读下面的文字,完成1~3题。 时至今日,社会已经认识到,网络视听节目是新时代的新型广播电视,它与传统广播电视的性质、使命、作用________,因此内容标准也必然一样。网络视听节目精品创作的规模化、常态化显然不会________,这需要网络视听领域的平台、创作者、受众、研究者、评论者等提高自觉性和主动性,在推动原创网络视听节目精品化发展上________。相关部门应________进一步加强引导。充分吸取传统文艺节目精品生产的经验和办法,在题材规划、剧本创作、作品生产、作品评论等方面加大重视程度,在人才培训、资金扶持、评优奖励等方面采取更切合发展实际的措施,为适应网络生产网络传播特性的视听节目建立和完善规范有序、便捷高效的版权保护与内容审核制度与办法。()。网络视听节目是广泛影响社会思想的精神产品,提供视听节目服务应当确保社会效益优先,力争社会效益与经济效益相统一。行业协会应专注职能定位发挥桥梁纽带作用。团结督促会员切实履行行业公约,不断提高行业自教自律效能。协会还要积极组织业内专家学者纠偏扶正,及时研判,总结经验教训,把握创作生产传播趋势,及时为业界少走弯路建言献策。 1. 下列在文中括号内补写的语句,最恰当的一项是() A. 播出平台的社会责任到底在哪里 B. 负起社会责任为播出平台的不二选择 C. 播出平台应切实负起社会责任 D. 播出平台应进一步架起沟通桥梁 2. 依次填入文中横线上的成语,全都恰当的一项是() A. 一气呵成迎刃而解各司其职度德量力 B. 一脉相承一蹴而就各司其职审时度势 C. 一气呵成一蹴而就按部就班度德量力 D. 一脉相承迎刃而解按部就班审时度势 3. 文中画横线的部分有语病,下列修改最恰当的一项是() A. 协会还要积极组织业内专家学者及时研判创作生产传播趋势,纠偏扶正;及时总结经验教训,为业界少走弯路建言献策。 B. 协会还要积极组织业内专家学者纠偏扶正,及时研判创作生产传播趋势;为业界少走弯路建言献策,及时总结经验教训。 C. 协会还要积极组织业内专家学者及时总结经验教训,为业界少走弯路建言献策;及时研判创作生产传播趋势,纠偏扶正。 D. 协会还要积极组织业内专家学者纠偏扶正,及时总结经验教训,为业界少走弯路建言献策,及时研判创作生产传播趋势。 二、阅读下面的文字,完成4~6题。 “成功的谈判,双方都是胜利者。”这是美国著名谈判专家杰勒德·尼伦伯格的一句名言。然而,在中美经贸谈判中,美方却与这一理念________,一再________、一味漫天要价,导致谈判严重受挫。美方的行为,低估了中方捍卫自身权益的决心和意志,也是对形势的严重误判。________,中美经贸谈判,一开始就是围绕贸易不平衡问题谈的。可是,在谈判过程中,美方不断扩大范围、频频提出不合理要价。即便如此,中方始终以最大诚意和善意回应美方关切,以_______的态度对待彼此分歧,尽最大努力推动谈判进程,并取得一系列重要成果。这既是对“合作共赢”理念的践行,也是对两国和世界人民负责。()。既然是经贸谈判,就要围绕“经贸”来谈。倘若在谈判中,不断抬高要价,甚至试图把损害对方核心利益的内容塞入协议,只能是为谈判设置障碍,何谈诚意? 4. 依次填入文中横线上的成语,全都恰当的一项是() A. 背道而驰得寸进尺众所周知求同存异

C语言程序设计在线测试

题目描述 定义了一个含8个元素的int数组,调用包含指针的函数分别实现输入、计算最大值,之后输出结果。请将下列程序代码补充完整,并提交。 #include <> int main() { int a[8]; void input_array(int * p, int n); int array_max(int * p, int n); input_array(____,_____);//调用函数inout_array()输入数组各元素值 printf("%d\n",________);//调用函数array_max()计算最大值,并输出 return 0; } void input_array(int * p, int n) { //请补充代码 } int array_max(int * p, int n)

{ //请补充代码 } 输入 输入8个整数,用空格分开输出 输出数组中的最大值 样例输入 1 2 3 5 8 7 6 4 样例输出 8 #include <> int main() { int a[8];

void input_array(int * p, int n); int array_max(int * p, int n); input_array(a, 8);//调用函数inout_array()输入数组各元素值 printf("%d\n",array_max(a,8));//调用函数array_max()计算最大值,并输出 return 0; } void input_array(int * p, int n) { for (int i = 0; i < n; i++) scanf("%d", &p[i]); } int array_max(int * p, int n) { int i,max; max = 0; for (i = 0; i < n; i++) if (*(p + i)>max)

语言测试主要内容

考试信度:考分的一致性。考试效度:考试达到其预期测试意图的程度。交互性:指在考试所设计的任务中学生的参与程度。直接考试:学生被要求直接运用被试的技能或能力。间接考试:测试那些相关技能、以达到评估能力的目的。诊断考试:此类考试旨在了解学生在某个阶段中学习上的长处与短处,其最终目的是为了给教师提供教学效果或质量方面的信息。整体评分法:把作文视作一完整的篇章,根据对其总体印象打分。原始分数:未经处理或未加权重的分数。考试:用来获取某些行为的方法,其目的是从这些行为中推断出个人具有的某些特征。 1.根据考试的方式,考试的分类:1直接考试(①侧重考试形式的真实性②便于从总体上考查产出性技能,如口语能力、写作能力、翻译能力等③从命题人员的角度出发,直接考试具有比较明确的测试目标)2间接考试(①不强调考试形式上的真实性,即考试形式无需与实际语用环境相一致②由于不受语用环境的限制,所选择测试的技能可以更具有代表性和概括性③间接考试可选用多项选择题型,可以提高考试信度。) 2.常用的口试形式及特点:①朗读:学生事先在规定时间里浏览朗读材料,然后朗读。材料的长度视考试难度或学生水平而定,可以是单句,也可以是段落。但是,朗读作为口试形式只测试学生的语音语调等,无法检查整体口语能力。②看图说话:给学生一幅或多幅图片,让他们描绘或叙述图中所发生的事件。③简短说话:是一种弹性口试形式,即在难度上有伸缩性,可以是一个三言两语的形式,也可以是一个时间较长的形式。④对话:在一个假设情景中进行,学生之间或学生与考官之间根据情景要求进行对话。对话者既要运用一些常用会话技能,同时还要运用解决沟通问题的技能。⑤小组讨论:学生们就一个话题展开交流,一般控制在三四个人左右。⑥面试型口试:基本上采取问答形式,但又不同于简单的一问一答形式。考官通过各种提问技巧,从多个层面来观察学生的口语能力。 3.如何评阅作文,特点?⑴整体评分法①节省评阅时间②阅卷人员注重作文的整体质量③它的问题主要表现在阅卷人员对标准的理解和掌握上,以及所定档次标准瑜现实作文之间的吻合性。⑵分析评分法①阅卷人员明确具体评分方面②组成部分之间的评分不相互干扰或影响③其存在的第一个问题是把写作能力人为地分割成互不关联的部分④第二个问题起源于第一个问题,写作能力划成单独的部分后就涉及分值分配,即某个部分占总分的比例,这样的比例分配值得进一步商榷。两种评分标准的使用场合:要考虑三个因素:阅卷时间、阅卷方式、阅卷人员的经验。在阅卷时间较紧的情况下,最好采用整体评分法,比较省时。集中阅卷时用整体评分法较合适,因为便于两人或三人交换打分。分散阅卷最好使用分析评分法,分项评分可以减少评分盲目性和任意性。如果阅卷人员经过培训,并且有过去阅卷的良好记录,则可采用整体评分法。若阅卷人员大都没有阅卷经验,采用分析评分法较为妥当。四种语言测试方法:写作-翻译法,主要特征:A、对测试的技能或专长没有特殊的要求,主要依靠教师的主观判断力;B、试卷通常包括翻译、写作和语法分析等项目;C、试卷内容带有较浓厚的文学或文化色彩;D、试题一般采用书面回答形似,试卷需人工评阅。由于写作-翻译法全以教师或命题人员的经验和主观判断来确定,没有什么科学理论依据,故20世纪40年代以前的测试统称为科学前语言测试。结构主义/心理测试法,主要特征:A、一道题可以单独测试一个语言成分或技能:以结构主义语言学为其理论基础;强调不同的语言成分可以分别测试,比如语音、语法和词汇都可以脱离上下文进行单独的测试;B、采纳了心理测量学的一些方法,强调语言测量的可靠性和客观性。 代表题型:多项选择题,一题测一分,适合进行考后统计分析。综合测试法,主要特征:A、语言测试要在一定的上下文(context)中进行;B、不在测试中可以追求区分各单项语言成分、技能或能力、强调两项或两项以上的综合评代表题型:完形填空交际测试法A、考试内设计“信息沟”,要求学生通过各种已溃入的信息来获取未知信息;B、考试任务或项目之间存在关联性,即一个项目要在另一个项目的基础上完成;C、考试强调针对性,根据学生的具体需要设计考试内容;D、侧重更广泛地测试语言能力,包括语言知识、语言功能、语言使用的合适性等E、考试采用定性评估方式,以取代纯粹的定量评估方式或作为补充。交际法与综合法在某种程度上有相似之处,即两者都强调语言的意义而不是语言的形式和结构;区别在于交际法更注重语言在交际中的使用。 测量:根据明确的程序和规则量化研究对象特征的过程。评估:为决策而系统地收集信息的过程。考试功能:教学功能,科研功能根据考试目的分类:水平考试,学业考试,分级考试,诊断考试根据语言测量形式分类:分离式考试,综合式考试测试考试信度的方法:①重复测试法②平行卷测试法③对半分析法表面效度:表面可信度或公众可接受度。效度与信度的关系:一个考试要具有效度的话,首先必须具有信度。信度是保证考试效度的必备条件之一。考试要素:考试信度,考试效度,真实性,交互性,后效作用,可操作性正误判断题:通过正误判断来检查学生对某一细节的理解,或对某一概念的掌握等。 匹配题:可用来考核词汇知识、语法知识、对概念的理解、事实或观点之间的关联等。多项选择是目前考试中用途最广,最常见的考试形式。组成:题干,备选项补全句子:语法,交际能力完形填空题:一般按照两条原则删除单词或词组,固定删除(按照固定间隔删除-每隔6个单词删除一词)和选择删除(无提示型,提示型,首字母提示型,多项选择型,混合选择型) 转换题:1排序题(考查①学生对英语句子基本概念的掌握②对篇章的理解和篇章知识的运用) 2句型转换题(特点:①侧重在句子与段落层次上检查学生的语言水平②着重测试英语书面表达能力的某些方面) 阅读目的:生存目的,学习需要,休闲需要阅读方式:泛读,精读,跳读,寻读阅读技能包括:词汇知识,语法知识,以及各种篇章理解技能。选择答题类评估方法:1.正误判断题:可用来测试mechanical skills和language use 2.匹配题:可用于测试language use和organizational skills 论述题:由3部分组成:提示.题目.要求整体评分法:把作文视作一完整的篇章,根据对其总体印象打分。hearing指无意识地听到周围的声响或信息。listening指有意识地去听周围的声响或信息。听写:单句听写,段落听写口语活动的特点:①交互性②目的性③准语言性④非语言性⑤听力与口语的不可分割性口试评分标准:整体评分法+分析评分法成绩报告形式:百分制,等级制算术平均数,中位数,众数三者之间的关系:①当频数分布呈正偏态时(即平均数以下的分数多于平均数以上的分数),算术平均数>中位数>众数②当频数分布呈负偏态时(即平均数以上的分数多于平均数以下的分数),算术

语言测试方法的历史和现状

语言测试方法的历史和现状 发表时间:2012-11-19T09:28:36.653Z 来源:《现代教育教学导刊》2012年第9期供稿作者:梁媛 [导读] 对于某种形式的测试或出于某种特定的目的,结构主义测试法的一些特征还是有作用的。 哈尔滨工程大学外语系(150000)梁媛 【摘要】本文回顾了语言测试发展的不同阶段所采用的语言测试方法,我们会发现,人们在不同时期对语言能力的认识是不同的,因此语言测试逐渐形成了不同的体系。本文着重阐述了 Bachman的交际测试的理论,结合前人的理论实践及笔者的研究,笔者认为交际测试法将成为未来语言测试的主流。 【关键词】语言测试历史现状交际测试法 根据语言测试的四个主要方法,语言测试可被粗略分类为:淤语法翻译测试法;于结构主义测试法;盂综合式测试法;榆交际测试法。虽然这四种方法是根据时间顺序列出的,但他们并不与语言测试的某一阶段完全对应,四种方法间也并不是彼此排斥的,一项好的测试通常要涵盖这几种方法的很多特征。的确如此,某一方法无论多么有说服力,如果一项测试仅包含了一种测试方法,那么它是存在一定内在缺陷的。 1语法翻译法( The Grammar-Translation Approach) 前科学时期是指 20世纪 50年代之前的很长的一段时期。语法翻译法通常被认为用于前科学时期(pre-scientific period),在这一时期,测试中不需要特殊技巧或专业知识,教师的主观评断被视为头等重要。本阶段的测试通常包括写作、翻译和语法分析,本时期的测试比较偏重字面和文学。运用语法翻译法的公共考试(如中学毕业考试)有时会在中高层和高级层面上采取听力、口语因素,这在过去被认为是大纲或考试之外的东西。 为了把语言知识具体化,教师授课时就是从课文里找出这些语言点,然后传授给学生,考试时就考平时所学的这些语言点。由此可以看出,这一时期的语言测试和教学完全是由教师或出题人的经验和主观评断来决定的,并无科学依据。 总之,传统测试法缺乏明确的指导思想和科学系统的分析方法,处于教师自发、分散、随意的组织状态,所以测试的信度和效度都不能得以保障。 2结构主义测试法(The Structuralist Approach) 在 20世纪初,现代语言学诞生了,著名语言学家Saus原 sure的《普通语言学教程》成为现代语言学的奠基之作。另一位著名的结构主义语言学家 L.Bloomfield与 Z.S.Harris等人创立了美国结构主义语言学,受这一理论影响,分离式测试法(即结构主义测试法)产生了。本方法认为语言学习就是系统地获取一套语言习惯的过程,学习者需要研究结构语言学,尤其要明白对比研究的重要性,并需要确认和测量学习者对目标语的各个成分(语音、词汇、语法等)的掌握程度。学习者的掌握程度的测量是通过使用完全和语境脱离的词汇和句子试题来进行的,并且用相对短的时间在一张试卷里设计到能考察到所有语言能力的试题。语言技能(听、说、读、写)也要尽量做得分离测试,因为这一时期的语言测试方法的首要任务就是要一题只测一个考点,即每题只测量一种语言能力。 对于某种形式的测试或出于某种特定的目的,结构主义测试法的一些特征还是有作用的。比如,想要集中精力测量考生的写作能力,出题人把作文和阅读分离开来,也就是说,使作文与长时间阅读和复杂的指导或语言刺激完全分离,这一方法在某些方面是很好的。想要建立一次好的测试,结构主义测试法里的某些特征是值得考虑进去的。 着重于测量信度和客观性的心理测量法是结构主义测试不可或缺的一部分,心理测量学家有能力证明这样的传统测试,如文章写作,是非常主观并且不可信的。因此,测试中最重要的就是要用数据来证明测试的信度和效度,正因如此,多项选择题开始大受欢迎,因为它可以被非常好地用来进行数据分析。 3综合式测试法(The Integrative Approach) 20世纪 50年代末 60年代初,结构主义测试法受到了 Chomsky的转换生成语法的挑战,60年代后期,着重研究语言与社会关系的社会语言学受到了人们的关注,社会语言学强调语言的使用要受到社会地位和环境等因素的制约。综合式测试法强调语言在语境中的使用,所以它与语言的意义和话语的交际作用紧密相关。综合式测试认为语言能力是整体而不可分的。综合式测试法的特征在完形填空和听写题型中得以最好的体现,然而,很容易被很多人忽略的是,口试、翻译和写作题型中也会运用到综合式测试法。完形填空考察的就是阅读者通过上下文的线索找到最合适的替代词来填补空缺和不完整句子的能力。在文章中,每隔几个词就删掉一个词(通常是隔 5至 7个词),学生们被要求用最适合的词填补空缺处。 完形填空有两种评分方法:一种是填入能说得通的词即可得到一分,另一种是填入唯一的答案才得分。两种方法都被证实是有效的,有人认为第一种方法比后一种方法好一点,但却不能说明什么样的词算是“说得通”的,但是对于学生来说,选择任何一个合理的类同替换词即可得分看起来更公平。除此之外,学生不能因为拼错单词而不予给分,除非这个词的拼写让人看不懂。对于想要考察受试语法能力的完形填空来讲,语法错误应不予给分。 作为综合式测试的另一种主要形式,听写曾被认为是测量学生听力理解技巧的一种手段。如果语言的发音和代表它的符号之间没有特别紧密的关系,那么在听的过程中如果不需要写下来会更易于理解所听内容。然而,在英语中,当语言的发音和拼写系统紧密相关时,理解单独的发音而不完全听懂内容意思有时会更容易些。的确,一些应用语言学家和教师认为听写太过于鼓励学生把自己的精力集中于单独的发音而不是整体的文本意思。测量听写题时,第一遍应该用接近于平时对话的速度陈述,然后教师要开始陈述足够长度的义群,用以考察学生的短时记忆范围。最后,整篇文章要再用一遍稍低于正常的速度陈述一遍。 4交际式测试法(The Communicative Approach) 70年代初,随着社会语言学突飞猛进的发展,人们对语言功能,语言变体和社会文化原则逐渐达成共识,与此同时,功能语言学的系统功能理论及语用学的行为理论开始流行,从而引发了外语教育界的一场革命,一种新的测试法 ———交际式测试法诞生了。 交际式测试法有时与综合式测试法相关,然而,尽管两种测试方法都强调话语的意义而不是其形式和结构,但是两种方法间是有根本不同的。交际式测试主要关注的是语言如何在交际中使用,因此大多数的交际式测试旨在囊括与学生们在现实生活相关的交际任务。评判交际成功的标准是交际的有效性,而不是正式、僵化且准确的语言运用。语言的使用和语言的用法是完全不同的两个概念,语言的使用是

2011年高考语文试题分类汇编——语言表达

2011年高考语文试题分类汇编——语言表达 (全国新课标卷) 15.依次填入下面一段文字横线处的语句,衔接最恰当的一组是(3分)【C】 我国是食品生产和消费大国,_____,_____,_____,_____,_____, _____。这样才能有效解决食品安全领域损害群众利益的突出问题,切实增强消费安全感。 ①强化执法措施,严惩违法犯罪分子 ②食品产业涉及环节多,哪一环出现漏洞都会给食品安全带来严重威胁 ③创新食品安全监管机制 ④坚决淘汰劣质企业,以震慑所有企业使之不敢越雷池半步 ⑤保障食品安全需要生产经营者诚信自律,更需要严格的法律制度约束和有效监管 ⑥因此,必须保持严厉打击违法违规行为的态势,及时消除各环节的隐患 A.②⑥①③④⑤ B.②⑤⑥①④③ C.⑤②⑥③①④ D.⑤⑥②④③① 解析:⑤起领起作用,应位于开头;②⑥由“因此”连接;③①④是具体措施,先有机制,在执法,之后是淘汰、震慑,是后文“这样”指代的对象,应在最后。 16.把下面这个长句改成几个较短的句子,可以改变语序,增删词语,但不得改变原意。(5分) 巴黎之行让我对法国作家和诗人维克多〃雨果为建立法国文学创作者的著作权保护机构——法国文学家协会所做的工作,为促成制定保护文学艺术作品著作权的国际公约——伯尔尼公约做出的杰出贡献有了更深的了解。 答:巴黎之行让我对法国作家和诗人维克多·雨果有了更深的了解。他在著作权保护方面作出了杰出的贡献。他促成了法国文学创作者的著作权保护机构——法国文学家协会的建立,促成了保护文学艺术作品著作权的国际公约——伯尔尼公约的制定。 解析:抓住句子主干并单列为一个分句,然后按照一定的顺序排列句中的定语或状语。注意使用“润滑剂”——介词、副词和关联词。长句变短句要抓住最难于理解的成分,使变后的文段语序合理,意思明了,前后通顺。 17.仿照下面的示例,自选话题,另写三句话,要求使用比喻的修辞手法,句式与示例相同。(6分) 平凡是泥土,孕育着收获,只要你肯耕耘; 平凡是苗圃,孕育着烂漫,只要你肯浇灌;

汉语能力测试(HSK)等级划分标准

汉语能力测试六个等级的划分标准和要求 来源:汉语能力测试网 一级能参与家庭成员、亲友邻里及与其基本生活密切相关的交流对象之间的简单社交活动。其语言的积累、知识经验的储备、思考的空间、感兴趣的话题等基本上围绕家庭生活展开。以口语为基本交流途径。所听、所说基本上属于关于具体人、事、物的记叙性话语。学历参照:具有相当于小学中年级的文化水平。职业参照:从事简单家务、一般手工劳动者等。 二级能关注本地社会特别是与其自身生活相关的事务,能参与工作和学习圈里的小型社交活动。以口语为基本交流途径,但在其生活领域中有一定的阅读要求和少量书面表达要求。学历参照:具有相当于小学高年级的文化水平。职业参照:一般从事家务、手工劳动和比较简单的技术操作工作。 三级能参与和自身生活、文化娱乐活动、学习和工作相关的事务与社会活动,能关注身边的社会现象与问题并阅读与此相关的材料。语言交流以口语为主,也能运用书面语。学历参照:具有相当于初中毕业的文化水平。职业参照:一般从事对语言文字运用能力略有要求的初级技术工作。

四级语言积累较丰富,阅读面较宽,能思考地方、国家和世界范围内的重大事件,并发表一些片段式的个人见解,能初步使用相关领域的专门词语。学历参照:具有相当于高中毕业的文化水平。职业参照:一般从事对语言文字能力有一定要求的一般技术工作。 五级能参与较广泛的社会活动,熟悉自己专业领域的语汇,有较宽的知识视野,对社会政治、经济、文化等方面问题有较广泛的关注和理性思考。?学历参照:具有相当于大专及以上的文化水平。?职业参照:一般从事对语言能力有较高要求、但不以语言文字为专业的工作。 六级词语积累、语言运用知识和经验的积累都比较丰富,视野开阔,知识面广,对社会政治、经济、文化等方面问题有广泛的关注和比较系统的思考?学历参照:具有相当于本科及以上的文化水平。?职业参照:一般从事语言文字方面的专门工作。

语文语言表达得体的题高考语文-高考语言表达得体题(四)|61-80题(选择题)

语文语言表达得体的题高考语文-高考语言表达得体题(四)|61-80题(选择题) 高考语言表达得体题(四)|61-80题(选择题) 61.下列各句中,表达得体的一句是() A.毕业之后,学生垂念师恩。值此春节到来之际,谨祝恩师节日快乐,万事如意! B.承蒙你把这么重要的事交给我,遗憾的是毕竟资历尚浅,能力有限,我只能敬谢不敏了。 C.刘老师的一番话真是抛砖引玉,使我深受教育,像刘老师这样快要退休的老师仍在为培养我们而略尽绵薄,难道我们倒可以对学习不负责任? D.这次办理出国手续,多亏了你的鼎力相助。明天我将登门致谢,请你在家恭候。 61.B(A项“垂念”称对方(多指长辈或上级)对自己的关心挂念,此处应改为“感念”。B项“敬谢(推辞)不敏(不聪明,没有才能)”是恭敬地表示自己能力不足,不能够接受做某事。多作推辞做某事的婉辞。C项“抛砖引玉”是自谦之词,比喻用自己不成熟的意见或作品引出别人更好的意见或好作品。D项“恭候”敬辞,恭敬地等候别人。) 62.下列各句中,表达得体的一句是()

A.你是班上的“笔杆子”,我想向《高中生》投稿,烦请你把我的这篇大作斧正一下。 B.明日是我的18岁华诞,我准备明晚邀请几位好友一起庆祝,到时,请你屈驾光临。 C.李教授出差路过此地,受到了同窗好友的热情接待,分别时,他连说:“叨光!叨光!” D.我起身与舅舅告别,舅舅送我到大门口说:“实在对不起,我太忙了,我留步了。” 62.C(A项“大作”是称人作品的敬词。B项“华诞”是敬词,称伟大的人物或机构诞生的日子。此处大词小用,改为“出生纪念日”。C项“叨光”是受到对方好处表示谢意时用的客套话。D项“留步”是敬词,客人离去时请主人不要再送的客套语。) 63.下列各句中,表达得体的一项是() A.这节公开课效果很好,师生之间解惑答疑,不耻下问,形成了良性互动。 B.特邀您作为嘉宾莅临我校校园戏剧节,相信您会有幸观赏到最具特色的演出,敬候您的光临。 C.本人昨日不慎于学校阅览室丢失阿伦特《反抗平庸之恶》一书,期盼拾得者璧还原物,不甚感激! D.工会提议用探望一线劳动者的方式过“五一”,这很有意义,群众积极响应,没有一点异议。

国家职业汉语能力测试模拟试卷七(含答案)

国家职业汉语能力测试模拟试卷(一) 一、阅读理解(50题,60分钟) 第一部分(第1~120题) 说明:1~20题。每道试题提供1段文字,并带有1个问题,请你阅读后根据提问,在4个备选项中选出最恰当和答案。这部分试题主要测查对句段的概括、归纳、理解能力。答案参考时限为20分钟。 1.父子两人在雪地上比赛走路,看谁走得又直又快。父亲看着终点,一步一个脚印,走得既直又快;儿子看着自己走的每一步,走一步回头看一直,结果又慢又弯曲。 这段文字是要说明: (A)如果只盯着过程,就会忘记目标(B)过于小心谨慎,反倒会影响效果 (C)我们不应该总是留恋过去,而应具有长远的目光(D)丰富的人生阅历,可以帮我们更完美地到达终点 2.在中国近代历史上,“血肉长城”一词不停地被人使用。其实,最能够被冠以这一赞誉的,只有滇缅公路。 这段文字间在强调: (A)滇缅公路是伟大之作(B)滇缅公路是唯一的“血肉长城” (C)历史上的“血肉长城”都不如滇缅公路(D)滇缅公路的筑成过程充满了艰辛和血汗 3.在整个世界经济一片衰退之际,中国经济的“一枝独秀”让我们出了名。但是,善于思考的人们还会发现一个让我们清醒的话外音——“一枝独秀不是春”。如今,整个世界经济的严冬对我们这个枝独秀的温暖角落产生了些许影响。 对这段文字概括最准确的是: (A)我国经济增长面临着挑战(B)中国经济与世界经济对比鲜明 (C)世界经济状况陷入不良循环之中(D)当前中国经济形势喜人,不断增长 4.教师不应该把年轻人当成等你灌充的空瓶,而是应该把他们看成等你点燃的蜡烛。 这句话是要告诉教师们: (A)正确的人生态度(B)要带给学生希望 (C)不要让学生等待(D)正确的教学方法 5.一只屎壳郎推着一个粪球以不慢的速度在并不平坦的路上奔走,突然它推的粪球一下子扑到了一株植物上,它在尝试了很多办法后终于把粪球从剌上推了下来,它没有丝毫的停滞,没有从困境中走出的长吁短叹,像没事一样匆匆离开了。 这段文字传递了什么样的信息? (A)不要轻易放弃任何机会(B)遇到困难了要客观全面的分析 (C)不能莽撞,成功需要等待时机(D)生活本没有痛苦,不要太计较得失 6.机会就像一扇迅速旋转的转门,那个空档转到你面前时,你必须迅速挤进去。 这段话意在强调: (A)机会来去无踪(B)机不可失,时不再来 (C)人要审时度势,随机应变(D)机会瞬息万变,万变不离其宗 7.一个中国留学生对一位西方学生说:“我的母亲特别无私,她把自己的精力都奉献给了单位。她过去经常书忙于工作而顾不上照管我们,我们姐妹经常饿着肚子等她很晚回家。”这位西方学生说:“这叫什么无私啊,我妈妈才叫无私呢,她为了我们姐弟几个,把工作都辞了,一辈子在家里照顾我们!” 这段文字主要体现了东西方: (A)妇女社会地位的差异(B)妇女的人生观有差别

相关文档
最新文档