国外作文自动评分系统评述及启示

合集下载

AI智能作文批改:提高英语写作水平

AI智能作文批改:提高英语写作水平

AI智能作文批改:提高英语写作水平随着科技的不断发展,人工智能(AI)在各个领域的应用越来越广泛。

其中,AI智能作文批改系统的出现对于提高学生的英语写作水平起到了积极的促进作用。

本文将探讨AI智能作文批改系统的优势,并提供一些建议,将其作为学习的有力工具。

首先,AI智能作文批改系统的最大优势之一是其高速度和准确性。

相比人工批改,AI系统可以在几秒钟内完成对一篇文章的检查,并给出精确的评分和反馈。

这种高效率的处理能力使得学生可以及时了解自己的写作问题,并进行有效的修正。

此外,AI系统能够基于大量的语言模型和写作样本进行分析,提供更准确的语法、拼写和词汇建议,从而帮助学生避免常见的错误。

其次,AI智能作文批改系统具备个性化的学习功能。

这意味着系统可以根据学生的特点和需求,定制化地提供反馈和指导。

通过分析学生的写作样式和错误模式,系统可以识别出学生的弱点,并推荐相应的学习资源和练习活动。

这种针对性的辅导将有效提高学生的学习效果,帮助他们更好地理解并运用英语写作技巧。

此外,AI智能作文批改系统还具备自动评估和科学评分的能力。

使用传统的人工评分方法,评分标准可能存在主观性和不一致性的问题。

而AI系统通过基于大数据和机器学习的方法,可以在全面考虑各种因素的基础上,给出客观、科学的评分。

这种标准化的评分方式使得学生更加清楚自己在写作方面的实际水平,并能根据评分结果有针对性地进行更高层次的提升。

然而,虽然AI智能作文批改系统具备诸多优势,但仍然需要学生正确地使用与之配合。

首先,学生需要养成良好的写作习惯,并自觉地使用AI系统进行定期的作文练习。

其次,学生需要积极参与自我学习和反思,不仅仅局限于接受系统的纠错和建议,还要从中总结出自己的问题并进行深入思考。

最后,学生还需要结合课堂教学和其他学习资源,通过多种途径提升自己的英语写作水平。

综上所述,AI智能作文批改系统作为一种先进的学习工具,对提高英语写作水平有着积极的影响。

ai评英语作文

ai评英语作文

ai评英语作文{z}Document: AI Evaluation of English EssaysIntroduction:The use of Artificial Intelligence (AI) in evaluating English essays has gained significant attention in recent years.AI-based essay evaluation systems aim to provide accurate and efficient feedback to students, helping them improve their writing skills.This document discusses the benefits and challenges of using AI for evaluating English essays.Benefits of AI Essay Evaluation:1.Quick and Efficient Feedback: AI essay evaluation systems can provide instant feedback to students, saving time for both teachers and students.This allows students to receive timely guidance and make improvements in their essays.2.Objective Assessment: AI evaluation systems can assess essays based on predefined criteria, such as coherence, grammar, and vocabulary usage.This reduces the potential for subjective judgments by human evaluators, ensuring a fair and consistent assessment process.3.Scalability: AI essay evaluation systems can assess a large number of essays simultaneously, making it suitable for large-scale assessments such as standardized tests or entrance exams.This scalability helps in managing the increasing demand for essay evaluation in educational institutions.4.Personalized Feedback: AI systems can provide personalized feedback to students, highlighting specific areas of improvement.This tailored feedback can guide students in addressing their weaknesses and enhancing their writing skills.Challenges of AI Essay Evaluation:1.Quality of Feedback: While AI systems can provide objective assessments, they may lack the depth and nuance of feedback that human evaluators can provide.AI-generated feedback might not address the specific needs and context of individual students as effectively as human evaluators.2.Misinterpretation of Context: AI systems may not fully understand the context or cultural nuances in essays, potentially leading to misinterpretations or inaccurate evaluations.Human evaluators can better comprehend the context and provide more appropriate feedback.3.Limited Creativity Assessment: AI essay evaluation systems may struggle to assess creativity, originality, or critical thinking skills in essays.These aspects of writing require human judgment and understanding, which AI systems may not fully capture.4.Dependence on Data: AI essay evaluation systems heavily rely on data and algorithms.Any biases or limitations in the data or algorithms can affect the evaluation results, potentially compromising the fairness and accuracy of the assessment.Conclusion:AI evaluation of English essays offers several benefits, including quick feedback, objective assessment, scalability, and personalized feedback.However, it also presents challenges related to the quality of feedback, context understanding, assessment of creativity, and dependence on data.As AI technology continues to evolve, it is essential to address these challenges and integrate AI-based essay evaluation systems with human evaluators to enhance the overall assessment process.。

在线自动评价系统在大学英语写作中的应用——以批改网为例

在线自动评价系统在大学英语写作中的应用——以批改网为例

302020年42期总第534期ENGLISH ON CAMPUS在线自动评价系统在大学英语写作中的应用——以批改网为例文/罗 莉 胡 丹引言写作自动评价系统起源于20世纪60年代,国外对其的研究主要集中在三方面:一是研究机器评分与教师评分是否一致,即对系统本身效度的研究;二是研究自动评价系统对写作水平影响,由系统开发公司进行, 多采用成绩对比的量化研究方法,得出的结论都比较积极,即系统有利于提高学生的成绩;三是该系统在课堂教学中的应用研究。

国内学者唐锦兰(2011)对写作自动评价系统的应用研究做了述评;蒋学清(2011)认为,写作自动评价系统 WritingRoadmap 2 .0(由美国麦格劳-希尔教育测评中心研发)在发展非母语英语学习者的写作能力方面能发挥积极作用;何旭良(2013)阐述了我国研发的自动作文评价系统——句酷批改网的工作原理及评分信度;石晓玲(2012)探讨了批改网的利与弊,研究了该系统对学生英语写作能力发展的积极影响;杨晓琼、戴运财(2015)认为自动评价系统弥补了传统写作教学的不足。

在线自动评价系统在英语教学中得到了广泛应用,它能给师生提供方便,有必要做进一步探究,以更好地将该系统应用于英语写作教学。

一、研究设计1. 研究问题。

本研究以批改网为例,旨在探讨在线自动评价系统对非英语专业学生写作能力的影响,具体分析讨论以下问题:第一,该校学生对自己写作能力的自我认同度如何;第二,学生对批改网的认同度如何;第三,基于批改网的自我修改与同伴反馈对学生作文分数的提高是否有促进作用?2. 研究对象。

本研究抽取了武汉某高校经济学院二年级一个班级共33人,开展为期一个学期的作文训练研究。

学生每两周在网上提交一篇作文,并利用批改网的自动反馈功能自主修改,然后通过老师设置的同伴互评模式相互评阅作文。

八篇作文训练题目均来自历年的四六级考试真题,主题都与学生的学习、生活息息相关。

在写作前,老师对针对写作任务,创设课堂情境,帮助激活学生相关知识;作文完成后,老师在课堂上作点评与讲解。

英语作文电脑智能自动评分系统的使用和启示

英语作文电脑智能自动评分系统的使用和启示

英语作文电脑智能自动评分系统的使用和启示作者:杨学前来源:《教育界》2012年第30期【摘要】英语作文电脑智能自动评分系统是指对已经输入电脑的英语作文进行自动评分的电脑软件,是对人工评分的有力补充,可以大大提高教师的工作效率。

本人以IntelliMetric 系统为例,介绍目前智能评分系统的原理,为探索在我国各级各类英语教学和考试中使用智能评分系统提供一些依据和参考。

【关键词】英语作文自动评分系统在英语作文教学中,对学生作文进行批改一直被师生共识为提高写作能力的有效手段。

但是,考虑到时间、精力、作文收发等方面,又不得不承认效率不高。

在大规模语言考试中,作文又是必不可少的题型,阅卷工作量和阅卷的信度等问题一直以来都不能让我们如意。

针对这一难题,电脑智能自动评分系统提供了可以信赖、值得期盼的解决方案。

在PEG、IEA、E-rater、冰果、MY Access、IntelliMetric等几种智能评分系统中,本文选取IntelliMetric系统进行研究,对其评价标准进行理论分析,对其所评分的作文进行跟踪评析,发现其通过对学生作文按照若干评分标准问题进行回应和打分的方法能够快速、有效地解决了作文评分的效率问题,可靠性和准确性不亚于人工评分的水平,完全可以作为人工评分的补充手段。

由此看来,智能评分系统的发展值得期盼。

一、IntelliMetric系统概述IntelliMetric系统发布于1998年1月,是第一个提供给教育机构的智能作文评分软件,相比传统的人工评阅具有许多优点,如:准确度大于个人评分,尤其大于单人人工评分;提供即时反馈等等。

发布以后,系统得到了广泛的应用。

IntelliMetric系统作为一个智能评分系统,充分模拟了人工评分的过程。

系统开发时经过了大量的测试培训,即不断通过人工纠正其自动认定的给分点,直至契合。

值得提出的是,系统不是将所有的给分点简单地相加,而是通过分析给分点之间的聚合关系,模拟人工从整体上看待作文并给出判断,这一点上跟人工评分的过程是一致的。

冰果英语智能作文系统

冰果英语智能作文系统

冰果英语智能作文系统前阵子,因为英语老师布置的作文作业,我接触到了一个叫冰果英语智能作文系统的玩意儿。

一开始听到这个名字,我心里还犯嘀咕:“这能是个啥厉害的东西?能帮我把那头疼的英语作文搞定?”带着满满的怀疑,我决定去探个究竟。

打开这个系统,界面倒是挺简洁清晰的,没有那些花里胡哨让人眼花缭乱的东西。

我试着按照提示输入了作文题目,然后就像等待一场未知的冒险一样,心里七上八下。

没一会儿,系统就给出了一篇范文。

我一看,哟呵,这语法错误倒是没见着,句子结构也还算合理。

可再仔细一读,总觉得少了点啥。

就好像是一个机器人按照设定好的程序拼凑出来的文字,虽然挑不出大毛病,但就是缺了那么点儿灵魂。

为了更深入地了解这个系统,我决定多试几次不同的题目。

我绞尽脑汁地想啊,把能想到的各种主题都试了个遍,从“我的周末”到“我最喜欢的动物”。

每次系统给出的作文都中规中矩,该有的要点都有,可就是没法让人眼前一亮。

有一次,我写了一篇关于和朋友吵架又和好的经历。

我在作文里详细描述了当时的心情,那种愤怒、伤心还有最后的释然。

可系统给出的修改建议,只是在语法和词汇上做了些调整,对于我那些真情实感的表达,似乎并没有真正理解。

我就想啊,这冰果英语智能作文系统,它就像是一个严格的语法老师,能帮你把句子打磨得更规范,可对于文章中的情感、细节,它好像就有点无能为力了。

比如说,我在作文里提到和朋友吵架时,气得把手里的冰淇淋扔在了地上,那冰淇淋在地上融化成一滩彩色的污渍,就像我当时破碎的心。

这么生动的细节,系统可没给我任何特别的反馈,它关注的只是我有没有用对时态,有没有拼写错误。

还有一次,我写了去海边度假的经历。

我形容那海浪拍打着沙滩的声音,像一首动听的交响乐,让我整个人都陶醉其中。

可系统对我这些充满想象力的描述,也没有给出什么特别的评价,只是说我的形容词用得不错。

经过这几次的尝试,我算是明白了,这冰果英语智能作文系统啊,能在语法和词汇方面给咱提供不少帮助,可要是想让作文真正有血有肉,充满感情,还得靠咱们自己去观察、去体验、去用心感受生活中的点点滴滴。

托福写作机器评分标准全面解读

托福写作机器评分标准全面解读

托福写作机器评分标准全面解读托福写作的评分是采用机器自动评分和人工评分兼顾的方式。

其中,人工评分看的是文章的内容和意义,而机器评分看的是文章的语言特征。

之所以采取两种评分方式,是为了保证评分的一致性和质量。

下面是小编给大家带来的福写作机器评分标准全面解读,希望能帮到大家!托福写作:机器评分标准全面解读(一)审查语言特征从ETS官网的描述中可以看出托福写作会有机器专门来看文章的语言,而机器看语言跟人工看语言是有区别的。

人在看文章语言的时候多半还是以印象为主,而不会去细致数每一个单词,也不会去计算文章有多少个句子。

但如果是机器评分,机器可以更精确地计算出文本中的语言特征。

来看看ETS官网对机器评分具体会看的语言特征的描述:The e-rater engine predicts essay scores based on features related to writing quality,including:errors in grammar (e.g., subject-verb agreement)usage (e.g., preposition selection)mechanics (e.g., capitalization)style (e.g., repetitious word use)discourse structure (e.g., presence of a thesis statement, main points)vocabulary usage (e.g., relative sophistication of vocabulary) 可见,e-rater 是根据以下特征来判定作文的打分:语法错误 (例如,主谓一致)词汇使用 (例如,介词搭配)机械性错误 (例如,单词大小写,拼写,单词缩写,标点符号)文风 (例如,单词重复使用)文本结构 (例如,有文章主题句以及段落主题句)词汇高级型 (e.g.使用相对较复杂的词汇)从上面的描述来看,机器评分会审查文章语言的各方面,且机器可以精准地计算出文章出现的语法错误(想一想平时用word写英文时,稍微有点小错误就会有红线、绿线出现,何况是专门看语言错误的e-rater,它只会对语法错误更为敏感)。

国外作文自动评分系统评述及启示

国外作文自动评分系统评述及启示
E2rater的开发者们声称 ,他们的作文评分系统利 用了多种技术 ,其中包括统计技术 、矢量空间模型技术 和自然语言处理技术 (Valenti et al. 2003) 。凭借这些 技术 , E2rater不光能够像 PEG那样评判作文的语言质 量 ,还能够像 IEA 那样评判作文的内容质量 。除此之 外 , E2rater还对作文的篇章结构进行分析 。
第 117期 2007年 10月
语言技术与外语教学研究
外语电化教学 CA FL E
No. 117 Oct. 2007
3 版权所有 文责自负 3
国外作文自动评分系统评述及启示
梁茂成 ,文秋芳
(北京外国语大学 中国外语教育研究中心 ,北京 100089)
摘 要 : 本文依据语言测试领域的作文评分要素 ,对国外具有代表性的三种作文自动评分系统进
将潜伏语义分析用于学生作文自动评分时 ,待评 分的作文与预先选定的范文 (训练集 )被视作为矢量 , 对矢量进行比较之后 ,可以得到每一篇待评分作文与 范文在内容上的相似度得分 ( sim ilarity score) 。该得 分被直接视为机器评分或经过转换后得到机器评分 ( Foltz et al. , 1999) 。根据 Landauer et al. ( 2000)的 报告 ,该系统所评出的作文得分与人工评分之间的相 关性达到 r = 0. 85。 1. 3 E2ra ter,一个模块结构的混合评分系统
本文对国外最具代表性的三种作文自动评分系统 进行述评 。这三种系统是 : PEG ( Project Essay Grade) 、 IEA ( Intelligent Essay A ssessor)和 E2rater。 PEG重语言 形式 , IEA 重作文内容 , E2rater则既重形式又重内容 。 一般说来 ,作文评分应形式和内容并重 ,围绕作文的语 言质量 、内容质量和篇章结构质量三个主要方面进行

英语作文自动评分

英语作文自动评分

英语作文自动评分English:Automated essay scoring (AES) is a technology that evaluates and scores essays written by students using artificial intelligence algorithms. These algorithms analyze various linguistic features of the text, such as vocabulary usage, sentence structure, coherence, and argumentation. AES has gained popularity in educational settings due to its efficiency in providing quick and consistent feedback to students. By eliminating the need for manual grading, AES saves time for educators and allows them to focus more on teaching. However, there are debates surrounding the effectiveness and fairness of AES, as it may not fully capture the complexity and creativity of human writing. Critics argue that AES may favor formulaic or superficially structured essays over those with originality and depth of thought. Additionally, there are concerns about the potential biases embedded in the algorithms, particularly regarding language proficiency, cultural background, and writing style. Despite these challenges, AES continues to evolve with advancements in natural language processing and machine learning, aiming toaddress its limitations and enhance its accuracy and fairness in evaluating student writing.中文翻译:自动作文评分(AES)是一种利用人工智能算法评估和打分学生写作的技术。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第117期2007年10月外语电化教学CAFLENo.117Oct.2007国外作文自动评分系统评述及启示梁茂成,文秋芳(北京外国语大学中国外语教育研究中心,北京100089)·鬣杠昕有主膏自负·摘要:本文依据语言测试领域的作文评分要素,对国外具有代表性的三种作文自动评分系统进行评介和比较,指出这些评分系统在训练及作文的人工评分方法和机器评分效度等方面存在的问题,并分析这些作文自动评分系统为我国自主开发作文自动评分系统所提供的借鉴作用。

关键词:作文自动评分;模型;评分要素;信度;效度中图分类号:H319.3文献标识码:A文章编号:1001-5795(2007)10-0018-0007作文是大规模语言考试(如TOEFL,GRE,IELTS等)中的一种必备题型。

通过作文可以检测应试者综合运用语言的能力。

然而,大规模作文阅卷面临两大难题:其一,阅卷需要耗费大量人力、物力等资源;其二,评判作文质量具有很强的主观性,阅卷的信度(pliability)和效度(validity)不强(Johnsonetal,1991)。

近几十年来,随着计算机硬件和软件性能快速提高,自然语言处理等技术获得了长足的发展,国外一批作文自动评分系统相继问世,这两个长期困扰大规模作文阅卷的难题有望得到解决。

本文对国外最具代表性的三种作文自动评分系统进行述评。

这三种系统是:PEG(PmjeetEssayGrade)、IEA(IntelligentEssayAssessor)和E—rater。

PEG重语言形式,IEA重作文内容,E—rater则既重形式又重内容。

一般说来,作文评分应形式和内容并重,围绕作文的语言质量、内容质量和篇章结构质量三个主要方面进行(Blok&deGlopper,1992;Purves.1985;Weigle,2002;梁茂成,2005),然而这三种系统侧重各有不同,在这三个方面的分析力度也存在很大差异。

通过对比分析,笔者力图揭示这些作文自动评分系统的优势与劣势,以期对开发我国学生作文自动评分系统有所启示。

I国外作文自动评分系统述评1.1PEG.一个重语言形式的评分系统PEG于1966年由美国杜克大学(UniversityofDuke)的EllisPage等人开发(Daigon,1966;rage,1966)。

PEG的设计者们认为,计算机程序没有必要理解作文内容,大规模考试中尤其如此(Shermiseta1.。

2001)。

因此,他们在其网站上公开申明:“PEG不能理解作文的内容”(http://134.68.49.185/PEG-DEMO/)。

在PEG的开发者看来,作文质量的诸要素是作文的内在因素,无法直接测量,因此,最为合乎逻辑的方法是从作文文本中提取一些能够间接反映作文质量的文本表层特征项(surfacefeatures)。

Page首先收集了一部分人工评分后的作文(训练集),利用当时并不发达的自然语言处理技术,从作文中提取若干个文本特征项(textfeatures),并在这些文本特征项与人工评分之间进行相关性分析。

然后,Page选择与人工评分相关的文本特征项作为自变量,把人工评分作为因变量,进行多元回归分析,得到回归方程。

回归方程为每一个变量确定了beta值,这样,在对新的作文进行评分时,PEG只需要提取这些变量,并把beta值代人回归作者简舟:粱茂成:男,博士,教授。

研究方向:应用语言学厦计算语言学。

文秋芳:女,教授。

研究方向:语言学覆应用语言擎。

收稿日期:2007-01.1.5’基金项目:本研究得到教育部人文社科项目(编号06JA740007)和中国外语教育研究中心重大研究项目的资助,在此一井致谢。

·18·墨蕉盛:笙!垦盐堡墨自塑堡坌墨丝塑垄垦生至方程之中+就可以预测出这些作文的得分。

经过开发者的多年努力,PEG“目前的程序中使用很多复杂的变量”(Page&Peterson,1995)。

遗憾的是,对这些所谓“复杂的变量”,PEG的开发者们没有详细报告,展现给我们的仅是一个“黑匣子”(Kaplaneta1.,1998)。

比较Page和Peterson(1995)和Page(1968)的变量列表,他们的确增加了几个冠以代码的新变量,其中部分变量可能的确比早期的更加复杂,但PEG的理论基础和工作原理没有发生根本的变化(Page,1994)。

由此看来,PEG实现作文自动评分有三个步骤:变量提取、多元回归分析和把多元回归得到的hem值代入计算机程序换算出作文得分(Chung&O'Neil,1997;Page,1994)。

概括起来,PEG的技术大体包括两方面:其一,PEG使用的统计方法是多元线性回归,以此来确定各变量的beta值,这样,基于训练集作文而构建的统计模型便可以用来为新的作文进行自动评分。

这一技术合理而容易理解,后期出现的作文自动评分系统大多采用这一技术。

其二,自然语言处理技术是PEG提取变量的主要方法。

基于这两种技术,PEG取得了很好的评分效果。

有关PEG的技术报告中申明,PEG的评分结果与人工评分结果十分一致。

据Page(1994)和Page和Peterson(1995)报告,PEG在1994年的实验中取得了很好的结果,多元回归系数(multipleR)达到了R=0.877。

i.2lEA.一个重内容的评分系统IEA(IntelligentEssayAssessor)是一种基于潜伏语义分析(LatentSemanticAnalysis)的作文自动评分系统,由美国科罗拉多大学的ThomasLandauer等学者开发。

与PEG显著不同的是,IEA的设计者们在其网站上申明:“IEA是唯一能够测量语义和作文内容的程序”(http://tsacolorado.edu)。

据IEA的设计者们报告,潜伏语义分析主要分析文本的内容和学生作文中所传达的知识,而不是作文的风格或语言(Foltzetal,1998)。

根据Landauer和Dumais(1997)的描述,潜伏语义分析既是一种理论,也是一种技术。

这种理论认为,在文本中隐藏着一个潜在的语义结构(senlantiestrac·tura).这一潜在的语义结构正是所有词汇(潜伏语义分析称之为“词汇项”,即temm)的语义之和(Dumaiseta1.,1982)。

然而,由于自然语言中存在大量的多词同义(synonymy)和一词多义(polysemy)现象,常常使得语义结构带有大量的干扰信息(noise)。

从技术的角度看,潜伏语义分析是一种矢量空间模型(VectorSpaceModel,VSM)技术,但与一般的矢量空间模型相比.这种技术能够通过减少维数(dimensionality)的方法(Landauer&Dumais,1997;桂诗春,2003),有效地过滤干扰信息,提取数据中的潜在语义结构(Chung&0’Neil,1997)。

潜在语义结构可以通过一个词汇项一文档矩阵(terlll-by—documentmatrix)来代表,矩阵中的每~行代表一个词汇项,每一列代表一个文档,而矩阵的每一个单元格中填人对应词汇项在对应文档中出现的频数。

使用矩阵代表潜在语义结构的好处,是对矩阵可以进行一种称之为奇异值分解(SingularValueDecem—position。

SYD)的矩阵运算,通过该运算,原来的矩阵可以被分解成为三个不同的矩阵。

减少维数后,对这三个矩阵进行进一步的运算,可以重建一个矩阵。

重建后的矩阵因为使用了较少的维数,与原来的矩阵相比,可以更好地代表潜在语义结构。

该矩阵保持了原来矩阵中最重要的语义联想关系(associationpattern.s),同时又排除了大量的干扰信息(Decrwestexeta1.,1990;Dumaiseta1.,1982;Landauereta1.,1998)。

将潜伏语义分析用于学生作文自动评分时,待评分的作文与预先选定的范文(训练集)被视作为矢量,对矢量进行比较之后,可以得到每一篇待评分{乍文与范文在内容上的相似度得分(similarityscore)。

该得分被直接视为机器评分或经过转换后得到机器评分(Foltzeta1.,1999)。

根据Landauereta1.(2000)的报告,该系统所评出的作文得分与人工评分之间的相关性达到r=0.85。

1.3E-rater.一个模块结构的混合评分系统E.rater是由美国教育考试处(EducationalTestingService,ETS)于20世纪90年代开发,其目的是评估GMAT考试中的作文质量(Bursteineta1.,1998a;1998b;1998e)。

据Bursteineta1.(2001)、Coheneta1.(2003)和Valenfieta1.(2003)的描述,E-rater自1999年以来已经进人操作阶段,至2003年,共评定作文750,000篇。

E.rater的开发者们声称,他们的作文评分系统利用了多种技术,其中包括统计技术、矢量空间模型技术和自然语言处理技术(Valenfieta1.2003)。

凭借这些技术,E-rater不光能够像PEG那样评判作文的语言质量,还能够像IEA那样评判作文的内容质量。

除此之外,E.rater还对作文的篇章结构进行分析。

与PEG相类似,E—rater的评分方法基于线性回归·19·鲞垄盛:釜!垦盐堡叁自堂堂坌墨堕堡堡垦生至表l三种作文评分系统比较模型(Powersel:a1.2000)。

E-later围绕三个主要方面对作文的质量进行分析和评判,Burstein等人把这三个方面称作为模块(BurRtein&Mareu,2000)。

E.rater的第一个模块为话语(discourse)结构(亦即篇章结构)分析模块,主要靠在文本中搜索“Insummary”、“Incoil-clusion”等提示词(cuewords)的方法得以实现(Burst-eineta1.,1998b)。

E-rater的第二个模块为句法多样性(syntacticvariety)分析模块,根据作文中句子结构的多样性来评判作文的质量。

显然,该模块的目的是分析作文的语言质量。

E-rater的第三个模块为内容(content)分析模块。

在这一模块中,E—rater通过矢量空间模型,观察作文中是否包含了足够的与作文题目高度相关的主题词。

E·rater的三个模块中分别包括哪些变量,有关报告一直含糊其辞(或许是出于商业方面的考虑)。

Ku.kith(2000)报告说E—later可以提取100多个变量,Powerseta1.(2000)声称E—rater可以提取50多个变量,而AttalJ和Burstein(2004:5)的报告则说最新版本的E—rater“依据有关理论对写作能力的若干方面给予考虑”,只提取12个变量。

相关文档
最新文档