作文自动评分总结

作文自动评分总结
作文自动评分总结

李艳老师和葛诗利老师《大学英语作文自动评分中分级词表的效度研究》中提出了作文分级词表的思想,而这可以通过改进或者调整已有的词表来获得。

目前自然语言处理中准确率最高的、也是最基本的研究就是词汇分析,词汇分析一般包括词长分布、词汇分布和词汇丰富性等。

词汇分布:一篇作文中的词汇占某一分级词表每个级别词汇的比例。Laufer&Nation的3个级别的词表。

CLEC中国学习者英语语料库

SPSS软件包的单因素方差分析(ANOV A)

SPSS多元线性回归

分数档的精确率和召回率,总体准确率和误判率

个分数精确率=本为X档作文并且被评为X档作文的数量/所有被评为X档作文的总数*100 精确率越高,说明作文被评为该分数档的可信度越高

Laufer&Nation 以词族为计算单位,词频概貌

文秋芳以类符为计算单词,称为词频广度

倪岚以形符为计算单位词频分布

准确率都是30%左右

徐剑和梁茂成《对集中英汉机器翻译系统的测评》

翻译系统在译文输出方面已经比较成熟,源语言的语义识别方面还不如人意。

80年代,机器翻译研究863智能型英汉翻译系统—“译星一号”

评估标准:系统功能,操作的难易度及译文质量(包括译文的忠实度、译语的可懂度和译文的可接受性)

欧共体评估:识别(译文的得懂度、忠实度、连贯度、有用性、读取速度和译文的可接受性)和语言方面(句子结构和语义的连贯性、词汇评价、翻译错误)

可懂度、忠实度和译文的可接受性

梁茂成和李刚《英汉机器翻译中人称代词的处理》徐州师范大学外语系

汉语术语分析语,词序、虚词等来表达各种语法关系;

英语属于综合语,通过词本身的形态变化来表示

英语中人称代词的使用频率要远远高于汉语

汉语属于孤立性语言,英语为粘着性语言

原因:

1.汉语表示所属关系的物主代词往往可以省略

2.英语中大量使用反身代词

反身代词:(译星对反身代词处理较为得当)

1.英语较汉语大量使用反身代词

2.汉语反身代词具有独立的指称功能,英语则依附于其他代词或名次,无独立的指称功能。英汉第二人称代词的差异

You是你还是你们?

英语代词的预指功能

人称代词在机器翻译中的处理

1.调整语法信息库(代词的主要作用是代替名词)

2.条件句

自动评分技术

陆军,梁颖红,陆玉清,李斌,姚建民《多分类器融合技术在自动作文评分中的应用》 分类器:贝叶斯、K 近邻和支持向量机

自动作文评分(Automated Essay Scoring ,AES )

国外主观题自动评分系统:E-rater 、IEA(Intelligent Essay Assessor)、PEG(Project Essay Grade) 国内最早涉足作文评分领域:梁茂成教授

中国学习者英语语料库(Chinese Learner English Corpus )对作文中的错误进行了详细标注、分类和统计

作文内容的特征(作文中的单词和短语,即通常的Uni-Gram 、Bi-Gram 和Tri-Gram 模型)考察作文的主题和内容

语言学特征:

浅层的语言学特征(句子个数、句子平均长度、单词平均长度、单词个数)考察作文的形式 复杂的语言学特征(作文中的语法、单词的词性、连接词、各种类型错误个数)考察作文的语法、连贯性和错误

特征筛选:文档频率(Document Frequency ,DF )、信息增益(Information Gain ,IG )、统计量(Chi-square Statistic, CHI )

文本分类算法

朴素贝叶斯(Na?ve Bayes )假定各种特征之间相互独立。性能不稳定,易受分类任务的影响。

K 近邻(K-Nearest Neighbor )要求有较高质量的训练集,K 值确定比较难

支持向量机(Support Vector Machine ,SVM )基于结构风险最小化理论

评价分类结果的好坏:准确率p 、召回率r 和F1测度

)/(21r p r p F +??=

E-rater 商用机器评分系统,准确率计入相邻分数

所有分类方法的效果都要低于它们在其他方面的分类效果

原因:四级作文本身的特点和各分数作文的篇章数的分布情况

结束语:

语言学特征更能体现作文的水平 NLP 技术

曹亦微,杨晨《使用潜语义分析的汉语作文自动评分研究》

评分方式

1. 依靠精确的分析和提取反映文章质量的指标进行评分,指标大多是语法层面上的;

(PEG )

2. 另一种是整体评分,综合使用了文章的词语使用、论述结构、句法结构以及内容和语义

等方面的特征(e-rater :统计方法+自然语言处理技术)。

潜语义(LSA ,latent Semantic Analysis )

葛诗利,陈潇潇《文本聚类在大学英语作文自动评分中应用》

文本聚类把作文按内容的相似程度聚集到一起,形成一棵内密外疏的聚类树。识别跑题作文 文秋芳:“作文内容能够解释作文总体质量56%的差异”

内容评价:采用文本自动层级聚类

优点:不需要事先基于大规模标注训练集构建评价模型

PEG侧重结构分析,较高的评分准确率,忽略内容,更多地注重表面结构

IEA 只基于潜伏语义分析测量的是“文本的内容和学生作文中所传达的只是,而不是作文的风格或语言”,适用于本族语作文(基本没有较大语言失误)—单独的潜伏语义分析用于外语作文评分显然不够

BETSY基于文本分类技术

E-rater,IntelliMetric,语言质量和内容兼顾,适用外语作文自动评分

E-rater内容分析采用了向量空间模型,作文首先转化为词频的向量,再合并语言质量得分层级聚类:自底向上(Bottom-up合并聚类)和自顶向下(Top-down分割聚类)

常见文档聚类算法:

k-means算法(分割)

凝聚层级算法(Hierarchical Agglomerative Clustering,HAG 层级算法)

建立特征向量TF-IDF(Term Frequency-Inverse Document Frequency)

葛诗利,陈潇潇《大学英语作文自动评分研究中的问题及对策》

四个难题:评分标准、针对性、通用性和人机界面的划分

作文自动评分研究使用技术:计算机统计技术、自然语言处理技术、信息检索技术和人工智能技术

马希文计算机解决问题前提条件:

第一,必须把待解决的问题形式化

第二,这种问题必须是可计算的

第三,这种问题必须有一个合理的复杂度,要避免指数爆炸

语言:人工选取特征和机器统计加权

非英语专业大学生作文语言使用特征:词汇、短语、句法、搭配和错误

PEG统计文章长度、各种词类的数量、词长的变化(浅层文本特征)

IEA使用词汇统计,实义词的统计

E-rater基于词汇统计(内容),浅层文本特征(语言)

把内容评分转换为词汇向量的统计比较

针对语言使用的评分,低分段评分准确率非常高,中、高分段,尤其是高分段准确率较低

梁茂成、文秋芳《国外作文自动评分系统评述及启示》

信度(reliability)效度(validity)

PEG(Project Essay Grade)重语言形式

实现步骤:变量提取—多元回归分析—多元回归得到的beta值代入计算机程序换算出作文得分

IEA(Intelligent Essay Assessor)重作文内容

矢量空间模型(Vector Space Model VSM)过滤干扰信息,提取数据中的潜在语义结构

潜在语义结构词汇项(即词汇)—文档矩阵term-by-document matrix

之后对矩阵进行奇异值分解(Singular Value Decomposition,SVD)把原来矩阵分解为三个不同矩阵,再重建一个新的维度较少的矩阵

E-rater既重形式又重内容—一个模块结构的混合评分系统

基于线性回归模型

三个模块:

第一模块,话语(discourse)结构,即篇章结构,依靠搜索提示词(In summary…)实现

第二模块,句法多样性(syntactic variety)—分析语言质量

第三模块,内容(content)分析模块,通过矢量空间模型,观察作文中是否包含了足够的与作文题目高度相关的主题词。

不足:

a)对语言质量的分析主要考虑的知识作文的句法多样性,(语言质量的分析应该包

括:词汇、句法、语言的准确性)

b)与IEA相比,内容质量分析模块显然尚有提高的余地(E-rater基于主题词分析

技术,IEA使用潜伏语义分析法是一种降维技术,可以有效去除文本中的干扰

信息)

c)篇章结构分析模块靠搜索作文中的In conclusion等话语标记语,容易被考生识

破,导致不利的反拨作用(wash back effect)

评价评分的合理:评分的效度

评分模型中的内核技术问题

多元回归统计技术,以多个文本特征作为自变量,以人工评分作为因变量(基本技术)自然语言处理技术,挖掘变量

信息检索技术—分析学生作文的内容质量

韩宁《几个英语作文自动评分系统的原理与评述》

PEG最早目标变量trin,相关变量prox

IEA 需要较少的训练集

E-rater(ETS Education Testing Service,目前正在使用)和Criterion

Criterion作文评分和评价服务系统,综合了E-rater和Critique(诊断文章中的语法和用法错误)

IntelliMetric,核心技术是基于人工智能理论开发的,是一种模仿人脑思考的过程并将专家的智慧合成起来的学习机器

分析和每篇文章每个具体分数点相伴随的语言的特征—分数量表和评分规则

分析的变量多

非线性,多维度,建立在多个数学模型之上并且支持语言的作文评分

My Access!为语言教学服务

针对美国的教育体系和教育环境的写作评价工具,学生可以得到迅速的结构化的反馈和诊断报告

BETSY目前属于管理学研究生招生委员会GMAC(Graduate of Management Admission Council)

核心原理是:贝叶斯方法

反垃圾邮件:所有受到的邮件要与经分类的邮件进行相似性比较,凡和垃圾邮件非常相似的要被拒之门外;

文献分类:多元贝努利模型(将每篇作文看做是所关注的作文的优劣特征的特例,关注是否一个特定的特征在一篇文章中存在)和多项模型(把每篇作文看做是我们所关注的作文的优劣特征的样本,关注一个特定的特征在一篇文章中是否多次出现)

共同点:

第一,需要大量训练集

第二,除了给出总分之外,强调在写作各个方面提供尽可能详细的反馈信息

第三,与人工评分之间的一致性

葛诗利,陈潇潇《中国EFL学习者自动作文评分探索》

Write认识Workbench(WWB)工具包,给读者在拼写、措词及可读性方面提供反馈,包括拼写检查程序,措词程序和计算可读性程序

E-rater采用了基于NLP的工具包,如:词性标注器、句法分析器、篇章分析器和词汇相似性度量器,采用了基于语料库的方法建模。

前三个模块+第四个模块(用来选择和加权对作文评分具有预测力的特征)+第五个模块(计算最后得分)

E-rater仍然侧重于内容

AES目标:为学生提供一个基于网络的写作环境,反馈很重要

IEA前提条件:100篇已评分的作文作为训练预料;样板作文和知识源材料;未评分作文集的内部比较

陈潇潇,葛诗利《自动作文评分研究综述》

作文自动评分系统:基于统计、自然语言处理以及人工智能(1999年付诸实用)

优点:可靠性、客观性、经济性、及时性、互动性

PEG 标准多元回归—回归系数

评分特征:

1.作文长度—写作的流畅性;

2.介词、关系代词—表明句子结构的复杂性、多样性;

3.词长变化—表明文章的措辞情况(因为非常用词一般都比较长)

评分原理:

1.从经过人工评分的作文中统计出上述prox指标,

2.然后以这些prox指标为自变量,和人工分数

3.做标准多元回归,得出回归系数,建立回归方程。

4.再将待测作文的prox指标代入回归方程,进行自动评分。

其假定前提:作文的质量好坏可以通过统计得来的prox指标体现

IEA (智能评分系统)基于潜在语义分析

工作原理:

1. 将一个文件和其所使用的单词放到一个二维语义空间矩阵,借助单值分解的矩阵代数法

进行转换,得到新矩阵(横行是单词,纵列是单词所在的上下文,数字代表单词频率)

2. 根据词频,赋予每个词权重,词频越高,权重越低

3. 再经过一次SVD转换,把矩阵分成三个单维的子矩阵

4.余弦相关指标,检验学生作文和标准答案的相似性程度

E-rater(电子评分员)关注语言形式

句法分析器—篇章分析器—作文主题分析器和论点主题分析器—模型构建—评分

逐步线性回归,在56个变量中进行筛选,建立回归方程

问题:不能判别语法正确、但内容空洞的作文

IntellMetric 评估了语义、句法、篇章3个层次300多个特征

BETSY 概率论,文章非为优、良、合格、不合格80%准备率与测试结果不同

朴素贝叶斯:朴素假设条件独立

C-rater(Conceptual Rater内容性评分工具)

不需要训练集,只需要标准答案

Automark(简答题自动评分)

评分过程:

1.把回答文字的标点和拼写法规范成标准形式;

2.进行句子分析,分析每一个句子的语义与上下文联系

3.与模板进行匹配,看学生作文的语法成分和评分模板里的哪一类最为匹配

4.得出匹配结果

模板信息:包括拼写、输入、句法、语义四方面的错误

SEAR(Schema Extract Analyses and Report,提取要素评分法)

李亚男《汉语作为第二语言测试的作文自动评分研究》

研究样本—少数名族汉语水平考试三级作文

研究方法—多元线性回归分析,45个可量化的评分要素作为自变量,老师分数为因变量,利用逐步回归(stepwise)和强迫输入回归(enter)提取变量,进行多元线性回归分析,样本随机组内进行交叉验证。得出8个回归方程,选取其中给一个作文自动评分方程。TOEFL(the Test of English as a Foreign Language,托福)

GRE(Graduate Record Examinations)

IELTS(the International English Language Testing System,雅思)

GMAT(Graduate Management Admission Test)

SAT 美国高考

TOEIC(Test of English for International Communication,托业)

英语作文自动评分系统的制作技术

本技术公开了一种英语作文自动评分系统,涉及作文批改技术领域,包括作文读取模块、作文评判模块、人工评分模块、机器评分模块、评分输出模块和权重修改模块,所述作文评判模块电连接所述作文读取模块、所述人工评分模块、所述机器评分模块、所述评分输出模块和所述权重修改模块,所述权重修改模块电连接所述机器评分模块。本技术不仅能够自动对英语作文进行评分,总结出错地方、给出改正意见,而且各项评分标准的比重也可以由操作者自行设定,同时还能够自由设置人工评分和机器评分的比重,适应于多种英语作文的自动评分情况。 技术要求 1.一种英语作文自动评分系统,其特征在于,包括作文读取模块、作文评判模块、人工评分模块、机器评分模块、评分输出模块和权重修改模块,所述作文评判模块电连接所述 作文读取模块、所述人工评分模块、所述机器评分模块、所述评分输出模块和所述权重 修改模块,所述权重修改模块电连接所述机器评分模块; 所述作文读取模块用于识别英语作文、并进行字数统计和格式检查;所述人工评分模块 用于通过人工对英语作文进行评分;所述机器评分模块用于通过系统内的多项评分标准 自动对英语作文进行评分;所述作文评判模块用于对英语作文进行综合评价,并按照人 工评分比重和机器评分比重计算英语作文最终得分;所述评分输出模块用于输出最终评 分并总结错误、给出修改建议;所述权重修改模块用于修改所述机器评分模块内的多项 评分标准的权重系数。

作文识别模块、字数统计模块和格式检查模块,所述作文识别模块用于识别读取出英语作文,所述字数统计模块用于统计英语作文字数,所述格式检查模块用于对英语作文进行格式检查。 3.如权利要求1所述的一种英语作文自动评分系统,其特征在于,所述机器评分模块包括拼写检查模块、语法检查模块、单词高级度模块、要点覆盖模块、整体美观模块和评分汇总模块,所述拼写检查模块、所述语法检查模块、所述单词高级度模块、所述要点覆盖模块、所述整体美观模块均与所述评分汇总模块电连接; 所述拼写检查模块用于对英语作文的单词拼写进行检查,所述语法检查模块用于对英语作文的语法进行检查,所述单词高级度模块用于对英语作文的高级度进行判别,所述要点覆盖模块用于对英语作文的要点覆盖程度进行判别,所述整体美观模块用于对英语作文整体美观程度进行判别,所述评分汇总模块用于汇总所述拼写检查模块、所述语法检查模块、所述单词高级度模块、所述要点覆盖模块和所述整体美观模块的各项比重得分并计算出最终得分。 4.如权利要求3所述的一种英语作文自动评分系统,其特征在于,所述评分汇总模块内的评判公式为: 汇总得分=拼写检查得分*拼写检查权重+语法检查得分*语法检查权重+单词高级度得分*单词高级度权重+要点覆盖得分*要点覆盖权重+整体美观得分*整体美观权重。 5.如权利要求4所述的一种英语作文自动评分系统,其特征在于,所述拼写检查权重、所述语法检查权重、所述单词高级度权重、所述要点覆盖权重和所述整体美观权重均由操作者自行设置且满足总和等于1。 6.如权利要求1所述的一种英语作文自动评分系统,其特征在于,所述评分输出模块包括错误总结模块、改正建议模块和评分结果模块,所述错误总结模块用于对英语作文中出现的错误进行总结,所述改正建议模块用于针对英语作文中出现的错误给出改正建议,所述评分结果模块用于输出英语作文的最终结果。

英语作文评分标准

英语作文评分标准 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

一、评分标准 一档文 17-20分:写出全部内容要点,层次清楚、语言流畅,有句式变化,有复杂结构(至少2-3个),基本无语法错误(1-2个错误),或有少量由于使用复杂结构而引起的语法或拼写错误,但不影响意义理解。 二档文13-16分:基本写出全部内容要点,层次清楚、语言流畅,有少量语法错误(3-4个错误)。 三档文9-12分:写出大部分内容要点,语言基本通顺,有一些语法和拼写错误,基本不影响意思表达。 四档文5-8分:写出一半左右有关内容要点,语言不太通顺,语法结构单调、错误较多,只有少数句子可读,影响理解。 五档文0-4分:词不达意,不知所云;只有2-3个短语可读。 二、评分说明 1、短语及句子结构不对,人称、时态、语态误用,均为大错。一处大错扣1分。 2、通篇人称、时态、标点错误,统扣2分。 3、拼写、标点符号、冠词、介词等方面的错误为小错。3个小错相当于1处大错。 4、相同错误,只扣一次。 5、词数不足60词扣2分。 6、文中若出现自己及学校等真实名称扣3分。 7、书写潦草,卷面不清,乃至影响阅卷,扣2分。 三、评分标准 一档文 17-20分:写出全部内容要点,层次清楚、语言流畅,有句式变化,有复杂结构(至少2-3个),基本无语法错误(1-2个错误),或有少量由于使用复杂结构而引起的语法或拼写错误,但不影响意义理解。 二档文13-16分:基本写出全部内容要点,层次清楚、语言流畅,有少量语法错误(3-4个错误)。 三档文9-12分:写出大部分内容要点,语言基本通顺,有一些语法和拼写错误,基本不影响意思表达。 四档文5-8分:写出一半左右有关内容要点,语言不太通顺,语法结构单调、错误较多,只有少数句子可读,影响理解。 五档文0-4分:词不达意,不知所云;只有2-3个短语可读。 四、评分说明 8、短语及句子结构不对,人称、时态、语态误用,均为大错。一处大错扣1分。 9、通篇人称、时态、标点错误,统扣2分。 10、拼写、标点符号、冠词、介词等方面的错误为小错。3个小错相当于1处大错。 11、相同错误,只扣一次。 12、词数不足60词扣2分。 13、文中若出现自己及学校等真实名称扣3分。 14、书写潦草,卷面不清,乃至影响阅卷,扣2分。 五、评分标准 一档文 17-20分:写出全部内容要点,层次清楚、语言流畅,有句式变化,有复杂结构(至少2-3个),基本无语法错误(1-2个错误),或有少量由于使用复杂结构而引起的语法或拼写错误,但不影响意义理解。 二档文13-16分:基本写出全部内容要点,层次清楚、语言流畅,有少量语法错误(3-4个错误)。 三档文9-12分:写出大部分内容要点,语言基本通顺,有一些语法和拼写错误,基本不影响意思表达。 四档文5-8分:写出一半左右有关内容要点,语言不太通顺,语法结构单调、错误较多,只有少数句子可读,影响理解。 五档文0-4分:词不达意,不知所云;只有2-3个短语可读。 六、评分说明 15、短语及句子结构不对,人称、时态、语态误用,均为大错。一处大错扣1分。 16、通篇人称、时态、标点错误,统扣2分。 17、拼写、标点符号、冠词、介词等方面的错误为小错。3个小错相当于1处大错。 18、相同错误,只扣一次。 19、词数不足60词扣2分。 20、文中若出现自己及学校等真实名称扣3分。 21、书写潦草,卷面不清,乃至影响阅卷,扣2分。

大学英语六级英语作文评分方法

大学英语六级英语作文评分方法 大学英语六级考试作文的目的旨在考核学生英语书面表达的能力。作文考试时间为30分钟,要求写出不少于120个词的短文。六级考试作文的出题方式有:命题作文,看图画或图表作文,根据所给文章(英文或中文)写出文章摘要或大意,给出关键词作文章。考试的作文内容为社会、文化或日常生活的一般常识,不涉及知识面过广、专业性太强的内容。对作文的要求是:切题,文理通顺,表达正确,意思连贯,无重大语言错误。下面介绍六级考试作文的评分原则和标准,并通过五份样卷作一个详细说明。 (一)、作文评分原则 1.CET是检查考生是否达到大学英语教学大纲规定的六级教学要求,对作文的评判应以此要求为准则。 2.CET作文题采用总体评分方法。阅卷人员就总的印象给出奖励分,而不是按语言点的错误数目扣分。 3.从内容和语言两个方面对作文进行综合评判。内容和语言是一个统一体,作文应表达题目所规定的内容,而内容要通过语言来表达。要考虑作文是否切题,是否充分表达思想,也要考虑是否用英语清楚而确切地表达思想,也就

是要考虑语言上的错误是否造成理解上的障碍。 4.避免趋中倾向。该给高分的给高分,包括满分;该给低分的给低分,包括0分,一名阅卷人员在所阅的全部作文卷中不应只给中间的几种分数。 (二)、作文评分标准 1.本题满分为15分。 2.阅卷标准共分五等:2分、5分、8分、11分及14分。各有标准样卷一至二份。 3.阅卷人员根据阅卷标准,对照样卷评分,若认为与某一份数(如8分)相似,即定为该分数(即8分);若认为稍优或稍劣于该分数,即可加一分(即9分)或减一分(即7分),但不得加或减半分。 4.评分标准:2分……条理不清,思路紊乱,语言支离破碎或在部分句子均有错误,且多数为严重错误。5分……基本切题。表达思想不清楚,连贯性差。有较多的严重语言错误。8分……基本切题。有些地方表达思想不够清楚,文字勉强连贯;语言错误相当多,其中有一些是严重错误。11分……切题。表达思想清楚,文字连贯,但有少量语言错误。14分……切题。表达思想清楚,文字通顺,连贯性好。基本上无语言错误,仅有个别小错误。[注:白卷,作文与题目毫不相关,或只有几个孤立的词而无法表达思想,则给0 分。] 累记字数CET6 100-119

英语作文电脑智能自动评分系统的使用和启示

英语作文电脑智能自动评分系统的使用和启示 英语作文电脑智能自动评分系统的使用和启示内容简介: 英语作文电脑智能自动评分系统的使用和启示 在英语作文教学中,对学生作文进行批改一直被师生共识为提高写作能力的有效手段。但是,考虑到时间、精力、作文收发等方面,又不得不承认效率不高。在大规模语言考试中,作文又是必不可少的题 论文格式论文范文毕业论文 英语作文电脑智能自动评分系统的使用和启示 在英语作文教学中,对学生作文进行批改一直被师生共识为提高写作能力的有效手段。但是,考虑到时间、精力、作文收发等方面,又不得不承认效率不高。在大规模语言考试中,作文又是必不可少的题型,阅卷工作量和阅卷的信度等问题一直以来都不能让我们如意。针对这一难题,电脑智能自动评分系统提供了可以信赖、值得期盼的解决方案。在PEG、IEA、E-rater、冰果、MY Aess、IntelliMetri等几种智能评分系统中,选取IntelliMetri系统进行研究,对其评价标准进行理论分析,对其所评分的作文进行跟踪评析,发现其通过对学生作文按照若干评分标准问题进行回应和打分的方法能够快速、有效地解决了作文评分的效率问题,可靠性和准确性不亚于人工评分的水平,完全可以作为人工评分的补充手段。由此看来,智能评分系统的发展值得期盼。

一、IntelliMetri系统概述IntelliMetri系统发布于1998年1月,是第一个提供给教育机构的智能作文评分软件,相比传统的人工评阅具有许多优点,如: 准确度大于个人评分,尤其大于单人人工评分;提供即时反馈等等。发布以后,系统得到了广泛的应用。IntelliMetri系统作为一个智能评分系统,充分模拟了人工评分的过程。系统开发时经过了大量的测试培训,即不断通过人工纠正其自动认定的给分点,直至契合。值得提出的是,系统不是将所有的给分点简单地相加,而是通过分析给分点之间的聚合关系,模拟人工从整体上看待作文并给出判断,这一点上跟人工评分的过程是一致的。对于每一个给分点刺激和提示,IntelliMetri系统创建了一个独特的解决方案,主要的给分点、次要的给分点、聚群给分点和分散给分点,都有不同的分数赋值。每一个刺激或提示,这相当于人工阅卷时我们先将作文的得分点做上标记,然后回过头来审视通篇看所有的这些给分点是否形成整体,主题是否突出,连贯是否流畅。正因为如此,IntelliMetri系统能够实现令人满意的高匹配的评阅结果。 二、IntelliMetri系统评分依据IntelliMetri系统的评分依据主要根据其对作文进行的300多个变量的分析,这些变量包括语义学、造句法等与主题有关的一切因素,其数量和认定的准确度还在发展当中。概括起来,IntelliMetri系统评分依据从宏观到微观具有几个方面功能特征: 首先是聚焦度(Fous)和整体性(Unit),系统高度关注指向写作目的的聚焦度和一致性,对给分点的聚合关系赋值有统筹考虑,同时,也不排斥出现的单个观点的出现,注意到意义的关联度,做到点

大学英语作文评分标准[1](2020年九月整理).doc

作文评分标准 本题满分为15分。 2.阅卷标准共分五等:2分、5分、8分、11分及14分。各有标准样卷一至二份。 3.阅卷人员根据阅卷标准,对照样卷评分,若认为与某一份数(如8分)相似,即定为该分数(即8分);若认为稍优或稍劣于该分数,即可加一分(即9分)或减一分(即7分),但不得加或减半分。 4.评分标准:2分……条理不清,思路紊乱,语言支离破碎或在部分句子均有错误,且多数为严重错误。5分……基本切题。表达思想不清楚,连贯性差。有较多的严重语言错误。8分……基本切题。有些地方表达思想不够清楚,文字勉强连贯;语言错误相当多,其中有一些是严重错误。11分……切题。表达思想清楚,文字连贯,但有少量语言错误。14分……切题。表达思想清楚,文字通顺,连贯性好。基本上无语言错误,仅有个别小错误。[注:白卷,作文与题目毫不相关,或只有几个孤立的词而无法表达思想,则给0分。] [注] 1.如题目中给出主题句,起始句,结束句,均不得计入所写字数 2.只写一段者:0~4分;只写两段者:0~9分(指规定三段的作文) 长度计分标准: 91~100词: 扣1分 81~90词: 扣2.5分 71~80词: 扣4分 61~70词: 扣6分 60词以下: 扣8分 3.为了便于阅卷人员掌握评分标准,现将各档作文分相当于百分制的得分,列表如下,称为得分率。其中9分的得分率为60(相当于百分制的60分)。 作文分15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 得分率100 94 87 80 74 67 60 54 47 40 34 27 20 14 7 经原国家教委批准,四、六级考试已从1997年6月份起采用“作文最低”制计算成绩,其中足见国家对提高大学英语写作能力的重视程度。按规定,考生作文若为0分,无论其总分是否高于60分,均作不及格处理;若其作文分高于0分,低于6分,报导成绩时,需从总分中减去6分,再加上实得作文分。也就是说,要从总分中减去实得作文分与6分之间的差额部分。 评分标准分五个档次,14分,11分、8分、5分、2分,它分两个档次,14分上可以给到15,下可以给到13,8分上可以给到9分,下可以给到7分,5分上可以给多6分,下可以给到4分,2分上可以给到3分,下可以给到1分,这就是从1到15它分了五个档次。这五个档次我们再可以分三大档,14分和11分的这算是两个合起来,叫一大档,这大档的它相同点是内容切题,文字连贯,条理清楚,这是14分和11分它的相同点,也就是说只要你达到内容切题,文字连贯,条理清楚,你就可以得到11分以上的这么一个分数。 11分和14分两个档之间区别在什么地方?在于用词上,你的用词是不

英语作文评分方法

评分标准 在评分时,主要针对三个方面进行评估:语言、内容和文采。 *语言考查英语表达是否正确,包括单词拼写、标点符号、词汇搭配、句子的语法结构是否正确等。 *内容考查文章内容是否得当,要求包括:主题明确、结构清晰、内容切题、语言精练等。 *文采考查语言的丰富性和连贯性,要求包括:恰当运用所学的英语单词、词组和各类句型,以及句子之间的合理过渡。 写作中存在的不足 考生在写作中,普遍存在着以下三个方面的不足: * 语言不规范 英语句子必须有谓语动词,要使用正确的语态和时态。动词、名词、介词、副词也有各自特定的搭配。另外,句子中若有多个谓语,必须用并列连词或者从句来处理。但考生由于受中文语法习惯的影响,对这方面的概念比较淡薄,导致语法错误以及不符合英语习惯的Chinglish(中式英文)出现。 * 句型单一,简单句偏多 英语是讲究形式的语言,但考生往往过于注重把所思所想用英语翻译出来,导致千篇一律地用简单句和主动语态,忽略了句型的变化和逻辑关系的表达。 *谋篇能力不足 考生拿到题目,经常是想到哪里就写到哪里,对文章的内容没有事先做筛选和安排,不注意文章的层次和句子间的逻辑关系,有时甚至缺乏主题句,使得文章主题不明确。 写作“五步曲” 针对上述问题以及中考作文的评分标准,考生可运用以下五步应对中考英语写作: 第一步审题 主要包括以下几方面的内容: 1. 确定文章的体裁 中考英语写作以记叙文为主,但有时会要求考生在文章最后发表观点,即我们所说的“夹叙夹议”。 2. 确定文章的格式要求 中考英语写作有时会要求考生写书信或日记,这一类的应用文都有其相应的格式要求。如书信的开篇必须有称呼(Dear...),结束必须有谦称(Yours,),正文的第一段一般写“收到来信很高兴”、“抱歉很久没写信”或者“很高兴给你写信”之类的话,而正文最后一段一般写“期待你的来信”或者“祝你..”等内容。日记在正文前必须写日期、星期和天气。 3. 明确题目要求,确定必写内容 考题有时会对内容有详细的文字要求,如2002年上海卷题目为“My Favorite Thing(s)”,在题目要求中明确注明要考生描写该事物,说明其来历,并阐述最喜爱它的理由。而有时题目的要求则比较隐晦,如2005年上海卷题目为“Growing Pains and Gains”,虽然没有对必写的内容做明确的文字说明,但是很显然,pains和gains是必写的,缺一不可。 另外,考题有时会通过图画给出提示。这种情况下,考生必须首先弄清楚图画是仅供参考还是文章的必写内容。此外,对于记叙文,有6个要素是必备的,即“时间(when)、地点(where)、人物(who)、发生什么事(what)、发生原因(why)、怎样进行(how)”。 4. 确定文章的字数 若文章字数不够,会被扣去相应的分数;字数过多,又会浪费答题时间,所以建议考生把篇幅控制在80~100 词。相应的,文章的句子数量建议控制在8~10句。

国外作文自动评分系统评述及启示

第117期2007年10月 外语电化教学 CAFLE No.117 Oct.2007国外作文自动评分系统评述及启示 梁茂成,文秋芳 (北京外国语大学中国外语教育研究中心,北京100089) ?鬣杠昕有主膏自负? 摘要:本文依据语言测试领域的作文评分要素,对国外具有代表性的三种作文自动评分系统进行评介和比较,指出这些评分系统在训练及作文的人工评分方法和机器评分效度等方面存在的问题,并分析这些作文自动评分系统为我国自主开发作文自动评分系统所提供的借鉴作用。 关键词:作文自动评分;模型;评分要素;信度;效度 中图分类号:H319.3文献标识码:A文章编号:1001-5795(2007)10-0018-0007 作文是大规模语言考试(如TOEFL,GRE,IELTS等)中的一种必备题型。通过作文可以检测应试者综合运用语言的能力。然而,大规模作文阅卷面临两大难题:其一,阅卷需要耗费大量人力、物力等资源;其二,评判作文质量具有很强的主观性,阅卷的信度(pliability)和效度(validity)不强(Johnsonetal,1991)。近几十年来,随着计算机硬件和软件性能快速提高,自然语言处理等技术获得了长足的发展,国外一批作文自动评分系统相继问世,这两个长期困扰大规模作文阅卷的难题有望得到解决。 本文对国外最具代表性的三种作文自动评分系统进行述评。这三种系统是:PEG(PmjeetEssayGrade)、IEA(IntelligentEssayAssessor)和E—rater。PEG重语言形式,IEA重作文内容,E—rater则既重形式又重内容。一般说来,作文评分应形式和内容并重,围绕作文的语言质量、内容质量和篇章结构质量三个主要方面进行(Blok&deGlopper,1992;Purves.1985;Weigle,2002;梁茂成,2005),然而这三种系统侧重各有不同,在这三个方面的分析力度也存在很大差异。通过对比分析,笔者力图揭示这些作文自动评分系统的优势与劣势,以期对开发我国学生作文自动评分系统有所启示。I国外作文自动评分系统述评 1.1PEG.一个重语言形式的评分系统 PEG于1966年由美国杜克大学(UniversityofDuke)的EllisPage等人开发(Daigon,1966;rage,1966)。PEG的设计者们认为,计算机程序没有必要理解作文内容,大规模考试中尤其如此(Shermiseta1.。2001)。因此,他们在其网站上公开申明:“PEG不能理解作文的内容”(http://134.68.49.185/PEG-DEMO/)。 在PEG的开发者看来,作文质量的诸要素是作文的内在因素,无法直接测量,因此,最为合乎逻辑的方法是从作文文本中提取一些能够间接反映作文质量的文本表层特征项(surfacefeatures)。Page首先收集了一部分人工评分后的作文(训练集),利用当时并不发达的自然语言处理技术,从作文中提取若干个文本特征项(textfeatures),并在这些文本特征项与人工评分之间进行相关性分析。然后,Page选择与人工评分相关的文本特征项作为自变量,把人工评分作为因变量,进行多元回归分析,得到回归方程。回归方程为每一个变量确定了beta值,这样,在对新的作文进行评分时,PEG只需要提取这些变量,并把beta值代人回归 作者简舟:粱茂成:男,博士,教授。研究方向:应用语言学厦计算语言学。 文秋芳:女,教授。研究方向:语言学覆应用语言擎。 收稿日期:2007-01.1.5’ 基金项目:本研究得到教育部人文社科项目(编号06JA740007)和中国外语教育研究中心重大研究项目的资助,在此一井致谢。?18?

作文自动评分总结

李艳老师和葛诗利老师《大学英语作文自动评分中分级词表的效度研究》中提出了作文分级词表的思想,而这可以通过改进或者调整已有的词表来获得。 目前自然语言处理中准确率最高的、也是最基本的研究就是词汇分析,词汇分析一般包括词长分布、词汇分布和词汇丰富性等。 词汇分布:一篇作文中的词汇占某一分级词表每个级别词汇的比例。Laufer&Nation的3个级别的词表。 CLEC中国学习者英语语料库 SPSS软件包的单因素方差分析(ANOV A) SPSS多元线性回归 分数档的精确率和召回率,总体准确率和误判率 个分数精确率=本为X档作文并且被评为X档作文的数量/所有被评为X档作文的总数*100 精确率越高,说明作文被评为该分数档的可信度越高 Laufer&Nation 以词族为计算单位,词频概貌 文秋芳以类符为计算单词,称为词频广度 倪岚以形符为计算单位词频分布 准确率都是30%左右 徐剑和梁茂成《对集中英汉机器翻译系统的测评》 翻译系统在译文输出方面已经比较成熟,源语言的语义识别方面还不如人意。 80年代,机器翻译研究863智能型英汉翻译系统—“译星一号” 评估标准:系统功能,操作的难易度及译文质量(包括译文的忠实度、译语的可懂度和译文的可接受性) 欧共体评估:识别(译文的得懂度、忠实度、连贯度、有用性、读取速度和译文的可接受性)和语言方面(句子结构和语义的连贯性、词汇评价、翻译错误) 可懂度、忠实度和译文的可接受性 梁茂成和李刚《英汉机器翻译中人称代词的处理》徐州师范大学外语系 汉语术语分析语,词序、虚词等来表达各种语法关系; 英语属于综合语,通过词本身的形态变化来表示 英语中人称代词的使用频率要远远高于汉语 汉语属于孤立性语言,英语为粘着性语言 原因: 1.汉语表示所属关系的物主代词往往可以省略 2.英语中大量使用反身代词 反身代词:(译星对反身代词处理较为得当) 1.英语较汉语大量使用反身代词 2.汉语反身代词具有独立的指称功能,英语则依附于其他代词或名次,无独立的指称功能。英汉第二人称代词的差异 You是你还是你们? 英语代词的预指功能 人称代词在机器翻译中的处理 1.调整语法信息库(代词的主要作用是代替名词) 2.条件句

高考英语作文评分标准细则 评分标准是什么

高考英语作文评分标准细则评分标准是什么 高考英语作文评分标准是什么 第五档(很好):(21~25分) 1.完全完成了试题规定的任务。 2.覆盖所有内容要点。 3.应用了较多的语法结构和词汇。 4.语法结构或词汇方面有些许错误,但为尽力使用较复杂结构或较高级词汇所致;具备较强的语言运用能力。 5.有效地使用了语句间的连接成分,使全文结构紧凑。 6.完全达到了预期的写作目的。 第四档(好):(16~20分) 1.完全完成了试题规定的任务。 2.虽漏掉1、2个次重点,但覆盖所有主要内容。 3.应用的语法结构和词汇能满足任务的要求。 4.语法结构或词汇方面应用基本准确,些许错误主要是因尝试较复杂语法结构或词汇所致。 5.应用简单的语句间的连接成分,使全文结构紧凑。 6.达到了预期的写作目的。 第三档(适当):(11~15分) 1.基本完成了试题规定的任务。

2.虽漏掉一些内容,但覆盖所有主要内容。 3.应用的语法结构和词汇能满足任务的要求。 4.有一些语法结构或词汇方面的错误,但不影响理解。 5.应用简单的语句间的连接成分,使全文内容连贯。 6.整体而言,基本达到了预期的写作目的。 第二档(较差):(6-10分) 1.未恰当完成试题规定的任务。 2.漏掉或未描述清楚一些主要内容,写了一些无关内容。 3.语法结构单调、词汇项目有限。 4.有一些语法结构或词汇方面的错误,影响了对写作内容的理解。 5.较少使用语句间的连接成分,内容缺少连贯性。 6.信息未能清楚地传达给读者。 第一档(差):(1~5分) 1.未完成试题规定的任务。 2.明显遗漏主要内容,写了一些无关内容,原因可能是未理解试题要求。 3.语法结构单调、词汇项目有限。 4.较多语法结构或词汇方面的错误,影响对写作内容的理解。 5.缺乏语句间的连接成分,内容不连贯。 6.信息未能传达给读者。 不得分:(0分)

英语作文写作要点及评分标准

英语作文写作要点及评分标准 一、写作要点: 1、人们对此有不同看法; 2、赞同:理由一、理由二; 3、反对:理由一、理由二; 4、你的看法。 二、英语作文评分标准 1、本题总分为25分,按5个档次给分。 2、评分时,先根据文章的内容和语言初步确定其所属档次,然后以该档次的 要求来衡量,确定或调整档次,最后给分。 3、词数少于 80和多于 120的,从总分中减去2分。 4、评分时,应注意的主要内容为:内容要点、应用词汇和语法结构的数量 和准确性、上下文的连贯性及语言的得体性。 5、拼写与标点符号是语言准确性的一个方面,评分时,应视其对交际的影 响程度予以考虑。英、美拼写汉词汇用法均可接受。 6、如书写较差,以至影响交际,将分数降低一个档次。 7、内容要点可用不同方式表达,对紧扣主题的适当发挥不予扣分。 各档次的给分范围和要求: Ⅰ. 第五档(很好);(21-25分): ⑴完全完成了试题规定的任务;⑵覆盖所有内容要点; ⑶应用了较多的语法结构和词汇; ⑷语法结构或词汇方面有些许错误,但为尽力使用较复杂结构或较高级词 汇所致;具备较强的语言运用能力; ⑸有效地使用了语句间的连接成分,使全文结构紧凑; ⑹完全达到了预期的写作目的。 Ⅱ. 第四档(好):(16-20分) ⑴完全完成了试题规定的任务;⑵虽漏掉1、2个次重点,但覆盖所有主要内容; ⑶应用的语法结构和词汇能满足任务的要求; ⑷语法结构或词汇方面应用基本准确,些许错误主要是因尝试较复杂语法结构或词汇所致; ⑸应用简单的语句间的连接成分,使全文结构紧凑; ⑹达到了预期的写作目的。 Ⅲ. 第三档(适当):(11-15分) ⑴基本完成了试题规定的任务; ⑵虽漏掉一些内容,但覆盖所有主要内容; ⑶应用的语法结构和词汇能满足任务的要求; ⑷有一些语法结构或词汇方面的错误,但不影响理解; ⑸应用简单的语句间的连接成分,使全文内容连贯; ⑹整体而言,基本达到了预期的写作目的。 Ⅳ. 第二档(较差):(6-10分) ⑴未恰当完成试题规定的任务;⑵漏掉或未描述清楚一些主要内容,写了一些无关内容;

高考英语作文评分标准详解

高考英语作文评分标准详解 一般来说,写作题的高考评分标准包含评分原则、内容要点、给分范围及要求、说明和参考范文五个部分。其中内容要点以及词数、标点、书写等方面的原则比较容易理解、操控和落实。但“评分时,应该注意的主要内容为……应用词汇和语法结构的数量……上下文的连贯性和语言的得体性”等评分原则,“应用了较多的语法结构和词汇;语法结构或词汇方面有些许错误,但为尽力使用较复杂结构或较高级词汇所致,具备较强的语言运用能力;有效地使用了语句间的连接成份,使全文结构紧凑”等给分要求、以及“对紧扣主题的适当发挥不予扣分”等说明,相对比较抽象,不易捉摸。 一、如何理解“应用了较多的词汇” 这里所说的“词汇”,可以从高级词汇的使用、同义词的使用、短语的使用等方面去理解: (一)高级词汇的使用 评分标准第五档次的要求中提到,“词汇方面有些许错误,但为尽力使用较复杂结构或较高级词汇所致”。这里所说的“高级词汇”,指的是大纲中没有列入或没有识记要求,但在实际运用中却出现比较频繁的词汇,比如frustration, awkward, awfully, concern等词,都可以算作是“高级词汇”。考生若能够适当地运用一些高级词汇,定会给评卷老师留下深刻的印象。 1. I can’t find any way to solve the problem. (换作高级词汇:I can’t find any solution to the problem.) 2. The pet dog is so lovely that almost everybody likes her. (换作高级词汇:The pet dog is so cute that almost everybody likes her.) 3. The question is really difficult to understand. (换作高级词汇:The question is really confusing.) 4. He had to face all the possible difficulties. (换作高级词汇:He had to cope with all the possible difficulties) (二)同义词的使用 英语中有些词的使用频率非常高,比如interesting, clever等,在表达时大家都很喜欢用,这样很容易令文章入千人一面的窘境中。但如果我们能够使用它们相应的同义词,就可以做到与众不同,给评卷者带来清新的感觉。例如: 1. It will be very interesting. (换作同义词:It will be a lot of fun.) 2. He was so clever that he could count all the way up to 100 at one year old.( 换作同义词:He was so smart that he could count all the way up to 100 at one year old.)

在线英语写作自动评分系统Writing

在线英语写作自动评分系统Writing 在线英语写作自动评分系统Writing Roadmap的应用计划 淄博市周村城北中学英语组 2010-11-10 1、支撑性理论 英国文学家弗兰西斯培根在《谈读书》中有句经典论断“Reading makes a full man; conference a ready man; writing an exact man.” 麦格劳-希尔教育测评中心(CTB/McGraw-Hill)是成立于1926年的国际知名专业教育测评机构,“有氧英语课堂”是麦格劳-希尔教育测评中心经过三年的调查、研发、论证和试点,为中国基础英语教学量身打造的全新英语课堂教学解决方案。在“有氧英语课堂”的课程设计中特别引入了WritingRoadmap2.0等数字化测评工具,这在国内英语教学尚属首例。 2、研究目标 利用WritingRoadmap2.0数字化测评工具培养学生对英语学习的兴趣和自信心,为中考英语的读写部分做好充分准备,提倡学生学习用英语进行沟通,培养英文思维习惯,同时引导学生关注中西方文化的共性和差异性并体现在文字上的表述形式。 通过“有氧英语课堂教师培训”,教师可以学到最新的读写教学法、写作命题法及作文评判技巧。同时,在教学中,教师可以运用在线英语写作自动评分系统对学生的英语写作水平进行评估、指导,还可以使用系统提供的报告量化教学效果。积累的数据既可以支撑教师的科研,又能改善教师的教学质量。让教师在教学的过程中,完成自己教学水平的升华。 3、研究内容设计

以学生为中心 “有氧英语课堂”更加突出了学生为中心、学生为主导者的思想。常规英语课堂以传授语言知识和技能为主,“有氧英语课堂”则以培养学生英语语感和思维能力为主。作为传统课堂的补充,“有氧英语课堂”可以帮助学生消化吸收在传统课堂上学习到的知识点,给学生提供综合运用所学语言技能的平台,在使用英语的过程中,精进语言掌控能力,从而更好激发学生的自主学习潜能。 全人教育 “有氧英语课堂”注重学生综合素质提升,强调学生的培养不能只注重知识和技能,同时要兼顾道德观念、综合素质、文化底蕴以及学习方法的指引和教导。“有氧英语课堂”选用西方原版简易读物作为教材,其中不少涉及立志、科学、名人传记等内容的优秀作品,让学生在学习语言的过程中培养正确的价值观,在了解西方文化的同时为将来成为一名优秀的复 合型人才打下坚实的基础。 教学相长 “有氧英语课堂”在课堂模式、教师定位、选用教材等方面都与传统课堂有很大差异,同时还需使用WritingRoadmap2.0等数字化的测评工具,所以对教师来说具有一定的挑战性。但是通过“有氧英语课堂教师培训”,教师可以学到最新的读写教学法、写作命题法及作文评判技巧。同时,教师可以运用在线英语写作自动评分系统对学生的英语写作水平进行评估、指导,还可以使用系统提供的报告量化教学效果。积累的数据既可支撑教师的科研,又能改善教师的教学质量。让教师在教学的过程中,完成自身教学水平的提升。 课程设计科学 “有氧英语课堂”的设计注重“过程教学(Process Meaning)”;“语言情景活动(PlentyMeaningfulActivities)”以及“趣味性和系统性(Engaging

高考英语作文评分标准

高考英语作文评分标准 1本体总分为25分,按5个档次给分。 2评分时,先根据文章的内容和语言初步确定其所属档次,然后以该档次的要求来衡量,确定或调整档次,最后给分。 3词数少于80和多余120的,从总分中减去2分 4评分时,应注意的主要内容为:内容要点,应用词汇和语法结构的数量和准确性,上下文的连贯性及语言的得体性。 5拼写与标点符号是语言准确性的一个方面,评分时,应视其对交际的影响程度予以考虑。英,美拼写汉词汇用法均可接受。 6如书写较差,以至影响交际,将分数降低一个档次。 7内容要点可用不同方式表达,对紧扣主题的适当发挥不予扣分。 {各档次的给分范围和要求} 第五档(很好);(21-25分) 1完全完成了试题规定的任务。 2覆盖所有内容要点。 3应用了较多的语法结构和词汇。 4语法或词汇方面有些许错误,但为尽力使用较复杂结构或词汇所致。具备较强的语言运用能力。 5有效地使用了语句间的成份,使全文结构紧凑。 6完全达到了预期的写作目的。 第四档(好);(16-20分) 1完全完成了试题规定的任务。 2虽漏掉一两个次重点,但覆盖所有主要内容。 3运用的语法结构或词汇方面能满足任务的要求。 4语法结构或词汇方面应用基本准确,些许错误主要是因尝试较复杂语法结构或词汇所致。5应用简单的语句间的连接成分,使全文结构紧凑。 6达到了预期的写作目的。 第三档(适当);(11-15分) 1基本完成了试题规定的任务。

2虽漏掉一些内容,但覆盖所有主要内容。 3应用的语法结构和词汇能满足任务的要求。 4有一些语法结构或词汇方面的错误,但不影响理解。 5应用简单的语句间的连接成分,使全文内容连贯。 6整体而言,基本达到了语气的写作目的。 第二档(较差);(6-10分) 1未恰当完成试题规定的任务。 2漏掉或未描述清楚一些主要内容,写了一些无关内容。 3词法结构单调,词汇项目有限。 4有一些语法结构词汇方面的错误,影响了对写作内容的理解。 5较少使用语句间的连接成分,内容缺少连贯性。 6信息未能清楚地传达给读者。 第一档(差);(1-5分) 1未完成试题规定的任务。 2明显遗漏主要内容,写了一些无关内容,原因可能是未理解试题要求。 3语法结构单调,词汇项目有限。 4较多语法结构或词汇方面的错误,影响对写作内容的理解。 5缺乏语句间的连接成分,内容不连贯。 6信息未能传达给读者。 不得分(0分) 未能传达给读者任何信息:内容太少,无法评判,写的内容均与所要求内容无关或所写内容无法看清。

英语作文评分标准,解析及答题技巧

(一)高考英语作文评分标准 (二)高考英语作文评分标准解析及答题技巧 (一)高考英语作文评分标准 1本体总分为25分,按5个档次给分。 2评分时,先根据文章的内容和语言初步确定其所属档次,然后以该档次的要求来衡量,确定或调整档次,最后给分。 3词数少于或多余要求字数的,从总分中减去2分 4评分时,应注意的主要内容为:内容要点,应用词汇和语法结构的数量和准确性,上下文的连贯性及语言的得体性。 5拼写与标点符号是语言准确性的一个方面,评分时,应视其对交际的影响程度予以考虑。英,美拼写汉词汇用法均可接受。 6如书写较差,以至影响交际,将分数降低一个档次。7内容要点可用不同方式表达,对紧扣主题的适当发挥不予扣分。 {各档次的给分范围和要求} 第五档(很好);(21-25分) 1完全完成了试题规定的任务。 2覆盖所有内容要点。 3应用了较多的语法结构和词汇。 4语法或词汇方面有些许错误,但为尽力使用较复杂结构或词汇所致。具备较强的语言运用能力。 5有效地使用了语句间的成份,使全文结构紧凑。 6完全达到了预期的写作目的。 第四档(好);(16-20分) 1完全完成了试题规定的任务。 2虽漏掉一两个次重点,但覆盖所有主要内容。 3运用的语法结构或词汇方面能满足任务的要求。 4语法结构或词汇方面应用基本准确,些许错误主要是因尝试较复杂语法结构或词汇所致。5应用简单的语句间的连接成分,使全文结构紧凑。 6达到了预期的写作目的。 第三档(适当);(11-15分) 1基本完成了试题规定的任务。 2虽漏掉一些内容,但覆盖所有主要内容。 3应用的语法结构和词汇能满足任务的要求。 4有一些语法结构或词汇方面的错误,但不影响理解。5应用简单的语句间的连接成分,使全文内容连贯。 6整体而言,基本达到了语气的写作目的。 第二档(较差);(6-10分) 1未恰当完成试题规定的任务。 2漏掉或未描述清楚一些主要内容,写了一些无关内容。3词法结构单调,词汇项目有限。 4有一些语法结构词汇方面的错误,影响了对写作内容的理解。 5较少使用语句间的连接成分,内容缺少连贯性。 6信息未能清楚地传达给读者。 第一档(差);(1-5分) 1未完成试题规定的任务。 2明显遗漏主要内容,写了一些无关内容,原因可能是未理解试题要求。 3语法结构单调,词汇项目有限。 4较多语法结构或词汇方面的错误,影响对写作内容的理解。 5缺乏语句间的连接成分,内容不连贯。 6信息未能传达给读者。 不得分(0分) 未能传达给读者任何信息:内容太少,无法评判,写的内容均与所要求内容无关或所写内容无法看清。

(完整)高考英语作文评分标准

安徽省高考英语作文评分标准,答题技巧,答题方法1本体总分为25分,按5个档次给分。 2评分时,先根据文章的内容和语言初步确定其所属档次,然后以该档次的要求来衡量,确定或调整档次,最后给分。 3词数少于80和多余120的,从总分中减去2分 4评分时,应注意的主要内容为:内容要点,应用词汇和语法结构的数量和准确性,上下文的连贯性及语言的得体性。 5拼写与标点符号是语言准确性的一个方面,评分时,应视其对交际的影响程度予以考虑。英,美拼写汉词汇用法均可接受。 6如书写较差,以至影响交际,将分数降低一个档次。 7内容要点可用不同方式表达,对紧扣主题的适当发挥不予扣分。 {各档次的给分范围和要求} 第五档(很好);(21-25分) 1完全完成了试题规定的任务。 2覆盖所有内容要点。 3应用了较多的语法结构和词汇。 4语法或词汇方面有些许错误,但为尽力使用较复杂结构或词汇所致。具备较强的语言运用能力。 5有效地使用了语句间的成份,使全文结构紧凑。 6完全达到了预期的写作目的。 第四档(好);(16-20分) 1完全完成了试题规定的任务。 2虽漏掉一两个次重点,但覆盖所有主要内容。 3运用的语法结构或词汇方面能满足任务的要求。 4语法结构或词汇方面应用基本准确,些许错误主要是因尝试较复杂语法结构或词汇所致。5应用简单的语句间的连接成分,使全文结构紧凑。 6达到了预期的写作目的。 第三档(适当);(11-15分) 1基本完成了试题规定的任务。

2虽漏掉一些内容,但覆盖所有主要内容。 3应用的语法结构和词汇能满足任务的要求。 4有一些语法结构或词汇方面的错误,但不影响理解。 5应用简单的语句间的连接成分,使全文内容连贯。 6整体而言,基本达到了语气的写作目的。 第二档(较差);(6-10分) 1未恰当完成试题规定的任务。 2漏掉或未描述清楚一些主要内容,写了一些无关内容。 3词法结构单调,词汇项目有限。 4有一些语法结构词汇方面的错误,影响了对写作内容的理解。 5较少使用语句间的连接成分,内容缺少连贯性。 6信息未能清楚地传达给读者。 第一档(差);(1-5分) 1未完成试题规定的任务。 2明显遗漏主要内容,写了一些无关内容,原因可能是未理解试题要求。 3语法结构单调,词汇项目有限。 4较多语法结构或词汇方面的错误,影响对写作内容的理解。 5缺乏语句间的连接成分,内容不连贯。 6信息未能传达给读者。 不得分(0分) 未能传达给读者任何信息:内容太少,无法评判,写的内容均与所要求内容无关或所写内容无法看清。 注意事项: 1、对于写作内容,无题目或以书信体写作的不扣分。对于引言(李华在学校举行的英语比赛中获得一等奖)的描述与否,不宜作扣分处理。 2、评分时,先根据要点的覆盖面和语言表达的流畅性初步确定是否到及格线(即15分),划定其所属档次后,以该档次的要求来衡量,调整上下分值,最后确定分数。 3、词数少于120,应从得分中减去2分。 4、大小错误的界定: 小错:单词拼写,冠词,大小写、标点符号错误。 大错:搭配错误、用词用错(介词、名词、动词、形容词、副词)、时态、语态、 主谓一致、非谓语动词、句式等错误。

高职高专英语作文自动评分指标探索

高职高专英语作文自动评分指标探索 李恩亮 (江苏海事职业技术学院外语系,江苏南京211170) 【摘要】高职高专英语教学突出“实用为主、够用为度”的原则,英语课程不仅应打好语言基础,更要注重培养实际使用语言的技能,特别是使用英语处理日常和涉外业务活动的能力。然而,在高校扩招背景下,基础相对薄弱的高职高专学生在英文写作方面反映出的问题尤为突出,远达不到规定的要求。由于高职高专学生英语基础较差和自主学习能力不够,所以老师监督和反馈就显得非常重要,但是部分高职高专院校英语教师的师生比已经达到了130:1,所以采用计算机辅助批改作文对于高职高专教师来说就变得越来越重要。目前针对大学英语作文的自动评分方法已经有大量的研究成果,比如北京外国语大学的梁茂成教授、北京语言大学的葛诗利博士以及国外的ETS等机构,但是针对高职高专领域的专门研究还比较少,本文尝试在已有英语作文自动评分研究为基础上,通过研究教育部高职高专英语课程的写作要求,以及以2012年(第三届)全国高职高专英语写作大赛江苏省赛区参赛作文作为测试样本,探索符合高职高专特点的英语作文自动评分指标。 【关键词】高职高专;英语写作;自动作文评分;评分指标 一、引言 全国高职高专英语写作大赛已经举办过三届,前两届参赛作文均采用人工批改与评审,在这过程中发现人工批改英语作文存在一定的问题。主要的问题包括: 第一、主观性强,不同的阅卷教师对同一篇作文可能会给出完全不一样的评价。 第二、一致性差,同一篇作文阅卷教师在不同的时候评分可能不一样,比如心情好的时候分数可能会高一些,心情不好的时候可能会差一些。 第三、工作量大,以2012年(第三届)全国高职高专英语写作大赛(江苏赛区)为例,每个评阅教师要在3个小时内看300篇作文,平均每篇 作文的批改时间不到1分钟,阅卷教师这么短的时间下很容易疲劳, 导致给出不完全客观的评价。 近年来英语作文自动评分(Automated Essay Scoring,简称为AES)已经逐渐成为语言测评中的热点方向,成熟的系统已有十余个,文章与著述也比较多,但大多数针对英语母语作文评分,涉及英语作为外语(EFL)作文评价并不多见(葛诗利,2010)。

相关文档
最新文档