结合语言学特征和自编码器的英语作文自动评分
人工智能英语作文试卷答题评分

人工智能英语作文试卷答题评分{z}Document: Artificial Intelligence English Composition Examination ScoringIntroduction:The use of artificial intelligence (AI) in scoring English composition exams has gained significant attention in recent years.AI-based scoring systems offer several advantages over traditional human scoring methods, including efficiency, consistency, and the ability to handle a large volume of essays.This document discusses the process and criteria used by AI systems to score English compositions.1.AI Scoring System:An AI scoring system uses natural language processing and machine learning algorithms to analyze and evaluate the quality of student essays.These systems are trained on large datasets of annotated essays, which help them learn the characteristics of good writing and effective arguments.2.Data Collection and Preprocessing:Before the scoring process begins, the AI system collects a dataset of student essays.This dataset is then preprocessed to remove any irrelevant information, such as HTML tags or special characters.The preprocessing step also includes tokenization, lemmatization, and named entity recognition to standardize the text.3.Feature Extraction:Once the data is preprocessed, the AI system extracts relevant features from the essays.These features may include sentence length, complexity, coherence, vocabulary usage, and grammatical accuracy.Feature extraction helps the system identify important aspects of the essays that contribute to their overall quality.4.Scoring Criteria:AI scoring systems use a set of predefined criteria to evaluate the essays.These criteria are based on academic standards and best practices in English composition.The criteria may include the clarity of the thesis statement, the development of ideas, the use of evidence, and the organization of the essay.The AI system assigns a score to each essay based on how well it meets these criteria.5.Machine Learning Algorithms:Machine learning algorithms play a crucial role in the AI scoring process.These algorithms learn from the annotated dataset to identify patterns and relationships between essay features and scores.During the scoring process, the algorithms use this learned information to predict the score of each essay.6.Evaluation and Optimization:To ensure the accuracy and reliability of the AI scoring system, it undergoes evaluation and optimization.This process involves comparingthe system"s scores with those of human scorers.Any discrepancies are identified and used to refine the algorithms and scoring criteria.This iterative process continues until the AI system"s scores closely match those of human scorers.7.Limitations:While AI scoring systems offer many benefits, they also have limitations.For example, they may struggle with understanding context and cultural nuances, leading to potential biases in scoring.Additionally, AI systems may not be able to detect certain aspects of good writing, such as creativity and personal voice.Therefore, human oversight and involvement are still essential in the scoring process.Conclusion:Artificial intelligence-based scoring systems have the potential to revolutionize the evaluation of English composition exams.By using AI, educators can efficiently and consistently assess a large number of essays.However, it is crucial to recognize the limitations of AI scoring systems and ensure human involvement to maintain the quality and fairness of the scoring process.。
基于人工智能的英语作文自动批改系统的设计与实现

基于人工智能的英语作文自动批改系统的设计与实现一、引言随着的快速发展和广泛应用,英语作文自动批改系统作为一种应用于教育领域的技术,正在逐渐受到关注。
本报告将讨论,分析现状、存在问题,并提出相应对策建议,以期在教育领域提供更智能、高效的服务。
二、现状分析1.英语作文教学的现状英语作文是学生学习英语的重要组成部分。
然而,传统的教育方式面临着诸多挑战,例如人力资源投入大、效率低下、标准不一等问题。
在这样的背景下,引入技术成为解决问题的一种潜在途径。
2.英语作文自动批改系统的现状目前,已有一些商业化的英语作文自动批改系统问世。
这些系统基于自然语言处理、机器学习等技术手段,能够自动检测学生作文中的语法错误、拼写错误等,并给出相应的批改建议。
然而,这些系统在实际应用中还存在一些问题亟待解决。
三、存在问题分析1.评分标准不准确英语作文的评分标准是一个复杂且有一定主观性的过程。
现有的自动批改系统在评分准确性上存在一定的不足,无法真正达到人工批改的水平。
2.反馈过于简略传统的英语作文批改通常会提供详细的反馈,指出学生文章中的问题所在、错误原因以及改进方法。
而自动批改系统提供的反馈往往较为简略,无法满足学生的学习需求。
3.对主观性问题的处理英语作文中存在一些主观性问题,例如表达方式、逻辑结构等。
自动批改系统往往难以处理这些问题,导致反馈并不全面。
四、对策建议1.改进评分准确性针对评分标准不准确的问题,可以通过引入更精确的自然语言处理算法、机器学习模型等技术手段,提高系统对学生作文的评分准确性。
引入大数据分析的方法,对历史批改数据进行分析,从而进一步优化评分算法。
2.提供更详细的反馈为了满足学生的学习需求,可以在系统中加入更多的反馈内容,例如错误类型、错误原因以及改进建议等。
可以借鉴传统教育方式中的批改方法,将人工批改和自动批改相结合,提供更全面的反馈。
3.处理主观性问题针对主观性问题,可以提供更灵活的处理方式。
一方面,可以通过引入自然语言生成算法,模拟人工的批改过程,提供更具个性化的反馈。
英语作文电脑智能自动评分系统的使用和启示

英语作文电脑智能自动评分系统的使用和启示作者:杨学前来源:《教育界》2012年第30期【摘要】英语作文电脑智能自动评分系统是指对已经输入电脑的英语作文进行自动评分的电脑软件,是对人工评分的有力补充,可以大大提高教师的工作效率。
本人以IntelliMetric 系统为例,介绍目前智能评分系统的原理,为探索在我国各级各类英语教学和考试中使用智能评分系统提供一些依据和参考。
【关键词】英语作文自动评分系统在英语作文教学中,对学生作文进行批改一直被师生共识为提高写作能力的有效手段。
但是,考虑到时间、精力、作文收发等方面,又不得不承认效率不高。
在大规模语言考试中,作文又是必不可少的题型,阅卷工作量和阅卷的信度等问题一直以来都不能让我们如意。
针对这一难题,电脑智能自动评分系统提供了可以信赖、值得期盼的解决方案。
在PEG、IEA、E-rater、冰果、MY Access、IntelliMetric等几种智能评分系统中,本文选取IntelliMetric系统进行研究,对其评价标准进行理论分析,对其所评分的作文进行跟踪评析,发现其通过对学生作文按照若干评分标准问题进行回应和打分的方法能够快速、有效地解决了作文评分的效率问题,可靠性和准确性不亚于人工评分的水平,完全可以作为人工评分的补充手段。
由此看来,智能评分系统的发展值得期盼。
一、IntelliMetric系统概述IntelliMetric系统发布于1998年1月,是第一个提供给教育机构的智能作文评分软件,相比传统的人工评阅具有许多优点,如:准确度大于个人评分,尤其大于单人人工评分;提供即时反馈等等。
发布以后,系统得到了广泛的应用。
IntelliMetric系统作为一个智能评分系统,充分模拟了人工评分的过程。
系统开发时经过了大量的测试培训,即不断通过人工纠正其自动认定的给分点,直至契合。
值得提出的是,系统不是将所有的给分点简单地相加,而是通过分析给分点之间的聚合关系,模拟人工从整体上看待作文并给出判断,这一点上跟人工评分的过程是一致的。
高等教育领域中基于ChatGPT的自动化作文评估方法探讨(英文中文双语版优质文档)

高等教育领域中基于ChatGPT的自动化作文评估方法探讨(英文中文双语版优质文档)Discussion on ChatGPT-based Automated Essay Evaluation Method in the Field of Higher Education (English and Chinese bilingual version high-quality document)In the field of higher education, composition evaluation has always been one of the important tasks faced by teachers and students. However, traditional essay evaluation methods have many limitations, such as time-consuming, subjectivity, and resource consumption. In recent years, ChatGPT-based automated composition evaluation methods have gradually attracted attention, bringing new possibilities to the education community. This article will discuss the challenges, opportunities and prospects in this field from multiple perspectives.First, the automated composition evaluation method based on ChatGPT can improve the efficiency of evaluation. Traditional composition assessment needs to consume a lot of teachers' time and energy, especially when faced with a large number of student compositions. ChatGPT can quickly give evaluation results by analyzing the grammar, structure, logic and semantics of the composition. This automated assessment not only saves teachers time, but also provides timely feedback to help students improve their writing skills and presentation skills.Second, the automated composition evaluation method based on ChatGPT can provide objective evaluation criteria. Traditional composition evaluation is easily affected by subjective factors, and different teachers may give different evaluations to the same composition. ChatGPT is based on its training model, which has a certain degree of objectivity and consistency. It can evaluate all aspects of the composition according to the pre-set evaluation standards, avoid the influence of subjective bias, and provide more objective and fair evaluation results.However, ChatGPT-based automated composition evaluation methods also face some challenges. First, automatic evaluation may have certain limitations in terms of semantic understanding and topic analysis. Although ChatGPT performs well in language generation, it still has certain limitations when it comes to understanding and analyzing long-form compositions. Aspects of composition, such as context, expression, and logical thinking, challenge the accuracy and depth of automatic assessment. Second, automatic evaluation methods may fail to fully consider the innovative and individual factors of the composition. Composition, as an expression of students' thinking and creativity, is not just a pile of grammar and structure, but also needs to consider students' unique viewpoints and ways of expression.However, these challenges do not imply that ChatGPT-based automated essay evaluation methods have no prospects. Instead, we can expect further breakthroughs in this field as the technology continues to develop and improve. For example, combining technologies such as natural language processing and machine learning can improve ChatGPT's capabilities in semantic understanding and topic analysis, and better adapt to diverse composition evaluation needs. At the same time, by introducing the reference opinions of human evaluation and combining theadvantages of machine evaluation and manual evaluation, a more comprehensive and accurate composition evaluation system can be established.To sum up, the ChatGPT-based automated composition evaluation method has broad application prospects in the field of higher education. It can improve evaluation efficiency, provide objective evaluation criteria, and solve current challenges through continuous development of technology. However, we should also be aware of the limitations of automatic assessment methods and not rely too much on them, but use them as part of teaching aids, combined with manual assessment and personalized guidance, to jointly promote students' writing skills and thinking development. With the continuous advancement of technology and the innovation of educational methods, we have reason to believe that automated composition evaluation methods will bring more convenience and development to the field of higher education.在高等教育领域,作文评估一直是教师和学生们面临的重要任务之一。
大学英语作文自动评分系统( AES)的实证研究

3.1 研究的主要问题 1)AES 在多大程度上可以用来预测作文得分?即自动
评分系统的效度如何? 2)自动评分系统与人工阅卷得分之间是否具有显著相
关性? 3.2 研究对象
1)天津大学仁爱学院英语专业和商务英语专业一年级
共计 142 名学生参与了本次研究项目。参与该研究的学生 经过了近一年的学习,较为系统地学习了语篇知识和写作
2 自动作文评分系统的特点
与传统的人工批改作文相比,自动作文评分系统具有 明显优势。1)及时高效。AES 以网络为媒介,速度快,大大提 高工作效率。还能实现评分结果的及时传递。2)客观公正。AES 在每次评阅作文时都会按照一定的标准,从作文的语言、内 容和写作技巧等多方面进行综合评分,避免教师人工批阅 时的主观喜恶,保证评分的一致性。3)反馈全面。除了评定 分数外,AES 还会对语言错误进行指正,对内容和组织结构 进行评价,进而还有相应的延伸拓展。4)注重过程性评估。 AES 注重过程考核,学生可反复修改提交,并可杜绝抄袭, 教师能够全程跟踪,关注学生写作能力的成长过程。因此, AES 在大学英语教学中的应用是一种有益的尝试。
总第 275 期 2014 年 4 月(中)
The Science Education Article Collects
Total.275 April 2014(B)
大学英语作文自动评分系统(AES)的实证研究
王菲
(天津大学仁爱学院 天津 300636)
中图分类号:H315
文献标识码:A
文章编号:1672-7894(2014)11-0099-02
冰果智能评分系统和句酷批改网都能够为学生英语作 文提供较为客观的评判,在词语、句式、语法、拼写等各个方 面给予意见和指导,给出分数和排名,激发了学生的写作练 习热情。具体情况见表 2。 3.5.2 作文样本分析结果
基于文本分类技术的英语作文自动评分研究的开题报告

基于文本分类技术的英语作文自动评分研究的开题报告一、研究背景英语作文评分一直是英语教学和考试中的重要内容之一。
传统的评分方法依靠教师的经验和判断,存在主观性和不稳定性的问题。
因此,利用自然语言处理技术和机器学习算法对英语作文进行自动评分成为研究的热点之一。
文本分类技术是一种重要的机器学习算法,在自然语言处理领域有广泛应用,如垃圾邮件过滤、情感分析等。
本研究拟探究基于文本分类技术的英语作文自动评分方法。
二、研究目的本研究旨在探究基于文本分类技术的英语作文自动评分方法,通过建立分类模型和学习评分规则等手段,实现对英语作文的自动评分。
三、研究内容1. 文本预处理技术:对英语作文文本进行清洗、分词、词干化、停用词处理等预处理操作,使其适合用于分类模型的输入。
2. 特征提取技术:通过词袋模型、TF-IDF、词向量等方法提取英语作文的文本特征,构建分类模型的输入特征向量。
3. 文本分类模型的构建:选用支持向量机、决策树、朴素贝叶斯等方法构建分类模型,预测英语作文的分数。
4. 学习评分规则方法:利用机器学习算法,根据大量标注好的英语作文和分数,学习评分规则,自动生成评分标准和评分细则。
四、研究意义1. 提高英语作文评分效率和准确度,减轻教师评分工作压力。
2. 促进教育信息化、智能化的发展,提高英语对外教学和考试的质量。
3. 推广文本分类技术在自然语言处理领域的应用。
五、研究方法本研究主要采用机器学习算法和自然语言处理技术,结合实验研究进行。
1. 数据源从教育部、ETS等机构获取大量英语作文和分数样本数据,用于构建分类模型和学习评分规则。
2. 实验设计本研究将数据分为训练集和测试集,采取交叉验证等方法对分类模型进行训练和测试,评估模型的准确率、召回率和F1值等指标。
3. 工具和技术采用Python语言和相关开源库进行实验研究,如nltk、scikit-learn 等。
六、预期成果本研究预计能够实现基于文本分类技术的英语作文自动评分方法,并在大量实验数据上得到验证。
基于人工智能的英语作文自动批改系统设计与实现
基于人工智能的英语作文自动批改系统设计与实现1. 引言随着全球化的推进和英语的广泛应用,英语学习成为许多国家教育系统中的重要组成部分。
然而,英语写作是许多学生面临的难题之一。
传统的英语作文批改方式,如教师批改,耗时耗力且容易出现人为主观因素的干扰。
基于的英语作文自动批改系统应运而生。
2. 现状分析2.1 传统英语作文批改方式的缺点传统的英语作文批改方式主要依靠教师的批改,存在以下缺点:a) 耗时耗力:教师需要耗费大量时间和精力对大量学生的英语作文进行评阅。
b) 主观性:每个教师的标准和偏好不同,会导致批改结果的不一致性。
c) 无法及时反馈:学生需要等待教师批改完成才能获得反馈,这样会延迟学生的进步。
2.2 英语作文自动批改系统的发展现状随着技术的发展,英语作文自动批改系统开始广泛应用。
这些系统利用自然语言处理技术和机器学习算法,能够自动检测语法错误、词汇使用不当以及句子结构不准确等问题,并给出相应的建议和修改意见。
一些商业化的英语作文自动批改系统(如IELTS Writing Assistant)已经在市场上推出,并取得了一定的成功。
3. 存在问题分析虽然英语作文自动批改系统在一定程度上解决了传统批改方式的问题,但仍然存在以下问题:a) 语义理解不足:目前的英语作文自动批改系统主要侧重于词汇和语法的纠错,但对于语义和逻辑的理解还不够准确。
b) 效果不稳定:针对特定错误类型,系统的纠错效果还不够稳定,需要进一步优化和改进。
c) 同质性限制:现有的系统对于不同学习者的差异性需求的满足度较低,缺乏个性化的辅导和指导。
4. 对策建议综合分析现状和存在问题,以下是对于基于的英语作文自动批改系统的对策建议:a) 提升语义理解能力:应加强系统对英语作文语义和逻辑理解的研究和算法开发,以更准确地识别语义错误和提供恰当的修改建议。
b) 深化机器学习算法:通过收集大量的标注数据,采用深度学习等最新的机器学习技术,提高系统对于各种语法错误的检测和纠正能力,并进一步提升纠错的准确率和稳定性。
英语自动写作评估
英语自动写作评估In the digital age, the concept of an English automatic writing assessment tool is revolutionary. It promises to provide instant feedback, saving teachers valuable time and offering students a chance to improve their writing skills continuously.This technology employs advanced algorithms to analyze grammar, vocabulary, and sentence structure, ensuring that the writing meets educational standards. It's not just about identifying errors; it's about understanding the context and providing constructive suggestions for improvement.For students, the experience is akin to having a personal tutor at their fingertips. They can submit their essays, receive feedback, and revise their work, all within a matter of minutes. This immediate response is particularlybeneficial for those who wish to practice writing outside of class hours.Moreover, the tool's adaptability to different learning levels is a significant advantage. Whether a student is a beginner or an advanced writer, the assessment system can be tailored to provide appropriate challenges and guidance.However, it's important to note that while the technology is impressive, it cannot replace the nuanced understanding and personal touch of a human teacher. The tool should beseen as a supplement to traditional teaching methods, not a substitute.In the future, we can expect these systems to become even more sophisticated, incorporating elements of creativity and style into their assessments. This evolution will further enhance the learning experience, bridging the gap between technology and the art of writing.As with any tool, the key to success lies in its use. When integrated thoughtfully into the educational process, an English automatic writing assessment can be a powerful ally in the quest for literacy and expression.。
英语自动作文评分系统实现路径探析
[收 稿 日期 】2018—05—25 [基 金项 目】深圳 信息职业技术 学院科研项 目 (PT201701);深圳 市科技计划创 客专项项 目 (GRcK20l7O424O956O8l0);深圳市科技
计划创 客专 项项 目 (GRCK2017042409552883);深圳 市科技计划项 目 (JcYJ2016O52710l8074o3);深圳 市科技计划项 目 (JCYJ20141M 18100633638) 【作者 简介】夏林 中 (1980一),男 (汉 ),安徽安 庆人 ,博士 ,副教授 ,主要研究 方向 :自然语言处理 。E—mail:xialzl@sziit.edu.en
批 改 系 统就 显得 尤 为重 要 。
1基 于 非 文本 相 关 特 征 的 AES系统 从 国 家 层 面 看 , 近 年 来 中 国 每 年 中考 和 高 考
人数 都 达 到千 万 量级 ,大学 英语 四 、六级 每 年考 试
基 于 非 文 本 相 关 特 征 的 AES系 统 是 依 靠 文 章
第 2期
夏林 中,罗德安 ,张春 晓 ,张卫 丰 :英语 自动作文评分 系统实 现路 径探析
19
浅 层 语 言 学 特 征 来 给 文 章 评 分 的 ,并 未 涉 及 到 对 了较 好 的成 绩 , ̄lJPage最 新 的实验 结果 与 人工 评 分 文章 内容 的分 析 。早期 的AES系 统设 计 依 据 的就 是 在 多元 回 归相 关 性 上 达 到 了0.87[9】。但 是 因该 系 统 非 文 本 相 关 特 征 的分 析 , ̄lEllis Page开 发 的PEG 无 法 对 作 文 内容 本 身 进 行 评 价 招 致 了诸 多 指 责 。 (Project Essay Grader)系统 , ]。 由于 文 章 的流 畅 同时 ,该系统无法反馈与写作 内容相关的指导性建
基于深度学习技术的英语自动评分系统研究
基于深度学习技术的英语自动评分系统研究随着人工智能的不断发展,深度学习技术已经成为了英语自动评分系统的主流技术之一。
这个系统可以用来自动评估试卷、文章等英文文本的语法与语义等方面,它不仅能够帮助评分人员省时省力,同时也能够提高评分的准确性。
在这篇文章中,我们将探讨基于深度学习技术的英语自动评分系统的研究现状以及未来的发展方向。
一、基于深度学习技术的英语自动评分系统的研究现状目前,已经有不少学者和企业开始研究基于深度学习技术的英语自动评分系统。
其中,这个系统主要包括自然语言处理模型、评分算法和人工智能技术的应用等方面。
在自然语言处理模型方面,研究者们主要采用了基于神经网络的模型和基于卷积神经网络的模型。
这些模型可以将文本信息转化为向量,并进行词性分析、词形还原等处理,最终得到一个关于文本信息的特征向量。
在评分算法方面,研究者们主要采用了基于机器学习的算法和基于深度学习的算法。
其中,基于机器学习的算法主要通过训练模型来提高预测的准确性;而基于深度学习的算法则主要通过优化神经网络的结构和权重来提高预测的准确性。
在人工智能技术的应用方面,研究者们主要采用了自然语言处理、数据挖掘、机器学习、计算机视觉等技术。
这些技术可以对文本进行分析,提取特征信息以及进行知识推理等工作,最终实现自动评分的过程。
二、未来的发展方向尽管基于深度学习技术的英语自动评分系统已经取得了一定的进展,但是它还存在一些限制和挑战。
以下是一些未来发展方向的思考。
1. 语料库的建立与拓展自动评分系统所依赖的语料库规模和质量直接影响到自动评分系统的准确性。
因此,未来的研究应该致力于建立更加完备、规范化和具有代表性的语料库,扩大覆盖面和分类细度,提高系统的通用性和精确度。
2. 多模态信息的融合与应用自然语言处理只能处理文字信息,而英语自动评分包含的信息不仅仅是文字,还包括语音、图像等信息。
因此,未来的研究应该致力于将多模态信息进行整合,实现多模态的自动评分系统,提高评分的综合性和准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年第26卷第1期 http |I {、 .C・S—a.org.cn 计算机系统应用 结合语言学特征和自编码器的英语作文自动评分① 魏扬威,黄萱菁 (复旦大学计算机科学与技术学院,上海201203) (复旦大学上海市智能信息处理重点实验室,上海201203)
摘要:近年来,越来越多的大规模英语考试采用了自动评分系统.因此,对英语作文自动评分的研究有着非常 重要的价值.我们先依据英语作文写作技巧提取了大量语言学特征,再分别使用自编码器,特征值离散化方法对 特征进行重构,最后我们使用分层多项模型来输出文章的最终得分.实验表明,该方法能取得很好的预测效果, 而且面对不同主题的作文进行预测时也能显示出较好的鲁棒性.相比于传统自动评分方法皮尔森相关系数高出 9.7%,具有良好的实际应用价值. 关键词:自动评分;白编码器;离散化;文本特征提取
Automatic Essay Scoring Using Linguistic Features and Autoencoder WEI Yang—Wei,HUANG Xuan—Jing (School ofComputer Science,Fudan University,Shanghai 201303,China) (Shanghai Key Laboratory ofIntelligent Information Processing,Fudan University,Shanghai 201303,China)
Abstract:In recent years,more and more large-scale English tests begin to use the automatic scoring system.Therefore, the research of this system is of great value.In this papeL we first extract a lot of features according to English writing guide.Then we use autoencoder and discretization algorithm to learn a different representation of features.Finally,we use a hierarchical multinomial model to output the final scores of articles.Experimental results indicate that this method not only achieves great performance for those essays of the same topic,but also shows good robustness when predicts essays of diferent topics.Compared with the traditional automatic score method.our approach achieves higher than 9.7%in term of Pearson Correlation Coefficient,with good practical values. Key words:automatic essay scoring;autoencoder;discretization;textual feature extraction
英语作文自动评分使用自然语言处理相关技术, 让计算机系统对于目标文章给出合适的得分.随着很 多英语等级认证考试报名人数的增加和计算技术的发 展,一些自动评分的软件已经正式被使用.国外最有 代表性的自动评分系统有:Project Essay Grade(PEG)。 于1966年由美国的杜克大学(University of Duke)的 Ellis Page等人开发I ;intelligent Essay Assessor(IEA)。 由美国科罗拉多大学(University of Colorado) ̄发[2】. e.rater评分系统,已经正式被用来评测TOEFL和GRE 考试中文章的质量l3】.性能优异的自动评分系统结合 文本纠错的功能【 ’5]能减少人的工作量,极大地节约人 力物力资源. 英语作文自动评分的方法研究一直是一项具有挑 战性的,且不断被完善的任务.1996年Arthor Daigon 通过对文章语言形式的考察进行文章质量评测[6 ; 1998年,Leah S.Larkey使用了基于文本分类的方法取 得了性能的提升【1 ;2011-2014年,Isaac Persing和 Vincent Ng等人发表了一系列的文章,使用了回归方 法分别从文章的组织结构【8],文章和对应主题的相关 性 ,还有文章表达的清晰度方面 加 对文章质量进行 评估;2013年,HongboChen和BenHe使用了排序的方 法,通过先对文章质量进行排序再进行划分等级来对
①基金项目:国家自然科学基金(61472088) 收稿时f@2016—04.22;收到修改稿时f@2016-05-23[doi:10.158880.cnki.csa.005535]
Special Issue专论综述1 计算机系统应用 http:llv ̄'w.c—s—a.org.cn 2017年第26卷第1期 文章评分…j. 白编码器(autoencoder)是人工神经网络的一种, 通常用来学习特征的有效编码.2006年Hinton发表在 science上的文章 ” 提出了自编码器,引发了这几年科 学界对人工神经网络研究的热潮.Hinton在文中使用 了自编码器对图像的特征矩阵进行压缩编码.白编码 器也可以用于我们的英语自动评分任务,一方面可以 降低特征的维数,另一方面可以通过重构捕捉到原始 特征中最重要的信息.
1 自编码器 一篇英语作文的原始特征直接用来进行分类或者 回归,往往很难得到很好的评分预测结果.我们可以 先使用自编码器对原始特征进行重编码,再使用编码 结果来对文章的评分进行预测. 白编码器主要是学习一个近似等式: hw,b( )≈X (1)
这里的x表示输入矩阵,w表示权重矩阵,b表示 偏置.自编码器包括编码和解码的两层结构.通过编 码可以得到特征的另外一种表示方式,再通过解码将 编码结果还原出来.如果最终输出的还原结果和输入 非常接近,那么编码结果就可以看成是输入的近似代 替. 第层 图1 自编码器 h b(x) 自编码器的意义不在于还原输入数据,而是体现 在对隐层神经元的限制.如图1所示,为了进行压缩 编码,我们将隐层神经元的数量设置为2,这样就可以 将输入的5维特征压缩到2维.当隐层神经元的数量 火于输入特征的维度时,可以得到特征的高维稀疏编 码结果. 2专论・综述Special Issue 显然,白编码器的目标函数是输出结果和输入之 间的重构误差尽可能小.其计算公式如式(2)所示: ( ) 去 圭I L hw,b( I (2) 当然,为了避免系统的过拟合,我们还要加入一 个正则化项来控制模型的复杂度增长: ’( ,6)=j(w,6)+÷∑( ) (3) /0lIlJIl 如果我们训练的是稀疏自编码器,需要在目标函 数中再增加一个约束项,控制模型的稀疏性.这里引 入激活的概念,如果最后传递函数的输出结果非常接 近于0,那么我们认为该神经元没有被激活.而如果最 后传递函数输出的结果接近于1,那么该神经元被激 活了.通常来说,传递函数为sigmoid函数: 】 八 ? (4) 或者是: f0, l<0 f(x)={ ,0< <1 f51 Il, >1 我们把对稀疏性的控制具体量化为对平均激活度 的控制,令 ㈤表示给定输入x时,第J个隐层神 经元的激活度,具体地,其平均值(整个训练数据上) 为:
P 吉 ( 】 (6)
再引入稀疏性参考P,通常是一个非常接近于0 的值,比如0.05.然后计算P和 的信息增益,用来描 述这两者之间分布的差别. ∑s2碰( lI 』):∑s2 log p+(1-p)l。g( 二 ) (7)
i j pi 1一pi 其中,s2表示隐层中神经元的总数,J是对隐层神经元 的索引.对于稀疏编码,我们将上式的信息增益也作 为惩罚项加入目标函数中.因此对于稀疏自编码器, 其目标函数为式(8)所示.其中 是一个系数,表示对 稀疏性惩罚的力度,这个值越大表示对稀疏性要求越 高. 在有了压缩编码和稀疏编码自编码器的目标函数 之后,我们可以进一步利用优化算法,如梯度下降法, 来对目标函数进行优化以得到最优的网络结构.在英 语作文自动评分任务中,对于提取的原始特征,我们 可以进一步使用自编码器进行重构.通过控制隐层神 2017年第26卷第1期 http://www.c—S-a.org.cn 计算机系统应用 经元的数量,一方面压缩编码进行特征压缩,另一方 面稀疏编码将特征重构到高维.
.  ̄arse( )= l。+ 1 (z 孛 )
2特征值离散化 机器学习系统进行数据训练时,有时候会遇到少 量的异常样本.比如英语作文自动评分任务,其中一 维特征是平均每句话中第一人称代词所占的比例.这 个比例不会太高,一般来说低于0.25,一些异常学生 作文在该维取值可能达到了0.8,0.9或者更高.为了削 弱这些异常样本的影响,我们可以使用不同的区间来 对特征值进行分段.比如这里我们可以取0~0.1, 0.1~0.2,0.2~0.3,0.3~0.4和0.4~1这几个区间.不论异 常作文在该维度的取值是0.8还是0.9统统归到0.4~1 这个区间中,其本身的特征值并不会加入系统训练. 这样可以大大减少异常样本对系统整体性能的干扰. 特征离散化关键问题就在于分割区问的选择ll , 不同的分割区间直接影响到系统的性能.我们首先将 所有样本都归为一个区间中,使用信息增益的方式, 来决定是否进一步分割区问,再递归地分割其每个子 区问.首先是特征 对应的熵,如式(9)所示: 上 E(A,S)=一Zp(F ̄,S)logp(F ̄, ) (9) 其中 是特征 对应的取值的集合, ( , )是 上取 值 对应的比例.下面我们使用分割边界 对特征 划分,划分之后其熵值计算方法为: : E(A,SI)+ E(A,S2)(10) 其中 1和 分别是集合 对应分割边界 的两个子 集.因此信息增益为: Gain(A,r; )=E(A, )一E(A, ; ) (11) 当然我们不能无限对特征值区间进行分割,因此, 我们需要增加一个停止分割条件“ : G ( , ; )< + (12) 其中,Ⅳ是集合 中的元素个数,使用以下公式进行计 算: △( =log(Y一2)一 ・ 一南・E(A,SO一 ・ 4 )] (13) 其中k表示 中元素的个数, 1和 分别表示 l和 中元素的个数.有了上述条件之后,我们在对连续 (8) 特征进行分割的时候就会逐渐收敛,最终停止得到最 优的分割结果. 离散化能够进一步提升特征值的表达能力,离散 化之后的多维特征,每个特征都可以有不同的权重, 因此特征的表达能力得到进一步提升,系统更加稳定. 我们在进行自动评分时,可以对于提取到的原始特征 首先进行离散化,离散化后的高维特征再使用自编码 器重编码.重构的特征最后分别使用支持向量机进行 回归或者分层多项模型进行分类,以输出一篇学生作 文的最终得分.