中国中文信息学会第五届全国机器翻译研讨会

合集下载

中文信息处理的研究内容

中文信息处理的研究内容

中文信息处理的研究内容中文信息处理是计算机领域中的一个重要研究方向。

它旨在解决中文信息在计算机中的输入、输出、转换和处理等一系列问题。

下面,我将依次介绍中文信息处理的研究内容。

一、中文输入法中文输入法是中文信息处理的关键部分之一。

它是将汉字转换为计算机可以识别的数字代码的软件。

不同的中文输入法采用不同的汉字输入方式,如五笔、拼音、笔画等。

中文输入法的研究内容包括汉字输入方式的改进、输入法的智能化、语音输入等。

二、中文分词技术中文分词是将一段中文文本按照词语进行划分的过程,它是其他中文信息处理任务的基础。

中文分词技术的研究内容包括分词算法、分词准确率提高、未登录词的识别等。

三、中文信息检索中文信息检索是通过计算机对大量文本信息进行匹配,将用户的查询需求与最相关的文本信息匹配,并返回给用户的过程。

中文信息检索技术的研究内容包括检索算法、搜索引擎优化、语义分析等。

四、中文语音识别中文语音识别是将人类语音转化为计算机可以理解的文字或者指令的技术。

中文语音识别技术的研究内容包括语音样本的输入和处理、语音识别算法、语音指令转换等。

五、中文机器翻译中文机器翻译是指将一种语言的文本翻译成另一种语言的技术。

中文机器翻译技术的研究内容包括语言模型的建立、翻译规则的设计、翻译结果的优化等。

六、中文信息抽取中文信息抽取是指从海量中文文本中,得出有价值的信息。

中文信息抽取技术的研究内容包括实体识别、关系抽取、事件抽取等。

综上所述,中文信息处理是一个广泛而又深入的领域。

在未来,我们可以期待更多的技术创新和研究成果的涌现,为中文信息处理提供更加强大的工具和平台。

张家俊,李茂西,周玉,陈钰枫,宗成庆 中国

张家俊,李茂西,周玉,陈钰枫,宗成庆 中国

2 参评系统描述
在这次机器翻译评测中我们使用了 6 个翻译系统,即: (1)基于最大熵括弧转录文法 (MEBTG)的统计机器翻译系统、 (2)句法增强的基于最大熵括弧转录文法(SynMEBTG)的统 1 计机器翻译系统、 (3)开源基于短语的翻译系统(Moses ) 、 (4)开源基于层次短语的翻译系统 2 (Joshua ) 、 (5)词语级系统融合系统(WordComb)以及(6)句子级系统融合系统(SenComb) 。
λ8
λ7 ⋅ PLM y
其中 Ω 是调序分值, λ8 为相应特征的权重。与[xiong et al., 2006]相似,调序的分值由基于 词汇化(边界词)特征的最大熵模型训练得到。
2.2 SynMEBTG 系统的句法增强版本。由于 MEBTG 的核心思想就是将顺序合 并和逆序合并看成一个最大熵的二元分类问题。 因此, 分类所采用的特征将成为决定系统性能的 关键因素。MEBTG 系统只采用了词汇化的特征,分类的正确率不是很高。SynMEBTG 系统就 是设法在不降低实际解码速度的情形下,将源语言的句法信息高效地融入调序模型。 SynMEBTG 的基本思想就是:如果被合并的两个短语都是句法短语,我们就采用句法调序 信息,否则我们采用 MEBTG 的词汇化调序信息。不同于在解码过程中计算句法调序信息,我 们将句法调序信息的计算作为翻译前的预处理模块。类似于[Li et al., 2007],我们从一棵句法树 上获得句法调序信息。 [Li et al, 2007]处理含有两个或三个孩子节点的子树, 然后决定孩子节点间 是否需要调序, 最终得到调序后的源语言句子。 我们的方法如下: 如果一个节点有两个孩子节点, 我们即可以构造一个规则决定他们是否需要交换顺序;如果一个节点含有三个以上的孩子节点, 我们首先判断孩子节点中是否有中心节点(VP 或者 NP),有的话,我们便设计一个规则决定位于 中心节点前的修饰节点是否需要调至中心节点后。综合而得我们设计的规则如下:

机器翻译译后编辑大赛历年题目含金量

机器翻译译后编辑大赛历年题目含金量

机器翻译译后编辑大赛历年题目含金量含金量很高
全国机器翻译译后编辑大赛已成功举办4届,吸引了来自全球700余所高校、280余家单位的20000余名翻译爱好者参赛,辐射中国大陆31个省份
和港澳台地区以及美国、英国、法国、俄罗斯、新加坡、澳大利亚和韩国等,赛事影响力日益凸显。

为顺应翻译爱好者对机器翻译译后编辑飞速增长的需求,火山翻译·第五届全国机器翻译译后编辑大赛注入两大崭新亮点:1)首次增设汉/日互译比赛项目;
2)汉/英互译比赛项目首次引入分赛区模式,设东部、北部、南部和中西部4个分赛区进行初赛,选手晋级后进入全国决赛。

欢迎对翻译感兴趣的广大师生、翻译从业人员及翻译爱好者报名。

本届大赛免收报名费。

中俄多领域合作背景下机器翻译与人工翻译的发展与应用

中俄多领域合作背景下机器翻译与人工翻译的发展与应用

1192022年5月上 第09期 总第381期学术研究China Science & Technology Overview0. 引言自中俄两国领导人将两国关系提升为“新时代中俄全面战略协作伙伴关系”以来,在经贸、能源、航空航天、创新科技等多领域合作持续发力,互利共赢。

随着国内产业的快速发展,对俄合作日益深入,国内与国外技术人员接触也与日俱增。

在这种形势下,翻译人员承担着艰巨的任务,也发挥着越来越重要的作用,但培养一名优秀的翻译人才往往需要时间和经历的磨练,所以机器翻译与人工翻译的发展也将迎来的新的机遇与挑战。

1. 翻译的发展进程在翻译发展的历史长河中,翻译一直是以一种言语转换、文字转码,在非固定的语境中做出抉择的艺术而存在。

翻译的艺术体现在脑力活动中,它不仅仅需要专业技能,还需要创造力,还有对社会的适应能力、以及心理素质。

20世纪时,翻译已经转变为一种大众化的职业。

翻译的艺术再也不是口口相传,而是变得更加系统化。

人们对翻译行为有了更加科学的理解。

在现代翻译科学发展的瓶颈期,法国语言学家乔治•穆南提出:“翻译活动的成就是相对的,它所达到的交流思想水平是变化发展的[1]。

”翻译活动虽然存在一定的限度,但是随着人类对这个世界认知的不断完善,其限度也是不断发展变化的。

21世纪对我们提出了全新的挑战。

这些挑战使我们不禁思考,一系列涉及人类生活各方面的职业在未来的发展方向。

以经济预测准确而闻名的世界经济论坛创始人兼执行主席克劳斯·施瓦布提出了第四次工业革命的概念:“我们正处于一场技术革命的边缘。

它将彻底改变我们的生活、工作,以及人际交往方式。

这种转变的规模和复杂程度将和之前完全不同。

我们尚不明确它会如何发展,但很清楚这次技术革命将带来全方位的反应。

它将影响到国际社会所有相关方面,从国家部门、私营经济到学术界及大众社会。

翻译的发展史证明了这种变革与技术发展的记录、重现、储存、信息传输都有直接联系。

中英文机器翻译的实现及效果评价

中英文机器翻译的实现及效果评价

中英文机器翻译的实现及效果评价在今天的全球化世界中,语言不再是沟通的阻碍,机器翻译的出现极大地促进了跨国交流与合作。

中英文机器翻译早在上世纪六七十年代就有了初步的尝试,但效果并不理想。

随着计算机技术的发展,机器翻译质量得到了极大提升。

本文将从中英文机器翻译的实现及其效果评价两个方面,探讨机器翻译的现状与未来发展。

一、中英文机器翻译的实现中英文机器翻译的实现,是一项涉及自然语言处理、机器学习、语料库建设等众多专业领域的复杂工程。

在深层次的理论和技术基础上,实现机器翻译大致可以分为以下几个步骤。

1.分词和词性标注中英文机器翻译首先需要将句子按照语义和语法规则进行自动切分和分析,这个过程就是分词和词性标注。

中文的分词比英文更加困难,因为汉字之间是不用空格分隔的。

而且同一个汉字在不同的词语中有不同的意思,需要根据句子的上下文来判断。

在这一步中,对于同一语言的机器翻译与不同语言之间的翻译稍有不同,最终目的都是生成一个标准化的句子表示形式。

2.句法分析句法分析是指分析句子中不同部分之间的关系和语法结构。

这一步通常采用递归神经网络、转移系统等算法进行处理,从而生成一棵句法树。

3.语义分析语义分析的目的在于获取句子的真实意义,以便进行下一步的翻译处理。

通常采用词向量、LSTM、注意力机制等算法,将句子中各词语的语义信息进行融合,从而形成一个表示整个句子的语义向量。

4.译文生成在完成句子的分析和语义表达后,就可以采用统计机器翻译、神经机器翻译等算法来生成翻译结果。

其中,神经机器翻译由于其更强的适应性和学习能力,在翻译效果上相对更优秀。

二、中英文机器翻译的效果评价尽管机器翻译已经取得了不小的进展,但在现实中,仍然难以做到真正的“人机无缝对接”。

中英文机器翻译还面临很多问题,例如:1.词汇和文化差异中英文之间存在很多词汇和文化差异。

例如,中文中的“一带一路”、英文中的“Brexit”等专有名词和术语在翻译时需要根据具体语境进行处理,否则容易导致意义歧义、误解甚至词义对立。

赵铁军教授 - 机器智能与翻译研究室--哈工大

赵铁军教授 - 机器智能与翻译研究室--哈工大

赵铁军,博士,教授,博士生导师,哈工大计算机学院副院长、哈工大语言语音教育部-微软重点实验室副主任。

中国中文信息学会理事、中文信息学会机器翻译专业委员会副主任、《中文信息学报》、《自动化学报》编委、中国计算机学会高级会员。

主要研究方向:自然语言理解、基于内容的网络信息处理、人工智能应用。

目前讲授“人工智能原理”、“命名实体识别与信息抽取”等研究生和本科生课程。

近5年来承担国家自然科学基金项目、863计划项目、科技部国际合作项目等10余项,曾获部级科技进步奖5项,出版专著2部。

近3年来发表论文60余篇。

Dr. Tiejun Zhao, professor (doctorial supervisor) of Research Center of Language Technology, School of Computer Science and Technology, Harbin Institute of Technology. He is dean of SCST and deputy director of MOE-MS Key Laboratory of NLP & Speech in HIT. He is associate director of Machine Translation Subject Committee of Chinese Information Society, the member of editorial board of Journal of Chinese Information Processing, Journal of Automation, the senior member of China Computer Federation. His research fields include: natural language understanding,content-based web information processing, applied artificial intelligence. Now he teaches the courses of AI, NER and IE for master students and undergraduates. He has done and is doing about 10 projects from NSFC, 863 High-Tech Program, MOST etc. in recent 5 years. He has won 5 prizes of Ministry Science & Technology Award and published 2 academic books. He has published over 60 papers on journals and conferences in recent 3 years.。

汉译英机器翻译错误类型统计分析以外宣文本汉译英为例

汉译英机器翻译错误类型统计分析以外宣文本汉译英为例

汉译英机器翻译错误类型统计分析以外宣文本汉译英为例一、本文概述随着全球化的深入发展和中国对外开放政策的持续推动,外宣文本的汉译英工作日益重要。

外宣文本作为展现国家形象、传播中华文化、促进国际交流的重要载体,其翻译质量直接影响到我国在国际舞台上的形象塑造和文化传播。

因此,提高外宣文本汉译英的准确性和质量,对于增强我国的国际影响力和竞争力具有重要意义。

本文旨在通过对汉译英机器翻译在外宣文本翻译中的错误类型进行统计分析,揭示机器翻译在外宣文本翻译中常见的错误类型和产生原因,为改进机器翻译算法和提高翻译质量提供有益参考。

本文还将结合具体案例,探讨如何在外宣文本汉译英中避免或减少这些错误,提高翻译的准确性和流畅性。

通过本文的研究,我们期望能够为外宣文本汉译英的实践工作者提供一些有益的启示和建议,同时也为机器翻译技术的发展和完善贡献一份力量。

二、汉译英机器翻译错误类型统计分析随着全球化进程的加快,外宣文本的汉译英需求日益增加。

在这一背景下,机器翻译技术虽然为我们提供了极大的便利,但其存在的错误也不容忽视。

本部分将以外宣文本汉译英为例,对机器翻译中常见的错误类型进行统计分析,以期为提高翻译质量提供参考。

在汉译英的机器翻译过程中,常见的错误类型主要包括语义理解错误、词汇选择不当、语法结构混乱、文化差异导致的误译等。

这些错误不仅影响了译文的准确性,还可能造成读者的误解,进而影响外宣效果。

通过对大量外宣文本的汉译英结果进行分析,我们发现语义理解错误是其中最为常见的问题之一。

这主要是由于汉英两种语言在表达方式和文化背景上存在差异,导致机器在理解原文时产生偏差。

例如,某些在汉语中具有特定文化内涵的词汇,在翻译成英文时可能无法准确传达其深层含义,从而造成语义上的损失。

词汇选择不当也是机器翻译中常见的错误类型。

由于汉英两种语言的词汇库庞大且复杂,机器在选择合适的词汇进行翻译时往往会遇到困难。

这可能导致译文中的词汇与原文不符,甚至产生歧义。

浙江省湖州市重点中学2024届第二学期高三教学质量检测试题语文试题试卷含解析

浙江省湖州市重点中学2024届第二学期高三教学质量检测试题语文试题试卷含解析

浙江省湖州市重点中学2024届第二学期高三教学质量检测试题语文试题试卷考生请注意:1.答题前请将考场、试室号、座位号、考生号、姓名写在试卷密封线内,不得在试卷上作任何标记。

2.第一部分选择题每小题选出答案后,需将答案写在试卷指定的括号内,第二部分非选择题答案写在试卷题目指定的位置上。

3.考生必须保证答题卡的整洁。

考试结束后,请将本试卷和答题卡一并交回。

1、阅读下面的作品,完成下面小题。

语言智能和语言教育不应“相杀”饶高琦近年来,语言智能技术迅猛发展,并在舆论中对人工语言服务形成冲击。

语言教育存废及投入多寡等,成为国家教育规划和技术规划中需要面对的问题。

12月24日,北京语言大学语言资源高精尖创新中心和中国中文信息学会召开了“语言智能与社会发展”论坛。

40余位来自语言教育界、信息技术界、企业界、新闻界和政界的有识之士共同就语言智能与外语教育协同发展献言献策,并形成了《语言智能与外语教育协同发展宣言》,倡议教育界和技术界相拥相爱,停止相搏相杀。

智能技术冲击传统产业,挤出其中的就业人口,本不新鲜。

但今天机器翻译为代表的语言智能技术对传统语言产业的冲击大部分只存在于舆论之中:翻译人员的收入保持稳定,翻译市场的价格没有明显下降,规模持续增加。

其他语言服务产业也在蓬勃发展。

2018年两家一线创新企业机器翻译产品在重要会议上“翻车”,也表明语言智能还远远不足以像两百多年前的轧棉机一样制造失业潮。

但这种舆论中的冲击,伤害却不小:大学英语专业,从曾经的香饽饽,变成今天坊间“对不起良心”的专业,语言智能的冲击也是重要因素之一。

很多学界、企业界人士刻意制造了一种“外语专业灭亡论”。

××翻译在××技术竞赛中拿到冠军,××系统超越人工翻译,××翻译机通过专业考试等信息更在媒体的追逐中频现网端。

在人工智能服务大量进入日常生活的今天,这种论调已经不再是未来小说、科幻电影里那种飘忽云端的危言耸听,而成为了触手可及的恐慌之源。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
WoodPecker是微软亚洲研究院研制的新的机器翻译评测指标。该指标的评测使用 WoodPecker系统平台,自动评测翻译系统对各种语言学知识(称为检测点)的翻译能 力。依据测试数据集和参考翻译数据集之间的词对齐结果和它们的句法分析树, WoodPecker系统首先自动从源语言和目标语言中抽取各种检测点类型,包括名词短语, 动宾搭配,介词短语,新词等几十种语言学类型。然后,WoodPecker系统通过计算测 试语料中检测点的参考翻译结果与翻译系统翻译结果之间的匹配程度来评估翻译系统 在特定语言学现象方面的翻译能力。有关WoodPecker评测系统的相关介绍参见附录六。 为提高WoodPecker评测的准确度,本次WoodPecker评测的测试集将通过人工方式进行 校对。
CWMT2009研讨会结束一个月内,评测组织单位将会把“英汉科技机器翻译”和“汉 蒙日常口语机器翻译”两个评测任务的参考译文提供给参评单位,供各参评单位研究 之用。 “汉英新闻领域单一系统”和“英汉新闻领域机器翻译”两个项目的参考译文 将不提供给参评单位,而是留到下次评测时继续使用,以便了解各参评单位在这一段 时间间隔内的技术进步。因此,参评单位应在这一段时间内避免对这两个测试集进行 针对性调试,以免影响下次评测的客观性。
“单一系统”项目的测试数据与“机器翻译”项目类似。 本次CWMT2009“汉英新闻领域单一系统”评测项目的参评单位除了要在本次评测 的CWMT2009测试数据上运行并产生结果以外,还要求在SSMT2007测试数据上运行并产 生结果,并同时提交给评测组织单位。 3. “系统融合”项目的测试数据 在“汉英新闻领域单一系统”项目评测结束后,评测组织单位会将所有参评单位 在CWMT2009和SSMT2007两个测试数据上的输出翻译结果(N-best译文)发给“汉英新 闻领域系统融合”项目的所有参评单位,作为测试数据。 “汉英新闻领域系统融合”项目的参评单位在本次评测的CWMT2009测试数据的多 个译文基础上进行系统融合,并给出系统融合的结果。SSMT2007测试数据的翻译结果 用于对各个输入系统进行评估。 4. 干扰数据 评测组织者提供给参评单位的测试数据中,除了真正的测试数据外,还有一定比 例的干扰数据,干扰数据并不真正用于评测。 5. 分割日期 为了确保训练数据和测试数据不会重叠,评测组织方定义了一个训练数据和测试 数据的分割日期(Cut-off Date)。本次评测定义的分隔日期是2009年1月1日。 所有的训练数据和开发数据,包括评测组织方提供的数据和参评单位自己收集的 数据,都必须是在分割日期之前(不含分割日期)产生的数据。 评测组织方提供的测试数据将是在截止日期之后(含分割日期)产生的数据。
九、 评测日历
1. 2009年7月15日 报名截止日期
2. 2009年7月1日 评测组织方发放训练数据
2009 年 8 月 10 日
3. 上午9:00
评测组织方发放“汉英新闻领域单一系统”项目测试数据
2009年8月14日 “汉英新闻领域单一系统”项目参评单位提交运行结果和系
4. 上午9:00
统描述
2009年8月17日 评测组织方发放“英汉新闻领域机器翻译”和“英汉科技领
参评单位最多可以提交三个对比结果(Contrast Results),产生对比结果的系统称 为参评单位的对比系统(Contrast Systems)。
2. “单一系统”项目
“单一系统”项目的输出结果采用N-best结果文参评单位必须提交一个基本结果(Primary Result),产 生基本结果的系统称为参评单位的基本系统(Primary System)。
本次评测仅在“汉英新闻领域单一系统”项目和“汉英新闻领域系统融合”项目
中使用WoodPecker进行评测。
七、 提交技术报告并参加评测研讨会
评测结束后,参评单位应向CWMT2009研讨会提交一份详细的技术报告,并派至 少一人参加CWMT2009研讨会。技术报告的要求见附件四。
八、 评测组织者向参评单位提供参考译文
参评单位最多可以提交三个对比结果(Contrast Results),产生对比结果的系统称 为参评单位的对比系统(Contrast Systems)。
如果可能的话,参评系统输出的N-best结果应给出每个结果的评分,并且按照评 分从高到低排序。N最多不超过20。该项目评测只使用第一个结果进行评价,其他结果 将提供给“汉英新闻领域系统融合”项目的参评单位作为输入数据。如果参评系统由 于所采用的技术原因,无法提供每个结果的评分,或者无法提供N-best的翻译结果, 则可以不提供N-best翻译结果和评分,在这种情况下,请直接采用1-best结果文件格 式,不要采用N-best结果文件格式。
另外需要特别注意的是,由于“汉英新闻领域单一系统”项目的参评系统需要运 行 并 提 交 SSMT2007 测 试 数 据 上 的 运 行 结 果 , 因 此 该 项 目 的 训 练 数 据 不 允 许 使 用 SSMT2007测试数据及其参考译文。 3. “系统融合”项目
“系统融合”项目的参评系统,仅允许使用评测组织者指定的数据进行训练,不 允许使用任何外部数据。
此类项目的参评系统必须是单一的系统,也就是说,不允许采用系统融合技术, 将多个系统的结果融合成一个结果;也不允许采用对多个翻译结果进行重评分 (Rescoring)的技术,因为重评分技术可以认为是系统融合技术的一个特例;同样不 允许采用解码阶段的多模型技术,也就是使用多个不同概率模型同时指导解码的技术, 因为这也可以看做另一种类型的系统融合技术。除此之外,对参评系统所采用的技术
“汉英新闻领域单一系统”项目的参评系统,包括基本系统和对比系统,都仅允 许使用评测组织者指定的数据,不允许使用任何外部数据进行训练(注意,这一点与 “机器翻译”项目不同)。系统开发过程中通过人工方式构造的数据也在允许范围之 内,因此基于规则的机器翻译系统也可以作为参评系统。如果参评系统是基于规则的 机器翻译系统,但其中混合了基于实例的机器翻译技术或者统计机器翻译技术,那么 这些技术所使用的数据也必须限制在评测组织者指定的数据范围之内,不允许使用任 何外部数据。
根据惯例,本次研讨会将继续组织统一的机器翻译评测,以推进参评单位的实质 性交流和机器翻译技术的发展。
本次评测的主办机构为:
中国中文信息学会
本次评测的组织单位是:
中国科学院计算技术研究所
本次评测的合作单位包括: 北京大学 内蒙古大学 中国科学技术信息研究所 微软亚洲研究院
本次评测的资源提供单位包括: 北京大学 哈尔滨工业大学 内蒙古大学 厦门大学 万方数据股份有限公司 点通数据有限公司 中国科学技术信息研究所 中国科学院自动化研究所 中国科学院计算技术研究所
没有任何其他限制。 3. “系统融合”项目
“系统融合”项目的参评系统目标是,接受“单一系统”项目的翻译结果,并对 这些结果进行重新组合,以得到更好的结果。
三、 测试数据
1. “机器翻译”项目的测试数据 各“机器翻译”项目的评测都采用目前国际上普遍采用的评测方式。由评测组织
方提供源语言的测试数据,测试数据已经分割成句子。测试数据格式见附件二。 2. “单一系统”项目的测试数据:
六、 评测指标
本次评测采用多种自动评价标准,包括:BLEU-SBP、BLEU-IBM、BLEU-NIST、 NIST 、GTM 、mWER 、mPER、ICT和WoodPecker。BLEU-SBP是主要的自动评价 标准。自动评测的算法是大小写敏感的。中文的评测是基于字的,而不是词。参评单 位无需在中文译文的汉字之间添加空格。评测组织方会在自动评价前将所有中文译文 中的对应于GB2312编码的A3区全角字符都转换成半角字符,参评单位也无需自己进行 此项转换。
中国中文信息学会第五届全国机器翻译研讨会 (CWMT2009)评测大纲
中国科学院计算技术研究所 CWMT2009 机器翻译评测小组
一、 引言
第五届全国机器翻译研讨会(CWMT2009)即将于2009年10月16-17日举行。该研 讨会是前四届统计机器翻译研讨会(SSMT2005、SSMT2006、SSMT2007、CWMT2008) 的延续。
“机器翻译”项目的参评系统要将评测组织者提供的源语言句子翻译成目标语言 句子。
此类项目的参评系统可以采用任何机器翻译技术,包括基于规则的机器翻译技术、 基于实例的机器翻译技术、或者统计机器翻译技术。对参评系统所采用的技术没有任 何限制。
2. “单一系统”项目
“单一系统”项目的参评系统也要将评测组织者提供的源语言句子翻译成目标语 言句子。
评测项目名称 汉英新闻领域单一系统 汉英新闻领域系统融合 英汉新闻领域机器翻译 英汉科技领域机器翻译 汉蒙日常用语机器翻译
语种 汉Æ英 汉Æ英 英Æ汉 英Æ汉 汉Æ蒙
领域 新闻领域 新闻领域 新闻领域 科技领域 日常用语
技术 单一系统 系统融合 机器翻译 机器翻译 机器翻译
以上评测项目分为三类:
1. “机器翻译”项目
本次评测的评测委员会主席是: 刘群(中国科学院计算技术研究所)
本次评测的评测委员会委员有: 李沐(微软亚洲研究院) 吕雅娟(中国科学院计算技术研究所)
那顺乌日图(内蒙古大学) 史晓东(厦门大学) 孙乐(中国科学院软件研究所) 王惠临(中国科学技术信息研究所) 杨沐昀(哈尔滨工业大学) 俞敬松 (北京大学) 张冬冬(微软亚洲研究院) 赵红梅(中国科学院计算技术研究所) 周玉(中国科学院自动化研究所) 有关会议和评测的更多信息请参见以下网址:
四、 测试结果
参评单位收到测试数据后,应在给定时间内返回翻译结果。 参评单位提交的每个结果,都应附带一个详细的系统描述,系统描述的要求见附
件三。 1. “机器翻译”项目
“机器翻译”项目的输出结果采用1-best结果文件格式,具体数据格式见附件二。
“机器翻译”项目的每个参评单位必须提交一个基本结果(Primary Result),产 生基本结果的系统称为参评单位的基本系统(Primary System)。
相关文档
最新文档