基于规则的机器翻译系统详解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器翻译原理

基于规则的机器翻译系统 (Rule-based System)
机器翻译(machine translation)

机器翻译原理本质:
是人类思维和语言活动的模拟; 是探索如何借助计算机程序将文字或语言 从一种自然语言翻译成另一种自然语言的 技术。



机器翻译的翻译过程如图所示:
(输入)原语 目的语(输出)
分析
转换
生成
机器翻译(machine translation)

机器翻译主要有两套系统:
一、基于规则的(Rule-based System) 二、基于语料库的(Corpus-based System)


基于规则的机器翻译系统



规则主要包括: 1、词法 2、句法 3、短语规则 4、转换生成语法

问题:

这两种诠释有什么相似之处?
基于规则的机器翻译系统 之 中间语翻译

自然语言大多一个单词有多种意思,比如, 中文的“方便”二字就有很多不同的意思, 容易产生歧义。在机器翻译中,为了简化 纷繁的表达结构,避免其含糊不清的语言 现象,独立于各种自然语言,同时又能清 晰准确地表达各种自然语言的人造计算机 语言英语而生。这种人造计算机语言就是 中间语(interlingua,IL)

基于中间语的机器翻译原理就是不同语言 之间建立一个通用的语义-句法表达式,如 图所示:
SL
分析
中间语表达式
TL
合成
SL词典和语法库
SL词典
TL词典和语法库
个人见解





货币的本质是一种等价物,那意味着所有的物品 都可以用货币去衡量,就相当于一种中间语,用 货币比喻如图: 1000RMB=一头牛 100欧元=一个花瓶 1000RMB=100欧元=1货币 在这个比喻中,虽然不能把一头牛直接等价于一 个花瓶,也不能直接把1000RMB直接等价于100 欧元,但是它们都有相同的等价物1货币,这1货 币就是它们之间的桥梁,它们可以互相交换。 这就和中间语的功能是相似的

奈达根据乔姆斯基的“转换生成语法”做 的诠释
SL表层结构
分析 TL表层结构
生成
SL深层结构
转换
TL深层结构

机器翻译中,从原语(SL)句子的表层结 构到其深层结构需要经过词法、句法、语 义等分析。性层的深层结构是一种树 (syntax tree)。它反映的事一个句子内部 的语法结构,这种结构认为是人类抽象思 维的逻辑表达式。不同的语言具有相同或 相似的深层结构。就像是一座桥梁,把人 类不同的语言连接恰来,使彼此可以翻译 交流。
wk.baidu.com
基于规则的机器翻译系统 之 转换系统


通常包括: 分析、转换和生成三部分 其中从原语向目的语的转换是该系统的核 心。 这种方法被认为是模拟人类翻译活动最恰 当的机制。
机器翻译的三个阶段




1957年,美国学者V.Yingve提出了翻译的三 个阶段,即: 1、用代码化的结构标志转换为目的语句子 结构标志(分析阶段) 2、把原语句子的结构标志转换为目的语句 子的结构标志(转换阶段) 3、有目的语句子结构都标志生成目的语句 子(生成阶段)

由于原语与目的语在句子语法结构上千差万 别,翻译出来的句子的可读性可想而知。 但它是机器翻译的最实质性的一步,是机器 翻译从梦想到现实的一次飞跃。
基于规则的机器翻译系统 之 转换系统


为了提高译文的可读性,人们更多的从句 子的层面来分析处理原语与目的语的特征。 于是在直接翻译系统之上,出现了机器翻 译的转换系统。
个人见解
SL表层结 构 我 SL深层分 析 5 TL深层结 构 Five TL表层结 构 I

2 0 分析 转换
Two Zero
Love You

生成
三阶段的新诠释

法国人B.Vouquois将三阶段诠释为六个步骤
分析 转换 生成
原句词法
原句句法
双语词法
双语句法
目的语句法
目的语词法
奈达对翻译过程的诠释

其翻译模式如下图:
SL输入
形态分析
双语词典查询
语序调整
TL输出

在孩子的教育问题上,家庭教育与 学校教育同等重要
Family education play an equally important role in children's education as school education.
寻找中间语的难度

“如果要设计出一种元语言(中间语)用来 解释,那么它就必须包含多种语言的所有 特征。这种努力不仅毫无止境,而且可能 毫无结果”
——法国人 斯莱德
基于规则的机器翻译系统


大致可分为三种类型: 1、直接翻译 2、结构转换翻译 3、中间语翻译
基于规则的机器翻译系统 之 直接翻译


是把原语中的单词或句子直接替换成相应 的目的语的单词,必要时对词序进行适当 的调整。 这是机器翻译最初的构想。从目的语中寻 找与原语词汇相对应的单词.但并不是电子 词典的word-to-word形式,而是翻译句子中 所有的词汇。到后期也加入了一些简单句 法甚至语义规则,对替换后的词语进行重 新排序,生成目的语文本。
相关文档
最新文档