机器翻译概
英文转中文语音翻译器

英文转中文语音翻译器概述英文转中文语音翻译器是一种基于语音识别和机器翻译技术的应用程序,它可以将英文语音或文本转换为中文语音或文本。
该翻译器不仅可以帮助用户实时理解英文内容,还可以提供便捷的翻译功能,让用户更好地跨越语言障碍。
功能1. 语音识别英文转中文语音翻译器通过使用现代语音识别技术,可以将用户提供的英文语音实时转换为文本格式。
这个功能可以方便用户在各种情境下,例如会议、讲座、英语听力等,实时了解英文内容,并将其转化为中文文字。
2. 文本翻译该翻译器还可以将用户提供的英文文本翻译为中文文本,帮助用户更好地理解内容。
它利用机器翻译技术,根据上下文和语法规则,将英文文本转化为准确、流畅的中文表达。
3. 语音合成英文转中文语音翻译器还具备语音合成功能,可以将用户提供的英文文本或翻译后的中文文本转换为中文语音输出。
用户不仅可以通过阅读文本理解翻译结果,还可以通过听取语音输出更好地感受和理解内容。
应用场景1. 跨语言交流英文转中文语音翻译器为用户提供了跨语言交流的工具。
无论是在国际会议中与外籍代表沟通,还是在旅游中向外国友人询问路线,用户都可以通过该翻译器实现实时翻译和互通无障碍的交流。
2. 学习英语该翻译器也可以成为学习者学习英语的辅助工具。
学习者可以通过将英文语音转化为中文文本,更好地理解和记忆英语的发音和用法。
同时,通过将中文文本转化为中文语音输出,学习者还可以提升英语听力和语音发音。
3. 实时翻译对于需要实时翻译的场景,如新闻报道、实时会议、紧急通信等,英文转中文语音翻译器提供了快速、准确的英文翻译服务。
用户只需将英文语音输入到翻译器,即可实时获取中文翻译结果。
技术原理英文转中文语音翻译器利用了多项先进技术实现其功能:1.语音识别:采用语音识别算法,通过语音分析和模型匹配,将英文语音转换为文本。
目前常用的语音识别技术包括梅尔频率倒谱系数(MFCC)、隐马尔可夫模型(HMM)等。
2.机器翻译:该翻译器利用机器翻译技术,基于大规模语料库和神经网络模型,将英文文本翻译为中文文本。
人工智能与机器翻译方法.ppt

尽管计算机自动分词在诸多方面存在着许多困难, 但是由于自动分词是 许多应用工作的第一步(也是自动翻译的第一步), 这就促进了研究的持续不断, 提出了不少方法, 它们各有优缺点, 也可能是基于特定环境的。
第 5 章 单词与词组的处理与分析
5. 2 . 1 典型的自动分词方法 5 . 2 . 1 . 1 正向最大匹配法和逆向最大匹配法
第 5 章 单词与词组的处理与分析
5 . 2 自动分词
汉语自动分词是我国计算机科学研究的重要课题之一, 它是自然语言理 解、自动翻译、 电子词典等信息处理的基础性工件。所谓分词, 就是要把一 句话, 一篇文章甚至一部著作中的词语逐个逐个的切分出来。汉语不象拼音 文字那样有自然切分标志, 而且词语长短不一, 词语的定义也不统一, 语言 学中对词的定义多种多样, 造成切分的多样性, 这也自然给自动分词的同一性 带来很大困难。 汉语中词语本身的词素、词、词组无明显的区分界限, 没有 一个统一的标准, 许多东西都是凭经验和语感来划分。.这项工作如果全部交 给计算机来作, 就没有那么简单了。
A1: 一条汉语语句分划成单一字符X1,X2,…,XM。 A2: 决定语词中可能出现的词最大字符长度Lmax, 最小字符 长度 Lmin。 A3: 逆向匹配,取语句最后的Lmin个字查关键词库, 若查不到, 加入一个字重复此工作,直至字符数为Lmax为止。 A4: 若实施A3查不到词,去掉语句中最后一个字,再实施A3,直 至整个语句只剩下L min为止。
pan翻译

pan翻译
Pan翻译(Panglossian Translations)是一种自动翻译技术,它可以将文本从一种语言翻译成另一种语言,而无需人工干预。
这种技术名字源自法国作家蒙田的《伽利略传》中的一个角色,即“帕兰格罗斯”,也就是“永远乐观主义者”的意思。
Pan翻译是一种基于机器学习的自动翻译系统,它使用统计语言模型来确定翻译句子中出现的词语和搭配。
它通过对大量源语言和目标语言句子对之间的共现关系,来学习如何将源语言的句子转换为目标语言的句子。
Pan翻译的一个重要特征是它可以支持一种叫做多语言表达的方式。
这意味着它可以在不同的语言中表达同一个概念,并且在表达过程中能够保持概念上的一致性。
这就有利于理解翻译的共性和个性,从而使翻译变得更加准确和精确。
Pan翻译与传统的机器翻译相比有许多优点,例如更快的翻译速度、更好的准确率、更低的成本、更高的效率等。
此外,它还能够以一种更简洁、更准确的方式来捕捉句子的意义,而不是简单地翻译句子的字面意思。
另外,Pan翻译也能够支持多个语言之间的互相翻译,这使得翻译过程变得更加高效、准确。
此外,它还可以支持跨文化翻译,从而使翻译变得更加准确。
总而言之,Pan翻译是一种极具前瞻性的自动翻译技术,其准确性、效率和灵活性都得到了显著提升。
它的应用可以极大地改善当今社会的跨文化交流,使得翻译技术更加精准和高效。
英译汉扫描翻译

英译汉扫描翻译(原创实用版)目录1.英译汉扫描翻译的概述2.英译汉扫描翻译的具体方法3.英译汉扫描翻译的优缺点4.英译汉扫描翻译的未来发展正文随着全球化的加速,英语作为国际通用语言的地位日益重要,而中文作为世界上使用人数最多的语言之一,也在不断加强与其他语言的交流。
英译汉扫描翻译作为一种便捷高效的翻译方式,逐渐受到人们的关注和喜爱。
一、英译汉扫描翻译的概述英译汉扫描翻译是指通过光学字符识别(OCR)技术将英文文本转化为数字文本,然后通过机器翻译(MT)技术将英文数字文本翻译成中文。
这种翻译方式具有速度快、准确率高等特点,适用于大量英文资料的快速翻译。
二、英译汉扫描翻译的具体方法1.使用 OCR 技术将英文文本转化为数字文本。
目前市场上有许多成熟的 OCR 软件,如 ABBYY、腾讯云 OCR 等,可以实现英文文本的准确识别。
2.将识别后的英文数字文本输入到机器翻译系统中。
目前主流的机器翻译系统有谷歌翻译、百度翻译等,可以根据英文数字文本的内容将其翻译成中文。
3.对翻译结果进行校对和修改。
由于机器翻译可能存在一定程度的误差,因此需要人工对翻译结果进行校对和修改,以确保翻译质量。
三、英译汉扫描翻译的优缺点优点:1.速度快:相较于传统的人工翻译,英译汉扫描翻译速度更快,适用于大量资料的快速翻译。
2.准确率高:OCR 技术和机器翻译技术的发展,使得英译汉扫描翻译的准确率不断提高。
3.降低人力成本:英译汉扫描翻译可以减少人工翻译的工作量,降低人力成本。
缺点:1.翻译质量有限:相较于人工翻译,英译汉扫描翻译在处理复杂句子、专业术语等方面仍有一定局限性。
2.需要校对:虽然英译汉扫描翻译可以提高翻译速度,但仍需要人工对翻译结果进行校对和修改,以确保翻译质量。
四、英译汉扫描翻译的未来发展随着 OCR 技术和机器翻译技术的不断发展,英译汉扫描翻译在未来将具有更高的准确率和更快的速度。
同时,随着人工智能技术的发展,未来英译汉扫描翻译可能实现更高水平的自动化,进一步提高翻译质量和效率。
计算机辅助翻译技术Review

计算机辅助翻译技术概论押题:1、隐马尔科夫模型2、机器翻译的方法3、文本电子化OCR4、双语对齐处理5、汉语切分的方法和关键问题5-20考试——计算机辅助翻译技术考试题型:填空、判断、问答7-8个考查内容:基本概念梳理,理解分析能力,考题思路,课件!1、概论1.1概况为什么要研究翻译技术?何谓翻译技术(translation technology)?能够用来进行语言翻译或辅助进行语言翻译的信息技术。
解决或缓解语言障碍(language barrier)问题,提高翻译从业人员的生产率。
翻译技术的研究始于机器翻译关于机器翻译机器翻译(Machine Translation)定义:利用计算机及其软件把一种语言(自动)翻译成为另外一种语言的技术。
机器翻译研究的目标是研制具有翻译能力的计算机软件系统。
机器翻译的研究始于20世纪40年代末期。
机器翻译结论很困难。
翻译技术的分流机器翻译(MT):机器翻译的主体是机器。
目前比较困难。
(目标是寻找彻底的解决方案)计算机辅助翻译(CAT):计算机辅助翻译的主体是人。
相对比较容易,但却很实用。
计算机辅助翻译立足为翻译人员提供(软件)工具。
协助翻译人员提高效率(生产率)。
名词辨析CAT - Computer-aided TranslationMAT - Machine-aided(-assisted) TranslationMAHT - Machine-assisted Human TranslationHAMT - Human-assisted Machine TranslationMT - Machine TranslationFAHQMT - Fully Automatic High Quality MT关于翻译技术的理解狭义的理解,翻译技术指计算机辅助翻译技术和机器翻译技术。
广义的理解,翻译技术指的是对翻译人员工作有益的任何信息技术。
文字处理工具(MS Word) (不可或缺)国际互联网及其应用(WWW、Email...)各种电子资源(百科全书光盘...)本课程的定位:主要是狭义的翻译技术。
依存语法和机器翻译

语言文字应用1997年第3期(总第23期)依存语法和机器翻译刘海涛 提要 回顾了依存语法的发展过程,介绍了依存语法的基本原则和构建方法,比较了短语结构语法与依存语法的异同以及它们在机器翻译中的作用,说明了依存语法与配价语法的关系。
认为依存语法在自然语言的计算机处理中有着重要的作用。
一 Tesni ère 和依存语法理论的产生虽然语法依存和动词中心论的概念古已有之,但一般认为现代依存语法理论的创立者是法国语言学家Lucien Tesni ère (特思尼耶尔,1893—1954)。
他的主要思想反映在1959年出版的《结构句法基础》一书中,事实上,早在1934年,特思尼耶尔就发表了阐述依存语法基本观点的论文。
特思尼耶尔的《结构句法基础》和其他著作对于语言学的特殊价值在于,它们是建立于对人类语言进行广泛对比研究的基础之上的,这与目前某些语言学者仅仅通过一种语言的研究而得出语言普遍现象的方法迥然不同。
特思尼耶尔本身掌握多种古典与现代语言,这使得他的许多发现和理论相似于今天的语言类型和语言共性研究的成果。
特思尼耶尔的本意是建立一门跨越各国语言界限、客观揭示人类语言内在规律的句法理论。
特思尼耶尔所用的术语“结构句法”与今天我们用的“依存语法”指的是一回事。
《结构句法基础》可分为三个主要部分:La connexion (联系或依存),La jonction (组合),La translation (转移或词类转换)。
作者说:“联系、组合和转移是概括一切结构句法现象的三大核心。
”遗憾的是特思尼耶尔对什么是结构句法(依存语法)未作正面的定义,我们对于这一概念的理解只能从他对其他问题的论述得出。
周国光将配价(依存)语法定义为:“一种结构语法。
它主要研究以谓词为中心而构句时由深层语义结构映现为表层句法结构的状况及条件,谓词与体词之间的同现关系,并据此划分谓词的词类。
”(见沈阳,1995)这一定义基本反映了依存语法的实质和核心内容。
2024年机器翻译市场规模分析
2024年机器翻译市场规模分析概述机器翻译(Machine Translation,MT)是一种利用计算机技术实现自然语言之间的翻译的方法。
随着全球化的加速发展,跨国交流的需求越来越大,机器翻译市场也呈现出快速增长的趋势。
本文将对机器翻译市场的规模进行深入分析。
市场规模趋势根据市场研究公司的报告,机器翻译市场在过去几年中保持了强劲的增长。
根据数据预测,机器翻译市场规模将在未来几年内继续扩大。
以下是具体的市场规模趋势:1.年均增长率(CAGR):机器翻译市场的年均增长率达到了约XX%。
这表明市场呈现出稳定增长的态势。
2.市场价值:根据最新报告,机器翻译市场的价值在20XX年达到了XX亿美元。
预计到20XX年,市场价值将达到XX亿美元。
3.区域分布:目前,机器翻译市场的主要份额集中在北美地区,其次是欧洲和亚太地区。
然而,亚太地区的市场正在迅速增长,并有望在未来几年内超过北美市场。
4.应用领域:机器翻译在多个垂直领域得到广泛应用,包括旅游、电子商务、金融等。
其中,旅游和电子商务方面的需求增长最为显著。
市场驱动因素分析机器翻译市场的快速增长离不开以下几个关键因素的驱动:1.全球化需求:随着全球经济一体化的深入发展,跨国交流需求日益增长。
机器翻译能够提供快速、准确的翻译服务,满足跨国交流的需要。
2.技术进步:人工智能和自然语言处理技术的持续进步使机器翻译的质量不断提升。
机器翻译算法的改进和数据集的丰富化进一步推动了市场的发展。
3.成本效益:与传统人工翻译相比,机器翻译可实现更高的效率和更低的成本。
这使得企业和个人用户更愿意采用机器翻译服务,从而推动市场的增长。
市场挑战与机遇机器翻译市场在发展过程中也面临一些挑战,但同时也带来了新的机遇:1.语言多样性:不同语言之间的差异性使得机器翻译的任务具有挑战性。
由于语言结构、语法等方面的差异,对于一些语言的翻译质量仍然有待提升。
2.专业性需求:在某些专业领域,如法律、医疗等,对于翻译质量的要求较高。
翻译概论知识点整理
翻译概论知识点整理翻译是一项复杂而重要的跨语言交流活动,它在促进不同文化之间的理解、交流与合作方面发挥着至关重要的作用。
以下是对翻译概论中一些关键知识点的整理。
一、翻译的定义与类型翻译,简单来说,就是将一种语言(源语)所表达的内容用另一种语言(目标语)准确而完整地重新表达出来。
根据不同的标准,翻译可以分为多种类型。
从翻译的手段来看,可分为人工翻译和机器翻译。
人工翻译依靠译者的语言能力和文化素养,能够更加灵活、准确地传达原文的意义和风格。
机器翻译则借助计算机程序和算法,虽然速度快,但在准确性和灵活性上往往存在一定的局限。
从翻译的方向上,分为口译和笔译。
口译是即时性的,要求译者在短时间内理解源语并迅速转化为目标语进行表达,常见的有同声传译和交替传译。
笔译则有更多的时间进行思考和查证,对译文的质量和准确性要求更高。
从翻译的内容来看,有文学翻译、科技翻译、商务翻译、法律翻译等。
不同领域的翻译具有各自的特点和要求,需要译者具备相应的专业知识和翻译技巧。
关于翻译的标准,虽然众说纷纭,但大致可以概括为“信、达、雅”。
“信”指的是忠实于原文的内容,准确无误地传达原文的信息,不随意增减或歪曲。
“达”要求译文通顺流畅,符合目标语的语法和表达习惯,让读者能够毫无障碍地理解。
“雅”则强调译文要有文采,尽可能地再现原文的风格和韵味。
然而,在实际的翻译过程中,要完全达到这三个标准并非易事,需要根据具体的情况进行权衡和取舍。
比如,在科技翻译中,更注重“信”和“达”,而在文学翻译中,“雅”的要求可能会相对较高。
三、翻译的过程翻译不是简单的语言转换,而是一个复杂的思维过程。
首先是理解阶段。
译者需要对原文进行仔细的阅读和分析,理解原文的词汇、语法结构、语义以及背后的文化内涵。
这需要译者具备扎实的语言功底和丰富的文化知识。
然后是表达阶段。
在理解原文的基础上,译者运用目标语的词汇、语法和表达方式,将原文的内容重新呈现出来。
这要求译者能够熟练掌握目标语的语言规则,并具备灵活运用语言的能力。
binging翻译
binging翻译【原创实用版】目录1.binging 翻译的背景与概念2.binging 翻译的优势与应用场景3.binging 翻译的局限性与改进方向正文随着全球化的不断深入,语言翻译在各个领域中扮演着越来越重要的角色。
在众多的翻译工具中,binging 翻译以其强大的功能和便捷的操作赢得了广泛的关注和应用。
本文将从 binging 翻译的背景与概念、优势与应用场景、局限性与改进方向三个方面进行介绍。
一、binging 翻译的背景与概念Binging 翻译是微软公司开发的一款在线翻译工具,其前身为微软翻译。
它支持多种语言的实时翻译,并具有语音识别、图片识别等功能,方便用户在各种场景下进行翻译。
相较于其他翻译工具,binging 翻译以其强大的翻译能力和丰富的功能受到用户的青睐。
二、binging 翻译的优势与应用场景1.强大的翻译能力:binging 翻译采用了先进的神经机器翻译技术,翻译质量较高,可满足大部分用户的翻译需求。
2.多语言支持:binging 翻译支持超过 60 种语言的互译,覆盖了全球大部分国家和地区的主要语言。
3.实用功能:binging 翻译提供了语音识别、图片识别等功能,方便用户在各种场景下进行翻译。
例如,用户可以通过语音输入的方式进行实时翻译,也可以上传图片,让 binging 翻译识别图片中的文字并进行翻译。
4.应用场景广泛:binging 翻译适用于各种场景,如商务、旅游、学术研究等。
在商务领域,用户可以利用 binging 翻译进行跨语言沟通和合作;在旅游领域,用户可以通过 binging 翻译与当地人进行交流,解决语言不通的问题;在学术研究领域,用户可以利用 binging 翻译快速查阅外文文献,提高研究效率。
三、binging 翻译的局限性与改进方向虽然 binging 翻译具有很多优势,但仍存在一些局限性和需要改进的地方:1.翻译质量有待提高:虽然 binging 翻译采用了先进的神经机器翻译技术,但仍有部分翻译结果不够准确,需要人工校对。
大学实用翻译教程(英汉双向 )第三章 计算机辅助翻译
1.2计算机辅助翻译的发展前景展望
• 根据前面对机器翻译的介绍可以看出,自然语言的复杂性决定了机器翻译 技术发展的困难性。计算机语言学家提出了各种各样的机器翻译理论,但 目前为止还没有哪种理论能够有效的解决所有问题。但是,机器翻译系统 的应用领域正在发生变化。人们正在尝试将机译技术结合到信息访问、信 息提取和自动文摘中。这类跨语言应用在全球范围内越来越引起人们的兴 趣。未来对于口语的翻译也是市场迫切需求的,但尽管基于某些方面的需 求,机器翻译的发展方向更加多元化,但无论从实际应用角度还是从理论 研究角度来看,全自动的话语翻译还是很难实现的。当然,虽然机器翻译 的发展有诸多阻碍,但仍然有更多的发展希望。目前,单语语料库加工技 术以及应用在计算语言学领域内取得的成功,使建立双语或多语语料库并 进行多层次的加工作为大规模的跨语言资源成为研究的焦点之一。另外, 大规模的语料库适合于统计方法的应用,通过统计来自动进行知识获取, 有助于克服自然语言处理中知识获取的瓶颈。把机器学习方法应用到机器 翻译中,可以帮众系统实现在线学习功能,最终建立主动的智能翻译服务 也是机器翻译的发展方向之一。
1.1计算机辅助翻译的发展历程
• “机器翻译”的概念可以追溯到20世纪30年代,40-50年代初经历 了早期的尝试阶段,当时,大多数从事手工翻译人士对于“利用计 算机进行翻译”不以为然,他们根本就不相信翻译会机械化,少数 人则或多或少有一点担心,害怕有一天机器会把他们取而代之。 • 50—60年代中期学界对于“机器翻译”持高度乐观的态度。 Systran翻译软件将“机器翻译”定义为利用计算机软件把文本内 容从一种自然语言转换成另一种自然语言,这个定义就是说“机器 翻译”是利用语言结构、规律和把原文(the source language) 的语言结构转换成译文(the target language)的语言结构。“机器 翻译”这一想法产生的时间正是结构主义语言学的观点盛行时期。 由于人类对语言结构规律的研究越发深入,语言学家为翻译找到了 更多的理论依据作为支撑,从而给翻译加上了科学主义的色彩。奈 达、巴尔胡达罗夫以及彼得· 纽马克等人的翻译观都是从结构主义 理论开始的。(张治中,俞可怀,2002:54-58)结构主义者认 为在各种复杂的表面现象的下都有着一种普遍性的规律,这些规律 就是结构,人们通过分割归并作品的各种结构就可弄清语言信息变 成文艺作品的奥秘。(吕俊, 2001:96-111)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容提要
1、概述
2、机器翻译的产生与发展
3、机器翻译的困难
4、机器翻译研究现状
5、机器翻译基本方法
1 概述
有关专家已经指出,语言障碍是21世纪国际 社会全球化面临的主要困难之一; 机器翻译涉及语言学、计算语言学、认知科 学和数学等多种学科,具有重要的科学意义; 具有巨大的社会需求,以欧洲为例,有380多 种语言,2004年5月1日以前欧盟有11种官方 语言,每年为这11种语言翻译、转录文件耗 费的人力费用大约 549M 欧元。目前欧盟20 多种工作语言; 汉语已经不再仅仅是中国人关注的语言。
…… 几十种翻译!
4 机器翻译研究现状
若干翻译系统已实用化或接近实用化
• • • • Systran () TAUM-METEO / Google translator 华建翻译系统/ 有道翻译系统/金山词霸 等
仍面临若干问题
理论模型与方法 实现技术问题 用户认识问题
(/china/2010-12/14/content_11698022.htm)
部门应该进行严密的付款关连的检查保证民工薪水没 有被延迟,没有说Yin Weimin,人力资源和社会保 险的大臣。
4 机器翻译研究现状
有道(Youdao)翻译系统
(/) The departments should conduct strict payment-related inspections to ensure migrant workers pay is not delayed, said Yin Weimin, the Minister of Human Resources and Social Security.
-《生活报》1994. 11. 13. 第六版
3 机器翻译的困难
奇怪的翻译:
(1)馒头: steamed bread Mantou
(2)夫妻肺片:Husband and wife’s lung slices Fuqifeipian (3)童子鸡:Young lad chicken Boy chicken without sexual life spring chicken
(/china/2010-12/14/content_11698022.htm)
各部门要进行严格的支付相关的检查,以确保民工工 资不拖延,尹蔚民说,人力资源和社会保障部部长。
4 机器翻译研究现状
SYSTRAN 系统的实际水平
(/index.html) The departments should conduct strict payment-related inspections to ensure migrant workers pay is not delayed, said Yin Weimin, the Minister of Human Resources and Social Security.
概念:机器翻译 (machine translation, MT) 是用计 算机把一种语言(源语言, source language) 翻译成 另一种语言(目标语言, target language) 的一门学 科和技术。
机器翻译 MT 源语言 (SL) 目标语言(TL)
2 机器翻译的产生与发展
n 为句子中介词短语的个数。
3 机器翻译的困难
语义歧义
他说:“她这个人真有意思(funny)”。她说: “他这个人怪有意思的(funny)”。于是人们以为他 们有了意思(wish),并让他向她意思意思(express)。 他火了:“我根本没有那个意思(thought)”!她也生 气了:“你们这么说是什么意思(intention)”?事后 有人说:“真有意思(funny)”。也有人说:“真没意 思(nonsense)”。
- 文学翻译家 David Hawkes 摘自冯志伟著《机器翻译研究》, 2004
4 机器翻译研究现状
Google翻译系统
(/#en|zh-CN|) The departments should conduct strict payment-related inspections to ensure migrant workers pay is not delayed, said Yin Weimin, the Minister of Human Resources and Social Security.
I saw a man with a telescope in the park. ?
3 机器翻译的困难
我们将歧义组合数称为凯塔兰数(Catalan Numbers), 记作 Cn:
2n 1 Cn n n 1
其中: 2n
(2n)! n n!n!
1000
汉英两大强势语言的自 Spanish 动翻译问题是人类语言技术 Hindi/Urdu 500 English Arabic 300 Portuguese 中最具挑战性的研究课题! Japanese
100 0
French
1950 1970 1990 2010 2030 2050
(Year)
2 机器翻译的产生与发展
3 机器翻译的困难
We do chicken right.
(1) 我们做鸡是对的。 (2) 我们做鸡正点耶。 (3) 我们就是做鸡的。 (4) 我们有做鸡的权利。 (5) 我们只做鸡的右边。 (6) 我们可以做鸡,对吧! (7) 我们行使了鸡的权利。 (8) 我们只做右边的鸡。 (9) 我们主张鸡权。 (10)我们公正地做鸡! (11) 我们要把鸡打成右派。 (12) 我们做鸡肉权利。 (13) 我们还是做鸡好。 (14) 我们用正确的方法炸鸡。 (15) 我们做鸡有理! (16) 我们让鸡向右看齐. (17) 我们肯定是鸡,对! (18) 我们做的鸡才是正宗。
5 基本翻译方法
直接转换法 基于规则的翻译方法 基于中间语言的翻译方法 基于语料库的翻译方法 - 基于事例的翻译方法 - 统计翻译方法
5 基本翻译方法
直接转换法
从源语言句子的表层出发,将单词、短语或句 子直接置换成目标语言译文,必要时进行简单的词 序调整。对原文句子的分析仅满足于特定译文生成 的需要。这类翻译系统一般针对某一个特定的语言 对,将分析与生成、语言数据、文法和规则与程序 等都融合在一起。例如:
2 机器翻译的产生与发展
概括为三个阶段:
1954 ~ 1970 (ALPAC):草创时期;
1970 ~ 1976:复苏阶段;
1976 ~ 现在:繁荣时期。
3 机器翻译的困难
3 机器翻译的困难
自然语言中普遍存在的歧义和未知现象
句法结构歧义/词汇歧义/语用歧义 „
新的词汇、术语、结构、语义 „
1 概述
(Million)
Chinese
1000
Spanish English
500 300
Hindi/Urdu
Arabic
100 0
1950 1970 1990 2010 2030
Portuguese Japanese French (Year)
2050
1 概述
(Million)
Chinese
I like Mary. Me(I) gusta(like) Maria(Mary). X like Y Y X gusta
5 基本翻译方法
基于规则的翻译过程分成六个步骤: (a) 对源语言句子进行词法分析 (b) 对源语言句子进行句法/语义分析 (c) 源语言句子结构到译文结构的转换 (d) 译文句法结构生成 (e) 源语言词汇到译文词汇的转换
译中都会遇到。 不同语言之间文化的差异
现有方法无法表示和利用世界知识和常识
机器翻译的解不唯一,而且始终存在的人 为的标准
3 机器翻译的困难
困难之一:大量歧义(ambiguity)现象 词法歧义
例如: (1) I’ll see Prof. Zhang home.
(2) 自动化研究所取得的成就。 自动化/研究所/取得/的/成就/。 自动化/研究/所/取得/的/成就/。
Weaver 的两个基本观点:
(1) 翻译类似于解读密码的过程:当我阅读一 篇用俄语写的文章时,我可以说这篇文章 实际上是用英文写的,只不过它用另外一 种奇怪的符号编了码,当我阅读时,我是 在进行解码;
2 机器翻译的产生与发展
(2) 原文和译文“说的是同样的事情”,因此, 当把语言A 翻译为语言B 时,就意味着, 从语言A 出发,经过某一“通用语言 (universal language)” 或“中间语言 (interlingua)”,然后转换为语言B,这种 “通用语言”或“中间语言”可以假定是 全人类共同的。
?
3 机器翻译的困难
(3) 门把手弄坏了。 门/ 把/ 手/ 弄/ 坏/ 了/ 。 ? 门把手/ 弄/ 坏/ 了/ 。 (4) 打扫平板罚款10元。 打[扫平板]罚款10元。
3 机器翻译的困难
结构歧义
(1) 喜欢乡下的孩子。 (2) 关于鲁迅的文章。 (3) 今天中午吃馒头。 (4) 今天中午吃食堂。 (5) 今天中午吃大碗。 (6) 今天中午吃了闭门羹。
机器翻译不仅仅是字符串的转换
不同语言之间文化的差异
现有方法无法表示和利用世界知识和常识
机器翻译的解不唯一,而且始终存在的人 为的标准
3 机器翻译的困难
自然语言中普遍存在的歧义和未知现象
句法结构歧义/词汇歧义/语用歧义 „
几乎自然语言处理中 新的词汇、术语、结构、语义 „
的所有问题在机器翻 机器翻译不仅仅是字符串的转换
(/china/2010-12/14/content_11698022.htm)