基于汉英双语语料库的翻译等价单位自动获取研究

合集下载

一种矩形编码与行程编码相结合的图像压缩方法

一种矩形编码与行程编码相结合的图像压缩方法
7 2
计 算机应 用 与软件
o eANLP,a a e e 1 9 ft h Jp n s , 9 9.
21 0 2牟
到质量较高 的汉语短语。进而在平行 语料 库基础上使 用了词语 和短语对齐工具 , 抽取汉英短语对 。然后通过取汉语短语交集 、 使用英语停用词 、L L R和上下文熵来进一步过滤 , 实现了短语 对
d c r a T a se fr L mi d u e s nd r n fr o a i t Do i T a sai n e man r n lt Ap lc t n o piai o
像素个数有 限 , 同一相同像 素存 储多次 , 使 造成空 间浪费 ; 对于 矩形编码 , 如果将 一个像素点作 为矩形块 , 需要耗 费很 多时 间, 压缩率也不高 , 分解 至 一定 的子 块 ( 若 多于 一个像 素 ) 止 分 停 解, 则将会使 5]D n o gagB re HMM WodadP rs l n et r t s e g ngn ,y Y u W. r n haeAi m n a — g o f Sf
有产生反膨胀 ; 对于不复杂的图像 b c d 又要 比单独采 用行程 ,,,
编码压缩的好。
采取矩形编码与行程编码结合 的压缩方法压缩不仅解决 了
[ ]/ C ,97 3 0 35 C / A L 19 : — 6 . 6
[7]WuD Sohscivro asutnga as n in a prig . t at es nt ndci rmm r adbl gl as c in i r o iu n
讯 ,0 3 1 ( ) 2 0 ,3 5 .




( 接第 6 上 8页 )

基于语料库的翻译教学研究

基于语料库的翻译教学研究

基于语料库的翻译教学研究
随着全球化的加速以及中外交往的不断增强,中文翻译已成为最为重
要的跨文化交流方式之一。

然而,在中文翻译教学中,传统的课堂教学方
法难以满足日益增长的翻译需求。

随着互联网和计算机技术的飞速发展,
语料库翻译成为一种新的翻译教学方式,为学生提供了更为实用和高效的
翻译实践经验。

语料库翻译是指利用大规模的平行语料库来进行翻译学习,通过分析
语料库中的句子构造、单词搭配、语法结构等,让学生了解不同语言之间
的差异和奥秘,从而提高其翻译技能。

与传统的翻译方法相比,语料库翻
译具有以下几个优点:
1.实用性强。

语料库翻译能够迅速提供学生所需的大量平行语料库,
使学生能够更好地了解翻译的实际应用情况,提高其翻译水平和适应能力。

2.掌握语言的特点和规律。

通过对语料库的分析,学生可以更好地掌
握词语的搭配和使用规则,从而更准确地把握翻译的精度和流畅度。

3.提高效率。

语料库翻译可以快速地进行批量翻译,并且能够自动检
测翻译的准确性和合理性,同时还能提供更详细的反馈和纠错建议,以帮
助学生快速修正错误。

由此可见,语料库翻译教学不仅可以提高学生的实际翻译技能,还可
以更好地帮助学生了解语言的规律和特点,从而更好地应对复杂多变的翻
译任务。

因此,未来中文翻译教学应该更多地融合语料库翻译的方法和技术,以更好地培养具有实际应用能力和创新潜力的翻译人才。

基于双语平行语料库的翻译教学研究

基于双语平行语料库的翻译教学研究

基 于 双 语 平 行 语 料 库 的 翻 译 教 学 研 究
李 高新
( 吉首大学 国际交流与公共外语教育学院 湖南吉首 460 ) 100

要: 双语 平行语料 库在 2 0世纪 9 O年代受到重视并广泛建立 , 对语言对 比研究 以及包括 自动翻译在 内的翻译教 学和双语 词典 的编 撰具 有重 要意义。双语平行语料库在 翻译教学 中的应用 主要 体现 在词汇 、 句子和语篇三个层次上 。
Abl _嚏 : e t at n in Wa o u e n b l g a r l l o pu n Swi e ra e n t e 1 9 s I h s ge ti i a in e h Gr a te t S f c s d O in u l al r s a d wa d l c e td i h 9 0 . t a r mpl t si t o i pa e c y a c o n h
rs a c fln a ec r s ,ta lto e c n n ldi ut m a i rnsa i ,a d t o pi to fbiig ldc in r e e rh o a gu g ontat rnsa in t a hig icu nga o tc ta lton n hec m l in o l ua ito a y. a n
第 1 0卷
第 1期












V01 O NO. . 1 1 Fe . 01 bn l f Ch n z o c t n lCo e e o n o ma in Te h o o y o r a a g h u Vo a i a U g f I f r t c n l g o o o

自建英汉双语语料库在大学英语翻译教学中的应用研究

自建英汉双语语料库在大学英语翻译教学中的应用研究

之 间 的 差 异 , 行 翻译 语 料 库 的 对 比语 言 研 究 , 培 养 学 生 的 进 以 研 究 性 学 习 能 力 , 建 一 种 有 效 的 、 行 的 、 创 意 的 翻 译 教 创 可 有
学模式。 2英 汉 双 语 语料 库 的构 建 . 语 料 库 作 为 一 种 辅 助 性 工 具 应 用 于语 言教 学 ,是 应 用 语 言 学 中 一 个 新 兴 的 研 究 领 域 。语 料 库 收集 了 大 量 真 实 的 语 言 材 料 , 用 先 进 的 检 索 软 件 . 于 翻 译 教 学 大 有 益 处 , 得 对 运 对 使 数 量 庞 大 的 语 言 数 据 进 行 快 速 分 析 成 为 可 能 ,并 能 同 时 推 动 学 生 的 自主 学 习 。 先 , 料 库 为翻 译 教 学 提 供 了一 种 新 的方 首 语 法 。 对 于 老 师 来 说 , 料 库 使 获 取 教 学 材 料 的 效 率 大 为提 高 , 语 在 基 于 语 料 库 的翻 译 课 堂 上 , 师 扮 演 着 学 习指 导 者 的角 色 。 老 对 于 学 生 来 说 ,一 种 强 调 探 寻式 学 习使 得 学 习 过 程 变 得 生 动 有 趣 , 而使 学 生 更 加 积 极 地 参 与 , 发 学 生 的 主 动 性 并 且 提 从 激 高 学 习 效 率 , 过 探 寻 的 过 程 , 中获 得 一 种 自我 实 践 之 后 的 通 从 成就感 。 () 1 语料 库 原 始语 料 来 源 的 选择 。
础 和 翻译 潜 力 ,但 在 实 际 的 英 语 类 考 试 如 大学 英 语 四六 级 考 试 中翻 译 部 分 得 分 率 很 低 ,教 师 在 课 程 讲 授 过 程 中 很 少 甚 至

双语语料库在英汉翻译中的应用.doc2

双语语料库在英汉翻译中的应用.doc2

双语语料库在英汉翻译中的应用外语学院09.3班侯义茹摘要:本文介绍双语语料库的发展历程和现状及其研究价值,阐述了基于双语语料库的英汉翻译教学及研究,讨论了计算机辅助翻译的重要性和应用。

随着国与国之间密切的往来,语言获得日新月异的发展,双语语料库也以其大量的对译材料为语言和翻译研究提供了新途径,基于双语语料库开展的英汉翻译研究日益广泛和实用。

关键词:双语语料库;翻译研究;教学;语言交流The Usage of Bilingual Corpus in English - ChineseTranslationHou Yiru Class 3, Grade 09 Foreign Language DepartmentAbstract:This paper introduces the development and value of bilingual corpus. At the same time, it tells us English - Chinese translation studies based on bilingual corpus and it discusses the importance and application of computer-aided translation. With the intimate contractions between countries, languages develop day by day, so bilingual corpus open up a new way to language and translation studies. English - Chinese translation studies based on bilingual corpus is wide and practical.Key words:bilingual corpus,translation studies,teaching,language exchange一、引言“语料库几乎在语言学所有的领域引发了一场革命”。

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——论文摘要指以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。

(国家标准GB 47) 学术论文摘要概括论文的主要信息,对研究的目的、方法、结果和最终结论有一个比较完整的说明,对于论文的发表、收录、检索及科研人员的学术交流等起着重要的作用。

当今时代,英语已成为国际交往的世界性语言,英文学术论文摘要的重要性日益显现。

近年来,不少中外学者(如Swales1990、段平2002、滕延江2008、邓军涛2013 等) 对论文摘要的语言特点与翻译进行了比较广泛深入的分析,其成果无疑有利于该领域的实践与发展。

然而,大多数相关研究都是基于研究者个人的经验,选取的例句和掌握的语料比较有限。

不少学习者和研究人员撰写及翻译摘要的能力还比较欠缺。

鉴于此,本课题组决定建设学术期刊论文摘要汉英双语语料库,一方面从大的语料基础上客观描述英文摘要的文体特征和进行汉英翻译研究,同时将该语料库用作翻译教学平台,试验并总结数据驱动的教学方法,推动学术研究与翻译教学共同发展。

一、学术期刊论文摘要汉英双语语料库的建设(一) 语料库与双语语料库语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库(杨惠中,2002) 。

语料库具有语料真实、丰富、代表性强以及融合了计算机技术等特点,在语言研究和教学方面具有较大的优势与应用价值。

按照语料的语种,语料库可以分成单语、双语和多语语料库。

双语和多语语料库还可分为平行语料库和可比语料库。

平行语料库收集原文与译文双语对照的文本,按设定的标准对语料进行句子或段落的对齐。

可比语料库收集具有可比性的语料,分别放置于不同的文本库,主要用于语言对比研究。

关于双语语料库的作用,不少专家从不同角度进行了探讨。

基于Babel英汉平行语料库的英汉介词对比分析

基于Babel英汉平行语料库的英汉介词对比分析

基于Babel英汉平行语料库的英汉介词对比分析王磊;许霄羽【摘要】介词是英汉两种语言中较为特殊的一类词,在实际使用中都非常活跃。

通过对英汉介词的简要阐述,在以前的研究基础上,尝试基于Babel英汉平行语料库,对其中出现频率最高的前十个英语介词和汉语介词的使用频率,兼类情况及其对应关系做以对比分析,以期对英译汉中的介词翻译能有所启示。

另外,介词在英译汉时可以采取直译、增译、省译和转译四种方法。

%Preposition is a type of extraordinary words with very active use. By general introduction to English and Chinese prepositions, based on the previous studies, this paper tries to make use of Babel English-Chinese Parallel Corpus and make a contrastive analysis on the frequency, multiple part of speech and the corresponding relationship between the top ten English and Chinese prepositions, hoping it could shed light on our English-Chinese translation. Moreover, the author points out that we can adopt four methods in doing such translation practice,including literal translation,addition, omission and conversion.【期刊名称】《辽宁医学院学报(社会科学版)》【年(卷),期】2015(000)002【总页数】4页(P126-128,132)【关键词】平行语料库;英语;汉语;介词对比【作者】王磊;许霄羽【作者单位】西北工业大学,陕西西安 710129;西北工业大学,陕西西安710129【正文语种】中文【中图分类】R194英语介词通常可以根据位置来判断,而汉语介词则主要依据其作用加以区别。

基于语言模型的中英文翻译研究

基于语言模型的中英文翻译研究

基于语言模型的中英文翻译研究随着全球化的推进,跨国交流愈发频繁,而语言交流是沟通的基础。

然而,由于不同地区的语言和文化差异,语言交流难免会遇到一些难题,尤其是在翻译上。

针对这个问题,自然语言处理和机器翻译技术的发展为翻译提供了一种新的思路。

其中,基于语言模型的中英文翻译成为了研究热点。

什么是语言模型?语言模型是自然语言处理中的重要研究内容之一,主要用于计算概率分布,表示自然语言中的词序列。

具体而言,它通过对语言现象的观察来推断语言的统计规律,并将这些规律用数学模型进行描述,从而给出某个语言序列出现的概率。

在实际应用中,语言模型可以用于词语预测、自动翻译、语音识别等方面。

其中,基于语言模型的机器翻译已经成为社会关注的热门领域。

接下来,我们将以中英文翻译为例,介绍基于语言模型的翻译模型及其应用。

基于语言模型的中英文翻译架构基于语言模型的中英文翻译模型的架构主要包括三个部分:前处理、翻译模型和解码器。

其中,前处理负责分词、词性标注、对齐等任务;翻译模型使用双语语料库进行训练,构建源语言和目标语言之间的概率转移模型;解码器负责由已训练好的模型生成目标语言句子。

在具体实现中,中英文句子经过前处理后,进入翻译模型。

翻译模型的最终目标是尽可能高效地计算源语言和目标语言之间的概率转移。

为此,翻译模型通常使用基于词典、短语和句法树等不同层次的知识表示方法。

这些层次的知识表示方法之间的互动,能够有效地解决单层次翻译模型所存在的局限性,提高翻译的准确性和流畅度。

接下来,解码器用于生成目标语言句子。

在该过程中,解码器将翻译模型生成的概率转移模型应用于源语言句子的不同部分,并根据最大概率选择最优匹配的目标语言单词。

随之而来的问题是,在翻译过程中如何避免诸如语法和词语歧义等本质性的错误。

这个问题的解决在一定程度上归结于随机漫步和束搜索算法的运用。

当解码器无法生成一个类似源语言文本的目标语言句子时,随机漫步算法可以帮助解码器得到具有启发性的解,而束搜索算法则可以更加高效地集中搜索器的时间和空间资源以改善算法性能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A bs r c : M o e a d m o e r s a c r v ec g z d t otnta a u ft e pa a l lc r usi ta t r n r e e r he sha e r o nie he p e i lv l e o h r le o p n t e e e r h o a hi e h r s a c n M c n Tr n l to n M a h ne A i e a s ai n. Thi p r e a i e o t a sa i n a d c i d d Tr n l to s pa e x m n s h w he ta l to q v l t a r o l xta t d fo a al l c r u . A n ie a i e a g rt r nsa i n e ui aen p is c u d be e r c e r m p r le o p s tr tv l o hm a e n i b sd o


引 言
中 获 取 双 语 词 典 的 研 究 是 十 分 有 意 义 的 ,大
双 语 词 典 是 基 于 规 则 机 器 翻 译 系 统 的 一
规 模 双 语 语 料 库 不 但 为 双 语 词 典 自动 或 半 自
动 构 建 提 供 了 一 个 可 靠 的 基 础 ,还 在 以 下 两 点上有 助 于词 典质量 的提 高 : ( )利 用 双 语 语 料 库 提 取 双 语 词 典 ,有 利 1 于 保 证 所 提 取 的源 语 言单 词 及 其 目标 译 词 具有 真 正 的 翻译 等 价 关 系 。 长 期 以来 ,许 多 实 用 机 器 翻译 系统 ,为 了迅 速 扩 充 词 典 ,大 多尽 可 能
取 翻 译 等价 单 位 。本 文 还 对 不 同 的 关联 度 量 方 法进 行 了对 比 , 提 出利 用 范畴 假 设 改进 抽 取 算 并
法 的效率。
Ex r c i fTr s a i ta t on o an l t on Equial tPai r v en r fOm s
h p h ss — t si pp o c i u e t x r c h Chi e e — Eng ih Tr n l to Equ v l ntPa r . y ot e i e tng a r a h s s d o e ta tt e ns ls a s a i n i a e is W e lo m a e c m p rs n b t e if r n t tsi a s o i to e ur m e nd pr po e o us a s d o a io e we n d fe e t sa i t l a s c a i n m as e nta o s d t e c c t g rc lh po h s s t mpr v h ro m a e o x r c i n. a e o a y t e i o i i o e t e pe f r nc f e ta to
些 语 文 性 或 百 科 性 词 典 的 预 期 用 户 是 人 , 功 能 定 位 一 般 是 辅 助 语 文 教 学 和 外 语 理 解 。 在 这 种 定 位 下 , 双 语 词 典 中更 多 关 注 的 是 如 何 用 目标 语 言 定 义 一 个 源 语 言 单 词 , 而 不 是 提 供 源 语 言 单 词 的 等 价 目标 语 译 词 。 然 而 对 于 机 器 翻 译 而 言 ,把 一 个 源 语 言 单 词 译 作 其 目 标语 言定义往往 是不合适 的。 ( )利 用 双 语 语 料 库 提 取 双 语 词 典 ,有 利 2 于 扩 大 提 取 翻 译 单 位 。 长 期 以来 ,机 器 翻 译 默 认 词 为 语 言 翻 译 的 基 本 单 位 。但 是 ,从 翻 译 人 员 的 翻 译 实 践 来 看 ,仅 仅 把 词 作 为 翻 译 单 位 并 不 合 适 , 一 些 多 词 组 合 或 搭 配 在 特 定 的 语 言 环 境 中 , 往 往 需 要 作 为 一 个 整 体 来 进
Chi e e ・ En i h Par l n s - - gl s al Cor u el p s
CHAiG o a 、 Ba b o
Ke ywo ds bii g lc r us ta s a i n e ui a e tpar a o tc e ta to fTEPs r : ln ua o p , r n l to q v l n i, ut ma i x r c i n o
个 关 键 部 件 。 为 了 能 够 合 理 覆 盖 真 实 语 言 文 本 ,一 个 实 用 的 机 器 翻 译 系 统 ,动 辄 需 要 数 十 万 双 语 词 条 , 编 纂 、维 护 双 语 词 典 的任 务 十 分 艰 巨 。 大 规 模 双 语 词 典 的 构 建 始 终 是 限
维普资讯
基 于 汉英 双 语 语 料 库 的

早 隹
常 宝宝 ( 京 大 学 ) 北


关键词 : 语语料库 ; 译等 价单位 ; 双 翻 翻译 等 价 单 位 抽 取 摘 要 : 语 语 料 库 在 机 器翻 译 或机 器辅 助 翻 译 研 究 中 的 重要 作 用 已经 越 来越 多地 得 到 研 双 究人 员 的认 可 。本 文探 讨 了如 何 利 用 汉 英 双 语 语 料 进 行 汉 英 翻 译 等 价 单 位 的抽 取 , 出 了基 于 提 词 语 关联 度 进 行 多词 组 合 单 位 的识 别 方 法 ,并 利 用假 设 一检 验 的 方 法 , 汉 英 双 语 语 料 库 中抽 在
d g e fwo d a s c a i n i r p s d t de tf h li r e r e o r s o i to s p o o e o i n iy t e mu two d unisf r Chi e e a g ih.Th n a t o n s nd En ls e
制 一 些 实 验 系 统 走 向 实 用 的 瓶 颈 性 问 题 自动 构
建 是 一 条 必 经 之 路 ,从 大 规 模 双 语 真 实 语 料
利 用 已经 存 在 的机 器 可 读 词 典 。然 而 ,通 常 这
维普资讯
相关文档
最新文档