美国当代英语语料库 COCA 使用介绍
COCA与《中式英语之鉴》

COCA与《中式英语之鉴》作者:岑秀文张尚莲姚爽孙乃荣来源:《现代商贸工业》2015年第18期摘要:基于教学实践,从词语搭配方面,部分描述以当代美语语料库(COCA)为工具,对平卡姆女士杰作《中式英语之鉴》译例修改稿的查证结果。
实践表明,COCA和《中式英语之鉴》结合使用,能够很好克服中式英语现象,同时也能辩证使用这一汉英翻译领域极具参考价值的力作。
关键词:当代美语语料库;《中式英语之鉴》;搭配;结合使用;学生验证举隅中图分类号:G4文献标识码:A文章编号:16723198(2015)180151021 问题的提出美国当代英语语料库(Corpus of Contemporary American English,COCA)是Mark Davies 教授开发的高达3.6亿词汇的美国最新当代英语语料库,也是当今世界上最大的英语平衡语料库,可以免费在线使用。
自2008年上线以来,越来越多英语教师和学习者从COCA的知识海洋中受益。
《中式英语之鉴》(以下简称《中》)由中美资深翻译专家联手打造(姜桂华老师审校),众多业内知名人士倾情推荐,同时作为多年来北京外国语大学考研参考书目,该书在业界的权威性和认可度可见一斑。
作者琼·平卡姆女士毕生从事翻译工作,曾先后在中国外文出版社和中央编译工作过8年,专门给中国译者修改润饰英译文。
她在书中理论与实践紧密结合,将大量典型中式英语实例分门别类、逐一修改并加以分析。
河北工业大学2010级英语专业“英汉对比与翻译”课程部分以《中》为教材进行教学,同时用COCA进行辅助学习。
身为地道美国人的作者平卡姆于书中针对中式英语存在的问题提出修改建议,虽然在很多时候都对其改译本进行了详细的解释说明,但英语毕竟不是中国学习者母语,教学中我们发现学生对教材的修改建议仍然存在很大的困惑甚至怀疑,于是借助COCA这一强大的数据驱动工具来相互补充和验证,效果令师生满意。
正如佟颖同学所说,在学习《中》时,COCA帮了很大的忙,书中很多的改动都跟我们现实中的用法非常违背,而COCA则恰好能够支持书中的结论。
英语词汇库网站

1.打开浏览器,输入网址:/coca/2.进入后点击 enter 键3.注册输入自己的电子邮箱,和密码,然后按 register键进入注册页面,选择自己的名字,邮箱和密码,同时还要选择自己属于研究者还是学生,大家可以选择 student(undergraduate)然后点击 submit 就可以提交自己的材料了。
4.查询最左边界面上是查询界面(1)查询界面最上面一列DISPLAY是查询结果的显示方式,可以选择LIST—列表显示, 也可以选择CHART—图表显示,COMPARE—单词比较,以及KWIC—按照字母排序。
LIST, 是该语料库默认的显示方式。
当我们需要查询一个单词的用法或者与它相关的搭配是可以直接在WORDS一栏输入所要查询的词汇。
例如,我们要查询independent的用法,可以直接输入。
右上方会出现这个对话框。
之后点击INDEPENDENT就可以查询到它的具体用法。
随着鼠标的移动刚才那个对话框就会变小,左边的对话框也会变小,界面上主要显示的就是有关independent的例句。
CHART,按照图表来显示这个词在某个方面的使用频率。
(2)SEARCH STRING字串查询在这个界面中,COLLOCATE 和POS LIST后面的选项都是被隐藏的,把光标放在这两个选项上面,点击后面的选项就会出现。
COLLOCATES这里面可以输入你所要查询的搭配POS LIST 是词性列表其下拉框中共有39中词性,也包括了一些标点符号。
例如我们要查找与independence搭配的常见动词,可以再POS LIST 下拉框中选择动词,就会发现与independence 最常见的搭配的是declare, gain, achieve, maintain等。
可以点击每个单词查看它的例句。
这样就能有效地帮助大家避免搭配上的错误。
POS LIST下面的选项框是隐藏的,拉开后下面有39词性分类,其中包括标点符号。
(3)SECTIONS 语料库分区通常情况下语料库的默认状态为IGNORE,即忽略语料库和时段的分类,所有语料库中查询。
COCA语料库对英译汉语新词的实证性研究——以《新世纪英汉大词典》(第二版)为例

COCA语料库对英译汉语新词的实证性研究——以《新世纪英汉大词典》(第二版)为例摘要:本文借鉴巴斯奈特文化翻译观理论,以回译、意译和直译等三种汉语新词英译原则为标准,以外研社新出版的《新世纪英汉大词典》(第二版)中的19个英译汉语新词为例,在COCA语料库中对这些词进行检索分析,并结合英语国家的权威媒体报道和词典综合考量,探讨其译法在英语国家的可接受度和合理性,对英译汉语新词进行科学实证,提高英译汉语新词的准确性。
关键词:新世纪英汉大词典(第二版);英译汉语新词;COCA;科学实证COCA Corpus Empirical Research about English Translation of Chinese Neologisms ——Take the New Century English-Chinese Dictionary (Second Edition) as an ExampleAbstract:This article based on the theory of cultural translation of Bassnett and followed the principles of reductive translation, significant translation and direct translation of Chinese neologisms.Nineteen Chinese neologisms in the New Century Chinese-English Dictionary (second edition) published by CNP were tested by COCA corpus. It combined authoritative media reports and dictionaries in English-speaking countries to meke a scientific demonstration of English translation of Chinese neologisms and improve its accuracy.Key Words:New Century English-Chinese Dictionary (Second Edition); English translation of Chinese neologisms;COCA; Scientific Demonstration1 引言词汇是语言要素中变化最快的一个。
基于COCA语料库的英语近义词对比研究——以Leak和Leakage为例

2024年第1期现代商贸工业Modern Business Trade Industry基金项目:西安石油大学2021年度研究生教育综合改革研究与实践课题 石油特色翻译课程案例教学模式研究及案例库建设(2021-X -YJG -020)㊂作者简介:陈佳鑫(1997-),女,硕士研究生,研究方向:笔译㊂基于COCA 语料库的英语近义词对比研究以Leak 和Leakage 为例陈佳鑫㊀高鹏鹏(西安石油大学外国语学院,陕西西安710000)摘㊀要:美国当代英语语料库COCA (Corpus of Contemporary American English )由美国杨伯翰大学Mark Davies 教授开发,是当今世界上最大的英语平衡语料库,库容量超过10亿单词的美国英语语料库㊂英语词汇中存在着在数量众多的词义相近的词汇,在石油科技类文本的翻译过程中,为了确保译文用词准确,借助COCA 语料库其广泛的语料范围,再现目的语母语者的真实使用情况,为学者们研究近义词的辨析理解提供了极其有效的帮助㊂本次将以Leak ㊁Leakage 为例,借助COCA 语料库对其从词频㊁语域㊁搭配和这三方面来进行对比分析,研究两者之间的区别㊂关键词:COCA 语料库;近义词;语域;搭配中图分类号:F74㊀㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀㊀㊀doi:10.19311/ki.1672-3198.2024.01.0181㊀研究设计1.1㊀研究问题Leak 和Leakage 在COCA 语料库中的用法研究㊂1.2㊀研究工具COCA 在线语料库1.3㊀研究步骤在COCA 语料库中分别搜索Leak 和Leakage 在不同语域中的词频差异和二者的搭配进行分析㊂2㊀基于COCA 语料库的Leak 和Leakage 对比分析2.1㊀语域对比研究语域 这一概念由Raid 在1956年研究双语现象时提出,后经Halliday 等人进一步完善,语域理论成为系统功能语言学的核心理论㊂语域是指人们在实际的语言交流活动中,由于所从事的职业差异,或由于对话的场景㊁对象㊁所处地点㊁话题等的不同,反映为语言的不同语体风格而产生的一种语言变体㊂表1㊀Leakage 在COCA 语料库中的不同语域的分布情况Section All Blog WEB TV /M SPOK FIC MAG NEWS FREQ143815913966756230262WORDS(M)993128.6124.3128.1126.1118.3126.1121.7PER MIL 1.45 1.24 1.120.520.590.52 2.400.51表2㊀Leak 在COCA 语料库中不同语域的分布情况Section All Blog WEB TV /M SPOK FIC MAG NEWS FREQ 87531028922161116709181209911WORDS(M)993128.6124.3128.1126.1118.3126.1121.7PER MIL 8.817.997.4212.5813.247.769.597.48㊀㊀因此,在进行近义词的比较研究时,语域研究是必不可少的一部分,这对辨析近义词具有极其重要的指导作用㊂近义词在不同语域下的用法有显著区别,使用COCA 语料对两个词的语域进行对比分析后,就能清楚地掌握它们的使用区别㊂通过在COCA 语料库中List 板块检索中我们可以看出,Leak 的使用频率高达8000多次,而Leakage 的使用频率仅有1000多次,两个词的使用频率相差了6倍多㊂前者的使用频率远高于后者,说明其适用的语域更广㊂Leakage 在学术期刊中出现的频率最高为573次,作为书面语在学术期刊和杂志中的使用频率远高于其他语域,这可以说明在特定语域中其的正式程度高于Leak㊂㊃35㊃现代商贸工业Modern Business Trade Industry2024年第1期值得注意的是Leak在演讲中使用频率最高,较口语化,除学术期刊外其他语域的使用频率均高于Leak-age,不同于前者的极端使用现象,Leak在各语域使用频率较为均衡㊂2.2㊀搭配差异对比研究搭配是指在文中实现一定的非成语意义,并按一定的语法形式因循组合而使用的一系列词语㊂词语搭配的学习对于习得者来说词汇量的提升作用和指导意义都很大㊂我们可以通过搭配词之间的Mutual Information Value(互相信息值),MI值越大则两个词搭配的频率越高㊂在COCA语料库 SEARCH 界面中Word一栏中搜索Leak和Leakage,并在Collocats中查询Leakage和名词条件下的Leak的搭配词,本次将最低MI值设为3,选取排列前10的搭配词,按照降序排列,借此来了解词的搭配频率,并由此分析出搭配词的特点:表3㊀Leak在COCA中搭配一览表序号MI+NOUN MI+ADJ MI+VERB MI+ADV 19.39perilymph9.15cerebrospinal8.35caulk 6.29catastrophically 28.83coolant7.87Intra-abdominal7.71spring 5.71harmlessly 38.43tritium7.86plagued7.44dowse 5.07disastrously 48.22earmold7.83Solid-fuel7.40plug 4.62poignantly 57.91ductwork7.80unaired 6.99depressurize 4.51skeptically 67.89mooch7.65Non-flammable 6.96jeopardise 4.22perilously 77.80pneumothorax7.58gushing 6.61cork 4.18gleefully 87.83cleanout7.17classified 6.53unclip97.78toiler7.16Out-of-context 5.93purvey107.58clotting7.10unsourced 5.85entomb表4㊀Leakage在COCA中搭配一览表序号MI+NOUN MI+ADJ MI+VERB MI+ADV 111.75disaggregation12.12circumferential10.01grain8.10catastrophically 211.62perilymph11.37carbon-intensive9.50treble8.00unacceptably 311.49fluorescein11.06sectoral8.53feminize 6.49oft 410.70transaminase10.75refrigerant8.52turbocharge 6.38onwards 510.56Post-processing10.67pre-event8.51miniaturize 6.07surgically 610.42stoma10.62unaccounted-for7.68disclaim 6.04ecologically 710.37lamplighter10.55Blood-brain7.54decompose 5.92ategorically 810.29earmold10.32Water-supply 6.91spatter 5.73ie 910.20inductance9.92Ever-higher 6.87sap 5.42unilaterally 1010.05spillage9.85cerebrospinal 6.80home 4.92markedly㊀㊀根据表3和表4发现同为名词条件下的两词的搭配词汇中,词汇领域大致相同,但Leakage与各类词汇的MI值均高于Leak,例如:Perilymph淋巴液㊁earmold耳模㊁cerebrospinal脑脊髓的㊁catastrophically灾难性地,这4个单词,表明母语者在名词条件下更倾向于使用严谨度和正式程度较高的Leakage㊂2.3㊀Leak和Leakage搭配分析在COCA语料库 SEARCH 功能中的Collocates一栏中分别输入固定结构[leak]from/in和[Leakage] from/in,得到与其搭配词的数据:根据表5中的数据可以发现,与Leak from搭配MI 值较高的词汇包含机构名(UEA),地点(Fukushima)等普通词汇,这些词汇大多在新闻㊁电视㊁网络及博客一类的传播媒介语域中使用,由此可以发现与Leak搭配的词汇更贴近日常生活㊂而Leakage from的搭配词多为专业性较强的词汇,例如:zwitterionic(两性离子)㊁astro-cytes(星形胶质细胞)等词汇多用于学术期刊中,正式程度较高㊂从表6中的数据可以发现,两者搭配词中都出现了pipes和attic,但是leakage in与两词的MI值均高于Leak in,表明母语使用者在表达泄露时更倾向于使用Leakage,用Leakage强调结果,泄露这个结果中包括发生的泄露这个动作状态㊂两者中都出现了地名词汇,但是两者的MI值有一定差距,同地名搭配时,母语使用者偏向于Leak㊂Leakage in搭配的词汇中出现了数量词,Leak in中并未出现,这说明母语使用者在表达某一准确数量时会选择Leakage,从而体现其严谨性和准确性㊂此外,作者㊃45㊃2024年第1期现代商贸工业Modern Business Trade Industry在剑桥词典中查询两词后得到以下结果:Leak:(Of a liquid or gas)to escape from a hole or crack in a pipe or container;(of a container)to allow liquid or gas to escape. Leakage:The act of leaking or the leak itself.表5㊀[Leak/Leakage]from搭配情况表Leak from Leakage from序号搭配词MI序号搭配词MI 1UEA12.281zwitterionic18.31 2orifice10.872Waterbath17.89 3Fukushima10.733precharge17.37 4corroded10.564backlighting14.43 5derdged10.415licit14.35 6UST10.106impoundment14.10 7Anus9.907astrocytes13.62 8seafloor9.888decommissioned13.08 9closed-door9.849slop12.39 10spindle9.8110thoracic12.35表6㊀[Leak/Leakage]in搭配情况表Leak in Leakage in序号搭配词MI序号搭配词MI 1Bhopal12.591toolong18.94 2ductwork12.28296.1%18.82 3dike10.653Blood-brain16.63 4coolant10.234subzero14.61 5radiator10.145superconducting13.16 6ducts10.006wetter13.15 7coils9.327multiplier12.48 8piping9.068envelopes11.23 9roof8.609discreet11.18 10pipes8.0510landfill10.92 11gulf8.0111bladder10.63 12containment7.8812drying10.32 13ceiling7.8013attic10.13 14embargo7.7314hull9.74 15basement7.5815pipes9.66 16stove7.1516absolute9.48 17cooling7.0917static9.33 18brake 6.9818Palstine9.29 19distorted 6.9519488.98 20attic 6.9320drain8.84㊀㊀根据Cambridge Dictionary的解释可以发现Leak强调泄露的动作,Leakage强调泄露的 事件 ,这两个词的意义侧重点有明显的差异,从语用角度来说,一般一个 泄露事件 可以包括很多 泄露动作 ,侧面也可以认为Leakage表意更加宏观,使用频率较小,而Leak的表意更加微观,所以使用频率较高㊂3㊀结语本文借助COCA语料库大量而真实的语料帮助下,研究发现Leak的总体使用频数高于Leakage㊂前者较多搭配与人们工作生活息息相关的名词,多使用在正式程度较低的语域中,表意较微观,日常使用的频率较高,而后者则是主要使用于正式程度或专业性较高的语域中,表意较宏观㊂研究结果表明,相比于单从词典查询或模糊的传统语感的近义词辨析法,利用COCA语料库作为研究工具,所展示的数据更加准确且有说服力㊂因此,在日常英语学习和教学过程中,应该积极使用COCA语料库作为辅助手段,更加准确地了解和运用近义词,避免误用,从而确保翻译质量㊂参考文献[1]曾毅.基于COCA语料库探讨英语中近义名词的辨析 以reaction和response为例[J].海外英语,2022, 469(09):77-78.[2]刘莹莹.基于COCA语料库的英语近义词分析 im-prove和promote用法辨析[J].现代商贸工业,2021,42(34):134-135.[3]刘辉,龚芳霞.基于COCA语料库的英语近义词对比分析 以 vice 和 associate 为例[J].中国石油大学胜利学院学报,2020,34(04):63-66.[4]佟玉平,宋雪童.基于COCA及BNC语料库的同义词辨析 以displace㊁replace和substitute为例[J].校园英语,2020(26):239-240.[5]刘倩倩.基于COCA语料库的近义词辨析 以fully和totally为例[J].海外英语,2021(21):108-109.[6]姜敏,黄蕾.基于COCA㊁BNC语料库的近义词辨析 以raise和rise为例[J].长春教育学院学报,2018,34(06): 39-41+46.[7]赖康生.基于COCA语料库的英语近义词辨析 以a-bolish㊁cancel和repeal为例[J].萍乡学院学报,2022,39(01):84-88.[8]迟红丹.基于语料库COCA的英语近义词辨析研究[J].对外经贸,2023,No.346(04):64-68.[9]丁成顺.基于COCA语料库的近义词研究 以reduce和decrease为例[J].汉字文化,2020,(07):11-14.㊃55㊃。
美式英语中Like作为连词的用法:一项基于美国当代英语语料库(COCA)的研究

美式英语中Like作为连词的用法:一项基于美国当代英语语
料库(COCA)的研究
白云
【期刊名称】《海外英语(上)》
【年(卷),期】2010(000)008
【摘要】Like一般作为介词和动词在英语中使用,然而是否还有别的用法呢?该文从美国当代英语语料库(COCA)中对like进行检索,考察其作为连词时候的使用情况.分析结果表明:首先,like作为连词的意思大概可以分为三种情况.其次,like作为连词的使用频率明显低于其作为介词和动词时的使用频率;再词,like作为连词的普遍度在最近十年内呈上升趋势,在口语中的出现最多.希望通过该文能够对英语学习者和研究者有所启发.
【总页数】2页(P181-182)
【作者】白云
【作者单位】国防科学技术大学,人文与社会科学学院,湖南,长沙,410073
【正文语种】中文
【中图分类】G633
【相关文献】
1.美国当代英语语料库(COCA)在词汇教学中的应用价值 [J], 张仁霞
2.基于COCA语料库的globalization在美式英语中的语义韵研究 [J], 肖寒
3.Try的搭配用法浅析——基于COCA语料库对try to和try and的用法研究 [J],
柴萌
4.从语义韵看《道德经》中\"玄\"之英译——基于《道德经》英译本语料库和美国当代英语语料库的分析 [J], 马嘉欣;吕长竑
5.美国当代英语语料库(COCA)——英语教学与研究的良好平台 [J], 汪兴富;Mark Davies;刘国辉
因版权原因,仅展示原文概要,查看原文内容请购买。
常用的英语语料库

常用的英语语料库有以下几个:
英国国家语料库(BNC):是目前世界上非常有代表性的当代英语语料库之一,收录了1亿字的电子资源,涉及口语和书面英语。
美国当代英语语料库(COCA):是目前最大的免费英语语料库,包含5.2亿词的文本,由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。
密歇根大学学术口语语料库(MICASE):专注于学术口语,收集了大量学术讨论和讲座的语音转录。
密西根高阶学生论文语料库(MICUSP):主要收录高年级学生的论文,对于研究学术写作风格和习惯很有帮助。
台湾清大自然语言处理语料库(Linggle):结合大数据分析,提供了丰富的语料和语言统计信息。
这些语料库各具特色,可以根据具体的研究需求选择合适的语料库。
美国当代英语语料库在英语词汇学习中的应用

美国当代英语语料库在英语词汇学习中的应用
迟秋玲
【期刊名称】《科技信息》
【年(卷),期】2013(000)004
【摘要】本文从词汇的扩展、搭配以及同义词查询和语体查询几个角度简单介绍
了美国当代英语语料库的使用,阐明学习者通过观察和分析大量客观真实的语料,能发现语言语法规则、意义表达及语用特征,能培养学习者的思考、推理能力,减少语用失误,有助于学习者习得地道纯正的美语。
【总页数】2页(P241-241,242)
【作者】迟秋玲
【作者单位】青岛农业大学
【正文语种】中文
【相关文献】
1.美国当代英语语料库(COCA)在词汇教学中的应用价值
2.语料库在大学生英语词
汇学习与写作中的应用3.美式英语中Like作为连词的用法:一项基于美国当代英语语料库(COCA)的研究4.从语义韵看《道德经》中\"玄\"之英译——基于《道德经》英译本语料库和美国当代英语语料库的分析5.语料库在大学生英语词汇学习与写
作中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。
语言学常用语料库

语言学常用语料库
以下是一些语言学常用的语料库:
- Brown语料库:这是一个基于英语的语料库,包含了1961年至1979年间推广的1,000,000个单词的样本,覆盖了各种文体和题材。
- COCA(Corpus of Contemporary American English):这是一
个覆盖美国当代英语的语料库,包含了1990年至今的一亿多
个单词样本。
- BNC(British National Corpus):这是一个覆盖英国英语的
语料库,包含了1980年代至1993年间的一亿个单词样本。
- CHILDES(Child Language Data Exchange System):这是一
个收集婴儿和儿童语言数据的数据库,用于研究儿童语言发展。
- Penn Treebank:这是一个标注了句法和语义信息的英语语料库,用于自然语言处理研究。
- EuroParl语料库:这是一个包含欧洲议会会议记录的多语言
语料库,可以用于研究多语言对比和机器翻译。
- COrE(Corpus of English):这是一个以英语为基础的多样
化语料库,包含了来自不同国家和地区的语言样本,用于研究语言变体和语言接触。
- WALS(World Atlas of Language Structures):这是一个收集了世界各地不同语言结构的数据库,可以用于跨语言比较和语言学理论研究。
这些语料库可以通过在线平台或特定的研究机构访问和获取。
使用语料库可以帮助语言学家进行语言研究、语言分析和理论构建。