基于语料库分析英语中“关于”的同义词短语使用差异
基于语料库对同义词specially、particularly、especially对比分析

ቤተ መጻሕፍቲ ባይዱ
搭 配是 指 “ 个 或两 个 以上 的词 在文 本 中短 距 离 两 内的共现 ” Snli 1 9 )L n at N w b ( i a , 9 1 。 acs r C e 提供 了MI c r eB 、 TS oe -cr 等六种值表 示词汇搭配强度 ,每种计算 方式侧重 点 不尽 相 同。杨节 之 ( 0 7 2 0 )指 出 : 时候 搭配相 同, 有 但 强度不一 定相同 ,词 与词 的搭配 强度一般可 以通过搭
配 频率显现 ,高搭配频 率不等于 高搭配强度 。互相信息
MI 能突 出有较 高搭 配 比率 的低频 词 ,如某 些专 业术 更 语。 T值则突 出较高搭 配值的高频词和 一些难 以反映搭配 特 点的高频词 。值越 大,两个词 的搭配强度 就越高 。 类 联接 是词语搭配研 究 中的一个重要概 念 。它指 的 是文 本 中语 法 范畴 间 的结 合 。类 联接 不 是与 词语 搭配 平行 的抽象 ,而 是高一 级的抽象 ( ih 1 5 )Mi hl Fr , 9 7 。 t el t c ( 951012 1 7 :2 —2 )认 为,类 联接 是关 于词语 组合 类别 的 抽象表 达 ,搭配 则是类联接 的具体实现 。简言之 ,类 联 接 是词语 搭配 发生于 其 中的语法 结 陶和 框架 ( 乃兴 , 卫
Di e so s rin p
Fe un y rq e c
F - u n yp r r q e c e  ̄
C t oy a g r e
W rtn ie t
No o w rs . f od
8 , 0 ,71 79 35
N0o ht . f i s
17 3 .9
(v r ls o e e) i f
基于COCA语料库辨析英语同义动词——以improve和ameliorate为例

2024年第9期现代商贸工业Modern Business Trade Industry作者简介:袁森(1961-),男,山东菏泽人,硕士研究生导师,教授,研究方向:语用与翻译㊁专门用途英语(ESP );冯黎明(1982-),女,西安石油大学外国语学院在读硕士研究生,研究方向:语用与翻译㊂基于COCA 语料库辨析英语同义动词以improve 和ameliorate 为例袁㊀森㊀冯黎明(西安石油大学外国语学院,陕西西安710000)摘㊀要:本文主要讨论分析同义词词组improve 和ameliorate 在不同语域的词频分布㊁显著搭配词和语义韵特点,以期通过语料库的使用提升精准地道使用语言的语用意识和学习方式㊂主要研究发现如下:(1)在整体和分类的语域中,improve 的词频远远高于ameliorate ;(2)在动词和名词㊁动词和形容的搭配方面,improve 的搭配词多呈现积极或中性的含义,而ameliorate 的搭配词反之;(3)improve 多用于中性和积极的语义氛围中,多描述事物从好的方面向更好发展,而ameliorate 语义氛围分布偏重消极语义,其所含改善意义大多基于事物负面消极的方面所做出㊂关键词:语料库;词频;语域;搭配;语义韵中图分类号:F74㊀㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀㊀㊀doi:10.19311/ki.1672-3198.2024.09.0180㊀引言同义词极易生成语言习得过程中的重难点,英语学习者如果只是从字典释义方面来认识同义词,抛开同义词出现的语境和上下文,那么对于同义词学习就脱离了本质上的思考和精准的语言分析以及实际运用中的恰当输出㊂随着日新月异的科技对于语言学习的辅助功能大大提升,针对同义词使用中常常出现含义模糊㊁词汇误用㊁语境不符的情况,利用语料库可以弥补词典释义辨析的短板,大大提升针对同义词的准确掌握程度和运用能力㊂利用语料库中的检索工具对同义词展开辨析研究,能够得到更加直观和有效的辨析结果㊂本研究先利用 查找了improve 和ameliorate 的权威释义和词典意义对比㊂之后,再利用COCA(Corpus of Contemporary American English) 美国当代英语语料库在近义词辨析方面的独特优势,针对improve 和amel-iorate 在不同语域的词频分布㊁搭配词的异同和语义韵的差异三个方面进行对比分析㊂1㊀研究设计1.1㊀研究问题本文试图回答以下研究问题:(1)improve 和ameliorate 在COCA 语料库中不同语域的词频分布情况及其显著特征如何?(2)这两个同义词在COCA 语料库中的显著搭配词有何异同?(3)这两个同义词在COCA 语料库中的语义韵对比分析结果如何?1.2㊀研究工具及方法本研究先利用 查找了improve 和ameliorate 的权威释义和词典意义对比㊂(https://)是世界上最大的免费在线英语同义词库㊂该网站有550,000个同义词的精确单词㊂先搜索并确定这两个词有关 改进,改善 的定义存在意义相似之处,之后选用了CACO 语料库进行进一步的词频㊁搭配和语义韵的研究㊂世界最大的英语语料库 美国当代英语语料库(Corpus of Contem-porary American English 简称COCA)(https:// /coca /),具有三个最基本特征:规模(size)㊁速度(speed)及词性标注(annotation),其方便快捷㊁均衡性强㊁时效性强和规模大速度快的优势,为英语学习者提供了海量可追溯的理想资源,使研究得到更加翔实准确的结论㊂本文依托美国当代英语语料库(COCA),依据数据驱动的方法,从三个方面探索improve 和ameliorate 的语用差异:(1)对比两个同义词在不同语域中的词频分布;(2)对比总结两个同义词在跨距-4/+4之间的搭配词异同;(3)阅读分析两个同义词所有动词形式的扩展语境,对两个同义词的语义韵特征进行概括和描述㊂2㊀基于COCA 的improve 和ameliorate 对比分析2.1㊀提取词典释义,确立improve 和ameliorate 互为同义词作为网络上首屈一指的同义词库, 专有的相关性,复杂性和长度过滤器,能帮助任何人快速找到完美的单词㊂根据 的同义词搜索引擎,确定两个词为同义词㊂之后对两词的词典释义进行表格归纳㊂表1将improve 和ameliorate 的词典释义进行展示后,发现两个词均出现了表达 改进,改善 的意义,这对于同义词的地道性选择形成了一定的选词㊃35㊃现代商贸工业Modern Business Trade Industry2024年第9期难度㊂表1㊀improve 和ameliorate 的词典释义单词词典释义improveverb (used with object)1.to bring into a more desirable or excellent condition.2.to make (land)more useful,profitable,or valuable by en-closure,cultivation,etc.verb (used without object)3.to increase in value,excellence,etc.4.to make improvements,as by revision,addition,or change.ameliorate verb (used with or without object)to make or become better,more bearable,or more satisfacto-ry;improve.2.2㊀improve 和ameliorate 在不同语域的词频分布词频,是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重复程度㊂语域(register)是指人们在实际的语言活动中处于交际的需要,或因其从事的职业和兴趣相异,亦因其话语发生的情景,说话的对象㊁地点和话题的不同而产生的一种语言变体,体现为语言中的不同语体风格㊁用语格调等㊂观察同义词在不同语域中的分布特征能从宏观的层面揭示同义词的部分使用特征㊂通过COCA 语料库中Chart 板块的检索输入框里依次输入两个同义词,运用词频分析方法,得到表2㊂表2中为美国当代英语语料库(COCA))网页数据㊂数据表明,这两个同义词在整体和分类的词频使用频率上,单词improve 的词频远远高于ameliorate㊂improve 和ameliorate 两个同义词在学术(ACAD),博客(BLOG)网站,杂志(MAG)和新闻(NEWS)中的运用显著高于在其他板块中的使用频率㊂虽然这两个单词WORDS(M)指以百万为单位统计单词数量几乎一致,但即便如此,从词频总量(FREQ)和单词词频的千分比(PER MIL)来看,ameliorate 在相同语域的使用频率都十分的小众㊂表2㊀improve 和ameliorate 在COCA 不同语域中的词频分布Improve ㊀㊀㊀AmeliorateSECTIONFREQ PER MIL FREQ PER MIL ALL 总计9477495.441074 1.08BLOG 博客14679114.131260.98WEB 网站14189114.19127 1.02TV /M 电视/电影187514.6440.03SPOK 口语616248.85540.43FIC 小说218618.47300.25MAG 杂志15622123.891120.89NEWS 新闻14327117.68590.48ACAD 学术25734214.83562 4.691990-199********.93131 1.081995-199********.22137 1.092000-20041102388.451200.962005-20091093888.89136 1.112010-201412615102.2712312015-20191099289.55174 1.42㊀㊀从历时发展的角度来看,单词ameliorate 随时间的发展,其词频呈稳步上升状态㊂improve 的使用频率在2015年至2019年间整体平稳,只在2010年至2015年间出现小幅提升㊂2.3㊀improve 和ameliorate 在搭配词方面的异同语料库证据表明,每一个词项都有其独特的搭配行为(Partington,1998)㊂研究高频搭配词的语义特征是考察语义韵的重要依据(陆军,2010)㊂同义词虽然具有相同或相近的概念意义,但是在搭配词选择上可能存在不同㊂语义偏好(semantic preference)指某个节点词与其经常搭配的词的共同语义特征,它关注搭配词的语义特征或类别(McEnery et al,2006)㊂通过研究同义词的显著搭配词以及其语义偏好来区分同义词是一种行之有效的方法㊂在语料库的Word 界面分别输入两个同义词,在Collocates 板块选取词频较高的名词㊁动词㊁形容词和副词,进一步考察两个同义词在搭配词方面的异同㊂CO-CA 网站自动选取跨距-4/+4之间的搭配词㊂表3用表格收集了网页信息,更直观地描述了improve 和amel-iorate 在搭配名词㊁动词㊁形容词和副词时的异同㊂表3㊀improve 和ameliorate 与名词㊁动词㊁形容词和副词的搭配对比CollocatesImproveNOUN quality,health,performance,condition,skill,effort,situation,education,economy VERB help,continue,reduce,design,seek,increase,aim,maintain,expand,enhance,strive ADJOverall,economic,academic,physical,educational,mental,environmental,patientADV significantly,greatly,dramatically,vastly,substantially,constantly,steadily,slightly AmeliorateNOUN problem,effect,condition,situation,effort,symptom,concern,consequence,government VERB Could,help,try,may,might,prevent,attempt,seek,design,serve,identify,improve ADJ social,economic,negative,environmental,adverse,potential,global,living,human ADVLeast,somewhat,partially,significantly,best,potentially,immediately,likely,constantly㊀㊀从COCA 语料库输出的信息来看,improve 和amel-iorate 共用的显著搭配词并不多㊂例如,名词有situa-tion,condition,动词有design,help,seek,reduce,形容词有physical,environmental,副词有constantly,signifi-cantly,considerably㊂它们的共同搭配词存在于动词与名词,动词与名动词,动词与形容词以及动词与副词㊂针对同义动词和名词的搭配,可以发现动词im-prove 在表达 改进,改善 的意义时,更多搭配客观世界中可量化的中性事物名词,如质量quality,表现perform-ance,经济economy,效率efficiency 等㊂而ameliorate 搭㊃45㊃2024年第9期现代商贸工业Modern Business Trade Industry配的名词多为不易量化的负面抽象事物的名词㊂例如:猜忌distrust,缺点shortage,危害harms,苦难hardship等㊂针对同义动词和形容词的搭配,很容易发现动词improve搭配的形容词多为中性或者含有积极意义的,例如经济的economic,学术的academic,体力的physi-cal,而ameliorate搭配的形容词有部分词汇含有负面意义,例如,阻塞的obstructive,不利的adverse,负面的neg-ative等㊂至于两个同义词搭配动词或副词时,未表现出明显集中的语义偏好㊂2.4㊀同义词improve和ameliorate在COCA语料库的语义韵对比语义韵(semantic prosody)的概念在1987年由Sin-clair首次提出,此后成为语料库语言学研究的主要方面㊂王江渭(2012)认为 语义韵是一种搭配现象,指某些词语由于经常同具有某种语义特征的语言单位共现而产生某种语义色彩 ㊂研究者通过观察词的语义色彩来帮助解释词的有关现象㊂研究发现,有些节点词总是习惯性地吸引某一类具有相同或相似语义特点的搭配词,其语义相互感染,相互渗透,在语境内形成一种语义氛围(卫乃兴,2006)㊂语义韵分为积极(positive)㊁消极(negative)和中性(neutral)三类㊂积极的语义韵是指节点词多与具有积极语义特点的词语搭配,消极语义韵的节点词则吸引具有鲜明的消极语义特点的搭配词,而中性语义韵的节点词因既能搭配具有积极语义特点也能搭配消极语义特点的词语,便形成错综(mixed)语义韵㊂同义词可能呈现出不同的语义韵㊂语义韵与语义偏好在实际运用中既相互区别又相互联系㊂本研究结合上文中总结出的两个同义词的语义偏好来分析他们在语义韵方面的特点㊂根据COCA网站的单个词条KWIC项下解析,进行阅读和记录,包括同义动词的所有动词形式展开阅读和梳理㊂表4是通过人工分析统计200条同义词相关索引行所得出的语义韵对比表,所采用的是基于语料库节点词搜索后所得的语境信息进行语义韵分类的数据分析㊂表4㊀improve和ameliorate语义韵对比表积极语义韵中性语义韵消极语义韵Improve39%49%12% Ameliorate11%28%61%㊀㊀通过观察和比对,不难发现improve和ameliorate两个同义动词在表达 改进,改善 意思时,improve多用于中性和积极的语义氛围中,多描述从事物好的方面或基础出发的改善和提高,而ameliorate的语义氛围分布偏重于消极语义,其所指向的改善和提高大多数是基于或由于事物负面消极的方面所做出的㊂3㊀结语本文结合词典释义和基于COCA大量语料库资源的分析,对improve和ameliorate两个同义动词在表达 改进,改善 意思进行对比:1)这两个同义词在整体和分类的词频使用频率上,单词improve的词频远远高于ameliorate㊂两个同义词在学术㊁博客㊁网站㊁杂志和新闻中的运用显著高于在其它语域中的使用频率㊂但是a-meliorate在相同语域的使用频率都远远不及improve;2)关于动词improve和ameliorate同义动词和名词的搭配,动词improve在表达 提高,改善 的意义时,更多搭配客观世界中可量化的中性事物名词,而ameliorate搭配的名词多为不易量化的负面抽象事物的名词㊂关于同义动词和形容词的搭配,很容易发现动词improve搭配的形容词多为中性或者含有积极意义的,而ameliorate搭配的形容词多含有负面意义㊂至于两个同义词搭配动词或副词时,未表现出明显集中的语义偏好;3)通过观察和比对improve和ameliorate所处句子的语义韵,不难发现improve和ameliorate两个同义动词在表达 改进,改善 意思时,improve多用于中性和积极的语义氛围中,多描述从事物好的方面或基础出发的改善和提高,而ameliorate的语义氛围分布偏重于消极语义,其所指向的改善和提高大多数是基于或由于事物负面消极的方面所做出的㊂基于语料库进行词汇研究具有其独特的优势,因为基于大量真实语言数据的定量分析使得研究结论更具有说服力,让学习者对于同义词差异的深入了解更直观㊁全面和准确㊂对于精准地道使用语言的语用意识和学习方式都将产生极大的促进作用㊂参考文献[1]Firth J R.Papers in Linguistics1934-1951[C].London: Oxford University Press,1957.[2]Sinclair J.Corpus,Concordance,Collocation.Oxford:Oxford Universlty Press,1991.[3]何安平.谈语料库语言学应用的新发展[J],外国语, 2001,(2).[4]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.[5]卫乃兴.专业性搭配初探 语料库语言学方法[J].解放军外国语学院学报,2001,(04):19-23.[6]卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].当代语言学,2002,(02):101-114+157.[7]卫乃兴.语义韵研究的一般方法[J].外语教学与研究, 2002,(04):300-307.[8]迟红丹.基于语料库COCA的英语近义词辨析研究.对外经贸,2023,(04),64-68.[9]房丽丽,杨洪娟.基于COCA语料库对近义动词Swing和Sway的对比研究[J].英语广场,2023,(20):51-55.[10]王江渭.近义词PROVIDE和SUPPLY的语义韵对比研究[D].西北师范大学,2012.㊃55㊃。
基于BNC语料库的英语近义词差异性研究——“hit和strike”为例

和技 能训练,为以后 的工作积累经验。
的推动 [J].佳木斯职业学院学报,2015,(12):21—22.
总之,中职院校的设立为我国培养专业技术性人才发挥 【5】方娟 .职业能力培养视角下的 中职英语教 学改革探 索 [J】.
了重要作用,在英语教学的过程中更要注重对于人才实用技 科学大众 (科 学教育 ),2015, (08):123.
知该词 。从词语 的搭配 ,学习者 了解词块,把它们作为整
体来一块记忆 。Part ington指 出基于语料库的研 究是一个
表 1 “hit和 strike”在 BNC每 百万词中分布频率
有效方法对 语言的描述,并且能够弥补传统的字典对词语
描述 的不足 。卢晓娟、高盈盈基于语料库对 “begin”和
从语域和搭 配两个方面分析 “hit和 strike” 两个词 。研 究发现 ,hit在各语域 中使用频率都是 最高的 。基 于语料 库
的研 究对英语教 学和学 习都有帮助 。
【关键词 】语料库;语域 ;搭配
【中图分类号 】H313.2
【文献标识码 】A
【文章编号 】1009-5624(2018)04-0178-02
教学方法 ,语料库为学习者提供大量真实可靠的语料 ,有
3.1同义词 hit和 strike在不 同语域 中词频分布
利于学生综合语言能力和 思维能力的培养 。因此很 多学者
不 同语 域 的词 频分布 差异 是人们 在实 际的语 言活 动
将语料库与英语近义词的辨析研究结合起来 ,对英语教学 中,因为话语发生 的情景、对象 、地点和话题 的不 同而产
圃 堡:
8一- ̄-4月 1 9鲞第4期
基于语料库的英语同义词辨析

文 献 标 识 码 :A
文 章 编 号 :1 7 —7 9 ( 0 9 卜0 2 5 6 39 7 2 0 )O 1 80
A r u — a e f e e i tO g ih S nO m s CO p s b s d Di f r nta i n OfEn ls y ny
Abtat src :Th sp ri to u e o t e r gi y o y yu izn o p s frty t ido t i 印e n r d c s w JanEn 1 hs n n ms tl i gc r u : i 1, o f u h o s b i s n
河南理工大学学报社会科学版第卷第期年月?基于语料库的英语同义词辨析王璇任培红河南科技大学外国语学院河南洛阳摘要介绍了利用语料库来学习英语同叉词的方法首先通过统计同义词在不同语料库中的分布频率来观察其使用的地域差异其次通过观察其在语料库不同语域中的词频分布来判断其使用情况的差异最后通过观察检索行总结检索行中所呈现的不同的典型类联接行为和典型搭配词并通过对搭配词的量化分析揭示同义词在语义韵上的差异
p oa h no on y pu s f r r w y f d fe e ta i r c t l t o wa d a ne wa o il r n itng Eng h s o m s u c f hs yn ny ,b t om p1m e st e nt he
isr g o 1d f e e c n u a e a c dn o t e sa itc of o e s no m ’ dsrb to r q e y i t e i na il r n e i s g c or i g t h t tsi n y ny s it iu i n fe u nc n f d f e e t c pu e ;s c d o 0r t t e df e e e oft la e b a l z n h 0c b lr fe— if r n or s s e on ,t s tou h if r nc he I g y nay i g t e V a ua y r s q e c iti u i n i a i sr gs e sofc pu ;ls ,b oo n h O g h e re 1ln ,t u — u n y d srb to n v rou e it r or s a t y 1 ki g t r u h t e r tiVa i e O s m m a i e t if r n i ngb ha o n i a d t yp c lc 1oc to ndm a e aq a ia i ea l ss rz hed fe e tl nki e vi ri t n het ia o 1 a i nsa k u ntt tV nay i o he c l c to o r v a he df_ e e fs o m sa h e lOfs m a tcpr s d Thi p — ft Olo a i nst e e 1t if r nc so yn ny tt e lve e n i o O y. e sa
基于COCA语料库的英语同义词辨析

词, 结 果如下 ( 表 1 ) :
表 1 : o b t a i n 的 同义 动词 序 号
1 2 3
似语义特征的搭配词 , 体现说话者意图、 态度或 实施 具体 的 功能 。_ 4 J 因此 , 同义 词 的语 境大 体相
近。 但 语料 库证 据表 明 , 每一 个词 项都有 其独 特 的搭 配行 为 ; 嘲 同义词 一般 只在 概 念意 义上 相 同 或 接近 , 但 在搭 配词 选择上 并不 能随意 替换 。这
同 义 词
G E T【 S 】 T A K E[ S ] F I N D【 S ]
频数
f r e q .
4 . 3 4 3 . 6 4 3 . 9 2 3 . 4 2 3 . O 3
MI
3 . 2 2 W EAL TH 3 . 5 4 DEs TRUC Ⅱ 0N 3 . 1 MI S S I LE
收 稿 日期 : 2 0 1 2 — 0 3 — 1 5
作者简 介: 王大鹏( 1 9 7 ) , 男, 硕士 , 渤海 大学大学外语教研部讲师, 从事语料库语言学研 究。
一
、
引 言
二 、基 于COC A 语 料 库 的 同 义 词 辨 析 方 法
英 语词 汇 教 学 是 大 学 英语 教 学 的重 点 , 同 义词 在英 语词 汇 中 占有相 当大 的 比重 ,据 统计
渤海大学掌曩 哲 学 学 版
基于C O C A 语料库的英语同义词辨析
— —
以o b t a i n 等同义词为例
王大鹏 ( 渤海 大学 大学外语教研部 , 辽宁 锦州 1 2 1 O 1 3 )
传统方法与语料库方法辨析英语同义词的对比研究-2019年精选文档

传统方法与语料库方法辨析英语同义词的对比研究1 引言英语是世界上同义词最多的语言之一。
对于英语学习者来说,同义词辨析是个棘手的问题。
传统的辨析同义词的方式是借助于词典,主要分为三类:语文词典、搭配词典和同义词辨析词典。
我们可以利用语文词典区分同义词的词性、词义、适用的文体等。
同义词辨析词典是最常用的辨析同义词的词典。
搭配词典着重于搭配和语法结构。
传统方法辨析同义词主要是基于描述和定义,这种方法的缺点是显而易见的。
描述和定义都过于抽象,难以理解。
随着语料库语言学的发展,语料库被广泛用于应用语言学的各个领域和语言教学中。
机器翻译、词典学、英语教学都从语料库语言学中受益。
基于语料库的分析能给我们提供量化标准,还能提供传统方法所不能提供的新信息。
研究者现在已经开始尝试用语料库工具辨析同义词,但是他们的研究主要着重于利用语料库的搭配检索功能辨析同义词,而语料库的其他功能并没有被利用起来,比如显示某词在不同文体中的分布情况、使用频率等。
本文将研究PROCURE,OBTAIN 和ACQUIRE 三个同义词,三词均表示获得。
作为对比,本文分别采用传统方法和基于语料库的方法进行同义词辨析。
2 传统方法辨析OBTAIN、ACQUIRE 和 PROCURE在分析传统方法时,三本词典将被涉及到:牛津高阶英汉双解词典,韦氏新世界美语词典和Use the Right Word.2.1韦氏新世界美语词典在这本词典中,这三个词的释义中都包含了通过自己的努力获得,但是获得过程中的难度差异并未反映出来。
Obtain 和procure 更是互为释义。
Acquire的两个义项可以用obtain和procure 替换。
在某些情况下,obtain 和procure 不能被acquire替换,但是从这本词典中,我们无法发现 acquire 的独特用法。
2.2 牛津高阶汉英双解词典这本词典给出了三词的中英文解释。
三词都被翻译为“获得”,从中文定义中,很难发现任何语义差别。
基于语料库的英语近义词辨析

2016年2月第5卷 第1期 JournalofBengbuUniversity Feb.2016Vol.5,No.1基于语料库的英语近义词辨析收稿日期:2015-09-26作者简介:朱英毅(1987-),男,湖南衡阳人,助教,硕士。
E-mail:jasdinzhu@qq.com朱英毅(衡阳师范学院 外国语学院,湖南 衡阳 421008)摘 要:以英语近义动词divide、separate和part为例,通过检索目标动词在COCA语料库中的使用频率、语域分布情况以及在语境中与名词和副词的搭配关系,并以数据统计法探究其实际使用规律,进一步说明语料库研究方法对近义词辨析具有的辅助作用,以期为英语词汇教学和二语习得研究提供参考。
关键词:近义词辨析;语料库;语域;搭配中图分类号:H313.2文献标识码:A文章编号:(2016)01-0115-05Corpus-basedAnalysisofSynonymDiscriminationZHUYing-yi(SchoolofForeignLanguages,HengyangNormalUniversity,Hengyang,421008,Hunan)Abstract:TakingthethreeEnglishverbs,"divide","separate"and"part",asexamples,itretrievedlan-guagefeaturesastheirfluencies,registersandregularcollocationsofnounsandadverbsinCOCAinthispaper.Thenthesedatawerecollectedtoprobeintotheiractualusestoillustratethattheresearchap-proachofcorpuslinguisticshasasupplementaryroleinsynonymdiscrimination,soastoproviderefer-encestolexicalteachingandsecondlanguageacquisition.Keywords:synonymdiscrimination;corpus;register;collocation 英语虽隶属于印欧语系下属的日耳曼语支,但在其发展过程中吸收了不少同语系下的拉丁语、法语、德语等外来语的词汇。
语料库搭配检索与英语同义词辨析

语料库搭配检索与英语同义词辨析
中文语料库搭配检索用于分析句子中词语之间的关系和上下文,以判断词语之间的同义词关系。
通常将词语放入语料库搭配,将它们转换成一系列由特定编码代表的短语,并在语料库中搜索是否可以找到与给定词语的短语相匹配的短语。
具有完整的语料库表示的特定词语搭配可以用来帮助判断两个词语之间的相似
程度,因此可以确定它们是否具有同义词关系。
更具体地说,句子中的每个词语被提取出来,并给出其特定的搭配词。
然后,比较句子中两个词语的特定搭配,看它们是否拥有相同的搭配词。
如果这些特定搭配词相同则说明它们可以是同义词,否则不能表示同义词关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大语域: 口语、 小说、 新闻、 、 学术 非小说和其他类共六 l
类。根据统计 , 的常模统计最高 , at so 在六大语域 里 I
( As fr 4) o
A o 和其他六 个同义 词短语不 同的是 在小说 sf r
使用次数最多 。 i ead t 而 n rgr o的常模统计最低 , 在六 : 语域使用的常模统计最高 。 另外从 词汇索引分析可见
汇在语境 中的实际使用情况 , 尤其在 同义词的使 用差 这 组同义词 的使用频率 , 同时辨别他们在不 同语域的
别方面语料库研究更具优势。 利用语料库可以对意义 } 布 情 况 。 另 外 根 据 B C 给 出 的 词 汇 索 引 分 N
相近的词汇和固定短语进行区别分析, 分析他们在使 lcno ac ns分析他们各自的使用特点。 (oc dnele) r i
用 中的特点 以及在不同上下文中的使用差异 。 文将 - 本 二、 方法
利用 B C N 语料库分析表达“ 于” 关 的几个 同义词短语 l 的使 用 差异 。他 们分 别是 : oa ta r a snf a f / o s e r / s rs / g di
1 . 语料库 Bis N tnlCr sB C 语料 库 是 一个 词 ri aoa o u (N ) th i p
短语 在 B C语料库 的原始 统计 和常模 统计以及在六 N
根据统计分析结果 , 在分析它们的搭配和使用特 I 大语 域的常模统计 , 并且也粗略分析了他们各 自的使 点时, 分析 a f 在小说语域的词汇索引, so r 其余六个 1 用特点 和搭配情况。 从分析 中可以发现语料库在同义 分析他们在学术语域的词汇索引。
不同的上下文里有使用上的差别? 字典的解释含糊不 } 接着列表统计每个同义词在六大语域里的使用频 语;
明确 , 很难清楚 区分他们 。其 中有的字典里也给出 了 率并且 比较分析其分布情况 ; 最后利用词汇索引分析
某个短语的使用特点, 例如,i ea 用在正式 l wt r r t h gdo 它们在学术语域里(cdmcr ie) aae i e s r的搭配和使用 gt
rgr o n rgr o意思分别是相 同的。而牛津高 l eadt/ eadt i 究无法 比拟的。 级辞典解 释 a o srgrs st a ead 意思是相 同的。 / 但是它们 l 本文首先 列表统计 这七个 同义词 在 B C语料库 N
究竟是完全一样, 在任何情况下都可以互换?还是在 1 的使用总频率 ,比较后找出总频率最高和最低的词
《 教学与管理 》
21 年 6 2 01 月 O日
基于语料库分析英语中 “ 关于" 的同义词短语使用差异 : l :
⑩陕西成阳师范学院 谭鼎华
传统的词汇研究 局限于研究 词汇 的含义及 其相 J 的文体 , grig 于正式 的商业文体里 ,但是给 出 r adn 用 e
应的近义词。随着 电脑技术的进步和推广 , 基于语料 } 的解释不足以区分这些 同义词之间 的使用差异 , 更谈 库基础上的研究摆脱 了传统研究的局限 , 侧重研究词 I 不上恰 当地使用他们 。本 文将 根据 B C语料库分析 N
该 文 为成 阳师 范 学院 专 项科 研基 金 资助 项 目(8 S K 2 ) 阶段 性研 究成 果 0X Y 35 的
谭鼎华 : 基于语料库分析英语中“ 关于” 的同义词短语使用差异
w 特点 。B C语料库 的网上界面包含六大类语 域和七 f hih o he t i t e mo e d e l. N c f t wo s h r e p y
里出现总次数为 78 次,常模统计为每百万个词汇 I a la n ・・ 14 rime t・ P
单位 出现 7 . 1 4次 ;sfr 8 a 0 的原始 统计为 2 5 4 0次 , 常
( ) s rg rs 3 A e ad
模统计为 2. 4 0次; g d g 5 r a i 紧随其后位居第 三; e rn il n
模统计第二, 小说和新闻类最低。
计最高 , 而在
j 是经常和 b t或者 a d u n 连用 。例如 :
As f r l a ig o t al h b a , a c u d o e vn y u o s i t e o t wh t o l
a f 的统计结果很特别, so r 在小说语域的常模统 l
十个左右的子语域, 不可能做到分析每个语域里的搭 ;
计最高 的语域 中的表现。 三、 分析结 果 1 . 同义词短语 总频率统计 七个
( I rg r t/ i rg r t/ g rigW i 2)n e ad oW t e ad oRe adn / t h h
配和使用特点, 因此本文仅分析七个同义词在常模统 fe p c o s e t t r
( ) st 1 A o
f 词的使用研究方 面具 备了传统研究方法 无法 比拟 的
l
I 优越性 。 研究结果使 学生和教 师更加清楚了解这组同
f
A 主要用于句子中间, st o 后跟名词、 名词短语和 l 义词短语在实 际使用 中的差 异 , 并且明 白字典里解 释 动名词。 也可以与 Whwr 一起使用引导一个从句, 的同义词并不表 明可 以毫无差别地使用他们 。 —o d f 真正掌
2 个同义词短语在六大语域 的频率统计 . 七
t c Iha p o e y f ny o sde a l v l e l o t r p  ̄ o a c n i r be au wil me
i 在前 面的分析方法里谈到 B C语料 库被分成六 :nt t e d r c o es i f a li fnt N o h ie t wn r h p o l n a .
四 、 语 结
差异很大, 说明这个短语几乎不出现在小说和新闻语 {
域, 主要用 于学术类文章 。
3七 个 同义 词短 语 搭 配和 使 用 特 点 .
本 文 分 析 了 a o a o ead/ ead t/ sf /st a rgrsn rgr o r / s i
t r r t sgrn wt r pc t七个 同义 词 I i ea / ea i /i e eto wh g d o dg h s
统 计显示 出 a o的使 用频 率最 高 ,其 次是 a st s—
a f . gr t使用频率最低 。a t 在 B C语料库 In c so y o c id e a e o sa ty e ie b oi r a o r e d n so N d u td f hl r n r c n t n l r v s d y
究更加注重真实语境中的应用研究 。 本文的七个 同义 :
词短语都有相同 的汉语解 释 , 示“ 于” 即表 关 的意思 。 J
语 料库 研究 中 主要 利 用 词汇索 引(oc dne cno ac r
根据语言学习者常用的朗文当代英语辞典、 牛津高级 li s分析研究结果。词汇索引是指把选定的某个语 n ) le
常见的词有 w ehrw i ,o ,h ,ht h te,hc h w w yw a 等等 。例如 : h : 握并 且恰 当使用词汇需要了解他们 的真实语境。
r a o i ea o ea i /i e ett通 ! e r twt r r t gr n wt r pc o g d / h g d /r d g h s . 汇容量 巨大 、涵盖多种体裁 的语料库 ,包括新 闻、 小 过分析试图说 明如下 问题 : 同义词 的总体使用频 } 、 、 七个 说 教育 学术 、 商业 、 医学 、 等等体裁 , 宗教 词汇量达 率是多少? 哪一个使用频率最高? 哪一个使用频率最 l 到一亿现代词 汇 ,其中 9% 0 是书面语体 , % {头 1 是= 0 = _ = 1
n 最后 ,i e eto w hr pc t的常模统计中学术统计为 f o t te s:f r e i, i' a s a t s t o o h r o g t t ts h m.
5 .4 小说 统计为 0 6 新 闻统计 为 02 , 0 , 9 . , 5 .8语域 统 计 -
和 上 面 四 个 短 语 相 比较 ,s r a s 了位 置 不 a e r 除 gd
r a o a r a s 用 的 次 数 最 少 ,其 中 i J 主要放在句 首的位置外 , 他的用法 和它们 很类 e r t和 s e r 使 gd gd n 同, 其
rgr o ead t 的原始统计仅达到 2 3次 , 8 常模统计为 2 3f , . 似 同样引 出比较正式的和严肃 的话题 。例如 : 8 次。 由此可见 , 尽管他们意思相同 , 并不意味着 可以毫 I
域有很大不同。 l
s il p n h t y u v n th n e e o e 口语类 最低 , 比其他六个短语使用 语 po sb y ha pe t a o ha e a dld b f r ? ” 相
A rte ga or a ahd t sme jb n s f h lm u t ce o o o sa d o t
大语域里使用次数最低。
l 常常出现在句首的位置 , 后跟名词 、 名词短语 和动名
词 从统计中还可以分析出, a f 以外, 除 so r 其他六 1 。 其他六个短语在 引出话题方面突出引出的话题和