语料库术语表

语料库术语表
语料库术语表

(注:可编辑下载,若有不当之处,请指正,谢谢!)

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

语料库简单dye 第二讲

2008/7/31 语料库简单DIY 第二讲语料库软件初探-- 语料库软件初探--MonoConcPro 2.2 本软件是Athelstan开发小组https://www.360docs.net/doc/4314240711.html,/ ,于1996年开发的语料库比较检索工具。目前,我的服务器上提供学术性下载,下载地址: http://vu.flare.hiroshima-u.ac.jp/whistle/corpus/MoconcPro2. 2.rar (本软件为学术交流使用,所有权归本软件开发小组所有,一切商务性盈利目的的违法使用,所带来的连带责任关系与本人及本论坛无关。请慎重下载,小心使用!!!) 功能介绍: 软件主界 面 基本功能: MonoConc Pro 2.2 的软件界面比较简单。适合语料库初学者和初级研究人员使用。 本软件据作者的研究,其内部主核使用UTF-8编码,基本支持欧洲几种主要语言。当然,其主要的应用领域还是针对英语。本软件主要处理的文本素材是以TXT结尾的记事本文件,当然,本软件还可以导入RTF文档和其他格式的操作系统默认文档格式。不过,从DIY的角度来说,我们自己收集到的语料,为了免除格式,字体,行距等等文本要求,最好全部使用TXT文档,方便,省

事!用了都说好!(谁用谁知道) 我们按照自己的研究目的,研究方向,收集我们所需要的语料素材,具体的收集方法因人而异。可以从报纸杂志的电子文文档上直接下载,也可以从网站上直接下载整理好的TXT版本的小说,资料素材等,还可以直接从各大语料库中检索需要的语用素材,然后拷贝粘贴到TXT文本中。由于MonoConc Pro 强大的跨文档处理系统,一次可以同时导入多个TXT文档进行比较处理,所以我们可以把文章或者资料按照自己喜好的分类标准进行分类,然后存成不同的TXT文件名。检索的时候,只需要同时导入这些文件就可以了。(异常强大~)下载好软件,解压缩,然后打开MP22.EXE文件,你就可以看到上图那个简单的主界面了。 之后,选择File→Lord Corpus File(s),找到你需要导入处理的TXT文档,一个或者多个都可以,然后选择[打开]。指定的TXT文件就被全部导入进MonoConc Pro中了。 如果导入了过多的TXT文档,比如您导入了莎士比亚全集+马克思选+恩格斯选+列宁选+毛泽东选+邓小平选.....(不能否认,真的有这样的朋友存在)。那么,为了方便您查询检索结果所出现的文章,你可以选择File→View Corpus File/URL,这样就能看到查询结果所在的文章,还可以删除不需要的文章,或者添加新的文章,非常简单。 *这里的URL,指的是在HTTP或者FTP上,可以直接打开的文字页面的链接。一般朋友们DIY的语料库都是存在本地硬盘上的,所以基本上可以无视这个选项。不过,将来我们的个人语料库要实现点对点,点对多的平台连接。连接后,我们就可以相互查询对方个人语料库中的资料,此时在导入对方语料库中的文档的时候,就要用这个了。(这个目前还很遥远,大家还是踏踏实实做自己的DIY语料库吧!) 当我们要删除所有的文章的时候,这个时候仅仅关闭文章的窗口,是不能实

中医药术语汉英双语平行语料库的创建和应用 探讨

Modern Linguistics 现代语言学, 2019, 7(2), 207-211 Published Online April 2019 in Hans. https://www.360docs.net/doc/4314240711.html,/journal/ml https://https://www.360docs.net/doc/4314240711.html,/10.12677/ml.2019.72027 Construction and Application of Chinese-English Bilingual Corpus for TCM Terminologies Xiao Ye1*, Ling Tong2 1Humanities and Management College, Zhejiang Chinese Medical University, Hangzhou Zhejiang 2College of Health Science, University of Wisconsin Milwaukee, Milwaukee USA Received: Apr. 1st, 2019; accepted: Apr. 16th, 2019; published: Apr. 23rd, 2019 Abstract In order to solve the problem of the confusion of English translation of terminology of traditional Chinese medicine (TCM) in the world, experts and scholars from several domestic and foreign au-thoritative organizations have tried to establish an international unified standard for it. However, due to the complexity of the English translation of TCM terminology, plus factors such as the history, economy, culture, and national discourse rights, many domestic and international standards for TCM terms have not been widely promoted and uniformly recognized in the world, resulting in ob-stacles of international exchanges. Under this circumstance, the author believes that by collecting and arranging various versions of TCM terminology translation standards at home and abroad, and applying corpus technology, the function of looking up multiple English versions of TCM terms can be achieved by one click. It can not only largely solve the problem of communication, but also make people understand more about the various meanings of the TCM terms and the situation in multiple versions of English translation. This article is to give some introductions and useful endeavors on the establishment and application of the Chinese-English bilingual corpus of TCM terminologies, hoping to contribute to TCM’s international exchanges and “One Belt One Road” services. Keywords Traditional Chinese Medicine (TCM), Terminology, English Translation, Corpus 中医药术语汉英双语平行语料库的创建和应用探讨 叶晓1*,童凌2 *通讯作者。

商务英语语料库的建设及应用

商务英语语料库的建设及应用初探 【摘要】语料库语言学作为一门新兴的语言学分支,其影响已遍及语言学研究的各领域。将语料库的方法应用于商务英语词汇教学中,发挥其语料真实丰富、计算机程序强大的重新组织语言数据的能力,既能提高学生商务词汇学习的效率和积极性,也能提高商务英语教学质量。本文从商务英语语料库的建设及其应用价值入手,以期语料库语言学为商务英语教学带来更多成果。 【关键词】商务英语语料库地方课程 商务英语(business english)是指商务场景下所应用到的英语,作为特殊目的英语(english for specific purpose)具有很强的专业性。商务英语跟普通英语(english for general purpose)最大区别之一就是专业词汇的大量使用,因此,词汇教学在商务英语教学中的作用不容忽视。语料库(corpus)是语言素材的集合体,能快速准确地提供诸如构词、搭配、语境等多方面的语料及信息。在外语学习中,语料库能够缩小课堂语言与真实语言的差距、培养学习者的语感和学习能力及研究能力,所以用语料库的方法来学习商务英语词汇既可以刺激学生的学习积极性,也可以更加准确、更加有效地掌握商务英语中专业特点较强的词汇。 1 语料库及其发展 语料库可以概述为运用随机抽样的方法,收集自然出现的连续的语言,运用文本或话语片断,并按照一定的语言学原则建成的具有

一定容量的语料体系。 语料库的发展大致经历了三个阶段:第一代语料库以20世纪60年代的brown corpus以及lob corpus为代表,由于是语料库发展的最初时期,所以规模都比较小,这个时期的语料库只能用来考查常用语言现象的频率,无法展现语言的全貌。第二阶段以20世纪80年代的birmingham collection of english language text以及longman/lancaster english为代表,这一时期的语料库建设以电子语料库的兴起为主要特征,语料库的容量不断扩大,种类不断增多。第三阶段从20世纪90年代至今,是语料库建设、研究与应用的迅猛发展阶段,功能更为强大的计算机系统软件的开发与应用致使第二代超大型计算机语料库开始出现,语料库进入了发展的黄金年代。 2 商务英语词汇及其特征 商务英语源于普通英语,并基于普通英语的基本语法、句法结构和词汇语,有普通英语的一些语言学特征。与此同时,作为应用在商务场合的英语,商务英语又是英语语言知识和商务专业知识的综合,因而又具有独有的专业特征。 2.1 在文体风格上,商务英语词汇属于庄重文体(frozen style)。庄重文体,即各体英语中正式程度最高的一种。这种“正式”一是为了在表达上追求准确、专业、标准化的效果,二是为了在思维上追求清晰和条理。许多商务词汇都表现出这一特性。

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

基于学习者英语语料的类联接研究概念、方法及例析

第127期2009年05月 外语电化教学 CAFLEC No.127 May2009 基于学习者英语语料的类联接研究 概念、方法及例析 许家金,熊文新 (北京外国语大学中国外语教育研究中心,北京100089) 摘要:本文主张类联接研究应兼顾词形、语法类别以及篇章和语类等不同语言层面来观察搭配行为。具体可包含:单个语法范畴的类联接、语法串分析、词形与语法范畴的类联接、不连续结构类联接、语法范畴与话语、语体的类联接等。本文结合中国英语学习者语料进行了示例分析,旨在说明可以结合类联接开展中间语对比分析、语体分析等。 关键词:类联接;学习者语料库;语料库语言学;研究方法;类联接分析器 中图分类号:H319.3文献标识码:A文章编号:1001-5795(2009)03-0018-0006 搭配(或称共现关系)是语料库语言学的核心概念之一。目前的搭配研究已不单限于词汇间的共现关系,很多学者试图借助语料库语言学的方法观察语法及其他语言相关层面的共现现象,其中以Hoey的“词汇触发”(1exiealpriming)理论涵盖层面最宽泛。Hoey将词汇间的共现关系扩展到词汇与其在篇章中的出现位置以及在不同文体中的分布等十个层面(2005:13)。事实上,对于搭配范围的不同处理,体现了不同的语境观,即对共现语境范围的不同认识。本文将基于赋码语料探讨如何兼顾词形和语法类别,以及篇章和语类等不同层面来观察搭配问题。本文示例所用语料主要为中国英语学习者英语。 1类联接及其扩展 1.1类联接 “类联接”(eolligation,又译作“类联结”或“类连接”)即语法层面的搭配关系。该术语由Firth(1957[1968]:181)提出,他将1watchedhim背后体现的“第一人称代词+动词过去时+第三人称代词”语法类别共现关系称为类联接。这一术语中的“类”即词类或语法类别之意。换言之,类联接就是有关词类或语法类别的共现关系。而新近的一些文献,如Baker,Hat-die&McEnery(2006:36)的《语料库语言学术语汇编》里对colligation这一词条的解释除了原有的句法共现关系外,还专门以window为例,说明window常和介词构成类联接。 目前的类联接研究很大程度得益于一些优良的自动词性赋码工具(如CLAWS,准确率高达96—7%)(Garside&Smith,1997)。因此通过赋码语料研究词类或语法类别的共现关系成为可能。相关研究大致分三类。一、有关赋码串(tagsequences或POSgrams)和语法搭配的总体分析(如,Aarts&Granger,1998;Tono,1999;Hunston&Francis,2000;濮建忠,2003b);二、针对某一词类的总体研究,通常以对动词的考察为主(如,Francis,Hunston&Manning,1996,1998;Mindt,1995,2002;濮建忠,2003a;孙海燕,2004;孙海燕,陈永捷,2006);三、还有一些专题研究。如Biber&Reppen(1998)关于补语从句,Gabrielatos(2007)关于if条件句的类联接,张军、李文中(2004)关于动名搭配,以及梁茂成(2008)有关情态序列的研究等。 作者简介:许家金:男,博士、副教授。研究方向:话语分析、语料库语言学。 熊文新:男,博士、副教授。研究方向:计算语言学。 收稿日期:2008-12-25 基金项目:本研究得到教育部人文社会科学研究项目(08JC740002)资助;本文的撰写还得到梁茂成教授的指导,在此一并致谢。?18?  万方数据

可以免费使用的大型英语语料库资源

英语语料库#参考 2012-03-02 22:29:26 ■BNC=The British National Corpus英国国家语料库 https://www.360docs.net/doc/4314240711.html,/(备用) https://www.360docs.net/doc/4314240711.html,/bnc/ ■ANC = The American National Corpus美国国家语料库 https://www.360docs.net/doc/4314240711.html,/ ■COCA = Corpus of Contemporary American English 美国当代英语语料库 https://www.360docs.net/doc/4314240711.html,/ ■COHA = Corpus of Historical American English 美国近当代英语语料库 https://www.360docs.net/doc/4314240711.html,/coha/ ■BOE=Bank of English 柯林斯英语语料库 https://www.360docs.net/doc/4314240711.html,/wordbanks/ ■NMC=New Model Corpus 新规范语料库 https://www.360docs.net/doc/4314240711.html,/ ■ARC=ACL Anthology Reference Corpus (ARC) 文选参考语料库 https://www.360docs.net/doc/4314240711.html,/auth/preloaded_corpus/aclarc/ske/first_form ■BAWE=British Academic Written Eng Corpus (BAWE) 英国学术书面语语料库 https://www.360docs.net/doc/4314240711.html,/auth/preloaded_corpus/bawe2/ske/first_form https://www.360docs.net/doc/4314240711.html,/AcaDepts/ll/app_ling/internal/bawe/sketch_engine_bawe.htm download ■BASE= British Academic Spoken English Corpus (BASE) 英国学术口语语料库 https://www.360docs.net/doc/4314240711.html,/fac/soc/celte/research/base/ ■SCTS=Scottish Corpus Of Texts and Speech苏格兰口语与书面语语料库 https://www.360docs.net/doc/4314240711.html,/ ■SCTS=Corpus Of Modern Scottish Writing 当代苏格兰语实库 https://www.360docs.net/doc/4314240711.html,/cmsw/ Slang https://www.360docs.net/doc/4314240711.html,/ (American, English, and Urban slang) https://www.360docs.net/doc/4314240711.html,/slang/ (UK) https://www.360docs.net/doc/4314240711.html,/ https://www.360docs.net/doc/4314240711.html,/cybereng/slang/ https://www.360docs.net/doc/4314240711.html,/ https://www.360docs.net/doc/4314240711.html,/

国家标准《建立术语研究用语料库的一般原则与方法》.

国家标准《建立术语研究用语料库的一般原则与方法》 (征求意见稿)编制说明 一、任务来源 随着科学技术的发展,新术语、新概念层出不穷,为了更好的管理、规范日益增多的新术语,需要借助更先进的工具及方法。目前国内外已经建立了大量的术语数据库,为了更好的对大量术语资源进行研究就需要建立术语语料库,大规模真实语料库是术语研究的可靠基础和最主要的来源,建设与术语库相配合的、统一规范的精加工术语语料库,可以使我们对中文术语构成、术语专业分布、术语地域分布、术语来源以及术语发展等各种复杂现象获得更为直观、深刻的全面认识,进而为推动中文术语规范化和标准化的进程、促进语言信息处理技术的总体发展起到关键的作用。因此制定建立术语语料库的标准已经十分必要。 GB/T XXXX-XXXX《建立术语研究用语料库的一般原则与方法》项目由中国标准研究中心提出,于2002年列入国家质量监督检验检疫总局制、修订国家标准项目计划,项目编号:20020411-T-424。该标准由中国标准研究中心归口,计划于2002年底完成。 二、工作情况: 1、标准起草小组的同志积极参与对《建立术语研究用语料库的一般原则与方 法》国家标准的制定工作,在工作中深入的研究了术语语料库的功能,吸取国内外先进经验,制定出一套实用的术语语料库建立标准。 2、进行了广泛的调研工作,搜集了使用者的一些建议,同时争求了一部分专 家的意见,作为本项目的重要参考。 3、在制定标准过程中,标准起草工作组根据实际情况制定工作计划,保证工 作顺利进行。 4、标准起草工作组多次召开会议,反复研究了《建立术语研究用语料库的一 般原则与方法》讨论稿,广泛征求了该专业领域的专家及用户的意见,对

语料库术语汇编

语料库术语汇编: Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 A WL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLA WS/Constituent Likelihood Automatic Word-tagging System CLA WS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学

最常用的英语动词(根据美国语料库整理 word 可打印)

be turn walk wear lie have start win support occur do might offer end accept say show remember hit identify go hear love base determine can play consider produce prepare get run appear eat argue would move buy teach recognize make like wait face indicate know live serve cover wonder will believe die describe lay think hold send catch fail take bring expect draw arrive see happen build choose name come must stay cause present could write fall point answer want provide cut listen compare look sit reach realize miss use stand kill place act find lose remain close state give pay suggest involve discuss tell meet raise increase force work include pass seek check may continue sell deal laugh should set require fight guess call learn report throw study try change decide fill prove ask lead pull represent hang need understand return focus design feel watch explain drop forget become follow hope plan claim leave stop develop push remove put create carry reduce sound mean speak drive note enjoy keep read break enter form let allow thank share establish begin add receive rise visit seem spend join shoot care help grow agree save avoid talk open pick protect imagine

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义 General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法 Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体 Alveolar 齿龈音

相关文档
最新文档