语料库术语表

合集下载

语料库语言学术语汇编V20-CORPUSnplcorpora

语料库语言学术语汇编V20-CORPUSnplcorpora
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化
Normalized frequency
标准化频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
Open-choice principle
Bi-hapax
两次词、二次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
语料库语言学术语汇编(V2.0)
Last updated2015-07-31by许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)、赋码
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词丛、词簇
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation

语料库术语表

语料库术语表
跟踪语料库、发展语料库、历时语料库
Machine-readable
机读的
Markup
标记、置标

MDA/Multi-dimensional approach
多维度分析法
Metadata
元信息
Meta-metadata
元元信息
MF/MD (Multi-feature/Multi-dimensional) approach
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字类的
Annotate
标注(动词)
Annotation
标注(名词)
·
Annotation scheme
标注方案
ANSI/American National Standards Institute
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Search term
检索项
Search word
检索词
}
Segmentation
切分、分词
Semantic preference
语义倾向
Semantic prosody
语义韵
SGML/Standard Generalized Markup Language

Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
Collocational framework/frame

CLEC中国英语学习者语料库

CLEC中国英语学习者语料库

CLEC中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。

表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计 1070602言语失误标注原则1. 简单合理,易于系统操作。

参与标注的人比较多,分类表过于繁复,就难于掌握。

我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。

每一类里再用数目字细分。

如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。

2. 分类表的类别要适中。

过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。

现在的分类表有61个失误码,是属于中等规模的分类表。

提供足够的失误信息(失误本身、失误类型和失误发生范围)。

例如In the past,[vp6, 4-] kind to each other…, 失误用方括号表示,放在失误people are 之后。

[vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。

要联系这4个词,才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 )Last updated 2012-10-08 by许家金Aboutness所言之事Absolute frequency绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的Annotate标注(动词)Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词)Annotation scheme标注方案ANSI/American National Standards Institute美国国家标准学会ASCII/American Standard Code for Information美国信息交换标准码ExchangeAssociates (of keywords)(主题词的)联想词AWL/academic word list学术词表Balanced corpus平衡语料库Base list/baselist底表、基础词表Bigram二元组、二元序列、二元结构Bi-text/bitext双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax两次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析Case-sensitive/case sensitivity大小写敏感、区分大小写Category-based approach基于类(范畴)的方法Chi-square test/ 2χ卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统tagging SystemClean text policy干净文本原则Cluster词簇、词丛Colligation类联接、类连接、类联结Collocate n./v.搭配词;搭配Collocability搭配强度、搭配力Collocation搭配、词语搭配Collocational strength搭配强度Collocational framework/frame搭配框架Collocational profile搭配概貌Collocational network搭配网络Comparable corpora类比语料库、可比语料库Computational Linguistics计算语言学ConcGram/concgram同现词列、框合结构Concord索引(行)(简略形式)Concordance (line)索引(行)Concordance plot(索引)词图Concordancer索引工具Concordancing索引分析Context语境、上下文Context word语境词Contextual prosody语境韵律Contingency table连列表、联列表、列连表、列联表Co-occurrence/Co-occurring共现、同现Corpus Linguistics语料库语言学Corpus, pl. corpora语料库Corpus-based基于语料库的Corpus-based translation studies基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究Corpus-driven语料库驱动的Corpus-informed语料库指导下的、参考了语料库的Corpus size库容Corpus stylistics语料库文体学Co-select/co-selection/co-selectiveness共选(机制)Co-text共文Data mining数据挖掘DDL/Data Driven Learning数据驱动学习Dependency(句法)依存关系Dice coefficient Dice 系数Disambiguation消歧Diachronic corpus历时语料库Discourse话语、语篇Discourse prosody话语韵律Documentation文检报告、备检文件、说明文档EAGLES/Expert Advisory Groups on Language EAGLES 文本规格Engineering StandardsEmpirical linguistics实证语言学Empiricism经验主义Encoding字符编码Error-tagging错误标注、错误赋码Explicitation显化Extended unit of meaning扩展意义单位File-based search/concordancing批量检索Firthian (linguistics)弗斯(语言学)、弗斯学派的(语言学)Formulaic sequence程式化序列、套语Frequency频数、频率Frequency list词频表General (purpose) corpus通用语料库Genre语体、体裁Grammatical patterning语法型式Granularity颗粒度Hapax legomenon/hapax一次词Header/corpus head文本头、头标、头文件Hidden Markov model (HMM)隐马尔科夫模型、隐马模型Idiom principle习语原则、成语原则Idiomaticity习语性、地道程度Implicitation隐化Index/indexing(建)索引In-line annotation文内标注、行内标注Interlanguage中介语、过渡语Inter-coder agreement/reliability标注者间一致性/信度Introspection/introspective内省(式)(的)Intuition直觉Key keywords关键主题词Keyness主体性、关键性Keywords主题词KWIC/Key Word in Context语境中的关键词、语境共现(方式)KWIC sort语境共现排序、索引行排序Learner corpus学习者语料库Lemma, pl. lemmata/lemmas词目、原形词、词元Lemmatization词形还原、词元化Lemmatizer词形还原工具、词元化工具Lexical bundle词束Lexical density词汇密度Lexical frequency profile词频概貌Lexical grammar词汇语法Lexical item词项、词语项目Lexical patterning词语型式、词汇型式Lexical priming词汇触发理论、词汇启动理论Lexical profile词汇分布概貌Lexical richness词汇丰富度Lexico-grammar词汇语法Lexis词语、词项、词语学Log-likelihood ratio对数似然比、对数似然率Longitudinal/developmental corpus跟踪语料库、发展语料库、历时语料库Machine-readable机读的Machine translation机器翻译Manual annotation手工标注Markup/mark-up标记、置标MDA (Multi-dimensional analysis/approach)多维度分析法Metadata元信息Meta-metadata元元信息MF/MD approach/multi-feature/multi-dimensional多特征/多维度分析法analysisMisuse误用Monitor corpus(动态)监察语料库Monolingual corpus单语语料库Multilingual corpus多语语料库Multimodal corpus多模态语料库MWU/multiword unit多词单位MWE/multiword expression多词表达MI/mutual information互信息、互现信息N-gram N 元组、 N 元序列、 N 元结构、 N 元词、多词序列Neo-Firth (school)新弗斯学派Neo-Firthian新弗斯学派的NLP/Natural Language Processing自然语言处理Node (word)节点(词)Normalization标准化、(翻译)规范化、泛化Normalized frequency标准化频率、标称频率、归一频率Observed corpus观察语料库Ontology知识本体、本体Open choice principle开放选择原则OrthographicOrthography正字法Overuse过多使用、超用、使用过度、过度使用Paradigmatic纵聚合(关系)的Parallel corpus平行语料库、对应语料库Parole linguistics言语语言学Parsed corpus句法标注的语料库、树库Parser句法分析器Parsing句法标注、句法分析Pattern/patterning型式、模式Pattern grammar型式语法Pattern matching模式匹配Pedagogic corpus教学语料库Phraseology短语、短语学Phraseological unit/sequence短语单位 /序列Plain text纯文本POSgram赋码序列、码串POS sequence赋码序列、码串POS tagging/Part-of-Speech tagging词性赋码、词性标注、词性附码POS tagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probabilistic grammar概率语法、概率性语法、盖然语法Probability概率Query查询、检索Range分布(范围)、跨度Rationalism理性主义Raw frequency原始频数、生频数Raw text/corpus生文本 /生语料Reference corpus参照语料库Regex/RE/RegExp/regular expressions正则表达式、正则式Register variation语域变异Relative frequency相对频率Representative/representativeness代表性(的)Rule-based基于规则的S-universals源语型共性(特征)Sample n./v.样本;取样、采样、抽样Sampling取样、采样、抽样Sanitization净化Search term检索项Search word检索词Segmentation切分、分词Semantic association语义联想Semantic preference语义倾向、语义趋向Semantic prosody语义韵Sentence alignment句对齐、句级对齐SGML/Standard Generalized Markup Language标准通用标记语言Simplification简化Skipgram跨词序列、跨词结构Span跨距Specialized corpus专用语料库、专门用途语料库、专题语料库Standardized type/token ratio标准化类符 /形符比、标准化类/形比、标准化型次比Standardized TTR/STTR标准化类符 /形符比、标准化类/形比、标准化型次比Stand-off annotation分离式标注Stochastic随机的Stop list停用词表、过滤词表Stop word停用词、过滤词Synchronic corpus共时语料库Syntagmatic横组合(关系)的T score T 值T-universals目标语型共性(特征)Tag赋码、标记、附码Tagger赋码器、赋码工具、标注工具Tagging赋码、标注、附码Tag sequence赋码序列、码串Tagset赋码集、码集Tertium comparationis对比中立项、对比基础Text文本Text type文体、文类Text category文体、文类Text mining文本挖掘TEI/Text Encoding Initiative TEI 文本编码计划The Lexical Approach词汇中心教学法The Lexical Syllabus词汇大纲Token形符、词次Token definition/word definition形符界定、单词界定Tokenization分词Tokenizer分词工具Transcription转写Translation memory翻译记忆(库)Translation norms翻译规范Translationuniversals/Universal features of 翻译共性、翻译普遍特征translationTranslational corpus翻译语料库Translationese翻译体、翻译腔Treebank树库Trigram三元组、三元序列、三元结构T-score T 值Type类符、词种、词型TTR类符 /形符比、类 /形比、型次比Type/token ratio类符 /形符比、类 /形比、型次比Underuse少用、使用不足Unicode通用码Unicodify按通用码编码、转换为通用码Unit of meaning意义单位WaC/Web as Corpus网络语料库、网库Wildcard通配符Word alignment词对齐、词级对齐Word form词形Word family词族Word list词表Word sketch词语素描WSD/Word-sense disambiguation词义消歧XML/Extensible Markup Language可扩展标记语言Zipf ’ s Law/Zipfian Law齐夫定律Z score Z 值常用语料库ACE Australian Corpus of EnglishANC American National CorpusARCHER A Representative Corpus of Historical English Registers BASE British Academic Spoken English CorpusBAWE British Academic Written English CorpusBNC British National CorpusBoE Bank of EnglishBrown Brown CorpusCANCODE Cambridge and Nottingham Corpus of Discourse in English CEC China English CorpusCEM Corpus for English MajorsCHILDES Child Language Data Exchange SystemCIC Cambridge International CorpusCLEC Chinese Learners English CorpusCLOB2009 Brown family corpus of British EnglishCOBUILD Collins Birmingham University International Language Database COCA The Corpus of Contemporary American EnglishCOLSEC College Learners Spoken English CorpusCOLT Bergen Corpus of London Teenage LanguageCrown2009 Brown family corpus of American EnglishFLOB Freiburg-LOB Corpus of British EnglishFROWN Freiburg-Brown Corpus of American EnglishHelsinki Diachronic part of the Helsinki Corpus of English Texts DiachroniccorpusHKCSE Hong Kong Corpus of Spoken EnglishICE International Corpus of EnglishICE-GB International Corpus of English: Great BritainICLE International Corpus of Learner EnglishJEFLL Japanese EFL Learner CorpusLCMC Lancaster Corpus Mandarin ChineseLINDSEI Louvain International Database of Spoken English Interlanguage LIVAC Linguistic Variations in Chinese Speech CommunitiesLLC London Lund CorpusLOB Lancaster-Oslo/Bergen CorpusLOCNESS Louvain Corpus of Native English EssaysLONGDALE LONGitudinal DAtabase of Learner EnglishMICASE Michigan Corpus of Academic Spoken EnglishMICUSP Michigan Corpus of Upper-level Student PapersNESSIE Native English Speakers ’Similarly and Identically-prompted EssaysPACCEL Parallel Corpus of Chinese EFL LearnersSBCSAE Santa Barbara Corpus of Spoken American EnglishSCCSD The Spoken Chinese Corpus of Situated DiscourseSCORE Singapore Corpus of Research in EducationSEC Spoken English CorpusSECCL Spoken English Corpus of Chinese LearnersSECOPETS Spoken English Corpus of Public English Test SystemSEU Survey of English UsageSWECCL Spoken and Written English Corpus of Chinese Learners WECCL Written English Corpus of Chinese LearnersLast updated 2012-08-08 by许家金。

语料库语言学术语汇编Aglossaryofcorpuslinguistics

语料库语言学术语汇编Aglossaryofcorpuslinguistics

语料库语言学术语汇编Aglossaryofcorpuslinguistics语料库语言学术语汇编(V2.0)Last updated 2012-10-08 by 许家金Aboutness 所言之事Absolute frequency 绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric 字母数字构成的Annotate标注(动词)Annotated text/corpus 标注文本/语料库、赋码文本/语料库Annotation标注(名词)Annotation scheme标注方案ANSI/American National Standards Institute美国国家标准学会ASCII/American Standard Code for Information Exchange美国信息交换标准码Associates (of keywords)(主题词的)联想词AWL/academic word list 学术词表Balanced corpus 平衡语料库Base list/baselist 底表、基础词表Bigram 二元组、二元序列、二元结构Bi-text/bitext双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax 两次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussion (新手)训练营大辩论/话语/大探讨CA/Contrastive Analysis 对比分析Case-sensitive/case sensitivity 大小写敏感、区分大小写Category-based approach 基于类(范畴)的方法Chi-square test/χ2 卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS 词性赋码系统Clean text policy 干净文本原则Cluster 词簇、词丛Colligation 类联接、类连接、类联结Collocate n./v.搭配词;搭配Collocability 搭配强度、搭配力Collocation搭配、词语搭配Collocational strength 搭配强度Collocational framework/frame 搭配框架Collocational profile搭配概貌、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。

语料库语言学术语汇编A glossary of corpus linguistics

语料库语言学术语汇编A glossary of corpus linguistics
短语单位/序列
Plain text
纯文本
POSgram
赋码序列、码串
POS sequence
赋码序列、码串
POS tagging/Part-of-Speech tagging
词性赋码、词性标注、词性附码
POS tagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
同现词列、框合结构
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化、泛化
Normalized frequency
标准化频率、标称频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
随机的
Stop list
停用词表、过滤词表
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
T score
T值
T-universals
目标语型共性(特征)

语料库词汇表

语料库词汇表
MI/Mutual information 互信息、互现信息
N-gram N元组、N元序列、N元结构、N元词、多词序列
NLP/Natural Language Processing 自然语言处理
Node 节点(词)
Normalization 标准化
Normalized frequency 标准化频率、标称频率、归一频率
Concordance (line) 索引(行)
Concordance plot (索引)词图
Concordancer 索引工具
Concordancing 索引生成、索引分析
Context 语境、上下文
Context word 语境词
Contingency table 连列表、联列表、列连表、列联表
Granularity 颗粒度
Hapax legomenon/hapax 一次词
Header/Text head 文本头、头标、头文件
HMM/Hidden Markov Model 隐马尔科夫模型
Idiom Principle 习语原则
Index/Indexing (建)索引
In-line annotation 文内标注、行内标注
Co-select/Co-selection/Co-selectiveness 共选(机制)
Co-text 共文
DDL/Data Driven Learning 数据驱动学习
Diachronic corpus 历时语料库
Discourse 话语、语篇
Discourse prosody 话语韵律
Documentation 备检文件、文检报告
EAGLES/Expert Advisory Groups on Language Engineering Standards EAGLES文本规格

语料库语言学术语集

语料库语言学术语集
EAGLES文本规格
Empirical Linguistics
实证语言学
Empiricism
经验主义
Encoding
字符编码
Error-tagging
错误标注、错误赋码
Extended unit of meaning
扩展意义单位
File-based search/concordancing
批量检索
Formulaic sequence
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
词汇触发理论
Lexical richness
词汇丰富度
Lexico-grammar/Lexical grammar
词汇语法
Lexis
词语、词项
LL/Log likelihood (ratio)
对数似然比、对数似然率
Longitudinal/Developmental corpus
跟踪语料库、发展语料库、历时语料库
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字类的
Annotate
标注(动词)
Annotation
标注(名词)
Annotation scheme
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
言语语言学
Parsed corpus
句法标注的语料库
Parser
句法分析器
Parsing
句法分析
Pattern/patterning
型式
Pattern grammar
型式语法
Pedagogic corpus
教学语料库
Phraseology
短语、短语学
POSgram
赋码序列、码串
POS tagging/Part-of-Speech tagging
Machine-readable
机读的
Markup
标记、置标
MDA/Multi-dimensional approach
多维度分析法
Metadata
元信息
Meta-metadata
元元信息
MF/MD (Multi-feature/Multi-dimensional) approach
多特征/多维度分析法
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
Collocational framework/frame
搭配框架
Comparable corpora
类比语料库、可比语料库
ConcGram
同现词列、框合结构
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引生成、索引分析
Context
语境、上下文
Context word
语境词
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
程式化序列
Frequency
频数、频率
General (purpose) corpus
通用语料库
Granularity
颗粒度
Hapax legomenon/hapax
一次词
Header/Text head
文本头、头标、头文件
HMM/Hidden Markov Model
隐马尔科夫模型
Idiom Principle
Observed corpus
观察语料库
Ontology
知识本体、本体
Open Choice Principle
开放选择原则
Overuse
超用、过多使用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallel corpus
平行语料库、对应语料库
Parole linguistics
Mini-text
微型文本
Misuse
误用
Monitor corpus
(动态)监察语料库
Monolingual corpus
单语语料库
Multilingual corpus
多语语料库
Multimodal corpus
多模态语料库
MWU/Multiword unit
多词单位
MWE/Multiword expression
多词单位
MI/Mutual information
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
NLP/Natural Language Processing
自然语言处理
Node
节点(词)
Normalization
标准化
Normalized frequency
标准化频率、标称频率、归一频率
检索项
Search word
检索词
Segmentation
切分、分词
Semantic preference
语义倾向
Semantic prosody
语义韵
SGML/Standard Generalized Markup Language
标准通用标记语言
Skipgram
跨词序列、跨词结构
Span
跨距
Special purpose corpus
文本编码计划
The Lexical Approach
词汇中心教学法
The Lexical Syllabus
词汇大纲
Token
形符、词次
Token definition
形符界定、单词界定
Tokenization
分词
Tokenizer
分词工具
Transcription
转写
Translational corpus
正则表达式
Register variation
语域变异
Relative frequency
相对频率
Representative/Representativeness
代表性(的)
Rule-based
基于规则的
Samplen./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Search term
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
Tag
标记、码、标注码
Tagger
赋码器、赋码工具、标注工具
Tagging
赋码、标注、附码
Tag sequence
赋码序列、码串
Tagset
赋码集、码集
Text
文本
TEI/Text Encoding Initiative
翻译语料库
Treebank
树库
Trigram
三元组、三元序列、三元结构
T-score
T值
Type
类符、词型
TTR/Type-token ratio
类符/形符比、类/形比、型次比
Underuse
少用、使用不足
Unicode
通用码
Unit of meaning
意义单位
WaC/Web as Corpus
网络语料库
专用语料库、专门用途语料库、专题语料库
Specialized corpus
专用语料库
Standardized TTR/Standardized type-token ratio
标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation
分离式标注
Stop list
停用词表、过滤词表
Lemma
词目、原形词、词元
Lemma list
词形还原对应表
Lemmata
词目、原形词、词元(复数)
Lemmatization
词形还原、词元化
Lemmatizer
词形还原(词元化)工具
Lexical bundle
词束
Lexical density
词汇密度
Lexical item
词项、词语项目
Lexical priming
Wildcard
通配符
Word definition
单词界定
Word form
词形
Word family
词族
Word list
词表
XML/EXtensible Markup Language
可扩展标记语言
Zipf's Law
齐夫定律
Z-score
Z值
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
美国国家标准学会
ASCII/American Standard Code for Information Exchange
美国信息交换标准码
Associate(of keywords)
(主题词的)联想词
AWL/Academic word list
学术词表
Balanced corpus
平衡语料库
Base list
词汇触发理论
Lexical richness
词汇丰富度
Lexico-grammar/Lexical grammar
词汇语法
Lexis
词语、词项
LL/Log likelihood (ratio)
对数似然比、对数似然率
Longitudinal/Developmental corpus
跟踪语料库、发展语料库、历时语料库
共选(机制)
Co-text
共文
DDL/Data Driven Learning
数据驱动学习
Diachronic corpus
历时语料库
Discourse
话语、语篇
Discourse prosody
话语韵律
Documentation
备检文件、文检报告
EAGLES/Expert Advisory Groups on Language Engineering Standards
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐AlLeabharlann hanumeric字母数字类的
相关文档
最新文档