基于语料库的X-er名词构式

合集下载

语料库术语汇编

语料库术语汇编语料库术语汇编：Aboutness 所言之事Absolute frequency 绝对频数Alignment (of parallel texts) （平行或对应）语料的对齐Alphanumeric 字母数字类的Annotate 标注（动词）Annotation 标注（名词）Annotation scheme 标注方案ANSI/American National Standards Institute 美国国家标准学会ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) （主题词的）联想词A WL/Academic word list 学术词表Balanced corpus 平衡语料库Base list 底表、基础词表Bigram 二元组、二元序列、二元结构Bi-hapax 两次词Bilingual corpus 双语语料库CA/Contrastive Analysis 对比分析Case-sensitive 大小写敏感、区分大小写Chi-square (χ2) test 卡方检验Chunk 词块CIA/Contrastive Interlanguage Analysis 中介语对比分析CLA WS/Constituent Likelihood Automatic Word-tagging System CLA WS词性赋码系统Clean text policy 干净文本原则Cluster 词簇、词丛Colligation 类联接、类连接、类联结Collocate n./v. 搭配词；搭配Collocability 搭配强度、搭配力Collocation 搭配、词语搭配Collocational strength 搭配强度Collocational framework/frame 搭配框架Comparable corpora 类比语料库、可比语料库ConcGram 同现词列、框合结构Concordance (line) 索引（行）Concordance plot （索引）词图Concordancer 索引工具Concordancing 索引生成、索引分析Context 语境、上下文Context word 语境词Contingency table 连列表、联列表、列连表、列联表Co-occurrence/Co-occurring 共现Corpora 语料库（复数）Corpus Linguistics 语料库语言学Corpus 语料库Corpus-based 基于语料库的Corpus-driven 语料库驱动的Corpus-informed 语料库指导的、参考了语料库的Co-select/Co-selection/Co-selectiveness 共选（机制）Co-text 共文DDL/Data Driven Learning 数据驱动学习Diachronic corpus 历时语料库Discourse 话语、语篇Discourse prosody 话语韵律Documentation 备检文件、文检报告EAGLES/Expert Advisory Groups on Language Engineering Standards EAGLES文本规格embedded annotation 嵌入式标注Empirical Linguistics 实证语言学Empiricism 经验主义Encoding 字符编码Error-tagging 错误标注、错误赋码Extended unit of meaning 扩展意义单位File-based search/concordancing 批量检索Formulaic sequence 程式化序列Frequency 频数、频率General (purpose) corpus 通用语料库Granularity 颗粒度Hapax legomenon/hapax 一次词Header/Text head 文本头、头标、头文件HMM/Hidden Markov Model 隐马尔科夫模型Idiom Principle 习语原则Index/Indexing （建）索引In-line annotation 文内标注、行内标注Key keyword 关键主题词Keyness 主题性、关键性Keyword 主题词KWIC/Key Word in Context 语境中的关键词、语境共现（方式）Learner corpus 学习者语料库Lemma 词目、原形词、词元Lemma list 词形还原对应表Lemmata 词目、原形词、词元（复数）Lemmatization 词形还原、词元化Lemmatizer 词形还原（词元化）工具Lexical bundle 词束Lexical density 词汇密度Lexical item 词项、词语项目Lexical priming 词汇触发理论Lexical richness 词汇丰富度Lexico-grammar/Lexical grammar 词汇语法Lexis 词语、词项LL/Log likelihood (ratio) 对数似然比、对数似然率Longitudinal/Developmental corpus 跟踪语料库、发展语料库、历时语料库Machine-readable 机读的Markup 标记、置标MDA/Multi-dimensional approach 多维度分析法Metadata 元信息Meta-metadata 元元信息MF/MD (Multi-feature/Multi-dimensional) approach 多特征/多维度分析法Mini-text 微型文本Misuse 误用Monitor corpus （动态）监察语料库Monolingual corpus 单语语料库Multilingual corpus 多语语料库Multimodal corpus 多模态语料库MWU/Multiword unit 多词单位MWE/Multiword expression 多词单位MI/Mutual information 互信息、互现信息N-gram N元组、N元序列、N元结构、N元词、多词序列NLP/Natural Language Processing 自然语言处理Node 节点（词）Normalization 标准化Normalized frequency 标准化频率、标称频率、归一频率Observed corpus 观察语料库Ontology 知识本体、本体Open Choice Principle 开放选择原则Overuse 超用、过多使用、使用过度、过度使用Paradigmatic 纵聚合（关系）的Parallel corpus 平行语料库、对应语料库Parole linguistics 言语语言学Parsed corpus 句法标注的语料库Parser 句法分析器Parsing 句法分析Pattern/patterning 型式Pattern grammar 型式语法Pedagogic corpus 教学语料库Phraseology 短语、短语学POSgram 赋码序列、码串POS tagging/Part-of-Speech tagging 词性赋码、词性标注、词性附码POS tagger 词性赋码器、词性赋码工具Prefab 预制语块Probabilistic （基于）概率的、概率性的、盖然的Probability 概率Rationalism 理性主义Raw text/Raw corpus 生文本（语料）Reference corpus 参照语料库Regex/RE/RegExp/Regular Expressions 正则表达式Register variation 语域变异Relative frequency 相对频率Representative/Representativeness 代表性（的）Rule-based 基于规则的Sample n./v. 样本；取样、采样、抽样Sampling 取样、采样、抽样Search term 检索项Search word 检索词Segmentation 切分、分词Semantic preference 语义倾向Semantic prosody 语义韵SGML/Standard Generalized Markup Language 标准通用标记语言Skipgram 跨词序列、跨词结构Span 跨距Special purpose corpus 专用语料库、专门用途语料库、专题语料库Specialized corpus 专用语料库Standardized TTR/Standardized type-token ratio 标准化类符/形符比、标准化类/形比、标准化型次比Stand-off annotation 分离式标注Stop list 停用词表、过滤词表Stop word 停用词、过滤词Synchronic corpus 共时语料库Syntagmatic 横组合（关系）的Tag 标记、码、标注码Tagger 赋码器、赋码工具、标注工具Tagging 赋码、标注、附码Tag sequence 赋码序列、码串Tagset 赋码集、码集Text 文本TEI/Text Encoding Initiative 文本编码计划The Lexical Approach 词汇中心教学法The Lexical Syllabus 词汇大纲Token 形符、词次Token definition 形符界定、单词界定Tokenization 分词Tokenizer 分词工具Transcription 转写Translational corpus 翻译语料库Treebank 树库Trigram 三元组、三元序列、三元结构T-score T值Type 类符、词型TTR/Type-token ratio 类符/形符比、类/形比、型次比Underuse 少用、使用不足Unicode 通用码Unit of meaning 意义单位WaC/Web as Corpus 网络语料库Wildcard 通配符Word definition 单词界定Word form 词形Word family 词族Word list 词表XML/EXtensible Markup Language 可扩展标记语言Zipf's Law 齐夫定律Z-score Z值。

“有X有Y”构式中“X”与“Y”的内部语义研究

“有X有Y”构式中“X”与“Y”的内部语义研究基于认知语义理论，借助CCL语料库，结合定性和定量分析，考察“有X 有Y”中单音节“X”与“Y”的语义特征，旨在促进对外汉语教学与构式本体研究。

研究发现：1.“X”与“Y”语义呈现不同层面的语义关联，且其关联度与使用频数成正比。

2.X与Y的语义及其词性存在关联，语义相近或相关时，多为体词性语素，而语义相反或相对时，多为谓词性语素；语义不相关①时，与语义相近或相关时的句法分布相似。

3.“X”“Y”的语义的关联特性首先受制于象似性原则、认知能量分配原则和经济原则折三种认知原则，其次受制于构式的客观描述的整体语义及体词与谓词的语义表达之分工互补性。

标签：“有X有Y” 认知语义语义关联原则制约一、引言“有X有Y”构式是现代汉语中使用较频繁的构式，近年来，众多的研究者从语义、句法、语用等角度对其进行了研究。

在语义上，刘凌宇（2012）和张璋（2012）对“X、Y”进行语义关系分类；陈慧（2004）得出“有X”与“有Y”的“一维同时”“一维异时”和“多维同时”三种内部语义关联；刘银姣（2011）和胡伟、王嘉（2015）研究了“有X”与“有Y”之间关系和“有X有Y”的构式语义。

但立足定量分析和认知视角深入探求其内部语义者鲜见。

另外，前人的研究大多限于“有X有Y”构式所形成的类固定短语，本文将研究范围拓展至非类固定短语（如“有桌有床”）。

主要研究如下三种构式②：a.我们有牙有手！（“X，Y”为N单音节）b.有说有笑。

（“X，Y”为V单音节）c.有大有小。

（“X，Y”为A单音节）*d.有勺有门。

（“X，Y”具有制约性）“有X有Y”属于同一个义群或“有X”与“有Y”为并列的两个义群（如“有吃有住有穿”不在研究之列）。

本文拟基于认知语义理论和定量分析结果，深入探究单音节“X、Y”的内部语义关系及其认知制约原则，旨在促进对外汉语教学与此构式本体研究。

二、“X”与“Y”语义关系的定性研究来自CCL语料显示，“X与Y”之间存在三类语义关系：相近或相关、不相关、相反或相对，在所得1043个“有X有Y”构式中，语义相近或相关的有508个，语义不相关的有162个，语义相反或相对的有373个。

基于语料库的动词与构式关系研究以sneeze及物动词用法的规约化为例

基于语料库的动词与构式关系研究以sneeze及物动词用法的规约化为例一、本文概述本文旨在通过语料库语言学的方法，深入探讨动词与构式之间的关系，并以“sneeze”这个及物动词的用法规约化为例进行详细阐述。

本文将首先回顾现有的语言学理论，分析动词和构式的基本定义及相互关系，探讨它们在语言结构中的作用。

随后，本文将运用语料库分析工具，对“sneeze”在实际语料中的使用情况进行定量和定性分析，揭示其作为及物动词的用法如何被规约化，即如何在语言使用中逐渐形成并固定下来。

通过这一研究，我们期望能够更深入地理解动词与构式之间的互动关系，以及这种关系如何影响语言的生成和理解。

本文还将探讨这种研究方法在语言学其他领域的应用潜力，以期为未来语言学研究提供新的视角和思路。

二、文献综述动词与构式关系的研究一直是语言学领域的热点和难点问题。

近年来，随着语料库语言学的发展，越来越多的学者开始利用语料库对动词与构式的关系进行实证研究。

本文旨在基于语料库的方法，以“sneeze”及物动词用法的规约化为例，探讨动词与构式之间的互动关系。

在早期的语言学研究中，动词通常被视为句子的核心，负责表达事件的主要动作或状态。

而构式则被看作是语言中的固定结构，具有一定的语法和语义功能。

然而，随着研究的深入，学者们逐渐发现动词与构式之间的关系并非简单的“核心-框架”关系，而是相互影响、相互制约的动态关系。

近年来，语料库语言学的发展为动词与构式关系的研究提供了新的视角和方法。

通过大规模的语料库数据，学者们可以更准确地描述动词在不同构式中的使用情况，进而揭示动词与构式之间的互动规律。

例如，一些研究发现，某些动词在某些构式中的使用频率较高，而这些构式往往具有一定的语义特征，从而形成了动词与构式之间的规约化关系。

在已有的研究中，对于“sneeze”这一动词的研究相对较少。

然而，从其语义特征来看，“sneeze”具有明确的动作性和及物性，因此具有较高的研究价值。

基于语料库的研究生学术英语语篇中外壳名词使用分析

基于语料库的研究生学术英语语篇中外壳名词使用分析一、本文概述随着语料库语言学的发展，外壳名词（Shell Nouns）在学术英语语篇中的使用逐渐受到研究者的关注。

本文旨在通过语料库分析的方法，深入探究研究生学术英语语篇中外壳名词的使用情况。

本文将首先对外壳名词的定义和分类进行梳理，然后基于自建的研究生学术英语语料库，对外壳名词的使用频率、分布特征以及语境功能进行详细分析。

本文还将对比研究不同学科领域中外壳名词使用的差异，以期揭示外壳名词在学术英语语篇中的重要性和作用。

本研究不仅有助于提升研究生学术英语写作能力，也为学术英语教学和语料库语言学研究提供有益的参考。

二、文献综述外壳名词，作为一种语言现象，在学术英语中扮演着重要的角色。

近年来，随着语料库语言学的发展，越来越多的学者开始关注外壳名词在学术英语中的使用情况。

本文旨在基于语料库的研究方法，探讨研究生学术英语语篇中外壳名词的使用特点及其背后的动因。

在已有的研究中，外壳名词被认为是学术英语中一种重要的词汇资源，能够帮助作者构建严谨的学术论证，提高文本的客观性和科学性。

一些学者通过语料库分析的方法，发现外壳名词在学术英语中的使用频率较高，且在不同的学科领域存在使用差异。

这些差异不仅反映了不同学科的语言特点，也反映了不同学科的研究者对于知识构建和表达的偏好。

还有研究关注了外壳名词的语义功能和语用功能。

语义功能上，外壳名词能够抽象化、概念化复杂的学术概念，帮助读者更好地理解和把握文章的主旨。

语用功能上，外壳名词的使用能够增强文本的客观性，减少作者的主观色彩，提高文本的说服力。

然而，尽管外壳名词在学术英语中的使用已经得到了广泛的关注，但仍然存在一些问题和争议。

例如，如何准确识别和界定外壳名词，如何有效地从语料库中提取和分析外壳名词的使用数据，以及如何深入解释外壳名词使用的动因和效果等。

这些问题都是需要进一步研究和探讨的。

本文将在已有研究的基础上，利用语料库的研究方法，对研究生学术英语语篇中外壳名词的使用进行深入的分析和探讨。

基于语料库的名词单复数失误研究

第30卷第5期广东海洋大学学报V ol.30 No.52010年10月 Journal of Guangdong Ocean University Oct. 2010收稿日期：2010-05-12基金项目：广东海洋大学人文社会科学研究资助项目第一作者：庄萍，女，1965年生，本科，硕士，高级讲师，研究方向：英语语言文学与应用语言学。

基于语料库的名词单复数失误研究庄萍（广东海洋大学外国语学院，外国语言与教学研究所，广东湛江 524088）摘要：利用中国学习者英语语料库，结合定量和定性研究方法，对中国英语学习者作文里英语名词单复数失误的现象进行了研究，发现：1）学习者的母语干扰是造成名词单复数失误的主要原因；2）中国学习者名词单复数失误最多的是名词复数形式使用不足；3）名词单复数失误与学习者英语水平相关主要表现在：低水平学习者使用失误的名词多数为常用的简单的名词，水平较高的学习者使用失误的名词多数是较复杂的抽象或物质名词。

并探讨了基于语料库的研究对英语教学所带来的启示。

关键词：语料库；名词的数；错误分析；语言迁移中图分类号：H319 文献标志码：A 文章编号：1673-9159(2010)05-0076-07A Corpus-based Study on the Errors of Number of English NounsZHUANG Ping（Faculty of Foreign Languages ，Foreign Language and Teaching Research Institute ，Guangdong Ocean University, Zhanjiang 524025，China ）Abstract: This paper is a corpus-based study on the errors of number of English nouns committed by Chinese English learners in writing. It makes use of the Chinese Learner English Corpus (CLEC) and adopts both the qualitative and quantitative methods.Based on the results of the error analysis ，this study mainly finds out: 1) most errors of number of English nouns committed by Chinese learners are attributable to mother tongue interference; 2) most errors of noun number committed by Chinese learners are the errors of underuse of the plural markers due to L1 transfer; 3) the errors do have something to do with the English proficiency of the Chinese learners: the nouns with number errors used by ST2 and ST4 students are mostly simple nouns ; while the nouns with number errors used by ST6 students are difficult abstract or material nouns. In conclusion, some suggestions concerning the pedagogical implications of corpus-based study to English teaching in China are made. Key words : corpus; number of nouns; error analysis; language transfer很多研究者利用语料库对学习者的错误进行分析研究。

网络流行语“X精”语义及语用分析

开封文化艺术职业学院学报Journal of Kaifeng Vocational College of Culture & Art 2021年2月20日Feb.20 2021第41卷第2期Vo1.41 No.2doi:10.3969/j.issn.2096-7853.2021.02.023网络流行语“X精”语义及语用分析赵一锦李国宏于雯（西华大学外国语学院，四川成都 610039）摘要：近年来，网民们频繁使用“柠檬精”“杠精”“猪精”等“X精”词汇，使其成为网络流行词汇。

分析“X精”语义及语用情况能进一步探究网民情感与网络流行语之间的关系。

研究发现，“X精”形式满足语言中的经济原则，其使用更能隐晦表达网民感情。

这一发现有助于研究近年来网民情感变化趋势，从而反映出语言和变化中的社会文化之间的关系。

关键词：网络热词；“X精”；语义分析；语用分析中图分类号：H030 文献标识码：A 文章编号：2096-7853（2021）02-0051-04多元的文化交融造就了多样化的语言，丰富了网民的情感，并最终使出现的网络用语迅速走红，因此，本文试从社会环境着手分析网络流行语风靡背后人们的心理动机。

反过来，对网络流行语的语用进行研究也能够顺势探索出中国网民所关注的焦点，从而总结这些焦点反映的网民感情偏好和发展情况。

一、“X精”的语义结构根据阿黛尔·葛德伯格（Adele E. Goldberg）所说，当语言表达形成构式时，一般表明这种语言表达能够在形式和意义上配对，同时其意义超越其构成成分意义的简单组合［1］。

例如，“戏精”一词是“X 精”最早流行起来的样式，却不是最早出现的样式，早在明代吴承恩的《西游记》中便有“白骨精”“蜘蛛精”等“X精”的出现［2］，但语素意义却与本文中讨论的“X精”大相径庭。

《西游记》中的“X精”就是各类妖精的一个称呼，而现在流行的“X精”并不是指某种妖精，而是对具有X特性的一类人的称呼，更加具有语用价值。

现代汉语言论文关于汉语语言的论文

现代汉语言论文关于汉语语言的论文汉语“X俩”构式的组配模式及其制约规律与语篇频率研究摘要：本文在构式语法理论框架下，通过分析来自大型语料库的真实语言材料，集中讨论了现代汉语“X俩”构式的组配模式及其制约规律与语篇频率。

研究发现：第一，“X俩”构式具有“代词复数俩”模式、“代词单数俩”模式、“NP单数俩”模式、“NP儿俩”模式、“NP1+NP2俩”模式和“混合”模式等六类常见组配模式；第二，“X俩”组配模式受制于词类有限律、人称代词无制约律、混合模式的词类排斥律和组构单位量值制约律等形式制约规律，这些形式规律受“双人定指”语义制约律、三重同指极量制约律、信息值等级制约律和语义关系亲密律等语义制约规律的支配；第三，“X俩”组配模式构成一个语篇频率等级，“代词单数俩”模式是无标记的组配模式，混合模式是标记最强的组配模式；第四，“俩”的典型语义特征是[+人]、[+非正式]和[+复指]。

关键词：“X俩”构式组配模式制约规律语篇频率一、引言数是一个具有语言普遍性的基本范畴，但数的类型系统存在语言类型差异。

可以是单数、复数、双数或少数。

（Comrie，1989；GivÓn，1993；Croft，2003；Corbett，2005）。

我们认为，汉语有单数、双数、三数和复数①，其中单数、复数是主要数类型，单数是其无标记形式。

如：（1）a.孔子及其弟子常被后世尊作圣人。

b.弟子们都很尊敬孔子。

c.弟子都很尊敬孔子。

“俩”和“仨”分别是现代汉语“双数”和“三数”的语法标记。

“俩”尚处于语法化过渡阶段，兼有独立和依附双重属性：前者为词，如例（2）a；后者为“双数”语法标记，语音弱化为“liã”。

②双数标记“俩”正是本文的关注对象，如例（2）b。

（2）a.一共五个，我吃了俩，他吃了仨。

b.我们俩是好朋友。

*c.俩是好朋友。

二、关于“俩”的相关研究关于“俩”，为数不多的专题研究不同程度地关注了“俩”的起源、词性、语义、语音、句法与类型学意义。

基于语料库的“X个锤子”构式研究

基于语料库的“X个锤子”构式研究发布时间：2022-08-04T02:22:50.947Z 来源：《教学与研究》2022年第6期56卷作者：郑玉英[导读] 本文基于BCC语料库，从构式语法的视角，对“X个锤子”该构式的构式表征、语义进行分析郑玉英四川外国语大学英语学院，重庆 400031摘要：本文基于BCC语料库，从构式语法的视角，对“X个锤子”该构式的构式表征、语义进行分析。

研究发现：（1）在构式表征方面，部件X可为动词、形容词和各类短语等，“X个锤子”不能与否定词共现，且包含“X个锤子X”、“X是/像个锤子”两种变体；（2）在语义方面，该构式表达否定的反预期情感，以及藐视、气愤、不满的等负面情感。

关键词：BCC语料库；“X个锤子”构式；构式表征；语义引言“X个锤子”是现代汉语中较为常见的一种口语构式，在川渝地区使用尤其普遍。

该构式具有较高的能产性，且承载着较为丰富的语用信息，极大丰富了人们的表达手段。

然而，迄今为止，尚无人基于构式语法研究框架对口语句式“X个锤子”进行分析。

鉴于此，本文拟基于北京语言大学开发的BCC语料库对该构式的构式表征、语义特征展开分析，进而丰富构式语法研究成果。

一、研究方法认知语言学主张基于使用的语言观（usage-based approach），认为语言结构来自语言使用，语言研究应基于语言使用，与大规模语料库相结合。

近年来，认知语言学出现了“量化”转向。

其中，语料库法在认知语言学研究中占领了重要地位。

正因如此，日益增多的构式语法研究基于语料库方法展开。

可以说，语料库法为构式语法研究开启了一扇新的视窗，势将极大丰富构式语法研究成果。

本文拟以“个锤子”作为检索词，从BCC语料库（BLCU Corpus Center，简称BCC）中进行检索，共获得语料208条。

剔除不符合“X个锤子”构式的语料，最终共获得有效语料162条。

BCC语料库是由北京语言大学语料库中心研发的在线语料库。

基于语料库的网络语“X精”流行构式与认知解读

NEWS RESEARCH基于语料库的网络语鲤X精”流行构式与认知解读□周飞沈莹【摘要】各种"X精”的变体相继出现于网络，并广泛运用于人们的日常生活，本研究视其为一种构式。

通过对语料库的数据整理和实例分析可知：形式上，"X精”的普遍流行构式以名词论元形式为主；语义上，“X精”类词汇具备内涵义、风格义、感情义和反射义四个特征；认知上，图形-背景理论、原型范畴理论、隐喻理论和转喻理论对“X精”构式的形成与识解具有重要作用。

【关键词】语料库；“X精”构式；语义内涵；认知机制一、引语网络流行语作为一种社会潮流影响下的语言表达，总能在短时间内迅速获得网民的青睐，进而在人们的日常生活中广泛传播和使用。

例如，2017年出现的网络流行语“戏精”，随后猪精、蛇精、人精、排骨精等“X精”类语言形式高频率出没于网络和人们的社交生活，即便是进入2019年，该语言形式仍然被广泛使用。

“鸽子精、柠檬精、芒果精”疯狂被网民转载，并被制作成各式各样的表情包来言情达意。

依据Goldberg'的观点，一种语言表达如果具备形式和意义的配对，且该语言表达的意义并不是其构成成分意义的简单组合，那么这种语言表达便形成一种构式。

例如“柠檬精”，该语言表达的意义并不是“柠檬”和“精”两种字词意义的组合，该词语在网络上喻指那些爱吃醋的人。

笔者根据Goldberg的构式理论，提炼出“X精”的构式结构，基于国家语委现代汉语语料库和北京语言大学BCC现代汉语语料库探索其流行构式搭配，并进一步研究“X精”类构式的语义内涵，同时在其语义识解的过程中探究其可能存在的认知机制。

二、“X精”类词的构成“X精”的体现形式最早出现于1947年人民日报中出现的“心眼精”一词，随后各种各样的“X精”类变体流传开来，并呈现递增的趋势。

形式上，“X精”类词由“X”和“精”两个部分组成，“X”可以看作是一个变量，“精”是一个不变【作者简介】周飞，广西大学外国语学院，硕士研究生。

基于语料“xx哥”构式论文

基于语料的“xx哥”构式分析摘要：文章首次尝试以百度“互动百科”为语料库对“xx哥”构式进行分析。

研究表明：该构式句法上传承整合了“偏正构式”、“双音节构式”和“三音节构式”的形式特征；表达的整体意义是“因特别的行为或特殊的才能而吸引纵多眼球的男子”；并实现了调侃、幽默和指称的语用功能。

关键词：xx哥；构式；句法特征；语义特征；语用特征中图分类号：h03 文献标识码：a文章编号：1009-0118（2012）07-0311-01“xx哥”是近年来网络时代催生出的众多新表达之一。

随着2010年初”犀利哥”的网络走红，网民和媒体竞相仿效，一两年间，网络和纸媒创造出了数百条以“xx哥”为形式的新词语，这一现象也引起了语言研究者的兴趣。

我们在知网上共搜到5篇文章，都发表于2011年，从不同的视角分析了“xx哥”的特征和成因。

但偏重于其语义泛化的衍生机制上的探讨，未对其具体特征做详细分析。

根据langacker（2008）的观点，一个音义配对体形成一个“象征单位”，两个或两个以上的象征单位形成一个“构式”。

［1］由于“xx 哥”刚好由两个象征单位“xx”和“哥”构成，所以它就是一个构式。

因此，文章将以百度互动百科为语料库，以构式语法理论为指导，对“xx哥”构式进行句法、语义和语用特征的逐一分析。

一、语料说明语料语言学在行为主义的影响下，从60年代开始发展，迄今已经有近五十年的历史。

简而言之，就是以语料库为手段来研究语言。

因其有自己独到的理论体系和操作方法，有人把语料库语言学（corpus linguistics）看作一个独立的学科，但另一些学者仅把它看作一种研究方法。

该文就是基于这种方法对“xx哥”的一个实证研究。

由于该构式是近两三年来兴起的一个新表达，而且不断有新词语补充进来，为了获得最新的数据，我们尝试利用“互动百科”作为语料库对“xx哥”进行研究。

我们利用互动百科中的搜索引擎直接键入“哥”进行搜索，并进行人工排查，共获得255条合格语料。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2012年Vol.27 No.10南昌教育学院学报外语研究收稿日期：2012-09-15作者简介：欧平娅（1982-），女，重庆人，从事语言学及二语习得方向的研究。

词汇是语言大厦的基石。

正如语言学家Wilkins所说：没有句法我们可以表达有限的思想，而如果没有词汇，就什么都表达不了[1]。

所以研究词汇，无论是对语言理论的建构还是对教学实践而言，都具有重大的意义。

如果说自然界万物的生存之道受制于自然法则，那么词汇的发展就是人选择的结果。

正是人对客观世界进行概念加工的基础上才产生了语言[2]。

人在建构这个世界的同时，也在积极地建构着语言。

词汇的生成机制折射出人的认知规律。

本文正是以此为出发点，在语料库的基础上，尝试结合语言共时研究和历时研究，探究生成X-er类名词构式背后的认知机制。

一、研究目的X-er名词构式是英语语言学界的研究热点之一。

相关研究对X-er派生词的构造类型、语义扩展及其指称功能实现的理据都作了探讨，但分析主要是依赖语言直觉，而不是基于实际的语言使用展开。

如果能够有来自语料库的数据支撑，那么X-er 类名词构式将会得到更逼真的剖析。

因此本文在语料库的驱动下，以认知视角下的隐喻延伸为依据，尝试对X-er类名词构式作出更真切的描写和解释。

二、数据采集本文利用美国杨伯翰大学Mark Davies教授开发的COCA美国当代英语语料库(该语料库库容量为4亿词汇，涵盖美国1990年至2009年间20年内的各种类型语料，是当今世界上最大的英语平衡语料库)，对X-er类名词构式的使用情况进行统计，检索出4000个条目(检索条件为：*er.(n*))。

检索结果表明：X-er类构式具有很强的典型性，后缀-er 能产性很强。

但是该类构式具有不同的固化程度，很多词词汇化程度较低，只能依附语境以发挥应急或“应景”作用，只是一种灵活的应急手段，难以准确揭示X-er类名词构式的生成机制。

经过初步判断筛选，根据词频高低，选出400条。

研究发现：在词汇化程度较高的构式中，存在着规律。

在经济原则和准确原则的指导下，取前50条作精确分析，结合词源词典，作进一步研究，尝试从历时和共时两个纬度对X-er类名词构式的生成作出认知解释。

三、研究结果(一)X-er构式中词基X的词性后缀-er源于古英语-ere，能产性历来很强。

早期主要附于动词，其派生词主要指称词基的动作执行者(即施事)。

到了现代英语，-er的词基的词性类别逐渐扩大而包括名、形、介等词类，甚至短语及组合形式也能充当词基。

但是实际上对于词基X而言，各类词性占的比例有多大呢？笔者作了一个初步的统计。

结果显示，在词汇化程度很高的50条X-er名词构式中，尽管词基X的词性呈现多样性，但是仍然以动词为主，百分比高达0.62，这个研究结果对解释X-er 的原型语义可以提供数据上和词法上的支撑。

(二)X-er构式的识解模式从共时的层面研究，有的词基，例如win，可以同时兼作动词和名词，因此，winner应该被识解为V-er类名词构式还是 N-er类名词构式呢？首先，我们通过词源词典，透析词基win的演变历程(见图一)：通过上图可以清楚地看到，词形win的词性最初是动词，然后大概在1325年在动词基础上附加后缀-er，形成winner构式，而win直到1862年才通过“语法隐喻” 获得名词词性。

因此，winner应该被识解为V-er类名词构式而不是 N-er类名词构式。

任何一个词都会经历演变的历程，如果可以结合词源词典，从历时的纬度来研究，则会得到更真切的结果。

数据结果显示，英语施事名词中既有V-er构造，又有N-er 构造。

两类不同词根的X-er名词之间存在系统的概念相似性，其词基虽然不同，但两者均能激活行为情景(包括活动、参与者及相关处所)。

两者区别在于：V-er名词通过动词词基直接激活相关动作情景；N-er名词隐含的动作则激活N隐含的相关情景。

换言之，N-er名词是通过指称动作情景的某一成分(如受事、工具、处所、时间等要素)以唤起相关动作情景[3]。

从理论上可以这样说，在心理词库里，N-er类构造的启动时间要比V-er构造的启动时间长。

所以当词基X既可以做名词又可以做动词时，根据认知经济原则，人们倾向于将其识解为基于语料库的X-er名词构式研究欧平娅（长江师范学院外国语学院重庆 408100）摘　要：本文以美国当代英语语料库为平台，对X-er名词构式中词基X的词性和该构式的指称范围进行考察。

语料证明：当词基X既可以做N又可以做V时，将其识解为V-er图示更合理；X-er名词构式的原型指称对象为人类施事者。

关键词：X-er名词构式；词基X；指称范围中图分类号：H313 文献标识码：A 文章编号：1008-6757（2012）10-0147-01（下转第149页）2012年Vol.27 No.10刘　瑶：基于框架语言视角的语码转换对母语影响的探讨中的语码转换翻译，特别是在A＋B—B类型中，目的语恰好是源语文本语码转换中涉及到的一种语言(陈婵英，2007：92)。

此时，译者就要注意A语言的句法结构对B语言句法结构的影响。

近年来，网络上很普遍的一种用法是中文＋ing，这一语言现象由“中文”后加“ing”两部分组成。

“ing”是英语现在进行时的语法标志，这种语言现象的结构中借用了这一语法标志加在“中文”后，表达中文结构处于进行时态(陈硒，孙傲飚，2006：146)。

它有三种构成：一是中文部分为词，如哭ing，更新ing，幸福ing等等；二是中文部分为结构：如极度羡慕ing，流鼻血ing等等；三是中文部分为句子，如我得意地笑ing，我在热恋ing等等。

其中，“中文”部分可以定义为一种语码，“ing”则是另一种语码的构成要素。

四、结论综上所述，笔者认为，频繁的句内语码转换会导致嵌入语在潜移默化之中影响框架语言的句法结构。

同时，嵌入语传承着该语言的文化、价值观念和意识形态，因此，它会在语码转换过程中，渐渐将该语言的文化、价值观念和意识形态移植到语码转换者的脑中。

从长远来看，嵌入语可能会通过语码转换进行语言侵略，最终使框架语言失去其独立性。

在中国，英汉语码转换非常普遍。

不否认英语词汇丰富，词缀灵活多样，不仅可以丰富汉语的表现能力，扩大汉语的词汇量，而且便于国际间的交流与沟通。

但是，应该有一些规范来避免英语在汉语中的渗透，特别是影响力大、影响范围广的主流媒体如电视、报纸等，应该摒弃字母词，使用纯汉语。

参考文献：[1]Myers-Scotton.Social motivation for code-swithing[M].Oxford:Oxford university press, 1993:70-72.[2]Poplack, S. Sometimes I will start a sentence in Spanish YTERMINO EN ESPANOL: Toward a Typology of Code-Switching. Linguistics 18, 1980:581-582.[3]阳志清.论书面语语码转换[J].现代外语,1992(01):1-6.On the perspective of code-switching on mother tongue influence based on the framework of languageLiu Yao(Institute of foreign languages Changsha District Vocational and Technical College, Changsha Hunan, 410004, China) Abstract: Code-switching is communication phenomenon for the result of language contact and cross cultural, along with the development of Chinese economy, Chinese embedded in English ( Chinese-English code-switching) now appears frequently in written text, media and people's spoken language. Code-switching has long been an important research topic in social linguistics, more and more become the focus of attention. Linguists from different angles on it was described and explained. Take Chinese-English code-switching as an example, from the Myers-Scotton ( 1993) of the frame model of language perspective, analyzes influence of the code-switching and mother tongue.Key words: Chinese-English code-switching; frame language structure; frame; purity; syntactic structure ［责任编辑：周　呈］V-er图示。

这种识解模式也符合语料事实。

在这一点上，历时研究的结果和共时研究的结果不谋而合。

这充分说明：词语的演变历程是与人类的一般认知规律相吻合的。

简言之，词语是人选择的结果。

(三)X-er名词构式指称范围将X-er名词构式指称的事物大体分为七类[4]：a.人singer b.动物mouser c.植物creeper d.工具sweeper e.服装rompers f.处所diner g.事件/活动 laugher。

本文参考了以上分类，为了统计的方便，根据统计素材，笔者将X-er构式的指称分为四类，一类是指执行某种动作或参与某项活动为基本职业的人类施事者，二类指工具，三类是既可表示人类施事者，又可表示工具，第四类是其它。

Panthe(2002)提到X-er名词构式原型意义是“以执行某种动作或参与某项活动为基本职业的人类施事者”。

而来自语料库的数据也印证了语言直觉。

结果表明，尽管X-er名词构式的指称范围很广，但是在指称时，不同语义范围的使用量并不是并驾齐驱，而是具有显著的差异。

可以看出，X-er名词构式用来指称人类施事者具有绝对的优势(72%+10%)。