“破晓”一词的词类标注问题:一项基于语料库的个案研究

龙源期刊网 https://www.360docs.net/doc/e63557409.html,

“破晓”一词的词类标注问题:一项基于语料库的个案研究

作者:柴宁

来源:《东方教育》2015年第09期

【摘要】文章从基于使用的语言学理论和词类范畴化两个视角出发,采取基于语料库的研究方法,对“破晓”的使用模式进行调查,结果表明“破晓”经过词类范畴化这一动态过程在词典中应处理为动名兼类词。本研究试图对词典编纂中词类标注不明确的词语的完善贡献绵薄之力。

【关键词】词类标注;语料库;范畴化;“破晓”

一、研究问题

词类标注是词典编纂的重要环节之一,特别是对兼类词而言。各部词典对词类标注的标准不一,造成了词语义项的不一致,为读者掌握词语用法带来了一定的困扰。随着电子计算机技术的普及推广,语料库被越来越多地投入到词典编纂的工作当中,成为词类标注的重要依据之一。然而在编纂词典的过程中,业界一直沿用传统方法即以总结实际用法为主,这必然是不科学的,也是不客观的,因此将语料库引入词典编纂迫在眉睫。经过对多部词典的调查取证,笔者发现“破晓”一词在各个词典中的词类标注不一致,读者很难对该词的词类做出快速准确的判断,那么就需要借助语料库这一现代技术了。本文以范畴化理论为基础,以“破晓”为例考查它的词类、释义以及例证,试图探究出一种借助语料库而进行词类标准的全新方法。

二、研究过程

(一)词典考证

为确保研究的客观公正,笔者选取了21部较权威的词典对“破晓”一词的词类进行统计,其中汉英词典中已标注词类的7部,未标注词类的6部,汉语词典已标注词类的6部,未标注词类的2部:

7部已标注词类的汉英词典:

【破晓】dawn;daybreak:我们必须在~前出发。We must start before dawn./这时天已~。By this time it was daybreak.《新汉英词典》(2007)

【破晓】 dawn:~时分 at daybreak /天色~。Day is breaking.《牛津·外研社英汉汉英词典》(2010)

试论词的兼类与词类活用

试论词的兼类与词类活用 (王苗 2011134103 文学院对外汉语) [摘要] 文章对古汉语词类活用与词的兼类现象进行了分析,阐述了这二种不同类型的语言现象的本质,分析了它们的联系、区别及辨识的方法。并强调指出,词类活用既是语法问题,又与词义、语用等因素密不可分,必须从多方面考虑这一语言现象。 [关键词]古代汉语; 词类活用; 兼类; 语用; 语法; 词义 一、兼类词的界定与判断 黄伯荣、廖序东指出:“词的兼类是某个词同时具备两类或几类词的主要语法功能”。[1]邵敬敏认为:“一个词在不同的语境中具有A类和B类这两类词的语法功能。”[2]胡裕树概括为:“从归类的角度看,有些词具备两类或两类以上的语法功能,这就是词的兼类。”[3] 博采各家之长,我认为汉语词的兼类标准可以简单的归结为以下六条:在形体方面:必须是一个词,即字形相同;在词性方面:归属两类或两类以上的词,具有两类或两类以上词的特点;在词义方面:基本意义又有某种联系;在字音方面:读音(身母、韵母、身调)完全相同;具备经常性的特点。 二、词类活用的界定与判断 词的活用的含义:(1)词的活用是一类词活用为另一类词,语法功能发生改变,其功能在动态的言语环境中体现。(2)这种改变是临时的、不固定的、受现实语句的制约。其稳定性弱。使用频率低。适用范围有局限性。(3)活用往往有修辞的性质。(4)词的活用是指某一类词的意义和语法特点的语言现象。 胡裕树认为:“甲类词在特定条件下,为了修辞的需要,偶尔用作乙类词,是活用。”活用是暂时的,具有不稳定性,要靠依句辨析来认识。要注意三个点:明确本义,不要把本义当活用;考查词义的演变过程;不要以古律今。 词类活用,早在清代俞樾的《古书疑义举例》中就已谈到。1922年商务印书馆出版的陈承泽所著《国文法草创》一书中首次提出了“词类活用”说,这在汉语词类分析上具有重要的历史意义。近数十年的研究者一般认为,某类词在一定的条件下可以灵活运用,可以使某类词临时具有另一类词的语法功能,词的这种

语料库与语料库建设

语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。 语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,由此保证基于语料库的语言研究的科学性、客观性。3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过计算机处理的,具有资源优势和处理速度优势。5、基于语料库的研究以量化研究为基石,以概率统计为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,又代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(R.Quirk)等人着手进行的“英语用法调查”(Survey of English Usage)通过系统的调查建立了第一个现代英语语料库,在此基础上完成的《现代英语语法》( A Grammar of Contemporary English)和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。

中考语文专题复习-词类及词性教学文稿

语法——词类及词性 一、词的分类 词,是语言里最小的、可以自由运用的单位。 例:山、水、走、兴奋、玻璃、坦克、中国、人民、奥林匹克、中华人民共和国…… 根据语法功能和意义,一般把汉语的词分成两大类: 1.实词——表示实在意义的词,有名词、动词、形容词、数词、量词、代词。 2.虚词——不表示实在意义而表示语法意义的词,有:副词、介词、连词、助词、叹词、拟声词。 二、词性 名词:表示人或事物名称的词。 1、人事名词:如,人学生鲁迅《离骚》政治文化 2、时间名词:如,春天上午星期天母亲节刚才 3、处所名词:如,上海中国远处周围里屋郊区 4、方位名词:如,上下左右前里外旁内东西 判断方法: 1、能受数量词修饰。两个城市一些学生一点儿水 2、不受副词“不”修饰。 动词:表示动作、行为、存现、变化、消失、判断、心理活动等的词。 1、动作动词:表动作、行为。如,走看说进行开始 2、心理活动动词:如,想爱恨怕希望喜欢担心 3、使令动词:表指使、命令或请求。如,使叫让派请求禁止 4、能愿动词:(助动词)如,能会可以愿肯敢要应应该(跟动词、形容词等组成能愿短语。如,能够解决) 5、趋向动词:如,来去上进出回过开上来起来 6、判断动词:主要是“是”,以及同“是”相当的“为”等。 动词的判断方法: 1、不能受“很” 修饰(除能愿和心理活动动词外) 2、标志:“着”“了”“过” 3、用带趋向动词或重叠的方式来表示动作行为的状态、趋向等。 形容词:表示性质、状态的词。 1、表示形状如,长、短、粗、高大…… 2、表示性质如,高尚、乐观、懦弱…… 3、表示状态如,迅速、朦胧、遥远…… 判断方法: 1、一般能用程度副词“很”等修饰(少数本身就表示程度“雪白、完美”等)。 2、大多可以按AA或AABB的方式重叠。如,小小(的)高高大大 数词:表示数目的词。 1、表示确数:三分之二、七百…… 2、表示概数:成千上万、若干…… 3、表示序数:初一、第八……

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

词类活用(一)

词类活用 词类活用:在具体语言环境中一类词临时用作另一类词并且改变了原来的语法语义的语言现象。 特点:一是要有具体语境。二是语义语法的临时性。三是“以今律古”,就是现代人以现在的语法习惯去看待文言文的语法,比如“雨”字,在造字之初就身兼名词和动词两类,如“天雨雪”(《苏武传》)中的“雨”本身就是动词,但是现在的“雨”却只具有名词的词性,人们就把这句中的“雨”字看作活用了。 如何判别词类何用?最好的方法是句法分析。简而言之,就是划分句子 成份,即把句子的成分先划出来,然后去分辨各个成分上的词类是否和正常的词类位置一致,不一致的就可能是活用。 一、名词活用 (一) 名词作一般动词 1、两个名词相连,必有一个活用。“襟三江而带五湖”的襟和带。(《滕王阁序》) 2、结构助词“所”字之后的名词活用。 “置人所罾z ēng 鱼腹中”。(《陈涉世家》) 罾z ēng 本义是渔网,活用作动词“网起”。 3、名词后直接粘附一个语气词,活用。 “赵王之子孙侯者”的侯。(《触龙说赵太后》) 4、连词“而”(以、且)前后的名词活用。 君人者,隆礼尊贤而王(称王)。(《荀子?天论》) 遵海而南(向南)。(《孟子?梁惠王章句下》) 败楚汉,楚以故不能过荥阳而西(向西)。(《史记?项羽本纪》) 5、代词前面的名词活用。代词不受名词修饰,所以代词(通常为“之”、“者”)前面的名词往往活用为动词。 “辱而逐之,折而族之”的族。(侮辱他,扭逐他,打倒他,消灭他的家族)(《原谤》) 以故其后名(命名)之曰“褒禅”。(王安石《游褒禅山记》) 6、状语(不)后面的名词活用。 “太子及宾客知其事者,皆白衣冠以送之”的白衣冠。(《荆轲刺秦王》) “巫医、乐师、百工之人,君子不齿”的齿。(《师说》) 7、 能愿动词“能、欲、可、当”等后面的名词活用。“公子怒,欲鞭之”的鞭。

词类活用的判断方法

词类活用的判断方法 一、什么是词类活用 词类活用是指某些词按照一定的语言习惯在句中临时改变了它的基本职能,充当了别的词类这种语法现象。 词类活用是从语法角度来说的,而不是从词汇角度来谈的。一般来说,一个词的基本的语法功能是固定的,活用只是一种临时性的功能,离开了特定的语言环境,这种临时性的功能就不存在了。《荀子?劝学》:“假舟楫者,非能水也,而绝江河。”句中“水”受助动词“能”修饰,作谓语,由名词活用为动词,它的基本语法功能是作主语、定语、宾语,而本句中功能改变,成了别的词类。由于这种功能是临时性的,离开了这种环境,活用就不存在了。发展到现代汉语,词类活用就很少了。 词类活用与词的兼类不同,如《邹忌讽齐王纳谏》:“于是入朝见威王。”“朝”是名词,朝庭。“燕赵韩魏闻之,皆朝于齐。”“朝”是动词“朝拜”。词的兼类是词义引伸的结果,是一个词所固有的。词类活用是一个词的临时性的功能,是不固定的。 二、名词、形容词活用为一般动词 (一)名词活用为一般动词 活用后既保留了名词的意义,又具有动词的功能。名词活用为动词后,译为现代汉语,有的译为述宾短语,[动+名]如: 后妃率九嫔蚕于郊,桑于公田。《吕氏春秋?上农》 子高曰:“微二子者,楚不国矣。” 《左传?哀公十六年》 春申君死,而荀卿废,因家兰陵。《史记?孟子荀卿列传》 有的译为状中短语,([介+名]+动),如: 卫鞅曰:“法之不行,自上犯之。”将法太子。《史记?商君列传》 上无衣,下无履,手弓而腰矢。《聊斋志异.妖术》 不惟举之于其口,而又笔之于其书。韩愈《原道》 有的完全译为动词,如: 士为知己者用,女为悦己者容。《报任安书》 是以令吏人完客所馆。《左传?襄公三十一年》 吾不能以春风风人,以夏雨雨人。《说苑?贵德》 (二)形容词活用为一般动词 活用后具有动词的功能。有的译为状中短语,[形+动],如: 敌人远我,欲以火器困我也。徐珂《冯婉贞》 适自相公家来,相公厚我厚我。明.宗臣《报刘一丈书》 夫以人言善我,必以人言罪我。《韩非子.说林》 有的完全译为动词,如: 老吾老,以及人之老;幼吾幼,以及人之幼。《孟子?梁惠王上》 此六子者,世之所高也。《庄子?盗跖》 三、使动用法 (一)什么是使动用法 指主语使宾语施行谓语所表示的动作这种词类活用现象。译为“使(让,叫)……。” 齐威王欲将孙膑。《史记.孙子吴起列传》

词类和词性

词类和词性 (一)知识概述 词类是指词在语法上的分类,也就是把汉语里的所有词,根据它们的词汇意义和语法特点进行分类,这样得出的 结果就是词类。现代汉语教学系统把词分为十二类: 实词可以分为: ( 5) 概数:十几概数、十余人、三十多岁、两三个、成千上万、很多人 5、量词:表示事物单位或行为、动作单位的词叫量词。 无量 (表示人或事物单位的词) (1) (2) (3) (4) 动量 动量词也可以借用跟动作有关的事物的名词。如:画一笔、切一刀、工作一星期、学习一下午、踢一脚、送一车 说明:在现代 表示人或事物名称的词叫名词。 表示人:老师、学生、作家、工人、鲁迅 具 体事物:天、地、花、草、天空、海洋 抽象概念:方法、科学、法律、事业 处所:北京、青岛、 方位:东、西、南、 西面、里头。 时间:早晨、正午、 1、名词: (1) (2) (3) (4) (5) 东边、 (6) 动词:表示动作行为、发展变化、心理活动等意义的词叫动词。 动作行为:穿、跳、走、纪念、朗诵。 存在变化:有、增加、缩小、扩大、发生。 心理活动:想、懊悔、喜欢、担心。 可能意愿:应该、应当、能够、愿意、必须、敢、肯、会、能、要、可以。 趋向:上、下、来、去、上去、下去、进来、进去、起来、上来。 判断:是、就是、正是 使令:使、让、派、请、 形容词:表示事物的形状、 1) 形状:大、小、高、 ( 2) 性质:好、坏、镇定、 ( 3) 状态:愉快、慌张、急躁、迅速、朦胧、桔红 4、数词:表示数目的词叫数词。 (1) (2) (3) (4) 黄河、长江、三味书屋 北、上、下、前、后、左、右、里、外、内、中、间、旁、以前、以南、之下、之后、 晚上、半夜、上午、白天、夏天、立秋、今天、星期二 2、 (1) (2) (3) (4) (5) (6) (7) 3、 叫、要求、命令、推举、允许、鼓动、鼓励。 性质或状态的词叫形容词。 圆、长、短、高大、肥胖。 勇敢、乐观、伟大、优秀 基数(确数)一、二、千、万、亿 序数:第一、三叔、三年级、六楼、初五、老三。 分数:三分之一、九成 倍数:三倍、十倍、翻一番 个体:个、位、尺、只、台、条 集体:批、帮、群、套、双、副、对、类 不定量:些、点 度量衡:丈、尺、里、亩 表示动作行为的单位) 次、回、下、趟、遍、阵、场、遭、焉

古今异义,词类活用,重点词精编版

古今异义: 1.陈太丘与友期.:(古义:约定。今义:日期,期限。) 2.相委.而去:(古义:丢下,舍弃。今义:委屈,曲折,确实) 3.太丘舍去.:(古义:离开。今义:到······去。) 4.下车引.之:(古义:来。今义:引导。) 5.入门不顾.:(古义:回头看。今义:引导。) 6.与儿女 ..讲论文义:(古义:指家中的侄子辈。今义:子女。) 7.谢太傅寒雪日内.集:(古义:家庭。今义:内心。) 8.未若柳絮因.风起:(古义:顺。今义:因果。) 9.撒盐空中差.可拟:(古义:大概。今义:差别。) 10.不亦君子 ..乎:(古义:道德上有修养的人。今义:泛指品德高尚的人。) 11.可.以.为师矣:(古义:可以,能够凭借。今义:可能、许可。) 12.饭疏.食饮水:(古义:粗劣。今义:疏通、疏散。) 13.匹夫 ..不可夺志也:(古义:普通人。今义:无学识、无智谋的人。) 14.吾日三.省吾身:(古义:多次。今义:数词,三。) 15.学而不思则罔.:(古义:迷惑,意思是感到迷茫而无所适从。今义:蒙蔽,没有。) 16.思而不学则殆.:(古义:有害。今义:危险,几乎。) 17.有朋.自远方来:(古义:志同道合的人。今义:朋友。) 18.虽.有至道:(古义:即使。今义:虽然。) 19.不知其旨.也:(古义:甘美。今义:意义。) 20.教然后知困.:(古义:不通,理解不了。今义:困难。) 21.教学相长.也:(古义:促进。今义:增长。) 22.沧州南一寺临河干.:(古义:岸。今义:与湿相对。) 23.并.沉焉:(古义:一起。今义:并列。) 24.阅.十余岁:古义:经过,过了。今义:看。 25.尔辈不能究物理 ..:(古义:事物的道理、规律。今义:一门学科,物理学。) 26.盖.石性坚重:(古义:句首发语词,原来是。今义:有遮蔽作用的器物。) 27.是.非木柿:(古义:这。今义:表判断的动词。) 28.转转不已.:(古义:停止。今义:已经。) 29.但.知其一:(古义:只。今义:表转折,当时,却。) 30.求之下流,固.颠:(古义:副词,本来。今义:坚固。) 31.不筑.:(古义:修补。今义:建筑。) 32.居.数月:(古义:停留,这里是“经过”的意思。今义:居住。) 33.人皆吊.之:(古义:指对遭遇不幸的人表示慰问。今义:指祭奠死者或对遭到丧事的人家、团体给予慰问。) 34.胡人大.入塞:(古义:指大规模。今义:指在面积体积容积等方面超过通常情况或特定的比较对象。)

语料库与语料库建设

语料库与语料库建设 语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是 指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 口前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的儿种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设讣是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。语料库不同于电子文档,语料库的建设有特定的研究LI 的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档U标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设讣与建设有系统的语言学理论指导,语料库的开发具有明确而乂具体的U的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行

研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。 2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,山此保证基于语料库的语言研究的科学性、客观性。 3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。 4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过讣算机处理的,具有资源优势和处理速度优势。5>基于语料库的研究以量化研究为基石,以概率统汁为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,乂代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪 50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛圉无疑促进了对语料的重视。1939年夸克(R. Quirk)等人着手进行的“英语用法调查” (Survey of English Usage)通过系统的调查建立了笫一个现代英语语料库,在此基础上完成的《现代英语语法》(A Grammar of Contemporary English )和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。 20世纪六十年代后,语言学研究主流从经验主义转向理性主义,乔姆斯基的语言能力说被广泛接受,转换生成语法学派批评语料库研究方法,认为,1、基于语料库的方法有误。乔姆斯基等认为语言学应当以人脑的语言机制即语言能力为研究对象,语料库收集的只是人们的语言运用,语言运用会因超语言因素的影响而发生变化,它并

词性和词类活用

词性和词类活用 词类活用是古代汉语突出的语言现象,也是古今汉语语法重要差异之一。由于词类活用在现代汉语中已经很少使用了,所以对现代人来说,阅读古文最突出的障碍莫过于词类活用。要透彻理解和分析词类活用,首先要了解词类,学会分析和判断词性。 一.如何分析词性 词性是词在语法意义上的性别,它表示词所属的类别。古今汉语词类的划分没有太大的差别,学会判断词性,对分析词类活用和提高阅读古书的能力有很大的帮助。它可以使我们掌握句子结构,确切地理解文章。例如: ①孔子之丧有自燕来观者。舍于子夏氏。子夏曰:“圣人之葬人与?人之葬圣人也。子何观焉?”(《礼记?檀弓上》) ②周有泉府之官,收不售,与欲得,即《易》所谓“理财正辞,禁民为非”者也。(《资治通鉴》)——周:周代。泉府:钱府。官:官府。售:卖出去。 例①的“与”是句尾语气词。全句的意思是孔子办丧事的时候,有从燕国来观看的人,住在子夏家里。子夏说:“是圣人葬一般的人吗?〔不是〕是一般的人葬圣人。你看什么呢?”汉郑玄注“与”为“及也”,解为连词。这样“圣人之葬人与人之葬圣人也”连为一句,意思就不通了。例②的“与”是动词,“给予”。如理解为连词,“收不售与欲得”连为一句,“不售与欲得”都成了收的对象,意思也不通了。 分析词性的主要依据是看词在句子的组合能力及其充当什么成分,因此熟练掌握各类词的组合能力及造句功能是正确判断词性的基础。组合能力指某类词可以跟什么词组合,不能跟什么词组合。例如副词可以和形容词组合(部分副词可以和动词组合),不能同名词组合。介词可以同名词、代词及名词性词组组合,不能同动词组合等等。造句功能在句子中可以充当什么成分。例如名词在句子中可以充当主语、宾语、定语、状语及判断句的谓语,不能充当叙述句的谓语。连词不能单独充当句子成分,只能与名词、动词、形容词组成词组充当句子成分等。根据词造句的功能,可以将词分为实词和虚词两大类;根据词的组合关系,又可以将实词分为名词、代词、动词、形容词、数量词五类,将虚词分为副词、介词、连词、语气词、叹词五类。下面把各类词的主要特点作一简单介绍。 (一)名词。表示人或事物名称的词。可以分为普通名词、专有名词、时间名词、方位名词四种。普通名词如“人”、“妻”、“国”、“天下”、“兵”等。专有名词如“江”(长江)、“河”(黄河)、《诗》(专指《诗经》)、“书”(专指《尚书》)、“刘备”、“戈”等。时间名词如“今”、“昔”、“旦”、“暮”等。方位名词如“东”、“西”、“南”、“北”、“中”、“内”、“外”等。名词可以同形容词、介词、动词、连词等组合,在句中充当主语、宾语、状语、定语、补语和判断句谓语,一般不能与副词组合。例如:今人有大功而击之,不义。(《史记?项羽本纪》)——现在别人有大功却去攻击他,这样做不符合道义。 “功”受形容词“大”修辞,在句中作“有”的宾语。“义”前边是否定副词“不”,正说明“义”是名词活用为动词。 需要注意的是,古汉语名词作状语或补语常常不用介词,例如: ①至天都侧,从流石蛇行而上。(《游天都》)——到达天都峰旁边,沿着光滑的石板象蛇一样向上爬。 ②西门豹簪笔磬折。(《西门豹治邺》)——西门豹把笔插在头发上,象磬一样弯着腰(恭敬地站在那里)。 以上是名词作状语。

词类活用

词类活用 (一)名词作动词 《卖油翁》 1.但微颔之“颔”转化为动词“点头”。 《三峡》 2.每至晴初霜旦“霜”转化为动词“下霜”。 《黔之驴》 3.驴不胜怒,蹄之“蹄”转化为动词“用蹄子踢”。 《口技》 4.妇抚儿乳“乳”转化为动词“喂乳”。 5.不能名其一处也“名”转化为动词“说出”。 6.其夫呓语“呓语”转化为动词“说梦话”。 7.会宾客大宴“宴”由名词“宴席”转化为动词“宴请”。 《满井游记》 8.泉而茗者,罍而歌者,红装而蹇者 “泉”“茗”“罍”“歌”“红装”“蹇”等分别转化为动词“汲泉”“喝茶”“端酒杯”“唱歌”“穿着艳装”“骑驴”。《生于忧患,死于安乐》 9.人恒过“过”转化为动词“犯过失”。 《曹刿论战》 10.神弗福也“福”转化为动词“保佑”。 11.公将鼓之“鼓”转化为动词“击鼓”。 《狼》 12.意将隧入以攻其后也“隧”转化为动词“打洞”。 《公输》 13.在宋城上而待楚寇也“寇”转化为动词“入侵”。 《捕蛇者说》 14.然得而腊之以为饵“腊”转化为动词“风干”,这里译为“把……晾干”。 15.又安敢毒耶“毒”转化为动词“怨恨”。 《约客》 16.黄梅时节家家雨“雨”转化为动词“下雨”。 《送东阳马生序》 17.余则缊袍敝衣处其间“缊袍敝衣”是“穿缊袍敝衣”的意思。 18.腰白玉之环“腰”转化为动词“腰佩”。 (二)名词作状语 现代汉语只有时间名词才能作状语,普通名词很少作状语。古代汉语不但时间名词可以作状语,普通名词也可以作状语。由于名词的这种作用和副词相似,所以有的人称之为名词用如副词。普通名词作状语,有的表示处所或工具,有的表示对待人的态度,有的表示比喻。 1.表示方位或处所。例如: 《山海经·夸父逐日》河渭不足,北.饮大泽。(表示方位) 《荀子·劝学》上.食埃土,下.饮黄泉。(表示方位)

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

词类活用

古汉语词类活用现象详解 掌握词类活用的方法首先是对词类活用的概念有清楚的认识,其次要搞清楚各类词的基本用法和活用用法,同时要多作练习——通过套用格式来分析词类活用。在古代汉语中,某些词在特定的语言环境中改变了它的基本用法,在句中充当其他词类和句子成分,这种临时的灵活运用,就叫词类活用。 一一般的词类活用 (一)名词的一般活用 1、名词作状语基本结构:名词+动词基本用法:主语+谓语活用用法:状语+谓语 ① 动作的特征状态赢粮而景从(像影子一样) ②表动作的对待方式人皆得以隶使之(像对待奴隶那样)③表动作的凭借工具余自齐安舟行适临汝(用船前往)④表动作的时间一夫夜呼,乱者四应(在夜里)⑤表动作的处所卒廷见相如(在朝廷上) 2、名词活用为动词 基本结构:名词+名词或代词基本用法:定语+中心语或复指短语活用用法:谓语+宾语 ① 词+宾语驴不胜怒,蹄之(踢) ②名词+介宾结构沛公军(于)霸上(驻扎) ③副词(能愿动词、名词)+名词 古者天下散乱,莫之能一,是以诸侯并作。(《史记?秦本纪》)(统一)不日,其盟渝也。(《谷梁传?隐公元年》)(书写日期)会天大雨,道不通,度已失期。(《陈涉世家》)(下大雨) ④“而”“则”前后的名词 客逾庖而宴(吃饭) 出则车舆,入则扶持(06湖北卷)(乘坐车舆) (二)形容词的一般活用 1、活用为动词 基本结构:形容词+名词或代词 基本用法:定语+中心语活用用法:谓语+宾语 吾妻之美我者,私我也。(偏爱) 素善留侯张良(跟…交好) 2、活用为名词 基本结构:形容词+名词或动词 基本用法:定语+中心语或状语+中心语活用用法: 动词或数词或介词或之、其+形容词—→谓语+宾语或介词+宾语 积善成德(善行) 问其深,则好游者不能穷也(深度) 亦以明死生之大(重大作用) 四美具,二难并(美好的事物) 不能容于远近(远近的人)

语料库

Background Information 语料库的概念 语料库是指按照一定的语言学规则,利用随机抽样的方法收集的有代表性的语言材料的总汇,它是语言材料的样本。 语料库通常指为语言研究机构收集的,具有一定容量的大型电子文本语料库。它是由口语语料和书面语的样本汇集而成,用来代表特定的语言或语言变体,或经过加工后带有语言学信息标注的文本的集合。 语料库的分类 按照语料库所涉及的语言种类,语料库课分为单语语料库,双语平行语料库(parallel corpus)和多语语料库(multilingual corpus); 按照语言涉及的题材,语料库可分为普通语料库(general corpus)和专门用途语料库(specialized corpus); 按语料的来源,又可分为口语语料库和书面语语料库; 按语料库是否被标注,语料库可分为生语料库或原始语料库(raw corpus)和熟语料库或标注语料库(annotated corpus) In linguistics, a corpus (plural corpora) or text corpus is a large and structured set of texts (now usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules on a specific universe. A corpus may contain texts in a single language (monolingual corpus) or text data in multiple languages (multilingual corpus). Multilingual corpora that have been specially formatted for side-by-side comparison are called aligned parallel corpora. In order to make the corpora more useful for doing linguistic research, they are often subjected to a process known as annotation. An example of annotating a corpus is

试论词的兼类与词类活用

试论词的兼类与词类活用 (王苗2011134103 文学院对外汉语) [摘要] 文章对古汉语词类活用与词的兼类现象进行了分析,阐述了这二种不同类型的语言现象的本质,分析了它们的联系、区别及辨识的方法。并强调指出,词类活用既是语法问题,又与词义、语用等因素密不可分,必须从多方面考虑这一语言现象。 [关键词]古代汉语; 词类活用; 兼类; 语用; 语法; 词义 一、兼类词的界定与判断 黄伯荣、廖序东指出:“词的兼类是某个词同时具备两类或几类词的主要语法功能”。[1]邵敬敏认为:“一个词在不同的语境中具有A类和B类这两类词的语法功能。”[2]胡裕树概括为:“从归类的角度看,有些词具备两类或两类以上的语法功能,这就是词的兼类。”[3] 博采各家之长,我认为汉语词的兼类标准可以简单的归结为以下六条:在形体方面:必须是一个词,即字形相同;在词性方面:归属两类或两类以上的词,具有两类或两类以上词的特点;在词义方面:基本意义又有某种联系;在字音方面:读音(身母、韵母、身调)完全相同;具备经常性的特点。 二、词类活用的界定与判断 词的活用的含义:(1)词的活用是一类词活用为另一类词,语法功能发生改变,其功能在动态的言语环境中体现。(2)这种改变是临时的、不固定的、受现实语句的制约。其稳定性弱。使用频率低。适用X围有局限性。(3)活用往往有修辞的性质。(4)词的活用是指某一类词的意义和语法特点的语言现象。 胡裕树认为:“甲类词在特定条件下,为了修辞的需要,偶尔用作乙类词,

是活用。”活用是暂时的,具有不稳定性,要靠依句辨析来认识。要注意三个点:明确本义,不要把本义当活用;考查词义的演变过程;不要以古律今。 词类活用,早在清代俞樾的《古书疑义举例》中就已谈到。1922年商务印书馆出版的陈承泽所著《国文法草创》一书中首次提出了“词类活用”说,这在汉语词类分析上具有重要的历史意义。近数十年的研究者一般认为,某类词在一定的条件下可以灵活运用,可以使某类词临时具有另一类词的语法功能,词的这种语法功能的临时改变,即是词类活用。目前高校教材中在谈到词类活用问题时,有一种共识: (1)词类活用纯系一种语法现象———词的语法功能的临时改变;(2)词类活用出于古汉语语法结构的精密化程度较低,或谓“开始多半是随意的”; (3)词类活用出于古代汉语的词语欠丰富;(4)强调活用是因为古人的“一定的表达习惯而灵活运用”。[4]可是具体在对词类活用现象进行论述时各家表述却不完全一致,分歧的焦点集中在词类活用的X围及具体词在句中是否活用等问题上。其实质是对词类活用与词的兼类的现象的模糊认识。 三、正确认识词类活用和词的兼类现象 在学习现代汉语和古代汉语就已经发现汉语所分词类同语法成分无法对应的问题。因此曾无可奈何地说过:“字无定义,故无定类。”在20世纪30年代、50年代的文法、词类大论战中,“词有定类”占了上风,也算有了定局。而且语法学界也已酝酿成熟,我们可以说,“词类活用”之说,其实质是语法学界以静态意义类属为唯一标准,去划分汉语词类但所得出的词类,却无法说明其造句功能,于是而采用活用之说这一补救方法。因此,一说到“词类活用”,就意味着某词的语法功能是超越本类词应有的职能。这功能有两种不同情况,一种是词在短语中的功能,这是静态的,处在尚未体现交际功能的单位———语言单位中;一种是词在句子中

词和词性

一、划分词类的标准 能够充当句子成分的词叫实词。实词都有词汇意义。 不能充当句子成分,只能帮助实词造句,表示语法意义的词,叫虚词。 例如:太阳北京学校红美丽跑步 了的吧吗把从和 二、实词 (一)名词 表示人或物。 例如:雷锋同志作家老师学生(表人) 水山马飞机车辆道德(表物) 秋天明年早晨现在过去(表时间) 上海中国亚洲远处里屋(表处所) 上下前后以上以下上面左右(表示方位) (二)动词 表示动作、行为、心理活动或存在、变化、消失等。 例如:走坐听批评宣传学习(动作行为) 爱恨怕想念打算希望(心理活动) 在发生存在有演变死亡(存在、变化、消失) 是(判断) 能能够会可以愿意应当(助动词) 上下进出来去上来(趋向动词) 注意: 1、助动词 是能用在一般动词、形容词前边表示意愿或可能、必要的动词。 例如:我们一定要好好学习。 他能来吗? 天气应该暖和了。 2、趋向动词 例如:太阳下去了,月亮出来了。 拿出一本书。 (三)形容词 表示性质、状态。 例如:伟大勇敢优秀聪明老实鲁莽大方 长短大小粗细红愉快 多少许多全多少 注意:区别动词与形容词: 1、能否带宾语:动词多能带宾语,形容词不能带宾语。 2、能否受修饰:动词多数不能,形容词多数能。 例如:“端正”一词,在“端正态度”中词性为动词;在“容貌端正”中为形容词。 (四)数词 表示数目和次序。 1、基数:表示数目多少。例如:一二十百千零 2、序数:表示次序前后。例如:第一第五 3、倍数:基数+“倍”例如:一倍五倍

4、分数:几分之几 5、概数:例如:一百多一千左右三四(个) (五)量词 表示计数单位,又叫单位词。 1、物量词: 表示人和事物的单位。 例如:尺、丈、升、磅、吨、元、角(度量衡) 个、位、件、本、间、匹、章(个体单位) 双、对、堆、群、班、套、伙(集体单位) 些、点(不定单位) 2、动量词: 表示动作行为的单位。 例如:次、趟、回、顿、遍 还有一些是借用的单位: 笔(画一笔)、刀(切一刀)、拳(打一拳) 看(看一看)、摸(摸一摸) 3、复合量词: 例如:架次、人次、吨公里、秒立方米 (六)副词 限制修饰动词、形容词,表示程度、范围、时间等意义。 例如:很、最、极、挺、非常、十分、几乎、过于(表程度) 都、总、共、统统、只、仅仅、一齐、一律(表范围) 已、已经、马上、要、就、将、常、终于(表时间) 必、必须、准、的确、不、没有、别、不用(表肯定、否定) 大肆、亲自、猛然、忽然、公然、连忙、悄悄(表情态、方式) 难道、岂、究竟、简直、居然、何必、只好(表语气) (七)代词 有替代、指示作用。 1、人称代词 代替人或事物名称。例如:你、我、他、咱、自己、大家、彼此 2、疑问代词 表示疑问。(有疑而问或无疑而问)例如:谁、什么、哪儿、怎么 3、指示代词 指称或区别人、事物、情况的叫指示代词。 例如:这、那、这样、那样、这些、那些、这么、那么 (八)象声词 模拟自然界声音的词。 例如:咣、叮当、哗啦、呼呼、轰隆 (九)叹词 表示感叹或呼唤、应答的词。 例如:唉、啊、哎呀、哼、哈哈、嗯 有时同一叹词读不同的音调,便表示不同的意义。 例如:啊(ā)!真好哇!(表赞叹) 啊(á)?这么快呀?(表惊讶或不知道)

词类和词类活用

词类与词类活用 一、古代汉语得词类划分 词类就是根据词得语法意义与语法功能划分出来得类别。 古代汉语得词类,跟现代汉语得词类大致相同:总共可以分成十一类,即名词、动词、形容词、数词、量词、代词、副词、介词、连词、助词、叹词.下边分别叙述。 1、名词,表示人或事物得名称得词。例如: 阿爷无大男,木兰无长兄。(《木兰诗》)?黔无驴,有好事者船载以入。(《黔之驴》) 2、动词,表示人或事物得动作、行为、发展变化得词。例如: 一屠晚归,担中肉尽。(《狼》) 谍报敌骑至。(《冯婉贞》) 3、形容词,表示人或事物得形状、性质或者动作、行为得状态得词。例如:。 肉食者鄙,未能远谋。(《曹刿论战》)?寒暑易节,始一反焉。(《愚公移山》) 4、数词,表示数目得词。例如: 一桌、一椅、扇、一抚尺而已.(《口技》)?策勋十二转,赏赐百千强。(《木兰诗》) 5、量词:表示人或事物得单位或动作行为得词.例如: 距圆明园十里,有村曰谢庄。(《冯婉贞》)?孤帆一片日边来。(《望天门山》)6、代词,代替名词、动词、形容词或数量词得词,叫做代词。例如: 会长老,问之民所疾苦。(《西门豹治邺》) 余将告于莅事者,更若役,复若赋,则何如?(《捕蛇者说》) 7、副词,经常用在动词或形容词得前面,表示程度、范围、时间等。例如: 太后之色少解。(《触旮说赵太后》) 村中闻此入,咸来问讯。(《桃花源记》) 8、介词,同它后面得名词、代词等组合起,经常用在动词,形容词得前面或后面,表示处所、方向、时间、对象等等。例如: 何不试之以足(《郑人买履》) 乃取一葫芦置于地.(《卖油翁》) 9、连词,把两个词或两个比词大得单位连接起来得词,例如: 居庙堂之高则忧其民;处江湖之远则忧其君.(《岳阳楼记》)?西人长火器而短技击。(《冯婉贞》) 10、助词,附着在一个词、一个词组或一个句子上,起辅助作用。例如: 遂率子孙荷担者三夫.(《愚公移山》) 诸将请所之(《李恕雪夜入蔡州》) 11、语气词,也叫语气助词。语气词不能充当句子成分, 但它可以表示提顿、陈述、祈使、疑问、感叹等不同语气。例如: 今虽死乎此,比吾乡邻之死则已后矣。(《捕蛇者说》) 然则何时而乐耶?(《岳阳楼记》) 12、叹词,表示感叹或呼唤应答得词。例如: 嘻,技亦灵怪矣哉!(《核舟记》)?嗟夫!予尝求古仁人之心,或异二者之为,何哉?(《岳阳楼记》)

相关文档
最新文档