“两个半天”和“两个半月”——面向词法自动分析的涉数时间语素说略

合集下载

语言学概论

语言学概论

语言学概论现代语言学发展流程图历史比较语言学——结构主义语言学【布拉格学说,美国描写主义学说】(20世纪30年代欧洲,索绪尔《普通语言学教程》【“现代语言学之父”,特点:共时描写】)——哥本哈根学说——转换-生成语言学索绪尔在语言学上的贡献:1提出了一系列二元对立的概念(1)语言和言语:把言语活动分成“语言”和“言语”两部分语言是符号系统,言语是运用言语表达的过程(2)语言的语言学和言语的语言学(3)语言的共时态和历时态共时态是指在某一特定状态中的语言状态,不考虑时间因素历时态是指语言的历史演变(4)共时语言学和历时语言学共时语言学从一个横断面描写研究语言在某个历史时期的状态和发展历时语言学是集中研究语言在较长的历史时期中所经历的变化(5)能指和所指符号由“能指”和“所指”两部分构成所指指语言所反映的事物的概念(内容,语义:词汇和语法)所指是声音的心理印记或音响形象(形式,语音)(6)句段关系和联想关系句段关系指语言的横向组合联想关系是由心理的联想而产生,指词语的纵向聚合(7)外部语言学和内部语言学内部语言学侧重研究语言的内部结构系统外部语言学侧重联系语言系统以外与语言相关的一切因素研究语言(8)不变形和可变性不变形指任何个人无法有意识地,主动地改变语言符号系统可变性指语言符号系统在时间的线条上将不可避免地变化2提出了语言学的重要原则和方法(1)区分语言和言语(2)共时和历时(3)提出语言的系统性3创立了符号学学科《普通语言学教程》索绪尔(二)布拉格学派:又称“结构—功能学派”或“功能学派”,强调语言的基本功能是做交际工具,代表作特鲁别茨科伊《音系学原理》哥本哈根学派,又称丹麦学派,理论是“语符学”美国结构语言学派,又称美国描写语言学派代表:布龙菲尔德《语言论》特点:注重口语的描写和共时的研究,重形式分析,回避意义问题(三)转换——生成语言学:20世纪50年代,乔姆斯基《句法结构》(标志)“乔姆斯基革命”强调对人的语言能力做出解释,而不仅描写语言行为,它要研究的是体现在人脑中的认知系统和普遍语法,为语言研究开辟了新的道路先天语言能力说第一节:语言的社会功能一、语言是人类最重要的交际工具列宁1914《论民族自决权》一文中提出(一)语言的社会性1.语言是特殊的社会现象,具有全民性,没有阶级性2.语言的交际功能:语言是联系社会成员的桥梁和纽带为什么说语言是最重要的交际工具?1除了语言,人类所使用的交际工具有:文字,旗语,红绿灯,电报代码,数学符号,化学公式等。

语言学概论(完整版)前半部分

语言学概论(完整版)前半部分

【语言学概论备考精要-上半部分】音质是一个声音区别于其他声音的基本特色。

一般语汇可以分为:新造词、古语词、方言词、外来词。

外来词(借词)的三种方式:纯粹音译、半音译半意译、音译兼意译。

专用语汇包括:科技术语、行业语。

#科技术语同时也是专有名词。

奥林匹克属于:单纯词、音译词、专有名词、多音节词。

狼吞虎咽是惯用语。

成语中的口头用语包括:七手八脚、欢天喜地、过河拆桥等。

科学、电话不属于外来词。

浪漫、可口可乐、幽默、香波属于音译兼意译的外来词。

徘徊属于连绵词、单纯词。

语汇构词中的复合构词分为:陈述式、偏正式、支配式、并列式。

#广义的构型包括语汇构词中的附加构词,如-tion、-ful、-ly。

词法手段包括:词形变化、词的轻重音、词的重叠。

词形变化包括:附加、曲折、异根、零形式。

词的轻重音包括重音移动和轻声,具有区别词性或区别意义的作用。

句法手段包括:虚词、语类选择、语序、语调。

俄语中房子、房间、楼房分别属于阳性、中性、阴性。

◆瑞士语言学家索绪尔的《普通语言学教程》(1916年)开创了20世纪现代语言学的新局面。

最早的比较全面系统地阐述“语言”的一般理论的著作是洪堡特(德)的《论人类语言结构的差异及其对人类精神发展的影响》。

传统语言学一般泛指20世纪以前的语言学,特别是指索绪尔开创的结构主义语言学以前的语言学。

语言学研究的角度包括语言的本体、社会功能、与思维之间的关系。

判断两种话是不同语言还是同一种语言的不同方言,不能单凭“相互理解程度”来划分,而应该主要依据共同的历史文化传统和由此产生的民族认同感,再参考社会政治因素来处理。

◆四呼中,齐齿呼、合口呼、撮口呼的韵头或韵腹分别是[i]、[u]、[y],除此之外,都是开口呼。

语音中的浊辅音是乐音和噪音的混合体。

决定声音音质的因素有:发音体、发音方法、共鸣器的形状。

非音质音位包括调位(声调)、重位(轻重音)、时位(长短音)。

语调的句重音分为两种:节律重音(语法重音)、强调重音(逻辑重音)。

内蒙古后套话中的语气副词“半天”

内蒙古后套话中的语气副词“半天”

内蒙古后套话中的语气副词“半天”杨开昌【摘要】内蒙古后套话中的"半天"是一个典型的语气副词,在句中位置灵活,可以表达醒悟、意外、怀疑和讽刺等多种语气,可以与其他副词共现,并具有丰富的语用功能。

通过研究发现,语气副词"半天"就是"动词+半天"结构的省略,这种结构体现了语言的经济性原则。

%Bantian(半天)is a typical modal adverb in Houtao dialect(偶发)Inner Mongolia.It has flexible positions in the sentences to express a variety of tones such asawakening,unexpectedness,suspicion and satire,and it can be used with other adverbs,having rich pragm【期刊名称】《晋中学院学报》【年(卷),期】2011(028)004【总页数】5页(P17-21)【关键词】后套话;语气副词“半天”;“动词+半天”;语言经济性原则【作者】杨开昌【作者单位】云南师范大学国际汉语教育学院,云南昆明650092【正文语种】中文【中图分类】H172在内蒙古西部的阴山和黄河之间,有一片美丽富饶的平原,这就是闻名遐迩的后套平原。

经过几千年的发展,北方的游牧文化、草原文明和农耕文明在这个地方交流、交汇、融通、融合,形成了独特的地域文化,尤其是在语言方面,形成了以晋陕口语为基础、属于晋语但又有自己特色的后套话。

就拿“半天”这个词来说,在后套话里就有三个义项:这块儿地,我半天就耕完了。

她半天在地里干活,半天在家里哄娃娃(照顾小孩)。

你咋(怎么)才来,我等了你半天了。

我写了半天才把老师留的作业写完。

我直(一直)以为他是个好人,半天也是个灰个跑(蒙语借词,本指私生子,现多用于骂人)。

他肚疼得可厉害了,半天是吃了日脏(肮脏)东西。

普通语言学教程笔记(索绪尔)

普通语言学教程笔记(索绪尔)

《普通语言学教程》索绪尔之邯郸勺丸创作绪论第一章语言学史一瞥语法(规范)-语文学(过于注重书面语)-比较语文学或比较语法(只比较)-新语法学派(语言集团集体精神的产品)第二章语言学的资料和任务;与毗邻科学的关系语言学的任务是:a 对一切能够得到的语言进行描写并整理他们的历史,尽可能重建每个语系的母语;b 寻求在一切语言中永恒地普遍地起作用的力量,整理出能概略一切历史特殊现象的一般规律;c 确定自己的界限和定义.它与社会心理学、生理学、语文学相关.语言学也有实际用途,特别是对于那些利用文献的人,另外对一般修养也很重要.第三章语言学的对象定义——在任何时候,语言都是现行制度和过去的产品.我们的研究办法是一开始就站在语言的阵地上,把它当做言语活动的其他一切表示的准则.语言和言语活动不克不及混为一谈,它只是言语活动的一个确定的部分,并且当然是一个主要部分,它既是言语机能的社会产品,又是社会集团为了使团体有可能行使这机能所采取的一整套必不成少的规约.语言自己是一个整体,一个分类的原则.它是一种约定俗成的东西,人们同意使用什么符号,这符号的性质是无关轻重的.对人类天赋的不是口头的言语活动,而是组成语言——即一套和不合的不雅念相当的不合的符号——的机能.人们说话的机能——不管是天赋的或非天赋的——只有借助于集体所创造和提供的东西才干运用,所以,说语言使言语活动成为统一体,绝不是空想.语言在言语活动事实中的地位——言语循环重建:心理现象-生理过程-物理过程-生理过程-心理现象(c-i)这一主动过程称为执行部分,(i-c)这一主动过程称为接受部分,此外还有联合和配置的机能.语言是社会的、主要的,言语是团体的、偶然的、从属的.语言的特征是:1 他是言语活动事实的混杂的总体中的一个十分确定的对象,是言语的社会部分.2 语言是人们能够分出来加以研究的对象.3 言语是异质的,而规定下来的语言是同质的,它是一种符号系统,在系统中,只有意义和音响形象的结合是主要的,符号的两个部分都是心理的.4 语言这个对象在具体性上比言语毫不逊色.即是音响形象的堆叠,又可转为文字.语言在人文事实中的地位:符号学——语言是一种表达不雅念的符号系统.符号在实质上是社会的.第四章语言的语言学和言语的语言学言语活动的研究包含两部分:一部分是主要的、社会的、不依赖于团体语言为研究对象,纯粹是心里的;另一部分是次要的、以团体言语为研究对象,是心理·物理的.从历史上看,言语是先于语言的,但两者互相依存,语言是言语的东西,又是言语的产品.语言是言语是第五章语言的内部要素和外部要素语言与民族学、文化史、政治史、制度、文学、地理都有密切关系,这些是语言的外部要素;至于内部语言学则不容许随意安插,语言是一个系统,它只知道自己固有的秩序.第六章文字表示语言我们研究的具体对象是储存在每团体脑子里的社会产品,一般通过文字来认识不合的语言.文字的威望——语言和文字是两种不合的符号系统,后者唯一存在理由是在于表示前者.即使没有文字,也不会损害语言保管,因此语言是可以离开文字独立的.文字的威望来自于:1 词的书写形象使人突出地感应它是永恒的和稳固的,比语音更适宜于经久地组成语言的统一性;2 在大多数人的脑子里,视觉印象比音响印象更加明晰和持久,因此他们更重视前者;3 文学语言更增强了文字不该有的重要性;4 当语言和正字法产生龃龉时,除语言学家外,任何人都难以解决争端.文字的体系——1 表意 2 表音写法和发音产生龃龉的原因——语言是不竭成长的,而文字却有停滞不前的倾向,后来写法终于酿成了不合适于它所应该表示的东西.另外,当一个民族向另一个民族借字母时,这一书写体系的资源往往不克不及适应新任务,于是不克不及不随机应变,例如用两个字母暗示一个声音.此外还有词源上的偏见.写法和发音产生龃龉的后果——许多符号暗示同一个音;同一符号暗示几个音;间接写法;毫无意义的写法;有时文字还没固定,正在探索规则,犹豫未定,因此有反应过去时代为了暗示声音所测验考试作出的举棋不定的拼写法.这样文字就遮掩了语音的面貌.当文字越不克不及暗示它所该表示的语音时,人们反而把它当做基础的倾向越强.这表示在语律例则中.实际上,决定一个词发音的,不是正字法,而是历史,是它的词源.第七章音位学定义——借用生理学家、歌颂理论家的研究,一种帮助科学,使语言学家可以解脱书写的词.语音学是一门历史科学,而音位学则是在实践之外的.音位文字——一字一音,专为语言学家而用.文字证据的评论——任何时候都要为一门语言建立一个音位系统,对于一门“死语言”我们可以从外部标记、内部标记(由有规则的语音演变得出的标记,同时代的标记,借词来研究).对于“活语言”,则可以通过直接不雅察确立语音系统,注意不雅察它用来暗示声音的符号系统.音位学原理要从发声动作和听感来研究.听觉链不是分红相当的拍子,而是分红同质的拍子,特征是印象的统一,这就是音位研究的自然出发点.音位是听觉印象和发声动作的总和,听见的单位和说出的单位的总和,他们是互相制约的.在发音中能起作用的因素是呼气、口部发音、喉头震动和鼻腔共识,我们可按照这些来分类.对分类来说,消极因素可能比积极因素重要.下面是按照上述因素加上开口大小进行的简单分类:A 开度零:塞音B 开度1:摩擦音或气息音C 开度2:鼻音D 开度3:流音:包含边音和颤音E 开度4:半元音,I 、U、 YUF 开度5:e、o、yoG 开度6:a语链中的音位只有综合才是最重要的,我们在实际中接触到的主要是音节,它是音之间的互相关系,比单音直接.组合音位学就是研究二元组合的,一个二元组合包含一定数量互相制约的机械的和音响的要素,其中一个产生变异,会对其他要素产生必定的,可以预测到的反应.组合音位学要划定各类可能性的界限,并确定各个互相依存的音位间的经常关系.内破和外破87-121闭合叫做内破,张开叫外破,也可以成为闭音和开音.外破和内破可有四种组合.在音链中,由一个内破过渡到一个外破(><)就可以得到一种标记着音节分界的特殊效果.以第一个内破性质使人产生这种印象的音成为元音点,或响音,同一音节里在它之前或之后都称为辅响音.响音永远内破.通常我们先阐发语链中的音节,得出不克不及再行缩减的单位,开音或闭音,然后把这些单位结合起来就可以确定音节的界限和元音点,于是知道这些音响效果应该在什么样的生理条件下产生的.所以外破和内破就是区分音节的基本条件.复合元音不过是一种特殊的内破环节,其中第二个音位开度较大.第一编一般原则第一章语言符号的性质符号、所指、能指——语言符号链接的不是事物和名称,而是概念和音响形象,后者是声音的心理印迹.我们把概念和音响形象的结合叫做符号,在日常使用上,这术语一般只指音响形象.所指是概念,能指是音响形象.第一原则:符号的任意性——能指和所指的联系是任意的,或者,因为我们所说的符号是指能指和所指相连结所产生的整体,所以语言符号是任意的.它是不成论证的,即对现实中跟他没有任何自然联系的所指来说是任意的.第二原则:能指的线条特征——能指属听觉性质,只在时间上展开,并且具有借自时间的特征1它体现一个长度,2这长度只能在一个向度上测定,它是一条线.第二章符号的不变性和可变性不变性——能指对它所暗示的不雅念来说,看来是自由选择的,相反,对使用它的语言社会来说,却不是自由的,而是强制的.语言学的唯一的真正的对象是一种已经组成的语言的正常的、有规律的生命.符号的任意性,组成任何语言都必须有大量符号,系统的性质太庞杂,集体惰性对一切语言创新的抗拒.语言之所以有稳固的性质,不但因为它被绑在集体的镇石上,并且因为它处在时间之中.因为符号是任意的,所以除了传统的规律外不知道有此外规律,因为它是建立在传统的基础上,所以可能是任意的.可变性——变更的原则是建立在连续性原则的基础上的.结果会导致能指和所指关系的转移.语言底子无力抵抗那些随时促使能指和所指关系产生转移的因素,这就是符号任意性的后果之一.语言的成长一方面处于大众之中,同时又处在时间之中,谁也不克不及对他有任何的改动,另一方面,语言符号的任意性在理论上又使人们在声音资料和不雅念之间有建立任何关系的自由.第三章静态语言学和演化语言学121-138一切研究价值的科学的内在二重性——AB:同时轴线,CD:连续轴线,可把语言学分为共时语言学和历时语言学,共时态和历时态辨别指语言的状态和演化的阶段.内在二重性和语言学史——内在二重性的例证——历时事实的目标绝不是要用另外一个符号来暗示某一价值,历时事实是自有存在理由的事件.历时事实没有改动系统的倾向,系统从来不直接改动的,它自己不变,改动的只是某些要素,不管他们跟整体的连带关系怎样.一个状态总带有偶然的性质.变更是在一切意图之外产生的,但共时态的事实总是有意义的,总要求助于两项同时的要素,但在历时事件中却只涉及一项要素.语言是一个系统,他的任何部分都可以并且应该从共时的连带关系方面去考虑.变更由于不涉及整个系统,只涉及它的某个要素,只能在系统外进行研究.每个变更都对系统有反应,但原始事实却只能影响到一点,原始事实和他对整个系统可能产生的后果没有任何内在关系.用比较说明两类事实的不同——投影,一棵树的横断面和直断面,下棋在办法和原则上对立的两种语言学——共时优于历时,共时态只知有一个展望,即说话者的展望,整个办法就在于搜集说话者的证词,但历时语言学却有两个展望,辨别是回顾和前瞻.两者研究的规模和界限不合,共时研究的是同时要素间的关系,历时研究一个要素在时间上代替另一个要素的事件.共时规律和历时规律——共时规律是一般性的,但不是命令性的,它意味着规则性的原理;138-155相反,历时态却必须有一种动力的因素,由此产生一种效果,执行一件事情,历时事件总有一种偶然的和特殊的性质.历时事实是个此外,引起系统变动的事件不但与系统无关,并且是孤立的,彼此不组成系统.总之,任何共时事实都有一定的规律性,但没有命令的性质,相反,历时事实却是强加于语言的,但没有一般的东西.把共时和历时混为一谈的后果——共时真理似乎是历时真理的否认,词源和共时价值是有区此外两回事.两者被混为一谈,认为别离是多此一举.结论——语言中凡属历时的,都只是由于言语.首先出于团体,之后被集体采取,酿成语言事实.共时语言学研究同一个集体意识感到到的各项同时存在并组成系统的要素间的逻辑关系和心理关系.历时语言学研究各项不是同一集体意识所感到到的相连续要素间的关系,这些要素一个代替一个,彼此间不组成系统.第二编共时语言学第一章概述一般共时语言学的目的是要确立任何特异共时系统的基来源根底则,任何语言状态的组成因素.普通语法的一切都属于共时态.研究一种语言状态,实际上就等于不管那些不重要的变更.静态语言学是研究时代的,但不如说状态.但不成能听落在一点上,所以只能是近似的.第二章语言的具体实体实体的和单位——语言的实体是只有把能指和所指连结起来才干存在的,如果只坚持这些要素中的一个,这一实体就化为乌有.概念要同音响形象连结起来,才干成为语言学的实体,就像化合物一样.另外,语言实体还要划定界限,把它同音链中围绕它的一切分隔,才算确定.总是就是在语链中排除前后的要素,作为某一概念的能指的一段音响.划分界限的办法——划分界限的实际困难——从词句中难断.结论——语言的特征就在于它是一种完全以具体单位的对立为基础的系统.它的实体不是一下子就能看出来的,可是谁也无法怀疑他们的存在,正是他们的作用组成了语言.第三章同一性、现实性、价值156在像语言这样的符号系统中,各个要素是依照一定规则互相坚持平衡的,同一性的概念常与价值的概念融合在一起,反过来也是一样,简言之,价值的概念就包含着单位、具体实体和现实性的概念.第四章语音的价值语言是组织在声音物质中的思想——语言就是思想和声音的媒介,使它们的结合必定导致各单位间彼此划清界限.,语言是在这两个无定型的浑然之物间形成时制定他的单位的.语言还可以比作一张纸:思想是正面,声音是背面.这种结合产生的是形式,而不是实质.不雅念和声音的联系是任意的.价值只依习惯和普遍同意存在,所以要确立价值就一定要有集体,团体是不克不及确定任何价值的.从概念方面考虑语言的价值——一方面,概念在符号内部似乎是听觉形象的对立面,另一方面,这符号自己,即它两个要素间的关系,又是语音的其他符号的对立面.语言既是一个系统,他的各项要素都有连带关系,并且其中每项要素的价值都只是因为有其他各项要素同时存在的结果.价值有两重组成:1 一种能与价值有待确定的物交换的不合的物;2 一些能与价值有待确定的物相比的类似的物.在同一种语言内部,所有表达向邻近的概念的词都是互相限制着的,只是由于他们的对立才各有自己的价值.反过来,也有一些要素因为同其他要素接触而丰厚起来.不雅念不是预先规定了的,而是由系统收回的价值,我们说价值与概念相当,言外之意是指后者纯粹是暗示差此外,它们不是积极地由它们的内容,而是消极地由它们跟系统中其他要素的关系确定的.在词里,重要的不是声音自己,而是使这个词区别于其他一切词的声音上的区别,因为带有意义的正是这些区别.符号不是通过内在价值,而是通过它们的相对位置起作用的.例如音位首先就是一些对立的、相关的、消极的实体.文字也相似.从整体来考虑符号——语言中只有不同,但语言中却只有没有积极要素的不同,语言不成能有先于语言系统而存在的不雅念或声音,而只有由这系统收回的概念不同和声音不同.但从符号的整体考察,就会看到他秩序里有某种积极的东西.语言系统是一系列声音不同和一系列不雅念差此外结合,但是把一定数目的音响符号和同样多的思想片段相配合就会产生一个价值系统,在每个符号里组成声音要素和心理要素间的有效联系的正是这个系统.能指和所指的结合却是积极的事实,两个符号之间的是区别,是对立.单位也是一样.第五章句段关系和联想关系174-190定义——这些要素一个挨着一个排列在言语的链条上面,这些以长度为支柱的结合可以称为句段.一个要素在句段中只是由于它跟前一个或后一个,或前后两个要素的对立才取得价值.另一种发散性的称为联想关系.句段关系是在现场的,它以两个或几个在现实的系列中出现的要素为基础,相反,联想关系却把不在现场的要素联合成潜在的记忆系列.句段可以使人立即想起要素有连续的顺序和一定的数目,而联想集合里的各项要素既没有一定的数目,又没有确定的顺序.第六章语言的结构句段的连带关系——差未几语言中的一切单位都决定于它们在语链上的周围要素,或者组成它们自己的各个连续部分.整体的价值决定于它的部分,部分的价值决定于它们在整体中的地位,所以部分和整体的句段关系跟部分和部分间的关系一样重要.在语言里,一切都归属于不同,但也归属于集合.集合两种形式同时运行——空间上的配合可以帮忙联想配合的建立,而联想配合又是阐发句段各部分所必须的.我们的记忆常保管着各类类型的句段,有的庞杂些,有的不庞杂,不管是什么种类或长度,使用时就让各类联想集合介入进来,以便决定我们的选择.不雅念唤起的不是一个形式,而是整个潜在的系统,有了这个系统,人们才干获得组成符号所必须的对立.符号可能是相对地可以论证的.句段阐发越是容易,次单位的意义越是明显,那么论证性就总越是完备.论证性永远不是绝对的,这不但因为可以论证的符号的各个要素自己是任意的,并且因为整个要素的价值永远不等于各部分的价值的总和.把某一要素加以阐发,从而得出一种句段关系,唤起一个或几个此外要素,从而得出一种联想关系.事实上,整个语言系统都是以符号任意性的不合理原则为基础的.没有绝对不克不及论证的,也没有绝对可以论证的.不成论证性达到最高点的语言比较着重词汇,如汉语;降到最低点的语言比较注重语法,如拉丁语.第七章语法及其区分190-215语法是指一种使共存的价值产生作用的庞杂而有系统的对象.语法是把语言当做表达手段的系统来研究的,所谓语法的,就是指共时的和暗示意义的.语法的传统区别(形态和功效)可能有实际用途,但不合适自然区别,并且缺乏任何逻辑上的联系.合理的区分——合理的区分是以句段关系和联想关系来区分.第八章抽象实体在语法中的作用抽象实体最后阐发起来,总是以具体实体为基础的.物质单位只有依靠意义,依靠它所具有的功效才干存在.第三编历史语言学第一章概述语音学的历时特性很合适一条原则,即语音学上的一切,没有什么是暗示意义的或语法的.许多语法的变更实际上都是语音的变更.第二章语音变更语音变更的绝对规律性——语音变更不影响到词,只影响音,是有绝对规律的.语音变更的条件——产生变更的不是音种,而是在某些环境、重音等等条件下出现的音位.语音现象有自发的和结合的.结合的语音事实总是有条件的,自发的事实却不一定是绝对的,它可能是消极地因为缺乏某些变更的因素而引起的.语音变更的原因——很多语言学家提供了很多不太使人信服的假设:如人种的不合;气候土壤的不合;省力原则;幼年教育;某一民族时期;政治上的稳定和不稳;民族吞并;风气.语音变更的效能是无限的——215-236语音变更的这种特性决定于语言符号的任意性,它是跟意义毫无联系的.语音变更有其盲目性.第三章语音演化在语法上的后果语法联系的破裂——语音现象的头一个后果是切断了两个或几个要素间的语法联系.语音演化还切断了同一个词两个屈折形式间的正常关系.词的复合结构的消失——语音变更在语法上的另一个后果是使过去有助于确定一个词的意义的不合部分变得不克不及阐发:整个词酿成了分不开的整体.语音演化在使阐发成为完全不成能之前,是从扰乱阐发开始的.扰乱阐发就会促使语法联系的松弛.没有语音上的同源对似词——语音演化自己不克不及创造两个形式来代替一个形式.事实上,不管在什么地方都看不到语音上的同源对似词,语音演化只是加强了在它之前早已存在的不同.交替——有时两个相邻要素间的不同只在于一两个很容易挑出的成分,并且这个不同在一系列平行的成对的词里有规律地频频出现,那就是语音变更在里面起作用的最广泛的、最平常的语法事实,就是交替.在两系列共存的形式间有规则地互换的两个音或音组的对应.交替总是属于语法的和共时态的.交替的规律——交替通常有规则地散布在几项要素之间,并且同功效上、规模上或限定上的重要的对立相吻合.但这些规律只是他们所由产生的语音事实的偶然结果.交替有严格的语法特性.交替和语法联系——两个要素的任何稍有点规则的语音对立都有在它们之间建立一个联系的倾向.第四章类化类比抵消了这些变更的结构,词的外表上的正常变更,凡不属于语音性质的,都是由类比引发的.类比必须有一个模型和对它的有规则的模仿.类比形式就是以一个或几个其他形式为模型的,依照一定规则组成的形式.四项比例式为了抵消语音变更造成不合的效能,类比又重新把这两个形式统一起来,再次成为有规则的.类比作用有利于规则性,倾向于划一构词和屈折的程序,但有时也频频无常.两三个孤立的词往往就足以造成一个一般的形式,比方说一种词尾.类比现象不是变更——任何类比事实都是由三种角色合演的一出戏,传统、合法的继承人;竞争者、由创造这竞争者的各类形式.由于语言不喜欢坚持两个能指来暗示同一个不雅念,那比较不规则的原始形式往往因为没人使用而消失了.类比效能一经完成,那旧状态和新状态的对立看来似乎跟语音演化所造成的对立没有区别.我们往往看到类比产生一些其实不代替任何东西的形式.。

现代汉语时间词的两个核心要素及其蕴含的理论意义

现代汉语时间词的两个核心要素及其蕴含的理论意义

汉语时间词的两个核心要素及其理论价值∗姚双云(华中师范大学 语言与语言教育研究中心,湖北 武汉 430079)摘要:“时基”与“时示”是现代汉语时间词的两个核心要素,时间词的内部一般都包含了这两个概念。

现代汉语时间词最主要的构造方式是“时示+时基”,其次是“时基+时示”。

其内部构造规律可以作为判定时间词的一个重要标准,在汉语的本体研究和自然语言处理领域均有应用价值。

关键词:时间词;时示;时基;核心要素;自然语言处理世界上绝大多数语言都涉及到时间概念,但时间的表达手段与民族的心理特征和文化因素相关。

汉语时间词反映了汉民族表达时间的心理特征,显著特点是具有时间定位和时间度量的双重功能。

比较而言,定位功能是首要的,度量功能是次要的。

作为汉语研究中的一个重要议题,时间词方面的研究成果颇丰。

但是,我们认为有一个极为重要的学术问题长期以来没有得到应有关注:即构建时间词的核心要素是什么。

这个问题不仅涉及到时间词的本体研究,也涉及到自然语言处理。

因为,时间知识及其表示在自然语言理解中占据重要地位。

正如该领域的权威学者爱伦(2005)所言:“支持自然语言的任何知识表示系统的一个中心模块是对动词和时间的处理。

”①本文旨在对现代汉语时间词作定量研究,考察时间词的内部特点与构成方式,以揭示其中蕴含的规律。

我们尝试将时间词的构成规律形式化,为自然语言处理提供必要的知识支持。

论文分析的材料主要来源于《现代汉语句法信息词典详解》②、《现代汉语词典》③、《普通话基础方言基本词汇集》④以及《信息处理用现代汉语分词词表》⑤中涉及的时间词。

一 时间词的两个核心要素与内部构成1.时间词的两个核心要素:“时基”和“时示”时间词与时间不是一个概念。

时间词表示时间,但是表示时间的词不一定都是时间词。

朱德熙(1982)将时间词定义为:时间词是能做“在”“到”“等到”的宾语,并且能用“这个时候”“那个时候”指称的体词⑥。

本文沿用了这一定义。

汉语的时间词蕴含了两个核心要素,本文称之为“时基”和“时示”。

2017国家公务员考试行测备考:词语辨析之语素联想法

2017国家公务员考试行测备考:词语辨析之语素联想法

2017国家公务员考试行测备考:词语辨析之语素联想法公务员考试申论是测查从事机关工作应具备的基本能力的科目,申论试卷由注意事项、给定资料和作答要求三部分组成。

当前公务员考试申论呈现出灵活性、科学性、具体性的特点,对于广大考生的能力要求越来越高,唯有抓住根本,方这里可以>>>在线咨询。

仍有疑惑?我们来看看国考课程是怎么设置教学的。

公务员考试中言语理解是必不可少的部分,而其中逻辑填空占据着半壁江山。

对于此类题目,很多考生认为并不是太难,但正确率却时高时低,无法把控。

由此很多考生就产生了消极态度,认为做言语题目只能靠猜,没什么技巧。

中公教育专家认为,这种心态应对言语理解是十分错误、必须摒弃的,言语理解并非没有方法技巧,掌握规律才能完全hold住它!许多考生在作答逻辑填空题时常常发现,每个词都认识,但是具体如何选择却不知道,感觉每个词放进空格都可以,主要原因是没有搞清楚两个词语之间的区别点。

因此学会对词语进行辨析的方法就尤为重要,一般来说,对两个词语进行辨析最重要也最常用的一种方法就是语素联想法,这种方法主要适用于含有相同语素的词语,通过分析相异语素的侧重含义,进而找到词语间区别。

比如:圣地VS胜地这两个词语之间的区别点就在圣和胜之间,圣:组词圣神,多指最崇高的,对所崇拜的事物的尊称;胜:组词名胜,多指优美的;因而两个词语之间的区别是:圣地——多指圣神的地方,比如:革命圣地;胜地——多指名胜古迹,比如旅游胜地。

这就是运用语素联想法区别词语的方法,如果掌握了此方法,把两个词语之间的区别理解了,就可以根据语境选择出正确选项了。

以下中公教育专家举实例说明:目前我国高校博物馆的数量已有150多座,然而这些博物馆却很寂寞,终年________,有的连自己学校的师生都不知晓,有的由于没有展出条件,众多的宝贝常年灰尘满面,利用率很低。

至于说到免费开放和惠及民众,更是很__________的话题。

依次填入划横线部分最恰当的一项是:A.门庭冷落生僻B.人迹罕至超前C.门可罗雀遥远D.无人问津突兀【参考答案】C。

巧用语素联想法解答湖北事业单位行测逻辑填空

巧用语素联想法解答湖北事业单位行测逻辑填空

更多相关信息点击查看湖北中公教育 巧用语素联想法解答湖北事业单位行测逻辑填空在整个言语的学习中,逻辑填空一直是各位考生比较头疼的题型,学习很长时间也提高不上去,而且好多的词语也不认识,除了我们所学习的运用逻辑呼应法去解题之外,运用语素联想法解题是一个非常有效的方法。

语素联想法指的是通过分析语素对词语进行辨析的方法。

主要适用于含相同语素的词语,通过分析相异语素的侧重含义,进而找到词语间的区别的方法。

首先 我们举一个例子,度过和渡过,两个词语之间有一个语素不相同,那我们可以通过分析这两个相异的语素来去辨别,度这个字一般都与时间相连接,比如欢度春节; 而渡过由于带了三点水,所以一定与水有关,所以渡江,渡河都用第二个渡。

那有的同学会考虑,如果后面加难关,应该用哪个呢?我们在去细分,如果后面接难 关,一定是前行遇到了阻力,那么这两个语素中哪个能体现到阻力呢,因为渡过中的渡带有三点水,在水中前行是会有阻力的,所以应该用这个渡过,即渡过难关。

比如营私舞弊和徇私舞弊两个成语,第一个营私舞弊侧重于营私,侧重于图谋私利;而徇私侧重于利用私人关系来进行违法乱纪;在比如圣地和胜地。

第一个圣地都 是神圣的地方,如革命圣地;而第二个胜地一般都指的是名胜,如避暑胜地。

这是利用相异语素来进行组词从而在进行猜测。

在比如不负众望和不孚众望,两者只差 了一个字,不负众望中的负字是辜负的意思,所以不负众望的意思是不能辜负大家的期望,而不孚众望的孚字是信服的意思,所以不孚众望的意思是不能使大家信 服。

在比如化妆和化装,第一个化妆和“女”的有关,侧重于让自己更漂亮;而第二个化装则侧重于伪装,隐蔽的含义。

在比如不容置疑和不容置喙,前者侧重于不 能提出疑问;而后者则侧重于不能插嘴。

在考试中还会有一种情况是这个字根本就不认识,比如曌字,这个字不认识我们也可以利用偏旁部首来进行猜测,曌字的结构是上面是日、月、下面是空字,日月当空应该是非常明亮,晴朗的画面,这个字就是这层含义。

语言学概论课后习题答案(胡晓研)

语言学概论课后习题答案(胡晓研)

术语解释1.语言学:语言学就是专门以语言为研究对象的一门独立的科学。

语言学的任务就是研究语言的性质、功能、结构及其运用等问题,揭示语言存在和发展的规律,使人们理解并掌握语言的理性知识。

2.语文学:语文学是从文献角度研究语言文字学科的总称。

它以文献评审为主,目的在于解释、注疏和考订。

3.语言:语言是一种特殊的社会现象,它作为人类最重要的交际工具为全社会服务,它同人的思维有密切的联系,是人区别于其他动物的本质特征之一,语言是音义结合的符号系统。

4.言语:言语是人们为了某种目的,在特定条件下发生的说话行为和说出来的话。

这里的“说话行为”是指说话的动作和过程;“说出来的话”是指一连串有意义的声音。

5.索绪尔:现代语言学的历史,是从瑞士语言学家费尔迪南·德·索绪尔开始的。

索绪尔的代表作是《普通语言学教程》。

索绪尔被誉为“现代语言学之父”,《普通语言学教程》是现代语言学的奠基之作。

索绪尔的语言学思想和19世纪以前的语文学最根本的区别在于:把语言看成是由各个符号之间的关系组成的有价值的结构系统。

6.布龙菲尔德:是美国描写语言学派的核心人物。

他们注重语言行为的描写,而不注重语言能力的解释;着眼于语言间的差异,而不重视语言的普遍性。

其着作有《语言论》7.乔姆斯基:1957年美国语言学家诺姆·乔姆斯基《句法结构》的出版,标志着“转换生成语法”的诞生。

这一理论是建立在理性主义的哲学基础之上的,它完全不同于建立在经验主义基础之上的美国结构主义,因此,它的出现是对当时居于主流地位的美国结构主义语言学的一大挑战,被人称作“乔姆斯基革命”。

8.菲尔墨:是格语法的代表,其代表作是1968年发表的《格辩》。

他认为标准理论无法说明类似下列两个句子中名词短语与动词短语之间的关系究竟有何区别:Thechildopensthedoor./Thekeyopensthedoor.这种名词短语与动词短语之间的功能关系只有用更深一层的语义区别才能解释清楚。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例句 3 三叠纪是 2.5 亿至 2 亿年前的一个地质时代 ,它位于二叠纪和侏罗纪之间, 是中生代的第一个纪。(www. 2004 年 06 月 09 日) 句中“纪”之前加了数量结构“第一个”,这句话里“纪”做名词。再如:
例句 4 显生宙的前一宙是元古宙。 句中“宙”之前加了数词“一”,这句话里“宙”做量词。由此可见,“宙、代、纪、世”也应该是 表达时间概念的涉数时间词,兼具名词和量词的词性。
切分
67
名词
切分
1742
名词、时间词、量词、习 标注为名词、量词和名语素时切分,标注为时
用语、名语素
间词和习用语时不切分
215
名词
切分
27007
时间词、名词、代词
标注为时间词和代词时不切分,标注为名词时 切分
689
时间词
不切分
时间词、名语素、代词、 标注为时间词和代词时不切分,标注为名语素
483
量词
1. 引言
有这样一组句子: 例句 1 (a)工程只用了两个半月就顺利完工了。
(b)展览可以持续开放半月甚至一个月。 在现代汉语自动分词中,例句(a)和(b)中的“半月”一词,在构词形式上都属于“数 (量)词+时间语素”,但(a)句中的数词“半”应该和前语境“两个”结合在一起构成完整的数量 “两个半”,即 2.5。而(b)句中的数词“半”本身就代表了完整的数量 0.5,应该直接和时间量词 “月”结合。所以(a)句中的“半月”要切分而(b)句中的“半月”不需切分1。 但在相同形式的另一组句子中: 例句 2 (a)他用了两个半天写完了这篇文章。
将“时间词”作为一个单独的词类提出的似乎只有朱德熙[8](1982)一人,他从名词中独
-1-

立出时间词、方位词和处所词。朱先生这样做是有一定道理的:首先,从语法意义上说,时 间词表示抽象的时间概念,不表示一般的事物,不同于一般的名词;其次,时间词能直接做 介词“在、到、从”的宾语,构成介词结构(如:在春季、到今天为止、从下一年开始),这 是一般名词所不具备的;另外,能被“这会儿”代替,能用“多会儿”提问,这也是一般名词所 不具备的。但是,朱先生同时又指出“时间词都表示时间,但是表示时间的词不一定是时间 词”,比如“已经、刚刚、忽然”是副词;“时间、时候、功夫”是一般名词;“一会儿、半天、 两年”是数量词,这些都不是时间词。按照朱先生的说法,本文所要讨论的“涉数时间语素” 就不应该属于“时间词”,而是数量词了。但看例句 2 中的两个“半天”,按照朱先生的意思, (a)句中的“半天”应该是数量词,但(b)句中的呢?

“两个半天”和“两个半月”——面向词法自动分析的 涉数时间语素说略
张霄军 1,2,冯敏萱 2
1 陕西师范大学外国语学院,西安 (710062) 2 南京师范大学文学院,南京 (210097)
E-mail:Andy_zxj@
摘 要:涉数的时间语素的词类问题一直是汉语学界争论的一个热点,这些语素在汉语词法 自动分析中也是最容易造成混淆和产生不一致的元素。本文从中文信息处理中词法自动分析 的角度剖析了涉数时间语素的词类归属,考察了 1200 万真实语料中涉数时间语素的词性标 注和自动分词情况,并提出了改进的面向汉语词法自动分析的这些语素的自动分词原则和词 性标注原则。 关键词:涉数时间语素,词类,词法自动分析,词性标注,自动分词
代-世 在陆先生考察的时间词中,并没有单独的“代”和“世”。我们认为这两个词也是表示时间 概念的,前面也能够加数词或数量词。例如 例句 5 一代不如一代。 例句 6 第一代计算机以电子管作为主要元器件。 例句 7 罗马天主教的教皇约翰·保罗二世度假结束,25 日返回了他在梵蒂冈的公寓。 ( 2003 年 09 月 26 日) 例句 8 詹姆斯绝对不是所谓的“乔丹二世”,这绝不是指他不如乔丹出色,而是因为詹 姆斯从某种程度上看已经超越了乔丹。( 2006 年 05 月 19 日) 以上例句中,“代”和“世”前面均可以加数词且表达一个时间概念,所以它们也属于量词。 此外,“年初”、“年中”、“年底”、“年末”、“月初”、“月中”、“月终”和“月末”做为词出 现时,前面也可以加数词修饰表示一个时间段;“春秋”表达“一年”的概念时前面也可以加数 量词修饰。这样,我们就把时间语素的数目扩展到了 80 个。 下面我们在考察真实语料文本的基础上讨论以下几个问题:(1)涉数时间语素除了名词、 量词和名词兼量词以外是否还有其它词类?(2)语素与数(量)词是单独成词还是组合成 词?(3)还有没有其它兼类的可能?
(b)我等她等了半天。 例句(a)和(b)中的“半天”一词,貌似例句 1 中的(a)和(b),但实际上差异很大。 (a)句中的“两个半”并不是指 2.5,而是指两天中各取半天,“半天”应该是一个独立的概念, 指 0.5 天,不能切分。而(b)句中的“半天”也并不是指确切的就 0.5 天,而是指“很长的一 段时间”,也不能切分。 这样就引出了与涉数的时间语素相关问题的讨论,尤其是涉数时间语素在中文信息处理 的词法自动分析中该如何处理的问题。
真实语料自动分词情况3
3782
名词、时间词
标注为名词时切分,标注为时间词时有时切分 有时不切分
1913
名词
切分
65697
时间词、量词、名词、代 标注为时间词和代词时不切分,标注为量词和

名词时切分
量词、成语、习用语
标注为量词时切分,标注为成语和习用语时不
968
切分
573
名词
切分
1220
名词
切分
9
名词
5
时切分
9610
习用语
不切分
13010
时间词
切分
46
时间词
不切分
32549
时间词、量词、代词、名 标注为时间词和代词时不切分,标注为量词和

名词时切分
984
量词、名词
有时切分,有时不切分
8
名词
切分
5
名词
切分
107
名词、时间词
切分
-4-

结合具体的真实语料的标注情况,分析一下上述统计结果: 1、不论是涉数时间语素的词性标注还是自动分词,不一致现象都非常严重,大大降低 标注语料库的质量。在具体语料标注考察过程中我们发现具有相同语法意义和相同语法功能 的涉数时间语素在不同语境中被处理成了不同的词类。如“天”,在“前一天”中被标注为“时 间词”,在“过些天”中被标注为“名词”,在“过几天”中被处理为“量词”,在“大半天”中被处理 为“数词”。即使完全相同的语素有时也被标注为不同的词类,如有的“一夜”被标注为“时间 词”,有的“一夜”中的“夜”被标注为“量词”; “一个星期”中的“星期”有时被标注为“习用语”, 有时则被标注为“名词”。自动分词中的不一致现象更加普遍,具有相同语法意义和相同语法 功能的涉数时间语素在不同语境中有的和前加数(量)词从合,有的则从分。如:“三天三 夜/”和“三/天/三/夜/”、“一夜/”和“一/夜/”、“半/天/”和“大半天/”等。涉数时间语素词性标注的 混乱和自动分词的杂糅会给后续的句法分析和语义分析带来麻烦,而且也为在该分词语料库 上进行其它应用研究带来不便,大大有损于带标语料库“金本位”4的美誉。 2、词法分析的本体研究和自然语言处理研究有很大的差异。在汉语本体研究中,对于 词类体系研究有两种学说:一种是“依句辨品说”(以黎锦熙为代表),就是要根据词例正在 实现着的语法功能来确定它所属词类;另一种是“词类多功能说”(以朱德熙为代表),主要 观点是在汉语中有很多词类,特别是动词和形容词,其语法功能不是单一的,因此不管它正 在实现何种语法功能其词类不变。对于词法自动分析而言,根据“依句辨品说”实现的词性标 注将会为自动句法分析提供更多的信息,但会导致兼类词的急剧膨胀,这又会给语言信息处 理带来很大的歧义消解的困难;如果根据“词类多功能说”来实现词性标注可以减少兼类词, 但能为句法分析所提供的信息却又会少得可怜。看来,本体研究中的词类体系的划分可以为 词法自动分析中的词性标注提供借鉴,但不能完全照搬照抄。陈小荷[12](1999)提出了一 种设想:先确定一个语法功能清单,然后在语法词典中详尽描述每个词在任何一种语法功能 上的表现(有或无),根据每个词型5的语法功能的总和来划分词类。在这种思想的指导下, 我们对 80 个涉数时间语素的语法功能进行了考察,得出了涉数时间语素的词类划分体系, 详见后述。 对于自动分词而言,“词”在语言本体研究和自动分词研究中也有很多差异。“词”这个概 念一直是汉语语言学界纠缠不清而又挥之不去的问题(刘开瑛,2000)[13]。集中体现在“词 是什么”(词的抽象定义)及“什么是词”(词的具体界定)这两个问题上,其主要困难在于 单字词与语素的区别以及词与短语的区别。此外,还有群众的语感对“词”的认识的影响等。 在自动分词中,一直没有一个统一的分词词表,主要就是大家对“词”的界定不清楚。《信息 处理用现代汉语规范》(以下简称“《规范》”)中对“分词单位”的定义是:汉语信息处理使 用的、具有确定的语义或语法功能的基本单位。这个定义是定性的,也是模糊的,在《规范》 中对分词单位稍微具体一点的描述是“结合紧密、使用稳定”,但这也不能解决自动分词中 “词”的问题。黄昌宁[11](2005)提出利用高质量带标语料库判定汉语的“词”,并将其收入动 态的词表为后续分词提供分词依据。这样就可以把有关“词”的争论搁置一边,“使自动分词 成为一个定义精良的科学问题”。在此理论指导下,我们考察了带标语料库中涉数时间语素 的切分情况,利用错误驱动的方法对涉数时间语素的自动分词规则做了改进,详见后述。 3、兼类词造成的语义歧义。 涉数时间语素与数(量)词连用组成的词(短语)可能会产生语义上的歧义。这种具有 语义歧义的词有两种形式:一种是新词的语义与时间概念无关,如“四周”;另一种新词的语 义与时间概念有关,如“半天”。在处理这些语义歧义时,前一种歧义一般都组合成词,而且
38314
时间词、名词、量词、代 标注为量词时切分,标注为名词、时间词和代
相关文档
最新文档