计算语言学概论——应用语言学系列教材

合集下载

于根元《应用语言学概论》课后练习答案

于根元《应用语言学概论》课后练习答案

应用语言学概论课后练习及答案第一章:1、举例说明为什么有了本体语言学还要有应用语言学。

答:因为本体语言学和应用语言学两者之间不具有可比性。

一方面,语言基本上是社会现象而不是自然现象,语言的发展和使用受到多种因素的影响,语言的应用有自身的规律,无论是语言应用的哪个方面。

另一方面,人们已经而且将会进一步看到,仅从语言自身看语言是不能完全认识语言的。

语言的应用研究不仅有利于语言应用本身,而且也有利于加深对语言本身的认识。

因此,没有语言的运用,就没有语言。

要全面认识语言,真正认识语言,必须结合语言的应用来进行。

例如,为什么一个人在不同的场合会使用不同的表达方式?为什么明明是两个不同的音有人却听成相同的音?为什么同样的词语会产生不同的交际效果?离开了语言的运用,单从语言本身是无法回答这些问题的。

因此,有了本体语言学还要有应用语言学。

2、历史比较语言学让位于结构主义语言学的两个历史教训是什么?答:历史比较语言学让位于结构主义语言学的一个历史教训是:历史比较语言学家的唯我独尊和封闭的态度。

认为只有研究语言历史的语言学才是科学,其他的研究都不是科学。

第二个教训是:研究的局限性。

它只注意古语言,并不研究现有的活语言。

因此,它在经历了光辉的百年之后,逐渐被新的研究兴趣所替代。

3、说说《普通语言学教程》的作者、出版时间和历史地位。

答:《普通语言学教程》的作者是瑞士语言学家索绪尔,出版时间是1916年,历史地位:书中针对历史比较语言学的不足提出的语言学理论,奠定了现代语言学的基础,因此成为现代语言学的“圣经”。

4、说说《马氏文通》的作者、出版时间和历史地位。

答:《马氏文通》的作者是马建忠,出版时间是1898年,历史地位:是中国形成独立的语言学学科的标志。

5、说说中国形成语言学的背景。

答:中国形成语言学是在19世纪和20世纪之交,有两个背景:一是受西方学术文化的影响,一是中国传统语文学自身的发展。

当时语言学方面中国向外国所学的理论、方法及层次是比较低的;学习的方法、层次也是比较低的。

应用语言学概论

应用语言学概论

应用语言学
Applied Linguistics
7.1946年美国在密执安大学建立了英语学院,研究如何
对外国人讲授英语,并出版著名的杂志《语言学习》,
这个刊物的副题就是《应用语言学杂志》。这是世界上 第一本明确冠以“应用语言学”的杂志。从此,应用语 言学作为一门独立的语言学科,受到学术界的承认和接 受。
应用语言学是中 国近20年来发展十 分迅速的学科,它 具有交叉性、应用 性、边缘性的特点, 对社会生活和经济 的许多方面都有积 极的影响或重要的 支撑作用,是语言 学的重要组成部分。
应用语言学
Applied Linguistics
二、应用语言学学科形成发展情况 应用语言学概念的提出 19世纪末,波兰J.N.博杜恩· 库尔德内提出了应用语言学 德· 这个概念。 独立的应用语言学学科形成的标志是1964年第一届国际应 用语言学大会在法国召开和国际应用语言学会的成立。 中国应用语言学学科形成的标志是:1984年语言文字应用 研究所成立,1992年《语言文字应用》杂志创刊,1995年 首届全国语言文字应用学术研讨会举行和中国应用语言学 会的筹建。
应用语言学
Applied Linguistics
在现代汉语规范研究方面,语言研究所词典编辑室编写的 《现代汉语词典》1978年由商务印书馆正式出版,1996年 出版了修订本。 这个时期还出现了一些新的学科和研究领域,如计算语言 学、社会语言学、文化语言学,双语双方言、称谓、北京 街巷名称、体态语、新词新语、文学作品语言、语言风格 研究等。 这个时期在建立研究机构、创办研究杂志、设置课题、培 养队伍等方面,都有一些实践和研究。1995年12月筹建了 中国应用语言学会。
应用语言学
Applied Linguistics

《计算语言学概论》PPT课件

《计算语言学概论》PPT课件
15
4.2 詞ê判別-11
其它ê問題(辭典無收ê詞)
定量詞 eg 三張紙、二十五個人、…
定量詞若無處理,會影響台語變調結果
複合詞問題 eg 國中小、上下班、… Prefix/Suffix eg 正確性、相關性、… 重thah詞 eg 歡歡喜喜、輕輕鬆鬆、… 人名、地名 eg 陳水扁、舞鶴、… 組織名、商品名 eg 台大資訊系、可口可樂、… 新名詞、簡省詞 eg E世代、A菜、資工、… 術語(Term)
(語詞)
3. A=[aij]nn , aij = P(qt+1=j | qt=i), 1≦ i ,j ≦N (目前詞
類是i ê情形下,下一個詞類是 j ê機率)
4. B={ bj(k) }, bj(k) = P(vk|j), 1 ≦k ≦M, 1 ≦j ≦N
5. π是開始狀態ê機率分佈
23
4.3 詞性標注-8
實作上
Beh按怎真緊ka詞chhe出來? 斷詞beh按怎做disambiguity? 詞類beh按怎做disambiguity?
5
4.2 詞ê判別
英文ê詞 (Tokenization)
White Space / 標點 隔開 有ê詞用標點隔開 eg “I’ll” “can’t” 有ê縮寫詞有句點 eg “U.S” 有ê詞有非字母 eg “AT&T” “Micro$oft” 數字 eg “123,456.789” “23.5%” “2005/12/21”
n個詞類,O(nm)
28
4.3 詞性標注-13
Viterbi : 利用動態規劃 ê觀念
假設每一個詞lóng有n個詞類標記,wm kàu wm+1 êj-th標記,有n個可能ê路徑,假設機 率siong kôan ê是 ti tj這個路徑

应用语言学概论习题答案

应用语言学概论习题答案

《应用语言学概论》教案(一)应用语言学概论第一章绪论第一节应用语言学学科建设一、应用语言学诞生福建有一位中学语文特级教师陈日亮有一个著名的观点:“世界即语言,语言即世界。

”“社会生活“把一切化在语言之中,把语言化在一切之中。

”应用语言学存在的事实,几乎与语言的诞生同时,就有了语言的应用。

但是作为一门独立的学科存在,则历史很短。

1870年波兰语言学家.博杜恩.德. 库尔德内首先提出“应用语言学”术语。

历经近百年的探索和积累,直到二次世界大战结束,社会、科学、文化、教育,特别是光电子信息技术的迅猛发展,世界各种语言面临生存和发展的挑战,纷纷推行新的语言战略,促使多学科结合的应用语言学作为独立学科的诞生和发展。

二、应用语言学学科建设1、应用语言学国际发展状况、标志:1964年第一届国际应用语言学大会在法国南锡召开并成立了国际应用语言学协会。

1970年出会刊。

欧美一些现代化水平较高的国家,在语言学和计算机紧密结合的过程中,迅速发展了语言信息处理、计算语言学、社会语言学、语言规划和语言教学理论,产生了众多颇有建树的应用语言学家。

而且各有发展特点。

一般说来,社会语言学率先在欧美国家发展起来的。

语言规划方面,美国、法国、俄罗斯比较领先。

在欧洲,语言学摆脱“哲学的婢女”的地位,成为一门独立的学科,始于19 19 世纪。

几乎整个19世纪,为寻找印欧语的共同来源,运用历史比较法研究语言,世谓一展辉煌的历史比较语言学。

19世纪与20世纪之交,结构主义语言学兴盛并取而代之。

总体上,国外应用语言学发展较快,理论逊于实践。

1946年美国密歇根大学开设应用语言学课程;1949年美国密歇根大学创办世界第一个应用语言学刊物;1969.9在伦敦召开第二届国际应用语言学大会。

2、中国应用语言学基本态势、从时间上看,比世界整整晚了20年。

这和语言大国的地位很不相称。

改革开放30多年来,情况发生了很大变化。

1984年经国务院批准始成立语言文字应用研究所;这是我国应用语言学形成的标志。

Computational_Linguistics_01计算语言学概论

Computational_Linguistics_01计算语言学概论

名称
授课时间授课地点助教
平时成绩期末笔试
计算语言学是一门交叉学科。

计算语言
语言障碍
终极目标当前目标
建立形式化的适于计算机处理的语言模研制分析、生成以及处理语言的各种算
规则方法举例
计算语言学的研究方法
用上述规则分析句子“the boy saw the girl with a telescope”
All grammar leak (Sapir 1921)
一般而言,很多基于规则的系统不能满
融合规则驱动和数据驱动的方法
著名的例子
联机机器翻译网站
联机
信息检索系统Google
文本数据结构化
文本分类(自动判别文本的类别)音字转换(汉字整句输入法)
拼写检查和自动勘校系统。

《应用语言学概论》课件

《应用语言学概论》课件
法律语言研究
应用语言学对法律语言进行研究和分析,以确保法律语言 的准确性和规范性。
01
司法语言与公正
应用语言学关注司法语言与公正的关系 ,以提高司法审判的公正性和公信力。
02
03
法律文书写作
应用语言学为法律文书写作提供语言 学上的指导,以确保法律文书的准确 性和规范性。
04
应用语言学的研究方法
实证研究法
语言障碍与治疗
心理语言学还涉及语言障 碍的诊断和治疗,研究各 种语言障碍的成因和治疗 方法。
文化语言学
语言与文化关系
文化语言学关注语言与文化的关系, 研究语言的符号意义和文化内涵,探
讨语言如何反映和传承文化。
跨文化交际
文化语言学还涉及跨文化交际,研究 不同文化背景下的语言使用和交际策
略。
文化变迁与语言变化
分析实际语境中的语言使用情况,以揭示话语的语义 、语用和语境特点。
详细描述
话语分析法是应用语言学中用于分析实际语境中语言 使用情况的研究方法。它通过分析实际语境中的话语 ,包括对话、演讲、新闻报道等,来揭示话语的语义 、语用和语境特点。这种方法有助于深入了解语言的 实际使用情况,提高语言交际能力。
语料库研究法
文化语言学还关注文化变迁与语言变 化的关系,研究文化因素对语言发展
的影响。
计算语言学
自然语言处理
计算语言学在自然语言处理方面,研究如何利用计算机技术处理、 分析和理解自然语言。
信息抽取与文本挖掘
计算语言学还涉及信息抽取和文本挖掘,研究如何从大量文本中提 取有用信息并进行语义分析。
机器翻译与语音识别
比较不同文化背景下的语言现象,以揭示文 化因素对语言使用的影响。
详细描述

应用语言学概论5自然语言处理精品PPT课件

应用语言学概论5自然语言处理精品PPT课件

二、任务和理论依据
• 任务:
A、数理语言学从数学领域得到的主要是思考问题的 思路和方法,而不是某种专门的结果,它把数学 模型和数学程序运用于语言学的研究,采用定量 化和形式化的描述方法,使得语言学和数学一样 精密,以便于计算机的操作,为计算机模拟人脑 和进行人工智能的研究开山辟道。
B、从语言的内部结构和语言的交际活动两方面进 行,也就是说把数理语言学的研究首先分为作为 符号 系统的语言的数学性质的研究和对作为交际 活动的过程及结果的言谈的数学性质的研究两个 部分。
数理语言学分支学科介绍
1、统计语言学 运用概率论、数理统计等数学的方法来作语
言成分的定量分析和动态描写,目的是要建立语 言统计模型,来解决传统语言学研究的定性和静 态研究的不足。
统计语言学根据不同的研究对象,又可分出 许多具体领域,如统计语音学、计算语言风格学 和年代统计学。统计语音学研究音素音位,计算 语言风格学通过统计研究某人、某一时代和某一 民族的言语风格。年代统计学根据时代的变化, 对词汇特征和句型等进行分析。
1985年上海知识出版社出版了冯志伟编著的数理语言学较为系统的阐述了数理语言学的理论知识包括该学科的重要定律和术语1997年北京语言文化大学出版社出版了方立编著的英文版的数理语言学这两本书成为我国目前研究数理语言学的集大成者此外在数理语言学领域研究取得较大成绩的还有白世云张世武孙锐欣盛金标等学者1985年上海知识出版社出版了冯志伟编著的数理语言学较为系统的阐述了数理语言学的理论知识包括该学科的重要定律和术语1997年北京语言文化大学出版社出版了方立编著的英文版的数理语言学这两本书成为我国目前研究数理语言学的集大成者
• 3,根据检索到的实例生成与源语言句子相对应的 译文。
• 例子: • 金山词霸:词库、释义库、音库

应用语言学之计算语言学

应用语言学之计算语言学
LOGO
第四节
语料库语言学
20 世纨 80 年代以后,陆续建立了一些以词典编纂为应用背景的大规模语料库。 COBUILD语料库(Collins Birmingham University International Language Database,首字母缩写就是 COBUILD)。1987 年,Collins 出版社出版了建 立在 COBUILD语料库基础上的英语词典,词条选目、用法说明和释义都直接 来自真实的语料。2003 年这个语料库的规模已经达到 5 亿词次,其中包含
未来,随着语料库语言学的収展,语料库还能为文学的研究、文化 的研究甚至社会学的研究提供帮助。
语料库网址:
北京大学《人民日报》标注语料库:/ 北京语言大学的语料库:/kych/H.htm 清华大学的汉语均衡语料库TH-ACorpus:/ainlp/source.htm 山西大学的语料库: /homepage/cslab/sxuc1.htm 台湾中研院的语料库: 现代汉语平衡语料库:.tw/SinicaCorpus 戒 .tw/~tibe/2-words/modern-words/ 戒 .tw/ftms-bin/kiwi.sh 近代汉语标记语料库:.tw/Early_Mandarin/ 古汉语语料库:.tw/ftms-bin/ftmsw3 戒 /projects/scriptasinica/cgi-bin/ghy/kiwi.cgi 戒 .tw/~tibe/2-words/old-words/ 台湾南岛语典藏:.tw/Formosan/ 闽南语典藏:.tw/ 汉籍电子文献:.tw/~tdbproj/handy1/ 戒 .tw/ftms-bin/ftmsw3 香港城市大学的 LIVAC 共时语料库:.hk/livac/ 戒 浙江师范大学的历叱文献语料库: /xueke/hyywzx/xkjj.htm 中国科学院计算所的双语语料库:/corpus/query_process.php 中文语言资源联盟:/xyzy.htm
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本书简介
本教材从“基础”“算法”和“应用”三个方面,较为系统地介绍计算语言学的基础理论、相关的自然语言处理技术和应用。

基础部分(包括一、二、三章)主要讲述计算语言学的数学和语言学基本概念,计算语言学和自然语言处理技术的关系,自然语言处理的基本流程等内容。

此外,作为计算语言学的重要分支之一,语料库语言学得到了较大发展,有关语料库语言学的基础概念、基本理论、近年来的一些发展概况在第三章中加以介绍。

介绍这部分内容的目的,是让读者在不涉及技术细节的情况下,对计算语言学有一个初步的,同时也是较为全面的理解和掌握。

算法部分(包括第四、五章)主要介绍计算语言学的常用技术和算法。

从处理对象来讲,主要包括词法层面的分析技术、句法层面的分析技术和语义层面的处理技术;从处理方法来讲,既有传统的规则方法,也有基于语料库的统计方法的介绍。

这部分内容的主旨是希望通过本章学习后,使学生能对计算语言学的领域中的一些主流技术(比如隐马尔可夫模型在词性标注中的应用,GLR算法
,部分分析技术等)有一个概要的认识,并能运用这些技术进行计算语言学相关的工作实践。

应用部分(包括第六、七章)主要讲授自然语言处理应用系统。

需要说明的是,基于语言信息处理技术的应用系统很多,本教材只是重点介绍一些常见的系统,介绍这些系统的工作机理、发展、取得的成绩,也客观介绍这些系统存在的问题和困难。

主要包括机器翻译系统,信息检索系统、信息提取系统,文本分类系统等。

目录
第一章 绪论:什么是计算语言学
 第一节 计算语言学的研究对象
 第二节 计算语言学的研究方法
 第三节 计算语言学的实际应用
 第四节 小结
第二章 语言知识的形式化表达
 第一节 语言与语言知识
 第二节 形式化表达手段
 第三节 语法知识的形式化表述理论体系
 第四节 语义知识的形式化表述理论体系
 第五节 语篇知识的形式化表述理论体系
 第六节 小结
第三章 语料库:语言知识的另一种表示形式
 第一节 语料库研究概况
 第二节 语料的收集与加工
 第三节 语料库的应用
 第四节 小结
第四章 词法分析
 第一节 概述
 第二节 “词”的识别
 第三节 词性标注
 第四节 词义标注
 第五节 小结
第五章 句法分析
 第一节 句法分析导引
 第二节 广义LR分析算法
 第三节 基于线图的分析技术
 第四节 其他句法分析技术
 第五节 小结
第六章 机器翻译
 第一节 机器翻译概述
 第二节 基于规则的机器翻译
 第三节 基于语料库的机器翻译以及混合式机器翻译
 第四节 机器翻译的困难、对策和评价
 第五节 小结
第七章 面向文本的智能信息处理
 第一节 信息检索
 第二节 信息提取
 第三节 文本自动分类
 第四节 小结
术语表
后记
下载后 点击此处查看更多内容。

相关文档
最新文档