语料库语言学与中国外语教学
语料库语言学与教学

3.运用语料库进行外语研究:方法和实例 3.1 分析词语的方法
3.1.1 不同语域词频差异的调查 3.1.2 根据搭配调查语义差异 3.1.3 根据搭配调查语义韵差异
3.2 学习者中介语的调查 3.2.1 学习者与本族语者之间的对比 3.2.2 不同母语背景学习者之间的对比 3.2.3 不同层次学习者之间的对比
语料库建库原则
表1.“英语用法调查”语料库 (I)原始书写语料(100篇) (A)印刷品(46) (B)非印刷品(36) 人文科学 6 ┌ 想象性 连续书写品┤ 自然科学 7 └ 资讯性 教学 6 ┌ 一般新闻 4 ┌亲密 报刊┤ 社交书信┤平等 └ 专门报导 4 └疏远 文书 4 ┌平等 非社交书信1┤ 法律 3 └疏远 论说文 5 日记 散文小说 7 (C)口语(18) ┌资讯性 剧本 4 谈话┤ └想象性 正式演说(经转写) 3 故事 广播新闻 3 5 6 6 4 4 4 4 4 4 2 2
4
语料库建库原则
语料库的主要用途之一是发现语言的主要的和典 型的用法。 一般用途语料库的语料随机地取自各种来源,在 语域方面尽量避免偏向,例如Brown语料库在语域 上分为15个类别(新闻报导、社论、新闻评论、 宗教、技能和爱好、学术和科技、各类小说和幽 默等等)。 语料采集方式最根本的目的在于尽可能保证所采 集的语料具有代表性,保证所收录的语料最大程 度地涵盖具体语言在诸如语体、语域、地域变体、 作品年代、作者性别、题材类型等多方面的比例 合理性,进而保证建成后的语料库能囊括具体言 语行为的普遍规律性。 5
9
3.1 分析词语的方法
3.1.1 不同语域词频差异的调查 Rundell就曾利用BNC的口语部分调 查发现: began在书面语中出现的次数几乎 是 started的两倍,而在口语中出现的频率 要比started低得多。
语料库语言学对外语课堂教学的影响研究

ln u g e riga drs ac ig I ee t e r, h w cl cr u ig i isb sd i n l h ca s e c igb c me n fte a g aelann n e erhn .n rcn as o al o sl us c eu e n E gi l —ta hn o so eo y p n t s s e h
性 ,进行 自主学习。 由此 可见 ,外语 教师借 助计算 机对 语
料库所提 供的大量语言材料进行相应 的分 析 、统计和应用 , 必将 能为外语课堂教学掀开崭新的一 页。
一
学的主流分支 。随着计 算机 技术 的迅猛发 展 ,电子语料 库 语 言学 以其大容量 的语 言信 息和 高效 的检索结果 对语 言研
中 图分 类 号 :H 1 文 献 标识 码 :A 文 章 编 号 :17 — 8 X (0 0 7— 10—0 39 6 1 3 0 2 1 )0 0 7 3
T e Efe to r u n u sis o o eg n u g a h n h f c fCo p s Li g itc n F r i n La g a e Te c i g
第3 2卷 第 7期 2 1 7月 00年
宜春 学院学报
Jun lo c u o e e o r a f h n C l g Yi l
V0. 2. N . 】3 o7
Jl. 0 0 uy 2 1
语 料 库 语 言学 对 外语 课 堂 教学 的影 响研 究
马 晓 欢
( 阳师 范学院 外 国语 学院 ,河 南 信 阳 4 4 0 ) 信 600
语料 库语 言学 ( opsLnu t s C ru igi c )兴 起 于 2 s i 0世纪 中
语料库语言学和英语专业教学

语料库语言学和英语专业教学
语料库语言学是一门研究语言使用的学科。
它以语料库为基础,通过对大量语料的分析,探究语言的规律和特征。
语料库语言学在英语教学中也有着广泛的应用。
在英语专业教学中,语料库语言学可以帮助学生更好地了解英语的实际应用,提高英语语言水平。
通过对语料的分析,学生可以了解到英语的实际用法和常见搭配,从而更好地理解英语语言的语法和用法。
此外,语料库语言学还可以帮助学生分析和解决语言运用中的问题,比如翻译、写作和口语表达等方面。
通过对语料库的分析,学生可以了解到英语的典型表达方式和常见错误,从而更好地运用英语,提高语言表达能力。
总之,语料库语言学在英语专业教学中具有重要的意义,可以帮助学生更好地理解和应用英语,提高英语语言水平和表达能力。
- 1 -。
浅谈语料库语言学与外语教学

520 ) 3 20
重 新 思 考 。她 指 出 语 料 库语 言学 并 不 是 一 个 真 正 意 义 上 的科 学研究领域 , 不过是为语言研究提供了一种方法论基础 , 只 同 时它 又 给 语 言 学 的研 究 提供 了新 的哲 学 思 路 。所 以它 是 介 于 理 论 和方 法 论 之 间 的 一 种 东 西 。 她 的 这一 观 点 代 表 了相 当多 语 言 学 家 的看 法 。 在 我 国学 者 中 ,顾 日国 在其 文章 中指 出 ,语 料 库 语 言学
2 1 料 库 .语
(o u n usc) 个 术语 有两 层 主 要 含 义 。一 是 利 用语 料 库 cr sigi i 这 p l ts 对 语 言 的 某 个 方 面 进 行 研 究 . “ 料 库 语 言 学 ” 是 一 个 新 即 语 不 学科 的名 称 , 仅 仅 反 映 了_ 个 新 的研 究 手 段 。 是 依据 语 料 而 二 库反 映 出来 的 语 言 事 实 对 现 行语 言学 理论 进 行 批 判 ,提 出新 的观 点或 理 论 。只 有 在 这 个 意 义 上 “ 料 库 语 言 学 ” 语 才是 一个 新学 科 的名 称 ( 日 国 ,o 3 。 顾 2 o )
语 料 库 ( op s亦 称 词 库 或 素 材 , 存 放 语 言 材 料 的 仓 C ru ) 是 库 。 料 库 是 收 集并 科 学 地 组 织 起 来 的语 言材 料 数 据 库 , 种 语 这 材料 是某 种 语 言 中 自然 出现 的 , 以 是 书 面 的 , 可 以是 口头 可 也 的( 申厚 坤 ,0 5 。以前 , 20 ) 由于 技 术 有 限 , 料 库 中 的材 料 是 由 语 人 工 收 集 和整 理 : 在 , 于使 用 计 算 机 的先 进 技 术 建 设 语 料 现 由 库 , 率 和 规 模 都 有 了很 大 的 提 高 。 “ 料 库 是 按 照 一 定 的语 效 语 言原则 . 用随机抽样方 法 . 运 收集 自然 出现 的 连 续 的语 言 , 运 用 文 本 或 话 语 片 断 而 建 成 的 具 有 一 定 容 量 的大 型 电 子 文 本
语料库语言学在大学英语教学中的应用

不意 味着语料库 语言学在走下坡路 ,恰恰相反 ,这说 明
语料库 已经成 为开展各项语言学研究与教学应用 的默认
资源 ( e uteo re ) d f lrsucs o a
一
、
语 料 库 语 言 学 的哲 学 根 源
Snli 1 9 ic r( 9 6)对语料库 的定义是 “ ol t n o a a clci f e o
机 网络与外 语课程的有机结合模式 ,倡 导讲 信息 网络技 术 与英语课 程进行生态化 的整合 。提 出计 算机教学 由辅
助作 用到智能化再走 向前 台的发展趋势 ,硬件系统 向智 能化 、数字化 、网络化发展 ,软件系统 向智能化 、个性 化 、虚拟化和完美化发展 。教育技术是关 于学习资源和 学 习过程 的设计 、开发、利用 、管理和评价 的理论 和实 践 ,基 于计算 机教学由辅 助作 用到智能化再走 向前台的
第1 9卷
第 5期
牡丹 江 大学学报
J u n 1 o M d n i n U i e s t o r a f u a j a g n v r iy
Vo1 9 N .5 .1 o
21 年 5 0 0 月
Ma y.
2 10 O
文 章 编 号 : 10 -7 7来自( 0 0 50 3 —3 0 88 1 2 1 )0 -1 30
语料库语言学与英语教学(中国英语教师丛书)

推荐
推荐
《语料库语言学与英语教学》介绍和探讨语料库语言学应用于外语教育教学的理论与实践。
作者简介
作者简介
何安平,1997年获新西兰维多利亚大学哲学博士学位,现任华南师范大学外文学院教授,博士生导师。
目录
目录
第一章语料库语言学简介 1.1语料库语言学的发展历程 1.2语料库的类型 1.3语料库的检索工具 第二章语料库语言学的研究层面与方法 2.1语言结构层面 2.1.1辨析近义词 2.1.2调查短语结构的搭配模式 2.1.3探讨意念的表达形式 2.2语篇结构层面 2.2.1构建口语篇章结构词的分析模式
语料库语言学与英语教学(中 国英语教师丛书)
20xx年外语教学与研究出版社出版的
02 推荐 04 目录
基本信息
《语料库语言学与英语教学(中国英语教师丛书)》是外语教学与研究出版社2004年出版的图书,作者是何 安平。
内容简介
内容简介
《语料库语言学与英语教学》一方面针对国内英语教育教学的实际需要介绍国外语料库语言学的最新发展及 应用成果,另一方面通过解剖大批研究实例展示语料库研究的方法和步骤,同时还附有相关和检索工具的说明。
谢谢观看
语料库语言学的理论解析

一、图式理论应用
3、形式图式:形式图式是指学生对所学语言的语篇结构、修辞手法和表达方 式等方面的掌握程度。在外语教学中,教师应注重培养学生的语篇分析能力,帮 助他们了解不同语篇类型的结构特点和修辞手法,以提高他们的口语和写作能力。
二、语料库语言学在外语教学中 的应用
二、语料库语言学在外语教学中的应用
英语语料库语言学的发展与国际语料库语言学年会ICAME
在今年的ICAME年会上,来自世界各地的学者、专家和从业者齐聚一堂,共同 探讨语料库语言学的未来发展。在会议上,一些领先的英语语料库研究者分享了 他们的最新研究成果,包括大规模语料库的建设、文本数据的自动标注、语料库 数据的可视化呈现以及基于语料库的语言模型的开发等。
内容摘要
在语料库在自然语言处理中的应用方面,学者们重点探讨了如何利用语料库 提高自然语言处理的性能和效率。例如,利用语料库进行词性标注、命名实体识 别、情感分析等方面的研究,为机器翻译、智能客服等应用提供了更加准确和高 效的技术支持。
内容摘要
总之,通过这次语料库语言学国际会议,我们对语料库语言学发展趋势有了 更加清晰的认识。未来,语料库语言学将继续发挥重要作用,推动自然语言处理 技术的不断进步。同时,我们也应该认识到语料库建设与标注的瓶颈问题,以及 自然语言处理技
内容摘要
念进行深入解析,并举例说明其在实际应用中的价值。
理论基础和概念
理论基础和概念
语料库语言学以语言学、统计学和计算机科学为基础,强调对语言数据的分 析和研究。其核心概念包括:
理论基础和概念
1、语料库:语料库是语料库语言学同的领域和语种,以满足研 究者的需求。
挑战与解决方案
2、数据代表性:建立语料库需要收集大量的语言数据,但数据的代表性是一 个关键问题。为了确保语料库能够涵盖各种语言现象和表达方式,需要采取多种 策略和方法来收集和处理数据,包括选择多样化的语料来源、进行数据平衡和处 理等。
语料库语言学应用于大学外语教学

提 供 诸 如 构 词 、 配 、 境 等 多 方 面 的语 料 及 信息 , 搭 语 以及 所 具 有 的 容 量 大 、 料 真 实 、 索 快 捷 准 确 等 独 特 优 势 语 检
在 现 代 语言 教学 中的 重 要 作 用 。提 出 随 着现 代 多媒 体 和 网 络技 术 的 日益 普 及 ,借 助 语 料 库 更 新 教 学 观 念 及 模
式 , 养 学 生 的 自主 学 习 能力 和观 察 分 析 问 题 的 能 力 , 供 大 量 真 实 而 自然 的 语 料 等 应用 设 计 理 念 。 培 提
关
键
词 :语 料库 语 言 学 ; 学 外语 教 学 ; 汇 学 ; 语 搭 配 大 词 词
中图分类号 :H 1 6 2 3 / 4 G
to ,a d c ne to i ai n o e i.W i te p p l rt f mutme i n ewo k tc n lg ,t eo m f in n o tx fst t f lxs u o t h o u a y o li da a d n t r e h oo y he r fr o h i la n n to n d lb s d o h o u ig it s a e ilsr td t r i h td n s blt st t d e r ig meh d a d mo e a e n te c r s l usi r l tae o tan t e su e t ’a i i o su y p n c u ie b h ms le n b e v swe la n lz . y te ev sa d o s r e a l sa a y e Ke y wor s c r u ig itc ;c l g oe g a g a e ta h n ;lxc lg ;c l c t n d : o sln u si s ol e fr in l n u g e c i g e i oo y ol ai p e o o
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010年11月November 2010第33卷第4期Vol.33No.4现代外语(季刊)Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成[编者按]为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。
期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。
以下是根据专家发言,整理后的主要内容。
[中图分类号]H319[文献标识码]A[文章编号]1003-6105(2010)04-0419-08语料库语言学的发展前景与资源共享广东外语外贸大学桂诗春1.语料库语言学的发展前景语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。
但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。
究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown.Flob ,BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。
在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。
我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。
首先是数学和统计学。
Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook ofMathematical Linguistics ),当时还是前计算机时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language inmass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。
某些语言学研究分支如果考虑到这两个方面,将会从中获益。
当时还没有真正的机读语料库,Brown 的语料库在1967年才面世,美国心理学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。
一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。
其次是计算机科学。
语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。
但是我们往往只注意到硬件部分,而不认识到软件的建设。
从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需语料库语言学与中国外语教学1.双语料库的建设我很赞同桂诗春教授的意见,积极推进语言资源的共享,语料库只有共享才能变成财富,如果把语料库的研究成果“藏诸名山,束之高阁”,只是一堆数据垃圾,必将自毁前程。
桂诗春教授刚才提到宾西法尼亚大学的Linguistic Data Consortium (我建议最好翻译为“语言数据联盟”,简称LDC ),是一个很好的供语料库语言学研究者进行交流互动的平台。
在语言数据联盟和其他相关机构的帮助下,研究者们可以获得口语和书面语的大规模的语料。
重要的是,在这些语料中还包括一些标注过的语料,如宾州树库(Penn Treebank ),布拉格依存树库(Prague Dependency Tree Bank ),命题库(PropBank ),宾州话语树库(PennDiscourse Treebank ),修辞结构库(RSTBank )和TimeBank (我不知道TimeBank 这个名称如何翻译为中文)。
这些语料库是带有句法、语义和语用等不同层次的标记的标准文本语言资源。
这些语言资源的存在大大地推动了人们使用“有监督的机器学习方法”(supervisedmachine learning )来处理那些在传统上非常复杂的自动句法剖析(automatic syntactic parsing )和自动语义分析(automatic semantic双语语料库的建设与用途国家教育部语言文字应用研究所冯志伟要,通过计算机自行编程来检验假设。
此外,要做语料库语言学研究,文本分类(又叫文本分析或内容分析)也必须具备雄厚的基础。
它的研究范围也很广,从信息的提取、组织、储存,文本(包括语体)的分析,社会舆论调查,著作归属到文本格式。
这也牵涉到许多统计学知识和计算机知识。
数理语言学和计算机语言学的研究对象是文本和语篇。
有志于研究这门科学的必需具有这些基础训练,否则不会走得很远的。
我觉得,当务之急是让我国语料库语言学的先行者们聚在一起,研究语料库语言学作为一门科学应该在什么层次上开设?它有什么基本内容?由哪些核心课程组成?只有规范语料库语言学专业的课程,按照这些课程设置来培养我国语料库语言学的学生,他们才能高瞻远瞩,取得真正的进展。
2.资源共享问题语料库语言学对资源有很大的依赖性,为了促进语料库语言学在我国的发展,应该提倡资源共享。
回顾语料库语言学在国外的迅猛发展,和资源共享有密切的关系。
共享的方法有多种:一是免费提供,最典型的例子是GeorgeMiller 领衔制作的英语大型词汇数据库Wordnet 受到各方面资助,前后参与制作的不下一千人,而且还在不断完善。
他们认为这不是一个商品,应该为公众所有。
二是提供网上服务,整个语料库不提供,但是在网上可以自由检索获得数据,像美国Brigham Young 大学的Mark Davies 在他的网页上检索美国现代英语语料库、美国历史英语语料库、英国国家语料库、《时代》杂志语料库、西班牙语语料库、葡萄牙语语料库以供检索。
三是成立语料库分配中心,收少量成本费提供语料库,像挪威的ICAME (International Computer Archive of Modern and Medieval English ),美国的LDC (The Linguistic Data Consortium ),等等。
一些语料库工具,如TACT 、LEXA ,Wordcruncher ,Wordsmith 、Antconc 也都很容易在网上获取。
资源共享的理念是,只要有更多的人使用,我们所开发的资源、工具才能完善,学科才能发展。
只有互通有无,才能共同协作,才能减少重复劳动,制作出更成熟的成品。
4201.语料库语言学的应用研究这次专题讨论的题目“语料库语言学与外语教学”我觉得很好,很及时。
语料库语言学本来就是实践性、应用性很强的一门学科,语料库语言学的应用研究与贡献上海交通大学杨惠中analysis )等问题。
这些语言资源也推动了有竞争性的评测机制的建立,评测的范围涉及到自动剖析(parsing )、信息抽取(informationextraction )、词义排歧(word sense disambiguation )、问答系统(question-answer system )、自动文摘(automatic summarization )等领域。
几年前由中国中文信息学会发起,在北京创建了“中文语言数据联盟”(ChineseLinguistic Data Consortium ,缩写为CLDC ),是一个自愿组成的学术性社会团体,其宗旨是团结中文语言资源建设领域的广大科技工作者,建成代表中文信息处理国际水平的、通用的中文语言和语音的资源库。
欢迎语言学界的同仁积极参与CLDC 的工作,促进语料库资源的共享。
目前单语语料库很多,已取得煌煌的成绩,但双语并行语料库(parallel corpus )不容易获得,它的构建和加工是很困难的工作。
我国还没有高质量的、大规模真实文本的英汉双语语料库,更没有成熟的、可共享的加工工具,最近公布的2010年国家社会科学基金重大项目中有一项就是“大规模英汉平行语料库的构建与加工研究”,资助强度大约是50万元左右,可见国家对于双语语料库建设的重视。
这个项目是我和王克非教授在今年的社科基金评审会议上建议提出的,已开始招标,希望大家积极投标,积极推进我国的双语语料库建设。
2.如何将语料库语言学运用到外语教学,如何从语料库中挖掘知识?我认为英汉双语语料库的最大用途就是推进英语教学,我们可以从双语语料库中抽取教材的原材料,帮助语言学习者提高对于真实语言材料的语感,从而编写出高质量的外语教材。
有的外语老师冥思苦想地根据自己的语感来编写教材,费时费力,其实,如果依靠英汉双语平行语料库,就可以减轻搜集素材之困难,大大提高编写教材的工作效率。
另外,语料库中蕴藏着无比丰富的知识等待我们去挖掘,如果我们使用“文本数据挖掘”(text data mining )的技术,从语料库中挖掘知识,既可以挖掘语言学的知识,也可以挖掘非语言学的知识,就像从矿石中挖掘出黄金一样,这些知识可以弥补传统语言学的不足,克服研究者的主观性和片面性。
我们在text data mining 这个术语中使用mining (挖掘)这个单词,而没有使用extraction (抽取)这个单词,正是为了强调在从语料库中获取知识的时候,要开动脑筋,要经过一番“去粗取精,去伪存真,由此及彼,由表及里”的深思熟虑的功夫来加工数据,而不要被海量的数据所迷惑。
数据就像矿石,我们的任务是从海量的数据中挖掘出隐藏在其中的有规律性的东西,把海量的、离散的“数据”(data )变为精炼的、系统化的“知识”(knowledge ),从而把经验主义方法和理性主义方法紧密地结合起来。
这种知识获取方法上的巨大变化,有可能引起整个语言学研究的“战略转移”(strategytransit );我们中国的语言学家应当敏锐地关注“战略转移”问题,做出我们的应有的贡献,千万不要错过这个在语言学历史上千载难逢的良机。
桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成421语料库语言学与中国外语教学脱离了应用,坐而论道,也就失去了发展的基础和动力,将变成无本之木、无源之水。
外语教学正是语料库语言学的重要应用领域,语料库语言学以实际使用中的语言事实作为研究对象是一种着眼于语言运用的研究方法(performance-based approach),因此跟语言教学有着直接的关系,对真实语言交际的各个方面,包括词汇的、句法的、语义的、语用的、语篇的,进行深入的探讨和全面的描写,其研究成果可以应用在教学大纲设计中,为确定教学内容、制定教学目标提供坚实可靠的决策依据。