语料库的应用(最终)
语料库的应用(最终)

语料库的应用(最终)语料库的应用语料库方法广泛应用于语言学理论研究、军事等领域。
当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。
军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。
和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。
军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。
【一】、语料库成为语言学理论研究的基础资源语料库是计算语言学的基础。
语料库对应的英文是corpus,复数形式为corpora。
这个词既可以指语料也可以表示语料库。
英国语言学专家戴维?克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也可作为验证语言假说的手段。
计算机语料库是一大批机器可读文本的结集。
各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。
起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。
随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。
我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。
双语语料库的用途

双语语料库的用途
1.语言学研究:双语语料库是研究语言结构、语法、词汇等方面的重要工具。
研究人员可以比较两种语言之间的差异和相似之处,探索不同语言之间的共同特征和独特特点。
他们可以分析语料库中的句法结构、语义关系和词汇用法,帮助理解语言的发展和演变。
2.翻译学研究:双语语料库对于翻译学研究来说至关重要。
研究人员可以通过比较源语言和目标语言之间的句子和词汇,深入研究语言之间的转换过程,了解语言中的文化和语用差异,并提供更准确和流畅的翻译方法。
双语语料库还可以用于计算机辅助翻译(CAT)系统的开发和改进,提高翻译质量和效率。
3.机器翻译:双语语料库是机器翻译系统的核心资源,用于训练和调优翻译模型。
研究人员可以利用大规模的双语语料库,使用统计机器翻译或神经网络机器翻译等技术,训练机器翻译系统,使其能够自动将一种语言翻译成另一种语言。
对于低资源语言,双语语料库也可以用于生成补充数据,提高机器翻译系统的性能。
4.跨文化研究:双语语料库可以用于跨文化研究,比较不同文化背景下的语言使用和交流方式。
研究人员可以通过双语语料库中的对应文本,比较不同文化中的社交规范、文化价值观和思维方式,从而深入了解不同文化之间的差异和相似之处。
5.教育和学习:双语语料库可以用于语言学习和教学的目的。
学习者可以通过对比两种语言之间的句子和翻译,学习词汇、语法和语言使用。
教师可以利用双语语料库开发教材和课程,帮助学生提高他们的听说读写能力,并培养跨文化理解能力。
专业的语料库应用技巧

专业的语料库应用技巧语料库是指收集和存储大量真实语言文本的数据库,这些文本可以用来进行语言学研究、语言教学以及自然语言处理等方面的工作。
在当今信息爆炸的时代,语料库的应用变得越来越重要。
本文将介绍一些专业的语料库应用技巧,帮助读者更好地利用语料库。
一、语言学研究语料库在语言学研究中有着广泛的应用。
研究人员可以通过语料库收集大规模的语言数据,分析其中的语言现象,从而对语言规律进行深入研究。
比如,研究人员可以通过语料库来研究某一语言的词汇使用频率、词义变化、语法特点等。
此外,语料库还可以帮助研究人员找到真实语言中的典型例子,验证自己的研究假设。
二、语言教学语料库在语言教学中也有着重要的应用。
通过利用语料库,教师可以为学生提供大量真实语言文本,让学生通过观察和分析,深入了解语言的使用。
学生可以通过语料库了解词汇的用法、短语和句型的搭配,从而提高自己的语言表达能力。
此外,语料库还可以帮助教师设计教学材料,制定教学计划。
三、自然语言处理语料库在自然语言处理领域也具有重要意义。
自然语言处理是研究如何使计算机能够理解和处理人类语言的学科。
语料库中的大量文本可以作为训练数据,用于开发和评估自然语言处理系统。
比如,通过语料库可以训练机器翻译系统、文本分类系统、信息抽取系统等。
语料库还可以帮助改善问答系统、机器人对话系统等人机交互系统。
四、语料库的构建构建一个优质的语料库是语料库应用的基础。
首先,语料库的收集需要广泛而有代表性,涵盖各类语言和语体。
其次,语料库的标注也非常重要,可以通过手工标注或自动标注的方式,对语料库中的各种语言信息进行注释。
再次,语料库需要定期更新和维护,以保证其数据的新鲜和可靠性。
最后,语料库的存储和检索功能也需要得到合理的设计和实现,方便用户的使用和查询。
五、语料库查询工具为了更好地利用语料库,我们需要了解一些有效的查询工具。
常见的查询工具有AntConc、Sketch Engine、CLAWS等。
语料库在词汇搭配研究中的应用

语料库在词汇搭配研究中的应用语料库(Corpus)在语言学研究中的应用越来越受到重视。
语料库是指一种特定语言的大量文本数据,可以是书籍、文章、对话录音等任何文字形式。
语料库在词汇搭配研究中的应用非常广泛,因为它们提供了丰富的实际语言数据,可以帮助研究人员更深入地了解特定单词与其他单词之间的关系。
首先,语料库可以帮助研究人员识别和区分不同的词汇搭配。
词汇搭配是指两个或更多单词在语言中经常一起出现,形成了一种固定的组合。
(例如,“make a decision”和“take a shower”等)。
研究人员可以使用语料库来查找常见的词汇搭配,并分析它们在不同语境中的使用方式。
通过这种分析,研究人员可以确定不同的搭配方式对于不同的情境可能会有不同的意义。
其次,语料库可以帮助研究人员了解单词的词性和语义。
在语言中,一个词的意义通常是由它周围的单词和句子组成的背景所决定的。
使用语料库可以使研究人员快速准确地找到一个单词在语境中的使用方式,从而帮助他们确定它的词性和语义。
例如,当我们在研究“run”的含义时,我们可以使用语料库来查找出现“run”的句子,并据此了解其词性和含义。
最后,语料库可以帮助研究人员进行跨语言比较。
由于不同语言的语法和词汇使用方式有所不同,语言翻译的准确性是一个非常关键的问题。
通过对多个语言的语料库进行比较,研究人员可以发现这些语言之间的相似之处和不同之处,并进一步了解不同语言中词汇搭配之间的联系。
总之,语料库在词汇搭配研究中的应用非常广泛,可以帮助研究人员深入了解语言的使用方式和语义,还可以促进不同语言之间的比较和研究。
然而,需要指出的是,语料库也有其局限性,例如语料库中的数据可能不够丰富,可能存在一定的偏差和误差。
因此,在使用语料库进行研究时,研究人员需要进行多维度的数据分析,并且需要充分考虑语料库中的数据质量和准确性。
语料库在英语写作教学中的应用

语料库在英语写作教学中的应用语料库是一个重要工具,可以在英语写作教学中被广泛应用。
它提供了学生所需的大量单词、短语和句型,帮助他们扩展他们的词汇量、把握语言用法的变化,以及提高英语写作技巧。
本文将探讨语料库在英语写作教学中的应用,并提供一些具体的实例。
首先,语料库可以用于扩展学生的词汇量。
语料库中包含了各种语句阶段的单词和短语,这些单词和短语的应用与当前所学的话题有关,并且是通用的。
作为一个教师,我们可以在英语写作教学中使用语料库,在培养学生归纳和推理的能力的同时,将这个语料库的词汇进行分类,以便更好的引导学生使用这些单词。
例如,教师可以指导学生在描述一个人时,可以使用“physical appearance”、“behavior”、“character traits”等特定单词,从而帮助学生更准确地表达他们的意思。
其次,语料库可以用于帮助学生掌握语言用法的变化。
英语是一种不断进步的语言,不同的语言用法在不同时期和地域是不一样的。
因此,学生需要在写作中学会如何进行修辞和表达。
例如,在学习过程中,我们可以使用语料库来引导学生掌握适当的谓语动词和时态,了解身份特征和职业的表达方式,以及语言表达中使用的比喻、修辞和其他例子。
最后,语料库可以用于提高学生的英语写作技巧。
语料库是一个充满不同单词和语法结构的资源,可以帮助学生更好地理解和阐述问题。
例如,在讲述一个故事时,语料库提供了大量的框架和惯用语,可以帮助学生更好的展开故事的情节。
此外,在写一篇论文或一个科技报告时,语料库可以帮助学生通过寻找类似的句子结构和论据,使学生感性地掌握写作技巧。
总之,语料库作为英语写作教学中的一个强有力的工具,可以拓展学生的单词量,掌握语言用法的变化,提高英语写作技能,更好地传达他们的意思。
我们必须意识到这一重要工具,以便更好地帮助学生发展他们的英语写作技能。
语料库技术及其应用

二、ELAN自建汉语方言多媒体 语料库
ELAN(Endangered Languages Archive)是由德国马普学会语言学研究所 开发的一款用于语言资料库建设的软件工具,可用于创建、管理和分析多种语言 的语音、文字和影像资料。本次演示将介绍如何利用ELAN自建汉语方言多媒体语 料库,以便对这些珍贵资料进行系统化的收集、整理和分类。
2、机器翻译:多模态语料库中的多种语言素材可以用于机器翻译系统的训 练,提高翻译的准确度和流畅度。
3、文本生成:基于语料库40的强大语料信息,可以用于自动文本生成,为 新闻报道、小说创作等领域提供丰富的素材和灵感。
4、教育领域:教师可以通过使用语料库40多模态语料库,让学生更好地接 触到真实的语境和多样化的语言表达方式,从而提高学生的语言能力和跨文化交 际能力。
语料库技术及其应用
目录
01 引言
03 关键词:内容构思
02 关键词:语料库技术 04 关键词:文本处理
目录
05 关键词:应用场景
07 参考内容
06 结论
引言
语料库技术是指以大量真实文本为基础,运用计算机和统计分析工具,对语 言使用进行系统研究的一种方法。随着计算机技术的不断发展,语料库技术在语 言学、文学、翻译等领域的应用日益广泛。本次演示将介绍语料库技术的定义、 特点及其在各领域的应用价值,同时探讨语料库技术在不同场景下的优势和不足, 以及未来可能的发展方向。
未来展望
随着技术的不断发展和应用需求的增长,语料库40多模态语料库的建设将不 断深入和完善。未来,语料库40可能会朝着以下几个方向发展:
1、更大规模的数据采集:随着互联网和数字化设备的普及,未来将能够采 集到更多样化、更大规模的数据,使语料库40更加全面和丰富。
语料库在英语教学中的运用

语料库在英语教学中的运用语料库是指由大量真实语言材料所构成的语言数据库,其中包含了各种语言用法的实例和模式。
在当今的英语教学中,语料库已经成为了一个不可或缺的工具。
通过利用语料库资源,教师们可以帮助学生更好地掌握英语,使他们能够更加自然地运用英语,避免单纯地翻译或者背诵。
一、语料库的定义语料库是指已存在的大量真实的语言使用情境,在语言学研究中它被视为一个很重要的研究工具。
语料库包括:写作、电子邮件、文章、电影和其他电子媒体中的语言使用等等。
这些使用情境被保存在计算机上,人们可以利用这些数据来进行研究或者制作词典等工具。
语料库被广泛应用于英语教学中,其主要用途是为学生提供真实的语言材料,并帮助他们更准确地掌握英语的用法、语法和词汇。
二、语料库在英语教学中的应用2.1 词汇教学语料库可以帮助学生更好地掌握英语词汇的使用方式。
通过词汇分析工具,教师可以帮助学生区分及分析动词或形容词在具体语境中的不同含义,以及它们在不同语言环境中的各种用法。
同时,语料库也为学生提供了更为准确的翻译和使用方式,而不是传统方法中的简单背诵单词和语法规则。
2.2 语法教学语料库可以帮助学生更深入地了解英语语法规则。
教师可以使用语料库分析工具来帮助学生发现英语语法规则中的差异和结构,从而使他们更清楚地了解英语的语言习惯。
同时,语料库还可以帮助学生了解英语中常用的语法结构,包括时态、语态、语气等等。
2.3 写作教学语料库也可以应用于英语写作教学。
它可以为学生提供范文和写作模式,并且可以为学生提供实时反馈。
例如,同学们可以用语料库查找类似主题的文章,从中学习常用词汇、句子和段落结构,以及表达方式。
这些功能都有助于学生提高英语写作能力。
三、语料库在英语教学中的优点语料库在英语教学中具有以下优点:3.1 真实性语料库中包含的语言使用是来自真实场景,可以使学生学习到更为真实的英语的使用方式,同时还可以帮助学生逐渐融入英语社区。
3.2 灵活性教师可以通过语料库快速获取所需材料,因此教学变得更加灵活和高效。
语料库在大学英语教学中的应用

语料库在大学英语教学中的应用摘要:语料库可以应用于语言教学的很多方面,主要包括:教学大纲的设计,教学内容的确立,教学方法的采用,语料库应用于课堂教学,学习者语料库及中间语研究和语言测试。
合理利用语料库对英语教学能起到巨大的推动作用。
关键词:语料库;语言教学;中间语按照科学的方法定义,语料库就是书写文本或口语转写的集合体:语料库可以用于语言的分析和描写。
语料库是“电子机读文本的有限集合,从最大限度上代表了某种语言或语言变体。
”1987年,第一本基于语料库编写的字典《柯林斯COBUILD英语词典》出版,这在语料库语言学界荡起了一股不小的涟漪,引起了众多语言教师的极大关注。
同时也激起了语料库驱动的和基于语料库的语言教学研究,很多有影响的论文也相继发表。
继此,基于语料库的语言研究和语言教学研究如雨后春笋般迅速发展。
对语言内在结构描述和语言运用的研究领域涌现出大量含金量高的论文著作,基于语料库的英语教学和语料库驱动的英语教学研究继而被推举到非常重要的地位。
语料库应用于语言教学主要表现在以下几个方面:母语语料库为准确地描述语言提供了可靠的依据,它基于真实的语言,对教材内容的编排和词典的编纂提供了丰富而真实的语料。
学习者语料库提供了学习者习得第二语言的大量信息。
研究学习者的语言特点、学习过程、编排学习者字典等工作都可以从中获益。
和母语语料库相比,用于编排教材的专门语料库不但对教材编写有很大的裨益,对测试材料的选择和试题构建也有着功不可没的贡献。
总之,无论是母语语料库还是学习者语料库对教学材料的选择和教学实践活动都带来了很大帮助。
一、大纲设计语料库的广泛应用为描写准确的语言提供了依据,同时也为语言教学的大纲设计和教学内容的编写提供亍素材。
语料库对语言教学的简单而重要的作用表现在它为语言教学提供的是真实的语料、实际生活中使用的语言。
另外,语料库提供的语言数据表明了语言使用状况的各种频率信息,为确立教学内容提供了可靠依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语料库的应用语料库方法广泛应用于语言学理论研究、军事等领域。
当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。
军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。
和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。
军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。
【一】、语料库成为语言学理论研究的基础资源语料库是计算语言学的基础。
语料库对应的英文是corpus,复数形式为corpora。
这个词既可以指语料也可以表示语料库。
英国语言学专家戴维•克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也可作为验证语言假说的手段。
计算机语料库是一大批机器可读文本的结集。
各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。
起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。
随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。
我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。
目前国外已建成且较有影响的主要为以下的语料库:美国:布朗大学的今日美国英语标准语料库(The Brown University Standard Corpusof Present Day American English)、兰卡斯特一奥斯陆/卑尔根语料库(The Lancast-er-Oslo/Bergen (LOB) Corpus)、英语语库(TheBank of English)、英国国家语料库(The BritishNational Corpus(BNC、伦敦一隆德语料库(Lon-don -Lund Corpus(LLC》、美国传统中介语料(American Heritage Intermediate(AHI) Corpus)以及英语国际语料库(The Intemational Corpus ofEnglish(ICE》等。
国内在语料库建设方面虽然较晚,但已体现出较强的后发优势,个别语料库在世界上也形成了一定的影响。
趋于领先地位的有广东外语外贸大学的中国英语学习者语料库(Chinese Learner English Corpus(CLEC)、中国社科院语言所的汉语情景会话口语库(北京地区)(Spoken Chinese Corpus of Situated Discoursein Beijing Area)以及上海交大的科技英语语料库(JDESt)近期由文秋芳等编著的中国学生英语口笔语语料库无疑是对以上的语料库的有效补充。
【二】、语料库在军事领域的应用<一>、信息化条件下的军事语料库的应用背景从世纪之交的几场局部战争来看,信息化战争已成为当代和未来战争的主要形式。
信息化战争的核心是对信息资源的争夺与占有,信息匮乏或信息弱势的一方注定会成为战争的输家。
不对称的战争中很大的不对称就是信息掌握和信息利用的不对称。
要想实现信息化的部队,避免在战争中成为信息弱势的一方,和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。
对于后者,军事语料库的建设正是针对实现这一目标的有力依靠和手段,具有不可低估的价值。
首先,可以借助语料库对海量信息进行情报处理和分析外,从中生成重要的情报,为相关部门和专家提供决策辅助;还可以借助语料库的后台支持,开发出战场针对交战对方或所在地的语言自动翻译和语音处理的软硬件,更好地服务于战场信息控制与掌握,提高战斗人员的生存能力,确保对敌的信息优势。
以美国为首的西方发达国家已经意识到军事语料库对信息化条件下的军事斗争所具备的潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。
比如,利用语料库的资源支持,借助自然语言的处理技术,美军为驻伊拉克的美军部队开发和配备了一种“多语言自动讲话翻译机”,它能迅速将英语翻译成阿拉伯语,以解决美军与伊拉克人交流的问题。
美国防高级研究计划局(DARPA)也正在着手开发新一代双路语音翻译技术,并采用该技术为驻伊部队开发英语和阿拉伯语的翻译系统。
美国的GALE(全球独立语言开发)计划通过构建多国语料库,运用语料库技术来处理库中多国语言的大量语音和文字材料,这些工作包括采集、翻译、分析和解释这些材料,旨在消除对语言学家和分析学家的依赖,以适当的方式自动地向军事指挥官或其他人员提供相关、简洁、可操作的信息。
此外,美国军方DARPA计划中,有很多项目涉及语料库基础上的计算机语言处理技术,其中包括机器自动翻译、跨语言情报侦测、情报抽取、情报摘要、特定事件情报追踪等方面。
在以上系统的研制过程中,美国建立了大量的军事语料库,大大提高了信息收集与处理的效率,并积累了丰富的军事语料库开发经验。
日本、俄罗斯、欧盟等其他发达国家和国际组织也不甘落后,在军事语料库研究与开发等方面投入大量资金,并取得了显著的效果。
我军未来面临的战争形势更为复杂,需要做好打赢“多战场”战争的准备,而且在情报电子对抗等方面面临的竞争更为激烈。
“多战场”战争即意味着战争的多地域性、多语言性。
这就要求我们研究与开发多种语言的军事语料库,并且开发多种载体的军事语料库,譬如文本、音频、视频等。
同时,情报电子对抗领域竞争的加剧也要求我们开发多种专业的军事语料库,譬如心理战语料库、核情报语料库、各种尖端武器语料库以及对方重要军政领导人物的语言语料库等。
<二>、军事语料库独特的发展空间作为一种专业语料库,军事语料库具备语料库的共有的功能。
这些功能可以归纳为军事语料库的一般应用;同时,在信息化条件下,军事语料库也有自身独特的发展空间和应用前景。
军事语料库是指由服务于军事甚至内容涉及军事的单一语种或多语种的文本所组成的语料库,也可以是含图片、语音、视频等媒体形式的语料库。
根据具体用途不同可以有军事通用语料库,指的是即覆盖军事思想、政策与规定、科学研究、教育训练、装备与技术、作战与指挥等各领域的语料,也可以是单一用途或对象的语料库,如军事术语语料库、军事科技文献语料库、军事装备与技术语料库(可以含军事装备本体的研究)、军事情报语料库、舆论战、心理战语言素材语料库、军事文学语料库、军事外语教学语料库等。
部分内容不涉及军事,但明显具有服务军事功能的语料库包括:对象国语言文化百科知识语料库,对象国政情语料库,对象国自然资源语料库,对象国科技情报语料库,对象国经济情报语料库,对象国新闻报道语料库等等。
总的说来,军事语料库的建设、开发与研究对大多数国家来说仍然是刚刚起步的新鲜事物,美军在此方面的研究较早,具体应用方面已经取得了明显的突破,因此我国也应该加紧军事语料库的建设步伐。
1、军事语料库的一般应用(1)革新军事语言研究方法,提高军事语言研究效率军事语言研究主要集中在五个方面,即军事术语研究、军事书面语研究、军事口语研究、军用主题词研究、军事现象与语言现象共变理论等研究。
这些方面的研究在局部已取得了令人振奋的成果,对军队建设发挥了积极的推动作用。
但目前,这样的研究许多仍基于以往的传统研究方法,即依靠人力进行语料的收集、分类、提取和分析,不仅效率低下,而且研究结论的可信度容易引起人们的疑问。
如果能借助于相关的军事语料库,军事语言的研究可以大大提高效率和准确度。
其中,可以为军事词汇的研究提供军事运用中的全貌,常用军事用语也可以更符合语言应用的实际情况,对于语言结构的研究也可以更好地体现军事用语的分布、变化和来龙去脉。
由于军事语料库具有使用方便、查询科学、信息抽取准确的优点,因而还能够满足军事用语应用和研究的各类应急需要。
(2)加速各类军事辞典编纂,提高军事辞典应用价值目前,国内已经有相当数量的针对我军和外军的军事词典,既有一般性的军语词典,也有专门性的术语词典,还有武器装备、科学技术词典和百科全书等。
但这些词典由于多是用传统人工收集语料的编纂而成,词典的覆盖面较窄,选词的代表性不高,也不易体现符合军事语言实际使用的全貌。
另外,由于选材的原因,军语和军事词汇的系统性较差,未能较好地体现当代语言使用的特点,也不能反映军语的历史变化和相互关系。
具体说来,就是对新词的收集未能全面覆盖,未能准确反映国内外军事发展的新动态,对旧词的采用没有有力的依据,例句的使用也不能保证是否是军语使用的实际情况,因而,其结果是容易造成随意性的编撰。
另一个突出的弱点是,几乎所有军语词典都没有考虑按照国际目前词典出版的新趋势去考虑,即配以语料库基础上生成的电子词典光盘版。
实际上,创建军事语料库,将词典的整个编撰和使用建立在军事语料库基础上,将能够有效弥补传统军事辞典的上述缺憾,能够保证军事辞典的理据性、系统性、全面性、准确度和时效性,从而提高军事辞典的实际应用价值。
(3)创新语言战法研究,大力促进新军事变革在新的国际斗争环境下,语言已成为当今军事斗争中的主要武器和媒介,其表现形式为信息战、心理战、舆论战、法律战等,作用和地位不断凸现。
舆论宣传和心理攻击已经成为新的大规模杀伤武器。
西方军队纷纷组建起大批专门从事上述作战形式的部队和研究机构。
美军在各军种的指挥学院都开设了心理战的课程,专门的心理战部队更是花样繁多,不断加强心理战的作战样式和作战能力。
对语言的巧妙运用是心理战的重要基础。
传统的做法是,组织人员针对某一特殊情况临时编辑创作心理战和舆论战的文本和稿件,但由于工作量大,任务紧急,单一的人工做法很难满足信息时代快节奏行动的需要。
因而,建立心理战、舆论战、法律战的语料库,利用语料库的快捷查询、数据准确、处理能力强、生成快捷的特点,可以定量和定性开展这方面的理论探索和应用研究,从而更好地发挥语言的实战作用,提高语言的杀伤力。