关于非相关文献知识发现方法在航天科技情报研究中的应用分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于非相关文献知识发现方法在航天科技

情报研究中的应用分析

论文关键词:知识发现非相关文献航天科技情报情报研究应用研究

论文摘要:概述了非相关文献知识发现方法的原理以及国内外应用现状,总结了该方法的发现流程以及开发人机交互系统所需要的关键技术,对比分析了非相关文献知识发现方法应用于生物医学领域及航天科技情报研究领域的异同点,人工模拟了用该方法发现新型飞行器隐身技术的知识发现过程,验证了非相关文献知识发现方法用于航天科技情报研究领域的可行性,揭示了规模应用的努力方向。

1非相关文献知识发现方法对于航天情报研究的重要意义

作为科技情报研究领域中的一个分支,航天科技情报研究既有与其他专业情报研究相同的一面,也有其保密性强、难以从公开渠道获取等特点。一直以来,航天情报研究多采用定性分析为主、定量分析为辅的方式,分析方法也局限于传统的情报研究方法,因此检索前沿技术发展动向时,会出现“巧妇难为无米之炊”的现象,难以发现有价值的文献,无法为科研决策提供有效的情报支持。

1986年,Don.R.Swanson在研究时偶然发现以雷诺病生理改变作为中间词,可将以鱼油和雷诺病为主题词检索到的两组原本无联系的文献联系起来,得出鱼油有助于雷诺病的治疗的结论。于是Swanson认为,对于两组非相关文献A和C,可以通过某中间词或中

间文献B建立起二者的关联,上述发现A、C关联的过程称为非相关文献知识发现方法。1997年,Swanson在描述知识发现的过程中,提出了开放式和闭合式两种方法(如图1所示,该方法2001年被Weeber 正式命名)。在科学假设的形成阶段主要采用开放式方法,以感兴趣的主题C为初始点,发现中间集合B,通过中间集合B与文献集合A 之间的关系,确定C与A之间的关联。在科学假设验证阶段主要采用闭合式方法,从C、A两端同时开始进行检索,产生相互交叉的词汇集合B。这种知识发现方法的诞生,不仅对情报学的学科建设具有重大意义,同时可有效解决一般检索方法无法发现有价值文献的问题,为航天情报研究者指明了努力的方向,具有里程碑意义。

与Swanson提出的非相关文献概念相比,本文中的非相关文献概念有所扩展,是指文献之间不彼此引用、没有被共引且也不共引其他文献…、不能用主题检索等常规检索方法同时被检索出来的彼此间相对独立的文献。非相关文献知识发现则是指以揭示隐含于非相关文献中的尚未被人们认识或发觉的知识片段的逻辑联系,从而提出知识假设,以便专业研究人员进一步证实,促使新知识的产生为目的的情报研究过程。

2非相关文献知识发现方法的应用现状及发展

Swanson提出非相关文献知识发现方法后,很多学者在其基础上进行了方法的改进和应用领域的拓展,使得该方法在其他学科的移植应用成为可能。

1993年,Z.Chen在Swanson理论的基础上提出一种整合分散

在文献内部知识片断间逻辑关联的方法,为建立不同专业领域间的知识关联开辟了新途径。1996年,M.D.Gordon创建了基于短语的词频统计方法,并建立起中介文献的概念,将非相关文献的发现应用扩展至学科和领域之间,拓展了基于非相关文献知识发现应用的广度。航天情报领域与物理、化学、材料等领域密切相关,非相关文献知识发现方法的跨学科、跨领域性使其可以用于发现不同学科和不同领域之间的隐含逻辑联系。

Swanson本人也尝试将该分析方法向数据库移植,1999年专门针对医学数据库Medline设计了人机交互检索系统Arrowsmith,用于自动检索联系两组非相关医学文献的中间文献。Arrowsmith系统除可以模拟整个非相关文献知识发现过程外,还提供了生物医学文本挖掘工具列表和以作者为入口的检索模块等8个模块,提高了实现过程的效率,使该方法在某些学科的大规模应用成为可能。

2001年,Weeber提出了基于“概念”的非相关文献发现方法,并开发出专门用于MetaMap的基于概念的自然语言处理系统——DAD 系统J。同年,M.D.Cordon和Lindsay研究了该方法在万维网中的应用,积累了网络应用经验。Kostof研究小组将Swanson理论的应用范围拓展到决策服务领域中,使其更具实践价值。

2001-2003年间,P.Srinivasan等也开展了对开放知识发现过程的研究。柏林自由大学医学图书馆的J.Stegmann等开始尝试用共词聚类分析来模拟知识发现的过程,寻找从来源文献到目标文献的路径和规律。2001-2005年问Hristovski等将该方法用于遗传学领域]。2006

年,Swanson以Medline为目标数据库,在回顾其以往基于非相关文献发现研究的基础上探讨了如何提高获取文献B的准确度的问题,认为根据特定主题事先获取文献A和C时应该优先考虑使用标题字段和MeSH主题词表术语。

在方法改进的同时,非相关文献知识发现方法的应用领域也在不断扩展,可以用于Biosis,Embase,Scisearch,Intemetdatabases等数据库中,但仍限于生物医学领域。直到1999年K.A.Cort将其用于Wilson人文数据库隐含知识关联的挖掘,利用该方法揭示了此前从未被人文领域知晓的现代诗人R.Fomt同古希腊哲学家Cameades 之间的思想关联,非相关文献知识发现方法的应用领域得到实质性拓展。

国内对Swanson情报学方法及Arrowsmith软件的介绍始于2000年,多数文献是对Swanson方法的评价、简介和相关性算法改进,实践方面限于网络版的Arrowsmith的利用和设计中文系统重现Swanson知识发现过程,也有文献探讨了该方法向中医药领域拓展的可行性和数据集构建等问题。目前,基于文献的知识发现方法已经成为国内情报界研究的热点,先后有20余篇文献在各种刊物上发表,种种改进使非相关文献知识发现方法日趋成熟和完善,为该方法用于航天科技情报研究领域奠定了基础。

3非相关文献知识发现方法应用于航天科技情报领域可行性分析3.1领域比较

非相关文献知识发现方法在人文领域的成功应用证明了该方法

相关文档
最新文档