网络时代情报检索语言的发展趋势探讨

合集下载

网络语言的趋势分析方法

网络语言的趋势分析方法

网络语言的趋势分析方法
1. 数据分析:收集和分析大量网络语言的数据,包括文字、图片、视频等,从中挖掘出网络语言的趋势和特点。

2. 文本挖掘:利用文本挖掘技术,包括自然语言处理和机器学习等方法,对网络语言中的关键词、主题、情感等进行分析,发现网络语言的趋势。

3. 社交网络分析:通过分析用户在社交网络上的行为和互动,包括点赞、评论、转发等,来了解网络语言的流行趋势和影响力。

4. 时间序列分析:对网络语言的使用和传播进行时间序列分析,从中找出网络语言的发展趋势和变化规律。

5. 视频内容分析:通过分析流行视频平台上的视频内容和用户互动数据,来了解网络语言的趋势和发展方向。

6. 社会学调查:通过实地调查或问卷调查等方式,对用户在网络上的语言使用习惯和偏好进行调查分析,从中发现网络语言的趋势和特点。

7. 深度学习技术:利用深度学习技术,如神经网络模型等,对网络语言进行模式识别和预测,帮助发现网络语言的发展趋势。

第二章 检索语言

第二章  检索语言

(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。

《信息检索》 第2讲 信息检索的基本知识2

《信息检索》 第2讲 信息检索的基本知识2

19
2013-8-1
(2)自然语言和受控语言的一体化发展趋势
在网络环境下自然语言和受控语言的融合或称一体化是检索
语言未来发展的必然趋势。这方面比较前沿的、有代表性的 理论研究和实践是国内张琪玉先生提出的学科——事物概念 组配型检索语言和美国国家医学图书馆所创建的UMLS系统 。 学科——事物概念组配型检索语言具有的特点是:通过学 科聚类和事物聚类的结合、号码标识和词语标识的结合以及 系统序列和字顺序列的结合,实现分类系统和主题系统的完 全一体化。用户从自然语言词汇、分类号和主题词任一途径 入口检索,都能获得相应的文献。这种检索语言具有开放性 ,可不断增补新概念。目前该模式正处于理论研究阶段。 UMLS模式即一体化医学语言系统。UMLS由超级叙词表、语 义网络、情报源图谱和专家词典四个相互联系的部分组成。
13
2013-8-1

用主题法查找文献,要注意以下几点:
注意利用词表
选择主题词要把握概念的含义 要利用概念之间的属种关系和相关关系增加检索线索
14
2013-8-1
注意利用词表
主题词是检索系统使用的专门的规范化语言,用这
种语言表述的概念,只有一种解释,不允许一词多 义、多词一义,这是规范化检索语言的单义性所规 定的。而一般用户的提问用的是自然语言,自然语 言并不遵守特定事物具有特定概念用特定语言表达 这一原则。
10
2.2 关键词语言
关键词语言是适应目录索引编制过程自动化的需要而产
生的。关键词是文献的篇名、摘要、正文中出现的具有 实质意义并能表达文献主题内容的词语。以关键词作为 标识的检索系统就叫做关键词语言。 由于关键词是未经规范的自然语言,一个概念可以用几 个词义相同或相近的词来表达,因此关键词语言没有固 定的词表,只有一个停用词词表,用以识别词语的词性 ,方便计算机自动抽取实质性语词。 关键词语言十分适于计算机编制索引,检索入口多,编 制速度快,但缺点是容易造成漏检。 例如:“国际联机检索概论”中的“国际联机检索”、 “国际联机”、“联机”、“检索”都是能描述这篇文 献主题的关键词,都可以作为检索词。

检索语言的表示形式及发展方向

检索语言的表示形式及发展方向

检索语言的表示形式及发展方向作者:孙赟星来源:《中国新技术新产品》2010年第18期摘要:作为情报语言学研究对象之一的检索语言,在情报检索中的应用正日趋广泛。

本文分析了检索语言不同的表现形式及未来发展方向。

关键词:检索语言;检索系统;整体检索语言1检索语言的定义检索语言是信息检索系统存贮与检索所使用的共同语言。

它是专门用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。

由于自然语言不可避免地存在词汇上的歧义性,语义上的歧解性,不便用于标引和检索工作,因此情报检索领域出现了各种检索语言。

检索语言由具体的检索标识构成。

包括分类语言、主题语言和代码语言。

分类语言是以数字和字母相结合作为基本字符,以基本专业类目为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。

用分类语言来描述和表达文献内容的加工方法称为分类法。

2检索语言的表示形式2.1以词表的方式建立的综合词表和各类专业词表受控检索语言是通过词表对检索语言中的同义词、同音词、多义词、同形异义词、近义词等进行规范化处理,建立各词之间的相互关系和位置。

具体地说就是通过“用、代、属、分、参”来限定各词的语义和关系,通过词族可了解一词的上下位关系,通过用/代项可知道某词的同义词和近义词,对于采用主题法对文献进行主题标引并使文献按一定规律排列的加工过程来说,叙词表起到了规范用词的标准作用。

世界各大型情报机构都有自己的主题词表。

例如: 英国剑桥科学文摘CSA(Cambridge Scientific Abstracts)有主题词表(Thesaurus),作为标引和检索的查询工具。

在我国,比较权威的是应用分类法组织文献信息的《中图分类法》和应用主题法组织文献信息的《汉语主题词表》,以及代表文献处理发展方向——分类主题一体化的《中国分类主题词表》。

各个专业情报机构依据专业资料的特殊性又相继编制了各类专业词表。

据不完全统计,国内已实际应用的词表有60多部,词表容量超过1万的有10部左右。

检索语言的表示形式及发展方向

检索语言的表示形式及发展方向

能够 以任何方式支持主题标引和检索作业 , 包 括 机 辅标 引 ( 自动 标 引 ) 或 和全 文检 索 、 自 由词检 索 , 不开各 类词 表的支 持 。 面提 都离 上 到的单 汉 字检索 系统尽 管没有 以叙 词表 为基 础 的 人 工标 引 ,但 还 需要 “ 用 词表 ”S p 停 (t o L t支 持其 自动抽 取关 键词 。 i) s 33检索 语 言 由前 控 向后 控 的发展 - 为 了弥补 无控 制词 表 的不足 ,单汉 字检 索系统 还需 要 建立 后控 词表 ,一种 不供标 引 只供检 索用 的词 表 。 当检索者 为 了查全某 一 主题 的资料 ,而 不 了解 相应 的同义 词和相 关 词时 , 输人 一个 自己以知 的检索 词 , 只需 系统 就能通 过后 控词 表 自动 将有关 同义 词与相 关 词 纳人 检 索式 , 并用 “ ” 或 逻辑 连接在 一起 。 从 而提 高查全 率 。配 备后 控制词 表是 提高 自然 语 言检 索效 率 的有效 措施 。 3 受控 语 言与 自然语 言相结合 的标 引 . 4 传 统 的 受控 语 言 与 自然 语 言共 同使用 , 可起 到优势 互 补 的作用 。这 在国 内外 已形 成 共 识 。 电子科 技文摘 》 《 的文献加 工 、 排序 组织 即采 用此种 方式 : 同时用 分 类号 ( 范畴号 )叙 、 词( 主题词 ) 自由词 ( 键词 ) 引一篇 文献 , 、 关 标 检索 时 分类 号 、叙 词 、 自由词 皆为可检 索字 段 。有人将 分 类 号、 叙词 、 自由词 合为一 体的 检索 方式 称 为整体 化 检索语 言 , 实践表 明 , 整 体化 检 索语 言足联 机检 索系统 理想 的语 言 。
发展 方 向。
关 键词 : 索语 言 ; 索 系统 ; 检 检 整体检 索语 言

我国情报检索语言研究的热点问题

我国情报检索语言研究的热点问题

初创逐步走向成熟 , 情报语言学系列课程不断完善 。 并取 热点 。总的说来 , 《 对 中图法》 的研究包括 以下几 方面的 对《 的理论研究 , 包括对《 中图法》 的体系结 得丰富的经验 。 特别 是对一些 热点 问题 , 如分类语言 、 主 内容 : 中图法》 题语言 、 分类 主题一体化语言和 自然语言与人工语言结 构、 发展方向及编制原理和原则 , 从总体上评价《 中图法》
【 关键词 】 情报检 索语言 ; 分类检 索语言 ; 主题检 索语言 【 中图分类 ̄l 24 -G 5 【 文献标识码】 A 【 文章. -17 — 0220 ) — 19 0  ̄ ]62 11(060 02 — 2 5
情报检索语言是根据情报检索的需要而编制的人工 成为一个值得大家注意的问题 。目前主要研究了信息 网
2 对 主题 检索 语言 的 研究 . 在 主题 检 索语 言 的研 究 方 面 , 叙 词 语 言 的 研 究 最 对
除了对《 中国分类 主题 词表》 的介绍 、 评介 以及如何 录的实现、 扩大 , 因而提出暂时的过 渡措 施是“ 内各 图 国
近几年 以来 , 联机环境中的情报检索语言 的发展的研究 多 。叙词语言是以自然语言词汇为基础的一种情报检索

今 后研 究 重点
1对几部大型词表, 中图法》 《 . 如《 、 汉语主题词表》 、
中国分类主题词表》 的理论研究应加强 , 不应仅 停留在 它与不断发展 的情报检索 技术相适 应的优 势得 到 了迅 《
我 国情 报 检 索语 言 研 究 的热 点 问题
张 东华
( 南工业 大学 图书馆 , 南 郑 州 4 00 ) 河 河 507
【 摘 要 】 文章通过对我 国 1 年 来情报检 索语言的研 究 , 0 重点评述 了以《 中图法》 为代表 的分类检 索语 言、 主题检 索语

论新时代下图书馆情报工作情况及其趋势

论新时代下图书馆情报工作情况及其趋势作者:蒋娟来源:《赤峰学院学报·自然科学版》 2012年第4期蒋娟(曲阜师范大学图书馆,山东曲阜 273165)摘要:21世纪是网络时代,信息技术的快速发展,对人们的工作、生活和学习方式都产生了巨大影响.图书馆情报工作在信息电子化和网络化的普及下也出现了新变化,呈现出新的特征,当然也遇到新的难题.图书馆情报工作到了一个变革时期.在新时代下,图书馆情报工作也面临着新的挑战,面临着更为复杂的局面,发展也呈现出新的趋势.在这种情况下,要做好图书馆情报工作不仅需要强化工作人员的信息采集、处理和跟踪能力,还要加强与其他图书馆之间的合作,形成高校图书馆联盟,在一定程度上,实现高校之间的信息共享,为读者提供尽可能多的信息渠道,更好的发挥图书馆职能.关键词:图书馆;情报工作;新时代;趋势中图分类号:G258.2 文献标识码:A 文章编号:1673-260X(2012)02-0119-02对于高校而言,图书馆是不可或缺的组成部分.在高校中,拥有齐全的设备、数字化资源和高素质人才,这些条件一方面是高校图书馆得天独厚的优势,为了网络信息教学提供了充分的外在条件和有效的人才支撑,但是另一方面这些条件使得高校图书馆面临着更为严峻的挑战.这种挑战主要是来自于高校图书馆的双重功能之间的平衡上.高校图书馆一方面是学校图书馆的情报中心,另一方面为师生的学习、科研和教学提供服务功能.那么,现代对于图书馆来说,就有一个问题摆在面前了,那就是如何做到在提高图书馆相关设施文献利用率的同时,又使得这些资源准确方便的应用于学习、教学和科研中.在笔者看来,在新时代下,图书馆工作的核心与实质是:通过高校图书馆的网络平台促进网络信息教育的实现与发展.那么,按照这种思路,图书馆情报工作从形式和内容上都发生了巨大变化.1 新时代下图书馆情报工作的新情况1.1 信息检索的瞬时化和信息存储的巨大化随着人类社会进入信息时代,人们对信息存储和检索的了解不断加深,对其要求也越来越高.一方面是希望检索速度越来越快,检索结果也越来越精确,另一方面也希望能查阅的信息资料是丰富的,但是巨大的书刊也海量信息必然会带来查找的难度.现在社会知识更新的周期越来越短,也就是说,一些科技文献可能今天还是最新成果,明天就被更新的研究成果取代了,科技文献的时效性越来越强.面对着这样的挑战,高校图书馆在信息存储格式和检索方式上都要发生相应的变革,从信息存储格式上来说,是要实现图书馆情报服务的数字化信息存储,而从检索方式上来说,则是要实现图书馆情报服务的资料细微化.“毫无疑问,现代高科技文明成果的应用和其他高存储媒介的应用以及数量和规模日益增大的数据库的建设,均成为高校图书馆服务的有效手段自动化标准化网络化已经发展成为衡量一个图书馆是否现代化的重要标志图书情报领域的巨大变革就要求引入计算机进行检索文献和各种信息数据,并将传统的手工检索自然地置于次要的辅助地位.”基于以上认识,我们可以知道未来图书馆的自动化水平是与其硬件设施息息相关的.1.2 脱手工化和电子化图书馆分类整理流程高校图书馆的发展可以说是走在前列的,目前,我国高校图书馆的网络建设也基本完成,各大高校都拥有一套较为稳定的校园网络.在这套网络上,还负载和集成了部分应用软件.这种网络环境对高校是图书馆实现数字化的基础,也为图书馆的查询和分类检索功能都提供了便利,并且能在此基础上不断得到完善.在这种情况下,图书分类整理流程也逐渐发生了变化,慢慢了脱离了原来的手工化,而实现了电子化的分类整理流程.工作流程得到简化,工作效率得到极大的提高.电子化的分类整理功能还能应用到图书馆的具体工作中,比如在一些图书馆的日常管理事务中可以应用到,有图书资料的收集、借阅、还书、办理借书证、证件挂失等.对于图书馆来说,它所担负的职能越来越多,而且一些原有的职能也能发挥得更好,图书馆的服务职能无论是从服务方式、服务水平还是服务手段上来说都不是传统图书馆所能比拟的.1.3 共享化和国际化的馆藏资源现代科技的发展日新月异,学科直接相互交叉和渗透也是常事,由此衍生出来许多新的边缘学科,自然也会有新的图书资源来阐释和探讨这些学科.而现在高校普遍面临的情况是三座大山拦在眼前,分别是人力资源不足、资金不足、空间不足.也就是说,在这种情况下,任何一个高校图书馆想评一己之力订购或者是收藏所有的图书杂志,基本是不可能的,所有的图书馆都只可能是在有限的范围内加以选择订购.在这种背景下,各大高校图书馆相互之间展开合作,形成了高校图书馆联盟,使得馆际资源共享成为必要和可能.这样,读者即使在本校图书馆中查询不到所需要的资料,也可以通过网络到其他图书馆中去查找.对于图书馆来说,人力资源、资金、空间资源都得到了节约,而且图书资源的利用率和使用频度都得到了提高.馆际资源共享对于读者和来说,是有百利而无一害的.他们在任何时间、任何时间需要查询和获取相应的文献,只要是有网路,都可以在当时当地获得,可以以最快的速度获得想要的图书资源,而且也节约了经费.在这种情况下,我们试想想,如果利用互联网使得全世界的图书情报机构组成一个整体,那么实现全球信息情报资源的共享也不再是空想.2 新时代下图书馆情报工作的新趋势2.1 实现联合编目与网络共享“网络环境下的联合编目是指图书情报组织利用网络建立开放式的编目系统,按联合目录数据库的统一标准进行文献编目、排序和管理,以满足联机网络书目查询与资源共享的需要.基于网络的联合编目数据库组织可以集中,但更多的是采用分布式管理模式,其前提是利于信息资源的共享和管理.”在新时代下,图书馆情报发展趋势在这一点上已经表现得非常明显了,与传统的图书馆有着明显的区别.传统图书馆在组织情报时,是以收集当前用户所需要的和将来可能需要的全部信息为指导思想的,然后将这些信息存储在本馆中.但是如果是这样的话,由于现代社会要求图书馆具有巨大的信息存储量,这样的指导思想根本不能适应了,继续使用传统图书馆的情报组织思想,显然是不合时宜的,会使图书情报工作的开展无法继续,陷入困境和死局.世界上的任何一家情报机构或情报组织,都不可能去购置全部的情报资料,一方面是没有足够的经费,另一方面是也没有这个必要.而且每一个图书馆的面积都是有限的,能用于整理图书馆的工作人员也是有限的.所以,在这种情况下,图书馆情报工作向着电子化、网络化、共享化发展,则是其必然选择.2.2 实现实体馆藏和虚拟馆藏建设相结合现代高校要求图书挂有丰富了信息资源,这些信息资料全部表现为纸质版,显然是不现实的.现代图书馆包含两个发展方向,一个是实体馆藏,另一个是虚拟馆藏.现代提到图书馆馆藏,而不应该只是想到印刷型、缩微型以及视听型的资料,而是应该包含更多的范畴,各类信息资源都可以作为馆藏资源.实体馆藏指的是各类可触摸的文本,而虚拟馆藏指的是各类网络化的信息资源.在现代化的图书馆中,馆藏包含两方面的内容:实体馆藏和虚拟馆藏.其中实体馆藏包括文本类和印刷类的实体书籍、文献资料、刊物等,而虚拟馆藏包括电子类和媒体类的信息资源.无论是实体馆藏还是虚拟馆藏,都是作为重要的馆藏资源需要加以保存的.在图书馆中,实体馆藏和虚拟馆藏中存在着各种不同类型的文献,文献之间是相互关联,相互补充的,它们的结合使得新时代下的图书情报组织文献体系更为完善.图书馆的工作人员,在搜集和整理这些相关文献的过程中.3 总结在当今社会环境下,图书馆情报工作的发展现状需要格外注重.首先,由于网络化的发展信息检索的瞬时化和信息存储的巨大化越来越明显.其次,由于计算机的不断普及,图书分类整理流程的脱手工化和电子化也是需要注意的.最后,由于网际网络等方面的发展,馆际资源的共享化与国际化同样不可忽视.在此基础之上,我们还应该看到新时代下图书馆情报工作的新趋势.实现联合编目与网络共享不仅仅是人们的目标,在当前环境下更是图书情报组织的必然选择.实体馆藏和虚拟馆藏建设相结合也是指日可待的.在实现高效联盟的基础之上,促进信息共享,充分发挥图书馆的作用仍旧是当前图书馆工作者孜孜不倦追求的目标.参考文献:〔1〕龚军慧,何艳群.我国高校图书情报事业发展趋势[J].科技情报开发与经济,2007(1):252.〔2〕张碧源.网络技术在图书情报中的作用[J].科技创新导报,2009(5):210-211.〔3〕胡昌平,曹宁,罗贤春.论网络环境下图书情报组织变革[J].图书馆论坛,2005,25(6):54-58.〔4〕邓伟珍.信息网络技术下我国图书情报工作的发展[J].长春理工大学学报,2008,21(1):139-142.。

网络信息资源组织与情报检索语言


会) 合作建立 的 H e a l t h We b 、 英 国N o t t i n g h a m 大 学 建 立 的
0 MN I 、 T h e P o l y t e c h n i c R e s e a r c h I n s t i t u t e 研 制 的 Me d i c a l Wo r l d S e a r c h ( M WS ) 、 美国 O r e g o n医 学 院 组 织 建 立 的 C l i n i We b I n —
具 的应用 现状 , 并分析其发展趋 势。
揭示和组织信息的 , 它 比较 全面客观地反 映了知识 全貌 和其
内在 的 逻 辑 联 系 , 它 的 知识 系统 性 和标 识 语 言 的通 用 性 以 及
1 生物 医学 网络信息资源组织 的现状
网络信 息资源 十分丰 富 , 是集 图 、 文、 声、 像于一体 的多 媒体信息 , 而有关医学专业的 网络信息资源更是 为医学研究
需求者 , 具有 明确的 网站评 价和选择准 则 , 资 源多采用或借
鉴检索语言进行组织 。而在国内 , 虽然人们 已经意识 到对生 物医学网络信息资源进行组织的必要性 , 部分 网站 也建立了 生物 医学 的 网络信 息资源导航 , 但 多为列表方式 , 只有 少数 采用检 索语言 的相 关概念对 国内的生物 医学 网络信息 资源
进 行 了探 讨 , 并 对 其发 展 趋 势提 出 了新 的 看 法 。
【 关键词】 检 索语言 网络
【 分类号] G 3 5 4
信 息组 织
生物 医学
近年来 , 随着信息 资源 网络 化 、 数字化 的发展 , 网络信息 资源从数 量到 内容 上都有 了突破性 的增 长 , 呈现 出多类型 、

对于中国情报检索语言发展脉络的探究

四部分类 体系 。
上 运 用 情 报 检 索 技 术 与 方 法 、 早 把 情 报 检 最
索思想应 用 到 实践 工作 上 的 国 家 。可 以说 , 我 国 情 报 检 索 语 言 发 展 历 史 悠 久 , 是 情 报 但 语 言 学 作 为 一 门 科 学 学 科 . 只 是 在 本 世 纪 却
编 制 了一 部 思 想 崭 新 的 “ 自创 型 ” 类 法 分
② 洋 为 中 用— — 新 分 类 体 系 的 产 生 : 主 要 有 :9 7年 , 祖 荣 、 庆 生 根 据 杜 威 十 进 11 沈 胡
分类 法的原 则 和 方 法 , 其结 构 自创“ 杜 ” 仿 仿
③ 图 书 分 类 协 作 组 织 的 成 立 : 9 5年 . 12
维普资讯
絮 囡鬻 》 基 与 谶糠 勤深时
《 家图书 学  ̄ o年 期 国 馆 刊 z 2 第1 o
对 于 中 国情 报 检 索 语 言 发 展 脉 络 的 探 究
余 晓 寒
我 国 是 最 早 在 图 书 文 献 资料 的 体 系 编 列
① 新 四 部 体 系 的 产 生 : 8 6年 , 启 超 19 粱 首 成 《 学 书 目表 》 提 出 “ 部 、 部 、 部 和 西 , 学 政 教 杂 类 ” 样 一 个 区 别 于 传 统 四 部 分 类 法 的 新 这
杜定 友谓 为《 杜 威 十 进 分 类 法 》 参 见 【 . 仿 . 】 3
年, 姚名 达 编 撰 而 成 《 国 目 录 学 史》 。 中 一书 这 本有关 图 书分 类原 理 基 础性 著作 的产 生 ,
辞 }
七 1 1 竹 竹 1 1 竹 竹 1 1 1 竹 1 竹 竹 竹 竹 1 竹 1 丌 竹 1 竹 1 1 1 1 卞1 1 竹 1 1 竹 1 1 竹 1 卞 卞 卞 卞 卞 卞 卞 卞 卞 f 卞 f 卞 f f1 卞 f 巾 卞 f 卞 f竹 竹 十

当今搜索引擎技术及发展趋势

当今搜索引擎技术及发展趋势随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。

目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。

搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。

据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9T,并且仍以每4个月翻一番的速度增长。

用户要在如此浩瀚的信息海洋里寻找信息,必然会“大海捞针”无功而返。

搜索引擎正是为了解决这个“迷航”问题而出现的技术。

搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。

搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。

搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。

一、分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。

信息大多面向网站,提供目录浏览服务和直接检索服务。

该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。

这类搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。

2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。

服务方式是面向网页的全文检索服务。

该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

络时代情报检 索语言的发展 方向, 阐述 了完善 自然语言的必要性和具体措施 。 关键词 : 情报检索语 言 ; 自然语 言; 网络环境
中图分类号 : 34 G 5 文献标识码 : A
索语言 的应 用也出现 了新局 面:由以分类 语言为主变 为以叙词语 言 为
1 网络环境的特点及对情报检索语言的要求
2 ( ) 18 19 34 :5 — 5 .
信 息载体 电子化的主要标志是机读数据库 的迅速崛起。2 世纪 9 O O 年代以来 , 全世界联机数据库已超过 5 0 个 , 0 我国 自建中文数据库也 已 0
达 3 0 余个 , 中包括书 目数据库、 0 0 其 数值数据库 、 全文数据库 、 图像数据
2 自然语言是网络时代检 索语言的发展方向
网络环境的需求 , 网环境用户需要 自 联 然语 言 , 呼唤 自 然语 言检索 的工
述, 新的信息环境引起 了情报检索 系统的大变革 , 同时也使作为情报检
索 系统重要组成部 分的情报检索语言得到发展和创新 。
具, 即后控词表或人 I词表等 的出现 和应用 。 = I
12 信 息载体 电子化 .
维普资讯
科技情报开发与经济 文章编 号:0 5 6 3 ( 0 6 1 - 0 3 0 10 — 0 3 2 0 )4 0 8 - 3
S IT C F R A I N D V L P E T&E O O Y C - E H I O M TO E E O M N N CNM
数为 9 0 万 , 20 年同期增长 8 其 中使用宽带上 网的人数达到 4 0 比 03 4 %, 2 0 ; 网计算机达到 410 8万 上 6 万台 , 20 年增长 了 1. 比 03 4 %。同时 , 6 与
及 O i IK式的图书馆资源共享网络建设莫定 了基础 。 h LN o 网络信息产品、 搜索引擎等 网络信息检索工具已非常成熟 , 息环境及信息载体的变化 信 直接影 响情报检索的方式和技 术 , 检索正 在由以往的对 文献线索的 情报 检索发展到全文检索 、 数值检索 、 事实 检索 、 超文本检索、 多媒体检索 , 由 文献检索发展 到信 息检索 , 由相关性检索 发展到直接性检索 , 使检索结 果更贴近用户 的需求 。 超文本 、 多媒体 、 全文检索等技 术及计算机 网络技
14 o O —Biblioteka 5.[2 张志彬 . 1] 学生勤工俭学促 进高校图 书馆发展 [] J. 中山大学学报论
丛 ,0 5 2 ( )3 2 3 6 2 0 ,5 3 :2— 2 .
( 责任编辑 : 王雅利)
[O 张锐 . 工与高校图 书馆 人力资源 管理 [] 1] 学生 J. 图书馆 论坛 ,03 20 ,
术 的发展使 检索语言 的联机显示 、多数据库查寻 中的词汇兼容与互换 、 自然语言检索接口以及 自动标引等问题 的研究和应用成为现实。 综上所
因特 网相连的 中国教 育科 研网( E N T 现 已连通 内地数 百所大学 , CR E ) 在 全 国形成了主干网及众多 的局域 网和校 园网。在计算机 网络环境 中, 检 索语言( 分类表 、 词表 ) 的使用对象 由原先 的专业标 引人员 和检索人员扩
1 信息资源的网络化 . 1 随着因特网在全球 的迅 速发展 ,其用户 已多达 几亿个 。20 年 1 05
主; 由使用单一的检索语言变为以多种检索语言 的并用或混用。
l 信息检索现代化 _ 3
网络将许许多多图书馆 的资源连接起来 , 并提供对 这些 资源 的有效 检索 , 从而使图书馆的数字信息提供能力产生了跨跃式 的提高 。M R AC
网络环境对情报检索语 言的易用性提 出了更高 的要 求。张琪玉教授 在
1 8 年出版 的《 93 情报检索语言》 一书中 , 对检索语 言是这样定义的 :情报 “
情报工作 ,0 5 2 :1— 1 . 20 ( ) 15 16
[ ] 史 曙霞 , 8 孙继 亮. 勤工助学学生参 与高校图书馆管理工作 的意义及 作用 [] J. 大学图书情报学刊 , 0 ,3 1 :7 8 . 2 3 2 ( )8 — 8 0 [ ] 蔡 焰辉. 时期大学 生参与图 书馆的管理 [ ] 9 谈新 J. 图书馆 ,0 5 5 : 2o( )
大到专业不同 、 层次不 一的广大终端用户 , 大量社会终端 用户 的介入 , 使
具有受控语言背景知识的专业用户 比例急剧减少 。 这些用户需要的信息
不是 已经 确定的内容 , 也不 能用规范 的术语 ( 如分类 语词 、 主题语词 ) 来
表示 , 尚未形成概念的情 报。传 统的分类语言和叙词语 言不能适应 而是
20 年 06

第 1 卷 第 l 期 6 4 收稿 日期:0 6 0 — 5 2 0 — 2 1
网络 时代情报检 索语言 的发展趋势探讨
剥树 国 、
( 郑州广播 电视学校 , 河南郑州 ,50 2 4 00 )

要 : 分析网络时代的特点及对情报检 索语言要 求的基础上 , 出 自然语言是 网 在 提
21 自然语言的易用性 更高 .
随着计算机检索的发展 , 对情报检索语言 的认识也 在发生着变化 ,
库等 。 与此同时, 计算机可读的电子出版物 ( 包括 电子图书、 电子报刊等 ) 也在急剧增长。由于机读数据库逐渐取代 了以往 的印刷 型二次文献 , 检
( ) 5 — 5 2 :4 5 .
( 机器可读 目 ) 录 的出现使计算 机全 面进入 了图书馆业务管理的核心 , 并 为图书馆 自 动化管理 、 馆际间联机联合编 目、 P C的建设与远程访问以 OA
月1 9日, 国互 联 网络信 息 中心 在 京发 布 的《 十五 次 中 国互联 网 中 第 络发展状况统计报告 》 显示 , 截至 2 0 年 l 月底 , 国内地上 网用户总 04 2 我
相关文档
最新文档