数字图书馆与Internet的对比分析
文献信息检索第3章 习题与答案

第3章图书信息资源利用1.图书馆的类型有几种?试比较实体图书馆和网上虚拟图书馆为读者所提供的服务功能有何不同。
答:图书馆的类型:按其存在形式可分为实体图书馆和虚拟图书馆;按其职能分为其他类型图书馆:公共图书馆、科学与专业图书馆、高等学校图书馆、国家图书馆和版本图书馆、军队图书馆、工会图书馆、社区图书馆等。
实体图书馆和虚拟图书馆的不同:实体图书馆有空间距离及固定开馆时间的限制,虚拟图书馆无时间空间限制,读者可以通过Internet进入图书馆,任意浏览或下载电子文献,获得所需信息。
虚拟图书馆不单介绍本馆情况,更重要的是作为网上服务的窗口,引导读者使用图书馆的资源和服务,并帮助读者以最快的速度获得所需的信息。
此外,图书馆还可以利用HomePage收集有关信息源的网址,建立学科信息导航系统,帮助读者在茫茫的网上电子信息世界中漫游、检索所需的文献信息(特别是各种免费资料)。
2.什么是数字图书馆?比较传统图书馆、数字图书馆、移动图书馆的区别。
答:数字图书馆的定义:数字图书馆是在网络环境下,利用数字化技术手段,使用规范化的方法,整理加工信息资源,供用户使用的机构。
传统图书馆、数字图书馆、移动图书馆的区别:1)从历史继承性来看,数字图书馆是传统图书馆的发展。
传统图书馆的藏书以纸质印刷书刊资料为主,服务以图书为中心,通过卡片目录反映馆藏信息,通过读者到馆借阅和送书上门传递信息,整个工作以手工操作为主。
数字图书馆则在许多方面有别于传统图书馆,即信息资源由过去的“以藏为主”变成了“藏用结合,以用为主”;信息服务由被动服务、单一服务变成了主动服务、综合服务;书目管理由卡片式变成计算机管理;读者借阅由封闭型变成开放型;信息资料的储存由单一的印刷型变成纸质图书、缩微、电子出版物和网络储存相结合的多元化方式。
2)从信息资源建设来看,传统图书馆是数字图书馆的基础。
数字图书馆作为一种信息环境,离不开各个具体图书馆和信息机构的支持。
数字化时代高校图书馆论文

数字化时代与高校图书馆摘要:本文在介绍信息共享空间概念、内涵的基础上,论述了信息共享环境下,保障系统成功的关键因素——图书馆管理人员及配置,并对图书馆管理人员提出更高的要求。
然后从信息素养的内涵出发揭示了信息共享空间与信息素养培育之间的密切关系,指出如何培育用户的信息素养,以便使用户能够更好地利用信息共享空间。
关键词:数字化图书馆;信息共享空间;参考咨询人员;信息素养中图分类号:g58.6 文献标识码:a 文章编号:1009-0118(2012)-02-0-02信息共享空间是从国外引进的概念。
它的英文名称是information commons简称ic。
另外也有称之为learning commons的,如加拿大圭尔夫大学、达尔豪斯大学、英属哥伦比亚大学等;美国普渡大学则将其命名为digital learning collaboratory;薇诺娜州立大学称呼其为 information gallery。
在我国,除了信息共享空间外,还有很多不同的翻译名称:香港通常翻译为咨询坊,而台湾则习惯翻译成资讯市集、资讯公共空间,或者称之为资讯大众。
信息共享空间是20世纪90代兴起于北美一些大学图书馆的一种新型的图书馆服务模式。
它是一个经过特别设计、确保开放存取的一站式服务设施和协作学习环境。
它围绕数字资源环境、整合使用方便的互联网络、功能完善的计算机软硬件设施以及各种图书馆资源(包括印刷资源、数字资源等)。
在训练有素的参考咨询员、学科馆员、it专家等工作人员的共同支持下,为用户提供信息的获取和与之相关的各种参考咨询的“一站式”服务。
这是一种理想的学习和科研环境,在这种环境下,可以培育用户的信息素养,促进用户的学习、交流、协作和研究。
作为一种新型的动态服务模式。
它更加体现了图书馆以用户为中心的服务理念。
根据donald beagle的分析,信息共享空间由两个层面构成:第一个层面是独特的在线环境,在这一环境下,用户通过图形界面可以获得多种数字资源服务,并且同时可以通过网络工作站上的任何搜索引擎进行搜索。
电子阅览室系统

电子阅览室系统(电子图书馆系统)一、产品简介电子图书馆也叫"数字图书馆",相对传统图书馆而言,它管理和珍藏的不是纸质的图书,而是数字化的"电子图书",并让人们利用计算机通过网络检索和获得这些电子图书。
所以电子图书馆是存储和管理大量电子图书,并为人们提供网络检索和阅读服务的计算机网络系统。
电子图书馆由三部分组成:大量的电子图书、电子图书管理系统和网络发布系统。
电子图书是图书馆的基础;管理系统对电子图书进行分类、编目、维护,使得大量的电子图书利于读者使用;网络发布系统是电子图书馆的核心,因为最终读者只有通过网络发布系统来了解电子图书馆的信息,检索和阅读图书,并通过网络发布系统与管理员或其他读者进行交流。
从某种意义上将,在普通读者眼中,网络发布系统就是电子图书馆的全部。
电子图书馆是一套面向学校、企业的网络信息中心、图书馆等部门的书籍管理和发布系统,能够为各部门提供完整的知识管理和发布功能。
电子图书馆是一个基于Web的B/S系统,所有的操作都通过浏览器来完成。
在安装数字化图书馆产品时,一方面会往服务器上预装相应的数字图书,另一方面,也可以让管理员从任何一台可以登录系统的计算机上,利用管理员帐号登录,然后对服务器上的图书进行管理。
二、系统特点●支持跨平台的“国标级”电子图书馆符合国家教育部颁发的信息管理平台标准,支持WIN2000/WIN98/ME/XP,linux等各种操作系统●图书资源可批量导入可批量导入各种格式和各主流出版社的电子图书,资源海量●读者界面生动友好让老师,学生更有兴趣在网上阅读图书,逛游书海●独具个性化的“我的藏书阁”让每个读者都有自己最具特色的而又方便阅读的“个性化空间”●支持各种不同类型的电子图书格式支持各种不同类型的,标准的和主流的电子图书格式,●海量的电子图书资源拥有数万册电子图书资源三、功能模块电子图书管理系统分两大部分:(一)电子图书馆管理部分1、图书管理:增加、修改图书的管理2、评论管理:对所有的读者留下的评论进行管理、对相应的好看的书籍进行评定,而且还可以查询3、类别管理:各种图书的类型的划分4、精品推荐:电子图书等级推荐管理5、统计分析:对所有的电子图书进行统计分析6、数据备份与恢复:考虑到安全问题,管理员最好是一个星期或者是隔几天就备份一次数据库。
云计算环境下数字图书馆服务模式论文

云计算环境下数字图书馆服务模式探析随着网络的普及和发展,数字图书馆的数据量以爆炸式的速度增长,导致图书馆数据存储的成本上升。
这对于经费本身就困难的图书馆来说,仅靠更换设备来保证计算速度和存储容量并非万全之策,更何况这些设备带来的附加费用也是一个不小的数据,而且随着设备数量的增加,各种存储体系结构之间的差异不断增加,可融合性变差,数字图书馆中存储资源难以管理和充分使用。
与此同时,利用网络为用户提供服务的图书馆,在提升图书馆服务水平的同时,也遇到了一些困境和挑战,如数字图书馆应用服务器正面临着经常遭受黑客的恶意攻击、服务器相关硬件的配置不能很好地满足用户需求等问题。
这此问题解决不好,轻则导致图书馆无法开展正常的工作,重则将导致图书馆重要信息的丢失,给图书馆造成难以挽回的损失。
如何利用较少的、合理的投资解决图书馆所面临的上述问题,是当今数字图书馆在网络环境下所要解决的又一课题,云计算的出现可以很好地解决数字图书馆中存在的问题,如云计算提供了强大的数据存储和网络服务功能,通过云计算可以解决数字图书馆技术上的异质问题,减少数字图书馆存储空间的成本,提供更完善的人机交互功能等;同时云计算还可以提供更加多样个性的信息服务,从而提高数字图书馆的信息服务效率。
从数字图书馆的困境与云计算的优势可以看出,数字图书馆具有对云计算的现实需求。
1.云计算的内在机理云计算这个名词实际上是借用了量子物理中的“电子云”的说法,强调说明计算的弥漫性、无所不在的分布性和社会性特征。
它是指在原子核周围运动的电子不是沿着一个经验世界的轨道运行,例如,像天体一样的运行轨道,而是弥漫空间的、云状的存在。
电子云有以下特性:概然性、弥漫性、同时性等,这与云计算的概念完全一样,也与早几年提倡的“无所不在的计算”类似。
云计算(cloud computing)是分布式处理、并行处理、网格计算和internet从现实应用角度的进一步发展,是一种新型计算模型与互联网结合的商业产物,它将分布在大量计算机和存储设备上的计算和动态可伸缩的it计算资源集成在一个虚拟池上并将这此庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多台服务器,经搜寻、计算分析之后将处理结果以internet的服务方式回传给用户。
图书馆学学习资料

1、数字图书馆是一个数字化的信息系统,它将分散于不同载体、不同地理位置的信息资源以数字化方式贮存,以网络化方式互相连接,提供即时利用,实现资源共享。
2、数字图书馆范式演变第一代:基于数字化资源的数字图书馆(Resource-based digital Library)特点:以特定文献资源的数字化为核心,致力于提供这些数字资源的跨时空检索获取,但往往作为独立资源系统(Stand-alone),可能作为传统图书馆系统的一部分。
核心技术:数字格式标准体系,描述信息对象的元数据,数字资源库组织,检索与呈现方法,初步数字权益管理技术,初步CBIR,数字化工程规范等。
第二代:基于分布式信息服务的数字图书馆(Service-based digital library)特点:以分布式多样化数字信息资源的互操作和集成为核心,致力于通过服务集成(资源建设、门户建设、知识组织、跨异构系统检索、使用管理、权益管理、长期保护等)形成虚拟信息系统,全面支持信息检索与获取。
核心技术:分布式系统结构、系统互操作与互操作协议,数字对象与数字对象唯一标示符、元数据互操作、参考文献链接、使用管理、数字权益管理、虚拟资源建设、网络化知识组织系统、基于内容检索、跨语言检索、数字信息长期保护技术等。
第三代:基于用户信息活动的数字图书馆(User-centered and Work-based digital library)特点:以支持用户灵活和协作地处理信息、提炼知识和传播交流为核心,围绕用户信息活动和用户信息系统来组织、集成和嵌入数字信息资源和信息服务核心技术:数字对象与分布式对象代理技术,动态文献与动态DL技术,知识组织系统与语义处理技术,智能代理技术,个性化定制,虚拟定制技术,信息协作处理技术,用户信息环境中信息服务系统嵌入机制,基于XML的信息组织与处理技术,基于UML/XML的信息系统定义、构建、集成技术。
★3、在数字图书馆的建设和利用中,你认为资源、技术和服务三者的重要程度如何?4、美国政府“国家计算、信息、通信指导办公室”(NCO for CIC),自1994年以来每年发表一本“蓝皮书”,这是一种重要研究与发展的正式官方报告,在这些报告中数字图书馆项目的战略重要性越来越明显。
数字图书馆的建设与发展对策

2012年4月内蒙古科技与经济A pril 2012 第8期总第258期Inner M o ngo lia Science T echnolo gy &Economy N o .8T o tal N o .258数字图书馆的建设与发展对策王玉红(周口师范学院,河南周口 466001) 摘 要:概述了数字图书馆的概念、应用及特征,结合数字图书馆建设中所存在的问题,提出了建设数字图书馆的必要性和发展对策。
关键词:数字图书馆;网络建设;资源共享;数字信息资源 中图分类号:G250.76 文献标识码:A 文章编号:1007—6921(2012)08—0088—03 在世界文明史上,图书馆作为一片圣土始终闪烁着耀眼的光芒。
图书馆在推动人类文明的进程中一直扮演着重要的角色,随着高科技术的迅猛发展,传统图书馆正在走向网络化,向数字化图书馆迈进;特别是知识经济的兴起,网上信息的有序组织越来越引起世界各国的重视,数字图书馆应运而生。
数字图书馆的建设与发展使信息资源的利用与开发都发生了重大的变化,使全球性信息资源共享的梦想成为现实。
数字图书馆是网络环境下共建共享可扩展的知识网络系统,其模式是面向读者的分布式网状结构,即它是超大规模分布式的、没有时间限制、便于使用的、能实现跨库无缝连接与智能检索的知识中心。
1 数字图书馆的概念及应用1.1 数字图书馆的概念“数字图书馆”即“Dig it al L ibrary ”。
“L ibr ary ”这个词在英文里有两种解释:一是“图书馆”,二是“库”。
根据分析发展趋势,数字图书馆更趋向于“库”的建设,而“库”不只仅限于“电子图书库”还包括“图片库”、“视频库”、“音像库”等。
关于什么是“数字图书馆”,中外学者有诸多解释。
——C.林奇和H.加西亚.莫利纳:数字图书馆是为某一用户群体提供的大型的,有组织的信息库进行有机检索的系统(1995年)。
——李易梅:数字图书馆是通过多种技术将各种文献数字化,并将其组织起来在网上提供信息服务的信息中心或数据库(1998年)。
浅谈图书馆信息化建设
浅谈图书馆信息化建设二十一世纪是网络信息时代,未来的信息高速公路需要的是电子化、数字化的信息,从而也明确了二十一世纪图书馆发展的道路——信息化。
一、图书馆信息化的重要性和必要性图书馆信息化是传统图书馆走向现代图书馆的一个过程,是社会信息化的要求和组成部分。
图书馆作为文献信息资源的集散地,拥有丰富的信息资源是其最大的优势。
随着信息技术的快速发展和社会信息化进程的加快,图书馆的信息化应当在信息技术的应用、信息资源的建设、信息资源的开发和服务等方面拥有自己的地位和作用。
因此,图书馆该怎样走信息化发展道路是一个现实而且严峻的问题。
目前,我国已有1000多个信息中心,4万多个信息咨询机构。
这些社会咨询服务业的兴起,使我们迫切地感到,传统图书馆如果想在信息社会中不被淘汰,就必须转变观念,走信息化发展的道路。
从而也就要求图书馆把工作重心从原来的以信息资源提供服务为主转到信息咨询服务工作为主上来,使得图书馆在市场经济、信息产业相互渗透、竞争加剧的二十一世纪中,不再被动地向读者提供需要的信息,而是要帮助其明确信息需求,主动走出去推销经过深加工的信息产品,主动与一些机构联系,进行信息研究分析工作。
还要树立起更适合目前信息时代所需要的服务观念,增加读者对图书馆的信任感,加强信息资源管理、开发,建立起本馆的信息系统,开发更多更好的信息产品。
二、图书馆信息化建设的指导思想和原则图书馆信息化应当以图书馆的资源、技术、网络优势为基础,制定图书馆信息化发展的具体规划,形成分层次的公共图书馆信息服务网络。
以数字图书馆建设为发展方向,贯彻整体规划、分布建设、需求牵引、标准统一、避免重复的指导思想,结合公共图书馆的实际,提高在网络环境下公共图书馆的整体信息服务能力。
同时利用先进的管理思想改进图书馆管理,降低内部的交易成本和管理成本,降低图书馆与外部伙伴之间的信息传递成本,从而提高图书馆的服务效益。
图书馆信息化应当坚持开放、共享的原则,避免在网络环境下新的重复建设。
数字图书馆与传统图书馆的区别
·研究探讨·241数字图书馆与传统图书馆的区别甘南州图书馆 王海艳【摘要】信息技术的迅速发展,带动和促进了图书馆数字化。
与传统图书馆相比,数字图书馆确实具有明显的优势,但与此同时,数字图书馆也面临不少问题。
如何针对数字图书馆的局限性,加强数字图书馆的管理,从而使数字图书馆的各种活动能规范、优质、高效的完成呢?【关键词】数字图书馆 传统图书馆 区别 管理互联网的迅速普及,对图书行业产生了重大影响,原本以图书、报纸为主体的传播平台有了革命性的创新,衍生出多种新的传播知识的方式,如网上图书馆、网络期刊室等等。
信息技术的迅速发展,为数字图书馆创造了所需的技术手段和设施,动和促进图书馆数字化。
与传统图书馆相比,数字图书馆具有许多优势。
但人们在对数字图书馆寄予厚望的同时,数字图书馆也面临着许多问题。
针对数字图书馆的局限性,如何加强数字图书馆的管理,从而使图书馆的各种活动能规范、优质、高效的完成呢?一、数字图书馆与传统图书馆的区别数字图书馆就是指利用互联网或其他网络为其馆藏品和服务作为主要渠道,向信息需求者提供数字化信息服务的图书馆。
传统图书馆是数字图书馆的母体,数字图书馆是在传统图书馆的基础上产生、发展的,是传统图书馆的分支、组成部分。
两者的区别主要体现在以下几个方面:1、服务方式不同。
传统图书馆的服务是以物理的图书馆为中心被动为读者服务,受时间和空间的限制,只能局限在一定的地区和在一定的时间段里为读者服务。
数字图书馆的服务渠道是互联网、无线互联网以及广电网,它服务的对象范围广、人数多,面向全球所有网民。
2、馆藏结构不同。
传统图书馆是以纸质载体为主,藏品历史悠久,种类丰富,经典众多,但藏品体积大,占用空间多,存储密度小。
数字图书馆的存储介质不限于印刷体,存储的载体有光盘、录音带和各种类型的数字化、电子化装置。
3、阅读方式不同。
数字图书馆的阅读方式称为电子式阅读,快捷、信息丰富、可交互性,但容易产生疲劳,不适合深度阅读。
信息时代 如何建设数字图书馆?
信息时代如何建设数字图书馆?经济全球化、社会信息化、企业信息化的浪潮,不仅加快了人类社会历史发展的进程,而且日益深刻地改变着人们的工作、生活和思维方式。
作为重要信息资源之一的图书馆,面临着全球信息化趋势的巨大冲击:以计算机技术、通信技术、网络技术以及多媒体技术为基础的网络环境逐渐形成,电子文件的大量产生和应用,使得图书馆的图文信息快速地向数字化方向发展。
传统图书馆最主要的职能是收藏,并在对所收藏的图书资料进行保存和组织的基础上为读者提供各种服务。
数字图书馆系统,是对有价值的图像、文本、语音、影像、影视和科学数据等多媒体信息进行收集,进行数字化处理、存储和管理,实施信息资源增值,并提供基于网络的电子存取服务。
此外,数字图书馆还涉及到知识产权、存取权限、数据安全等一系列管理问题。
传统图书馆数字图书馆的定义所谓的数字图书馆有四重含义:一是它不是一个图书馆,而是通过计算机网络连接在一起的图书组织机构群体。
二是数字图书馆中的信息不仅仅是图书,还应包括未归档的各类电子文件和图书、资料,甚至是采集于实物的信息,可以说是上述综合性的数字信息的完整集合。
三是数字图书馆不是封闭的图书馆信息网络,而是包含在办公自动化系统、计算机辅助设计和管理系统、公共信息数据管理系统等更为广阔的大系统中的一部分。
四是数字图书馆不是仅仅为图书管理服务,而是面向整个企业甚至社会提供服务。
数字图书馆示例数字图书馆将使图书信息与其它各类信息更为紧密地结合在一起,成为一个有机的整体,从而对信息处理的标准化、管理过程的一体化和服务对象的社会化等提出更高的要求。
概括的说,数字图书馆是建立在现代信息技术的普遍应用基础上,利用数字手段,以内容管理为核心,以海量信息处理、知识发现与加工交流为主要技术手段的智能知识服务基础平台,是运行在互联网上的、超大规模的、便于使用的、没有时空限制的知识中心。
说到数字图书馆,信息化建设当中首当其冲的便是教育行业。
无论是高等教育学院还是普教的中小学校,图书馆作为核心的信息资源收集和提供中心,扮演着数据信息平台的角色。
基于INTERNET信息视域下数字化图书馆建设的思考
图书 馆 是保 存 知识 和 传 播 知识 的场 所 , 人类 文 明 进 步 在 中 占有 举 足轻 重 的地 位 , 社 会 发展 不 可 缺 少 的知 识 宝库 。 是 图书 馆 作为 社 会 重要 的 信 息资 源 基 地 ,国 家信 息 基 础设 施 和 资 源 的 提供 者 , 信 息化 、 对 网络 化 浪 潮 的 冲击更 为敏 感 。随 着 现 代信 息技 术 的发 展 , 统 图 书馆 越 来越 不 能 满 足 知识 增 长 传
敏锐地意识到在图书馆馆藏 中使用数字存储技术的优越性。 他提出的“ 关联索引” 及其 富于创新性的计算机检索概念成为
6 年代 中后期 一 些 试验 性 示 范项 目探 索 的重 点之 一 。 0 就 数 字 化 图书 馆 的 概念 而 言 ,9 5年 的美 国联邦 信 息 与 19
应用项 目所用的定义是 :“ 数字图书馆是向用户群体提供便 于查找利用庞大的 、 经过组织的信息和知识存储的手段的系
的需求 ,传统图书馆保存文献的能力越来越相形见绌 ,传统
手段 管 理 的 图书 馆 也无 法 对 文 献进 行 深 层 信息 地 揭示 ,不 能
是探索数字 图书馆的基础构架 , 寻求最佳的信息 资源提供模
式 , 究 数 字 图 书 馆之 间交 互 操 作 的 协 议 。9 9 , 国 国会 研 16 年 美 图 书馆 正式 发行 M R I机 读 目录 , 是 图 书 馆 进入 自动化 A CI 这 的 标 志 。 9 5 , 国 图 书 馆 学 家 R W. hiin出 版 了 17 年 美 . C rt sa
纪 六 七 十 年 代 , 电 子 图 书 馆 思 想 贡 献 最 大 的 莫 过 于 对 JC R Lcl e, 在 16 年 完 成 的 图 书 馆 学 史 上 的 经 典 之 . . . i i r他 kd 95 作 —— 《 未来 的图 书馆 》 , 展 望 了2 0 年 的 图书 馆 , 中 不仅 00 而且
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图书馆与Internet的对比分析
作者:李颖
摘要:阐述了Internet资源利用方面存在的主要问题,通过Internet与数字图书馆的比较,指出数字图书馆在提供信息资源的技术方面优于Internet,展望了数字图书馆的发展前景。
关键词:数字图书馆;检索系统;信息资源技术中图分类号:G250.76
文献标识码:A
数字化革命和Internet的发展带来了经济、贸易、信息传播的全球化。
可是,Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出,据权威机构统计,网上约有数十亿的网页,并且这一数字还在不断增长,而如何有效利用如此庞大的信息技术的水平却远远落后于信息增长的速度。
而且,由于Internet上的信息资源很大程度上处于混乱无序状态,大大影响了信息利用的效率,从而造成对网上巨大信息资源以及网络互联和带宽的极大浪费。
1 Internet在资源利用上存在的主要问题(1)查找困难。
查找困难的根本原因在于信息仓储中的数字化信息缺乏良好的组织结构,这恰如一个没有合理的分类体系,不进行严格编目控制,缺乏统一的主题词表的图书馆,馆藏再丰富也无异于一座堆放资料的仓库。
(2)互操作问题。
Internet上的信息资源是由分布在各处的各种各样的信息仓储构成的,每个仓储都是一个相对独立的信息空间,具有各自的信息组织方式和处理方式,具有不同权限保护收费政策。
用户的信息需求往往也需要查询多个仓储才能满足。
在网络环境下,用户要了解每一个仓储的特性并掌握其检索技术,这无疑是一项沉重的负担。
(3)大规模分布数据的操作。
目前,Internet已成为一个全球的信息网络系统,网上的信息量达到了空前的规模,而且还在不断增长,它们广泛分布在网络的各个角落,在处理和检索这些网络信息时必须充分考虑信息的分布性和超大规模,于是在分布式数据集合上采用不同的方法进行检索也成为Web信息检索的一个重要挑战。
在过去的信息检索研究中,人们提出过多种不同的检索方法,例如,使用不同的检索模型、语言学资源、参数设置或不同的信息空间等方法得到的检索结果也各不相同。
而且每种方法不一定对每个查询都能起到最佳性能,有时得到的检索结果往往还具有很大的互补性。
尤其是在一个数据集合中对不同的数据子集分别进行检索时,这种互补现象尤其明显。
这时也需要通过对不同检索数据集合的结果合并,得到在整个数据集上的结果,并提交给用户。
这是分布式信息检索的一个必要而重要的环节。
最近,清华大学张敏等人提出了按位加权插入合并算法。
虽然这种方法在一定程度上突破了传统方法对分布数据集结果合并的综合效果总是低于使用集中数据集检索的性能局限,但不能从根本上改变在Internet中,由于海量数据的多样性和分布性所带来的大规模分布数据的操作所带来的一系列问题。
(4)搜索引擎的主要问题。
在信息多元化的发展趋势下,信息收录完备性、检全率、检准率、检索功能和用户检索界面等方面还存在许多不足。
搜索引擎发展的主要问题是信息收录的完备性不够、检全与检准都不理想,检索功能单一。
如何提高信息检索的检准率及完善和用户间的交互功能成为了搜索引擎的新问题。
(5)Internet网络拥堵。
中国互联网正在稳步发展,网民成倍增长,用户的上网时间也持续增加,于是用户上网时常常会碰到网络拥堵问题,原因是:用户分散在各个地方,他们随时会使用Internet,此时网络组件很难控制和处理这些流量到达的分布和大小,从而导致网络服务质量的下降。
2 数字图书馆技术的先进性
数字图书馆与目前的互联网相比,在提供信息资源技术上有很大的优势,具体有以下几方面:
2.1 资源内容的组织方式不同
数字图书馆的资源内容是按照用户需求挑选出来的具有高度价值的知识信息,它经过分类、编辑、整理、加工等方法,以受教育者易于接受的形式提供给用户,是一种有很大增值价值的、有序的知识库。
而Internet上的资源内容是无序的,上网信息的内容鱼龙混杂,良莠不齐。
数字图书馆将资源分为元数据库和对象数据库。
元数据是描述和管理对象数据的数据,对象数据是指数字化的文本、图片、声音、影像等数据。
元数据要集中在数字图书馆中心的超大规模的服务器上,对象数据库则分布式存放在各地的资源点内。
当用户查询时,中心高度系统通过元数据调度各个对象数据库中的数据供用户使用。
2.2 资源内容标引方法不同
目前,Internet上提供的信息资源有的也经过一定的标引,但标引深度以文献条目为主,大多数全文文献则是不经标引上网。
在有用户请求时由Internet搜索引擎按每种文献的前50~200进行关键词抽取,并与查询请求匹配得出结果,其查全率、查准率都有问题。
数字图书馆的资源标引则深入到文献内容,对每一数据对象使用标准通用置标语言/可扩展置标语言(SGML/XML)进行置标,并抽取元数据组织元数据库。
SGML/XML是信息处理的国际标准,是用来定义具有特殊目的的标记语言,它在文件的保护、交换、共用、整合、安全、扩展、长级等方面的应用都是其标准化所无法比拟的。
2.3 检索效果不同
数字图书馆由于进行了上述工作,使各资源库之间实现跨库无缝链接成为可能,只要采用合适的查询引擎及中间件,用户就能够通过浏览器方便、迅速地找到所需要的内容。
目前,数字图书馆大都采用分布式检索,在此系统中,图书馆服务器和各个对象服务器是分布式分布的,且各个服务器上的数据库要求可以是异构
的,数据对象被封装分布在各个服务器中,然后依据需求采用中间件来提供服务。
而Internet 上的信息网则不同,它没有经过加工、标引,各种资源杂乱无章,用户在检索信息时需要对一个个网站进行访问。
在使用检索引擎检索信息时,如同大海捞针一样,既慢又不全。
3 数字图书馆的发展前景
数字的信息化已经成为历史发展的必然趋势,而数字图书馆是未来图书馆发展的大趋势,从信息方面来讲,必然有数字存储海量化和信息的标准化两个方面。
Internet的无国界特性使得数字图书馆的合作空间无限扩大,全球性合作成为可能,并且逐步实现人才、技术、设施、资源等多方面的合作,在关键技术上互通有无,最终实现全球数字一体化。
参考文献[1]高文,刘峰.数字图书馆——原理与技术实现[M].北京:清华大学出版社,2003.[2]田捷.数字图书馆技术与应用[M].北京:科学出版社,2003.[3]秦曾复.关于数字图书馆的可持续发展问题[J].上海高校图书情报研究,2004(4):1-5.第一作者简介:李颖,女,1975年3月生,1995年毕业于浙江教育学院计算机应用专业,现为西安交通大学机电信息工程学院计算机应用专业2004级在读硕士研究生,助理馆员,浙江省丽水职业技术学院图书馆,浙江省丽水市北五宅底2号,323000。