07级讲义 第五章 跨库检索系统(修复)

合集下载

数据库系统概论(第五版)()演示文稿

数据库系统概论(第五版)()演示文稿
第30页,共95页。
删除模式(续)
[例3.4] DROP SCHEMA ZHANG CASCADE; 删除模式ZHANG 同时该模式中定义的表TAB1也被删除
第31页,共95页。
3.3 数据定义
3.3.1 模式的定义与删除 3.3.2 基本表的定义、删除与修改
3.3.3 索引的建立与删除
第32页,共95页。
/* 表级完整性约束条件,Sno是外码,被参照表是Student */
FOREIGN KEY (Cno)REFERENCES Course(Cno)
/* 表级完整性约束条件, Cno是外码,被参照表是Course*/
);
第36页,共95页。
2. 数据类型
❖ SQL中域的概念用数据类型来实现 ❖ 定义表的属性时需要指明其数据类型及长度 ❖ 选用哪种数据类型
课程号 Cno 1 2 3 2 3
成绩 Grade 92 85 88 90 80
第22页,共95页。
第三章 关系数据库标准语言SQL
3.1 SQL概述 3.2 学生-课程数据库 3.3 数据定义 3.4 数据查询 3.5 数据更新 3.6 空值的处理 3.7 视图 3.8 小结
第23页,共95页。
[例3.2] CREATE SCHEMA AUTHORIZATION WANG; 该语句没有指定<模式名>,<模式名>隐含为<用户名>
第27页,共95页。
定义模式(续)
❖ 定义模式实际上定义了一个命名空间。 ❖ 在这个空间中可以定义该模式包含的数据库对象,
例如基本表、视图、索引等。 ❖在CREATE SCHEMA中可以接受CREATE
❖ SQL采用集合操作方式

4.1 CNKI(07版)

4.1 CNKI(07版)

4.1中国知网4.1.1 简介1996年底,由中国电子杂志社研制出版了《中国学术期刊(光盘版)》,它是我国第一部集成化全文电子期刊数据库。

随着通信技术、数据存储技术的提高,由清华同方光盘股份有限公司、光盘国家工程研究中心、中国学术期刊(光盘版)电子杂志社和清华同方光盘电子出版社联合承担建设中国知识基础设施工程(China National Knowledge Infrastructure,简称CNKI),于1999年6月在CERNET上开通了中心网站(),在CHINANET上开通了第二中心网站(),并且在许多图书馆和图书情报单位建立了镜像站点。

中国矿业大学就建立了一个镜像站点,校园网上任何一台计算机都可以很方便地进行检索。

本校用户可以通过中心网站或镜像站点去访问,极大地提高了速度和效率。

在取得《中国学术期刊(光盘版)》和《中国期刊网》的成功之后,CNKI工程集团又建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台。

2012年,中国知网(CNKI)推出全新改版新平台——KDN 知识发现网络平台,该新平台集成千万种期刊、学位论文、会议论文、报纸、工具书、年鉴等各种文献类型。

4.1.2 产品介绍目前,知识发现网络平台(简称KDN)提供的学术资源主要集中于以下几个数据库:以下几个数据库内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域。

根据文献特点,按照学科领域分为10大专辑:基础科学、工程科技Ⅰ、工程科技Ⅱ、农业科技、医药卫生科技、哲学与人文科学、社会科学Ⅰ、社会科学Ⅱ、信息科技、经济与管理科学。

10大专辑下分为168个专题分类。

(1) 中国学术期刊网络出版总库该数据库是目前世界上最大的连续动态更新的中国学术期刊全文数据库,截止至2013年1月,收录国内7940多种重要学术类期刊。

(2) 中国博士学位论文全文数据库该数据库收录年限为1984年至今,每年收录全国985、211工程等重点高校,中国科学院、社会科学院等研究院所的博士学位论文。

文献信息检索基础知识

文献信息检索基础知识
索书号
1=Biblioteka 主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 主题词:表达文献主题概念的词叫主题词 。当使用主题词来表达文献内容特征时叫主题标引(标识)。 主题语言的优点: 直观 符合人的辩识习惯 专指性强 主题词标识经过严格的规范化处 理,查准率高。 灵活 词与词的概念组配揭示文献中各种主题。 集中性 将不同学科的同一主题文献集中在一起。 例如有关“鲁迅”的文献资料,分类法将其 分散在文学、艺术、文化、历史各个门类 查找费时,而主题法在“鲁迅”标题下,直接 反映出全部有关“鲁迅”的文献资料。
3种逻辑关系的区别
逻辑算符
AND(与)
OR(或)
NOT(非)
检索式
A AND B A * B
F250 物资经济理论 F251 物资管理 F252 物资流通 F253 物资企业 经营与管理 F259 世界各国 物资经济
F251.1 物资管理 体制 F251.2 物资计划 F251.3 物资统计
分类号
类名
+
类目
F251.3 /1 或F251.3 “1”种次号
信息的基本属性
二、基本概念: 1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征 。
知识性或客观性 记录和传播性
目录
CONTENTS
01
信息存储
Add a title
02
Add a title
一次文献:论文等 二次文献:目录、文摘、索引 三次文献:字词典、百科、年鉴
《汉表》 主表的著录格式(例2) Tian zhu ren 天竺人 Sindus; Sindhus “用”项 Y 古印度人 词族索引(例3) 族首词 法(法律) * 一级下位词 . 国际法 04LA 二级下位词 . .国际公法 三级下位词 . . .海洋法

起重工07.讲义

起重工07.讲义

—一.判断题(共8题)1. 《特种设备安全监察条例》规定:特种设备包括其附属的安全附件、安全保护装置。

(B )错误正确★检查答案标准答案:正确2. 调查事故发生前设备的状况,查阅原始档案、技术资料、现场记录是事故调查组应当履行的职责。

(B)错误正确★检查答案标准答案:正确3. 检验前,使用单位应当将起重机械主要受力部件、主要焊缝、严重腐蚀部位, 以及检验人员指定部位和部件清理干净,露出金属表面。

(B)错误正确★检查答案标准答案:正确4. 特种设备检验检测机构和检验检测人员对涉及的被检验检测单位的商业秘密,负有保密义务。

(B)错误正确★检查答案标准答案:正确5. “事故造成的人员伤亡、设备损坏程度和直接经济损失”是事故调查报告内容之一。

(B)错误正确★检查答案标准答案:正确6. 参加特种设备作业人员考试的人员,必须向考试机构提交县级以上医院体检证明,其他的证明方式无效。

(A)错误正确★检查答案标准答案:错误7. 起重机械的改造,是指改变原起重机械主要受力结构件、主要材料、主要配置、控制系统,致使原性能参数与技术指标发生改变的活动。

(B)错误正确★检查答案标准答案:正确8. 凡是在《特种设备安全监察条例》规定的范围内的起重机械其施工均需监督检查。

(A)错误正确★检查答案标准答案:错误9. 额定起重量小于25t的吊钩,检验载荷为2倍额定起重量为载荷。

因此,吊钩允许超载使用。

(A)错误正确★检查答案标准答案:错误10. 桥式起重机的两项基本参数是起重量与跨度。

(A)错误正确★检查答案标准答案:错误11. 专用手势信号适用于指挥载人电梯设备的吊运。

(A)错误正确★检查答案标准答案:错误12. 总电源短路保护装置应由熔断器和断路器来完成。

(B)错误正确★检查答案标准答案:正确13. 圆盘形起重电磁铁,用于吊运钢板、钢条、钢管及型钢等。

(A)错误正确★检查答案标准答案:错误14. 控制器应操作灵活、零位手感明确及档位清楚。

数据库系统概论(第5版)复习备考资料.doc

数据库系统概论(第5版)复习备考资料.doc

、数据库系统概述数据是数据库中心储的基木对彖。

记录是计算机中衣示和存储数据的一种格式或-种方法。

数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。

数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种川户共享。

数据弃管理系统(DBMS)和操作系统一样是计算机的基础软件,具有如下主要功能:1.数据定义功能;2.数据组织、储存和管理;3.数据操作功能;4.数据库的事务管理和运行管理;5.数据库的建立和维护功能;6.其他功能。

数据库系统(DBS)是由数据库、数据库管理系统(及其应用开发软件)、应用程序和数据库管理员纽•成。

数据管理三个阶段数据库系统实现整体数据的结构化。

数据库管理系统有以下数据控制功能:1)数据安全性保护;2)数据完整性检査:3)并发控制;4)数据库恢复。

数据模型也是一种模型,它是对现实壯界数据特征的抽象,即数据模型是用来描述数据、组织数据和对数据进行操作的。

数据模型分类:概念模型、逻辑模型和物理模型。

逻辑模型主要包括:层次模型、网状模型和关系模盘。

唯-•标识实体的属性集称为码;用实体名及其属性名集合来抽象和刻画同类实体,称为实体性。

实体之间的联系有一-对一、一对多和多对多等多种类型。

实体•联系方法用E-R图描述,E-R方法也成E-R模型。

数据模型通常山数据结构、数据操作和数据的完整性约朿条件三部分组成。

层次模型是数据库系统中域早出现的数据模型。

关系模型是最重要的-•种数据模型,每个关系的数据结构是一张规范化的二维表。

关系模型:对关系的描述,要求关系必须是规范化的。

关系的完整性约束条件包括三犬类:实体完整性、参照完整性和用户定义的完整性。

操作对彖和操作结果都是关系。

在数据模型中有“型”和“值”的概念。

模式是数据库中全体数据的逻辑结构和特征的描述。

数据廂系统的三级模式结构是指数据廂系统是山外模式、模式和内模式三级构成。

一个数据库只冇一个模式,也只冇一个内模式。

4.1 CNKI(07版)

4.1 CNKI(07版)

4.1中国知网4.1.1 简介1996年底,由中国电子杂志社研制出版了《中国学术期刊(光盘版)》,它是我国第一部集成化全文电子期刊数据库。

随着通信技术、数据存储技术的提高,由清华同方光盘股份有限公司、光盘国家工程研究中心、中国学术期刊(光盘版)电子杂志社和清华同方光盘电子出版社联合承担建设中国知识基础设施工程(China National Knowledge Infrastructure,简称CNKI),于1999年6月在CERNET上开通了中心网站(),在CHINANET上开通了第二中心网站(),并且在许多图书馆和图书情报单位建立了镜像站点。

中国矿业大学就建立了一个镜像站点,校园网上任何一台计算机都可以很方便地进行检索。

本校用户可以通过中心网站或镜像站点去访问,极大地提高了速度和效率。

在取得《中国学术期刊(光盘版)》和《中国期刊网》的成功之后,CNKI工程集团又建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台。

2012年,中国知网(CNKI)推出全新改版新平台——KDN 知识发现网络平台,该新平台集成千万种期刊、学位论文、会议论文、报纸、工具书、年鉴等各种文献类型。

4.1.2 产品介绍目前,知识发现网络平台(简称KDN)提供的学术资源主要集中于以下几个数据库:以下几个数据库内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域。

根据文献特点,按照学科领域分为10大专辑:基础科学、工程科技Ⅰ、工程科技Ⅱ、农业科技、医药卫生科技、哲学与人文科学、社会科学Ⅰ、社会科学Ⅱ、信息科技、经济与管理科学。

10大专辑下分为168个专题分类。

(1) 中国学术期刊网络出版总库该数据库是目前世界上最大的连续动态更新的中国学术期刊全文数据库,截止至2013年1月,收录国内7940多种重要学术类期刊。

(2) 中国博士学位论文全文数据库该数据库收录年限为1984年至今,每年收录全国985、211工程等重点高校,中国科学院、社会科学院等研究院所的博士学位论文。

数据库系统概论(第四版)_王珊_萨师煊_chp1

数据库系统概论(第四版)_王珊_萨师煊_chp1

用户
用户
应用系统
应用开发工 具
数据库管理系 统
数据库管理员
操作系统
数据库
数据库系统
An Introduction to Database Systems
1.1 数据库系统概述
1.1.1 四个基本概念
1.1.2 数据管理技术的产生和发展
1.1.3 数据库系统的特点
An Introduction to Database Systems
例如 93是一个数据
语义1:学生某门课的成绩 语义2:某人的体重 语义3:某个年级的学生人数 语义4:请同学给出。。。
An Introduction to Database Systems
数据举例
学生档案中的学生记录
(李明,男,197205,江苏南京市,计算机系,1990)
语义:学生姓名、性别、出生年月、籍贯、所在院系、
数据管理技术的产生和发展(续)
数据管理技术的发展动力
应用需求的推动
计算机硬件的发展
计算机软件的发展
An Introduction to Database Systems
一、人工管理阶段
时期
20世纪40年代中--50年代中
产生的背景
应用需求 硬件水平 软件水平 处理方式 科学计算 无直接存取存储设备 没有操作系统 批处理
An Introduction to Database Systems
数据结构化
整体数据的结构化是数据库的主要特征之 一 整体结构化
不再仅仅针对某一个应用,而是面向全组织 不仅数据内部结构化,整体是结构化的,数据之间具 有联系
An Introduction to Database Systems

12章-数据库管理系统-数据库系统概论(第五版)

12章-数据库管理系统-数据库系统概论(第五版)

第12章数据库管理系统本章进一步阐述数据库管理系统的基本功能、系统结构及主要实现技术。

本章不是针对数据库管理系统的设计人员写的,而是面向数据库管理员和数据库应用系统开发人员的,目的是使他们从宏观和总体的角度掌握数据库管理系统的基本概念和基本原理,以便更好地使用和维护数据库管理系统。

12.1数据库管理系统的基本功能数据库管理系统已经发展成为继操作系统之后最复杂的系统软件。

前面已讲过,数据库管理系统主要是实现对共享数据有效的组织、存储、管理和存取。

围绕数据,数据库管理系统应具有如下基本功能。

1.数据库定义和创建创建数据库主要是用数据定义语言定义和创建数据库模式、外模式、内模式等数据库对象。

在关系数据库中就是建立数据库(或模式)、表、视图、索引等,还有创建用户、安全保密定义(如用户口令、级别、角色、存取权限)、数据库的完整性定义。

这些定义存储在数据字典(亦称为系统日录)中,是数据库管理系统运行的基本依据。

2.数据组织、存储和管理数据库管理系统要分类组织、存储和管理各种数据,包括数据字典、用户数据、存取路径等。

要确定以何种文件结构和存取方式在存储器上组织这些数据,以及如何实现数据之间的联系。

数据组织和存储的基本目标是提高存储空间利用率和方便存取,提供多种存取方法(如索引查找、hash查找、顺序查找等)以提高存取效率。

3.数据存取数据库管理系统提供用户对数据的操作功能,实现对数据库数据的检索、插入、修改和删除。

一个好的关系数据库管理系统应该提供功能强且易学易用的数据操纵语言、方便的操作方式和较高的数据存取效率。

数据操纵语言有两类:宿主型语言和自立(独立)型语言。

4.数据库事务管理和运行管理这是指数据库管理系统的运行控制和管理功能,包括多用户环境下的事务管理功能和安全性、完整性控制功能;数据库恢复、并发控制和死锁检测(或死锁防止)、安全性检查和存取控制、完整性检查和执行、运行日志的组织管理等。

这些功能保证了数据库系统的正常运行,保证了事务的ACID特性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章跨库统一检索系统第一节异构数据库跨库检索系统的概述第二节异构数据库跨库检索系统的原理与功能第三节数字资源整合利用的相关技术和发展第四节异构数据库跨库检索系统的使用简介第五节数字资源整合的需求和问题第六节其它商业数据库的跨库检索系统第一节异构数据库跨库检索系统的概述1.1 开发异构数据库跨库检索系统的背景数字图书馆服务面广,不受时间、空间的限制,只要与网络连接,读者就可以在任何地点,任何时间进入数字图书馆存取、检索、浏览网上信息。

当前,数字信息资源已成为图书馆信息资源体系中的重要组成部分,有着印刷型资源无可替代的作用。

数字信息资源作为一种新型的信息资源,具有数据量大、内容丰富、形式多样、出版更快、检索界面友好、使用方便等特点,近年来发展迅猛,日益受到人们的青睐。

为此,许多高校图书馆大力发展数字化资源馆藏,其电子、网络馆藏比重越来越大,电子网络资源已成为高校图书馆必不可少的信息来源和重要组成部分,为广大读者提供了丰富的知识来源。

但数字资源种类多样,格式各异。

因此,将数字信息资源集成是数字图书馆建设和研究的重要内容之一。

1.2 为什么要开发异构数据库跨库检索系统?图书馆购买了大量的国内外数据库资源和多媒体资源,而这些资源往往采用不同的检索方式和专用浏览器。

许多数据库检索项都不统一,比如“作者”,有的数据库又叫“责任者”,文章“题目”,有的叫“题名”,有的叫“篇名”等等,读者必须学习不同的数据库检索方式,还必须下载安装不同的浏览器,必须学会不同数据库的使用方法。

数据库越来越多,就是图书馆参考咨询人员往往也只能熟练运用某几个数据库资源,很难弄清所有数据库的使用细节,读者就更没有办法了。

图书馆的数字资源由不同的商家提供,没有统一的格式和标准,人为地设置了一些障碍,造成对读者信息素养培养的困难。

大量数字文献资源的出现,不仅仅给图书馆在资源建设和组织管理上带来冲击,同时还要求图书馆采用先进技术构建一种全新的文献信息服务环境来满足不断扩张的用户需求。

用户对资源缺乏足够的认识,读者若想获得全面而准确的信息往往需要依次进入各个电子资源的搜索界面进行搜索,并且要对各个数据库的检索平台和搜索规则有足够的认识,方可获得所需的信息。

如果用户对资源缺乏足够的认识,对系统不熟悉,而且各个系统都要进行登录和认证,这就给用户检索利用数字资源带来极大不便。

针对数字资源自身存在的这种缺陷,我校图书馆开发了异构数据库统一库检索平台(以下简称跨库检索)。

1.3 开发异构数据库跨库检索平台目标图书馆购置的大量数字资源都是以孤岛的形式存在,用户必须分别进入到各个系统中查找资源。

每种资源的用户界面和检索规则各异,用户需要逐一熟悉,对用户而言这是既费时又费力的事情。

用户期望能够通过统一界面,方便快捷地检索到图书馆的所有分布式资源(书目、图像、档案资源、电子图书、电子期刊和会议录等),随着图书馆提供电子资源及相关服务的增多, 人们希望能够将这些资源与服务整合在一起, 实现跨平台的无缝链接, 使用户用一个检索指令在一个统一的界面上一次查得所需文献或信息。

希望图书馆提供一步到位的服务(one step services)。

总的目标是实现数字资源的统一管理和有效利用。

第二节异构数据库跨库检索系统的原理与功能2.1 基本原理异构数据库跨库检索系统是一个用于同时调用多个数据库和搜索引擎进行资料检索的软件系统,它可以帮助用户同时在多个数据库中进行检索,并同时得到多个数据库的检索结果,避免了需要逐个登录数据库、输入检索条件的麻烦,使用方便、快捷,使用户觉得就像在使用一个数据库一样。

异构数据库统一检索系统使读者可以在一个界面内对多个数据源同时进行检索,数据源包括电子期刊、电子图书、网页资源等,是一个实现资源整合的系统。

异构数据库跨库检索系统的工作原理是:当用户提出检索请求后,其请求被交给服务器端的用户代理程序。

用户代理程序针对不同的数据库,将用户请求转化为符合其规定的格式,再利用多线程机制,将请求发送到各数据库。

在得到数据库的返回结果后,用户代理程序再将不同数据库的结果转化为统一的格式,并发送到浏览器端显示给用户。

即:异构数据库跨库检索系统实际上为一个中间代理应用程序,首先接受客户端的数据请求,然后将这些请求转换成不同的格式发送到各个相应的数据库接口,再将各个数据库返回的记录进行处理并以统一格式输出。

异构数据库跨库检索系统目前支持40个国内外常用的数据库,并且在不断的增加,我们也可以根据用户的实际需求来提供定制服务。

主要功能和技术特点异构数据库跨库检索系统包括统一检索门户、IP地址认证、站点封装、内容抽取、实现对异构数据源的检索、定制和管理。

异构数据库跨库检索系统对用户实行IP地址认证。

异构数据库跨库检索系统通过多线程机制来提供优秀的并发访问性能。

采用了对检索结果先出来先显示的机制,达到快速响应的目的。

异构数据库跨库检索系统是可以实现对多个异构数据库的统一搜索、结果整合、管理。

异构数据库跨库检索系统支持各类常用网络数据库和用户自定义新增网络数据源的检索。

异构数据库跨库检索系统提供检索结果中更深层的链接功能。

主页面提供数据库导航功能。

第三节数字资源整合利用的相关技术和发展图书馆从提供服务的角度出发,希望分布环境下图书馆新一代的管理平台具备数字资源整合的功能:1)可以同时检索本地和远程资源;2)可以检索多种类型的数字资源;3)可以检索不同平台、不同结构的资源;4)可以实现对文献的多方位链接(文摘、全文、OPAC、网络资源等)。

3.1 现有的整合系统目前,国内外至少有几十种针对分布环境下数字资源整合管理的软件。

比较典型的有:1)以色列 Exlib公司/ Metalib with SFX(40+180)Metalib系统是由ExLibris 公司推出的电子信息资源整合系统,提供多种数据库统一检索界面,并可直接链接到电子全文。

Metalib 是当前用户最多的一个跨库检索系统,目前国内有此系统的用户比较少。

SFX 向人们展示了一种新的图书馆电子馆藏的管理模式,使图书馆各类复杂的数据和信息之间的关联变成简单的链接。

它不仅能完成从二次文献到全文的链接,还能实现从文摘到文摘、全文到全文(从全文后面的参考文献到相关全文)的链接,使图书馆所有的Web资源形成完全融合的整体。

Metalib 的共同关联引擎(Universal Gateway)允许使用者一次检索数个异构数据库系统,可整合并剔除重复的纪录,也可根据检索结果作更精确的查询或进行相关文献的查询。

另外,也允许使用者直接连结至个别资料库检索MetaLib通过对知识库(KB)的配置实现对分布资源的整合利用,主要模快包括:•通用网关(Universal Gateway)•资源存储(ResourceStore)•个性化和用户管理•(Personalization and User Administration)•扩展服务(SFX支持)(Extended Services)其中的关键技术是通用网关和SFX。

Metalib/通用检索网关—通过对知识库(KB)配置实现。

2)美国Innovative公司/ MAP(26)MAP(Millennium Access Plus)是Innovative Interfaces 公司的一种数据库资源整合方案,对图书馆电子资源的管理使用提供了完善的解决方案。

MAP 通过WebPAC 的搜索功能及Innopac Millennium版的管理模块将馆内的各类型的电子资源整合到一套资源存取管理工具中。

其MetaFind提供图书馆就其订阅的数据来源进行一次搜寻所有资源的功能,在统一的检索接口中获得查询结果并可直接连结至数据所在。

支持之通讯协定包括Z39.50、HTTP以及SQL等多种通讯协定。

3)美国Endeavor公司/ENCompass and LinkFinderPlus(24)4)上海金鑫计算机公司的跨库检索组件5)南京大学图书馆网络数据库一站式检索系统6)TRS数字图书馆资源整合门户清华同方的异构统一检索平台是用ASP开发的,南京大学图书馆网络数据库一站式检索系统是用PHP开发的,上海金鑫计算机公司的跨库检索组件是用JA V A开发的。

3.2 数字资源整合的方法和技术整合利用的基本思路:基于Webservice 的跨库检索系统。

WebserviceDCOM/CORBA 等分布式计算体系的发展,其使用基于XML 的SOAP 协议作为平台无关的通讯机制,通过UDDI 进行定位。

定位在异构数据库上的资源整合利用,最根本的是解决异构系统之间的互操作问题。

目前的研究思路可归纳为两种:第一种:把注意力放在信息源上,也就是通讯协议上。

异构数据库统一检索的理想实现需要各个数据库提供商提供统一的Webservice 数据库检索服务。

这种方法要求资源提供方进行一些技术层面的投入,在短时间内难以全面实现。

Webservice 提供了解决跨库检索问题的基本框架,但只有各个数据库提供者提供符合统一标准的信息检索服务,才能实现跨库检索功能。

为此,我们分析了现有的多种数据库及一些元数据标准,提出了一个标准的检索服务框架,主要定义了搜索服务的输入输出标准及出错处理机制。

各个数据库均可据此框架发布标准的Webservice 检索服务。

目前我们已经做了一个数据库接口标准协议在IETF上发布。

第二种:以承认信息源的差异为前提,开发一种能够适应不同检索模式的通用检索网关。

需要服务提供者做技术层面的投入。

这是目前唯一的解决方式,由于供应商的数据库对我们来讲是一个黑箱,数据库供应商只是提供了检索接口,我们只能得到数据库的页面,这是基于页面分析的方法,通过对获得的检索页面进行分析,从中抽取检索到的数据库记录。

第四节异构数据库跨库检索系统的使用简介4.1数据库导航对于不了解各数据库属性的用户而言,异构数据库跨库检索系统通过按中文数据库学科分类导航或按西文数据库学科分类来选择数据库,为用户自动选择数据库导航。

例如:选中中文数据库的“工业技术”学科分类,系统会自动选中该学科分类下的超星图书、维普期刊、中国期刊网、万方期刊、万方学术会议论文(中文版)、万方学术会议论文(英文版)、INNOPAC(馆藏检索)数据库(见图1)。

每个数据库中的下拉列表的名称是从所选数据库的检索点中汇集的共性检索点,选择不同数量的数据库,下拉列表中所显示的检索项名称有可能不同。

注意:选择多个数据库时,在检索词的输入框中要输入与多个数据库检索点相对应的检索词,检索词中不支持表达式或多词组合,均按一个词处理。

检索结果默认原数据库检索结果的相关度和排序。

图1点击“清除选择”按钮,可以清除已经选择过的数据库。

点击“选择全部数据库检索”按钮,可以一次选中所有的数据库。

相关文档
最新文档