异构数据库跨库检索技术综述
基于元搜索引擎的异构数据检索系统研究

用户 界面模块 数 据处 理槿块 崔据j 代坪模块 i 4 [
于 跨厍检 索理论 上存 在两 种观点 : 种观 点认 为 是 以多 个分 布式 一 异构数据 源为对 象的 检索 系统 ; 一种观 点认 为跨 库 检 索从 原理 另
上说是一 种元搜 索引 擎( t er E g e, 是元搜 索引擎 的检 Me Sae ni )但 a h n 索对 象仅 为网 页和 网 站 。 包 括 网络 数据 库 , 不 因此 国外 把它 归 为 搜索引 擎。笔者较 认 同第 二种观 点 , 为元搜 索 引擎 所 要达 到 的 因 主要 目的就是要 增加 覆盖 率和 实现 界面 的统 一 , 而跨 库检 索 的 目
种基 于元搜 索引擎的跨 库检 索模 型; 讨了跨库检索 系统的数据整合难点 , 出标 准问题 的至关重要, 探 提 F _。 - 跨库检 索 元搜 索引擎
身 并不 处理检 索 式 , 而是 按照 各个成 员搜 索 引 擎的 查 询格 式作相 应 的 转换之后 再分 派到各 个成 员搜 索引 擎 , 这样 可 以 比较简 洁 高 效 地 实现异构 数据 库的透 明访 问 。如图 2 示 : 户通 过用 户 界 所 用
面向 系统发 出查询请 求 ; 对用 户的检 索 式进 行规 范 并选 择 合适 的 数 据 库 ; 用并 行的 方 式将 检 索 式传 递 给搜 索 引擎 ; 检索 式 转 使 将
化 为 具 体搜 索引 擎 的 查询 格 式 , 然后 交 给相 应 的搜 索 引擎 , 集 收 搜 索 引 擎返 回 的结 果 ; 返 回的 检索 结 果进 行 处理 , 过用 户 界 将 通
李 雅 琼
( 京 政 治 学 院 上 海 分 院 军事 信 息 管理 系 上海 2 0 3 ) 南 04 3
图书馆电子资源整合技术

取 方 便 性 和 获 取 效 率 。 目前 应 用 的 技 术 主 要 有 链 接 访 块 。大大 浪费 系统资 源 。
. 问技术 、异构 数据 库跨 库检 索技 术 、知识发 现 等几 种 12 动 态链 接 技 术
图书馆拥 有众 多 电子 资源 .但 电子资 源异 构性 和 类 型 电子 资 源 的整 合 ,在 MA RC记 录里 增 加 8 6字 5 分 布性 给读 者的检 索 和利用 带来 了诸 多不便 ,对 众 多 段 ( 电子 资源 地址 与存 取”字 段 ) “ .用 于记 录被著 录 的 电子 资源 .采用 技术 整合 实现 统一 检索 是发展 的趋 的 电子资 源的存 取地 址 和存取方 式 。这种 技术 实现 起 势 ,整 合能 提高 电子资 源公 共获 取效率 ,而技术 是 实 来 比较简单 ,但 局 限性很 大 。使 用静 态链 接可 以节 省
现整合 的基 础 。对 众多 自主的 、异构 的乃 至分 布式 的 不 少 内存 和磁 盘 空 间 。但 是 ,它 还 是 有 些 固有 的 缺
电子资 源 ,采 用各 种整 合技 术实 现一体 化 集成 ,让 读 点: 是静 态库 也 需要 定 期 维护 和 更新 ,否 则链 接 对 一
者 在 统 一 的透 明 界 面 下 ,实 现一 步 到位 的 检 索 和 使 象 的细微变 化都 会 引起链 接 的失效 。二是 如果 有几 十
类 型
动 态 链 接 是 指 在 读 者 需 要 链 接 时 根 据 一 定 规 则 计
算 链 接路径 并进 行链 接 。共享 库( 动态 链 接文件 ) 一 是
07级讲义 第五章 跨库检索系统(修复)

第五章跨库统一检索系统第一节异构数据库跨库检索系统的概述第二节异构数据库跨库检索系统的原理与功能第三节数字资源整合利用的相关技术和发展第四节异构数据库跨库检索系统的使用简介第五节数字资源整合的需求和问题第六节其它商业数据库的跨库检索系统第一节异构数据库跨库检索系统的概述1.1 开发异构数据库跨库检索系统的背景数字图书馆服务面广,不受时间、空间的限制,只要与网络连接,读者就可以在任何地点,任何时间进入数字图书馆存取、检索、浏览网上信息。
当前,数字信息资源已成为图书馆信息资源体系中的重要组成部分,有着印刷型资源无可替代的作用。
数字信息资源作为一种新型的信息资源,具有数据量大、内容丰富、形式多样、出版更快、检索界面友好、使用方便等特点,近年来发展迅猛,日益受到人们的青睐。
为此,许多高校图书馆大力发展数字化资源馆藏,其电子、网络馆藏比重越来越大,电子网络资源已成为高校图书馆必不可少的信息来源和重要组成部分,为广大读者提供了丰富的知识来源。
但数字资源种类多样,格式各异。
因此,将数字信息资源集成是数字图书馆建设和研究的重要内容之一。
1.2 为什么要开发异构数据库跨库检索系统?图书馆购买了大量的国内外数据库资源和多媒体资源,而这些资源往往采用不同的检索方式和专用浏览器。
许多数据库检索项都不统一,比如“作者”,有的数据库又叫“责任者”,文章“题目”,有的叫“题名”,有的叫“篇名”等等,读者必须学习不同的数据库检索方式,还必须下载安装不同的浏览器,必须学会不同数据库的使用方法。
数据库越来越多,就是图书馆参考咨询人员往往也只能熟练运用某几个数据库资源,很难弄清所有数据库的使用细节,读者就更没有办法了。
图书馆的数字资源由不同的商家提供,没有统一的格式和标准,人为地设置了一些障碍,造成对读者信息素养培养的困难。
大量数字文献资源的出现,不仅仅给图书馆在资源建设和组织管理上带来冲击,同时还要求图书馆采用先进技术构建一种全新的文献信息服务环境来满足不断扩张的用户需求。
异构数据融合中的跨平台数据集成技术研究

异构数据融合中的跨平台数据集成技术研究摘要:随着信息技术的迅猛发展,异构数据融合成为了一个重要的研究领域。
在现实生活中,我们面对着大量异构数据,这些数据来自不同的平台、不同的系统、不同的格式。
如何将这些异构数据进行集成,成为了一个重要而具有挑战性的问题。
本文将对跨平台数据集成技术进行深入研究,分析其现有问题,并提出一种高效且可行的解决方案。
1. 引言随着互联网和大数据时代的到来,各种信息系统和平台迅速发展起来。
这些系统和平台中存在着大量异构数据,如何实现这些异构数据之间的有效集成已经成为了一个亟待解决的问题。
2. 异构数据融合中存在问题2.1 数据格式不一致在不同系统和平台之间存在各种各样的文件格式和数据库格式。
这导致了在进行跨平台集成时需要面临格式转换、兼容性等问题。
2.2 数据语义差异在不同系统和平台之间存在着语义差异,即相同含义下使用不同的术语和标准。
这导致了在进行数据集成时需要进行语义映射和转换,增加了数据集成的复杂性。
2.3 数据质量差异不同系统和平台之间的数据质量差异也是进行数据集成时需要面临的问题。
不同系统之间可能存在着数据冗余、不一致等问题,这需要在集成过程中进行数据清洗和处理。
3. 跨平台数据集成技术研究3.1 数据格式转换技术为了解决不同系统和平台之间的格式差异问题,可以使用一些格式转换技术。
例如,可以使用XML、JSON等通用格式来表示异构数据,并通过解析器将其转换为目标系统所需的格式。
3.2 语义映射技术为了解决语义差异问题,可以使用一些语义映射技术。
例如,可以使用本体论来描述不同系统中的概念,并通过本体匹配算法来实现跨平台之间概念的对应。
3.3 数据清洗与处理技术为了解决数据质量差异问题,可以使用一些数据清洗与处理技术。
例如,可以通过规则匹配、异常检测等方法对原始数据进行清洗和处理,提高其质量。
4. 跨平台数据集成技术应用案例4.1 跨平台数据集成在电商行业的应用在电商行业中,存在着大量的异构数据,如商品信息、用户信息等。
异构数据库

异构数据库的跨库检索技术综述1.引言近几年,图书馆通过引进和自建数据库,已使电子资源的建设具有相当规模,电子文献在文献服务中所占的比重也不断增加。
在继续加强电子资源建设的同时,图书馆开始更加关注电子资源的管理工作,整合已有的资源,将不同类型、不同结构、不同环境、不同用法的各种异构数据库纳入统一的检索平台,以便于用户更方便、更高效地获取信息。
2.数据库的异构特征图书馆要整合的数据库主要包括:书目数据库(OPAC)、题录/文摘数据库、全文数据库、电子期刊和电子图书、相关的WEB网站等。
这些数据库分布在不同的服务器,由不同的信息服务公司和出版社提供、或由图书馆自建,成为各具不同特性的异构数据库,其异构特征表现为以下几个方面:2.1 数据模型的异构分层次、网状、关系和面向对象4种。
2.2 数据结构不同如ORACLE与Sybase数据库物理模型异构、数据结构不同,而有些数据还是半结构或非结构的。
2.3 系统控制方式不同有集中式与分布式。
2.4 计算机平台的异构从巨、大、中、小型机到工作站、PC。
2.5 通信协议的不同有Z39.50、HTTP及非标准等。
2.6 通信结构模式的不同有主从结构、客户机/服务器模式、浏览器/服务器模式。
2.7 操作系统的异构有UNIX、NT、OS/2、Apache、Sun Solaris、Linux等。
2.8 网络的异构有LAN、WAN、以太总线结构与令牌环结构等。
3.异构数据库连接与存取的相关技术面对当前信息资源和网络环境的复杂性,要实现异构数据库的跨库检索,传统的DBMS (数据库管理系统)已经很难解决。
近几年许多新的相关技术相继推出,综合应用这些技术可进行异构数据库之间的连接和数据转换,接受用户对些数据库的并行交叉访问和查询,对查询结果进行融合处理并反馈给用户端。
纵览近年来的进展,主要包括以下相关技术:3.1 公共网关接口技术CGI利用CGI可实现Web与数据库的连接,CGI(Common Gateway Interface)是最早的Web 程序设计方式,它提供一个外部应用程序与Web服务器交互的标准接口,遵循CGI标准编写的Web服务器端的可执行程序称为CGI程序。
跨库检索技术在数据库建设中的应用研究

下十 分流行 的跨 库搜 索 引擎 G O. E做 了 咩细 的 O( L
比较 ,n 系统在 检索 范 和检 索结 果输 出及其 单 T
资 源库跨 库 “ 无缝链 接” 即 凑耆在 浏览某个 资 条 } 录的处理 时间等 方面都具 备 r很强 的竞 争力 、 , 己
设 计思 想 、 的软件功能模块 卜 新 体现 。
不断 上升 , 即使在 一软件建立 的数据库, 由于底层
在系统的个性化特点疗面 ,随着各种 电子 资源 数据库 结构不同 , 或者数据库 宁段名称 的不同 , 都导 的增加和网上资源 的发展 , 资源整合 、 用户个性 化界 致库 与连接的不畅通。 举个简 单的例子 , 如科研 成果
面成为图书馆 自动化集成系统 的又一发展趋势 。为 可 以查看所有的资源 已经成为现实 。 IMi nu  ̄ : l im系 ] l e 统新开 发的 M P模块 ,它整合 所有类 ,,, JJ 不能支持连接技术。同此有的图书馆在数据库建设 中, 至少在 白建数据库 中 , 相应定制 了对各 种文献 资
不 同级别的用户提供不同 的使用界面 ,一次榆索 就 之差就大大影响 _跨库 及连接的步骤和方法 ,甚至 『
源, 并基于网络资源提供敏锐的 } = 下文检索。 读者 料 , 使 数据 资源的相对规范 稳定 的捕述 。 在大的范罔内 小管身在何处 ,都可 以检索到需要 }限 的商业 数据 来讲早先在数据库的建 没中就提 r相对的 数折 义 c 库 和电子期刊 。 应该说 , 一个系统软件的功能和模块 概念 , “ 如 都柏林核心元数据 ”都柏林 核心元数据焦 , 的开 发 ,是与公 司对 图书馆 与信息 资源发展 的研 究 是一种跨领域的信息资源捕述标 准。这里的信息资
医学资源异构跨库检索技术理论和实践

这种 模式 多用 于 数 据 源有 数 据 访 问 接 1 库 检 3跨
数 据采 集方 式 三 :对 于 订 购 的 网上 电子期 刊 等 更 新速 度快 又有 较 好 的检 索 体 系 的数 据 源 采 用 网页
搜 索代 理 的方式 进行 元数 据采 集 。 由于 不 同数 据源 的数 据 性 质差 异 ,对 所 有选 定 的数 据源 按照 医 学 P b d标 准字 段 转 换 标准 ;对 u Me
信 息发 布 的主 流方 式 ,也 成 为 跨 平 台 检索 系统 主 要
面对 的处理 对象 。 2 跨 平 台检 索系统 模式 分 析
索 系统 可以 节 省 用户 获 取 资 料 的时 间 ,将 不 同媒 体 不 同类 型 的 全 文数 据 源 以整 合
一
w 发布 两种 方 式 。专 用 服 务 器/ 户端 模 式 主 要 客
应用 在 目前 的 O AC,Z 9 5 P 3 . 0和某 些光 盘数 据库 等
方 面 。 因特 网 的发 展 使 WE B发 布方 式 成 为 全 文 库
进行 检索 ,并 以统 一 的 界 面显 示 不 同数 据 源 的全
资源 ,元 数据 与 原 文数 据 源 之 间 的 同步性 差 。对 于
・
313 ・
维普资讯
● l 7
l 口
^n 7
, Ⅷ J
‘
。 1-
vJ
J OUR NAL OF M EDI CAL I OMATl NO. NF OS 4, 2 0 07
医 学 姿 源 异 构 跨 库 检 索 技 市 理 论 和 实 跬
毛 垣 生 王 宁 张屹 张君 郭 雪梅
( 天津 医科大 学 图书馆 网络 部 天津 3 0 7 ) 000
基于代理机制的异构数据库检索技术的研究

利用 元 搜 索 引 擎 的 原理 对 各 个 异 构 数 据 库 进 行 统 一 检 索 。这 种 户 端 输 入 自己 的检 索 需 求 .客 户端 将 其 需 求 传 递 给 代 理 总 服 务 方 法 的 缺 点 在 于需 要 对 各 个 数 据 库 的 We b处 理 接 口进 行 详 尽 器 . 后 代 理 总 服 务 器 再 将 此 任 务 分 配 给 每个 代 理 , 然 由代 理们 完 接 口 的稳 定 性 较差 分析 ,各 个 数 据 库 的 We b处 理 接 口如 发 生 改 变 则 需 重 新 设 计 . 成 检 索 , 把结 果 汇 总 于 代 理 总 服 务 器 . 中 代 理 以 Wesri 并 其 bev e c 的形 式 向 代理 总服 务 提 供 调 用 接 口 . 实 现 代 理 的 分 布式 处 理 。 以
We b客户辅 l
随 着 计 算 机 技 术 的迅 猛 发 展 . 别 是 网 络 技 术 、 码 存 储 的 原 理 , 用各 个 数 据 库 的 w b客 户端 建 立 代 理 机 制 该 机 制 实 特 数 利 e
与 传 输 技 术 等 的全 面普 及 . 得 人 们 对 文 献 信 息 的 加 工 、 储 、 使 存 查询 、 用 等方 面有 了新 的 要 求 一个 新 生 的事 物 一 数 字 图 书馆 利 应 运 而生 。它 以组 织 数 字 化 信 息 及 其 技 术 进 入 图书 馆 并 提 供 有 效 服 务 。 乎 图 书馆 的所 有 载 体 的 信 息 均 能 以数 字 的形 式 获 得 . 几 包 括 所 有 联 机 采购 、 目 、 共 查 询 : 各 种 信 息 资 源 的 检 索 : 编 公 对 利 用 计 算 机 进 行 图 书管 理 ; 用 网络 链 接 实 现 资 源 共 享 等 。 然 而 , 利 由 于各 种 电 子 资 源 的分 布 各 异 、存 储 结 构 以及 存 储 方 式 各 不 相 同, 给广 大 用 户 对 信 息 的检 索 带 来 了极 大 的不 便 。 在此 情 况 下 . 跨 越 各 种 异 构 数 据 库 的 信 息 检 索 成 为 解 决 这 一 问 题 的 重 要 手
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异构数据库的跨库检索技术综述黄镝上海交通大学图书馆上海200030[摘要] 异构数据库的跨库检索是电子资源整合的核心技术,本文介绍了异构数据库的特征、异构数据库的连接和数据交换技术;探讨了跨库检索系统应具备的功能和应注意的问题,并对国外一些有影响的跨库检索系统进行了介绍。
[关鍵词] 异构数据库跨库检索数据库连接Webfeat MetaLib[分类号] G250.73Review of Cross Searching Technique for Heterogeneous DatabaseHuang DiShanghai Jiaotong University Library, Shanghai 200030[Abstract] Cross searching technique for heterogeneous database is core technology of integrating electronic resource. The paper has introduced the character of heterogeneous database, the technology of heterogeneous databases connection and information exchanging. It also discussed the function of cross retrieval system for heterogeneous databases. The paper has also included a survey of foreign products in cross database searching.[Keywords] Heterogeneous databases Cross database searching Database connection Webfeat MetaLib1.引言近几年,图书馆通过引进和自建数据库,已使电子资源的建设具有相当规模,电子文献在文献服务中所占的比重也不断增加。
在继续加强电子资源建设的同时,图书馆开始更加关注电子资源的管理工作,整合已有的资源,将不同类型、不同结构、不同环境、不同用法的各种异构数据库纳入统一的检索平台,以便于用户更方便、更高效地获取信息。
2.数据库的异构特征图书馆要整合的数据库主要包括:书目数据库(OPAC)、题录/文摘数据库、全文数据库、电子期刊和电子图书、相关的WEB网站等。
这些数据库分布在不同的服务器,由不同的信息服务公司和出版社提供、或由图书馆自建,成为各具不同特性的异构数据库,其异构特征表现为以下几个方面:2.1 数据模型的异构分层次、网状、关系和面向对象4种。
2.2 数据结构不同如ORACLE与Sybase数据库物理模型异构、数据结构不同,而有些数据还是半结构或非结构的。
2.3 系统控制方式不同有集中式与分布式。
2.4 计算机平台的异构从巨、大、中、小型机到工作站、PC。
2.5 通信协议的不同有Z39.50、HTTP及非标准等。
2.6 通信结构模式的不同有主从结构、客户机/服务器模式、浏览器/服务器模式。
2.7 操作系统的异构有UNIX、NT、OS/2、Apache、Sun Solaris、Linux等。
2.8 网络的异构有LAN、WAN、以太总线结构与令牌环结构等。
3.异构数据库连接与存取的相关技术面对当前信息资源和网络环境的复杂性,要实现异构数据库的跨库检索,传统的DBMS (数据库管理系统)已经很难解决。
近几年许多新的相关技术相继推出,综合应用这些技术可进行异构数据库之间的连接和数据转换,接受用户对些数据库的并行交叉访问和查询,对查询结果进行融合处理并反馈给用户端。
纵览近年来的进展,主要包括以下相关技术:3.1 公共网关接口技术CGI利用CGI可实现Web与数据库的连接,CGI(Common Gateway Interface)是最早的Web 程序设计方式,它提供一个外部应用程序与Web服务器交互的标准接口,遵循CGI标准编写的Web服务器端的可执行程序称为CGI程序。
CGI最大的用处之一是其与浏览Web站点的用户之间的交互能力,使信息网关、反馈机制、访问数据库、查询等一系列灵活复杂的操作得以实现。
利用CGI实现与数据库的连接,最大的优点在于其通用性。
目前几乎所有的HTTP服务器都支持CGI。
3.2 开放式数据库互连技术ODBCODBC(Open Database Connector)是由Microsoft推出的基于C语言的开放数据库互连技术,主要针对客户端/服务器结构的数据库。
它包含访问不同数据库所要求的ODBC驱动程序及驱动程序所支持的函数,应用程序通过调用不同的驱动程序所支持的函数来操纵不同的数据库。
若想使应用程序操作不同类型的数据库,就要动态地链接到不同的驱动程序上。
3.3 JA V A 数据库互连技术JDBCJDBC(Java Database Connector)是JavaSoft公司设计的Java语言的数据库API(应用编程接口),主要针对浏览器/服务器结构的WEB数据库。
JDBC的出现是Java编程中最重大的突破之一,它使得Java程序与数据库服务器的连接更加方便。
与其他的数据库存取技术相比,JDBC继承了Java语言的所有特点,不仅具有独立于平台运行、面向对象、坚固性好的优点,而且具有多线程、内置检校器来防止病毒入侵等功能,更加适合网络应用。
JDBC的这些特点也特别适合于实现对Web异构数据库的访问。
JDBC是连接Internet上异构数据库的最好方法。
使用JDBC能够方便地向任何关系数据库发送SQL语句。
浏览器从服务器上下载含有JDBC接口的Java Applet,由浏览器直接与数据库服务器连接,自行进行数据交换。
JDBC完成三项工作:(1)建立与数据库的连接;(2)发送SQL语句;(3)处理查询结果。
应用Java语言和JDBC编写具有统一的用户查询界面的应用程序,可实现在浏览器端对多个位于不同数据库服务器上的异构数据库的选择查询。
3.4ASP技术和JSP技术ASP(Active Serve Page)是Microsoft公司于1997年推出的一个功能强大的WEB应用程序开发技术,ASP在Web服务器上解释脚本,可产生并执行动态交互式、高效率的站点服务器应用程序。
ASP可以胜任基于微软Web服务器的各种动态数据发布。
ASP脚本是在Web服务器端解释执行的,当遇到访问数据库的脚本命令时,ASP通过ActiveX组件ADO(ActiveX Data objects)与数据库对话,通过ODBC与后台数据库相连,由数据库访问组件执行访库操作。
并将执行结果动态生成一个HTML页面,返回web服务器端,以响应浏览器的请求。
在用户端浏览器所见到的是纯HTML表现的画面,例如用表格来表现的后台数据库表中的字段内容。
由于ASP结合了脚本语言,可以通过编程访问ActiveX组件,并且具有现场自动生成HTML的能力,所以它成为建立动态Web站点的有效工具。
在结构关系上,ASP是通过ODBC与数据库打交道。
因此,可向上层兼容各类数据。
另一种相似的动态网页技术JSP由Sun公司于1999年发布,JSP支持的是完全的Java,可以充分发挥Java面向对象编程的强大功能,可以使用J2EE标准服务,使用大量的Java API,如JDBC API。
3.5 XML中间件技术目前网上有很多信息格式是半结构化或非结构化的,其来源极端异构。
利用XML作为中间件对这些信息进行元数据搜索,提供一个统一界面的检索系统是一个较好的应用方案。
XML(Extensible Markup Language,可扩展标记语言)是由W3C(World Wide Web Consortium)组织于1998年2月制定的一种通用语言规范,它是专门为Web应用程序而设计的SGML 的简化子集。
XML最大的优点在于它的数据描述和传送能力,具备很强的开放性。
为了使基于XML的数据交换成为可能,必须实现数据库的XML数据存取,并且将XML数据同应用程序集成,进而使之同现有的规则和技术相结合。
开发基于XML动态应用(如动态信息发布、动态数据交换等)的前提是所支持的数据库必须能支持XML。
XML提供描述不同类型数据的标准格式,例如:数据库记录、图形、声音等,并且可一致而正确地解码、管理和显示信息。
4. 电子资源跨库检索应具备的功能跨库检索技术不等同于搜索引擎,它应为用户呈现图书馆的整体信息资源、帮助用户定位相关的资源、并直接融合这些资源,在各类学术信息资源中通过知识元的搜索实现知识发现。
具体应具有以下功能:4.1浏览与检索系统应提供主题树等索引系统,帮助用户以浏览的方式选取合适的检索词进行查询。
检索应包括简单和高级检索,简单检索应包括自然语言、短语检索及布尔算符、位置算符、截词符和通配符等检索。
高级检索应提供多字段检索和多种限制选项。
同时,系统还应提供检索策略的保存及定题跟踪服务,以方便用户再次检索。
4.2用户定制功能系统应提供特定的学科入口,把同一学科相关的数据库整合在一起。
同时应提供可供跨库检索的数据库列表,并允许用户自由选择和组合,一次检索到相关数据库的各种信息。
4.3统计功能数据库使用数据是电子资源利用率的重要指标,因此跨库检索系统应提供完善的统计功能,包括用户利用跨库检索系统访问各数据库的各种使用数据,如访问各数据库的登录数、检索次数、下载题录文摘数、下载全文数等。
并提供各时间段、各用户IP或帐户的使用统计。
4.4数据间的连接系统应兼容CrossRef、OpenURL、SFX等数据库无缝链接技术或标准,使不同数据库之间的各种记录能互相链接,包括书目数据库、文摘数据库、全文数据库中各种数据之间的互连。
4.5数据的显示与保存系统应对来源于不同数据库的结果进行融合,检索结果输出应具备排序功能,如按日期、篇名、作者、相关性排序。
检索记录应可以打印、下载、Email发送。
最好能兼容各种Citation Manager软件,如Reference Manager、Endnote、Refworks等。
5. 电子资源跨库检索应注重的问题5.1网络安全跨库检索系统要与Internet及各种不同软硬件环境的数据库进行连接,黑客和病毒入侵的危险就会始终存在。
跨库检索系统支持各种脚本和CGI程序,以实现一些页面的交互功能,例如数据采集和确认。
这些程序为Internet上的任何人提供了一个连向web服务器操作系统的直接链接。
攻击者们可以利用CGI程序来修改web页面,窃取帐号,为未来的攻击设置后门。