一种基于XML的异构数据库集成方法
合集下载
基于XML的异构数据库集成技术的研究

维普资讯
本 目 任 辑: 翔 栏责编 闻军
数据 库 及 信息 管 理
基于 X ML的异构数据库集成技术的研究
孙海 军 . 岩 高 ( 津 商业 大 学 信 息 工 程 学 院 , 津 30 3 ) 天 天 0 14
摘 要 : 实现 异 构 数 据 库 间信 息 的 共 享 和 集 成 , 数 据 集成 的 原 理 以 及 主 要 技 术 进 行 了研 究 。 重 点 分 析 了 XML与 关 系数 据 库之 间 为 对 的 映 射 , 出 了一 种 以 X L作 为 中 间件 的 异 构 数 据 库 集 成 方 案 , 对 其 中的 主 要 环 节给 出 了具 体 实 现 。 该 方 案 实现 了异 构 数 据 库 的 透 提 M 并
1引言
长 期 以 来 , 企 业 或 部 门 的 数 据 库 系 统 相 对 独 立 建 设 , 于 各 由 操 作 系 统 不 同 、 据 库 类 型 不 同 、 据 结 构 不 同 以及 D MS不 同 数 数 B 等 原 因 , 步 形 成 了各 个 独 立 的 异 构 数 据 库 . 互 之 间 不 能 进 行 逐 相 有 效 的交 互 。 为企 业 内部 以及 企 业 之 间 业 务 逻 辑 的 整 合 和 数 据 这 信 息 的共 享 提 出 了巨 大 的 挑 战 。 本 文 提 出 了一 种 利用 XM L作 为 中 间 件 技 术 ,进 行 异 构 数 据
e eprs n o m a on s tm ntg a o ntr i ei f r t yse i e t n. i r i
K y WO d : e r S XM L; tr g n o sDaa a e Da aI t g a o ; i de r Hee o e e u tb s ; t n e t n M d lwae r i
本 目 任 辑: 翔 栏责编 闻军
数据 库 及 信息 管 理
基于 X ML的异构数据库集成技术的研究
孙海 军 . 岩 高 ( 津 商业 大 学 信 息 工 程 学 院 , 津 30 3 ) 天 天 0 14
摘 要 : 实现 异 构 数 据 库 间信 息 的 共 享 和 集 成 , 数 据 集成 的 原 理 以 及 主 要 技 术 进 行 了研 究 。 重 点 分 析 了 XML与 关 系数 据 库之 间 为 对 的 映 射 , 出 了一 种 以 X L作 为 中 间件 的 异 构 数 据 库 集 成 方 案 , 对 其 中的 主 要 环 节给 出 了具 体 实 现 。 该 方 案 实现 了异 构 数 据 库 的 透 提 M 并
1引言
长 期 以 来 , 企 业 或 部 门 的 数 据 库 系 统 相 对 独 立 建 设 , 于 各 由 操 作 系 统 不 同 、 据 库 类 型 不 同 、 据 结 构 不 同 以及 D MS不 同 数 数 B 等 原 因 , 步 形 成 了各 个 独 立 的 异 构 数 据 库 . 互 之 间 不 能 进 行 逐 相 有 效 的交 互 。 为企 业 内部 以及 企 业 之 间 业 务 逻 辑 的 整 合 和 数 据 这 信 息 的共 享 提 出 了巨 大 的 挑 战 。 本 文 提 出 了一 种 利用 XM L作 为 中 间 件 技 术 ,进 行 异 构 数 据
e eprs n o m a on s tm ntg a o ntr i ei f r t yse i e t n. i r i
K y WO d : e r S XM L; tr g n o sDaa a e Da aI t g a o ; i de r Hee o e e u tb s ; t n e t n M d lwae r i
基于XML的异构数据库集成的研究

务I 匐 地
基于X ML的异构数据库集成的研究
Res ear n egr i t ogene ch on i t atng he er ous d a at bas b ed on X M L e as
王雅轩,顼
聪
W ANG 、 — u n XU Co g r xa . n a
一
中囝分类号 :T 3 2 P 9
文献标识码 :B
文章编号 :1 0 - 1 4 2 1 ) ( - 1 2 0 9 0 ( 0 1 1下) 0 - 2 0 3 2
D i 1 . 9 9 J is . 0 9 1 4 2 1 .( ) 4 o : 3 6} . n 1 0 -0 3 . 0 1 1 下 . 1 0 / s
互转 换 ,将 数据 存储 到 X ML数据 空 间中 ,并 维持
XML数据 空间 与各异构数 据源之 间的映射关 系 。
技术 将这个 模型映 射到 关系数 据库 。
收 稿 日 期 :2 1-1-1 00 2 7 作者简介:王雅轩 (99 16 一) ,女 ,黑龙江哈尔滨人 ,副教授 ,研究生 ,研究方向为软件理论与应用。
的映 射模式 的原理 就 是利 用 XML文 档 中的数据模
图 1 异 构 数 据 库 数 据 集 成 的构 架 图
1 数 据 服 务 器 层 :系统 数 据 的提 供 者 ,它 包 ) 括 各种 类 型 的数 据 库 。 每个 数 据 源 与 企业 内部 各
部 门的 MI S系统 相连 , 成 自己的 本地应 用 。 构
板驱 动和模 型驱 动 。在 基于模 板驱 动的映 射 中 , 并
出一
分 散 异 构 数 据 源 层
不 预先 定 义 文 档结 构 和 数 据库 结构 之 间 的映 射 关 系,而是 在数据 转换软 件 的处理模 板 中嵌 入说 明命 令 ,让数据 传输 中间件 来执 行该模板 。以模型 驱动
基于X ML的异构数据库集成的研究
Res ear n egr i t ogene ch on i t atng he er ous d a at bas b ed on X M L e as
王雅轩,顼
聪
W ANG 、 — u n XU Co g r xa . n a
一
中囝分类号 :T 3 2 P 9
文献标识码 :B
文章编号 :1 0 - 1 4 2 1 ) ( - 1 2 0 9 0 ( 0 1 1下) 0 - 2 0 3 2
D i 1 . 9 9 J is . 0 9 1 4 2 1 .( ) 4 o : 3 6} . n 1 0 -0 3 . 0 1 1 下 . 1 0 / s
互转 换 ,将 数据 存储 到 X ML数据 空 间中 ,并 维持
XML数据 空间 与各异构数 据源之 间的映射关 系 。
技术 将这个 模型映 射到 关系数 据库 。
收 稿 日 期 :2 1-1-1 00 2 7 作者简介:王雅轩 (99 16 一) ,女 ,黑龙江哈尔滨人 ,副教授 ,研究生 ,研究方向为软件理论与应用。
的映 射模式 的原理 就 是利 用 XML文 档 中的数据模
图 1 异 构 数 据 库 数 据 集 成 的构 架 图
1 数 据 服 务 器 层 :系统 数 据 的提 供 者 ,它 包 ) 括 各种 类 型 的数 据 库 。 每个 数 据 源 与 企业 内部 各
部 门的 MI S系统 相连 , 成 自己的 本地应 用 。 构
板驱 动和模 型驱 动 。在 基于模 板驱 动的映 射 中 , 并
出一
分 散 异 构 数 据 源 层
不 预先 定 义 文 档结 构 和 数 据库 结构 之 间 的映 射 关 系,而是 在数据 转换软 件 的处理模 板 中嵌 入说 明命 令 ,让数据 传输 中间件 来执 行该模板 。以模型 驱动
一种基于XML的异构数据集成系统结构的研究

用 , 现 企 业 内部 数 据 共 享 , 之 在企 业 运 行 中 发挥 更 大 的 作 用 , 企 实 使 是 业发展的必然需求。 主 要 任 务 是 获 得 各 异 构 数 据 源 的 信 息 , 立 公 共 模 型 和 包 装 异 构 建 数 据 源 , 为 数 据 集 成 查 询 阶 段 中的 数 据 查 询 分 解 和 结 果 合 成 提 供 支 分 中间 件 ( dao Wrp e) 术 通 过 提 供 一 个 全 局 模 式 和 对 应 各 持 。这 一 过 程 应 有 两 类 角 色 参 与 , 别 为 各 局 部 数 据 库 管 理 员 和 数 据 Me i r ap r技 t/ 数 据 源 的局 部 模 式 . 成 来 自不 同 数 据 源 的数 据 , 态 分 解 针 对 每 个 集 成 人 员 。包 括 三 个 步 骤 : 集 动
同 . 据 的统 一 性 没 有 保证 , 业 各部 门之 间无 法 进 行 信 息 共 享 , 成 成 , 成 以 XML结 构 的结 果 文 件 返 回给 用 户 。 数 企 形 生 在此 过程 可 分 成 建 立 集 了 “ 息 孤 岛 ” 严 重 影 响 了 信 息化 对 企业 的 服务 能 力 l 如 何 通 过 网络 成 模 式 和 数 据 集 成 查 询 两 个 阶 段 。 信 , l 】 。 . 有 效 地 对 这 些 不 同来 源 、不 同 格 式 的数 据 进 行 有 效 的 集 成 访 问 和 利 21 建 立 集 成 模 式 阶 段
随着 信 息 化 建 设 的 深 入 . 当数 量 的企 业 积 累 了 大 量 建 立 于 不 同 相 该 系 统 的 工 作 过 程 是 , 户 输 入 全 局 数 据 查 询 信 息 , 据 公 共 模 用 根 的时 间 、 储 在 不 同 平 台 、 存 依赖 于 不 同数 据 库 管 理 系统 的数 据 ( 关 系 型 将 全 局 查 询 分 解 为 针 对 各 异 构 数据 源 的 子 查 询 , 各 子 查 询 传 递 给 如 将 型数 据 库 数 据 、 ML文 档 、 本 文 件 等) 由 于数 据 格 式 、 码 标 准 不 各 数 据 源 执 行 .各 数 据 执 行 的 子 查 询 结 果 根 据 公 共 模 型进 行 结 果 合 X 文 。 编
同 . 据 的统 一 性 没 有 保证 , 业 各部 门之 间无 法 进 行 信 息 共 享 , 成 成 , 成 以 XML结 构 的结 果 文 件 返 回给 用 户 。 数 企 形 生 在此 过程 可 分 成 建 立 集 了 “ 息 孤 岛 ” 严 重 影 响 了 信 息化 对 企业 的 服务 能 力 l 如 何 通 过 网络 成 模 式 和 数 据 集 成 查 询 两 个 阶 段 。 信 , l 】 。 . 有 效 地 对 这 些 不 同来 源 、不 同 格 式 的数 据 进 行 有 效 的 集 成 访 问 和 利 21 建 立 集 成 模 式 阶 段
随着 信 息 化 建 设 的 深 入 . 当数 量 的企 业 积 累 了 大 量 建 立 于 不 同 相 该 系 统 的 工 作 过 程 是 , 户 输 入 全 局 数 据 查 询 信 息 , 据 公 共 模 用 根 的时 间 、 储 在 不 同 平 台 、 存 依赖 于 不 同数 据 库 管 理 系统 的数 据 ( 关 系 型 将 全 局 查 询 分 解 为 针 对 各 异 构 数据 源 的 子 查 询 , 各 子 查 询 传 递 给 如 将 型数 据 库 数 据 、 ML文 档 、 本 文 件 等) 由 于数 据 格 式 、 码 标 准 不 各 数 据 源 执 行 .各 数 据 执 行 的 子 查 询 结 果 根 据 公 共 模 型进 行 结 果 合 X 文 。 编
基于XML的异构生物信息数据库整合技术研究

作 者 简介 : 李 美 满( 1 9 7 1 - ) , 男, 硕士 , 副教 授 , 研 究 方 向 为 生物 信 息 学
⑨ 现 代 计 算 机 2 0 1 3 . 0 1 中
该系统 的体 系结 构由下载中心数据库 、数据库 管 理、 用户端组成 下 载中心数据库模块给 出数据源地址
和 具 体 的 下 载方 式 .指 导 数 据 库 管 理 员 下 载 到 本 地 指 定 的文件夹 中: 数 据 库 管 理 模 块 采 用 可 视化 的 界 面 , 方 便 维 护 系 统 .其 主 要 功 能 是 按 照 生 物 公 共 数 据 模 型 建 立 异 构 数 据 库 之 间 的语 义 链 接 .在 概 念 和联 系 层 次 上
对 数 据 进 行 建 模 而 引 起 的数 据结 构 和 数 据 语 义 表 达 的
成, 这些注释对序列数据功 能 、 来源、 特性 进行描述 , 数 据 的无 结构化 就是指生物数 据通 常以文档 形式描 述 数据 的异构包括语 义的异 构和语 法的异构 .数据描述
模 式 和描 述 标 识 不 同 导致 语 义 的 异 构 .语 法 的 异 构 是
0 引
言
1 生 物 公 共 数 据模 型
生物数据库 的整合存在数据 的异构 和数据 的无结
构 化 两 个 主 要 的难 题 生 物 数 据 库 中对 生 物 数 据 的描 述 主 要 由原 始 序 列 数 据 以及 对 生 物 信 息 描 述 的 注 释 组
生 物信 息学是在生命科学 的研究 中以计算机 为工 具对生 物信息进行储 存 、 检索和分析 的科学 . 其根 本任 务 是从 海量的生物数据 中提取有效信 息 .并从 中揭示
李美满 , 许 中华 , 刘 柯
基于XML的异构数据库集成中间件

[ 作者简介 ] 吴启 明(9 3一) 男, 17 , 湖南 浏阳人 , 河池 学院计信 系讲师 , 武汉 大学在职硕 士研 究生 , 主要研究
方向为数据挖掘与个性搜索; 易云飞(9 1一) 男, 18 , 广西资源人 , 河池 学院计信 系助教 , 中南民族 大学在 读硕士研究
生, 主要研究方向为数据挖掘 , 工智 能和信息安全 。 人
1 X ML简 介
X L即可扩展标记语言(Xes l M r pLnug) M 是定义标记的规则 , M e t ie ak agae 。X L nb u 这些标记将文档分成 许 多部件 并对这 些部件 加 以标 识 。标记语 言 是一种对 文档 的规 范 化 的描 述 , 它用 于指 出文档 中哪些 是 内容 , 哪些是标记 , 以及这些标记的用处。由于 X L描述数据的内容 , M 适合于机器处理和数据库应用和查询 , M XL 已成为互 联 网上 数据表 示和交 换 的标 准 。X ML文 档包括 三部 分 :ML声 明、 X 处理 指示 ( 可选 )X 、 ML元 素 。
例如 :
<?x eso mlv rin= “1 0” sa dao e=“y s” e c d n =“g 2 2”? > . tn l n e n o ig b 31
<?x —s l h e y e = “ e t x l ml t e s e t p y t tx/ s ”h e =“ sy e x l ? > r f my t l. s ”
改变成为一个亟待解决的难题。纵观国内外 , 对它的研究起步较晚, 且很不完善。一般可采用以下两种方式 之一来解 决 。一种方 式是将 原有 的数据 移植 到新 的数据 库 系统 中 , 以达 到两 种数 据库 之间 的数据 溶合 ; 另一
基于XML的异构数据库集成的研究

S u y o n e r to fh tr g n o s d t b s a e n XM L t d n i tg a i n o e e o e e u aa a e b s d o
W ANG — 0 g, Z Nih n HANG a g li Gu n -e
太 适用 。
() 2 中间件技术 中间件是位于 CS之间的中介 接 口软件 , 异 / 是
() 2模式异构 , 即数据源在存储模式上的不 同。
存储模式主要包括关系模式 、 对象模式 、 对象关系模 构系统集成所需的粘接剂 , 是保证操作系统 、 通讯协 式和文档嵌套模式等几种 , 其中关系模式 ( 关系数据 议 、 数据库 间进行对话 、 互相操作的软件系统。现有 库) 为主流存储模式。同时 , 即便是 同一类 存储模 的数据 库 中间件 允许 C et ln 在异构数据库 上调用 i 式, 它们的模式结构可能也存在着差异。例如不同
同时 , 每个数据库系统仍保有 自己的应 用特性 、 完
整 性控 制 和安全性 控 制 。用 户可 以通过本平 台对 这
置上的多个业务数据管理系统中的数据 , 如图 l 所 示。异构数据源的整合 、 集成是企业 信息化建设 过 程经常遇到的一个现实 问题 , 也是制约企业各种应
些数据库里的数据进行各种操作 , 同操作一个单 如
一
X (x n b a u agae技术作为异构 ML Et s lM r pL ug) e ie k n 数据集成与异构数据交换解决方 案有其先天优势。
XL M 包含了大量 “ 自描述” 性标记来精确 的表示信 息的各种含 义, 它提供 了丰富的数据构造和解析方 法, 能够适应多样并且不断变化的网络应用环境 , 被
基于XML的异构数据库集成技术研究

£7 { | / 嵌务 入 服 《模 淼 j V l } I 式
lI 局 , ‘ ●
l
q
’ .
L
一 一 ,
记语言 ,x 能够根据具体应用灵 活 地表现异构数据源 中的各种信息 ,包
括应用程序之间的数据交换 、结构化 和半结构化文档 以及数据库 中数据 的 输出.随着 X L技术 的兴起 ,异构数 M 据源 的集 成问题 成为数据库领域研究
刘淑 梅
( 水学院 衡 现 代 教育 技 术 管 理 中心 ,河 北 衡 水 0 3 0 ) 5 0 0
摘 要 :异构数据库 系 统的集成是 当 前数据处理领域的研究热点,它能有效地利用信息资源,实现数据共享.提出了一
种基于 X L的异构数据库集成的方法,X L中间件层是异构数据 源集成的关键和核心 ,它能够 实现 X L数据模型与数据 源 M M M 各数据模型之 间的映射和数据源文档与 X L文档 的相互转换. M 利用这种方 法可有效地集成各种数据格 式的异构数据库 系统
集成应 用系统 除了要集 成传统 的异构
信发 彳 息 布 ll
, , r — 、
.
◆
用 查 户询
腑 器
/
用屡 户
数据库 ,还 要集成 W b上这些新 的数 e 据源 ,如何实现异构数据源 集成应 用 在 W b上 的实现 ,其中一个关键技术 e 是如何 以一种统一 的数据模 式描述 各
关键 词 :XL M;中间件;数据集成;数据模型 中图分类 号 :T3 11 P1.3 文献 标识码 :A 文章编 号 :17—0520) 102—3 6326 (08O—0 70
随着计算机 网络技术 的迅速发展,出现 了许多新的数据形式,如 电子邮件、H M T L文档等信息,与这些数据 相 比,传统数据库 中的数据具有严格的存储格式 ,数据的各种操 作具有严格 的规范 ,因此 ,传统数据库中的数 据称为结构化数据 .而互联网上的大量 数据缺乏统一 固定的模式,数据往往是不规则的并且是经常变动的,这 些数据 是先有 数据后 有模式 ,即半结 构化数据.在 W b上实现异构数据源 e
基于XML的异构数据库集成研究

2 . 3核 心模 块 描 述
毋庸置疑 ,在基于 X ML的中间件 集成系 统中,最 关键的是 中间层 ,也就是说 中间层是
核心层 ,因为中间层封装 了异构数据库的业务
数据缓存 中。另外 ,基于各个包装器和数 据层
的数据库是一一对应的关系 ,当数据库 里面数
以不同形 式存 储的 、依赖 于不 同 的 DB MS的 数据 。当然 ,想要更大程度上利用这些数据资
本文针 对异 构数据 库 系统 间
信 息 共 享 与 信 息 交 换 难 题 , 深 入
l
2 . 2体 系结 构
的讨论 了异构数据 库的集成 方法, 『 并采 用 x M L 的 异构 数据 库 中 间件 1
技 术 实现异 构数 据库 之 间的信 息 交换 ,在 实际应 用 中有 着较 广 阔 的应 用前景
3 总 结
异构 数据库 之 间进 行数 据的 传输 日益成
下面详细说明上述三个主要模块的功能。 据访 问接 口,让用户感觉到就像操作一个数据 模块。 2 . 3 . 1配置 文件模块 库一 一 样方便快 捷。X ML的出现为 异构数据 库 的集成带来 了新的挑战和契机。
XML是一种基于 S G ML简 单灵活的元语 合 以往异构数据库集成方法的基础上 ,采用基 言,具有 高可扩展性 、高度结构化和 自定义性 据信。在这 个配 置文件模块 中,会生成三类文 件 ,包括全局虚拟视图文件 、数 据库 连接配置 于 XML的异构数据库 中间件技术实现异构数 等特性 ,方便表示不 同类型 的数据信息 ,同时 据库之间信息交换 .首先提 出了一个异构数据 也 方 便 了 不 同 数 据 库 之 间 进 行 数 据 共 享 和 交 信息文件 以及安全控制文件。生成的这三类配 库集 成 中间件 的三层 框架结构 , 并通过 XM L 置文件可 以使管理员对集成的个数据 库的元数 换 ,进而 X ML在 异构数据库 的集成方面有很 技术在客户端与数据库服务器 问构建 了一个 中 据信息进行重新定义 ,也可以配置需要查询数 火优势 。本文 主要研 究基于 XML异构数据库 间件 系统 。在该集成 中间件系统中通过对配置 据库的连接信息和安全控 制信息 。 的集成。 改 全局 虚拟 视 图文件 :对 数据 层 的异构数 文件模块 、查询模块 、包 装器模 块的封装 ,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
装
据和半结构化数据 )使数据交换保持了平台独立性 , 原则 , 降低耦合性 , 提高 了重用的可能性 , 这样 就使 异构数据源集成中问件能更好地适应开放 、 发展环
中间件层
器
数据源层
图 1 异构数据库 集成方案框 架
收稿 日期 :0 8—1 —2 修 回 日期 ;09—1 20 1 5; 20 2—1 6
该方案具有扩展性 , 如要添加新的数据源访问需要 , 只需向中间件系统进行注册相关 信息即可实现 , 即该 中间件系统具有弹性环境 , 有利于 日后系统 的维护。采用该异构数据库集成方案可解决企业异构数据库
第2卷 o
第1 期
茂名 学 院学报
J R I OF MAO OU NA M G U 、 R nY NI S
V0 . 0 N . 12 o 1 F b.0 9 e 20
21 00年 2月
一
种基 于 X ML的异 构 数 据 库 集 成 方 法
乔 玮
( 西安文理学 院, 陕西 西安 70 6 ) 105
中图分类号 :P 1 .3 T 3 11 文献标识码 : A 文章编号 :6 1 502 1)1 0 9 3 17 —69 (0 00 —0 4 —0
现代企业普遍应用数据库技术来管理各种数据 , 多数企业在发展过程中积累了大量的数据 , 这些数据 可为企业的业务发展和经营规划提供参考。但由于数据库应用系统是在不同时期 、 根据不同的需求建立 的, 开发标准、 数据库平 台、 数据格式等不 同, 因此在企业数据共享中形成 了“ 信息孤岛” 。数据库 中间件技 术通过提供一个全局模式和对应各数据源的局部模式 , 集成来 自不同数据源的数据, 不需考虑数据库的模 型和运行平 台…。X L e t s l M r pLnu e是 S M (t dr G nr a u agae的子集。作 M (Xe ie a u aga ) G LS na ee l r pLnug) n b k g a d aM k 为一种可扩展标记语言 , 自描述性使得 X L 其 M 本身非常适用 于异构数据应用 间的数据交换 。由于 X L M 能够描述不规则数据 , 能够从不同的来源集成数据 , 因此将 X L M 作为数据 的描述工具和转换工具来构造 数据集成 的中间件 , 是实现异构数据集成的较理想 的解决方式[。 2 】
作者 简介 : 乔玮(97一)男 , 17 , 河南洛 阳人 , 助理工程师 , 硕士 , 从事网络集成与数据库技术研究。
5 0
茂名 学 院学 报 ຫໍສະໝຸດ 21 00年 境中的数据集成 。本方案中的中间件层主要 由注册器 、 查询处理器 、 结果处理器和包装器四个模块组成。 注册器主要负责异构数据库的注册服务, 并生成公共模型; 查询处理器需要根据用户提交的查询请求 , 将基 于总体视图的查询分解为针对各个数据源的子查询 , 并提交给包装器执行 ; 结果处理器把包装器的结果汇总
处理 , X L 以 M 的方式返回; 包装器负责与底层数据源交互 , 包装异构数据源, 实现数据位置和访问的透明性。 该构架的工作流程及所实现的功能为: 应用程序服务器接收客户端发送的查询请求 , 该查询请求为全 局查询请求 , 可能需要访问数据源层中不同数据库中的信息。中间件层接收全局查询 , 根据各异构数据源 注册的共享信息进行分析 , 查询处理器将全局查询分解为针对具体数据库子查询 , 并将子查询发送到对应
应 ●—— . ——— . 二二 )
信息 , 为数据的共享和应用提供访问支持 , 负责异构 户
端
数据源的数据访问和查询 , 同时协调各数据源之间 客 的信息集成。该方案 将 X 技术 与全局数据模式 户 ML 相结合 , 在中间件 中以 X L M 文档进行数据 的交互 ,
用
l 异 构 数 据 库 集成 方 案
本文 中的异构数据库是指相关 的多个数据库系统的集合 , 异构数据库的各个组成部分具有 自身的 自 治性 , 每个局部数据库拥有 自己的 D M ( B S 可以是同为关系型数据库系统的 Oal S LSr r 也可以是 r e Q v 等, c、 ee 不同数据模型的数据库 , 如关系 、 模式 、 层次 、 面向对象数据库等)在实现数据 的共享 和透明访 问的同时 , , 每个数据库管理系统仍然保有 自身的完整性控制和安全性控制。
的数据源。数据层 中的各数据库管理系统接收到查询后 , 从数据库中查询相关信息 , 把查询结果返还给结 果处理器, 结果处理器将其合并成同一笔数据记录 , 并将得到的全局查询结果返还给应用程序服务器, 应 用程序服务器再将用户请求的结果返回给用户 。以上过程均以 X L M 文档为数据转换的中介格式。同时,
程
务
( 注册器 )
包 I二=≥ <
端
端
服 - ( 询 理 —+器 一 + 序 4 查 处 器) — 装 ● {堡 三 ’ ●— _墼
器
应用层
户 它能够转换来 自 同数据源的数据 ( 不 包括结构化数 客
(结果处理器)●—.包 一 F ——. ● = —— = 二二
基于 X L M 的异构数据库集成方案的基本框架如图 l 所示 , 它分为三层结构 : 分别为应用层 、 中间件层
和数据源层 , 中间件层构建在各数据库 系统之上 , 数据应用程序服务器之下 , 在不改变异构数据源原始数 据存储和管理方式的情况下 , 集成各个异构数据源 客
I 公共模型 I
摘要 : 异构数据库 的集成 是当前数据库研究领域 内的一个热点 , 它能更有效地利用信 息资源及实现 数据共享 。论 述了一种 基于 X L中间件 的异 构数据库集成方法 。首先介绍 了异 构数据库 集成 系统整 体框架 结构 的层次模 型和每 一层 的服务功 M
能, 然后对 其中的关键 问题 , 如关系数据模式到 X ce a MLShm 模式转换及查询分解方法进 行 了讨论 , 最后 阐述 了该 异构数据 库集成方法 的优点 。 关键词 : M ; X L 中间件 ; 据集成 ; 数 异构 数据库
据和半结构化数据 )使数据交换保持了平台独立性 , 原则 , 降低耦合性 , 提高 了重用的可能性 , 这样 就使 异构数据源集成中问件能更好地适应开放 、 发展环
中间件层
器
数据源层
图 1 异构数据库 集成方案框 架
收稿 日期 :0 8—1 —2 修 回 日期 ;09—1 20 1 5; 20 2—1 6
该方案具有扩展性 , 如要添加新的数据源访问需要 , 只需向中间件系统进行注册相关 信息即可实现 , 即该 中间件系统具有弹性环境 , 有利于 日后系统 的维护。采用该异构数据库集成方案可解决企业异构数据库
第2卷 o
第1 期
茂名 学 院学报
J R I OF MAO OU NA M G U 、 R nY NI S
V0 . 0 N . 12 o 1 F b.0 9 e 20
21 00年 2月
一
种基 于 X ML的异 构 数 据 库 集 成 方 法
乔 玮
( 西安文理学 院, 陕西 西安 70 6 ) 105
中图分类号 :P 1 .3 T 3 11 文献标识码 : A 文章编号 :6 1 502 1)1 0 9 3 17 —69 (0 00 —0 4 —0
现代企业普遍应用数据库技术来管理各种数据 , 多数企业在发展过程中积累了大量的数据 , 这些数据 可为企业的业务发展和经营规划提供参考。但由于数据库应用系统是在不同时期 、 根据不同的需求建立 的, 开发标准、 数据库平 台、 数据格式等不 同, 因此在企业数据共享中形成 了“ 信息孤岛” 。数据库 中间件技 术通过提供一个全局模式和对应各数据源的局部模式 , 集成来 自不同数据源的数据, 不需考虑数据库的模 型和运行平 台…。X L e t s l M r pLnu e是 S M (t dr G nr a u agae的子集。作 M (Xe ie a u aga ) G LS na ee l r pLnug) n b k g a d aM k 为一种可扩展标记语言 , 自描述性使得 X L 其 M 本身非常适用 于异构数据应用 间的数据交换 。由于 X L M 能够描述不规则数据 , 能够从不同的来源集成数据 , 因此将 X L M 作为数据 的描述工具和转换工具来构造 数据集成 的中间件 , 是实现异构数据集成的较理想 的解决方式[。 2 】
作者 简介 : 乔玮(97一)男 , 17 , 河南洛 阳人 , 助理工程师 , 硕士 , 从事网络集成与数据库技术研究。
5 0
茂名 学 院学 报 ຫໍສະໝຸດ 21 00年 境中的数据集成 。本方案中的中间件层主要 由注册器 、 查询处理器 、 结果处理器和包装器四个模块组成。 注册器主要负责异构数据库的注册服务, 并生成公共模型; 查询处理器需要根据用户提交的查询请求 , 将基 于总体视图的查询分解为针对各个数据源的子查询 , 并提交给包装器执行 ; 结果处理器把包装器的结果汇总
处理 , X L 以 M 的方式返回; 包装器负责与底层数据源交互 , 包装异构数据源, 实现数据位置和访问的透明性。 该构架的工作流程及所实现的功能为: 应用程序服务器接收客户端发送的查询请求 , 该查询请求为全 局查询请求 , 可能需要访问数据源层中不同数据库中的信息。中间件层接收全局查询 , 根据各异构数据源 注册的共享信息进行分析 , 查询处理器将全局查询分解为针对具体数据库子查询 , 并将子查询发送到对应
应 ●—— . ——— . 二二 )
信息 , 为数据的共享和应用提供访问支持 , 负责异构 户
端
数据源的数据访问和查询 , 同时协调各数据源之间 客 的信息集成。该方案 将 X 技术 与全局数据模式 户 ML 相结合 , 在中间件 中以 X L M 文档进行数据 的交互 ,
用
l 异 构 数 据 库 集成 方 案
本文 中的异构数据库是指相关 的多个数据库系统的集合 , 异构数据库的各个组成部分具有 自身的 自 治性 , 每个局部数据库拥有 自己的 D M ( B S 可以是同为关系型数据库系统的 Oal S LSr r 也可以是 r e Q v 等, c、 ee 不同数据模型的数据库 , 如关系 、 模式 、 层次 、 面向对象数据库等)在实现数据 的共享 和透明访 问的同时 , , 每个数据库管理系统仍然保有 自身的完整性控制和安全性控制。
的数据源。数据层 中的各数据库管理系统接收到查询后 , 从数据库中查询相关信息 , 把查询结果返还给结 果处理器, 结果处理器将其合并成同一笔数据记录 , 并将得到的全局查询结果返还给应用程序服务器, 应 用程序服务器再将用户请求的结果返回给用户 。以上过程均以 X L M 文档为数据转换的中介格式。同时,
程
务
( 注册器 )
包 I二=≥ <
端
端
服 - ( 询 理 —+器 一 + 序 4 查 处 器) — 装 ● {堡 三 ’ ●— _墼
器
应用层
户 它能够转换来 自 同数据源的数据 ( 不 包括结构化数 客
(结果处理器)●—.包 一 F ——. ● = —— = 二二
基于 X L M 的异构数据库集成方案的基本框架如图 l 所示 , 它分为三层结构 : 分别为应用层 、 中间件层
和数据源层 , 中间件层构建在各数据库 系统之上 , 数据应用程序服务器之下 , 在不改变异构数据源原始数 据存储和管理方式的情况下 , 集成各个异构数据源 客
I 公共模型 I
摘要 : 异构数据库 的集成 是当前数据库研究领域 内的一个热点 , 它能更有效地利用信 息资源及实现 数据共享 。论 述了一种 基于 X L中间件 的异 构数据库集成方法 。首先介绍 了异 构数据库 集成 系统整 体框架 结构 的层次模 型和每 一层 的服务功 M
能, 然后对 其中的关键 问题 , 如关系数据模式到 X ce a MLShm 模式转换及查询分解方法进 行 了讨论 , 最后 阐述 了该 异构数据 库集成方法 的优点 。 关键词 : M ; X L 中间件 ; 据集成 ; 数 异构 数据库