基于XML高校异构数据源系统的集成设计
合集下载
基于XML的异构数据库集成技术的研究

维普资讯
本 目 任 辑: 翔 栏责编 闻军
数据 库 及 信息 管 理
基于 X ML的异构数据库集成技术的研究
孙海 军 . 岩 高 ( 津 商业 大 学 信 息 工 程 学 院 , 津 30 3 ) 天 天 0 14
摘 要 : 实现 异 构 数 据 库 间信 息 的 共 享 和 集 成 , 数 据 集成 的 原 理 以 及 主 要 技 术 进 行 了研 究 。 重 点 分 析 了 XML与 关 系数 据 库之 间 为 对 的 映 射 , 出 了一 种 以 X L作 为 中 间件 的 异 构 数 据 库 集 成 方 案 , 对 其 中的 主 要 环 节给 出 了具 体 实 现 。 该 方 案 实现 了异 构 数 据 库 的 透 提 M 并
1引言
长 期 以 来 , 企 业 或 部 门 的 数 据 库 系 统 相 对 独 立 建 设 , 于 各 由 操 作 系 统 不 同 、 据 库 类 型 不 同 、 据 结 构 不 同 以及 D MS不 同 数 数 B 等 原 因 , 步 形 成 了各 个 独 立 的 异 构 数 据 库 . 互 之 间 不 能 进 行 逐 相 有 效 的交 互 。 为企 业 内部 以及 企 业 之 间 业 务 逻 辑 的 整 合 和 数 据 这 信 息 的共 享 提 出 了巨 大 的 挑 战 。 本 文 提 出 了一 种 利用 XM L作 为 中 间 件 技 术 ,进 行 异 构 数 据
e eprs n o m a on s tm ntg a o ntr i ei f r t yse i e t n. i r i
K y WO d : e r S XM L; tr g n o sDaa a e Da aI t g a o ; i de r Hee o e e u tb s ; t n e t n M d lwae r i
本 目 任 辑: 翔 栏责编 闻军
数据 库 及 信息 管 理
基于 X ML的异构数据库集成技术的研究
孙海 军 . 岩 高 ( 津 商业 大 学 信 息 工 程 学 院 , 津 30 3 ) 天 天 0 14
摘 要 : 实现 异 构 数 据 库 间信 息 的 共 享 和 集 成 , 数 据 集成 的 原 理 以 及 主 要 技 术 进 行 了研 究 。 重 点 分 析 了 XML与 关 系数 据 库之 间 为 对 的 映 射 , 出 了一 种 以 X L作 为 中 间件 的 异 构 数 据 库 集 成 方 案 , 对 其 中的 主 要 环 节给 出 了具 体 实 现 。 该 方 案 实现 了异 构 数 据 库 的 透 提 M 并
1引言
长 期 以 来 , 企 业 或 部 门 的 数 据 库 系 统 相 对 独 立 建 设 , 于 各 由 操 作 系 统 不 同 、 据 库 类 型 不 同 、 据 结 构 不 同 以及 D MS不 同 数 数 B 等 原 因 , 步 形 成 了各 个 独 立 的 异 构 数 据 库 . 互 之 间 不 能 进 行 逐 相 有 效 的交 互 。 为企 业 内部 以及 企 业 之 间 业 务 逻 辑 的 整 合 和 数 据 这 信 息 的共 享 提 出 了巨 大 的 挑 战 。 本 文 提 出 了一 种 利用 XM L作 为 中 间 件 技 术 ,进 行 异 构 数 据
e eprs n o m a on s tm ntg a o ntr i ei f r t yse i e t n. i r i
K y WO d : e r S XM L; tr g n o sDaa a e Da aI t g a o ; i de r Hee o e e u tb s ; t n e t n M d lwae r i
基于XML的异构数据库集成的研究

务I 匐 地
基于X ML的异构数据库集成的研究
Res ear n egr i t ogene ch on i t atng he er ous d a at bas b ed on X M L e as
王雅轩,顼
聪
W ANG 、 — u n XU Co g r xa . n a
一
中囝分类号 :T 3 2 P 9
文献标识码 :B
文章编号 :1 0 - 1 4 2 1 ) ( - 1 2 0 9 0 ( 0 1 1下) 0 - 2 0 3 2
D i 1 . 9 9 J is . 0 9 1 4 2 1 .( ) 4 o : 3 6} . n 1 0 -0 3 . 0 1 1 下 . 1 0 / s
互转 换 ,将 数据 存储 到 X ML数据 空 间中 ,并 维持
XML数据 空间 与各异构数 据源之 间的映射关 系 。
技术 将这个 模型映 射到 关系数 据库 。
收 稿 日 期 :2 1-1-1 00 2 7 作者简介:王雅轩 (99 16 一) ,女 ,黑龙江哈尔滨人 ,副教授 ,研究生 ,研究方向为软件理论与应用。
的映 射模式 的原理 就 是利 用 XML文 档 中的数据模
图 1 异 构 数 据 库 数 据 集 成 的构 架 图
1 数 据 服 务 器 层 :系统 数 据 的提 供 者 ,它 包 ) 括 各种 类 型 的数 据 库 。 每个 数 据 源 与 企业 内部 各
部 门的 MI S系统 相连 , 成 自己的 本地应 用 。 构
板驱 动和模 型驱 动 。在 基于模 板驱 动的映 射 中 , 并
出一
分 散 异 构 数 据 源 层
不 预先 定 义 文 档结 构 和 数 据库 结构 之 间 的映 射 关 系,而是 在数据 转换软 件 的处理模 板 中嵌 入说 明命 令 ,让数据 传输 中间件 来执 行该模板 。以模型 驱动
基于X ML的异构数据库集成的研究
Res ear n egr i t ogene ch on i t atng he er ous d a at bas b ed on X M L e as
王雅轩,顼
聪
W ANG 、 — u n XU Co g r xa . n a
一
中囝分类号 :T 3 2 P 9
文献标识码 :B
文章编号 :1 0 - 1 4 2 1 ) ( - 1 2 0 9 0 ( 0 1 1下) 0 - 2 0 3 2
D i 1 . 9 9 J is . 0 9 1 4 2 1 .( ) 4 o : 3 6} . n 1 0 -0 3 . 0 1 1 下 . 1 0 / s
互转 换 ,将 数据 存储 到 X ML数据 空 间中 ,并 维持
XML数据 空间 与各异构数 据源之 间的映射关 系 。
技术 将这个 模型映 射到 关系数 据库 。
收 稿 日 期 :2 1-1-1 00 2 7 作者简介:王雅轩 (99 16 一) ,女 ,黑龙江哈尔滨人 ,副教授 ,研究生 ,研究方向为软件理论与应用。
的映 射模式 的原理 就 是利 用 XML文 档 中的数据模
图 1 异 构 数 据 库 数 据 集 成 的构 架 图
1 数 据 服 务 器 层 :系统 数 据 的提 供 者 ,它 包 ) 括 各种 类 型 的数 据 库 。 每个 数 据 源 与 企业 内部 各
部 门的 MI S系统 相连 , 成 自己的 本地应 用 。 构
板驱 动和模 型驱 动 。在 基于模 板驱 动的映 射 中 , 并
出一
分 散 异 构 数 据 源 层
不 预先 定 义 文 档结 构 和 数 据库 结构 之 间 的映 射 关 系,而是 在数据 转换软 件 的处理模 板 中嵌 入说 明命 令 ,让数据 传输 中间件 来执 行该模板 。以模型 驱动
基于XML的异构数据源集成查询中间件的设计和实现

I
维普资讯
・3 4・
南 开 大 学 学 报 ( 自然 科学 版 )
第 4 卷 0
查询命令 传输 给相应 的数 据源所 对应 的包装器 ; () 由包装 器负责 按各 子查询 任务树 从数 据源 中查询 出数据 . 4 如果 数据 源为 非本地 数据 源 , 需要 还 将查 询请求发送 给 网络模块 , 传给远 程数据 源查询数 据信息 ; () 最 后 由包装 器将各数 据源 查询返 回的结果 信息返 回给查询 中间件 , 由中间件进行 查 向结果 的 5 并
能.
关 键 词 : 构 数 据 源 集 成 ; ML; 询 优 化 ;中间 件 异 X 查
中 图分 类 号 : P 1 T 31 文献标识码 : A
0 引
言
异 构数 据源集 成 问题是一 普遍存 在 且难 以解决 的 问题 , 今后 几年将 继续 是该 领域 的难 点 问题和 热 在
Vo1 40 N_ . O5 0c . 0 t 20 7
文 章编 号 : 4 57 4 ( 0 7 0 — 0 3 0 0 6 —92 2 0 ) 503 —7
基于 X ML 的异构 数 据 源 集成 查 询 中 间件 的设 计 和 实现
邵秀丽, 琳, 张 张 峰
(南 开 大 学 信 息 技 术科 学 学 院 ,天津 3 0 7 0 0 1)
1 异 构数 据 源集 成 查 询 中间件 原 型 的体 系结 构
本文借 鉴 了已有 的基 于 XML 的异 构数 据源集 成查 询 中间件 的一些 实现 方案_ , 中间件设 计为二 1 将 ]
层结 构 , 底层 的数 据源层 表示 现有 的异 构数据 源 以及 在 这些数 据源 上 的应用 ; 最 XML 中间件层 是最 重要
维普资讯
・3 4・
南 开 大 学 学 报 ( 自然 科学 版 )
第 4 卷 0
查询命令 传输 给相应 的数 据源所 对应 的包装器 ; () 由包装 器负责 按各 子查询 任务树 从数 据源 中查询 出数据 . 4 如果 数据 源为 非本地 数据 源 , 需要 还 将查 询请求发送 给 网络模块 , 传给远 程数据 源查询数 据信息 ; () 最 后 由包装 器将各数 据源 查询返 回的结果 信息返 回给查询 中间件 , 由中间件进行 查 向结果 的 5 并
能.
关 键 词 : 构 数 据 源 集 成 ; ML; 询 优 化 ;中间 件 异 X 查
中 图分 类 号 : P 1 T 31 文献标识码 : A
0 引
言
异 构数 据源集 成 问题是一 普遍存 在 且难 以解决 的 问题 , 今后 几年将 继续 是该 领域 的难 点 问题和 热 在
Vo1 40 N_ . O5 0c . 0 t 20 7
文 章编 号 : 4 57 4 ( 0 7 0 — 0 3 0 0 6 —92 2 0 ) 503 —7
基于 X ML 的异构 数 据 源 集成 查 询 中 间件 的设 计 和 实现
邵秀丽, 琳, 张 张 峰
(南 开 大 学 信 息 技 术科 学 学 院 ,天津 3 0 7 0 0 1)
1 异 构数 据 源集 成 查 询 中间件 原 型 的体 系结 构
本文借 鉴 了已有 的基 于 XML 的异 构数 据源集 成查 询 中间件 的一些 实现 方案_ , 中间件设 计为二 1 将 ]
层结 构 , 底层 的数 据源层 表示 现有 的异 构数据 源 以及 在 这些数 据源 上 的应用 ; 最 XML 中间件层 是最 重要
一种基于XML的异构数据集成系统结构的研究

用 , 现 企 业 内部 数 据 共 享 , 之 在企 业 运 行 中 发挥 更 大 的 作 用 , 企 实 使 是 业发展的必然需求。 主 要 任 务 是 获 得 各 异 构 数 据 源 的 信 息 , 立 公 共 模 型 和 包 装 异 构 建 数 据 源 , 为 数 据 集 成 查 询 阶 段 中的 数 据 查 询 分 解 和 结 果 合 成 提 供 支 分 中间 件 ( dao Wrp e) 术 通 过 提 供 一 个 全 局 模 式 和 对 应 各 持 。这 一 过 程 应 有 两 类 角 色 参 与 , 别 为 各 局 部 数 据 库 管 理 员 和 数 据 Me i r ap r技 t/ 数 据 源 的局 部 模 式 . 成 来 自不 同 数 据 源 的数 据 , 态 分 解 针 对 每 个 集 成 人 员 。包 括 三 个 步 骤 : 集 动
同 . 据 的统 一 性 没 有 保证 , 业 各部 门之 间无 法 进 行 信 息 共 享 , 成 成 , 成 以 XML结 构 的结 果 文 件 返 回给 用 户 。 数 企 形 生 在此 过程 可 分 成 建 立 集 了 “ 息 孤 岛 ” 严 重 影 响 了 信 息化 对 企业 的 服务 能 力 l 如 何 通 过 网络 成 模 式 和 数 据 集 成 查 询 两 个 阶 段 。 信 , l 】 。 . 有 效 地 对 这 些 不 同来 源 、不 同 格 式 的数 据 进 行 有 效 的 集 成 访 问 和 利 21 建 立 集 成 模 式 阶 段
随着 信 息 化 建 设 的 深 入 . 当数 量 的企 业 积 累 了 大 量 建 立 于 不 同 相 该 系 统 的 工 作 过 程 是 , 户 输 入 全 局 数 据 查 询 信 息 , 据 公 共 模 用 根 的时 间 、 储 在 不 同 平 台 、 存 依赖 于 不 同数 据 库 管 理 系统 的数 据 ( 关 系 型 将 全 局 查 询 分 解 为 针 对 各 异 构 数据 源 的 子 查 询 , 各 子 查 询 传 递 给 如 将 型数 据 库 数 据 、 ML文 档 、 本 文 件 等) 由 于数 据 格 式 、 码 标 准 不 各 数 据 源 执 行 .各 数 据 执 行 的 子 查 询 结 果 根 据 公 共 模 型进 行 结 果 合 X 文 。 编
同 . 据 的统 一 性 没 有 保证 , 业 各部 门之 间无 法 进 行 信 息 共 享 , 成 成 , 成 以 XML结 构 的结 果 文 件 返 回给 用 户 。 数 企 形 生 在此 过程 可 分 成 建 立 集 了 “ 息 孤 岛 ” 严 重 影 响 了 信 息化 对 企业 的 服务 能 力 l 如 何 通 过 网络 成 模 式 和 数 据 集 成 查 询 两 个 阶 段 。 信 , l 】 。 . 有 效 地 对 这 些 不 同来 源 、不 同 格 式 的数 据 进 行 有 效 的 集 成 访 问 和 利 21 建 立 集 成 模 式 阶 段
随着 信 息 化 建 设 的 深 入 . 当数 量 的企 业 积 累 了 大 量 建 立 于 不 同 相 该 系 统 的 工 作 过 程 是 , 户 输 入 全 局 数 据 查 询 信 息 , 据 公 共 模 用 根 的时 间 、 储 在 不 同 平 台 、 存 依赖 于 不 同数 据 库 管 理 系统 的数 据 ( 关 系 型 将 全 局 查 询 分 解 为 针 对 各 异 构 数据 源 的 子 查 询 , 各 子 查 询 传 递 给 如 将 型数 据 库 数 据 、 ML文 档 、 本 文 件 等) 由 于数 据 格 式 、 码 标 准 不 各 数 据 源 执 行 .各 数 据 执 行 的 子 查 询 结 果 根 据 公 共 模 型进 行 结 果 合 X 文 。 编
基于XML的高校异构数据交换平台设计

据 交 流 等 问题 。其 中 的单 位 与部 门都 是 数据 源 的个 体 , 每
一
个 体 都 会 是 异 构 的模 式 , 因而 组 成 了繁 琐 而 庞 大 的异 构
数 据 库 环 境 。将 信 息 系统 有 效 集 成 , 并 实 现集 成 数据 的 共 享, 让全校师生都能 够拥有 相 同的集成共 享平 台, 对 数 字 校 园 的创 建 而 言 , 具 有 一 定 的 现实 意 义 。
第1 3 卷 第2 期 2 01 4 年 2 月
软 件 导 刊
S of t wa r e Gu i d e
Vo1 .1 3 No.2
F e b .2 01 4
基 于 XM L的高 校 异构 数 据 交 换 平 台设 计
李 秉键
( 嘉应 学院 计算 机 学院 , 广东 梅州 5 1 4 0 1 5 )
源 。按 照 相 应 的使 用 模 式 , 具 体 包 含 3种 , 即 关 系 型 数 据
库、 XML纯 文 本 文 档 以及 相 关 应 用 数 据 , 其 中 的应 用 数 据 目前 较 为 显 著 的 标 记 性 语 言 模 式 。然 而 , XML是 元 标 记
的语 言 类 型 , 一方 面囊 括着 S GML 的 扩 展 性 能 和 巨 大 的
虚 拟 视 图法 所 具 备 的独 特 优 势 是 , 将 中 间模 式 增 加 在
数据源 中 , 此 中 间模 式 利 用 制 定 好 的数 据 模 型 开展 详 细 的 数据描述 , 以此 将 不 同 事 物 的 约 束 、 联 系、 属性 、 结 构 等 反
映 出来 。在 查 询 过 程 中 , 系统 能够 通 过有 效 分解 用 户 的查 询, 来操作各个 数据源 , 在结 束 查 询 的 过 程 中 , 需 要 将 每 个
基于XML的异构数据库集成的研究

S u y o n e r to fh tr g n o s d t b s a e n XM L t d n i tg a i n o e e o e e u aa a e b s d o
W ANG — 0 g, Z Nih n HANG a g li Gu n -e
太 适用 。
() 2 中间件技术 中间件是位于 CS之间的中介 接 口软件 , 异 / 是
() 2模式异构 , 即数据源在存储模式上的不 同。
存储模式主要包括关系模式 、 对象模式 、 对象关系模 构系统集成所需的粘接剂 , 是保证操作系统 、 通讯协 式和文档嵌套模式等几种 , 其中关系模式 ( 关系数据 议 、 数据库 间进行对话 、 互相操作的软件系统。现有 库) 为主流存储模式。同时 , 即便是 同一类 存储模 的数据 库 中间件 允许 C et ln 在异构数据库 上调用 i 式, 它们的模式结构可能也存在着差异。例如不同
同时 , 每个数据库系统仍保有 自己的应 用特性 、 完
整 性控 制 和安全性 控 制 。用 户可 以通过本平 台对 这
置上的多个业务数据管理系统中的数据 , 如图 l 所 示。异构数据源的整合 、 集成是企业 信息化建设 过 程经常遇到的一个现实 问题 , 也是制约企业各种应
些数据库里的数据进行各种操作 , 同操作一个单 如
一
X (x n b a u agae技术作为异构 ML Et s lM r pL ug) e ie k n 数据集成与异构数据交换解决方 案有其先天优势。
XL M 包含了大量 “ 自描述” 性标记来精确 的表示信 息的各种含 义, 它提供 了丰富的数据构造和解析方 法, 能够适应多样并且不断变化的网络应用环境 , 被
基于XML的异构数据库集成技术研究

£7 { | / 嵌务 入 服 《模 淼 j V l } I 式
lI 局 , ‘ ●
l
q
’ .
L
一 一 ,
记语言 ,x 能够根据具体应用灵 活 地表现异构数据源 中的各种信息 ,包
括应用程序之间的数据交换 、结构化 和半结构化文档 以及数据库 中数据 的 输出.随着 X L技术 的兴起 ,异构数 M 据源 的集 成问题 成为数据库领域研究
刘淑 梅
( 水学院 衡 现 代 教育 技 术 管 理 中心 ,河 北 衡 水 0 3 0 ) 5 0 0
摘 要 :异构数据库 系 统的集成是 当 前数据处理领域的研究热点,它能有效地利用信息资源,实现数据共享.提出了一
种基于 X L的异构数据库集成的方法,X L中间件层是异构数据 源集成的关键和核心 ,它能够 实现 X L数据模型与数据 源 M M M 各数据模型之 间的映射和数据源文档与 X L文档 的相互转换. M 利用这种方 法可有效地集成各种数据格 式的异构数据库 系统
集成应 用系统 除了要集 成传统 的异构
信发 彳 息 布 ll
, , r — 、
.
◆
用 查 户询
腑 器
/
用屡 户
数据库 ,还 要集成 W b上这些新 的数 e 据源 ,如何实现异构数据源 集成应 用 在 W b上 的实现 ,其中一个关键技术 e 是如何 以一种统一 的数据模 式描述 各
关键 词 :XL M;中间件;数据集成;数据模型 中图分类 号 :T3 11 P1.3 文献 标识码 :A 文章编 号 :17—0520) 102—3 6326 (08O—0 70
随着计算机 网络技术 的迅速发展,出现 了许多新的数据形式,如 电子邮件、H M T L文档等信息,与这些数据 相 比,传统数据库 中的数据具有严格的存储格式 ,数据的各种操 作具有严格 的规范 ,因此 ,传统数据库中的数 据称为结构化数据 .而互联网上的大量 数据缺乏统一 固定的模式,数据往往是不规则的并且是经常变动的,这 些数据 是先有 数据后 有模式 ,即半结 构化数据.在 W b上实现异构数据源 e
基于XML的异构数据源集成与交换的实现

具体实现方法。
关 键 词 数 据 集 成 数据 交换 X ML 异 构 数 据 源
I P M LEM ENTATI oN OF HETERoGENEoUS DATAS OURCES I NTEGRATI oN AND EXCH ANGE BAS ED oN XM L
tb s t ln e o tn n g me t b sn s p i d , o ma in i t ga in a d c re p n i gt ost c ss p ot r , h c a n g a ae s l e dcne t i ma a e n , u i e sa t u e i r t n e r t n o r s o dn l o a t u p re s w ih c n ma a e t f n o o o a
●
Ke wo d y rs
Daa i t ga in D t x h n e XML He e o e e u a a s u c t n e t a a e c a g r o t rg n o s d t o r e
( 东省公安厅 广
摘 要
异构的数据源是 大部分大 型应用 系统所面临的 问题 , 数据库技术在 很 大程度上还 需要依 靠 内容 管理 、 商业智能 、 信息集
成 以及相应的工具等技术做支撑 , 以对不 同平 台上 的信息进行 实 时管理。研 究 了以 X ML作 为中间数据格 式 , 于完成 多个 独立 的 用 异构系统之间的数据集成和数据交换 , 并通过一个应用系统实例 阐述 了 X I 与 D M 技术相 结合进行 异构 数据源之 间信息交换 的 M O
基于 X ML 的异 构 数 据 源 集 成 与 交 换 的 实 现
关 键 词 数 据 集 成 数据 交换 X ML 异 构 数 据 源
I P M LEM ENTATI oN OF HETERoGENEoUS DATAS OURCES I NTEGRATI oN AND EXCH ANGE BAS ED oN XM L
tb s t ln e o tn n g me t b sn s p i d , o ma in i t ga in a d c re p n i gt ost c ss p ot r , h c a n g a ae s l e dcne t i ma a e n , u i e sa t u e i r t n e r t n o r s o dn l o a t u p re s w ih c n ma a e t f n o o o a
●
Ke wo d y rs
Daa i t ga in D t x h n e XML He e o e e u a a s u c t n e t a a e c a g r o t rg n o s d t o r e
( 东省公安厅 广
摘 要
异构的数据源是 大部分大 型应用 系统所面临的 问题 , 数据库技术在 很 大程度上还 需要依 靠 内容 管理 、 商业智能 、 信息集
成 以及相应的工具等技术做支撑 , 以对不 同平 台上 的信息进行 实 时管理。研 究 了以 X ML作 为中间数据格 式 , 于完成 多个 独立 的 用 异构系统之间的数据集成和数据交换 , 并通过一个应用系统实例 阐述 了 X I 与 D M 技术相 结合进行 异构 数据源之 间信息交换 的 M O
基于 X ML 的异 构 数 据 源 集 成 与 交 换 的 实 现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 解决 高校异构数据 源集成 的方法
1 给 各 种异 构 数 据 源 分 别 建 立 不 同 的用 户 交 )
互接 口, 不进行任何模式 的集成 。这种方法实现最 为简单 , 但用户不能透明访问数据 , 而且增加新的异
构 数据 源 时 , 须增加 新 的访 问接 口, 利于 系统 的 必 不
第2 7卷 第 2 3期 21 0 1年 1 2月
甘肃科 技
Ga s c e c n e h oo y n u S in e a d T c n lg
I 2 No 2 2 7 I .3 De . c 2 l O 1
基 于 X 校 异构 数 据 源 系统 的集成 设计 ML高
扩充。
基于以上对 异构数据源集成方法 的对 比分析 , 其中以中间件的方案最优。以下将讨论基于 X L M 的异构数据源集成中间件的设计方案 。
2 采用联邦 数据 库系统结构。联邦数据库 系 ) 统是由一组互相协作的但保持各 自自治性 的成员数 据库系统组成 , 通过数据源之间的数据交换格式进 行一一映射 , 也就是说 , 不同的数据源之间使用数据 转换接 口来实现数据互访 , 从而实现任意两个数据
科
技
第2 7卷
nt 用 的事实 上 的数 据格 式标 准 。X e应 ML文 档不 是 传 统意 义上 的文 档 , 是 一 种 数据 库 化 的文 档 。面 而
询时再 进 行权 限 的检查 , 发现 用户 无此 权 限肘 , 中间
向内容 的标记 , 使计 算机很容 易理解数据 的含义。
换 (D ) E I 中。 1 x L是一 种半 结 构化 的数据 模 型 , 的 自我 )M 它
过 程产 生 的数 据都 被 视 为无 效 , 会 多做 很 多无 用 就 功r 引。
+
●
‘
这一特性使它可以应用 于 We b数据和电子数据交 3 2 2 查 询 结果的 集成 ..
中 图 分 类 号 :P 9 T 31
源可 以相 互访 问 的 Fra bibliotek的。如果 有 a 异构 数据 源 需 个
1 什 么是高校异构数据源
高校 中结构 或者 形式 不一 样 的多个 数据 源构成
要相 互访 问 , 么 就需 要 构 造 a ( 那 a—1 个 映射 程 ) 序来 支持 这 a 异构 数据 源之 间的相互 访 问 。这些 个
数 据 源 在存 储 模 式 上 的不 同 , 据 源 可能 采用 数
文档模式 , 关系模式 , 对象模式 以及对象关 系模式等 模式中的任意一种 ( 中关系模式是现在 主流存储 其 模式) 。同时 , 即便是 同一类存储模式 , 它们 的模式 结构可能也存在着差异。
4 利用 中间件集成异构数据源 【 。中间件实 ) l J
桂 春
( 西北 民族 大学 数学与计算机科学 学院 , 甘肃 兰州 70 3 ) 3 00
摘 要: 高校信息系统需要访 问异构数据 源中的数据 , 因此 , 要一 种新的系统 架构来 解决多个 异构数据 源 的信息 需 访 问问题 。首 先对 高校 信息化建设 过程中遇到 的异构数据 源问题 进行 了分析 , 比较了 目前 已有的异构 数据 源集 并
的数 据 源 中查 询一 样 , 于 进行 联 机 分 析 和 数据 挖 便 掘, 缺点是 数据 需要 定期 更新 , 否则 就会发 生数 据源 和用 户使 用 的数据仓 库 中数据 不一致 的问题 。
系型数据库 S LS R E , Q E V R 财务处的数据库是简单 数 据库 A C S , 人 事 处 的 数 据 则 是 文 本 数 据 、 C ES 而
了高校异构数据 源。比如说 , 教务处 的数据库是关
成员数据库系统可以不同的程度集成。这种方案的 优点是容易实现 , 缺点是工作量大 , 扩展性差。 3 使用数据仓库。它是把来 自于多个数据库 ) 的数据副本都存储在单一的数据库中。在这种结构 中, 所有数据库 的数据都被抽取出来 , 通过预处理、 转换 , 以符合数据 仓库的模式 , 存储在数据仓库 并 中, 用户可以通过统一的数据接 口对历史数据访问。 这种方案的优点是用户使用查询就像是在原来单一
3 基于 X ML异 构数 据源集 成 中间件
设 计 31 X . ML的优越 性
X ( xes l MakpLnug) W3 ML E t ie ru agae 是 nb 织 C组 于 18 9 2年 2月发 布 的标准 。它 已经成 为基 于 It - ne r
2 4
甘
肃
X L数据等等 , M 当校长需要了解某教师的基本情况 时 , 这三 处得 到 的数 据 不能及 时 整合 到一起 , 从 因为 它们是来 自不同数据源的数据 , 构成了异构数据源。
1 1 系统 异构 .
数据源所在的业务应用系统 , 数据库 管理系统 以及操作系统的差异性。 12 模式异 构 .
成 方法的优劣性 , 比较 的基础上介绍 了 X L技术 的优越性 , 而提 出了 X L框架下异 构数据源集成 中 间件 设计 在 M 进 M 的数 据集成 方案 。最后 总结了异构数据源集成前后不同系统 访问时接 口数量的变化 。
关键 词 : 异构数据源 ; 邦数据库 ; 联 数据仓库 ; 中间件 ;M X L
把 从 多个 数据 源查询 得 到 的结 果 集成 在一 起发 送 给用 户 。这 是一 个 映 射过 程 , 体 的 映 射集 成 过 具
际上是一种软件组织 , 位于异构数据库源系统数据 层 和应用 程序 应用 层 之 间 , 用户 的查 询 先 提 交给 中
间件 , 中间件将 用户 的查 询 翻译 成 一 个 或 者 多个 对 数据 源 的查 询 , 再将 数 据 源 对查 询 的响 应 进行 综 合 处理 , 造 出用 户 需 要 的数 据 模 式 。该 方 法 不需 要 构 改变 原始 数据 的存储 和 管理方式 - 。 2 】