异构数据库高效数据交换引擎设计

合集下载

大数据交换共享中心方案设计

大数据交换共享中心方案设计

数据互换共享中心设计方案整合协同平台的重要功能是从其他子系统中提取共享数据,并对多来源渠道的、互相不一致的数据进行数据融合解决;基于数据字典对实时数据和历史数据进行组织,以保证数据间关系的对的性、可理解性并避免数据冗余;以多种形式提供数据服务,采用分层次的措施对各类顾客设立权限,使不同顾客既能获得各自所需要的数据,又能保证数据传播过程的安全性及共享数据的互操作性和互用性;维护基本信息、动态业务数据以及系统管理配备参数;支撑系统的网络构架、信息安全、网络管理、流程管理、数据库维护和备份等运维能力。

整合协同平台根据功能可分为两个部分:第一部分,基本数据和共享数据的互换服务和路由流程管理,该部分是互换平台的基本,涉及:静态互换数据、动态互换数据、图形数据及表格、记录资料等属性数据。

第二部分,各子系统之间的接口实现,根据事先制定好的规范、原则,实现各子系统之间的数据共享和传播操作。

在接入中心平台时,应按系统集成规定设计系统构造,各类数据接口遵循系统集成规范。

第一章中心平台设计1.1 平台功能构造整合协同平台服务器是公共基本平台的核心部分,XMA整合协同平台提供一整套规范的、高效的、安全的数据互换机制。

XMA整合协同平台由部署在数据中心和各业务部门的数据互换服务器、数据接口系统共同构成,解决数据采集、更新、汇总、分发、一致性等数据互换问题,解决按需查询、公共数据存取控制等问题。

各业务子系统都要统一使用XMA整合协同平台进行数据互换。

数据中心统一管理和制定数据互换原则。

各业务部门通过数据级整合或者应用级整合通过XMA 整合协同平台向数据中心提供数据,也通过XMA整合协同平台访问共享数据。

XMA整合协同平台的基本功能如下:共享数据库的数据采集、更新、维护。

业务资料库、公共服务数据库的数据采集。

提供安全可靠的共享数据服务。

业务部门之间的业务数据互换。

结合工作流的协调数据服务。

管理、控制、配置、传输管理、安全接口数据需方数据库应用数据层接口应用层接口数据转换传输管理接口适配共享交换数据供方数据库应用数据层接口应用层接口数据转换传输管理接口适配传输传输数据压缩加解密故障检测协议管理传输控制连接共享数据解析数据转换数据模板服务管理运行管理部署管理数据路由会话控制会话策略会话模式系统日志共享交换共享交换共享交换功能流程阐明:数据供需方的接口数据系统:为了满足应用层互换和数据层互换,互换代理必须有应用层和数据层的连接和接口适配功能,数据代理必须有数据格式的转换功能。

数据交换平台建设方案

数据交换平台建设方案

数据交换平台建设方案一、背景分析。

随着信息化时代的到来,各行各业都在积极推进数字化转型,数据交换平台作为信息化建设的重要组成部分,扮演着连接各个系统、实现数据互通共享的关键角色。

然而,目前我公司在数据交换方面存在着诸多问题,包括数据传输效率低、安全性不足、兼容性差等。

因此,为了提高数据交换的效率和安全性,我们有必要建设一套完善的数据交换平台。

二、建设目标。

1. 提高数据交换效率,通过建设数据交换平台,实现各个系统之间数据的快速、稳定、安全地交换,提高数据传输效率,降低数据交换成本。

2. 加强数据安全保障,建设具备完善的数据加密、防火墙、访问控制等安全机制,确保数据在传输过程中不被非法获取、篡改或破坏。

3. 提升系统兼容性,建设数据交换平台,实现不同系统之间的数据格式转换和兼容,确保各个系统之间能够互相交换数据。

4. 实现数据实时同步,建设数据交换平台,实现数据的实时同步,确保各个系统之间的数据能够及时更新,保持数据的一致性。

三、建设方案。

1. 技术选型,选择成熟稳定的数据交换平台软件,如MuleSoft、Talend、Dell Boomi等,根据实际需求进行技术评估和选型。

2. 网络架构设计,根据公司现有的网络环境和数据交换需求,设计合理的网络架构,包括内部网络、外部网络和云端网络的连接和通信方式。

3. 数据安全保障,建设数据交换平台时,加强数据加密、访问控制、身份认证等安全机制,确保数据在传输过程中的安全性。

4. 数据格式转换,建设数据交换平台时,考虑不同系统之间的数据格式差异,实现数据的格式转换和兼容,确保数据能够在不同系统之间流畅传输。

5. 实时同步机制,建设数据交换平台时,实现数据的实时同步,确保各个系统之间的数据能够及时更新,保持数据的一致性。

四、建设步骤。

1. 确定需求,明确公司各个系统之间的数据交换需求,包括数据类型、数据量、数据频率等。

2. 技术选型,根据实际需求进行技术评估和选型,选择合适的数据交换平台软件。

数据交换共享中心设计方案

数据交换共享中心设计方案

数据交换共享中心设计方案数据交换共享中心设计方案1. 引言在信息化时代,大量数据的产生和积累对于企业管理和决策起着重要作用。

为了实现数据的高效共享和利用,设计一个数据交换共享中心是必要的。

本文档旨在提供一个详细的设计方案,以指导数据交换共享中心的建设和运营。

2. 目标与需求分析2.1 目标- 实现不同系统之间的数据交换- 高效共享数据,提升决策效果- 提供稳定可靠的数据交换平台2.2 需求分析- 数据接入和采集需求分析- 数据质量和一致性的保证- 数据存储与管理需求分析- 安全与权限的管理需求分析3. 架构设计3.1 系统架构图在数据交换共享中心的设计中,采用分层架构,包括数据采集层、数据存储与管理层、数据应用与共享层。

3.2 数据采集层设计- 按照数据来源划分不同的数据采集接口- 设计数据采集任务调度和监控机制- 确保数据采集的可靠性和高效性3.3 数据存储与管理层设计- 设计数据存储和管理策略,包括数据模型设计、数据仓库设计等- 设计数据清洗、加工和集成等数据处理流程- 设计数据备份和恢复机制,保障数据安全性3.4 数据应用与共享层设计- 设计数据查询与分析工具- 设计数据共享与访问权限控制机制- 设计数据报表和发布机制4. 数据质量和一致性保障4.1 数据清洗和验证- 设计数据清洗和验证规则- 设计数据清洗和验证流程4.2 数据一致性保障- 设计数据同步和更新机制- 设计数据冲突解决机制5. 安全与权限管理5.1 安全管理- 设计数据交换的加密和传输机制- 设计用户身份认证和授权机制- 设计访问审计和安全监控机制5.2 权限管理- 设计数据访问权限控制策略- 设计角色和用户权限管理机制6. 系统可靠性和性能优化6.1 系统可靠性保障- 设计系统容错和自动恢复机制- 设计系统监控和报警机制6.2 性能优化- 设计数据存储和查询的优化策略- 设计系统资源的合理分配和利用策略附件:详细的系统架构图、数据模型设计图、系统实现方案等。

异构数据融合与集成的数据交换与共享

异构数据融合与集成的数据交换与共享

异构数据融合与集成的数据交换与共享一、引言随着当今信息技术的快速发展,各行各业的数据生成量不断增加,这些数据来源于不同的数据源,由于数据生成的时间、地点、形式、结构、语义等方面的异构性,导致了数据的融合与集成变得愈发困难。

然而,异构数据融合与集成对于实现数据交换与共享至关重要,它不仅能够提高数据的综合利用效率,还能够促进各领域之间的合作与创新。

因此,本文将重点探讨异构数据融合与集成的数据交换与共享。

二、异构数据融合与集成的概念和意义1. 异构数据融合与集成的概念异构数据融合与集成是指将不同地点、不同时间、不同形式、不同结构、不同语义的数据融合成一个统一的数据集,并提供一种统一的访问接口,以方便用户获取和利用数据的过程。

它涉及多个领域的数据融合与集成,包括数据库管理、数据挖掘、信息检索、人工智能等。

2. 异构数据融合与集成的意义异构数据融合与集成的意义在于将不同数据源的异构数据整合起来,提供了一种更加全面、全局的数据视角。

通过数据融合与集成,可以充分利用多样性的数据资源,实现数据的共享与交换,为决策提供更加全面和准确的信息支持。

此外,异构数据融合与集成还可以促进不同领域之间的合作与创新,推动产业升级和经济发展。

三、异构数据融合与集成的挑战与解决方案1. 异构数据融合与集成的挑战异构数据融合与集成面临着多个挑战,主要包括数据源的异构性、数据质量的差异、数据语义的不一致、数据安全与隐私等。

其中,数据源的异构性是最大的挑战,如何解决不同数据源之间的数据格式、数据结构、数据语义的差异,是关键问题之一。

2. 异构数据融合与集成的解决方案为了克服异构数据融合与集成的挑战,需要采取一系列的解决方案。

首先,可以使用数据转换和数据集成技术,将不同数据源的数据进行格式和结构的转换,以便于数据融合与集成。

其次,可以利用数据清洗和数据质量评估技术,对数据进行清洗和过滤,提高数据的质量和一致性。

同时,还可以利用自然语言处理和知识表示技术,解决数据语义的不一致问题。

异构数据库间数据交换技术研究与实现

异构数据库间数据交换技术研究与实现

象 模 型 D M fou et0 je Moe1以 及 文 档 类 型 定 义 D D O D e m n bet dl T (ou et yeD f io) 。 D c m n p e nt n ̄ T i i X ML是 一 种 元 语 言 所 谓 “ 语 言 ” 就 是 能 够 帮 助 不 同 个 人 元 . 和 组 织 定 制 自己 的标 记 语 言 的语 言 . 制 后 的标 记 语 言 可 以 用 于 定 特 定 的 应 用 领 域 中 实 现 信 息 数 据 的 交 换 . 比 如 在 科 技 领 域 的 Ma ML t h ,无线 通 信 应 用 的 WML ,在 网 络 图 象 方 面 的 S G等 等 V X ML是 以 文 本 形式 来描 述 数 据 结 构 的一 种 文 件 格 式 . 以 适 合 于 所
( ol eo o ue c n e n e h o g , u a ie i o eh o g , u a 3 0 0C ia C l g f mp t S i c d T c n l y e C r e a o W h n Un rW f c n ly W h n4 0 7 , hn ) v s T o
G UA N H u i
Re e r h a d Re l a in o t x h n e Te h o o y b t en He e o e e u s a c n a i t fDa a E c a g c n l g e we t r g n o s D ̄ab s z o a e
维普资讯
本 目 任 辑 闻 军 栏 责 编 : 翔
数据 库 及 信 息管理 ・
异构数据库 间数据 交换技术研 究与实现
关 辉 ( 汉理 工 大 学 计 算 机 科 学 与技 术 学 院 , 北 武 汉 4 0 7 ) 武 湖 3 0 0

异构数据库集成系统设计与实现

异构数据库集成系统设计与实现
同公 司 开 发 的 , 而 它 们 经 常 是 在 不 同平 因
合 , 企 业 的 信 息 资 测 验 , ( 1所 示 , 次 将 产 生 一定 如 图 ) 每 数量 的数 据 , P MS 而 I 系统 内部 设 有数 据 服 务 器 、 用 服 务器 以 及 若 干 工 作 站 , 应 本项 目
的 需 要 实 现 的 目的 即 是 : 过 工 作 站 可 以 通
台 下 或 者 是 在 不 同的 后 台数 据库 环 境 下运 而 搭 建 起 整 个 企 业 的 信 息 平 台 。 大 多 数 在
几 达 行的 , 很难 实现 数 据 共享 、 据 交 换和 数 据 企 业 中 , 乎 各 部 门 都 使 用 和 他 们 业 务 相 随 时 获 取 靶 场 测 试 的 最 新 数 据 , 到 远 程 数

致性 , 因此 形 成 一 个 个 企 业 内 部 的 信 息 关 的 管 理 系 统 , 些 系 统 往 往 是 不 同 公 司 这
访 问 的要 求 , 同时 , 场 测 试 工 作 人 员 将 通 靶
孤 岛 。 据 库技 术 是 数据 管 理 的 最 新技 术 , 数
开 发的 , 因而 它 们 经 常 是 在 不 同 平 台 下 或 过 本 项 目开 发 软 件 及 时 的将 数据 提 供 给 服 务器, 备工作站访 问。 以
功 应 用 于 企 业 管 理 , 据处 理量 急剧 增大 , 数 这 本 身 就 已经 存在 , 拥 有 自 己的 DMBS。 都 异 数 据 的 集 成 , 能 集 成 在 一 定 程 度 上 必 须
支持 数 据 集 成 。 数 据 集 成 包 括 两 个 系统 而 的数 据 共 享 、 据 同 步 。 数 XG2 4 统 本 身是 l系

数据集成和数据传递双模式访问异构数据库中间件框架设计

数据集成和数据传递双模式访问异构数据库中间件框架设计

1引言
随着 We b技 术 的不 断发 展 ,信 息 共享 和 数据 交换 的 范 围不 断扩 大 ,传 统 的关 系数 据 库 也面 临着 挑 战 , 种 不 同的数 据 库管 理系 统之 间的异 构性 及其 所 依赖 操 作系 统 的异构 性 , 各 严
重 限制 了信 息共 享和 数据 交 换范 围【2 。】 .。
个统一 的用户界面 ,为对异构数据库进行直接的 We b访问提供了新的解决方案n1 。 。
2 9
3期
一 总 5 1
21 M . X L的特 点
X ML具有跨平台、直接动态支持 We 操作、在数据描述方面灵活、可扩展、自描述 的 b
优点 ∞ ML在支持异构数据库系统方面有很多自身的优点:OX 。 ,X d ML结构性强、语义性

51
※编程 技术
应 用 实践 ※
数据 集成和数据 传递双 模式访 问异构数据 库 中间件框 架设计
邓念 东
( 安 科技 大学 地质 与环 境 工程 系 陕西 西安 7 0 5 ) 西 0 4 1
【 摘要 】本 文对 基于 Jv 和 X aa ML技术 的异 构数据库访 问中间件进行框架 设计。该中间件可根
据数据 用户的不 同需求,灵活 自动 的选择数据集 成或数据传 递访 问模式 ,能高效率 、低消耗地 实现异 构数据库信 息共享。 由于其 具有可扩展性 、可配置性 、通用性 、松 散耦合性等特 性 ,使
其 易于 部 署 在 不 同 w b应 用 环 境 下 。 e
【 关键词 】X ML ;中间件 ;异构数据库 ;数 据集 成 ;数据传递
异 构数 据库 的 异 构性 主要 体 现在 以下几 个方 面 【 】 计算 机 体系 结 构 的异 构 :各 个参 l :① I 2 与 的数据 库 可 以分别运 行 在 大型 机 、小型 机 、工 作站 、P 或 嵌入 式系 统 中 ;② 操 作系 统 的 C 异构 :各个 数据 库 系统 的操 作系 统可 以是 S l i、Wid ws iu 等 ;(DMBS的异构 : oa s r no 、Ln x  ̄ )

大型异构数据库数据迁移系统的研究与应用

大型异构数据库数据迁移系统的研究与应用
d f r n tu t rs t ov h r be o eeo e e u aa mo es d s r t n a d g n rc c n e so . B a sn aa ma p n s a d i e e tsr cu e o s le t e p o lm f h t r g n o s d t d l e c p i n e e o v rin f i o i y p r ig d t p i g n c mp l g d t l s h aa mir t n a d b c — — r i a o v ri n a n a g ee o e e u aa a e r e l e .T i s s m a o i n a a f e ,t e d t g a i n a k t o g n lc n e s mo g l r e h t rg n o s d tb s s a e r ai d i i o o i o z hs yt h s e b e p r t g o h il s I h s d n l a aa mir t n,a d a h e e n f d ma a e n n i tn n e wi x lr t n a d e n o e ai n t e f d . t a o e wel t d t ga i n e o n c i v d u i e n g me ta d man e a c t e po ai n i h o
取 这 个 字 段 值 的 条件 需 要 根 据 参 照 表 中 的 一 个 或 多 个参 照 字 段
(目 2 标代码表代码名称与潦代码表中的代码名称对应 ) ( 棒目标代码寰中的代码名称所对应的代码位填写到目标表中 3 )
来确定 , 这些参照字段与 源表有相应 的映射关 系。数据处理 规
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第39卷 第9期西南师范大学学报(自然科学版)2014年9月

Vol.39 No.9 Journal of Southwest China Normal University(Natural Science Edition)Sep.2014

DOI:10.13718/j.cnki.xsxb.2014.09.018

异构数据库高效数据交换引擎设计①

黄学彬1, 赵 春2, 郑 伟1

1.四川大学锦城学院教务部,成都611731;2.四川大学锦城学院计算机科学系,成都611731摘要:针对异构数据库之间数据交换软件的数据交换不规范、网状数据不通畅、数据同步无保证等问题,设计了一个通用安全高效的数据交换引擎.该设计采用影子表法获取数据,利用文本差异比较得出变化的数据量,并运用差异分析算法解析出数据变化结果集.设计中的数据交换规则与数据更新结果存储均采用了XML文件格式作为媒介,为了保证数据的安全性与可靠性,设计要求对需要传输的数据进行加密处理,并采用可靠的TCP作为数据传输协议的载体.实验表明,该文设计的异构数据库交换引擎可以高效率地完成异构数据库之间可靠、安全的数据交换.

关 键 词:异构数据库;高效数据交换;XML;差异分析;

影子表法

中图分类号:TP391 文献标志码:A 文章编号:1000-5471(2014)9-0100-09

在信息化不断发展的过程中,企业用户的应用也在不断扩充,企业自己的新应用也在不断增加,进而都会面临不同软硬件平台、不同类型的数据库之间的数据交换问题[1].不同软硬件平台、不同语义设计、不同网络环境等多种模式的并存造成了不同数据库之间的数据交换不规范、数据同步与数据安全无保证等问题,并由此产生了“信息孤岛”的现象[2].

现有的软件已经很难解决这种异构数据库之间的数据交换难题[3].数据库管理系统(DBMS,Database

Management System)为了最大程度地解决这个难题,一般都提供了相应的数据交换工具,但因与具体的

DBMS耦合性太强,以至于失去了通用性[4];中间件技术虽然可以很好地解决这个难题,但是中间件技术由于本身比较复杂,不容易实现,而且还需要昂贵的软硬件资源[5-6],对于一般的企业来说负担太重,

从而

很难实现普及;中间数据法采用一种公共的数据格式作为媒介进行数据交换,通过双方既定的协议完成最终的功能,该方法成本较低,可扩展性强[7-8],但是实现中必须考虑网络环境、

运行效率以及数据的安全

性[9-10].本文将采用中间数据法设计一个灵活高效、简洁透明的异构数据交换系统,该异构数据库数据交

换引擎(HDEDEE,Heterogeneous Database Efficient Data Exchange Engine)

只需要简单的配置即可准时

性地完成异构数据库之间数据安全可靠的互相访问.

为了设计出简单易用、成本低廉、并且通用的数据库交换引擎,我们有必要对其进行适当的分析,从而了解其基本特性,以找出合适的解决方案.

1 

异构数据库系统分析

异构数据库系统是对分布式数据库系统的集成和发展[10],

它们最根本的区别是分布式数据库系统拥

有自己单独的逻辑数据库,只有一个DBMS

,该DBNS为其整个系统提供一致的插入、查询、删除、更新等

①收稿日期:2014-02-29

基金项目:四川省应用基础项目“基于互联网应用的企业智能消息系统EIMS研究与实现”资助(10JC0335).

作者简介:黄学彬(1968-),男,四川蒲江人,博士,副研究员,主要从事计算机软件及互联网应用研究.操作;而异构数据库系统则是由多个自主的数据库系统通过适当程度的集成而构成的一个数据库系统.

异构数据库系统物理分布整体上可以概括为以下2种情况:同一个局域网内以及在不同的局域网内.

无论异构数据库系统是处于同一个局域网内还是在不同的局域网内,都具有分布性、异构性、自主性等3

个主要的特征.

1.1 

分布性

异构数据库系统的各个组成部分并不在同一个地理位置,而是分布在不同的地理位置,它们通过各式各样的网络建立连接.数据保存在各个数据库系统中,这些数据可以以各种不同的方式保存,没有严格的逻辑要求.

1.2 

异构性

1)不同的计算机体系结构:独立的数据库系统可以运行在大型机、工作站、微机等系统中.2)不同的计算机操作系统:独立的数据库系统可以被安装在不同的操作系统中,如Unix,Windows等.3)不同的DBMS:独立的数据库系统可以是MySQL,Oracle,SQLServer等,也可以是Redis、Monogdb等.4)不同的语义:数据库设计人员对数据定义、描述的二义性,会造成命名、数据存储类型、关系表达

等的二义性.

1.3 

自主性

各个子系统都拥有自身系统内对应资源的使用权,包括增加、删除、修改、查询等,同时拥有与系统内其他子系统交互的权利,包括加入、退出、提供服务等.

从上面的分析可以看出,异构数据库系统中各子系统情况相当复杂,各子系统之间的数据共享会遇到各种各样的困难,针对这个难题,本文设计了一个数据交换引擎,用于同步多个同构或者异构的数据库之间相关的数据,该引擎具有通用性,并且操作简单易用.

图1 异构数据库数据交换网络2 

高效数据交换引擎设计与实现

由于系统运行在网络环境下,所以文件格式的通用性、数据的安全性以及数据传输的高效性就成为了设计必须要考虑的前提.为此,本文提出的设计方案遵循如下原则:采用通用的数据存储格式存储数据;采用差量分析法分析数据;对差量数据进行加密传输;并且对大数据采用多线程断点续传来保证数据传输的高效性.

2.1 

总体设计方案

如图1所示,有多个异构的数据库,它们之间彼此需要获取对方的数据,DBMS的差异和不同局域网内数

据库之间网络线路不通的问题,使得彼此之间无法正常完成交换数据的功能.因此,要完成彼此之间的这种数据交换必须依靠第三方的应用程序来完成.本文设计的数据交换引擎就可以很好地实现这个功能.

如图1所示,局域网LAN-1中有4个数据库系统,分别为DB1

,DB2,DB3,DB4,局域网LAN-2中也同样有

4个数据库系统,分别为DB5,DB6,DB7,DB8.DB1要与DB2,DB4交换数据;DB3也要与DB2,DB4交换数据;DB5要与DB6,DB8交换数据;DB7也要与DB7,DB8交换数据;另外,有些交换关系图上并未画出,如DB1要与DB5

,DB6等交换数据.由图1可以看出,它们之

间数据交换的关系错综复杂,需要一个良好的中间媒介来辅助完成这种交换功能.

本文设计的HDEDEE就是要充当这个良好的中间媒介.HDEDEE的部署及其使用相当简单,数据库

101第9期 黄学彬,等:异构数据库高效数据交换引擎设计图2 数据控制流程设计维护人员只需要简单地配置彼此之间需要交换的数据规则,然后将HDEDEE部署在与交换数据双方数据库相关的服务器上即可,HDEDEE会根据配置文件以及数据

规则,运行对应的客户端程序或者服务器程序,完成彼此之间数据的推送与更新功能.如图2所示,数据控制流程设计,概括来说有以下几个步骤:1)数据的获取:客户端读取本地配置文件,根据配

置文件从响应的数据库中获取当前时刻既定规则的数据;2)数据差异分析:分析当前时刻的数据与前一个时

刻获取的数据,获得这2个时间段内的数据差量,对差量进行进一步的分析,进而得出新增数据集、删除数据集以及更新数据集,差异分析法的使用,使得只有变化的数据才会被传输,从而可以很好地保证数据传输的高效性与数据的一致性;3)数据加密:为了增强网络数据传输的安全性,对新增数据集、删除数据集以及更新数据集进行加密

处理;4)数据传输:包括数据发送与数据传输,即将新增数据集、删除数据集以及更新数据集分别传输至指

定的目的服务器上;5)数据解密:对加密的数据,必须解密后才能由目的服务器上的HDEDEE服务器程序对其进行操作,将数据更新至对应的数据库中;6)数据更新:HDEDEE服务器程序解密后的数据集,根据配置文件的既定规则,将数据集更新至指定的目的数据库.

已经实现的加密解密算法有很多,在本设计的实验中,采用了DES算法;数据发送与接收采用TCP/IP协议,使用socket套接字进行网络编程,实现了数据的传输功能.加解密算法与网络传输已经十分普遍,不再作为本文的重点.本文重点集中在数据获取方案的设计、差异比较算法的设计以及数据更新算法的设计上,并详细介绍了获取当前数据设计方案、变化结果集设计方案以及数据更新方案的方法.

2.2 

数据获取方案设计

需要获取什么数据都是预先设定的,本小节的目的就是设计如何设定待获取数据的方案.

程序需要的所有限制都记录在XML文件中,程序从XML配置文件读取信息,根据信息指示完成预定的功能.由于程序需要支持各种各样的异构数据库,而不同的DBMS有着不同的驱动接口,所以程序需要知道数据库类型,当然连接数据库所需的基本信息也必不可少.程序根据数据库类型调用不同的驱动接口,然后再依次读取XML配置文件中需要执行的查询命令,并将执行结果存储在XML配置中指定的文件内.另外,为了获得数据需要发送的目的地,还需要配置服务器所在的主机IP与端口.

HDEDEE客户端基本配置格式如图3所示.从这个配置文件设计可以得出,该客户端会将从数据库中获取的变化数据,发送至2个不同的服务器上,供2个服务器上的服务程序使用,从而将这些数据更新至服务程序所指定的数据库中.

2.3 

变化结果集获取方案设计

如图4所示,首先对比当前时刻获取的影子表数据与前一个时刻获取的影子表数据,获取差异数据,并将差异数据写入2个差异文件;然后利用差异分析算法对差异文件进行分析,从而获取3种不同类型的变化结果集,并将这3类变化结果集分别存储在对应的文件中.

201西南师范大学学报(自然科学版) http://xbbjb.swu.cn 第39卷

相关文档
最新文档