基于元数据驱动的异构数据模型映射算法_袁满

合集下载

虚拟数据中心的数据映射与数据路由策略研究

虚拟数据中心的数据映射与数据路由策略研究
异 构 数 据 模 型 。 种 技 术 侧 重 点 在 于建 立 中 间数 据 处 理 层 , 这
2 系统 的体 系 结 构
在基 于数据库 的数据虚拟整合模型研究 中主要是针对 多数据库 中数据 和文件 服务器 中的数据进行逻辑 上的数据 整合 。这里 的虚拟代 表逻 辑上 是统一 的整 体 , 但是 在实 际 的物理存储上依然是 存储 在 同构不 同质 的多个 数据库 上 , 其基本 的体 系结 构如图 1 :
进行模式 同化 ; 最后将模式同化后的结果进行组合 , 形成虚 拟数据集合 ; 根据虚拟控制器发送的信号 , 将组 合后的虚拟 数据 集合 交由响应 的模 块处 理。
3 映射 支 撑 元 模 型
映射支撑元模型[ 作为虚拟数据 中心 系统 的核心模 9 u
型 , 映着 数 据 的分 布 情 况 , 反 以及 数 据 之 间 的 映 射 关 系 , 如
O S da a mo e fda a v r u lb t e h o e so fd t a c r i g t n l z hed t it a , i d o a a v r u la c ie t r o a a U t d lo t it a e we n t e c nv r i n o a a, c o d n o a a y et a a v r u l a k n fd t i t a r h t c u e f r d t
o h ru lDa a Ce t r ft e Vit a t n e
YUAN a LI Chu p n H UANG n M n U neg Ga g
( h o fCo utra n o main Te h oo y,No t e s to e m ie st Sc o lo mp e ndI f r t c n lg o rh atPer lu Unv riy,Da i 1 3 1 ) qng 6 3 8

基于主题映射元数据的异构数据库集成仿真

基于主题映射元数据的异构数据库集成仿真

第37卷第3期计算机仿真2020年3月文章编号:1006-9348(2020)03-0198-04基于主题映射元数据的异构数据库集成仿真程显生,王俊(内蒙古农业大学计算机技术与信息管理系,内蒙古包头014109)摘要:传统异构数据库集成过程存在数据映射主题不明确问题,导致数据集成资源利用率偏低,切耗时较长。

为此提出基于主题映射元数据的异构数据库集成方法。

将待査询领域本体与元仓库组建映射,形成主体映射元数据,通过主体映射元数据解决数据库异构问题,并对用户查询进行推理扩展,实现对不同数据库集成。

实验结果表明,所提方法能够有效提升数据库集成后的资源利用率,减少数据库集成时间。

关键词:主题映射元数据;异构数据库;集成中图分类号:TP393文献标识码:BHeterogeneous Database Integration SimulationBased on Topic Mapping MetadataCHENG Xian-sheng,WANG Jun(Department of Computer Technology and Information Management,Inner Mongolia Agricultural University,Baotou Inner Mongolia014109,China)ABSTRACT:Traditionally,the heterogeneous database integration process has the problem of unclear data mapping topic,which leads to low resource utilization rate of data integration.Therefore,a method of integrating heterogeneous database based on topic mapping metadata was put forward.The domain ontology to be inquired was mapped with the meta-warehouse to form the subject mapping metadata.The problem about heterogeneous database was solved through the subject mapping metadata.Meanwhile,the user query was extended by inference,and thus to achieve the integra­tion of different databases.Simulation results show that the proposed method can improve the resource utilization and reduce the time of database integration effectively.KEYWORDS:Subject-mapping metadata;Heterogeneous database;Integration1引言信息爆炸时代的来临,信息量日益增加,目前绝大多数企业采用数据库进行信息的存储以及管理,但是通常情况下这些数据是异构的,如果想要实现异构数据库之间的相互操作,就需要对异构数据进行集成⑴。

元数据驱动的大型数据库数据迁移工具实现

元数据驱动的大型数据库数据迁移工具实现

元数据驱动的大型数据库数据迁移工具实现丛慧刚;任庆东;李天阳;袁满【摘要】With the upgrade of data model, companies need to migrate the original data stored in the database to the new database, the general practice is through the development of special software to achieve. but simply rely on the tools of database system provided can not meet the actual data migration needs. Through the study of ETL model and metadata-driven technology, in combination with the needs of China's oil data centers, large-scale data migration, defined the general framework of the data migration model system. The study was focus on the key technologies-the express of mapping schema. describe and storage with metadata. Finally, the use of metadata is drived the implementation of the ETL engine functions. The technical and functional has been applied in large-scale data migration of China's oil data centers.%随着数据模型的升级等,企业需要将原来数据库中存储的教据迁移到新的数据库,一般的做法都是通过开发专用迁移软件来实现,而仅仅依靠数据库系统本身提供的工具是不能满足实际数据迁移需求的.通过对ETL模型、元数据驱动技术的研究,结合中国石油数据中心大型数据迁移需求,定义了数据迁移的通用框架模型体系.对其中的关键技术——映射模式的元数据表示进行了重点研究,用元数据对映射模式进行描述与存储.最后,采用元数据来驱动对ETL引擎进行功能实现.该技术与功能已在中国石油数据中心大型数据迁移中得到了应用.【期刊名称】《科学技术与工程》【年(卷),期】2011(011)010【总页数】4页(P2353-2356)【关键词】数据迁移;元数据驱动;ETL;映射模式【作者】丛慧刚;任庆东;李天阳;袁满【作者单位】东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318【正文语种】中文【中图分类】TP311.54随着信息技术的飞速发展,数据集成的速度越来越快,数据中心的规模也越来越大,需要向数据中心迁移数据的业务数据库数量越来越多,大型数据库的数据迁移问题已经成为信息集成亟待解决的问题。

一种元数据驱动的通用GIS应用集成模型

一种元数据驱动的通用GIS应用集成模型
第3 8卷 第 6期
V0 - 8 13






21 0 2年 3月
M ac r h 201 2
NO. 6
Co pu e m t rEng n e i g i e rn
开 发研 究与设 计 技术 ・

文章编号:1 3 802 _ 8一o 文献标识码: o _4 ( 1)_0 2_3 0 2 2 0- 2 6 A
YUAN a LIJn t n GAO u .a FAN o gy M n , i-o g , J n to , Zh n .u
( . c o l f o u e & I fr t nT c n lg , r e s P t lu Un v ri , q n 6 3 8 Chn ; 1 S h o o C mp tr no mai o e h oo y Not a t er e m h o i es y Da ig1 3 1 , ia t 2 E po aina dDe eo me t e e rhI si t f a e Oi ed R n i 6 5 0 C i a . x lrt n v l p n s ac t ueo b i l l, e q u 2 5 , hn ) o R n t Hu f i 0
a g rt m o u o t n e r to n o sr c s a s re f mo e s t u p r p l a i n i t g a i n b s d o S. e me h d o lo i h f r a t ma i i t g a i n a d c n tu t e i s o d l o s p o t a p i to n e r to a e n GI Th t o f UEA t c c wi h Ar GI r e rd v l pme tp a f m swe l p le o t e a p i ai n s se i t g a i n o iti u e i e d p o u t n a e , ih me t h c S Se v r e eo o f n ltor i l a p i d t p lc to y t m e r to n d s b t d o l l r d c i r a wh c e st e h n r i f o n e ft e GI t g a i n o qi g o l e d e d o S i e r t fDa n i l . h n o i f

元数据驱动的数据中心字典管理元模型研究

元数据驱动的数据中心字典管理元模型研究

元数据驱动的数据中心字典管理元模型研究袁满;陈永芳【摘要】通过对元数据和数据管理技术的研究,针对企业数据中心建设中各种元数据的维护问题,提出了全面支撑企业数据中心表示与存储的元模型,同时,对企业数据中心的字典中各种数据的一致性进行了分类定义,构建各种规则元模型,通过对这些元模型进行管理来实现对整个企业数据中心有效管理与控制的目的.基于这些元模型,定义并实现了元数据维护的功能.【期刊名称】《长江大学学报(自然版)理工卷》【年(卷),期】2011(008)001【总页数】3页(P92-94)【关键词】数据中心;元数据;元模型【作者】袁满;陈永芳【作者单位】东北石油大学计算机与信息技术学院,黑龙江,大庆,163318;东北石油大学计算机与信息技术学院,黑龙江,大庆,163318【正文语种】中文【中图分类】TP393传统的数据管理平台只考虑到单一数据,忽略了数据之间的关系。

只实现单一数据的维护,没有根据数据字典内部数据之间存在的关系制定维护原则,进而实现对多个有关系的数据进行统一维护;大多数平台忽略了对代码表的维护;现有的维护平台还比较倾向于手工操作,不太适合大批量数据的维护,维护效率低[1]。

基于这些情况,笔者根据研究数据字典内部数据存在的关系制定了各种维护规则,构建了各种规则元模型,并且提出了基于企业元数据的用于存储和管理企业数据的元模型。

1 制定的维护原则1.1 名称代码命名规则针对企业中数据之间的名称和代码冲突问题,笔者制定了数据的命名原则:企业中不同数据字典的名称和代码不能相同;同一个数据字典所分的各个专业的名称和代码不能相同,而不同数据字典中的专业名称和代码可以相同;在同一个专业下存储的表的名称和代码不能相同,而在不同专业或者不同的字典下表的名称和代码可以相同;在同一个表中不允许数据的名称和代码相同,而在不同的表中数据的名称和代码可以相同。

1.2 基本信息维护原则1)数据字典基本信息维护原则当删除一个数据字典时,其内所包括的所有数据要一并删除;录入或修改字典基本信息时要遵循与其他字典名称代码不冲突原则。

异构时空数据的转换机制研究

异构时空数据的转换机制研究

异构时空数据的转换机制研究
尹章才;李霖
【期刊名称】《华中师范大学学报(自然科学版)》
【年(卷),期】2007(041)002
【摘要】目前时空模型难以兼顾时空语义表达与计算机实现困难的现状,形成不同部门、不同应用、不同时期的时空数据在语义、模型、结构等方面的差异,阻碍了时空数据之间的相互转换,限制了历史数据在预测预报等领域重要作用的发挥.在总结时空数据模型特点的基础上,试图以一个崭新的视角分析时空模型的发展历程;在此基础上,采用图论这一通用数据结构与数学描述方法.构建具有完备性的时空数据描述模型;探讨由此引发的异构时空数据的转换机制.最后,在异构时空模型之间的转换机制中分析了该模型的特点.
【总页数】4页(P295-298)
【作者】尹章才;李霖
【作者单位】武汉理工大学,资源与环境工程学院,武汉,430070;武汉大学,资源与环境科学学院,武汉,430079
【正文语种】中文
【中图分类】P208
【相关文献】
1.基于元数据映射实现异构数据库之间的数据转换 [J], 张卫清;陈龙;何乐
2.利用数据库转换实现异构数据库数据共享的研究与实现 [J], 唐红军;万健
3.流动形变数据库数据同步和异构数据模式转换研究 [J], 王丹宁;任海军;程陈;周辉
4.基于MDI的异构数据格式转换和远程文件传输机制研究 [J], 桂小林;钱德沛
5.流动形变数据库数据同步和异构数据模式转换研究 [J], 王丹宁;任海军;程陈;周辉
因版权原因,仅展示原文概要,查看原文内容请购买。

基于元数据驱动的异构数据模型映射算法

基于元数据驱动的异构数据模型映射算法
b e u c s f l p l d t a a ta so ai n fr Da ig ol f l e eo me td t b s n P e n s c e sul a p i o d t r n f r t o q n i i d d v l p n aa a e a d E DM a a a e y e m o e d tb s .whc ih
s l e aa t n fr n . ov sd t r s r g a ei Ke wo d Daa c n e so ;Me a aa d v n;E L;Ma p n c e s y rs t o v ri n t d t- r e i T p i g s h ma
目前 , 企业 f趋信 息化 、 准化的发展方 向 , 3 标 决定 当前企 业 中的大 量生产信息及管理数据 的集成与转换成为亟待解决 的问题 。由于石油领域 生产 、 管理 、 研上地域 分散 的特 点 , 科 使得企业 内存 在大 量采用不 同数 据库存储 的异构数 据 , 各个 企业应用 之间存在信 息壁垒 , 阻碍信 息之 间的共 享 。完 整的 数据迁移 系统 包括 数据 抽取 、 据转换 和数 据加 载… , 数 当前 的迁移方法包括 : ①利用 Pw ru dr o e i e 的数据管道 ( aaPp — Bl D t ie Ln ) 术 J 数 据 窗 口( aa n o s 和 动 态 S L语 句 实 ie 技 、 D t dw ) Wi Q 现 。数据管道技术虽然简单 , 』 但对于 大量且模 型结构 复杂 的数据 , 不提供纠错 和质量控 制机 制 ; 采用 动态 S L语 句虽 Q 然适用范 围广 , 在进行迁 移过程 中, 于数 据模 型复杂或数 但 对 据量庞大 的情况 , 使迁移任务 繁琐且效率低下 , 缺少可视化操 作界面 。②采用源数据库 自带的导出工 具和 目标 数据库的导 人工具 , 中间需要 经过必要 的转换处理 ; 采用手工迁移和数据 库 自带工具进行迁移需 要编写大 量辅助程 序 , 求迁 移人员 要 对源库与 目标库的结构 和业务规则 有 比较透 彻的 了解 , 加 增 了用户 的工作 量。③采 用已有 的一些数 据迁移 软件 , S L 如 Q

基于元数据映射实现异构数据库之间的数据转换

基于元数据映射实现异构数据库之间的数据转换
之 间 的 元 数 据 映 射 关 系 , 用 De h 7 0开 发 了 相 利 l i. p 应 的数 据 转 换 工 具 , 效 地 实 现 了 Aces O a l 有 cs 至 rce
带 的 Op n c e 方 法获 得相关 信 息 。 e S h ma * 表信 息 的获取
DBCo n.Op n h ma (sTa l s, Va Ar a Of e Sc e i be r ry
( Nul Nul Ta l] , mp y aa [ l , l, be ) E tP rm,d ) ' s;
* 字 段信 息 的获取
DBCo . e S h ma sC l m n ,Va Ar a Of n 0p n c e ( i o u s r ry

c sr it on t a n

nam e
f o l c s r i s w he e o ne r m a l on t ant r w r一 DBO a d n

( ns r i Ty Co t a nt pe= ~ o ns r i t Ty 一 ); r Co t a n pe R
1 1 元 数 据 映 射 表 .
t Pa a ,Emp y a a ,d ) y rm tP rm s;
在进 行 异 构数 据 库 之 间 的数 据转 换 之 前 , 首先 要建 立两 个异 构数 据库之 间 的元 数 据映射 。其 映射
表结 构如 下表 :
表 1 元 数 据 映 射 表 结构
( ) rce 据库元 数 据 的获 取 2 O al 数 Orce 据库 中元数 据 的获取 可通 过查 询系统 al数 视 图获 取 , 查 询语 句分别 如下 : 其 * 表 信息 的获 取
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 39 卷 第 12 期 2011 年 12 月
东 北 林 业 大 学 学 报 JOURNAL OF NORTHEAST FORESTRY UNIVERSITY
Vol. 39 No. 12 Dec. 2011
基于元数据驱动的异构数据模型映射算法
袁 满 陈星童
( 东北石油大学, 163318 ) 大庆,
MID <代码表> : 中间代码表。 ③外关键字映射, 源表中某字段所存储的信息 , 在目标表 中用一个外关键字段来代替 。 T <字段> ) 转换规则函数: F 外键( T <参照引用表> . T <参照引用字段> , 外关键字段映射过程, 首先确定目标表中外键字段引用 的表, 即 确 定 T <参照引用表> , 通 过 源 字 段 中 的 数 据, 在引用表 T <参照引用表> 中相应字段 T <参照引用字段> 数据作对照, 获取目标字段 T <字段> 的值。 函数参数: T <参照引用表> : 目标库中的参照引用表 ; T <参照引用字段> : 参照表中的参照字段。 ④常量映射, 目标字段值是常量值, 不需要源表字段参与 数据转换处理。 转换规则函数: F 常量 ( T <字段> , 常量值 ) , 函数参数: T <字段> : 目标字段。 ⑤多级映射, 由于模型复杂的层级结构和繁多的数据量 , 通过单次映射往往不能正确 、 有效获取目标字段值, 导致了数 据冗余或错误数据等问题 。对于一些复杂目标字段的获取需 通过多次中间值的查询和转换处理来解决 。可能通过外关键 字映射、 源表字段值、 目标字段值、 指定常量值等方式获取 。 在处理过程中, 下一次映射的启动依赖于上一次的映射结果 , 形成嵌 套 的 映 射 结 构。 转 换 规 则 函 数: F' 多级 ( F 多级 ( F 外键 ( T <参照引用表> . T <参照引用字段> , T <字段> ) , T <参照字段值> ) , T' <参照字段值> , S <参照字段值> ) 函数参数: T <参照字段值 > : F 多级 多级映射的目标参照 字段 值; T' <参照字段值> : F' 多级 多 级 映 射 的 目 标 参 照 字 段 值 ; S <参照字段值> : F' 多级 多级映射的源参照字段值 。 通过描述这些转换规则函数及参数的元数据 , 实现异构 数据模型字段间映射关系的描述 , 使得该基于映射关系的数 据库之间的数据转换得到灵活实现 。 1 . 3 . 2 映射转换算法 算法 1 : 识别映射模式, 调用对应映射转换规则函数 , 实 现映射识别与转换过程的自动处理算法 。 A2 … A i } ; E T { B1 , B2 , …, Bi } ; 前提需要: E S { A1 , A i { a1 , a2 , …, a i } ; B i { b1 , b2 , …, bi } ; 《D》 一组映射集合 S-T 开始: IF 《D》 ! = null THEN { f ( Ai , B i ) 记作 m i } ; FOR each m i ∈ 《D》DO { 识别 m i 在 《D》 中的映射模式信息 mod i } ; { 调用对应映射转换规则函数 } ; FOR each MOD∈ 《D》 DO IF MOD = = mod i THEN F mod( var1 , var2 , …) ; END IF; END FOR; END FOR; END IF; 算法 2 : 基于外关键字段映射规则的数据转换处理过程 算法。 F 外键( T <参照引用表> . T <参照引用字段> , T <字段> ) { 前提需要: 来自目标表的一组数据集合 P; 开始: P = ;
1 ) 黑龙江省教育厅基金项目资助 ( 11541008 ) 。 1965 年 6 月生, 第一作者简介: 袁满, 男, 东北石油大学计算机与 信息技术学院, 教授。 收稿日期: 2011 年 4 月 28 日。 责任编辑: 戴芳天。
加大, 导致新的映射关系不断出现 , 传统方案只能不断增加或 者修改代码来适应这种情况 , 不但增加了维护的难度 , 且可能 用元数据描述映射模式的设计思 导致软件重新开发。然而, 路实现的数据转换系统具有以下优点 : ①具有良好的扩展性, 不同数据模型之间出现一种新的映射模式只需编写单独的转 配置函数接口及参数信息 , 定制对应字段间映射 换规则函数, , , 模式元数据后 即可使用新映射模式 不需要更改程序代码, 降低了工具开发复杂度的同时 , 提高了工具的质量。 ② 通过 构建用于映射模式 元数据形式描述数据库之间的映射模式 , 元数据模型实现数据转换过程 , 使得数据转换行为能够灵活 控制, 更易于维护。
1)
摘 要 为解决企业异构数据模型间的数据转换问题 , 构建了用于描述和存储映射策略的系列支撑元模型 , 并对各种映射模式进行了详细的定义 , 并实现了相应模式的映射转换算法 。 通过对 ETL 体系结构进行分析, 提出 了一种基于元数据驱动的通用数据转换体系结构 。这些技术已在中国石油大型数据中心数据转换项目中得到应 实现了开发数据库数据向统一的勘探开发数据模型 EPDM 的数据转换, 应用效果良好。 用, 关键词 数据转换; 元数据驱动; ETL; 映射模式 分类号 TP311 Data Mapping Algorithm Between Heterogeneous Data Sources Based on MetadataDriven / Yuan Man,Chen Xingtong( School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318 ,P. R. China) / / 39 ( 12 ) . -128 ~ 131 Journal of Northeast Forestry University. -2011 , A series of supporting metadata models are built to store and describe policies of mapping patterns in order to solve the data conversion problem between heterogeneous data sources of enterprise. Meanwhile,all kinds of mapping patterns and transformation algorithms are define in details. A general architecture for data transformation,which merges technique of metadatadriven,is proposed by analyzing the architecture of extract,transform and load ( ETL) . These techniques have been successfully applied to data transformation for Daqing oil field development database and EPDM database,which solves data transferring. Keywords Data conversion; Metadatadriven; ETL; Mapping schemas 目前, 企业日趋信息化、 标准化的发展方向, 决定当前企 业中的大量生产信息及管理数据的集成与转换成为亟待解决 管理、 科研上地域分散的特点 , 的问题。由于石油领域生产、 使得企业内存在大量采用不同数据库存储的异构数据 , 各个 企业应用之间存在信息壁垒 , 阻碍信息之间的共享。 完整的 [1 ] 数据转换和数据加载 , 当前 数据迁移系统包括数据抽取 、 : PowerBuilder ( Data Pipe的迁移方法包括 ①利用 的数据管道 Line) 技术[2] 、 数 据 窗 口 ( DataWindows ) 和 动 态 SQL 语 句 实 [3 ] 但对于大量且模型结构复杂 现 。数据管道技术虽然简单 , 的数据, 不提供纠错和质量控制机制 ; 采用动态 SQL 语句虽 然适用范围广, 但在进行迁移过程中, 对于数据模型复杂或数 据量庞大的情况, 使迁移任务繁琐且效率低下 , 缺少可视化操 作界面。②采用源数据库自带的导出工具和目标数据库的导 入工具, 中间需要经过必要的转换处理 ; 采用手工迁移和数据 库自带工具进行迁移需要编写大量辅助程序 , 要求迁移人员 增加 对源库与目标库的结构和业务规则有比较透彻的了解 , 了用户的工作量。③ 采用已有的一些数据迁移软件 , 如 SQL Server 的 DTS 工具、 Delphi 中的 DataPump 工具等。 ④ 特殊的 如 PHP 实现 MYSQL 的 数据库提供的一些特别的迁移方法 , [4 ] 。 , 迁移等 ⑤通用数据迁移工具 其中用到基于相似度计算 的映射工具, 但对于具有复杂映射关系的数据仍不能满足 。 这些方法各有利弊。传统的 ETL 体系结构, 数据转换的描述 转换规则信息等, 信息包括对数据源位置与基本属性的描述 、 缺少控制数据转换行为的描述 , 使得整个转换过程要依赖程 序代码控制实现, 导致转换工具的实现复杂度增加 。 随着企 新行业标准的引入, 新旧数据模型差异逐渐 业信息化的深入、
1
1. 1
映ห้องสมุดไป่ตู้模式表示及算法
映射关系分析
[5 ]
存储相关数据的不同 映射关系 是指同一数据领域内, 关 系数据库数据 模 型 之 间 的 对 应 关 系 。 映 射 关 系 分 为3 个 层次: ①实体映射。反映了两个数据库概念模型上的差别 , 由 。 一个或多个属性描述 ②表映射。是实体映射的充分反映 , 为数据模型数据表 之间的对应关系, 在应用中表映射分为一对一映射 、 一对多映 多对一映射等情况, 对于多对多表交叉映射则可通过前 3 射、 种映射描述。 [6 ] ③ 属性映射 。 关系数据库中, 属性映射对应的是数据 。 是数据转换规则 表中的字段映射 它是映射关系的最底层 , 处理的最小单位。 了解进行数据转换的异构数据源的概念模型 , 以及数据 源数据之间的对应关系 , 将这种关系进行分类和细化 , 并且给 最终确定满足从源向目标库进行数据 出明确的定义和解释, 转换的数据映射模式。
相关文档
最新文档