数据仓库中元数据的管理
数据治理中的元数据管理策略

数据治理中的元数据管理策略随着社会信息化的不断深入,数据也成为了各个企业发展的核心。
不断收集、处理、分析数据,成为了企业信息化发展的重要环节。
然而,随着数据多样化的增加,采集和管理数据也面临着许多挑战,如何对数据进行有效的管理和治理已经成为了各个企业在信息化领域迫切需要解决的问题之一。
其中,元数据管理作为数据治理的重要组成部分,也越来越引起企业的重视。
元数据是一种描述数据的数据,例如对于某一数据表,元数据可以描述它的数据类型、数据的来源、数据的更新时间等信息。
元数据的管理不仅可以帮助企业对数据进行有效的描述和管理,还可以提高数据的质量以及数据的价值。
针对这一问题,本文在总结了目前国内外对于元数据管理的研究成果和实践经验的基础上,提出了一些元数据管理策略,以期为企业的数据治理提供一些有益的借鉴。
一、元数据管理的重要性在现代企业信息化中,元数据的管理已经成为企业信息化建设过程中必不可少的一部分。
元数据管理对于企业数据治理起到了至关重要的作用。
以下是几个方面的重要性:1、提高数据质量在数据管理过程中,元数据可以描述数据的来源、数据的格式、数据的更新时间等基本信息,同时也可以对数据的适用范围、数据生命周期进行详细描述。
这些描述可以帮助企业更好地管理与维护这些数据,从而提高数据的质量。
2、提高数据可靠性元数据可以描述数据标准和数据规范,将数据标准和数据规范对应到数据本身上,对数据进行描述和解耦,在数据分析之前,确保数据的可靠性,有效提高数据处理的准确性和可靠性。
3、加快决策的速度管理好元数据后,可以根据元数据快速查找到所需数据,提高数据使用效率。
并且,元数据可以帮助企业快速获取数据,根据数据进行决策分析。
从而加速企业决策效率,提高企业的竞争力。
二、元数据管理策略元数据管理在不同的企业中,可能会有不同的策略,但是需要注意以下几点:1、确定元数据管理团队元数据管理需要专业的技能和知识,所以需要专门组建一个元数据管理团队,负责组织、制定元数据标准以及元数据管理的流程和规范等工作。
元数据管理的解析

元数据管理的解析元数据管理是指对元数据进行组织、存储、维护和使用的过程。
元数据是关于数据的数据,它描述了数据的结构、属性、关系和其他特征。
元数据管理在数据仓库、数据库、信息系统等领域中扮演着重要的角色。
元数据管理的主要目标包括:1、数据理解:元数据提供了数据的上下文信息,帮助用户理解数据的含义和用途。
通过元数据,用户可以了解数据的来源、结构、关系等信息,从而更好地进行数据分析和处理。
2、数据管理:元数据管理有助于组织和维护数据仓库、数据库等信息系统中的数据资源。
通过元数据,可以对数据进行分类、标记、排序等操作,提高数据的可管理性和可维护性。
3、数据安全:元数据管理可以确保数据的安全性和完整性。
通过对元数据进行权限控制、访问控制等操作,可以防止未经授权的访问和修改,保护数据的机密性和完整性。
4、数据交换和共享:元数据管理可以促进数据交换和共享。
通过标准化的元数据格式和协议,可以实现不同系统之间的数据互操作性,提高数据的共享效率和使用价值。
元数据管理涉及的关键技术包括:1、元数据建模:元数据建模是指根据数据的特点和需求,建立元数据模型的过程。
元数据模型描述了数据的结构、属性、关系等信息,为元数据管理提供了基础。
2、元数据存储:元数据存储是指将元数据存储在数据库或其他存储介质中的过程。
元数据存储需要考虑数据的组织、索引、查询等问题,以提高元数据的访问效率和可靠性。
3、元数据同步:元数据同步是指在不同系统之间同步元数据的过程。
由于不同系统之间的数据可能存在差异,因此需要通过元数据同步来保持数据的一致性和准确性。
4、元数据质量管理:元数据质量管理是指对元数据的质量进行评估和管理的过程。
元数据质量的好坏直接影响到数据仓库、数据库等信息系统的质量和效率,因此需要对元数据进行质量检查、清洗等操作,确保元数据的准确性和完整性。
总之,元数据管理是数据管理领域中的一个重要分支,它有助于提高数据的质量、效率和安全性,促进数据的共享和交换。
数据仓库元数据管理

数据仓库元数据管理数据仓库元数据管理是指对数据仓库中的元数据进行管理和维护的过程。
元数据是描述数据的数据,它提供了关于数据的定义、结构、属性、关系以及数据的来源和用途等信息。
数据仓库中的元数据包括数据表、字段、索引、视图、存储过程等对象的描述信息,以及数据质量、数据血统、数据变化等相关信息。
数据仓库元数据管理的目标是保证数据仓库中的元数据准确、完整、一致和可靠。
通过对元数据的管理,可以提高数据仓库的可维护性、可扩展性和可重用性,进而提高数据仓库的价值和效用。
数据仓库元数据管理的主要任务包括元数据收集、元数据存储、元数据维护和元数据使用等。
1. 元数据收集:- 根据数据仓库的设计和需求,收集相关的元数据信息。
- 可以通过手工录入、自动抽取、数据字典等方式进行元数据的收集。
- 收集的元数据包括数据表、字段、索引、视图、存储过程等对象的描述信息,以及数据质量、数据血统、数据变化等相关信息。
2. 元数据存储:- 将收集到的元数据存储到元数据仓库中,以便后续的管理和使用。
- 元数据仓库可以使用关系型数据库、NoSQL数据库、文件系统等进行存储。
- 存储的元数据需要按照一定的结构进行组织和管理,以方便后续的检索和使用。
3. 元数据维护:- 对元数据进行定期的维护和更新,以保证其准确、完整、一致和可靠。
- 可以通过手工维护、自动抽取、数据字典同步等方式进行元数据的维护。
- 维护的内容包括元数据的新增、修改、删除等操作,以及元数据的版本管理和权限管理等。
4. 元数据使用:- 利用元数据提供的信息,支持数据仓库的各项管理和运维工作。
- 可以通过元数据进行数据质量管理、数据血统分析、数据变化跟踪等工作。
- 元数据还可以支持数据仓库的数据集成、数据查询、数据分析等应用。
数据仓库元数据管理的实施需要借助相应的工具和技术。
常用的工具包括元数据管理工具、数据建模工具、数据字典工具等。
常用的技术包括数据抽取、数据转换、数据加载(ETL)技术、数据建模技术、数据质量管理技术等。
数据仓库元数据管理系统

数据仓库元数据管理系统引言概述数据仓库元数据管理系统是指用于管理和维护数据仓库中的元数据信息的系统。
元数据是描述数据的数据,是数据仓库中非常重要的组成部分。
数据仓库元数据管理系统可以帮助组织管理者更好地理解、维护和利用数据仓库中的数据,提高数据仓库的效率和质量。
一、元数据的定义和重要性1.1 元数据的定义:元数据是描述数据的数据,包括数据的结构、属性、关系、来源等信息。
1.2 元数据的重要性:元数据是数据仓库中的灵魂,它可以帮助用户更好地理解数据、发现数据间的关系、提高数据的可信度和可用性。
1.3 元数据的分类:元数据可以分为技术元数据和业务元数据,技术元数据包括数据结构、数据源、数据质量等信息,业务元数据包括数据的业务含义、数据的关系等信息。
二、数据仓库元数据管理系统的功能2.1 元数据采集:数据仓库元数据管理系统可以自动采集数据仓库中的元数据信息,包括数据表结构、数据源信息等。
2.2 元数据存储:数据仓库元数据管理系统可以将采集到的元数据信息进行存储和管理,方便用户查询和分析。
2.3 元数据维护:数据仓库元数据管理系统可以帮助用户对元数据进行维护和更新,保证元数据的准确性和完整性。
三、数据仓库元数据管理系统的优势3.1 提高数据质量:通过管理和维护元数据信息,可以提高数据仓库中数据的质量,减少数据错误和冗余。
3.2 提高数据查询效率:数据仓库元数据管理系统可以帮助用户更快速地查询和分析数据,提高数据查询的效率。
3.3 促进数据共享和协作:数据仓库元数据管理系统可以促进不同部门之间的数据共享和协作,提高组织的整体效率和竞争力。
四、数据仓库元数据管理系统的应用场景4.1 企业数据管理:数据仓库元数据管理系统可以帮助企业更好地管理和利用数据,提高数据的价值和效益。
4.2 数据分析和挖掘:数据仓库元数据管理系统可以为数据分析和挖掘提供可靠的数据支持,帮助用户更好地发现数据中的规律和趋势。
4.3 决策支持:数据仓库元数据管理系统可以为组织管理者提供准确、及时的数据支持,帮助他们做出更明智的决策。
数据仓库元数据管理

数据仓库元数据管理数据仓库元数据管理是指对数据仓库中的元数据进行有效管理和维护,以确保数据仓库的可靠性和准确性。
元数据是描述数据的数据,它包括数据的定义、结构、关系、来源、用途等信息。
数据仓库中的元数据管理是数据仓库管理的重要组成部分,它对于数据仓库的建设和运营具有重要意义。
一、元数据管理的意义1. 提高数据仓库的可理解性和可维护性:通过对元数据的管理,可以使数据仓库的结构和内容更加清晰和易于理解,从而提高数据仓库的可维护性和可理解性。
2. 提高数据仓库的数据质量:元数据管理可以对数据仓库中的数据进行监控和评估,及时发现数据质量问题,并采取相应的措施进行修复,从而提高数据仓库的数据质量。
3. 提高数据仓库的数据一致性:通过元数据管理,可以对数据仓库中的数据进行统一的定义和管理,确保数据仓库中的数据一致性,避免数据冗余和不一致的问题。
4. 提高数据仓库的数据可追溯性:元数据管理可以记录数据仓库中数据的来源、变更历史等信息,使数据的变更过程可追溯,方便数据仓库的审计和管理。
二、元数据管理的内容1. 元数据定义和标准化:对数据仓库中的元数据进行定义和标准化,明确元数据的含义和格式,确保元数据的准确性和一致性。
2. 元数据收集和录入:通过各种手段和工具,收集数据仓库中的元数据,并将其录入到元数据管理系统中,建立元数据的库存。
3. 元数据的分类和组织:对元数据进行分类和组织,建立元数据的层次结构和关系,方便元数据的检索和使用。
4. 元数据的维护和更新:定期对元数据进行维护和更新,及时反映数据仓库中数据的变化和更新。
5. 元数据的查询和检索:提供元数据查询和检索的功能,方便用户查找和使用数据仓库中的元数据。
6. 元数据的安全管理:对元数据进行安全管理,设置权限和访问控制,保护元数据的安全性和机密性。
7. 元数据的版本管理:对元数据进行版本管理,记录元数据的变更历史,方便进行数据仓库的版本控制和管理。
三、元数据管理的流程1. 元数据收集和录入流程:(1)确定元数据的收集范围和目标。
数据仓库中元数据应用管理研究

科 技情报开发 与经济
文章 编 号 :0 5 6 3 ( 0 7 3 — 0 7 0 10 — 0 3 2 0 )3 0 1— 2
S IT C F R A I N D V L P N C - E H I O M T O E E O ME T&E O O Y N CN M
预处理 数据是 处于数 据源 和主题 数据之 问的 巾间层 次的数 据 , 预 处理数据 的处理在数据仓 库的后 台进 行 ,而且处理 的内容 比较 多 。包
8 一 2 O8.
巾。 这个过程所必 需的时间 、 地点信息 , 原始数据 和数据仓库 巾数据的对
[ ] 范井思. 3 基层公共图 书馆数 字资源建设 : 理念 、 原则与方案 [ ] J. 图书 馆论坛 ,0 5 6 :9 — 9 . 2 0 ( ) 10 15 ( 责任编辑 : 薛培荣 )
21 实 现 数据 仓 库 中 数 据 的 集 成 .
访问方法和使用限制 、 数据源 的存储平 台 、 源的内容说明 、 源的 数据 数据
更新频率等等 。
11 .. 预 处 理 数 据 元数 据 2
数据 仓库很重 要的一个特点是 它的集 成性 . 是将不 同时间 、 不同地 点、 不同 系统 中的数据采集 、 整理并且按 照一定 的模式 存储在数 据仓库
要面对用户进行工作 。 11 技术元数据 .
主题数据直 接面对分析性 用户的访 问 , 建立一个变视 图 , 分析性用
户通过实视 图对数据仓库进行访 问。数据仓 库主题 数据元数据包括 : 各 种数据库表 或视 图的定义 、 数据库分 区设置 、 引的 建立方法 、 索 数据库访 问权 限分配 、 数据库备 份方案 。
20 年 第 l 07 7卷 第 3 期 3
元数据-数据仓库的神经中枢

元数据——数据仓库的神经中枢引言:元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录(information directory),这一目录全面的描述了数据仓库中都有什么数据,如何得到,怎么得到这些数据的,以及怎么访问这些数据。
元数据是数据仓库运行和维护的中心,数据仓库服务器利用它来存储和更新数据,用户利用它来了解和访问数据。
元数据按使用对象的不同分为:商业元数据和技术元数据。
一:元数据在数据仓库中的重要性随着信息产业的飞速发展,数据的不断膨胀,数据仓库已经成为当今开发各种系统必不可少的工具。
如何合理高效地了解,管理,控制数据仓库成为当前一个急需解决的一个问题。
合理建立和使用描述数据仓库的元数据就显得尤为重要。
对于开发人员:在各项开发之前,需要对即将要操作的数据有一个整体的了解。
元数据能够很好地描述数据仓库的内部结构和流程,剖析数据在提取,转换,清洗过程中,各步所产生的中间结果,使开发人员能够在较短的时间片了解数据转换的全过程,并且能够实时检查,测试正确性。
元数据描述了数据仓库从各个数据库服务器中提取数据的方法,以及更新数据的策略,大大提高了开发人员的工作效率,缩短了软件开发的周期。
对于用户:操作型系统虽为他们提供了图形界面及预定义的报表,让其可以构建界面和定制报表,但他们并不是每次都自己构建界面或者定义报表的格式。
用户在使用数据仓库时,自己从数据仓库中获取信息,创建特别查询并在数据仓库中运行他们,在他们创建并运行查询之前,用户需要了解数据仓库中的数据,因此,他们也同样需要元数据,要知道数据项的含义。
开发者要防止用户忽略了数据的确切含义就去做分析,从而得出错误的结论。
二:按功能区域划分的元数据类型1.数据获取在这个区域中,数据仓库过程与下面的功能相关:数据抽取,数据转换,数据清洗,数据集成,数据准备。
在处理过程进行时,合适的工具记录了与这些处理相关的元数据元素。
数据仓库元数据管理

数据仓库元数据管理数据仓库元数据管理是指对数据仓库中的元数据进行有效管理和维护的过程。
元数据是描述数据的数据,它包含了数据的定义、结构、属性、关系以及数据之间的联系等信息。
通过对数据仓库元数据的管理,可以提高数据仓库的可维护性、可扩展性和可重用性,同时也能够提高数据仓库的查询效率和数据质量。
一、元数据管理的重要性1. 提高数据仓库的可维护性:通过对元数据的管理,可以清晰地了解数据仓库中各个数据表的含义、结构和关系,从而更好地进行数据仓库的维护和更新工作。
2. 提高数据仓库的可扩展性:元数据管理可以帮助我们了解数据仓库中的数据模型和数据结构,从而更好地进行数据仓库的扩展和升级。
3. 提高数据仓库的可重用性:通过对元数据的管理,可以清晰地了解数据仓库中的数据定义和数据结构,从而更好地进行数据仓库的重用和共享。
4. 提高数据仓库的查询效率:通过对元数据的管理,可以清晰地了解数据仓库中的数据模型和数据结构,从而更好地进行查询优化和索引设计,提高数据仓库的查询效率。
5. 提高数据仓库的数据质量:通过对元数据的管理,可以清晰地了解数据仓库中的数据定义和数据结构,从而更好地进行数据质量的监控和管理,提高数据仓库的数据质量。
二、元数据管理的主要内容1. 元数据定义和分类:对数据仓库中的元数据进行定义和分类,建立元数据的标准和规范,确保元数据的一致性和准确性。
2. 元数据采集和录入:通过采集工具和手工录入的方式,将数据仓库中的元数据进行采集和录入,包括数据表的定义、字段的定义、数据类型、数据长度、数据格式等信息。
3. 元数据存储和管理:将采集和录入的元数据存储到元数据仓库中,并进行管理和维护,包括元数据的更新、删除、备份和恢复等操作。
4. 元数据查询和检索:通过元数据查询和检索工具,可以根据需要查询和检索数据仓库中的元数据,包括数据表的定义、字段的定义、数据类型、数据长度、数据格式等信息。
5. 元数据共享和发布:将元数据共享给数据仓库的用户和开发人员,使其能够更好地了解数据仓库中的数据定义和数据结构,从而更好地进行数据仓库的开发和使用工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库中元数据的管理M etadata M anagem en t i n a Data W arehouse同济大学计算机科学与工程系(上海200092) 史金红 吴永明 【摘要】 介绍了数据仓库中四种基本类型的元数据,说明了不同类型元数据的收集和维护方法,并着重对分布式元数据的集成和管理进行了详细的阐述。
关键词:数据仓库,数据商场,决策支持,元数据【Abstract】 T h is p ap er in troduces fou r typ es of m etadata and the m ethods of co llecting and m ain tain ing them.It focu ses on the m etadata m anagem en t and in tegrity.Key words: da ta warehouse,da ta mart, dec ision support,m etada ta1 引言随着社会的发展和计算机技术的进步,人们已不满足于用计算机只作简单的数据处理和事务处理。
进一步用现有的数据进行分析和推理,从而为决策提供依据的需求导致了决策支持系统(D SS)的出现。
90年代以来计算机技术、网络技术和数据库技术的迅速发展为D SS提供了必要的技术环境, OL T P和办公自动化普遍应用积累的大量数据为D SS提供了必要的数据基础,日趋激烈的市场竞争促进了各级管理和决策人员对D SS的实际需求,因此自从1991年W.H.Inm on提出数据仓库的概念和1993年E.F.Codd提出OLA P概念以来,已有许多商品化的数据仓库管理系统和联机分析处理工具软件面市。
以上诸因素的共同作用促成许多公司、机构纷纷为提高自己的竞争能力建立数据仓库系统以进行决策支持。
元数据是成功的数据仓库的重要组成部分,它可以帮助数据仓库项目小组明确而全面地理解潜在数据源的物理布局以及所有数据元的业务定义,帮助数据仓库用户有效地使用仓库中的信息,帮助数据库管理员了解某些表的变化将对数据仓库产生怎样的影响以及不同商业过程对应的应用等等。
项目小组在开发过程中应当识别元数据并将它收入到元数据商店中,实施适当的过程捕作企业数据结构和应用的变化,从而修改相应的元数据,并向用户提供适当的工具访问元数据。
2 元数据的基本类型元数据按照其用户可以分为技术元数据和商业元数据。
技术元数据提供给数据仓库的技术人员,数据仓库技术人员在仓库的开发和维护中使用这类元数据。
商业元数据是商业用户在仓库中寻找他们所需商业信息的一个辅助。
但是,技术人员可能也需要访问几种类型的商业元数据,如和商业用户讨论信息需求和建立企业的数据模型。
同样,商业用户也需要尝试高水平的技术元数据。
元数据按其内容可以分为四个基本类型:1)关于数据仓库潜在数据来源的信息,包括现有的业务系统、可得到的外部数据和目前手工维护的信息。
例如,一个组织可以从中识别数据来源的潜在仓库数据源有:几个现有的应用程序,由财务部门保存的基于PC机的电子报表,从某一卖主处购买的销售数据,目前由顾客服务部门在纸上保存的顾客联系记录。
2)关于数据模型的信息,包括业务实体、关系、企业规则和企业数据模型。
3)关于业务数据与仓库数据结构间的映射信息。
只要那些来源中的一个数据元与仓库建立了映射关系,就应该记录下这些数据元间的逻辑联系以及发生的任何变换或变动。
4)关于数据仓库中信息的使用情况。
了解这类信息对更好地调整仓库性能、更多地利用现有查询以及理解仓库中的信息怎样用于解决企业问题是很重要的。
3 元数据的收集和维护在适当的时间收集适当的元数据是成功实施元数据驱动的数据仓库的基础。
为保证较高的准确性,元数据的收集应该尽可能自动化。
例如收集数据来源的信息时,可以利用扫描仪来扫描或分析数据结构;利用CA SE 工具设计并收集数据模型信息等。
数据仓库的元数据包括很多域,从物理结构数据到逻辑模型数据,再到企业的使用情况和业务规则。
这些类型中的每一类都要求有自己的元数据收集战略。
有些可以在某种程度上自动化,而有些则要采取一点手工劳动。
元数据的维护方法取决于它最初是怎样收集的、它变化的频率如何以及生成的元数据量,对于那些反映数据来源结构和数据仓库本身结构的物理元数据来说,可以使用纲目库工具或建立适当的过程,或执行一些自动程序来感知物理结构的变化,并相应地更新元数据;对于业务规则信息和数据模型而言,元数据很可能要靠手工维护或手工启动一个自动刷新过程来更新元数据商店中的数据模型信息;数据仓库映射是用数据仓库建立工具完成的,并且工具和元数据商店之间有接口,那么这一信息的维护就是固有的,可以自动进行;对于数据仓库使用信息,因为仓库查询所使用的特定表格和数据结构的信息是动态的,所以应该定期追加。
4 元数据的集成和管理现在很多数据仓库项目小组在开发企业级数据仓库同时,引入了数据商场。
数据商场是面向单个主题域、满足一个部门用户群需要的数据仓库,可看作数据仓库的子集,而数据库是面向整个企业的所有主题域和企业范围的用户,如图1所示。
图1 企业信息系统结构现代企业信息系统通常都有一个数据仓库和多个数据商场,数据仓库可以给企业高层管理人员提供关于整个企业全局的信息,并提供对整个企业的集中控制和决策支持;数据商场有助于部门经理和用户对他们部门的任务和执行情况进行分析和决策。
因此,一个企业一般都存在多个元数据商店,既有集中的元数据,又有分布的元数据,分布的元数据可以根据地理位置分布,也可以按照部门分布。
这些元数据存放在不同的元数据存储工具中,每种工具都以不同方式表示这些元数据,因此必须对这些元数据进行管理和集成,从而为用户提供一致的和可理解的元数据。
4.1 元数据集成和管理的必要性许多公司现在意识到了元数据的集成和管理在决策支持中的重要性,并深刻体会到了它的不可忽视的作用。
这主要有三个方面的原因:1)提高生产率。
管理数据仓库中技术元数据的好处类似于在事务处理系统中管理元数据的好处:提高了开发的效率。
集成、一致的技术元数据为负责创建和维护决策支持系统的技术人员创造了一个更加高效率的开发环境。
另一方面,商业元数据给商业用户提供了一个良好的决策支持环境,对利用数据仓库很有价值。
2)数据仓库和决策支持应用经常涉及范围很广的不同产品,为这些产品创建和维护元数据非常耗时和容易出错。
相同的元数据(如一个关系表的定义)可能被几个产品定义。
这不仅很麻烦,而且使元数据的维护、一致性和实时性实现起来很困难。
使元数据的管理过程自动化和在这些不同产品之间共享技术元数据,能减少开销和错误。
3)商业用户需要很好地理解数据仓库中存在什么样的信息,这个信息从商业角度来看意味着什么,它是怎么样导出的,来源于什么系统,根据这个信息如何决策以及如何进行预测和分析等等。
易于访问的商业元数据使商业用户能充分利用数据仓库中有价值的信息。
商业元数据还能帮助技术员与商业用户讨论信息需求、建立企业模型。
4.2 元数据共享和交换过去销售商提供的元数据共享和交换工具总是把元数据放在一个集中的元数据商店或仓库中,并给该商店提供进入 导出功能和编程应用接口,创建一整套描述商店中元数据的数据模型。
在事务处理环境下,这种集中式管理方法有成功之处,但也有缺点。
对于决策支持系统,销售商正在使用许多集中式和分布式方法管理元数据,运用的技术主要有三种:1)支持元数据共享和交换的元数据商店;2)元数据交换的标准;3)为元数据交换指定的开放式A P IS产品。
针对目前缺少就公共表示方式达成的协议、每个用户提出的性能需求各不相同而导致有许多种元数据使用商店的实际情况,解决元数据管理的唯一方法,是创建一个元数据hub和一个商业信息目录来管理不同元数据商店以及决策支持产品间的元数据流,如图2所示。
元数据hub和商业信息目录是两种不同类型的元数据管理工具,它们的用户、用法、结构和接口是完全不同的。
元数据hub主要面向技术用户,它可以是图形用户界面(GU I)工具,也可以是基于网络的工具(如浏览器)。
商业信息目录主要面向商业用户,用户通过基于网络的工具(不仅限于W eb浏览器)仔细查看信息目录中面向业务的元数据,找出哪些信息是可以得到的。
这两种类型的工具之间要有适当的接口,例如商业信息目录的用户需要能够对商业信息目录和由元数据hub维护的技术元数据进行数据挖掘,而技术用户则需要了解建立数据仓库时可以得到哪些源数据。
元数据hub作为面向技术用户的元数据管理工具,主要用来开发和维护数据仓库,并在决策支持产品之间管理技术元数据的交换和共享。
这个hub有四个要求:1)它应该支持在分布式元数据环境下不同系统和产品之间的元数据的交换。
这个hub应该有一个文档化和开放的编程对象接口(例如使用com或co rba),这可以使第三方工具能够应用hub的服务;一个工业认可的文件格式(如comm a deli m ited file、M D IS、M icro soft XM L In terchange fo rm at等)的文件传输机制应被提供给元数据交换。
2)它应该能对元数据进行更新和共享。
用户可以使用元数据hub提供的A P I对象和用以上列出的文件传输格式对元数据进行维护。
这个hub还应该提供一个代理接口,能捕捉本地产品及系统中新的或修改过的元数据,并动态地加载到元数据商店中。
元数据商店的元数据管理系统应该支持版本和时间特性,即能创建一个元数据变化的历史记录。
在大的分布式环境中,数据库管理员应能对横跨多个hub服务器和元数据商店的元数据环境进行物理分割。
3)最起码应该能管理数据仓库信息存贮定义。
图2 数据仓库中的元数据流格式支持包括关系表和列、多维表以及维。
另一种能被处理类型的元数据是关于用来创建数据仓库信息的源数据的信息以及源数据在装入仓库前的转换,但是目前的ETL工具都有它们特有的数据转换方法。
这个产品至少应提供能对源数据编制文档和对自由表文本格式元数据进行转换的能力。
在理想的情况下,hub还应该能对与企业模型相联系的商业元数据以及商业智能工具和分析工具中用到的商业观点编制文档,以便用户访问仓库信息。
4)应使用工业标准的元数据模型或它能够管理的元数据类型的相应元模型,这些元模型应该是编制成文档和可扩展的。
4.3 元数据共享和交换的工具产品支持事务处理的元数据共享和交换的仓库产品已经存在了许多年,大部分销售商已经开始扩展他们的仓库产品来支持决策过程,包括P latinum techno logy,inc.(P latinum R epo sito ry)、Softlab (Enab ler)、U n isys(U R EP)和V iaSoft(Rochade)。