元数据管理
元数据管理

元数据管理1. 什么是元数据管理元数据管理是对数据的描述、定义和管理,包括数据的属性、格式、来源、质量、关系等信息。
元数据通常被用于数据集成、数据分析、数据挖掘、数据治理、数据质量管理和数据安全等方面。
元数据可以提高数据资源的使用效率,促进应用系统的互操作性,提高数据的可信度和可重复性,降低数据管理成本,提高数据价值。
元数据管理可以分为三个层次:(1) 概念层元数据:描述数据的业务名义、业务规则、数据类别、数据的主体及其关系等。
(2) 逻辑层元数据:描述数据的逻辑模型、数据结构、数据和业务的关系等。
(3) 物理层元数据:描述数据的物理组织结构、存储方式、数据格式、访问方法等。
2. 元数据管理的价值元数据管理有助于提高数据资源的使用效率和数据管理的质量,其价值主要表现在以下几个方面:(1) 提高数据的可重复性和可信度元数据可以提供数据质量和数据来源的相关信息,使得数据的使用和转换能够更加准确地反映现实世界,提高数据的可信性和可重复性。
(2) 促进系统的互操作性元数据提供了关于数据之间相互关系的描述,可以促进不同系统之间的信息交流和协作,使系统更加互操作,便于数据资源的共享和利用。
(3) 降低数据管理的成本元数据可以提供数据的相关信息,使得数据的使用和管理更加高效,减少了重复性的工作量,降低了数据管理的成本,提高了数据资源的利用价值。
(4) 提供更加全面的数据支持元数据可以描述数据的特征、属性和约束条件等信息,涵盖了对数据的所有方面的考虑,使得数据资源对于业务的支持更加全面。
3. 元数据管理的应用场景元数据管理可以应用于以下几个方面:(1) 数据集成:元数据管理可以用于数据的集成,通过描述数据的属性和关系等信息使得数据能够在不同的系统之间交换和共享,促进数据的一体化管理。
(2) 数据分析:元数据管理可以提供数据质量、数据结构等信息,帮助用户对数据进行分析和挖掘,提高数据的分析效率。
(3) 数据治理:元数据管理可以用于数据的规范化和管理,描述数据的源头、质量等信息,保证数据的合法性和一致性。
元数据管理研究报告

元数据管理研究报告在当今数字化的时代,数据已成为企业和组织最宝贵的资产之一。
而元数据管理作为数据管理领域的重要组成部分,对于提升数据质量、促进数据共享和利用、保障数据安全等方面都具有至关重要的作用。
本文将对元数据管理进行深入研究,探讨其概念、重要性、面临的挑战以及解决方案。
一、元数据管理的概念元数据简单来说,就是“关于数据的数据”。
它描述了数据的各种属性和特征,例如数据的名称、类型、长度、来源、创建时间、修改时间、所有者、数据之间的关系等等。
元数据管理则是指对元数据的创建、存储、维护、更新、查询和使用进行有效的规划、控制和监督,以确保元数据的准确性、完整性和一致性。
二、元数据管理的重要性1、提高数据质量通过元数据管理,可以清楚地了解数据的来源、含义和质量状况,从而能够及时发现和纠正数据中的错误和不一致性,提高数据的准确性和可靠性。
2、促进数据共享和利用元数据提供了对数据的清晰描述和理解,使得不同部门和系统之间能够更好地共享和利用数据。
用户可以通过元数据快速找到所需的数据,提高数据的利用效率。
3、支持数据治理元数据管理是数据治理的重要基础。
通过对元数据的管理,可以明确数据的责任主体,制定数据的标准和规范,确保数据的合规性和安全性。
4、优化数据架构元数据能够反映数据的分布和结构,帮助企业优化数据架构,提高数据存储和处理的效率。
三、元数据管理面临的挑战1、元数据的多样性和复杂性随着企业信息化程度的提高,数据来源越来越多,包括数据库、文件系统、应用系统等,不同来源的数据具有不同的格式和结构,导致元数据的多样性和复杂性增加,给管理带来了困难。
2、元数据的一致性和准确性由于元数据可能在多个系统和部门中创建和维护,容易出现元数据不一致和不准确的情况。
例如,同一个数据在不同的系统中可能有不同的定义和描述。
3、元数据的变更管理在数据的生命周期中,元数据可能会频繁发生变更。
如何有效地管理元数据的变更,确保相关人员能够及时了解变更情况,并对受影响的系统和流程进行相应的调整,是一个挑战。
元数据管理的定义

元数据管理是一个根据使用这些资产的方式来管理组织的数据资产的流程。
此流程能集成、链接和集中管理多个来源的元数据,便于在整个组织内妥善维护、分析、消费和解释数据。
当从业务元数据和技术元数据中得出数据的含义时,可以更有效地汇总和集成数据。
简言之,当有效管理元数据时,数据变得更有价值。
IT 组织需要有效的元数据管理解决方案以:•简化数据发现和跟踪数据中央目录。
大多数公司需要管理日益复杂的系统。
通过管理元数据,IT 组织可以在能够快速发现数据资产的多个系统内创建数据资产库存。
•通过重复使用数据加强一致性并消除冗余,从而提高工作效率并降低项目付时间。
可以将中央元数据资料库当作“单一数据源”来发现开发人员可以充分利用的可重用组件。
公司可以减少冗余或未使用数据的数量,从而允许进行硬件和软件整合并节省成本。
•减少因人员流动而导致知识流失的风险。
有关存储重要信息的位置和方式、以及经常未存档意味着什么,所有这些都只留在了某些员工的头脑里。
当这些关键员工离开公司时,这方面的知识也就会随着他们一起消失。
元数据管理系统内的中央元数据资料库保存了这方面的知识,从而减轻了此类信息随着离职员工一起消失的任何风险。
•增加了向业务用户报告的数据交付的信心。
跟踪数据沿袭:数据来自什么地方以及如何产生、处理和交付数据,这为业务用户提供了重要的背景知识。
探查源系统中的数据可以暴露和解决数据不准确性和不一致性问题,从而产生可靠的高质量数据。
•通过制定更有效的开发流程来提高IT 部门对业务的响应度。
元数据的集成和可见性可以帮助IT 部门了解存在哪些数据、数据存储位置及其含义,从而最大限度地降低信息的复杂性。
此外,这种可见性通过不断变更业务要求为分析变化所带来的影响提供了基础架构,并将会加快新数据集成项目的开发。
数据集成开发人员可以依赖这些信息来轻松和准确地确定他们的数据集成项目所需的数据。
并且,能够访问潜在变化所带来的影响也可以帮助管理人员快速评估项目的持续时间和资源成本。
元数据管理内容

元数据管理内容
元数据管理内容主要包括以下几个方面:
1. 元数据标准:制定和推广元数据标准是元数据管理的核心内容。
元数据标准定义了数据的语义、结构和关系,使得不同系统之间能够进行有效的数据交换和共享。
例如,DC(Dublin Core)元数据标准广泛应用于数字图书馆和档案领域。
2. 元数据质量:保证元数据质量是元数据管理的重要任务。
高质量的元数据能够提高数据的可理解性和可用性,增强数据的可信度和可靠性。
元数据质量评估包括准确性、完整性、一致性和时效性等方面。
3. 元数据采集:元数据采集涉及确定需要采集的元数据类型、来源和采集频率等。
元数据采集应确保数据的准确性和完整性,同时考虑到数据规模和实时性的要求。
4. 元数据存储和备份:元数据存储和备份是元数据管理的基础设施。
选择合适的存储方案和备份策略,能够确保元数据的安全性和可恢复性。
5. 元数据映射和转换:元数据映射和转换是将不同来源和格式的元数据进行整合的关键技术。
通过元数据映射和转换,可以实现不同系统之间的数据共享和交换。
6. 元数据分析与利用:通过对元数据进行深入分析,可以挖掘出数据的潜在价值和知识。
利用元数据分析结果,可以为决策支持、
知识发现等应用提供支持。
综上所述,元数据管理内容广泛而复杂,涉及到标准制定、质量保证、采集、存储备份、映射转换和分析利用等多个方面。
元数据管理制度

元数据管理制度
元数据管理制度是指组织或企业为了更好地管理和利用元数据而建立的一套制度和规范。
元数据是描述数据的数据,它包含了数据的结构、属性、关系和语义等信息,可以帮助用户更好地理解和使用数据。
元数据管理制度的主要目标是确保元数据的准确性、完整性和一致性,以及提供有效的元数据管理流程和工具。
具体包括以下几个方面:
1. 元数据定义和标准化:制定统一的元数据定义和标准,明确元数据的各个属性和描述方式,确保不同部门和系统之间的元数据能够互通。
2. 元数据收集和维护:建立元数据收集和维护的机制,确保元数据的及时更新和正确性。
包括收集现有系统中的元数据,以及在新系统开发过程中对元数据进行记录和维护。
3. 元数据存储和共享:建立适当的元数据存储和共享机制,确保元数据的安全性和可访问性。
可以采用数据库或者元数据管理工具等方式来存储和管理元数据。
4. 元数据查询和检索:提供方便快捷的元数据查询和检索功能,用户可以根据需要查找和浏览元数据,以便更好地理解和使用数据。
5. 元数据权限管理:对元数据的访问和修改进行权限控制,确
保只有授权的人员可以修改和使用元数据,避免数据的误用和滥用。
通过建立和实施元数据管理制度,组织或企业可以更好地管理和利用元数据,提高数据的质量和价值,支持业务决策和数据分析等工作。
元数据管理包含的主要内容

元数据管理包含的主要内容元数据管理是指对数据的描述、组织和管理的过程。
它涉及到对数据的定义、分类、标准化、命名、注释、存储等方面的工作,以确保数据的可信性、可用性和可维护性。
元数据是关于数据的数据,是对数据的描述和解释,包括数据的结构、定义、来源、格式、用途等信息。
元数据管理的主要内容包括数据字典管理、数据分类与标准化、数据质量管理、数据安全与权限管理、数据血缘追踪与溯源等。
数据字典管理是元数据管理的核心环节。
数据字典是记录数据元素和数据元素之间关系的文档或数据库。
通过数据字典,可以清晰地了解数据的含义、结构和用途,方便数据的使用和维护。
数据字典管理涉及到数据元素的定义、属性、取值范围等信息的记录和维护,以及数据元素之间的关系的建立和管理。
数据分类与标准化是元数据管理的重要内容。
数据分类是将数据按照一定的标准进行分类和归类,以便于数据的管理和使用。
数据标准化是指对数据进行统一的命名、格式、编码等处理,以确保数据的一致性和规范性。
通过数据分类与标准化,可以提高数据的可查找性、可比性和可解释性。
数据质量管理是元数据管理的关键环节。
数据质量是指数据是否满足使用者的需求和期望。
数据质量管理包括数据准确性、完整性、一致性、有效性、及时性等方面的管理。
通过数据质量管理,可以提高数据的可信度和可用性,减少数据错误和冗余。
数据安全与权限管理是元数据管理的重要内容。
数据安全是指保护数据不被非法访问、篡改、删除等风险的管理措施。
权限管理是指对数据的访问权限进行控制和管理,确保只有授权的人员可以访问和使用数据。
通过数据安全与权限管理,可以确保数据的机密性、完整性和可用性。
数据血缘追踪与溯源是元数据管理的关键环节。
数据血缘追踪是指对数据的来源和去向进行追踪和记录,以便于数据溯源和问题排查。
数据溯源是指通过追溯数据的来源和处理过程,找到数据的源头和变动情况,以确保数据的可靠性和可信度。
元数据管理是对数据的描述、组织和管理的过程,包括数据字典管理、数据分类与标准化、数据质量管理、数据安全与权限管理、数据血缘追踪与溯源等内容。
元数据管理制度

元数据管理制度一、引言随着信息技术的发展和数据量的爆炸增长,元数据管理在企业中变得越来越重要。
元数据是描述数据的数据,是数据的关键资产。
合理管理元数据可以提高数据质量、管理数据资产,以及支持企业数据治理和决策。
本文将阐述元数据管理的重要性、管理原则、管理方法和操作流程,以及具体的管理制度。
二、元数据管理的重要性1.促进数据共享和集成:元数据是数据的描述,通过管理元数据可以促进数据共享和集成。
当各部门和系统都遵循同一种元数据标准时,数据的集成会更加容易,各方之间可以更好地共享数据。
2.提高数据质量:元数据管理可以帮助企业建立数据质量标准和规范,确保数据质量始终如一。
通过元数据管理,可以更好地了解数据的来源、含义、结构和关系,从而提高数据的准确性、完整性和一致性。
3.支持数据治理和决策:元数据是数据的关键抽象,通过管理元数据可以更好地了解数据资产、数据风险和数据价值。
有了清晰的元数据,企业可以更好地制定数据治理策略、做出数据决策,并支持企业的业务目标。
4.降低数据管理成本:随着数据量不断增长,数据管理的成本也在增加。
通过合理管理元数据,可以减少数据管理的成本,提高数据管理效率,降低风险。
5.促进数据分析和挖掘:元数据可以帮助用户更好地了解数据的结构和关系,为数据分析和挖掘提供支持。
通过元数据管理,可以更快、更准确地进行数据分析和挖掘,挖掘出数据背后的价值。
三、元数据管理原则1.一致性原则:元数据管理应该遵循一致性原则,即各部门和系统都应该使用同一种元数据标准,以确保元数据的一致性和准确性。
2.全面性原则:元数据管理应该是全面的,涵盖所有数据资产,包括结构化数据、非结构化数据、半结构化数据等,确保所有数据都受到管理。
3.及时性原则:元数据管理需要及时更新和维护,随着数据的不断变化,元数据也需要不断更新和调整,以保持元数据的准确性和时效性。
4.安全性原则:元数据管理需要确保元数据的安全性和机密性,防止元数据被未经授权的访问和篡改,保护数据资产的安全。
元数据管理内容 -回复

元数据管理内容 -回复什么是元数据管理??元数据管理是指对于数据的属性、定义、语意以及关系等信息进行管理的过程。
它能够帮助组织有效地存储、访问和分析数据,并支持决策和数据质量的改进。
在现代数据驱动的环境中,元数据管理是组织维护和管理海量数据所必不可少的一部分。
元数据管理的重要性元数据管理对于组织的数据管理和数据资产的价值是至关重要的。
以下是元数据管理的一些重要方面:1. 数据搜索和发现:元数据可以帮助用户快速定位和搜索到他们所需的数据。
通过元数据,用户可以了解到数据存储的位置、格式、内容、使用权限等相关信息,从而快速查找到需要的数据资源。
2. 数据字段和定义:元数据可以提供对数据字段和定义的准确描述。
这有助于确保多个团队或部门在使用相同数据时具有一致的理解。
如果不准确或缺乏定义,数据的解释就可能会发生歧义,给数据分析和决策带来困扰。
3. 数据质量管理:元数据管理可以帮助组织评估和监控数据质量。
通过对元数据的分析,可以检测数据源的可靠性和准确性。
这有助于组织及时发现和解决数据质量问题,提高数据分析的可信度。
4. 组织数据治理:元数据管理是有效数据治理的基础。
通过元数据的定义和记录,可以确保数据管理策略和规则的正确实施。
元数据可以记录数据的来源、相关方、数据使用规则等信息,从而对数据进行更好的管理和保护。
元数据管理的步骤下面是元数据管理的一般步骤:1. 确定元数据需求:首先,组织需要明确元数据管理的目标和需求。
这包括确定所需的元数据类型、范围和用途。
例如,是为了支持数据搜索、数据质量管理还是数据治理。
2. 收集元数据:一旦元数据需求被确定,接下来就是收集和获取相关的元数据。
这可能包括对现有系统和数据源的分析以及其他数据源的查询。
收集到的元数据可以来自于各种不同的来源,如数据库、文件系统、应用程序以及各种第三方工具。
3. 组织和分类元数据:一旦元数据被收集,组织和分类元数据将变得重要。
这可以通过建立元数据目录、定义元数据结构和属性等方法来实现。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.元数据管理技术及应用现状朋友老朱在最近惊喜地发现,在营业部的每周例会上,原先各部门针对每日用户数的争吵声,现在逐渐销声匿迹了。
原来,老朱所在的这家电信运营商,最近刚刚验收并启用了一个元数据管理平台工具。
通过这一平台,IT部门可以在那些曾经引发激烈争吵的数字后面加上详细的注解。
这样,即便各部门得出的当日用户数数值不一样,也能在注解中清楚地看到具体的差异在哪里。
如此,自然再没有了吵来吵去的必要。
元数据,最常见的定义是:“关于数据的数据”。
更准确一点说:元数据是描述流程、信息和对象的数据。
这些描述涉及像技术属性(例如,结构和行为)这样的特征、业务定义(包括字典和分类法)以及操作特征(如活动指标和使用历史)。
早在上世纪末,元数据的概念和相关工具就已经出现,但限于当时的数据量还不够大,而元数据本身又包含太多的内容,以至于它并未得到充分利用。
而在今天看来,元数据正在成为解决诸多数据问题时必须要抓住的一个“精髓”要素。
消弭争吵在此前一年中,老朱所在的那家电信运营商,各部门之间经常就每日用户数这类问题的指标数值不一致而吵得面红耳赤。
其实,在其他电信公司或者其他行业中也都存在着类似问题。
简单来讲,这些公司通过各个时期的IT建设,形成了很多个独立分开的系统。
以电信运营商为例,就有计费系统、网络系统、OA系统、财会系统和客服系统等等。
在这些系统中,存有不同的客户信息,具体体现就是不同格式的表。
两年前,公司的数据仓库项目建设完成,本以为这会大步提升IT系统的“智能性”,没想到,基层的反映却是根本没法用。
而其中的原因就在于,数据质量没法保证,也即:在业务逻辑上并不准确,各部门对于指标的定义不能统一。
以当日用户数为例。
对于这一指标,市场部、网络部、计费部等部门给出的定义并不一样。
按照元数据技术的术语来讲,就是在业务元数据上,大家对于业务的认识并不统一。
比如:计费部门认为,一个用户当天曾拨打电话,就可以计入到当日用户数;而财务部门则认定,只有在发生费用之后才能计入;至于网络部,则认为当天开机的用户就可以算作当日用户。
如此一来,各部门的当日用户数数值自然就不一样:计费中心的系统显示,当日用户数有6000;市场部的系统显示却只有4000;到了财务部门的系统中,显示仅有3000个。
在这种情况下,担负着业务压力的业务人员很可能谁也说服不了对方来接受自己的数字,导致大家对数据仓库系统本身的可信度也就打了折扣。
事实上,类似问题在目前已经建成的数据仓库项目中还有很多。
其中的一大难题就是,原先未能统一的定义导致了某种指标的不一致,而要搞清楚为什么不一致,就得反查数据仓库中的这些表在一开始的时候是如何定义的,表与表之间的联络关系是怎样的。
这种反查工作自然要求IT部门的人员就得详细查阅原先软件的设计。
但问题是,现在的软件开发一般都是迭代式开发,每个阶段都有不同的人在做。
回查一个表,很可能需要涉及到这个过程中的每一个开发人员。
事实上,很少有人能做到这一点。
即便费尽心机终于查到了,一个月的时间也过去了。
元数据管理平台的建设就是为了避免继续出现类似问题。
在元数据管理平台建成之后,其一,可以实现对技术元数据的抽取,把相关的字段放到平台上来。
在这个平台上,就能清晰地看到这些表或字段之间的关联关系,有一个很清晰的视图。
其二,还会把业务元数据抽取出来,确定要做哪些应用,就把相关的指标、流程在平台上建立起来。
把这些元数据抽取出来后,用户可以通过平台很方便地修改数据仓库中的数据,调整业务中的统计指标等等。
其三,就是要把技术元数据和业务元数据两种数据对应起来。
比如对于当日用户数来讲,它在数据仓库中对应的都是哪些表,让技术元数据和业务元数据联系起来。
这样,在把各种定义统一之后,元数据管理平台就可以给出一个更为详细的指标。
比如在数值之后做出注解,注明具体开机的有多少,发生费用的又有多少。
如此,老朱所在公司的争吵也就不复存在了。
第三方工具的魅力虽然元数据至今尚未引起业界的广泛重视,但是与元数据相关的管理工具其实早就存在,而专业的元数据管理工具则在2000年左右开始出现,比如像IBM、CA、DAG、Informatica、BEA等公司都有自己专门的元数据管理工具。
总起来看,目前国内的元数据管理工具大概有三类。
一是像IBM、CA等公司都提供的专门工具,比如IBM收购Ascential得到的Metastage,CA的DecisionBase都是如此;二是像DAG 的Metacenter,它不依托于某项BI产品,是一种第三方的元数据管理工具;三是像亚信、石竹这样的集成商也在开发自己的元数据管理工具。
“各种元数据管理工具有很多。
理论上讲,用户可以用其中一种管理其他系统中的数据,比如选择数据仓库系统厂商提供的元数据管理工具来管理其他层面的元数据。
但实际应用中的管理效果如何呢?一般情况是,这些专门工具管理自己本系统的元数据尚可,一旦跨系统管理,效果就不尽如人意了。
” 亚信产品及解决方案咨询部总监薛森这样表示。
从国内的实际应用来看,DAG的Metacenter这一工具使用最多,目前所看到的在电信、金融领域建设的元数据管理项目基本上都是应用了这一产品。
至于像CA等公司的工具,在国内基本上没有成功案例。
记者在对CA公司提出采访要求的时候,该公司在回复中则称没有合适人员接受采访,看来像CA公司在元数据管理技术上似乎还比较滞后。
石竹商业智能软件部产品支持经理薛勇认为,Metacenter能够为很多用户所采用,主要因为这一产品的几项优势:一是它是第三方提供的工具。
二是在技术上确有过人之处,可以实现动态元数据管理,实时获取元数据。
而其他非第三方工具可能对自己数据仓库中的数据看得很快,但是对于其他系统就不行了。
三是可以提供的应用多。
比如像血统分析和影响分析、表重要程度和表无关程度分析等都可以提供。
此外,还有两个产品使得SOA和元数据的紧密关系迅速凸显出来。
首先是IBM的Web Sphere元数据服务器将于今年年底作为IBM WebSphere信息集成(WII)平台Hawk 版的组成部分正式上市。
WebSphere元数据服务器将为WII平台中的产品提供元数据管理,并为其他IBM软件品牌中的元数据项目提供通用的元数据服务基础设施。
同在今年底,WebMethods公司将在12月份发布的Fabric产品下一版本也融合了Cerebra公司的语义元数据管理功能,从而来为IT 部门提供了软件资源的单一视图。
或许,只有当SOA战略充分认识到元数据管理的重要性之后,企业信息资源的业务价值才能实现最大化。
元数据管理工具现状一览表应用决定功能“这样一个平台不是仅仅把元数据抽取出来,我们把元数据管理平台定位为两个应用层次。
”亚信产品及解决方案咨询部总监薛森指出了目前元数据管理平台的两个主要应用层次,即系统维护和应用分析。
从系统维护来看,元数据管理平台使得数据仓库以及业务系统中的各种修改变得省心省力。
比如对数据库中表的修改,小的数据仓库模型的修改等等,都可以通过元数据管理平台来实现。
同时对数据仓库、OLAP、ETL等各个层面进行修改。
而在以前,这些工作需要DBA自己来完成。
那时虽然也有一些工具,但是都分散在不同的系统中。
一个DBA要完成全部修改必须要求精通所有工具才能实现。
而如果是多个DBA协作完成,同样需要通知所有人在数据仓库、OLAP、前端展现、ETL等系统中依次修改,耽误时间不说,修改是否准确也不能保证,而业务在这个修改阶段也会陷于停滞。
从应用分析上看,目前可见的应用主要有三类。
其一,作为即席查询工具做指标的管理,即通过基于元数据的指标管理,掌控各种指标的异常波动情况。
据薛森介绍,像亚信公司建设的吉林移动的元数据管理平台,现在就已经开放了一些接口给业务人员。
他们只需通过拖拽一些业务元数据就可以得到他们想要的东西。
比如,要找出某项业务的前十大用户,业务人员通过元数据平台提供的即席查询工具,几次操作就可得到结果。
而在过去,这需要业务人员首先提出请求,然后计费中心会制作一个工单,再把工单传给集成厂商,厂商再把这个工单分解开来,让某人做ETL层,某人做OLAP层。
等这些都做完,半个月的时间也就搭进去了。
当然,薛森也表示,目前这种应用接口还比较有限,因为如果每个业务人员都在用,数据仓库就承受不住了。
其二,血统分析和影响分析。
血统分析是指,发现某报表中的指标不正常就需要查出问题可能出在哪里。
通过血统图就可以很快找出问题是在BOSS系统中,还是在ODS层或者是DW层中。
影响分析则和血统图相反,主要看在修改一个表之后,可能会影响到上游的哪些数据。
其三,表重要程度分析和表无关程度分析。
主要就是针对现在数据仓库提供的表的数量太多(上万个)。
这些表中有的使用频率特别高,就需要加倍小心,多做优化。
通过元数据管理平台就可以列出不同重要程度的表。
据石竹商业智能软件部产品支持经理薛勇介绍,目前,像四川移动的元数据管理平台上,以上三类应用基本上都已存在。
但是,他也表示,目前针对元数据管理平台的应用大都还在探索阶段。
亚信薛森也认为,更重要的应用还在于更复杂的分析上。
此外,据说目前国内迄今为止最为全面的一个元数据管理平台项目正在中国银行总行抓紧实施,现在尚未开始验收,其中还将出现哪些新的应用尚且不得而知。
编看编想不够成熟,但足够重要!“你在做元数据管理平台项目时,最大的工作量是花在哪里?”这是笔者对每位被访者都会问的一个问题,而两位采访者不约而同提到的一点就是,整理元数据。
事实上,这一问题也正彰显着目前国内的元数据管理项目尚不够成熟。
“说不成熟,是因为数据不成熟。
”薛森表示。
作为企业,从一开始就没有完整的规划,比如当初指标的含义,现在几乎都需要倒着往回推,要获得那些元数据自然就比较困难。
薛勇也认为,各部门都有各自的描述方式,比如对于男女,有的分成F和M,有的分成0和1。
如果把这些整理出来,是个很麻烦的过程。
而要克服这种困难,只能靠熬时间一点一点解决。
而像管理工具本身的不成熟也是一个方面。
薛勇就认为,目前的元数据管理工具还不能自动把不同系统元数据之间的关系自动映射出来,还需要人工去做。
此外,目前平台导入的元数据范围也还很有限。
比如在电信企业中,大多仅仅导入了经营分析系统的元数据。
而像BOSS系统,动辄都有几千个业务控制点,导入元数据弄不好就要影响业务。
也正是因为顾及到这一点,所以目前的元数据管理平台只是选择了在经营分析系统这样一个准实时的分析系统上做试点,然后再逐步推广。
总起来看,目前国内大型行业企业做元数据管理项目虽然不成熟,但是技术发展很快;见效虽然不快,但是早晚要做,而且早做比晚做遇到的困难相对要少些。
对于那些有条件的大型行业用户,早点入手无疑更好一些。
(CCW-CNW)2.元数据管理技术及应用现状朋友老朱在最近惊喜地发现,在营业部的每周例会上,原先各部门针对每日用户数的争吵声,现在逐渐销声匿迹了。