元数据管理平台
元数据变更的管理流程

元数据管理--新增管理流程
IT项目组
提出新增需求
元数据管理员
数据平台/下游系统
开始 完成详设后
1.提出元数据新增 需求 《元数据变更审批 表》
2.受理新增需求,判 断是否元数据采集
新增元数据受理
是
是否采集
3.元数据采集方案及 计划确定
4.元数据信息整理
下游系统影响分析
5.评估元数据使用 情况
是否使用
是
库元数据采集
元数据发布
8.新增元数据发布
结束
元数据变更的管理流程
元数据管理--变更管理流程
IT项目组
提出变更需求
元数据管理员
数据平台/下游系统
开始 需求确认后 1.整理元数据变更信 息,提出元数据变更 需求 《元数据变更审批 表》
2.元数据变更影响 分析,判断是否影 响下游
变更影响分析
是否影响下游
是
否
3.通知相关下游系 统
4.实际影响情况评 估,判断是否需同 步改造 是否需同步改 造
同步改造
5.组织相关下游同步改 造
是
6.组织同步测试
7.变更同步投产 8.生产库元数据采集
否
投产后分析
9.元数据版本比对
10.元数据变更发布
结束
元数据管理方案

元数据管理方案1.1元数据抽取为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。
通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。
1.1.1抽取的对象元数据抽取主要针对的对象有以下几种:已有目录:已建业务应用系统中现有的目录资源。
数据库:各种数据库资源,包括关系型数据库、XML数据库等。
格式化电子文件:电子文件,例如Word、PDF、XLS等文件。
1.1.2元数据抽取的流程元数据抽取的流程有4个主要步骤,分别为:数据源信息获取:解决要从哪个数据源获得元数据的问题。
内容/结构分析:解决要从数据源中获得哪些元数据的问题。
元数据提取:解决如何从数据源中获取元数据的问题。
存储入库:解决元数据存储的问题。
1.1.3电子文档的元数据抽取对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。
针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程:整理归档对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的。
但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。
各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。
在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。
●根据安全级别,建立相应的访问机制由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。
●编目处理现阶段,主流格式的电子文档,主要包含:word、excel、ppt、pdf等。
元数据管理平台

元数据管理平台元数据管理平台是指对数据的元数据(metadata)进行统一管理和维护的工具或系统。
元数据是描述数据的数据,它包含字段、表、主键、外键、索引、数据类型等信息。
元数据管理平台的主要功能是收集、存储、管理和使用元数据,使企业能够更好地理解和利用数据资源。
元数据管理平台的主要优势是可以帮助企业实现数据质量管理、数据集成、数据治理等目标。
首先,通过对数据的元数据进行收集和分析,可以发现数据质量问题,如冗余数据、不一致数据等,并提供相关的数据清洗和校验功能,帮助企业提升数据质量。
其次,元数据管理平台可以帮助企业实现不同数据源的集成,将分散的数据整合在一起,形成一张全面、完整的数据地图,方便用户进行查找和分析。
另外,元数据管理平台还可以帮助企业进行数据治理,通过对元数据进行分类、权限管理和监控,确保数据的安全性和合规性。
元数据管理平台的核心功能包括元数据的收集、存储、检索和分析。
收集功能主要通过抽取工具、数据抓取接口等方式,将数据源中的元数据抽取出来,存储在统一的元数据仓库中。
存储功能主要是将元数据按照一定的数据模型进行存储,以便于后续的查询和分析。
检索功能主要是为用户提供便捷的元数据查找和查询功能,可以根据关键字、属性、分类等条件进行查找。
分析功能主要是对元数据进行统计和分析,可以生成元数据质量报告、数据流程图等辅助分析工具,帮助用户更好地理解和使用数据。
在选择元数据管理平台时,需要考虑以下几个因素。
首先,平台的易用性和用户界面是否友好,是否能够方便地进行元数据的管理和维护。
其次,平台的兼容性和扩展性,是否能够支持不同的数据源和数据模型,并能够进行业务的定制和扩展。
另外,平台的性能和稳定性也是重要的考虑因素,需要保证平台能够高效地处理大规模的元数据,并确保数据的安全性和可靠性。
总结而言,元数据管理平台是企业进行数据管理和维护的重要工具,它可以帮助企业实现数据质量管理、数据集成和数据治理等目标,提升数据的价值和利用率。
数据治理之元数据管理的利器——Atlas入门宝典

数据治理之元数据管理的利器——Atlas⼊门宝典随着数字化转型的⼯作推进,数据治理的⼯作已经被越来越多的公司提上了⽇程。
作为Hadoop⽣态最紧密的元数据管理与发现⼯具,Atlas在其中扮演着重要的位置。
但是其官⽅⽂档不是很丰富,也不够详细。
所以整理了这份⽂档供⼤家学习使⽤。
本⽂档基于Atlas2.1.0版本,整理⾃部分官⽹内容,各种博客及实践过程。
⽂章较长,建议收藏。
新版本的⽂档请关注公众号⼤数据流动,会持续的更新~本⽂档共分为8个部分,层级结构如下图所⽰。
⽂档版权为公众号⼤数据流动所有,请勿商⽤。
相关技术问题以及安装包可以联系笔者独孤风加⼊相关技术交流群讨论获取。
⼀、数据治理与元数据管理为什么要做数据治理?业务繁多,数据繁多,业务数据不断迭代。
⼈员流动,⽂档不全,逻辑不清楚,对于数据很难直观理解,后期很难维护。
在⼤数据研发中,原始数据就有着⾮常多的数据库,数据表。
⽽经过数据的聚合以后,⼜会有很多的维度表。
近⼏年来数据的量级在疯狂的增长,由此带来了系列的问题。
作为对⼈⼯智能团队的数据⽀撑,我们听到的最多的质疑是“正确的数据集”,他们需要正确的数据⽤于他们的分析。
我们开始意识到,虽然我们构建了⾼度可扩展的数据存储,实时计算等等能⼒,但是我们的团队仍然在浪费时间寻找合适的数据集来进⾏分析。
也就是我们缺乏对数据资产的管理。
事实上,有很多公司都提供了开源的解决⽅案来解决上述问题,这也就是数据发现与元数据管理⼯具。
简单地说,元数据管理是为了对数据资产进⾏有效的组织。
它使⽤元数据来帮助管理他们的数据。
它还可以帮助数据专业⼈员收集、组织、访问和丰富元数据,以⽀持数据治理。
三⼗年前,数据资产可能是 Oracle 数据库中的⼀张表。
然⽽,在现代企业中,我们拥有⼀系列令⼈眼花缭乱的不同类型的数据资产。
可能是关系数据库或 NoSQL 存储中的表、实时流数据、 AI 系统中的功能、指标平台中的指标,数据可视化⼯具中的仪表板。
元数据管理平台的建立

1.1 元数据简介元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。
元数据( Metadata )是描述其它数据的数据( data about other data ),或者说是用于提供某种资源的有关信息的结构数据( structured data )。
元数据是描述信息资源或者数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
元数据的基本特点主要有:1、元数据一经建立,便可共享。
元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开辟与利用环境往往是一个变化的分布式环境;任何一种格式都不可能彻底满足不同团体的不同需要;2、元数据首先是一种编码体系。
元数据是用来描述数字化信息资源,特殊是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。
元数据体系构建了企业业务的逻辑框架和基本模型,从而决定了企业业务的功能特征、运行模式和系统运行的总体性能。
企业业务的运作都基于元数据来实现。
其主要作用有:描述功能、整合功能、控制功能和代理功能。
由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。
如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。
用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。
在数据仓库领域中,元数据按用途分成技术元数据和业务元数据。
首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能匡助用户使用数据。
其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。
具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能: ( 1 )描述哪些数据在数据仓库中;( 2 )定义要进入数据仓库中的数据和从数据仓库中产生的数据;( 3 )记录根据业务事件发生而随之进行的数据抽取工作时间安排;( 4 )记录并检测系统数据一致性的要求和执行情况;( 5 )衡量数据质量。
元数据管理和数据采集

元数据管理和数据采集 公司是⼤数据公司,其中有⼀块业务主要是⼤数据的相关内容。
我们测试部门也有同事专门对针对这个平台进⾏测试。
由于我们公司有⼀个平台是做数治⼯坊的相关内容,其中从元数据管理、流程管理、配置管理、运维监控,整个主流程的了解,加深了对⼤数据的了解。
经过同事的讲解和培训,初步了解了什么是元数据管理、流程管理、调度管理、运维监控,每个模块对应有哪些内容。
数据采集流程图如下:1. 元数据管理:主要维护系统所管理的对象的各种元数据,如表、接⼝、程序。
简单说,元数据存储-表管理(采集数据、数据交换)-接⼝管理-数据交换-程序管理。
2. 流程管理:主要实现上线相关功能,如上线流程模板的维护、对象如表、接⼝、程序、字段等的上线处理、上线任务管理及对象下线处理等。
简单说,流程模板,提交上线,管理员审核-上线,测试库没问题后切换到⽣产库。
3. 调度管理:主要管理调度环境、配置调度任务(程序)等相关功能。
4. 运维监控:主要实现对任务调度环境及执⾏情况监控管理、前置机数据采集接⼝调度执⾏情况及业务数据查询等功能。
1 元数据管理元数据管理,对实际对象的管理。
包括元数据交换、元数据存储、元数据维护、元数据质量、元数据分析(⾎缘分析、影响分析、数据地图等)。
1.1 元数据 描述数据的数据。
元数据按⽤途不同分为技术元数据、业务元数据、管理元数据。
1. 业务元数据:描述数据系统中业务领域相关概念、关系和规则的数据。
包括业务术语、指标、信息分类、统计⼝径等。
2. 技术元数据:技术领域。
包括数据平台内对象和数据结构的定义、源数据到⽬的数据的映射、数据转换的描述等。
3. 管理元数据:管理领域。
包括⼈员⾓⾊、岗位职责、管理流程等。
1.2 元数据管理⼯具 元数据管理⼯具,可以了解数据资产分布及产⽣过程,⼯具具备如下功能:1. 元数据采集1. 异构环境,⽀持传统关系型数据库和⼤数据平台中采集从数据产⽣系统到数据加⼯处理系统到数据应⽤报表系统的全量元数据。
元数据管理系统的研究与设计

元数据管理系统的研究与设计容会;于勇涛;陈震霆;王晓亮;周绍景;严敏【摘要】随着计算机技术和GIS技术的发展,管理和访问大型数据集的复杂性已成为数据生产者和用户共同面临的突出问题,数据生产者需要有效的办法来组织、管理和维护海量数据.元数据作为描述数据的内容、质量、状况和其他特性的信息的作用已变得越来越重要,成为信息资源的有效管理和应用的重要手段.该文主要是研究元数据的管理,并根据现实社会需要设计一个适用在通信领域方面的元管理系统.%With the development oi computer technology and GIS technology, the complexity of managing and accessing large data sets has become a prominent problem of data producers and users, data producers need effective way to organize, manage and maintain amounts of data. The role of information of metadata as describing the data content, quality, condition and other characteristics has become increasingly important, and become an important means of effective management and applications of information resources. In this paper, the management of metadata is studied, metadata management system which is applied in communications field according to the needs of real world is designed.【期刊名称】《价值工程》【年(卷),期】2012(031)013【总页数】2页(P171-172)【关键词】元数据;DSS;CWM【作者】容会;于勇涛;陈震霆;王晓亮;周绍景;严敏【作者单位】昆明冶金高等专科学校,昆明650033;云南师范大学商学院,昆明650106;昆明冶金高等专科学校,昆明650033;昆明理工大学国土资源工程学院,昆明650093;昆明冶金高等专科学校,昆明650033;昆明冶金高等专科学校,昆明650033;昆明冶金高等专科学校,昆明650033【正文语种】中文【中图分类】TP3150 引言元数据就是描述数据的数据,随着信息技术的快速向前发展,元数据在地理空间信息资源共享过程中起着关键的作用。
openmetadata使用手册

openmetadata使用手册摘要:1.引言2.Openmetadata 简介3.Openmetadata 使用手册概述4.使用Openmetadata 进行数据发现5.使用Openmetadata 进行数据治理6.使用Openmetadata 进行数据质量管理7.使用Openmetadata 进行数据安全与合规性8.Openmetadata 的最佳实践9.结论正文:【引言】Openmetadata 是一个开源的元数据管理平台,旨在帮助组织更有效地管理其数据资产。
本使用手册将为您提供有关如何使用Openmetadata 进行数据发现、数据治理、数据质量管理和数据安全与合规性的详细信息。
【Openmetadata 简介】Openmetadata 是一个用于管理和搜索元数据的工具,可以帮助组织了解其数据资产的来源、内容和用途。
通过Openmetadata,您可以轻松地查找、理解和使用数据,从而提高数据的价值和利用率。
【Openmetadata 使用手册概述】本使用手册分为以下几个部分:1.使用Openmetadata 进行数据发现:介绍如何使用Openmetadata 来查找和理解数据资产。
2.使用Openmetadata 进行数据治理:介绍如何使用Openmetadata 来管理数据资产的整个生命周期。
3.使用Openmetadata 进行数据质量管理:介绍如何使用Openmetadata 来确保数据资产的质量和准确性。
4.使用Openmetadata 进行数据安全与合规性:介绍如何使用Openmetadata 来保护数据资产并确保合规性。
5.Openmetadata 的最佳实践:提供了一些建议和最佳实践,以帮助您更有效地使用Openmetadata。
【使用Openmetadata 进行数据发现】数据发现是了解数据资产的关键步骤。
通过使用Openmetadata,您可以轻松地搜索、浏览和筛选数据资产,以找到所需的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元数据管理平台技术白皮书北京亿信华辰软件责任有限公司2018年4月目录1.前言 (1)1.1.关于本白皮书 (1)1.2.背景介绍 (1)1.3.产品定位 (1)2.产品架构 (2)2.1.概述 (2)2.2.数据源层 (2)2.3.采集层 (2)2.4.数据层 (3)2.5.功能层 (3)2.6.访问层 (3)3.产品功能特色 (4)3.1.规范的元模型管理 (4)3.2.端到端的自动化采集 (5)3.3.全面的采集适配器 (5)3.4.可灵活定制的采集模板 (6)3.5.便捷的元数据检索 (7)3.6.完善的元数据管理 (7)3.7.强大的元数据版本管理 (8)3.8.实时的元数据变更监控 (8)3.9.数据地图鸟瞰全局 (9)3.10.丰富的元数据分析应用 (9)3.10.1.血缘分析 (9)3.10.2.影响分析 (10)3.10.3.全链分析 (10)3.10.4.关联度分析 (11)3.10.5.属性差异分析 (11)3.11.出色的元数据检核机制 (12)3.11.1.一致性检核 (12)3.11.2.属性填充率检核 (12)3.11.3.组合关系检核 (12)3.12.自助式门户 (13)3.13.丰富的服务接口 (13)4.产品技术优势 (13)4.1.系统设计原则 (13)4.1.1.先进性 (14)4.1.2.可维护性 (14)4.1.3.可靠性 (14)4.1.4.易用性 (15)4.1.5.安全性 (15)4.1.6.扩展性 (15)4.2.可扩展采集适配器设计 (16)4.3.采用MOF规范 (16)4.4.支持基于XMI的数据交换 (17)4.5.运用REST FUL架构 (18)5.软硬软件环境 (19)5.1.服务器配置推荐 (19)5.2.客户端配置 (20)5.2.1.客户端(建议配置) (20)5.2.2.客户端浏览器 (20)1.前言1.1.关于本白皮书本白皮书对应产品版本为:元数据管理技术白皮书V2.1。
最后修订日期:2018年05月。
本白皮书将在阐述元数据产品的背景介绍之后,详细介绍元数据管理平台在技术和功能上的特点。
1.2.背景介绍随着数字化加速,数据量成指数增长,大数据相关技术的出现,让大家看到了新机遇的同时,大家对数据治理的需求也在增加。
尤其是大型企业业务数据、政府政务数据、行业标准数据,往往由于数据分散、质量参差不齐、数据存储结构差异大,虽然数据中蕴含大量有价值信息,但想要挖掘出来,往往需要做大量的数据治理工作,成本十分高昂。
Gartner分析师在2017年预测,到2020年,50%的信息治理举措将通过基于元数据的政策制定。
就国内而言,目前完备成熟的元数据产品较少,市场正处于上升期,是抢占市场份额的好时机。
1.3.产品定位亿信元数据管理平台致力于处理技术元数据、业务元数据、管理元数据,帮助各行各业用户获得更多的数据洞察力,进而挖掘出隐藏在资源中的价值。
对技术人员而言,元数据管理平台通过对将分散、存储结构差异大的资源信息进行描述、定位、检索、评估、分析,实现了信息的描述和分类的结构化,从而为机器处理创造了可能,大大降低数据治理人工成本。
正因如此,元数据已经成为了很多大型数据治理项目的核心。
对业务人员而言,元数据管理平台通过对业务指标、业务术语、业务规则、业务含义等业务信息进行描述、定位、检索、评估、分析,协助业务人员了解业务含义、行业术语和规则、业务指标取数据口径和影响范围等。
2.产品架构2.1.概述元数据管理平台架构分为5层,数据源层、采集层、数据层、功能层和访问层,下图为元数据管理产品的整体架构图。
图1产品架构图2.2.数据源层数据源层是指元数据管理平台所支持的元数据来源的方式。
提供直连多种不同类型的数据源,包括:数据库类型、ETL类型、文件类型、业务系统类型等。
2.3.采集层采集层针对不同数据源提供丰富的适配器,实现端到端的自动化采集。
具体包括:sqlserver、oracle、mysql、postgresql、petabase、ODI、Excel、亿信BI等。
同时支持适配器扩展,实现最大限度的自动化采集。
2.4.数据层元数据数据层是基于关系数据库的元数据存储,用于实现元数据和元模型的数据的物理存储。
元模型存储了元数据的属性要求和存储格式要求。
元数据存储了从各个系统中采集而来的元数据信息。
2.5.功能层元数据功能层提供了元数据管理产品的基本功能,包括元模型增删改查及版本发布功能、元数据增删改查及版本管理、元数据变更管理、元数据分析应用、元数据检核以及产品的系统管理功能。
其中元模型管理模块用于操作元模型,元模型是对各个种类元数据以及元数据之间关系的定义,元模型包括两部分:一部分由元数据管理平台产品内置的标准元模型,另一部分是用户根据管理需求自定义的元模型。
元模型管理还设计了发布功能,只有在发布之后才会生效,使用户在设计元模型时,不会影响到元数据的使用。
元数据管理主要包括了元数据增删改查日常维护,版本管理,元数据全文检索。
元数据分析应用主要包括了血缘分析、影响分析、关联度分析、数据地图等多种图形化分析应用,并提供导出和收藏功能,将分享结果进行留档。
元数据检核包括一致性检核、属性填充率检核和组合关系检核,是保障元数据质量的重要手段之一系统管理功能包括了机构用户角色的权限管理、系统备份恢复、门户应用、日志管理、系统监控等系统运维相关的功能。
2.6.访问层元数据访问层用于给用户提供访问控制服务。
元数据产品面向的主要用户群有三类:技术设计人员、业务分析人员、以及系统的运维人员。
通过门户访问和后台访问,可以实现多种角色的访问控制。
同时访问层还提供了多种形式的接口服务,可以很方便的与其它IT系统进行集成。
3.产品功能特色3.1.规范的元模型管理亿信元数据管理平台元模型以Meta Object Facility(MOF)规范为基础,支持XMI 格式的元模型导入和导出,同时内置大量技术元数据、业务元数据的元模型,用户可直接使用。
元模型管理对元模型的基本信息、属性、父子关系、依赖关系、组合关系的增删改查操作,内置元模型的内置信息不允许修改或者删除,但可进行新增操作。
具体功能界面如下:图2元模型查看界面元模型支持发布功能,只有发布后的元模型才可被元数据使用,同时支持查看所有发布版本。
图3元模型版本查看界面通过发布过程,将元模型的设计和运用隔离开,元模型只有在发布之后才会生效,使用户在设计完成发布之前,不会影响到元数据的使用。
3.2.端到端的自动化采集对元数据信息的维护除界面手动操作方式外,亿信元数据管理平台利用内置采集适配器,让用户通过配置数据源参数及定时采集任务,进行自动化采集。
实现直连数据源的端到端元数据采集。
图4采集任务配置界面3.3.全面的采集适配器元数据管理系统提供了丰富的内置适配器,来保证自动化采集的同时,还支持对适配器进行扩展。
本版本内置适配器:亿信BI采集适配器i@Report采集适配器JDBC驱动采集驱动适配器Greenplum采集适配器MySOL采集适配器Oracle采集适配器PetaBase采集适配器PostgreSQL采集适配器SQL Server采集适配器Elasticsearch采集适配器HBase采集适配器ODI采集适配器Solution采集适配器Excel文件采集适配器Excel补录采集适配器3.4.可灵活定制的采集模板采集模板定制允许用户根据自己的采集需求,灵活选择需要采集的元数据及其属性,并自动生成EXCEL采集适配器可识别的EXCEL模板文件。
用户可使用模板文件将数据批量录入。
图5采集模板配置界面3.5.便捷的元数据检索提供对元数据的全文检索功能。
检索支持对检索范围、检索类型、修改时间进行过滤,过滤条件支持保存,让用户可以将常用的过滤条件保存使用,以便能够更加快速浏览所需元数据。
图6元数据检索界面3.6.完善的元数据管理元数据管理功能提供各类元数据管理,包括:业务元数据、技术元数据和管理元数据,支持元数据的基本信息、属性、依赖关系、组合关系的增删改查操作。
图7元数据管理界面3.7.强大的元数据版本管理元数据管理平台提供元数据版本管理功能,可以对元数据进行发布、查看历史版本、导出历史版本、版本对比操作。
图8版本发布界面在元数据没有发布时,仅有使用权限的用户不会获得未定版信息,保证了用户使用元数据系统的权威性和可靠性。
3.8.实时的元数据变更监控元数据管理平台可实时对元数据变更进行监控,并提供变更订阅功能,将用户关心的元数据的变更情况定期发送到用户邮箱。
图9变更查询界面3.9.数据地图鸟瞰全局一般情况下,元数据管理的业务繁多、形式各异,在集中管理后,如何提供便捷的使用方式,是发挥信息资产价值的关键。
数据地图从宏观层面组织信息,力求以用户视角对信息资产进行归并、整理,全局展现资产的宏观信息,有效挖掘信息的潜在价值。
图10数据地图3.10.丰富的元数据分析应用元数据管理平台提供了丰富的分析应用,包括:血缘分析、影响分析、全链分析、关联度分析、属性差异分析,同时支持将分析结果进行导出和收藏。
3.10.1.血缘分析血缘分析是对指定元数据的起源及其推移位置的分析。
它反应数据的来源与加工过程,还描述了数据在不同过程中发生的情况。
它可以帮助分析信息的使用方式并追踪用于特定用途的关键信息位。
图11血缘分析3.10.2.影响分析影响分析帮助用户迅速了解分析对象的下游数据信息,快速掌握元数据变更可能造成的影响,以便更有效的评估变化该元数据带来的风险,从而帮助用户高效准确的对数据资产进行清理、维护与使用。
图12影响分析3.10.3.全链分析全链分析是用来分析指定元数据前后与其有关系的所有元数据,不仅反应了元数据的来源与加工过程,也反应了元数据的使用情况,使用全链分析可清晰的了解该元数据的来龙去脉。
图13全链分析3.10.4.关联度分析关联度分析是从关系数量的角度对指定元数据进行分析,来体现该元数据在系统中依赖程度的高低,从一定的角度可以反映出该元数据的重要程度。
图14关联度分析3.10.5.属性差异分析属性差异分析是用来比较同类型元数据之间属性值的差异,方便用户识别相似元数据之间的存在的微小差距。
图15属性差异分析3.11.出色的元数据检核机制由于元数据是很多数据管理活动的基本,所以所有类型的数据中,元数据的质量是最为重要的。
亿信元数据管理平台提供元数据质量检核功能,包括一致性检核、属性填充率检核和组合关系检核,是保障元数据质量的重要手段之一。
3.11.1.一致性检核一致性检核用来检验来源系统元数据以及元数据之间信息是否一致的功能,帮助管理人员分析出元数据管理平台与来源系统之间的差异,辅助管理人员更好的维护元数据管理平台。