元数据管理研究报告

合集下载

报告中的原始数据管理与记录方法

报告中的原始数据管理与记录方法

报告中的原始数据管理与记录方法近年来,随着科技的不断进步和数据的快速发展,原始数据在各个领域中扮演着越来越重要的角色。

对于科研工作者、企业管理者以及政府决策者而言,准确、可靠的原始数据是做出正确决策和有效管理的基础。

在报告中,如何管理和记录原始数据成为了一个重要的环节。

本文将分别从六个方面来详细论述报告中的原始数据管理与记录方法。

一、确认指标和数据类型在进行报告撰写之前,首先需要确认所涉及的指标和数据类型。

对于不同的领域和目的,所需的指标和数据类型会有所不同。

例如,在科研领域中,常见的数据类型包括实验数据、调查问卷数据和统计数据等;而在企业管理中,常见的数据类型包括销售数据、财务数据和生产数据等。

确认指标和数据类型有助于明确所需的原始数据,以及后续的管理和记录方法。

二、建立数据收集和录入流程为了确保原始数据的准确性和完整性,在报告中建立数据收集和录入流程是必不可少的。

首先,需要明确数据收集的时间点和频率,并确保数据的采集和录入流程能够顺利进行。

其次,应选择合适的数据收集工具,并培训相关人员进行数据的录入和整理。

同时,需要设立一套数据审核和验证机制,及时发现并纠正数据录入中可能存在的错误。

三、确保数据的安全性和保密性在报告中,数据的安全性和保密性是非常重要的。

因此,需要采取一系列措施来确保数据的安全存储和传输。

首先,应建立严格的权限控制和数据访问规则,仅允许授权人员进行数据的查询和使用。

其次,可以使用加密技术来保护数据的传输过程,如采用SSL加密协议或VPN连接等。

此外,在报告中还应明确规定数据的保密期限和范围,以防止数据被未经授权的人员使用和泄露。

四、建立数据清洗和预处理流程在原始数据中,往往会存在一些噪声、异常值或缺失值等问题。

这些问题如果不进行清洗和预处理,将会对后续的分析和报告产生一定的影响。

因此,在报告中建立数据清洗和预处理流程是必要的。

清洗和预处理的方法可以包括剔除异常值、填充缺失值、平滑数据等。

数据治理流程研究报告总结

数据治理流程研究报告总结

数据治理流程研究报告总结数据治理流程研究报告总结一、引言数据作为企业和组织非常重要的资产之一,其管理和运用对于组织的发展和竞争力至关重要。

数据治理作为数据管理的重要手段,旨在确保数据的准确性、完整性、安全性和可信度,提高数据质量和数据价值,从而为企业决策和运营提供有力支持。

本报告对数据治理流程进行了研究和总结,目的是为各企业和组织提供相应的指导和借鉴。

二、数据治理流程概述数据治理流程是指对数据进行全面管理的一系列活动和步骤。

主要包括数据策略制定、数据标准定义、数据质量管理、数据安全管理、数据使用监控等环节。

在实施过程中,需要明确的责任和权限、制定合适的流程和规范,并采用相应的技术手段和工具来支持。

三、数据治理流程的关键环节1. 数据策略制定:制定适合组织需求的数据治理策略是数据治理流程的第一步。

这需要明确数据治理的目标和原则,确定数据治理的组织架构和相关职责,制定相应的政策和流程。

同时,还需要明确数据治理的资源投入和预期成果,保证治理工作的可持续发展。

2. 数据标准定义:数据标准是保证数据一致性和可比性的前提。

在数据治理流程中,需要进行全面的数据分类和整理,确定数据的语义和规范,建立数据字典和元数据管理体系。

同时,还需要制定数据质量标准和数据安全标准,明确数据的接口、格式和交换方式,确保数据规范性和可用性。

3. 数据质量管理:数据质量是数据治理的核心内容之一。

数据质量管理包括数据清洗、数据验证、数据修复和数据监测等环节。

数据清洗是指对数据中的重复、冗余、错误和不一致性进行清理和修正,确保数据的准确性和一致性。

数据验证是通过对数据进行比对和检验,确认数据的可信度和完整性。

数据修复是对数据的错误和不一致性进行修复和补充。

数据监测是对数据质量进行实时监控和评估,提供数据质量的反馈和改进机制。

4. 数据安全管理:数据安全是数据治理的重要保障。

数据安全管理包括数据的机密性、完整性、可用性和可追溯性管理。

这需要制定合适的访问控制策略和权限管理机制,保护数据的隐私和机密性。

元数据管理研究报告

元数据管理研究报告

元数据管理研究报告在当今数字化的时代,数据已成为企业和组织最宝贵的资产之一。

而元数据管理作为数据管理领域的重要组成部分,对于提升数据质量、促进数据共享和利用、保障数据安全等方面都具有至关重要的作用。

本文将对元数据管理进行深入研究,探讨其概念、重要性、面临的挑战以及解决方案。

一、元数据管理的概念元数据简单来说,就是“关于数据的数据”。

它描述了数据的各种属性和特征,例如数据的名称、类型、长度、来源、创建时间、修改时间、所有者、数据之间的关系等等。

元数据管理则是指对元数据的创建、存储、维护、更新、查询和使用进行有效的规划、控制和监督,以确保元数据的准确性、完整性和一致性。

二、元数据管理的重要性1、提高数据质量通过元数据管理,可以清楚地了解数据的来源、含义和质量状况,从而能够及时发现和纠正数据中的错误和不一致性,提高数据的准确性和可靠性。

2、促进数据共享和利用元数据提供了对数据的清晰描述和理解,使得不同部门和系统之间能够更好地共享和利用数据。

用户可以通过元数据快速找到所需的数据,提高数据的利用效率。

3、支持数据治理元数据管理是数据治理的重要基础。

通过对元数据的管理,可以明确数据的责任主体,制定数据的标准和规范,确保数据的合规性和安全性。

4、优化数据架构元数据能够反映数据的分布和结构,帮助企业优化数据架构,提高数据存储和处理的效率。

三、元数据管理面临的挑战1、元数据的多样性和复杂性随着企业信息化程度的提高,数据来源越来越多,包括数据库、文件系统、应用系统等,不同来源的数据具有不同的格式和结构,导致元数据的多样性和复杂性增加,给管理带来了困难。

2、元数据的一致性和准确性由于元数据可能在多个系统和部门中创建和维护,容易出现元数据不一致和不准确的情况。

例如,同一个数据在不同的系统中可能有不同的定义和描述。

3、元数据的变更管理在数据的生命周期中,元数据可能会频繁发生变更。

如何有效地管理元数据的变更,确保相关人员能够及时了解变更情况,并对受影响的系统和流程进行相应的调整,是一个挑战。

知识元数据分析

知识元数据分析

上传图纸“华能唐山港曹妃甸港区煤码头工程 工程可行性研究报告总平面布置图”
查询结果
总平面布置图(方案一)
来源:工程可行性研究报告
设计人:XXX 校核人:XXX 校审人:XXX 审核人:XXX
总平面布置图
来源: 工程可行性研究报告
设计人:XXX 校核人:XXX 校审人:XXX 审核人:XXX
总平面布置图(方案二)
图纸内容: XXX 相关图纸: XXX 设计人: XXX
…………………………………………………………………………………………………………………………………………………………
同时实现相关设计者显示
1. 图纸搜索
将档案管理系统中所存储的全部图纸、图片实现基于图纸元数据分析的图纸检索,将关键词与图纸属性 相匹配,查询相近、相关图纸,返回检索结果。同时检索结果可以根据设定的属性标签,将结果按照不同 属性类别递次筛选。系统功能包括对热门搜索知识元的归纳总结及相似图纸的类别总结。搜索电子文件中的图片, 通过从文件中自动抽取的图纸,以及其对应的标题、所属项目、设计人、内容阐述等实现基于内容的图纸搜索
XXX
知识元是显性知识的最小可控单位,一个知识元在逻辑上是完整的,能表达一个完整的事实、原理 方法、技巧等。
通过知识元连接和发掘各种知识元的相关联系,是知识元服务的重要手段和目的,以此来揭示知识元 间的各种关联,得以创造新知识
数值知识元 图纸知识元
图表知识元 概念知识元
知识链接 知识地图
将文献内容中的一段数值、一张图表、一张图纸、一个事实、一个概念、一个创新点为知识元, 并进行标引及链接,构建知识网络。阐明从单一知识到复合知识表达实现的过程方式。
来源
工程可行性研究报告

第12章元数据管理-DAMA-DMBOK:数据管理知识体系(第二版)

第12章元数据管理-DAMA-DMBOK:数据管理知识体系(第二版)

第12章元数据管理-DAMA-DMBOK:数据管理知识体系(第⼆版)第⼗⼆章元数据管理1.简介元数据的最常见定义,“关于数据的数据”,很容易引起误解。

可以归类为元数据的信息种类繁多。

元数据包括有关技术和业务流程,数据规则和约束以及逻辑和物理数据结构的信息。

它描述了数据本⾝(例如,数据库,数据元素,数据模型),数据表⽰的概念(例如,业务流程,应⽤程序系统,软件代码,技术基础结构)以及数据和概念之间的连接(关系)。

元数据可帮助组织了解其数据,系统和⼯作流程。

它可以进⾏数据质量评估,并且是数据库和其他应⽤程序管理的组成部分。

它有助于处理,维护,集成,保护,审核和管理其他数据。

要了解元数据在数据管理中的重要作⽤,请想象⼀个⼤型图书馆,其中有成千上万的书籍和杂志,但没有卡⽚⽬录。

没有卡⽚⽬录,读者甚⾄可能不知道如何开始寻找特定的书甚⾄特定的主题。

卡⽚⽬录不仅提供必要的信息(图书馆拥有的书籍和材料以及在何处被搁置),还使读者可以使⽤不同的起点(主题区域,作者或标题)来查找材料。

没有⽬录,很难甚⾄不可能找到⼀本书。

没有元数据的组织就像没有卡⽚⽬录的图书馆。

元数据对于数据管理和数据使⽤都是必不可少的(请参阅DAMA-DMBOK中对元数据的多个引⽤)。

所有⼤型组织都会产⽣和使⽤⼤量数据。

在整个组织中,不同的个⼈将具有不同级别的数据知识,但是没有⼀个⼈会了解有关数据的所有知识。

此信息必须记录在案,否则组织可能会失去有关⾃⾝的宝贵知识。

元数据提供了捕获和管理有关数据的组织知识的主要⽅法。

但是,元数据管理不仅是知识管理⽅⾯的挑战,⽽且还存在许多挑战。

这也是风险管理的必要。

元数据对于确保组织可以识别私有数据或敏感数据以及为⾃⼰的利益管理数据⽣命周期以及满⾜合规性要求并使风险最⼩化是必不可少的。

没有可靠的元数据,组织将不知道它拥有什么数据,数据代表什么,它起源于何处,它如何在系统中移动,谁可以访问它,或者对⾼质量数据意味着什么。

DAMABOOK(DAMA)- 第12章 元数据管理-思维导图

DAMABOOK(DAMA)- 第12章 元数据管理-思维导图

ETL作业详细信息。
文件格式模式定义。
源到目标的映射文档。
数据血缘文档,包括上游和下游变更影响的信 息。
程序和应用的名称和描述。
周期作业(内容更新)的调度计划和依赖。
恢复和备份规则。
数据访问的权限、组、角色。
批处理程序的作业执行日志。
抽取历史和结果。
调度异常处理。
基本概念
审计、平衡、控制度量的结果。 错误日志。
目标和原则
推换广。或强制使用技术元数据标准,以实现数据交 组织承诺
战略
企业视角
潜移默化 原则
访问
质量
审计
改进
元数据与数据
数据集、表和字段的定义和描述。
业务规则、转换规则、计算公式和推导公式。
数据模型。
数据质量规则和检核结果。
数据的更新计划。
引言
数据溯源和数据血缘。
业务元数据
数据标准。
特定的数据元素记录系统。
过程控制
元数据解决方案的文档
元数据标准和指南
元数据存储库完整性
元数据管理成熟度
专职人员配备
元数据使用情况 业务术语活动
度量指标
主数据服务数据遵从性
元数据文档质量
元数据存储库可用性
元数据治理
缺失高质量元数据影响
因容不的正知确识、导不致完错整误和判不断合。理的假设或缺乏数据内 暴业露信敏誉感和数导据致,法使律客纠户纷或。员工面临风险,影响商 如们果了了解解的数知据识的也那随些之领被域带专走家了们。离开了,那么他
集中式元数据架构
抽系取统元中数的据元时数可据进进行行转补换充、,自提定高义了或元使数用据其的他质源 量。 必须使用复杂的流程确保元数据源头中的更改能 够快速同步到存储库中。

从用户视角探索新一代图书馆信息管理服务——以FOLIO图书馆服务平台为例

从用户视角探索新一代图书馆信息管理服务——以FOLIO图书馆服务平台为例

DCWIndustry Observation产业观察179数字通信世界2024.031 图书馆服务系统到平台1.1 国内图书馆服务系统的现状国内大多数图书馆的服务系统相对于国际先进图书馆一直是处于滞后的状态,近期大多是使用国内商业公司的图书馆集成管理系统(Integrated Library Sy s t e m ,I L S )软件,如江苏汇文软件有限公司的Libsys 图书馆管理系统。

这种ILS 模式的图书馆系统软件仅对图书馆的纸质资源和电子资源进行存储和简单管理,但在搜索机制和辅助研究的功能上缺乏实用性,难以适应学术和教育的需求。

首先其作为信息搜索工具无法达到令人满意的效果,网络资源和电子资源的检索往往要借助搜索引擎。

其次,面对各项国内外电子资源的数据库没有做好整合处理,需要多次重复检索才能找出所有的资源。

此外,在学术和教育支持上,高校图书馆往往无法有效整合和筛选网络上的课程资源,知识服务并不完备。

但仍有高校图书馆积极做出改变,寻求满足我国高校需求的新型图书馆服务系统。

2016年12月北京师范大学成为我国第一家ALMA 图书馆服务平台,将图书馆服务平台(Library Service Platform ,LSP )引入国内。

2017年1月清华大学也将ALMA 作为其下一代图书馆服务平台[1]。

此后,部分高校引入了国外的图书馆服务平台。

2018年,深圳大学图书馆也在3—9月完成了基于FOLIO 和CLSP 的图书馆管理系统升级开发[2]。

FOLIO 和商业化LSP 产品正在我国崭露头角。

1.2 国外主流ILS产品的盛行国外的LSP 产品丰富多种,有OCLC 、EBSCO 和Exlibris 等大公司推出的WMS 、EDS 和ALMA 等主流产品,也有FOLIO 、Evergreeen 、Koha 等开源产品,还有可供选择的中等公司的Spydus 等主打澳洲等地的少量其他产品。

根据Marshall Breeding [3]总结的2020年图书馆系统市场报告中的内容,占据LSP 主流的产品逐渐减少为七个,其中ALMA 占据着绝对领先的地位。

meta开题报告

meta开题报告

meta开题报告一、研究背景随着信息技术的飞速发展,互联网已经成为人们生活中不可或缺的一部分。

在这个数字化的时代,数据的规模和复杂性呈指数级增长,如何有效地处理和分析这些海量数据,从中提取有价值的信息,成为了各行各业面临的重要挑战。

Meta 技术应运而生,它为解决这些问题提供了新的思路和方法。

Meta 技术,通常指的是关于数据、信息和知识的元数据管理和分析技术。

它不仅仅关注数据本身,更注重对数据的描述、定义、组织和管理,以提高数据的质量、可用性和可理解性。

通过 Meta 技术,我们可以更好地理解数据的来源、结构、含义和用途,从而更有效地利用数据进行决策支持、业务优化和创新发展。

二、研究目的和意义(一)研究目的本研究旨在深入探讨 Meta 技术的原理、应用和发展趋势,分析其在不同领域的应用案例,找出存在的问题和挑战,并提出相应的解决方案。

(二)研究意义1、理论意义Meta 技术作为一个新兴的研究领域,目前还缺乏系统的理论体系和研究方法。

本研究将有助于丰富和完善 Meta 技术的理论框架,为后续的研究提供参考和借鉴。

2、实践意义Meta 技术在数据管理、知识工程、人工智能等领域有着广泛的应用前景。

通过本研究,我们可以为企业和组织提供有效的 Meta 技术应用策略和实践指南,帮助他们提高数据管理水平和决策效率,提升竞争力。

三、研究内容(一)Meta 技术的基本原理和概念1、元数据的定义、分类和特点2、 Meta 模型和架构3、 Meta 技术的核心算法和数据结构(二)Meta 技术的应用领域和案例分析1、数据仓库和数据治理2、知识管理和语义网3、人工智能和机器学习(三)Meta 技术面临的问题和挑战1、数据质量和一致性问题2、元数据的更新和维护3、隐私和安全问题(四)Meta 技术的发展趋势和展望1、与新兴技术的融合(如区块链、物联网)2、智能化和自动化的发展方向3、行业标准和规范的建立四、研究方法(一)文献研究法通过查阅国内外相关文献,了解Meta 技术的研究现状和发展动态,为后续的研究提供理论基础和参考依据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.什么是元数据元数据是:• 数据的数据(data about data)• 结构化数据(Structured data about data)• 用于描述数据的内容(what)、覆盖范围(where, when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的桥梁;• 资源的信息(Information about a resource)• 编目信息(Cataloguing information)• 管理、控制信息(Administrative information)• 是一组独立的关于资源的说明(metadata is a set of independent assertions about a resource )data that defines and describes other data (ISO/IEC 11179-3:2003(E))简单地说,元数据是数据仓库数据本身信息的数据(data about data)。

针对于数据仓库的元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。

技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:•数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;•业务系统、数据仓库和数据集市的体系结构和模式;•汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;•由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。

业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:•企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。

以这个企业模型为基础,不懂数据库技术和SQL语句的业务人员对数据仓库中的数据也能做到心中有数。

•多维数据模型:这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。

这里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。

业务概念模型和物理数据之间的依赖:以上提到的业务元数据只是表示出了数据的业务视图,这些业务视图与实际的数据仓库或数据库、多维数据库中的表、字段、维度、层次等之间的对应关系也应该在元数据知识库中有所体现。

元数据与数据是什么关系?元数据也是数据,其本身也可以作为被描述的对象,这是描述它的数据就是元数据。

在信息系统中一般把数据看成是独立的信息单元,不管这里的“数据”是一本书、一个网页、或者一个虚拟的URL 地址。

元数据可以出现在:• 数据内部;• 独立于数据;• 伴随着数据;• 与数据包裹在一起元数据的作用在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:1.描述哪些数据在数据仓库中;2.定义要进入数据仓库中的数据和从数据仓库中产生的数据;3.记录根据业务事件发生而随之进行的数据抽取工作时间安排;4.记录并检测系统数据一致性的要求和执行情况;5.衡量数据质量。

与其说数据仓库是软件开发项目,还不如说是系统集成项目,因为它的主要工作是把所需的数据仓库工具集成在一起,完成数据的抽取、转换和加载,OLAP 分析和数据挖掘等。

它的典型结构由操作环境层、数据仓库层和业务层等组成。

其中,第一层(操作环境层)是指整个企业内有关业务的OLTP系统和一些外部数据源;第二层是通过把第一层的相关数据抽取到一个中心区而组成的数据仓库层;第三层是为了完成对业务数据的分析而由各种工具组成的业务层。

元数据管理起到了承上启下的作用,具体体现在以下几个方面:•便于集成•提高系统的灵活性•保证数据的质量•帮助用户理解数据的意义二.元数据管理状态所谓元数据管理,就是对技术元数据和业务元数据进行管理,其目标是为了提升共享、重新获取和理解企业信息资产的水平.元数据管理的主要任务有两个方面:一是负责存储和维护元数据库中的元数据;二是负责数据仓库建模工具、数据获取工具、前端工具等之间的消息传递,协调各模块和工具之间的工作。

数据仓库元数据管理的成熟度模型及现状元数据管理的成熟度模型第一级: 随机状态(Ad-hoc)行为特征在这一级上,对元数据的管理是随机的。

元数据由某个人或某一组人员在局部产生或获取,并在局部使用。

在大多数时间里,元数据是隐匿在信息中,比如存储于诸如Word、Excel等形式的办公文档,这些文档使用的术语仅局部的用户能知道其确切含义。

人们通过与“责任人”直接通信或通过信息会话来获取这些知识。

在局部环境工作数月或数年后,人们使这些元数据以及对它的理解内在化,使对这种信息有习惯性的理解。

在这一阶段,元数据通过组织机构缓慢的传播或根本不传播,这取决于局部小组与其他小组间的通信量的大小,这些元数据可能永远“待”在该局部小组或某个人那儿。

如果这样的小组或个人调离,则这种元数据信息可能永远丢失。

人元数据知识保留在人的大脑中。

在这种环境中,知道(或不知道)与谁交谈对于理解元数据成为一件十分重要的事。

处理元数据要通过与“责任人”的交谈才能共享。

新来者需要通过他们的日常工作来学习元数据。

外部人员难以理解元数据,他们必须与“责任人”交谈才能得到他们想要的东西。

因为元数据在局部产生或抓取并在局部使用,所以通常也只能在局部修改,这种修改通常也不会通知公司里其他的组织。

技术可以用各种不同的工具来生成元数据。

绝大部分是面向个人电脑的应用软件。

例如,ERWin可用于数据库建模,Rational用于为对象建模、Excel用于生成商品列表等。

这些工具都没有设计成可以交换信息,因此,只能在当地的文件系统中保存所生成的元数据。

第二级: 发现行为特征在元数据管理的这一级上,可以发现在不同企业之间的元数据。

像第一级的情况一样,元数据仍然在局部产生和抓取,然而,它处于可发现状态,这样的元数据在企业一级显露,使得每一个对它有兴趣的人都能随时了解“什么已经存在”。

元数据仍然可以在局部级上维护,然后更新中央知识库,但它们仍然使用不同的命名法。

结果,相同的名字被用于表示意义不同的事情,而同一件事情则使用了几个不同的名字。

尽管如此,相比之下,从不同来源来的数据和数据的含义已经具有了更多的透明度。

对于商业用户,如果他们需要,现存的技术可为他们提供有关数据的来源和怎样对数据进行计算的信息。

人人们开始感知到共享元数据信息的重要性。

业务分析员、数据拥有者和应用开发者现在自觉地将元数据信息加载到中央知识库中。

处理元数据知识经由中央数据库进行共享。

凭借对中央知识库地理解,人们能够发现在其他应用系统中的数据。

然而,由于使用术语的不同,人们互相之间需要交流,以便弄清某些元数据的含义。

而且,由于元数据的更新不受任何方式的控制,使得这种更新没有告示或贴切的分析。

技术有一些元数据管理工具可用于共享来自数据源的元数据,并能把来自不同建模工具的逻辑元数据导入到元数据知识库中。

AG Rochade、Unicon、MetaMatrix是该类产品的一些例子。

然而,除了以商业含义来定义数据表格的栏目名之外,这些工具没有一个能很好地抓取元数据。

第三级: 管理控制行为特征这一级对元数据的修改进行集中管理。

局部业务单元或开发小组如不通知其他的元数据保管者和用户,就不再能按照自己的想法对元数据进行修改。

在一个地方发起的元数据的修改将传播给其他地方。

有各种工具和方法可用于不同业务单元之间交换元数据。

为了整合不同数据源中的数据,仍然必须用手工进行数据的映射,以解决不同数据源的数据整合。

但是,这种映射在一个中央知识库上进行维护和管理。

人数据拥有者、应用开发人员、用户和其他的数据保存者现在比以往任何时候更清楚元数据管理的重要性。

人们遵循有关元数据管理的“监督”处理操作规程。

在对元数据进行修改前,他们就分析这种修改将会产生的影响。

他们认识到元数据的共享将使组织的运作更有效,并使他们的生活更轻松。

处理建立了监督体系结构(谁是数据和应用的拥有者),监督资产(数据仓库、数据集市、命名标准)和流程(何时开始更新、如何更新)。

技术有几个工具经常被用于元数据的监督处理。

SchemaLogic是一种新兴的工具,通常被用于帮助监督处理发现业务的词汇及其分类。

还有一些软件提供商正在相互竞争,以填补这一空间,但还没有一家能提供商用的产品。

第四级: 优化行为特征在对元数据实施集中存储并通过监督体制对元数据进行管理后,企业会发现,通过标准化和整合可以实施有意义的优化。

为了优化各业务单元之间的各种冲突和各个副本,人们开发了一个企业数据模型和词汇表。

人们可以将这些标准模型和词汇表用于各种新的应用。

时机成熟时,可以把各种老的应用迁移到这些模型上。

人在这一级,人们坚持不懈地探索优化的途径。

人们协同工作,通过在数据的入口点确认数据的有效性来提高数据的质量。

通过确定各业务实体的权威数据源,使数据的映射达到最小化。

数据开始从一个业务单元平滑地流到另一个业务单元,而不用担心昂贵的数据集成成本。

处理首先,生成企业数据模型,并在中央知识库进行维护。

第二,对数据模型中定义的每一个实体确定权威数据源或企业应用的主参照数据,然后将业务的上下文信息和含义与这些数据源进行关联。

在整个组织中对业务的词汇表进行标准化。

鼓励应用开发小组使用这些标准化的术语,来生成、传播和表示信息。

技术目前,仅有少数几个能帮助企业实施优化的工具。

而且,每一个工具只能完成其中一到两个任务,还没有哪个工具能做企业优化所需的所有事情。

第五级: 自动化行为特征在这一级,元数据管理是自动进行的。

当在逻辑层次发生元数据更新时,它们将被传播到物理层次。

反之,当在物理层次发生更新时,逻辑层次将被更新,以反映这种更新。

在元数据中的任何变化也将触发业务工作流,以处理其他各个业务系统所需的相对应的任何修改。

由于各个应用系统遵照相同的词汇表,它们之间的关系可以通过知识本体进行推断,所以,各应用系统之间数据格式的映射自动产生。

人人们把元数据管理作为常规业务的组成部分。

就像电信网对业务的支持一样,元数据成为组织运作中一种关键的、普遍存在的、无形的资产。

相关文档
最新文档