数据仓库 EDW

合集下载

数据仓库 EDW

数据仓库 EDW

数据中心 ODS随着企业信息化建设的发展,巨大的投资为企业建立了众多的信息系统,以帮助企业进行内外部业务的处理和管理工作。

随着信息系统的增加,各自孤立工作的信息系统将会造成大量的冗余数据和业务人员的重复劳动。

同时随着时间推移,各系统不断沉淀大量的历史数据。

如何打破信息孤岛,充分利用现有的历史数据,为企业提供战略决策的数据支持是各行各业所必需考虑的事情。

为支持企业各项业务的长远发展,不断提高管理水平,建立实现企业数据交换、数据集成的企业级数据中心,并在此基础上初步建设数据管控平台,有效实现数据质量管理,为后续数据线规划的报表管理以及EDW等系统建设奠定基础,为企业提升核心竞争力,优化资源配置、实施有效管控,提高服务水平、科学可待续发展和加速发展奠定良好的基础。

一、系统规划蓝图二、东南融通的优势1、关键技术优势数据交换、数据加工基于统一的调度监控ETLPLUS、调度引擎JSI模块封装SHELL、可执行程序、存储过程、Datastage作业等各种作业类型的执行接口?高扩展性设计,实现ETL、调度监控和硬件的集群报表工具(BI.OFFICE、其他)成熟组件支持,文件交换组件,数据加工组件2、团队优势BI线条员工超过1200人,覆盖咨询、解决方案、研发、实施各个层面参与众多的ODS/EDW/BI项目实施团队彼此配合程度高、统一协调、合作经验丰富随时进行同行信息共享与交流,及时进行方案提炼数据仓库 EDW现代商业银行面临着诸多挑战,包括金融改革日益深化的挑战、面临来自外资银行的竞争、银行国际化的发展需要、客户的要求越来越成熟、监管机构对银行的监管越来越严格。

面对这些挑战,要求金融企业对企业经营数据和信息进行充分的掌握和分析,以帮助企业精确掌握企业的经营状况和准确决策。

建立企业级的银行数据仓库是银行业整体信息资产的管理,建立信息资产的运营服务体系,提升信息资产的业务价值。

东南融通投入了大量资源研究银行企业级DW&BI应用体系,如下图所示:BI.Bank解决方案蓝图,包括以下关键内容:一、数据仓库战略规划参照国际银行领先DW&BI体系架构,规划银行企业级DW&BI的技术框架、数据模型、应用框架,结合银行的业务管理改革步伐制定整体实施计划,帮助银行循序渐进地逐步建成企业级DW&BI系统。

数据仓库、商业智能相关面试题(带答案)

数据仓库、商业智能相关面试题(带答案)

1商务智能1.1数据仓库1.1.1数据仓库的4大特点(特征)?面向主题的,集成的,相对稳定的,反映历史变化的。

1.1.2数据仓库的四个层次体系结构?1.数据源是数据仓库系统的基础,是整个系统的数据源泉。

通常包括企业内部信息和外部信息。

内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。

外部信息包括各类法律法规、市场信息和竞争对手的信息等等;2.数据的存储与管理是整个数据仓库系统的核心。

数据仓库的真正关键是数据的存储和管理。

数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。

要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。

针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。

数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)3.OLAP服务器对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。

其具体实现可以分为:ROLAP(关系型在线分析处理)、MOLAP(多维在线分析处理)和HOLAP(混合型线上分析处理)。

ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP 基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。

4.前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。

其中数据分析工具主要针对OLAP 服务器,报表工具、数据挖掘工具主要针对数据仓库。

1.1.3描述一下联机分析处理OLAP?(维的概念,基本多维操作,层次结构,与OLTP的区别)OLAP(联机分析处理On-Line Analytical Processing)也叫多维DBMS。

OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

EDW数据仓库项目策划方案

EDW数据仓库项目策划方案

XX银行EDW/数据仓库项目方案目录第一章系统总体架构............................. 51.1总体架构设计概述........................... 51.1.1总体架构的设计框架..................... 51.1.2总体架构的设计原则..................... 71.1.3总体架构的设计特点..................... 81.2EDW执行架构................................ 81.2.1执行架构概述........................... 91.2.2执行架构设计原则....................... 91.2.3执行架构框架......................... 111.3EDW逻辑架构.............................. 221.3.1逻辑架构框架......................... 221.3.2数据处理流程......................... 331.4EDW运维架构.............................. 341.4.1运维架构概述......................... 341.4.2运维架构的逻辑框架................... 361.5EDW数据架构.............................. 421.5.1数据架构设计原则..................... 421.5.2数据架构分层设计..................... 441.6EDW应用架构.............................. 491.6.1应用架构设计原则..................... 491.6.2数据服务............................. 501.6.3应用服务............................. 51第二章 ETL体系建设............................ 522.1ETL架构概述.............................. 522.2ETL设计方案.............................. 552.3ETL关键设计环节.......................... 552.3.1接口层设计策略....................... 552.3.2 Staging Area设计策略................. 562.3.3数据加载策略......................... 572.3.4增量ETL设计策略...................... 582.3.5异常处理............................. 612.3.6作业调度和监控....................... 622.3.7元数据治理........................... 622.3.8 ETL模块设计.......................... 622.3.9 ETL流程设计.......................... 672.3.10动态资源分配........................ 702.3.11数据接口设计........................ 72第一章系统总体架构1.1 总体架构设计概述1.1.1 总体架构的设计框架XX银行EDW项目的总体架构分为基础技术架构、应用架构和数据架构三个核心部分。

大数据战略分三步走

大数据战略分三步走

大数据战略分三步走作者:来源:《中国信息化周报》2017年第23期而大数据则是打磨好这六把“金钥匙”的利器。

张起华介绍,大数据战略在分三步走。

第一步,打造基础。

从2015年开始,与Teradata天睿公司合作,把分散在各个地方的数据统一整合起来。

“以前是每个单位都拿各自数据来做管理、做报告、做分析,但其实都没有统一,鸡同鸭讲,数据都不一样,决策就会有偏差。

”所以,第一步,建立了数据仓库EDW,把会员打上标签,然后做一些整合营销(Digital Marketing Services,DMS)。

这一步,已经于2016年7月已经完成。

第二步,完善强化。

接着做的第二步就是把第一步的内容做深入,在把EDW、会员视图与标签和DMS继续完善的基础上,把非结构化数据通过BDP(非结构化分析探索平台)纳入进来做整合,实现标签的丰富化。

第三步,智能时代。

便利餐饮连锁事业全面实现智能时代。

“未来,我们希望能够达到智能时代,有丰富的数据,很多预测模型建立起来以后,能达到很多的智能要求。

”张起华说。

便利餐饮连锁事业与Teradata已有三年多的合作,未来在更多的业务数据挖掘方面将有更多合作。

通过基础数据整合,建立企业动态数据仓库,可以掌控企业实时的运营数据。

“我们可以实时看到远至西藏、近至上海的每一家门店的交易情况。

根据这些数据情况,我们可以对比与预算的差距,分析会员所占的比例,会员做了什么,会员和非会员的差别是什么,哪些营销和服务部分我们做得不够好。

未来,我们希望可以一边看着这些实时的数据,一边与业务人员开会,制定在某区下午某个时间点应该进行什么样的促销,然后看着通过促销改善业务,最终数字在面前的大屏幕上如期展现。

”在张起华看来,“数据只有跟业务结合在一起才有意义,否则,脱节的数据,滞后的处理是没有价值的。

”在互联网时代,重要的是实时的交易、实时的数据,在这个基础之上,再把商品的关联性分析、推展分析逐步建立起来。

便利餐饮连锁事业在走第一步的时候,提供了三个愿望和四个需求,即个性化洞察、数字精准营销、智能化中心,以及数据的采集要多渠道,客户视图要一致性,客户分析多维度,专题建模个性营销。

永诚财产保险企业级数据仓库系统

永诚财产保险企业级数据仓库系统
对公CRM,对私CRM 绩效考核,产品管理
中国建设银行-大连分行(2003年)
业绩考评管理(ABC/EVA/贡献度)
中国建设银行-厦门分行(2002年)
数据中心 (BI.Bank DWM) 个人客户CRM,公司客户CRM 经营盈利分析,金融产品分析 绩效考核分析,财务收支测算 全行统计报表 系统升级移植(2006年)
福州商行(2005年)
业务报表系统
昆明商行(2004年)
经营分析与报表系统
太原商行(2003年)
经营分析与报表系统
苏州商行(2002年)
经营分析与报表系统
上海农村商业银行(2007年)
信贷风险统计分析系统
重庆农信(2006年)
EDW (BI.Bank DWM) 全行统计报表 1104工程
兴业银行(2003~ 2006年)
全行统一报表系统 稽核管理系统 信贷风险监控
民生银行(2002年/2007年)
统计报表系统;反洗钱监控系统
华夏银行(2001年)
aCRM
中国农业银行 (2001年)
资金财务分析
渤海银行(2007年)
报表平台 综合经营指标
天津农信(2004~2006年)
信贷管理分析 非现场监管稽核辅助分析
河南农信(2006年)
个人征信 企业征信
东莞农信(2005年)
EDW (BI.Bank DWM) 全行统计报表 卡风险监控
证券
兴业证券
FEn电信et
成功案例-其它行业
税务
政府
中国移动,多家分公司
P04先导项目(P04定义基于IAA理念 的CPIC信息模型)

dw知识点总结

dw知识点总结

dw知识点总结DW概念Data Warehousing是指从多个数据源中提取、转换和加载数据,并将其存储在一个集中的数据库或存储器中的过程。

DW主要用于支持企业决策制定,通过提供一致的、集成的和易于访问的数据来支持数据分析和报告。

主要特点包括:·集成:将来自不同数据源的数据合并,以便进行分析。

·非易失性:存储的数据通常是只读的,不会被修改或删除。

·主题导向:将数据以主题为中心进行组织,而不是按照应用程序或功能。

·时间性:数据存储会追踪时间变化,使用户能够进行历史数据分析。

DW架构DW架构包括数据提取、清洗、转换和加载(ETL),存储和元数据管理等组件。

常见的DW架构包括:企业数据仓库(EDW)、数据集市和操作数据存储(ODS)。

EDW是一个主要的DW系统,用于整合企业级数据,并支持高级分析和报告。

数据集市是一个专门的DW系统,提供特定主题的数据。

ODS是一个用于操作和实时决策支持的数据存储。

这些组件共同构成了一个完整的DW系统。

数据模型数据模型是DW的核心,它描述了数据在DW系统中的组织方式。

常见的数据模型包括:·星型模式:使用一个中心的事实表,连接到多个维度表。

·雪花模式:在星型模式的基础上,维度表进一步规范化,形成多层结构。

·灵活的模式:使用多个事实表和维度表,构建更复杂的关联结构。

ETL过程ETL过程包括三个主要步骤:数据提取、数据转换和数据加载。

数据提取是从不同数据源中获取数据,数据清洗和转换是对数据进行清理、处理和规范化,数据加载是将处理过的数据加载到DW系统中。

ETL工具是用于支持ETL过程的软件,如Informatica、SSIS和DataStage等。

数据分析数据分析是DW的一个主要应用场景,包括查询和报表、数据挖掘和预测分析等。

通过数据分析,企业能够发现潜在的商业机会、识别趋势和模式,并做出更明智的决策。

常用的数据分析工具包括Tableau、QlikView、Power BI和MicroStrategy等。

数据仓库与数据挖掘 课后答案 (陈志泊 著) 清华大学出版社

数据仓库与数据挖掘  课后答案 (陈志泊 著) 清华大学出版社

第1章数据仓库的概念与体系结构1.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。

2.元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。

3.数据处理通常分成两大类:联机事务处理OLTP和联机分析处理OLAP。

4.多维分析是指对以“维”形式组织起来的数据(多维数据集)采取切片(Slice)、切块(dice)、钻取(Drill-down 和Roll-up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。

5. ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。

6.数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。

7.数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型:两层架构、独立型数据集市、依赖型数据集市和操作型数据存储、逻辑型数据集市和实时数据仓库。

8.操作型数据存储实际上是一个集成的、面向主题的、可更新的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,也叫运营数据存储。

9.“实时数据仓库”意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则。

10.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主、以实时数据仓库和自动决策为主。

11.什么是数据仓库?数据仓库的特点主要有哪些?答:数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。

数据仓库的特点包含以下几个方面:(1)面向主题。

SAP数据仓库帮助目录翻译

SAP数据仓库帮助目录翻译
Analysis and Repair Environment .分析和修理环境
Archivation of Request Administration Data .请求管理数据的档案集
BI Background Management .BI后台管理
Clients in BW .BW的客户
Transferring Transaction Data Using Web Services (RDA) .使用WEB服务传送和处理事务数据
Monitor for Real-Time Data Acquisition .实时数据获取的监视(监控)
Troubleshooting Real-Time Data Acquisition. 实时数据获取的困难解决
InfoSource .信息源。
Migration of Update Rules, 3.x InfoSources, and Transfer Rules .对更新规则、 3.x 信息源和传输规则的迁移。
Old Transformation Concept .旧的转型概念。
Further Processing Data .进一步处理数据。
Data Warehousing .数据仓库。
ห้องสมุดไป่ตู้
The Data Warehouse Concept .数据仓库概念。
Using a Data Warehouse .使用数据仓库。
Architecture of a Data Warehouse .数据仓库的构建。
Enterprise Data Warehouse (EDW) .企业数据仓库(EDW)。
Controlling Real-Time Data Acquisition with Process Chains .带处理链的实时数据获取控制
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随着企业信息化建设的发展,巨大的投资为企业建立了众多的信息系统,以帮助企业进行内外部业务的处理和管理工作。

随着信息系统的增加,各自孤立工作的信息系统将会造成大量的冗余数据和业务人员的重复劳动。

同时随着时间推移,各系统不断沉淀大量的历史数据。

如何打破信息孤岛,充分利用现有的历史数据,为企业提供战略决策的数据支持是各行各业所必需考虑的事情。

为支持企业各项业务的长远发展,不断提高管理水平,建立实现企业数据交换、数据集成的企业级数据中心,并在此基础上初步建设数据管控平台,有效实现数据质量管理,为后续数据线规划的报表管理以及EDW等系统建设奠定基础,为企业提升核心竞争力,优化资源配置、实施有效管控,提高服务水平、科学可待续发展和加速发展奠定良好的基础。

一、系统规划蓝图二、东南融通的优势1、关键技术优势数据交换、数据加工基于统一的调度监控ETLPLUS、调度引擎JSI模块封装SHELL、可执行程序、存储过程、Datastage作业等各种作业类型的执行接口?高扩展性设计,实现ETL、调度监控和硬件的集群报表工具(BI.OFFICE、其他)成熟组件支持,文件交换组件,数据加工组件2、团队优势BI线条员工超过1200人,覆盖咨询、解决方案、研发、实施各个层面参与众多的ODS/EDW/BI项目实施团队彼此配合程度高、统一协调、合作经验丰富随时进行同行信息共享与交流,及时进行方案提炼数据仓库EDW现代商业银行面临着诸多挑战,包括金融改革日益深化的挑战、面临来自外资银行的竞争、银行国际化的发展需要、客户的要求越来越成熟、监管机构对银行的监管越来越严格。

面对这些挑战,要求金融企业对企业经营数据和信息进行充分的掌握和分析,以帮助企业精确掌握企业的经营状况和准确决策。

建立企业级的银行数据仓库是银行业整体信息资产的管理,建立信息资产的运营服务体系,提升信息资产的业务价值。

东南融通投入了大量资源研究银行企业级DW&BI应用体系,如下图所示:BI.Bank解决方案蓝图,包括以下关键内容:一、数据仓库战略规划参照国际银行领先DW&BI体系架构,规划银行企业级DW&BI的技术框架、数据模型、应用框架,结合银行的业务管理改革步伐制定整体实施计划,帮助银行循序渐进地逐步建成企业级DW&BI系统。

二、数据仓库技术平台数据仓库技术平台,即设计企业级DW&BI的整体技术框架,涵盖数据仓库、ETL、BI前端工具、元数据管理、数据质量管理、系统管理等关键技术的设计与集成。

三、银行数据仓库模型BI.BankDWM是一套预定的数据模型,描述了数据仓库各个主题域的实现,是对银行全行数据进行整合和组织的工具。

具有良好的完备性、扩展性和先进性。

四、商业智能行业应用满足个人金融部、公司金融部、计划财务部、风险管理部、信用卡部等各业务部门的日常统计报表、分析报表、管理报表;提供高层领导需要的各类统计指标数据;满足监管机构的报表。

并提供ACRM、绩效考核、平衡计分卡、资产负债管理等应用系统。

五、数据仓库实施方法论按照结构化的过程管理思想,结合数据仓库系统实施的特点,详细定义了建设一个满足客户需求的DW&BI系统所不可缺少的实施方法和项目管理方法,以降低系统实施的风险和成本,提高系统的可用性、可扩展性、灵活性。

六、数据仓库专业技术服务LFT拥有一支优秀的BI专业实施服务团队,具备丰富银行经营管理知识和丰富的项目实践经验。

以客户为中心,提供优质、及时、高效的服务,帮助银行实现商业智能技术与先进业务管理模式的整合,提升经营管理的基础平台,为客户提供业务策略分析及优化服务,帮助企业获得市场优势和价值回报。

七、解决方案特点1、LFTBI.Bank是东南融通大量项目实践经验的积累,能够为银行制度长期的建设规划。

2、提供商业智能应用平台LFTBI.Office,数据整合工具LFTETL-Plus、元数据管理平台LFTMetadata、调度与监控平台LFTDispatch、数据治理平台LFTGovernance。

3、具有大量的基于EDW的BI应用系统建设经验。

4、采用最开发的平台和技术架构。

5、最低的总投资成本。

6、最低的项目实施风险。

数据模型DWMBI.BankDWM是LFT多年的DW/BI实施过程中积累的最佳实践,并结合国外的最佳模型,在国内多个银行拥有成功案例。

BI.BankDWM用于对企业数据进行整合和组织的工具,是预定义的、面向主题的、可扩展的数据模型,我司投入大量的研发力量不断的对BI.Bank进行更新。

BI.BankDWM保证数据组织独立于业务系统的数据处理逻辑,最大程度的适应银行业务系统的升级和更换,以及新业务的开展。

BI.BankDWM是当前和未来数据的数据集成蓝图,用以建设集成的、稳定的、历史的、面向主题的企业级数据仓库,可以满足不断变化的报表、分析和决策支持的需求。

数据开放服务ADS随着企业数据中心的建立,企业已经构建了企业级数据视图,但如何快速高效的提供数据服务,真正实现数据资产的价值,已经成为企业面临的一个迫切问题。

一、目标场景随着市场环境不断变化,企业需要进行动态的经营管理,业务部门需要能够快速的获取各种信息,特别是在如下场景的快速支持:1.领导召开会议时需要的统计信息2.业绩考核与经营分析的信息支持3.时事相关的数据、临时的数据分析4.外部机构的数据需求二、服务对象开放数据服务主要针对以上场景,对以下类型的数据需求提供快速直接的服务:1.时效性要求很高,需要业务人员和IT人员高效协作2.很多查询是一次性的,或使用频度不高3.以明细数据为主,也有部分统计数据三、解决的问题开放数据服务既能解决上述的业务问题,同时还解决了企业数据中心建设后的如下问题:1、建设周期长:须先建设数据集市,再开发应用。

2、响应成本高:目前,传统工具开发报表过于复杂,大量IT人员投入到重复性的开发工作。

3、业务人员缺乏主动获取数据的手段:目前,没有操作简单、界面友好的取数工具。

4、IT与业务缺乏良好的协作平台:缺乏对数据开放过程的协作管理、应用监控。

开放数据服务是用东南融通展现平台BI.Office构建的,通过灵活报表引擎、图形、Execl/pdf/txt/html导出、透视表、批量物化和透视表等数据开放服务技术,实现自助查询、灵活报表、临时IT需求、临时报表、明细报表、外部数据需求等开放式数据服务。

逻辑架构如下图所示主数据管理ECIF一、概述目前金融企业正在面临前所未有的变革,集中体现在:业务变化的周期越来越短,客户的个性化要求越来越高。

很多银行迫切需要及时洞察客户,在金融产品和服务都需要完整、全面、及时的客户及其相关产品信息,但由于历史的原因,这些信息分布在银行的多个业务系统,造成了客户信息的分散,无法共享。

东南融通总结多年来在各专业银行数据整合、客户信息管理系统成功案例基础上,参照国际先进经验和模型,专门为区域性金融企业设计的、全面提升银行营销水平的客户信息的整体解决方案,即ECIF(Enterprise Customer Information Facility:企业级客户信息整合系统)系统解决方案。

二、解决方案特色1、LFT-ECIF 基于整体数据整合的客户信息,在数据的起点实现数据的一致性,有效的避免了某些客户信息产品的数据失真在处理过程中的放大缺陷。

2、融合了元数据、ODS、ECIF、OCRM、ACRM 等最新处理技术,实现了以完整信息对营销的全方位支持。

3、可分阶段、分模块的实施过程,最大限度的保护企业原有的投资。

4、架构设计具有高度的可扩展性,不仅能快速适应银行业务发展的需要,而且能通过加深数据挖掘深度来提升企业的经营水平。

三、方案内容四、系统应用价值1、为现有应用系统和未来新建的应用系统提供实时的、完整的、共享的、一致的客户信息。

2、推动银行新的业务流程再造3、建立新的业务规章制度4、规范客户营销、销售和服务流程,使客户体验更为亲切和方便5、使银行员工操作更为简洁和高效6、使内部管控和风险防范更有及时和有力。

元数据管理东南融通元数据管理平台(BI.MetaManger)主要针对企业在建设数据仓库项目过程中,出现的以下问题:1、每个工具都提供部分数据仓库结构信息即元数据功能,但没有全局的数据仓库视图;2、大量存在同一个数据(用户、产品和数据字典)在不同部门或系统中重复出现现象,含义和取值有可能都不同;3、代码和业务含义保存在某些人的脑子里或私有系统里,得不到共享,对开发和维护系统和理解系统带来天然的屏障;4、数据质量问题严重,出现数据质量问题后,无有效手段分析和定位问题。

BI.MetaManger有效解决了以上问题,它保证了数据仓库数据的一致性和准确性,为企业进行数据质量管理提供有力支持。

一、端到端的元数据管理作为真正端到端的元数据管理工具,提供跨工具和应用的企业级的元数据统一视图,提供了清晰定义和分析跟踪业务运作历史数据的实际可行的解决方案。

二、可定制的元模型管理提供企业数据仓库环境内置的元数据类型支持;支持用户按需定制元模型结构,形成统一的元数据类,特别适合支持业务元数据的管理,同时多样性的类关系管理支持灵活、规范的元数据项关联关系。

三、自动获取和关联元数据可连接其他软件工具(Oracle、DB2、ESSBASEOLAP、DB2OLAP、PowerCenter、Erwin等)自动获取元数据,保证了元数据的最新、一致、可用、极大减少人工维护工作量。

通过目录映射功能,在元数据采集时,自动映射两个来自数据库、BI工具的元数据。

减少人工映射的工作量。

支持SQL解析功能的元数据获取功能,大大减少已有存储过程或脚本语句等ETL作业的手工整理ETL映射元数据的工作量。

四、强大的分析功能血统分析影响分析表重要程度分析元数据属性差异分析元数据关联异常分析业务线数据流图分析 ETL生命周期分析五、完整的生命周期和版本管理系统提供元数据的生命周期管理,发布、删除和状态变更都有严格的流程,并提供了版本管理功能,这些都确保元数据的质量,保证了后续使用元数据系统的权威性和可靠性。

数据质量管理系统数据质量问题按照问题的来源和具体原因,可以分为信息、技术、流程、管理四个问题域。

1、信息问题域信息类问题是由于对数据本身的描述理解及其度量标准的偏差而造成的数据质量问题。

产生这部分数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证和变化频度不恰当等。

2、流程问题域流程类问题是指由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各环节:3、技术问题域技术类问题是指由于具体数据处理的各技术环节的异常造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。

相关文档
最新文档