工商银行数据仓库设计方案共43页

合集下载

XX银行数据仓库建设项目方案

XX银行数据仓库建设项目方案

XX银行EDW/数据仓库项目方案目录第一章系统总体架构41.1总体架构设计概述41.1.1总体架构的设计框架41.1.2总体架构的设计原则61.1.3总体架构的设计特点61.2EDW执行架构71.2.1执行架构概述71.2.2执行架构设计原则71.2.3执行架构框架91.3EDW逻辑架构181.3.1逻辑架构框架181.3.2数据处理流程281.4EDW运维架构291.4.1运维架构概述291.4.2运维架构的逻辑框架311.5EDW数据架构371.5.1数据架构设计原则371.5.2数据架构分层设计391.6EDW应用架构431.6.1应用架构设计原则431.6.2数据服务441.6.3应用服务45第二章 ETL体系建设462.1ETL架构概述462.2ETL设计方案492.3ETL关键设计环节492.3.1接口层设计策略492.3.2 Staging Area设计策略492.3.3数据加载策略502.3.4增量ETL设计策略512.3.5异常处理532.3.6作业调度和监控542.3.7元数据管理552.3.8 ETL模块设计552.3.9 ETL流程设计592.3.10动态资源分配622.3.11数据接口设计64第一章系统总体架构1.1总体架构设计概述1.1.1总体架构的设计框架XX银行EDW项目的总体架构分为基础技术架构、应用架构和数据架构三个核心部分。

这三个部分共同组成了XX银行EDW系统。

在基础技术架构中,包括执行架构、逻辑架构、功能组件架构和运维架构四个部分。

⏹执行架构描述系统大的框架和模块区域,以及之间的逻辑关系;是确定生产环境的建设要求及指导原则。

⏹逻辑架构描述EDW各个模块之间的数据的接口、数据流向、工具使用和采用具体的技术实现手段或方式情况,用于规范本项目最终生产环境的建立。

逻辑架构是建立应用架构、执行架构、运维架构的基础,也是建立执行架构、应用架构以及运维架构的原型系统。

XX银行数据仓库建设项目方案

XX银行数据仓库建设项目方案

XX银行EDW/数据仓库项目方案目录第一章系统总体架构 ......................................... 41.1总体架构设计概述 ........................................ 41.1.1总体架构的设计框架.................................. 41.1.2总体架构的设计原则.................................. 41.1.3总体架构的设计特点.................................. 51.2EDW执行架构............................................. 51.2.1执行架构概述........................................ 51.2.2执行架构设计原则.................................... 51.2.3执行架构框架........................................ 61.3EDW逻辑架构........................................... 111.3.1逻辑架构框架...................................... 111.3.2数据处理流程...................................... 161.4EDW运维架构........................................... 161.4.1运维架构概述...................................... 161.4.2运维架构的逻辑框架................................ 171.5EDW数据架构........................................... 191.5.1数据架构设计原则.................................. 191.5.2数据架构分层设计.................................. 201.6EDW应用架构........................................... 211.6.1应用架构设计原则.................................. 211.6.2数据服务.......................................... 221.6.3应用服务.......................................... 22第二章 ETL体系建设........................................ 242.1ETL架构概述........................................... 242.2ETL设计方案........................................... 252.3ETL关键设计环节....................................... 252.3.1接口层设计策略.................................... 252.3.2 Staging Area设计策略 ............................. 252.3.3数据加载策略...................................... 262.3.4增量ETL设计策略.................................. 262.3.5异常处理.......................................... 272.3.6作业调度和监控.................................... 282.3.7元数据管理........................................ 282.3.8 ETL模块设计 ...................................... 282.3.9 ETL流程设计 ...................................... 302.3.10动态资源分配..................................... 322.3.11数据接口设计..................................... 33第一章系统总体架构1.1总体架构设计概述1.1.1总体架构的设计框架XX银行EDW项目的总体架构分为基础技术架构、应用架构和数据架构三个核心部分。

工商银行数据仓库总体设计demo46页PPT

工商银行数据仓库总体设计demo46页PPT

21.11.2019
20
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 应用的竞争力
利用web展现工具输出报告,可以进 行网上直邮
21.11.2019
21
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 体现的概念
工商银行卡部在客户关系管理方案上 领先业界的尝试
抽样分析:SAS EG
21.11.2019
30
1.10 PCRM应用主题——深层分析
分布分析:SAS EG
21.11.2019
31
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
32
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
工商银行卡用户体验到自动的个性化 分析服务
IT部门开发产生直接的市场效益:
有先进的客户关系管理系统支持 的牡丹卡
21.11.2019
22
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 实现的方式
CB2000 每日加载 PCRM
数据
数据仓库
银行卡 数据集市
用卡行为月报
Hale Waihona Puke Web 展现工具21.11.2019
10
1.10 PCRM应用主题——深层分析
银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在36-45,46-55的客户的存款利润最高,其中, 36-45岁的客户的存款利润最高,因为这类人群中, 理财风格保守,存款倾向性强者较多。
21.11.2019

XXX商业银行数据仓库系统完整解决方案

XXX商业银行数据仓库系统完整解决方案

XXX商业银行数据仓库系统完整解决方案在当今数字化时代,数据变得异常重要,对于银行业来说更是如此。

银行需要处理大量的数据,包括客户信息、交易记录、贷款情况等,而有效地管理和分析这些数据将对银行的业务发展和决策制定起着关键的作用。

为了更好地管理数据并提升运营效率,许多银行选择建立数据仓库系统来统一管理和分析数据。

XXX商业银行也不例外,它可以采用完整的数据仓库解决方案来满足其需求。

首先,一个完整的数据仓库系统需要包括数据抽取、数据转换、数据加载等核心功能。

数据抽取是指从各个数据源中提取数据的过程,这些数据源可以包括银行的核心系统、在线交易系统、ATM机系统等。

数据抽取过程需要能够实现增量抽取、全量抽取等功能,并能够保证数据的完整性和准确性。

数据转换是将抽取的数据进行清洗、转换和整合的过程,保证数据的一致性和统一性。

数据加载是将转换后的数据加载到数据仓库中,以便后续的分析和查询。

其次,一个完整的数据仓库系统还需要包括数据建模和数据分析功能。

数据建模是指对数据进行结构化和建模,以便更好地理解数据的关系和特点。

数据建模可以采用ER模型、维度模型等方法来构建数据模型。

数据分析是针对数据仓库中的数据进行分析和挖掘,以发现数据之间的关联性和规律性,为银行的业务决策提供支持。

数据分析可以采用OLAP、数据挖掘、机器学习等技术来实现。

最后,一个完整的数据仓库系统还需要包括数据可视化和报表功能。

数据可视化是将数据以图表、报表等形式展示出来,使用户能够更直观地理解数据的含义和趋势。

数据可视化可以采用数据可视化工具来实现,如Tableau、PowerBI等。

报表功能是将数据以报表的形式呈现出来,为银行的管理层和决策者提供直观的数据分析结果和业务洞察。

综上所述,一个完整的数据仓库系统可以帮助XXX商业银行更好地管理和分析数据,提高运营效率和业务决策水平。

通过建立数据仓库系统,XXX商业银行可以实现数据的统一管理和分析,挖掘数据的潜在价值,为未来的业务发展打下坚实基础。

工行数据仓库

工行数据仓库

4. 汇总层
汇总层是在基础层数据的基础上聚合而来,数据的存放方式一般是按时间周期 存放快照。 汇总层数据一般粒度较粗,比较利于分析。另外,按时间存快照的方式,也比 较方便查询历史数据。 从基础层到汇总层的数据 ETL 过程,大约需要 10 小时。 汇总层是报表应用的一个数据源。 汇总层中还包括生成集市数据的一些中间表。
5. 集市层
集市层是为服务于特定报表应用需求而建立的,数据的存放方式也是按时间周 期存放快照。 集市层的数据主要是服务于当期报表,并且有生命周期管理机制,一般只保留 13 个月/32 天数据。 从基础层、汇总层到集市层的 ETL 过程,月结时超过 10 小时。 集市层是报表应用的主要数据源。
5
第四章 报表取数机制
3
图 3.3.1 工行数据仓库十大主题域 基础层模型按照第三范式来建设,下图是基础层模型的一个实例:
图 3.3.2 基础层模型实例 基础层数据很少冗余,并且大部分表都拉链化,这些都在很大程度上控制了 数据量。
4
基础层共有数据库表约 3000 张,其中较为常用的有大约 1000 张。 从临时区到基础层的数据 ETL 过程,大约需要 2-3 小时。 基础层是报表应用的一个数据源。
6
第五章 元数据和生命周期管理
1. 元数据管理
工行的元数据管理主要靠以下四张表: � 数据源表清单; � 下游依赖的表清单; � 数据源和临时区的对应关系清单; � 表的前驱后继关系清单;
2. 数据生命周期管理
工行的数据生命周期管理主要表现在以下几方面: � 临时区中的文件保留最近 7 天,逾期自动清理; � ODS 层的数据只有当前快照; � 集市层数据只保留 13 月/32 天,逾期自动清理;
2. ODS 层

某银行数据仓库建设方案设计

某银行数据仓库建设方案设计
载系统中提供的数据共开展了466项主题分析,并完成大量日常数据提取和统计工作。 在使用数据过程中,由于各源业务系统同一指标统计口径不一致,数据下载系统中各 业务系统库表数量庞杂等问题,各省(区、市)数据分析人员在使用数据时,面临着数
据提取来源不明确、统计方法不一致等问题。基于以上问题,亟需建立一套统一的数据
Data Lab与敏捷分析
• Data Lab 是一项敏捷分析技术,可以让用户导入外部数据,进行灵活的组合分析
Data Lab 内涵 Enterprise Data Warehouse
Production
Reference Data
ORDER IT EM B ACKORDE RE D QUA NT IT Y CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER NUMBE R NA ME CIT Y POS T ST ADDR PHONE FA X
•知识获取 •知识编辑 •知识分享
分析成果固化
• 数据分析平台将实现对有价值的分析成果,以前端应用的形式固化下来 固化范围
•只有需重复进行,且经过验证过的有价 值的分析成果,才需要进行IT固化
固化方式
•按照不同的业务目的与应用场景,选择 合适的固化方式与展现形式
常规的重复性的分析需求
数据 报表
•以数据属性的形式固化客 户偏好与知识 •以分析报表的形式固化常 用分析内容 •以挖掘模型的形式固化复 杂分析并定期执行 •以数据接口的形式固化信 息推送过程,或者通过第三 方分析工具实现灵活查询分 析
经过验证有业务价值的成果
模型
业务部门有强烈使用需求

XX银行数据仓库建设项目方案

XX银行数据仓库建设项目方案

XX银行数据仓库建设项目方案1. 项目概述本文档旨在介绍XX银行数据仓库建设项目的方案和目标。

数据仓库是一个用于集成和管理银行的各类数据的中央存储库,可为决策支持和业务分析提供有价值的信息。

本项目的目标是构建一个稳定、高效、可扩展的数据仓库,以提高XX银行的决策能力和业务竞争力。

2. 项目背景XX银行作为一家领先的金融机构,面临着数据分散、决策效率低下的问题。

传统的数据集成和分析方法已经无法满足业务需求,因此需要建立一个数据仓库来解决这些问题。

数据仓库将集中存储和管理各类数据,并提供强大的分析工具和报表功能,以支持XX银行的战略决策和业务优化。

本项目的目标是构建一个可靠、高效的数据仓库系统,具体包括以下几个方面:•数据集成:从各个业务系统中提取、清洗和转换数据,确保数据质量和一致性。

•数据存储:设计和构建合适的数据存储结构,包括数据表、索引等,以支持复杂的数据查询和分析。

•数据分析:开发和部署适合XX银行业务需求的数据分析工具和算法,提供灵活和高效的数据查询和报表功能。

•数据安全:确保数据仓库的安全性,实施访问控制和数据加密等措施,防止未授权的访问和数据泄露。

4.1 需求分析阶段在这个阶段,项目团队将与XX银行的不同业务部门和利益相关方进行沟通和需求收集。

我们将详细了解业务需求和数据源,并建立数据仓库的数据模型和架构设计。

4.2 数据集成阶段在数据集成阶段,我们将根据需求分析阶段的结果,从各个业务系统中提取和转换数据。

我们将设计和实现合适的ETL(提取、转换和加载)过程,确保数据质量和一致性。

4.3 数据存储阶段在数据存储阶段,我们将设计和构建数据仓库的存储结构,包括数据表、索引和分区等。

我们将利用合适的数据库技术和管理工具,如关系数据库和NoSQL数据库,来存储和管理数据。

4.4 数据分析阶段在数据分析阶段,我们将开发和部署适合XX银行业务需求的数据分析工具和报表功能。

我们将使用先进的分析算法和可视化技术,帮助XX银行的管理层和业务部门进行决策分析和业务优化。

商业银行企业级数据仓库系统架构设计书

商业银行企业级数据仓库系统架构设计书

商业银行企业数据仓库系统系统架构设计书目录1 概述 (1)1.1背景 (1)1.2目的 (1)1.3适用对象 (1)1.4范围 (1)1.5叁考文档 (2)2 概念性体系构架 (3)2.1数据源 (3)2.2数据仓库 (3)2.3分析 (3)2.4交互参考功能 (3)3 参考体系架构 (4)4 技术体系架构 (5)4.1源数据与数据接口 (6)4.1.1 数据源 (6)4.1.1.1 数据源范围 (6)4.1.2 文件缓冲区 (7)4.1.3 接口文件区 (7)4.2数据架构与存储 (10)4.2.1 接口文件区 (10)4.2.2 数据仓库 (10)4.2.2.1 细节数据暂存区SSA(SOR Staging Area) (10)4.2.2.2 细节数据SOR(System Of Record) (11)4.2.2.3 汇总数据区Summary (12)4.2.2.4 反馈数据区(Feedback Area) (12)4.2.2.5 元数据存储MDR(Meta Data Repository) (12)4.2.3 数据集市与多维立方体 (14)4.2.3.1 多维数据存储 (14)4.2.3.2 OLAP与多维立方体 (15)4.2.4 数据仓库应用 (17)4.2.5 实现中的一些特别因素 (17)4.2.5.1 参照表 (17)4.2.5.2 MQT的应用 (17)4.2.5.3 表与列的命名规则 (19)4.2.5.4 代理键的使用 (21)4.2.5.5 历史数据的处理 (21)4.3ETL处理架构 (22)4.3.1 ETL调度 (23)4.3.2 ETL监控 (23)4.3.3 数据质量控制 (24)4.3.4 ETL任务 (24)4.3.4.1 ETL0-数据抽取 (24)4.3.4.2 ETL1-处理接口文件 (25)4.3.4.3 ETL2-生成SOR (25)4.3.4.4 ETL3-数据汇总 (28)4.3.4.5 ETL4-生成数据集市 (28)4.3.4.6 ETL5-计算KPI (28)4.3.5 ETL规范 (28)4.3.5.1 SQL规范 (28)4.3.5.2 可重运行 (29)4.3.5.3 DB2 RUNSTATS (29)4.3.5.4 ETL工作流程 (30)4.4应用架构 (31)4.4.1 访问途径 (31)4.4.1.1 网络浏览器 (31)4.4.2 展示内容 (31)4.4.2.1 BST分析主题 (31)4.4.2.2 1104报表 (31)4.4.2.3 绩效考核 (31)4.4.2.4 输出服务 (31)4.5软硬件架构 (32)4.6系统管理 (33)4.6.1 备份恢复 (33)4.6.1.1 数据仓库的备份恢复 (33)4.6.1.2 接口文件的备份恢复 (35)4.6.1.3 开发环境的备份恢复 (35)4.6.2 配置管理 (35)4.6.3 安全与保密 (36)4.6.3.1 数据安全 (36)1概述1.1背景企业数据仓库系统是以业务支撑应用系统的数据以及其他相关数据作为基础数据源,采用科学的数据抽取、整理、存储等方法,建立企业级数据仓库;然后通过丰富的数据分析与挖掘方法找出这些数据内部蕴藏的大量有用信息,对客户、业务、市场、收益、服务、等各方面情况进行科学的分析,从而为市场决策管理者与市场经营工作提供及时、准确、科学的辅助决策依据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档