工商银行数据仓库总体设计demo资料

合集下载

工商银行数据仓库总体设计demo46页PPT

工商银行数据仓库总体设计demo46页PPT

21.11.2019
20
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 应用的竞争力
利用web展现工具输出报告,可以进 行网上直邮
21.11.2019
21
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 体现的概念
工商银行卡部在客户关系管理方案上 领先业界的尝试
抽样分析:SAS EG
21.11.2019
30
1.10 PCRM应用主题——深层分析
分布分析:SAS EG
21.11.2019
31
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
32
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
工商银行卡用户体验到自动的个性化 分析服务
IT部门开发产生直接的市场效益:
有先进的客户关系管理系统支持 的牡丹卡
21.11.2019
22
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 实现的方式
CB2000 每日加载 PCRM
数据
数据仓库
银行卡 数据集市
用卡行为月报
Hale Waihona Puke Web 展现工具21.11.2019
10
1.10 PCRM应用主题——深层分析
银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在36-45,46-55的客户的存款利润最高,其中, 36-45岁的客户的存款利润最高,因为这类人群中, 理财风格保守,存款倾向性强者较多。
21.11.2019

(精编)河北省工行数据仓库方案

(精编)河北省工行数据仓库方案

(精编)河北省工行数据仓库方案河北省工商银行数据仓库系统建设方案建议书北京世纪明日网络科技有限公司二零零零年三月河北省工商银行数据仓库系统建设方案目录第一章前言1.1数据仓库发展史1.2竞争日趋激烈的金融市场1.3中国专业银行面临的挑战1.4中国专业银行实施数据仓库的意义1.5中国专业银行实施数据仓库已具备的条件第二章数据仓库总体概述2.1数据仓库基础2.2数据仓库技术概述2.3一个可扩展数据仓库的基本框架2.4一个数据仓库实施流程第三章系统体系结构设计3.1系统设计指导思想3.2方案总体框架图3.3系统体系结构设计3.4系统方案的组成第四章银行数据仓库的建设4.1面向应用的OLTP系统和面向主题的OLAP系统4.2个性化服务的定义4.3业务探索/业务发掘4.4建立市场客户信息基础4.5利用数据仓库实现的基本模块4.6更高层次的开发应用4.7综合信息发布第五章方案实施建议5.1开发模式5.2组织机构5.3项目实施进程5.4项目进度计划第六章产品报价6.1软件产品报价6.2硬件产品报价6.3项目开发实施费用第一章前言1.1数据仓库发展史相对于许多行业而言,信息处理技术还是一门新兴的技术,但是其发展速度却几乎是最快的。

随着计算机硬件技术的飞速发展,软件技术也是日新月异。

许多企业和机构已经建立了相对完善的OLTP(联机事物处理)系统。

随着时间的推移,这些系统中积累了大量的历史数据,其中蕴含了许多重要的信息。

通过对这些历史数据的分析和综合处理,可以找到那些对企业发展至关重要的业务信息,从而帮助有关主管和业务部门作出更加合理的决策。

70年代中期出现的MIS(管理信息系统)实际上就是在这种背景下产生的。

但MIS具有极大的局限性。

首先,它是按预先定义好的流程对数据作相应的处理,因此只能对预先描述好的业务问题进行回答。

其次由于开发工具的限制,对它的修改也不大方便,特别是业务流程发生变化,模型需要调整,这种修改更加困难。

工商银行数据仓库总体设计demo共43页文档

工商银行数据仓库总体设计demo共43页文档

谢谢!
工商银行数据仓库总体设计demo
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生
ቤተ መጻሕፍቲ ባይዱ
61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿

工行数据仓库

工行数据仓库

4. 汇总层
汇总层是在基础层数据的基础上聚合而来,数据的存放方式一般是按时间周期 存放快照。 汇总层数据一般粒度较粗,比较利于分析。另外,按时间存快照的方式,也比 较方便查询历史数据。 从基础层到汇总层的数据 ETL 过程,大约需要 10 小时。 汇总层是报表应用的一个数据源。 汇总层中还包括生成集市数据的一些中间表。
5. 集市层
集市层是为服务于特定报表应用需求而建立的,数据的存放方式也是按时间周 期存放快照。 集市层的数据主要是服务于当期报表,并且有生命周期管理机制,一般只保留 13 个月/32 天数据。 从基础层、汇总层到集市层的 ETL 过程,月结时超过 10 小时。 集市层是报表应用的主要数据源。
5
第四章 报表取数机制
3
图 3.3.1 工行数据仓库十大主题域 基础层模型按照第三范式来建设,下图是基础层模型的一个实例:
图 3.3.2 基础层模型实例 基础层数据很少冗余,并且大部分表都拉链化,这些都在很大程度上控制了 数据量。
4
基础层共有数据库表约 3000 张,其中较为常用的有大约 1000 张。 从临时区到基础层的数据 ETL 过程,大约需要 2-3 小时。 基础层是报表应用的一个数据源。
6
第五章 元数据和生命周期管理
1. 元数据管理
工行的元数据管理主要靠以下四张表: � 数据源表清单; � 下游依赖的表清单; � 数据源和临时区的对应关系清单; � 表的前驱后继关系清单;
2. 数据生命周期管理
工行的数据生命周期管理主要表现在以下几方面: � 临时区中的文件保留最近 7 天,逾期自动清理; � ODS 层的数据只有当前快照; � 集市层数据只保留 13 月/32 天,逾期自动清理;
2. ODS 层

某银行数据仓库建设方案设计

某银行数据仓库建设方案设计
载系统中提供的数据共开展了466项主题分析,并完成大量日常数据提取和统计工作。 在使用数据过程中,由于各源业务系统同一指标统计口径不一致,数据下载系统中各 业务系统库表数量庞杂等问题,各省(区、市)数据分析人员在使用数据时,面临着数
据提取来源不明确、统计方法不一致等问题。基于以上问题,亟需建立一套统一的数据
Data Lab与敏捷分析
• Data Lab 是一项敏捷分析技术,可以让用户导入外部数据,进行灵活的组合分析
Data Lab 内涵 Enterprise Data Warehouse
Production
Reference Data
ORDER IT EM B ACKORDE RE D QUA NT IT Y CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER CUS TOMER NUMBE R NA ME CIT Y POS T ST ADDR PHONE FA X
•知识获取 •知识编辑 •知识分享
分析成果固化
• 数据分析平台将实现对有价值的分析成果,以前端应用的形式固化下来 固化范围
•只有需重复进行,且经过验证过的有价 值的分析成果,才需要进行IT固化
固化方式
•按照不同的业务目的与应用场景,选择 合适的固化方式与展现形式
常规的重复性的分析需求
数据 报表
•以数据属性的形式固化客 户偏好与知识 •以分析报表的形式固化常 用分析内容 •以挖掘模型的形式固化复 杂分析并定期执行 •以数据接口的形式固化信 息推送过程,或者通过第三 方分析工具实现灵活查询分 析
经过验证有业务价值的成果
模型
业务部门有强烈使用需求

商业银行数据仓库报表设计

商业银行数据仓库报表设计

商业银行数据仓库报表设计摘要随着商业银行业务的持续扩张和金融科技的发展,数据在银行行业中的重要性日益凸显。

数据仓库作为商业银行存储、管理和分析数据的核心基础设施,发挥着至关重要的作用。

本文将深入探讨商业银行数据仓库报表设计的关键要点,包括报表设计的目的、报表设计的原则和方法、报表的内容和结构等方面,以期为商业银行数据仓库报表设计提供参考和指导。

1. 报表设计的目的商业银行数据仓库报表设计的首要目的是为了帮助银行管理层和业务部门更好地把握业务状况、制定决策和优化业务流程。

通过精准、直观地展示银行的关键业务数据,报表设计可以帮助管理层及时监控业务运营情况,识别问题和机会,为商业银行的发展提供有力支持。

2. 报表设计的原则和方法商业银行数据仓库报表设计应遵循以下原则和方法: - 明确需求:在设计报表之前,需充分了解报表使用者的需求,确保报表设计符合用户的实际需求。

- 简洁清晰:报表设计应尽量简洁明了,避免信息过载,确保用户轻松获取所需信息。

- 一致性:报表设计中应保持一致性,包括数据展示、指标定义等方面,以确保报表易于比较和理解。

- 可扩展性:报表设计应具备良好的可扩展性,能够根据业务需求灵活调整和扩展数据展示内容。

- 数据质量保证:报表设计的数据来源应可靠,数据准确性和一致性是报表设计的基础。

3. 报表的内容和结构商业银行数据仓库报表的内容和结构应充分反映银行的业务特点和管理需求,一般可包括以下几个方面: - 关键指标展示:报表应突出展示商业银行的关键指标,如业务规模、盈利能力、风险状况等。

- 业务分析报表:报表可包括不同业务线的业务分析报表,帮助管理层了解各项业务的表现情况。

- 风险管理报表:针对风险管理需求,报表可包括风险指标、资产负债表结构等报表内容。

- 趋势分析报表:报表可包括历史演变趋势分析,帮助管理层了解业务走势和变化规律。

结论商业银行数据仓库报表设计是商业银行数据管理和决策的关键环节,合理设计的报表能够帮助商业银行管理层更好地把握业务状况,提高管理水平和决策效率。

某银行数据仓库建设方案设计

某银行数据仓库建设方案设计

Data Lab 价值
SAS data
Data Labs
•为不同用户设定一定的Data Lab空间与 计算能力
ORDER
csv data
ORDER NUMBE R ORDER DAT E S TA TUS
ORDER IT EM S HIP PE D QUA NT IT Y S HIP DA T E IT EM IT EM NUMBE R QUA NT IT Y DES CRIP TION
系统建设目标
内容提要
建设背景和当前现状 系统建设目标 数据分析平台的定位 系统架构和功能设计 数据模型设计
数据分析平台定位
• 数据分析平台将实现对分析相关的数据、能力、过程与成果进行一站式管理与支撑
数据管理平台
分析能力提供平台
过程支撑平台
成果应用平台
数据管控平台
数据分析所 需业务数据 的管理平台
指标库提供给各省(区、市)数据分析团队使用。
当前现状
现有客管系统数据不能完全支持数据分析的需要:包括数据的历史时长不够、数据质量 问题、数据缺失问题(基于风险、客户行为、财务管理等数据缺失比较严重)等 没有统一的分析平台:各支持厂商和总行自主分析团队的分析环境比较零乱,没有统一 的系统分析平台与环境,不能对开发效率、质量、流程等形成统一的管理 不能有效的对分析需求、分析过程进行集中管控、分析结果展现等 各期的专题分析成果没能发挥其持续业务效益,没有形成有效的知识库管理 对各省分行数据分析团队支持效率务中心、风险管
保障数据安全
数据分析平台在为不同业务部门与机构提供数 据分析服务的同时,必须确保数据的安全,如 隐私数据加密、数据权限管理等
分析能力提供平台内涵

商业银行企业级数据仓库系统架构设计书

商业银行企业级数据仓库系统架构设计书

商业银行企业数据仓库系统系统架构设计书目录1 概述 (1)1.1背景 (1)1.2目的 (1)1.3适用对象 (1)1.4范围 (1)1.5叁考文档 (2)2 概念性体系构架 (3)2.1数据源 (3)2.2数据仓库 (3)2.3分析 (3)2.4交互参考功能 (3)3 参考体系架构 (4)4 技术体系架构 (5)4.1源数据与数据接口 (6)4.1.1 数据源 (6)4.1.1.1 数据源范围 (6)4.1.2 文件缓冲区 (7)4.1.3 接口文件区 (7)4.2数据架构与存储 (10)4.2.1 接口文件区 (10)4.2.2 数据仓库 (10)4.2.2.1 细节数据暂存区SSA(SOR Staging Area) (10)4.2.2.2 细节数据SOR(System Of Record) (11)4.2.2.3 汇总数据区Summary (12)4.2.2.4 反馈数据区(Feedback Area) (12)4.2.2.5 元数据存储MDR(Meta Data Repository) (12)4.2.3 数据集市与多维立方体 (14)4.2.3.1 多维数据存储 (14)4.2.3.2 OLAP与多维立方体 (15)4.2.4 数据仓库应用 (17)4.2.5 实现中的一些特别因素 (17)4.2.5.1 参照表 (17)4.2.5.2 MQT的应用 (17)4.2.5.3 表与列的命名规则 (19)4.2.5.4 代理键的使用 (21)4.2.5.5 历史数据的处理 (21)4.3ETL处理架构 (22)4.3.1 ETL调度 (23)4.3.2 ETL监控 (23)4.3.3 数据质量控制 (24)4.3.4 ETL任务 (24)4.3.4.1 ETL0-数据抽取 (24)4.3.4.2 ETL1-处理接口文件 (25)4.3.4.3 ETL2-生成SOR (25)4.3.4.4 ETL3-数据汇总 (28)4.3.4.5 ETL4-生成数据集市 (28)4.3.4.6 ETL5-计算KPI (28)4.3.5 ETL规范 (28)4.3.5.1 SQL规范 (28)4.3.5.2 可重运行 (29)4.3.5.3 DB2 RUNSTATS (29)4.3.5.4 ETL工作流程 (30)4.4应用架构 (31)4.4.1 访问途径 (31)4.4.1.1 网络浏览器 (31)4.4.2 展示内容 (31)4.4.2.1 BST分析主题 (31)4.4.2.2 1104报表 (31)4.4.2.3 绩效考核 (31)4.4.2.4 输出服务 (31)4.5软硬件架构 (32)4.6系统管理 (33)4.6.1 备份恢复 (33)4.6.1.1 数据仓库的备份恢复 (33)4.6.1.2 接口文件的备份恢复 (35)4.6.1.3 开发环境的备份恢复 (35)4.6.2 配置管理 (35)4.6.3 安全与保密 (36)4.6.3.1 数据安全 (36)1概述1.1背景企业数据仓库系统是以业务支撑应用系统的数据以及其他相关数据作为基础数据源,采用科学的数据抽取、整理、存储等方法,建立企业级数据仓库;然后通过丰富的数据分析与挖掘方法找出这些数据内部蕴藏的大量有用信息,对客户、业务、市场、收益、服务、等各方面情况进行科学的分析,从而为市场决策管理者与市场经营工作提供及时、准确、科学的辅助决策依据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/10/15
19
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 应用的竞争力
利用数据挖掘进行优质客户自动筛选 提高平均筛选精度,提高优质
客户促销的投资建效率 降低筛选成本,提高筛选速度, 迎接他行的竞争(如交行的500 元个人理财报告)
2018/10/15
20
6
1.10 PCRM应用主题
银行卡应用:按照需求开发 个人金融应用 住房信贷应用 深层分析:原有需求之外的考虑


2018/10/15
7
1.10 PCRM应用主题 ——银行卡应用
银行卡应用:按照需求开发 重点客户分析: 基本信息查询、存款余额分析、 用卡行为分析、贡献度分析、 透支分析(透支余额、单笔透支余额、 单次透支金额、 还贷周期)。 客户群分析:
2018/10/15
18
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 解决的问题
对优质客户提供详细的行为分析,帮
助客户更好掌握自己的用卡行为 针对客户用卡的具体情形提供促销性 建议,使优质客户感受到工商银行卡 部的人性化关注 工商银行卡部可以更便捷地跟踪优质 客户的信息
CB2000 每日加载 数据
银行卡 数据集市
用卡行为月报
筛选优质客户数据挖掘
银行 卡部
2018/10/15
直邮
优质客户 25
1.10 PCRM应用主题——深层分析
ICBC PCRM 数据仓库管理界面
2018/10/15
26
1.10 PCRM应用主题——深层分析
数据仓库处理过程管理
2018/10/15

银行卡客户贡献度:初步结果
对于银行卡客户发展的辅助作用
工行牡丹卡的客户中,25-55的年龄段为高贡献度 主流年龄段,其中,如果关注当前直接贡献度, 36-45岁的客户是最好的人群,如果关注发展潜力 以及对新产品、新消费渠道的接受程度,25-35岁的 客户是重点人群。
2018/10/15
16
1.10 PCRM应用主题——深层分析

银行卡客户贡献度:初步结果
优质客户排名靠前的客户中,消费场所的分布 怎样
金融、证券等交易机构有较大金额占比, 饭店、旅游业其次,零售、百货等居于中游。 可以根据这个结果制定相应的消费场所促销策略
20ห้องสมุดไป่ตู้8/10/15
17
1.10 PCRM应用主题——深层分析

深层分析:原有需求之外的考虑
PCRM数据仓库应用对银行卡部的用户 有什么直接的帮助? 利用数据挖掘自动筛选优质客户, 针对优质客户提供个性化服务—— 直邮用卡行为月报
36
日程安排


开发进度 最终应用展现 数据仓库架构
2018/10/15
37
1.4 逻辑结构
应用层
面向用户实现各类应用。
如:个人客户关系管理子系统、业绩价值管理 子系统等。
数据仓库层
应用层
数据集市层
面向主题应用,按特定数据模型存贮的数据集合; 模型:星型结构; 存储:多维数据库。 数据来源取自数据仓库基本数据层。 数据集市层

银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在36-45,46-55的客户的存款利润最高,其中, 36-45岁的客户的存款利润最高,因为这类人群中, 理财风格保守,存款倾向性强者较多。 存款利润 在 年龄段 上的分布
2018/10/15
12
1.10 PCRM应用主题——深层分析

银行卡客户贡献度:初步结果
数据端
2018/10/15
DW模型设计
DM模型设计
应用展现 展现端
39
1.6 物理结构
2018/10/15
40
2018/10/15
45
2018/10/15
22
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 实现的方式
PCRM 数据仓库 Web 展现工具
CB2000 每日加载 数据
银行卡 数据集市
用卡行为月报
筛选优质客户数据挖掘
银行 卡部
2018/10/15
直邮
优质客户 23
1.10 PCRM应用主题——深层分析
2018/10/15
3
2.1 开发进展——个人客户关系管理(PCRM)
需求分析 总体方案 原型开发 原型评估 银行卡设计开发 个人金融: 个人金融:贷款类设计开发 其他个人金融及住房信贷设计开发 银行卡应用集成测试和试运行
存款类(综合帐户和个人理财等)设计开发
2001/10/11-2001/10/31 2002/11/01-2002/02/28 2001/11/15-2001/12/31 2001/12/24-2002/02/09 2002/01/04-2002/04/30 2002/02/01-2002/05/31 2002/05/05-2002/07/31 2002/04/01-2002/08/31 2002/05/31-2002/06/30
中国工商银行 数据仓库建设 情况汇报
数据仓库项目组
2018/10/15
1
日程安排


开发进度 最终应用展现 数据仓库架构
2018/10/15
2
二、 开发进展
2.1 2.2 2.3 2.4
个人客户关系管理(PCRM) 业绩价值管理(PVMS) 信贷台帐报表(CMIS-REPT) 管理信息综合统计报表
贡献度指标的具体分布怎样
年龄在25-35的客户的透支利润和消费回佣最高, 因为这类人群中,理财风格前卫,消费旺盛者居多。
2018/10/15
13
1.10 PCRM应用主题——深层分析

银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在25-35的客户的透支利润和消费回佣最高, 因为这类人群中,理财风格前卫,消费旺盛者居多。
2018/10/15
10
1.10 PCRM应用主题——深层分析

银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在36-45,46-55的客户的存款利润最高,其中, 36-45岁的客户的存款利润最高,因为这类人群中, 理财风格保守,存款倾向性强者较多。
2018/10/15
11
1.10 PCRM应用主题——深层分析
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 应用的竞争力
利用web展现工具输出报告,可以进
行网上直邮
2018/10/15
21
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 体现的概念
工商银行卡部在客户关系管理方案上
领先业界的尝试 工商银行卡用户体验到自动的个性化 分析服务 IT部门开发产生直接的市场效益: 有先进的客户关系管理系统支持 的牡丹卡
27
1.10 PCRM应用主题——深层分析
优质客户筛选:数据挖掘
2018/10/15
28
1.10 PCRM应用主题——深层分析
数据挖掘:模型评估
2018/10/15
29
1.10 PCRM应用主题——深层分析
抽样分析:SAS EG
2018/10/15
30
1.10 PCRM应用主题——深层分析
分布分析:SAS EG

深层分析:直邮用卡行为月报原型 实现的方式
PCRM 数据仓库 Web 展现工具
CB2000 每日加载 数据
银行卡 数据集市
用卡行为月报
筛选优质客户数据挖掘
银行 卡部
2018/10/15
直邮
优质客户 24
1.10 PCRM应用主题——深层分析

深层分析:直邮用卡行为月报原型 实现的方式
PCRM 数据仓库 Web 展现工具
外部数据 CMIS
加 工
数据处理 企业级 数据存贮 数据 集市
展现
数据挖掘 信息展现
预处理
批处理 数据 转送 抽取 缓存 整合 批处理 校验 抽取
分类
多维 分析 图示 展现
转换
关系型数据库、 多维数据存贮
转换
统计
报表制作 加载 加载
分析
计财数据 CB2000
译码 数据 转送
报告生成
备份与 老化处理
ETL
2018/10/15
31
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
2018/10/15
32
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
2018/10/15
33
1.10 PCRM应用主题——深层分析
图形分析:SAS EG
2018/10/15
34
1.10 PCRM应用主题 ——银行卡应用
优质客户排名分析、卡业务存款分析、 用卡行为分析、 贡献度分析、 卡申领情况分析、 卡业务风险分析。
2018/10/15
8
1.10 PCRM应用主题——深层分析

银行卡客户贡献度:初步结果
按照现有的贡献度指标体系, 什么样的客户对银行卡的贡献度最高
年龄在25-35,36-45的客户对银行卡的贡献度最高, 其中,36-45岁的客户的贡献度最高,因为这类人群 中稳定、高收入或高积蓄者较多。
2018/10/15
4
日程安排


开发进度 最终应用展现 数据仓库架构
2018/10/15
5
1.8
主要应用
个人客户关系管理(PCRM)
相关文档
最新文档