商业银行数据仓库业务模型设计及实现
工商银行数据仓库总体设计demo46页PPT

21.11.2019
20
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 应用的竞争力
利用web展现工具输出报告,可以进 行网上直邮
21.11.2019
21
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 体现的概念
工商银行卡部在客户关系管理方案上 领先业界的尝试
抽样分析:SAS EG
21.11.2019
30
1.10 PCRM应用主题——深层分析
分布分析:SAS EG
21.11.2019
31
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
32
1.10 PCRM应用主题——深层分析
图形展示:SAS EG
21.11.2019
工商银行卡用户体验到自动的个性化 分析服务
IT部门开发产生直接的市场效益:
有先进的客户关系管理系统支持 的牡丹卡
21.11.2019
22
1.10 PCRM应用主题——深层分析
深层分析:直邮用卡行为月报原型 实现的方式
CB2000 每日加载 PCRM
数据
数据仓库
银行卡 数据集市
用卡行为月报
Hale Waihona Puke Web 展现工具21.11.2019
10
1.10 PCRM应用主题——深层分析
银行卡客户贡献度:初步结果
贡献度指标的具体分布怎样
年龄在36-45,46-55的客户的存款利润最高,其中, 36-45岁的客户的存款利润最高,因为这类人群中, 理财风格保守,存款倾向性强者较多。
21.11.2019
商业银行数据仓库解决方案[1]
![商业银行数据仓库解决方案[1]](https://img.taocdn.com/s3/m/2075cb6c3186bceb18e8bb6f.png)
资产负债管理
▪监管报表 ▪流动性管理 ▪利率管理 ▪资本金分配 ▪场景分析
OLAP工具 / 数据挖掘工具 / 分析模型
客户管理
▪客户单一视图 ▪客户细分 ▪目标客户搜索 ▪客户行为分析 ▪营销活动管理 ▪营销自动化
PPT文档演模板
银行数据仓库
财务 合约 行销活动
事件
地域 产品
FS-LDM
参与人 客户资产
•KPI •仪表盘 •平衡计分卡
查询
平衡计分卡
报表
绩效 管理
查询
绩效指标
报表
管理
PPT文档演模板
•盈利分析 •资金转移计价 •场景分析 •利润贡献度分析
•GAP分析方法 • Duration方法 •利率敏感性分析 •到期日分析方法
报表 分析
报表 分析
2
1
2
1
财务管理
( FM )
资产负债管理 (ALM)
PPT文档演模板
商业银行数据仓库解决方案[1]
选择:数据集市 vs 企业级数据仓库
生产系统
核心
信贷
信用卡
网银
数据获取
独立数据集市
客户关系管理
风险管理
。。。。。
数据 组织
数据
访问
单一视图? 数据一致性? 系统扩展? 系统维护?
PPT文档演模板
商业银行数据仓库解决方案[1]
部门级 & 企业级
“Vertical” Business Analysis
知
识
信息访问工具
管 经营指标 资产负债 信用风险 利润贡献 客户关系
理 体系
管理 管理 分析
管理
系
统 应用系统
商业银行数据仓库建设

商业银行数据仓库建设摘要:目前国内几大商业银行的数据大集中基本完成,为企业级数据仓库的建设创造了先决条件。
同时,银行管理层也希望从既有的海量数据库中获取信息,可以在精准营销、绩效考核、风险管理等方面发挥作用,这也成为建设企业级数据仓库的主要动力。
结合作者的工作背景,对银行数据仓库建设过程中的几个方面进行了阐述,以期望能对读者有所启发。
关键词:数据仓库;数据模型;数据标准;元数据管理;灵活查询0 引言数据挖掘是20世纪90年代中后期提出的概念,它是以传统的数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法。
以人工智能技术作为挖掘知识和发现规律的科学途径的一种解决问题的方案。
而数据仓库的建设,可以看作数据挖掘的一个重要预处理步骤。
在数据仓库的建设过程中,可以将支持企业日常运作的各个独立系统中的数据进行清理、集成和统一,并且可以将数据加载入不同于日常交易系统结构的易于查询分析的数据模型中,为后续数据挖掘高效地获取准确明晰的数据扫清障碍。
1 数据仓库根据数据仓库之父W.H.Inmon的说法,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。
这个简短而又全面的定义指出了数据仓库的主要特征。
4个关键词,面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统(如关系数据库系统、事务处理系统和文件系统)相区别。
数据仓库领域的领导厂商,美国Teradata公司给企业级数据仓库下过一个定义,“一个企业级数据仓库是一个由集成的、明细的、可扩展的数据组成的,集中的,保留历史的数据机,可以支持多个部门的各种决策分析,是整个企业分析型数据的唯一来源”。
这里有5个关键字:集成的、明细的、可扩展的、集中的、保留历史的。
从以上两个定义来看,时变的包含了保留历史的意思,而面向主题的结构保证了其结构和设计是可扩展的。
因此,从笔者的观点来看,数据仓库的关键字应该是:面向主题的、集成的、时变的、明细的、集中的和非易失的。
数据仓库模型的设计

数据仓库模型的设计
其次,设计数据仓库模型需要考虑数据的结构。
数据结构是数据仓库
的基础,直接影响数据仓库的性能和可用性。
在设计数据结构时,需要根
据业务需求和查询需求进行合理的数据建模,即逻辑数据模型和物理数据
模型的设计。
逻辑数据模型应该能够准确地反映业务实体和关系,物理数
据模型应该能够优化数据存储和查询效率。
第三,设计数据仓库模型需要考虑数据集成和处理。
数据集成是将来
自各个业务系统的数据进行整合和合并的过程,数据处理是对数据进行清洗、转换和计算的过程。
在设计数据集成和处理过程时,需要考虑数据的
一致性、完整性和准确性,确保数据仓库模型能够提供一致的数据视图,
以支持准确可靠的数据分析和查询。
最后,设计数据仓库模型需要考虑数据查询和报表。
数据仓库的最终
目的是提供高效可靠的数据查询和决策支持,因此在设计数据仓库模型时,需要考虑用户的查询需求和报表需求。
数据查询需要能够支持多种不同的
查询方式,包括交互式查询、多维分析查询和复杂查询等。
报表需要能够
满足用户对数据的可视化和分析需求,包括数据报表、图表、仪表盘等。
在设计数据仓库模型时,还需要考虑数据的安全性和隐私保护。
数据
仓库存储了企业的重要数据和敏感数据,必须确保数据的安全性,防止数
据泄露和滥用。
设计数据仓库模型时需要设置合适的访问权限和数据加密
措施,以保证数据的安全性和隐私保护。
商业银行企业级数据仓库系统架构设计书

商业银行企业数据仓库系统系统架构设计书目录1 概述 (1)1.1背景 (1)1.2目的 (1)1.3适用对象 (1)1.4范围 (1)1.5叁考文档 (2)2 概念性体系构架 (3)2.1数据源 (3)2.2数据仓库 (3)2.3分析 (3)2.4交互参考功能 (3)3 参考体系架构 (4)4 技术体系架构 (5)4.1源数据与数据接口 (6)4.1.1 数据源 (6)4.1.1.1 数据源范围 (6)4.1.2 文件缓冲区 (7)4.1.3 接口文件区 (7)4.2数据架构与存储 (10)4.2.1 接口文件区 (10)4.2.2 数据仓库 (10)4.2.2.1 细节数据暂存区SSA(SOR Staging Area) (10)4.2.2.2 细节数据SOR(System Of Record) (11)4.2.2.3 汇总数据区Summary (12)4.2.2.4 反馈数据区(Feedback Area) (12)4.2.2.5 元数据存储MDR(Meta Data Repository) (12)4.2.3 数据集市与多维立方体 (14)4.2.3.1 多维数据存储 (14)4.2.3.2 OLAP与多维立方体 (15)4.2.4 数据仓库应用 (17)4.2.5 实现中的一些特别因素 (17)4.2.5.1 参照表 (17)4.2.5.2 MQT的应用 (17)4.2.5.3 表与列的命名规则 (19)4.2.5.4 代理键的使用 (21)4.2.5.5 历史数据的处理 (21)4.3ETL处理架构 (22)4.3.1 ETL调度 (23)4.3.2 ETL监控 (23)4.3.3 数据质量控制 (24)4.3.4 ETL任务 (24)4.3.4.1 ETL0-数据抽取 (24)4.3.4.2 ETL1-处理接口文件 (25)4.3.4.3 ETL2-生成SOR (25)4.3.4.4 ETL3-数据汇总 (28)4.3.4.5 ETL4-生成数据集市 (28)4.3.4.6 ETL5-计算KPI (28)4.3.5 ETL规范 (28)4.3.5.1 SQL规范 (28)4.3.5.2 可重运行 (29)4.3.5.3 DB2 RUNSTATS (29)4.3.5.4 ETL工作流程 (30)4.4应用架构 (31)4.4.1 访问途径 (31)4.4.1.1 网络浏览器 (31)4.4.2 展示内容 (31)4.4.2.1 BST分析主题 (31)4.4.2.2 1104报表 (31)4.4.2.3 绩效考核 (31)4.4.2.4 输出服务 (31)4.5软硬件架构 (32)4.6系统管理 (33)4.6.1 备份恢复 (33)4.6.1.1 数据仓库的备份恢复 (33)4.6.1.2 接口文件的备份恢复 (35)4.6.1.3 开发环境的备份恢复 (35)4.6.2 配置管理 (35)4.6.3 安全与保密 (36)4.6.3.1 数据安全 (36)1概述1.1背景企业数据仓库系统是以业务支撑应用系统的数据以及其他相关数据作为基础数据源,采用科学的数据抽取、整理、存储等方法,建立企业级数据仓库;然后通过丰富的数据分析与挖掘方法找出这些数据内部蕴藏的大量有用信息,对客户、业务、市场、收益、服务、等各方面情况进行科学的分析,从而为市场决策管理者与市场经营工作提供及时、准确、科学的辅助决策依据。
基于Greenplum的金融数据仓库模型设计与实现

B06. 票据业务 承兑业务 贴现业务
转贴现
再贴现
预算管控 零余额管理 投标保证金
聚合支付
B07. 资金业务 内部拆借 内部清算
信贷资产转让 财务顾问 委托理财
B08. 国际业务 外汇买卖业务 外汇资金管理业务
质押式回购 发行债券 票据回购 票据质押
资金划转
外币存款 外币贷款
债券现券 公募基金
票据池
第 21 期
综合金融服务系统 结算服务 票据服务 ……
客户服务能力层 聚合支付系统
快捷支付 商户管理 ……
员工工作台系统 代办管理 消息管理 ……
渠道整合平台
企业服务总线(ESB)
业务运营能力层
信贷管理系统
资金结算系统
票据系统
投资管理系统
外汇业务系统
贷前管理
一户通总户
票据承兑
同业存款
外汇买卖
合同管理
数据管控
元 数 据 管 理
智能搜索查询 业务应用
一户式分析
自定义查询 自定义分析
工作桌面 大屏展示
经营管理 数据化运营
数据应用服务平台
风险管理 精准画像
关系图谱 ……
调度平台
数
据
数
标
据
实
准
中
时
心
明细层 汇总层
数
校验层
据
质
量
实时抽取
数据缓冲处理
应用集市层
共性加工层
离 线
统 一
基础数据层
调
度
技术缓冲层
平
显得至关重要,数据仓库在面对海量的业务数据时,有着安全化、实时化、规范化、智能分析以及预测等诸多优势。而数据模型
银行数据仓库体系实践(9)--主题模型

银⾏数据仓库体系实践(9)--主题模型在银⾏主题模型中,每个数据仓库的实施公司会有⾦融⾏业或银⾏业的主题模型,这个模型会根据新的业务不断进⾏完善,是各实施公司的业务经验积累。
⼀个良好的模型对数据仓库的实施起到了事半功倍的效果,虽然不同的公司会有不同的主题模型产品,但每个公司的产品基本上分为以下⼏个主题:1、当事⼈(PARTY)是指银⾏所服务的任意对象和感兴趣进⾏分析的各种对象。
如:个⼈或公司客户、潜在客户、代理机构、雇员、合作伙伴等。
⼀个当事⼈可以同时是这当中的许多⾓⾊。
借助当事⼈主题的建⽴可以实现基于客户基本信息的分析,是实现以客户为中⼼的各种分析应⽤的重要基础。
PARTY主题⼀般包括:*外部机构、政府部门、⾏业监管机构等;*在银⾏登记注册开⽴账户的单位、个⼈普通客户;*和银⾏有业务往来的其他⾦融机构(如国内同业、海外代理⾏等);*银⾏机构的雇员(含柜员、客户经理等);*客户的⼲系⼈(如个⼈客户的配偶、⼦⼥,公司的法⼈等);*潜在客户(如交易对⼿,⽆账号交易客户等);那在实施过程中,除了对客户进⾏分类外,重点需要关注:(1)客户ID:为每位客户确定⼀个唯⼀的ID,由于不同的系统都会有客户ID,如何分析是否是同⼀个客户?许多银⾏都会有ECIF系统来唯⼀确定客户,如果已经有全⾏的唯⼀客户ID,那将减少许多整合⼯作,只需按⼀定规则将其他潜在客户、⼲系⼈分配唯⼀ID即可。
如果没有ECIF系统可以在主题模型进⾏整合,如按证件类型、证件号码、姓名、性别来识别唯⼀客户,将各源系统中的客户识别成唯⼀客户后,再将各源系统的客户信息进⾏整合。
(2)客户之间关系设计:由于⼀个客户可能有多个⾓⾊,⼀般可以通过客户关系表来确定。
⽐如既是员⼯也是客户可在关系表中存放客户ID和员⼯ID的关系类型是同⼀个⼈,既是个⼈客户⼜是企业法⼈,可在关系表中存放客户ID和企业ID的关系类型为企业法⼈关系。
(3)客户主题是整个模型的中⼼,其它的所有主题都会和客户主题进⾏关联,因此如何与其他主题进⾏关联也需要重点考虑。
商业银行数据仓库报表设计

**商业银行数据仓库报表设计版本:1.05/6/2020目录1.报表系统 (3)1.1.业务分析 (3)1.2.财务分析报表系统 (3)1.2.1.资产业务分析(月) (3)1.2.1.1.资产规模增长情况分析 (4)1.2.1.2.资产增量变化情况分析 (4)1.2.1.3.资产结构变化情况分析 (4)1.2.1.4.贷款资产专项统计 (5)1.2.2.负债业务分析 (5)1.2.2.1.负债规模增长情况分析表 (5)1.2.2.2.负债增量变动情况分析表 (5)1.2.2.3.负债结构变化情况分析表 (6)1.2.2.4.存款负债专项统计 (6)1.2.3.所有者权益分析 (6)1.2.3.1.所有者权益增长情况分析 (6)1.2.3.2.所有者权益增量变动情况分析 (7)1.2.3.3.所有者权益结构变化情况分析 (7)1.2.4.财务收支分析 (7)1.2.4.1.收支规模增长情况分析 (7)1.2.4.2.收支增量变动情况分析 (8)1.2.4.3.当期收支情况分析 (8)1.2.4.4.财务收支结构变动情况分析 (8)1.2.4.5.财务收支计划完成情况分析 (8)1.2.5.财务比率分析 (9)1.2.5.1.各项财务比率分析表 (9)1.3.资金计划业务需求 (10)1.3.1.资金头寸统计 (10)1.3.2.资金负债管理指标 (10)1.3.3.现金管理 (10)1.3.3.1.结算备付金统计 (10)1.3.3.2.库存现金统计 (11)1.3.3.2.1.即时余额统计 (11)1.3.3.2.2.日均余额统计 (11)1.3.3.3.业务量统计 (11)1.3.4.票据贴现业务统计 (12)1.4.综合统计分析 (12)1.4.1.存款统计 (12)1.4.1.1.存款结构统计 (12)1.4.1.1.1.日均存款统计 (12)1.4.1.1.2.存款即时余额统计 (12)1.4.1.1.3.储蓄业务统计 (13)1.4.1.2.存款明细统计 (13)1.4.2.贷款统计 (13)1.4.2.1.贷款结构统计 (13)1.4.2.1.1.贷款日均统计 (13)1.4.2.1.2.贷款即时余额统计 (14)1.4.2.2.贷款明细统计 (14)1.4.3.业务量统计 (14)1.4.3.1.会计综合业务量统计 (14)1.4.3.2.现金收付量统计 (14)1.5.安全性 (15)1.5.1.安全控制逻辑 (15)2.客户经理服务系统(ASS) (15)2.1.总体分析 (15)2.1.1.分析角度 (15)2.1.2.分析指标 (15)2.2.安全性 (15)1.报表系统1.1. 业务分析业务分析的方法主要是多维分析法,根据业务决策的需要,可进行各种分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
商业银行数据仓库业务模型设计及实现摘要:随着我国金融体系的发展与完善,商业银行快速扩张,导致了经营风险的日益增加和业务资源的激烈竞争。
利用先进的技术手段,整合已经积累的大量的客户信息和经营数据,为制定经营管理决策提供支持,是提高银行竞争力的重要途径。
本文以华兴商业银行模拟业务数据为例,从多个事实角度对其进行数据仓库建模并通过对数据进行多维度分析,说明数据仓库在商业银行中的应用前景。
关键词:商业银行;数据库;数据仓库;模型设计
中图分类号:tp311.13 文献标识码:a 文章编号:1007-9599 (2013) 04-0000-02
1 引言
随着我国金融体系的发展与完善,商业银行快速扩张,导致了经营风险的日益增加和业务资源的激烈竞争。
由于银行业的特殊性,不得不采用众多的业务系统,每天产生大量的业务数据,但由于系统相对独立,不可避免地形成了多个信息孤岛,领导决策者很难从全行的角度来分析盈利能力和预测风险。
虽然目前各个商业银行已经积累了大量的客户信息和经营数据,但目前却没有办法对客户的贡献度、产品和渠道的赢利能力、经营成本等进行准确、快速的计算,以及为市场的管理和分析、预测等提供有效的工具。
这样,建立银行数据仓库,为市场营销和客户分析提供基本的信息源和辅
助工具,就成为银行提高市场竞争能力和客户服务水平的关键。
本文以华兴商业银行模拟业务数据为例,从多个事实角度对其进行数据仓库建模并通过对数据进行多维度分析,说明数据仓库在商业银行中的应用前景。
2 需求分析
货款业务是华兴商业银行传统的主要高收益业务,经过多年的发展,华兴商业银行积累了一定的客户源。
因其高额的利润空间,各个商业公司纷纷涉足此业务,并且近年来随着市场化进程的加快,货款业务竞争加剧。
为了维持华兴商业银行在此业务的优势,实现利润高增长。
华兴商业银行总部高层决定集成公司内部分散的货款业务交易数据,如果华兴商兴银行在近几个月内的货款业务出现缩水,那么华兴将不得不推出一项旨吸引货款业务的惠民政策以保证华兴商业银行在货款业务的竞争优势。
如果决定推出惠民政策,总部需要知道历史货款业务在货款方式、货款期限、担保方式、货款性质、币种、借款时间等方面的交易量分布,以此让这项政策更有针对性,更具吸引力。
制订好这项政策之后,总部希望能根据历史的客户信息,知道华兴商业银行的主要货款客户在行业、公司规模、以及公司法人方面的一些特征,从而有针对性的进行宣传。
3 数据仓库设计
3.1 主题设计
根据需求分析的功能要求,将数据仓库抽象营业额、货款方式、
货款客户三个主题。
其中营业额主题通过对华兴商业银行历史交易数据在时间上对营业额进行度量,以此提供是否推广惠民政策的决策支持。
通过从款方式、货款期限、担保方式、货款性质、币种、借款时间、还款方式5个角度度量华兴的货款交易额,提供对惠民政策专注点的决策支持。
通过从行业分类、经营规模角度对客户货款额的度量提供对宣传客户的决策支持。
3.2 维度设计
在确定主题后,我们要考虑对主题的度量。
要考虑到量度的汇总情况和不同维度下量度的聚合情况。
考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小。
根据此原则,维度设计如下表1所示。
4 数据仓库装载
数据仓库在microsoft visual studio 平台上实现,由平台的数据集成服务完成。
由于数据仓库的事实表和维度表之前存在主外键关联。
所以装载数据仓库时应先装载维度表,然后装载事实表。
装载过程主要由平台的etl工具实现。
下图2为etl数据仓库装载数据流图。
5 数据仓库应用分析
对比2001到2005年间货款额的变化,从2001到2004年货款业务的货款额一直呈上升趋势,但到2005年,货款交易额急剧下降。
而且对比2005年内第一季度和第二季度的货款销售额,较之
于第一季度,第二季度也呈下降趋,所以总体来看,华兴商业银行有必要推出一项惠民的激励措施以此保障其货款业务的发展。
如图4所示,已交易的货款数据主要是票据贴现的担保方式,此外客户更喜欢选择等额本金递增还款的还款方式,票据贴现的货款类别,偏好于自营常规的短期货款。
公司可以着重在此类货款上给予客户更多的优惠。
此外,通过数据仓库的图表展示。
还可以看出历史客户主要集中在金融、批发和零售业、制造业内。
所以公司应着重加强对此类企业的宣传。
参考文献:
[1]杨俊.浅议商业银行数据仓库的逻辑数据模型设计[j].华南金融电脑,2004,12(6).
[2]王毅.数据仓库建模和设计的最新进展.电脑开发与应用[j].2010,23(3):34?36.
[3]孙磊.数据仓库与挖掘技术在银行业的应用[j].科技创新导报,2009(8)
[4]林宇.数据仓库原理与实践[m].北京:人民邮电出版社,2003:1-5.
[作者简介]王云凯(1988-),男,四川巴中人,硕士研究生,研究方向:商务智能,金融信息处理。