数据仓库方法论
数据仓库建设方法论

数据仓库建设方法论数据仓库建设是一个复杂而又关键的过程,需要仔细的规划和实施。
在数据仓库建设过程中,需要遵循一定的方法论,以确保数据仓库能够达到预期的效果和价值。
1. 确定业务需求在数据仓库建设之前,需要对业务需求进行详细的分析和梳理。
这包括对业务流程、数据来源、数据结构、数据质量等方面进行全面的调研和了解。
只有深入了解业务需求,才能够确定数据仓库的建设方向和目标。
2. 设计数据模型在确定了业务需求后,需要对数据进行建模。
数据模型是一个抽象的概念,它描述了数据的结构和关系。
一个好的数据模型应该具有清晰的层次结构,易于维护和扩展,同时还需要考虑数据的性能和安全性。
3. 确定数据采集方式数据采集是数据仓库建设的第一步,也是最重要的步骤之一。
数据采集需要考虑数据来源、数据格式、数据质量等方面,同时还需要根据业务需求确定数据采集的频率和方式。
数据采集的过程需要严格遵循标准化流程,以确保数据的准确性和完整性。
4. 建立数据仓库架构数据仓库架构是数据仓库建设的核心,它包括数据仓库的物理结构、数据仓库管理系统、数据访问接口等方面。
在建立数据仓库架构时,需要考虑数据的安全性、可靠性、性能等方面,同时还需要根据业务需求进行合理的规划和设计。
5. 实施数据质量管理数据质量是数据仓库建设的关键问题之一,它直接关系到数据的可信度和有效性。
因此,在数据仓库建设过程中,需要实施严格的数据质量管理,包括数据清洗、数据标准化、数据验证等方面。
只有保证数据质量,才能够保证数据仓库的有效性和价值。
6. 实现数据分析和利用数据仓库建设的最终目的是为了实现数据的分析和利用。
在数据分析和利用过程中,需要采用先进的数据挖掘和分析技术,以提取数据中的有价值信息。
同时,还需要将数据与业务相结合,实现数据的价值最大化。
数据仓库建设是一个长期的过程,需要不断地调整和优化。
在建设过程中,需要深入了解业务需求,设计合理的数据模型,实施严格的数据质量管理,以实现数据的有效分析和利用。
数据仓库 EDW

数据中心 ODS随着企业信息化建设的发展,巨大的投资为企业建立了众多的信息系统,以帮助企业进行内外部业务的处理和管理工作。
随着信息系统的增加,各自孤立工作的信息系统将会造成大量的冗余数据和业务人员的重复劳动。
同时随着时间推移,各系统不断沉淀大量的历史数据。
如何打破信息孤岛,充分利用现有的历史数据,为企业提供战略决策的数据支持是各行各业所必需考虑的事情。
为支持企业各项业务的长远发展,不断提高管理水平,建立实现企业数据交换、数据集成的企业级数据中心,并在此基础上初步建设数据管控平台,有效实现数据质量管理,为后续数据线规划的报表管理以及EDW等系统建设奠定基础,为企业提升核心竞争力,优化资源配置、实施有效管控,提高服务水平、科学可待续发展和加速发展奠定良好的基础。
一、系统规划蓝图二、东南融通的优势1、关键技术优势数据交换、数据加工基于统一的调度监控ETLPLUS、调度引擎JSI模块封装SHELL、可执行程序、存储过程、Datastage作业等各种作业类型的执行接口?高扩展性设计,实现ETL、调度监控和硬件的集群报表工具(BI.OFFICE、其他)成熟组件支持,文件交换组件,数据加工组件2、团队优势BI线条员工超过1200人,覆盖咨询、解决方案、研发、实施各个层面参与众多的ODS/EDW/BI项目实施团队彼此配合程度高、统一协调、合作经验丰富随时进行同行信息共享与交流,及时进行方案提炼数据仓库 EDW现代商业银行面临着诸多挑战,包括金融改革日益深化的挑战、面临来自外资银行的竞争、银行国际化的发展需要、客户的要求越来越成熟、监管机构对银行的监管越来越严格。
面对这些挑战,要求金融企业对企业经营数据和信息进行充分的掌握和分析,以帮助企业精确掌握企业的经营状况和准确决策。
建立企业级的银行数据仓库是银行业整体信息资产的管理,建立信息资产的运营服务体系,提升信息资产的业务价值。
东南融通投入了大量资源研究银行企业级DW&BI应用体系,如下图所示:BI.Bank解决方案蓝图,包括以下关键内容:一、数据仓库战略规划参照国际银行领先DW&BI体系架构,规划银行企业级DW&BI的技术框架、数据模型、应用框架,结合银行的业务管理改革步伐制定整体实施计划,帮助银行循序渐进地逐步建成企业级DW&BI系统。
数据仓库的测试方法论

数据仓库的测试方法论数据仓库是一个用于存储和管理大量结构化和非结构化数据的系统,它对于组织和分析数据非常重要。
然而,数据仓库的正确性和稳定性对于数据分析的准确性和可靠性至关重要。
因此,对数据仓库进行全面的测试是必不可少的。
本文将介绍数据仓库的测试方法论,以确保数据仓库的质量和可靠性。
一、测试策略数据仓库的测试策略应该包括以下几个方面:1.功能测试:测试数据仓库的基本功能,如数据加载、数据转换、数据清洗、数据查询等。
2.性能测试:测试数据仓库在不同负载下的性能表现,包括数据加载速度、查询响应时间等。
3.可靠性测试:测试数据仓库的稳定性和可靠性,包括数据的完整性和一致性。
4.安全性测试:测试数据仓库的安全性,包括数据的保密性和访问控制。
5.容错性测试:测试数据仓库在出现故障或异常情况下的恢复能力。
6.兼容性测试:测试数据仓库与其他系统的兼容性,如ETL工具、数据可视化工具等。
二、测试环境为了有效地进行数据仓库的测试,需要建立一个合适的测试环境。
测试环境应该包括以下几个方面:1.硬件环境:包括服务器、存储设备等。
2.软件环境:包括操作系统、数据库管理系统、ETL工具等。
3.测试数据:需要准备一些合适的测试数据,以模拟真实的数据情况。
4.测试工具:可以使用一些专业的数据仓库测试工具,如QuerySurge、Talend等。
三、测试用例设计在进行数据仓库测试之前,需要设计一些合适的测试用例,以确保测试的全面性和有效性。
测试用例应该包括以下几个方面:1.数据加载测试:测试数据仓库的数据加载过程,包括数据的抽取、转换和加载。
2.数据查询测试:测试数据仓库的查询功能,包括查询语句的正确性和查询结果的准确性。
3.数据清洗测试:测试数据仓库的数据清洗过程,包括去重、校验、修复等。
4.性能测试:测试数据仓库在不同负载下的性能表现,包括数据加载速度、查询响应时间等。
5.安全性测试:测试数据仓库的安全性,包括数据的保密性和访问控制。
onedata建模方法论

onedata建模方法论(原创版4篇)《onedata建模方法论》篇1OneData 是一种数据建模方法论,旨在帮助企业构建高质量的数据仓库。
该方法论包括以下主要内容:1. 数据仓库定义:OneData 将数据仓库定义为一个集成的、稳定的、易于访问的数据存储库,用于支持企业管理、决策和分析需求。
2. 数据建模流程:OneData 提出了一套完整的数据建模流程,包括需求分析、概念设计、逻辑设计、物理设计和实施等阶段。
在每个阶段,都有相应的方法和工具支持。
3. 数据模型设计:OneData 强调数据模型设计的重要性,提出了一些设计原则,如实体完整性、属性完整性、参照完整性和数据一致性等。
OneData 还提供了一些数据模型设计工具,如ER 图、数据字典和数据流图等。
4. 数据仓库实现:OneData 提供了一些数据仓库实现的技术和工具,如数据清洗、数据转换、数据加载、数据存储和数据查询等。
OneData 还强调了数据仓库的性能和安全性的重要性。
5. 数据仓库管理:OneData 提供了一些数据仓库管理方法和工具,如数据质量管理、数据备份和恢复、数据安全和数据审计等。
OneData 还强调了数据仓库的可用性和可扩展性的重要性。
《onedata建模方法论》篇2OneData 是一种数据仓库建模方法论,其核心思想是将数据仓库视为一个企业级的数据中心,通过建立一套完整的数据模型来实现数据的统一管理和运营。
OneData 方法论主要包括以下方面:1. 数据仓库概念模型设计:该阶段主要通过业务领域模型的设计,将企业的业务需求转化为数据模型,包括数据实体的定义、属性的设计以及实体之间的关系等。
2. 数据仓库逻辑模型设计:该阶段主要通过数据模型的逻辑设计,将概念模型转化为具体的数据表结构,包括数据表的定义、表之间的关系、索引的设计等。
3. 数据仓库物理模型设计:该阶段主要通过数据模型的物理设计,将逻辑模型转化为具体的数据存储结构,包括数据分区、数据备份、数据恢复等。
数据仓库建模方法论

数据仓库建模方法论数据仓库建模是指将数据仓库中的数据按照某种标准和规范进行组织和管理的过程。
数据仓库建模方法论包括了多种方法和技术,用于帮助用户理解和分析数据仓库中的数据,从而支持决策制定和业务分析。
一、维度建模方法维度建模方法是数据仓库建模的核心方法之一,它以维度为核心,将数据按照维度进行组织和管理,从而提供给用户灵活和高效的数据查询和分析能力。
1.1 星型模型星型模型是最常见和简单的维度建模方法,它将数据仓库中的事实表和多个维度表通过共享主键的方式进行关联。
事实表包含了衡量业务过程中的事件或指标,而维度表包含了用于描述和过滤事实记录的属性。
星型模型的结构清晰,易于理解和使用,适用于绝大部分的数据仓库场景。
1.2 雪花型模型雪花型模型是在星型模型的基础上进行扩展和优化的一种模型,它通过拆分维度表中的属性,将其拆分为多个维度表和子维度表,从而使得数据仓库更加灵活和高效。
雪花型模型适用于维度表中的属性比较复杂和层次结构比较多的情况。
1.3 天际线模型天际线模型是一种比较先进和复杂的维度建模方法,它通过将事实表和维度表按照一定的规则进行分组和划分,从而实现多个星型模型之间的关联。
天际线模型适用于数据仓库中包含多个相互关联的业务过程和多个不同的粒度的情况。
二、多维建模方法多维建模方法是在维度建模方法基础上进行进一步抽象和简化的一种方法,它通过创建多维数据立方体和维度层次结构来组织和管理数据。
2.1 数据立方体数据立方体是多维建模的核心概念,它将数据按照事实和维度进行组织和管理,从而提供给用户直观和高效的数据查询和分析能力。
数据立方体包含了多个维度和度量,用户可以通过选择和组合维度和度量进行数据分析和挖掘。
2.2 维度层次结构维度层次结构是多维建模的关键技术,它通过将维度进行分层和组织,从而实现维度之间的关联和上下级关系。
维度层次结构可以有效地减少数据的冗余和复杂性,提高数据仓库的查询和分析效率。
三、模式设计方法模式设计方法是在维度建模方法和多维建模方法的基础上进行进一步的抽象和规范的一种方法,它通过定义模式和规则来组织和管理数据仓库中的数据。
详解数据仓库的实施步骤

详解数据仓库的实施步骤建立数据仓库是一个解决企业数据问题应用的过程,是企业信息化发展到一定阶段必不可少的一步,也是发展数据化管理的重要基础。
数仓的知识市面上的书籍和文章不少,但是实际实施依据行业不同,企业核心诉求不同,从技术到方法论各有不同。
如何实施数仓项目,本文先以传统行业的数仓切入,从整体上讲下数据仓库的实施方法论!数据仓库的通用实施步骤一、需求分析需求分析是数据仓库项目最重要的一个环节,数仓说到底还是服务于业务,支撑于业务,如果需求分析不准确,做了没人用,上了不好用,会直接影响业务/客户的使用,最终导致项目的失败。
为了避免最坏的情况,磨刀不误砍柴工,前期一定要重视需求的调研、挖掘和分析,并采用一些严谨科学的措施和方法去做需求分析。
在实际调研过程中分享几个经验:1、尽可能与业务方/客户方一起分析需求,引导对方将项目所要实现的整体框架和业务细节部分述清楚,最好的方式就是需求人员和设计人员基于原型来讨论,从而正确理解实际的业务需求。
2、必须实事求是地将数据仓库所能实现的目标和不容易解决的问题与协商清楚。
这一个环节趟过不少坑,IT方急着上线,业务方对于项目还处于一知半解,甚至在推动的时候可能避重就轻,比如一期不满足的需求强行上,长远来看项目会产生不少推诿和扯皮,消磨的是对方的信任。
所以在需求讨论的基础上,需要理解业务工作流程,当然如果你已经具备了这个行业丰富的业务知识,那可以在需求调研的时候尽可能地让对方按照自己的思路去完成数据仓库系统的功能设计。
3、需求方群体的分类,BI项目最终的使用对象可以分为以下几类:数据查询者、报表查询者、企业决策者这三类人群的需求特点完全不一样,沟通的时候需要注意区分并深刻理解4、需求调研的再完美,也避免不了需求变更。
现实是很多情况下需求是不确定的,业务方是提不出有价值的需求的,需求今天是A 明天又变成B无法一步做到位的,这都很正常,作为项目实施者要做好心理预期。
一般情况下,业务方能够提供的都是需求的整体框架部分或者是实际需求的一部分内容,不能预见未来需要增加的需求,这也注定了数仓项目是一个不断循环、反馈,使系统不断完善增长的过程。
数仓建设方法论

数仓建设方法论随着大数据时代的到来,数据成为企业发展的重要资源。
为了更好地利用和管理数据,数仓建设成为企业信息化建设的重要环节。
数仓建设方法论是指在数仓建设过程中所采用的一系列方法和原则,旨在帮助企业高效、有序地构建数据仓库,实现数据价值最大化。
一、需求分析阶段在数仓建设的初期阶段,需求分析是关键的一步。
通过与业务部门的沟通和理解,明确企业的业务需求和数据需求,确定数仓的建设目标和规划。
在需求分析阶段,应注重以下几点:1. 充分了解业务需求:与业务部门进行深入交流,了解业务流程、数据来源和数据需求,明确业务指标和分析要求。
2. 定义数据模型:根据业务需求和数据特点,设计合适的数据模型,包括维度模型和事实模型。
数据模型的设计应符合规范,保证数据的准确性和一致性。
3. 制定数据采集计划:根据数据来源和数据质量要求,制定数据采集计划,明确数据的提取、清洗和转换等步骤,确保数据的完整性和可用性。
二、数据建模阶段数据建模是数仓建设的核心环节,它是将业务需求转化为数据模型的过程。
在数据建模阶段,应注意以下几点:1. 建立维度模型:根据需求分析阶段定义的数据模型,建立维度模型,包括维度表和事实表。
维度模型的设计应具有层次清晰、灵活性强的特点,方便后续的数据分析和查询。
2. 选择合适的ETL工具:ETL(Extract-Transform-Load)是将数据从源系统抽取、清洗和加载到数仓中的过程。
在选择ETL工具时,应根据数据量、数据质量和业务需求等因素进行评估,选择适合的工具。
3. 设计数据质量控制策略:数据质量是数仓建设的关键问题,对数据的准确性和一致性要求较高。
因此,在数据建模阶段应设计数据质量控制策略,包括数据清洗、数据校验和数据修复等措施,确保数据质量达到要求。
三、数据加载和存储阶段在数据建模完成后,需要将清洗好的数据加载到数仓中,并选择合适的存储方式进行数据存储。
在数据加载和存储阶段,应注意以下几点:1. 选择合适的存储方式:根据数据量、查询性能和成本等因素,选择合适的存储方式,包括关系型数据库、列式数据库和分布式存储等。
数仓建设方法论

数仓建设方法论随着大数据时代的到来,数据成为了企业决策的重要依据。
而数仓作为企业数据管理与分析的核心,成为了企业提升数据价值的关键。
本文将从数仓建设的方法论出发,探讨如何高效地构建一个优秀的数仓。
一、明确业务需求数仓的建设首先需要明确业务需求,只有深入了解业务过程和业务问题,才能够有针对性地建设数仓。
在明确业务需求时,可以采用以下方法:1.1 业务需求调研:通过与业务部门的沟通和交流,了解业务过程、数据来源、数据质量要求等方面的需求。
1.2 数据价值评估:评估不同数据对业务决策的价值,确定优先建设的数据主题。
1.3 业务流程建模:对业务流程进行建模,明确数据仓库中需要包含哪些数据,并定义数据间的关系。
二、数据采集与清洗数据采集与清洗是数仓建设过程中的重要环节,它直接影响到数仓数据的质量和可用性。
在数据采集与清洗过程中,可以采用以下方法:2.1 数据源对接:根据数据来源的不同,选择合适的数据采集方式,如API接口、数据库连接、日志文件等。
2.2 数据抽取与转换:通过ETL工具,对数据进行抽取、清洗和转换,使其符合数仓模型的要求。
2.3 数据质量控制:建立数据质量监控机制,对数据进行质量检查,确保数据的准确性和完整性。
三、数据建模与存储数据建模是数仓建设中的核心环节,它决定了数据在数仓中的组织方式和查询效率。
在数据建模与存储过程中,可以采用以下方法:3.1 维度建模:采用星型模型或雪花模型,将数据按照维度进行划分和组织,提高数据的可用性和查询效率。
3.2 数据分区:根据数据的特点和访问频率,将数据进行分区存储,提高查询性能和存储效率。
3.3 数据压缩:对数据进行压缩存储,减少存储空间的占用,提高数据的存储效率。
四、数据分析与应用数仓建设的最终目的是为了支持数据分析和业务应用。
在数据分析与应用过程中,可以采用以下方法:4.1 数据挖掘和分析:利用数据挖掘算法和工具,对数仓中的数据进行挖掘和分析,发现数据中隐藏的规律和价值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 提升系统的可管理性
• 数据访问的性能 • 系统的可靠性 • 易于使用和维护
数据仓库项目成功的要素-实施方面
• 制订合理的项目目标
• 必须与企业发展目标一致,才能获得领导层的支持 • 项目目标必须明确而具体 • 近期需求与长远规划相结合
• 沟通是关键
• 业务部门和技术部门紧密合作数据仓库ຫໍສະໝຸດ 法论成功引导您构建数据仓库
数据仓库系统的建设目标-从数据到知识
基于对知识的掌握 采取相应的行动
决策
信息间的逻辑关联 成为知识
知识
整合的数据提供 特定的信息
信息
原始业务数 据的记录
数据
行动 结果
完整的决策分析过程
发生了什么问题?
统计报表 即席查询
跟踪企业运行状况
EIS系统
数据仓库
数据集市
• 以应用为核心
• 数据仓库不是目的,而是手段
• 明确系统的使用对象
• 管理决策层 • 专业分析员 • 前台业务部门
• 提升管理水平
• 不是统计报表系统 • 最大限度发挥数据仓库的作用
数据仓库项目成功的要素-技术方面
• 信息集成是关键
• 保证数据质量 • 数据获取过程可靠,自动化
• 以服务用户为目标
细节数据层
数据挖
平 台
掘
和
模型
数
据
接
口
平
台
EAI
I
I 统计
业务
支撑 系统
计费 帐务
综合 结算
CRM
渠道 营销
支撑
服务 资源 施工 服务 网络 开通 管理 调度 管理 管理
财务
人力 资源
工程 管理
II
II
BSS
OSS
MSS
规划系统数据架构
高度汇总数据 低度汇总数据
详细数据 历史数据
企业绩效分析 - 固定报表 - 定制报表
分析员 管理员
数据仓库的直接使用和间接使用
业务层 业务层 业务层
业务层 决策层 分析层
生产系统
(综合营帐,计费、客服)
客户名单、信用度、客户价值 客户资料、帐单、详单
数据仓库
系统管理员
对数据仓库中信息的使用方式
决策层
其他系统
抽取数据
分析层
决策信息
息营
客
销
服
决 策 信
决 策 信 息
业 务 受 理 决
客户名称 联络人
地址
合同号 客户分类
工商银行济南分行 张主任
槐荫区经四路310号 JNDKH-000558 12(商业大客户)
• 匹配/合并结果
数据仓库
客户
联系人
工商银行济南分行 张晓东
详细地址
槐荫区经四路310号
ID
客户类别
123456789 12(商业大客户)
数据仓库项目成功关键因素
数据仓库项目成功的要素-应用方面
数据 + 元数据 =
信息 ?
质量(数据 + 元数据)
= 信息
数据质量金字塔
•违反唯一性约束 •违反主外键关系
•丢失数据 •丢失数据包含的
属性信息
•数据超出值域范围 •数据类型不匹配 •数据日期格式错
准确性 及时性 一致性 唯一性和参考完备性 完整性 数据类型和值域
•业务规则 •统计口径
•处理数据超出了 用户忍耐 •结果过时
现状
应用集中情况 数据源质量 数据的一致性 系统运行状况 部门的理解程度
数据仓库建设整体思路
• 整体规划,分步实施
• 整体规划 • 设立分阶段目标,逐步实施
• 需求驱动
• 注重分析型结果和操作型应用的交互,形成闭环操作流程
DWM-数据仓库实施方法
• Oracle数据仓库实施方法论(DWM-- Data Warehouse Method)
数据仓库 模型
主题 客户关系管理
- 客户消费行为统计
. .. ..
问问题题
客客
.
户户
要素n 要素n
f(要f(要素素1,1模要,模要素型素2型…2…要要素素n)n)
流满 失意 分度
析分
析
- 客户群体的细分 - 价格敏感度分析 - 客户的满意程度 - 客户流失分析 - 获取新的客户 - 获利能力和在目标市场上所占的份额
• 数据模式验证
• 电话号码、身份证
• 唯一性验证
• 重复的信息
• 数据有效性验证
• 符合值域范围
• 一致性验证
• 不同表之间、不同系统之间
• 完整性验证
• 关键字段缺失
数据匹配/合并
• 源系统
97系统
姓名
工行济南分行
联系人
张晓东
地址
经四路310号
ID
客户性质
123456789
C(金融)
10000
• 多年数据仓库系统实施的提炼; • 预定义好数据仓库系统不可缺少的步骤和任务; • 确定正确的系统范围和用户需求、建立灵活的系统架构; • 数据仓库系统的实施分为13个过程,7个阶段。
数据仓库方法论(DWM)的组成
UsEesrstimGautiidneg
HanTdebchonoikques
软件工具
Physical
物理数据库设计
PoC (增量)
实施
整体规划,分步实施
财务表现
经营战略
发展规划
销售管理
Business Intelligence For Telecom
网络管理
市场营销
客户服务
生产经营
应用驱动的建设模式
979系7系统统 计费系统
计费系统 客服系统
客服系统
要素1 要素1
要素2 要素2
规划系统应用架构
数据仓 库应用 统一应 用门户
数据 仓库
III
欺诈管理 II
客户 分析I
营销计划预演 II
催缴管理 II
量收 分析I
产品 分析I
竞争 分析I
绩效管理 III
客户关系管理 II
收入保障 III
服务质量 互联互通 营销渠道
分析I
分析II
分析I
报表集市
KPI指标库
分析应用多维数据集市
汇总数据层
• 模型设计的适应性 和扩展性
• 数据转换过程中的 保证
安全性和完整性
Oracle数据质量管理流程
数据质量
监控
数据
信息
执行
元数据 捕捉
数据质量 评估
数据特征 分析
数据质量 转换
部署
元数据管理
数据 规则
过程流
数据流
数据质量 规则设计
OWB中的数据质量分析
• 数据类型验证
• 数据类型(整数、浮点数、字符串等)是否正确
ETL服务器
数据仓库
OLAP 服务器
数据挖掘 服务器
存在的问题:
• 系统可管理性差 • 接口复杂 • 系统灵活性差
Oracle整合的数据仓库架构
低成本,低风险
Oracle数据库 Oracle应用服务器
关系型数据
门户
多维数据
报表
数据挖掘 ETL
查询 OLAP分析
整合而不是集成
• 整合的数据处理: ETL,OLAP,数据挖掘 • 整合的数据访问: 报表,查询,分析,门户 • 整合的元数据管理: 支持CWM 标准
完成时间
项目计划、项目管理
项目计划、报告
测试环境产品安装与调试
系统安装文档
系统实现方案
系统方案文档
9
详细调研
9
分析模型的定义
9
维值、维值层次和维值
编码规则的定义
9
分析报表的格式定义
9
扩展指标的定义
9
用户权限的定义
数据接口方案
数据接口文档
9
接口格式的定义
9
数据抽取、转换和装载
放、方案
数据仓库系统设计和开发方法
理解业务 发展目标
行业参照模型
逻辑模型模板
定义信息 可用性
Or
定义业务 需求优先级
数据仓库 逻辑模型
源系统分析
定义增量
数据仓库 物理模型
设计和建立 数据仓库
物理模型模板
举例:Oracle电信数据模型主题域
营销/客户交互 网络事件
帐务 参与人 地域
财务管理 产品 资源
传统的数据仓库架构
-使用专门产品实现专门的功能
y 方法指定原则 y 评估模型 y 工作计划生成器 y 项目框架
文档
y 技术手册 y 用户指南
Professional Community
Oracle数据仓库实施方法论
过程 | 阶段 业务需求定义 数据获取 系统结构定义 数据质量控制 数据仓库管理 元数据管理 数据访问 数据库设计与建立 文档设置 系统测试 培训 系统上线 技术支持
• 保持项目组成员的长期稳定
数据仓库项目成功的要素-推广方面
• 加强项目培训,提升员工的计算机应用水平和决策分析水平 • 建立系统推广配套体系与奖惩制度
• 数据问题:
• 数据整合 • 数据质量
• 应用问题:
• 产品易用性 • 分析功能-提供决策支持能力
数据仓库项目成功的关键因素
在最短时间内看到数据仓库的效益
• 效益
• 降低客户流失率
• 增加收入
• 提高客户满意度
• 成本
效益
成本+风险
• 软硬件投资 • 管理维护成本
• 风险
• 技术风险