数据仓库实施步骤与关键成功因素

合集下载

bi实施方案

bi实施方案

bi实施方案一、引言随着信息技术的发展和企业数据规模的快速增加,越来越多的企业开始重视商业智能(Business Intelligence,简称BI)的应用。

BI作为一种以数据为基础的决策支持系统,可以帮助企业有效地分析和利用数据,提供准确、全面的信息支持,助力企业在市场竞争中获得优势。

本文将为您介绍一个BI实施方案,帮助您了解如何有效地实施BI项目。

二、BI实施方案的步骤1. 定义需求BI项目的首要任务是明确企业的需求。

在此阶段,我们需要与企业管理层及业务部门进行深入的沟通,了解他们的需求和期望。

通过针对性的访谈和调研,了解业务流程、数据来源、信息需求等方面的情况,确保BI系统能够满足企业的实际需求。

2. 数据采集与整合在BI系统中,数据是关键的资源。

在数据采集与整合阶段,我们需要收集和整合企业内部和外部的数据,统一存储和管理。

通过构建数据仓库或数据湖等数据集成解决方案,实现多样化数据源的集成,确保数据的一致性和完整性。

3. 数据建模与分析数据建模是BI系统中的核心环节,通过对数据进行合理的建模和分析,实现对数据的深入挖掘和洞察。

在此阶段,我们需要运用数据挖掘和统计分析的方法,构建相应的指标体系和数据模型,并将数据可视化、报表分析等功能纳入到BI系统中。

4. 报表与可视化BI系统的最终目标是向用户提供生动、直观的数据分析结果。

在此阶段,我们需要将数据转化成易于阅读和理解的报表、图表、仪表盘等形式,帮助用户快速获取信息、识别问题和辅助决策。

同时,根据用户的需求,提供个性化的报表定制功能,让用户能够自主地创建适合自己的报表。

5. 部署与维护BI系统的部署与维护是BI项目的最后一步。

在此阶段,我们需要将BI系统部署到预定的硬件和软件环境中,并确保系统的稳定运行。

同时,我们还需要制定相应的维护计划,定期对系统进行监控和维护,及时解决潜在问题。

三、BI实施方案的关键成功因素1. 高层支持BI项目往往需要涉及到多个部门和决策层面,因此高层支持是BI项目成功的关键因素之一。

管理信息系统总复习题及答案

管理信息系统总复习题及答案

管理信息系统总复习题及答案一、选择题1. 管理信息系统属于以下哪一类系统?A. 事务处理系统B. 管理报告系统C. 决策支持系统D. 所有以上选项答案:D2. 以下哪项不是管理信息系统的基本功能?A. 数据收集B. 数据存储C. 数据传输D. 数据删除答案:D3. 管理信息系统的目的是为了提高组织的以下哪个方面?A. 效率B. 效益C. 竞争力D. 所有以上选项答案:D4. 以下哪个不是管理信息系统的关键成功因素?A. 技术支持B. 用户参与C. 组织文化D. 系统性能答案:D二、填空题5. 管理信息系统的主要目的是实现信息的______、______和______。

答案:准确性、及时性、有效性6. 管理信息系统主要包括______、______和______三个层次。

答案:操作层、战术层、战略层7. 数据仓库的三个主要特点是______、______和______。

答案:面向主题、集成性、稳定性三、判断题8. 管理信息系统只能用于企业内部管理,不能用于外部决策。

()答案:错误9. 管理信息系统可以帮助企业提高核心竞争力。

()答案:正确10. 管理信息系统的实施过程中,用户参与非常重要。

()答案:正确四、简答题11. 请简述管理信息系统的定义及作用。

答案:管理信息系统是一个以计算机技术为基础,用于支持组织内部管理决策的信息系统。

它通过收集、存储、处理和传递信息,为组织提供决策支持,提高组织的效率和效益,增强组织的竞争力。

12. 请简述管理信息系统的分类。

答案:管理信息系统主要分为以下几类:(1)事务处理系统(TPS):用于处理日常事务,如订单处理、库存管理等。

(2)管理报告系统(MRS):用于生成各种管理报表,如财务报表、销售报表等。

(3)决策支持系统(DSS):用于辅助决策者进行决策,如市场分析、预测等。

(4)专家系统(ES):模拟专家的决策过程,为用户提供决策建议。

五、论述题13. 论述管理信息系统实施的关键成功因素。

数据质量管理_数据仓库 ppt课件

数据质量管理_数据仓库 ppt课件

处理/生成
检查通过?
本地网
生成数据 检查通过?
数据质量管理_数据仓库
过程-稽核方法1
在从分公司到省公司的ETL过程中,采取总量稽核与分量稽核方法来校
1
验环节之间的数据平衡关系
总量稽核
• 对两个相邻环节中,对数据的总量进行验证,总量 指标包括:总记录数,所有度量指标的总值等。
• 总量正确说明数据没有被丢弃,没有不符合装载逻 辑规则的脏数据存在。
数据质量管理_数据仓库
系统推广
咨询/服务
启动会议
培需
训求
集成测试
相分 关析
DISBP实施方法
人整
员理
终端用户培训
产品配置
模型设计/
需求评审
ETL策略/ 客户化应用/元数据
管理
终验
初验
模型开发
需求确认


★ 系统建设 ★


试点局上线
集成测试
过程-校验点
对数据的稽核应包括三个层面的KPIs检查校验,其中业务层面 对于数据质量保证更为重要,也更为复杂
数据质量管理_数据仓库
上传的内容 优惠用户清单 新业务资料 新业务资料的月基量 长途清单 零次户清单 本地智能网卡清单汇总 小灵通预付费清单汇总 省智能网清单
上传的时间计划 每月28日20点 每天22点 每月28日20点 每天22点 每月28日20点 每月28日20点 每月28日20点 每月28日20点
有效的组织机构 是管理机制的有
力支持
数据质量保障流程
按照制定的规范获 取相应的项目资源 、支撑工具以及制
定工作计划
启动
定义详细的过程、 数据、组织的划分 以及质量元素、标

山东大学网络教育2022秋《管理信息系统》考试题加答案

山东大学网络教育2022秋《管理信息系统》考试题加答案

山东大学网络教育2022秋《管理信息系统》考试题加答案管理信息系统模拟题一、填空1、信息管理系统和(主管支持系统),(决策支持系统),(业务处理系统)及(知识工作系统)组成集成的管理信息系统。

2、电子计算机划分为以下四个时代(真空电子管计算机),(晶体管电子计算机),(集成电路电子计算机)和(大规模集成电路电子计算机)。

3、计算机都采用二进制或十六进制数字系统表示计算机中的数据信息。

十进制的(513)(1000000001)和(201)。

10的二进制数表示和十六进制数表示分别为4、计算机的主存储器,也称作为内存,它是由半导体存储器组成。

半导体的种类繁多,按其性能和用途可以分成两大类:分别是(只读存储器ROM)和(随机存储器RAM)。

5、传输介质是通讯网络中发送方和接收方之间的物理通道,我们常用有线的通讯介质有(双绞线),(同轴电缆),(光纤)。

6、(列双总线)是高性能、双总线光纤城域网,数据传输数率高于40Mbp,传输距离高达50km,具有与公共网的标准接口。

7、根据美国国家标准学会(ANSI)于1975年规定了数据库按三级体系结构组织的标准,这就是有名的SPARC分级结构。

这三级结构是(内模式)、(模式)和(外模式)。

8、由于传输介质的能力往往超出传输单一信号的能力,为了有效地利用传输系统,采用(多路复用)技术把多个信号组合起来在一条物理电缆上进行传输。

二、判断题下列问题在你认为正确的题目后面打(V),否则打(某)。

1、财务是企业四大职能之一,它实际包含两大部分,一部分是会计,一部分是财务。

其中会计的主要任务是记账,而财务的主要作用是资金的运作(V)2、调制解调器主要的功能是对脉冲数字信号进行转换。

(某)3、计算机预测系统是一个自维护系统,它不仅建立初始预测模型,而且当得到一个新的数据后能自动调整模型,使之适应新的变化。

(V)4、计算机网络有两部分组成,即负责通信控制的资源子网和由主干计算机专门负责数据处理的通信子网构成。

管理信息系统题库

管理信息系统题库

《管理信息系统》题库福建师范大学《管理信息系统》在线作业二--(1)一、单选题1. 系统切换的任务是A. 将总体设计转换为详细设B. 测试系统C. 验收系统D. 保证新老系统平稳而可靠的交换D2. 下列不属于财务信息系统输出子系统的是A. 预测子系统B. 内部审计子系统C. 控制子系统D. 资金管理子系统B3. 下列不属于数据库中的知识发现的是A. 数据仓库B. 数据商场C. 数据挖掘D. 数据字典D4. 为了解决数据的物理独立性,应提供某两种结构之间的映像,这两种结构为A. 物理结构与用户结构B. 逻辑结构与物理结构C. 逻辑结构与用户结构D. 概念结构与逻辑结构B5. 以下哪种是有用的信息A. 干扰信息B. 概括信息C. 冗余信息D. 未检错信息B6. 将m :n联系转换为关系时,该关系的码是A. m方的码B. n方的码C. m与n方码的组合D. m方或n方的码C7. U/C矩阵是一张表格,它的第一行列出系统中各数据类的名称,左边第一列是系统中各功能的名称。

表中内容表达了各()与()的关系A. 模块、数据B. 模块、数据项C. 数据类、功能D. 数据项、记录C8. 在决策过程中,设计阶段的主要任务是:A. 收集数据B. 分析处理数据C. 发现、制定和分析各种可能的行动方案D. 评价和审核方案C9. 在各种系统开发方法中,系统可重用性、扩充性、维护性最好的开发方法是A. 原型法B. 生命周期法C. 面向对象的方法D. 增长法C10. 系统开发具有以下4个特点:复杂性高;集体的创造性活动;质量要求高;通常认为A. 产品是有形的B. 产品可度量C. 产品是无形的D. 产品不可度量C11. 委托开发的特征是:它用于企业内部的费用小,而且用于外部的费用大。

本企业开发能力要求不太重要,对系统维护A. 可自行解决B. 相当困难C. 比较容易D. 不必关心B12. 最适合应用原型法开发的系统是A. 数据关系较复杂、数据量大的系统B. 用户需求较难定义的、规模较小的系统C. 用户需求较明确、规模较大的系统D. 运算关系复杂、运算工作量大的B13. 用于支持领导层决策的信息系统是:A. 专家系统B. 经理信息系统C. 作业信息系统D. 战术信息系统B14. 最适合应用原型法开发的系统是A. 数据关系较复杂、数据量大的系统B. 用户需求较难定义的、规模较小的系统C. 用户需求较明确、规模较大的系统D. 运算关系复杂、运算工作量大的B15. 在诺兰模型中,开始对计算机的使用进行规划与控制是在A. 集成阶段B. 成熟阶段C. 控制阶段D. 数据管理阶段C16. 系统开发具有以下4个特点:复杂性高;集体的创造性活动;质量要求高;通常认为A. 产品是有形的B. 产品可度量C. 产品是无形的D. 产品不可度量C17. 信息是附载在A. 数据上的B. 符号上的C. 消息上的D. 知识上的C18. 执行信息系统是综合了___许多特征的一种信息系统。

eod项目实施方案

eod项目实施方案

eod项目实施方案引言:在当今快速变化的商业环境中,企业面临着越来越多的挑战和机遇。

为了适应市场需求和业务发展,许多公司决定进行技术升级和转型。

一项成功的技术实施项目非常关键,可以帮助企业提高效率、降低成本、增强竞争力。

本文将探讨一种名为EOD的项目实施方案。

I. 背景随着数字化时代的到来,数据处理变得愈发重要。

对于大型企业来说,数据管理以及合理的数据流程至关重要。

为了解决这些挑战,一家跨国公司决定引入EOD项目。

II. 理解EOD项目EOD(End of Day)项目旨在确保公司日常运营的顺利进行。

该项目的目标是在每天的结束时,对企业的数据进行整理、分析和备份,为新的一天做好准备。

它涉及到跨部门的信息共享和业务流程优化。

III. 项目目标EOD项目的目标是提高跨部门间的沟通和协作效率,简化数据流程,并保证数据的准确性和完整性。

此外,项目还应提高系统的稳定性,降低风险。

IV. 项目范围EOD项目的范围包括数据整合、数据仓库的建立、报表生成和备份过程的优化等。

为了确保项目顺利进行,需要明确相关部门和职责,并建立清晰的沟通渠道。

V. 项目执行步骤1. 调研和需求分析:在项目开始之前,应对现有系统和流程进行调研,并与相关部门进行需求沟通。

这有助于确保项目团队全面了解业务流程和需求。

2. 解决方案设计:基于需求分析的结果,项目团队应设计一个满足企业需求的解决方案。

这涉及到技术架构设计、系统功能确定以及数据的整理和转换等。

3. 开发和测试:根据解决方案设计和项目计划,开发团队开始系统的开发工作。

在完成开发后,需要进行测试以确保系统稳定并符合预期结果。

4. 部署和培训:一旦系统通过测试,就可以进行部署。

此时,需要确保系统与现有系统的无缝集成,并对相关人员进行培训,以便他们能够高效地使用新系统。

5. 监控和改进:实施EOD项目后,关键的一步是持续监控系统运行情况并进行必要的改进。

这有助于确保系统的稳定性和满足不断变化的业务需求。

管理信息系统

管理信息系统

第一章:1.信息是物质存在的一种方式、形式或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使信息所描述事件的不确定性减少。

2.信息的性质:1.事实性2.时效性3.不完全性4.等级性5.变换性6.价值性3.信息量的大小取决于信息内容消除人们认识的不确定程度,消除的不确定程度大,则发出的信息量就大,反之。

如果事先就确定信息的内容,那么信息所包含的信息量就等于零。

信息管理主要是对数据的管理,而知识管理则是对思维的管理。

4.系统是由处于一定的环境中相互联系和相互作用的若干组成部分结合而成并为达到整体目的而存在的集合。

5.管理信息系统是对一个组织的信息进行全面管理的人和计算机相结合的系统,他综合运用计算机技术、信息技术、管理技术和决策技术,与现代化的管理思想、方法和手段结合起来,辅助管理人员进行管理和决策。

管理信息系统不仅是一个技术系统,同时还是一个社会系统。

第二章:.1.管理信息系统的特点:1.他是一个为管理决策服务的信息系统2.对组织乃至整个供需链进行全面管理的综合系统3.人机结合的系统4.需要与先进的管理方法和手段相结合的信息系统5.多学科交叉的学科2.不同管理层次的信息特征:信息特征运行控制管理控制战略管理来源系统内部内部外部范围确定有一定确定性很宽概括性详细较概括概括时间性历史综合未来流通性经常变化定期变化相对稳定精确性要求高较高低使用频率高较高低3.组织规模是管理信息系统环境中最重要的因素之一,它决定着系统应用的目标和规模,因而,在管理信息系统的建设上,应根据组织规模确定系统的规模和目标。

4.管理的规范化是管理组织、过程等的科学性与合理性的需求。

5.制造资源计划(MRPⅡ)是广泛应用于制造企业的一种管理思想和模式。

正确反应了企业生产中人、财、物等要素和产、供、销等管理活动的内在逻辑联系,能够有效地组织企业的所有资源进行生产,因而获得了广泛的应用。

6.企业资源计划(Erp)在mrp的基础上,向内、外两个方向延伸,向内主张以精益生产方式改造企业生产管理系统,向外则增加战略决策功能和供应链管理功能。

大数据项目经理招聘笔试题与参考答案2025年

大数据项目经理招聘笔试题与参考答案2025年

2025年招聘大数据项目经理笔试题与参考答案(答案在后面)一、单项选择题(本大题有10小题,每小题2分,共20分)1、大数据项目经理在进行项目规划时,以下哪个阶段最关键?A、需求分析阶段B、技术选型阶段C、数据采集阶段D、项目实施阶段2、在数据仓库的设计中,以下哪种模型通常用于描述数据之间的关系和实体?A、实体关系模型(ER模型)B、数据流图(DFD)C、层次模型D、关系模型3、题干:大数据项目经理在进行项目需求分析时,以下哪个工具最有助于梳理和理解项目需求?A. E-R图B. SWOT分析C. Gantt图D. 用户故事地图4、题干:在大数据项目中,以下哪个阶段最需要关注数据的质量问题?A. 需求分析阶段B. 数据采集阶段C. 数据存储阶段D. 数据分析阶段5、题干:在数据仓库的设计过程中,以下哪个阶段通常用于确定数据模型和业务规则?A、数据抽取B、数据清洗C、数据建模D、数据加载6、题干:以下哪个工具在处理大数据项目中,用于进行实时数据流的分析和处理?A、HadoopB、SparkC、MySQLD、MongoDB7、以下哪个不属于大数据项目经理所需具备的技能?A、项目管理经验B、数据分析能力C、编程能力D、财务报表编制能力8、大数据项目管理中,以下哪个阶段不属于项目生命周期的关键阶段?A、需求分析B、设计阶段C、开发阶段D、运营维护阶段9、大数据项目经理在项目规划阶段,以下哪个工具或方法最常用于评估项目风险?A. 敏捷迭代B. SWOT分析C. Gantt图D.PERT图 10、在大数据项目中,以下哪种数据清洗技术可以帮助减少数据集中的噪声和异常值?A. 数据转换B. 数据脱敏C. 数据归一化D. 数据聚类二、多项选择题(本大题有10小题,每小题4分,共40分)1、大数据项目管理中,以下哪些工具或技术是项目经理在项目规划阶段可能使用的?()A、数据仓库技术B、ETL(提取、转换、加载)工具C、业务流程建模工具D、敏捷开发工具E、数据可视化工具2、在大数据项目风险管理的流程中,以下哪些步骤是正确的?()A、风险识别B、风险评估C、风险应对计划制定D、风险监控与控制E、风险分析3、以下哪些技术或工具在大数据项目中通常被使用?()A. HadoopB. SparkC. PythonD. SQLE. ETL工具4、以下哪些因素会影响大数据项目的成功实施?()A. 数据质量B. 技术选型C. 团队经验D. 项目管理E. 客户需求变更5、以下哪些是大数据项目经理在项目规划阶段需要考虑的关键因素?()A、数据资源获取的合法性与合规性B、项目团队的组织结构和管理模式C、大数据技术的选型与实施路径D、项目预算与成本控制E、客户需求分析及项目目标设定6、以下哪些工具和技术可以用于大数据项目的数据质量管理?()A、数据清洗工具B、数据脱敏工具C、数据可视化工具D、数据比对工具E、数据压缩工具7、大数据项目中,以下哪些是常见的项目阶段?()A. 需求分析B. 数据采集C. 数据存储D. 数据清洗E. 预算规划F. 项目评估8、以下关于大数据技术应用的描述,正确的是哪些?()A. 大数据分析可以帮助企业进行市场预测B. 大数据技术可以用于处理和分析海量数据C. 大数据技术可以提高决策效率D. 大数据技术可以用于实现智能推荐系统E. 大数据技术仅适用于大型企业9、大数据项目经理在项目规划阶段需要考虑以下哪些因素?()A. 技术选型B. 项目团队组建C. 数据安全与隐私保护D. 项目预算E. 客户需求分析 10、在大数据项目中,以下哪些工具或技术可以用于数据质量管理?()A. ETL工具(数据抽取、转换、加载工具)B. 数据清洗软件C. 数据质量监控平台D. 数据脱敏技术E. 数据可视化工具三、判断题(本大题有10小题,每小题2分,共20分)1、大数据项目经理的主要职责是确保项目按时、按预算完成,而不涉及数据分析和挖掘工作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SQL, C, Sh
2) 在加载服务器上进行
C, Sh
清洗(数据析取后、
加载前)
数据仓库
SQL
3) 在数据仓库里进行清
洗(数据加载后)
3/16/2002
17
3/16/2002
2.7 数据转换常用手段
▪ 析取 Extracting ▪ 条件 Conditioning ▪ 剔除 Scrubbing ▪ 合并 Merging ▪ 浓缩 Enrichment ▪ 确认 Validating ▪ 加载 Loading ▪ 评分 Scoring ▪ 家庭关系识别 Householding
数据仓库实施步骤与关键成功因素
一、数据仓库实施方法论
规划
现成解决方案规划
业务 探索
数 据 仓
?库
策 略 开 发
业务 探索
修改
验证 逻辑
解决 数据
方案 模型
解解
详决 决
细方 方
数案 案
据准 实
分备 施
析就 建
解决 方案 定义
逻辑 数据 模型 设计
绪议
定制解决方案规划3/16源自2002设计与实现支持与增强
3/16/2002
6
业务探索



信息探索



逻辑数据
模型
2.4 逻辑数据模型设计
主要任务:
– 进行原始数据分析 – 建立实体模型 – 建立实体间依赖关系 – 完善并填入所有属性 – 建立数据库逻辑模型
利用工具:
➢ ERWin
交付项目:
➢ 数据仓库逻辑数据模型LDM ➢ 《逻辑数据模型说明书》
3/16/2002
• 主要实体和它们的关系 (Major Entities and Their Relationships)
逻辑数据模型 ( LDM - Logical Data Model )
• 业务模型加(CDM Plus) : • 所有的表及简单的数据(All Tables with Sample Data) • 辅助的表及简单的数据( Minor Tables with Sample Data ) • 主键与外键的关系( PK & FK Relationships ) • 数据约束( Constraints ) • 属性( Attributes )
交付项目:
➢ 《 数据转换加载设计说明书》 ➢ 《数据映射 (Data Mapping)说明书 》 ➢ 数据转换加载脚本 ( ETL Scripts) ➢ 加载流程控制( ETL Process Control)
3/16/2002
16
2.7 数据清洗方法
源系统 ETL服务器
1) 在源系统上进行清洗 (数据析取前)
3/16/2002
3
2.1 项目前期准备
业务探索



信息探索



逻辑数据
模型
主要任务:
– 项目启动会议(Kick-off Meeting) – 确认项目范围和主要目标 – 确认项目阶段性验收及总体验收标准 – 确认项目实施计划 – 成立项目组 – 确定各项目小组的成员及各自的工作职责 – 确定各项目小组的阶段性工作目标 – 确定教育训练计划 – 确定服务流程及方式
使用工具:
• ERWwin
交付项目:
➢ 物理数据模型(LDM) ➢ 《物理数据模型说明书》 ➢ 《数据库描述语言DDL》
建模方法:
• 第三范式 3NF • 星型结构 • 雪花状结构
3/16/2002
12
3/16/2002
2.6 数据模型的演变
概念数据模型( CDM – Conceptual Data Model )
系 统 体 系 结 构
元解
数据转换 数

据方
应用开发 管

理集
数据挖掘


服务
计 数据仓库管理
主要任务:
• 数据源及其特性定义 • 数据析取、转换和加载策略设计 • 构建和测试初始加载的程序和处理流程 • 构建和测试日常加载的程序和处理流程 • 40%的工作量在数据转换与加载上
使用工具:
• Teradata Builder、C、Shell、Perl
19
2.9 数据挖掘服务
1. 知识发现 (Knowledge Discovery): 发现将数据转变成信息的潜在模式
数据
知识
信息
决策 与行动
2. 知识应用(Knowledge Deployment): 将发现的知识应用于某种目标,例如进行预测
3/16/2002
20
2.9 数据挖掘方法
TeraMiner
Income>$40K
Yes
NO
Debt<10% of Income
Yes
NO
Debt=0%
NO
Yes
Good Credit Risks
Bad Credit Risks
Good Credit Risks
Teradata
Database
Data Mining & OLAP Assists
SQL
项目管理
2. 定义业务驱动力 3. 定义数据仓库成功的关键因素 4. 定义数据仓库的实施原则 5. 对系统体系结构各个组件进行详细设计
交付项目:
➢ 《系统体系结构设计说明书》
3/16/2002
10
3/16/2002
2.5 体系结构设计组件
▪ 用户类型 ▪ 拓扑结构 ▪ 网络存取与互连 ▪ 组织机构 ▪ 安全性 ▪ 数据体系结构
扩展逻辑数据模型 (ELDM - Extended Logical Data Model )
• 逻辑数据模型加(LDM Plus) : • 存取详细描述(Access Demographics) • 数据详细描述(Data Demographics)
物理数据模型 ( PDM - Physical Data Model )
使用工具:
• Teradata Metadata Service
❖ 逻辑非正则化
• 视图 (Views) • 逻辑星型结构 (Logical Star Schemas)
物理非正则化对模型的灵活性会有影响 逻辑非正则化是一个优选的方法(OLAP实现)
3/16/2002
14
2.6 物理数据模型(PDM)
3/16/2002
15
2.7 数据转换与加载(ETL)
物理数据 模型
物理数据库
设计 解
决 方 案 体 系 结
数据转换 元 解
数决
据方
应用开发
管案 理集

数 据 仓 库 评


数据挖掘


服务
数据仓库管理 (处理流程与操作)
解决方案支持
应用增强
逻辑数据 模型回顾 物理数据 库回顾
性能调整
容量规划
数据仓库的循环过程 2
二、项目具体实施步骤
物理数据模型
业务探索

元解
项 目
使用工具:
• 查询报表工具 • OLAP工具(Brio,Cognos,MicroStrategy…) • 基于Web的开发工具(InterDev,ColdFusion…) • 其他开发工具,如: Portal
交付项目:
➢ 《前端应用体系结构设计说明书》 ➢ 《应用模块设计说明书 》 ➢ 《用户使用手册 》
统 体
数据转换
数决 据方
前 期 准
信息探索
系 结 构
应用开发
管案 理集



逻辑数据

数据挖掘 服务
模型
数据仓库管理
项目具体实施步骤
1. 项目前期准备 2. 业务探索(Business Discovery) 3. 信息探索(Information Discovery) 4. 逻辑数据模型设计 5. 系统体系结构设计 6. 物理数据库设计 7. 数据转换加载ETL 8. 前端应用开发 9. 数据挖掘服务 10.元数据管理 11.数据仓库管理(处理流程与操作) 12.解决方案集成(测试验收与试运行)
交付项目:
➢ 《项目组织机构》 ➢ 《项目人员组成》
3/16/2002
4
2.2 业务探索(Business Discovery)
业务探索



信息探索



逻辑数据
模型
主要任务:
– 确定重点用户与数据源 – 用户需求调研与确认 – 数据源确认 – 用户需求和数据源的筛选和分析
交付项目:
➢ 《业务需求说明书BRL ( Business Requirement List )》 ➢ 《概念数据模型CDM ( Conceptual Data Model )》
18
物理数据 模型
系 统 体 系 结 构
元解
数据转换 数

据方
应用开发 管

理集
数据挖掘


服务
计 数据仓库管理
3/16/2002
2.8 前端应用开发
主要任务:
• 前端应用体系结构设计 • OLAP应用设计(Summary/Fact表及Cub的产生) • 前端应用开发(随机查询、预定义报表、 OLAP应用) • 撰写用户使用手册 • 用户测试验收
• 客户细分 • 市场细分
关联分析 Association
• 市场组合分析 • 套装产品分析 • 目录设计 • 交叉销售
神经网络 Neural Networks
相关文档
最新文档