商业智能知识点
曾鸣 商业智能20讲

曾鸣商业智能20讲曾鸣商业智能20讲第一讲:什么是商业智能商业智能(Business Intelligence,缩写为BI)是一种通过技术和工具来收集、整理、分析和展现企业内部和外部数据以及相关信息的过程。
它能帮助企业管理层做出更明智的决策,并提高企业的效率和竞争力。
1.1 商业智能的定义和背景商业智能是指利用数据分析技术、数据仓库和数据挖掘等手段,将海量的数据转化为有价值的信息,为企业管理层提供决策支持和业务洞察。
商业智能的发展背景是信息技术的快速进步和企业数据爆发式增长,以及对数据分析的需求不断增加。
1.2 商业智能的领域和应用商业智能的应用领域广泛,包括但不限于市场营销、供应链管理、客户关系管理、风险管理等。
通过商业智能,企业可以更好地了解市场趋势,优化业务流程,提高客户满意度,降低风险等。
第二讲:商业智能的组成和基础知识商业智能由多个组成部分构成,其中关键的组成部分包括数据仓库、数据集成、数据挖掘、数据可视化等。
2.1 数据仓库数据仓库是存储大量数据的集中式库,用于支持商业智能分析和决策。
数据仓库通常包括数据提取、转换、加载(ETL)等过程,确保数据的准确性和一致性。
2.2 数据集成数据集成是将来自不同源头的数据整合到统一的数据仓库中的过程。
数据集成可以通过ETL工具、API接口等方式进行。
2.3 数据挖掘数据挖掘是指通过对大量数据进行分析和探索,发现隐藏在数据背后的规律和模式。
数据挖掘可以帮助企业发现市场机会、评估风险、挖掘潜在客户等。
2.4 数据可视化数据可视化是指以图表、图像等形式展示数据结果和分析,以便更直观地理解数据和发现新的洞察。
数据可视化可以通过报表、仪表盘、数据图表等方式呈现。
第三讲:商业智能工具和技术商业智能工具和技术是支持商业智能实施的关键。
常用的商业智能工具和技术包括数据分析工具、数据可视化工具、数据挖掘工具等。
3.1 数据分析工具数据分析工具可以帮助企业对数据进行探索和分析,并提供各种算法和模型来支持决策制定。
bi基础知识 -回复

bi基础知识-回复BI基础知识: 了解商业智能商业智能(Business Intelligence,BI)是一个涵盖多个领域的概念,包括数据分析、数据可视化、报告和仪表板等。
它综合运用技术和工具来帮助企业从海量数据中提取有价值的信息,以支持决策制定和业务运营。
本文将从BI的定义、组成部分以及关键性步骤展开,详细介绍BI基础知识。
第一部分:商业智能的定义与概述1. 什么是商业智能?商业智能是指利用技术和工具来收集、整理、分析企业内外部数据,提供有意义的信息以支持决策制定和业务运营的一种智能化方法。
2. 商业智能的价值和意义商业智能可以帮助企业实现数据驱动的决策,并从中获得以下几方面的价值:- 改善决策质量:通过分析和可视化数据,帮助决策者深入了解企业状况,从而做出更明智的决策;- 提高工作效率:通过自动化数据收集和分析过程,减少人工工作量,节省时间和成本;- 发现商机或问题:通过挖掘数据中隐藏的模式和趋势,帮助企业发现新的商机或解决问题;- 优化业务流程:通过数据分析和报表,帮助企业识别业务流程中的瓶颈和改进机会。
第二部分:商业智能的组成部分1. 数据仓库与数据集成数据仓库是商业智能的基础,它是一个集成的、主题导向的、相对稳定的数据存储区域,用于支持业务智能分析和决策制定。
数据集成则是将来自不同数据源的数据整合到数据仓库中。
2. 数据清洗与转换数据清洗与转换是将原始数据进行清洗、过滤、整理和重构,以使其符合数据分析和报表的要求。
这一步骤包括数据去重、格式标准化、缺失数据填充等。
3. 数据分析与挖掘数据分析与挖掘是应用统计学和机器学习技术来发现数据中的模式、趋势和关联性。
常见的分析技术包括数据探索、预测分析、聚类分析等。
4. 可视化与报表可视化与报表是利用图表、图形和仪表板等方式将分析结果可视化呈现,以便于业务人员理解和使用。
这可以通过数据可视化工具或自定义开发实现。
第三部分:构建商业智能系统的关键步骤1. 确定业务目标和需求首先,明确商业智能系统的目标和需求,了解企业的业务需求和决策制定过程,以帮助指导后续的数据模型设计和分析内容。
最重要:商业智能复习提纲

业务数据库中错综复杂的抽取与访问将产生“蜘蛛网”现象,这样会带来很多的问题,诸如数据分析的结果缺乏可靠性、数据处理的效率很低、难于将数据转化成信息。
数据处理被分为操作型处理和分析型处理(或信息型处理)两大类。
操作型处理以传统的数据库为中心进行企业的日常业务处理。
分析型处理以数据仓库为中心分析数据背后的关联和规律,为企业的决策提供可靠有效的依据。
操作型系统的使用人员通常是企业的具体操作人员,处理的数据通常是企业业务的细节信息,其目标是实现企业的业务运营;而分析型系统的使用人员通常是企业的中高层管理者,或者是从事数据分析的工程师。
分析型系统包含的信息往往是企业的宏观信息而非具体的细节,其目的是为企业的决策者提供支持信息。
决策支持系统即DSS(Decision Support System)由3个层次的内容组成:数据仓库、联机分析处理(On-line Analytical Processing,OLAP)和数据挖掘(Data Mining,DM)。
作为商业智能系统中的核心部分,决策支持系统必须具备企业级的多维信息查询、OLAP在线分析处理、数据挖掘、预测等功能。
业务系统中提取的或者从外部数据源中导入的数据经过清洗、转化后成为数据仓库的原始数据,需要注意的是,它们是数据仓库数据的一部分,但不是全部。
由于需要数据仓库进行OLAP分析和数据挖掘,因此需要在原始数据的基础上增加冗余信息,比如进行大量的预运算,建立多维数据库,以求迅速的展现数据。
“元数据”就是描述数据的数据,它提供了有关数据的环境。
读者熟悉的可能是数据库系统的元数据,它包含数据库系统的所有存储信息、各个数据库和数据表中的字段信息、数据表之间的关联信息、数据索引约束等等。
数据仓库的元数据主要包含两类数据:第一种是为了从操作型环境向数据仓库环境转换而建立的元数据,它包括所有源数据项的名称、属性及其在提取仓库中的转化;第二种元数据在仓库中是用来与最终用户的多维商业模型和前端工具之间建立映射的,这种数据成为决策支持系统(DSS)元数据,它包括:(1)数据仓库中信息的种类、存储位置、存储格式;(2)信息之间的关系、信息和业务的关系、数据使用的业务规则;(3)数据模型;(4)数据模型和数据仓库的关系。
商务智能重点(大概整理)

题型:选择10*1分,单选10*1分,填空8*1分,计算4*9分,问答4*9分。
一、商务智能概述1.数据数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。
商务智能技术可以分析结构化数据、半结构化数据以及非结构化数据、静态的历史数据和动态数据流等各种类型的数据。
2.3.BI定义定义一:Business Intelligence is a process of turning data into knowledge and knowledge into action for business gain. (Data Warehouse Institute)标准定义:商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
4.商务智能的结构(1)商务智能的结构主要由两部分组成:数据仓库环境分析环境(2)商务智能主要由三种技术构成:数据仓库(Data Warehouse)联机分析处理(On-line Analysis,OLAP)数据挖掘(Data Mining)在三大技术支柱中,数据仓库是商务智能的基础。
联机分析处理(OLAP)是以海量数据为基础的复杂分析技术。
数据挖掘(Data Mining)是从海量数据中,提取隐含在其中的、人们事先不知道的但又可能有用的信息和知识的过程。
二、决策支持系统1.结构化:数据结构字段含义确定、清晰。
典型的如数据库中的表结构半结构化:具有一定结构,但语义不够确定典型的如HTML网页,有些字段是确定的(title),有些不确定(table) 非结构化:杂乱无章的数据,很难按照一个概念去进行抽取,无规律性2.DSS的产生背景电子数据处理——EDP(Electronic Data Processing)管理信息系统——MIS(Management Information Systems)决策支持系统——DSS(Decision Support Systems)(70年代中期提出)3.DSS的定义决策支持系统(DSS)是以管理科学,运筹学,控制论和行为科学为基础,以计算机技术,仿真技术和信息技术为手段,针对半结构化和非结构化的决策问题,支持决策活动的具有智能作用的人机系统.3.DSS 的构造DSS的构造研究主要解决DSS的组成问题,即组成DSS的部件。
商业智能BI介绍

商业智能BI介绍商业智能(Business Intelligence, 简称BI)是一种能够帮助组织利用数据分析和数据可视化的技术和工具。
通过将大量的数据集成、整理和分析,商业智能可以支持管理层做出决策、优化业务流程以及发现潜在的商业机会。
本文将介绍商业智能的定义、组成部分、应用场景、实施步骤和未来发展趋势。
一、商业智能的定义商业智能是一种通过使用数据分析和数据可视化工具来帮助企业管理层做出决策的技术。
商业智能的目的是将大量的数据整合、分析和可视化,以提供决策者所需的信息,帮助他们更好地了解企业的运营状况,并做出基于数据的决策。
二、商业智能的组成部分⒈数据源:商业智能系统需要从各个数据源中提取数据,这些数据源可以是企业内部的数据库、Excel文件、日志文件等。
⒉数据仓库:商业智能系统需要将数据存储在一个集中的数据仓库中,以便进行分析和查询。
⒊数据整合:商业智能系统需要将来自不同数据源的数据整合在一起,以便进行统一的分析和查询。
⒋数据分析:商业智能系统可以通过各种分析方法和算法对数据进行深入分析,以获取有关业务情况的洞察。
⒌数据可视化:商业智能系统可以将分析结果以图表、报表等形式展现出来,便于决策者理解和使用。
⒍决策支持:商业智能系统的最终目的是为决策者提供有关企业运营状况和业务机会的信息,帮助他们做出明智的决策。
三、商业智能的应用场景商业智能可以应用在各种不同的场景中,以下是其中一些常见的应用场景:⒈销售分析:通过分析销售数据和市场趋势,帮助企业了解产品销售情况和市场需求,从而制定合适的销售策略。
⒉客户分析:通过分析客户数据,帮助企业了解客户群体的特征和需求,以便进行定向营销和客户关系管理。
⒊运营分析:通过分析企业的运营数据,帮助企业优化生产流程、降低成本和提高效率。
⒋财务分析:通过分析财务数据,帮助企业了解财务状况、盈利能力和风险风险等关键指标。
⒌市场分析:通过分析市场数据和行业趋势,帮助企业了解市场竞争状况和未来发展趋势,从而制定市场战略。
商务智能考点内容

商务智能考点内容一、商务智能内容●数据仓库、数据挖掘、OLAP二、数据挖掘内容●算法、数据库技术、可视化技术、其他、机器学习、模式识别、统计分析三、知识包括什么●显性:规范化、系统化●隐性:个人思想和经验四、OTAP和OLAP区别●特征、面向、关注、功能五、数据仓库的特点●时变性、稳定性、决策支持、集成性、面向主题●主题以表存储,采用同一套编码规则、定时增加删除、实时捕捉快照、决策支持六、数据仓库流程●获取、管理、分析、展现七、数据仓库可运用于●投资组合分析、利润成本分析、资产分析八、元数据概念●是对于源数据的说明,包括名称、定义、来源、创建时间等九、数据仓库模型及联系和区别●物理模型、逻辑模型、概念模型●物理模型是逻辑模型在数据仓库中的实现十、粒度概念●粒度说明数据仓库中数据综合程度的高低。
●粒度越小,综合程度越小,可查询的种类越多;粒度越大,综合程度越高,查询的效率越高●粒度小的数据存储在低速存储器,粒度大的数据存储在高速存储器十一、OLAP概念●OLAP是针对特点问题的数据的联机访问和分析,它通过信息的可能的观察形式来进行快速的、稳定一致的、交互性的存取。
允许管理决策人员对数据进行深入观察。
十二、OLAP特点●快速性,5秒内对请求做出回应●可分析性,系统必须能够处理和应用有关的逻辑分析和统计分析●多维性,系统必须提供对数据的多维视图及分析●信息性,获得信息和管理信息十三、OLAP操作●对二维数据切片,三维数据切块●钻取,包括下钻和上卷●旋转十四、MOLAP特点●对数据进行预处理,性能好十五、MOLAP和ROLAP比较●MOLAP把多维实视图在概念上看成一个超立方体,物理上为一个多维数组,而ROLAP以表的形式存储实视图。
ROLAP更加灵活、节省空间,MOLAP在性能和管理上更加优越。
十六、数据仓库和数据库中数据的比较●数据仓库:长期框架、静态、定期更新、数据驱动●数据库:短期框架、快速变化、实时更新、事件驱动十七、BP神经网络训练步骤●分析业务问题●选择训练样本集,对输入值和输出值进行预处理●利用经验确定网络的拓扑结构,对神经元的权值和偏置进行初始化●利用反向传播等算法训练网络,逐渐缩小网络权值误差以达到最佳值●用测试集检查网络分类或预测质量●预测未知样本的分类十八、二元变量相异度计算●对称性:d(X1,X2)=b+c/a+b+c+d●非对称性:d(X1,X2)=b+c/a+b+c十九、支持度和置信度●多大可能购买集X中商品的顾客同时也购买集Y中商品二十、回归分析的步骤●确定自变量和因变量●绘制散点图,观察大致关系●求回归系数,建立回归模型●检验回归模型●预测未来情况二十一、Web挖掘概念●主要是处理文本、图形、图像等半结构化、非机构化数据。
商业智能系统构建知识点
商业智能系统构建知识点在当今数字化的商业世界中,商业智能系统已经成为企业决策支持和业务优化的重要工具。
它能够帮助企业从海量的数据中提取有价值的信息,洞察市场趋势,发现潜在的商业机会,以及优化业务流程。
那么,如何构建一个有效的商业智能系统呢?这其中涉及到许多关键的知识点。
一、数据仓库的设计与建设数据是商业智能系统的基础,而数据仓库则是存储和管理数据的核心组件。
在设计数据仓库时,需要充分考虑企业的业务需求和数据特点,确定合适的数据模型和架构。
常见的数据模型有星型模型和雪花模型,选择哪种模型取决于数据的复杂度和查询的性能要求。
数据仓库的建设过程包括数据提取、转换和加载(ETL)。
ETL 过程负责从各个数据源中抽取数据,并进行清洗、转换和整合,以确保数据的一致性和准确性。
在 ETL 过程中,需要处理数据的缺失值、异常值和重复值,同时进行数据的标准化和规范化。
二、数据治理与数据质量高质量的数据是商业智能系统成功的关键。
数据治理是确保数据质量的重要手段,它包括制定数据政策、数据标准和数据管理流程,明确数据的所有者、使用者和维护者的职责。
为了保证数据质量,需要进行数据监控和数据审计。
通过定期检查数据的准确性、完整性和一致性,及时发现和解决数据质量问题。
同时,建立数据质量评估指标体系,对数据质量进行量化评估,以便持续改进数据质量。
三、数据分析与挖掘技术数据分析是商业智能系统的核心功能之一。
常见的数据分析方法包括描述性分析、诊断性分析、预测性分析和规范性分析。
描述性分析用于总结和描述数据的特征,如数据的均值、中位数、标准差等。
诊断性分析则旨在找出数据中的问题和原因,例如通过关联分析和聚类分析来发现数据之间的关系。
预测性分析利用历史数据和统计模型来预测未来的趋势和结果,如时间序列分析、回归分析等。
规范性分析则在预测的基础上,为决策提供最优的行动方案。
数据挖掘技术则包括分类、聚类、关联规则挖掘等。
分类算法可以将数据分为不同的类别,聚类算法可以将相似的数据聚为一组,关联规则挖掘可以发现数据中隐藏的关联关系。
商业智能的基础知识和应用案例
商业智能的基础知识和应用案例商业智能(Business Intelligence,简称BI)是指以数据为基础,通过信息技术手段进行数据分析、挖掘和利用,实现企业的决策支持和业务优化,提高企业的绩效。
商业智能的应用范围广泛,涉及到企业管理、市场营销、金融投资等领域。
商业智能的基础构成包括数据仓库、数据挖掘、在线分析处理(OLAP)、报表分析和数据可视化等。
其中,数据仓库是商业智能的核心,它是指在企业内部进行的数据整合、清洗、结构化、存储和管理的过程,以满足企业的决策和分析需求。
数据挖掘是指在数据仓库中寻找有价值的信息,进行预测、分类和关联分析等,发现数据背后的隐含规律和知识。
OLAP是一种多维数据分析和查询工具,可以方便地进行数据切割、钻取和旋转等操作,以更直观、更高效地进行数据分析。
报表分析是指将数据以图表、列表、交叉表等形式进行呈现,以方便用户进行查看和理解。
数据可视化是通过图形化和可交互化的方式展示数据,可以帮助用户更加直观地理解数据的含义和价值。
商业智能的应用案例也很丰富。
在企业管理方面,商业智能可以帮助企业进行绩效评估、薪酬分析、人力资源管理等,以提高企业的效率和竞争力。
在市场营销方面,商业智能可以帮助企业进行客户分类、营销策略制定、销售预测等,以提高企业的营销效果和市场占有率。
在金融投资方面,商业智能可以帮助投资人进行股票分析、行情预测、投资组合管理等,以提高投资的收益和风险控制。
此外,在医疗、教育、政府等领域也都有广泛的商业智能应用。
以淘宝为例,其商业智能应用主要集中在数据仓库、数据挖掘和报表分析等方面。
淘宝通过数据仓库的建立和维护,实现对用户行为数据的采集、清洗和分析,从而为淘宝提供了充分的“数据资本”。
在数据挖掘方面,淘宝可以通过关联分析、分类和预测等方法,发现用户购买的偏好和趋势,提高商品的推荐和匹配效果。
在报表分析方面,淘宝可以通过各种图表和列表等形式,呈现用户行为数据和销售数据,以方便淘宝管理者进行实时的数据分析和决策。
商务智能复习资料(必读)
商务智能复习纲要第1章 商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字 信息:有用的数据 关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体,信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验--学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由 Gartner 公司的分析师Howard Dresner 首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念事物运动 数据 信息记录解释商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
软考重点-信息化知识(商业智能)章节重点
软考重点-信息化知识-5
商业智能
一、商业智能的基本概念
1.商业智能(BI):将组织中现有的数据转化为知识,帮助
组织做出明智的业务经营决策;
2.商业智能(BI):是数据仓库、OLAP和数据挖掘等技术
的综合运用;
二、商业智能的内容
1.商业智能的主要功能:
(1)数据仓库;
(2)数据ETL;
(3)数据统计输出(报表);
(4)分析功能;
2.商业智能的三个层次:
(1)数据报表;
(2)多维数据分析;
(3)数据挖掘;
3.在线事务处理(OLAP)的实现方法:根据存储数据的方
式不同可以分为ROLAP(基于关系数据库的OLAP)、MOLAP(基于多维数据组织的OLAP)、HOLAP(基于混合数据组织的OLAP);。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库的数据组织结构
在数据仓库中,数据被分成4种级别,分别是高度综合级、轻度综合级、当前细节级、早期细节级。
当前的数据总是首先进入当前细节级,然后根据应用的需求,通过预运算将细节数据聚合成轻度综合和高度综合级数据。
随着时间的推移,系统中的一些细节数据已经老化了,很少会被用户使用,此时为了节省系统的存储空间,可以将这些老化的细节数据导出到备份设备上,这就是早期细节级数据。
由于客户呼叫数据的数据量很大,并且数据仓库的使用者常常只关心近期的细节数据,因此我们可以在系统中只保存近期的细节数据,而将之前的详细数据导出到备份设备中。
对于高度综合的数据,由于其数据量已经很少,所以一般可以不考虑它们的导出问题。
总的来说,数据仓库的这种组织方式的核心思想是:在系统中保留最有可能被用户使用的数据,而用户很少使用的数据则备份出系统。
综合程度不同的数据其用途不同,在数据仓库中多重的数据粒度是必不可少的。
但是,由于数据仓库最主要的目的是反映企业的整体信息和DSS分析,回答综合程度较高的问题。
如果为了回答许多细节问题,而使系统的数据量极度膨胀,从而降低系统的运营效率,就背离了系统建设的初衷,这也是我们在数据仓库数据组织方式中说明的,对细节数据和综合数据采用不同策略的原因。
实际的工程项目中,我们可以将综合数据较高的数据存放在访问速率较高的磁盘上,而将细节数据定期导出到低速的磁带上。
从数据仓库中导出的数据仍然属于数据仓库,只是在存储介质上发生了改变。
如果这两个样本的数据特征不类似,则继续抽样。
等到抽样获得的样本5、样本6它们的数值特征非常地相似,则认为样本集合的数值特征类似,并且都同源数据具有类似的特征
数据分割能提高数据处理的效率。
如果数据库中的数据没有发生变化,则不需要对数据仓库进行追加。
数据追加只增加在上次数据输入后数据库中变化了的数据。
要完成数据追加的工作,最关键的是“捕捉”数据变化,并将数据的变化记录下来。
并不是日志文件中所有的信息都是必须的,通过分析日志文件可以减少工作量。
数据仓库的清理与普通系统中清理的含义有区别。
在普通的系统中,数据清理意味着将数据删除。
数据仓库系统中的清理并不是简单地删除,而是从细化级别的数据逐渐上升为高级综合度的数据,直到数据已经不再具备任何意义时被清除的过程。
投资回报率不但同回报金额有关,还同回报的时间有关。
投资回报率和投资回报周期是对投资回报的定量分析。
投资回报分析通过ROI(Return of Investment,投资回报率)和投资回报周期来衡量。
如果企业决定建立数据仓库,则需要进行技术选择分析。
瀑布式开发方法的优点是:如果需求确定,进行认真的系统分析和设计后,开发可以采用流水线的方式,效率很高。
在传统的操作型应用中,瀑布模型得到了广泛的应用。
因为操作型应用的需求常常是事先确定的,因此采用瀑布模型可以得到很好的效果。
瀑布模型取得良好效果的前提是需求确定。
在分析型应用中,情况同操作型应用大不相同:
(1)在最终用户还不了解DSS系统的基本概念或者对DSS系统还没有比较敏感的认识时,用户很难提出良好的需求。
(2)在最终用户对DSS系统有了一定的了解后,用户可能会提出非常庞大的问题;同时市场的需求以及决策者个人风格等诸多因素也是不断变化的,因此在DSS系统初步建立后,还需要不断地对其完善。
在为系统的初期阶段选择主题时,可以参考如下的几条原则:
(1)优先实施管理者目前最迫切需求、最关心的主题。
(2)优先选择能够在较短时间内发生效益的决策主题。
(3)推后实施业务逻辑准备不充分的主题。
(4)推后考虑实现技术难度大、可实现性较低、投资风险大的主题。
螺旋式开发通过不断扩大开发范围的方式来逐渐完善数据仓库系统,这种方式可以使项目的方方面面均从中受益。
(1)由于任务进行了阶段划分,企业能在比较短的时间内获得他们需要的一部分系统功能。
这些功能虽然还不非常完善,但是企业已经可以利用这些功能进行决策支持并从中受益。
螺旋式开发的思想是:越早让企业拥有决策支持系统(哪怕只是其中的一部分),企业就能越快从该系统受益。
(2)开发团体则以与企业建立信任关系的方式从中收益
由于每个阶段的任务相对较小,需要的开发时间较短,阶段成果能够在比较短的时间内获得。
随着交付使用的成功系统的数目不断增多,企业对开发团队的专业技能有更充分的肯定,企业投资者对项目和团队的信心也会增加。
(3)系统本身从中受益匪浅
开发团队在系统设计、开发、实现时获得的经验可以加入螺旋式开发方法后续的开发过程中,使得系统性能更加优越。
实践证明:螺旋模型适合数据仓库系统开发,螺旋式的方法已经成为数据仓库业内比较公认的开发策略。
1)用维表来记录多维数据库中的维度。
将多维数据立方体每一坐标轴上的各个取值记录在一张维表中, 这样对于一个n维数据,ROLAP中就存在n张维表。
2)用事实表来记录多维数据立方体各个维度的交点的度量值。
3)维表和事实表之间通过关系数据库中的外键来联系,我们使用维表和事实表以及它们之间的关联关系,就可以恢复出数据立方体。
模型对训练集的准确率越高越好。
错误
比较ROLAP和MOLAP的优劣势。
1)数据存取速度: ROLAP的响应时间较长,MOLAP在数据存取速度上占
优势。
2)数据存储的容量:ROLAP使用传统的关系型数据库的存储方法,在存储
容量上基本没有限制。
多维数据库通常使用平面文件的方式进行存放(这样访问速度快),因此受操作系统平台中文件大小的限制。
当数据量超过操作系统最大文件长度时,需要进行数据分割。
并且随着数量的增大,多维数据库进行的预运算结果将占用巨量的空间,此时可能导致“数据爆炸”的现象。
因此,多维数据库的数据量级难以达到太字节级。
3)并行处理能力:ROLAP是建立在传统数据库技术上的,可以充分利用现
有的并行计算的成果。
MOLAP是专为OLAP所设计的,支持多用户的读写操作,但是现有的并行计算成果需要进行调整后才能运用到MOLAP中。
4)多维计算的能力:MOLAP能够支持高性能的决策支持计算,而在ROLAP 中,SQL无法完成部分计算,并且ROLAP无法完成多行的计算和维之间的计算。
5)维度变化的适应性:MOLAP在多维数据库建立之后,如果要增加新的维度,则多维数据库通常需要重新建立。
ROLAP增加一个维度只是增加一张维表并修改事实表,系统中其它维表不需要修改,因此ROLAP对于维度的变更有很好的适应性。
6)数据变化的适应性:由于多维数据通过预综合处理来提高速度,当数据频繁地变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引,乃至重构多维数据库。
在ROLAP中预综合处理通常由设计者根据需求制定,因此灵活性较好,对于数据变化的适应性高。
7)软硬件平台的适应性:由于关系型数据已经在众多的软硬件平台上成功地运行,即ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。
8)系统培训与维护工作:ROLAP建立在关系型数据基础上,所以熟悉关系型数据库的ROLAP的使用人员可以很快的掌握ROLAP的操作。
MOLAP是比较新的技术,原先熟悉关系型数据的使用者通常还不熟悉MDDB,因此对于MOLAP系统,客户培训与维护工作比较多。