数据仓库设计的21条原则

合集下载

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)一、填空题1、SQL Server中数据完整性包括______、______和______。

2、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

3、____________和____________一起组成了安全性子系统。

4、采用关系模型的逻辑结构设计的任务是将E-R图转换成一组______,并进行______处理。

5、数据仓库创建后,首先从______中抽取所需要的数据到数据准备区,在数据准备区中经过净化处理______,再加载到数据仓库中,最后根据用户的需求将数据发布到______。

6、“为哪些表,在哪些字段上,建立什么样的索引”这一设计内容应该属于数据库设计中的______阶段。

7、在SELECT命令中进行查询,若希望查询的结果不出现重复元组,应在SEL ECT语句中使用______保留字。

8、在RDBMS中,通过某种代价模型计算各种查询的执行代价。

在集中式数据库中,查询的执行开销主要包括______和______代价。

在多用户数据库中,还应考虑查询的内存代价开销。

9、关系规范化的目的是______。

10、使某个事务永远处于等待状态,得不到执行的现象称为______。

有两个或两个以上的事务处于等待状态,每个事务都在等待其中另一个事务解除封锁,它才能继续下去,结果任何一个事务都无法执行,这种现象称为______。

二、判断题11、在数据库恢复中,对已完成的事务进行撤销处理。

()12、数据模型的核心构成要素是数据结构。

()13、概念模型是对现实世界的第二层抽象。

()14、全码的关系模式一定属于BC范式。

()15、在关系模式中,候选码可以有多个,主码只能有一个。

()16、在第一个事务以S锁方式读数据R时,第二个事务可以进行对数据R加S锁并写数据的操作。

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)一、填空题1、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

2、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

3、关系数据库中基于数学的两类运算是______________和______________。

4、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。

5、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

6、数据的安全性是指____________。

7、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

8、数据管理技术经历了______________、______________和______________3个阶段。

9、在SQL Server 2000中,某数据库用户User在此数据库中具有对T 表数据的查询和更改权限。

现要收回User对T表的数据更改权,下述是实现该功能的语句,请补全语句。

_____UPDATE ON T FROM User;10、____________和____________一起组成了安全性子系统。

二、判断题11、在一个关系中,不同的列可以对应同一个域,但必须具有不同的列名。

()12、并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。

()13、全码的关系模式一定属于BC范式。

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)一、填空题1、数据模型是由______________、______________和______________三部分组成。

2、对于非规范化的模式,经过转变为1NF,______,将1NF经过转变为2NF,______,将2NF经过转变为3NF______。

3、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

4、____________和____________一起组成了安全性子系统。

5、数据库管理系统的主要功能有______________、______________、数据库的运行管理以及数据库的建立和维护等4个方面。

6、数据库恢复是将数据库从______状态恢复到______的功能。

7、关系数据库中基于数学的两类运算是______________和______________。

8、____________、____________、____________和是计算机系统中的三类安全性。

9、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。

10、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

二、判断题11、在关系数据库中,属性的排列顺序是可以颠倒的。

()12、一个数据表只能有一个唯一索引。

()13、连接是数据库最耗时的操作。

()14、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。

()15、在SQL中,ALTERTABLE语句中MODIFY用于修改字段的类型和长度等,ADD用于添加新的字段。

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题4带答案

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题4带答案

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题带答案卷I一.综合检测题(共100题)1.下列选项中,模块凝聚程度最高的是()。

A.偶然凝聚B.时间凝聚C.功能凝聚D.逻辑凝聚2.管理信息系统投入运行后,根据用户提出的新需求,增加新功能,这属于系统的()。

A.完善性维护B.适应性维护C.纠错性维护3.外部实体模块有_____个。

4.一个企业的信息系统受到破坏后,会对企业或其他组织的合法权益产生损害,但不损害国家安全、社会秩序和公共利益,则该系统的信息安全等级为()。

A.第l级自主保护B.第2级系统审计C.第3级安全标记D.第4级结构化5.在一个E—R图中,包括3个实体集、一个1:n联系和一个m:n联系,则最终对应的关系模型应有()。

B.4个关系C.5个关系D.6个关系6.主要服务对象位于企业操作和执行层面的信息系统是()。

A.业务处理系统B.管理信息系统C.专家系统D.决策支持系统7.设计数据库在物理设备上的存储结构和存取方法的过程是()。

A.物理结构设计B.逻辑结构设计C.系统结构设计D.数据结构设计8.我国目前实行的信息安全等级保护制度分为()。

A.3级B.4级C.5级D.6级9.下列选项中,不属于管理信息特点的是()。

A.数据来源的广泛性B.信息价值的确定性C.信息资源的共享性D.信息形式的多样性10.检索供应商“红星机床公司”提供零件的工程号和工程名称;11.查询选修课程号为C1且成绩超过80分的学生姓名;12.我国“信息安全保护制度”分为5级,其中安全标记是()。

A.第2级B.第3级C.第4级D.第5级13.软件开发、工程建设等技术性因素会从哪些方面影响系统实施效果?15.TCP和UDP位于TCP/IP协议体系的()。

A.应用层B.传输层C.网络层D.网络接口层16.逆向测试17.将两个关系中相同的元组构成一个新关系的关系运算是()。

A.并B.差C.交D.投影18.为了防范系统的漏洞被黑客利用,及时设计和安装补丁程序,这种维护属于()。

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、在SQL语言中,为了数据库的安全性,设置了对数据的存取进行控制的语句,对用户授权使用____________语句,收回所授的权限使用____________语句。

2、如图所示的关系R的候选码为;R中的函数依赖有;R属于范式。

一个关系R3、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

4、SQL语言的数据定义功能包括______、______、______和______。

5、以子模式为框架的数据库是______________;以模式为框架的数据库是______________;以物理模式为框架的数据库是______________。

6、____________和____________一起组成了安全性子系统。

7、在一个关系R中,若每个数据项都是不可再分割的,那么R一定属于______。

8、在RDBMS中,通过某种代价模型计算各种查询的执行代价。

在集中式数据库中,查询的执行开销主要包括______和______代价。

在多用户数据库中,还应考虑查询的内存代价开销。

9、数据仓库创建后,首先从______中抽取所需要的数据到数据准备区,在数据准备区中经过净化处理______,再加载到数据仓库中,最后根据用户的需求将数据发布到______。

10、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。

二、判断题11、可串行化的调度一定遵守两段锁协议。

()12、有了外模式/模式映象,可以保证数据和应用程序之间的物理独立性。

()13、数据模型的核心构成要素是数据结构。

()14、数据库系统由软、硬件及各类人员构成。

()15、连接是数据库最耗时的操作。

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、在SQL Server 2000中,某数据库用户User在此数据库中具有对T 表数据的查询和更改权限。

现要收回User对T表的数据更改权,下述是实现该功能的语句,请补全语句。

_____UPDATE ON T FROM User;2、数据模型是由______________、______________和______________三部分组成。

3、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

4、数据的安全性是指____________。

5、如图所示的关系R的候选码为;R中的函数依赖有;R属于范式。

一个关系R6、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

7、某事务从账户A转出资金并向账户B转入资金,此操作要么全做,要么全不做,为了保证该操作的完整,需要利用到事务性质中的_____性。

8、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

9、数据库恢复是将数据库从______状态恢复到______的功能。

10、数据仓库主要是供决策分析用的______,所涉及的数据操作主要是______,一般情况下不进行。

二、判断题11、可以用UNION将两个查询结果合并为一个查询结果。

()12、在数据表中,空值表示不确定。

()13、在数据库恢复中,对已完成的事务进行撤销处理。

()14、在一个关系模型中,不同关系模式之间的联系是通过公共属性来实现的。

()15、数据模型的核心构成要素是数据结构。

()16、在SELECT语句中,需要对分组情况满足的条件进行判断时,应使用WHERE子句。

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

2、在SQL Server 2000中,新建了一个SQL Server身份验证模式的登录账户LOG,现希望LOG在数据库服务器上具有全部的操作权限,下述语句是为LOG授权的语句,请补全该语句。

EXEC sp_addsrvrolemember‘LOG’,_____;3、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

4、数据仓库主要是供决策分析用的______,所涉及的数据操作主要是______,一般情况下不进行。

5、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。

SELECT城市FROM作者表_____SELECT城市FROM出版商表;6、某事务从账户A转出资金并向账户B转入资金,此操作要么全做,要么全不做,为了保证该操作的完整,需要利用到事务性质中的_____性。

7、对于非规范化的模式,经过转变为1NF,______,将1NF经过转变为2NF,______,将2NF经过转变为3NF______。

8、在SQL Server 2000中,数据页的大小是8KB。

某数据库表有1000行数据,每行需要5000字节空间,则此数据库表需要占用的数据页数为_____页。

9、关系代数运算中,基本的运算是______________、______________、______________、______________和______________。

10、在SELECT命令中进行查询,若希望查询的结果不出现重复元组,应在SEL ECT语句中使用______保留字。

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)一、填空题1、SQL语言的数据定义功能包括______、______、______和______。

2、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

3、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

4、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

5、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。

6、主题在数据仓库中由一系列实现。

一个主题之下表的划分可按______、______数据所属时间段进行划分,主题在数据仓库中可用______方式进行存储,如果主题存储量大,为了提高处理效率可采用______方式进行存储。

7、设有关系模式R(A,B,C)和S(E,A,F),若R.A是R的主码,S.A是S的外码,则S.A的值或者等于R中某个元组的主码值,或者______取空值,这是规则,它是通过______和______约束来实现的。

8、____________、____________、____________和是计算机系统中的三类安全性。

9、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

10、“为哪些表,在哪些字段上,建立什么样的索引”这一设计内容应该属于数据库设计中的______阶段。

二、判断题11、连接是数据库最耗时的操作。

()12、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。

()13、DBMS提供授权功能控制不同用户访问数据的权限,主要目的是为了实现数据库的完整性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据仓库设计的21条原则:7个步骤,7个禁忌和7种思路(转)高效实现数据仓库的七个步骤数据仓库和我们常见的RDBMS系统有些亲缘关系,但它又有所不同。

如果你没有实施过数据仓库,那么从设定目标到给出设计,从创建数据结构到编写数据分析程序,再到面对挑剔的用户的评估,整个过程都会带给你一种与以往的项目完全不同的体验。

一句话,如果你试图以旧有的方式创建数据仓库,那你所面对的不是预算超支就是所建立的数据仓库无法良好运作。

在处理一个数据仓库项目时需要注意的问题很多,但同时也有很多有建设性的参考可以帮助你更顺利的完成任务。

开放思维,不断尝试新的途径,对于找到一种可行的数据仓库实现方法来说也是必需的。

1. 配备一个全职的项目经理或你自己全面负责项目管理在通常情况下,项目经理都会同时负责多个项目的实施。

这么做完全是出于资金和IT资源方面的考虑。

但是对于数据仓库项目的管理,绝对不能出现一人身兼数个项目的情况。

由于你所处的领域是你和你的团队之前没有进入过的领域,有关数据仓库的一切-数据分析、设计、编程、测试、修改、维护-全都是崭新的,因此你或者你指派的项目经理如果能全心投入,对于项目的成功会有很大帮助。

2. 将项目管理职责推给别的项目经理由于数据仓库实现过程实在是太困难了,为了避免自虐,你可以在当前阶段的项目完成后就将项目管理职责推给别的项目经理。

当然,这个新的项目经理一定要复合第一条所说的具有全职性。

为什么要这么做呢?首先,从项目经理的角度看,数据仓库实施过程的任何一个阶段都足以让人身心疲惫。

从物理存储设备的开发到Extract-Transform-Load的实现,从设计开发模型到OLAP,所有阶段都明显的比以前接触的项目更加困难。

每个阶段不但需要新的处理方法、新的管理方法,还需要创新性的观点。

所以将管理职责推给别的项目经理不但不会对项目有损害,还可以起到帮助作用。

3.与用户进行沟通这里所讲的内容远比一篇文章本身要重要的多。

你必须明白,在数据仓库的设计阶段,那些潜在用户自己也不清楚他们到底需要数据仓库为他们做什么。

他们在不断的探索和发现自己的需求,而你的开发团队也在和客户的接触中做着同样的事情。

更加频繁的与客户接触,多做记录,并让你的团队更关注于项目需求讨论的结果而不是讨论的过程本身。

既然你和客户的交流是为了了解存储的数据是何种类型以及如何有效存储数据,你也许需要(和你的用户一起)采用一种新的方法观察数据,而不是直接处理数据。

你可以尝试从中找出隐藏的信息,比如在一段时期内的数字涨落等。

不要试图追寻项目需求的答案,而是要让答案找上门来。

4. 以技术/信息库作为领导由于数据仓库实施的各个阶段都有很大不同,因此你需要有人能起到维持整个项目的连续进行的作用,不过这个职责并不需要那种全职性。

项目实施有三个重要方面:架构、技术和业务。

将架构作为重点可以保证在整个项目中,数据仓库的架构从物理层往上,都会受到良好的维护。

而我们应该将技术作为重点,因为开发团队和关键用户都在使用他们以前从未用过的工具,必须有人监督开发过程以及工具使用的一致性。

最后,在数据仓库的应用过程中浮现出来的业务需求必须被详细分析和记录,以促机开发过程持续下去。

如果用户不能很好的与开发人员以及其它用户沟通,那么数据分析和度量方面的开发进程就会延期,所以必须有人关注业务方面的开发,推动开发进入更高级别。

5. 跳出反复修改程序的陷阱第一次实现的数据仓库肯定不会是最终交付的版本。

为什么呢?实际上在真正见到产品前,你无法确定的知道自己的目标是什么。

或者说,最终用户只有在使用数据仓库产品一段时间后,才能明确告诉你这个产品是不是他所希望的。

与你以往处理的项目不同,业务智能还处于发展的初期,每个公司对业务智能都有不同的解释,因此你的项目决不会一次成功。

为了以正确的格式获得数据,你需要在不断变化的状况中摸索前进。

BI具有很强的个性,不同的环境、不同的市场以及不同的企业都有不同的BI。

这又代表什么呢?这表示你需要把数据库管理员放在一个消息相对封闭的环境中,不要让他知道数据仓库的数据结构以及ETL程序在不断的改变。

对此没有别的办法。

这样可以减轻你和DBA所承受的压力。

6. 对大量的前端资源进行数据源分析在数据仓库实现过程中,你不得不在旧有的数据中艰难跋涉,这些数据来自老的数据库、老的磁带机以及远程的数据。

它们中的大部分都凌乱不堪,并且难以获取。

你要对这些数据进行大量处理,并且还要设计ETL程序来寻找其中的有用信息。

如果你希望整个项目做起来比较顺利,并且找到一种方法能够一次成功,那就需要你的开发人员必须花费足够的时间来充分研究这些旧有数据,将凌乱的数据规则化,并尽力设计和实现强壮的数据采集和转换过程。

数据仓库的ETL部分会占用整个项目资源的百分之八十,所以一定要确定你的资源都用在刀刃上了。

7. 将人际关系处理放在首位在数据仓库实现过程中真正的地狱不是来自技术或者开发方面,而是来自你周围的人。

你也许会遇到一个对项目并不乐观而又没时间听你陈述的领导。

你也许会遇到一些开发人员将进度拖延太长时间还抱怨为什么不能用老方法实施。

你也许还会遇到一些抱有不切实际的幻想的用户,他们希望轻点鼠标就能实现想象中的功能,但却不愿在他们那边多做些智力投资,更好的培训他们自己的员工。

而你也已经疲惫不堪,鼓励投资,以及在开发团队和用户(甚至老板)中推广新的开发技巧。

总之你要保持微笑。

当一切搞定,你的烦恼也就一扫而空了,笑到最后才笑得最轻松。

数据仓库开发过程中的七个禁忌过去我们一直使用的OLTP技术也许隐藏着许多严重的缺陷。

数据仓库的实现并不是一个简单的任务,你会发现以前积累下来的丰富经验,并不适合处理每个数据仓库的独特需求。

下面列出的条款是你在实现数据仓库过程中一定会面对的问题,其中一些看起来并没有想象中那么严重,但是你还是应该尽量避免出现类似问题。

数据仓库并不是一个事务处理系统,它没有一定的标准也不会实现某个特定的应用,但它本质上是非常有组织性的。

总之,每个公司所建立的数据仓库都是唯一的,并且每一次数据仓库的实现方法都不是一成不变的。

在实现数据仓库时需要注意的不单是"应该如何作",更要注意"不该如何做"。

下面就是我们总结的七点"不该如何作"。

1.不要编写自己无法快速修改的代码你所要编写的程序主要用于数据分析,而不是处理事务。

而你的用户也并不真正知道他们自己真正想要一个什么样的程序。

因此你不得不反复修改代码好几次,才会明白用户到底需要一个什么样的程序。

如果你编写的程序具有良好的结构和灵活性,就算需要修改也不会太浪费力气。

反之,你会被自己累死。

2. 不要使用无法修改的数据库访问API在过去,你的数据库可以为大量的客户提供稳定的数据查询服务。

而如今,你的程序必须能够应付更多的数据查询。

这使得重新改写程序以使得每个查询请求能得到最大的数据量成为势在必行的工作,而一般来说这种代码修改都不会一次成功,所以只有选择合适的可以修改的API,才能使程序尽快适应新的需求。

3. 不要设计任何无法扩展的东西在联机处理过程(OLTP)应用中,数据分析并不是一个真正的应用程序。

实际上,数据分析的关键是获取大量旧的数据,从中提取数据模型,并以此模型推断出新的信息。

而你所编写的访问潜在信息的代码应该具有可扩展性,可以附加新的数据。

千万别在支持数据分析的代码中假定数据都是固定格式的。

4. 不要附加不必要的功能一个仓库要做的是恰到好处的服务,用户走进仓库,从货架上取得自己所需得信息,仅此而已。

由于业务智能、分析以及规律性的问题都有各自的处理程序,因此你的客户唯一的需要就是获取信息。

他们需要一种应用环境,可以让他们快速的从数据仓库中取得分析过程所需的数据,而不论这个数据是什么样子的。

也许你想帮助他们精炼一下获得的数据,但最好不要这么做。

一定要记住,不要给客户的数据分析程序添加任何会影响数据访问性能的功能。

5. 不要简化数据清除和数据源分析的步骤在实现数据仓库过程中最应该注意的地方就是为Extract-Transform-Load机制分析数据源,以及为优化负载而清除数据。

安全的做法是假设项目经理在这个阶段会需要整个项目资源的一半以上。

相反,如果你在这方面进行了简化,稍后肯定会后悔。

所以就算系统工作缓慢,也不要简化清理旧的数据的过程。

6. 不要避免颗粒度和分区问题在数据仓库设计过程中有两个最大的数据存储问题,第一是如何给转换数据定位一个恰当的颗粒度等级,第二是如何将数据绝对的分区。

为什么这两点问题如此重要呢?因为整个数据仓库的响应能力受颗粒度影响,并且数据访问的效率直接与数据分区性能有关。

因此这是具有关键性的工作,不要试图避免面对这些问题。

7. 不要在没考虑业务问题前就使用OLAP用户在亲眼见到程序前通常都不知道自己到底想要个什么样的程序。

因此他们的观点有不少错误,比如他们希望分析结果会忠实反应性能度量,或者希望程序会使他们部门或公司的业务工作有所不同。

而你必须跳出自己的职责范围,从IT管理者的角度考虑用户部门直至整个企业的运行方式,才能在开发过程中避免这类问题。

在通常的OLTP开发中,你可以比较方便的理解业务流程。

而在联机分析处理(OLAP)领域,任何事情都需要亲自考察,而在你周围工作的人也许并不会发现你对业务方面存在的误解。

因此,不要自以为已经了解了足够的信息。

不断的询问才能使你真正了解"业务智能"中的"业务"到底是什么样子的顺利开发数据仓库的七种思路对于大多数IT顾问来说,实现一个数据仓库的难度比以前做过的任何项目难度都要大。

考虑到不同的数据结构、用途以及应用程序开发方法,以前所积累的经验和技巧大部分都无用武之地了。

但是只要在你的前进道路上稍加修正,你就会发现实现一个数据仓库并不是难事,就算你是第一次实现数据仓库也没问题。

下面列出了数据仓库实施过程需要考虑的步骤,有一些你可能从来没有意识到,而另一些可能已经在实施过程中使用到了,但是重新思考一番也许你会有更多的领悟。

开放思维,不断尝试新的途径,找到一种可行的数据仓库实现方法。

1. 再三考虑应用程序的实现方法数据仓库并不涉及事务处理,并且在报表方面也仅占一小部分。

而数据仓库应用程序的本质是分析,尤其是针对业务智能的分析。

BI并不是通常所说的数据:它是一种从旧有数据中,模型化得到的新的数据。

那么如何才能从旧有数据中挖出这些新数据呢?事实上,这个工作不是让你来完成的,而是你的客户所要完成的。

从项目主管的角度看,应该有一个经验丰富的数据表格设计师与你合作,进而决定如何将各类程序融合在一起。

其中所遇到的最主要的挑战将是如何用新的方法观察数据,这也是你的客户正在试图使用的方法。

相关文档
最新文档