数据仓库逻辑模型试题
(完整版)数据仓库架构师笔试题

数据仓库架构师笔试题1、请简述下什么缓慢变化维,以及通过设计怎样解决缓慢变化维的问题。
参考答案:这道题是数据仓库的基础知识题,能答对答全的基本可确定对方有一定的数据仓库开发和设计经验。
1)2、请简述下数据仓库一般有哪两种设计模式,以及这两种设计模式的优缺点。
参考答案:这题属于简单的基础知识题。
其解题思路如下:1)能准确说出雪花模型和星型模型这两个模型的,算及格。
2)能描述出雪花模型和星形模型分别是怎样一种模型,比如星型模型是维度与事实表直接关联,不存在多层维度的结构,而雪花模型层了维度表保持三范式或准三范式设计外其它与星形模型一样的,最好能用图例画出来的,得90分。
3)能够说出雪花模型和星形模型的优缺点的,其中星形模型减少了关联,用空间换时间,性能更优,雪花模型结构更清晰,维护更方便,但性能差一些。
通常的数据仓库建设都是两者的混合模式存在。
得满分。
3、请简述下自己做过的项目中用过那些实体,以及各实体间的关系,并将实体中的一些核心属性列出来。
参考参考:这道题没有标准答案,根据各自项目的情况有不同答案,首先面试者必须将项目中的关键实体、实体属性,以及实体间的关系描述出来。
另外可以通过对方的描述,了解对方在对所做项目的了解程度,在项目中承担的角色和作用,以及对方的语言沟通能力。
4、7、请简述下在实体关系是1对1,1对多,多对多的情况下,怎么去设计表来记录两个实体之间的关系,可举例说明。
参考答案:本题算是一道相对简单的设计基础题,如果这题答不出来,基本确定没什么数据库设计经验,并且作为开发人员对数据库结构的了解也是很有限的。
解题思路如下:1)1对1关系可以将其中一个表的主键带到另一个表中,以便于关联查询。
2)1对多关系只能将前者的主键带在后者的表中,不能反过来。
比如学校和班级表,只能表学校的标识放在班级表中,而不能反过来。
3)多对多关系则必须在两者之间额外创建一张中间表(一般叫交叉表),这个答案才是最关键的答案,没答对这个,基本可以判定不及格。
数据库题库含参考答案

数据库题库含参考答案一、单选题(共98题,每题1分,共98分)1.在数据库应用系统生命周期模型中,规划与分析阶段的输出结果不包括()。
A、项目计划书B、需求规范说明书C、可行性分析报告D、系统范围与边界正确答案:B2.下列哪些属性不适合建立索引?()。
A、经常岀现在GROUP BY子句中的属性B、经常参与连接操作的属性C、经常出现在WHERE子句中的属性D、经常需要进行更新操作的属性正确答案:D3.下列属于数据仓库特点的是()。
A、一次处理的数据量小B、综合性和提炼性数据C、面向操作人员,支持日常操作D、重复性的、可预测的处理正确答案:B4.下述哪一个SQL语句用于实现数据存取的安全机制()。
A、COMMITB、ROLLBACKC、GRANTD、CREATE TABLE正确答案:C5.有教师表(教师号,姓名,职称.所在系)和授课表(教师号,课程号,授课学年,授课时数),同一门课程可由多个教师讲授,同一个教师也可讲授多门课程,査询从未被“教授”讲授过的课程的课程号,正确的语句是()。
A、SELECT课程号FROM授课表a JOIN教师表bON a 教师号=b.教师号WHERE职称!='教授'B、SELECT课程号FROM授课表a RIGHTOUTTER JOIN教师表bONa.教师号=b.教师号C、SELECT课程号FROM授课表WHERE课程号NOT IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!='教授')D、SELECT课程号FROM授课表WHERE课程号IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!=,教授,)正确答案:D6.下列有关范式的叙述中正确的是()。
A、如果关系模式RG 1NF,且R中主属性完全函数依赖于码,则R是2NFB、如果关系模式RG3NF, X、YCU,若X—Y,则R是BCNFC、如果关系模式ReBCNF,若X一一Y (Y4X)是平凡的多值依赖,则R 是4NFD、—个关系模式如果属于4NF,则一定属于BCNF;反之不成立正确答案:D7.下列说法正确的是( )。
数据模型决策期末考试试题

数据模型决策期末考试试题### 数据模型决策期末考试试题#### 一、选择题(每题2分,共20分)1. 以下哪项不是数据模型的组成部分?A. 数据结构B. 数据操作C. 数据存储D. 数据分析2. 在数据库设计中,规范化的目的是什么?A. 提高查询速度B. 减少数据冗余C. 增加数据安全性D. 降低存储成本3. 以下哪个是关系数据库管理系统(RDBMS)的特点?A. 支持非结构化数据B. 支持多用户并发访问C. 只支持单一数据类型D. 数据存储在单一文件中4. 数据仓库与操作型数据库的主要区别是什么?A. 数据仓库主要用于数据存储B. 数据仓库主要用于数据挖掘和分析C. 数据仓库使用关系模型D. 数据仓库不支持SQL查询5. 在数据建模中,实体-关系图(ER图)的主要作用是什么?A. 描述数据的存储方式B. 描述数据的逻辑结构C. 描述数据的物理结构D. 描述数据的访问权限#### 二、简答题(每题10分,共30分)1. 简述数据库的三种主要范式,并说明它们各自的作用。
2. 解释什么是维度建模,并举例说明其在数据仓库中的应用。
3. 描述数据挖掘与数据分析的主要区别,并给出数据挖掘的一个实际应用场景。
#### 三、论述题(每题25分,共50分)1. 论述数据模型在企业决策支持系统中的作用,并举例说明如何通过数据模型辅助决策制定。
2. 论述大数据时代下,数据模型设计面临的挑战及应对策略。
#### 四、案例分析题(共30分)背景材料:某电子商务公司希望利用其庞大的用户数据来优化产品推荐系统。
请分析以下问题:1. 如何构建一个有效的用户行为数据模型来支持个性化推荐?2. 在构建数据模型时,需要考虑哪些关键因素?3. 描述如何通过数据模型来评估推荐系统的效果,并提出改进建议。
#### 五、开放性问题(共20分)请设计一个数据模型,用于支持一个在线教育平台的课程推荐系统。
考虑以下因素:1. 用户特征2. 课程属性3. 用户与课程的交互数据4. 推荐系统的反馈机制请在设计中详细说明数据模型的结构、关键属性以及推荐逻辑。
数据仓库架构与建模考试

数据仓库架构与建模考试(答案见尾页)一、选择题1. 数据仓库的架构通常分为哪几个层次?A. 持久层B. 逻辑层C. 物理层D. 应用层2. 在数据仓库中,以下哪个不是常用的数据建模工具?A. Erwin Data ModelerB. IBM Data ArchitectC. Microsoft VisioD. Oracle SQL Developer3. 在数据仓库中,以下哪个不是维度表的特点?A. 通常包含事实表中的度量值B. 包含描述性信息C. 通常是静态的D. 用于支持复杂的查询分析4. 在数据仓库中,以下哪种类型的建模技术最适合于分析型应用?A. 星型模型B. 事实星座模型C. 雪花模型D. 星型雪花模型5. 在数据仓库中,以下哪个不是ETL(提取、转换、加载)过程中的步骤?A. 提取B. 清洗C. 转换D. 压缩6. 在数据仓库中,以下哪个是维度表的设计原则?A. 尽可能少地包含数据B. 尽可能多地包含数据C. 保持数据冗余D. 保持数据一致性7. 在数据仓库中,以下哪个是事实表的设计原则?A. 尽可能少地包含数据B. 尽可能多地包含数据C. 保持数据冗余D. 保持数据一致性8. 在数据仓库中,以下哪个是雪花模型与星型模型的主要区别?A. 维度表的分布方式B. 事实表的分布方式C. 星型模型的中心化程度D. 雪花模型的规范化程度9. 在数据仓库中,以下哪个是主键与外键的主要区别?A. 主键用于唯一标识记录,外键用于建立表之间的关系B. 主键用于建立表之间的关系,外键用于唯一标识记录C. 主键和外键都用于唯一标识记录D. 主键和外键都用于建立表之间的关系10. 在数据仓库中,以下哪个是数据治理的主要目标?A. 确保数据的质量和准确性B. 提高数据处理的效率C. 减少数据冗余和不一致性D. 优化数据存储和备份策略11. 数据仓库的主要目的是什么?A. 存储原始数据B. 提供数据分析和报告功能C. 用于数据挖掘和机器学习D. 所有以上选项12. 在设计数据仓库时,以下哪个层次结构最适合存储历史数据?A. 事实层B. 维度层C. 汇总层D. 应用层13. 在数据仓库中,以下哪个术语描述了用于分析数据的模式?A. 实体B. 属性C. 关系D. 记录14. 在数据仓库中,以下哪个工具不是用于数据分析和报告的?A. 查询语言(如SQL)B. 数据可视化工具C. 数据仓库建模工具D. 数据库管理系统(DBMS)15. 在数据仓库中,以下哪个维度通常与客户相关?A. 时间B. 市场细分C. 产品D. 销售渠道16. 在数据仓库中,以下哪个过程不是数据仓库生命周期的一部分?A. 数据抽取B. 数据清洗C. 数据转换D. 数据删除17. 在数据仓库中,以下哪个步骤不是数据建模过程中的步骤?A. 概念设计B. 逻辑设计C. 物理设计D. 数据加载18. 在数据仓库中,以下哪个技术用于将多个表中的数据组合成一个视图?A. 连接B. 视图C. 索引D. 分区19. 在数据仓库中,以下哪个策略用于确保数据的质量和准确性?A. 数据验证B. 数据清理C. 数据备份D. 数据归档20. 在数据仓库中,以下哪个指标是用于衡量数据仓库性能的?A. 查询响应时间B. 数据存储容量C. 数据传输速度D. 计算资源利用率21. 在数据仓库中,以下哪个层次的结构是从下到上逐渐抽象的?A. 事实层、维度层、业务层B. 业务层、维度层、事实层C. 维度层、事实层、业务层D. 业务层、事实层、维度层22. 在数据仓库的建模过程中,以下哪个术语描述了事实表中的关键属性?A. 主键B. 外键C. 代理键D. 候选键23. 在维度建模中,以下哪个维度通常包含时间信息?A. 时间维B. 地点维C. 产品维D. 客户维24. 在构建数据仓库时,以下哪项不是常用的ETL(抽取、转换、加载)工具?A. Informatica PowerCenterB. Microsoft SQL Server Integration Services (SSIS)C. Apache NiFiD. Oracle Data Integrator25. 在数据仓库中,以下哪种类型的查询通常涉及复杂的聚合和计算?A. 交互式查询B. 批量查询C. 连续查询D. 以上都不是26. 在维度建模中,以下哪个步骤不是必要的?A. 概念设计B. 逻辑模型设计C. 物理模型设计D. 数据仓库实施27. 在数据仓库中,以下哪个选项是维度表的设计原则?A. 尽可能少地包含属性B. 尽可能多地包含属性C. 属性必须是可量化的D. 属性可以是非量化或半量化的28. 在数据仓库中,以下哪个工具通常用于验证数据质量和完整性?A. 数据清洗工具B. 数据验证工具C. 数据转换工具D. 数据存储工具29. 在数据仓库中,以下哪个层次是用于存储实际数据的?A. 物理层B. 逻辑层C. 事实层D. 业务层30. 在数据仓库中,事实表通常包含哪些关键字段?A. 序列号B. 日期/时间戳C. 统计指标(如销售额)D. 实体键31. 以下哪个选项不是数据仓库的分层架构的一部分?A. 物理层B. 服务层C. 汇总层D. 逻辑层32. 在数据仓库建模中,常用的粒度级别有哪些?A. 业务单元B. 细粒度C. 中粒度D. 宽粒度33. 下列哪种类型的数据库常用于数据仓库中?A. 关系型数据库B. 非关系型数据库C. 图数据库D. 列存储数据库34. 在数据仓库中,星型模型和雪花模型有哪些主要区别?A. 星型模型的维度通常直接连接到事实表B. 雪花模型通过多个事实表和维度表进行建模C. 星型模型的维度和事实表是物理上分离的D. 雪花模型更适用于大数据集35. 在数据仓库设计中,平衡事实和维度的重要性意味着什么?A. 确保维度数据的质量和完整性B. 减少事实表中的记录数量C. 平衡查询性能和数据冗余D. 优化数据仓库的扩展性36. 数据仓库中的ETL过程是指什么?A. 数据提取B. 数据转换C. 数据加载D. 数据集成37. 在数据仓库中,索引的主要作用是什么?A. 提高查询性能B. 增加数据冗余C. 降低数据完整性D. 减少数据量38. 在数据仓库中,事实表通常包含哪些维度?A. 时间B. 地点C. 产品39. 数据仓库中的维度表通常包含哪些属性?A. 属性值B. 维度描述C. 维度关键字D. 以上都是40. 在数据仓库中,星型模型和雪花模型有什么区别?A. 星型模型的维度表不包含聚合B. 雪花模型可以减少数据冗余C. 星型模型的事实表包含聚合D. 雪花模型更容易理解41. 在数据仓库中,哪个层次的结构包含了业务需求和数据需求?A. 企业级数据仓库B. 数据集市C. 物理数据仓库D. 以上都不是42. 在数据仓库中,如何确保数据的准确性和完整性?A. 使用主键和外键约束B. 进行数据验证和清洗C. 实施数据备份和恢复策略D. 以上都是43. 数据仓库中的数据冗余是如何产生的?A. 数据在多个地方重复存储B. 数据在不同系统间传输C. 数据从源头处就不一致D. 数据在进行聚合操作时产生44. 在数据仓库中,如何优化查询性能?B. 改变数据分区方式C. 使用更复杂的查询语句D. 以上都是45. 在数据仓库中,如何进行数据安全和隐私保护?A. 加密敏感数据B. 设置严格的访问权限C. 使用数据脱敏技术D. 以上都是二、问答题1. 什么是数据仓库?请简述其核心特点。
3-3数据仓库设计-逻辑模型

数据的行数 数据所占存储设备空间 数据所需要的索引空间
只能做数据级上的估算 从一方或多方收集信息进行合理估算
粗略估算数据量算法
双重粒度和单一粒度
表的行数是影响粒度划分主要的因素 将数据库的总行数与下表进行比较
确定粒度的循环和反复
选择合适的粒度级别是体系结构设计环境成功 的关键。 选择粒度级别的一般方法,是利用常识,建立 数据仓库的一小部分,并让用户去访问这些数 据。然后仔细聆听用户的意见,根据他们的反 馈意见适当调整粒度的级别。 最坏的想法是想要事先设计好所有的粒度级别, 再进行数据仓库的建造。 即使在最好的情况下,能使设计的5 0 %是正 确的就已经很不错的了。数据仓库环境的特点 就是只有当决策支持系统分析员实际看到了报 告之后,才能想像哪些是真正需要的。
……
… …
……
……
数据概括表与事实表对应关系
概括表表.列 名 是否 导出 事实表.列 名 SPGYB.SP 商品编号 _ID SPGYB.G YS_ID 供应商编号 备注 SPGKB.SP_I 否 D SPGKB.GYS _ID SPGKB.SPG YZSL SPGKB.SPG YZJE …… 否 是 是
例: 银 行 粒 度 设 计
例: 银 行 粒 度 设 计
数据分割
数据分片概念
水平分片 垂直分片 混合分片 导出分片
按时间进行数据分割是最普遍的 分割标准
数据量 数据分析处理的实际情况 简单易行 粒度划分策略
数据仓库的数据抽取模型
F2 KHCG F3 SPQK F4 ZGYJ
F1 数据抽取规则
确定粒度的循环和反复
提高粒度的方法
当源数据置入数据仓库时,对它进行汇总。 当源数据置入数据仓库时,对它求平均或进行 计算。 把最大/最小的设定值置入数据仓库。 只把显然需要的数据置入数据仓库。 用条件逻辑选取记录的一个子集置入数据仓库。 对于数据怎样轻度汇总是没有限制的(限制只 存在于设计者的脑海里)。
常州大学《数据仓库原理与实现》2023-2024学年第一学期期末试卷

常州大学《数据仓库原理与实现》2023-2024学年第一学期期末试卷《数据仓库原理与实现》考试内容:《数据仓库原理与实现》;考试时间:120分钟;满分:100分;姓名:——;班级:——;学号:——一、填空题(每题3分,共30分)1. 数据仓库是一种面向企业级数据分析的数据库系统,其主要目的是整合并存储企业各个业务系统的数据,形成一个统一的数据存储平台,以支持企业各级领导和业务人员的数据分析和决策。
2. 数据仓库系统的体系结构包括_____、ETL、_____、OLAP和前端工具等几个部分。
3. 数据的独立性包括数据的物理独立性和数据的_____。
4. 数据的物理独立性是指当数据的存储结构(或内模式)改变时,通过系统内部的自动映象功能或转换功能,保持了数据的全局逻辑结构(或模式)不变。
5. 数据仓库共有四个特性,分别是面向主题、集成的、_____和随时间变化。
6. 分布式数据库最基本的三个特征是:非集中式管理、_____和本地自治。
7. 关系数据模型的基本数据结构是_____。
8. SQL语言具有对数据的定义、_____、操纵和控制等四个方面的功能。
9. 数据模型由三部分组成:数据结构、数据操作和_____。
10. 在UML中,通信图主要用于描述对象在空间中如何交互,即除了动态交互,它也直接描述了对象是如何链接在一起的。
二、单项选择题(每题2分,共20分)1. 下列哪项是长期存储在计算机内的有组织,可共享的数据集合?A. 数据库管理系统B. 数据库系统C. 数据库D. 文件组织2. SQL语言中授权的操作是通过哪个语句实现的?A. CREATEB. REVOKEC. GRANTD. INSERT3. 下列聚合函数中不忽略空值(null)的是?A. SUM(列名)B. MAX(列名)C. COUNT(*)D. AVG(列名)4. 位于用户与操作系统之间的一层数据管理软件是?A. 数据库管理系统B. 数据库系统C. 数据库D. 数据库应用系统5. 分布式数据库系统中,下列哪个特征表明数据可以在不同地理位置上分布?A. 集中式管理B. 高可用性C. 本地自治D. 非集中式管理6. 关系数据模型的基本数据结构是?A. 索引B. 关系C. 数据项D. 数据源7. 下列哪个选项不属于数据库的特点?A. 数据共享B. 数据独立性高C. 数据冗余很高D. 数据完整性8. 在数据库系统中,元数据是指?A. 数据结构的描述B. 数据的来源C. 基本数据D. 数据项的描述9. 关系数据库实现数据之间联系的方法是?A. 候选码B. 外码C. 超码D. 索引10. 下列哪个阶段的主要任务是调查和分析用户的应用需要,为概念结构设计做好充分准备?A. 需求分析B. 逻辑设计C. 物理设计D. 运行设计三、简答题(每题10分,共30分)1. 解释数据仓库的主要特点和功能。
数据仓库-期末考试复习题

复习思考题(重点)一、单项选择题(1) 一般信息管理中,采用哪种方式的概念模型最多A. MapReduce模型B. 实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A. 身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(4)多维切片是指:A.在多个维度上观察全员操作B.多个成员的操作片段C.旋转数据集的部分维度D.在线分析或联机分析(5) 一般信息管理中,采用哪种方式的分布式物理模型最多A. MapReduce模型B. 实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?A. 客户信用程度B.银行卡行号C.加密的身份证号D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(8)多维报表是指:A.在多个维度上观察全员操作B.不同维度格式不同叠加展示C.旋转数据集的部分维度D.在线分析或联机分析(9)数据表的多维索引的作用是:A.使数据表更节省存储空间B.加快数据存储速度C. 表格格式美观大方 C. 加快数据查找效率(10)MapRedude结构中的MAP职能是?A.钻取B.汇聚C.分发D.结晶(11)下列哪种客户需求可以直接成为数据仓库的多维报表?A.客户销售业绩清单B.客户基本名册C.客户关系图表D.客户反馈信息(12) 数据仓库开发强调哪种主体特征?A. 信息安全性B.业务流程C.操作事务性D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:A.空间换时间B.数据范式更严格C.冗余度更小 C. 更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?A.存储能力B.展示能力C.稳定性能力D.安全性能力(15)OLAP的系统结构分为:A.胖客户端系统和瘦客户端系统B. OLAP服务器和多维数据存储C. OLAP服务器和传输分析处理后结果 C. 多维数据存储和分析处理后结果(16)MapRedude结构中的Reduce职能是?A.钻取B.汇聚C.分发D.结晶(17)下列哪种信息不能直接成为数据仓库的元数据?A.客户姓名的格式B.客户基本信息C.客户关系图D.客户反馈法则(18) noSQL数据库更强调哪种特征?A. 不兼容SQL命令B.非关系结构C.非事务性D.分布式计算(19)下列哪种关于数据仓库开发的观点是错误的?A.数据仓库开发的初期不能确定客户需求B.数据仓库开发过程是循环往复的C. 数据仓库开发不以客户需求为中心 C. 数据仓库开发是从基础数据出发的(20)客户关系图表属于下列哪种模型的范畴?A.概念模型B.物理模型C.逻辑模型D. Odoo模型(21)C/S网络结构中的C表示:A.瘦客户B.客户C.客户端D.直连线路(22)CRM的含义是:A.企业级数据仓库B.客户关系管理C.客户群D.决策管理系统(23)企业中对含义不一致的信息进行纠正的操作,叫做:A.数据清洗B.数据冗余C.数据降维D.数据转置(24)数据库高级管理员的职责不包括:A.输入业务数据B.设置操作员角色C.设置业务套账 B.系统数据备份(25)数据仓库按照不同的主体进行组织,可形成A.数据聚类B.数据分布C.数据集市D.数据链路(26)数据聚类中的聚簇中心是:A.事先拟定的B.搜索的目标C.动态产生的D.数据主题(27)数据代码要解决的主要问题是:A.节约信息存储空间B.解决名称混乱问题C.信息格式整齐D.方便排序(28)数据仓库中,下列哪种说法错误?A.消灭冗余,才能提高效率B.稳定性比集成性重要C.集成性直接提高系统的冗余度D. 稳定性促进高效率(29)数据粒度是指:A.数据处理的分割单位B.数据采集的单元C.数据抽样的单位D.数据记录的大小二、名词(1)数据仓库(2)SQL(3)OLAP(4)noSQL(5)DSS(6)支持度(7)大数据(8)E_R图(9)逻辑模型(10)O2O(11)MIS(12)关键字索引(13)数据颗粒度(14)元数据(15)数据连接(16)数据颗粒度(17)概念模型(18)数据挖掘(19)聚类(20)事务性(21)B2B(22)B2C(23)DBMS(24)ERP(25)数据粒度与数据分割的区别(26)时标法(27)自顶向下法(28)雪花模型(29)数据表主键三、模型设计1.某航空公司具有如下概念数据模型,请分析出适用的逻辑模型。
数据仓库与数据挖掘期末试题 (1)

1、数据仓库数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
2、数据挖掘:数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。
3、雪花模型:雪花模式中某些维表是规范化的,因而把数据进一步分解到附加的表中,模式图形成了类似雪花的形状。
通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。
雪花模型增加了用户必须处理的表数量,增加了某些查询的复杂性,但同时提高了处理的灵活性,可以回答更多的商业问题,特别适合系统的逐步建设要求。
4、OLAP OLAP是联机分析处理,是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
它支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
5、决策树:决策树是将训练集函数表示成树结构,通过它来近似离散值的目标函数。
这种树结构是一种有向树,它以训练集的一个属性作节点,这个属性所对应的一个值作边。
决策树一般都是自上而下的来生成的。
1、企业面对海量数据,应如何具体实施数据挖掘,使之转换成可行的结果/模型?首先进行数据的预处理,主要进行数据的清洗,数据清洗,处理空缺值,数据的集成,数据的变换和数据规约。
2、请列举您使用过的各种数据仓库工具软件(包括建模工具,ETL工具,前端展现工具,OLAP Server、数据库、数据挖掘工具)和熟悉程度。
ETL工具:AscentialDataStage ,IBM warehouseMANAGER、Informatica公司的PowerCenter、Cognos 公司的DecisionStream市场上的主流数据仓库存储层软件有:SQL SERVER、SYBASE、ORACLE、DB2、TERADATA但是使用过的只有SQLSERVER和数据挖掘工具Analysis Services,而且不大熟悉。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库逻辑模型试题
1. 什么是数据仓库逻辑模型?
数据仓库逻辑模型是指在数据仓库设计过程中,用于描述数据仓库中数据结构和数据之间的关系的模型。
它包括了数据实体、数据属性、关系和约束等元素。
2. 数据仓库逻辑模型的主要目的是什么?
数据仓库逻辑模型的主要目的是使数据仓库中的数据可以以一种合理、一致和易于理解的方式进行组织和查询,从而方便用户进行数据分析和决策支持。
3. 数据仓库逻辑模型中常用的建模方法有哪些?
常用的数据仓库逻辑模型建模方法包括维度建模、实体关系模型和标准化模型等。
4. 请描述一下维度建模方法。
维度建模方法是一种面向主题的建模方法,主要用于描述数据仓库中的事实表和维度表之间的关系。
它以事实表为中心,通过将业务过程中涉及的维度进行规范化,形成多个维度表,然后将维度表和事实表进行关联,来实现对数据的多维分析。
5. 数据仓库逻辑模型中的实体关系模型是如何描述的?
实体关系模型主要是用于描述数据实体之间的关系。
它将数据仓库中的实体和实体之间的关系抽象为实体关系图,并使用实体和关系两种类型的实体来表示数据仓库中的数据对象和数据之间的关系。
6. 数据仓库逻辑模型中的标准化模型是如何描述的?
标准化模型是指将数据仓库中的数据表按照关系数据库的设计原理进行规范化。
它通过将数据表中的属性按照功能进行分解,消除冗余数据,确保数据的一致性和完整性,从而提高数据仓库的查询效率和数据的可维护性。
7. 数据仓库逻辑模型中常用的约束有哪些?
常用的约束包括主键约束、外键约束、唯一约束、默认值约束、检查约束和非空约束等。
通过对数据仓库逻辑模型中的数据属性和关系应用这些约束,可以确保数据的有效性和一致性。
8. 数据仓库逻辑模型和数据仓库物理模型之间的关系是什么?数据仓库逻辑模型和数据仓库物理模型之间是一种上下级关系。
数据仓库逻辑模型是对数据仓库中数据的逻辑结构和数据之间关系的描述,而数据仓库物理模型是将逻辑模型转化为具体的存储结构和存储方式的实现。