数据库与数据挖掘阶段考试试题及答案
数据挖掘考试题及答案

数据挖掘考试题及答案### 数据挖掘考试题及答案#### 一、选择题(每题2分,共20分)1. 数据挖掘的目的是发现数据中的:- A. 错误- B. 模式- C. 异常- D. 趋势答案:B2. 以下哪项不是数据挖掘的常用算法:- A. 决策树- B. 聚类分析- C. 线性回归- D. 神经网络答案:C3. 关联规则挖掘中,Apriori算法用于发现:- A. 频繁项集- B. 异常值- C. 趋势- D. 聚类答案:A4. K-means算法是一种:- A. 分类算法- B. 聚类算法- C. 预测算法- D. 关联规则挖掘算法答案:B5. 以下哪个指标用于评估分类模型的性能:- A. 准确率- B. 召回率- C. F1分数- D. 所有以上答案:D#### 二、简答题(每题10分,共30分)1. 描述数据挖掘中的“过拟合”现象,并给出避免过拟合的策略。
答案:过拟合是指模型对训练数据拟合得过于完美,以至于失去了泛化能力。
避免过拟合的策略包括:使用交叉验证、正则化技术、减少模型复杂度、获取更多的训练数据等。
2. 解释什么是“数据清洗”以及它在数据挖掘中的重要性。
答案:数据清洗是指从原始数据中识别并纠正(或删除)错误、重复或不完整的数据的过程。
它在数据挖掘中至关重要,因为脏数据会导致分析结果不准确,影响最终的决策。
3. 描述“特征选择”在数据挖掘中的作用。
答案:特征选择是数据挖掘中用来降低数据维度、提高模型性能和减少计算成本的过程。
通过选择最有信息量的特征,可以去除冗余或无关的特征,从而提高模型的准确性和效率。
#### 三、应用题(每题25分,共50分)1. 假设你正在分析一个电子商务网站的用户购买行为,描述你将如何使用数据挖掘技术来识别潜在的营销机会。
答案:首先,我会使用聚类分析来识别不同的用户群体。
然后,通过关联规则挖掘来发现不同用户群体的购买模式。
接着,利用分类算法来预测用户可能感兴趣的产品。
数据库数据挖掘与分析考试试卷

数据库数据挖掘与分析考试试卷(答案见尾页)一、选择题1. 数据挖掘的主要目的是什么?A. 提取数据库中的数据B. 分析数据库中的数据以发现隐藏的模式和关联C. 存储和管理数据库中的数据D. 传输数据库中的数据2. 在数据挖掘中,以下哪个过程是用来发现数据项之间的有趣关系和关联的?A. 数据清理B. 数据集成C. 数据转换D. 数据挖掘3. 数据挖掘任务通常不包括以下哪项?A.分类B.聚类C.回归D. 数据库优化4. 关联规则学习是数据挖掘中的一个重要技术,它主要关注什么?A. 发现数据集中不同项之间的因果关系B. 发现数据集中频繁出现的模式和关联C. 建立数据模型以预测未来趋势D. 优化数据库查询性能5. 在聚类分析中,以下哪个选项不是常用的距离度量方法?A. 曼哈顿距离B. 欧氏距离C. 切比雪夫距离D. 余弦相似度6. 数据挖掘中经常使用哪种图表来展示聚类结果?A. 条形图B. 饼图C. 网络图D. 散点图7. 在数据挖掘中,以下哪个算法主要用于发现连续数值型数据中的异常值或离群点?A. K-均值算法B. DBSCANC. 谱聚类算法D. 决策树算法8. 数据挖掘中,以下哪个步骤不是数据预处理的一部分?A. 数据清洗B. 数据集成C. 数据转换D. 数据降维9. 在建立数据挖掘模型时,以下哪个步骤不是特征选择的一部分?A. 特征提取B. 特征选择C. 特征验证D. 特征排序10. 数据挖掘中,以下哪个工具不是常用的数据挖掘工具?A. SQLB. ExcelC. PythonD. R二、问答题2. 什么是SQL语言?请列举几种常见的SQL语句。
3. 什么是数据库的完整性约束?请举例说明。
4. 什么是数据库的设计原则?请列举几个常用的设计原则。
5. 什么是数据库的范式?请简要解释第一范式和第二范式。
6. 什么是数据库索引?请简述索引的作用和分类。
7. 什么是数据库的事务处理?请简述事务的定义和特性。
数据挖掘考试题库及答案

数据挖掘考试题库及答案一、选择题1. 数据挖掘是从大量数据中提取有价值信息的过程,以下哪项不是数据挖掘的主要任务?A. 预测B. 分类C. 聚类D. 数据可视化答案:D2. 以下哪种技术不属于数据挖掘的常用方法?A. 决策树B. 支持向量机C. 关联规则D. 数据仓库答案:D3. 数据挖掘中,以下哪项技术常用于分类和预测?A. 神经网络B. K-均值聚类C. 主成分分析D. 决策树答案:D4. 在数据挖掘中,以下哪个概念表示数据集中的属性?A. 数据项B. 数据记录C. 数据属性D. 数据集答案:C5. 数据挖掘中,以下哪个算法用于求解关联规则?A. Apriori算法B. ID3算法C. K-Means算法D. C4.5算法答案:A二、填空题6. 数据挖掘的目的是从大量数据中提取______信息。
答案:有价值7. 在数据挖掘中,分类任务分为有监督学习和______学习。
答案:无监督8. 决策树是一种用于分类和预测的树形结构,其核心思想是______。
答案:递归划分9. 关联规则挖掘中,支持度表示某个项集在数据集中的出现频率,置信度表示______。
答案:包含项集的记录中同时包含结论的记录的比例10. 数据挖掘中,聚类分析是将数据集划分为若干个______的子集。
答案:相似三、判断题11. 数据挖掘只关注大量数据中的异常值。
()答案:错误12. 数据挖掘是数据仓库的一部分。
()答案:正确13. 决策树算法适用于处理连续属性的分类问题。
()答案:错误14. 数据挖掘中的聚类分析是无监督学习任务。
()答案:正确15. 关联规则挖掘中,支持度越高,关联规则越可靠。
()答案:错误四、简答题16. 简述数据挖掘的主要任务。
答案:数据挖掘的主要任务包括预测、分类、聚类、关联规则挖掘、异常检测等。
17. 简述决策树算法的基本原理。
答案:决策树算法是一种自顶向下的递归划分方法。
它通过选择具有最高信息增益的属性进行划分,将数据集划分为若干个子集,直到满足停止条件。
数据仓库与数据挖掘考试试题

一、填空题(15分)1.数据仓库的特点分别是面向主题、集成、相对稳定、反映历史变化。
2.元数据是描述数据仓库内数据的结构和建立方法的数据。
根据元数据用途的不同可将元数据分为技术元数据和业务元数据两类。
3.OLAP技术多维分析过程中,多维分析操作包括切片、切块、钻取、旋转等。
4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“中心和辐射”架构,其中企业级数据仓库是中心,源数据系统和数据集市在输入和输出范围的两端。
5.ODS实际上是一个集成的、面向主题的、可更新的、当前值的、企业级的、详细的数据库,也叫运营数据存储。
二、多项选择题(10分)6.在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A 分类B 关联C 估值D 预言7.数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A 数据抽取B 数据转换C 数据加载D 数据稽核8.数据分类的评价准则包括( ABCD )A 精确度B 查全率和查准率C F-MeasureD 几何均值9.层次聚类方法包括( BC )A 划分聚类方法B 凝聚型层次聚类方法C 分解型层次聚类方法D 基于密度聚类方法10.贝叶斯网络由两部分组成,分别是( A D )A 网络结构B 先验概率C 后验概率D 条件概率表三、计算题(30分)11.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定sup min=40%,conf min=40%,使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。
(15分)解:(1)由I={面包、果冻、花生酱、牛奶、啤酒}的所有项目直接产生1-候选C1,计算其支持度,取出支持度小于sup min的项集,形成1-频繁集L1,如下表所示:(2)组合连接L1中的各项目,产生2-候选集C2,计算其支持度,取出支持度小于sup min的项集,形成2-频繁集L2,如下表所示:至此,所有频繁集都被找到,算法结束,所以,confidence({面包}→{花生酱})=(4/5)/(3/5)=4/3> conf minconfidence({ 花生酱}→{面包})=(3/5)/(4/5)=3/4> conf min所以,关联规则{面包}→{花生酱}、{ 花生酱}→{面包}均是强关联规则。
数据仓库和数据挖掘试题答案南京理工研究生

数据仓库及数据挖掘I.选择题,为每个问题选择最适宜的答案(10×2%=20%)1.数据仓库上的业务处理称作_B_。
A.联机事务处理B.联机分析处理C.联机输入处理D.联机查询处理2.在自然演化体系构造中,关于导致数据缺乏可信性的原因的说法哪个不正确?DA.数据无时基B.抽取程序的算法有差异C.抽取的层次不同D.缺乏集成性3.下面哪项关于OLTP及OLAP访问特点的说法是不正确的。
AA.OLTP和OLAP对于响应时间的要求都高B.OLTP访问频率高,OLAP访问频率低C.OLAP访问大量的历史,执行大量统计操作D.OLTP数据处理具有并发性4.下面关于数据仓库中数据的说法错误的选项是?A.数据越详细,粒度越小,层次级别就越高。
B.在估计直接存储设备数时,如数据超过1000万行必须强制采取双重粒度级。
C.数据仓库大局部分析是针对被压缩的、存取效率高的轻度级数据进展的。
D.数据分割便于数据的重构、重组和恢复,以提高创立索引和顺序扫描的效率。
5.下面关于数据仓库的数据存储方式的说法哪个是不正确的?FE.虚拟存储方式中,数据仓库的数据仍然在源数据中。
F.星型模式下的维表标准化的,而雪花模式下的不需要标准化G.在查询效率方面,星型模式效率更高H.在事实星座模式中有多个事实表,且它们共享一样的维表6.下面关于星型模型的说法哪个是不正确的?I.有一个包含大量数据的事实表J.有一组小的附属表,称为维表,每维一个。
K.事实表的每个字段都是事实度量字段L.事实中每条元组都含有指向各个维表的外键和一些相应的度量数据。
7.下面关于数据仓库的数据追加的说法哪个是不正确的?CA.时标法需要为记录数据增加一个时间标志。
B.前后映像文件方法需要扫描整个数据库,占用较多资源,对性能有较大影响C.DELTA不需要扫描整个数据库,效率较高,应用普遍D.日志文件法也不需要扫描整个数据库,是固有机制。
8.假设收入属性的最小及最大分别是10000和90000,现在想把当前值30000映射到区间[0,1],假设采用最大-最小数据标准方法,计算结果是多少?B9.下面关于维的概念哪个是不正确的? CA.维是人们观察数据的特定角度。
北京大学《数据仓库与数据挖掘》试题答案整理

《数据仓库与数据挖掘》试题与答案整理2013级智能系高飙1.名词解释5x4(1)主题主题(Subject):宏观分析领域所涉及的分析对象。
是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。
面向主题的数据组织方式:在较高的层次上对分析对象的数据的一个完整、一致的描述。
(2)事实(P联机分析)事实是数值度量的;存储一个多维数据,表达期望分析的主题(目的、感兴趣的事情、事件或者指标等);具有一定的粒度,粒度的大小与维层次相关;一个事实中通常包含一个或者多个度量一个事实的两个组件:数字型指标、聚集函数(3)数据归约(P数据预处理)在可能获得相同或相似结果的前提下,对数据的容量进行有效的缩减数据归约的方法:1数据立方体聚集:聚集操作作用于立方体中的数据2减少数据维度(维归约):可以检测并删除不相关、弱相关或者冗余的属性或维3数据压缩:使用编码机制压缩数据集4数值压缩:用替代的、较小的数据表示替换或估计数据5数据离散化以及概念层次的建立:属性的原始值用区间值或较高层的概念予以替换(4)兴趣度(P数据挖掘)一个数据挖掘系统的挖掘结果可能会产生成千上万个模式,但是并不是所有的模式都有意义。
兴趣度度量用于将不感兴趣的模式从知识中分开。
他们可以用于指导挖掘过程,或在挖掘之后,评估发现的模式。
不同类型的数据需要不同的兴趣度量。
兴趣度的度量:一个模式是否感兴趣,取决于它是否容易被用户所理解,是否有效可信,是否潜在有用,是否新颖等兴趣度的度量:客观的度量: 从模式的角度出发,基于模式结构的某些统计的结果,如:支持度(support)、置信度(confidence)等。
主观的度量:从用户的角度出发,对模式的信任程度,如:新颖性、可操作性等。
(5)数据分区(片)(P数据仓库设计)把逻辑上统一的数据分割成较小的、可以独立管理的物理单元(分片)进行存储。
可按时间、按地区、按业务类型进行数据分片(6)数据挖掘数据挖掘是识别数据中有效的、新颖的、潜在有用的和最终可被理解的模式(Pattern)的非平凡过程。
数据挖掘测试题及答案

数据挖掘测试题及答案一、选择题1. 数据挖掘的目的是:A. 数据清洗B. 数据转换C. 模式发现D. 数据存储答案:C2. 以下哪项不是数据挖掘的常用算法?A. 决策树B. 聚类分析C. 线性回归D. 关联规则答案:C二、填空题1. 数据挖掘中的_________是指在大量数据中发现的有意义的模式。
答案:知识2. 一种常用的数据挖掘技术是_________,它用于发现数据中隐藏的分组。
答案:聚类三、简答题1. 简述数据挖掘与数据分析的区别。
答案:数据挖掘是一种自动或半自动的过程,旨在从大量数据中发现模式和知识。
数据分析通常涉及更具体的查询和问题,使用统计方法来理解数据。
2. 描述什么是关联规则挖掘,并给出一个例子。
答案:关联规则挖掘是一种用于发现变量之间有趣关系的技术,特别是变量之间的频繁模式、关联或相关性。
例如,在市场篮子分析中,关联规则挖掘可以用来发现顾客购买行为中的模式,如“购买面包的顾客中有80%也购买了牛奶”。
四、计算题1. 给定以下数据集,计算支持度和置信度:| 事务ID | 购买的商品 |||-|| 1 | A, B || 2 | A, C || 3 | B, C || 4 | A, B, C || 5 | B, D |(1) 计算项集{A}的支持度。
(2) 计算规则A => B的置信度。
答案:(1) 项集{A}的支持度为4/5,因为A出现在4个事务中。
(2) 规则A => B的置信度为3/4,因为A和B同时出现在3个事务中,而A出现在4个事务中。
五、论述题1. 论述数据挖掘在电子商务中的应用,并给出至少两个具体的例子。
答案:数据挖掘在电子商务中的应用非常广泛,包括:- 客户细分:通过数据挖掘技术,商家可以识别不同的客户群体,为每个群体提供定制化的服务或产品。
- 推荐系统:利用关联规则挖掘,电商平台可以推荐用户可能感兴趣的商品,提高用户满意度和购买率。
- 欺诈检测:通过分析交易模式,数据挖掘可以帮助识别异常行为,预防信用卡欺诈等风险。
数据挖掘测试题及答案

数据挖掘测试题及答案一、单项选择题(每题2分,共10题,共20分)1. 数据挖掘中,用于发现数据集中的关联规则的算法是:A. K-meansB. AprioriC. Naive BayesD. Decision Tree答案:B2. 以下哪个选项不是数据挖掘的步骤之一:A. 数据预处理B. 数据探索C. 数据收集D. 数据分析答案:C3. 在分类问题中,以下哪个算法属于监督学习:A. 聚类B. 决策树C. 关联规则D. 异常检测答案:B4. 数据挖掘中,用于发现数据集中的频繁项集的算法是:A. K-meansB. AprioriC. Naive BayesD. Decision Tree5. 在数据挖掘中,以下哪个选项不是数据预处理的步骤:A. 数据清洗B. 数据集成C. 数据变换D. 数据分类答案:D6. 以下哪个算法主要用于聚类问题:A. K-meansB. AprioriC. Naive BayesD. Decision Tree答案:A7. 在数据挖掘中,以下哪个选项不是数据挖掘的应用领域:A. 市场分析B. 医疗诊断C. 社交网络分析D. 视频游戏开发答案:D8. 以下哪个算法主要用于异常检测:A. K-meansB. AprioriC. Naive BayesD. One-Class SVM答案:D9. 在数据挖掘中,以下哪个选项不是数据挖掘的输出结果:B. 规则C. 趋势D. 软件答案:D10. 以下哪个算法主要用于分类问题:A. K-meansB. AprioriC. Naive BayesD. Decision Tree答案:D二、多项选择题(每题3分,共5题,共15分)1. 数据挖掘中,以下哪些算法可以用于分类问题:A. K-meansB. Decision TreeC. Naive BayesD. Logistic Regression答案:BCD2. 在数据挖掘中,以下哪些步骤属于数据预处理:A. 数据清洗B. 数据集成C. 数据变换D. 数据分类答案:ABC3. 以下哪些算法可以用于聚类问题:A. K-meansB. AprioriC. Hierarchical ClusteringD. DBSCAN答案:ACD4. 在数据挖掘中,以下哪些步骤属于数据探索:A. 数据可视化B. 数据摘要C. 数据分类D. 数据变换答案:AB5. 以下哪些算法可以用于异常检测:A. K-meansB. One-Class SVMC. Isolation ForestD. Apriori答案:BC三、简答题(每题5分,共3题,共15分)1. 简述数据挖掘中关联规则挖掘的主要步骤。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释(5个,10分)1、数据库:长期储存在计算机内的、有组织的、可共享的数据集合。
2、数据库系统:数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。
3、数据库管理系统:位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。
4、视图:从一个或几个基本表导出的表,它与基本表不同,是一个虚表,数据库中只存放视图的定义,而不存放视图对应的数据。
5、实体:现实世界中客观存在并能相互区别的事物。
6、模式是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
7、实体完整性:关系R的所有元组在主码上的值必须唯一,并且在主码的任何属性上都不能取空值。
二、单选题(30个,30分)1、SQL中,下列涉及空值的操作,不正确的是(C)。
A. AGE IS NULLB. AGE IS NOT NULLC. AGE = NULLD. NOT (AGE IS NULL)2、数据库管理系统是一个(A )。
(A) 软件系统(B) 硬件系统(C)软硬件结合的系统(D) 数据集合3.数据模型是(A )数据特征的抽象。
(A)计算机世界(B)现实世界(C) 模型空间(D) 概念世界4、关系模式R为3NF, 则R不存在( D )。
(A) 部分依赖(B) 传递依赖(C)非主属性对码的传递依赖(D) 主属性对码的传递依赖5、关系R的实体完整性控制是指( A )。
(A)主键非空(B)主键唯一(C)主键非空且唯一(D)主键非空或唯一6、实体联系模型属于( D )。
A. 层次模型B. 网状模型C. 关系模型 D 概念模型7、在一个关系中,任意两个元组的值( C )。
A. 可以全同B. 必须全同C. 不能全同D. 以上都不是8、关系R和S进行自然连接时,要求R和S含有一个或多个公共( B )A. 行B. 属性C. 记录D.元组9、SQL是( C )的缩写。
A. Standard Query LanguageB. Select Query LanguageC. Structured Query LanguageD. 以上都不是10、在关系中的各元组的( B )。
A.顺序不能任意排列,一定要按照输入的顺序排列B.顺序可以任意排列C.顺序一定要按照关键字段值的顺序排列D.排列顺序不同,统计处理的结果就可能不同。
11、SQL中创建基本表应使用( C )语句。
A.CREATE VIEWB.CREATE DATABASEC.CREATE TABLED.CREATE FORM12、与WHERE 年龄 BETWEEN 32 AND 45 语句等价的子句是( D )。
A. WHERE年龄 >32 AND年龄<45B. WHERE年龄>=32 AND年龄<45C. WHERE年龄>32 AND年龄<=45D. WHERE年龄>=32 AND年龄<=4513、公司中有多个部门和多名职员,每个职员只能属于一个部门,一个部门可以有多名职员,职员与部门的联系类型是( C )。
A. m : nB. 1 : nC. n : 1D. 1 : 114、在数据库的三级模式结构中,内模式有( A )。
A.1个 B.2个 C.三个 D.任意多个15、下述那一条不属于概念模型应具备的性质( D )。
A.有丰富的语义表达能力 B.易于交流和理解C.易于变动 D.在计算机中实现的效率高16、用二维表结构表示实体以及实体间联系的数据模型称为( C )。
A.网状模型 B.层次模型 C.关系模型 D.面向对象模型17、使用CREATE VIEW语句建立的是( C )。
A.数抿库B.表C.视图D.索引18、一个学生可以同时借阅多本图书,一本图书只能借给一个学生,学生和图书之间的联系为( B )的联系。
A.一对一B.一对多C.多对多D.多对一19、SQL语句的一次查询结果是( D )。
A. 数据项B. 记录C. 元组D. 表20、下列哪个是单目运算( C )。
A. 差B. 并C. 投影D. 除法21、采用SQL查询语言对关系进行查询操作,若要求查询结果中不能出现重复元组,可在SELECT子句后增加保留字( A )。
A. DISTINCTB. UNIQUEC. NOT NULLD. SINGLE22、数据的存储结构与数据逻辑结构之间的独立性称为数据的( A )。
A. 物理独立性B. 结构独立性C. 逻辑独立性D. 分布独立性23、关系模式的任何属性( A )。
A. 不可再分B. 可再分C. 命名在该关系模式中可以不唯一D. 以上都不是24、数据模型的三要素是( D )。
A. 外模式、模式、内模式B.关系模型、层次模型、网状模型C. 实体、联系、属性D. 数据结构、数据操作、完整性约束25、数据库管理系统能实现对数据库中数据的查询、插入、修改和删除,这类功能称为(C)。
A. 数据定义功能B.数据管理功能C. 数据操纵功能D.数据控制功能26、在SQL语句中,对输出结果进行排序的语句是( B )。
A. GROUP BYB. ORDER BYC. WHERED. HAVING27、消除了部分函数依赖的1NF的关系模式必定是( B )。
A. 1NFB. 2NFC. 3NFD. 4NF28、从表中删除记录的SQL语句是( B )。
A. INSERTB. DELETEC. UPDATED. DROP29、关系模型的数据结构是( D )。
A. 树B. 图C. 表D. 二维表30、数据库系统与文件系统的主要区别是( B )。
A. 数据库系统复杂,而文件系统简单B. 文件系统不能解决数据冗余和数据独立性问题,而数据库系统可以解决C. 文件系统只能管理程序文件,而数据库系统能够管理各种类型的文件D. 文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量三、填空题(20个空,20分)1、数据库管理员利用( Grant )语句将对某类数据的操作权限赋于用户;用( revoke )语句收回用户对某类数据的操作权限。
2、数据管理技术经历了人工管理、文件系统和数据库系统三个阶段。
3、二元实体之间的联系可抽象为三类,它们是1:1、1:n和m:n(或者写一对一、一对多、多对多)。
4、关系代数中,从关系中取出所需属性组成新关系的操作称为投影。
5、构造E-R模型的三个基本要素是实体、属性、联系。
6、在SQL中视图是由基本表或视图产生的虚表,不能存放数据,只能存储视图的定义。
7、关系数据库规范化是为解决关系数据库中插入异常、删除异常、更新异常和数据冗余问题而引入的。
8、数据库模式体系结构中提供了两个映像功能,即外模式/模式和模式/内模式映像。
9、关系模式的规范化是指一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式。
10、最著名、最为常用的概念模型是_ER模型_。
11、关系数据模型由关系数据结构、关系操作和关系完整性约束三部分组成。
四、简答题(4个,20分)1、试述视图的作用?答:(1)视图能够简化用户的操作;(2)视图使用户能以多种角度看待同一数据;(3)视图对重构数据库提供了一定程度的逻辑独立性;(4)视图能够对机密数据提供安全保护;(5)适当的利用视图可以更清晰的表达查询。
2、数据库管理系统的主要功能。
答:(1)数据定义功能;(2)数据操纵功能;(3)数据库的事务管理和运行管理;(4)数据组织、存储和管理;(5)数据库的建立和维护功能;(6)其他功能。
3、数据库管理员的职责是什么?答:(1)决定数据库中的信息内容和数据的逻辑结构;(2)决定数据库的存储结构和存取策略;(3)定义数据的安全性要求和完整性约束条件;(4)数据库系统的日常维护;(5)重组和重构数据库。
4、什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?答:数据与程序的逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的,即数据的逻辑结构改变了,用户程序也可以不变。
数据与程序的物理独立性:用户的应用程序与存储在磁盘上的数据库中数据是相互独立的,即数据的物理存储改变时用户的应用程序不用改变。
数据库管理系统在三级模式之间提供的两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
5、SQL的基本特点。
(1) 综合统一; (2) 高度非过程化; (3) 面向集合的操作方式;(4) 以同一种语法结构提供两种使用方法;(5) 语言简洁,易学易用。
五、操作题(1个小题,20分)1、设某商业集团数据库中有三个实体集。
一是“商品”实体集,属性有商品号、商品名、规格、单价等;二是“商店”实体集,属性有商店号、商店名、地址等;三是“供应商”实体集,属性有供应商编号、供应商名、地址等。
供应商与商品间存在“供应”联系,每个供应商可供应多种商品,每种商品可向多个供应商订购,供应商供应每种商品有月供应量;商店与商品间存在“销售”联系,每个商店可销售多种商品,每种商品可在多个商店销售,商店销售商品有月计划数。
试画出ER图,并在图上注明属性、联系的类型。
再转换成关系模式集,并指出每个关系模式的主键和外键。
这个ER图转换的关系模式如下:商品(商品号,商品名,规格,单价)供应商(供应商编号,供应商名,地址)商店(商店号,商店名,地址)供应(商品号,供应商编号,月供应量)销售(商品号,商店号,月计划数)备注:自己指出每个关系模式的主键和外键。
这部分就靠你们自己啦。