分布式数据库系统_复习
分布式数据库复习题(佟玉君).doc

一、名词解释1.DDBS: (Distributed DataBase System)分布式数据库系统,是一个物理上分散而逻辑上集中的数据集。
2.Transparency:也称分布透明性(Distribution Transparency),分布透明性指用户不必关系数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关系各个场地上数据库数据模型。
分布透明性可归入物理独立性的范围。
包括三个层次:分片透明性、位置透明性和局部数据模型透明性。
3.Transaction:事务,是访问数据库的最小逻辑工作单位,它是一个操作序列。
分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上。
4.Concurrency:迸发控制,并发控制就是负责正确协调并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一致性,确保并发执行的多个事务能够正确地运行并获得正确的结果。
5.Reliability:数据库可靠性,指数据库在一个给定的时间间隔内不产生任何失败的概率。
二、简答题1、简述分布式数据库12条规则。
答:1.局部自治2.不依赖于中心节点3.不间断的处理4.位置独立性5.分片独立性6. 副本独立性7.分布式查询处理8.分布式事务管理9.硬件独立性10.操作系统独立性11.网络独立性12. DBMS独立性独立性用户可以从逻辑的高度对数据进行操作,就如同数据都存用户应该可以从逻辑的观点出发进行操作,就如同数据实际用户可以从逻辑的高度对数据进行操作,就如同根本没有副本用户应该可以从逻辑的观点出发进行操作,高可靠性,高可靠性,高可用性用户不需要了解数据实际存储的位置,用户不需要了解数据实际存储的位置在给定节点上的所有操作都是由所在节点控制的。
在给定节点上的所有操作都是由所在节点控制的。
所有的节点平等对待,不依赖中心,所有的节点平等对待,不依赖中心,主节点提供集中的的存在一样。
上并没有分片一样。
的存在一样。
上并没有分片一样。
分布式数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。
逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。
另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。
二、简述分布式数据库的模式结构和各层模式的概念。
分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。
它为全局概念模式的子集,表示全局应用所涉及的数据库部分。
全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。
分片模式用于说明如何放置数据库的分片部分。
分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。
分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。
局部概念层:局部概念模式是全局概念模式的子集。
分布式数据库系统复习材料

分布式数据库系统复习材料在学习和复习分布式数据库系统时,需要掌握以下几个关键知识点:1.分布式数据库架构:分布式数据库系统可以采用集中式架构、两层架构、三层架构等不同的架构模式。
其中集中式架构通过一个中央服务器管理所有的数据,两层架构将数据分为客户端和服务器两部分进行管理,三层架构引入中间层服务器来协调不同的功能和数据层。
2.分布式数据库一致性:分布式数据库系统需要保证数据的一致性。
数据的一致性可以通过ACID原则来保证,即原子性、一致性、隔离性和持久性。
此外,还可以使用分布式事务来保证数据的一致性,分布式事务可以通过两阶段提交(2PC)或者三阶段提交(3PC)来实现。
3.分布式数据库的查询:分布式数据库系统可以进行分布式查询,即将查询请求分发给不同的节点进行处理。
常用的查询分发策略包括哈希分发、范围分发和复制分发。
哈希分发根据查询内容的哈希值将查询请求分发到对应的节点上,范围分发根据数据的范围将查询请求分发到对应节点上,复制分发将查询请求分发到多个节点上进行处理。
4.分布式数据库的数据复制:分布式数据库系统可以通过数据复制来提高数据的可靠性和性能。
数据复制可以采用同步复制或者异步复制方式。
同步复制要求数据在所有节点上都写入成功后才算成功,而异步复制则可以先将数据写入一个节点,然后再异步地将数据复制到其他节点上。
5.分布式数据库的容错与恢复:分布式数据库系统需要具备容错和恢复机制,以应对节点故障或者网络故障等异常情况。
常用的容错机制包括故障检测、容错存储和故障恢复。
故障检测可以通过心跳机制或者节点监视来实现,容错存储可以通过数据备份或者数据冗余来实现,故障恢复可以通过副本恢复或者数据迁移来实现。
6.分布式数据库的性能优化:分布式数据库系统可以通过多种方式来优化性能。
常用的性能优化方法包括数据分片、负载均衡和缓存机制。
数据分片可以将数据分散到不同的节点上,以减轻节点的负载;负载均衡可以将查询请求均匀地分发到各个节点上,以提高查询的响应速度;缓存机制可以将频繁查询的数据缓存在节点上,以减少磁盘访问,提高查询性能。
Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案一、选择题1、以下哪个不是Nosql分布式数据库的特点?A.高度可扩展性B.面向文档的数据模型C.严格的ACID事务D.水平扩展能力答案:C.严格的ACID事务解释:Nosql分布式数据库通常不提供严格的ACID事务,而是采用柔性事务模型,如最终一致性。
这是因为Nosql系统设计的主要目标是高可用性和高性能,而严格的ACID事务会限制这些目标的实现。
2、下列哪个不是Nosql分布式数据库的查询语言?A. SQLB. JSON查询语言C. MapReduceD.结构化查询语言答案:D.结构化查询语言解释:Nosql分布式数据库通常使用非结构化查询语言,如SQL或JSON 查询语言,而不是结构化查询语言。
这是因为Nosql数据库以非结构化和半结构化数据为主,而结构化查询语言主要用于关系型数据库中的结构化数据。
3、下列哪个是分布式Nosql数据库中的一种常用技术?A.分片技术B.复制技术C.缓存技术D.压缩技术答案:A.分片技术解释:在分布式Nosql数据库中,分片技术是一种常见的技术,用于将数据分散到多个节点上,以提高数据的可用性和扩展性。
复制技术用于数据的冗余备份,缓存技术用于提高查询速度,而压缩技术用于减少存储空间的使用。
4、下列哪个是关系型数据库的优点?A.高度可扩展性B.面向文档的数据模型C.支持严格的事务一致性D.高并发读写能力答案:C.支持严格的事务一致性解释:关系型数据库支持严格的事务一致性,这是其一个重要优点。
关系型数据库使用ACID事务,确保数据在多个操作中保持一致性。
其他选项都是Nosql分布式数据库的优点。
5、下列哪个是分布式数据库的缺点?A.复杂性增加B.性能瓶颈C.数据一致性降低D.成本增加答案:A.复杂性增加解释:分布式数据库的设计和维护比单一数据库更复杂,需要更多的技术和资源来管理。
在分布式系统中,故障恢复和数据复制等任务也更加复杂。
因此,分布式数据库的复杂性增加是其主要的缺点。
分布式数据库系统考试

分布式数据库系统考试(答案见尾页)一、选择题1. 分布式数据库系统的定义是什么?A. 一种将数据存储在多个地理位置的数据库系统中,通过分布式计算框架来管理和访问数据的一种技术。
B. 一种单一的集中式数据库系统,所有数据都存储在一个服务器上。
C. 一种将数据分割成多个部分,并分布存储在不同的服务器上的数据库系统。
D. 一种不依赖于单一服务器的数据库系统,数据可以跨多个服务器进行存储和访问。
2. 分布式数据库系统的优点包括哪些?A. 提高数据处理速度和效率。
B. 降低单点故障的风险。
C. 更好的数据冗余和容错能力。
D. 扩展性更强,可以更容易地添加新的数据和节点。
3. 以下哪个不是分布式数据库系统中的常见拓扑结构?A. 星形拓扑B. 环形拓扑C. 网状拓扑D. 树形拓扑4. 在分布式数据库系统中,什么是分片?A. 将整个数据库系统的数据分成多个部分,每个部分存放在一个单独的节点上。
B. 将数据库系统的一个或多个表按照某种规则分成多个部分。
C. 将数据库系统的数据按照某种规则分成多个部分,每个部分存放在一个单独的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存放在不同的节点上。
5. 在分布式数据库系统中,什么是复制?A. 将数据库系统的数据复制到多个节点上,以确保数据的可靠性和可用性。
B. 将数据库系统的数据存储在多个地理位置,以确保数据的可靠性和可用性。
C. 将数据库系统的数据按照某种规则分成多个部分,并存放在不同的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存储在不同的节点上。
6. 在分布式数据库系统中,什么是分布式事务?A. 一种需要在多个节点上同步更新数据的事务处理方式。
B. 一种可以在多个节点上并行处理的事务处理方式。
C. 一种需要确保数据的一致性和完整性的事务处理方式。
D. 一种可以在多个节点上同时执行的事务处理方式。
7. 分布式数据库系统中的数据一致性是指什么?A. 数据在多个节点上保持一致的状态。
分布式数据库复习重点

DBMS1
DBMS2
DBMSm
4.
网络
1 1.1
分布式数据库设计概述 DDBS创建方法
重构法
根据实现环境 和用户需求
1.
用户1
用户2
用户n
2.
按照DDBS的 设计思想和方 法
从总体设计做 起,包括 LDBS,重新建 立一个DDBS 可有效解决数 据一致性、完 整性和可靠性 问题。 通常是同构异 质或同构同质 DDBS
2 自顶向下设计DDB
2.2 数据的分片设计
小项谓词选择
(1) A<10 (2) A<10 (3) A<10 (4) A<10 (5) A<10 (6) A<10 (7) A<10 (8) A<10
A>5 Loc=SA Loc=SB A>5 Loc=SA ¬(Loc=SB) A>5 ¬(Loc=SA) Loc=SB A>5 ¬(Loc=SA) ¬(Loc=SB) ¬(A>5) Loc=SA Loc=SB ¬(A>5) Loc=SA ¬(Loc=SB) ¬(A>5) ¬(Loc=SA) Loc=SB ¬(A>5) ¬(Loc=SA) ¬(Loc=SB)
5 分布式数据库系统的体系结构和组成成分 5.3 DDBS中数据的分片与分布
1. 数据分片(P.10) 又称数据分割、数据分段,局部数据库是由全局数据库分割而成 • • • 水平分片(对全局关系施加选择运算) 垂直分片(对全局关系施加投影运算) 混合分片(两种方法的混合)
数据分片要准守的原则:
• • • 完备性原则:要把所有的数据映射到各个片断中 可重构原则:关系分片后的各个片断可重构整个关系 不相交原则:关系分片后的各个片断不能重叠
分布式数据库复习要点

分布式数据库复习要点第一章1、分布式数据库的定义(P4)物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。
分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。
2、分布式数据库的两种分类方法(P7)●按局部DBMS的数据模型分同构型DDBS:各个站点上数据库使用同一数据模型同构同质型-数据模型相同,且是同一种DBMS(同一厂家)同构异质型-数据模型相同,不是同一种DBMS异构型DDBS :各站点上数据库的数据模型类型不同全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。
全局控制可变型DDBS:也称主从型DDBS。
分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。
3、分布式数据库的组成成分(两部分)(P9)●数据:分布式数据库的主体,包括局部数据和全局数据。
●数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。
4、分布式数据库的数据分片的定义和类型(3种)(P10)数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。
三种类型:●水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。
●垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。
●混合分片:以上两种方法的混合。
5、分布式数据库的分布策略(4条)(P11)数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.●集中式:所有数据都安排在同一站点上●分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点●复制式:所有数据有多个副本,每个站点都有一个完整的数据副本●混合式:分割式和复制式的混合6、分布式数据库的模式结构(P13)分四层:●全局外层:全局外模式---全局应用的用户视图。
分布式数据库系统架构设计考试

分布式数据库系统架构设计考试(答案见尾页)一、选择题1. 分布式数据库系统(DDBS)的三个层次及其主要特点是什么?A. 存储层、逻辑层、应用层B. 节点层、网络层、存储层C. 数据层、查询层、事务层D. 主节点层、从节点层、副本层2. 什么是分布式数据库系统的CAP理论,以及它的三个要素?A. 一致性、可用性、分区容错性B. 一致性、可用性、数据一致性C. 可用性、分区容错性、数据一致性D. 数据完整性、可用性、分区容错性3. 什么是分布式数据库系统的BASE理论,以及它的三个特性?A. 基本可用、软状态、最终一致性B. 基本可用、硬状态、即时一致性C. 基本可用、软状态、即时一致性D. 基本可用、硬状态、最终一致性4. 分布式数据库系统中的一种常见的分片技术是什么?A. 水平分片B. 垂直分片C. 分区D. 列分片5. 什么是分布式数据库系统中的一致性哈希算法?A. 通过哈希函数将关系分成不同的碎片B. 通过将关系映射到环上,并分配哈希值C. 通过将关系映射到树上,并分配哈希值D. 通过将关系映射到网格上,并分配哈希值6. 分布式数据库系统中的复制策略有哪些?A. 完全复制B. 不完全复制C. 混合复制D. 并发复制7. 什么是分布式数据库系统中的分布式事务?A. 由一组相关的本地事务组成,这些事务在逻辑上是一致的B. 由一组相关的本地事务组成,这些事务在逻辑上是一致的,并且提交或回滚C. 由一组相关的远程事务组成,这些事务在逻辑上是一致的D. 由一组相关的远程事务组成,这些事务在逻辑上是一致的,并且提交或回滚8. 分布式数据库系统中的负载均衡技术在哪个方面提高了系统性能?A. 将请求分散到多个数据库服务器上B. 提高数据库服务器的缓存性能C. 优化数据库索引D. 优化数据库查询语句9. 什么是分布式数据库系统中的数据复制?A. 将数据从一个数据库同步到另一个数据库的过程B. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性C. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性和完整性D. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性、完整性和可扩展性10. 什么是分布式数据库系统中的分区和水平分片?A. 分区是将关系分成不同的片段,水平分片是在垂直方向上分割关系B. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系C. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片D. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片,同时保证数据的一致性11. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统由多个物理上分散的数据库组成,逻辑上是一个统一的整体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空
分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为和两类。
同构型DDBS 异构型DDBS
分布式数据库系统按全避控制系统类型分类,可以分为、
和三类。
全局控制集中型DDBS 全局控制分散型DDBS 全局控制可变型DDBS
分布式数据库是分布式数据库系统中各站点上数据库的逻辑集合,它由和组成。
应用数据库描述数据库
数据分片的三种基本方法是:、和三类。
水平分片垂直分片混合分片
《
分布式数据库中的数据分布策略有:、、
和四层。
集中式分割式复制式混合式
分布式数据库是多层模式结构,一般划分为、、
和四层。
全局外层全局概念层局部概念层局部内层
一个分布式数据库管理系统一般应包括、、
和四个基本功能模块。
查询处理模块完整性处理模块调度处理模块可靠性处理模块
分布透明性包括、和三个层次。
,
分片透明性位置透明性局部数据模型透明性
分布式数据库系统的创建方法,大致可分为和两种。
组合法重构法
集中式数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段,它位于和之间。
分布设计逻辑设计物理设计
水平分片的方法可归为和两种。
初级分片导出分片
DATAID-D相对于DATAID-1增加了和两个阶段。
分布要求分析分布设计
》
DATAID-D中的分布设计分成、、
和四个阶段。
分片设计非冗余分配冗余分配局部模式的重新构造
分布式查询优化的准则是。
通信费用和响应时间最短
在分布式系统中,查询代价QC=。
I/O代价+CPU代价+通信代价
在分布式环境下,查询可分为、和三种类型。
局部查询远程查询全局查询
分布式查询处理可以分为、、和四层。
【
查询分解数据本地化全局优化局部优化一个分布式事务通常是由和组成。
主事务子事务
事务的四个特性是:、、和。
原子性一致性隔离性耐久性
控制分布式事务所执行的控制模型有:、和。
主从模型三角模型层次模型
分布式数据库系统中,通信故障可以分为和两种。
报文故障网络分割故障
事务恢复主要是依靠来实现的。
日志
,
并发控制机制可以为和两种类型。
悲观并发控制法乐观并发控制法
常用的基本封锁算法有:、、和。
简单的分布式封锁方法主站点封锁法主副本封锁法快照方法
预防死锁的方法有和两种类型。
非占先权方法占先权方法
检测分布式死锁的三种方法是、和。
集中式层次式分布式
二、[
三、简答题
分布式数据库系统的特点是什么
答:物理分布性:数据不是存放在一个站点上
逻辑整体性:是与分散式数据库系统的区别
站点自治性:是与多处理机的系统的区别
数据分布透明性
集中与自治相结合
存在适当的数据冗余度
事务管理的分布性
/
分布式数据库中数据分片的规则是什么
答:(1)完备性原则:必须把全局关系的所有数据映射到各自片段中,绝不允许有属于全局关系的数据却不发球它的任何一个片段。
(2)可重构原则:必须保证能够由同一个全局关系的各个片段来重建该全局关系。
对于水平分片可用并操作重构全局关系,对于垂直分片可用连接操作重构全局关系。
(3)不相交原则:关系分片后的各个片断不能重叠或只包含主键重叠。
DATAID-D相对于DATAID-1增加哪两个阶段,这两个阶段的具体工作是什么
答:(1)分布要求分析阶段:收集关于分布的信息,如水平分片的划分谓词,每一应用在各站点激活的频率等。
(2)分布设计阶段:始于全局数据库模式的规格说明和所收集的分布要求,然后产生全局数据的分片模式和片段的位置分配模式,分配模式描述了分配在各站点上的数据情况。
分布式事务的一般结构是什么
:
答:分布式事务的一般结构为:
Begin Transaction原语:开始一个事务(2分)
T1[]
T2[]
: 子事务或操作序列
:
Tn[]
Commit原语:事务成功完成的结束(2分)
Rollback或Abort原语:事务失败的结束(1分)
,
五、论述题
分布式数据库中,"数据分配"有哪些策略"数据分片"有哪些策略数据分片的准则是什么
数据分配是指数据在计算机网络各场地上的分配策略。
包括:
(1)集中式:所有数据均安排在同一个场地上。
(2)分割式:所有数据只有一份,分别被安置在若干个场地。
(3)全复制式:数据在每个场地重复存储。
(4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是每一场地未必保存全部数据。
数据分片的方式有以下三种:
(1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
(2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。
(3)混合型分片:将水平分片与垂直分片方式综合使用则为混合型分片。
数据分片应遵循的准则为:
(1)完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许发生属于全局关系的某个数据不属于任何一个片段。
(2)重构条件:划分所采用的方法必须确保能够由各个片段重建全局关系。
(3)不相交条件:要求一个全局关系被划分后得到的各个数据片段互相不重叠。
简述基于关系代数等价变换查询优化处理的基本原理和实现方法
答:基本原理:把查询问题转变为关系代数表达,分析得到查询树,进行从全局到片段的变换得到基于片段上的查询树,然后利用关系代数等价变换规则的优化算法,尽可能先执行选择和投影操作。
实现步骤和方法:(1)将一个查询问题转换成关系代数表达式。
(2)从关系代数表达式到查询树的变换:对一个关系代数表达式进行语法分析,可得到一棵语法树。
(3)从全局查询到片段查询的变换:把基于全局关系的查询树中的全局关系名,用其重构该全局关系的各片段名替换,变换成相应片段上的查询树。
(4)利用关系代数等价变换规则的优化算法,对片段上的查询树进行优化处理,最后达到优化查询的目的。