分布式数据库系统复习题
分布式数据库试题及答案

数据库试题目录1. 九八年秋季试题 (5)1.1. 概念题 (5)1.1.1. 比较半连接方法和枚举法的优缺点。
(5)1.1.2. 2PL协议的基本思想。
(5)1.1.3. WAL协议的主要思想。
(5)1.1.4. SSPARC三级模式体系结构。
(5)1.1.5. 设计OID的数据结构时应考虑哪些问题。
(6)1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。
每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。
完成下列各种要求: (7)1.3. 下面是某学院的一个学生档案数据库的全局模式: (9)1.3.1. 将全局模式进行分片,写出分片定义和分片条件。
(9)1.3.2. 指出各分片的类型,并画出分片树。
(9)1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。
要求给出优化变换过程。
(10)1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。
对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。
(11)1.4.1. 局部分别是可串行化,而全局是不可串行化的 (11)1.4.2. 局部和全局都是可串行化的。
要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁)121.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, (12)2. 九九年春季试题 (13)2.1. DBMS解决了信息处理技术中的哪些挑战? (13)2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? (13)2.3. 简述ACID特性。
分布式数据库复习题(佟玉君).doc

一、名词解释1.DDBS: (Distributed DataBase System)分布式数据库系统,是一个物理上分散而逻辑上集中的数据集。
2.Transparency:也称分布透明性(Distribution Transparency),分布透明性指用户不必关系数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关系各个场地上数据库数据模型。
分布透明性可归入物理独立性的范围。
包括三个层次:分片透明性、位置透明性和局部数据模型透明性。
3.Transaction:事务,是访问数据库的最小逻辑工作单位,它是一个操作序列。
分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上。
4.Concurrency:迸发控制,并发控制就是负责正确协调并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一致性,确保并发执行的多个事务能够正确地运行并获得正确的结果。
5.Reliability:数据库可靠性,指数据库在一个给定的时间间隔内不产生任何失败的概率。
二、简答题1、简述分布式数据库12条规则。
答:1.局部自治2.不依赖于中心节点3.不间断的处理4.位置独立性5.分片独立性6. 副本独立性7.分布式查询处理8.分布式事务管理9.硬件独立性10.操作系统独立性11.网络独立性12. DBMS独立性独立性用户可以从逻辑的高度对数据进行操作,就如同数据都存用户应该可以从逻辑的观点出发进行操作,就如同数据实际用户可以从逻辑的高度对数据进行操作,就如同根本没有副本用户应该可以从逻辑的观点出发进行操作,高可靠性,高可靠性,高可用性用户不需要了解数据实际存储的位置,用户不需要了解数据实际存储的位置在给定节点上的所有操作都是由所在节点控制的。
在给定节点上的所有操作都是由所在节点控制的。
所有的节点平等对待,不依赖中心,所有的节点平等对待,不依赖中心,主节点提供集中的的存在一样。
上并没有分片一样。
的存在一样。
上并没有分片一样。
分布式数据库试题及答案

数据库试题目录1. 九八年秋季试题 (5)1.1. 概念题 (5)1.1.1. 比较半连接方法和枚举法的优缺点。
(5)1.1.2. 2PL协议的基本思想。
(5)1.1.3. WAL协议的主要思想。
(5)1.1.4. SSPARC三级模式体系结构。
(6)1.1.5. 设计OID的数据结构时应考虑哪些问题。
(6)1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。
每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。
完成下列各种要求: (7)1.3. 下面是某学院的一个学生档案数据库的全局模式: (9)1.3.1. 将全局模式进行分片,写出分片定义和分片条件。
(9)1.3.2. 指出各分片的类型,并画出分片树。
(9)1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。
要求给出优化变换过程。
(10)1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。
对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。
(11)1.4.1. 局部分别是可串行化,而全局是不可串行化的 (11)1.4.2. 局部和全局都是可串行化的。
要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁)121.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, (12)2. 九九年春季试题 (13)2.1. DBMS解决了信息处理技术中的哪些挑战? (13)2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? (13)2.3. 简述ACID特性。
分布式数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。
逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。
另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。
二、简述分布式数据库的模式结构和各层模式的概念。
分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。
它为全局概念模式的子集,表示全局应用所涉及的数据库部分。
全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。
分片模式用于说明如何放置数据库的分片部分。
分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。
分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。
局部概念层:局部概念模式是全局概念模式的子集。
分布式数据库系统(重点解析,经典试题及答案)

第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。
(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。
(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。
(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS 的组成,DDBMS的功能和组成。
(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。
(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。
9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。
(教材P365-367)(2)分布式数据存储:分片和分配。
(教材P375-377)(3)DDB的体系结构。
(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。
(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。
·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。
这种计算环境称为分布计算。
·处理分布:指系统中处理是分布的,数据是集中的这种情况。
·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。
·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS 功能放在服务器上执行,把应用处理功能放在客户机上执行。
·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。
·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。
·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。
Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案一、选择题1、以下哪个不是Nosql分布式数据库的特点?A.高度可扩展性B.面向文档的数据模型C.严格的ACID事务D.水平扩展能力答案:C.严格的ACID事务解释:Nosql分布式数据库通常不提供严格的ACID事务,而是采用柔性事务模型,如最终一致性。
这是因为Nosql系统设计的主要目标是高可用性和高性能,而严格的ACID事务会限制这些目标的实现。
2、下列哪个不是Nosql分布式数据库的查询语言?A. SQLB. JSON查询语言C. MapReduceD.结构化查询语言答案:D.结构化查询语言解释:Nosql分布式数据库通常使用非结构化查询语言,如SQL或JSON 查询语言,而不是结构化查询语言。
这是因为Nosql数据库以非结构化和半结构化数据为主,而结构化查询语言主要用于关系型数据库中的结构化数据。
3、下列哪个是分布式Nosql数据库中的一种常用技术?A.分片技术B.复制技术C.缓存技术D.压缩技术答案:A.分片技术解释:在分布式Nosql数据库中,分片技术是一种常见的技术,用于将数据分散到多个节点上,以提高数据的可用性和扩展性。
复制技术用于数据的冗余备份,缓存技术用于提高查询速度,而压缩技术用于减少存储空间的使用。
4、下列哪个是关系型数据库的优点?A.高度可扩展性B.面向文档的数据模型C.支持严格的事务一致性D.高并发读写能力答案:C.支持严格的事务一致性解释:关系型数据库支持严格的事务一致性,这是其一个重要优点。
关系型数据库使用ACID事务,确保数据在多个操作中保持一致性。
其他选项都是Nosql分布式数据库的优点。
5、下列哪个是分布式数据库的缺点?A.复杂性增加B.性能瓶颈C.数据一致性降低D.成本增加答案:A.复杂性增加解释:分布式数据库的设计和维护比单一数据库更复杂,需要更多的技术和资源来管理。
在分布式系统中,故障恢复和数据复制等任务也更加复杂。
因此,分布式数据库的复杂性增加是其主要的缺点。
分布式数据库系统考试

分布式数据库系统考试(答案见尾页)一、选择题1. 分布式数据库系统的定义是什么?A. 一种将数据存储在多个地理位置的数据库系统中,通过分布式计算框架来管理和访问数据的一种技术。
B. 一种单一的集中式数据库系统,所有数据都存储在一个服务器上。
C. 一种将数据分割成多个部分,并分布存储在不同的服务器上的数据库系统。
D. 一种不依赖于单一服务器的数据库系统,数据可以跨多个服务器进行存储和访问。
2. 分布式数据库系统的优点包括哪些?A. 提高数据处理速度和效率。
B. 降低单点故障的风险。
C. 更好的数据冗余和容错能力。
D. 扩展性更强,可以更容易地添加新的数据和节点。
3. 以下哪个不是分布式数据库系统中的常见拓扑结构?A. 星形拓扑B. 环形拓扑C. 网状拓扑D. 树形拓扑4. 在分布式数据库系统中,什么是分片?A. 将整个数据库系统的数据分成多个部分,每个部分存放在一个单独的节点上。
B. 将数据库系统的一个或多个表按照某种规则分成多个部分。
C. 将数据库系统的数据按照某种规则分成多个部分,每个部分存放在一个单独的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存放在不同的节点上。
5. 在分布式数据库系统中,什么是复制?A. 将数据库系统的数据复制到多个节点上,以确保数据的可靠性和可用性。
B. 将数据库系统的数据存储在多个地理位置,以确保数据的可靠性和可用性。
C. 将数据库系统的数据按照某种规则分成多个部分,并存放在不同的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存储在不同的节点上。
6. 在分布式数据库系统中,什么是分布式事务?A. 一种需要在多个节点上同步更新数据的事务处理方式。
B. 一种可以在多个节点上并行处理的事务处理方式。
C. 一种需要确保数据的一致性和完整性的事务处理方式。
D. 一种可以在多个节点上同时执行的事务处理方式。
7. 分布式数据库系统中的数据一致性是指什么?A. 数据在多个节点上保持一致的状态。
分布式数据库系统架构设计考试

分布式数据库系统架构设计考试(答案见尾页)一、选择题1. 分布式数据库系统(DDBS)的三个层次及其主要特点是什么?A. 存储层、逻辑层、应用层B. 节点层、网络层、存储层C. 数据层、查询层、事务层D. 主节点层、从节点层、副本层2. 什么是分布式数据库系统的CAP理论,以及它的三个要素?A. 一致性、可用性、分区容错性B. 一致性、可用性、数据一致性C. 可用性、分区容错性、数据一致性D. 数据完整性、可用性、分区容错性3. 什么是分布式数据库系统的BASE理论,以及它的三个特性?A. 基本可用、软状态、最终一致性B. 基本可用、硬状态、即时一致性C. 基本可用、软状态、即时一致性D. 基本可用、硬状态、最终一致性4. 分布式数据库系统中的一种常见的分片技术是什么?A. 水平分片B. 垂直分片C. 分区D. 列分片5. 什么是分布式数据库系统中的一致性哈希算法?A. 通过哈希函数将关系分成不同的碎片B. 通过将关系映射到环上,并分配哈希值C. 通过将关系映射到树上,并分配哈希值D. 通过将关系映射到网格上,并分配哈希值6. 分布式数据库系统中的复制策略有哪些?A. 完全复制B. 不完全复制C. 混合复制D. 并发复制7. 什么是分布式数据库系统中的分布式事务?A. 由一组相关的本地事务组成,这些事务在逻辑上是一致的B. 由一组相关的本地事务组成,这些事务在逻辑上是一致的,并且提交或回滚C. 由一组相关的远程事务组成,这些事务在逻辑上是一致的D. 由一组相关的远程事务组成,这些事务在逻辑上是一致的,并且提交或回滚8. 分布式数据库系统中的负载均衡技术在哪个方面提高了系统性能?A. 将请求分散到多个数据库服务器上B. 提高数据库服务器的缓存性能C. 优化数据库索引D. 优化数据库查询语句9. 什么是分布式数据库系统中的数据复制?A. 将数据从一个数据库同步到另一个数据库的过程B. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性C. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性和完整性D. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性、完整性和可扩展性10. 什么是分布式数据库系统中的分区和水平分片?A. 分区是将关系分成不同的片段,水平分片是在垂直方向上分割关系B. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系C. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片D. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片,同时保证数据的一致性11. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统由多个物理上分散的数据库组成,逻辑上是一个统一的整体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。
逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。
另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。
二、简述分布式数据库的模式结构和各层模式的概念。
分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。
它为全局概念模式的子集,表示全局应用所涉及的数据库部分。
全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。
分片模式用于说明如何放置数据库的分片部分。
分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。
分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。
局部概念层:局部概念模式是全局概念模式的子集。
局部内层:局部内模式局部内模式是分布式数据库中关于物理数据库的描述,类同集中式数据库中的内模式,但其描述的内容不仅包含只局部于本站点的数据的存储描述,还包括全局数据在本站点的存储描述。
三、简述分布式数据库系统中的分布透明性,举例说明分布式数据库简单查询的各级分布透明性问题。
分布式数据库中的分布透明性即分布独立性,指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,以及各站点上数据库的数据模型等。
即全局数据的逻辑分片、片段的物理位置分配,各站点数据库的数据模型等情况对用户和用户程序透明。
分布透明性包括三个层次:分片透明性,是分布透明性中的最高层;位置透明性,也称分配透明性,是分布透明性的中间层;局部数据模型透明性,也称局部映像透明性,即与各站点上数据库的数据模型无关,是分布透明性的最底层。
四、讨论分布式数据库更新应用中的各级分布透明性问题。
分片透明性:应用程序如同数据库不是分布的那样来执行更新操作,编程人员不必知道被更新的属性是否是分片模式的定义中使用的属性。
位置透明性:应用程序员必须要知道分片情形,并将给出明确的处理。
这是一种非常简单的更新应用,最后四个语句可以任何次序或并行执行。
本地映像透明性:应用程序员必须明确地处理片段的位置。
若为更新应用,还必须考虑片段的复制问题五、数据库设计中分片设计的基本目的是什么?何为水平分片?举例说明初级分片和导出分片的方法。
分片设计的基本目的是产生一个对全局数据合适的划分方案。
使用这种方案得到的片段作为分布式数据库中数据的分配和存储单位时,不但能够减少应用中的操作量,而且能够对于应用具有最大可能的本地性,即使得各片段位于其使用最多的站点,或者说,使绝大多数应用所使用的数据位于该应用的原发站点。
但是,不是所有的全局数据都必须进行分片,应考虑到有可能一个全局关系根本不需要分片。
特别是,如果分片一个全局关系所能够获得的好处太小,不足以补偿因分片造成的开销,就不必须对该全局关系进行分片。
水平分片是对全局关系执行“选择”操作,把具有相同性质的元组进行分组,构成若干个不相交的子集。
水平分片的方法可归为初级分片和导出分片两类。
初级分片:以关系自身的属性性质为基础,执行“选择”操作,将该关系分片成若干个不相交的片段。
例如:S(S#,SNAME,AGE,SEX)Define fragment S1 as select * from s where sex = ‘M’Define fragment S2 as select * from s where sex = ‘F’导出分片:全局关系的导出式水平分片不是以其自身的属性性质为基础,而是从另一个关系的属性性质或水平片段推导出来的。
采用导出分片可使片段与片段之间的“连接”变得更容易。
例如:设全局关系 SC(S#,C#,GRADE)S(S#,SNAME,AGE,SEX)若要将SC划分为男生的各门课成绩和女生的各门课成绩。
这就不可能从SC本身的属性性质来执行选择,必须从关系S的属性性质或水平片段来导出。
define fragment SC 1 asselect SC.S#,C#,GRADE from SC,Swhere SC.S#=S.S# and SEX=’M’define fragment SC2 asselect SC.S#,C#,GRADE from SC,Swhere SC.S#=S.S# and SEX=’F’如果S已经进行水平分片,分为SF、和SM,分别为男生全体和女生全体,则上述的片段定义可以基于片段SF和SM导出:define fragment SC 1 asselect*from SC where S# in(select SF.S# from SF)define fragment SC2 asSelect * from SC where S# in(select SM.S# from SM)六、水平分片正确性原则的三个条件是什么?请说明它们的意义。
1)完整性条件。
各片段定义中的限定语集合必须是完整的,即至少是它们允许值的集合。
例如:SEX={’M’,’F’} 季节={春,夏,秋,冬}2)可重构条件。
如果限定语集合是完整的,则通过并操作总能重构全局关系。
3)不相交条件。
如果限定语之间是互斥的,它们的片段必不相交。
其意义是确定一组合适的不相交的,完整的限定语。
七、数据库的片段位置分配设计中,何为冗余分配?请简述其两种设计方法。
在确定数据片段的位置分配时,冗余分配即要每个片段映射到一个或多个站点上。
冗余分配的设计较为复杂,使用冗余分配,设计者必须决定每一片段复制的程度。
复制的利益随着检索与更新间的比值而增加,因为数据维护的一致性需要将更新传播到所有副本。
然而,系统可以允许临时不一致性,在这种情况下,复制变得更加有用。
此外,复制增加了从故障中恢复的能力,这是因为同一数据的几个副本不大可能同时全部丢失或破坏,而且当某一故障损坏被经常访问的一些副本时,应用可以访问其他的副本。
冗余分配的两种设计方法:1)“所有得益站点”法:首先确定非复制问题的解,然后在全部站点中确定一组站点,给这组中的每一站点分配片段的一个副本,这样做所得到的好处要比为此而付出的费用合算。
2)“附加复制”法:首先确定非复制的问题的解,然后从最有益处起逐步附加复制的副本,此过程直到“附加复制”已无明显好处时结束。
这种方法是典型的启迪式方法。
采用这种方法考虑到随着冗余度的增加得益逐渐减少。
一般,当一个片段只有两三个副本时,系统的得益在增加;但当副本数再增加时,系统的得益就不再明显增加。
八、举例说明数据片段分配的费用和得益估算方法。
九、请分析分布式查询策略优化的重要性(参照例3.1举例说明)。
为了实现这一查询,可以有六种可能的查询策略,如下所示:估算结果列如下表所示十、考虑教学数据库中的全局关系S(s#,sname,age,sex)和SC(s#,c#,grade)被水平分片。
S的分片限定语为:sex=“M”和sex=“F”,SC的分片限定语为:c#<=20和c#>20。
若有查询问题:“查找至少有一门课程的成绩在90分以上的男学生姓名”,它的关系代数表达式为:πsname(σsex=”M”∧grade>90(σS.s#=SC.s#(S×SC))请给出它的查询树。
按等价变换准则进行变换,并给出变换的查询树。
它的查询树如下图a,按等价变换准则进行变换后,得出b,c,d图。
十一、简述基于半连接算法的查询优化原理,举例讨论。
答案二:基本原理1. 通常有两次传输2. 但是传输的数据量和传输整个关系相比,要远远少3. 一般有:T半<<T全4. 半连接的得益:当card(R)>>card(R’),可减少站点间的数据传输量5. 半连接的损失:传输 B (S) =C0+C1* size (B)* val( B[S])6. 基本原理是在传到另一个站点做连接前,消除与连接无关的数据,减少做连接操作的数据量,从而减小传输代价十二、假定站点1上的关系R和站点2上的关系S在属性R.A和S.B上做关于R.A=S.B 的连接操作。
请用半连接方法表示该连接操作,画出相应的示意图,给出代价估算分析。
答案:当连接操作采用半连接方法表示时,有采用半连接方法表示连接操作示意图如下图所示:因传输代价可用下式估算:T=C0+C1*X则:十三、假定一个查询要进行关系R1和R2的连接,R1和R2的数据分布如图所示。
设片段大小为F11=50,F12=50,F21=100,F22=200;数据通信代价由C(x)=x给出(即C0=0,C1=1);每个站点上的本地连接代价由J(x1,x2)=5*(x1+x2)给出,且每个站点上的并操作代价∪(x1,x2)=2*(x1+ x2)。
请分别计算FT(Q,S1,R1)、FT(Q,S2,R1)、FT(Q,S1,R2)、FT(Q,S2,R2),并据此,选择在基于直接连接算法的查询优化中哪一个关系保持分片状态。
站点S1S2关系R1F11 F12 R2F21F22答案:当关系R1保持分片状态时,站点S1的完成时间FR(Q,S1,R1)为:FT(Q,S1,R1)=200+2*(100+200)+5*(50+300)=2550,其中200是传送F22的通信代价,2*(100+200)是F21和F22的并操作代价,5*(50+300)是R2和F11的连接操作代价。
同样地,FT(Q,S2,R1)=100+2*(100+200)+5*(50+300)=2450.因此,查询的响应时间在R1保持分片状态时为2550。