分布式数据库系统复习题

合集下载

分布式数据库试题及答案

分布式数据库试题及答案

数据库试题目录1. 九八年秋季试题 (5)1.1. 概念题 (5)1.1.1. 比较半连接方法和枚举法的优缺点。

(5)1.1.2. 2PL协议的基本思想。

(5)1.1.3. WAL协议的主要思想。

(5)1.1.4. SSPARC三级模式体系结构。

(5)1.1.5. 设计OID的数据结构时应考虑哪些问题。

(6)1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。

每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。

完成下列各种要求: (7)1.3. 下面是某学院的一个学生档案数据库的全局模式: (9)1.3.1. 将全局模式进行分片,写出分片定义和分片条件。

(9)1.3.2. 指出各分片的类型,并画出分片树。

(9)1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。

要求给出优化变换过程。

(10)1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。

对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。

(11)1.4.1. 局部分别是可串行化,而全局是不可串行化的 (11)1.4.2. 局部和全局都是可串行化的。

要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁)121.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, (12)2. 九九年春季试题 (13)2.1. DBMS解决了信息处理技术中的哪些挑战? (13)2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? (13)2.3. 简述ACID特性。

分布式系统复习题及参考答案

分布式系统复习题及参考答案

关于分布式系统复习题与参考答案一、填空题(每题n分,答错个扣分,全错全扣g,共计m分)1.访问透明性是指对不同数据表示形式以及资源访问方式的隐藏。

而位置透明是用户无法判别资源在系统中的物理位置。

2. 迁移透明性是指分布式系统中的资源移动不会影响该资源的访问方式。

而复制透明是指对同一个资源存在多个副本的隐藏。

3. 一个开放的分布式系统就是根据一系列准则来提供服务,这些准则描述了所提供服务的语法和语义。

4. 集群计算系统一个突出的特征是它的同构性;它提供了最大限度的分布式透明性。

可用于单个程序在多台计算机上并行地运行。

5. 网格计算系统具有高度的异构性:其硬件、操作系统、网络、管理域和安全策略等都不尽相同。

6. 网格计算系统一个关键问题是如何把来自不同计算机组织的资源集中起来,使一组人或机构进行协调工作。

7. 分布式事务处理的四个特性是:原子性、一致性、独立性和持久性。

8. 分布式普适系统应用程序的需求归纳为三种,它们是:接受上下文的变化、促使自主合成、认可共享为默认行为。

9. 分布式系统体系结构样式很多,其最重要的有:分层体系结构;基于对象的体系结构、以数据为中心的体系结构以及基于事件的体系结构等四类。

10. 客户/服务器结构的应用程序通常划分为三层,它们是:用户接口层、处理层和数据层。

11. 在结构化点对点体系结构中覆盖网络是用一个确定性的过程来构成的,这个使用最多的进程是通过一个分布式哈希表来组织进程的。

12. 超级对等体通常是维护一个索引或充当一个代理程序的结点。

13. 分布式软件体系结构主要分集中式、非集中式和各种混合形式三大类。

其非集中式体系结构又分为结构化的点对点、非结构化的点对点、超级对等体三种。

14. 实现软件自适应的基本技术分为要点分离、计算映像和基于组件的设计三种类型。

15. 分布式的自主系统指的是自我管理、自我恢复、自我配置和自我优化等各种自适应性。

16. 一个线程独立地执行它自己的程序代码。

分布式数据库复习题(佟玉君).doc

分布式数据库复习题(佟玉君).doc

一、名词解释1.DDBS: (Distributed DataBase System)分布式数据库系统,是一个物理上分散而逻辑上集中的数据集。

2.Transparency:也称分布透明性(Distribution Transparency),分布透明性指用户不必关系数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关系各个场地上数据库数据模型。

分布透明性可归入物理独立性的范围。

包括三个层次:分片透明性、位置透明性和局部数据模型透明性。

3.Transaction:事务,是访问数据库的最小逻辑工作单位,它是一个操作序列。

分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上。

4.Concurrency:迸发控制,并发控制就是负责正确协调并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一致性,确保并发执行的多个事务能够正确地运行并获得正确的结果。

5.Reliability:数据库可靠性,指数据库在一个给定的时间间隔内不产生任何失败的概率。

二、简答题1、简述分布式数据库12条规则。

答:1.局部自治2.不依赖于中心节点3.不间断的处理4.位置独立性5.分片独立性6. 副本独立性7.分布式查询处理8.分布式事务管理9.硬件独立性10.操作系统独立性11.网络独立性12. DBMS独立性独立性用户可以从逻辑的高度对数据进行操作,就如同数据都存用户应该可以从逻辑的观点出发进行操作,就如同数据实际用户可以从逻辑的高度对数据进行操作,就如同根本没有副本用户应该可以从逻辑的观点出发进行操作,高可靠性,高可靠性,高可用性用户不需要了解数据实际存储的位置,用户不需要了解数据实际存储的位置在给定节点上的所有操作都是由所在节点控制的。

在给定节点上的所有操作都是由所在节点控制的。

所有的节点平等对待,不依赖中心,所有的节点平等对待,不依赖中心,主节点提供集中的的存在一样。

上并没有分片一样。

的存在一样。

上并没有分片一样。

分布式数据库试题及答案

分布式数据库试题及答案

数据库试题目录1. 九八年秋季试题 (5)1.1. 概念题 (5)1.1.1. 比较半连接方法和枚举法的优缺点。

(5)1.1.2. 2PL协议的基本思想。

(5)1.1.3. WAL协议的主要思想。

(5)1.1.4. SSPARC三级模式体系结构。

(6)1.1.5. 设计OID的数据结构时应考虑哪些问题。

(6)1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。

每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。

完成下列各种要求: (7)1.3. 下面是某学院的一个学生档案数据库的全局模式: (9)1.3.1. 将全局模式进行分片,写出分片定义和分片条件。

(9)1.3.2. 指出各分片的类型,并画出分片树。

(9)1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。

要求给出优化变换过程。

(10)1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。

对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。

(11)1.4.1. 局部分别是可串行化,而全局是不可串行化的 (11)1.4.2. 局部和全局都是可串行化的。

要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁)121.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, (12)2. 九九年春季试题 (13)2.1. DBMS解决了信息处理技术中的哪些挑战? (13)2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? (13)2.3. 简述ACID特性。

分布式数据库系统复习题

分布式数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。

因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。

一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。

逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。

站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。

另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。

二、简述分布式数据库的模式结构和各层模式的概念。

分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。

它为全局概念模式的子集,表示全局应用所涉及的数据库部分。

全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。

分片模式用于说明如何放置数据库的分片部分。

分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。

分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。

局部概念层:局部概念模式是全局概念模式的子集。

分布式数据库系统(重点解析,经典试题及答案)

分布式数据库系统(重点解析,经典试题及答案)

第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。

(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。

(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。

(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS 的组成,DDBMS的功能和组成。

(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。

(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。

9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。

(教材P365-367)(2)分布式数据存储:分片和分配。

(教材P375-377)(3)DDB的体系结构。

(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。

(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。

·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。

这种计算环境称为分布计算。

·处理分布:指系统中处理是分布的,数据是集中的这种情况。

·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。

·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS 功能放在服务器上执行,把应用处理功能放在客户机上执行。

·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。

·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。

·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案第一章1.交易型系统,比如银行核心系统对一致性和可用性要求比较高,基本上选择关系型数据库系统进行数据的管理,由于它放弃了分区容错性,因此系统在扩展上存在限制。

True/ false2.以下哪些是NoSQL数据库的特点?A .NoSQL数据满足最终一致性 B. 灵活的数据模式C.NoSQL集群的可扩展性强,可动态添加和删除节点D.数据以多副本的方式存放在不同节点上3.Base的核心思想是无法做到强一致性,但每个应用都可以根据自身的特点,采用适当方式达到最终一致性。

TrueFalse4.适合于存储大量复杂、互连接的数据类型,比如人际交往、推荐系统和知识图谱的NoSQL 数据库有:A.MongoDB B. Neo4j C. Redis D. HBase5.NoSQL是指no SQL,表示用非关系型数据库替代关系型数据库。

True/ False6.NoSQL数据库种类比较繁多,以下哪些是NoSQL数据库?A. HBaseB. MongoDBC. RedisD. Oracle7.数据库(Database)是按照一定的数据模型来组织、存储和管理数据的仓库。

操作系统里的文件夹可看作是一个数据库。

True /False8.数据模型(Data Model)是数据特征的抽象。

数据模型所描述的内容有三部分,分别为数据结构、数据操作和数据约束。

True False9.在一个分布式系统中可以同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项要。

True/False10.大数据时代,数据的存储与管理有哪些要求?A.数据管理系统具有很高的扩展性,适应海量数据的迅速增长!B.满足完整性的约束条件C.满足用户的高并发读写D.要适应多变的数据结构11.数据库按逻辑模型进行区分,有关系模型、层次模型、网状模型等,以下哪个是层次模型数据库。

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案一、选择题1、以下哪个不是Nosql分布式数据库的特点?A.高度可扩展性B.面向文档的数据模型C.严格的ACID事务D.水平扩展能力答案:C.严格的ACID事务解释:Nosql分布式数据库通常不提供严格的ACID事务,而是采用柔性事务模型,如最终一致性。

这是因为Nosql系统设计的主要目标是高可用性和高性能,而严格的ACID事务会限制这些目标的实现。

2、下列哪个不是Nosql分布式数据库的查询语言?A. SQLB. JSON查询语言C. MapReduceD.结构化查询语言答案:D.结构化查询语言解释:Nosql分布式数据库通常使用非结构化查询语言,如SQL或JSON 查询语言,而不是结构化查询语言。

这是因为Nosql数据库以非结构化和半结构化数据为主,而结构化查询语言主要用于关系型数据库中的结构化数据。

3、下列哪个是分布式Nosql数据库中的一种常用技术?A.分片技术B.复制技术C.缓存技术D.压缩技术答案:A.分片技术解释:在分布式Nosql数据库中,分片技术是一种常见的技术,用于将数据分散到多个节点上,以提高数据的可用性和扩展性。

复制技术用于数据的冗余备份,缓存技术用于提高查询速度,而压缩技术用于减少存储空间的使用。

4、下列哪个是关系型数据库的优点?A.高度可扩展性B.面向文档的数据模型C.支持严格的事务一致性D.高并发读写能力答案:C.支持严格的事务一致性解释:关系型数据库支持严格的事务一致性,这是其一个重要优点。

关系型数据库使用ACID事务,确保数据在多个操作中保持一致性。

其他选项都是Nosql分布式数据库的优点。

5、下列哪个是分布式数据库的缺点?A.复杂性增加B.性能瓶颈C.数据一致性降低D.成本增加答案:A.复杂性增加解释:分布式数据库的设计和维护比单一数据库更复杂,需要更多的技术和资源来管理。

在分布式系统中,故障恢复和数据复制等任务也更加复杂。

因此,分布式数据库的复杂性增加是其主要的缺点。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。

因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。

一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。

逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。

站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。

另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。

二、简述分布式数据库的模式结构和各层模式的概念。

分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。

它为全局概念模式的子集,表示全局应用所涉及的数据库部分。

全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。

分片模式用于说明如何放置数据库的分片部分。

分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。

分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。

局部概念层:局部概念模式是全局概念模式的子集。

局部内层:局部内模式局部内模式是分布式数据库中关于物理数据库的描述,类同集中式数据库中的内模式,但其描述的内容不仅包含只局部于本站点的数据的存储描述,还包括全局数据在本站点的存储描述。

三、简述分布式数据库系统中的分布透明性,举例说明分布式数据库简单查询的各级分布透明性问题。

分布式数据库中的分布透明性即分布独立性,指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,以及各站点上数据库的数据模型等。

即全局数据的逻辑分片、片段的物理位置分配,各站点数据库的数据模型等情况对用户和用户程序透明。

分布透明性包括三个层次:分片透明性,是分布透明性中的最高层;位置透明性,也称分配透明性,是分布透明性的中间层;局部数据模型透明性,也称局部映像透明性,即与各站点上数据库的数据模型无关,是分布透明性的最底层。

四、讨论分布式数据库更新应用中的各级分布透明性问题。

分片透明性:应用程序如同数据库不是分布的那样来执行更新操作,编程人员不必知道被更新的属性是否是分片模式的定义中使用的属性。

位置透明性:应用程序员必须要知道分片情形,并将给出明确的处理。

这是一种非常简单的更新应用,最后四个语句可以任何次序或并行执行。

本地映像透明性:应用程序员必须明确地处理片段的位置。

若为更新应用,还必须考虑片段的复制问题五、数据库设计中分片设计的基本目的是什么?何为水平分片?举例说明初级分片和导出分片的方法。

分片设计的基本目的是产生一个对全局数据合适的划分方案。

使用这种方案得到的片段作为分布式数据库中数据的分配和存储单位时,不但能够减少应用中的操作量,而且能够对于应用具有最大可能的本地性,即使得各片段位于其使用最多的站点,或者说,使绝大多数应用所使用的数据位于该应用的原发站点。

但是,不是所有的全局数据都必须进行分片,应考虑到有可能一个全局关系根本不需要分片。

特别是,如果分片一个全局关系所能够获得的好处太小,不足以补偿因分片造成的开销,就不必须对该全局关系进行分片。

水平分片是对全局关系执行“选择”操作,把具有相同性质的元组进行分组,构成若干个不相交的子集。

水平分片的方法可归为初级分片和导出分片两类。

初级分片:以关系自身的属性性质为基础,执行“选择”操作,将该关系分片成若干个不相交的片段。

例如:S(S#,SNAME,AGE,SEX)Define fragment S1 as select * from s where sex = ‘M’Define fragment S2 as select * from s where sex = ‘F’导出分片:全局关系的导出式水平分片不是以其自身的属性性质为基础,而是从另一个关系的属性性质或水平片段推导出来的。

采用导出分片可使片段与片段之间的“连接”变得更容易。

例如:设全局关系 SC(S#,C#,GRADE)S(S#,SNAME,AGE,SEX)若要将SC划分为男生的各门课成绩和女生的各门课成绩。

这就不可能从SC本身的属性性质来执行选择,必须从关系S的属性性质或水平片段来导出。

define fragment SC 1 asselect SC.S#,C#,GRADE from SC,Swhere SC.S#=S.S# and SEX=’M’define fragment SC2 asselect SC.S#,C#,GRADE from SC,Swhere SC.S#=S.S# and SEX=’F’如果S已经进行水平分片,分为SF、和SM,分别为男生全体和女生全体,则上述的片段定义可以基于片段SF和SM导出:define fragment SC 1 asselect*from SC where S# in(select SF.S# from SF)define fragment SC2 asSelect * from SC where S# in(select SM.S# from SM)六、水平分片正确性原则的三个条件是什么?请说明它们的意义。

1)完整性条件。

各片段定义中的限定语集合必须是完整的,即至少是它们允许值的集合。

例如:SEX={’M’,’F’} 季节={春,夏,秋,冬}2)可重构条件。

如果限定语集合是完整的,则通过并操作总能重构全局关系。

3)不相交条件。

如果限定语之间是互斥的,它们的片段必不相交。

其意义是确定一组合适的不相交的,完整的限定语。

七、数据库的片段位置分配设计中,何为冗余分配?请简述其两种设计方法。

在确定数据片段的位置分配时,冗余分配即要每个片段映射到一个或多个站点上。

冗余分配的设计较为复杂,使用冗余分配,设计者必须决定每一片段复制的程度。

复制的利益随着检索与更新间的比值而增加,因为数据维护的一致性需要将更新传播到所有副本。

然而,系统可以允许临时不一致性,在这种情况下,复制变得更加有用。

此外,复制增加了从故障中恢复的能力,这是因为同一数据的几个副本不大可能同时全部丢失或破坏,而且当某一故障损坏被经常访问的一些副本时,应用可以访问其他的副本。

冗余分配的两种设计方法:1)“所有得益站点”法:首先确定非复制问题的解,然后在全部站点中确定一组站点,给这组中的每一站点分配片段的一个副本,这样做所得到的好处要比为此而付出的费用合算。

2)“附加复制”法:首先确定非复制的问题的解,然后从最有益处起逐步附加复制的副本,此过程直到“附加复制”已无明显好处时结束。

这种方法是典型的启迪式方法。

采用这种方法考虑到随着冗余度的增加得益逐渐减少。

一般,当一个片段只有两三个副本时,系统的得益在增加;但当副本数再增加时,系统的得益就不再明显增加。

八、举例说明数据片段分配的费用和得益估算方法。

九、请分析分布式查询策略优化的重要性(参照例3.1举例说明)。

为了实现这一查询,可以有六种可能的查询策略,如下所示:估算结果列如下表所示十、考虑教学数据库中的全局关系S(s#,sname,age,sex)和SC(s#,c#,grade)被水平分片。

S的分片限定语为:sex=“M”和sex=“F”,SC的分片限定语为:c#<=20和c#>20。

若有查询问题:“查找至少有一门课程的成绩在90分以上的男学生姓名”,它的关系代数表达式为:πsname(σsex=”M”∧grade>90(σS.s#=SC.s#(S×SC))请给出它的查询树。

按等价变换准则进行变换,并给出变换的查询树。

它的查询树如下图a,按等价变换准则进行变换后,得出b,c,d图。

十一、简述基于半连接算法的查询优化原理,举例讨论。

答案二:基本原理1. 通常有两次传输2. 但是传输的数据量和传输整个关系相比,要远远少3. 一般有:T半<<T全4. 半连接的得益:当card(R)>>card(R’),可减少站点间的数据传输量5. 半连接的损失:传输 B (S) =C0+C1* size (B)* val( B[S])6. 基本原理是在传到另一个站点做连接前,消除与连接无关的数据,减少做连接操作的数据量,从而减小传输代价十二、假定站点1上的关系R和站点2上的关系S在属性R.A和S.B上做关于R.A=S.B 的连接操作。

请用半连接方法表示该连接操作,画出相应的示意图,给出代价估算分析。

答案:当连接操作采用半连接方法表示时,有采用半连接方法表示连接操作示意图如下图所示:因传输代价可用下式估算:T=C0+C1*X则:十三、假定一个查询要进行关系R1和R2的连接,R1和R2的数据分布如图所示。

设片段大小为F11=50,F12=50,F21=100,F22=200;数据通信代价由C(x)=x给出(即C0=0,C1=1);每个站点上的本地连接代价由J(x1,x2)=5*(x1+x2)给出,且每个站点上的并操作代价∪(x1,x2)=2*(x1+ x2)。

请分别计算FT(Q,S1,R1)、FT(Q,S2,R1)、FT(Q,S1,R2)、FT(Q,S2,R2),并据此,选择在基于直接连接算法的查询优化中哪一个关系保持分片状态。

答案:当关系R1保持分片状态时,站点S1的完成时间FR(Q,S1,R1)为:FT(Q,S1,R1)=200+2*(100+200)+5*(50+300)=2550,其中200是传送F22的通信代价,2*(100+200)是F21和F22的并操作代价,5*(50+300)是R2和F11的连接操作代价。

同样地,FT(Q,S2,R1)=100+2*(100+200)+5*(50+300)=2450.因此,查询的响应时间在R1保持分片状态时为2550。

同样计算R2保持分片状态时得到FT(Q,S1,R2)=50+2*(50+50)+5*(100+100)=1250FT(Q,S1,R2)=50+2*(50+50)+5*(100+200)=1750因此,在R2保持分片状态时,查询的响应时间1750。

相关文档
最新文档