分布式数据库系统知识点及习题
分布式系统基础考试

分布式系统基础考试(答案见尾页)一、选择题1. 分布式系统的定义是什么?A. 由多个计算机组成的系统,这些计算机通过网络进行通信和协调B. 一个提供分布式服务的计算机系统C. 一种软件技术,使得应用程序可以跨多个硬件和操作系统运行D. 一种允许多个用户同时访问和操作的系统2. 分布式系统中的“分布式”一词的含义是什么?A. 多个系统独立运行B. 数据存储在多个位置C. 系统具有高可用性和容错性D. 所有节点都可以独立完成任务3. 分布式系统的核心特性是什么?A. 并发性B. 透明性C. 可伸缩性D. 容错性4. 分布式系统中的节点可以是哪种类型?A. 服务器B. 桌面电脑C. 移动设备D. 所有这些都可能5. 分布式系统中的通信协议有哪些?A. HTTPB. TCP/IPC. UDPD. 所有这些都可能6. 分布式系统中的数据一致性是指什么?A. 所有节点上的数据完全相同B. 所有节点上的数据保持同步更新C. 所有节点上的数据在某个时间点相同D. 所有节点上的数据可以不同7. 分布式系统中的负载均衡是什么?A. 将请求平均分配到多个服务器B. 将流量限制到单个服务器C. 将流量分散到多个服务器D. 将流量全部转发到单个服务器8. 分布式系统中的复制是什么?A. 在多个节点上创建数据的副本B. 将数据存储在远程位置C. 将数据加密D. 将数据存储在本地9. 分布式系统中的CAP理论指的是什么?A. 一致性、可用性和分区容错性之间的权衡B. 一致性、可用性和性能之间的权衡C. 一致性、可用性和可伸缩性之间的权衡D. 一致性、可用性和安全性之间的权衡10. 分布式系统中的分布式事务是什么?A. 一种需要在多个节点上同步执行的事务B. 一种可以在多个节点上并行执行的事务C. 一种不能在多个节点上同步执行的事务D. 一种可以在多个节点上同步执行但不需要一致性的事务11. 分布式系统的定义是什么?A. 一组独立的计算机通过网络进行通信和协作B. 一个硬件和软件的组合,能够在多个处理器上运行C. 一个提供分布式服务的互联网D. 一个由多个服务器组成的系统,每个服务器都有自己的资源12. 分布式系统中的“分布式”一词意味着什么?A. 多个系统组件位于不同的地理位置B. 多个系统组件共同工作以完成一项任务C. 多个系统组件独立地运行并相互通信D. 多个系统组件共享数据和资源13. 分布式系统中的节点可以是哪种类型?A. 主节点B. 从节点C. 客户端D. 所有类型的节点14. 分布式系统中的数据复制是为了什么目的?A. 提高系统性能B. 防止数据丢失C. 提高数据的可用性D. 保证数据的一致性15. 分布式系统中的负载均衡是一种什么技术?A. 将请求分配到多个服务器以优化性能B. 将流量限制到特定的服务器以避免拥塞C. 将客户端的请求直接路由到正确的服务器D. 使用一种算法来决定哪个服务器应该处理哪个请求16. 分布式系统中的共识算法是什么?A. 一种确保所有节点对数据的一致性达成一致的技术B. 一种用于同步不同节点之间的数据状态的技术C. 一种用于检测和处理网络延迟的技术D. 一种用于管理分布式系统中的故障的技术17. 分布式系统中的容错机制是什么?A. 一种确保系统在部分组件失败时仍能正常运行的技术B. 一种用于检测和修复系统错误的技术C. 一种用于保护系统免受恶意攻击的技术D. 一种用于限制系统中的用户数量的技术18. 分布式系统中的数据分片是什么?A. 将数据分割成小块以便于存储在不同的位置B. 将数据分割成小块以便于在不同的硬件设备上存储C. 将数据分割成小块以便于在不同的网络上进行传输D. 将数据分割成小块以便于在不同的时间点进行访问19. 分布式系统中的消息传递机制是什么?A. 一种用于在节点之间传递消息的技术B. 一种用于在节点之间同步数据的技术C. 一种用于在节点之间交换数据的技术D. 一种用于在节点之间协调任务的技术20. 分布式系统中的安全性是指什么?A. 保护系统免受未经授权的访问B. 保护系统免受未经授权的修改C. 保护系统免受未经授权的数据泄露D. 保护系统免受所有上述威胁21. 分布式系统的定义是什么?A. 一组计算机通过互联网进行通信和协调的系统B. 一个硬件和软件集合,能够在有限时间内处理大量数据C. 一个提供分布式服务的互联网系统D. 一种允许多个用户访问和共享资源的网络架构22. 分布式系统中的“分布式”一词意味着什么?A. 多个系统独立运行B. 数据存储在多个位置C. 系统具有高可用性和可扩展性D. 所有节点共同工作以完成特定任务23. 分布式系统的核心特性包括哪些?A. 可靠性B. 可用性C. 并发性D. 容错性24. 在分布式系统中,通常使用哪种通信协议?A. HTTPB. TCP/IPC. UDPD. ICMP25. 分布式系统中的“容错性”是什么意思?A. 系统在部分组件失败时仍能继续运行的能力B. 系统能够自动恢复丢失的数据或进程的能力C. 系统能够自我调整以避免单点故障的能力D. 系统能够确保所有节点之间的同步性26. 分布式数据库的概念是什么?A. 一个包含多个数据副本的数据库,以提高数据可用性和性能B. 一个只有一个数据副本的数据库C. 一个动态调整数据分布的数据库D. 一个支持实时数据更新的数据库27. 分布式系统的设计原则之一是什么?A. 高度集权B. 高度分散C. 高度可伸缩性28. 在分布式系统中,什么是“微服务”?A. 一种特定的编程风格或架构模式,其中应用程序被拆分成一系列小型服务B. 一种分布式系统的实现技术C. 一种单一的、集中的服务D. 一种特定的数据存储技术29. 分布式系统中的“同步”和“异步”有什么区别?A. 同步是指多个进程或线程在同一时间访问同一资源B. 异步是指多个进程或线程在不同的时间访问同一资源C. 同步通常用于需要数据一致性的场景D. 异步通常用于需要提高系统性能的场景30. 分布式系统的发展历程及其在不同领域中的应用有哪些?A. 分布式系统的发展始于20世纪80年代B. 分布式系统广泛应用于大数据处理、云计算、物联网等领域C. 分布式系统的发展受到了计算机网络技术的影响D. 分布式系统是现代计算机系统的基本组成部分31. 分布式系统的定义是什么?A. 一组通过网络进行通信的计算机系统B. 一个硬件和软件的组合,可以在多个位置进行数据处理和存储C. 一种允许多个服务器共享资源和数据的系统D. 一种设计用于处理大量数据并保证数据一致性的系统32. 分布式系统中的“分布式”一词意味着什么?A. 多个系统独立运行B. 资源共享C. 数据备份D. 所有这些都正确33. 分布式系统的核心特性是什么?B. 高可用性C. 任务无关性D. 资源共享34. 分布式系统中的“并发”是指什么?A. 同时执行多个任务B. 同时访问同一资源C. 同时处理多个数据流D. 同时修改数据库35. 以下哪个选项不是分布式系统中的常见同步问题?A. 机器之间的网络延迟B. 任务执行的先后顺序C. 共享资源的访问冲突D. 数据一致性问题36. 分布式系统中的“透明性”是指什么?A. 用户感觉好像所有的系统组件都在本地运行B. 系统管理员可以远程管理所有组件C. 应用程序的数据和代码在主机之间是可移植的D. 所有这些都正确37. 以下哪个分布式算法不是CAP定理中提到的?A. 客户端-服务器算法B. 一致性算法C. 分区容错算法D. 内容分发算法38. 分布式系统中的“分区容错”是什么意思?A. 在网络故障时,系统仍然可以运行B. 在网络分区时,系统能够继续运行C. 在网络拥堵时,系统仍然可以运行D. 在网络配置错误时,系统能够继续运行39. 以下哪个选项不是分布式系统中的常见性能指标?A. 响应时间B. 可扩展性C. 容错性D. 资源利用率40. 分布式系统与传统集中式系统的最大区别是什么?A. 可靠性更高B. 可伸缩性更好C. 无需依赖中央控制点D. 所有这些都正确二、问答题1. 什么是分布式系统?请简述其基本特性。
分布式数据库实战案例考试

分布式数据库实战案例考试(答案见尾页)一、选择题1. 分布式数据库的优势是什么?A. 高可用性B. 高性能C. 灵活扩展性D. 扩展性2. 分布式数据库中,哪个概念指的是将数据分散存储在多个节点上,每个节点可以独立处理自己的数据?A. 分片B. 复制C. 分区D. 事务3. 在分布式数据库中,什么是主从复制(Master-Slave Replication)?A. 主节点负责读取和写入,从节点负责读取B. 主节点负责写入,从节点负责读取和写入C. 主节点负责读取,从节点负责写入D. 主节点负责写入和读取,从节点只负责读取4. 什么是分布式事务?它为什么重要?A. 分布式事务是指在多个节点上同步执行的事务B. 分布式事务是指在不同节点上同步执行的事务C. 分布式事务很重要,因为它确保了数据的一致性和完整性D. 分布式事务很重要,因为它确保了数据的一致性和完整性5. 在分布式数据库中,什么是分片(Sharding)?A. 将数据分割成不同的片段,每个片段存放在不同的节点上B. 将数据分割成不同的片段,每个片段存放在同一个节点上C. 将数据分割成不同的片段,每个片段存放在不同的节点上,并且按照某种规则进行分布D. 将数据分割成不同的片段,每个片段存放在不同的节点上,并且按照某种规则进行分布6. 分布式数据库中的复制策略有哪些?A. 单主复制B. 多主复制C. 混合复制D. 等级复制7. 什么是分布式数据库中的分区和分片?A. 分区是将数据库数据分成不同的物理区域B. 分片是将数据库数据分成逻辑上独立的片段C. 分区是将数据库数据分成不同的物理区域,并且按照某种规则进行分布D. 分片是将数据库数据分成逻辑上独立的片段,并且按照某种规则进行分布8. 在分布式数据库中,什么是读写分离?A. 将读操作和写操作分开在不同的节点上进行B. 将写操作和读操作分开在不同的节点上进行C. 将所有的写操作集中在一个节点上进行D. 将所有的读操作集中在一个节点上进行9. 什么是分布式数据库中的冲突解决策略?A. 乐观锁B. 悲观锁C. 最后写入胜利(Last Write Wins)D. 分布式事务10. 在分布式数据库中,什么是CAP理论?A. 一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)之间的权衡B. 一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)之间的权衡C. 一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)之间的权衡D. 一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)之间的权衡11. 分布式数据库与传统数据库的主要区别是什么?A. 数据存储位置B. 数据复制方式C. 事务处理能力D. 数据库管理复杂性12. 在分布式数据库中,通常使用什么技术来实现数据的复制和同步?A. 触发器B. 索引C. 分区D. 消息队列13. 分布式数据库中的“分片”是指什么?A. 将数据分割成不同的部分,分别存储在不同的节点上B. 提高数据库系统的可用性C. 数据备份的一种策略D. 数据迁移的一种方法14. 在分布式数据库中,什么是“读写分离”?A. 将读操作和写操作分开在不同的节点上进行B. 将数据分布在多个节点上,每个节点负责一部分数据C. 提高数据访问速度D. 数据同步的一种策略15. 分布式数据库中的“灰度发布”是什么意思?A. 逐步将新功能推送给部分用户,检查反馈后决定是否全面推广B. 一种数据库管理技术C. 数据库故障时的应对措施D. 数据备份的一种策略16. 在分布式数据库中,如何实现跨地域的数据备份?A. 使用分布式事务B. 异步数据复制C. 同步数据复制D. 使用数据库自身的备份功能17. 分布式数据库中的“分布式事务”有什么特点?A. 保证在不同节点上的数据一致性和完整性B. 支持只读操作C. 无锁机制D. 高并发场景下的性能优越性18. 在分布式数据库中,如何处理跨节点的并发访问问题?A. 使用分布式锁B. 优化数据库访问代码C. 使用数据库层面的隔离机制D. 使用中间件进行请求转发19. 分布式数据库中的“主从复制”是什么含义?A. 主节点负责读取,从节点负责写入B. 主节点负责写入,从节点负责读取C. 从节点可以自动同步主节点的数据变更D. 主节点的数据更新需要手动同步到从节点20. 在分布式数据库中,如何评估系统的性能和可扩展性?A. 监控节点的CPU和内存使用情况B. 分析查询响应时间和事务吞吐量C. 测试系统的峰值负载能力D. 估算数据量和节点数量,计算理论上的性能瓶颈21. 在分布式数据库中,通常使用什么技术来实现数据分片?A. 子查询B. 二维表格C. 代码分区D. 分区表22. 分布式数据库中的“弱一致性”指的是什么?A. 数据在修改后,需要一段时间才能被其他事务读取到。
分布式数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。
逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。
另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。
二、简述分布式数据库的模式结构和各层模式的概念。
分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。
它为全局概念模式的子集,表示全局应用所涉及的数据库部分。
全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。
分片模式用于说明如何放置数据库的分片部分。
分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。
分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。
局部概念层:局部概念模式是全局概念模式的子集。
分布式数据库系统复习材料

分布式数据库系统复习材料在学习和复习分布式数据库系统时,需要掌握以下几个关键知识点:1.分布式数据库架构:分布式数据库系统可以采用集中式架构、两层架构、三层架构等不同的架构模式。
其中集中式架构通过一个中央服务器管理所有的数据,两层架构将数据分为客户端和服务器两部分进行管理,三层架构引入中间层服务器来协调不同的功能和数据层。
2.分布式数据库一致性:分布式数据库系统需要保证数据的一致性。
数据的一致性可以通过ACID原则来保证,即原子性、一致性、隔离性和持久性。
此外,还可以使用分布式事务来保证数据的一致性,分布式事务可以通过两阶段提交(2PC)或者三阶段提交(3PC)来实现。
3.分布式数据库的查询:分布式数据库系统可以进行分布式查询,即将查询请求分发给不同的节点进行处理。
常用的查询分发策略包括哈希分发、范围分发和复制分发。
哈希分发根据查询内容的哈希值将查询请求分发到对应的节点上,范围分发根据数据的范围将查询请求分发到对应节点上,复制分发将查询请求分发到多个节点上进行处理。
4.分布式数据库的数据复制:分布式数据库系统可以通过数据复制来提高数据的可靠性和性能。
数据复制可以采用同步复制或者异步复制方式。
同步复制要求数据在所有节点上都写入成功后才算成功,而异步复制则可以先将数据写入一个节点,然后再异步地将数据复制到其他节点上。
5.分布式数据库的容错与恢复:分布式数据库系统需要具备容错和恢复机制,以应对节点故障或者网络故障等异常情况。
常用的容错机制包括故障检测、容错存储和故障恢复。
故障检测可以通过心跳机制或者节点监视来实现,容错存储可以通过数据备份或者数据冗余来实现,故障恢复可以通过副本恢复或者数据迁移来实现。
6.分布式数据库的性能优化:分布式数据库系统可以通过多种方式来优化性能。
常用的性能优化方法包括数据分片、负载均衡和缓存机制。
数据分片可以将数据分散到不同的节点上,以减轻节点的负载;负载均衡可以将查询请求均匀地分发到各个节点上,以提高查询的响应速度;缓存机制可以将频繁查询的数据缓存在节点上,以减少磁盘访问,提高查询性能。
分布式数据库系统考试

分布式数据库系统考试(答案见尾页)一、选择题1. 分布式数据库系统的定义是什么?A. 一种将数据存储在多个地理位置的数据库系统中,通过分布式计算框架来管理和访问数据的一种技术。
B. 一种单一的集中式数据库系统,所有数据都存储在一个服务器上。
C. 一种将数据分割成多个部分,并分布存储在不同的服务器上的数据库系统。
D. 一种不依赖于单一服务器的数据库系统,数据可以跨多个服务器进行存储和访问。
2. 分布式数据库系统的优点包括哪些?A. 提高数据处理速度和效率。
B. 降低单点故障的风险。
C. 更好的数据冗余和容错能力。
D. 扩展性更强,可以更容易地添加新的数据和节点。
3. 以下哪个不是分布式数据库系统中的常见拓扑结构?A. 星形拓扑B. 环形拓扑C. 网状拓扑D. 树形拓扑4. 在分布式数据库系统中,什么是分片?A. 将整个数据库系统的数据分成多个部分,每个部分存放在一个单独的节点上。
B. 将数据库系统的一个或多个表按照某种规则分成多个部分。
C. 将数据库系统的数据按照某种规则分成多个部分,每个部分存放在一个单独的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存放在不同的节点上。
5. 在分布式数据库系统中,什么是复制?A. 将数据库系统的数据复制到多个节点上,以确保数据的可靠性和可用性。
B. 将数据库系统的数据存储在多个地理位置,以确保数据的可靠性和可用性。
C. 将数据库系统的数据按照某种规则分成多个部分,并存放在不同的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存储在不同的节点上。
6. 在分布式数据库系统中,什么是分布式事务?A. 一种需要在多个节点上同步更新数据的事务处理方式。
B. 一种可以在多个节点上并行处理的事务处理方式。
C. 一种需要确保数据的一致性和完整性的事务处理方式。
D. 一种可以在多个节点上同时执行的事务处理方式。
7. 分布式数据库系统中的数据一致性是指什么?A. 数据在多个节点上保持一致的状态。
分布式课后习题答案

分布式课后习题答案第⼀章分布式数据库系统概述1.1请⽤⾃⼰的语⾔定义下列分布式数据库系统中的术语:(1)局部数据:只提供本站点的局部应⽤所需要的数据。
全局数据:虽然物理上存储在个站点上,但是参与全局应⽤(2)全局/局部⽤户:局部⽤户:⼀个⽤户或⼀个应⽤如果只访问他注册的那个站点上的数据称为本地或局部⽤户或本地应⽤;全局⽤户:如果访问涉及两个或两个以上的站点中的数据,称为全局⽤户或全局应⽤。
全局/局部DBMS:1)LDBMS(Local DBMS):局部场地上的数据库管理系统,其功能是建⽴和管理局部数据库,提供场地⾃治能⼒,执⾏局部应⽤及全局查询的⼦查询。
(2)GDBMS(Global DBMS):全局数据库管理系统,主要功能是提供分布透明性,协调全局事物的执⾏,协调各局部DBMS 以完成全局应⽤,保证数据库的全局⼀致性,执⾏并发控制,实现更新同步,提供全局恢复功能等。
(3)全局外模式:全局应⽤的⽤户视图,也称全局视图。
从⼀个由各局部数据库组成的逻辑集合中抽取,即全局外模式是全局概念式的⼦集。
对全局⽤户⽽⾔,都可以认为在整个分布式数据库系统的各个站点上的所有数据库都如同在本站点上⼀样,只关⼼他们⾃⼰所使⽤的那部分数据(4)全局概念模式:描述分布式数据库中全局数据的逻辑结构和数据特性,是分布式数据库的全局概念视图。
采⽤关系模型的全局概念模式由⼀组全局关系的定义(如关系名、关系中的属性、每⼀属性的数据类型和长度等)和完整性定义(关系的主键、外键及完整性其他约束条件等)组成。
(5)分⽚模式:描述全局数据的逻辑划分。
每个全局关系可以通过选择和投影的关系操作被逻辑划分为若⼲⽚段。
分⽚模式描述数据分⽚或定义⽚段,以及全局关系与⽚段之间的映像。
这种映像是⼀对多的。
(6)分配模式:根据选定的数据分布策略,定义各⽚段的物理存放站点,即定义⽚段映像的类型,确定分布式数据库是冗余的还是⾮冗余的,以及冗余的程度。
如果⼀个⽚段分配在多个站点上,则⽚段的映像是⼀对多的,分布式数据库是冗余的,否则是不冗余的。
分布式数据库系统及其应用课后习题练习

1.1 采用分布式数据库系统的主要原因是什么?集中式数据库系统的不足:1.数据按实际需要已经在网络上分布存储,如果再采用集中式处理,势必造成附加成本和通信开销,2,。
应用程序集中在一台计算机上运行,一旦该计算机发生故障,将会影响整个系统的运行,可靠性不高。
3集中式处理导致系统的规模和配置都不够灵活,系统的可扩展性较差。
1.6 分布式DBMS 具有哪些集中式DBMS 不具备的功能?数据跟踪,分布式查询处理,分布式事务管理,复制数据管理,安全性,分布式目录管理1.12分布式数据库系统的实现技术主要包括哪些内容?分布式数据库设计,分布式查询和优化,分布式事务管理和恢复,分布式并发控制,分布式数据库的可靠性,分布式数据库的安全性1.14分布式数据库系统的主要优点是什么?存在哪些技术问题?分布式数据库系统优点:良好地可靠性和可用性;提高系统效率,降低通信成本;较大的灵活性和可伸缩性;经济型和保护投资;适应组织的分布式管理和控制;数据分布式具有透明性和站点具有较好的自治性;提高了资源利用率;实现了数据共享。
分布式数据库系统中存在的技术问题:数据的分割、分布和冗余度;异构数据库的互联;分布式数据库系统的查询处理;分布式数据库系统的更新处理;分布式数据库系统的并发控制;分布式数据库系统的恢复控制;目录管理;数据安全性和保密性处理。
2.5 数据库系统设计过程有那几个阶段?简述需求收集和分析阶段;概念模型设计阶段;逻辑模型设计阶段;物理模型设计阶段;数据库实现阶段;数据库试运行阶段;数据库正式运行和维护阶段。
2.10简述OSI网络模型和TCP/IP的层次结构,TCP/IP为什么成为In ternet的事实标准?OSI 层次结构:物理层,数据链路层,网络层,传输层,会话层,表示层,应用层。
TCP/IP层次结构:网络层,In ternet层,传输层,应用层。
TCP/IP之所以成为In ternet的事实标准,主要是它有如下特点:1,灵活性好,即适用于广域网,又适用于局域网;2效率高,采用简化的四层通信协议,不同于OSI 的七层通信协议:3 可靠性高,不进行纠错,发现错误后重发,比较实用,4跨平台性好,支持UNIX 、Linux、Windows 等不同的平台;5网络通用性好,适用于各种网络拓扑结构,以共享全局标识符(IP 地址)来实现信息定位和传输。
分布式课后习题答案

第一章分布式数据库系统概述请用自己的语言定义下列分布式数据库系统中的术语:(1)全局/局部数据:(详见课本第9页所谓的局部数据是指……;所谓的全局数据是指……)(2)全局/局部用户(应用):(3)全局/局部DBMS:(4)全局/局部DB:(5)全局外模式:(详见课本第13页)由全局用户视图组成,是全局概念模式的子集。
(6)全局概念模式:(详见课本第13页)定义分布式数据库系统中所有数据的整体逻辑结构,是全局应用的公共数据视图。
(7)分片模式:(详见课本第13页)是全局数据整体逻辑结构分割后的局部逻辑结构,是DDBS 的全局数据的逻辑划分视图.(8)分配模式:(详见课本第13页)用于根据选定的数据总体分配方案,定义各片段的物理存放地点.(9)局部概念模式:(详见课本第13-14页)是全局概念模式被分片和分配到局部场地上的映像的逻辑结构及特征的描述,是全局概念模式的子集。
其逻辑结构与局部DBMS所支持的数据模型有关,当全局数据模型与局部数据模型不同时,局部概念模式还应包括数据模型转换的描述。
(10)局部内模式:描述局部概念模式涉及的数据在局部DBMS中的物理结构及物理存储细节,完全与非分布式系统相同。
1.2采用分布式数据库系统的主要原因是什么?(P1)1.3分布式数据库系统可分为哪些类?(课件第1章。
课本P6,7,8)1.4什么是分布式数据库系统?它具有哪些主要特点?怎么样区别分布式数据库系统与只提供远程数据访问功能的网络数据库系统?(分布式数据库系统的定义、特点详见课件第1.课本P6)1.5分布式DBMS具有哪些集中式DBMS不具备的功能?(课件第1章。
课本P15)用自己的语言解析“什么时候需要进行数据分片和数据复制”?(课本第10,11页)式数据库系统中,为什么要对数据进行分片?什么是关系的片段?关系的片段有哪些主要类型?(课本第9-10页。
数据分片是指数据存放单位不是全部关系,而是关系的一个片段。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。
(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。
(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。
(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS的组成,DDBMS的功能和组成。
(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。
(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。
9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。
(教材P365-367)(2)分布式数据存储:分片和分配。
(教材P375-377)(3)DDB的体系结构。
(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。
(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。
·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。
这种计算环境称为分布计算。
·处理分布:指系统中处理是分布的,数据是集中的这种情况。
·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。
·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS功能放在服务器上执行,把应用处理功能放在客户机上执行。
·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。
·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。
·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。
·DDB:DDB是计算机网络环境中各场地上DB的逻辑集合。
·DDBMS:DDBMS是DDBS中的一组软件,它负责管理分布环境下逻辑集成数据的存取、一致性和完备性。
同时,由于数据的分布性,在管理机制上还必须具有计算机网络通信协议的分布管理特性。
·分布透明性:是指用户不必关心数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关心各个场地上DB的数据模型是哪种类型,可以像集中式DB一样来操作物理上分布的DB。
·数据分片:把全局概念模式中的全局关系划分成若干不相交部分的过程,称为数据分片。
·水平分片:对全局关系执行选择操作得到的片段,称为水平分片。
·垂直分片:对全局关系执行投影操作得到的片段,称为垂直分片。
·数据分配:是指片段在场地上的分配策略。
·分片透明性:分片透明性位于全局概念模式与分片模式之间。
分片透明性是指用户或应用程序只对全局关系进行操作而不必考虑数据的分片。
·位置透明性:位于分片模式和分配模式之间。
位置透明性是指用户或应用程序应当了解分片情况,但不必了解片段的存储场地。
·局部数据模型透明性:位于分配模式与局部概念模式之间。
指用户或应用程序要了解分片及各片段存储的场地,但不必了解场地上使用的是何种数据模型。
9.2 C/S结构的基本原则是什么?客户机和服务器的任务各是什么?答:C/S结构的基本原则是将计算机应用任务分解成多个子任务,由多台计算机分工完成,即“功能分布”原则。
客户机完成数据处理、数据表示、用户接口等功能。
服务器完成DBMS的核心功能。
9.3 一个典型的应用程序有哪四部分组成?在C/S结构的DBS中是如何实现的?答:一个典型的应用程序有四部分组成:用户界面的显示逻辑,应用逻辑,事务逻辑,数据管理。
在C/S环境下,通常把前两部分驻留在客户机上,而把后两部分驻留在服务器上。
9.4 C/S系统有哪些主要的技术特征?答:C/S系统主要有下面六个技术特征:按功能划分;共享资源;不对称协议;定位透明性;基于消息的交换;可扩展性。
9.5 C/S系统的体系结构有几部分组成?试作必要的解释。
答:C/S系统的体系结构由客户机、服务器和中间件等三大部分构成。
(解释略)9.6试对C/S结构的两层模型、三层模型、多层模型作详细的解释。
从C/S 的结构看,其发展趋势如何?答:两层C/S结构的引出主要是为了减轻集中式DBS主机的负担,把计算机功能分布在不同计算机上。
三层C/S结构的引出主要是为了减轻客户机的负担,从两层C/S的客户机和服务器中各抽出一部分功能组成应用服务器。
多层C/S结构的引出是通过引入中间层组件,扩大了两层C/S结构。
C/S结构的发展趋势是:客户机越来越瘦,服务器品种越来越多。
使得C/S 结构容易组装、扩展。
9.7网络服务器有哪几类?答:网络服务器分成DB服务器、文件服务器、事务服务器、文档服务器、Web 服务器、电子邮件服务器、各种应用服务器等。
9.8试叙述数据从集中存储、分散存储到分布存储的演变过程。
答:集中式DBS的数据属于集中存储方式;把数据库分成多个,建立在多台计算机上,但相互独立,这种分散式系统的数据属于分散存储;把分散在各地的DBS通过网络通信联接起来,这种分布式DBS的数据属于分布存储,兼有集中式和分散式的优点。
9.9与集中式DBS、分散式DBS相比,DDBS的区别在哪里?答:与集中式DBS的集中存储相比,分布式DBS的数据具有“分布性”特点:数据不是存储在一个场地,而是分布存储在各个场地。
与分散式DBS的分散存储相比,分布式DBS的数据具有“逻辑整体性”特点。
9.10 DDBS有哪些基本特点?还可以导出哪些特点?答:DDBS有四个基本特点:物理分布性,逻辑整体性,场地自治性,场地之间协作性。
由此还可导出其他四个特点:数据独立性,集中与自治相结合的控制机制,适当增加数据冗余度,事务管理的分布性。
9.11在DDBS中为什么需要适当增加数据冗余度?答:在DDBS中希望通过冗余数据提高系统的可靠性、可用性和改善系统性能。
9.12 DDBS有哪些优点和缺点?答:与集中式DBS相比,DDBS有六个优点:灵活的体系结构,分布式的管理和控制机构,经济性能优越,系统可靠性高可用性好,局部应用的响应速度快,可扩展性好。
缺点有三个:花在通信部分开销较大,复杂的存取结构在分布式系统中不一定有效,数据的安全性保密性较难处理。
9.13试解释下列术语:同构同质型DDBS,同构异质型DDBS,异构型DDBS。
答:同构同质型DDBS:系统中各个场地都采用同一类型的数据模型,并且是同一型号的DBMS。
同构异质型DDBS:系统中各个场地都采用同一类型的数据模型,但DBMS 的型号可不同。
异构型DDBS:系统中各个场地的数据模型是不同的类型。
9.14 DDB中,数据分片有哪些策略?定义分片时必须遵守那些规则?答:数据分片有水平分片、垂直分片、导出分片和混合分片等四种方式。
数据分片时必须遵守三条规则:完备性条件,可重构条件,不相交条件。
9.15 全局关系与片段之间映像只能是一对多,不可以是多对多,为什么?答:在DDB的体系结构中,往上方向是越来越“逻辑”,往下方向是越来越“物理”。
据此可看出,全局关系在上方,片段在下方,因此每个片段只能来自一个全局关系。
如果来自多个全局关系的数据,那就不是片段了,而是位于全局关系上方的全局视图(全局外模式)了。
因而全局关系与片段之间的映象只能是一对多。
9.16 DDB中,数据分配有哪些策略?分配策略的评估因素有哪几个?答:数据分配有集中式、分割式、全复制式和混合式等四种分配策略。
分配策略的评估因素有四个:存储代价,可靠性,检索代价和更新代价。
9.17试叙述DDB的六层模式结构的主要成分。
答:DDB的六层模式结构的主要成分是:六层模式、五级映像和五级独立性(透明性)。
(详细解释略)9.18 DDB的六层模式结构是一种通用的概念结构,它有哪些显著的特征?答:有三个特征:数据分布独立性,数据冗余的显式控制,局部DBMS的独立性。
9.19 DDB的六层模式结构之间的五级映象,各体现什么独立性(或透明性)?答:五级映像体现五个独立性(透明性),自上而下是:逻辑独立性,分片透明性,位置透明性,局部数据模型透明性,物理独立性。
9.20 DDBMS主要有哪些功能?DDBMS应包括哪些基本功能模块?答:DDBMS的功能有五点:接受并处理用户请求,访问网络数据字典,分布式处理,通信接口功能,异构型处理。
DDBMS应包括以下四个基本功能模块:查询处理模块,完整性处理模块,调度处理模块,可靠性处理模块。
9.21分布式系统中影响查询的主要因素是什么?答:主要因素是网络中数据的传输量。
9.22基于半联接的优化策略的基本原理是什么?答:不参与联接的数据或无用的数据不必在网络中来回传输。
9.23什么是“半联接程序”?如何执行?答:用半联接方法来计算自然联接的方法,称为“半联接程序”。
具体步骤为:R⋈S ==(R⋈πB(S))⋈S (此处B为R和S的公共属性)==(R⋉S)⋈S(如何执行见教材P389)9.24与集中式DBMS比较,DDBMS环境中在并发控制和恢复方面遇到哪些新问题?答:与集中式DBMS比较,DDBMS环境中在并发控制和恢复方面会遇到以下五个问题:①数据项的多拷贝之间的一致性问题。
②在单个场地故障恢复时,局部数据库的数据应和其他场地的同步问题。
③通信网络的故障处理能力问题。
④分布式提交的实现问题。
⑤分时式死锁的处理问题。
9.25试解释分布式并发控制中使用的名词:·副本(拷贝):DDB中,一个数据项可以复制存放在多个场地,每个场地的数据称为副本或拷贝。
·识别拷贝:一个数据项可以在多个场地有副本,系统为每个数据项指定一个特定的拷贝作为该数据项的识别拷贝。
对该数据项的封锁应与识别拷贝相联系,并且所有的封锁和解锁请求都被传送到包含那个拷贝的场地上。
·主场地:数据库中所有的识别拷贝都被保留在同一个场地上,该场地称为主场地。
·备份场地:在主场点发生故障时,将接管它而成为主场地的场地称为“备份场地”。
·主拷贝:各种数据项的识别拷贝可以存储在不同的场地上,这种识别拷贝称为主拷贝。
·协调者场地:存储数据项识别拷贝的场地,称为该数据项的协调者场地。
9.26试对分布式并发控制中的主场地方法和主拷贝方法作一比较。
使用备份场地对它们有什么影响?答:分布式并发控制中的主场地方法和主拷贝方法的比较以及有备份场地时对它们的影响如图9.1所示。
图9.19.27在分布式数据库中,什么时候要使用投票和选举方法?答:在分布式并发控制中,如果不存在备份场地,或主场地和备份场地都有故障时,就要用到选举方法产生一个备份场地。