分布式数据库系统(全文)

合集下载

《分布式数据库系统》PPT课件

《分布式数据库系统》PPT课件
回答它。 (6)连接管理器传递连接控制到最好的现存数据泵(data pump),
或者产生一个新泵,然后传递连接控制。 (7)数据泵询问导航器下一个去的地址:其它Interchange,或
者其它目的地。 (8)数据泵发送连接到下个协议“共同体”。 注意:如果Interchange作为目的地是在同一个协议“共同体”返回节

5 分片独立性

6 数据复制独立性

7 分布式查询处理

8 分布式事务管理

9 硬件独立性

10 操作系统独立性

11 网络独立性

12 DBMS独立性

返回章
9.2 分布式数据库的连接
图9.3:一个ORACLE分布式数据库实际结构
目录
9.2.1分布式数据库全局名和数据库链 9.2.2 连 接 客 户 ( CLIENTS ) 和 服 务 器
9.5.5 配置LISTENER
1. 配置listener地址 :将机器上一定的数据库连接要求配置为监控器确 定的地址 listener配置文件listener.ora指定 例9.12:配置一个叫LISTENER的listener,来接受在PORT.7000的“共同 体”.ORACLE和在OBJECT lsnr的.ORACLE“共同体” 上的连接:
2 WHERE ename=’GREEN’; 1 row deleted.
返回节
9.4 事务管理
事务 :一个原子单位 ,满足ACID准则即原子性、一 致性、隔离性、持久性。 ORACLE的事务管理 由一个可执行的SQL语句开始 ,事务开始时,被赋给 一个可用回滚段,记录该事务的回滚项 事务结束
当COMMIT或ROLLBACK(没有SAVEPOINT子句)语句发出。 一个DDL语句被执行。在DDL语句执行前、后都隐式地提交。 用户撤消对ORACLE的连接(当前事务提交)。 用户进程异常中止(当前事务回滚)。

分布式数据库系统(重点解析,经典试题及答案)

分布式数据库系统(重点解析,经典试题及答案)

第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。

(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。

(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。

(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS 的组成,DDBMS的功能和组成。

(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。

(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。

9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。

(教材P365-367)(2)分布式数据存储:分片和分配。

(教材P375-377)(3)DDB的体系结构。

(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。

(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。

·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。

这种计算环境称为分布计算。

·处理分布:指系统中处理是分布的,数据是集中的这种情况。

·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。

·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS 功能放在服务器上执行,把应用处理功能放在客户机上执行。

·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。

·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。

·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。

第3章 分布式文件及数据库系统

第3章 分布式文件及数据库系统
– 每一个文件具有唯一的逻辑地址,每一个文件 副本对应一个物理地址
26/20
名字服务器
• 文件服务器管理
– 动态管理文件服务器
• 添加、删除文件服务器
– 指导文件服务器进行文件备份
• 同一个文件在两台文件服务器中保存副本
– 实时获取文件服务器信息
• 剩余空间、负载
– 文件服务器选择策略:剩余空间+负载
3.3.2 分布式数据库系统的定义
分布式数据库包含两个重要组成部分: 分布式数据库(DDB)和分布式数据库管 理系统(DDBMS) 。 分布式数据库是计算机网络环境中各场地 上数据库的逻辑集合。 分布式数据库管理系统是分布式数据库系 统中的一组软件,它复杂管理分布环境下 逻辑集成数据的存取、一致性、有效性和 完备性。
28/20
文件的传输
• 文件服务器:监控管理程序
– 监控文件服务器信息,提供当前的磁盘空间等资源信息 – 响应删除文件命令,删除文件服务器上的文件 – 响应备份命令,将本地文件备份到另一文件服务器上
• 客户端使用的工具包
– 上传文件、下载文件、删除文件 – ftp协议
• NS使用的工具包
– 提供资源信息查询 – 通知备份文件到第三方文件服务器 – 删除文件服务器上的备份文件功能
3.3.3分布式数据库的基本特点
物理分布性:数据不是存储在一个场地上,而是 存储在计算机网络的多个场地上。
• MapReduce 模式的思想是通过自动分割将 要执行的问题(程序)、拆解成Map(映射)和 Reduce(化简)的方式。
• 在自动分割后通过Map 程序将数据映射成 不相关的区块,分配(调度)给大量计算机处 理达到分散运算的效果,再通过Reduce 程 序将结果汇整,输出开发者需要的结果。

分布式数据库总结(申德荣)

分布式数据库总结(申德荣)

第一章分布式数据库系统概述一、分布式数据库的发展1、分布式数据库的发展:①集中式数据库管理系统的局限性:a.通讯瓶颈;b.响应速度。

②推动分布式数据库发展的动力:a.应用需求;b.硬件环境的发展。

二、分布式数据库系统的定义:分布式数据库系统,通俗地说,是物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中是数据库系统)连接起来,共同组成一个统一的数据库系统。

三、分布式数据库系统的特点:a.物理分布性:数据不是存放在一个站点上b.逻辑整体性:是与分散式数据库系统的区别c.站点自治性:是与多处理机系统的区别d.数据分布透明性e.集中与自治相结合的控制机制f.存在适当的数据冗余度g.事务管理的分布性四、分布式数据库系统的分类按局部数据库管理系统的数据模型分类:同构性(homogeneous)(分为同构同质型和同构异质型)DDBS和异构性(heterogeneous)DDBS按分布式数据库系统的全局控制系统类型分类:全局控制集中型DDBS,全局控制分散型DDBS,全局控制可变型DDBS。

五、分布式数据库中数据的独立性和分布透明性所谓数据独立性是指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段站点位置的分配情况,以及各站点上数据库的数据模型等。

也就是说,全局数据的逻辑分片、片段的物理位置分配,各站点数据库的数据模型等情况对用户和用户程序透明。

所以,在分布式数据库中分布独立性也称为分布透明性。

六、分布式数据库系统的体系结构、组成成分集中式数据库管理系统结构:a. DB(数据库)b. DBMS(集中式数据库管理系统)c. DBA(数据库管理员)分布式数据库管理系统(DDBMS)结构:a. LDB(局部数据库)b. GDB(全局数据库)c. LDBMS (局部数据库管理系统)d. GDBMS (全局数据库管理系统)e. LDBA(局部数据库管理员)f. GDBA (全局数据库管理员)七、分布式数据库系统的特性:1. 数据透明性:a.分布透明性b. 分片透明性c. 复制透明性2. 场地自治性:a. 设计自治性b. 通信自治性c. 执行自治性八、分布式数据库系统的优点:分布式数据库系统是在集中式数据库系统的基础上发展来的,比较分布式数据库系统与集中式数据库系统,可以发现分布是数据库系统具有下列优点:1.更适合分布式的管理与控制。

数据库系统概论第十四章分布式数据库系统

数据库系统概论第十四章分布式数据库系统

分布式数据库设计
– 组合存储 这种方法是重复存储和分片存储相结合的方 法。关系被划分为几个片段,系统为每个片 段维护几个副本,每个副本存放于不同的结 点上。
分布式数据库设计
命名和局部自治性 – 每个数据项(关系、副本、片段)必须有唯 一的名字,在分布式数据库系统中必须保证 在不同的结点上不会用同一个名字来代表不 同的数据项。 – 途径1:名字服务器
分布式数据库和分布式数据库系统
– 全局的一致性、可串行性和可恢复性
• 分布式数据库系统中各局部数据库应满足集中式 数据库的一致性、并发事务的可串行性和可恢复 性。除此之外还应保证数据库的全局一致性、全 局并发事务的可串行性和系统全局的可恢复性。 这是因为在分布式数据库系统中全局应用要涉及 两个以上结点的数据,全局事务可能由不同结点 上的多个操作组成。
– 逐步扩展处理能力和系统规模
• 相对于集中式数据库系统,分布式数据库系统能 够方便地将一个新结点纳入系统,而不影响现有 系统的结构和系统的正常运行,提供了逐步扩展 系统能力的较好途径。
分布式数据库的体系结构
全局外模式 全局外模式
映像1 映像2
全局概念模式
全局DBMS
分片模式
映像3 分布模式 局部概念模式
• 可用性强 如果某个存储R的结点出了故障,系统仍然可以使用其它 结点上的副本继续处理用户查询,使系统正常运行。 • 增强并行性 由于R的重复存储,可以使更多的用户并行地查询R。
数据的重复存储也会带来一些问题,如增加了更新 操作的开销,加大了并行控制的难度
分布式数据库设计
– 分片存储 关系被划分为几个片段,各个片段存储在不 同的结点上。将数据分片,使数据存放的单 位不是关系而是片段,这既有利于按照用户 的需求较好地组织数据的分布,也有利于控 制数据的冗余度。分片时必须遵循以下原则:

分布式数据库系统

分布式数据库系统


P
场地A
场地B
在场地B选出红色零件的元组(10个),然后对每一 个元组逐一检查场地A,看北京供应商的装运单中是否有 这个零件装运单(若有则选出S#),每做这样一次检查 包括2次消息,共问答10次,通信时间为:
T[4]=2*10=20秒
26
查询处理和优化
策略5:
传(S#,P#)
(S)SP
P
场地A
14
分布透明性----包括分片透明性、位置透明性和局部数 据模型透明性。
分片透明性----分布透明性的最高层次。指用户或 应用程序只对全局关系进行操作而不考虑关系的分 片。当分片模式改变了,由于全局到分片模式的映 像、全局模式不变,应用程序不必改写。
位置透明性----分布透明的下一层次。指用户或应用 程序不必了解片段的场地,当存储场地改变了,由于 分片模式到分布模式的映像,应用程序不必改变。 局部数据模型透明性----用户或应用程序不必了解局 部场地上使用哪种数据模型,模型转换以及数据库语 言的转换由映像4完成。
分布式数据库系统中全局应用要涉及到两个以上结点的 数据,全局事务可能由不同场地的多个操作组成。所以应 该保证数据库的全局一致性、全局并发事务的可串行性和 系统的全局可恢复性。 当一个结点发生故障,操作失败后如何使全局事务回滚? 如何使另一个结点撤销已执行的操作或不必再执行其他操作。
采用的技术比集中式数据库系统更复杂和困难。
•提高系统的可靠性、可用性 当某一场地出现故障时,系统可以对另一场地上的相同 副本进行操作,不至于造成整个系统的瘫痪。
•提高系统性能 系统可选择用户最近的数据副本进行操作,减少通
信代价,改善整个系统性能。
存在的问题: 冗余副本之间存在数据不一致,必须着力解决。

分布式数据库总结

分布式数据库总结

%%%%%%%%%%%%%%%第一章:分布式数据库系统概述数据库:长期存储在计算机内的有组织的,可共享的相关数据的集合。

数据库管理系统:DBMS是介于用户与操作系统之间的一层数据管理软件。

为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。

DBMS基于某种数据模型。

数据库系统:数据库系统(DBS)通常是指带有数据库的计算机应用系统。

包括数据库、相应的硬件、软件和各类人员。

数据库技术:数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科;是一门综合性较强的学科。

数据抽象:视图抽象——外模式;概念抽象——概念模式;物理抽象——内模式数据模型:数据模型三要素:数据结构;数据操作;完整性约束模式/内模式映象:该映象存在于模式与内模式之间,用于定义模式与内模式之间的对应性。

本映象一般在内模式中描述。

外模式/模式映象:该映象存在于外模式与模式之间,用于定义外模式和模式之间的对应性。

本映象一般在外模式中描述。

物理独立性:在数据库系统的三级模式结构中,存在模式/内模式的映象,当内模式发生变化时,只要修改模式/内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。

逻辑独立性:在数据库系统的三级模式结构中,存在外模式/模式的映象,当模式发生变化时,只要修改外模式/模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。

DDBS具有如下四个基本特点:物理分布性逻辑整体性场地自治性场地之间协作性计算机网络:定义为相互联接、彼此独立的计算机系统的集合。

相互联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。

计算机网络的组成:通信子网和资源子网分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。

分布式数据库系统(DDBS)概述.

分布式数据库系统(DDBS)概述.

分布式数据库系统(DDBS概述一个远程事务为一个事务,包含一人或多个远程语句,它所引用的全部是在同一个远程结点上.一个分布式事务中一个事务,包含一个或多个语句修改分布式数据库的两个或多个不同结点的数据.在分布式数据库中,事务控制必须在网络上直辖市,保证数据一致性.两阶段提交机制保证参与分布式事务的全部数据库服务器是全部提交或全部回滚事务中的语句.ORACLE分布式数据库系统结构可由ORACLE数据库管理员为终端用户和应用提供位置透明性,利用视图、同义词、过程可提供ORACLE分布式数据库系统中的位置透明性.ORACLE提供两种机制实现分布式数据库中表重复的透明性:表快照提供异步的表重复;触发器实现同步的表的重复。

在两种情况下,都实现了对表重复的透明性。

在单场地或分布式数据库中,所有事务都是用COMMIT或ROLLBACK语句中止。

二、分布式数据库系统的分类:(1 同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型,并且是同一型号的DBMS。

(2同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS的型号不同,譬如DB2、ORACLE、SYBASE、SQL Server等。

(3异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。

随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。

三、分布式数据库系统主要特点:DDBS的基本特点:(1物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。

逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户共享,并由一个DDBMS统一管理。

(2场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用。

(3场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。

DDBS的其他特点(1数据独立性(2集中与自治相结合的控制机制(3适当增加数据冗余度(4事务管理的分布性四、分布式数据库系统的优点:(1更适合分布式的管理与控制。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分布式数据库系统(全文)胡经国本文作者的话本文是根据有关文献和资料编写的《漫话云计算》系列文稿之一。

以此作为云计算学习笔录,供云计算业外读者进一步学习和研究参考。

希望能够得到大家的指教和喜欢!下面是正文一、分布式数据库系统概述1、概述一分布式数据库(Distributed Database,DDB)是指数据分散存储在计算机网络中的各台计算机上的数据库。

分布式数据库系统(Distributed Database System,DDBS)通常使用较小的计算机系统,每台计算机可单独放在一个地方;每台计算机中都可能有DBMS (数据库管理系统)的一份完整拷贝副本,或者部分拷贝副本,并具有自己局部的数据库;位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的、逻辑上集中、物理上分布的大型数据库系统。

2、概述二分布式数据库,是指利用高速计算机网络,将物理上分散的多个数据存储单元连接起来组成一个逻辑上统一的数据库。

分布式数据库的基本思想,是将原来集中式数据库中的数据分散存储到多个通过网络连接的数据存储节点上,以获取更大的存储容量和更高的并发访问量。

近年来,随着数据量的高速增长,分布式数据库技术也得到了快速的发展。

传统的关系型数据库开始从集中式模型向分布式架构发展。

基于关系型的分布式数据库,在保留传统数据库的数据模型和基本特征前提下,从集中式存储走向分布式存储,从集中式计算走向分布式计算。

另一方面,随着数据量越来越大,关系型数据库开始暴露出一些难以克服的缺点。

以NoSQL为代表的、具有高可扩展性、高并发性等优势的非关系型数据库快速发展;一时间市场上出现了大量的key-value(键-值)存储系统、文档型数据库等NoSQL数据库产品。

NoSQL类型数据库正日渐成为大数据时代下分布式数据库领域的主力。

这种按分布式组织数据库的方法克服了物理中心数据库组织的弱点。

首先,降低了数据传送代价。

因为,大多数对数据库的访问操作都是针对局部数据库的,而不是针对其他位置的数据库访问。

其次,系统的可靠性提高了很多。

因为,当网络出现故障时,仍然允许对局部数据库的操作,而且一个位置的故障不影响其他位置的处理工作。

只有当访问出现故障位置的数据时,在某种程度上才受影响。

第三,便于系统的扩充。

增加一个新的局部数据库,或在某个位置扩充一台适当的小型计算机,都很容易实现。

然而,有些功能要付出更高的代价。

例如,为了调配在几个位置上的活动,事务管理的性能比在中心数据库时花费更高,而且甚至抵消许多其他的优点。

二、分布式软件系统分布式软件系统(Distributed Software Systems,DSS),是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。

它包括:分布式操作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分布式数据库系统等。

⑴、分布式操作系统分布式操作系统(Distributed Operating System,DOS),负责管理分布式处理系统资源和控制分布式程序运行。

它和集中式操作系统的区别,在于资源管理、进程通信和系统结构等方面。

⑵、分布式程序设计语言分布式程序设计语言(Distributed Programming Language,DPL),用于编写运行于分布式计算机系统上的分布式程序。

一个分布式程序,由若干个可以独立执行的程序模块组成;它们分布于一个分布式处理系统的多台计算机上被同时执行。

它与集中式的程序设计语言相比,有以下三个特点:分布性、通信性和稳健性。

⑶、分布式文件系统分布式文件系统(Distributed File System ,DFS),具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。

⑷、分布式数据库系统分布式数据库系统(Distributed Database System,DDBS),由分布于多个计算机结点上的若干个数据库组成。

它提供有效的存取手段来操纵这些结点上的子数据库。

分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理上分散的各个结点上的。

当然,分布在各个结点上的子数据库在逻辑上是相关的。

Hadoop的分布式文件系统HDFS,作为开源的分布式平台,为目前流行的很多分布式数据库提供了支持,譬如HBase等。

Yonghong的分布式文件系统ZFS,为分布式数据集市Z-DataMart提供了底层平台。

链接:Hadoop与HDFS和MapReduceHadoop是一个由Apache基金会所开发的分布式系统基础架构。

用户可以在不了解该分布式系统基础架构的底层细节的情况下,开发分布式程序;充分利用集群的威力,进行高速运算和存储。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System,HDFS)。

HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。

HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access,流媒体访问)文件系统中的数据。

Hadoop的架构最核心的设计就是:HDFS和MapReduce。

HDFS为海量数据提供了存储,而MapReduce则为海量数据提供了计算。

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。

概念“Map(映射)”和“Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的;还有从矢量编程语言里借来的特性。

它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。

当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

三、分布式数据库系统主要特点在大数据时代,面对海量数据量的井喷式增长和不断增长的用户需求,分布式数据库系统必须具有如下特征,才能应对不断增长的海量数据。

1、高可扩展性分布式数据库系统必须具有高可扩展性,能够动态地增添存储节点以实现存储容量的线性扩展。

2、高并发性分布式数据库系统必须及时响应大规模用户的读/写请求,能对海量数据进行随机读/写。

3、高可用性分布式数据库系统必须提供容错机制,能够实现对数据的冗余备份,保证数据和服务的高度可靠性。

四、分布式数据库系统优点在大数据时代,面对日益增长的海量数据,传统的集中式数据库系统的弊端日益显现,分布式数据库系统相对传统的集中式数据库系统具有如下优点:1、更高的数据访问速度分布式数据库系统为了保证数据的高可靠性,往往采用备份的策略实现容错机制。

所以,在读取数据的时候,客户端可以并发地从多个备份服务器同时读取,从而提高了数据访问速度。

2、更强的可扩展性分布式数据库系统可以通过增添存储节点来实现存储容量的线性扩展,而集中式数据库系统的可扩展性十分有限。

3、更高的并发访问量分布式数据库系统由于采用多台主机组成存储集群,所以相对集中式数据库系统,它可以提供更高的用户并发访问量。

五、分布式数据库系统功能结构分布式数据库管理系统(DBMS)软件结构包括AP模块、CM模块和DP 模块。

以下对各模块功能进行简要描述:1、AP模块功能包括用户接口、查询处理、全局事务管理及全局字典管理和全局恢复管理。

⑴、用户接口检查用户身份,接受用户命令,如SQL命令。

⑵、全局查询处理将用户命令翻译成数据库命令;生成全局查询的分布执行计划;收集局部执行结果并返回给用户。

⑶、全局事务管理调度、协调和监视AP模块和DP模块之间的分布执行;保证复制数据的一致性;保证全局事务的原子性。

2、DP模块功能包括局部查询处理、局部事务管理及局部字典管理和局部恢复管理。

⑴、局部查询处理实现全局命令到局部命令的转换。

⑵、局部事务管理执行局部数据操作;返回局部执行结果;保证子事务执行的正确性。

六、分布式数据库系统模式结构根据中国制定的《分布式数据库系统标准》,分布式数据库系统被抽象为四层的模式结构。

这种模式结构得到了国内外同行的支持和认同。

分布式数据库系统4层模式结构划分为:全局外层、全局概念层、局部概念层和局部内层;在各层间还有相应的层间映射,层与层(模式与模式)之间是映射关系。

这种四层模式结构适用于同构型分布式数据库系统,也适用于异构型分布式数据库系统。

1、全局模式ES(全局外层)全局模式定义全局用户试图,是分布式数据库的全局用户对分布式数据库最高层抽象。

全局用户使用视图时,不必关心数据的分片和具体的物理分配细节。

2、全局概念模式GCS(全局概念层)全局概念模式定义全局概念视图,是分布式数据库的整体抽象,包含了全局数据特性和逻辑结构。

像集中式数据库中的概念模式一样,是对数据库全体的描述。

全局概念模式再经过分片模式和分配模式,映射到局部模式。

⑴、分片模式分片模式是描述全局数据的逻辑化分视图,即全局数据逻辑结构根据某种条件的划分,将全局数据逻辑结构划分为局部数据逻辑结构,每个逻辑划分为一个分片。

在关系数据库中,一个关系的一个子关系称为该关系的一个分片。

⑵、分配模式分配模式是描述局部数据逻辑的局部物理结构,即划分后的分片的物理分配试图。

3、局部概念模式LCS(局部概念层)局部概念模式定义局部概念视图,是全局概念模式的子集。

全局概念模式经逻辑划分后,被分配到各个局部场地上。

局部概念模式用于描述局部场地上的局部数据逻辑结构。

当全局数据模型与局部数据模型不同时,还涉及数据模型转换等内容。

4、局部内模式LIS(局部内层)局部内模式定义局部物理视图,是对物理数据库的描述。

它类似于集中数据库的内层。

综上所述,分布式数据库的四层结构及模式,定义描述了分布式数据库是一组用网络连接的局部数据库的逻辑集合。

它将数据库分为全局数据库和局部数据库。

全局数据库到局部数据库,由映射(1∶N)模式描述。

全局数据库是虚拟的,由全局概念层描述。

局部数据库是全局数据库的内层,由局部概念层和局部内层描述。

全局用户只关心全局外层定义的数据库用户视图,其内部数据模型的转换、场地分配细节等由系统自动实现。

分布式数据库划分为全局外层、全局概念层、局部概念层和局部内层。

分布式数据库可以描述为虚拟的全局数据库和局部场地数据库的逻辑集合。

全局数据库到局部数据库,由分片模式和分配模式映射描述。

分布式数据库系统,借助通信网络完成地理上分布存储的数据的逻辑集中管理。

该系统提供给用户的是全局外层视图,就好像集中式数据库一样。

全局外层用户的应用请求,分布成局部请求及局部操作,从完成到结果提交及整个全局事务提交,由该系统自动完成。

相关文档
最新文档