分布式数据库管理系统简介
分布式数据库简介

分布式数据库的目标:
4.逐步扩展处理能力和系统规模。当一个单位规
模扩大要增加新的部门(如银行系统增加新的分行,工厂 增加新的科室、车间)时,分布式数据库系统的结构为扩 展系统的处理能力提供了较好的途径:在分布式数据库 系统中增加一个新的结点.这样做比在集中式系统中扩 大系统规模要方便、灵活、经济得多.
分布式数据库的目标:
3.充分利用数据库资源,提高现有集中式数据库的 利用率。当在一个大企业或大部门中已建成了若干个数据
库之后,为了利用相互的资源,为了开发全局应用,就要研 制分布式数据库系统.这种情况可称为自底向上的建立分布 式系统.这种方法虽然也要对各现存的局部数据库系统做某 些改动、重构,但比起把这些数据库集中起来重建一个集中 式数据库,则无论从经济上还是从组织上考虑,分布式数据 库均是较好的选择.
到最大,这使得各处理机之间的相互干扰降到最低。负 载在各处理机之间分担,可以避免临界瓶颈。
4、方便进行全局应用。当现有机构中已存在几个数
据库系统,而且实现全局应用的必要性增加时,就可以 由这些数据库自下而上构成分布式数据库系统。
5、系统的可靠性高。相等规模的分布式数据库系统
在出现故障的几率上不会比集中式数据库系统低,但由 于其故障的影响仅限于局部数据应用,因此就整个系统 来讲它的可靠性是比较高的。
分布式数据库的特点:
四、全局的一致性、可串行性和可恢复性
分布式数据库中各局部数据库应满足集中式数据库 的一致性、可串行性和可恢复性.除此以外还应保 证数据库的全局一致性、并行操作的可串行性和系 统的全局可恢复性.这是因为全局应用要涉及两个 以上结点的数据.因此在分布式数据库系统中一个 业务可能由不同场地上的 多个操作组成.
分布式数据库的目标:
分布式数据库总结(申德荣)

第一章分布式数据库系统概述一、分布式数据库的发展1、分布式数据库的发展:①集中式数据库管理系统的局限性:a.通讯瓶颈;b.响应速度。
②推动分布式数据库发展的动力:a.应用需求;b.硬件环境的发展。
二、分布式数据库系统的定义:分布式数据库系统,通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中是数据库系统)连接起来,共同组成一个统一的数据库系统。
三、分布式数据库系统的特点:a.物理分布性:数据不是存放在一个站点上b.逻辑整体性:是与分散式数据库系统的区别c.站点自治性:是与多处理机系统的区别d.数据分布透明性e.集中与自治相结合的控制机制f.存在适当的数据冗余度g.事务管理的分布性四、分布式数据库系统的分类按局部数据库管理系统的数据模型分类:同构性(homogeneous)(分为同构同质型和同构异质型)DDBS和异构性(heterogeneous)DDBS按分布式数据库系统的全局控制系统类型分类:全局控制集中型DDBS,全局控制分散型DDBS,全局控制可变型DDBS。
五、分布式数据库中数据的独立性和分布透明性所谓数据独立性是指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段站点位置的分配情况,以及各站点上数据库的数据模型等。
也就是说,全局数据的逻辑分片、片段的物理位置分配,各站点数据库的数据模型等情况对用户和用户程序透明。
所以,在分布式数据库中分布独立性也称为分布透明性。
六、分布式数据库系统的体系结构、组成成分集中式数据库管理系统结构:a. DB(数据库)b. DBMS(集中式数据库管理系统)c. DBA(数据库管理员)分布式数据库管理系统(DDBMS)结构:a. LDB(局部数据库)b. GDB(全局数据库)c. LDBMS (局部数据库管理系统)d. GDBMS (全局数据库管理系统)e. LDBA(局部数据库管理员)f. GDBA (全局数据库管理员)七、分布式数据库系统的特性:1. 数据透明性:a.分布透明性b. 分片透明性c. 复制透明性2. 场地自治性:a. 设计自治性b. 通信自治性c. 执行自治性八、分布式数据库系统的优点:分布式数据库系统是在集中式数据库系统的基础上发展来的,比较分布式数据库系统与集中式数据库系统,可以发现分布是数据库系统具有下列优点:1.更适合分布式的管理与控制。
什么是数据库介绍一下常见的数据库管理系统

什么是数据库介绍一下常见的数据库管理系统什么是数据库?介绍一下常见的数据库管理系统数据库是一种用来存储和组织数据的系统。
它是指一个可以进行数据集中存储、管理和维护的结构化数据集合。
数据库管理系统(DBMS)是在计算机系统中管理数据库的软件,它可以提供对数据库的访问、查询、更新和管理功能。
下面将介绍一些常见的数据库管理系统。
1. 关系型数据库管理系统(RDBMS)关系型数据库管理系统是目前应用最广泛的数据库管理系统之一。
它使用以表的形式组织数据,其中每个表包含多个行和列。
关系型数据库使用结构化查询语言(SQL)进行数据操作,它的优点是数据一致性和完整性较高。
常见的关系型数据库管理系统包括Oracle、MySQL和Microsoft SQL Server。
2. 非关系型数据库管理系统(NoSQL)非关系型数据库管理系统则是与关系型数据库管理系统相对的概念。
它不使用表结构,而是使用各种不同的数据模型,如键值对、文档型、列族和图等。
非关系型数据库管理系统更加适用于海量数据、高并发读写和数据模型灵活性要求较高的场景。
常见的非关系型数据库管理系统包括MongoDB、Cassandra和Redis。
3. 分布式数据库管理系统(DDBMS)分布式数据库管理系统用于管理分布在多个计算机节点上的数据。
它允许将数据分布在不同的物理位置,并提供了数据的分片、复制和故障容错等机制。
通过分布式数据库管理系统,可以实现数据的高可用性、容量扩展和负载均衡等特性。
Hadoop和Couchbase就是常见的分布式数据库管理系统。
总结起来,数据库管理系统是用于管理数据的软件系统,根据数据存储方式的不同,分为关系型数据库管理系统、非关系型数据库管理系统和分布式数据库管理系统。
不同的数据库管理系统适用于不同的应用场景,开发人员和企业可以根据自己的需求选择适合的数据库管理系统来进行数据管理。
分布式数据库系统

答
P
场地A
场地B
在场地B选出红色零件的元组(10个),然后对每一 个元组逐一检查场地A,看北京供应商的装运单中是否有 这个零件装运单(若有则选出S#),每做这样一次检查 包括2次消息,共问答10次,通信时间为:
T[4]=2*10=20秒
26
查询处理和优化
策略5:
传(S#,P#)
(S)SP
P
场地A
14
分布透明性----包括分片透明性、位置透明性和局部数 据模型透明性。
分片透明性----分布透明性的最高层次。指用户或 应用程序只对全局关系进行操作而不考虑关系的分 片。当分片模式改变了,由于全局到分片模式的映 像、全局模式不变,应用程序不必改写。
位置透明性----分布透明的下一层次。指用户或应用 程序不必了解片段的场地,当存储场地改变了,由于 分片模式到分布模式的映像,应用程序不必改变。 局部数据模型透明性----用户或应用程序不必了解局 部场地上使用哪种数据模型,模型转换以及数据库语 言的转换由映像4完成。
分布式数据库系统中全局应用要涉及到两个以上结点的 数据,全局事务可能由不同场地的多个操作组成。所以应 该保证数据库的全局一致性、全局并发事务的可串行性和 系统的全局可恢复性。 当一个结点发生故障,操作失败后如何使全局事务回滚? 如何使另一个结点撤销已执行的操作或不必再执行其他操作。
采用的技术比集中式数据库系统更复杂和困难。
•提高系统的可靠性、可用性 当某一场地出现故障时,系统可以对另一场地上的相同 副本进行操作,不至于造成整个系统的瘫痪。
•提高系统性能 系统可选择用户最近的数据副本进行操作,减少通
信代价,改善整个系统性能。
存在的问题: 冗余副本之间存在数据不一致,必须着力解决。
分布式数据库总结

%%%%%%%%%%%%%%%第一章:分布式数据库系统概述数据库:长期存储在计算机内的有组织的,可共享的相关数据的集合。
数据库管理系统:DBMS是介于用户与操作系统之间的一层数据管理软件。
为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
DBMS基于某种数据模型。
数据库系统:数据库系统(DBS)通常是指带有数据库的计算机应用系统。
包括数据库、相应的硬件、软件和各类人员。
数据库技术:数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科;是一门综合性较强的学科。
数据抽象:视图抽象——外模式;概念抽象——概念模式;物理抽象——内模式数据模型:数据模型三要素:数据结构;数据操作;完整性约束模式/内模式映象:该映象存在于模式与内模式之间,用于定义模式与内模式之间的对应性。
本映象一般在内模式中描述。
外模式/模式映象:该映象存在于外模式与模式之间,用于定义外模式和模式之间的对应性。
本映象一般在外模式中描述。
物理独立性:在数据库系统的三级模式结构中,存在模式/内模式的映象,当内模式发生变化时,只要修改模式/内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。
逻辑独立性:在数据库系统的三级模式结构中,存在外模式/模式的映象,当模式发生变化时,只要修改外模式/模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。
DDBS具有如下四个基本特点:物理分布性逻辑整体性场地自治性场地之间协作性计算机网络:定义为相互联接、彼此独立的计算机系统的集合。
相互联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。
计算机网络的组成:通信子网和资源子网分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。
分布式数据库系统(DDBS)概述.

分布式数据库系统(DDBS概述一个远程事务为一个事务,包含一人或多个远程语句,它所引用的全部是在同一个远程结点上.一个分布式事务中一个事务,包含一个或多个语句修改分布式数据库的两个或多个不同结点的数据.在分布式数据库中,事务控制必须在网络上直辖市,保证数据一致性.两阶段提交机制保证参与分布式事务的全部数据库服务器是全部提交或全部回滚事务中的语句.ORACLE分布式数据库系统结构可由ORACLE数据库管理员为终端用户和应用提供位置透明性,利用视图、同义词、过程可提供ORACLE分布式数据库系统中的位置透明性.ORACLE提供两种机制实现分布式数据库中表重复的透明性:表快照提供异步的表重复;触发器实现同步的表的重复。
在两种情况下,都实现了对表重复的透明性。
在单场地或分布式数据库中,所有事务都是用COMMIT或ROLLBACK语句中止。
二、分布式数据库系统的分类:(1 同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型,并且是同一型号的DBMS。
(2同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS的型号不同,譬如DB2、ORACLE、SYBASE、SQL Server等。
(3异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。
随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。
三、分布式数据库系统主要特点:DDBS的基本特点:(1物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。
逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户共享,并由一个DDBMS统一管理。
(2场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用。
(3场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。
DDBS的其他特点(1数据独立性(2集中与自治相结合的控制机制(3适当增加数据冗余度(4事务管理的分布性四、分布式数据库系统的优点:(1更适合分布式的管理与控制。
数据库分布式系统的说明书
数据库分布式系统的说明书一、引言数据库分布式系统是一种基于分布式计算和存储的数据库系统,可以将数据和计算任务分散到多个节点上进行并行处理,从而提高系统的性能与可扩展性。
本文将详细介绍数据库分布式系统的原理、架构以及应用场景。
二、原理与架构1. 分布式数据存储数据库分布式系统中的数据通常被分散存储在多个节点上,每个节点负责管理一部分数据。
这样的分布方式可以提高数据的可用性和容错性,同时也增加了系统的并行处理能力。
2. 分布式数据访问为了实现对分布式存储的数据的高效访问,数据库分布式系统采用了一些常用的技术手段,如数据划分、数据复制、数据分片等。
这些技术可以提高数据的可靠性、查询效率和负载均衡能力。
3. 分布式事务处理在分布式环境下,事务处理变得更加复杂。
数据库分布式系统通过引入分布式事务协调器来协调多个节点上的事务执行,保证数据的一致性和可靠性。
4. 分布式查询与计算数据库分布式系统支持将查询和计算任务分发到多个节点上进行并行处理,从而提高系统的查询性能和计算能力。
常用的分布式查询与计算技术包括MapReduce、Spark等。
三、应用场景数据库分布式系统在许多领域都有广泛的应用,以下是几个典型的应用场景。
1. 大规模数据分析对于大规模的数据分析任务,传统的单机数据库往往无法满足性能要求。
通过将数据分散存储在多个节点上,并使用分布式查询和计算技术,可以大幅提高数据分析的效率和速度。
2. 云计算平台云计算平台需要支持大规模用户的数据存储和查询需求,因此数据库分布式系统是其基础设施之一。
通过将数据库分布在多个物理节点上,可以提供高可用性和扩展性的数据服务。
3. 实时数据处理对于实时数据处理场景,数据库分布式系统可以通过数据的并行处理和分布式计算来实现对实时数据的快速处理和分析。
这在金融、物联网等领域有着重要的应用价值。
四、总结数据库分布式系统是一个基于分布式计算和存储的数据库架构,可以提高系统的性能、可靠性和可扩展性。
分布式数据库
8.2 分布式数据库管理系统DDBMS(Distribute DBMS )分布式数据库意味着一个应用程序可以对数据库进行透明操作,数据库中的数据分布在不同的数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通讯网络连接在一起。
一个一分布式数据库由一个逻辑数据库组成,这个逻辑数据库的数据分布存贮在由计算机网络相连的不同场地的计算机中,每一场地都有自治能力完成局部应用。
每一场地也参与至少两个结点以上的全局应用程序的执行,全局应用可以存取若干场地的数据。
从应用程序看来,就好象数据是存储在一台计算机上,由单个DBMS管理一样。
8.2.1 分布式数据库系统的产生分布式数据库由一组数据集合组成,这些数据属于一个逻辑数据库,但数据存贮在多个物理计算机结点上,通过网络连接在一起。
分布式数据库系统是在集中式数据库系统的基础上发展起来的,是数据库技术与计算机网络技术结合的产物。
分布式数据库系统是具有管理分布数据库功能的计算机系统。
一个分布式数据库是由分布于计算机网络上的多个逻辑相关的数据库组成的集合,网络中的每个结点具有独立处理的能力(称为场地自治),可执行局部应用,同时,每个结点通过网络通讯系统也能执行全局应用。
所谓局部应用即仅对本结点的数据库执行某些应用。
所谓全局应用(或分布应用)是指对二个以上结点上的数据库执行某些应用。
支持全局应用的系统才能称为分布式数据库系统。
对用户来说,一个分布式数据库系统逻辑上看如同集中式数据库系统一样,用户可在任何一个场地执行全局应用。
分布式数据库系统适合于单位分散的部门,允许各个部门将其常用数据存储在本地,实施就地存放就地使用,降低通讯费用,并可提高响应速度。
因为这些企业实际上已经把数据分散在不同的位置或不同的物理计算机上。
例如,一个公司的不同部门的数据,银行系统的各个分行数据等。
企业的信息资源已经是被划分为许多信息资源孤岛,分布式数据库系统是适应企业的结构现状,满足企业的应用要求,把所有的信息资源孤岛连接起来,实现数据的异地存取。
分布式数据库管理系统简介
分布式数据库管理系统简介一、什么是分布式数据库:分布式数据库系统是在集中式数据库系统的基础上发展来的。
是数据库技术与网络技术结合的产物。
分布式数据库系统有两种:一种是物理上分布的,但逻辑上却是集中的。
这种分布式数据库只适宜用途比较单一的、不大的单位或部门。
另一种分布式数据库系统在物理上和逻辑上都是分布的,也就是所谓联邦式分布数据库系统。
由于组成联邦的各个子数据库系统是相对“自治”的,这种系统可以容纳多种不同用途的、差异较大的数据库,比较适宜于大范围内数据库的集成。
分布式数据库系统(DDBS)包含分布式数据库管理系统(DDBMS)和分布式数据库(DDB)。
在分布式数据库系统中,一个应用程序可以对数据库进行透明操作,数据库中的数据分别在不同的局部数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。
一个分布式数据库在逻辑上是一个统一的整体:即在用户面前为单个逻辑数据库,在物理上则是分别存储在不同的物理节点上。
一个应用程序通过网络的连接可以访问分布在不同地理位置的数据库。
它的分布性表现在数据库中的数据不是存储在同一场地。
更确切地讲,不存储在同一计算机的存储设备上。
这就是与集中式数据库的区别。
从用户的角度看,一个分布式数据库系统在逻辑上和集中式数据库系统一样,用户可以在任何一个场地执行全局应用。
就好那些数据是存储在同一台计算机上,有单个数据库管理系统(DBMS)管理一样,用户并没有什么感觉不一样。
分布式数据库中每一个数据库服务器合作地维护全局数据库的一致性。
分布式数据库系统是一个客户/服务器体系结构。
在系统中的每一台计算机称为结点。
如果一结点具有管理数据库软件,该结点称为数据库服务器。
如果一个结点为请求服务器的信息的一应用,该结点称为客户。
在ORACLE客户,执行数据库应用,可存取数据信息和与用户交互。
在服务器,执行ORACLE软件,处理对ORACLE 数据库并发、共享数据存取。
数据库管理系统简介
02
CATALOGUE
数据库管理系统的主要组件
数据存储
数据存储
01
数据库管理系统负责存储和管理大量数据,提供稳定的数据存
储环境。
数据存储方式
02
数据以表格形式存储,每个表格包含一系列行和列,用于组织
数据。
数据存储介质
03
数据存储在硬盘、内存和网络等介质上,以确保数据的安全性
和可靠性。
数据检索
数据检索
数据库管理系统提供高效的数据检索功能,支持用户快速 查询和获取所需数据。
01
查询语言
数据库管理系统使用结构化查询语言( SQL)进行数据检索,用户可以通过编 写SQL语句来查询数据。
02
03
检索性能优化
数据库管理系统采用索引、查询优化 等技术提高数据检索效率。
数据安全与保护
数据安全
数据库管理系统提供数据加密、 访问控制等安全措施,确保数据 不被非法访问和篡改。
数据库管理系统用于存储和管理商品 信息,包括产品描述、价格、库存等 ,支持在线购物和销售。
订单处理
数据库管理系统用于处理电子商务平 台的订单信息,包括订单确认、支付 、发货等环节,确保交易顺利进行。
云计算应用
云存储
数据库管理系统提供云存储服务,支持大量数据的存储和管理,方便用户随时随地访问 数据。
功能
数据库管理系统提供数据存储、检索 、更新、删除和安全控制等功能。
数据库管理系统的分类
关系型数据库管理系统(RDBMS)
使用表格形式存储数据,支持SQL语言,如MySQL、Oracle和SQL Server。
非关系型数据库管理系统(NoSQL DBMS)
不使用表格形式存储数据,支持键值对、文档、列式存储等,如MongoDB、Cassandra和Redis。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布式数据库管理系统简介一、什么是分布式数据库:分布式数据库系统是在集中式数据库系统的基础上发展来的。
是数据库技术与网络技术结合的产物。
分布式数据库系统有两种:一种是物理上分布的,但逻辑上却是集中的。
这种分布式数据库只适宜用途比较单一的、不大的单位或部门。
另一种分布式数据库系统在物理上和逻辑上都是分布的,也就是所谓联邦式分布数据库系统。
由于组成联邦的各个子数据库系统是相对“自治”的,这种系统可以容纳多种不同用途的、差异较大的数据库,比较适宜于大范围内数据库的集成。
分布式数据库系统(DDBS)包含分布式数据库管理系统(DDBMS和分布式数据库(DDB)。
在分布式数据库系统中,一个应用程序可以对数据库进行透明操作,数据库中的数据分别在不同的局部数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。
一个分布式数据库在逻辑上是一个统一的整体:即在用户面前为单个逻辑数据库,在物理上则是分别存储在不同的物理节点上。
一个应用程序通过网络的连接可以访问分布在不同地理位置的数据库。
它的分布性表现在数据库中的数据不是存储在同一场地。
更确切地讲,不存储在同一计算机的存储设备上。
这就是与集中式数据库的区别。
从用户的角度看,一个分布式数据库系统在逻辑上和集中式数据库系统一样,用户可以在任何一个场地执行全局应用。
就好那些数据是存储在同一台计算机上,有单个数据库管理系统(DBMS)管理一样,用户并没有什么感觉不一样。
分布式数据库中每一个数据库服务器合作地维护全局数据库的一致性。
分布式数据库系统是一个客户/ 服务器体系结构。
在系统中的每一台计算机称为结点。
如果一结点具有管理数据库软件,该结点称为数据库服务器。
如果一个结点为请求服务器的信息的一应用,该结点称为客户。
在ORACL客户,执行数据库应用,可存取数据信息和与用户交互。
在服务器,执行ORACL软件,处理对ORACLE 数据库并发、共享数据存取。
ORACL允许上述两部分在同一台计算机上,但当客户部分和服务器部分是由网连接的不同计算机上时,更有效。
分布处理是由多台处理机分担单个任务的处理。
在ORACL数据库系统中分布处理的例子如:客户和服务器是位于网络连接的不同计算机上。
单台计算机上有多个处理器,不同处理器分别执行客户应用。
参与分布式数据库的每一服务器是分别地独立地管理数据库,好像每一数据库不是网络化的数据库。
每一个数据库独立地被管理,称为场地自治性。
场地自治性有下列好处:♦系统的结点可反映公司的逻辑组织。
♦由局部数据库管理员控制局部数据,这样每一个数据库管理员责任域要小一些,可更好管理。
♦只要一个数据库和网络是可用,那么全局数据库可部分可用。
不会因一个数据库的故障而停止全部操作或引起性能瓶颈。
♦故障恢复通常在单个结点上进行。
♦每个局部数据库存在一个数据字典。
♦结点可独立地升级软件。
可从分布式数据库的所有结点存取模式对象,因此正像非分布的局部的DBMS必须提供一种机制,可在局部数据库中引用一个对象。
分布式DBMS必须提供一种命名模式,以致分布式数据库中一个对象可在应用中唯一标识和引用。
一般在层次结构的每一层实施唯一性。
分布式DBMS简单地扩充层次命名模型,实施在网络上唯一数据库命名。
因此一个对象的全局对象名保证在分布式数据库内是唯一。
ORACL允许在SQL语句中使用全局对象名引用分布式数据库中的模式对象(表、视图和过程)。
在ORACLE中,一个模式对象的全局名由三部分组成:包含对象的模式名、对象名、数据库名、其形式如:SCOTT.EMP@一个远程查询为一查询, 是从一个或多个远程表中选择信息, 这些表驻留在同一个远程结点.一个分布式查询可从两个或多个结点检索数据. 一个分布式更新可修改两个或两个以上结点的数据.一个远程事务为一个事务, 包含一人或多个远程语句, 它所引用的全部是在同一个远程结点上.一个分布式事务中一个事务, 包含一个或多个语句修改分布式数据库的两个或多个不同结点的数据.在分布式数据库中,事务控制必须在网络上直辖市, 保证数据一致性.两阶段提交机制保证参与分布式事务的全部数据库服务器是全部提交或全部回滚事务中的语句.ORACL分布式数据库系统结构可由ORACLE D据库管理员为终端用户和应用提供位置透明性,利用视图、同义词、过程可提供ORACLE分布式数据库系统中的位置透明性.ORACL提供两种机制实现分布式数据库中表重复的透明性:表快照提供异步的表重复;触发器实现同步的表的重复。
在两种情况下,都实现了对表重复的透明性。
在单场地或分布式数据库中,所有事务都是用COMMIT或ROLLBACK S句中止。
二、分布式数据库系统的分类:(1)同构同质型DDBS各个场地都采用同一类型的数据模型(譬如都是关系型),并且是同一型号的DBMS。
(2)同构异质型DDBS各个场地采用同一类型的数据模型,但是DBMS勺型号不同,譬如DB2、ORACL、E SYBASE、SQL Server 等。
(3)异构型DDBS各个场地的数据模型的型号不同,甚至类型也不同。
随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。
三、分布式数据库系统主要特点:DDBS勺基本特点:(1)物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。
逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBM统一管理。
(2)场地自治性:各场地上的数据由本地的DBMS!理,具有自治处理能力,完成本场地的应用( 局部应用) 。
(3)场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。
DDBS勺其他特点(1)数据独立性(2)集中与自治相结合的控制机制(3)适当增加数据冗余度(4)事务管理的分布性四、分布式数据库系统的优点:(1)更适合分布式的管理与控制。
分布式数据库系统的结构更适合具有地理分布特性的组织或机构使用,允许分布在不同区域、不同级别的各个部门对其自身的数据实行局部控制。
例如:实现全局数据在本地录入、查询、维护,这时由于计算机资源靠近用户,可以降低通信代价,提高响应速度,而涉及其他场地数据库中的数据只是少量的,从而可以大大减少网络上的信息传输量; 同时,局部数据的安全性也可以做得更好。
(2)具有灵活的体系结构。
集中式数据库系统强调的是集中式控制,物理数据库是存放在一个场地上的,由一个DBMS集中管理。
多个用户只可以通过近程或远程终端在多用户操作系统支持下运行该DBMS 来共享集中是数据库中的数据。
而分布式数据库系统的场地局部DBMS勺自治性,使得大部分的局部事务管理和控制都能就地解决,只有在涉及其他场地的数据时才需要通过网络作为全局事务来管理。
分布式DBM阿以设计成具有不同程度的自治性,从具有充分的场地自治到几乎是完全集中式的控制。
(3)系统经济,可靠性高,可用性好。
与一个大型计算机支持一个大型的集中式数据库在加一些进程和远程终端相比,由超级微型计算机或超级小型计算机支持的分布式数据库系统往往具有更高的性价比和实施灵活性。
分布式系统比集中式系统具有更高的可靠性和更好的可用性。
如由于数据分布在多个场地并有许多复制数据,在个别场地或个别通信链路发生故障时,不致于导致整个系统的崩溃,而且系统的局部故障不会引起全局失控。
(4)在一定条件下响应速度加快。
如果存取的数据在本地数据库中,那么就可以由用户所在的计算机来执行,速度就快。
(5)可扩展性好,易于集成现有系统,也易于扩充。
对于一个企业或组织,可以采用分布式数据库技术在以建立的若干数据库的基础上开发全局应用,对原有的局部数据库系统作某些改动,形成一个分布式系统。
这比重建一个大型数据库系统要简单,既省时间,又省财力、物力。
也可以通过增加场地数的办法,迅速扩充已有的分布式数据库系统。
五、分布式数据库系统的劣势:(1)通信开销较大,故障率高。
例如,在网络通信传输速度不高时,系统的响应速度慢,与通信相关的因素往往导致系统故障,同时系统本身的复杂性也容易导致较高的故障率。
当故障发生后系统恢复也比较复杂,可靠性有待提高。
(2)数据的存取结构复杂。
般来说,在分布时数据库中存取数据,比在集中时数据库中存取数据更复杂,开销更大。
(3)数据的安全性和保密性较难控制。
在具有高度场地自治的分布时数据库中,不同场地的局部数据库管理员可以采用不同的安全措施,但是无法保证全局数据都是安全的。
安全性问题式分布式系统固有的问题。
因为分布式系统式通过通信网络来实现分布控制的,而通信网络本身却在保护数据的安全性和保密性方面存在弱点,数据很容易被窃取。
分布式数据库的设计、场地划分及数据在不同场地的分配比较复杂。
数据的划分及分配对系统的性能、响应速度及可用性等具有极大的影响。
不同场地的通信速度与局部数据库系统的存取部件的存取速度相比,是非常慢的。
通信系统有较高的延迟,在CPU上处理通信信息的代价很高。
分布式数据库系统中要注意解决分布式数据库的设计、查询处理和优化、事务管理及并发控制和目录管理等问题。
六、分布式数据库系统:数据分片类型:1、水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
2、垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。
3、导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。
4、混合分片:以上三种方法的混合。
可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。
条件:(1) 完备性条件:必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。
(2) 可重构条件:必须保证能够由同一个全局关系的各个片段来重建该全局关系。
对于水平分片可用并操作重构全局关系; 对于垂直分片可用联接操作重构全局关系。
(3) 不相交条件:要求一个全局关系被分割后所得的各个数据片段互不重叠( 对垂直分片的主键除外)。
七、分布式数据库系统:数据分配方式(1)集中式:所有数据片段都安排在同一个场地上。
(2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。
(4)全复制式:数据在每个场地重复存储。
也就是每个场地上都有一个完整的数据副本。
(5)混合式:这是一种介乎于分割式和全复制式之间的分配方式。
八、分布式数据库系统:体系结构数据分片和数据分配概念的分离,形成了“数据分布独立型”概念。
数据冗余的显式控制。
数据在各个场地的分配情况在分配模式中一目了然,便于系统管理。