分布式数据库研究新趋势

合集下载

分布式数据库技术与应用分析

分布式数据库技术与应用分析随着互联网的发展和应用范围的拓展，数据规模也不断地扩大，因此，人们需要更高效的方式来存储、管理和处理数据。

在这样的背景下，分布式数据库技术应运而生。

本文将对分布式数据库技术进行分析及其应用。

一、分布式数据库技术的概念与优势分布式数据库技术指的是将一个数据库分为多个部分，分别存储在多个不同的计算机上，并通过网络进行通信，从而形成了一个虚拟的数据库，使得数据可以在不同的地方、不同的时间点进行存取。

与传统的集中式数据库相比，分布式数据库技术具有以下的优势：1. 可靠性更高：分布式数据库技术使用了数据备份、冗余和分布式交易等多种机制，保证了数据的复制和恢复能力，在一台计算机出现故障时，仍然可以进行数据的读取和操作。

2. 更高的性能：由于数据分布在多台计算机上，分布式数据库可以通过对各个计算机的并行处理来提高处理速度，从而提高了整个数据库的性能。

3. 扩展性更强：由于分布式数据库可以不断地添加计算机来扩展存储空间，使得整个系统的存储和处理能力可以很方便地进行扩展，以适应数据规模的增长。

二、分布式数据库技术的实现方式分布式数据库技术的实现方式主要包括：垂直划分、水平划分和复制等。

其中，垂直划分是将数据库按照数据表进行划分，每个表分别存储在不同的计算机上；水平划分是将数据表中的数据按照行或列进行划分，使得同一个数据表中的数据可以分布在不同的计算机上；而复制则是将同样的数据存储在多个不同的计算机上，以实现数据的备份和冗余。

三、应用场景及实践案例分布式数据库技术在实际应用中可以解决很多问题，如数据安全性、负载均衡和数据存取速度等方面的问题，适用于大型企业和互联网应用。

以下是一些常见的应用场景和实践案例：1. 金融行业：在交易、结算等领域，金融行业需要处理海量的交易数据，采用分布式数据库技术可以实现高效的交易系统，保证金融系统的安全性和可靠性。

2. 电商平台：电商平台的订单、库存等数据会随着用户的增多而呈指数增长，采用分布式数据库技术可以实现大规模并发操作，以及快速的数据读取和写入。

分布式数据库中的事务管理与并发控制研究

分布式数据库中的事务管理与并发控制研究在当今信息技术高速发展的背景下，分布式数据库的应用日益广泛。

然而，分布式数据库面临着许多挑战，其中之一就是如何进行有效的事务管理和并发控制。

本文将重点研究分布式数据库中的事务管理和并发控制问题，并探讨当前的研究状况和未来发展趋势。

1. 事务管理事务是数据库操作的最小单位，它是一组数据库操作的集合，要么全部执行成功，要么全部回滚。

在分布式数据库中，由于数据分布在多个节点上，事务管理更加复杂。

主要的事务管理技术包括两阶段提交（Two-Phase Commit，2PC）、三阶段提交（Three-Phase Commit，3PC）和乐观并发控制（Optimistic Concurrency Control，OCC）。

2. 两阶段提交（2PC）2PC是一种常见的分布式事务管理协议，它通过协调器和参与者的交互来确保分布式事务的一致性。

首先，协调器向所有参与者发送准备请求，并等待它们的回复。

如果所有参与者都准备好了，协调器发送提交请求，否则发送中止请求。

然后，所有参与者执行相应的操作，完成后向协调器发送决策报告。

最后，协调器根据收到的决策报告判断是否提交事务。

2PC的主要问题是在协调器失效的情况下可能导致事务长时间阻塞。

3. 三阶段提交（3PC）为了解决2PC中的长时间阻塞问题，3PC在协议中引入了一次prepare阶段。

与2PC不同的是，3PC在prepare阶段引入了超时机制。

如果某个参与者超时，它将无法接收到协调器的提交请求，并进行回滚。

这样可以避免长时间阻塞，但是在网络不稳定的情况下仍然可能导致事务无法提交，丧失了完全一致性。

4. 乐观并发控制（OCC）OCC是一种轻量级的并发控制方法，它不需要显式的锁机制，而是基于版本控制实现。

每个事务在读取数据时都会获取一个版本号，并在提交时检查数据是否被其他事务修改，如果是，则回滚。

OCC的优势在于降低了锁开销和死锁风险，但在高并发和冲突频繁的场景中可能导致回滚的次数过多，影响性能。

分布式数据库的应用研究

新会引起数据的不一致 ! 系统必须以最小的代价保持各冗余副本的一致性" & # 分布式事务的并发控制在分布式数据库系统中 ! 多个事务同时读写同一数据的情况比集中式数据库系统大得多 ! 并发控制机制在尽可能提高系统并行性 # 提高系统效率的同时 ! 要协调多个事务 ! 保证结果的正确性以及数据库的完整性 # 一致性" ’ # 可靠性要有一套机制保证某站点或者某通信线路出现故障时 ! 系统其余部分可以正常工作 !并有效恢复出现故障的部件" 2 # 目录管理分布式数据库系统的目录即分布式数据库系统的数据字典 " 目录系统本身也构成了一个分布式数据库系统 ! 有着同样的问题 ! 目录的分布与冗余存在对某一费用函数的优化" $# 利用分布式数据库技术搭建企业信息管理系统
!! 引言当前 ! 企业管理思想和管理模式不断发生变化 ! 对信息系统也不断提出更高的要求 ! 基于集中式数据库的信息系统已经不能满足应用的需要 ! 此时 ! 数据库技术和计算机软硬件水平的不断进步以及网络技术的飞速发展 ! 促使分布式数据库技术出现 ! 在很大程度上解决了这一问题 " 分布式数据库技术是数据库技术与网络技术相结合的产物 ! 分布式数据库技术适用于地域上分散而管理上相对集中的大集团 # 大企业 ! 很好的解决了局部控制与全局管理的矛盾 ! 理顺了企业各个环节 ! 提升了企业的管理水平和竞争力" "# "!! 分布式数据库系统的优缺点简介分布式数据库系统的优点

刍议数据库技术现状与发展趋势

刍议数据库技术现状与发展趋势摘要：数据库技术是计算机技术的核心技术，也是发展最快速的技术。

计算机技术已经广泛应用于社会各个领域，而数据库技术却是整个计算机信息系统和应用系统的支撑技术，由此数据库技术的发展直接关系到计算机技术的发展，关系到社会的发展。

本文从数据库技术的发展进程出发，对数据库技术的发展现状进行了阐述，并对其发展趋势进行探讨。

关键词：数据库技术；发展现状；发展趋势中图分类号：tp311.13数据库技术起源于20世纪60年代末，是随着计算机技术的出现而出现的。

最初研发数据库技术是为了能够有效地管理和存取数据资源。

而且随着科学技术的不断发展与更新，数据库技术与计算机网络技术已经紧密结合起来，并相互促进、相互渗透，已经逐渐成为社会应用最为广泛的两大领域。

随着人们对于数据库技术的认识以及研发的不断加深，数据库技术逐渐完善，且应用领域不断拓展，由原先的事务处理逐渐延伸到情报检索、专家系统以及计算机辅助设计等领域，为人类生活与工作提供了便利，促进了社会的发展。

为了让数据库技术更好地服务于社会，本文对数据库技术的发展现状以及发展趋势做了详细地阐述。

1 数据库技术的发展进程数据库技术是信息系统的核心技术，并对计算机数据进行辅助管理。

数据库技术研究的重点在于如何更好地组织与存储数据，以及如何高效地获取和处理数据。

数据库技术是通过对数据库结构、设计、存储、管理等应用的理论和方法进行研究，并使用这些理论来对数据进行分析、处理的技术。

数据库技术的发展进程主要有三大阶段。

一、层次与网状数据库系统。

该系统是在20世纪70年代研制出来的。

层次数据库系统是数据库系统的先驱，而网状数据库系统则是数据库概念、方法、技术的奠基者。

二、关系数据库系统。

关系数据模型是在1970年由edgar f.codd提出的，为开创关系数据库技术奠定了理论基础，在随后的80年代，研发出了非常多的关系数据管理系统，如ingres、informix、db2等，这些管理系统被广泛应用于企业信息管理、情报检索等领域，为第三代数据库系统的研发奠定了坚实的理论基础。

分布式数据库技术的研究与应用前景

分布式数据库技术的研究与应用前景引言随着互联网、物联网、人工智能等技术的快速发展，数据的产生和处理速度呈现指数级增长。

在这个背景下，传统的集中式数据库系统已经无法满足数据处理需求。

分布式数据库系统应运而生，成为了解决大规模数据处理问题的重要手段。

本文将介绍分布式数据库技术的研究和应用前景，主要包括以下几个方面的内容：1. 分布式数据库的概念和特点2. 分布式数据库的系统体系结构3. 分布式数据库的数据一致性问题4. 分布式数据库的应用前景第一章：分布式数据库的概念和特点分布式数据库（Distributed Database）是一种将数据分布在多个物理节点上，节点间通过网络互联，形成一个逻辑上统一的数据库系统的技术。

它的发展目的在于解决数据处理的性能、可用性、扩展性和安全性等问题。

与传统的集中式数据库系统相比，分布式数据库有以下几个特点：1.1 分布式性分布式数据库的数据分布在不同的物理节点上，相当于一个大规模的数据库集群。

不同的节点可以在不同的位置，由不同的组织管理，节点间通过网络连接互通，形成一个逻辑上统一的系统。

1.2 高可用性由于数据可以分布在多个节点上，当其中一个节点出现故障后，其他节点可以继续提供服务。

这样可以避免单点故障（SinglePoint of Failure）的问题，提高系统的可用性。

1.3 高扩展性由于分布式数据库是由多个节点组成的，可以根据需要随时增加或减少节点，实现系统的弹性扩展和收缩。

1.4 高性能当数据量较大时，分布式数据库无疑比传统的集中式数据库系统具有更高的处理性能。

因为分布式数据库可以将数据分布在多个节点上，并行处理数据，提高系统的吞吐量和响应速度。

1.5 高安全性分布式数据库可以采用分布式数据备份和数据加密等安全措施，保证数据的安全性。

此外，由于数据分布在多个节点上，攻击者难以通过攻击单一节点来窃取数据，从而提高了系统的安全性。

第二章：分布式数据库的系统体系结构分布式数据库通常由以下几个组件组成：2.1 分布式数据库管理系统（Distributed Database Management System，简称DDBMS）分布式数据库管理系统是整个分布式数据库系统的核心，它负责将数据分片并存储在不同的物理节点上，处理用户的请求，维护数据的一致性和安全性等。

区块链技术的未来发展趋势展望

区块链技术的未来发展趋势展望区块链技术是近年来最受瞩目的新兴技术之一。

它是一种以分布式数据库技术为基础的公共账本，可以用于记录交易、管理资产、跟踪供应链等多种场景。

随着区块链技术的逐渐成熟和普及，未来几年将会出现很多新的应用场景和商业模式。

一、区块链技术的技术发展趋势1. 区块链技术的性能提升目前，区块链技术的性能仍然无法与传统数据库技术相媲美。

但是，在技术的不断迭代升级下，未来几年会有更多的技术方案和创新来提高区块链技术的吞吐量、延迟和可扩展性。

比如：Sharding、Plasma、Lightning Network等技术方案，可以有效地缩短交易时间并提升系统性能。

2. 隐私保护和安全性加强目前，区块链技术的隐私保护和安全性还存在一定的缺陷。

未来区块链技术的发展方向之一便是加强隐私保护和安全性。

比如：零知识证明、同态加密、加密计算等技术手段，可以在保障用户隐私的同时提高整个系统的安全性。

3. 区块链技术与其他技术的深度结合未来区块链技术不仅会单独存在，还会和其他领域的技术进行深度融合和结合，为不同行业的发展提供技术支持。

比如：与人工智能、物联网、云计算等技术结合，可以实现更广泛的应用场景。

二、区块链技术的应用发展趋势1. 金融领域区块链技术在金融领域的应用已经初步形成。

未来几年将会出现更多的形式。

比如：供应链金融、债券交易、区块链支付、数字货币等。

这些新的商业模式将极大地提高金融行业的效率和安全性。

2. 物联网领域物联网与区块链技术的结合也是未来的一个发展方向。

区块链技术可以为物联网设备提供安全可靠的身份认证和数据交换。

未来可以应用于智能家居、智能交通、智慧城市等领域，实现更便捷的生活和更高效的服务。

3. 社交领域区块链技术可以为社交平台提供更加透明和安全的交互环境，未来可能会引领下一代社交媒体的发展方向。

比如：利用区块链技术实现身份认证和信息分享，保护用户隐私的同时增加社交媒体的可信度。

三、区块链技术面临的挑战和解决方案1. 法律和监管问题区块链技术的应用可能会涉及到一些法律和监管问题。

分布式数据库系统设计与实现研究

分布式数据库系统设计与实现研究随着大数据时代的到来，数量庞大、复杂多变的数据需求越来越成为一个问题。

分布式数据库系统技术因此而受到广泛关注和研究。

本文将结合自己的研究经验，从以下几个方面分析分布式数据库系统的设计与实现。

一、分布式数据库系统的概念分布式数据库系统是指将数据分布在多个物理位置上，并且这些位置被连接到一起的系统。

每个物理位置上可能有一个或多个数据库，这些数据库在逻辑上是相互独立的，但在物理上是相互关联的。

分布式数据库系统的目的是实现全局性的数据共享和数据访问。

分布式数据库系统的特点在于它可以分散地存储数据，并利用多个独立的计算机系统处理这些数据。

这种设计能够使数据更加安全、高效地使用和处理，同时具有更高的可用性和可伸缩性。

二、分布式数据库系统的架构设计分布式数据库系统的架构设计应该包括以下几个方面：1.数据分片将数据按照某种规则分散地存储在不同的计算机节点上，可以避免单一节点的数据过于庞大，造成性能问题，同时也可以减轻系统的工作压力。

2.数据共享分布式数据库系统需要实现数据共享，让所有节点都能访问到相同的数据，避免数据的不一致性，这个过程需要确保数据的同步与一致性。

3.系统划分分布式数据库系统需要将系统划分成各个相对独立的子系统，每个子系统可以独立处理数据，这样可以提高系统的可靠性和可维护性。

4.灵活扩展分布式系统需要支持灵活扩展，在需要添加计算机节点时，系统应该能够自动添加并处理新增的节点。

三、实现分布式数据库系统的难点分布式数据库系统的实现有一些困难，其中最大的难点是数据的同步与一致性。

在分布式系统中，不同节点之间的数据可能会发生变化，如何保证数据的相对一致性，并且能够尽快同步，一直是分布式数据库系统需要面对的难题。

此外，在设计分布式数据库系统时，还需要考虑到负载均衡、数据安全等问题，这些都需要一定的技术储备和实践经验。

四、未来的发展方向随着大数据时代的到来，分布式数据库系统将继续得到广泛的应用。

数据库技术的发展趋势

数据库技术的发展趋势随着数字化时代的到来，数据成为了一种宝贵资源。

数据库技术作为数字化时代的重要组成部分，也在不断地发展和创新。

本文将探讨数据库技术的发展趋势。

1.云端化随着互联网的普及和云计算的兴起，越来越多的企业开始将数据库迁移到云端。

云端化的优势在于具有更高的可扩展性和可靠性。

云端化的数据库不仅能够提高数据的安全性，还能够有效地降低企业的成本。

随着云计算领域的不断发展和创新，云端化的数据库技术也将不断地发展和完善。

2.大数据随着社交网络、物联网等大量数据的产生，数据的储存量也呈现出爆发式的增长。

传统的关系数据库很难应对如此海量的数据存储和处理。

因此，大数据技术的出现给数据库带来了一次革命性的变革。

Hadoop和NoSQL等大数据相关技术已经成为数据库领域的重要发展方向。

未来，大数据技术将会继续推动数据库技术的发展。

3.人工智能人工智能的兴起将会为数据库技术带来新的发展机遇。

在传统数据库中，数据只是被动地被存储和查询。

但是，随着人工智能技术的不断发展，数据库将被赋予更多的智能技能，如自动分析数据、自动优化数据结构等。

未来，人工智能技术将会与数据库技术结合得更加紧密，创建出新的数据库应用场景。

4.区块链区块链技术的出现正在改变着传统的数据库技术。

与传统的关系型数据库相比，区块链数据库具有更高的安全性和去中心化特性。

因此，区块链技术将在数据存储领域取得越来越大的进展。

未来，区块链技术将逐渐成为数据库技术的重要领域之一。

5.物联网物联网的兴起也将推动数据库技术的发展。

物联网产生的数据具有更多的复杂性和多样性，需要更加完善的数据库技术进行存储和管理。

未来，数据库技术将继续为物联网的发展提供支持和保障。

总结随着数字化时代的到来，数据库技术也在不断地发展和创新。

云端化、大数据、人工智能、区块链和物联网等技术的兴起正在推动数据库技术的发展。

这些发展趋势不仅将使数据库技术更加智能化、安全化和高效化，也将为我们的数字生活带来更多的便利和惊喜。

数据库技术的发展趋势

数据库技术的发展趋势数据库技术的发展趋势随着计算机技术特别是计算机⽹络技术的发展，传统的数据库技术⾯临挑战。

主要表现在以下⼏个⽅⾯：环境的变化数据库的应⽤环境由可控制的环境变成多变的异构信息集成环境和Internet环境。

数据类型的变化数据库中的数据类型由结构化扩⼤⾄半结构化、⾮结构化和多媒体数据类型。

数据来源的变化⼤量数据将来源于实时和动态的传感器或监测设备，需要处理的数据量剧增。

数据管理要求的变化许多新型应⽤需要⽀持协同设计和⼯作流管理。

⾯向对象数据库把⾯向对象的技术与数据库技术相结合，便产⽣了⾯向对象数据库。

⽬前，⾯向对象数据库是数据库技术的⼀个重要发展⽅向，国外已经推出⼀些⾯向对象数据库产品，如美国Itasca System 公司的Itascs、Object Design公司的ObjectStore。

这些⾯向对象数据库⼀般采⽤的是“纯”的⾯向对象模型。

另外，还有⼀类⾯向对象数据库基于原有的关系数据库扩展⽽来的，即在关系数据库上引进封装、继承、随机数据类型等概念。

⼀些著名的数据库⼚商及第三⽅⼚商在关系数据库上开发了⼤量的⾯向对象开发⼯具及环境。

分布式数据库分布式数据库系统由多台计算机组成，每台计算机上配有各⾃的本地数据库，各计算机之间通过通信⽹络连接。

在这种系统中，⼤多数处理任务由本地计算机访问本地数据库来完成，对于少量本地计算机不能单独胜任的处理任务，则通过通信⽹络与其他计算机相联系，并获得其他数据库中的数据。

分布式数据库的数据在地理上分散、逻辑上集中，数据由系统统⼀管理，使⽤户感觉不到数据的分散，⽤户看到的似乎是⼀个集中式数据库。

与集中式数据库⽐较，分布式数据库具有体系结构灵活性⼤、可靠性⾼、可⽤性好、可扩充性好等优点。

同时，也存在⼀些不⾜：分布式数据库虽然有利于改善性能，但如果数据库设计不好，数据分布不合理，使远距离访问过多，特别是当分布连接操作过多时，会降低系统的性能。

联邦数据库⼈类在其⽂明形成和发展过程中已经积累了浩瀚的数据，并且采⽤已有的各种DBMS分别进⾏着管理。

分布式数据库与数据治理

分布式数据库与数据治理分布式数据库是一种数据库系统，它的数据被分布在多个地点，这些地点可以在同一个建筑内，也可以分布在世界各地。

分布式数据库的主要目的是提高数据的可靠性和可用性，同时降低数据的存储成本。

在分布式数据库中，数据被分成多个部分，每个部分存储在不同的服务器上。

这些服务器可以通过网络进行通信，协同工作，对外提供一致的数据访问接口。

数据治理是一种管理数据的方法，它的目的是确保数据的质量、安全性和合规性。

数据治理包括数据的规划、管理、监督和控制，涉及到数据的整个生命周期。

在分布式数据库中，数据治理显得尤为重要，因为数据分布在多个地点，管理起来更加复杂。

分布式数据库与数据治理的关系如下：1.分布式数据库为数据治理提供了基础设施。

数据治理需要管理大量的数据，分布式数据库可以提供足够的存储空间和计算资源，满足数据治理的需求。

2.数据治理是分布式数据库正常运行的保障。

分布式数据库中的数据分布在多个地点，数据的安全性、可靠性和一致性需要通过数据治理来确保。

3.分布式数据库和数据治理共同支持业务的发展。

随着业务的发展，数据量不断增加，分布式数据库和数据治理可以帮助企业更好地利用数据，提高业务效率和竞争力。

在分布式数据库与数据治理方面，需要关注以下几个知识点：1.分布式数据库的架构和设计：了解分布式数据库的系统架构，包括数据节点、数据副本、数据分区等，以及如何设计和实现一个分布式数据库。

2.分布式数据库的数据一致性和同步：掌握分布式数据库中数据一致性的实现方法，如复制、校验和版本控制等，以及如何实现数据同步。

3.分布式数据库的数据安全：了解分布式数据库的安全风险，如数据泄露、数据篡改等，以及如何通过加密、访问控制和安全审计等措施来保护数据的安全。

4.数据治理的策略和方法：学习数据治理的策略和方法，如数据质量控制、数据标准化、数据隐私保护等，以及如何制定和实施数据治理计划。

5.分布式数据库与数据治理的工具和技术：了解分布式数据库和数据治理领域常用的工具和技术，如数据库管理系统、数据质量管理工具、数据治理平台等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1997年8月计算机工程与科学　第19卷　第3期 A ug.1997 COM PU T ER EN GIN EERIN G&SCIEN CE Vo l.19　N o.3　分布式数据库研究新趋势New T rends in Research onDistributed Databases李　霖　周兴铭Li Lin and Zhou Xingming(国防科技大学计算机系)(Department of Computer Science,National University of Defense Technology) 摘　要　本文从异构分布式数据库、网络数据库、移动数据库等几个方向,讨论了分布式数据库研究所面临的几个新课题,并对未来分布式数据库的发展前景作了展望。

ABSTRACTS　This paper presents three new issues on distributed databases, w hich are heter ogeneous distributed databases,the large netw ork o f auto nom ous databases,and mobile databases.Finally,w e describe our ex pectation o n distributed databases in the future.关键词　分布式数据库,异构性,自治性,网络规模,网络数据库,移动计算,移动数据库。

KEY WORDS　distributed databases,heterogeneity,autonomy,scale of netw ork, netw ork databases,mo bile computing,mobile databases.现在人们倾向于采用更广义的分布式数据库概念,即一个由若干独立自治的数据库系统(称为成员数据库)组成的集合,其中每个成员数据库都提供一组功能,用以实现与其它成员交换数据和服务。

这个定义具有很大的灵活性,将更广泛的研究领域纳入分布式数据库的范围之中。

本文将以这个广义的分布式数据库概念为基础,从异构分布式数据库、网络数据库、移动数据库等几个方面入手,综述在新的技术条件和应用背景下,分布式数据库研究面临的一些新问题和发展前景。

一、异构分布式数据库技术异构分布式数据库是指对已经存在的多个异构数据库,在尽可能少地影响其本地自收稿日期:1996年9月9日。

本课题为九五国防预研项目。

作者简介:李霖,男,博士研究生,1972年4月生,主要研究兴趣为并行与分布式数据库、移动数据库技术;周兴铭,中科院院士,主要研究法趣包括高性能机体系结构、并行与分布式数据库、先进计算机网络技术等。

通讯地址:410073　湖南长沙国防科技大学计算机系Address:Dept.of Computer S ci.,Nat′l Un iv.of Defense Tech.,Ch ang sha,Hunan410073,P.R.China治性的基础上,构造具有用户所需要的某种透明性的分布式数据库,以支持对物理上分布的多个数据库的全局访问和数据库之间的互操作性。

按照透明程度的不同,可以将异构分布式数据库的研究分为两个方向:一是联邦数据库(Feder al DB),它把多个异构数据库的模式集成为一个统一的全局模式(称作联邦模式),从而向用户提供较高程度的访问透明性,典型的联邦数据库结构由5层模式构成;二是多数据库(M ultiDB),它不建立统一的全局模式,只提供一种统一的多数据库语言和公共模式接口,用户可以使用这种语言访问各个异构的数据库,但在涉及需同时访问多个数据库的全局应用时,数据库之间的约束或依赖关系必须由用户(应用程序)负责定义和维护。

与传统的分布式数据库相比,异构分布式数据库的研究主要集中在以下几个方面。

1　模式翻译为了消除异构数据库的异构性,首先必须采用一种统一的数据模型来表示成员数据库的概念模式(本地模式),这种用公共数据模型描述的成员数据库模式称为成员模式。

模式翻译的关键问题是公共数据模型的选取。

为了包容各种数据模型,使本地模式的语义不致丢失,公共数据模型必须有很强的语义表达能力;此外,公共数据模型应易于被大家接收。

2　模式集成(用于联邦数据库)在参与联邦数据库时,各个成员数据库在成员模式的基础上定义允许外部用户访问的输出模式。

模式集成的任务就是将这些输出模式集成到一个统一的联邦模式中。

3　多数据库语言(用于多数据库)多数据库系统不提供统一的全局视图,但为用户提供一种能够访问所有成员数据库的多数据库语言。

使用这种多数据库语言,用户可以用统一的界面直接与各个成员数据库打交道,但要求用户自己清楚存在哪些成员数据库以及它们的输出模式。

4　全局查询处理在联邦数据库中,用户根据联邦模式提交全局查询。

与传统的分布查询处理相比,联邦数据库的异构性和自治性给查询优化带来了很大困难。

5　全局事务处理与并发控制异构分布式数据库的全局事务处理和并发控制一直是一个很棘手的难题,人们至今仍未找到理想的解决办法,其主要问题仍然是数据库的异构性与自治性的影响。

全局事务处理的另一个焦点问题是如何维护全局事务的可串性(serializability)。

现有的研究具有较大的局限性,它们有的存在潜在的正确性问题,有的虽然能够保证严格的可串性,但却大大降低了整个系统的并发性能。

未来的研究似乎将更着重于设计结合实际应用需求的全局事务正确性准则。

二、网络数据库的组织、管理与访问所谓网络数据库,是指所有连入网络并提供信息服务的自治数据库的集合。

众所周知,数据库是网络应用中必不可少的基础之一。

1　网络规模对分布式数据库实现算法的影响现有异构分布式数据库的研究主要基于有限规模的网络环境,在网络规模急剧扩大时,许多系统实现算法已难以适用,这些算法涉及分布查询处理、分布事务处理以及数据复制等领域。

系统可用性也是一个重要问题。

随着网络规模的膨胀,每个结点都同时处于可用状态的概率迅速降低。

实际上,当网络结点数超出一定数值时(例如10000),任何时候总会有某些结点处于不可访问状态,而许多原有的分布式数据库算法不能很好地解决这个问题。

2　大规模分布数据库的管理如何对大规模分布的数据库进行有效管理也是一个挑战。

随着成员数据库、用户以及各种事务的数量迅速增长,DBM S要维护的计帐、用户验证、访问权限等管理信息也相应增多;在考虑如何修改系统配置以改善运行效率时,DBA将面临着比往常多得多的可行选择;此外,各种数据库模式的大小和个数也在不断增加,所有这些因素都导致要有效地管理整个系统变得越来越困难。

其次,面对众多的数据库个数,人们难以评价整个系统的性能,也无法有效预测各种变化条件(如成员数据库的加入、退出)对系统性能产生的影响,因此目前亟需研究能完成这个任务的分布式数据库基准测试程序(Benchm ar k)。

3　语景(context)的差异与消解语景差异问题是由网络的规模引出的一个新的研究重点。

语景是指一组关于信息意义(称作语景定义)和信息质量(称作语景特征)的隐含假设。

通俗地说,语景就是人们在交流信息时互相默认的对信息的解释方式。

在不同的地域、组织或部门中,语景通常是互不相同的。

因此,在获取全球信息的同时,必须研究并解决不同语景之间存在的差别。

随着网络中数据库的数目持续快速地增长以及网络涉及地理范围的扩展,语景的类型(既包括信息发送者即数据库的语景,也包括信息接收者所处的语景)也不断多样化,这种手工的方法肯定不再适合,因此必须要研究新的语景消解策略来应付这个困境。

S.E.M adnick提出了一种语景调解服务的结构,从而在语景差异研究领域迈出了重要一步,但我们距离全球语景互换这个最终目标还相当遥远,需要付出更大的努力。

4　信息获取技术随着越来越多的各种数据库连入网络提供服务,人们可以从网络中获取的信息种类和容量都在迅速膨胀。

然而,面对全球网络中成千上万、规模庞大的数据库集合,用户怎样才能知道自己所需信息存放在哪些数据库中?又怎样才能快速访问到这些信息呢?由于规模等因素的影响,不可能把所有网络数据库的有关信息集中保存在一个单一的索引中,于是一个关键问题是:在没有集中索引的情况下,如何避免可能发生的遍历全网范围的穷尽搜索,设计更为有效的访问策略?这就是信息获取技术的研究内容。

信息获取技术主要需要解决两个问题:一是对网络中提供信息服务的各种自治数据库进行有效组织;二是为用户设计界面良好、效率较高的查询/浏览工具,利用对网络数据库的有效组织快速定位和访问信息。

三、移动数据库(Mobile Databases) 1　移动计算的主要特点移动性同一台移动计算机可以在不同的地方连通网络,这种计算平台的移动性可能导致系统访问布局的变化和资源的移动性。

而且,个人的移动性(即在不同地方使用当地的计算设备)也随着个人通信网PCN与网络计算机NC的提出而日益突出;断接性移动计算机在移动过程中,由于使用方式、电源、网络条件等因素的限制,一般不采用保持持续联网的工作方式,而是频繁地、有预见地入网、断接;带宽的多样性移动计算机的移动性使得不同时间可用的网络带宽与服务质量是变化多端的,甚至相差悬殊:移动计算机既可以联入高带宽的固定网络中,也可以工作在低带宽的无线广域网中,甚至根本无网可上;网络通信的非对称性由于物理通信媒介的限制,一般的无线网络通信都是非对称的,表现在固定服务器节点可以拥有强大的发送设备,而移动计算机的发送能力非常有限,于是下行链路(服务器到移动计算机)的通信带宽和代价与上行链路是相差很大的;移动计算机的电源能力移动计算机主要依靠蓄电池供电,一般在正常的连续使用情况下只能维持2—5个小时。

不幸的是,电池容量的改进要远低于同期CPU速度和存储容量的发展速度。

因此,尽管已有不少节能技术应用于移动计算机,但电池容量问题仍将在长时间内存在;可靠性无线网络与固定网络相比,可靠性较低,更容易受到干扰出现网络故障;此外,移动计算机由于其便携性和工作环境,也带来潜在的不安全因素,如损坏、失窃等;规模许多移动数据库应用环境,如公共交通信息系统,都要求系统同时支持大量的移动用户并发访问,这就要求移动数据库系统必须具有比传统客户/服务器及分布式数据库系统高得多的可伸缩性。

2　移动数据库的主要研究内容(1)查询处理移动数据库系统所在的网络环境是千差万别的,因此,在进行分布查询优化时,不仅要考虑不同网络带宽的差别,还必须考虑一些新出现的特殊因素。

例如,在无线网络上发送数据的费用相对较高,这就迫使查询优化器将重点转移到如何使一个查询规划所消耗的经济费用最小化;此外,在采用蜂窝通信的移动计算环境中,除了数据传输开销以外,启动一次通信连接还需要相对较高的额外费用,因此在优化执行时间较长的分布查询时,不能采用频繁的短时通信方式,而应考虑尽量减少通信连接的次数,增加每次连接的时间,这样才能降低总的通信费用。