分布式数据库研究新趋势

合集下载

分布式数据库技术与应用分析

分布式数据库技术与应用分析

分布式数据库技术与应用分析随着互联网的发展和应用范围的拓展,数据规模也不断地扩大,因此,人们需要更高效的方式来存储、管理和处理数据。

在这样的背景下,分布式数据库技术应运而生。

本文将对分布式数据库技术进行分析及其应用。

一、分布式数据库技术的概念与优势分布式数据库技术指的是将一个数据库分为多个部分,分别存储在多个不同的计算机上,并通过网络进行通信,从而形成了一个虚拟的数据库,使得数据可以在不同的地方、不同的时间点进行存取。

与传统的集中式数据库相比,分布式数据库技术具有以下的优势:1. 可靠性更高:分布式数据库技术使用了数据备份、冗余和分布式交易等多种机制,保证了数据的复制和恢复能力,在一台计算机出现故障时,仍然可以进行数据的读取和操作。

2. 更高的性能:由于数据分布在多台计算机上,分布式数据库可以通过对各个计算机的并行处理来提高处理速度,从而提高了整个数据库的性能。

3. 扩展性更强:由于分布式数据库可以不断地添加计算机来扩展存储空间,使得整个系统的存储和处理能力可以很方便地进行扩展,以适应数据规模的增长。

二、分布式数据库技术的实现方式分布式数据库技术的实现方式主要包括:垂直划分、水平划分和复制等。

其中,垂直划分是将数据库按照数据表进行划分,每个表分别存储在不同的计算机上;水平划分是将数据表中的数据按照行或列进行划分,使得同一个数据表中的数据可以分布在不同的计算机上;而复制则是将同样的数据存储在多个不同的计算机上,以实现数据的备份和冗余。

三、应用场景及实践案例分布式数据库技术在实际应用中可以解决很多问题,如数据安全性、负载均衡和数据存取速度等方面的问题,适用于大型企业和互联网应用。

以下是一些常见的应用场景和实践案例:1. 金融行业:在交易、结算等领域,金融行业需要处理海量的交易数据,采用分布式数据库技术可以实现高效的交易系统,保证金融系统的安全性和可靠性。

2. 电商平台:电商平台的订单、库存等数据会随着用户的增多而呈指数增长,采用分布式数据库技术可以实现大规模并发操作,以及快速的数据读取和写入。

分布式数据库中的事务管理与并发控制研究

分布式数据库中的事务管理与并发控制研究

分布式数据库中的事务管理与并发控制研究在当今信息技术高速发展的背景下,分布式数据库的应用日益广泛。

然而,分布式数据库面临着许多挑战,其中之一就是如何进行有效的事务管理和并发控制。

本文将重点研究分布式数据库中的事务管理和并发控制问题,并探讨当前的研究状况和未来发展趋势。

1. 事务管理事务是数据库操作的最小单位,它是一组数据库操作的集合,要么全部执行成功,要么全部回滚。

在分布式数据库中,由于数据分布在多个节点上,事务管理更加复杂。

主要的事务管理技术包括两阶段提交(Two-Phase Commit,2PC)、三阶段提交(Three-Phase Commit,3PC)和乐观并发控制(Optimistic Concurrency Control,OCC)。

2. 两阶段提交(2PC)2PC是一种常见的分布式事务管理协议,它通过协调器和参与者的交互来确保分布式事务的一致性。

首先,协调器向所有参与者发送准备请求,并等待它们的回复。

如果所有参与者都准备好了,协调器发送提交请求,否则发送中止请求。

然后,所有参与者执行相应的操作,完成后向协调器发送决策报告。

最后,协调器根据收到的决策报告判断是否提交事务。

2PC的主要问题是在协调器失效的情况下可能导致事务长时间阻塞。

3. 三阶段提交(3PC)为了解决2PC中的长时间阻塞问题,3PC在协议中引入了一次prepare阶段。

与2PC不同的是,3PC在prepare阶段引入了超时机制。

如果某个参与者超时,它将无法接收到协调器的提交请求,并进行回滚。

这样可以避免长时间阻塞,但是在网络不稳定的情况下仍然可能导致事务无法提交,丧失了完全一致性。

4. 乐观并发控制(OCC)OCC是一种轻量级的并发控制方法,它不需要显式的锁机制,而是基于版本控制实现。

每个事务在读取数据时都会获取一个版本号,并在提交时检查数据是否被其他事务修改,如果是,则回滚。

OCC的优势在于降低了锁开销和死锁风险,但在高并发和冲突频繁的场景中可能导致回滚的次数过多,影响性能。

分布式数据库的应用研究

分布式数据库的应用研究

新会 引 起 数据 的 不 一致 ! 系 统必 须 以 最小 的 代 价 保 持各 冗 余 副 本 的 一 致性" & # 分 布 式事 务 的 并发 控 制 在分 布 式 数据 库 系 统中 ! 多 个事 务 同 时读 写 同 一 数 据的 情 况 比 集 中 式 数 据 库 系统 大 得 多 ! 并 发 控 制 机 制在 尽 可 能 提 高 系 统 并 行 性 # 提 高 系 统 效 率 的 同时 ! 要 协调 多 个 事务 ! 保 证 结果 的 正确 性 以 及 数 据 库的 完 整 性 # 一 致 性" ’ # 可 靠 性要 有 一 套机 制 保 证某 站 点 或者 某 通 信 线 路 出现 故 障 时 ! 系 统 其 余 部分 可 以 正常 工 作 !并 有 效 恢复 出 现 故障 的 部 件" 2 # 目 录管 理 分 布式 数 据 库系 统 的 目 录即 分 布 式 数 据库 系 统 的 数 据 字 典 " 目 录系 统 本 身也 构 成 了一 个 分 布式 数 据 库系 统 ! 有着 同 样 的问 题 ! 目 录 的 分 布与 冗 余 存在 对 某 一费 用 函 数的 优 化" $# 利 用 分布 式 数 据库 技 术 搭建 企 业 信息 管 理系 统
!! 引言 当 前 ! 企 业管 理 思 想 和 管 理 模 式 不 断发 生 变 化 ! 对 信 息 系 统 也 不 断 提 出 更 高 的要 求 ! 基于 集 中 式数 据 库 的信 息 系 统已 经 不 能 满 足应 用 的 需 要 ! 此 时 ! 数 据库 技 术 和计 算 机 软硬 件 水 平的 不 断 进步 以 及 网 络 技术 的 飞 速 发 展 ! 促 使 分布 式 数 据库 技 术 出现 ! 在 很大 程 度 上解 决 了 这一 问 题 " 分布 式 数 据 库 技 术是 数 据 库技 术 与 网络 技 术 相结 合 的 产物 ! 分 布 式 数 据库 技 术 适 用 于 地 域 上 分 散 而管 理 上 相 对 集 中 的 大集 团 # 大 企 业 ! 很 好 的 解 决 了 局 部 控 制 与 全 局 管 理的 矛 盾 ! 理 顺 了 企 业 各 个 环节 ! 提 升 了 企 业 的 管 理 水 平 和 竞 争力" "# "!! 分 布 式 数据 库 系 统的 优 缺 点简 介 分 布 式数 据 库 系统 的 优 点

刍议数据库技术现状与发展趋势

刍议数据库技术现状与发展趋势

刍议数据库技术现状与发展趋势摘要:数据库技术是计算机技术的核心技术,也是发展最快速的技术。

计算机技术已经广泛应用于社会各个领域,而数据库技术却是整个计算机信息系统和应用系统的支撑技术,由此数据库技术的发展直接关系到计算机技术的发展,关系到社会的发展。

本文从数据库技术的发展进程出发,对数据库技术的发展现状进行了阐述,并对其发展趋势进行探讨。

关键词:数据库技术;发展现状;发展趋势中图分类号:tp311.13数据库技术起源于20世纪60年代末,是随着计算机技术的出现而出现的。

最初研发数据库技术是为了能够有效地管理和存取数据资源。

而且随着科学技术的不断发展与更新,数据库技术与计算机网络技术已经紧密结合起来,并相互促进、相互渗透,已经逐渐成为社会应用最为广泛的两大领域。

随着人们对于数据库技术的认识以及研发的不断加深,数据库技术逐渐完善,且应用领域不断拓展,由原先的事务处理逐渐延伸到情报检索、专家系统以及计算机辅助设计等领域,为人类生活与工作提供了便利,促进了社会的发展。

为了让数据库技术更好地服务于社会,本文对数据库技术的发展现状以及发展趋势做了详细地阐述。

1 数据库技术的发展进程数据库技术是信息系统的核心技术,并对计算机数据进行辅助管理。

数据库技术研究的重点在于如何更好地组织与存储数据,以及如何高效地获取和处理数据。

数据库技术是通过对数据库结构、设计、存储、管理等应用的理论和方法进行研究,并使用这些理论来对数据进行分析、处理的技术。

数据库技术的发展进程主要有三大阶段。

一、层次与网状数据库系统。

该系统是在20世纪70年代研制出来的。

层次数据库系统是数据库系统的先驱,而网状数据库系统则是数据库概念、方法、技术的奠基者。

二、关系数据库系统。

关系数据模型是在1970年由edgar f.codd提出的,为开创关系数据库技术奠定了理论基础,在随后的80年代,研发出了非常多的关系数据管理系统,如ingres、informix、db2等,这些管理系统被广泛应用于企业信息管理、情报检索等领域,为第三代数据库系统的研发奠定了坚实的理论基础。

分布式数据库技术的研究与应用前景

分布式数据库技术的研究与应用前景

分布式数据库技术的研究与应用前景引言随着互联网、物联网、人工智能等技术的快速发展,数据的产生和处理速度呈现指数级增长。

在这个背景下,传统的集中式数据库系统已经无法满足数据处理需求。

分布式数据库系统应运而生,成为了解决大规模数据处理问题的重要手段。

本文将介绍分布式数据库技术的研究和应用前景,主要包括以下几个方面的内容:1. 分布式数据库的概念和特点2. 分布式数据库的系统体系结构3. 分布式数据库的数据一致性问题4. 分布式数据库的应用前景第一章:分布式数据库的概念和特点分布式数据库(Distributed Database)是一种将数据分布在多个物理节点上,节点间通过网络互联,形成一个逻辑上统一的数据库系统的技术。

它的发展目的在于解决数据处理的性能、可用性、扩展性和安全性等问题。

与传统的集中式数据库系统相比,分布式数据库有以下几个特点:1.1 分布式性分布式数据库的数据分布在不同的物理节点上,相当于一个大规模的数据库集群。

不同的节点可以在不同的位置,由不同的组织管理,节点间通过网络连接互通,形成一个逻辑上统一的系统。

1.2 高可用性由于数据可以分布在多个节点上,当其中一个节点出现故障后,其他节点可以继续提供服务。

这样可以避免单点故障(SinglePoint of Failure)的问题,提高系统的可用性。

1.3 高扩展性由于分布式数据库是由多个节点组成的,可以根据需要随时增加或减少节点,实现系统的弹性扩展和收缩。

1.4 高性能当数据量较大时,分布式数据库无疑比传统的集中式数据库系统具有更高的处理性能。

因为分布式数据库可以将数据分布在多个节点上,并行处理数据,提高系统的吞吐量和响应速度。

1.5 高安全性分布式数据库可以采用分布式数据备份和数据加密等安全措施,保证数据的安全性。

此外,由于数据分布在多个节点上,攻击者难以通过攻击单一节点来窃取数据,从而提高了系统的安全性。

第二章:分布式数据库的系统体系结构分布式数据库通常由以下几个组件组成:2.1 分布式数据库管理系统(Distributed Database Management System,简称DDBMS)分布式数据库管理系统是整个分布式数据库系统的核心,它负责将数据分片并存储在不同的物理节点上,处理用户的请求,维护数据的一致性和安全性等。

区块链技术的未来发展趋势展望

区块链技术的未来发展趋势展望

区块链技术的未来发展趋势展望区块链技术是近年来最受瞩目的新兴技术之一。

它是一种以分布式数据库技术为基础的公共账本,可以用于记录交易、管理资产、跟踪供应链等多种场景。

随着区块链技术的逐渐成熟和普及,未来几年将会出现很多新的应用场景和商业模式。

一、区块链技术的技术发展趋势1. 区块链技术的性能提升目前,区块链技术的性能仍然无法与传统数据库技术相媲美。

但是,在技术的不断迭代升级下,未来几年会有更多的技术方案和创新来提高区块链技术的吞吐量、延迟和可扩展性。

比如:Sharding、Plasma、Lightning Network等技术方案,可以有效地缩短交易时间并提升系统性能。

2. 隐私保护和安全性加强目前,区块链技术的隐私保护和安全性还存在一定的缺陷。

未来区块链技术的发展方向之一便是加强隐私保护和安全性。

比如:零知识证明、同态加密、加密计算等技术手段,可以在保障用户隐私的同时提高整个系统的安全性。

3. 区块链技术与其他技术的深度结合未来区块链技术不仅会单独存在,还会和其他领域的技术进行深度融合和结合,为不同行业的发展提供技术支持。

比如:与人工智能、物联网、云计算等技术结合,可以实现更广泛的应用场景。

二、区块链技术的应用发展趋势1. 金融领域区块链技术在金融领域的应用已经初步形成。

未来几年将会出现更多的形式。

比如:供应链金融、债券交易、区块链支付、数字货币等。

这些新的商业模式将极大地提高金融行业的效率和安全性。

2. 物联网领域物联网与区块链技术的结合也是未来的一个发展方向。

区块链技术可以为物联网设备提供安全可靠的身份认证和数据交换。

未来可以应用于智能家居、智能交通、智慧城市等领域,实现更便捷的生活和更高效的服务。

3. 社交领域区块链技术可以为社交平台提供更加透明和安全的交互环境,未来可能会引领下一代社交媒体的发展方向。

比如:利用区块链技术实现身份认证和信息分享,保护用户隐私的同时增加社交媒体的可信度。

三、区块链技术面临的挑战和解决方案1. 法律和监管问题区块链技术的应用可能会涉及到一些法律和监管问题。

分布式数据库系统设计与实现研究

分布式数据库系统设计与实现研究

分布式数据库系统设计与实现研究随着大数据时代的到来,数量庞大、复杂多变的数据需求越来越成为一个问题。

分布式数据库系统技术因此而受到广泛关注和研究。

本文将结合自己的研究经验,从以下几个方面分析分布式数据库系统的设计与实现。

一、分布式数据库系统的概念分布式数据库系统是指将数据分布在多个物理位置上,并且这些位置被连接到一起的系统。

每个物理位置上可能有一个或多个数据库,这些数据库在逻辑上是相互独立的,但在物理上是相互关联的。

分布式数据库系统的目的是实现全局性的数据共享和数据访问。

分布式数据库系统的特点在于它可以分散地存储数据,并利用多个独立的计算机系统处理这些数据。

这种设计能够使数据更加安全、高效地使用和处理,同时具有更高的可用性和可伸缩性。

二、分布式数据库系统的架构设计分布式数据库系统的架构设计应该包括以下几个方面:1.数据分片将数据按照某种规则分散地存储在不同的计算机节点上,可以避免单一节点的数据过于庞大,造成性能问题,同时也可以减轻系统的工作压力。

2.数据共享分布式数据库系统需要实现数据共享,让所有节点都能访问到相同的数据,避免数据的不一致性,这个过程需要确保数据的同步与一致性。

3.系统划分分布式数据库系统需要将系统划分成各个相对独立的子系统,每个子系统可以独立处理数据,这样可以提高系统的可靠性和可维护性。

4.灵活扩展分布式系统需要支持灵活扩展,在需要添加计算机节点时,系统应该能够自动添加并处理新增的节点。

三、实现分布式数据库系统的难点分布式数据库系统的实现有一些困难,其中最大的难点是数据的同步与一致性。

在分布式系统中,不同节点之间的数据可能会发生变化,如何保证数据的相对一致性,并且能够尽快同步,一直是分布式数据库系统需要面对的难题。

此外,在设计分布式数据库系统时,还需要考虑到负载均衡、数据安全等问题,这些都需要一定的技术储备和实践经验。

四、未来的发展方向随着大数据时代的到来,分布式数据库系统将继续得到广泛的应用。

数据库技术的发展趋势

数据库技术的发展趋势

数据库技术的发展趋势随着数字化时代的到来,数据成为了一种宝贵资源。

数据库技术作为数字化时代的重要组成部分,也在不断地发展和创新。

本文将探讨数据库技术的发展趋势。

1.云端化随着互联网的普及和云计算的兴起,越来越多的企业开始将数据库迁移到云端。

云端化的优势在于具有更高的可扩展性和可靠性。

云端化的数据库不仅能够提高数据的安全性,还能够有效地降低企业的成本。

随着云计算领域的不断发展和创新,云端化的数据库技术也将不断地发展和完善。

2.大数据随着社交网络、物联网等大量数据的产生,数据的储存量也呈现出爆发式的增长。

传统的关系数据库很难应对如此海量的数据存储和处理。

因此,大数据技术的出现给数据库带来了一次革命性的变革。

Hadoop和NoSQL等大数据相关技术已经成为数据库领域的重要发展方向。

未来,大数据技术将会继续推动数据库技术的发展。

3.人工智能人工智能的兴起将会为数据库技术带来新的发展机遇。

在传统数据库中,数据只是被动地被存储和查询。

但是,随着人工智能技术的不断发展,数据库将被赋予更多的智能技能,如自动分析数据、自动优化数据结构等。

未来,人工智能技术将会与数据库技术结合得更加紧密,创建出新的数据库应用场景。

4.区块链区块链技术的出现正在改变着传统的数据库技术。

与传统的关系型数据库相比,区块链数据库具有更高的安全性和去中心化特性。

因此,区块链技术将在数据存储领域取得越来越大的进展。

未来,区块链技术将逐渐成为数据库技术的重要领域之一。

5.物联网物联网的兴起也将推动数据库技术的发展。

物联网产生的数据具有更多的复杂性和多样性,需要更加完善的数据库技术进行存储和管理。

未来,数据库技术将继续为物联网的发展提供支持和保障。

总结随着数字化时代的到来,数据库技术也在不断地发展和创新。

云端化、大数据、人工智能、区块链和物联网等技术的兴起正在推动数据库技术的发展。

这些发展趋势不仅将使数据库技术更加智能化、安全化和高效化,也将为我们的数字生活带来更多的便利和惊喜。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1997年8月 计算机工程与科学 第19卷 第3期 A ug.1997 COM PU T ER EN GIN EERIN G&SCIEN CE Vo l.19 N o.3 分布式数据库研究新趋势New T rends in Research onDistributed Databases李 霖 周兴铭Li Lin and Zhou Xingming(国防科技大学计算机系)(Department of Computer Science,National University of Defense Technology) 摘 要 本文从异构分布式数据库、网络数据库、移动数据库等几个方向,讨论了分布式数据库研究所面临的几个新课题,并对未来分布式数据库的发展前景作了展望。

ABSTRACTS This paper presents three new issues on distributed databases, w hich are heter ogeneous distributed databases,the large netw ork o f auto nom ous databases,and mobile databases.Finally,w e describe our ex pectation o n distributed databases in the future.关键词 分布式数据库,异构性,自治性,网络规模,网络数据库,移动计算,移动数据库。

KEY WORDS distributed databases,heterogeneity,autonomy,scale of netw ork, netw ork databases,mo bile computing,mobile databases.现在人们倾向于采用更广义的分布式数据库概念,即一个由若干独立自治的数据库系统(称为成员数据库)组成的集合,其中每个成员数据库都提供一组功能,用以实现与其它成员交换数据和服务。

这个定义具有很大的灵活性,将更广泛的研究领域纳入分布式数据库的范围之中。

本文将以这个广义的分布式数据库概念为基础,从异构分布式数据库、网络数据库、移动数据库等几个方面入手,综述在新的技术条件和应用背景下,分布式数据库研究面临的一些新问题和发展前景。

一、异构分布式数据库技术 异构分布式数据库是指对已经存在的多个异构数据库,在尽可能少地影响其本地自 收稿日期:1996年9月9日。

本课题为九五国防预研项目。

作者简介:李霖,男,博士研究生,1972年4月生,主要研究兴趣为并行与分布式数据库、移动数据库技术;周兴铭,中科院院士,主要研究法趣包括高性能机体系结构、并行与分布式数据库、先进计算机网络技术等。

通讯地址:410073 湖南长沙国防科技大学计算机系Address:Dept.of Computer S ci.,Nat′l Un iv.of Defense Tech.,Ch ang sha,Hunan410073,P.R.China治性的基础上,构造具有用户所需要的某种透明性的分布式数据库,以支持对物理上分布的多个数据库的全局访问和数据库之间的互操作性。

按照透明程度的不同,可以将异构分布式数据库的研究分为两个方向:一是联邦数据库(Feder al DB),它把多个异构数据库的模式集成为一个统一的全局模式(称作联邦模式),从而向用户提供较高程度的访问透明性,典型的联邦数据库结构由5层模式构成;二是多数据库(M ultiDB),它不建立统一的全局模式,只提供一种统一的多数据库语言和公共模式接口,用户可以使用这种语言访问各个异构的数据库,但在涉及需同时访问多个数据库的全局应用时,数据库之间的约束或依赖关系必须由用户(应用程序)负责定义和维护。

与传统的分布式数据库相比,异构分布式数据库的研究主要集中在以下几个方面。

1 模式翻译为了消除异构数据库的异构性,首先必须采用一种统一的数据模型来表示成员数据库的概念模式(本地模式),这种用公共数据模型描述的成员数据库模式称为成员模式。

模式翻译的关键问题是公共数据模型的选取。

为了包容各种数据模型,使本地模式的语义不致丢失,公共数据模型必须有很强的语义表达能力;此外,公共数据模型应易于被大家接收。

2 模式集成(用于联邦数据库)在参与联邦数据库时,各个成员数据库在成员模式的基础上定义允许外部用户访问的输出模式。

模式集成的任务就是将这些输出模式集成到一个统一的联邦模式中。

3 多数据库语言(用于多数据库)多数据库系统不提供统一的全局视图,但为用户提供一种能够访问所有成员数据库的多数据库语言。

使用这种多数据库语言,用户可以用统一的界面直接与各个成员数据库打交道,但要求用户自己清楚存在哪些成员数据库以及它们的输出模式。

4 全局查询处理在联邦数据库中,用户根据联邦模式提交全局查询。

与传统的分布查询处理相比,联邦数据库的异构性和自治性给查询优化带来了很大困难。

5 全局事务处理与并发控制异构分布式数据库的全局事务处理和并发控制一直是一个很棘手的难题,人们至今仍未找到理想的解决办法,其主要问题仍然是数据库的异构性与自治性的影响。

全局事务处理的另一个焦点问题是如何维护全局事务的可串性(serializability)。

现有的研究具有较大的局限性,它们有的存在潜在的正确性问题,有的虽然能够保证严格的可串性,但却大大降低了整个系统的并发性能。

未来的研究似乎将更着重于设计结合实际应用需求的全局事务正确性准则。

二、网络数据库的组织、管理与访问 所谓网络数据库,是指所有连入网络并提供信息服务的自治数据库的集合。

众所周知,数据库是网络应用中必不可少的基础之一。

1 网络规模对分布式数据库实现算法的影响现有异构分布式数据库的研究主要基于有限规模的网络环境,在网络规模急剧扩大时,许多系统实现算法已难以适用,这些算法涉及分布查询处理、分布事务处理以及数据复制等领域。

系统可用性也是一个重要问题。

随着网络规模的膨胀,每个结点都同时处于可用状态的概率迅速降低。

实际上,当网络结点数超出一定数值时(例如10000),任何时候总会有某些结点处于不可访问状态,而许多原有的分布式数据库算法不能很好地解决这个问题。

2 大规模分布数据库的管理如何对大规模分布的数据库进行有效管理也是一个挑战。

随着成员数据库、用户以及各种事务的数量迅速增长,DBM S要维护的计帐、用户验证、访问权限等管理信息也相应增多;在考虑如何修改系统配置以改善运行效率时,DBA将面临着比往常多得多的可行选择;此外,各种数据库模式的大小和个数也在不断增加,所有这些因素都导致要有效地管理整个系统变得越来越困难。

其次,面对众多的数据库个数,人们难以评价整个系统的性能,也无法有效预测各种变化条件(如成员数据库的加入、退出)对系统性能产生的影响,因此目前亟需研究能完成这个任务的分布式数据库基准测试程序(Benchm ar k)。

3 语景(context)的差异与消解语景差异问题是由网络的规模引出的一个新的研究重点。

语景是指一组关于信息意义(称作语景定义)和信息质量(称作语景特征)的隐含假设。

通俗地说,语景就是人们在交流信息时互相默认的对信息的解释方式。

在不同的地域、组织或部门中,语景通常是互不相同的。

因此,在获取全球信息的同时,必须研究并解决不同语景之间存在的差别。

随着网络中数据库的数目持续快速地增长以及网络涉及地理范围的扩展,语景的类型(既包括信息发送者即数据库的语景,也包括信息接收者所处的语景)也不断多样化,这种手工的方法肯定不再适合,因此必须要研究新的语景消解策略来应付这个困境。

S.E.M adnick提出了一种语景调解服务的结构,从而在语景差异研究领域迈出了重要一步,但我们距离全球语景互换这个最终目标还相当遥远,需要付出更大的努力。

4 信息获取技术随着越来越多的各种数据库连入网络提供服务,人们可以从网络中获取的信息种类和容量都在迅速膨胀。

然而,面对全球网络中成千上万、规模庞大的数据库集合,用户怎样才能知道自己所需信息存放在哪些数据库中?又怎样才能快速访问到这些信息呢?由于规模等因素的影响,不可能把所有网络数据库的有关信息集中保存在一个单一的索引中,于是一个关键问题是:在没有集中索引的情况下,如何避免可能发生的遍历全网范围的穷尽搜索,设计更为有效的访问策略?这就是信息获取技术的研究内容。

信息获取技术主要需要解决两个问题:一是对网络中提供信息服务的各种自治数据库进行有效组织;二是为用户设计界面良好、效率较高的查询/浏览工具,利用对网络数据库的有效组织快速定位和访问信息。

三、移动数据库(Mobile Databases) 1 移动计算的主要特点移动性同一台移动计算机可以在不同的地方连通网络,这种计算平台的移动性可能导致系统访问布局的变化和资源的移动性。

而且,个人的移动性(即在不同地方使用当地的计算设备)也随着个人通信网PCN与网络计算机NC的提出而日益突出;断接性移动计算机在移动过程中,由于使用方式、电源、网络条件等因素的限制,一般不采用保持持续联网的工作方式,而是频繁地、有预见地入网、断接;带宽的多样性移动计算机的移动性使得不同时间可用的网络带宽与服务质量是变化多端的,甚至相差悬殊:移动计算机既可以联入高带宽的固定网络中,也可以工作在低带宽的无线广域网中,甚至根本无网可上;网络通信的非对称性由于物理通信媒介的限制,一般的无线网络通信都是非对称的,表现在固定服务器节点可以拥有强大的发送设备,而移动计算机的发送能力非常有限,于是下行链路(服务器到移动计算机)的通信带宽和代价与上行链路是相差很大的;移动计算机的电源能力移动计算机主要依靠蓄电池供电,一般在正常的连续使用情况下只能维持2—5个小时。

不幸的是,电池容量的改进要远低于同期CPU速度和存储容量的发展速度。

因此,尽管已有不少节能技术应用于移动计算机,但电池容量问题仍将在长时间内存在;可靠性无线网络与固定网络相比,可靠性较低,更容易受到干扰出现网络故障;此外,移动计算机由于其便携性和工作环境,也带来潜在的不安全因素,如损坏、失窃等;规模许多移动数据库应用环境,如公共交通信息系统,都要求系统同时支持大量的移动用户并发访问,这就要求移动数据库系统必须具有比传统客户/服务器及分布式数据库系统高得多的可伸缩性。

2 移动数据库的主要研究内容(1)查询处理移动数据库系统所在的网络环境是千差万别的,因此,在进行分布查询优化时,不仅要考虑不同网络带宽的差别,还必须考虑一些新出现的特殊因素。

例如,在无线网络上发送数据的费用相对较高,这就迫使查询优化器将重点转移到如何使一个查询规划所消耗的经济费用最小化;此外,在采用蜂窝通信的移动计算环境中,除了数据传输开销以外,启动一次通信连接还需要相对较高的额外费用,因此在优化执行时间较长的分布查询时,不能采用频繁的短时通信方式,而应考虑尽量减少通信连接的次数,增加每次连接的时间,这样才能降低总的通信费用。

相关文档
最新文档