多媒体数据库的发展认识

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体数据库技术的发展认识随着近时代电子计算机的诞生,我们的工作、生活发生了革命性的变化,特别是近几年,计算机行业一次次的飞跃是我们亲身体会的,如多媒体产生而带来的巨大影响. 多媒体正以全新的方式在众多领域中得到广泛应用,为广大用户提供了丰富多彩的信息服务,其涉及的应用领域主要有办公室自动化、教育、新闻、娱乐、医疗、计算机协同工作(CSCW)等等.特别是在多媒体电子邮件系统、视频点播系统(VOD)、地理信息系统、计算机桌面会议系统、远程医疗诊断系统、企业无纸化办公等方面都有实际成功的案例.

多媒体技术及相关新技术的飞速发展,其应用领域将越来越广,实用系统也会越来越多,因而信息量将会大幅度地增长,数据量大、内容复杂,而且面临数据共享、数据保密等各种方面的要求,此时对信息进行快速高效的处理就显得非常重要了.

多媒体数据(Multimedia Data)是指多种式样信息的载体,例如:文本、图形、图象、声音等数据. 多媒体数据的特点是:种类繁多(大多是非结构化数据),来源于不同的媒体,具有完全不同的形式和格式;数据量庞大;具有时间特性和版本概念。由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的. 因而出现多媒体数据库系统.数据库系统的一个重要概念是数据的独立性,用户对数据的任何操作(如查询、修改)不再是通过应用程序直接进行,而必须通过向数据库管理系统发请求实现。

一、多媒体数据库的数据模型:

从多媒体数据库总体的发展上看,可分为三类:(1) 关系数据模型;(2) 面向对象的数据模型;(3)超媒体数据模型. 基于不同数据模型的多媒体数据库管理系统的功能也有很大差别。

(一)、关系数据模型

通常基于关系数据模型的多媒体DBMS可以实现多媒体数据的存取,对多媒体数据对象之间的语义关系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成了。这类系统典型的有ORACLE7.0、INGRES6.0、nfomix-Online等。它们是在著名的商品化关系DBMS的基础上扩充了一种新类型的字段以支持多媒体数据的存取,对关系数据模型的基本结构不作改动. 用户只能对字段的存在进行查询,不能实现基于字段内容的查询。

(二)、面向对象数据模型

面向对象数据模型可以支持多媒体数据对象之间的语义关系、时态关系、空间关系的处理,其抽象程度更高,但DBMS的实现也相对复杂。面向对象技术以其丰富的建模能力而备受青睐,它通过对现实世界的抽象描述而对各种媒体数据加以定义和操作. 如当前流行的视频点播系统(Vedio_On_Demand)就是这一模型应用的实例。

(三)、超媒体数据模型

超媒体是利用关系链来表示离散数据片断(nodes)的方法. 超媒体的数据片断可以是任何媒体形式的数据,如文本、图象、图形、声音、视象等. 用户通过链由一个信息结点转移到另一个信息结点. 从而实现信息的查询。我们经常看到的地理信息系统(GIS)就是这一模型的典型应用。

以上简单说了现有的三种多媒体数据模型,还应说明的是:(1)目前的多媒体数据库不只局限于一种数据模型. (2)在实现多媒体数据库的过程中吸纳了许多其它领域的技术. 因此在设计多媒体数据库时,应采取具体情况具体分析的原则,可以考虑让多种数据模型并存,把多种数据库的优点相结合.

二、多媒体数据库的三种查询方法:关键字查询、可视化查询、语义查询.

1、关键字查询是最简单的方法. 它要求每个对象都带有精确描述其内容的标签(或关键字),然后通过该关键字进行快速查询. 在大多数的多媒体数据库系统中都采取了这种方法,主要原因是对于标准的SQL来说,这可以容易地实现. 但是关键字查询也存在着缺点:(1).关键字的准确性问题. 在许多情况下,对于一幅图象很难用一个确切的词把它的内容描述出来,或者面对许多可以使用的词选取哪个也难达成一致的意见.(2).信息的丢失. 关键字不能保存媒体之间的时空关系,也无法存储媒体本身的特性,在某些情况下不可避免的信息丢失是令人无法忍受的. 因此,在许多系统中将关键字查询与其它查询方法一起使用,这样既可以利用关键字查询的简单和高效的特点,又可以实现基于内容的查询.

2、由于多媒体数据的复杂结构和时空关系,可视化查询在多媒体数据库中显得非常重要. 通常用户为了找到所需对象而放松查询条件或难于描绘一个对象时,就可能发出非确定性查询. 查询的每个对象都有本身的相似范围,对象间的相似程度依权重而定. 可视化查询不仅包括数字字符表达式,还包括非数字字符表达式如图象、图标、样本帧等. 可视化查询语言允许用户发出视图查询,

并将其转化成低层的查询原语,所以可被看作是查询模型与用户间的接口,通过该接口用户用不完全或相似的图片来实现模糊查询。

3、语义查询(或基于内容的查询)是各种方法中最具挑战性的,它采用索引、模式匹配等多种技术. 它要求数据库中信息的表示必须包括隐含或明显的语义. 明显的语义可以通过声明的知识表达技术实现. 一个对象的语义或内容可通过本身的性质和它与其它对象的关系表示出来. 这些性质的识别依赖于多媒体数据的处理技术,包括图象处理、模式识别、语音识别、动态检测等. 这些技术的目标就是从输入数据中精确地提取其性质. 例如在一个图象数据库中,语义查询允许用户使用各种图象描述符如颜色、材料、形状(即可以描述空间也可以表达内容信息)来进行信息的检索. 这样通过图象描述符把一幅图象分解成一些独立的子对象而将其描绘出来. 但是目前模式匹配的条件还不能很好地处理,模式识别的准确率也不是令人非常满意,因而DBMS模式匹配条件的查询,恐怕还得有待于其它领域技术取得更大的进展.

三. 目前多媒体数据库的实现

1.在关系数据库的基础上构造多媒体数据库

关系模型结构简单,是单一的二维表,数据类型和长度被限制在一个较小的子集中,又不支持新的数据类型和数据结构,难以实现空间数据和时态数据,缺乏演绎和推理操作,因此表达数据特性的能力受到限制。在多媒体数据库系统中使用关系模型,必须对现有的关系模型进行扩充,使它不但能支持格式化数据,也能处理非格式化数据。对关系数据库模型的扩充技术主要有3种。

①使关系数据库管理系统和操作系统中的文件系统相结合,实现对非格式化数

据的管理。

②将关系元组中格式化数据和非格式化数据装在一起形成一个完整的元组,存

相关文档
最新文档