多媒体技术的应用现状与发展趋势

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

’ 多媒体技术的应用现状 多媒体技术的开发和应用,使人类社会工作和 生活的方方面面都沐浴着它所带来的阳光,新技术 所带来的新感觉、新体验是以往任何时候都无法想 象的。 ’# ! 多媒体数据压缩,图像处理的应用 多媒体计算机技术是面向三维图形、环绕立体 声和彩色全屏幕运动画面的处理技术。而数字计算 机面临的是数值、文字、语言、音乐、图形、动画、图 像、视频等多种媒体的问题,它承载着由模拟量转化 成数字量信息的吞吐、存储和传输。数字化了的视频 和音频信号的数量之大是非常惊人的,它给存储器 的存储容量、通信干线的信道传输率以及计算机的 速度都增加了极大的压力,解决这一问题,单纯用扩 大存储器容量、增加通信干线的传输率的办法是不 现实的。 数据压缩技术为图像、视频和音频信号的压缩, 文件存储和分布式利用,提高通信干线的传输效率 等应用提供了一个行之有效的方法,同时使计算机 实时处理音频、视频信息,以保证播放出高质量的视 频、音频节目成为可能。 国际标准化协会,国际电子学委员会,国际电信 协会等国际组织,于二十世纪 23 年代领导制定了三 个重要的有关视频图像压缩编码的国际标准,4561 标准;$# ’"! 标准;7561 标准。 ’# !# ! 4561 它是国际上彩色、灰度、静止图像的第一个国际 标准,它不仅适于静态图像的压缩,电视图像序列的
! 多媒体技术涉及的内容 多媒体技术是使用计算机交互式综合技术和数 字通信网络技术处理多种表示媒体———文本、图形、 图像、视频和声音,使多种信息建立逻辑连接,集成 为一个交互式系统。 它主要涉及如下几个部分: !# ! 多媒体数据压缩,图像处理:它包括 $%& 与交互介面设计、多模态转换、压缩与编码和虚拟现 实等。 !# ’ 音频信息处理:它包括音乐合成、特定人 与非特定人的语音识别、文字———语音的相互转换 等。 !# ( 多媒体数据库和基于内容检索:它包括 多媒体数据库和基于多媒体数据库的检索等。 !# ) 多媒体著作工具:它包括多媒体同步、超 媒体和超文本等。 !# * 多媒体通信与分布式多媒体:它包括 %+%,、会议系统、-./ 和系统设计等。 !# " 多媒体应用:%0& 与远程教学、1&+ 与数 字地球、多媒体远程监控等。
!"
冼俊峰 赵小侠 钟玉琢 Y 著
多媒体技术的应用现状与发展趋势
源抽取、事件报告等。 #$ # 音频信息处理的应用 在多媒体技术中,存储声音信息的文件格式主
要有:%&’ 文件、’() 文件、*+,+ 文件、&+- 文件、 .(/ 文件及 0*+ 文件等。
#$ #$ ! 音频信息录制编辑 把音乐和语音加到多媒体应用中,是我们研究 音频处理技术的目的,下面是我们常用的音频信息 录制编辑软件。 %1234567 工具的 04) 命令;.89:5 ;<1=73> 卡 的 ’4567# 软件;*6?>8=8@7 .89:5.A=73B 卡的 C96?D 03?8>53> 软件;)88<3567 软件;%123 4567 工具; )>317623 %123.79568。 #$ #$ # 语音识别 语音的识别长久以来一直是人们的美好梦想, 让计算机听懂人说话是发展人机语音通信和新一代 智能计算机的主要目标。随着计算机的普及、越来越 多的人在使用计算机,如何给不熟悉计算机的人提 供一个友好的人机交互手段,是人们感兴趣的问题, 而语音识别技术就是其中最自然的一种交流手段。 自从 #E 世纪 "E 年代中期以来,新技术的不断 出现使语音识别有了实质性的进展。特别是隐马尔 可夫模型 F G** H 的研究和广泛应用,推动了语音识 别的迅速发展,陆续出现了许多基于 G** 模型的 语音识别软什系统。 当前,语音识别领域的研究正方兴未艾。在这方 面的新算法、新思想和新的应用系统不断涌现。同 时,语音识别领域也正处在一个非常关键的时期,世 界各国的研究人员正在向语音识别的最高层次应用 ———非特定人、大词汇量、连续语音的听写机系统的 研究和实用化系统进行冲刺,可以乐观地说,人们所 期望的语音识别技术实用化的梦想很快就会变成现 实。 #$ #$ I 文语转换 目前,世界上已研制出汉、英、日、法、德等语种 的文语转换系统,并在许多领域得到了广泛应用。 ,4) J1<D 文语转换系统:这是 ,4) 公司在 *+J 的 KL&JJ 教授研制的语音合成器的基础上开 发的语音生成系统,用于英语文语转换。 &JMJ ;3<< 文语转换系统:这是美国 &JMJ 贝尔实验室研制的文语转换系统,它最初用于英语
&多重并行数据流的编码:多媒体表演,如虚拟 现实游戏,# 维动画,训练和飞行模拟,多媒体演示 和教育。
如今,越来越多的声像信息以数字形式存储和 传输,这为人们更灵活地使用这些信息提供了可能 性。但随之而来的问题是,随着网络上信息爆炸性的 增长,获取到我们感兴趣的信息的难度却越来越 大。传统的基于关键字或文件名的检索方法显然不 适于数据量庞大、又不具有天然结构特征的声像数 据,因此近些年来多媒体研究的一个热点是声像数 据的基于内容的检索,例如“从这段新闻片中找出有 首相、总统的镜头”这种形式的检索。实现这种基于 内容检索的一个关键性的步骤是要定义一种描述声 像信息内容的格式,而这与声像信息的存储形式 K 编 码 L 又是密切相关的。国际标准化组织运动图像专家 组注意到了这方面的需求和潜在的应用市场,在推 出影响极大的 A>83—!、A>83 ( + 之后,尚未完成 A>83 ( H 的最后定稿,便开始着手制定专门支持多 媒体信息基于内容检索的编码方案:A>83 ( "。
8 收稿日期 9’33’ > 3" > !*
!"
第 !# 卷第 # 期 +,,+ 年 - 月
广西广播电视大学学报 .%/0)1& %2 3/1)345 0165% 1)6 7$ /)5$80957:
$%&’ !# ( )*’ # 9;<=’ +,,+
帧内图像的压缩编码,也常采用 .>83 压缩标准。 +’ !’ + ?’ +@! 它是视频图像压缩编码国际标准,主要用于视
的文语转换,现在正扩展到其它语种。 .8:6? 文语转换系统:这是清华大学计算机系基
于波形编辑的汉语文语转换系统。该系统利用汉语 词库进行分词,并且根据语音学研究的成果建立了 语音规则,对汉语中的某些常见语音现象进行了处 理。系统采用 N.(L& 算法修改超音段语音特征,提 高了言语输出的质量。
#$ I 多媒体数据库和基于内容检索的应用 多媒体信息检索技术的应用使多媒体信息检索 系统、多媒体数据库,可视信息系统、多媒体信息自 动获取和索引系统等应用逐渐变为现实。基于内容 的图像检索、文本检索系统己成为近年来多媒体信 息检索领域中最为活跃的研究课题,基于内容的图 像检索是根据其可视特征,包括颜色、纹理、形状、位 置、运动、大小等,从图像库中检索出与查询描述的 图像内容相似的图像,利用图像可视特征索引,可以 大大提高图像系统的检索能力。 随着多媒体技术的迅速普及,%3O 上将大量出 现多媒体信息,例如,在遥感、医疗、安全、商业等部 门中每天都不断产生大量的图像信息。这些信息的 有效组织管理和检索中都依赖基于图像内容的检 索。目前,这方面的研究已引起了广泛的重视,并已 有一些提供图像检索功能的多媒体检索系统软件问 世。例如,由 +;* 公司开发的 C;+) 是最有代表性的 系统,它通过友好的图形界面为用户提供了颜色、纹 理、草图、形状等多种检索方法;美国加州大学伯克 利分校与加州水资源部合作进行了 )P1O87 计划,以 便对水资源部的大量图像提供基于内容的有效检索 手段。此外还有麻省理工学院的 NP878O88D,可以利 用 -1?3,.P1Q3,J3R79>3,NP878O88D 分别对人脸图像、 工具和纹理进行基于内容的检索,在 ’6>1S3 系统中 又进一步发展了将多种检索特征相融合的手段。澳 大利亚的 /3T .897P %1<3= 大学已开发了 /UJJ&; 系统,用于食品成份数据库的检索。 清华大学计算机系结合国家 "VI 高技术研究发 展项目 “%3O 上基于内容的图像检索”的研究,于 !WWX 年研制了一个 +:73B37 上的静态图像的基于内 容检索的原型系统。该项目的研究目标是开发能在 +:73>:37 Y +:7>1:37 环境下,通过友好的人 Z 机界面,以 颜色、纹理等图像特征或样本图像检索图像的方法 和工具。
分析,使我们展望到,随着日益普及的高速信息网,它正被广泛应用在咨询服务、图书、教育、通信、军事、金融、医疗等诸多行
业。
8 关键词 9 多媒体技术 应用现状 发展趋势
8 中图分类号 9 1)()
8 文献标识码 9 0
8 文章编号 9 !33:—;"*" < ’33’ = 3(—33!"—3"
多媒体技术是当今信息技术领域发展最快、最 活跃的技术,是新一代电子技术发展和竞争的焦 点。多媒体技术融计算机、声音、文本、图像、动画、视 频和通信等多种功能于一体,借助日益普及的高速 信息网,可实现计算机的全球联网和信息资源共享, 因此被广泛应用在咨询服务、图书、教育、通信、军 事、金融、医疗等诸多行业,并正潜移默化地改变着 我们生活的面貌。
第 !( 卷第 ( 期 ’33’ 年 2 月
广西广播电视大学学报 4.BC@0? .D 1B0@1E& C0/&. 0@/ F- B@&-6C+&FG
-.?# !( > @A# ( +HIJ# ’33’
多媒体技术的应用现状与发展趋势
#冼俊峰 赵小侠 钟玉琢
8 摘 要 9 多媒体技术是当今信息技术领域发展最快、最活跃的技术,本文通过对多媒体技术的应用现状和发展趋势的
A>83 ( " 作为 A>83 家族中的一个新成员,正 式名称叫做 “多媒体内容描述接口”,百度文库将为各种类 型的多媒体信息规定一种标准化的描述,这种描述 与多媒体信息的内容本身一起,支持用户对其感兴 趣的各种“资料”的快速、有效地检索。
以下一些应用领域将从 A>83 ( " 标准的制定 中获益:
&数字化图书馆 K 图像分类目录,音乐字典,… L &多媒体目录服务 &广播式媒体选择 K 收音机频道,电视频道,… L &多媒体编辑 K 个人电子新闻服务,媒体著作 L 还有一些潜在的应用领域: &教育 &旅游信息 &娱乐 K 例如寻找游戏、卡拉 %M 节目 L &购物 K 例如寻找你喜欢的衣服 L A>83 ( +! 的 范 围 可 以 描 述 成 是 一 个 决 定 性 K 关键 L 技术的集成,这些技术可以通过访问全球网 络和设备实现对多媒体资源的透明和增强的使用。 其功能包括:内容创建、内容产品、内容发布、内容消 耗和使用、内容表示、知识产权管理和保护、内容识 别与描述、财政管理、用户的隐私权、终端和网络资
频电话和电视会议,可以以较好的质量来传输更复 杂的图像。
+’ !’ # A>83 A>83 视频压缩技术是针对运动图像的数据压 缩技术。目前又分为 A>83 ( 5、A>83 ( !、A>83 ( 5$、A>83 ( " 和 A>83 ( +!。 A>83 ( 5 最初用于数字存储上活动图像及伴 音的编码,数码率为 !’ BACD= E F,图像采用 952 格式, 两 路 立 体 声 伴 音 的 质 量 接 近 G6 音 质 , 到 现 在 , A>83 ( 5 压缩技术的应用已经相当成熟,广泛地应 用在 $G6 制作,图像监控领域。 A>83 ( !是 A>83 ( 5 的扩充、丰富和完善。 A>83 ( 55 的视频数据速率为 H—BAD= E 9,能提供 "+, I HJ, K )79G L 或 "+, I B"@ K >1& L 分辨率的广播 级质量的视像,适用于包括宽屏幕和高清晰度电视 K ?67$ L 在内的高质量电视和广播。 随着网络、有线 E 无线通信系统的迅猛发展,交 互式计算机和交互性电视技术的普遍应用,以及视 频、音频数据综合服务等应用的发展趋势,对计算机 多媒体数据压缩编码、解码技术及其遵循的标准提 出 更 多 更 高 的 要 求 , 有 许 多 要 求 A>83 ( 5 和 A>83 ( !标准是难以支持的,因此 A>83 ( "应运 而生,它正是为解决这些高需求而推出的。 根据 A>83 ( "开发的不同的压缩编码,我们 可以分为如下几类: &基于内容的多媒体数据访问工具:应用于从 在线的程序库和传送信息的数据库中进行基于内容 的信息检索。 &基于内容的处理和比特流编辑:应用于交互 式家庭购物、影视的制作和编辑、数字特技。 &混合自然和人工数据编码:应用于动画和音 响的自然组合,在游戏节目中观众可以移动和传送 覆盖在要查看的视频之上的图形,从不同的观察点 描绘图形和声音。 &改进的时间随机访问:应用于音像数据的远 程终端随机访问。 &改进的编码效率:应用于低带宽信道上的有 效音像数据存储和传送。
相关文档
最新文档