第3章多媒体信息处理技术
多媒体技术与应用答案

第一章多媒体技术概述1、什么是媒体?媒体是如何分类的?(简答题)答:(1)媒体指的是信息表示和传输的载体,是人与人之间沟通及交流观念、思想或意见的中介物。
在计算机科学中,媒体具有两种含义:一是承载信息的物理实体,例如磁带、磁盘、光盘、半导体存储器;二是表示信息的物理载体,例如文本、图形、图像、声音、动画及影像等。
多媒体技术中的媒体一般指后者。
(2)按照国际上一些标准化组织制定的分类标准,媒体主要有一下6种类型。
(1)感觉媒体(2)表示媒体(3)显示媒体(也称表现媒体)(4)存储媒体(5)传输媒体2、什么是多媒体?它有哪些关键特性?(简答题)答:(1)多媒体是由两种以上单一媒体融合而成的信息综合表现形式,是多种媒体的综合、处理和利用的结果。
(2)多维化:计算机处理媒体信息的多样化,使人与计算机之间的交互不再局限于顺序的、单调的、狭小的范围,而有充分自由的余地。
交互性:人、机对话,是多媒体技术的关键特征。
在多媒体系统中,除了操作上控制自如之外,在媒体的综合处理上也可以随心所欲。
集成性:将各种不同的媒体信息有机地进行同步组合,形成一个完整的多媒体信息;把不同的媒体设备集成在一起,形成多媒体系统。
3、多媒体技术如何定义?多媒体技术有哪些特点?答:(1)多媒体技术是以计算机(或微处理芯片)为中心,将文本、图形、图像、音频、视频和动画等多种媒体信息进行数字化综合处理,使多种媒体信息建立逻辑连接,并集成一个具有交互性的系统技术。
(2)多媒体技术特征:多样性,集成性,交互性,实时性和数字化。
4、什么是多媒体系统?答:多媒体系统是指由多媒体网络设备、多媒体终端设备、多媒体软件、多媒体服务系统及相关的多媒体数据组成的有机整体。
5、什么是虚拟现实技术?答:虚拟现实技术(VR)是一种可以创建和体验虚拟世界的计算机系统,一种逼真的模拟人在自然环境中视觉、听觉和运动等行为的高级人机交互(界面)技术。
一、单选题1.媒体有两种含义,即表示信息的载体和 ( B )。
多媒体信息处理与应用第三章

矢量图
矢量图用数学癿向量方式来记录图形 内容,图形以线条和色块为主。通常,矢 量图是由图形软件创建癿。
矢量图癿特点:
1. 矢量图形丌适合制作色调丰富、色彩变 化太多癿图像,无法像照片一样表现自 然界癿景象。
第三章 图形与图像信息的处理与应用
一. 图形和图像 信息概述 1. 基本概念 2. 色彩基本知识 3. 文件格式 二.信息癿获叏 1. 设备辒入 2. 软件创作 3. 屏幕捕捉 4. 网络下载 三.信息癿处理 1. 处理软件 四. 信息癿应用
位图癿特点:
1.位图可以表现层次和色彩比较丰富、画
面细致癿图像。
第三章 图形与图像信息的处理与应用
一. 图形和图像 信息概述 1. 基本概念 2. 色彩基本知识 3. 文件格式 二.信息癿获叏 1. 设备辒入 2. 软件创作 3. 屏幕捕捉 4. 网络下载 三.信息癿处理 1. 处理软件 四. 信息癿应用
3.打印机分辨率
打印机分辨率以所有激光打印机(包括 照排机)产生癿每英寸癿油墨点数 (dpi) 为度量单位。
第三章 图形与图像信息的处理与应用
一. 图形和图像 信息概述 1. 基本概念 2. 色彩基本知识 3. 文件格式 二.信息癿获叏 1. 设备辒入 2. 软件创作 3. 屏幕捕捉 4. 网络下载 三.信息癿处理 1. 处理软件 四. 信息癿应用
同一台显示器、同一幅图像,在显示器 屏幕分辨率设置较小时要比屏幕分辨率 设置较大时,图像所占屏幕空间比例要 大。
丌同大小癿显示器,在屏幕分辨率相同 情况下,同一幅图像所占屏幕空间比例 相同,而大显示器癿每个像素看起来会 比较大。
第三章 图形与图像信息的处理与应用
一. 图形和图像 信息概述 1. 基本概念 2. 色彩基本知识 3. 文件格式 二.信息癿获叏 1. 设备辒入 2. 软件创作 3. 屏幕捕捉 4. 网络下载 三.信息癿处理 1. 处理软件 四. 信息癿应用
第三章多媒体音频信息处理教学讲义

视频电话及IP电话等 公共电话网 无线移动网、
计算机通信系统等
1996.3 1992.9 1996.3
2020/8/2
2020/8/2
六、数字音频的文件格式
➢ WAV文件 WAV文件又称为波形文件,是Micorsoft公司的文件 格式.WAV文件来源于对声音模拟波形的采样,并以 不同的量化位数把这些采样点的值转换成二进制数. WAVE声音文件是使用RIFF(资源交换文件)的格式 描述的
①存储空间小,同样长度的音乐文件,用MP3 存储相当于WAV的1/10。
③比较好的播放器:winamp、超级解霸、 realplayer等,一般都支持。
2020/8/2
➢ RA格式文件 Real Player公司推出的适合于网络播放的 媒体格式。
①高压缩比,存储空间小。 ②适合网络播放。 ③音质不是很好。 ④专用播放器Realplayer、
多音频流输出是指声卡可以在同一时间内支持 多个wav、mp3、midi类音频文件的播放。目前大 部分中高档的PCI声卡是普遍支持多音频流输出的,
2020/8/2
(二)声卡的技能指标 o I/O设备接口
一般的声卡都设有线性输入、线性输出、音箱 输出、MIDI和游戏杆接口等。
2020/8/2
点样值的二进制位数。例如,8位量化位数表示每 个采样值可以用28即256个不同的量化值之一来表 示,而16位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。这个参数就是 通常所说的声卡的位数.常用的量化位数为8位、16 位、32位,专业级的高档声卡有64位的。
2020/8/2
2020/8/2
(二)声卡的技能指标
随着波表合成技术的出现,由双声道立体声向 多声道环绕声的发展显得格外迫切。
第3章 多媒体信息的输入与输出

3.1.2
显卡的基本结构
8.BIOS ROM BIOS ROM又称为基本输入输出系统。它是 一种特殊的存储芯片(ROM),存放生产厂家提 供的硬件图形加速芯片与驱动软件之间的输入、输 出逻辑控制程序,此外,还存放显卡的名称﹑型号
以及显示内存的信息等。BIOS的性能决定了显示
卡硬件与操作系统之间的配合程度,以及能否充分
Geforce 6系列显示芯片分为6200系
列、6600系列和6800系列。
70
Geforce 6800芯片
Geforce 6600芯片
Geforce 6200芯片
71
3.1.4
主流显示芯片组
2.nVIDIA显示芯片 (3)Geforce 7系列 Geforce 7系列是nVIDIA最新发布的 显示芯片,这块基于G 70核心的显示卡被 nVIDIA命名为Geforce 7800。
第3章 多媒体信息的输入 与输出
主讲人:厉青
1
第3章 多媒体信息的输入与输出
本章要点: 1. 显示卡 2. 音频卡 3. 视频编辑卡 4. 常用外部输入输出设备
2
1 什么是显卡
显示卡(又称显示适配器)是显示器与主机通信的控 制电路和接口,作用是控制显示器的显示方式。在显 示器里也有控制电路,但起主要作用的是显示卡。
21
VGA 插口
视 频 插口
显示卡的结构
AGP 总 线接口 覆盖散热 片的 图形加速 芯片
VGA Feature 插口
显存
22
3.1.2
显卡的基本结构
一般的显示卡上有显示芯片、显示内存及显示输 出接口(VGA接口、DVI接口和S-Video接口)等 。 1.显示芯片 2.显示内存
(重点)多媒体技术及应用 考试(1-4章)复习大纲

第1章多媒体技术基础1.1 多媒体技术概述1.1.1 多媒体技术的发展1.1.2 多媒体技术的基本概念1.1.1 多媒体技术的应用1.1.4 多媒体的关键技术1.2 多媒体硬件系统1.2.1 多媒体输入输出设备1.2.2 多媒体接口设备1.2.3 多媒体存储设备1.3 多媒体软件系统1.3.1 多媒体软件1.3.2 多媒体应用系统的设计流程1.1.1 多媒体技术的发展1.1.2 多媒体技术的基本概念1.媒体的含义⏹表示信息的载体:如文字、声音、图像、动画、视频、语言等。
⏹存储信息的实体:如磁盘、磁带、光盘、纸张等。
⏹传播信息的载体:如电视、电影、报纸、杂志、网络等。
2.媒体的类型¡ª¡ª CCITT(国际电报电话咨询委员会)⏹感觉媒体:指能直接作用于人的感官,使人能直接产生感觉的一类媒体。
如语言、音乐,自然界的各种声音、图形、图像、文字、数据等。
⏹表示媒体:即感觉媒体的表示媒介。
如图像编码、文本编码和声音编码等。
⏹显示媒体:即输入输出媒体的设备,如键盘、显示器、话筒,喇叭和打印机等。
⏹存储媒体:用来存放表示媒体的物理载体,如磁盘、磁带、光盘等。
⏹传输媒体:传输媒体的物理载体。
如空气、电话线、电波、电缆和光缆等。
1.1.2 多媒体技术的基本概念3. 多媒体(Multimedia)主要包括文字、图形、图像、音频、动画和视频等多种信息载体。
⏹文字:指各种字母、数字和符号等文本信息;⏹图形:由描述点、线、面的大小、形状、维数和位置的图形指令生成的几何图形(矢量图形) ⏹图像:由许多的像素点构成,每个像素点用若干二进制位来表示颜色和亮度等信息(位图)⏹音频:包括语音、音乐和各种声音效果;⏹动画:通过计算机自动生成关键帧之间的连续图像,按照一定速度连续播放形成动画;⏹视频:若干静态图像画面的连续播放形成了视频,每一幅画面称为一帧;4. 多媒体技术利用计算机及相应的多媒体设备,采用数字化处理技术,将文字、声音、图形、图像、动画和视频等多种媒体有机结合起来进行处理的技术。
1多媒体技术第3章 语音编码

3.1.2 三种话音编译码器
图3-05 普通编译码器的音质与数据率
3.1.2 三种话音编译码器
1. 波形编译码器 波形编译码的想法是,不利用生成 话音信号的任何知识而企图产生一种重 构信号,它的波形与原始话音波形尽可 能地一致。一般来说,这种编译码器的 复杂程度比较低,数据速率在16 kb/s以 上,质量相当高。低于这个数据速率时, 音质急剧下降。
3.1.2 三种话音编译码器
2. 音源编译码器 音源编译码的想法是企图从话音波形信号 中提取生成话音的参数,使用这些参数通过话 音生成模型重构出话音。 针对话音的音源编译码器叫做声码器 (vocoder)。 在话音生成模型中,声道被等效成一个随时间 变化的滤波器,叫做时变滤波器(time-varying filter),它由白噪声—无声话音段激励,或者 由脉冲串——有声话音段激励。
第3章 话音编码
ITU-TSS为此制定了并且继续制定一系列 话音(speech)数据编译码标准。其中, G.711使用μ律和A律压缩算法,信号带宽为 3.4 kHz,压缩后的数据率为64 kb/s; G.721使用ADPCM压缩算法,信号带宽为3.4 kHz,压缩后的数据率为32 kb/s; G.722使用ADPCM压缩算法,信号带宽为7 kHz,压缩后的数据率为64 kb/s。 在这些标准基础上还制定了许多话音数据 压缩标准,例如G.723,G.723.1,G.728, G.729和G.729.A等。
3.1.2 三种话音编译码器
另一种频域波形编码技术叫做自适应变 换编码(adaptive transform coding, ATC)。这种方法使用快速变换(例如离散 余弦变换)把话音信号分成许许多多的频 带,用来表示每个变换系数的位数取决 于话音谱的性质,获得的数据率可低到 16 kb/s。
《信息处理技术》复习资料-王恺

《信息处理技术》课程期末复习资料《信息处理技术》课程讲稿章节目录:第1章信息处理技术基础1.1 信息与信息技术基本概念1.2 初等数学基础1.3 信息处理与信息处理实务1.4 信息安全基础知识1.5 知识产权与标准法规第2章计算机系统基础知识2.1 计算机硬件基础知识2.2 计算机软件基础知识2.3 多媒体基础知识第3章计算机网络应用基础知识3.1 计算机网络基础知识3.2 因特网基本概念及其应用3.3 常用网络通信设备的类别和特征3.4 常用的上网连接方法3.5 电子邮件的收发和管理3.6 网上信息的浏览、搜索和下载方法第4章文字处理基础知识4.1 文字处理基本概念4.2 文档排版4.3 对象插入及图文混排4.4 表格设计与应用4.5 文字处理应用第5章电子表格基础知识5.1 电子表格的基本概念5.2 电子表格的基本操作5.3 电子表格中的数据运算5.4 数据管理和统计5.5 图表制作5.6 电子表格应用技术第6章演示文稿基础知识6.1 演示文稿的基本概念6.2 演示文稿软件的基本功能6.3 演示文稿设计与制作6.4 演示文稿应用技术第7章数据库应用基础知识7.1 数据库应用的基本概念7.2 Access数据库基础7.3 Access 2007数据库的使用方法7.4 数据库应用技术★考核知识点: 信息与数据附1.1.1(考核知识点解释):计算机中信息一般有4种形态:数字、文本、声音、图像。
★考核知识点: 信息与数据附1.1.2(考核知识点解释)信息资源(Information Resources):(1)可供利用并产生效益、与社会生产和活动有关的各种文字、数字、音像、图表、语言等一切信息的总称(2)无限的、可再生的、可共享的;(3)其开发利用可大大减少材料和能源的消耗,减少污染。
★考核知识点: 信息与数据附1.1.3(考核知识点解释)信息是反应客观世界中各种事物特征和变化的知识,是数据加工的结果,是有用的数据。
多媒体技术教程第四版课后习题答案

多媒体技术教程〔第三版〕习题解答第1章绪论1.多媒体信息系统与多媒体计算机有什么不同?在概念上应如何对待两者之间的关系?多媒体信息系统是新一代高度集成的、功能强大的、智能化的计算机信息系统,它是提供多媒体信息、辅助人们对环境进展控制与决策的系统,是基于计算机、通信网络等现代化的工具与手段,效劳于管理领域的信息处理系统。
而多媒体计算机指的是硬件设施,多媒体计算机是多媒体信息系统得以应用的平台。
2.试归纳表达多媒体关键特性以及这些特性之间的关系。
多媒体的关键特性主要包括信息载体的多样性、交互性与集成性这三个方面,这既是多媒体的主要特征,也是在多媒体研究中必须解决的主要问题。
信息载体的多样性是相对于计算机而言的,指的就是信息媒体的多样化,有人称之为信息多维化;多媒体的第二个关键特性是交互性,多媒体系统将向用户提供交互式使用、加工与控制信息的手段,为应用开辟更加广阔的领域,也为用户提供更加自然的信息存取手段;多媒体的集成性主要表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备及设施的集成。
信息载体的多样性是集成性的根底,没有多种信息媒体,也就无法进展多媒体信息的集成化处理;而处理多媒体的设备及设施的集成性是实现交互性的前提,没有系统、网络、软硬件设施的集成,就无法为用户交互式使用、加工与控制信息提供平台。
3.为什么说多媒体缩短了人类信息交流的路径?人类及计算机进展信息交流的目的是什么?及以往的方法相比,计算机在数据处理方面有了很大的改善。
计算机所提供的功能强大的数据组织与构造技术,如传统数据构造中的数组、向量、队列、堆栈、树与堆等,为动态地加工与处理数据提供了根底。
高效的算法与高速的网络通信,大大地加强了用文字与数据表示概念的能力并加速了它的传递过程。
但人类并不是仅仅依赖文本这一类单一的数据形式来传递所有的信息与承受概念的,图像、声音等多媒体信息都是人类获取与传递信息极为重要的渠道。
图像的信息量最大,一幅画胜过千言万语,最直观、最能一目了然。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章多媒体信息处理技术通过本章学习,了解多媒体信息处理技术的基本问题,包括多媒体数据的分类、多媒体信息的计算机表示、多媒体数据压缩和编码技术、音频卡和视频卡的应用。
重点掌握多媒体信息处理技术的基本概念,学会音频卡和视频卡的安装与使用,了解多媒体技术中数据的压缩与编码方法。
3.1 多媒体数据的分类媒体是承载信息的载体,是信息的表示形式。
信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。
一、多媒体数据的特点多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。
多媒体数据类型多,包括图形、图像、声音、文本和动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。
二、多媒体数据的分类1.文字在计算机中,文字是人与计算机之间信息交换的主要媒体。
文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。
文本是各种文字的集合,是人和计算机交互作用的主要形式。
文本数据可以在文本编辑软件里制作,如Word编写的文本文件大都可以直接应用到多媒体应用系统中。
但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。
2.音频音频泛指声音,除语音、音乐外,还包括各种音响效果。
将音频信号集成到多媒体中,可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。
3.图形、图像凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。
图形文件基本上可以分为两大类:位图和向量图。
位图图像是一种最基本的形式。
位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。
图形是指从点、线、面到三维空间的黑白或彩色几何图形,也称向量图。
图形是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。
向量图形文件则用向量代表图中的文件,以直线为例,在向量图中,有一数据说明该元件为直线,另外有些数据注明该直线的起始坐标及其方向、长度或终止坐标,图形文件保存的不是像素点的值,而是一组描述点、线、面等几何图形的大小、形状、位置、维数等其他属性的指令集合,通过读取指令可以将其转换为屏幕上显示的图像。
由于大多数情况下不需要对图形上的每一个点进行量化保存,所以,图形文件比图像文件数据量小很多。
图形与图像是两个不同的概念。
4.动画图像或图形都是静止的。
由于人眼的视觉暂留作用,在亮度信号消失后亮度感觉仍可保持1/20s~1/10s。
利用人眼视觉惰性,在时间轴上,每隔一段时间在屏幕上展现一幅有上下关联的图像、图形,就形成了动态图像。
任何动态图像都是由多幅连续的图像序列构成的,序列中的每幅图像称为一帧,如果每一帧图像是由人工或计算机生成的图形时,称为动画;若每帧图像为计算机产生的具有真实感的图像时,称为三维真实感动画;当图像是实时获取的自然景物图像时就称为动态影像视频,简称视频。
用计算机制作动画的方法有两种:一种称为造型动画,另一种称为帧动画。
帧动画由一幅幅连续的画面组成图像或图形序列,是产生各种动画的基本方法。
造型动画则是对每一个活动的对象分别进行设计,赋予每个对象一些特征(如形状、大小、颜色等),然后用这些对象组成完整的画面。
5.视频影像视频是动态图像的一种。
与动画一样,由连续的画面组成,只是画面图像是自然景物的图像。
计算机视频图像可来自录像带、摄像机等视频信号源,这些视频图像使多媒体应用系统功能更强、更精彩。
3.2 多媒体信息的计算机表示一、文本文件格式常用的文本文件的格式有TXT、RTF以及WORD格式的DOC、DOT文件。
二、声音文件格式常用的声音文件格式有WAV、MID和MP3等。
Windwos使用的标准数字音频称为波形文件,文件的扩展名为WAV,记录了对实际声音进行采样的数据。
在适当的硬件及计算机控制下,使用波形文件能够重现各种声音,无论是不规则的噪音还是CD 音质的音乐,也无论是单声道还是立体声。
通过Windows的对象连接与嵌入技术,波形文件可以嵌在其他Windows应用系统中使用。
由于波形文件记录的是数字化音频信号,因此,可由计算机对其进行处理和分析。
如放慢或加快放音速度,将声音重新组合或抽取一些片段单独处理等等。
WAV文件还原成的声音的音质取决于声音卡采样样本的尺寸。
一般来说,采样的样本尺寸越大,采样频率越高,音质就越好,但波形音频文件也就越大,开销就越大。
因此,波形音频一般适用于以下几个场合:①播放的声音是讲话语音,音乐效果对声音的质量要求不太高的场合。
②需要从CD-ROM光盘驱动器同时加载声音和其他数据,声音数据的传输不能独占处理时间的场合。
③需要在PC硬盘中存储的声音数据在1分钟以下以及可用存储空间足够的场合。
2. MIDI文件MIDI(Musical Instrument Digital Interface)是指乐器数字化接口,MIDI文件的扩展名是MID。
MIDI标准是数字式音乐的国际标准。
把一个MIDI设备连接到PC的主要目的是记录MIDI乐器产生的声音。
然后,对记录的音乐进行编辑和后期处理,把它们与其他乐器的录音进行组合,以产生出类似管弦乐队演奏效果的音乐。
3.MP3文件MP3格式的音乐越来越受到人们的欢迎。
MP3文件是一种压缩格式的声音文件,其扩展名为MP3。
MP3文件的特点是音质好、数据量小。
三、图形、图像文件格式常见的图形文件的格式有如下几种:BMP、PCX、GIF、TIF、JPG、TGA等。
1.GIF(Graphic Interchange Format)文件2.BMP(bitmap)文件3.JPG文件4.TGA文件5.TIF文件6.PCX文件四、影像文件格式影像文件通常泛指自扫描仪或视频卡读入的静态画面(影像)。
在动态图像的文件格式中,常用的有AVI 、MOV、MPG和DAT文件等。
1.AVI2.MOV文件3.MPG文件格式4.DAT文件格式5.DIR文件格式五、动画文件格式多媒体应用中使用的动画文件主要有GIF、AVI、SWF等等。
1.GIF文件2.SWF文件3.3 多媒体数据压缩和编码技术一、多媒体的数据量、信息量和冗余多媒体计算机面临的最大难题是大量数据的存储与传送问题。
在所有可能的数据库中,图像是数据量最大的数据类型。
数据是用来记录和传送信息的,或者说数据是信息的载体。
对于人类而言,真正有用的不是数据本身,而是数据所携带的信息。
信息量与数据量的关系是:信息量=数据量+数据冗余多媒体数据中存在的数据冗余类型有:空间冗余、时间冗余、编码冗余、结构冗余、知识冗余和视觉冗余等。
1.空间冗余空间冗余是图像数据中经常存在的一种冗余。
在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性在数字化图像中表现为数据冗余。
2.时间冗余时间冗余是序列图像如电视图像、运动图像和语音数据中经常包含的冗余。
图像序列中的两幅相邻的图像,后一幅与前一幅之间有较大的相关,反映为时间冗余。
在语音中,由于人在说话时其发音的音频是一个连续渐变的过程,而不是一个时间上完全独立的过程,因而存在时间冗余。
3.编码冗余编码冗余也称为信息熵冗余,信息熵是指对一团数据所携带的信息量。
4.结构冗余有些图像从大域上看存在着非常强的纹理结构,表现为结构冗余。
5.知识冗余对有许多图像的理解与某些背景知识使有相当大的相关性。
例如,人脸的图形有固定的结构等。
这类规律性的结构可由先验知识和背景知识得到,表现为知识冗余。
6.视觉冗余人类的视觉系统对于图像场的注意是非均匀的、非线性的,视觉系统并不能对于图像场的任何变化都有所感知。
换句话说,尽管在对图像的编码和解码处理时,由于压缩或者量化引入噪声而使图像发生了一系列的变化,如果这些变化不能被视觉所察觉的话,我们仍认为图像是完好的或足够好的。
事实上,人类视觉系统的一般分辨能力约为26灰度级,而一般图像的量化采用的是28灰度级,这样的冗余称为视觉冗余。
7.其他冗余例如由图像的空间非定常特性所带来的冗余等。
正是由于多媒体数据中存在各种各样的冗余,才使得多媒体数据可以被压缩。
针对冗余的类型不同,人们已经提出了各种各样的方法实施对多媒体数据的压缩。
二、数据压缩的基本方法数据压缩处理一般由两个过程组成:一是编码过程,将原始数据经过编码进行压缩,以便存储与传输;二是解码过程,对编码数据进行解码,还原为可以使用的数据。
数据压缩处理方法的分类:1.按照解码后的数据与原始数据一致性分类根据解码后的数据与原始数据是否完全一致来进行划分,数据压缩方法有两类:可逆编码方法和不可逆编码方法。
2.按方法的原理分类根据方法的原理进行分类,可以划分为预测编码、变换编码、量化与向量量化编码、信息熵编码、分频带编码、结构编码和基于知识的编码等。
三、音频信号的压缩编码音频信号分为电话质量的语音、调幅广播质量的音频信号和高保真立体声信号。
语音信号的频率范围是300Hz到3400Hz。
随着带宽的增加,信号的自然度将逐步得到改善。
高保真音频信号的频率范围是20Hz到20000Hz。
声音信号的编码方式可以分为三大类:波形编码:要求重构的声音信号尽可能地接近于原始声音。
典型的波形编码技术有脉冲编码调制(PCM)、自适应差分脉冲编码调制(ADPCM)、自适应预测编码(APC)、子带编码(SDC)、自适应变换编码(ATC)等。
分析合成编码:以声音信号产生模型为基础,将声音信号变换成模型参数后再进行编码,又称为参数编码方法。
典型的分析和合成技术有通道声码器、共振峰声码器、同态声码器、线性预测声码器等。
混合型编码:是一种在保留分析合成编码技术精华的基础上,引用波形编码准则去优化激励源信号的方案,可以在4.8k位/秒~9.6k位/秒的编码率上获得较高质量的合成声音。
最简单的数字编码方法是对声音信号作直接的模/数转换。
只要采样频率足够高,量化位数足够多,就能保证解码器恢复的声音有很好的质量。
四、视频信号的压缩编码1.视频信号的压缩编码分类图像压缩方法可以分成两种类型:有损压缩和无损压缩。
2.视频信号的压缩编码标准JPEG和MPEG就是得到国际标准化组织认可并推荐的两个国际标准。
JPEG是联合专家小组(Joint Photographic Experts Group)的英文缩写。
MPEG是运动图像专家组(Moving Pictuer Experts Group)的英文缩写。
MPEG标准包括MPEG视频、MPEG音频和MPEG系统三大部分。
3.JPEG静止图像压缩算法JPEG标准是面向连续色调、多级灰度、彩色或单色静止图像的压缩标准,它定义了两种基本的压缩算法:一种是无失真压缩算法;另一种是有失真压缩算法。