第12章 运动图像压缩标准MPEG
动态图像压缩的标准是

动态图像压缩的标准是动态图像压缩的标准。
动态图像压缩是指通过对动态图像数据进行处理,以减少其占用的存储空间或传输带宽。
在现代社会中,动态图像已经成为人们生活中不可或缺的一部分,它们被广泛应用于电视、电影、互联网视频、移动应用程序等各个领域。
然而,由于动态图像文件通常较大,其传输和存储成本较高,因此对动态图像进行压缩处理显得尤为重要。
动态图像压缩的标准是指对动态图像进行压缩处理时需要遵循的一系列规范和要求。
这些标准旨在确保压缩后的动态图像在质量、存储空间和传输带宽等方面都能够达到理想的效果。
在本文中,我们将详细介绍动态图像压缩的标准,以及在实际操作中需要注意的事项。
首先,动态图像压缩的标准包括但不限于以下几个方面:1. 图像质量,在进行动态图像压缩时,需要确保压缩后的图像质量能够满足用户的需求。
通常情况下,压缩后的图像应该保持清晰度、色彩鲜艳、边缘锐利等特点,尽量减少失真和模糊现象的发生。
2. 压缩比,压缩比是指压缩后的图像文件大小与原始图像文件大小的比值。
在进行动态图像压缩时,需要根据实际需求确定合适的压缩比。
一般来说,压缩比越高,压缩后的图像文件大小就越小,但同时也会导致图像质量的下降。
3. 压缩算法,选择合适的压缩算法对于动态图像压缩至关重要。
目前常用的动态图像压缩算法包括JPEG、GIF、PNG等,它们各自具有不同的特点和适用范围。
在实际操作中,需要根据图像的特点和使用场景选择合适的压缩算法。
4. 兼容性,压缩后的动态图像应该具有良好的兼容性,能够在不同的设备和平台上正常显示和播放。
因此,在进行动态图像压缩时,需要考虑到不同设备和平台的兼容性要求,尽量避免出现不兼容或无法正常显示的情况。
5. 动态效果保留,对于包含动态效果的图像,如动画、视频等,需要确保在压缩过程中能够保留其原有的动态效果。
这就要求压缩算法能够有效地处理动态图像数据,减少文件大小的同时尽量保持动态效果的流畅和自然。
在实际操作中,为了确保动态图像压缩的质量和效果,我们需要注意以下几点:1. 在选择压缩算法时,需要根据图像的特点和使用场景进行综合考虑,选择最适合的压缩算法。
运动图像压缩标准MPEG

多媒体技术基础与应用
MPEG-2
MPEG-2是一个直接与数字电视广播有关 的高质量图像和声音编码标准。MPEG2所能提 供的传输率在3~10Mbit/s之间,在NTSC制式 下的分辨率可达720×486,可提供广播级的 图像质量和CD级的音质。MPEG-2主要针对高 清晰度电视(HDTV)所需要的视频及伴音信号, 与MPEG-1兼容。
多媒体技术基础与应用
H.26x与MPEG标准的发展演进
多媒体技术基础与应用
MPEG标准简述
视频能够压缩的根本原因在于视频数据具有 较高的冗余度。压缩就是指冗余的消除,主要基 于两种技术:统计学和心理 视觉。消除统计冗 余的基本依据是视频数字化过程在时间和 空间 上采用了规则的采样过程。视频画面数字化为规 则的像 素阵列,其密集程度适于表征每点最高 的空间频率,而绝大多数画面帧包含非常少甚至 不含这种最高频率的细节。
MPEG-7既不同于基于波形和基于压缩 的表示方式如MPEG-1和MPEG-2,又不同 于基于对象的表示方式如MPEG-4,而是将 对各种不同类型的多媒体信息进行标准化 描述,并将该描述与所描述的内容相联系, 以实现快速有效的搜索。MPEG-7的功能与 其他MPEG标准互为补充。
多媒体技术基础与应用
12.2 基于第一代的视频编码技术-MPEG
MPEG的数据分为MPEG视频、MPEG音频和 同步信号三个部分,视频流包含画面信息, 音频流包含伴音信息,所有播放MPEG图像和 伴音数据所需的时钟信息都包含在同步信号 流中。
多媒体技术基础与应用
MPEG系统的编码过程
多媒体技术基础与应用
MPEG系统的解码过程
以H.264和MPEG-4标准代表了基于对象的
上海建桥学院本科课程教学大纲

上海建桥学院本科课程教学大纲【多媒体技术】【Multimedia Technology】一、基本信息课程代码:【B01221065】课程学分:【3】面向专业:【计算机科学与技术(软件方向)、(网络方向)】课程性质:【学科专业必修课】开课院系:【信息技术学院数字媒体艺术系】使用教材:主教材【多媒体技术基础与应用鄂大伟高等教育出版社2008年第3版ZA】辅助教材【多媒体技术及其应用张正兰等北京大学出版社2006年】先修课程:【计算机导论B0122119(2)】并修课程:无二、课程简介“多媒体技术”课程系统地介绍了多媒体计算机的基本原理处理技术和具体应用,主要包括多媒体技术的基本概念、多媒体系统组成与体系结构、音频信号处理技术、数字图像及视频处理技术、多媒体数据压缩技术、计算机动画技术、多媒体创作系统、虚拟现实技术以及多媒体通信等技术。
同时以实例介绍多种媒体的制作方法和基本工具的使用,使学生具有解决一般多媒体信息制作问题的能力。
由于多媒体技术的应用已经渗透到各个领域,因此本课程的目的是使学生理解多媒体技术的基本概念和主要功能,了解多媒体数据压缩的原理,以多媒体产品的制作为主要教学目标。
三、选课建议该课程适合计算机专业的学生在第 5 学期或第6学期时选课四、课程基本要求了解多媒体技术的基本概念以及多媒体计算机系统中应该具备的软件系统和硬件设备。
理解多媒体的数字图象、音视频技术,数据压缩、存储技术、软件技术等。
熟悉多媒体对象制作的主要方法和多媒体工具软件的使用(比如CoolEdit、photoshop、illustrator、premiere、flash、dreamweaver、authorware、nero等软件)。
了解多媒体的新技术(流媒体技术、人机界面、虚拟现实技术、多媒体通信等)。
五、课程内容第一章多媒体概述1.1 多媒体的概念1.2 多媒体技术的发展1.3 多媒体的应用领域1.4 多媒体数据的特性与表现形式1.5 多媒体的关键技术熟练掌握多媒体的基本概念以及主要研究内容、多媒体的关键技术了解多媒体技术的发展趋势第二章多媒体计算机系统2.1 多媒体计算机系统的组成2.2 多媒体计算机主机系统2.3 磁存储系统及其工作原理2.4 显示系统及其工作原理2.5 多媒体信息处理器及芯片了解多媒体计算机系统的组成及其主机系统第三章多媒体光盘存储系统3.1 光盘存储系统3.2 光盘的标准3.3 光存储介质的结构与工作原理3.4 光盘数据编码与光盘制作掌握光盘的类型、标准了解光盘的结构与工作方式第四章多媒体音频信息处理技术4.1 音频信号及其概念4.2 模拟音频的数字化过程4.3 声卡4.4 音频文件的格式与处理软件4.5 乐器数字接口——MIDI理解声音信号的数字化过程熟练掌握音频文件的格式及其转换和处理第五章数字图像处理技术5.1 数字图像处理概述5.2 数字图像处理的主要研究内容5.3 图像与图像数字化过程5.4 图像处理中的色彩学知识5.5 位图绘画与编辑5.6 图像文件格式与图像处理熟练掌握图形图像的格式以及转换、熟练掌握数字图像的处理第六章计算机图形学与图形处理技术6.1 计算机图形学概论6.2 计算机图形学的发展与应用6.3 二维矢量绘图与编辑6.4 三维真实感图形技术6.5 实时真实感图形学技术6.6矢量图格式与绘图软件理解计算机图形学概念、实时真实感图形学掌握矢量图格式与绘图方法第七章多媒体视频信息处理技术7.1 视频基础知识7.2 广播电视信号及其标准7.3 视频的数字化过程7.4 数字视频处理系统7.5 视频文件的类型了解视频的基础知识熟练掌握视频文件的格式及其转换,视频文件的制作和处理第八章计算机动画8.1 计算机动画及其发展8.2 计算机动画采用的技术与方法8.3 二维动画制作过程及其软件8.4 三维动画制作过程及其软件8.5 运动捕捉技术与三维计算机动画熟练掌握多媒体动画素材的编辑和制作了解动画的分类、生成、传输等第九章数据压缩编码技术与JPEG标准 9.1 数据压缩编码技术概述9.2 预测编码9.3 统计编码9.4 变换编码9.5 静止图像压缩标准JPEG理解数据压缩的必然性和可行性、了解数据压缩的分类熟练掌握统计编码的方法第十章运动图像压缩标准MPEG10.1 MPEG标准简述10.2 MPEG的编码与实现过程10.3 基于对象编码技术的MPEG-410.4 基于内容的信息存取与MPEG-710.5 H.261与H.263了解MPEG标准了解MPEG-4和MPEG-7的编码方法第十一章多媒体辅助设备11.1 图像扫描仪11.2 数字投影机11.3 数字视频展示台11.4 触摸屏11.5 彩色打印技术11.6 数码相机11.7 数字摄像机11.8 数字摄像头11.9 手写输入设备了解各个多媒体辅助设备的工作原理第十二章多媒体电子出版物与著作工具12.1 电子出版物的制作12.2 多媒体著作工具12.3 常用多媒体著作工具介绍了解常用多媒体著作工具的种类掌握简单著作工具的使用方法六、课内实验名称及基本要求实验1:图像处理和存储格式的转换实验目的: 1. 学习静态图像编辑和处理的基本方法2. 掌握图形图像处理的基本方法,如缩放、变形、特技效果等 3.熟练掌握数码照片的处理(曝光不足、曝光过度等)实验学时:4学时实验2:视频数据的编辑、处理以及文件格式的转换实验目的:1. 学习视频图像编辑和处理的基本过程和方法技巧2. 掌握视频小短片的制作方法和特点3. 熟练掌握常见的视频编辑方法:转场、滤镜特效、运动等实验学时:4学时实验3:二维动画素材的编辑与制作实验目的:1. 学习二维动画的编辑和处理的基本方法2. 熟练掌握常见的网页动画的制作3. 熟悉交互式动画的制作过程和方法实验学时:4学时实验4:多媒体作品的整合实验目的:1.学习使用多媒体软件集成各种媒体素材的基本方法2.熟练掌握Dreamweaver整合多媒体的方法3. 熟悉flex整合多媒体资源的方法和过程实验学时:4学时七、能力实现矩阵能力目标相关章节主要实现手段(知识点和教学环节)1 熟练掌握多媒体的基本概念以及主要研究内容、多媒体的关键技术了解多媒体技术的发展趋势第一章多媒体概述理论讲授、图片视频网络等演示、讨论2了解多媒体计算机系统的组成及其主机系统第二章多媒体计算机系统理论讲授、图片视频等演示3掌握光盘的类型、标准了解光盘的结构与工作方式第三章多媒体光盘存储系统理论讲授、图片视频等演示4理解声音信号的数字化过程熟练掌握音频文件的格式及其转换和处理第四章多媒体音频信息处理技术理论讲授、实验练习5熟练掌握图形图像的格式以及转换、熟练掌握数字图像的处理第五章数字图像处理技术理论讲授、实验练习6理解计算机图形学概念、实时真实感图形学掌握矢量图格式与绘图方法第六章计算机图形学与图形处理技术理论讲授、实验练习7 了解视频的基础知识熟练掌握视频文件的格式及其转换,视频文件的制作和处理第七章多媒体视频信息处理技术理论讲授、实验练习8熟练掌握多媒体动画素材的编辑和制作了解动画的分类、生成、传输等第八章计算机动画理论讲授、实验练习9 理解数据压缩的必然性和可行性、了解数据压缩的分类熟练掌握统计编码的方法第九章数据压缩编码技术与JPEG标准理论讲授10了解MPEG标准了解MPEG-4和MPEG-7的编码方法第十章运动图像压缩标准MPEG理论讲授11 了解各个多媒体辅助设备的工作原理第十一章多媒体辅助设备理论讲授、图片视频网络等演示12了解常用多媒体著作工具的种类掌握简单著作工具的使用方法第十二章多媒体电子出版物与著作工具理论讲授、实验练习八、教学进度序号教学内容总学时讲课实验(上机、实验)习题课讨论课课程设计(大作业)1 第一章多媒体概述2 2 12 第二章多媒体计算机系统 2 23 第三章多媒体光盘存储系统 2 24 第四章多媒体音频信息处理技术 2 25 第五章数字图像处理技术8 4 46 第六章计算机图形学与图形处理技术 6 67 第七章多媒体视频信息处理技术 6 2 48 第八章计算机动画 6 2 49 习题课、复习课 2 210 第九章数据压缩编码技术与JPEG标准 2 2序号教学内容总学时讲课实验(上机、实验)习题课讨论课课程设计(大作业)11 第十章运动图像压缩标准MPEG 2 212 第十一章多媒体辅助设备 2 213 第十二章多媒体电子出版物与著作工具 4 414 习题课、复习课 2 2九、作业第三章多媒体音频信息处理技术掌握音频的简单处理第四章数字图像处理技术掌握photoshop的简单处理第五章计算机图形学与图形处理技术掌握illustrator基本用法第六章多媒体视频信息处理技术掌握premiere的简单处理第七章计算机动画掌握flash的简单动画的制作第十章多媒体产品的制作掌握用Authorware制作简单的多媒体产品十、考核方式和成绩评定考核方式:考查平时成绩30%;第一次考核30%;第二次考核40%撰写:李玮莹系主任:矫桂娥教学副院长:徐方勤注:教学大纲一式三份,一份教师,一份教研室,一份存系。
运动图像压缩标准 MPEG

加详细的规定和进一步的完善,克服并解决了
MPEG-1不能满足日益增长的多媒体技术、数
字电视技术对分辨率和传输率等方面的技术要
求缺陷。
1.2 MPEG系列标准
与MPEG-1、MPEG-2相比,MPEG-4具
有如下独特的优点:
(1) 基于内容的交互性
(2)高效的压缩性
(3)通用的访问性
MPEG-4的主要应用领域有:因特网
1.2 MPEG系列标准
5.MPEG-21多媒体框架标准
制定MPEG-21标准的目的是建立一个
规范且开放的多媒体传输平台,让所有的多
媒体播放装置都能透过此平台接收多媒体资
料,使用者可以利用各种装置、透过各种网
络环境去获得多媒体内容,而无须知道多媒
体资料的压缩方式及使用的网络环境。同样
地,多媒体内容提供者或服务业者也不会受
输的在视频序列中处于该帧前的I帧或P帧作预
测参考帧,进行前向运动补偿预测;又用后面
的P帧作预测参考帧,进行后向运动补偿预测。
但B帧不能用来作为对其他帧进行运动补偿预
测的参考帧。
1.1 运动图图像压缩编码的基本方法 一个典型的MPEG图像排列如图1-11所示。
图1-11 典型的MPEG图像帧排列
1.2 MPEG系列标准
2.MPEG-2数字电视标准
MPEG-2标准是针对标准数字电视和高
清晰度电视在各种应用下的压缩方案和系统层
的详细规定,标准的正式规范在ISO/IEC13818 中,标准名称为“信息技术——电视图像和伴 音信息的通用编码”。MPEG-2不是MPEG-1的 简单升级,MPEG-2在系统和传送方面作了更
1.MPEG-1标准
MPEG-1的标准名称为“信息技术——
MPEG图像压缩标准的背景知识

MPEG图像压缩标准的背景知识出于以下两个原因,图像必须压缩。
首先,传输数字图像所需的带宽远窄于未压缩图像。
例如,ntsc图像以大约640 x 480的分辨率,24bits/象素,每秒30帧的质量传输时,其数据率达28m字节/秒或221m位/秒。
此外,ntsc声音信号还要使未压缩图像的比特率再增加一些。
然而单速cd-rom(1x)驱动器只能以1.2m位/秒的速率传输数据。
第二个原因是以28m字节/秒的速率,15秒的未压缩图像将占用420m字节的内存空间,这对于大多数只能处理小图像片断的台式计算机来说都是不可接受的。
当今把图像加入电子信号的关键问题是压缩方式。
有几种不同的压缩方式,但mpeg是最有市场潜力的压缩方式mpeg的历史和优点mpeg(即moving picture experts group运动图像专家小组)是个国际标准,即所谓iso11172。
它的两个标准─mpeg-1和mpeg-2特别重要。
mpeg-1于1991年引入,用于加速cd-rom中图像的传输。
它的目的是把221mbit/秒的ntsc图像压缩到1.2mbit/秒,压缩率为200:1。
这是图像压缩的工业认可标准。
mpeg-2用于宽带传输的图像,图像质量达到电视广播甚至hdtv的标准。
和mpeg-1相比,mpeg-2支持更广的分辨率和比特率范围,将成为数字图像盘(dvd)和数字广播电视的压缩方式。
这些市场将和计算机市场交织在一起,从而使mpeg-2成为计算机的一种重要的图像压缩标准。
这一点非常重要,因为将mpeg-1的比特流解压缩时需要用到mpeg-2的解压缩器。
另一标准──mpeg-4──正在发展中,它将支持非常低的比特率的数据流的应用,如电视电话,视频邮件和电子报刊等。
对mpeg的广泛接受意味着对它的使用者的投资保护。
许多零售商出售mpeg的软件或硬件播放器,这种竞争造成了价格的下降和质量的上升。
mpeg-1可以和mpeg-2兼容,因此它是一种尚有发展余地的标准。
运动图像压缩技术与标准的研究与展望

Gop r u ,运动图像专家组)是 I O ( S 国际标准组织 )和
IC( E 国际电工委员会 )内的一个工作组。M E 公布 PG 的标准有 :@M E 一 标准:1 9 年8 PG 1 9 3 月公布 。用于传
关键 词 :M E J E 媒体 PG PG
自1 4 年O e 提出脉冲编码调制 ( C )理论之 98 1vr i PM 后,人们 已经研究了各种各样的多媒体数据压缩方法。
四个方面的计算机系统和广播电视都统一的标准,从而
M G P 压缩技术 已是 目前视频压缩 的重要技术之 E
P C 位 藏 E
至更高的编码范围;⑧M E 一 标准 :2 0 年1 月公 PG4 02 0 布 该标准的 目标为:支持多种多媒体应用 ( 主要侧重 多媒体信息内容 的访 问) 可根据应 用的不 同要求现场 , 配置解码器。 目前, P G M E 将研究重 点转 向了交互性更 加高级的形式, 在未来 的几年里, 技术 的发展将使这种
题
应 ,因而扩大 了多媒体应用 空间的 自由度及灵活度 。 它开拓了很多不同的数 字影像应用,V D 目制作就是 C节 运用 J P G ' E 压缩技术 。V D M C 盘上存储的影视 图像和声 音是采用M E 算法压缩的数字信息 ,并按M E 的格式 PG PG 交错存放在V D C 盘上 。在数字多媒体压缩 ( 特别是视频 压缩 )领域 内的国际标准有很多 ,如I O I u T ( s / T— 国 际标准化组织/ 国际 电信 同盟 )技术委员会 下的J E PG
准,即用于静态图像数据压缩的J E 和用于电视电话、 PG 会议 电视图像压缩的H 2 1 . 6 ,但是他们都与计算机数据 标准无关 。这就要求制定一个图像 、伴音、存储和传输
图像压缩的算法及其国际标准

静态图像压缩-DWT变换
二维DWT变换:
原始图像
列变换
行变换
三层DWT分解后的结果:
静态图像压缩-DWT变换
三层DWT分解的结果:
静态图像压缩-分形方法
自相似性:无论几何尺度怎样变化,物体 任何组成部分的形状都以某种方式与整体 相似。 关键在于引入了局部与全部相关去冗余的 思想。 压缩效率与物体本身性质有关。
有 损 压 缩
分形编码(Fractal) 矢量量化(Vector Quantization) 人工神经网络方法(ANN)
静态图像压缩-变换编码
K-L变换
变 换 编 码
离散余弦变换(DCT)
Gabor变换 小波变换(DWT)
静态图像压缩-K-L变换
K-L变换是最佳变换,将原始信号中相关 性很强的空域变换到相关性彻底去除 的变换域; 无快速算法而难以实现。
动态图像编码(Video Coding)
静态图像压缩
静 态 图 像 压 缩 无损压缩(Lossless Compression)
有损压缩(Lossy Compression)
静态图像压缩-无损压缩
差分脉冲调制方法(DPCM)
去除相关 无 损 压 缩 统计编码
分层内插法(HINT) 差分金字塔方法(DP) 多重自回归方法(MAR)
H.261: 第一个高效视频编码标准算法。图像编码的其他 几个国际标准(如JPEG、MPEG、CCIR723等)都是由它 演变而来的。 1984年12月,CCITT第15研究组成立了“可视电话编码专 家组”,并在1988年提出了视频编码器的H.261建议。它 的目标是P×64K(P=1~30)码率的视频编码标准,以 满足ISDN日益发展的需要。主要应用对象是视频会议的 图像传输。它的视频压缩算法必须能够实时操作,解码 延迟要短,当P=1或2时,只支持帧速率较小的可视电话, 当P>=6时,则可支持电视会议。 H.261建议的原理结构的要点是:采用运动补偿进行帧间 预测,以利用图像在时域的相关性;对帧间预测误差以 8×8或者16×16为宏块,进行DCT变换,以利用图像在 空域上的相关性;接着对DCT变换系数设置自适应量化 器,以利用人们的视觉特性;再采用Huffman熵编码,获 得压缩码流。
MPEG标准

双向预测图象B的压缩编码算法
MPEG-1视频系统
简化的视频编码框图
基本的视频解码器框图
MPEG-1音频压缩算法
MPEG-1音频压缩算法:第一个高保真音频数据压 缩标准 音频信号采样率:32KHz、44.1KHz或48KHz。 压缩后的比特流可以按4种模式之一支持单声道、 双声道或联合立体声
MPEG视频数据流的结构
运动图象序列
图片组 块 图片 图片切片 宏块 8 象 素
MPEG-1数据体系结构
8象素
运动序列 表头+图片组+结束标志 图片组 一系列图像 图象信号分3个部分: 一个亮度信号Y和两个色度信号U、V Y:U:V=4:2:2。
色度和亮度
的位置关系
亮度信号Y由偶数个行和偶数个列组成, 色度信号U、V分 别取Y信号在水平、垂直方向的1/2。如图所示, 黑点代表 色度U、V位置,亮度Y位置用白圈表示。
I=Intra Picture, P=Predicted Picture, B=Bidirectional Picture
四种预测技术
帧内编码 前向预测 后向预测 双向预测
图像帧间预测
前向预测
1
2
3
4
5
6
7
8
1
I
B
B
B
P
B
B
B
I
双向预测
运动序列流的组成
I图象的频率和位置可以选择
1秒 参照帧间有2个B图象 每0.5秒1帧I图象
11种规范(为了向下兼容,满足各种需求)
高级的基本型 MP@HL 高级的增强型 HP@HL 高-1440级的基本型 MP@H1440 高-1440级的空间可调型 SSP@H1440 高-1440级的的增强型 HP@H1440 基本级的简单型 SP@ML 基本级基本型 MP@ML 基本级的信噪比可调型 SNP@ML 基本级的增强型 HP@ML 低级的基本型 MP@LL 低级的信噪比可调型 SNP@LL
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与第一帧的差别超过规定值,则将此帧与第一帧 的差别(包括位移量和差值)存储起来,并将此 帧排列在第一帧后传送出去,这就是P帧。
多媒体技术基础与应用
典型的MPEG帧序列
帧内图像I的距离为N=9,预测图像(P)的距离为 M=3
多媒体技术基础与应用
帧间预测编码:运动估计与运动补偿
与ISO/IEC(国际标准化组织/国际电工委员会)是 制定视频编码标准的两大国际组织。ITU-T的标准 包括H.261,H.262、H.263、H.264、H.265,主 要应用于实时视频通信领域,如会议电视。 MPEG系统标准由ISO/IEC制定,制定的标准主 要有MPEG-1、MPEG-2、MPEG-4和MPEG-7等。 主要应用于视频存储(DVD)、广播电视、因特网 和流媒体以及内容服务与管理等方面
多媒体技术基础与应用
宏块由1个亮度块和两个色度块组成
多媒体技术基础与应用
MPEG图像的类型
▪ I图(帧内图Intra Picture)是对整幅图像采 用JPEG编码的图像,它是一个独立的帧,其信 息由自身画面决定,不需要参照其他画面而产 生,它是P图和B图的参考图。
▪ P图(前向预测帧Predicted Picture),它参 照前一幅I或P图像做运动补偿编码。
多媒体技术基础与应用
MPEG-2
MPEG-2是一个直接与数字电视广播有关 的高质量图像和声音编码标准。MPEG2所能提 供的传输率在3~10Mbit/s之间,在NTSC制式 下的分辨率可达720×486,可提供广播级的 图像质量和CD级的音质。MPEG-2主要针对高 清晰度电视(HDTV)所需要的视频及伴音信号, 与MPEG-1兼容。
多媒体技术基础与应用
H.26x与MPEG标准的发展演进
多媒体技术基础与应用
MPEG标准简述
▪ 视频能够压缩的根本原因在于视频数据具有
较高的冗余度。压缩就是指冗余的消除,主要基 于两种技术:统计学和心理 视觉。消除统计冗 余的基本依据是视频数字化过程在时间和 空间 上采用了规则的采样过程。视频画面数字化为规 则的像 素阵列,其密集程度适于表征每点最高 的空间频率,而绝大多数画面帧包含非常少甚至 不含这种最高频率的细节。
多媒体技术基础与应用
基于块匹配的运动补偿
▪ 基于块匹配算法(Block Matching
Algorithm) 的运动估计就是在参考帧(可能是 前一帧)的搜索窗口中找到和目标帧中的当前块 的最匹配的块。其基本思想是首先要将目标帧和 参考帧图像分块,一般宏块为16×16 像素大小。 然后确定搜索范围大小,最后在参考图像相应搜 索区域中寻找最匹配的宏块,运动矢量(包括位 移和方向)从参考宏块位置指向当前宏块位置。
多媒体技术基础与应用
MPEG-4
▪ MPEG-4采用第一代视频编码的核心技术,如
变换编码、运动估计与运动补偿、量化、熵编码 外,还提出了一些新的有创见性的关键技术,并 在第一代视频编码技术基础上进行了卓有成效的 完善和改进。
▪ MPEG-4实现基于内容交互的首要任务就是
把视频/图像分割成不同对象或者把运动对象从背 景中分离出来,然后针对不同对象采用相应编码 方法,以实现高效压缩。因此视频对象提取即视 频对象分割,是MPEG-4视频编码的关键技术, 也是新一代视频编码的研究热点和难点。
多媒体技术基础与应用
MPEG的流结构
▪ 图像(Image)是独立的显示单位,也是基本编 码单位。
▪ 宏块(Macro block)是进行运动补偿的基本 单位。由一个1616像素的亮度信息和两个88 像素的色度信息组成的块称为宏块。
▪ 块(Block)是由88像素组成的基本单位,是 进行DCT运算的单位,块可分为亮度块或色度 块。
多媒体技术基础与应用
MPEG-4的对象
▪ 传统的视频压缩技术都是以一帧画面作为压缩
的单位,而MPEG-4将输入视频系列每一帧分割 成相应形状的图形区域(即视频对象),以便每 一视频对象代表语义上有意义的对象或感兴趣的 视频内容。视频对象是构成内容的基本要素。因 此原本是一张张画面的视频序列被分割成数个以 对象为主的视频序列。
多媒体技术基础与应用
第二代压缩编码技术
▪ MPEG-4则代表了基于模型/对象的第二代
压缩编码技术,它充分利用了人眼视觉特 性,抓住了图像信息传输的本质,以对象 的轮廓、纹理、位移特征,支持基于视觉 内容的交互功能,适应了多媒体信息的应 用由播放型转向基于内容的访问、检索的 发展趋势。
多媒体技术基础与应用
▪ B图像(双向预测 Bidirectional Prediction), 它参照前一幅和后一幅I或P图像做双向运动补 偿编码。
多媒体技术基础与应用
MPEG定义的三种帧类型图像
多媒体技术基础与应用
典型的MPEG帧序列
▪ MPEG的I帧、P帧和B帧是由MPEG编码器生
成的。当第一帧编码完成后,编码器将其数据进 行存储和传送,这就是I帧。紧接着第二帧输入, 并以同样的过程和方法对其进行处理,但编码器 并非将第二帧完整的数据进行存储和传送,而是 将它与第一帧进行比较运算。
▪ 运动估计技术是帧间压缩模块的核心环 节,因此受到人们的广泛关注。运动矢量 (Motion Vector,MV)和运动补偿 (Motion Compensation,MC)是帧间 预测编码中两个最重要的概念。
多媒体技术基础与应用
运动估计与运动矢量
▪ 运动估计研究的是视频序列图像中投影 坐标在像平面上的变化,获取运动参数, 估计运动前后相邻时刻两幅图像上对应点 坐标之间的差值,即运动矢量。
▪ 以H.264和MPEG-4标准代表了基于对象的
第二代压缩编码技术。它以视听媒体对象 为基本单元,采用基于内容的压缩编码, 充分利用了人眼视觉特性,抓住了图像信 息传输的本质,从轮廓、纹理思路出发, 支持基于视觉内容的交互功能,这适应了 多媒体信息的应用由播放型转向基于内容 的访问、检索及操作的发展趋势。
12.2 基于第一代的视频编码技术-MPEG
MPEG的数据分为MPEG视频、MPEG音频和 同步信号三个部分,视频流包含画面信息, 音频流包含伴音信息,所有播放MPEG图像和 伴音数据所需的时钟信息都包含在同步信号 流中。
多媒体技术础与应用
MPEG系统的编码过程
多媒体技术基础与应用
MPEG系统的解码过程
多媒体技术基础与应用
MPEG-7
▪
MPEG-7作为MPEG家庭中的一个新
成员,正式名称叫作“多媒体内容描述接
口” ,它将为各种类型的多媒体信息规定
一种标准化的描述,这种描述与多媒体信
息的内容本身一起,支持用户对其感兴趣
的各种"资料"进行快速、有效的检索。
多媒体技术基础与应用
MPEG-7
▪ MPEG-7既不同于基于波形和基于压缩
是采用第一代压缩编码技术,着眼于图像信号的 统计特性来设计编码器。空间域的压缩依赖于图 像大块区域中相邻象素间的相似之处。在帧间编 码的情况下,每一帧图像划分成宏块以进行运动 补偿和编码以压缩时间冗余度。
多媒体技术基础与应用
第一代视频编码技术: 基于块的编码与运动补偿
多媒体技术基础与应用
第二代压缩编码技术
第一代视频压缩编码技术
▪ 第一代视频压缩编码也可称之为传统的压缩编码
方式,它建立在Shannon信息论的基础上,以经 典的集合论为基础,用概率统计模型来描述信源, 压缩就是去掉数据的冗余。
多媒体技术基础与应用
第一代视频压缩编码技术
▪ MPEG-1、MPEG-2、H.261、H.262、H.263都
的表示方式如MPEG-1和MPEG-2,又不同 于基于对象的表示方式如MPEG-4,而是将 对各种不同类型的多媒体信息进行标准化 描述,并将该描述与所描述的内容相联系, 以实现快速有效的搜索。MPEG-7的功能与 其他MPEG标准互为补充。
多媒体技术基础与应用
视频编码技术的发展的三个阶段
多媒体技术基础与应用
多媒体技术基础与应用
基于块匹配的运动补偿
多媒体技术基础与应用
基于块匹配的运动估计编码器的结构
多媒体技术基础与应用
运动估计与补偿解码器的结构
多媒体技术基础与应用
12.3 MPEG-4:基于对象的视频编码技术
▪ MPEG-4 采用了新一代视频编码技术,它在视
频编码发展史上第一次把编码对象从图像帧拓展 到具有实际意义的任意形状视频对象,从而实现 了从基于像素的传统编码向基于对象和内容的现 代编码的转变,是视频编码技术突破性的飞跃。
多媒体技术基础与应用
MPEG-1
MPEG-1标准 1992年公布,其任务是在一 种可接受的质量下,把视频和伴音信号压缩 到速率大约为1.5Mb/s或更高的单一的MPEG数 据流。它可对SIF(标准交换格式)分辨率 (NTSC制式为352×240;PAL制式为352×288) 的图像进行压缩,每秒播放30帧,具有CD音 质,图像质量基本与VHS家用录像机相当。
多媒体技术基础与应用
基于对象编码技术的场景示例
多媒体技术基础与应用
基于对象编码技术的场景示例
▪ 在这个场景中,对象主要包含了三大类: ▪ 静态图像(Still images,如场景中的背景) ▪ 视频对象(Video Objects,如场景中的节目
主持人,不含背景)
▪ 音频对像(Audio Objects,如场景中节目主
MPEG流的分层结构
多媒体技术基础与应用
MPEG的流结构
▪ MPEG流(MPEG stream)包含音频流和视 频流。视频流是由图像组(GOP)构成的图像 序列,有表示开始的图像序列头和表示结束的 图像终止码。
▪ 图像组(GOP)是为方便随机存取而加的, 其结构和长度均可变。图像组是随机存取视频 单位。一个GOP由一串IBP帧组成,起始为I帧。 GOP的长度是一个I帧到下一个I 帧的间隔。