下一代视频编码标准HEVC分析研究

北京航空航天大学

2012－2013学年第一学期期末

《视频编码技术及其应用》

课程大作业

班级_____学号__________

姓名____________成绩 _________

2012 年1 月5日

下一代视频编码标准HEVC分析研究

（北京航空航天大学计算机学院）

摘要 (3)

关键字 (3)

Abstract (3)

Key Words (3)

1、引言 (3)

1.1背景简介 (3)

1.2当前视频编码的主要挑战 (4)

1.3 H.264的缺点 (5)

1.4 HEVC的主要特征 (5)

2、HEVC技术分析 (6)

2.1 灵活的编码结构 (6)

2.2 多方向帧内预测 (7)

2.3 大尺度DCT变换 (7)

2.4 自适应采样点补偿 (7)

2.5 并行化的熵编码 (7)

3、结论 (8)

4、参考文献 (8)

摘要

下一代视频编码标准HEVC是继H.264之后视频编码领域的又一重大突破，该标准主要针对目前日益盛行的高清、超高清视频而开发，在克服H.264标准不足的同时，提出了多种针对高清视频编码的新技术。本文首先介绍了视频编码的背景和当前视频编码领域的主要挑战，随后分析了H.264编码标准的不足之处，进而引出了下一代视频编码标准HEVC。通过对HEVC中一些新技术的分析介绍，阐明了HEVC在高清视频领域的优势，对于详细了解HEVC的框架结构有提纲挈领的作用。

关键字

视频编码；HEVC；超高清视频编码；自适应采样点补偿；并行化熵编码

Abstract

HEVC(High Efficiency Video Coding) is another breakthrough in video coding field after H.264, it concentrates on High Definition or Super High Definition video coding. In this paper, the background of video coding and some challenges of current video coding field is introduced first. After analysing some shortages of H.264, the author brings out the features of HEVC. The advantages of HEVC in High Definition video coding is clarified by analysing some new technologies in HEVC. This paper will be a introduction to details about HEVC.

Key Words

Video Coding; HEVC; Super High Definition Video Coding; Sample Adaptive Offset; Parallelization of Entropy Coding

1、引言

1.1背景简介

当前世界上的视频编码标准主要来源于国际电信联盟(ITU-T)的视频编码专家组VCEG和国际标准化组织(ISO)的运动图像专家组MPEG，他们基于不同的应用需求，分别制定了H.26x和MPEG系列视频编码标准。ITU的H.26x系列标准主要应用在实时的视频通信系统中，而MPEG系列标准则主要用于数字监控系统、视频存储、广播电视及因特网领域[1]。

2001年MPEG和VCEG又成立了视频联合工作组JVT，制定了H.264/AVC(即MPEG-4的第10部分)视频编码标准。H.264标准使得视频压缩效率提高到了一个

加，H.264编码标准已不足以应对高清和超高清视频编码的应用，这就为更高效的视频编码标准的提出奠定了前提。

2010年1月，VCEG和MPEG开始发起下一代视频压缩技术正事提案，相关技术由视频编码联合组(JCT-VC)审议和评估。所收到的27个提案从增加编码复杂度、提高压缩效率，或者从保证编码质量、降低编码复杂度的角度出发，讨论如何在H.264/A VC的基础上进一步提高编码性能。下一代视频压缩标准主要面向高清电视(HDTV)以及视频捕获系统的应用，提供从QVGA至1080P以及至超高清电视(7680×4320)不同级别的视频应用，其名称定为HEVC(High Efficiency Video Coding)或H.265。其核心目标在于：在H.264/AVC High Profile 的基础上，对高分辨率/高保真的视频图像压缩效率提高1倍，即在保证相同视频图像质量的前提下，视频流的码率减少50%[2]。

1.2当前视频编码的主要挑战

随着数字视频应用产业链的快速发展，特别是从2005 年高清数字视频的普及应用开始，原有的标清数字视频应用已经快速走向淘汰，数字视频的应用格式从720 P 到1080 P，数字视频帧率从30 fps 到60 fps，短短几年就不断的突破发展。高清数字视频相对于原来的标清数字视频，不只是分辨率的提升，还有以下的显著特点[3]：

(1) 宏块个数爆发式增加

以前的标清数字视频，比如PAL格式的标清视频，分辨率为720×576，帧率为25fps，每秒钟的宏块个数(假设宏块大小为16×16)为：(720×576×25)/(16×16) = 40500；但是一个720P的高清视频，分辨率为1280×720，帧率为60fps，其每秒钟的宏块个数为：(1280×720×60)/(16×16) =216000，是PAL 数字视频的5.3 倍；一个1080P的高清视频，分辨率为1920×1080，帧率为60 fps，其每秒钟的宏块个数为：(1920×1088×60)/(16×16) =489600，是PAL 数字视频12.1 倍。由此可见，高清或超高清视频格式下，每帧内的宏块个数相对于标清有爆发式的增加。

(2) 运动矢量数值大幅度增加

相对于一个PAL(720×576)制式的标清数字视频，如果物体在两帧时间内从画面左侧高速运动到画面右侧，其运动矢量就是720，但是对于1080P(1920×1080)的高清数字视频，如果物体在两帧时间内从画面左侧高速运动到画面右侧，其运动矢量就是1920 了。由此可见，在高清和超高清视频格式下，对于运动矢量的描述，需要更大的数据结构。

(3) 宏块内容复杂度降低

以前的标清数字视频，需要在一个有限的分辨率画面中包含尽可能多的画面内容，因此平均分配到一个宏块中的画面内容就会比较复杂，而进入高清数字视频之后，摄像头的摄像角度基本上没有太多的增加，但是由于分辨率的增加，因此平均分配到每个宏块中的画面内容相对会更加简单，如图1[3]所示，左侧为低分辨率中一个宏块包含的内容，右侧表明高分辨率下同样的内容分到多个宏块中了，相对来说每个宏块的内容复杂度已经大大降低，由此，可以设计更加高效的运动估计方法来提高单个宏块的编码效率。

图1 宏块内容复杂度降低

1.3 H.264的缺点

高清视频的出现和普及使得H.264编码技术在很多方面都疲于应付，越来越不能适应高清编码的需要。主要变现在以下几个方面[3]：

(1)宏块个数的爆发式增长，会导致每个编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级的参数信息在海量的高清数字视频宏块个数中，占用太多的码流资源，在有限的带宽资源中，分配给真正描述图像内容的残差系数信息的可用带宽明显减少了。

(2)单个宏块内容复杂度的降低化，导致一个4×4 或8×8 块内的变换系数也倾向于低频化，相邻的4×4 或8×8 块变换后的低频系数相似程度也大大提高，也就是说，以4×4 或8×8 为单位的变换并不能提高低频系数的压缩效率，由于变换块的颗粒度太小，会导致高清数字视频编码时，在相邻的变换块之间出现大量的数值比较接近的低频系数。

(3)在H .264 的宏块信息中，对于一个单向预测的宏块，H .264 的水平运动矢量和垂直运动矢量的和最小为2 最大为32，对运动矢量的预测使用的是哥伦布指数编码[4]，该编码方式的特点是数值越小使用的比特数越少，由于高清数字视频的应用，运动矢量数值会大幅度增加，导致的结果就是用来描述运动矢量数值的比特数也大幅度增加。

(4)H .264 使用的熵编码方式为CA VLC(适应性变动长度编码法)[5]和CABAC(适应性二元算术编码)[6] 2种，这2 种都是基于上下文的编码方法，都要求编码过程为串行编码，由于并行度太低，这种方式在H .264 的产业化实现过程中，特别是针对GPU/DSP/FPGA/ASIC 等并行化程度非常高的CPU，熵编码和熵解码的串行化处理是非常浪费资源的。

由此可见，在高清视频盛行的今天，H.264似乎已走到尽头，需要一种更加高效的视频编码技术来代替H.264标准。

1.4 HEVC的主要特征

HEVC主要是在原H.264/AVC的编码框架上，提出更先进的改进技术，包括扩展的编码单元尺寸、基于块的更灵活的帧间/帧内预测方式、大尺寸块的变换、新的熵编码方法、更加复杂的内插滤波器等[7,8]。

HEVC进行了大量的技术创新[8]，优点主要体现在：

(1)压缩效率更高。

(2)视频质量更高。

(3)健壮性更好。

(4)对IP网络的友好性好。

2、HEVC技术分析

2.1 灵活的编码结构

HEVC定义了3种类型的单元，包括编码单元(CU)、预测单元(PU)和变换单元(TU)[9]。1幅图像可以被分为多个片，而1个片又可以被分为多个最大编码单元(LCU)，一个最大编码单元又可以分为4个编码单元。HEVC定义了5种尺寸类型的编码单元：128×128(LCU)、64×64、32×32、16×16、8×8(SCU)，而不仅限于H.264中的16×16大小的固定单元。预测单元被定义为编码单元的支节点，预测单元的尺寸可以是方块也可以是矩形，可根据需要进行设定，但其尺寸最大不应超过相应编码单元的尺寸。而变换单元则是针对正交变换和量化。这三个单元的分离，使得变换、预测和编码三个环节的处理更加灵活，也有利于各环节的划分更加符合视频图像的纹理特征，有利于各个单元更优化的完成各自的功能[10]。三种类型的单元如图2所示：

图2 三种类型的单元

图像首先以最大编码单元(LCU)为单位进行编码，在LCU内部按照四叉树结构进行子块划分，直至成为最小编码单元(SCU)。

2.2 多方向帧内预测

HEVC将帧内预测方向由H.264中的9种增加至34种[8]，提高了帧内预测的精细度。另外，帧内预测模式保留了DC预测，并对Planar预测方法进行了改进。目前HM模型中共包含了35种预测模式。但由于受到编码复杂度限制，编码模型对4×4和64×64尺寸的PU所能使用的预测模式进行了限制。

2.3大尺度DCT变换

DCT变换将图像由空域转换到频域，可减少空间冗余，提高编码效率，被广泛应用于视频压缩编码中，HEVC中同样使用DCT变换。对于高分辨率的视频图像，一个变换块通常只表示某个运动物体或图像背景中很小的一部分，变换块内部相对平坦而不会有太多变化，对于这些平坦的数据，大尺寸的变换块可以更好地集中能量和减少量化误差。因此HEVC视频压缩编码方案增加了三种大尺寸的变换块：16×16、32×32和64×64。这一改进可大大减少变换相邻块间的相似系数，提高编码效率[7]。

2.4 自适应采样点补偿

自适应采样点补偿(Sample Adaptive Offset,SAO)[8]是一个自适应选择过程，在去块滤波后进行，输入是重建帧和原始帧数据，输出是SAO数据和SAO后的重建帧。首先将帧划分为若干LCU, 然后对每个LCU中的每个像素进行SAO操作，将根据其LCU像素特征选择一种像素补偿方式，以减少源图像与重构图像之间的失真。

自适应样点补偿方式分为带状补偿（Band Offset，BO）和边缘补偿（Edge Offset，EO）两大类。带状补偿将像素值强度等级划分为若干个条带，每个条带内的像素拥有相同的补偿值，进行补偿时根据重构像素点所处的条带，选择相应的带状补偿值进行补偿。边缘补偿主要用于对图像的轮廓进行补偿。它将当前像素点值与相邻的2个像素值进行对比，从而得到该像素点的类型。解码端根据码流中标示的像素点的类型信息进行相应的补偿校正。

大量模拟测试和资料显示, SAO平均可以节约2%到6%的码率[11], 而编解码的复杂度只增加2%左右。SAO的主要目的和操作原理是减少源图像与重构图像之间的失真。如果只看这点，实际上每帧编码后的码率反而会增加，因为多了SAO的相关语法和语义以及补偿值的编码。其实不然，虽然当前帧的码率增加了几个字节或者几个比特，但是这点增加码字使得源图像与重构图像的失真减少，使接下来的预测残差更小了，从而大大的降低了码率。

2.5 并行化的熵编码

熵编码即编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量（不确定性的度量）。常见的熵编码有：LZW编码、香农(Shannon)编码、哈夫曼(Huffman)编码和算术编码(Arithmetic Coding)。在视频编码中，熵编码把一系列用来表示视频序列的元素符号转变为一个用来传输或是存储的压缩码流[12]。

H.264标准中使用CA VLC和CABAC两种熵编码方案，这两种串行处理的熵编

集的提案大致从3个角度提出了并行化CABAC解决方案：基于比特的并行CABAC，基于语法元素的并行CABAC和基于片的并行CABAC。最后，基于语法元素的并行CABAC编码方案（即SBAC）被HM模型所采纳。目前，HM可支持上下文自适应变长编码（CA VLC）和基于语法元素的上下文自适应二进制算术编码（SBAC），分别用于低复杂度的编码场合和高效的编码场合。

3、结论

下一代视频编码标准HEVC的国际标准草案已基本确定，即将成为在未来代替H.264的视频编码标准。伴随着高清、超高清视频时代的到来，HEVC标准的盛行指日可待。HEVC针对H.264标准中的不足，提出了多项改进措施，如灵活的编码结构、多方向的帧内预测、大尺度DCT变换、自适应采样点补偿、并行化的熵编码等等。经过初步的测试，已证明这些改进方案可有效的提高编码效率，尤其是对于高清视频编码的效率。但同时也应看到，HEVC还有一些需要扩展的方面，例如目前许多研究人员已经开始着手研究HEVC的可伸缩编码和多视点编码方案，相关研究工作正在有计划地展开。

2012年2月10日，在美国圣何塞召开了第99届MPEG会议。MPEG组织和ITU-T 组织对JCT-VC的工作表示满意，准备于2013年1月，同时在ISO/IEC和ITU-T 发布HEVC标准的最终版本[13]。这是视频编码领域的又一里程碑，也宣告了高清视频编码时代的到来。

4、参考文献

[1] 陈清H.265标准现状和发展应用趋势中国多媒体通讯2011年

[2] ITU-T SG 16. Joint collaborative team on video coding[EB/OL].[2011-07-20].

http://www.itu.int/en/ITU-T/studygroups/com16/video/Pages/jctvc.aspx.

[3] 刘国梁从H.264向H.265的数字视频压缩技术升级

铁路通信信号工程技术(RSCE) 2011年6月

[4] 翁慈杰张悠慧汪东升H.264中指数哥伦布算法的优化实现研究

计算机工程与设计2007年第12期

[5] 维基百科适应性变动长度编码法CAVLC

https://www.360docs.net/doc/3d6276959.html,/wiki/CAVLC

[6] 百度文库CABAC解码

https://www.360docs.net/doc/3d6276959.html,/view/f6c379be960590c69ec376f7.html

[7] 杨克伟HEVC视频编码技术的研究与实现百度文库

[8] 蔡晓霞崔岩松邓中亮常志峰下一代视频编码标准关键技术电视技术

2012年第36卷第2期

[9] 刘梅峰陆玲新一代视频编码标准HEVC变换方法的研究电视技术

2012年第36卷第1期

[10] 赵瑞臣下一代视频编码标准H.265(HEVC) 2012年6月

[11] HEVC中SAO——自适应样点补偿详细分析解读。

https://www.360docs.net/doc/3d6276959.html,/feixiang_john/article/details/8258452

国际主流视频编码标准优化代码的对比测试-文档资料

国际主流视频编码标准优化代码的对比测试王中元（1972- ），男，湖北英山人，讲师，博士，主要研究方向为视频编/ 解码、多媒体通信；朱福喜（1957- ），男，湖北新洲人，教授，博导，博士，主要研究方向为人工智能等. （武汉大学a. 计算机学院; b. 国家多媒体软件工程技术研究中心; c. 档案馆，武汉430072）以H.263、MPEG-4、H.264 三种标准作为测试对象，在 Win/Intel 平台上测试了优化后编码器的计算效率、编码效率和码率控制精度，并对测试结果进行了比较和分析。测试数据为开发人员在一定硬件性价比的约束条件下实现视频编码器提供了参考。 Test?Band?Bcomparison?Bon?Boptimized?Bcode?Bof?Bmajor?B international?Bvideo?Bcoding?Bstandards LI Naa,c, WANG Zhong-yuanb, ZHU Fu-xia (a.School of Computer, b.National Multimedia Software Engineering Research Center, c.Archives, Wuhan University, Wuhan 430072, China) This paper selected H.263,MPEG-4 and H.264 video

coding standards as test object to measure such performance index as compression efficiency,calculation efficiency and rate control accuracy on Win/Intel platform. And illustrated the-analysis and comparison on experiment results too. These test datum could be served as a reference guide for designer who would develop video coding application with the constraint on hardware performance and price ratio. 几乎在每一种视频标准的制定过程中或者发布后，都有专家将该标准与它前期的同类标准作压缩效率和计算复杂度的客观比较测试[1] 。这些测试数据尽管有它一定的学术意义，但是对实际开发的指导价值非常有限。其原因有两点：a) 测试过程往往涵盖了编码工具的全集，而在实际应用中不太可能启用所有编码选项，因此，这样测试的压缩效率数据已经背离了实际应用条件； b) 在计算复杂度的对比测试中，一般均使用伴随标准发布的参考源码，而这些源码仅仅是用来验证算法的，它充其量也只是对算法的一种数学描述。在标准的实现过程中，免不了要对编/ 解码器(CODE)展开算法优化和代码优化，这些优化往往又要结合

常见的几种高清视频编码格式

高清视频的编码格式有五种，即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上，现在网络上流传的高清视频主要以两类文件的方式存在：一类是经过MPEG-2标准压缩，以tp和ts为后缀的视频流文件；一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件，还有少数文件后缀为avi或mpg，其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比，在同等的图像质量，H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2～3倍，比MPEG-4高1.5～2倍。正因为如此，经过H.264压缩的视频数据，在网络传输过程中所需要的带宽更少，也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时，H.264只需要1Mbps～2Mbps 的传输速率，目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳，成为新一代HD DVD的标准，不过H.264解码算法更复杂，计算要求比WMA-HD 还要高。从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始，它们均加入对H.264硬解码的支持。与MPEG-4一样，经过H.264压缩的视频文件一般也是采用avi 作为其后缀名，同样不容易辨认，只能通过解码器来自己识别。总的来说，常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质，相同效果的MPEG2与H.264影片做比较，后者在容量上仅需前者的一半左右。这也就意味着，H.264不仅能够节省HDTV的存储空间，而且还可以

视频编码标准汇总及比较

视频编码标准汇总及比较 MPEG-1 类型：Audio&Video 制定者：MPEG(Moving Picture Expert Group) 所需频宽：2Mbps 特性：对动作不激烈的视频信号可获得较好的图像质量，但当动作激烈时，图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式，因此这种技术不能广泛推广。它主要用于家用VCD，它需要的存储空间比较大。优点：对动作不激烈的视频信号可获得较好的图像质量。缺点：当动作激烈时，图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式，因此这种技术不能广泛推广。应用领域：Mixer 版权方式：Free 备注：MPEG-1即俗称的VCD。MPEG是ISO/IEC JTC1 1988年成立的运动图像专家组（Moving Picture Expert Group）的简称，负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。MPEG-1制定于1992年，它是将视频数据压缩成1~2Mb/s的标准数据流。对于清晰度为352×288的彩色画面，采用25帧/秒，压缩比为50：1时，实时录像一个小时，经计算可知需存储空间为600MB左右，若是8路图像以每天录像10小时，每月30天算，则要求硬盘存储容量为1440GB，则显然是不能被接受的。 --------------------------------------------------------------------------------------------- MPEG-2

类型：Audio&Video 制定者：MPEG(Moving Picture Expert Group) 所需频宽：视频上4.3Mbps，音频上最低的采样率为16kHz 特性：编码码率从每秒3兆比特～100兆比特，是广播级质量的图像压缩标准，并具有CD 级的音质。MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道。作为MPEG-1的兼容性扩展，MPEG-2支持隔行扫描视频格式和其它先进功能，可广泛应用在各种速率和各种分辨率的场合。但是MPEG-2标准数据量依然很大，不便存放和传输。优点：MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道，具有CD级的音质。可提供一个较广的范围改变压缩比，以适应不同画面质量、存储容量以及带宽的要求。支持隔行扫描视频格式和其它先进功能，可广泛应用在各种速率和各种分辨率的场合。缺点：压缩比较低，数据量依然很大，不便存放和传输，如用于网络方面则需要较高的网络带宽，因此不太适合用于Internet和VOD点播方面。应用领域：Mixer 版税方式：按个收取(最初的收费对象为解码设备和编码设备，中国DVD制造商每生产一台DVD需要交纳专利费16.5美元。向解码设备和编码设备收取的专利授权费每台2.5美元) 备注：MPEG-2是其颁布的（活动图像及声音编码）国际标准之一，制定于1994年，是为高级工业标准的图像质量以及更高的传输率而设计，为了力争获得更高的分辨率（720×486），提供广播级视频和CD级的音频，它是高质量视频音频编码标准。在常规电视的数字化、高清晰电视HDTV、视频点播VOD，交互式电视等各个领域中都是核心的技术之一。由于MPEG-2在设计时的巧妙处理，使得大多数MPEG-2解码器也可播放MPEG-1格式的数据，如VCD。MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道。我们平时所说的DVD就是采用MPEG-2编码压缩，所以可有8种语言的配音。除了作为DVD的指定标准外，MPEG-2的应用前景非常的广阔，

音视频技术基本知识一

https://www.360docs.net/doc/3d6276959.html, 音视频技术基本知识一网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术，为客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PaaS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在，网易视频云总结网络上的知识，与大家分享一下音视频技术基本知识。与画质、音质等有关的术语这些术语术语包括帧大小、帧速率、比特率及采样率等。 1、帧一般来说，帧是影像常用的最小单位，简单的说就是组成一段视频的一幅幅图片。电影的播放连续的帧播放所产生的，现在大多数视频也类似，下面说说帧速率和帧大小。帧速率，有的转换器也叫帧率，或者是每秒帧数一类的，这可以理解为每一秒的播放中有多少张图片，一般来说，我们的眼睛在看到东西时，那些东西的影像会在眼睛中停留大约十六分之一秒，也就是视频中只要每秒超过15帧，人眼就会认为画面是连续不断的，事实上早期的手绘动画就是每秒播放15张以上的图片做出来的。但这只是一般情况，当视频中有较快的动作时，帧速率过小，动作的画面跳跃感就会很严重,有明显的失真感。因此帧速率最好在24帧及以上，这24帧是电影的帧速率。帧大小，有的转换器也叫画面大小或屏幕大小等，是组成视频的每一帧的大小，直观表现为转换出来的视频的分辨率的大小。一般来说，软件都会预置几个分辨率，一般为320×240、480×320、640×360、800×480、960×540、1280×720及1920×1080等，当然很多转换器提供自定义选项，这里，不得改变视频长宽比例。一般根据所需要想要在什么设备上播放来选择分辨率，如果是转换到普通手机、PSP等设备上，视频分辨率选择与设备分辨率相同，否则某些设备可能会播放不流畅，设备分辨率的大小一般都可以在中关村在线上查到。 2、比特率比特率，又叫码率或数据速率，是指每秒传输的视频数据量的大小，音视频中的比特率，是指由模拟信号转换为数字信号的采样率；采样率越高，还原后的音质和画质就越好；音视频文件的体积就越大，对系统配置的要求也越高。在音频中，1M以上比特率的音乐一般只能在正版CD中找到，500K到1M的是以APE、FLAC等为扩展名的无损压缩的音频格式，一般的MP3是在96K到320K之间。目前，对大多数人而言，对一般人而言192K就足够了。在视频中，蓝光高清的比特率一般在40M以上，DVD一般在5M以上，VCD一般是在1M 以上。（这些均是指正版原盘，即未经视频压缩的版本）。常见的视频文件中，1080P的码率一般在2到5M之间，720P的一般在1到3M，其他分辨率的多在一M一下。视频文件的比特率与帧大小、帧速率直接相关，一般帧越大、速率越高，比特率也就越大。当然某些转换器也可以强制调低比特率，但这样一般都会导致画面失真，如产生色块、色位不正、出现锯齿等情况。

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT（Joint Video Team，视频联合工作组）于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳，新的视频压缩编码标准称为H.264标准，该标准也被ISO接纳，称为AVC（Advanced Video Coding）标准，是MPEG-4的第10部分。 H.264标准可分为三档：基本档次（其简单版本，应用面广）；主要档次（采用了多项提高图像质量和增加压缩比的技术措施，可用于SDTV、HDTV和DVD等）；扩展档次（可用于各种网络的视频流传输）。 H.264不仅比H.263和MPEG-4节约了50％的码率，而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制，有利于网络中的分组传输，支持网络中视频的流媒体传输。H.264具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输，从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输，网络亲和性好。一、H.264视频压缩系统 H.264标准压缩系统由视频编码层（VCL）和网络提取层（Network Abstraction Layer，NAL）两部分组成。VCL中包括VCL编码器与VCL解码器，主要功能是视频数据压缩编码和解码，它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口，它负责对视频数据

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准？视频压缩技术有：MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称，在它之前的标准叫做JPEG，即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时，实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础，而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能，它包含了H.263的核心设计，并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码，同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较从上表可以看出，MPEG1和MPEG2主要应用于固定媒体，比如 VCD 和 DVD ，而对于网络传输，MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准，随后出现的第二版(H.263+)及H.263++增加了许多选项，使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。它是在H.261基础上发展起来的，其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿，并增加了4种有效的压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2，非正式地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变的基础上，增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式，仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式，自定义图像的尺寸，从而拓宽了标准使用的范围，使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。为提高压缩效率，H.263+采用先进的帧内编码模式；增强的PB-帧模式改进了H.263的不足，增强了帧间预测的效果；去块效应滤波器不仅提高了压缩效率，而且提供重建图像的主观质量。为适应网络传输，H.263+增加了时间分级、信噪比和空间分级，对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义；另外，片结构模式、参考帧选择模式增强了视频传输的抗误码能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。对信道时延的适应性较强，既可工作于低时延模式以满足实时业务，如会议电视等；又可工作于无时延限制的场合，如视频存储等。 2.提高网络适应性，采用“网络友好”的结构和语法，加强对误码和丢包的处理，提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应不同复杂度的应用。 4.相对于先期的视频压缩标准，H.264引入了很多先进的技术，包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比，同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准，用于视频压缩和解压过程。它主要用于电话方面。在电话学中，有两个主要的算法，分别定义在 mu-law 算法（美国使用）和 a-law 算法（欧洲及世界其他国家使用），两者都是对数关系，但对于计算机的处理来说，后者的设计更为简单。国际电信联盟G系列典型语音压缩标准的参数比较：

数字视频基础知识

第三章数字视频基础知识 3.1 视频的基础知识在人类接受的信息中，有70%来自视觉，其中视频是最直观、最具体、信息量最丰富的。我们在日常生活中看到的电视、电影、VCD、DVD以及用摄像机、手机等拍摄的活动图像等都属于视频的范畴。摄影机是指用胶片拍摄电影的机器，摄像机是用磁带、光盘、硬盘等作为界质记录活动影像的机器，广泛用于电视节目制作、家庭及其他各个方面。摄影机使用胶片和机械装置记录活动影像，所采用的是光学和化学记录方式，摄象机是采用电子记录方式。 1 视频的定义 ?视频(Video)就其本质而言，是内容随时间变化的一组动态图像(25或30帧/秒)，所以视频又叫作运动图像或活动图像。 ?一帧就是一幅静态画面，快速连续地显示帧，便能形运动的图像，每秒钟显示帧数越多，即帧频越高，所显示的动作就会越流畅。『视觉暂留现象』 ?人眼在观察景物时，光信号传人大脑神经，需经过一段短暂的时间，光的作用结束后，视觉形象并不立即消失，这种残留的视觉称“后像”，视觉的这一现象则被称为“视觉暂留现象”。 ?具体应用是电影的拍摄和放映。 ?根据实验人们发现要想看到连续不闪烁的画面，帧与帧之间的时间间隔最少要达到是二十四分之一秒。 ?视频信号具有以下特点： ?内容随时间而变化 ?有与画面动作同步的声音(伴音) ?图像与视频是两个既有联系又有区别的概念：静止的图片称为图像(Image)，运动的图像称为视频(Video)。 ?图像与视频两者的信源方式不同，图像的输入靠扫描仪、数字照相机等设备；视频的输入是电视接收机、

摄象机、录象机、影碟机以及可以输出连续图像信号的设备。 2.视频的分类 ?按照处理方式的不同，视频分为模拟视频和数字视频。 ?模拟视频（Analog Video） ?模拟视频是用于传输图像和声音的随时间连续变化的电信号。早期视频的记录、存储和传输都采用模拟方式，如在电视上所见到的视频图像是以一种模拟电信号的形式来记录的，并依靠模拟调幅的手段在空间传播，再用盒式磁带录像机将其作为模拟信号存放在磁带上。 ?模拟视频的特点： ?以模拟电信号的形式来记录 ?依靠模拟调幅的手段在空间传播 ?使用磁带录象机将视频作为模拟信号存放在磁带上 ?传统视频信号以模拟方式进行存储和传送然而模拟视频不适合网络传输，在传输效率方面先天不足，而且图像随时间和频道的衰减较大，不便于分类、检索和编辑。 ?要使计算机能对视频进行处理，必须把视频源即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式，这个过程称为视频的数字化过程。 ?数字视频可大大降低视频的传输和存储费用、增加交互性、带来精确稳定的图像。 ?如今，数字视频的应用已非常广泛。包括直接广播卫星(DBS)、有线电视(如图5.2)、数字电视在内的各种通信应用均需要采用数字视频。 ?一些消费产品，如VCD和DVD，数字式便携摄像机，都是以MPEG视频压缩为基础的。数字化视频的优点 ?适合于网络应用 ?在网络环境中，视频信息可方便地实现资源共享。视频数字信号便于长距离传输。 ?再现性好 ?模拟信号由于是连续变化的，所以不管复制时精确度多高，失真不可避免，经多次复制后，误差就很大。

H.264视频编码标准分析和算法优化

H.264编码标准的分析和算法优化一、研究背景：随着社会的不断进步和多媒体信息技术的发展，人们对信息的需求越来越丰富，方便、快捷、灵活地通过语音、数据、图像与视频等方式进行多媒体通信已成不可或缺的工具。其中视觉信息给人们直观、生动的形象，因此图像与视频的传输更受到广泛的关注。然而，视频数据具有庞大的数据量，以普通的25帧每秒，CIF格式（分辨率为352×288）的视频图像为例，一秒钟的原始视频数据速率高达3.8M字节。不对视频信号进行压缩根本无法实时传输如此庞大的数据量，因此，视频压缩技术成为研究热点。随着近几年来视频图像传输领域的不断扩展，以往的标准己经难于适应不同信道的传输特征及新兴的应用环境。为此，ISO/IEC&ITU-T共同开发了最新视频编码标准H.264/AVC。相对以前的视频编码标准，H.264集成了许多新的视频压缩技术，具有更高的压缩效率和图像质量。在同等的图像质量条件下，H.264的数据压缩比是应用于当前DVD系统MPEG-2的2~3倍，比MPEG-4高1.5~2倍，并且具有更好的网络友好性。但是H.264高压缩比的代价是编码器计算复杂度大幅度地提高。因此在保持编码效率几乎不变的同时尽可能提高编码速度是H.264/AVC视频编码标准能否得到广泛应用的关键。在上述研究背景下，本文深入探讨了H.264/AVC标准，分析了编码器主要耗时模块的工作原理，提出三种降低H.264/AVC高计算复杂度的优化算法――快速帧内预测模式选择算法、快速帧间预测模式选择算法以及快速运动估计算法。实验结果表明：本文所提快速算法都可大幅度地降低H.264编码器的计算复杂度，并且保持基本不变的编码效率。二、新一代视频编码标准H.264简介：编码标准演进过程：H.261 MPEG-1 MPEG-2 H.263 MPEG-4 从视频编码标准的发展历程来看，视频编码标准都有一个不断追求的目标：在尽可能低的码率（或存储容量）下获得尽可能好的图像质量。MPEG-2、MPEG-4、H.263等标准都取得了巨大的成功，但在应用中也发现一些问题。H.263众多的选项往往令使用者无所适从；MPEG-2压缩效率己显略低；引人注目的MPEG-4的“基于对象的编码”由于尚有技术障碍，目前还难以普遍应用。在此背景下，两大国际标准化组织ITU-T和ISO共同制定了新一代视频编码标准H.264。该编码标准在混合编码的框架下引入新的编码方式，解决了目前编码标准存在的问题，进一步贴近实际应用，其应用前景是不言而喻的。三、H.264视频编码标准概述 JVT的工作目标是制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。JVT的工作已于2003年3月被ITU-T采纳，新的视频编码标准称为H.264标准。该标准也被ISO采纳，称为AVC（Advanced Video Coding）标准，是国际标准ISO14496-10（MPEG-4的第10部分），因此总称为H.264/AVC。 H.264着重于提高压缩效率和传输的可靠性，因而其应用面十分广泛。具体来说，H.264支持三个不同档次的应用： 1、基本档次：H.264简单版本，应用面广，主要用于视频会话，如会议电视、可视电话、远程医疗、远程教学等。 2、主要档次：采用了多项提高图像质量和增加压缩比的技术措施，主要用于消费电子应用，可用于SDTV、HDTV和DVD等。 3、扩展档次：主要用于各种网络的视频流传输，如视频点播等。

视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等)

视频压缩格式的分析和对比（MJPEG、MPEG-4、H.264等）时间：2011-08-06 点击数：1977 视频压缩格式的分析和对比（MJPEG、MPEG-4、H.264等） 1．H.261 H.261又称为P*64，其中P为64kb/s的取值范围，是1到30的可变参数，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法，但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多，此算法为了优化带宽占用量，引进了在图像质量与运动幅度之间的平衡折中机制，也就是说，剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 2．H.263 H.263是国际电联ITU-T的一个标准草案，是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围，而非只用于低码流应用，它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样，但做了一些改善和改变，以提高性能和纠错能力。.263标准在低码率下能够提供比H.261更好的图像效果，两者的区别有：(1)H.263的运动补偿使用半象素精度，而H.261则用全象素精度和循环滤波；(2)数据流层次结构的某些部分在H.263中是可选的，使得编解码可以配置成更低的数据率或更好的纠错能力；(3)H.263包含四个可协商的选项以改善性能；(4)H.263采用无限制的运动向量以及基于语法的算术编码；(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法；(6)H.263支持5种分辨率，即除了支持H.261中所支持的QCIF和CIF外，还支持SQCIF、4CIF和16CIF，SQCIF相当于QCIF一半的分辨率，而4CIF和16CIF分别为CIF的4倍和16倍。 1998年IUT-T推出的H.263＋是H.263建议的第2版，它提供了12个新的可协商模式和其他特征，进一步提高了压缩编码性能。如H.263只有5种视频源格式，H.263＋允许使用更多的源格式，图像时钟频率也有多种选择，拓宽应用范围；另一重要的改进是可扩展性，它允许多显示率、多速率及多分辨率，增强了视频信息在易误码、易丢包异构网络环境下的传输。另外，H.263＋对H.263中的不受限运动矢量模式进行了改进，加上12个新增的可选模式，不仅提高了编码性能，而且增强了应用的灵活性。H.263已经基本上取代了H.261。二、M-JPEG M-JPEG（Motion- Join Photographic Experts Group）技术即运动静止图像（或逐帧）压缩技术，广泛应用于非线性编辑领域可精确到帧编辑和多层图像

新一代视频编码技术---H.265HEVC高效视频编码技术

新一代视频编码技术--- H.265/HEVC高效视频编码技术音视频信息包含图像、语音、文字等各种信息，是人与人之间沟通的重要媒介，因此以音视频为核心的视频会议、视频指挥、视频监控、可视电话等各种音视频系统成为现代各个行业和领域信息化建设领域的重点。然而，高清晰的实时图像数据量巨大，以图像分辨率为1920X1080，颜色取样深度为24bit，每秒帧数为60帧的实时高清视频为例，未经压缩处理的图像通过网络传输每秒的流量将达到355.957MB。为了实现在有限带宽下传输如此高数据量的视频图像，音视频应用系统通过使用编码设备将图像进行压缩编码大幅降低数据量后再通过网络传输，目前这些编码设备主要采用H.264编码技术。H.264又称MPEG-4part10，由VCEG和MPEG联合组成的JVT （JointVideoTeam）于2003年3月正式发布，经过十余年的发展，H.264已被业内的厂商广泛的采纳和使用。 H.264采用帧内、帧间预测技术，高精度、多模式的位移估计，整数变换编码以及先进的量化处理和滤波处理，在同等保真条件下，大幅提高了编码效率。但是，H.264也存在一定的局限性，例如，由于图像分辨率的大大增加，单个宏块所表示的图像内容信息大大减少，H.264所采用的4×4或8×8宏块经过整数变换后，低频系数相似程度也大大提高，出现大量冗余，导致H.264编码对高清视频的压缩效率明显降低，而目前720P，1080P高清图像已经成为音视频应用系统的主流，未来图像分辨率将达到4K（4096 x 2160）、8K（8192×4320），H.264已经无法满足用户对高清视频图像传输的需求。新一代视频编码技术---H.265/HEVC高效视频编码技术的出现为解决这问题提供了手段。 H.265/HEVC在现有的主流视频编码标准H.264上保留了一些较为成熟的技术和继承其现有的优势，同时采用了基于四叉树结构的编码分割、预测编码技术等先进的编码技术，视频压缩效率将比H.264提高大约一半，可以轻松实现在低带宽下实现1080P图像的传输，同时支持4K、8K高清图像的传输。业内厂商纷纷开展了H.265/HEVC编码产品的研发和应用，例如武汉兴图新科已率先实现H.265/HEVC编码器的规模化应用，推出支持HDSDI 、DVI、HDMI 等各种视频制式的H.265/HEVC高清编码器，该型号的编码器在同等图像质量下，图像数据量只有MPEG2的1/16，MPEG4的1/6，H.264的1/2，同时实现在高达25%丢包率的不稳定网络环境下稳定传输。随着用户对高清和超高清视频的需求，基于H.265/HEVC标准的编码器将得到广泛的应用。

高效视频编码标准中的关键技术概述

本栏目责任编辑：唐一东多媒体技术及其应用高效视频编码标准中的关键技术概述张玢（渭南师范学院数学与信息科学学院网络工程技术中心，陕西渭南714000）摘要：高效视频编码标准(High Efficiency Video Coding)是视频压缩领域继H.264/AVC 之后的又一重大突破，主要面向高清电视（HDTV ）以及视频编解码系统，文章从HEVC 基本体系出发，较全面地介绍了HEVC 在编码结构、自适应样点补偿、自适应环路滤波以及并行化设计方面采用的关键技术。关键词：视频编码；H.265/HEVC ；变换结构中图分类号：TP391文献标识码：A 文章编号：1009-3044(2013)18-4316-03 Research on Core Techniques in the High Efficiency Video Coding ZHANG Bin (Center of Network Engineering Technology,College of Mathematics and Information Science,Weinan Normal University, Weinan 714000,China ) Abstract:As the successor to H.264/AVC,the High Efficiency Video Coding standard targets at next-generation HDTV dis? plays and video compression systems.The encode architectures and some of the key technologies used in the new model are in? troduced in this paper.Those key technologies involve with code structure,sample adaptive offset,adaptive loop filter and paral? lel structure. Key words:video coding;H.265/HEVC;transforming structure 国际电联(ITU)已正式批准通过了高效视频编码标准H.265/HEVC(High Efficiency Video Coding)，性能比H.264压缩标准有了很大的改善。H.265/HEVC 标准对压缩技术进行了改进，旨在有限带宽下传输更高质量的网络视频，H.265标准也同时支持超高清视频：4K (4096×2160)和8K(8192×4320)。可以说，H.265标准让网络视频跟上了显示屏“高分辨率化”的脚步。1HEVC 编码架构视频编码压缩的基本原理，是充分利用时间、空间的相关性，尽可能的去除冗余信息。目前通常采用混合视频编码框架，即按照相关原则将一帧数据划分为若干块，通过预测、变换、量化、熵编码等一系列算法来实现视频压缩。与H.264/AVC 相似，H.265/HEVC 的编码架构主要包含：帧内预测、帧间预测、转换、量化、去区块滤波器、熵编码等模块，但与H.264基于宏块不同，HEVC 整体被分为了三个基本单位：编码单位(CU ，coding unit )、预测单位(PU ，predict unit)和转换单位(TU ，transform unit)。2HEVC 使用的优势技术 H.265/HEVC 标准在之前压缩标准的基础上进行了技术改进，有以下基本算法：图像与声音分解与合成、图像与声音前处理、小波子带熵速率控制、小波子带熵量化与反量化、小波子带邻域交叉降维等，这些算法虽然复杂，但将压缩效率提升了一倍以上，该标准具体有以下几个方面的优势技术。1）编码结构灵活与H.264的4×4和8×8变换块相比，H.265/HEVC 引入了更大的宏块类型，扩充到16×16、32×32甚至于64×64的变换和量化算法，目的在于减少高清数字视频的宏块个数，描述宏块内容的参数信息也相对减少，以便于高分辨率视频的压缩。为了提高视频的编码压缩效率，H.265/HEVC 提出了超大尺寸四叉树编码结构，该编码结构更加灵活，并使用CU ，PU 和TU 3个概念来描述整个编码过程。收稿日期：2013-06-03 基金项目：渭南师范学院研究生专项基金项目（12YKZ048）作者简介：张玢（1986-），女，陕西渭南人，教师，硕士研究生，主要从事嵌入式开发研究。 4316

视频压缩编码标准H.264详解

视频编码跟音频编码常识新

视频与音频编码知识动态链接：Adobe premiere pro 编码定义：原始的视屏图像数据和音频信息都包含有大量的冗余信息，编码就是压缩的过程，将信息中的冗余信息去掉。分为视屏编码和音频编码，两者是分开的。一般来说视频比那马方案往往决定了高清视频的画质高低（严格意义上还有码率因素).音频编码决定了起音质的好坏。常用视频编码：XVID(DIVX的升级版），DIVX,H.264，MPEG-2\MPEG-4等。 Mpeg1:早期vcd使用，分辨率是352*288，压缩比低。Mpeg2:一般DVD使用，有NTSC(720*480)和 PAL(720*576),压缩比高于mpeg1. Mpeg4：目前使用最多的技术，avi文件始祖，大大提高压缩比，而质量堪比DVD Divx:基于mpeg4开发，有一定算法优先。 Xvid:divx技术封锁以后被人破解开发的，也是基于mpeg4的编码技术更先进，采用开放源码，画质更好。 H.261:早期的低码率编码，应用于352*288和176*144，

现在已不用。 H.263:在低码率下能够提供比H.261更好的图像效果，改进一些算法。 H.263+:h.263的改进型 H.264:H.264集中了以往标准的优点，高效压缩，与H.263+和mpeg4 sp相似。 Rm\rmvb:real 公司推出的应用于网络的高压缩编码，rm 是固定码率。Rmvb是动态码率（就是静态画面采用低码率，动态采用高码率） X264 X264是国际标准H.264的编码器实现，是一个开源encoder,得益于H.264的高效压缩性能，加之于X264的高效（编码速度快）实现，X264目前被广泛应用于DVDrip 领域。封装格式（也叫容器）所谓封装格式就是将已经编码压缩好的视频和音频按照一定的格式放到一个文件中，也就是说仅仅是一个外壳。格式类型 AVI：微软在90年代初创立的封装标准，是当时为对抗

视频编码全参数

视频编码参数编码类型编码类型为H264。 Adaptive DCT 允许使用8*8DCT。对画面质量和压缩效率都有好处。I4*4，P4*4，P8*8，B8*8：AVC标准允许使用多种DCT 块划分方式，这里就能选择允许使用的DCT块划分方式。前面的字母代表对于的帧类型，后面的数字代表块大小。本选项对画面质量和压缩效率都有好处，推荐都选上。I8*8需要ADaptive DCT打开才有效。帧率每秒的帧数(fps)或者说帧率表示图形处理器处理场时每秒钟能够更新的次数。高的帧率可以得到更流畅、更逼真的动画。一般来说30fps就是可以接受的，但是将性能提升至60fps则可以明显提升交互感和逼真感，但是一般来说超过75fps一般就不容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力，因为监视器不能以这么快的速度更新，这样超过刷新率的帧率就浪费掉了。 GOP（Group of picture）关键帧的周期，也就是两个IDR帧之间的距离，一

个帧组的最大帧数，一般而言，每一秒视频至少需要使用 1 个关键帧。增加关键帧个数可改善质量，但是同时增加带宽和网络负载。需要说明的是，通过提高GOP值来提高图像质量是有限度的，在遇到场景切换的情况时，H.264编码器会自动强制插入一个I帧，此时实际的GOP值被缩短了。另一方面，在一个GOP中，P、B帧是由I帧预测得到的，当I帧的图像质量比较差时，会影响到一个GOP中后续P、B帧的图像质量，直到下一个GOP开始才有可能得以恢复，所以GOP 值也不宜设置过大。同时，由于P、B帧的复杂度大于I帧，所以过多的P、B帧会影响编码效率，使编码效率降低。另外，过长的GOP还会影响Seek操作的响应速度，由于P、B帧是由前面的I或P帧预测得到的，所以Seek操作需要直接定位，解码某一个P或B帧时，需要先解码得到本GOP内的I帧及之前的N个预测帧才可以，GOP值越长，需要解码的预测帧就越多，seek响应的时间也越长。 CABAC/CAVLC H.264/AVC标准中两种熵编码方法，CABAC叫自适应二进制算数编码，CAVLC叫前后自适应可变长度编码，这两个选项中，CAVLC是低质量的，易于解码的选项，CABAC是高质量的，难于解码的选项。

视频音频封装基础知识

视频/ 音频/ 封装的基本知识 1.分辨率由于现在的高清视频全部是数字方式，由若干象素构成图象，一幅图象的水平象素乘以垂直象素，就表示为分辨率，比如分辨率为1920×1080，图象的水平方向每行有1920 个象素，垂直方向上每列1080 个象素。分辨率越高，构成图象的象素越多，包含的图象信息越丰富，图象越清晰，所以分辨率是高清的重要指标。 2.隔行和逐行隔行和逐行是电视系统显示图像的方法。隔行就是每一幅画面被分割为两场，每一场包含了一幅画面中所有的奇数行或者偶数行，通常是先扫描奇数行得到第一场，然后扫描偶数行得到第二场。由于视觉暂留效应，人眼将会看到平滑的运动而不是闪动的半幅的图像。但是这时会有几乎不会被注意到的闪烁出现，使得人眼容易疲劳。逐行每次显示整个图象，由于目前的平板电视绝大多数是逐行显示方式，不管电视信号如何，电视机都可以选择无闪烁的逐行显示。 4.码率码率是单位时间传送的数据量, 高清视频常用的单位是Mbps。通俗一点的理解就是原始片源制作数字格式的高清视频文件的取样率，码率越高，单位象素上包含的信息量越多，文件就越接近原始文件，清晰度越高。 5.编码方式：目前高清主流的视频编码格式有MPEG2、H264，VC-1。 MPEG2是DVD采用的视频编码格式，广泛用于DVD和电视信号传输。用于1080i 高清电视信号传输，需要12-20Mbps带宽，占用大量带宽，技术较老，压缩比不高。中国和美国的部分高清节目在使用MPEG2，欧洲已基本换用H264。Blu-ray早期部分节目使用过MPEG2，目前已全部换为H264和VC1。MPEG2压缩比低，对机器的要求最低，硬加速也最完善，只要你的机器不要太古董，都可以放得动。 H264是由ITU-T和ISO/IEC两大国际组织制定，H264在两大组织内分别表述为H264、MPEG-4 Part 10、ISO/IEC 14496-10、MPEG-4 AVC这4种名称，我们习惯使用其最

视频编码技术

视频编码技术所谓视频编码方式就是指通过特定的压缩技术，将某个视频格式的文件转换成另一种视频格式文件的方式。目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263，运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准，此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV以及Apple公司的QuickTime等。目前监控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP）、H.264/A VC、VC-1、RealVideo等几种视频编码技术。对于最终用户来言他最为关心的主要有：清晰度、存储量（带宽）、稳定性还有价格。采用不同的压缩技术，将很大程度影响以上几大要素。 MJPEG MJPEG（Motion JPEG）压缩技术，主要是基于静态视频压缩发展起来的技术，它的主要特点是基本不考虑视频流中不同帧之间的变化，只单独对某一帧进行压缩。 MJPEG压缩技术可以获取清晰度很高的视频图像，可以动态调整帧率、分辨率。但由于没有考虑到帧间变化，造成大量冗余信息被重复存储，因此单帧视频的占用空间较大，目前流行的MJPEG技术最好的也只能做到3K字节/帧，通常要8~20K！ MPEG-1/2 MPEG-1标准主要针对SIF标准分辨率(NTSC制为352X240；PAL制为352X288）的图像进行压缩. 压缩位率主要目标为 1.5Mb/s.较MJPEG技术，MPEG1在实时压缩、每帧数据量、处理速度上有显著的提高。但MPEG1也有较多不利地方：存储容量还是过大、清晰度不够高和网络传输困难。 MPEG-2 在MPEG-1基础上进行了扩充和提升，和MPEG-1向下兼容，主要针对存储媒体、数字电视、高清晰等应用领域，分辨率为：低（352x288），中（720x480），次高（1440x1080），高（1920x1080）。MPEG-2视频相对MPEG-1提升了分辨率，满足了用户高清晰的要求，但由于压缩性能没有多少提高，使得存储容量还是太大，也不适合网络传输。 MPEG-4 MPEG-4视频压缩算法相对于MPEG-1/2在低比特率压缩上有着显著提高，在CIF（352*288）或者更高清晰度（768*576）情况下的视频压缩，无论从清晰度还是从存储量上都比MPEG1具有更大的优势，也更适合网络传输。另外MPEG-4可以方便地动态调整帧率、比特率，以降低存储量。 MPEG-4由于系统设计过于复杂，使得MPEG-4难以完全实现并且兼容，很难在视频会议、可视电话等领域实现，这一点有点偏离原来地初衷。另外对于中国企业来说还要面临高昂的专利费问题，目前规定：－每台解码设备需要交给MPEG-LA 0.25美元。－编码/解码设备还需要按时间交费（4美分/天=1.2美元/月=14.4美元/年）。 H.264/A VC 视频压缩国际标准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4，其中H.262/MPEG-2和