H.264AVC中的SPSI帧技术

合集下载

H264编解码协议详解

H264编解码协议详解H.264编解码协议，也被称为AVC（Advanced Video Coding），是一种广泛应用于视频压缩的标准。

它是一种基于帧的压缩算法，可以将高质量的视频数据以较低的比特率传输和存储。

以下是H.264编解码协议的详细解释：1.压缩结构H.264使用了多种技术来实现高效率的视频压缩。

它使用了预测编码、变换编码和熵编码等多种技术。

预测编码通过利用帧间和帧内的冗余性，对视频进行空间和时间上的预测。

变换编码则通过对预测误差进行离散余弦变换（DCT），在频域上进行编码。

最后，熵编码使用了熵编码表将变换后的数据进行进一步的压缩。

2.帧结构H264将视频数据划分为一系列的帧，每个帧包含了许多宏块（macroblock）。

其中，关键帧（I帧）是完全独立的帧，它包含了视频的全局信息。

预测帧（P帧）和双向预测帧（B帧）则通过对前一帧和前后一帧进行预测来进行编码。

P帧只依赖前一帧，而B帧则依赖前后两帧。

这种结构可以进一步提高视频压缩的效率。

3.量化参数H.264使用量化参数对预测误差进行编码。

量化参数决定了每个预测误差值的精度，较大的量化参数会导致更高的压缩率，但也会导致较大的失真。

编码器和解码器可以通过动态调整量化参数来平衡压缩率和失真。

4.帧间预测帧间预测是H.264压缩的核心技术之一、它通过对前后帧的像素进行比较，预测当前帧的像素值。

如果在帧间没有大的运动，那么预测误差就会较小，从而达到更好的压缩效果。

帧间预测有多种模式，包括帧间直接模式（inter-direct mode）、帧间双向模式（inter-bidirect mode）和帧间skip模式（inter-skip mode）等。

5.熵编码H.264使用了基于上下文的自适应变长编码（CAVLC）和基于上下文的自适应二进制算术编码（CABAC）两种熵编码技术。

CAVLC主要用于编码量化系数和运动矢量等数据，而CABAC主要用于编码预测模式和其他语法元素。

率失真理论及经典的码率控制算法

率失真理论及经典的码率控制算法一、视频编码的率失真思想率失真理论研究的是限失真编码问题：能使限失真条件下比特数最小的编码为最佳编码。

设信源为},...,,{21m m a a a A =，经过编码后，信宿为},...,,{21n n b b b B =，定义信源、信宿概率空间分别为)}(),...,(),({Q )}(),...,(),({2121n m b Q b Q b Q a P a P a P P 、。

定义平均失真函数)(Q D 如下： ∑∑∑∑======m j j k j nk k j m j k j n k k j a b Q a P b a d b a P b a d Q D 1111)|()(),(),(),()(其中，),(k j b a d 为失真度，度量准则可是均方误差MSE 、绝对差分和SAD 或差分平方和SSD 等。

若信源概率分布)(j a P 已知，则平均失真仅仅取决于条件概率)|(j k a b Q ，从而必然存在这样一个条件概率)|(j k a b Q 使得D Q D ≤)(，即：))((D Q D Q Q D ≤=即D Q 为保证平均失真)(Q D 在允许范围D 内的条件概率集合。

进一步，定义),(Y X I 为接收端获取的平均信息量：)()|(log)|()(),(1k j k m j j k j b Q a b Q a b Q a P Y X I ∑==同样，在给定的)(j a P 前提下，),(Y X I 的大小也只取决于。

现在率失真函数)(D R 定义为在D Q 范围内寻找最起码的信息量，即：),()(min Y X I D R DQ Q ∈=该公式的含义：在允许的失真度为D 的条件下，信源编码给出的平均信息量的下界，也就是数据压缩的极限数码率。

当数码率R 小于率失真函数)(D R 时，无论采用什么编码方式，其平均失真必大于D 。

视频压缩是典型的限失真编码，率失真理论同样适应于视频编码。

数字视频压缩技术H264详解

数字视频压缩技术H264详解一个基于分组方式的接口，打包和相应的信令属于NAL的一部分。

这样，高编码效率和网络友好性的任务分别由VCL和NAL来完成。

VCL层包括基于块的运动补偿混合编码和一些新特性。

与前面的视频编码标准一样，H.264没有把前处理和后处理等功能包括在草案中，这样可以增加标准的灵活性。

NAL负责使用下层网络的分段格式来封装数据，包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。

例如，NAL支持视频在电路交换信道上的传输格式，支持视频在Internet上利用RTP/UDP/IP传输的格式。

NAL包括自己的头部信息、段结构信息和实际载荷信息，即上层的VCL数据。

（如果采用数据分割技术，数据可能由几个部分组成）。

（2）高精度、多模式运动估计H.264支持1/4或1/8像素精度的运动矢量。

在1/4像素精度时可使用6抽头滤波器来减少高频噪声，对于1/8像素精度的运动矢量，可使用更为复杂的8抽头的滤波器。

在进行运动估计时，编码器还可选择“增强”内插滤波器来提高预测的效果。

在H.264的运动预测中，一个宏块（MB）可以按图2被分为不同的子块，形成7种不同模式的块尺寸。

这种多模式的灵活和细致的划分，更切合图像中实际运动物体的形状，大大提高了运动估计的精确程度。

在这种方式下，在每个宏块中可以包含有1、2、4、8或16个运动矢量。

在H.264中，允许编码器使用多于一帧的先前帧用于运动估计，这就是所谓的多帧参考技术。

例如2帧或3帧刚刚编码好的参考帧，编码器将选择对每个目标宏块能给出更好的预测帧，并为每一宏块指示是哪一帧被用于预测。

（3）4某4块的整数变换H.264与先前的标准相似，对残差采用基于块的变换编码，但变换是整数操作而不是实数运算，其过程和DCT基本相似。

这种方法的优点在于：在编码器中和解码器中允许精度相同的变换和反变换，便于使用简单的定点运算方式。

也就是说，这里没有“反变换误差”。

变换的单位是4某4块，而不是以往常用的8某8块。

视频编码标准

视频编码标准H.264/AVCH.264/AVC 是ITU-T VCEG 和ISO/IEC MPEG 共同开发的视频处理标准，ITU-T作为标准建议H.264，ISO/IEC作为国际标准14496-10（MPEG-4 第10部分）高级视频编码（AVC）。

MPEG-2视频编码标准（又称为ITU-T H.262[2]）已有10年的历史了，由MPEG-1扩充而来，支持隔行扫描。

使用十分广泛，几乎用于所有的数字电视系统，适合标清和高清电视，适合各种媒体传输，包括卫星、有线、地面等，都能有效地传输。

然而，类似xDSL、UMTS（通用移动系统）技术只能提供较小的传输速率，甚至DVB-T，也没有足够的频段可用，提供的节目很有限，随着高清电视的引入，迫切需要高压缩比技术的出现。

应用于电信的视频编码经历了ITUT H.261、H.262（MPEG-2）、H.263、H.263+、H.263++，提供的服务从ISDN和T1/E1到PSTN、移动无线网和LAN/INTERNET网。

最近MPEG-4 第二部分进入了实用领域，提供了视频形状编码，目标是与MPEG-2一样获得广泛的数字电视应用。

1998年，视频编码专家组（VCEG-ITU-T SG16 Q.6）启动了H.26L工程，旨在研制出新的压缩标准，与以前的任何标准相比，效率要提高一倍，同时具有简单、直观的视频编码技术，网络友好的视频描述，适合交互和非交互式应用（广播、存储、流煤体）。

2001年12月，VCEG和运动图像专家组（MPEG-ISO/IEC JTC 1/SC 29/WG 11）组成了联合视频组（JVT，Joint Video Team），研究新的编码标准H.264/AVC，该标准于2003年3月正式获得批准。

视频的各种应用必须通过各种网络传送，这要求一个好的视频方案能处理各种应用和网络接口。

H.2 64/AVC为了解决这个问题，提供了很多灵活性和客户化特性。

h.264标准简介

H.264标准简介H.264/MPEG-4 A VCH.264，或称MPEG-4第十部分，是由ITU-T视频编码专家组（VCEG）和ISO/IEC动态图像专家组（MPEG）联合组成的联合视频组（JVT，Joint Video Team）提出的高度压缩数字视频编解码器标准。

ITU-T的H.264标准和ISO/IEC MPEG-4第10部分（正式名称是ISO/IEC 14496-10）在编解码技术上是相同的，这种编解码技术也被称为A VC，即高级视频编码（Advanced Video Coding）。

该标准第一版的最终草案已于2003年5月完成。

H.264是ITU-T以H.26x系列为名称命名的标准之一，同时A VC是ISO/IEC MPEG一方的称呼。

这个标准通常被称之为H.264/A VC（或者A VC/H.264或者H.264/MPEG-4 A VC或MPEG-4/H.264 A VC）而明确的说明它两方面的开发者。

该标准最早来自于ITU-T的称之为H.26L的项目的开发。

H.26L这个名称虽然不太常见，但是一直被使用着。

有时候该标准也被称之为“JVT 编解码器”，这是由于该标准是由JVT组织并开发的（作为两个机构合作开发同一个标准的事情并非空前，之前的视频编码标准MPEG-2也是由MPEG 和ITU-T两方合作开发的，因此MPEG-2在ITU-T的命名规范中被称之为H.262）。

H.264/A VC项目最初的目标是希望新的编解码器能够在比相对以前的视频标准（比如MPEG-2或者H.263）低很多的位元率下（比如说，一半或者更少）提供很好的视频质量；同时，并不增加很多复杂的编码工具，使得硬件难以实现。

另外一个目标是可适应性，即该编解码器能够在一个很广的范围内使用（比如说，即包含高码率也包含低码率，以及不同的视频分辨率），并且能在各种网络和系统上（比如组播、DVD存储、RTP/IP包网络、ITU-T 多媒体电话系统）工作。

H.264视频压缩标准

2.
H.264的发展
H.264是ITU-T 的视频编码专家组（VCEG）和ISO/IEC 运动图像专家组（MPEG）联合制定的新一代视频压缩标准。 ITU-T是一个代表国际电信联盟协调制定电信标准的部门。 ISO 是指国际标准化组织。 IEC是指国际电气和相关技术的标准。 H.264是ITU-T所使用的名称，而ISO/IEC 将其命电工委员会，负责制定所有电子、名为MPEG-4 Part 10/AVC，因为它代表的是MPEG-4系列标准中的一个新标准。 MPEG-4系列标准包括了 MPEG-4 Part 2等标准， MPEG-4 Part 2是一个应用于基于IP的视频编码器和网络摄像机的标准。为了解决先前视频压缩标准中存在的不足， H.264的目标是支持： > 高效压缩，在某一特定的视频质量下，与采用任何其它视频标准相比，可以使比特率平均降低 50%。 > 更强大的容错能力，能够纠正各种网络的传输错误 > 低时延功能，并能够在更高时延的情况下提供更高质量的图像 > 通过简单的句法规范简化实施 > 精确匹配解码，严格规定了编码器和解码器如何进行数值计算，以避免错误累积此外， H.264 还能够灵活地支持有着不同比特率要求的各种监控应用。例如，在娱乐视频应用（包括广中， H.264 能够以高时延实现1-10Mbit/ 秒的性能。而对于电信服务来播、卫星电视、有线电视和 DVD）说， H.264能够以低时延实现低于1Mbit/ 秒的比特率。
4
4.
H.264类别和等级
参与制定H.264 标准的联合组织致力于创建一个简单明了的解决方案，最大限度地限制选项和特性的数量。和其它视频标准一样， H.264 标准的一个重要方面是通过类别（算法特性集）和等级（性能等级）中提供的功能，以最佳的方式支持常见应用和通用格式。 H.264 有7个类别，每个类别都针对某一类特定的应用。此外，每个类别都定义了编码器能够使用哪些特性集，并限制了解码器在实施方面的复杂性。网络摄像机和视频编码器最有可能使用的是基准类别，此类别主要针对计算资源有限的应用。对于嵌入在网络视频产品中的实时编码器来说，在特定的可用性能下，基准类别最为适用。此类别能够实现低延时，这对监控视频来说是一个很重要的要求，而且对于支持 PTZ 网络摄像机实现实时的平移 / 倾斜 / 缩放 (PTZ) 控制来说尤为重要。 H.264分为11个功能等级，对性能、带宽和内存需求进行了限制。每个等级都规定了从QCIF 到HDTV 等各种分辨率所对应的比特率和编码速率（每秒宏块数）。分辨率越高，要求的等级就越高。

基于H.264／AVC视频安全级别可分的加密方案

ｉｎｇｓｔａｎｄｙｄａｉｎｏｒｄｅｒｔｏｐｒｏｔｅｃｔｈｅｔｓｅｃｕｒｉｔｙｏｆｖｉｄｅｏｄａｔａｉｓｐｒｅｓｅｎｔｅｄ．Ｕｓｉｎｇｓｔｒｅｍａｃｉｐｈｅｒｅｎｃｒｙｐｔｉｏｎａｄｖａｎｔａｇｅｓｏｆｓｉｍｐｌｅ，ｆａｓｔｏｐｅｒａｔｉｏｎ，ｔｈｅＡｄｖａｎｃｅｄ
（ＰＰＳ）ａｎｄＩｆｒｍｅａｓ．Ｆｏｒｄｉｆｅｒｅｎｔｖｉｄｅｏａｐｐｌｉｃａｔｉｏｎｓｄｅｍａｎｄｄｉｆｅｒｅｎｔｓｅｃｕｒｉｔｙｌｅｖｅｌｓ，ｉｎｔｈｅｍａｃｒｏｂｌｏｃｋｌｅｖｅｌａｃｅｒｔａｉｎｎｕｍｂｅｒｏｆｍａｃｒｏｂｌｏｃｋｓａｙｅｓｅ —
ＳｅｃｕｒｉｔｙＬｅｖｅｌＤｉ￣ｓｉｏｎＥｎｃｒｙｐｔｉｏｎＳｃｈｅｍｅｆｏｒＨ．２６４／ＡＶＣＶｉｄｅｏ
ＣＨＥＮＺｈｉｙｕ，ＳＯＮＧＪｉａｎｘｉｎ
（ＩｍａｇｅＰｒｏｃｅｓｓｉｎｇａｎｄＩａｇｍｅＣｏｍｍｕｎｉｃａｔｉｏｎＬａｂ，ＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓ＆Ｔｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎ，Ｎａｎｊｉｎｇ２１０００３，Ｃｈｉｎａ）【Ａｂｓｔｒａｃｔ】Ｆｏｒｔｈｅｃｕｒｒｅｎｔｖｉｄｅｏｆｅａｔｕｒｅｓｓｕｃｈａｓｅａｓｙｔｏｃｏｐｙ，ｅｓａｙｔｏｔａｍｐｅｒｗｉｔｈｔｈｅｄａｔａ，ａｖｉｄｅｏｅｎｃｒｙｐｔｉｏｎｓｃｈｅｍｅｂａｓｅｄｏｎＨ．２￣／ＡＶＣｖｉｄｅｏｃｏｄ —

sps和pps的简单理解记录

sps和pps的简单理解记录
最近博客写出了⽇记的既视感。

使⽤RTP传输H264的时候,需要⽤到sdp协议描述,其中有两项:Sequence Parameter Sets (SPS) 和Picture Parameter Set (PPS)需要⽤到,那么这两项从哪⾥获取呢?
答案是从H264码流中获取.在H264码流中,都是以"0x00 0x00 0x01"或者"0x00 0x00 0x00 0x01"为开始码的,找到开始码之后,使⽤开始码之后的第⼀个字节的低5位判断是否为7(sps)或者8(pps), 及data[4] & 0x1f == 7 || data[4] & 0x1f == 8.然后对获取的nal去掉开始码之后进⾏base64编码,得到的信息就可以⽤于sdp.sps和pps需要⽤逗号分隔开来.
SPS 对于H264⽽⾔，就是编码后的第⼀帧，如果是读取的H264⽂件，就是第⼀个帧界定符和第⼆个帧界定符之间的数据的长度是4
PPS 就是编码后的第⼆帧，如果是读取的H264⽂件，就是第⼆帧界定符和第三帧界定符中间的数据长度不固定。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

%’?<@015@ & .J@K L8LE9 M@KNOKKEK :PQ AEP R98SE :GLEKC *+$R98SEK 8AM *-$R98SEKC MER@AEM @A :JE ESE9B@AB T@MEQ NQM@AB K:8AU
M89MC VAQPA 8K -./7. DEN= 0=#&( Q9 -*2 , -34 5+367( , +89: !"7;<4= .JE S8@A RE8:O9E QR *+7R98SEK @K :J8: @MEA:@N8F *+7 R98SEK N8A WE 9ENQAK:9ON:EM ETEA PJEA M@RRE9EA: 9ERE9EANE R98SEK 89E OKEM RQ9 :JE@9 L9EM@N:@QA= ?E 8FKQ @ANFOME 8 MEKN9@L:@QA QR *-7R98SEKC PJ@NJ 89E OKEM @A NQAXOAN:@QA P@:J *+7R98SEK= .JE L9QLE9:G QR *+7R98SEK 8FFQPK :JES :Q 9ELF8NE -7R98SEK @A 8LLF@N8:@QAK KONJ 8K W@:K:9E8S KP@:NJ@AB &KLF@N@ABC 8AM 98AMQS 8NNEKK= Y@A8FFGC K@SOF8:@QA 9EKOF:K KJQP :J8: *+7R98SEK J8TE K@BA@R@N8A:FG WE::E9 NQM@AB ERR@N@EANG :J8A -7R98SEK PJ@FE L9QT@M@AB K@S@F89 ROAN:@QA8F@:@EK=
%E99&#_%9EN$%L9EM&#
然后把得到的预测误差系数 %E99&# 进行无损的熵编码 % 在解码器端 & 解码器生成 7#)E &6 # 后 & 对 7#)E &6 # 进行变换 ( 量化 & 即可得到 %L9EM&#& 其值与编码器端的值相同 % %L9EM&# 与接收到的预测误差系数 %E99&#) 其值与
+@N:O9E $
[!\ [#\ []\
为切换预测帧 & 称 *- "*P@:NJ@AB - +@NU
:O9E $[!\[(\为切换起始帧 % *+ 帧编码的基本原理类似于 + 帧 & 仍然是基于
帧间预测的运动补偿预测编码 & 但它能够在使用不同参考帧的情况下重构相同的图像帧 % 利用这一特性可以实现码流的随机切换功能 & 即 *+ 帧可以在流间切换 "^@:K:9E8S *P@:NJ@AB $( 拼接 "*LF@N@AB $( 随机接入 "D8AMQS ;NNEKK $(* 快进 , 快退 + 和错误恢复等应用中取代 - 帧 % 与 *+ 帧相对应 &*- 帧利用了帧内预测编码技术 & 其重建图像和对应的采用运动补偿预测的 *+ 帧的重建图像相同 %
帧 )*ENQAM89G *+$Y98SE #& 前者的参考帧和当前编码帧在同一个码流中 & 而后者则不在同一个码流 % 下面以一个例子来说明 *+ 帧可实现的功能原理 % *- 帧与 *+ 帧在功能实现上相类似 & 都能恢复出相同的解码图像帧 & 只是前者利用的是帧间预测 & 而后者利用的则是帧内预测 % 首先对以下用到的符号进行说明 !7 )E &6 #&F" )E &
5
+, 1 +2 帧的应用
凡是会经常出现图像信号流切换的地方 " 都需
要 +, 1 +2 帧技术 " 例如它可以解决视频流应用中终端用户可用带宽不断变化的问题 " 以及不同内容节目拼接时数据量的激增和错误恢复问题等 " 实际上这也是提出 +, 1 +2 帧的原因 #
#&( & 也称作 -*2 , -34 5+36 7( , +89:!" 7;<4 [!\% 01 #&( , ;<4 新增了一系列新的技术 & 以适应视频数据
在各种传输媒体中的应用 &*+ , *- 帧技术即是其中之一 % 由于尚无标准词 & 权且称 *+ "*P@:NJ@AB +
#-#-#
主 +, 帧的解码图 # 是文献 .34 中定义的主 +, 帧非帧内块的解
码方框图 # 获得预测块 & &$ "% ! 后进行正变换 " 变换后得到的系数记为 +%"!&# 将编码端输出的已经量化的预测误差系数 !!"" 采用量化参数 &)& 进行反量化 " 得到的系数记为 *!""# *!"" 与 +%"!& 的和记为 +"!(# 重建系数 +"!( 采用量化参数 -&)& 进行量化和反量化 " 并对反量化后获得的 *"!( 进行反变换和滤波即得重建图像 #
*+ & *- 帧编码原理 *+ 帧分为主 *+ 帧 )+9@S89G *+$Y98SE # 和辅 *+
服务日益流行 & 对视频流的带宽自适应性提出了要求 & 同时 & 由于网络的复杂性越来越高 & 要求传输码流具有强的抗误码性能 &以适应噪声干扰大 (丢包率高的信道传输要求 % 为此 & 通过汲取近年来图像压缩编码研究取得的最新成果 & 由运动图像专家组 )5+36 $ 与视频编码专家组 "<436 $ 组成的联合视频工作组 "Z<. $ 制定了新一代图像压缩标准 -./ 0=
’"(
流间切换在预先压缩视频节目的应用中 " 实现带宽自适
应的最好方法 " 是设置多组不同的信源编码参数对同一视频序列分别进行压缩 " 从而生成适应不同带宽 ’ 具有不同质量的多个相互独立的码流 # 这样 " 服务器就可以在不同的码流间切换以适应网络有效带宽的不断变化 # 设 6,*". 7*",*".",*"./*8 和 6,#". )*",#".",#"./*8 分别是对同一段视频序列采用了不同的信源编码参数压缩所得到的两个码流 # 由于压缩参数不同 " 两个码流中同一时刻的帧 " 例如 ,*".)* 和 ,#".)*" 是不完全一样的 # 假设服务器开始时发送比特流 * " 到时刻 . 开始发送比特流 # " 此时解码器收到的序列为 6,*".)#",*".)*"
编码器端所得完全相同 ! 相加 " 所得和为 !!"""#$!%"!&"#’
!"!()!%"!&"#$!%"!&"#’!"!(# 对 !"!( 进行反量化 $量化参数不变 !
和反变换 " 就得到了重建图像 "#$$ "% !" 其与以 &*$$ "
%! 作为预测帧的主 +, 帧所重建的图像完全相同 % !"! #-#-* #$ % #& 帧编解码的方框图
*+ , -+ /0123 43567898:;3< ;7 !=>$% & ’()
?;> +@ABC 403> DEA$FE@C ?;>6 08@7G@AB H!"#$$% $& ’(%("$) *+,-+((.-+,/ 0(-1-+, 2+-3(.4-56 $& 7$454 8+9 :(%("$));+-"85-$+4< =(-1-+, >?@ABC/ D#-+8I
6 # 形式的符号用于图像域 &%9EN&%E99&# 形式的符号用于
变换域 % 设以 7!)E &6 # 作为预测帧时主 *+ 帧的重建图像为 F" )E &6 #&F" )E &6 # 由重建系数 %9EN 做反量化和反变换得到 % 假设另一预测帧为 7#)E &6 #&与数字视频数字电视字电视与与数数字字视视频频
文章编号 !!""#$%&’#"#""( #"!$""##$"(