视频编码技术及H264标准精品PPT课件

合集下载

第5课视频编码课件(共13张PPT) 三下信息科技浙教版(2023)

三、数字视频的应用
随着互联网、大数据技术的发展，数字视频利用先进的处理技术，在提升视频播放质量的同时，实现了更多的创新应用。例如，视频会议满足多人实时沟通交流；赛场高清直播实时捕捉并转播运动员的精彩画面；虚拟现实(VR)全景技术模拟还原现实中的场景，使观众获得沉浸式的交互体验；人工智能(AI)视频分析技术能够辨识追踪视频画面，实时监控分析。
试一试
视频编码后也会产生不同类型的文件格式，常见的视频文件类型有AVI、WMV、MP4、MOV等。试着将一种格式的视频利用格式转换软件转化成其他视频格式，比较不同格式视频的差异。
选中文件，单击鼠标右键，选择“属性”,查看视频详细信息。
二、视频数字化
当连续的图像以一定的速度播放时，就会形成比较流畅的视频画面。在视频中，称一幅静止的画面为帧。当计算机要处理视频时，通过数字采集设备如摄像机对画面进行采集，当每秒采集的帧画面越多，产生的视频就会越流畅，然后对采集到的视频画面进行编码转换，根据量化的结果进行编码转换，最终完成视频数字化。
第5课视频编码
学习内容
1.视频编码实现过程。 2.数字视频的应用。
讨论
视频是可以用于记录比赛、进行远程交流的一种方式，动态的画面是如何变成视频被计算机处理的呢?
建构
视频编码是视频处理中的一个核心技术，视频的数据量一般都比较大，经过数字化编码后便于存储和传输。
一、认识数字视频
数字视频技术能将动态的图像、声音等进行编码、压缩、储存，得到不同格式的数字视频，最大程度保证了图像与声音的完整性。
练习
定格动画是通过逐帧地拍拍摄一段简单的定格动画视频，并与同伴分享交流。
谢谢聆听！
INTERNET OF THINGS

视频编码技术-PPT

第3章视频编码技术
1.视频信号的数字化 2.视频文件格式 3.视频压缩编码原理 4.视频压缩标准
学习目标
掌握视频数字化方法了解视频文件格式掌握视频压缩编码原理（预测编码、变换编
码、统计编码原理）
理解视频压缩标准（ MPEG标准）
3.1 视频信号的数字化
1.视频相关的基本概念
所谓视频（video frequency ），连续的图像变化每秒超过24帧（frame）画面以上时，根据视觉暂留原理，人眼无法辨别单幅的静态画面，看上去是平滑连续的视觉效果，这样连续的画面叫做视频。即视频是由一系列单独的静止图像组成，其单位用帧或格来表示；
（1）本地影像视频格式
－MOV格式，美国Apple公司开发的一种视频格式，默认的播放器是苹果的QuickTime Player。具有较高的压缩比率和较完美的视频清晰度等特点，但其最大的特点还是跨平台性，即不仅能支持Mac OS，同样也能支持Windows系列。
Avid Media composer非线性编辑软件支持该格式。
同步信号
)
地(色度)
S-Video四芯插头（座）
地(亮度)
2.视频的采集及数字化
视频采集卡的接口
莲花接头
2.视频的采集及数字化
视频采集卡的接口 IEEE1394接口
IEEE1394是一种外部串行总线标准，800Mbps的高速。1394接口具有把一个输入信息源传来的数据向多个输出机器广播的功能，特别适用于家庭视听的连接。由于该接口具有等时间的传送功能，确保视听AV设备重播声音和图像数据质量，具有好的重播效果。
人眼在观察景物时，光信号传入大脑神经，需经过一段短暂的时间，光的作用结束后，视觉形象并不立即消失，而能继续保留其影像0.1-0.4秒左右，这种现象被称为视觉暂留现象。

H264编码技术

H264编码技术一、H.264的制定过程和应用场合在制订完最初的H.263标准之后，ITU-T的视频编码专家组（VCEG）将开发工作分为两部分：一部分称之为“短期（short-term）”计划，目的是给H.263增加一些新的特性（这一计划开发出了H.263+和H.263++）；另一部分被称为“长期（long-term）”计划，其最初的目标就是要制定出一个比当时其他的视频编码标准效率提高一倍的新标准。

这一计划在1997年开始，其成果就是作为H.264前身的H.26L（起初叫H.263L）。

在将近2001年底，由于H.26L优越的性能，ISO／IEC的MPEG专家组加入到VCEG中来，共同成立了联合视频小组（JVT），接管了H.26L的开发工作。

这个组织的目标是：“研究新的视频编码算法，其目标是在性能上要比以往制定的最好的标准提高很多。

”这一标准正式成为国际标准是2003年3月在泰国Pattaya举行的JVT第7次会议上通过的。

由于该标准是由两个不同的组织共同制定的，因此有两个不同的名称：在ITU-T中，它的名字叫H.264；而在ISO／IEC中，它被称为MPEG-4的第10部分，即高级视频编码（A VC）。

H.264的应用场合相当广泛，包括可视电话（固定或移动）、实时视频会议系统、视频监控系统、因特网视频传输以及多媒体信息存储等。

目前在国际上，加拿大的UB Video公司开发出了一套基于TMS320C64x系列的H.26L实时视频通信系统，它可以在160kbit/s 的码率下获得与H.263+在320kbit/s下相同的图像质量。

另一家加拿大的公司VideoLocus通过在系统中插入一块基于FPGA的硬件扩展卡，在P4平台上实现了H.264的实时编解码。

二、H.264的特点H.264在编码框架上还是沿用以往的MC-DCT结构，即运动补偿加变换编码的混合（hybrid）结构，因此它保留了一些先前标准的特点，如不受限制的运动矢量（unrestricted motion vectors），对运动矢量的中值预测（median prediction）等。

协议软件部培训PPT-H264视频编解码技术

2021/7/14
培训内容
• 视频编码标准H.263 – 协议结构
H.263有效载荷头定义了三种格式（模式A、模式B和模式C）。在模式A 中，在实际压缩H.263视频比特流之前存在4字节的H.263有效载荷头。这样允许在GOB边界有分段。在模式B中，使用的是8字节的H.263有效载荷头，且每个数据包从MB边界开始，没有PB帧选项。最后，模式C中使用的是12字节的H.263有效载荷头，采用PB帧选项支持在MB边界的帧分段。
4:4:4 ，Y、Cb 和Cr 具有同样的水平和垂直清晰度，在每一像素位置，都有Y，Cb 和Cr分量，即不论水平方向还是垂直方向，每4个亮度像素相应的有4个Cb和4个Cr色度像素。
4:4:4
4:2:0
4:2:2
Y Cb Cr
2021/7/14
• 视频编码的相关术语
1. 场和帧 2. 片和宏块 3. 片组 4. 档次和级 5. SP和SI 6. SPS和PPS 7. 图像序列号（POC） 8. RBSP和SODB
协议软件部培训PPTH264视频编解码技术
2021年7月14日星期三
•目标 •重点 •培训内容 •参考资料
2021/7/14
目录
培训目标 1. 掌握视频信息和视频编码的相关概念 2. 理解H.264编解码器的工作原理和关键算法 3. 掌握主流的H.264开源编解码器的架构和实
现 4. 掌握H.264视频数据RTP传输封包格式
1988年，ISO/IEC信息技术联合委员会成立了活动图像专家组（MPEG，Moving Picture Expert Group）。1991年公布了MPEG-1视频编码标准，码率为1.5Mbps，主要应用于家用VCD的视频压缩；1994年11月，公布了 MPEG-2标准，用于数字视频广播（DVB）、家用 DVD的视频压缩及高清晰度电视（HDTV）。

H.264视频编码学习(精)

H.263
• H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。 • H.263与H.261的主要区别：（1）数据流层次结构的某些部分在H.263中是可选的，使得编解码可以配置成更低的数据率。（2）H.263的运动补偿使用半像素精度，而H.261则用全像素精度和环路滤波。（3）H.263采用无限制的运动向量以及基于语法的算术编码。（4）H.263除支持QCIF和CIF外，还支持SQCIF、4CIF和16CIF， SQCIF相当于QCIF一半的分辨率，而4CIF和16CIF分别为CIF的4倍和16倍。（5）采用事先预测和与MPEG中的P-B帧一样的帧预测方法。
对称编/解码和不对称编/解码 —对称：编码和解码占用相同的计算处理能力和时间，实时性好。 —不对称：与上相反，一般压缩慢，解压快。
第二章视频编码发展概况
ITU-T 与MPEG • ITU-T与ISO/IEC是制定视频编码标准的两大组织，ITU-T 的标准包括H.261、H.263、H.264，主要应用于实时视频通信领域，如会议电视；MPEG系列标准是由ISO/IEC制定的，主要应用于视频存储(DVD)、广播电视、因特网或无线网上的流媒体等。 • 值得注意的是两个组织也共同制定了一些标准，H.262标准等同于MPEG-2的视频编码标准，而最新的H.264标准则被纳入MPEG-4的第10部分。 • 注：本幻灯片以ITU-T视频编码标准概述发展过程。
H.264
• H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。 • H.264的特点：（1）在同等视觉条件下，压缩比更高。（2）对网络传输具有更好的支持功能，支持交互式应用所需的低延迟模式，支持随机帧索取，支持可变码率，支持多种分辨率。（3）对信道时延的适应性较强，既能用于低时延的实时业务（如会议电视），又可用于无时延限制的场合（如视频存储）。（4）具有较强的抗误码能力，可适应不同网络中的视频传输，网络亲和性好。（5）在编码器和解码器中的复杂度可分级设计，使图像质量和编码处理之间可分级，以适应不同复杂度的应用。

第四章视频编码基础PPT课件

4）看成二阶马尔可夫信源，则信源熵： H 3 ( X ) H 2 1 ( X ) 3 . 1 比特 / 符号
5）看成无穷阶马尔可夫信源，则信源熵：
H ( X ) 1 . 4 比特 /符号
信源相对熵：
H(X) 1.40.29
Hmax(X) 4.76
信源冗余度： E1H (X) 10.290.71
并且这种冗余度在解码后还可无失真地恢复。（2）利用人的视觉特性，在不被主观视觉察觉的容限内，通过减少表示信号的精度，以一定的客观失真换取数据压缩。
10
第四章视频编码基础
4、图像信号的冗余度
图像信号的冗余度存在于结构和统计两方面。
① 空间冗余相邻像素/行变化小
在一幅图像中某一块面积上相邻像素的亮度和色度信息存在空间连贯性相似。一幅图像的亮度和色度信息中基本相同，存在多余信息。
A 0.064 J 0.001 S 0.051 2）按实际概率分布，且 B 0.013 K 0.005 T 0.08 无相关性，则信源熵：
C 0.022 L 0.032 U 0.023
D 0.032 M 0.020 V 0.008 H 1(X )H 0 1(X )
E 0.103 N 0.057 W 0.018 F 0.021 O 0.063 X 0.001 G 0.015 P 0.015 Y 0.016
第四章视频编码基础
第一部分
整体概述
THE FIRST PART OF THE OVERALL OVERVIEW, PLEASE SUMMARIZE THE CONTENT
2
第四章视频编码基础
4.1 视频编码系统概述
信源
信源编码
用户

H.264视频编码介绍资料

• H263++在H263+基础上增加了3个选项，增强码流在恶劣信道上的抗误码性和编码效率。 • 选项U—增强型参考帧选择，提供增强的编码效率和信道错误再生能力。 • 选项V—数据分片选择，提供增强型的抗误码能力(特别是在传输过程中本地数据被破坏的情况下)，通过分离视频码流中DCT的系数头和运动矢量数据，采用可逆编码方式保护运动矢量。 • 选项W—在H263+的码流中补充信息，保证增强型的反向兼容性。
H.264解码器
H.264采用的新技术
• H.264标准中诸如帧间预测、变换、量化、熵编码等基本功能模块与前几个标准（MPEG-1, MPEG-2, MPEG-4, H.261, H.263）并无太大 • • • • • • • 区别，变化主要体现在功能模块的具体细节上。分层设计帧间预测编码帧内预测编码整数变换量化处理熵编码环路滤波
TTS图解
• 如图所示，搜索步骤如下：
– 第一步：从搜索起点开始，以最大搜索长度的一半为步长，在周围距离步长的 8个点处进行块匹配计算并比较，图中用正方形表示，1号为该次搜索最优点。 – 第二步：将步长减半，中心点移到上一步的最小匹配点，重新在周围距离步长的8个点处进行块匹配计算并比较，图中用圆形表示，2号为该次搜索最优点。 – 第三步：在上一步得到的最小匹配点的中心及周围8个点处找出最匹配点，该点即为所求，图中用菱形表示，3号为该次搜索最优点
块的搜索与匹配
• 搜索起点的选择很重要。 • 块搜索算法：
①全搜索法FS ②三步搜索法TTS ③菱形搜索法DS ④六边形搜索法注：有不少对上述方法的改进及新方法。
• 块匹配准则：
①最小绝对差MAD ②最小均方误差MSE ③归一化互相关函数NCCF ④求和绝对误差SAD

H264视频压缩编码标准

述
由上边像素推出相应像素值由左边像素推出相应像素值由上边和左边像素平均值推出相应像素值利用线形“plane”函数及左、上像素推出相应像素值，适用于亮度变化平缓区域
SLIDE 30
帧内预测
图6 16×16 宏块举例：图6给出了一个左上方像素已编码的亮度宏块。图7 给出了4 种预测模式预测结果。其中模式 3最匹配原始宏块。帧内16×16模式适用于图像平坦区域预测。图7 帧内 16×16 预测块
SLIDE 11
–
–
–
H.264/AVC的结构
图3 H.264档次
SLIDE 12
H.264/AVC的结构
编码数据格式
– H.264支持4:2:0的逐行或隔行视频的编码和解码。
SLIDE 13
H.264/AVC的结构
参考图像
– 可从一组前面或后面已编码图像中选出一个或两个与当前最匹配的图像作为帧间编码间的参数图像， – H.264中最多可从15个参考图像中进行选择，选出最佳的匹配图像。 – 对于P片中帧间编码宏块可从表“0”中选择参数图像；对于B片中的帧间编码宏块和宏块分割的预测，可从表“0”和“1”中选择参考图像。
SLIDE 17
H.264/AVC的结构
表1 MB到片组的映射名称类型 0 1 2 3 交错散乱前景和背景 Box－out MB游程被依次分配给每一块组（图8）每一片组中的MB被分散在整个图象中（图9）例见图10 从帧的中心开始，产生一个箱子，其MB属于片组 0，其它MB属于片组（图11）描述
SLIDE 9
H.264/AVC的结构
名词解释
– 宏块、片: 一个编码图像通常划分成若干宏块组成，一个宏块由一个16×16亮度像素和附加的一个8×8 Cb和一个 8×8 Cr彩色像素块组成。每个图象中，若干宏块被排列成片的形式。 I片只包含I宏块，P片可包含P和I宏块，而B片可包含B和I宏块。 I宏块利用从当前片中已解码的像素作为参考进行帧内预测。 P宏块利用前面已编码图象作为参考图象进行帧内预测，一个帧内编码的宏块可进一步作宏块的分割：即16×16、 16×8、8×16或8×8亮度像素块（以及附带的彩色像素）；如果选了8×8的子宏块，则可再分成各种子宏块的分割，其尺寸为8×8、8×4、4×8或4×4亮度像素块（以及附带的彩色像素）。 B宏块则利用双向的参考图象（当前和未来的已编码图象帧）进行帧内预测。。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

熵编码原理算术编码的唯一性和效率
• 长度为n的序列的算术编码的平均码长为：
lA P (x)l x
P (x ) lo g
P
1 (x
)
1
P
(
x
)
lo
g
P
1 (x
)
1
1
P (x ) lo g P (x ) 2 P (x )
H X n 2 n H X 2
n H X lA n n H X 2 H X lA H X n 2
Zeroleft: 当前非零系数之前所有零的个数，初始值为TotalZeros
HR.2un6_b4eforCe：A游V程 LC 下面两种情况不需要编码：最后一个非零系数（反Z方向）前零的个数没有剩余的零可以编码，∑ Run_before=total_zeros
本例题中：0 3 0 1 -1 -1 0 1 0 0 0 。。。。。
HEVC视频编码标准之熵编码
——基于上下文的自适应二进制算术编码CABAC （Context-based Adapting Binary Arithmetic Coding）
郑明魁
数字电视智能化技术国家地方联合工程研究中心
熵编码基础
目前的视频编码标准主要通过去除空间冗余、时间冗余与编码冗余来实现压缩。编码器将多种算法有效的结合起来达到较高的压缩性能，主要相关技术包括预测编码、变换编码、量化和熵编码技术。
熵编码原理
1.算术编码 Arithmetic Coding（二进制）
在编码过程中，输入数据流中的信源符号被分为大概率符号 (MPS)和小概率符号(LPS)。
LPS的概率记为Q， MPS的概率记为P=1-Q
熵编码原理算术编码的唯一性和效率
• 上述产生的标识可以唯一表示一个序列，这意味着该标识的二进制表示为序列的唯一二进制编码
自适应算术编码在扫描符号序列前并不知道各符号的统计概率，这时假定每个概率相等，并平均分配区间[0,1],然后在扫描符号序列的过程中不断调整各个符号的概率。
1.调整概率后，再进行进行区间分配，随着编(译)码过程的进行。 2.概率分配将逐渐趋于信源的实际概率分布。这种方法对于无法进行概率统计的信源比较合适。
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
码字长度
2 2 3 3 5 5 5 5 5 6 7 7 7 7 7 7 8
码字
00 01 100 101 11000 11001 11010 11011 11100 111010
权值
0x00 0x01 0x11 0x02 0x21 0x03 0x31 0x41 0x12 0x51 0x61 0x71 0x81 0x91 0x22 0x13 0x32
算术编码的效率高：当信源符号序列很长，平均码长接近信源的熵
算术编码基础
2.自适应算术编码 Adapting Arithmetic Coding
在前面讨论的算术编码中，我们把信源的统计特性被看作是固定不变的，这在实际应用中显然不太实际。为解决使编码技术适应信源统计特性变化的问题，前人提出了自适应算术编码方法，自适应算术编码在一次扫描中可完成两个过程，即概率模型的建立过程和扫描编码过程。
熵编码基础
游程编码：游程编码在传真文件压缩中的应用
例:０００１０００１１１０１１１１１００００
3 1 3 31
54电ຫໍສະໝຸດ 网熵编码原理H.264基于上下文的自适应变长编码CAVLC（Context-based Adapting Variable Length Coding）游程编码思想的应用： 5、run before：以反z向扫秒零的个数，类似游程编码。注意两个参数，Zeroleft和Run_before
run_before(4) ZerosLeft=3; run_before=1 run_before(3) ZerosLeft=2; run_before=0 run_before(2) ZerosLeft=2; run_before=0 run_before(1) ZerosLeft=2; run_before=1 run_before(0) ZerosLeft=1; run_before=1 No code required; last coefficient.
哈夫曼编码(Huffman Coding)，霍夫曼编码是可变字长编码(VLC) 的一种。出现机率高的字母使用较短的编码，反之出现机率低的则
使用较长的编码。现在流行的很多压缩方法都使用了范式哈夫曼编码技术，如 GZIB、ZLIB、PNG、JPEG、MPEG 等。在直流 DC 系数经过上面的 DPCM 编码，交流 AC 系数经过 RLE 编码后，得到的数据，还可以再进一补压缩，即使用 Huffman 编码来处理。
• 但二进制表示的精度可以是无限长：保证唯一性但不够有效
• 为了保证有效性，可以截断二进制表示，但如何保证唯一性？
• 答案：为了保证唯一性和有效性，需取小数点后l位数字作为信源序列的码字，其中
lx
log
P(1x)1
– 注意：P(x)为最后区间的宽度，也是该符号串的概率
– 符合概率匹配原则：出现概率较大的符号取较短的码字，而对出现概率较小的符号取较长的码字
预测
变换
量化
熵编码
熵编码基础
熵编码是按照熵原理进行的一种无失真压缩编码方式，生成的码流可以通过解码过程无失真的将原始数据解析出来。常见的熵编码主要有：香农编码(Shannon Coding)、哈夫曼编码(Huffman Coding)和算术编码(Arithmetic Coding)等。
熵编码基础
算术编码基础
3.基于上下文自适应算术编码
在实际的视频编码过程中，由于冗余的存在（特别是时间冗余和空间冗余，于是在自适应算术编码的基础上引入了context model的概念，通过信源前后（时间或空间上）消息的预测分布来调整并适应信源统计特性的变化，这就是所谓的基于上下文的自适应算术编码。
Context model是根据当前符号周围的已编(译)码符号的情况构造的，每个context model内，概率随着编(译)码的进行而进行自适应的更新。对于不同的context model，其概率分配也是不同的，此时的概率即为条件概率。