H.264编码标准的分析研究
[摘要]主要学习研究H.264标准中的关键技术,H.264标准是最新的视频编码标准,它采用一系列先进的编码技术,在编码效率、抗误码能力、网络适应性等方面表现出超越以往各标准的优势,H.264的研究和应用将大大推进视频技术的发展。
[关键词]H.264 视频编码
中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)0710040-01
随着科技的发展,人们的生活越来越便利,家庭中的家务劳动大多都由各种各样的家用电器代劳,工业生产中,已广泛实现自动化,通信领域也在飞速发展,由书信、电报到传真、电话、E-mail、网络聊天,人与人的沟通任何时候任何地方都在进行。人们的需求就是科技发展的推动力,近年来,视频技术成为关注的焦点,在娱乐、远程医疗、远程监控、视频会议、网络教学等领域都得到广泛的应用,相信在即将出台的3G无线通信中,视频技术也会有更好的表现。国际化标准组织(ISO)/国际电工委员会(IEC)和国际电信联盟(ITU)制定了一系列视频编码标准以获得更好的编码效率。H.264是由ISO/IEC和ITU合作制定的新一代视频编码标准,2003年3月正式通过,现在正处于应用开发阶段,凭借它的优势必将在视频应用领域大有作为。
一、H.264标准介绍
H.264同样采用DPCM加变换编码的混合编码模式,但它采用“回归基本”的简洁设计,不用众多的选项,但获得比H.263++好得多的压缩性能;应用目标范围较宽,以满足不同速率、不同分辨率以及不同传输(存储)场合的需求。
技术特点包括:(1)帧间编码,可变块的运动补偿预测技术;(2)帧内编码,多方向的空间预测技术;(3)环内滤波器,去除块效应;(4)4×4的整数正交变换及相应的量化策略;(5)改进的运动向量预测编码;(6)更加高效的熵编码器;(7)基于信息率失真的编码优化技术。
这些措施使得H.264算法具有很高的编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。但H.264性能的改进是以增加复杂性为代价而获得的,其编码的计算复杂度大约相当于H.263的3倍,解码复杂度大约相当于H.263的2倍。
H.264的突出特点是特别有利于对视频信源的高比率压缩、对信道的高效利用以及对视频传输瓶颈的缓解,并且能够产生不同等级的视频质量(HDTV、SDTV,PDTV)分别满足不同的应用需求。因此,H.264在数字电视广播与存储、互联网视频流信息服务和视频移动传输(如3G移动通信)等领域得到广泛的应用。
二、H.264标准中关键技术研究
视频编码的建议从H.261到H.262/3,MPEG-1/2和MPEG-4都有一个共同的目标:在尽可能低的码率下获得尽可能好的图像质量。然而,随着图像通信的发展,如何适应不同信道传输的需求,如何适应用户对视频自由选择编码的需求等问题相继出现。与以往的标准相比,H.264具有最高的编码效率,简洁的表现形式和低时延,能够很好的解决上述问题。
H.264标准采用了与已经制定的视频编解码标准(如H.263和MPEG-4) 相类似的一些编解码方法。主要技术包括:
(1)将每个视频图像分成16×16的像素宏块。这种处理就使得视频图像能以像素宏块为单位进行处理。
(2)时域上的相关性存在于那些连续图像的块之间,这就使得在编码的时候只需要编码那些差值即可。利用时域相关性一般是通过运动估值和运动补偿等技术。对于一个像素块来说,在已经编码好的前一幅或几幅图像中搜索其相关像素块,从而获得其运动矢量,而该运动矢量就在编码端和解码端被用来预测当前像素块。
(3)利用残差的空域冗余度。在运动估值后,编码端只需要编码残差即可,也就是编码当前块与其相应的预测块的差。残差块编码过程与原来系数块的编码过程类似,都是变换、量化、扫描和熵编码。
(4)其他技术。还包括传统的4:2:0的色度数据与亮度数据的采样关系;块运动置换;超越图像边界的运动矢量;变化块大小的运动;可分级的量化;I, P和B图像类型。
(一)变换与量化
H.264中变换块的大小由8×8变为4×4能够降低图像的块效应,从而获得更好的图像质量和主观视觉效果;整数变换、量化计算及其逆过程可以完全通过整数运算实现,比浮点运算能够有效地提高计算速度,也更利于硬件实现实时系统;整数运算不存在误差匹配问题,运算精度高;尺度运算被结合到量化过程中进行,降低了变换的复杂度;16位的整数变换更加简洁,无须乘法运算,减少了变换后的动态范围,从而降低了对存储器和处理器的要求。
(二)扫描顺序
变换系数为之字形(Zigzag)扫描,系数残差块经变换量化后,矩阵右下三角基本为零,采用Zigzag扫描能够最大可能地缩短码字长度,提高编码效率。
(三)运动估计与运动补偿
H.264中采用了7种宏块预测模式,再加上直接拷贝模式(MODE 0)、帧内模式(MODE 8),使运动预测多达9种模式,改善了比特率和PSNR(峰值信噪比)。
(四)帧内编码
在 H.264编码标准采用的新技术中,帧内预测编码是取得高编码效率的关键技术之一。H.264利用空间域的相关性进行帧内预测,采用了新的帧内预测算法,与H.263+高级帧内编码模式中DCT域的帧内预测相比,其PSNR值平均提高了4.37dB。
(五)去块效应滤波
H.264在编码环中引入了基于内容的去块滤波器,较好地消除了块效应,提高了解码图像的主观与客观质量,同时提供了更好的参考图像。
在 H.264编码标准采用的新技术中,帧内预测编码是取得高编码效率的关键在编码环和解码环中使用去块滤波系统主要有两个优点:图像中由于运动补偿、变换及量化产生的虚假边界可以被平滑,降低图像块效应,提高了主观视觉效果;滤波后的帧用于后续帧的运动补偿与预测,从而避免了虚假边界积累误差导致的图像质量进一步降低。
(六)熵编码
自适应变长编码(CAVLC) 对变长编码(VLC)的码流适应性进行了改进,能够自适应码流;自适应二进制算术编码(CABAC)对算术编码在计算速度和码流的适应性都进行了改进,使算术编码在视频压缩中得到实际应用。可以看出,新的熵编码算法都利用上下文建模,并且上下文建模提高了编码效率。最新的上下文建模方法利用了6个上下文参数,比以前只利用2个上下文参数编码效率进一步提高。可以看出熵编码的发展在于上下文建模的突破。
(七)SP/SI帧技术
除了支持传统的图像片(Slice)类型外,H.264还支持新的码流间可转换图像片,称之为SP片(Switching P Slice)和SI片(Switching I Slice)。
SP帧编码的基本原理类似于P帧,仍然是基于帧间预测的运动补偿预测编码,但SP能够在使用不同参考帧的情况下重构相同的图像帧。利用这一特性可以实现码流的随机切换功能(在有类似内容但码率不同的码流之间快速切换),即SP帧可以在流间切换(Bit-stream Switching)、拼接(Splicing)、随机接入(Random Access)、“快进/快退”和错误恢复等应用中取代I帧。与SP帧相对应,SI帧利用了帧内预测编码技术,其重建图像和对应的采用运动补偿预测的SP帧的重建图像相同,是在由于传输错误而无法采用Inter预测的方法时,对SP片最好的近似的片。SP帧的编码效率尽管略低于P帧,但却远远高于I帧,而且其提供的功能是P帧不具有的。从一定意义上说,正是由于提出了SP/SI帧,H.264的网络友好性方面才有了很大改进,对网络传输具有很好的支持,支持灵活的流媒体服务应用;具有强的抗误码性能,以适应在噪声干扰大,丢包率高的无线信道中传输。
(八)场编码模式
在H.26中,对于一幅图像,可以按照帧的模式,也可以按照场的模式进行编码。把一幅图像拆成两场图像,其中一场采用Intra编码,而另一场则利用前一场的信息进行运动补偿编码,这样就能提高压缩效率,尤其是在存在剧烈垂直方向运动的场景下。在某些情况下,图像的一些部分适合采用帧模式编码,而另一部分适合采用场模式编码,所以H.26支持在宏块级自适应的场帧编码模式转换。
(九)分层结构
H.264算法在概念上可以分层两层:视频编码层(VCL)负责高效的视频内容表示;网络提取层(NAL)负责以网络所要求的恰当的方式对数据进行打包和传送。
三、结束语
H.26是新一代的视频压缩编码标准,H.26具有很高的编码效率和良好的网络接口,是未来多媒体数据压缩编码的应用主流。H.26的推广应用对视频终端、网关、MCU等系统的要求较高,将有力地推动视频领域的软、硬件设备的不断完善。H.26必将会在视频通信领域、数字广播电视领域和视频存储播放领域等领域有更为广泛的应用。
参考文献:
[1]刘峰,视频图像编码技术及国际标准,北京:北京邮电大学出版社,2005:169-178.
[2]胡伟军,李克非,视频压缩标准的最新进展,中国有线电视.2003,24:57-61.
[3]朱学涛、向键勇、张志伟,数字压缩标准纵横谈,中国有线电视. 2004,18:17-20.
[4]张杰,视频编码新标准H.264/AVC中的重要技术,现代电子技术,2004,6(137):101-103.
作者简介:
李伟英,女,湖南娄底人,娄底职业技术学院讲师,研究方向:电子技术。
上一篇:长三角服务贸易选择分析过程研究
下一篇:外贸商战中的“潜伏”