AVS-M:从标准到应用
AVS-M: From Standards to Applications
-
摘要: AVS-M是中国音视频编码标准工作组制定的《信息技术 先进音视频编码》标准的第七部分——移动视频。为了便于在各种实际应用系统中使用AVS-M,还制定了相应的文件格式(第九部分第一子部分)和AVS-M 实时传输协议(Real-time Transport Protocol, RTP)打包格式(第八部分第一子部分)。本文介绍了AVS-M的各种高层编码工具、AVS-M文件格式和RTP打包格式,并给出了AVS-M的编码效率和容错性能的模拟实验数据。文中包含了大量与国际视频标准H.264/AVC及其文件格式和RTP打包格式的比较。多媒体应用包括本地播放、流媒体、对话式应用以及广播和多播业务,其中涉及的技术包括媒体编码、存储和传输,涉及的媒体类型包括语音、音频、(静态)图像、视频、图形和时序文本。关于视频编码国际上存在很多标准,H.264/AVC是其中最新的。无论H.264/AVC还是AVS-M,在各种实际的标准系统(如3GPP的各种多媒体业务)中应用都离不开相应的文件格式和RTP打包格式。视频编码标准中的工具可以分为两类:第一类称为底层工具或核心压缩工具,包括变换、各种预测、运动补偿、量化、熵编码和环路滤波;第二类称为高层工具,包括比特流格式、档次、级别、缓冲模型的定义和限制,对随机访问、可伸缩性、时序等信息的编码,以及容错工具。高层工具、文件格式和RTP 打包格式一起形成了一个编解码器的系统接口。本文详细介绍了以下16个AVS-M高层编码工具:1)网络抽象层(Network Adaptation Layer, NAL)单元结构2)参数集3)即时解码刷新(Instantaneous Decoding Refresh, IDR)图像4)逐渐解码刷新(Gradual Decoding Refresh, GDR)或逐渐随机访问 5)灵活的条带编码方法6)参考图像计数7)非参考P图像8)受限的帧内预测9)在条带边缘可禁止环路滤波10)字节流格式11)图像顺序和时间12)随机访问点指示13)图像头14)可伸缩信息15)参考图像管理16)虚拟参考解码器(Hypothetical Reference Decoder, HRD)其中前10个工具与H.264/AVC类似,后6个与H.264/AVC不同。在对这些高层编码工具的介绍中,部分或全部给出了各个工具的设计思想和方法、作用、发展历史,从而阐明为什么在AVS-M的标准制定过程选择了该设计。每个工具涉及的AVS提案文献都列在了参考文献中。介绍完前面16个高层工具后,分三类简单介绍了容错工具:编解码层标准工具、编解码层非标准工具和传输层工具。早期的第一类容错工具有11种。H.264/AVC中新增了7种,但不支持前11种中的5种。AVS-M支持这18种容错工具中的8种。第二类包含4种,第三类包含6种。第二类和第三类容错工具可以与任何编码标准一起使用。对文件格式的介绍包括以下内容:什么是文件格式,目前国际上都有哪些文件格式标准,如何定义AVS-M文件格式,以及AVS-M文件格式与H.264/AVC文件格式的比较。对RTP打包格式的介绍包括以下内容:什么是RTP和RTP打包格式,目前国际上都有哪些视频RTP打包格式标准,AVS-M RTP打包格式及其与H.264/AVC RTP打包格式的比较。最后,分别给出了AVS-M的编码效率性能(与H.264/AVC对比)和容错性能结果。如果都使用1个参考帧,AVS-M的PSNR对比特率曲线比H.264/AVC平均约低0.3到0.5 dB。在容错性能结果中,对三种不同的AVS-M容错编码策略进行了对比。Abstract: AVS stands for the Audio Video coding Standard Workgroup of China, whodevelops audio/video coding standards as well as system and digitalright management standards. AVS-M is the AVS video coding standardtargeting for mobile multimedia applications. Besides the codingspecification, AVS also developed the file format and Real-timeTransport Protocol (RTP) payload format specifications to enable theapplication of AVS-M video in various services. This paper reviews thehigh-level coding tools and features of the AVS-M coding standard aswell as the file format and payload format standards. In particular,sixteen AVS-M high-level coding tools and features, which cover most ofthe high-level topics during AVS-M standardization, are discussed insome detail. After that, the error resilience tools are briefly reviewedbefore the file format and RTP payload format discussions. The codingefficiency and error resiliency performances of AVS-M are providedfinally. H.264/AVC has been extensively used as a comparison in many ofthe discussions and the simulation results.