数字多媒体广播
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.10 高效音频编码与频带恢复(SBR)技术

2.10.1 AAC-Plus V1 与AAC-Plus V2

最有效的一种音频压缩方法是AAC,已经于1997年在MPEG2中标准化。AAC是一种变换编码,在这种编码方法中有意识放弃了与过去的一些编码方法例如Layer-2和MP3的向下兼容性,因此可以避免以此为条件的限制。

AAC在数据率远低于96kb/s的情况下可以达到很好的立体声音频质量,然而这对许多应用来说总还是显得大多。每个比特的传输与存储都要付出代价。

在数字广播中,音频比特率的减半意味着可提供的节目套数加倍。

如果将比特率降低到一个临界值以下,就会以不同的形式损伤音频质量:音频带宽必须限制,这会使信号听起来发闷;或者立体声声基受损,使信号听起来几乎是单声道的而没有空间的感觉。在最坏的情况下甚至可听出有干扰的编码不自然产物。

过去,人们已经清楚认识了传统的变换编码的极限。为了改善它的能力必须开发新的方法与改进现有的方法。先进音频编码方法AAC与频带恢复(SBR)技术、参数立体声相结合,产生出新的高效编码方法。

MPEG-4 AAC-Plus音频编码系列是由三个MPEG技术结合起来的:AAC用作核心编码器,频带恢复(SBR)与参数立体声(PS)两种附加技术使极大提高编码效率成为可能。SBR是Coding Technologies发明的,利用它可以恢复音频信号的上部范围的频谱,直到15kHz。

SBR与核心编码AAC相结合不仅可以在MPEG-2,也可以在MPEG-4,而且在高效的AAC型,被标准化及命名为AAC-Plus V1。

SBR也可以与基本的语音编码方法(如码本激励线性预测-CELP、谐波矢量激励编码-HVXC)相结合,用来展宽语言频带,提高语言节目的清晰度与可懂度。

参数立体声技术是在很低的比特率的情况下,使一个音频信号的立体声信息的形成成为可能,同时在解码器中重建立体声声像。这项技术也是MPEG-4标准的组成部分。

AAC、SBR与SP这三种技术的结合称为AAC-Plus V2,是目前现有音频编码方法中最有效的音频编码方法。AAC-Plus两个版本的关系如图2-10-1所示。

图2-10-1 AAC-Plus的两个版本

2.10.2 SBR基本原理与压缩效率

SBR技术在编码器端通过音频信号产生出重要的信息。在解码器端,这个信息用作以尽可能高的准确度实现音频信号上部频谱部分的重建。

在编码器输入端提供没有编码的音频信号,AAC-Plus编码器用一个正交镜像滤波器(QMF)组分析完整的信号频谱。这种分析产生出一个频谱包络特性的描述。这个描述作为AAC-Plus解码器的SBR控制信息,补入到比特流中。最终传给解码器的数据流中包括音频信号下部频谱部分编码的AAC音频数据与SBR控制信息。

控制信息的数据率取决于音频信号,一般来说每个声道大约1~3kb/s,这要比对上部频谱部分进行正常的编码产生的比特率低的多。因此,AAC-Plus V1 在56kb/s的数据率下所能达到的音频质量,可与单独使用AAC编码器数据率为96kb/s时的质量相比美。如图2-10-2所示是SBR原理示意图。

图2-10-2 SBR原理示意图

AAC-Plus在所谓的双码率工作下提供最大可能的效率:AAC-Plus编码器的AAC部分以原始音频信号的半取样频率工作,而SBR以原始的取样频率处理音频信号。由此可产生的结果是,一方面AAC仅仅是对音频信号的下部频谱部分编码,另一方面通过音频信号在由时域向频域变换时的高的频率分辨率,提高了编码效率。

此外,这个优点对算法的复杂性产生影响。少的音频样值意味着低的运算能力和与此相联系的电流消耗。这主要对于在移动电话或其他便携终端设备中的处理器,如音乐播放器有重要意义。

SBR的作用在编码端像一个预处理器,而在解码端像一个后处理器,如图2-10-3所示。如图2-10-4所示是AAC与SBR相结合,即AAC-Plus的编码器,图2-10-5是相应的解码器原理方框图。

图2-10-3 SBR预处理与后处理原理方框图

图2-10-4 AAC-Plus的编码器原理方框图

图2-10-5 AAC-Plus的解码器原理方框图

2.10.3 参数立体声原理与效果

参数立体声技术按照相似的原理工作。在参数立体声工作方式中,立体声信息有效获得是基于在编码时不再需要两个明显分离的音频声道,而是可以从两个声道产生一个单声道信号。这个单声道信号在相同的声音质量下,仅需要原始立体声信号大约一半的比特率。图2-10-6示出参数立体声的工作原理。

图2-10-6 参数立体声工作原理

编码器的输入信号是原始立体声信号,首先对两个声道进行分析。分析的结果是立体声信号的参数信息,例如全景信息、空间声或相位差。这些参数信息作为控制信息,如同SBR一样,补入到比特流中。在它的解码器的基础上重建立体声声像,与在一个立体声信号两个声道编码时相比,需要的数据率明显减小。参数信息典型的数据率可以处于2~2.5kb/s。

AAC-Plus-V2编码器包含了三种技术(AAC、SBR和PS),在大约32kb/s时达到的音频质量,与单独使用AAC时96kb/s比特率的质量相当。

2.10.4 应用领域

作为最有效的音频编码方法MPEG-4 AAC-Plus已经在许多领域得到应用。AAC-Plus-V2不久前已经是第三代移动通信的3GPP规范的组成部分。AAC-Plus-V1 已经有成效地用于在移动电话上的音乐下载,如在日本、韩国、德国和英国应用。在数字广播中编解码器是用来保证声音质量的,例如应用在美国的XM卫星广播和在数字长中短波广播(DRM)中。

AAC-Plus也是DVB-H标准的组成部分,是基于IP为未来的移动DVB手机传送广播和电视节目。

此外,在互联网中也有越来越大的意义:越来越多的电台使用AAC-Plus,使用明显低的比特率就可以获得相同的音频质量。

MPEG-4 AAC-Plus以它的可通用性,为实现广播、通信、互联网和娱乐电子之间的融合奠定基础。