数字多媒体广播
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.9 CELP与HVXC语音编码方法

2.9.1 码本激励线性预测(CELP)编码

CELP是性能很好的语音编码算法。它用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量。CELP已经被许多语音编码标准所采用。除了高质量的通信系统外,CELP也在数字中短波广播(DRM)中得到应用。

CELP是一种混合编码方法,它将信号波形编码与参数编码的优点结合起来。结果是有好的语音质量,在4~16kb/s低的数据率下有PCM相应的质量。大部分混合编码方法的原理是线性预测编码(LPC)。它的保留的剩余信号通过在一个表中“查阅”而被压缩。通常,40个样值(5ms信号)通过10比特(有1024项的表)来反映。CELP的主要部分,一个大约50ms的信号延时,低延时的CELP被降到2ms以下。

MPEG-4-CELP模块使用8kHz(窄带)或16kHz(宽带)取样频率,语言信号的编码数据率范围分别为3.85~12.2kb/s或10.9~23.8kb/s。可以以200b/s的步级来分级。在这些数据率下,音乐只能降低质量传输。

带宽的可分级性在采样率为8kHz和16kHz时均可实现,是通过在CELP编码上加一个带宽扩展工具来实现的。

如图2-9-1所示是MPEG-4-CELP解码器方框图。

图2-9-1 MPEG-4-CELP解码器电路方框图

语言信号的频谱包络,即共振峰的跳变,借助LPC(线性预测编码)参数描述,表示为“线性频谱频率”(LSF)并使用一个矢量量化器(VQ)编码。LP综合滤波器的激励信号可以是“多脉冲激励”(MPE)或“规则脉冲激励”(RPE)。MPE方式可以在两种取样频率下应用,而RPE方式只能在16kHz的取样频率下应用,但其编码器的复杂性明显要比MPE方式低,但为此不得不付出编码效率受到限制的代价。在这两种激励方式下,发声的信号片段的周期性借助一个自适应码本加以充分利用。需要注意的是,图2-9-1中的最后方块所示的滤波器是可选择的,而没有被标准的规范部分所规定。

与其他标准化的语言编码器相比较,MPEG-4-CRLP的突出特征是有相当高的灵活性。它对窄带和宽带语言信号(16kHz取样率)都可以编码。此外,所希望的数据率可以根据取样率、激励方式和帧长,以大约0.2kb/s到0.8kb/s的步级进行选择。这里,应用的帧长的范围是10~40ms。这样,算法系统的时延在15ms以下是可能的。

除了它的灵活性外,MPEG-4-CELP附加一种数据率可分级性,也称之为“嵌入编码”。此时,编码器产生一个所谓的基本比特流(基本层)和一个或多个扩展比特流(增强层)。根据可提供的传输容量,除了基本数据流外,解码器也可以对一个或多个扩展比特流计值,以改善解码信号的质量。如图2-9-2所示是具有可分级数据率的MPEG-4-CELP编码的一个例子。除了激励信号的改良外,使用扩展比特流也使带宽可分级成为可能。

图2-9-2 具有可分级数据率的MPEG-4-CELP

在许多语言编码标准中,编码和解码比特被准确地定义,在MPEG-4标准的规范部分中仅规定了比特流格式和解码方法。然而,编码只在标准的信息部分借助一种编码器例子加以说明。据此有可能在标准通过以后,编码效率通过编码器的优化而进一步改善。此外,这样做对于当时的应用来说,可以选择编码器复杂性和编码效率之间的最佳关系。

2.9.2 谐波矢量激励编码(HVXC)

为了对典型的2kb/s这种很低数据率的语言信号进行编码,在MPEG-4中应用了一种参数语言编码器,称为谐波矢量激励编码(Harmonic Vector eXcitation Coding,HVXC)。

HVXC允许对语言信号在2kb/s和4Kbs之间进行可分级性编码。HVXC提供了在延迟模式上的可分级性。其编码器和解码器可以独立地选择低或正常的延迟模式。如图2-9-3所示是MPEG-4-HVXC解码器方块电路图。

图2-9-3 MPEG-4-HVXC解码器方块电路图

HVXC的解码过程分四步进行:参数的反量化;对声音帧用正弦合成产生激励信号和加上噪声分量;对非声音帧通过查找码书产生激励信号;LPC(线型预测编码)合成。对合成语言质量的增强可以使用频谱后置滤波。

当语言信号的频谱包络与在MPEG-4-CELP编码时相似时,激励信号的编码可以使用两种不同的技术。对于无声信号片段来说,激励信号与在CELP时相似,通过一个码本索引和通过幅度信息描述。相反,在发声信号片段应用了谐波综合,它是将基音和谐音的正弦振荡按照传输的基频进行综合。在此应用了一种有效的算法,它使用了快速傅里叶变换(FFT),同时确保了在相连续的帧中相连续的相位变化和频率变化。

HVXC的帧长为20ms,这样,算法系统延时可以达到33.5ms。如同在MPEG-4-CELPP已经指出的,图2-9-3中最后的滤波器是可供选择的,并不是标准的规范部分所规定的。HVXC也提供数据率的可分级性,除了2kb/s的基本比特流外,可以传输2kb/s的扩展比特流。一种4kb/s的固定数据率也是可能的。

基于在HVXC中应用的参数表示,在解码器按照简单的方式独立地变化语言信号的音高和重放速度是可能的。这种附加的功能不需要特殊的编码,而HVXC解码器复杂性的提高是微不足道的。在MPEG-4 验证试验时表明,HVXC在2kb/s和4kb/s时的质量,显著好于CELP在4.8kb/s时的质量。

HVXC编码方法数字中短波广播中播送语言节目时使用,每套节目2kb/s就足够了,一部DRM发射机,可同时传输四套这样的节目。