
第2章 信源编码
2.1 模拟信号的数字化
2.1.1 模拟信号转换为数字信号
把模拟的电信号变为数字的电信号,称为模拟信号数字化。通常采用PCM(脉冲编码调制)技术来实现。PCM是将模拟信号的抽样量化值变换成代码,这个过程通常也称A/D转换(或ADC)。整个A/D转换过程包括:取样、量化和编码。
1.取样与取样定理
取样又叫抽样,是对模拟电信号按一定的时间间隔进行周期性扫描,把时间连续和幅度连续的电信号,变为时间离散和幅度连续的信号。取样也称时间量化。
对模拟信号取样的时间间隔TS称为取样周期,而TS的倒数即为取样频率fS,fS=1/TS。取样频率的含义是每秒钟对模拟信号取样的次数,单位是赫兹(H z)。fS的选取要由取样定理限定。
取样定理可以表述为:一个频带限制在0~fH之间的低通模拟信号,必须以fS≥2fH的频率对其取样,才能不失真地从取样值恢复出原始信号。2fH也称为奈奎斯特频率。
为什么要有这样的限定条件呢?这是由于模拟信号被取样后,频谱会发生变化。除含有原始信号的频谱成分外,还出现以fS、2fS、3fS…为中心频率的双边带信号,如图2-1-1所示。

图2-1-1 模拟信号与取样后的频谱图
下面讨论当fS取不同值时带来的后果:
① 当fS<2fH(fH为模拟信号的最高频率)时,抽样后的信号频谱发生重叠,会产生折叠噪声。
② 当fS=2fH时,虽不发生频谱重叠,但对接收滤波器要求严格。
③ 当fS>2fH时,既不发生频谱重叠,又留有一定的防卫带,便于接收端滤波器制作。
通过上面的讨论可知,通常应取fS≥2fH。
但是,fS也不能取得太高,否则,随着fS的提高,信号总的数据率将成正比例地提高,这样就会增大对数据处理、传输带宽、存储器容量的要求。
此外还应指出的是,为确保不产生频谱重叠,在进行A/D转换前,模拟信号要先经过低通滤波器处理,滤掉任何高于fH的频率分量。
在数字音频技术中,视不同的应用,通常使用32kHz(用于数字卫星广播)、44.1kHz(用于CD)和48kHz(用于演播室)。在一些特殊应用中,也可以使用上述频率的1/2或1/4作为取样频率。
以上我们讨论的fS是针对低通信号而言的。如果信号是频率处于fL~fH之间的带通信号,那么取样频率fS就应满足以下关系

式中n是小于fL/(fH-fL)的最大整数(包括零)。
2.幅度量化与量化噪声
模拟信号经取样后,得到时间离散但幅度仍然连续的信号,好像等间隔的脉冲受到幅度调制一样,称为脉冲调幅(PAM)信号。
人的感觉器官对幅度的分辨能力是有限的,仅能感觉到有限的信号强度差别。所谓量化,就是利用预先规定的有限个电平(或称幅度等级、量化级)来表示实际取样值的过程,即将PAM信号的幅度离散化的过程。
模拟信号数字化的全过程如图2-1-2所示。
原始的模拟信号(为简单起见,这里给出的是一个正弦信号,图2-1-2(a))经时间量化(取样后),得到PAM信号(图2-1-2(b)),经幅度量化后得到图2-1-2(c)所示的信号,这个信号是离散的、而且只是数量有限的几种幅度。对比图2-1-2(b)和图2-1-2(c)可以看出,凡是处于某一幅度范围(区间)的取样值,其幅度大小都量化为该范围的中值。所举的该例中,只给出11种不同的幅度范围。
不难看出,量化前后的样值是有差别的。量化级数越多,量化后的信号与原始号就越接近,但编码以后的总数据率也高。音频信号的量化级数要根据信号的动态范围(即可能出现的最强信号与刚刚能感受到的最弱信号之间的电平差,用dB表示)和要求的质量来确定。
连续幅度的时间函数与量化后离散幅度的时间函数之间的差别称为量化误差(或量化失真)。量化误差带来的影响相当于干扰或噪声,故量化误差又称为量化噪声。
需要指出的是,量化误差是随机的,并主要取决于量化级数M。设信号功率为S,量化噪声功率为NQ,则信噪比与量化级数的关系为:

用dB表示的信噪比为:

当M≫1时,信噪比可表示为:

表2-1-1所示是一些量化级数对应的可能达到的信噪比。

表2-11-1 不同应用、分解率和图像速率、数据率之间的关系(fps为每秒帧数)
表2-1-1 量化级数对应的信噪比

如果取样后每个样值用n比特表示,那么信噪比也可以用下式表示:

当n较大时,可以近似认为取样的编码位数每增加一位,信噪比就提高6dB,称为“每位6dB”,在工程应用中可用来进行粗略估算。
图2-1-3所示是取样、量化和相应的量化噪声。图中的实际函数是根据量化后的样值恢复出来的,它与原函数的差即为量化噪声。
3.均匀量化与非均匀量化
(1)均匀量化
信号的幅度取值按等距离分割的量化称为均匀量化。在均匀量化时,出现在每一量化区间的不同电平均被量化为该区间的中点电平。图2-1-2和图2-1-3中所举的例子都是均匀量化。
均匀量化的缺点是:当信号较小时信噪比也低(信号小,噪声不变)。
(2)非均匀量化
为了克服均匀量化的缺点,可以将信号幅度的取值按不等间隔进行量化,称为非均匀量化。例如,为了保持不同大小信号的信噪比相同,随着信号幅度由小变大,量化间隔也逐级增大。图2-1-4所示是均匀量化与非均匀量化的对比。
4.编码
A/D转换的最后一步是编码。所谓编码,就是把经过量化的离散样值变换成相应的数字信号码组,即每个样值都用相应的一组二进制序列表示。
码组(或称码字)的位数(比特数)n与量化数M的关系为

例如,当n=3时,3位二进制的数字码就有8种不同的组合:000、001、010、011、100、101、110、111,共代表8种不同的量化状态(M=8)。
二进制序列的比特数与可区分的状态数(或量化级数)有确定的关系,如表2-1-2所示。
表2-1-2 比特序列与可区分的状态(量化级数)

(续表)

现在,让我们再回过头看一下图2-1-2中(c)、(d)和(e)图,看看量化的样值是如何编码的。由于图2-1-2量化分为11个区间(从A~L),要用二进制序列表示落入每个区间的样值,至少需要4比特。例如,落入区间A的样值用1000表示,落入区间B的用0100表示,……。

图2-1-2 模拟信号的数字化
编码可以按照不同的方法进行。PCM系统常用的码型有自然二进制码、反射二进制码(格雷码)和折叠二进制码。如表2-1-3所示是以量化级数M=16为例,不同码型的编码表。
由表2-1-3可以看出,所谓自然二进制码,就是通常的十进制正整数的二进制形式。在反射二进制码中,任何相邻电平的码组,只有一个码位发生变化。相邻码组对应位不相同的数量称为码距。在反射二进制码中,码距总是等于1。在折叠二进制码中,除去最高位(表示符号——取样值的正负极性)外,折叠码的上半部和下半部呈镜像(倒影)关系。当信号的极性为正时,最高位用1,信号为负时,最高位用0表示。

图2-1-3 量化与量化噪声
按照取样值出现的时间顺序,传送经过编码的数据序列,形成所谓的PCM数据流,这就是我们所说的数字信号(图2-1-2)。我们常说PCM(脉冲编码调制)信号,实际上,从信号处理的过程看,是对调制脉冲进行编码。

图2-1-4 均匀量化与非均匀量化
现以4位折叠二进制码,并以如图2-1-5所示的逐次比较编码器为例来说明如何实现编码。

图2-1-5 逐次比较编码器原理方框图
控制逻辑电路受位定时脉冲控制,在一个编码周期Ts内,在极性判断定时脉冲后面产生三个位定时脉冲,依次控制开关S1、S2和S3的换向(接地或与基准电压接通)。由基准电压与电阻网络产生供比较使用的标准电平,并单独作用到放大器输入端时为UE(计算时将P AM信号视为开路),而P AM信号为恒流源,并单独作用到放大器输入端时电压为UI(计算时将基准电压视为短路),两个电压叠加后在放大器输入端的电压为U=UE+UI。根据放大器输出电压的正负,触发器输出“0”或“1”。
下面我们看一下数字化信号的数据率问题。数据率又叫比特率,是单位时间内传送的二进制序列的位(比特)数。数据率与取样频率和每取样值量化后编码的比特数成正比。
若声音信号取样频率fS=48k H z,为确保质量,每取样值按16比特量化(即分为65536个量化级),则每声道的数据率为48×103×16=768(kb/s),对于双声道立体声节目而言,总数据率为2×768kb/s。
表2-1-3 不同码型的编码表(以 16级量化为例)

5.数字信号的形式
如图2-1-6所示是一些数字信号形式。由图可以看出,对同一个二进制序列(如图中示出的01000011000001010),可以用不同的电脉冲来表示。图2-1-6(a)是单极性不归零(NRZ)码,在这种信号形式中,“1”对应脉冲的正电位,“0”对应脉冲的零电位。图2-1-6(b)是双极性不归零(NRZ)码,在这种信号形式中,“1”和“0”分别对应正电位和负电位。图2-1-6(c)是单极性归零(RZ)码,在这种信号形式中,在传送“1”时,发送一个脉冲宽度小于码元持续期的归零脉冲;传送“0”时不发送脉冲。图2-1-6(d)所示是双极性归零(RZ)码,在这种信号形式中,“1”和“0”分别用小于码元宽度的正、负电脉冲表示,相邻电脉冲间必有零电位区域存在。图2-1-6(e)所示是差分码,也叫相对码,这种信号形式是利用前后码元电平的相对极性变化来传送信息。图2-1-6(f)所示是交替极性码(AMI),图2-1-6(g)是三阶高密度双极性码(HDB3)。此外,还经常使用被称之为双相码(曼彻斯特码)的信号形式,其特点是每个码元用两个连续极性相反的电脉冲来表示。对应于“1”时,发送一个周期的正、负脉冲;对应于“0”时,发送一个周期的负、正脉冲,读者可以自己画出波形。双相码的突出优点是,不论“1”和“0”出现的概率如何,信号都不会有直流分量,且有利于提取位同步信号。

图2-1-6 数字信号的一些形式
以上讨论的都是二进制数字信号的形式。在实际应用中,常用到四进制、八进制和十六进制的数字信号。在本书的概论中已经提到四进制数字信号。八进制数字信号是8种电平的电脉冲,每种电平分别代表000,001,…,011和111的数字序列。
2.1.2 数字信号还原为模拟信号
数字信号必须还原为模拟的电信号,才能通过扬声器放出声音,或通过显示器显示出图像,供受众聆听或观看。将数字信号还原为模拟信号称为D/A转换。
前面谈到编码的数字信号(PCM信号)经解码后,变成电平为不同极性和不同幅度的抽样值,再经低通滤波器滤波就可以恢复出模拟信号。
以4位折叠二进制码1110为例,第一位“1”表示正电平,后面3位码“110”加到逐次比较型解码器[图2-1-7(a)],解码器与编码器的位定时脉冲是同步的。位脉冲与输入代码经过逻辑控制电路,控制开关S1、S2和S3,当输入代码“110”全部进入后,控制开关S1、S2转接到基准电压,S3仍接地,因此就可以得到如图2-1-7(b)所示的等效电路,由此可计算出此时的输出电压。

图2-1-7 解码原理图
2.1.3 广播电视信号数字化的代价和解决办法
我们前面曾以声音信号为例,说明模拟信号数字化以后会有较高的数据率(48kHz取样频率,16比特量化,每路PCM信号的数据率为768kb/s)。现在,我们再看一下PAL电视信号变为数字信号后的比特率。
计算PAL电视信号数字化后的数据率可以从以下条件出发:
图像格式4∶3(宽∶高);每帧625行;每秒25 帧;正方形像素;亮度信号的数值范围分级为256;色度信号的数值范围分级为256。当亮度和色度都考虑256种不同的状态时,每个像素需要8+8=16比特的序列。
由于是方形像素,根据图像格式(4∶3),可算出每行有625×4/3=833.3个像素,每帧有833.3×625=520812.5个像素。由于每秒传送25 帧,因此可以算出数字信号的数据率约为208.3Mb/s。
如果传送高清晰度电视(HDTV),与PAL相比,图像格式变为16∶9,每帧为1250行,其他条件不变,可以算出数据率约为1.11Gb/s。
由以上的例子可以看出,广播电视信号数字化以后,有很高的数据率,存储时需要大容量的存储器,传输时需要占用很大的信道容量,需要很宽的传输带宽,甚至达到现实不能接受的程度。这就是模拟信号数字化需要付出的代价。
如何解决这个问题?随着近年来数字压缩技术的进步,完善地解决了音频和视频数字信号数据量大的问题,为广播电视实现全面数字化清除了障碍。数据率压缩是信源编码的任务,因此,模拟信号数字化以后,接着的处理就是进行信源编码,以便力求以最少的数据率传送更多的信息,解决信息传输的有效性问题。