多媒体通信技术基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 多媒体的概念与含义

1984年美国RCA公司在普林斯顿的DavidSarnoff实验室,组织了包括计算机、广播电视和信号处理三个方面的40余名专家,综合了前人已经取得的科研成果,经过4年的研究,将彩色电视技术与计算机技术融合在一起,于1987年在国际第二届CD-ROM年会上展出了世界上第一台多媒体计算机。这项技术后来定名为DVI(Digital Video Interactive)。这便是多媒体(Multimedia,由Multiple Media两个词组合而成)技术的雏形。

多媒体技术一出现,在世界范围内立即引起巨大的反响,因为它清楚地展现出信息处理与传输(即通信)技术的革命性的发展方向。国际上在同一年内立即成立了交互声像工业协会,当该组织1991年更名为交互多媒体协会IMA(Interactive Multimedia Association)时,已经有15个国家的200多个公司加入了。

多媒体计算机与普通计算机有什么不同,它的出现何以如此引人瞩目?早期的计算机只能进行数学运算,后来又具有了文字处理能力,经过若干年的发展之后又增加了图形与动画的功能。而多媒体计算机则是增加了对包括伴音在内的活动图像(即动作连续的电视图像)的处理、存储和显示的能力。这在技术上是一个质变性的飞跃。

为了比较深入地理解这一飞跃,首先让我们来作一个简单的计算。我国的电视制式在一帧图像内有625行,去掉在扫描逆程(不显示图像的部分)中占去的约50行,出现在一幅画面上有效的扫描行数是576行左右。电视画面的宽与高尺寸之比是4∶3,要保证图像在水平方向上单位距离内可分辨的像素数与垂直方向上相等,那么在图像水平方向上的像素数应为576×4/3=768。将这样一幅单色的电视图像数字化,其取样点数应不少于768×576。

根据三基色原理,一幅彩色图像是由红、绿、蓝3幅单色图像组成的,每秒钟要传送25幅彩色图像才能保证电视图像的连续性。如果每一个像素采用8比特量化,1秒钟时间内需要传送的数据量则为

768×576×3×8×25≈265(Mb)=33(MB)

1部2小时电视电影的总数据量为

33×60×60×2=238(GB)

在20世纪80年代,计算机硬盘的容量是40MB,总线传输能力在3Mb/s左右,由此可见,普通微机不具有存储未经压缩的活动图像信号的能力,也无法通过总线将其送到显示器上进行连续显示。

多媒体计算机的出现,标志着人们已经在电视图像信号(或称视频信号)的实时压缩(使得能在实时的条件下存储、传送活动图像)、实时解压缩(以显示活动图像)等技术上取得了突破性的进展,具有划时代的意义。

多媒体计算机区别于普通计算机的第二个技术特征,是解决了同时存储、读取和显示两个在时间上紧密相关的数字信号(即伴音信号和图像信号)时,如何在时间上保持同步的问题。同步的必要性很容易理解,屏幕上说话的人嘴形与声音配不上就是不同步。在电视系统中,图像信号与伴音信号是组合成一个信号传送的,二者之间总是保持着同步。在多媒体计算机中,数字形式的伴音与视频图像信号是可以作为两个信号分别存储的,要保证同步就需要考虑二者在读取、处理和显示过程中的正确时间关系。在单纯处理数字、文字和图形的普通计算机中并不需要维护这种严格的时间约束关系。当多媒体扩展到远程应用时,服务器与客户端(或两个对等的终端)通过网络连接,由于网络延时和延时抖动的存在,保证声/像信号在传输过程中的同步也是有别于传统数据传输的新问题。

根据以上分析我们看到,多媒体计算机所增加的处理包括伴音在内的电视图像的功能,不仅使计算机在功能数量上多了一项,而是一个质变的过程。声音和电视图像在传统上是属于通信技术和电视技术的研究对象的,多媒体计算机已经将计算机延伸到电视技术和通信技术领域了。

前面的简单计算表明,包括伴音在内的电视信号,是各种媒体中数据量最大的一种。既然技术已经发展到了能用计算机处理这种数据量最大的业务,其他数据量小的,如信息查询、电子邮件、电话、传真、可视电话等项业务,都将可以融合到一起,在一台多媒体终端上实现。这是多媒体中“多”字的另一层含意。也有人用集成一词来描述多媒体将多种媒体、多项业务集合在一起的这一特点。

有的学者从数据本身的特点来理解多媒体技术与其他技术的区别。多媒体数据是由内容上相互关联的文本、图形、图像、声音、动画、活动图像等媒体的数据所形成的复合数据。这一数据合成的过程是在计算机控制下完成的N.D.Georganas,“Multimedia Communication,”IEEEJ.SAC,Vol.8,Vo.4,1990。在这里首先说明了多媒体所涉及的信号是数字化的,而不是模拟的;其次应当注意“内容上相互关联”和“合成”这两个要点,内容上毫不相干的文字、图形、声音、活动图像等数据的集合并不是多媒体数据。通常对时间敏感的声音、活动图像的数据称为实时数据,其他类型的数据则是非实时数据。如果说某个数据是多媒体数据,则意味着该复合数据中至少包含有一种实时数据和一种非实时数据D.Minoli and R.Keinath,Distributed Multimedia through Broadb and Communications Services,Boston;Artech House,1994

能够通过计算机对视频数据进行操作,形成了多媒体技术的另一个基本特征,即交互性(Inter-active)。人—机交互是计算机固有的技术特征。通过键盘或鼠标打开一个文件,就会显示你所要的内容,经过修改、补充之后,再写入到给定的文件名下,或者通过一条打印指令则可在打印机上将文章打印出来。这种人与计算机之间通过指令“对话”式的操作就是交互操作,这已经是人们几十年来所熟知的常识。而多媒体强调的是以交互的方式对活动图像(包括伴音)进行操作,例如,对其进行“快进”、“暂停”等录像机式的操作。

值得注意,人—机交互与传统的通信领域中的双向通信(Two Ways)是不同的两个概念。双向通信意味着通信可以在两个方向上进行,如图1-1(a)所示,北京的电视节目经过线路1传到上海,上海的电视节目经过线路2传到北京,二者使用了对称的信道,但相互独立。所谓对称是指两条线路的信道带宽或数据率等传输参数与指标是相同的。而图(b)表示由北京的通信终端自动地从位于上海的数据库内调取电视节目时的交互工作。这项业务使用了双向的非对称信道,上行线(由用户向信息中心)传送指令,是低速率的;下行线传送读取的电视信号,是高速率的。需要强调的是,这项业务中的上、下行信道中传输的信息是相互关联的,体现了人—机交互操作。

图1-1 交互工作与双向通信

除了人—机交互之外,一些多媒体系统支持人与人之间的交互,例如,可视电话、多媒体会议和协同工作就是典型的例子。传统的电话也是实现人与人交互的通信系统;支持人与人之间交互的多媒体系统与电话的最大区别在于,它使用了更多的媒体(除相互听得见外还相互看得见)和允许同时进行更多的业务(如除通话外还可以共同观看、修改文件等)。

通过上面的讨论,我们可以对多媒体的特征作一个简要的总结,即它具有集成性、同步性交互性。其中集成性包括多种媒体的集成和多种业务的集成;交互性包括人与人的交互和人—机交互。