电子商务数据库技术(第3版)
上QQ阅读APP看书,第一时间看更新

2.5 电子商务数据库技术新发展

进入20世纪90年代后,随着计算机技术应用的发展,数据库技术也快速发展。数据库支持的数据模型越来越复杂,不仅包含越来越多的语义,而且还出现许多新的发展方向。例如,各类支持特殊领域应用要求的数据模型的数据库技术,包括空间数据库技术、时间数据库技术、演绎数据库技术和模糊数据库技术等,都得到了迅速发展。此外,对数据分散及不同数据类型数据库互联的需求推动了分布式数据库的发展,对CAD、CAM、CIMS、CAI和办公自动化的需求推动了面向对象数据库的发展,多媒体技术推动了多媒体数据库(Multimedia Database, MDB)的发展,联机分析的需求则引起了数据仓库技术的发展。本节将简单介绍数据库技术的这些新进展。

1.分布式数据库技术

分布式数据库系统是地理上或物理上分散而逻辑上集中的数据库系统。管理这样的数据库系统的软件称为分布式数据库管理系统。分布式数据库管理系统通常由计算机网络(局域网或广域网)连接起来,被连接的逻辑单位,包括硬件(如计算机、外部设备)和软件(如操作系统、数据库管理系统等),称为节点或站点。所谓地理上分散,是指各个站点分布在不同的地方。所谓逻辑上集中,是指网络联结的各站点共同组成单一的数据库。

分布式数据库始于20世纪70年代,繁荣于80年代,在20世纪90年代由于其在分布性和开放性方面的优势获得了用户的青睐。这一切并不是偶然的,一方面是受到应用需求的刺激,另一方面是硬件环境的发展。在应用方面,如银行的通存通兑及划汇、全球性民航订票系统、水陆空联运系统、连锁店的管理系统、军事上的情报系统、旅游订票系统等,这些应用都涉及地理上分散的统一组织的管理,集中式的数据库系统已经无法提供合适的支持。在硬件方面,计算机及通信网络更是突飞猛进的发展。功能日益强大的计算机、微型机和工作站,以及日益广泛装备的公用数据网和局域网,为数据库管理系统的研制提供了一个成熟的、实用的环境。在这两方面的推动下,数据库管理系统得到了迅猛发展。现在,分布式数据库的应用领域已不再局限于联机事务处理,分布式数据库技术已经广泛应用于分布式计算、互联网应用以及数据仓库等。

2.面向对象的数据库技术

面向对象(Object-Oriented, OO)的数据库系统是数据库技术与面向对象技术相结合的产物,它是数据库的应用从传统的商业或管理中的事务处理扩展到CAD(Computer Aided Design)、CAM(Computer Aided Manufacturing)及CIMS(Computer Intergrated Manufacturing System)、CAI(Computer Aided Instruction)和办公自动化等新领域而产生和发展起来的。在这些领域中,传统的关系数据库管理系统支持的数据模型的关系太简单,不能很好地描述这些应用领域的数据结构,因此,面向对象的数据库就应运而生了。OO数据模型与传统的数据模型相比具有以下优势。

(1)具有表示和构造复杂对象的能力。

(2)通过封装和消息隐藏技术提供了程序的模块化机制。

(3)继承和类层次技术不仅能表示is-a联系,还提供了软件重用的机制。

(4)通过滞后联编等概念提供系统扩充能力。

(5)提供与宿主语言的无缝(Seamless)连接。

OO数据模型支持的基本概念包括对象和对象标识、封装、类型(或类)、继承、重载、滞后联编、多态性。OO数据模型支持的基本数据类型较多,从简单的字符、数字、发展到图像、声音、视频和动画等多媒体数据。OO数据模型允许用户定义数据类型,它包括下列类(或对象)的结构机制:聚集(元件)、集合、列表、数据等。任一结构机制都可以作用到任一种对象上,使用户能定义十分复杂的数据类型(或类),并且能够描述关系很难、甚至之前不能描述的新应用领域中的数据。

面向对象的数据库管理系统也具有传统的数据库管理系统所具有的功能,如并发控制、用户及授权管理、从故障中恢复等。但仅仅这样是不够的。传统的事务一般在零点几秒到几秒之内完成一事务对数据的处理,事务具备原子性、持久性以及可串行性等特殊性质;而新的应用技术(如CAD、CAI等)的数据处理可以持续几个小时、几天,甚至更长,它们使得传统的事务处理技术不再适用,而需要新的事务模型(如长事务、嵌套事务等)。所以,面向对象的数据库管理系统还应当支持长事务处理和嵌套事务,以便当故障发生时不至于回滚整个事务。

面向对象的数据库系统所面临的问题是,建立一个健全的、商用的、面向对象的数据库系统开销很大,所以其必须能在现有的关系数据库中直接使用,而不是花很大的代价去转换,尽管目前已有大量的研究开发工作,有一些可支持的面向对象数据库系统,但面向对象数据库的成熟仍存在许多亟待解决的问题。当前的许多研究都是建立在数据库已有的成果和技术上的。针对不同的应用,对关系数据库管理系统进行不同层次上的扩充。

3.多媒体数据库技术

当今社会存在着各种形态的信息,计算机要以图形、印刷文字、手写文字、声音、图像、动画和身体语言等多种媒体作为处理对象。能够管理数值、文件、表格、图形、图像、声音等多媒体的数据库称为多媒体数据库。近年来,大容量光盘、高速CPU、高速信号处理器以及宽带网络等硬件技术的发展为多媒体技术的应用奠定了基础。对多媒体数据库管理的应用主要有以下三种方式。

(1)基于关系模型,加以扩充,使之支持多媒体数据库类型。

(2)基于OO数据模型来实现对多媒体信息的描述和操作。

(3)基于超文本模型。

针对多媒体信息的特点,多媒体数据库一般支持以下特殊功能。

(1)支持图形、图像、动画、声音、动态视频和文本等多媒体字段类型及用户定义的特殊类型。

(2)支持定长数据和非定长数据的集成管理。

(3)支持复杂实体的表示和处理,要求有表示和处理实体间复杂关系(如时空关系)的能力。

(4)有保证实体完整性和一致性的机制。

(5)支持同一实体的多种表现形式。

(6)具有良好的用户界面。

(7)支持多媒体的特殊查询及良好的接口处理。

(8)支持分布式环境。

多媒体数据库系统的关键技术包括以下几种。

(1)数据模型技术,如OO数据模型、语义数据模型等。

(2)数据的存储管理和压缩/解压技术。

(3)多媒体信息的再现和良好的用户界面技术。

(4)多媒体信息的检索与查询及其他处理技术。

(5)分布式环境与并行处理技术。

4.数据仓库、联机分析处理技术和数据挖掘

快速、准确、高效地收集和分析信息是企业提高决策水平和增强企业竞争力的重要手段。企业的数据就像埋藏在深山中的金矿,如果不能供企业决策人员使用,就不能充分发挥其应有的价值。建立以数据仓库技术为基础,以数据库的联机分析处理技术和数据挖掘技术为实现手段的决策支持系统是解决上述问题的一种行之有效的系统化解决方案。

数据仓库利用计算机和数据库技术的最新进展,它不仅面向复杂的数据分析以支持决策过程,而且可以集成企业范围内的数据,无论其地理位置、格式和通信要求。数据仓库把支持决策的数据进行收集、归纳、整理,使企业的业务环境和信息分析环境分离,从而有效地提供实时的信息服务。数据仓库不是单一的产品,而是由软、硬件技术组成的环境,它把各种数据库集成为一个统一的数据仓库,并且把各种数据库中的数据进行合理的重组、转换和集成,以适应数据仓库面向主题的要求。

联机分析处理技术以超大规模数据库或数据仓库为基础来对数据进行多维化和综合分析,构建面向分析的多维数据模型,再使用多维分析方法,从若干不同角度对多维数据进行分析、比较,找出它们之间的内在联系。联机分析处理技术使分析活动从方法驱动转向了数据驱动,分析方法和数据结构实现了分离。

数据挖掘是从大型数据库或数据仓库中发现并提取深藏于其中的信息的一种新技术,目的在于帮助决策者找寻数据间潜在的关联,发现未被注意的信息,而这些信息对预测趋势和决策行为或许很有用。数据挖掘技术涉及数据库、人工智能、机器学习和统计分析等多种技术。数据挖掘技术能从数据仓库中自动分析数据,进行归纳性推理,从中挖掘潜在的模式或产生联想,建立新的业务模型,帮助决策者做出正确的决策。

数据仓库、联机分析处理技术和数据挖掘是三种独立的信息处理技术。数据仓库用于数据存储和组织,联机分析处理技术集中于数据分析,数据挖掘则致力于知识的自动发现。它们可以分别应用到信息系统的涉及和实现中,以提高相应部分的处理能力。在现代电子商务决策支持系统解决方案中,这三种技术的综合是最有前途的选择。