
1.1.3 云数据中心体系结构简介
1. 存储
随着企业网络应用时间和应用数据量的加大,企业已经感觉到存储容量和性能与网络应用发展之间的不平衡。因此,满足用户存储需求的技术也应运而生,DAS(Direct Attached Storage,直连式存储)、NAS(Network-Attached Storage,网络接入存储)和SAN(Storage Area Network,存储区域网络)3种存储技术成为当今主流的存储技术。
(1)DAS
DAS在我们生活中非常常见,尤其是在中小企业应用中,DAS是最主要的应用模式,存储系统被直连到应用的服务器中。DAS技术是最早被采用的存储技术,但由于这种存储技术是把设备直接挂载在服务器上,随着需求的不断增加,越来越多的设备被添加到网络环境中,服务器和存储独立数量较多,导致资源利用率低下,使得数据共享受到严重限制。
DAS更多地依赖服务器主机操作系统进行数据的I/O读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统I/O等),数据流需要回流主机再到服务器连接着的存储设备,数据备份通常占用服务器主机资源的20%~30%,直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。DAS逻辑示意如图1-5所示。

图1-5 DAS逻辑示意
(2)NAS
NAS技术改进了DAS技术,通过标准的拓扑结构实现连接,服务器无需直接与企业网络连接,不依赖于通用的操作系统,所以存储容量得以扩展,而且对原来的网络服务器的性能没有任何影响。NAS逻辑示意如图1-6所示。

图1-6 NAS逻辑示意
NAS是文件级的存储方法,常被用来共享文档、图片、电影等,而且随着云计算的发展,一些NAS厂商也推出了云存储功能,大大方便了企业和个人用户的使用。
(3)SAN
SAN的支撑技术就是光纤通道——FC技术,该技术与前面介绍的NAS技术完全不同。它不是把所有的存储设备集中安装在一个服务器中,而是将这些设备单独通过光纤交换机连接起来,形成一个光纤通道存储在网络中,然后在企业的局域网中进行连接。这种技术的最大特点就是将网络和设备的通信协议与传输介质隔离开,使其可以在同一个物理连接上传输。高性能的存储系统和宽带网络的使用,使得系统的构建成本和构建复杂程度大大降低。SAN逻辑示意如图1-7所示。

图1-7 SAN逻辑示意
2. 网络结构
DCN(Data Center Network,数据中心网络)主要采用层次结构实现,按照网络结构中设备作用的不同,网络系统可以被划分为核心层、汇聚层、接入层。多种应用同时运行在一个数据中心,每种应用一般都运行在特定的服务器与虚拟服务器集群上,每个应用与一个或者多个因特网路由的IP地址绑定,用于接收来自因特网的客户端访问。在数据中心内部,来自因特网的请求被弹性负载均衡器分配到这个对应的服务器池中进行处理。根据传统负载均衡的术语,接收请求的IP地址被称为虚拟IP地址(Virtual IP Address,VIP),负责处理请求的服务器的集合被称为直接IP地址(Direct IP Address,DIP)。一个典型的数据中心网络体系结构示意如图1-8所示。
除了以上所说的网络结构以外,还有一种Fabric的网络架构。数据中心在部署云计算之后,Fabric网络架构可以利用阵列技术来扁平化网络,可以将传统的三层结构压缩为两层,并最终转变为一层,通过实现任意点之间的连接来消除复杂性和网络延迟。不过,Fabric这个新技术目前仍未有统一的标准,其推广应用还有待更多的实践。
3. 数据层次
数据中心全年无休地运行,一旦数据丢失,造成的损失将难以估量,因此部署数据备份系统尤为重要,而数据备份技术也是整个备份系统中的核心技术。
数据备份技术可以将整个数据中心的数据或状态保存下来,一旦发生硬件损坏而导致数据丢失,我们可以从已有的备份中,快速、正确、方便地将数据恢复。数据备份技术在存储系统中的意义不仅在于防范意外事件的发生,而且它还是历史数据归档保存的主要方式。

图1-8 典型的数据中心网络体系结构示意
数据备份由备份服务器、备份软件、数据服务器和备份介质4个部分组成。数据备份并不是简单地数据拷贝,为降低备份数据所占用的额外空间,一般需要改变数据格式,进行压缩等操作,这一般由专业的备份软件完成。数据库的备份与普通文件备份不同,需要通过应用插件与数据库协调,以保证备份数据的一致性和完整性。
那么什么是备份策略呢?备份策略是确定需要备份的内容、备份时间及备份方式的过程。各行各业都需要根据自己的实际情况来制订不同的备份策略。目前被采用的备份策略主要有以下3种。
(1)完全备份(Full Backup)
如图1-9所示,我们可以每天对自己的系统进行完全备份。例如,第一天用一盘磁带对整个系统进行备份,第二天再用另一盘磁带对整个系统进行备份,以此类推。

图1-9 完全备份策略示意
优点:只需使用当天的数据盘就能恢复数据。
缺点:每天都对整个系统进行完全备份会造成备份的数据大量重复,这些重复的数据占用了大量的磁带空间;其次,由于需要备份的数据量较大,备份所需的时间也较长。
(2)增量备份(Incremental Backup)
第一天进行一次完全备份,然后在接下来的每天只对当天新的或被修改过的数据进行备份。这种备份策略如图1-10所示。

图1-10 增量备份策略示意
优点:节省了磁带空间,缩短了备份时间。
缺点:当灾难发生时,数据的恢复比较麻烦。例如,系统在星期三的早晨发生故障,丢失了大量的数据,那么现在就要将系统恢复到星期二晚上时的状态。这时系统管理员就要先找出星期天的那盘完全备份磁带进行系统恢复,然后再找出星期一的磁带来恢复星期一的数据,接着找出星期二的磁带来恢复星期二的数据。很明显,这种方式很繁琐且可靠性也很差。在这种备份方式下,各盘磁带间的关系就像链子一样,一环套一环,其中任何一盘磁带出了问题都会导致整条链子脱节。比如在上例中,若星期二的磁带出了故障,那么管理员最多只能将系统恢复到星期一晚上时的状态。
(3)差异备份(Differential Backup)
管理员首先在星期天进行一次系统完全备份,然后在接下来的几天里,再将当天所有与星期天不同的数据(新的或修改过的)备份到磁带上,如图1-11所示。差异备份策略在避免了以上两种策略的缺陷的同时,又具有了它们的所有优点。
优点:它无需每天都对系统做完全备份,因此备份所需时间短,节省了磁带空间;其次,它的灾难恢复也很方便,系统管理员只需两盘磁带,即星期天的磁带与灾难发生前一天的磁带,就可以将系统恢复。

图1-11 差异备份策略示意
4. 能源利用
PUE(Power Us age Effectiveness,能源使用效率)是评价数据中心能源效率的指标,是数据中心消耗的所有能源与IT负载消耗的能源之比。PUE值已经成为国际上比较通行的数据中心电力使用效率的衡量指标。PUE值越接近于1,表示一个数据中心的绿色化程度越高,能源的利用率越高。
节能减排在今天已成为一种社会责任,越来越多的数据中心在构建之初就已将其列为一项硬性指标。数据中心所耗费的能源费用已占企业运营费用的40%~45%,因此,合理高效的能源利用是十分重要的。
5. 延迟、带宽、容量
随着越来越多新技术的问世以及标准的出台,数据中心的带宽提升也变得越来越棘手。目前,数据中心的带宽发展介于突破与疯狂之间,带宽需求正在以每年25%~35%的速度飞速增长,预计这样的增长速度还会持续几年甚至更久。因此,合理的网络架构和及时更换网络设备是解决带宽问题的首要方法。
6. 故障恢复
随着网络科技快速发展,云数据中心需要更高水平的运营支撑能力和强大的数据处理能力,既要确保关键业务数据万无一失,又要支撑各企业业务系统的连续、可靠运行。因此,数据中心的故障恢复要快速,不能影响业务的正常运行,高可用和负载均衡的技术就显得尤为重要。合理的高可用架构可以保证服务的不间断运行,性能优秀的负载均衡架构可以保证服务的质量,两者的合理安排,是数据中心故障恢复的有力保障。