
2.1 TensorFlow基础框架
2.1.1 系统框架
虽然TensorFlow框架的版本在不断更新,但是其系统架构并没有发生根本性的改变。它以不同功能需求进行分层处理,以统一接口屏蔽具体实现,从而集中各自的关注层次,更好地提升TensorFlow的适用性,系统架构如图2.1所示。

图2.1 系统框架
从中可以很明显地看出,TensorFlow系统框架分为三层,由上而下依次是应用层、接口层和核心层。
1.应用层
应用层是TensorFlow框架的最上层,主要提供了机器学习相关的训练库、预测库以及针对Python、C++和Java等编程语言的编程环境,便于不同编程语言在应用层通过接口层调用TensorFlow核心功能以实现相关实验和应用。可以将应用层理解为系统的前端,这样便于使用Python等语言进行编程,主要实现对计算图的构造。
2.接口层
接口层是对TensorFlow功能模块的封装,便于其他语言平台调用。
3.核心层
核心层是TensorFlow进行运算学习的最重要部分,包括设备层、网络层、数据操作层和图计算层。可以将核心层理解为系统的后端,它对前端提出的计算命令进行具体的计算。
(1)设备层
设备层主要包括TensorFlow在不同硬件设备上的实现,主要支持CPU、GPU和Mobile等不同设备。通过在不同的硬件设备上实现计算命令转换,给上层提供统一的接口,实现程序的跨平台功能。
(2)网络层
网络层主要包括RPC(Remote Procedure Call,远程过程调用)和RDMA(Remote Direct Memory Access,远程直接内存访问)通信协议,主要实现不同设备间的数据传输和更新,这些协议都会在分布式计算中用到。
(3)数据操作层
数据操作层以Tensor为处理对象,实现Tensor的各种操作或计算。这些操作包括MatMul等计算操作,也包含Queue等非计算操作。
(4)图计算层
图计算层中主要包括分布式计算图和本地计算图的实现,主要实现了图的创建、编译、优化和执行等部分。
2.1.2 系统的特性
TensorFlow的系统架构具备许多特性,在官网中着重介绍了它的高度灵活性(Deep Flexibility)、真正的可移植性(True Portability)、连接研究与产品(Connect Research and Production)、自动微分(Auto-Differentiation)、多语言选择(Language Options)以及最大化性能(Maximize Performance)六大特性。
1.高度灵活性
TensorFlow不是一个死板的神经网络库,只要能够将计算表示成数据流图,驱动计算的内部循环就可以使用TensorFlow来实现。除了系统提供的神经网络中的常见子图外,还要能编写TensorFlow之上的库,这样可以极大地减少重复代码量。
2.真正的可移植性
TensorFlow可以运行在CPU和GPU上,也可以在桌面端、服务器、移动端、云端服务器和Docker等各类终端上运行。只要有实现机器学习的想法,无需任何特定的硬件就能完成基础的尝试。
3.连接研究与产品
可以让产品研究人员更快地将想法变为产品,可以让学术研究人员更直接地共享代码,具有更大的科学产出率。过去将机器学习想法从研究转变成产品时,一般都需要大量的代码重写工作,现在研究人员在TensorFlow中进行新算法的实验,产品团队用TensorFlow来训练模型并实时地使用模型为真实的消费者服务。
4.自动微分
TensorFlow能够自动完成微分计算操作。在基于梯度的机器学习算法中求微分是重要的步骤,使用TensorFlow完成机器学习,只需要定义预测模型的计算结构、目标函数,然后添加数据便能完成微分计算。
5.多语言选择
TensorFlow附带了Python、C++和Java等接口来构建用户程序,后续还会附带Lua、JavaScript或R等。
6.最大化性能
TensorFlow对线程、队列和异步计算具有一流的支持,可以让你最大限度地利用可用硬件,即使拥有具有32核CPU和4块GPU的工作站,TensorFlow也可以将TensorFlow中的计算需求分配到CPU和GPU中,实现同时计算的效果,从而最大化地利用硬件资源。
2.1.3 编程模型
TensorFlow有自己的设计理念和编程模型,理解其编程模型是后续进行机器学习的基础。
TensorFlow的设计理念以数据流为核心,当构建相应的机器学习模型后,使用训练数据在模型中进行数据流动,同时将结果以反向传播的方式反馈给模型中的参数,以进行调整,使用调整后的参数对训练数据再次进行迭代计算。
所以,可以将TensorFlow理解为一张计算图中“张量的流动”,其由Tensor和Flow两部分组成。Tensor(张量)代表了计算图中的边,Flow(流动)代表了计算图中因节点所做的操作而形成的数据流动。
下面通过一张基础的数据流图来说明数据流图中的各个要素,如图2.2所示。
该图的计算过程是回归模型计算,在图中数据由下向上运行,主要包括输入(Input)、重塑(Reshape)、ReLu层(ReLu Layer)、Logit层(Logit Layer)、Softmax方法、交叉熵(Cross Entropy)、梯度(Gradient)、SGD训练(SGD Trainer)等步骤。
计算过程从输入开始,经过重塑成为统一格式,然后进行下一步运算。
在ReLu层有两个参数:Wh1和bh1。使用ReLu层的激活函数进行非线性计算处理后,进入Logit层。
在Logit层有另外两个学习参数:Wsm和bsm,用于存储计算的结果。
完成计算后使用Softmax方法计算出各类输出结果的概率分布。同时,用交叉熵度量源样本概率分布和输出结果概率分布之间的相似性。然后使用Wh1、bh1、Wsm和bsm以及交叉熵结果来计算梯度,随后进入SGD训练。
在SGD训练中,通过梯度计算值反向传播,依次更新bsm、Wsm、bh1和Wh1,然后再次进行计算,不断地进行迭代学习。

图2.2 数据流图
2.1.4 编程特点
TensorFlow除了以数据流为核心外,在编程实现过程中还具备两大特点。
1.将图的定义和图的运行完全分开
使用TensorFlow进行编程与使用Python等进行编程有明显的区别。在使用Python进行编程时,只要定义了相关变量以及运算,在程序运行时就会直接执行相关运算得到结果。但是,在TensorFlow中,需要预先定义各种变量,建立相关数据流图,在数据流图中定义各种变量之间的计算关系,以此完成图的定义。此时,图只是运算规则,没有任何实际数据,需要把运算的输入数据放进去后,才会形成输出值。
2.图的计算在会话中执行
TensorFlow的相关计算在图中进行定义,而图的具体运行环境在会话(Session)中。只有开启会话后,才可以使用相关数据去填充节点,这样才能开始计算;关闭会话后,就不能再进行计算了。
为了更直观地感受TensorFlow编程的特点,下面分别使用Python的编程思路和TensorFlow的编程思路来实现简单的数学计算。
例如,我们需要计算y=a*b+c,其中a=3,b=4,c=5。
在Python中,直接进行变量以及运算的定义,最后打印输出,具体实现如下:
01 a=3
02 b=4
03 c=5
04 y=a*b+c
05 print(y)
运行上述代码后会直接输出最终的计算结果17。
在TensorFlow中,我们也输入类似的代码:
01 import tensorflow as tf
02 a=3
03 b=4
04 c=5
05 y=tf.add(a*b、c)
06 print(y)
运行上述代码,具体输出如下:
Tensor("Add:0"、 shape=()、 dtype=int32)
可以看出并没有输出运算结果,而是输出了一个Tensor,这是因为我们仅仅完成了图的定义,而没有具体进行运算。
如果需要在TensorFlow中实现该运算,就需要满足TensorFlow中计算的几个阶段,首先定义计算图,然后创建会话,最后完成计算。具体实现如下:

为了便于对比,在完成图的创建后以及计算完成后分别输出了结果,详细的代码含义将在后续章节中讲解,运行结果如下:
Tensor("Add_2:0"、 shape=()、 dtype=float32)
17.0
可以看出,只有在会话中完成计算后才会输出计算结果17。
TensorFlow采用这样的设计主要是因为它是针对机器学习的框架,消耗最多的是对输入数据的训练。这样设计的好处在于当进行计算时,图已经确定,计算就是一个不断迭代优化的过程。