前言
本书首先介绍自然语言处理领域的基本构件,接着介绍使用最先进的神经网络模型可以解决的问题,将深入涵盖文本处理任务中所需的必要预处理以及自然语言处理领域的一些热门话题,包括卷积神经网络、循环神经网络和长短期记忆网络。通过阅读本书,读者将理解文本预处理以及超参数调整的重要性。
学习目标
❏学习自然语言处理的基础知识。
❏了解深度学习问题的各种预处理技术。
❏使用word2vec和GloVe构建文本的矢量表示。
❏理解命名实体识别。
❏使用机器学习进行词性标注。
❏训练和部署可扩展的模型。
❏了解神经网络的几种架构。
目标读者
对自然语言处理领域的深度学习感兴趣的有抱负的数据科学家和工程师。
他们将从自然语言处理概念的基础开始,逐渐深入到神经网络的概念及其在文本处理问题中的应用。他们将学习不同的神经网络架构及其应用领域。需要具备丰富的Python知识和线性代数技能。
方法
本书从自然语言处理的基本概念讲起,在了解了基本概念之后,读者将逐渐意识到自然语言处理技术在现实世界中的应用和问题。接下来本书针对这些问题领域介绍开发解决方案的方法。本书还讨论了作为基于解决方案的方法的一部分的神经网络的基本构造块。最后通过实例阐述各种现代的神经网络架构及其相应的应用领域。
硬件要求
为了获得最佳体验,我们推荐以下硬件配置:
❏处理器:英特尔酷睿i5或同级产品
❏内存:4GB内存
❏存储:5GB可用空间
软件需求
我们还建议你预先安装以下软件:
❏操作系统:Windows 7 SP164位、Windows 8.164位或Windows 1064位、Linux(Ubuntu、Debian、Red Hat或Suse)或OS X的最新版本。
❏Python 3.6.5或更高版本,最好是3.7。可访问https://www.python.org/downloads/release/python-371/下载。
❏Jupyter(访问网站https://jupyter.org/install下载,按照说明安装)。或者,你可以使用Anaconda来安装Jupyter。
❏Keras(https://keras.io/#installation)。
❏Google Colab这是一个免费的Jupyter笔记本环境,运行在云基础架构上。强烈建议你使用它,因为其不需要任何设置,并且预先安装了流行的Python包和库(https://colab.research.google.com/note-books/welcome.ipynb)。
安装和设置
每一次伟大的旅程都是从一个不起眼的步骤开始的,对于即将到来的数据领域的冒险也不例外。在能够用数据做令人敬畏的事情之前,我们需要准备好最高效的环境。
在Windows上安装Python
1)在官方安装页面(https://www.python.org/downloads/windows/)上找到你想要的Python版本。
2)确保根据你的计算机系统安装正确的“位”版本(32位或64位)。你可以在操作系统的“系统属性”窗口中找到此信息。
下载安装程序后,只需双击文件,并按照屏幕上显示的用户友好提示操作。
在Linux上安装Python
要在Linux上安装Python,需执行以下操作:
1)在命令提示符下运行python3--version验证尚未安装p\Python 3。
2)要安装Python 3,请运行以下命令:
3)如果遇到问题,有许多在线资源可以帮助你解决问题。
在macOS X上安装Python
要在macOS X上安装Python,需执行以下操作:
1)通过按住“CMD+空格”组合键打开终端,在打开的搜索框中键入终端,然后按回车键。
2)通过命令行运行xcode--select--install来安装Xcode。
3)安装Python 3最简单的方法是使用homebrew,通过命令行运行ruby--e"$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"来安装。
4)将homebrew添加到你的PATH环境变量中。通过运行sudo nano~/.profile在命令行中打开你的配置文件,并在底部插入export PATH="/usr/local/opt/python/libexec/bin:$PATH"。
5)最后一步是安装Python。在命令行中,运行brew install python。
6)注意,如果你安装Anaconda,最新版本的Python将自动安装。
安装Keras
要安装Keras,需执行以下步骤:
1)由于Keras需要另一个深度学习框架作为后端,你需要先下载另一个框架,建议使用TensorFlow。
要在你的平台上安装TensorFlow,请访问https://www.tensorflow.org/install/。
2)安装后端后,就可以使用以下命令安装Keras:
也可以从GitHub安装它,使用以下方法克隆Keras:
3)使用以下命令在Python上安装Keras:
现在需要配置后端。更多信息请参考链接https://keras.io/backend/。
下载示例代码及彩色图像
本书的示例代码及所有截图和样图,可以从http://www.packtpub.com通过个人账号下载,也可以访问华章图书官网http://www.hzbook.com,通过注册并登录个人账号下载。