人工智能基础与应用
上QQ阅读APP看书,第一时间看更新

1.2 机器学习与深度学习

1.2.1 机器学习的含义

机器学习(Machine Learning,ML)专门研究计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习最基本的做法,就是使用算法解析数据并从中学习,然后对真实世界中的事件做出决策和预测。与传统的为完成特定任务、硬编码的软件程序不同,机器学习使用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。例如,邮箱里有自动垃圾邮件分类程序,它的工作就是收到一封邮件后,通过查看内容判断它是否为垃圾邮件。那么,它是如何判断的呢?首先需要一堆邮件,提取判断邮件正常与否的特征数据(如关键词、词频等),并对其中的普通邮件和垃圾邮件进行标注;随后,可以通过某种算法来构建一个模型,然后用数据进行训练,得到一条回归曲线,收到一封邮件后,判断它与曲线的距离,如果远离正常邮件回归曲线,则认为是垃圾邮件。构建的模型从数据中学习以判断垃圾邮件,这就是机器学习。垃圾邮件分类过程如图1-15所示。

图1-15 垃圾邮件分类过程

机器学习源于早期的人工智能领域。传统的人工智能算法包括决策树学习、推导逻辑规划、聚类、分类、回归、强化学习和贝叶斯网络等(当然除此之外还有很多)。

机器学习较成功的应用领域是计算机视觉领域,但仍需要大量的手工编码来完成工作。人们需要手工编写分类器、边缘检测滤波器,以便让程序能识别拍摄到的物体从哪里开始,到哪里结束;编写形状检测程序来判断检测对象是不是有8条边;编写分类器来识别字母序列“S-T-O-P”。使用以上这些手工编写的程序,人们可以开发算法来感知图像,判断图像是不是一个停止标志牌。这个算法的效果尚可,但并不完美,特别是遇到云雾天,标志牌变得不那么清晰可见的,或者被树遮挡住一部分时,算法就可能难以成功了。这就是为什么相当长的一段时间内,计算机视觉的处理能力一直无法接近人眼的处理能力,它比较僵化,比较容易受环境条件的干扰。随着时间的推进,机器学习算法的发展改变了一切。