人工智能程序员面试笔试宝典
上QQ阅读APP看书,第一时间看更新

第5章 深度强化学习

2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件,其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果。深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域均有很多重要的应用。本章将从强化学习的基础概念讲起,并由易到难讲解策略梯度算法、深度Q网络算法、A3C算法及其他算法的相应扩展。本章也针对个别强化学习算法提供了相对应的PyTorch实现代码和代码解释。