强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女频现言网

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

加书架

下载

听书

强化学习：原理与Python实战最新章节

会员
强化学习：原理与Python实现
全书分为三个部分。第一部分了解强化学习应用，了解强化学习基本知识，搭建强化学习测试环境。该部分包括：强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分：Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论；深度强化学习算法部分：详细剖析全部具有重要影响力的深度强
肖智清程序设计12.2万字

强化学习：原理与Python实战

强化学习：原理与Python实战最新章节

强化学习：原理与Python实现

深度学习与图像识别：原理与实践

空间计算：人工智能驱动的新商业革命

AIGC辅助软件开发：ChatGPT 10倍效率编程实战

AI速成课：从AI编程到构建智能软件

ChatGPT写作超简单

焊接机器人基本操作及应用

机器学习实战（视频教学版）

智能控制与强化学习：先进值迭代评判设计

大语言模型：原理、应用与优化

机器学习的算法分析和实践

破解深度学习（基础篇）：模型算法与实现

生成式AI实战

玩转机器人：DIY智能小车机器人

文心一言：人人都能上手的AI工具

当我点击时，算法在想什么？

空间智能原理与应用

机器学习（第2版）

大模型实战：微调、优化与私有化部署

基于信息增强的图神经网络学习方法研究