会员
深度强化学习理论与实践
龙强 章胜编著计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习理论与实践最新章节
查看全部- 参考文献
- 9.5 AlphaGo系列算法的应用与启示
- 9.4.3 MuZero的算法流程
- 9.4.2 MuZero中的MCTS
- 9.4.1 MuZero中的深度神经网络
- 9.4 MuZero算法介绍
- 9.3.3 AlphaZero的算法流程
- 9.3.2 AlphaZero相对于AlphaGo Zero的改进与调整
- 9.3.1 从围棋到其他棋类需要解决的问题
- 9.3 AlphaZero算法介绍
龙强 章胜编著
主页
同类热门书
最新上架
- 会员
SPSS统计分析标准教程(实战微课版)
本书以SPSS28.0中文版为平台,以实用为原则,由浅入深,全面系统地介绍SPSS的基本功能和实际应用方法。本书涉及面广,从SPSS基本操作开始介绍,覆盖大部分常用功能和高级统计分析方法。本书共11章,内容包括SPSS基础知识、建立与整理数据、SPSS基本统计分析、假设检验、非参数检验、方差分析、相关分析、回归分析、聚类和判别分析、统计图形和SPSS数据分析综合应用。在介绍的过程中,图文并茂地对计算机10.2万字 - 会员
深度序列模型与自然语言处理:基于TensorFlow 2实践
《深度序列模型与自然语言处理:基于TensorFlow2实践》以自然语言和语音信号处理两大应用领域为载体,详细介绍深度学习中的各种常用序列模型。在讲述理论知识的同时辅以代码实现和讲解,帮助读者深入掌握相关知识技能。《深度序列模型与自然语言处理:基于TensorFlow2实践》共12章,不仅涵盖了词向量、循环神经网络、卷积神经网络、Transformer等基础知识,还囊括了注意力机制、序列到序列问题计算机21.9万字 - 会员
Audition音频编辑标准教程(全彩微课版)
《Audition音频编辑标准教程(全彩微课版)》以AdobeAudition2022为写作平台,用通俗易懂的语言、精心挑选的实用技巧、翔实生动的操作案例,对AdobeAudition这款主流的音频处理软件进行了详细的阐述。全书共9章,内容涵盖音频知识、Audition入门基础、工作区与显示控制、音频的录制、音频的编辑、噪声的处理、效果器的应用、多轨会话、后期混音及输出等方面的知识、技巧,在需计算机8.1万字 - 会员
文心一言从新手到高手(写作+绘画+教育+编程+助手)
文心一言是百度推出的一款基于大语言模型的生成式AI产品,《文心一言从新手到高手(写作+绘画+教育+编程+助手)》详细介绍了其在不同领域的应用方法,是一本全面、详尽的文心一言使用指南。《文心一言从新手到高手(写作+绘画+教育+编程+助手)》共8章,依次讲解了文心一言的基础知识、创意写作、零基础绘画、数据分析、营销文案写作、职场百宝箱、求职招聘、教育教学、学生学习、编程辅助、生活顾问、插件、文心一言A计算机12.2万字 - 会员
重构知识:在线知识传播的疆域、结构与机制
《重构知识:在线知识传播的疆域、结构与机制》旨在探究社会化媒体知识分享平台的知识分享行为规律、知识疆域结构特征、知识构建的动力机制以及知识普惠的技术实现。依托于当前人文社会科学新文科建设总体要求,本书基于传播学理论视野,利用信息科学计算技术,结合复杂网络分析框架,致力于解决当前传播学现实问题。具体而言,本研究旨在探究基于互联网技术的知识传播,提高知识传播效率,推进知识普惠,探究信息技术能够惠及广泛计算机11.1万字 - 会员
文档处理与排版标准教程(Word+InDesign)
本书以简洁的语言介绍了使用Word和InDesign编辑与排版文档所需掌握的主要功能、操作方法和实用技巧。本书提供了动手实践案例实战疑难解答几个栏目,以便增强学习效果,使读者可以更好地将理论知识与实践相结合。本书共9章,内容分为Word和InDesign两部分:Word部分中的内容主要包括文档基本操作和页面设置、文本编辑和格式设置、创建和设置表格、插入和设置图片、图文表混排、创建和使用样式与模板、计算机9.9万字 - 会员
细说机器学习:从理论到实践
《细说机器学习:从理论到实践》从数学知识入手,详尽细致地阐述机器学习各方面的理论知识、常用算法与流行框架,并以大量代码示例进行实践。本书内容分为三篇:第一篇为基础知识,包括机器学习概述、开发环境和常用模块、特征工程、模型评估、降维方法等内容。本篇详细而友好地介绍机器学习的核心概念与原理,并结合大量示例帮助读者轻松入门。第二篇为算法应用,涵盖机器学习最重要与高频使用的模型,包括K-Means聚类、K计算机17.6万字 - 会员
H5页面设计与制作标准教程(全彩微课版)
《H5页面设计与制作标准教程(全彩微课版)》以H5为写作基础,以实际应用为指导思想,用通俗易懂的语言对H5页面设计与制作的相关知识进行详细介绍。H5页面设计的魅力在于通过巧妙的设计手法,将复杂的功能简化,将枯燥的信息趣味化,让用户在享受视觉盛宴的同时,轻松获取所需内容。《H5页面设计与制作标准教程(全彩微课版)》共7章,内容涵盖初识H5、H5视觉交互设计技巧、H5页面元素的设计与制作、H5页面动效计算机6.6万字 - 会员
深度强化学习:算法原理与金融实践入门
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(D计算机16.9万字