4236次浏览
《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。1 绪论 1 1.1 这是一本什么书 1 1.2 强化学习可以解决什么问题 2 1.3 强化学习如何解决问题 4 1.4 强化学习算法分类及发展趋势 5 1.5 强化学习仿真环境构建 7 1.5.1 gym安装及简单的demo示例 8 1.5.2 深入剖析gym环境构建 10 1.6 本书主要内容及安排 12 第一篇 强化学习基础 17 2 马尔科夫决
3030次浏览
深度强化学习(Deep Reinforcement Learning,DRL)是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL 算法潜力无限,AlphaGo 是目前该算法*成功的使用案例。DRL 算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,本书的目的就是要把这两种主要的算法(及设计技巧)讲解清楚,使算法研究人员能够熟练地掌握。《揭秘深度强化学习人工智能机器学习技术丛书》共10 章,首先以AlphaGo 在围棋大战的伟大事迹开始,引起对人工智能发展和现状的介绍,进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。*后介绍了深度强化学习在不同领域的几个应用实例。引例、基础知识和实例相结合,方便读者理解和学习。《揭秘深度强化学习 人工智能机器学习