澳大利亚新华书店网

强化学习
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：魏庆来//王飞跃|责编:贾斌出版社：清华大学
强化学习是目前机器学习乃至人工智能领域发展最快的分支之一。强化学习的基本思想是通过与环境的交互、智能体或智能算法获取相关智能，其具体过程就是根据环境反馈得到的奖励不断调整自身的策略进而获得最大奖励决策的学习历程。本书主要讲述了强化学习的基本原理和基本方法，基于强化学习的控制、决策和优化方法设计与理论分析，深度强化学习原理以及平行强化学习等未来强化学习的发展新方向，展示从先行后知到先知后行，再到知行合一的混合平行智能思路。本书可作为高等学校人工智能、机器学习、智能控制、智能决策、智慧管理、系统工程以及应用数学等专业的本科生或研究生教材，亦可供相关专业科研人员和工程技术人员参考。
售价：23.92

EASY RL(强化学习教程)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：编者:王琦//杨毅远//江季|责编:郭媛出版社：人民邮电
强化学习作为机器学习及人工智能领域的一种重要方法，在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容，在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa 、Q学习等传统强化学习算法，以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法，并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。此外，本书还提供习题解答以及Python代码实现，可以让读者进行端到端、从理论到轻松实践的全生态学习，充分掌握强化学习算法的原理并能进行实战。本书适合对强化学习感兴趣的读者阅读，也可以作为相关课程的配套教材。
售价：39.96

强化学习与机器人控制(精)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(墨)余文//阿道夫·佩鲁斯基亚|责编:王军|译者:刘晓骏出版社：清华大学
在《强化学习与机器人控制》一书中，专家团队不仅简洁明了地描述了人机交互控制方案，还深入介绍了新颖的无模型强化学习控制器。本书首先简述更先进的人机交互控制方案和强化学习，然后讲解典型的环境模型，最后介绍一些更著名的参数估计识别技术。《强化学习与机器人控制》提供了严谨的数学推理和演示，这有助于读者理解控制方案和算法。书中还描述了人机交互控制和基于强化学习控制的稳定性和收敛性分析。另外，还讨论了一些前沿话题，如逆运动学和速度运动学解决方案、神经控制以及机器人领域未来可能的发展趋势。 ·全面介绍基于模型的人机交互控制。 ·详细研究基于欧拉角的无模型人机交互控制和“人机回圈”机制控制。 ·实际讨论机器人位置和力控制的强化学习以及机器人力控制的连续时间强化学习。 ·深入研究使用强化学习来控制最坏情况下不确定性的机器人，并使用多智能体强化学习对冗余机器人进行控制。
售价：39.20

深度强化学习原理与实践
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：陈喆|责编:白立军//常建丽出版社：清华大学
本书从原理的角度，力求讲解清楚深度学习、强化学习、深度强化学习中的一些精选方法，并从实践的角度，通过一系列循序渐进的原创实验，引领读者独立编程实现这些方法，以期为读者精通深度强化学习并应用深度强化学习方法解决实际问题奠定坚实基础。本书不仅适合计算机科学与技术、人工智能、物联网工程、数据科学与大数据、软件工程、通信工程、电子信息、机器人工程、自动化、智能制造等相关专业高年级本科生及研究生教学与自学使用，也适合机器学习等领域的从业者、科研人员及爱好者自学与参考使用。
售价：23.60

深度强化学习/图灵原创
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：王树森//黎彧君//张志华|责编:刘美英出版社：人民邮电
丛书项：图灵原创
本书基于备受读者推崇的王树森“深度强化学习”系列公开视频课，专门解决“入门深度强化学习难”的问题。本书的独特之处在于：第一，知识精简，剔除一切不必要的概念和公式，学起来轻松；第二，内容新颖，聚焦近10年深度强化学习领域的突破，让你一上手就紧跟最新技术。本书系统讲解深度强化学习的原理与实现，但不回避数学公式和各种模型，原创100多幅精美插图，并以全彩印刷展示。简洁清晰的语言+生动形象的图示，助你扫除任何可能的学习障碍！本书内容分为五部分：基础知识、价值学习、策略学习、多智能体强化学习、应用与展望，涉及DQN、A3C 、TRPO、DDPG、 AlphaGo等。本书面向深度强化学习入门读者，助你构建完整的知识体系。学完本书，你能够轻松看懂深度强化学习的实现代码、读懂该领域的论文、听懂学术报告，具备进一步自学和深挖的能力。
售价：51.92

深度强化学习实战/深度学习系列
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(美)亚历山大·扎伊//布兰登·布朗|责编:吴晋瑜|译者:李晗出版社：人民邮电
丛书项：深度学习系列
本书先介绍深度强化学习的基础知识及相关算法，然后给出多个实战项目，以期让读者可以根据环境的直接反馈对智能体加以调整和改进，进一步提升运用深度强化学习技术解决实际问题的能力。本书涵盖深度Q网络、策略梯度法、演员-评论家算法、进化算法、 Dist-DQN、多智能体强化学习、可解释性强化学习等内容。本书给出的实战项目紧贴深度强化学习技术的发展趋势，且所有项目示例以 Jupter Notebook样式给出，便于读者修改代码、观察结果并及时获取经验，能够带给读者交互式的学习体验。
售价：47.92

TensorFlow2强化学习手册/中外学者论AI
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(美)普拉文·帕拉尼萨米|责编:王芳|译者:陈翔//王玺钧出版社：清华大学
丛书项：中外学者论AI
深度强化学习能够构建智能体、产品和服务，超越计算机视觉或感知执行动作。TensorFlow 2.x是最流行的深度学习框架的最新主要版本，用于开发和训练深度神经网络。本书介绍了深度强化学习的基本原理和TensorFlow 的最新版本，同时也介绍了 OpenAl Gym、基于模型和无模型的强化学习，并学习如何开发基本智能体。同时给出了高级深度强化学习算法（Actor-Critic、深度确定性策略梯度、深度Q网络、近端策略优化和深度递归Q 网络等）的实现。
售价：39.60

强化学习的数学原理(英文版)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：赵世钰|责编:郭赛出版社：清华大学
本书从强化学习最基本的概念开始介绍，将介绍基础的分析工具，包括贝尔曼公式和贝尔曼最优公式，然后推广到基于模型的和无模型的强化学习算法，最后推广到基于函数逼近的强化学法。本书强调从数学的角度引入概念、分析问题、分析算法，并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景，仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础，本书可以帮助读者更深入地理解一些问题并提供新的视角。本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。
售价：47.20

网络智能化中的深度强化学习技术
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：戚琦//付霄元//庄子睿//王敬宇//廖建新|责编:代晓丽出版社：人民邮电
随着人工智能技术的广泛应用，网络智能化近年来受到广泛的关注，已经成为下一代移动通信与未来网络的重要技术。阿尔法围棋（ AlphaGo）之后，深度强化学习不断推陈出新，为网络中的决策问题提供了有效的潜在解决方案。本书系统介绍了网络智能化中深度强化学习的基本理论、算法及应用场景。全书共8章，针对互联网、移动通信网、边缘网络、数据中心等典型网络，阐述了网络管理、网络控制、任务调度等决策需求，深入论述了深度强化学习的模型构建与应用技术。第1 章介绍了网络智能的需求与挑战；第2章介绍了先进的深度强化学习模型与方法；第3～6章论述了无线接入优化、网络管理、网络控制与任务调度等普遍网络管控任务中，深度强化学习技术的应用方法；第7章和第8章论述了深度强化学习在流媒体控制以及自组织网络等典型场景中的新研究进展。本书可为高等院校计算机和通信相关专业的本科生、研究生提供参考，也可供对网络智能化与深度强化学习领域感兴趣的研究人员和工程技术人员参考。
售价：59.92

图强化学习(原理与实践入门)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：编者:谢文杰//周炜星|责编:杜杨//申美莹出版社：清华大学
图强化学习是深度强化学习的重要分支领域。本书作为该领域的入门教材，在内容上尽可能覆盖图强化学习的基础知识，并提供应用实践案例。全书共10章，大致分为三部分：第一部分（第1～3章）介绍图强化学习研究对象（复杂系统、图和复杂网络）；第二部分（第 4～7章）介绍图强化学习基础知识（图嵌入、图神经网络和深度强化学习）；第三部分（第8～10章）介绍图强化学习模型框架和应用实践案例，并进行总结和展望。每章都附有习题并介绍了相关阅读材料，以便有兴趣的读者进一步深入探索。本书可作为高等院校计算机、图数据挖掘及相关专业的本科生或研究生教材，也可供对图强化学习感兴趣的研究人员和工程技术人员阅读参考。
售价：27.60

强化学习入门(从原理到实践)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：编者:叶强//闫维新//黎斌|责编:迟振春出版社：机械工业
强化学习主要研究的问题是：具有一定思考和行为能力的个体在与其所处的环境进行交互的过程中，通过学习策略达到收获最大化或实现特定的目标。本书以理论和实践相结合的形式深入浅出地介绍强化学习的历史、基本概念、经典算法和一些前沿技术，共分为三大部分：第一部分（第1～5章）介绍强化学习的发展历史、基本概念以及一些经典的强化学习算法；第二部分（第6～9章）在简要回顾深度学习技术的基础上着重介绍深度强化学习的一些前沿实用算法；第三部分（第10章）以五子棋为例详细讲解战胜了人类顶级围棋选手的Alpha Zero算法的核心思想。对于本书介绍的每一个经典算法，我们都结合了一定的应用场景，详细介绍如何用Python代码来实现。本书既可以作为计算机专业高年级本科生及硕士生关于人工智能领域的入门参考读物，也可以作为对人工智能技术（特别是强化学习技术）感兴趣的人员理解强化学习思想的补充读物。
售价：31.60

信息物理系统强化学习(网络安全示例)/计算机科学丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦出版社：机械工业
丛书项：计算机科学丛书
本书通过系统介绍强化学习领域的基础与算法，在强化学习与信息物理系统两个领域之间建立起联系，每一部分都列举了一个或几个最新的信息物理系统示例，以帮助读者直观地理解强化学习技术的实用性。本书分为三个部分。第一部分对强化学习、信息物理系统和网络安全进行了概要介绍。第二部分正式介绍强化学习的框架，并对强化学习问题进行定义，给出了两类解决方法-基于模型的解决方案和无模型的解决方案。第三部分通过回顾现有的网络安全技术并描述新兴的网络威胁，将注意力转移到网络安全，之后给出了两个案例研究。
售价：31.60

深度学习入门(4强化学习)/图灵程序设计丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(日)斋藤康毅|责编:张海艳|译者:郑明智出版社：人民邮电
丛书项：图灵程序设计丛书
本书前半部分介绍强化学习的重要思想和基础知识，后半部分介绍如何将深度学习应用于强化学习，遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入，依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程，以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后，神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。本书延续“鱼书”系列的风格，搭配丰富的图、表、代码示例，加上轻松、简明的讲解，让人循序渐进地理解强化学习中各种方法之间的关系，于不知不觉中登堂入室。
售价：43.92

智能控制与强化学习(先进值迭代评判设计)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：王鼎//赵明明//哈明鸣//任进|责编:哈爽出版社：人民邮电
在人工智能技术的大力驱动下，智能控制与强化学习发展迅猛，先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题，以实现稳定学习、演化学习和快速学习为目标，建立一套先进的值迭代评判学习控制理论与设计方法。首先，对先进值迭代框架下迭代策略的稳定性进行全面深入的分析，建立一系列适用于不同场景的稳定性判据，从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次，基于迭代历史信息，提出一种新颖的收敛速度可调节的值迭代算法，有助于加快学习速度、减少计算代价，更高效地获得非线性系统的最优控制律。结合人工智能技术，对无模型值迭代评判学习控制的发展前景也进行了讨论。本书内容丰富、结构清晰、由浅入深、分析透彻，既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书，又可供相关领域的技术人员使用。
售价：55.92

深度强化学习理论与实践/计算机技术开发与应用丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：编者:龙强//章胜|责编:赵佳霓出版社：清华大学
丛书项：计算机技术开发与应用丛书
本书比较全面、系统地介绍了深度强化学习的理论和算法，并配有大量的案例和编程实现的代码。全书核心内容可以分为3部分，第一部分为经典强化学习，包括第2～4章，主要内容有动态规划法、蒙特卡罗法、时序差分法；第二部分为深度强化学习，包括第6～8章，主要内容有值函数近似算法、策略梯度算法、策略梯度法进阶；第三部分重点介绍深度强化学习的经典应用案例——AlphaGo系列算法。另外，作为理论和算法的辅助，第1章介绍强化学习的模型，第5章简单介绍深度学习和PyTorch。本书对理论、模型和算法的描述比较数学化，笔者力求做到用严谨、清晰、简洁的数学语言来写作；几乎每个算法配有一个或多个测试案例，便于读者理解理论和算法；每个案例都配有编程实现的代码，便于读者理论联系实际，并亲自上手实践。为降低读者编写代码的难度，本书所有案例的代码都是可以独立运行的，并且尽量减少了对依赖包的使用。本书可以作为理工科相关专业研究生的学位课教材，也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材，还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
售价：35.60

机器学习中的标记增强理论与应用研究/CCF优博丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：徐宁|责编:梁伟//游静出版社：机械工业
丛书项：CCF优博丛书
本书原创性地提出了标记增强这一概念，从0/1标记标注的训练数据中恢复出标记分布，通过连续的“描述度”来显式表达每个标记与数据对象的关联强度，使得预测模型可以在更为丰富的监督信息下进行训练，不仅为扩展标记分布学习范式的适用性提供有力支撑，而且对于探索类别监督信息的本质具有重要意义。本书构建了标记增强基础理论框架，包括标记分布的内在生成机制、标记增强所得标记分布的质量评价机制以及标记增强后学习系统的泛化性能提升机制，并且设计了面向标记增强的专用算法，进而将标记增强应用到既有学习范式上，为解决传统学习问题提供了新思路。本书适合机器学习领域的工程技术人员、高等院校相关专业研究生以及教师阅读。
售价：19.60

深度强化学习(算法原理与金融实践入门)
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：编者:谢文杰//周炜星|责编:杜杨出版社：清华大学
深度强化学习是人工智能和机器学习的重要分支领域，有着广泛应用，如 AlphaGo和ChatGPT。本书作为该领域的入门教材，在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章，大致分为4 部分：第1部分（第1～2章）介绍深度强化学习背景（智能决策、人工智能和机器学习）；第2部分（第3～4 章）介绍深度强化学习基础知识（深度学习和强化学习）；第3部分（第5～9章）介绍深度强化学习经典算法（DQN、AC、DDPG等）；第4部分（第10章）为总结和展望。每章都附有习题并介绍了相关阅读材料，以便有兴趣的读者进一步深入探索。本书可作为高等院校计算机、智能金融及相关专业的本科生或研究生教材，也可供对深度强化学习感兴趣的研究人员和工程技术人员阅读参考。
售价：27.60

控制系统与强化学习/工业自动化与智能化丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(美)肖恩·梅恩|责编:刘锋//冯润峰|译者:王占山//王秋富//葛伊阳出版社：机械工业
丛书项：工业自动化与智能化丛书
本书旨在以具有微积分和矩阵代数背景的学生可以理解的方式，解释强化学习和优化控制背后的科学。本书的一个独特重点是算法设计，以获得学习算法的快收敛速度，以及对强化学习有时失败的原因的洞察。一开始就避开了高级随机过程理论，用更直观的确定性探测来代替学习的随机探索。一旦理解了这些思想，掌握植根于随机控制的技术就不难了。这些主题在本书的第二部分有所涉及，从马尔科夫链理论开始，以对强化学习的行为者批评方法的全新审视结束。
售价：59.60

密码学隐私增强技术导论(新一代信息技术网络空间安全高等教育系列教材)
所属分类：电子电脑>>电工无线电自动化>>无线电电子.电讯作者：编者:鞠雷//刘巍然|责编:张中兴//王静//李萍|总主编:王小云//沈昌祥出版社：科学
本书是新一代信息技术网络空间安全高等教育系列教材之一。隐私增强技术允许在对数据进行处理和分析的同时保护数据的机密性，并且在某些情况下还可以保护数据的完整性及可用性，从而既保护数据主体的隐私，也维护数据控制者的商业利益。这些技术是确保数据安全合规流通的关键。近年来，基于密码学的隐私增强技术在基础理论、算法协议，以及实际应用等方面取得了显著进展，成为学术界和工业界的热点议题。本书全面介绍了包括差分隐私、同态加密、安全多方计算、门限签名、零知识证明等在内的主流密码学隐私增强技术，从发展历程、核心原理到算法分析进行了多维度的阐述，并通过实例展示了它们在人工智能和大数据等场景中的实际应用。本书内容由浅入深，结合理论知识与应用实践，旨在帮助读者掌握隐私增强技术的最新动态，并为进一步学习与应用这些技术打下坚实基础。
售价：35.60

多智能体强化学习(基础与现代方法)/智能系统与技术丛书
所属分类：电子电脑>>电工无线电自动化>>自动化技术作者：(德)斯特凡诺·V.阿尔布莱希特//(希)菲利波斯·克里斯蒂安诺斯//(德)卢卡斯·舍费尔|责编:刘锋//冯润峰|译者:孙罗洋//李欣然//张海峰出版社：机械工业
丛书项：智能系统与技术丛书
多智能体强化学习（Multi-Agent Reinforcement Learning， MARL）是机器学习中的一个领域，研究多个智能体如何在共享环境中学习最优的交互方式。这一领域在现代生活中有着广泛的应用，包括自动驾驶、多机器人工厂、自动化交易和能源网络管理等。本书是一部系统阐述多智能体强化学习理论与技术的权威著作，清晰而严谨地介绍了MARL的模型、解决方案概念、算法思想、技术挑战以及现代方法。书中首先介绍了该领域的基础知识，包括强化学习理论和算法的基础、交互式博弈模型、博弈中的不同解决方案概念以及支撑MARL研究的算法思想。随后，书中详细介绍了利用深度学习技术的现代 MARL算法，涵盖集中训练与分散执行、价值分解、参数共享和自博弈等思想。本书还附带了一个用Python编写的MARL代码库，其中包括自包含且易于阅读的 MARL算法实现。本书技术内容以易于理解的语言解释，并通过大量示例进行说明，既为初学者阐明了MARL的概念，也为专业的读者提供了高层次的见解。
售价：43.60

商品分类