购物车
我的订单
我的账号
帮助
全文搜索
全文搜索
商品名
作者
出版社
ISBN
立即搜索
高级搜索
使用帮助
首 页
本周新书
本月新书
热点销售
畅销排行
每周排行
每月排行
商品分类
图书
>
文学书店
>
经管书店
>
社科书店
>
艺术书店
>
教育书店
>
时尚生活
>
IT 技 术
>
建筑书店
>
科技书店
>
医药书店
>
少儿书店
影音
>
流行音乐店
>
世界音乐店
>
中国民乐店
>
影视音乐店
>
戏曲艺术店
>
电影
>
连续剧
>
教学
>
儿童
>
生活百科
共有
20
个搜索结果
强化学习
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
魏庆来//王飞跃|责编:贾斌
出版社:
清华大学
强化学习是目前机器学 习乃至人工智能领域发展最 快的分支之一。强化学习的 基本思想是通过与环境的交 互、智能体或智能算法获取 相关智能,其具体过程就是 根据环境反馈得到的奖励不 断调整自身的策略进而获得 最大奖励决策的学习历程。 本书主要讲述了强化学习的 基本原理和基本方法,基于 强化学习的控制、决策和优 化方法设计与理论分析,深 度强化学习原理以及平行强 化学习等未来强化学习的发 展新方向,展示从先行后知 到先知后行,再到知行合一 的混合平行智能思路。 本书可作为高等学校人 工智能、机器学习、智能控 制、智能决策、智慧管理、 系统工程以及应用数学等专 业的本科生或研究生教材, 亦可供相关专业科研人员和 工程技术人员参考。
售价:
23.92
EASY RL(强化学习教程)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:王琦//杨毅远//江季|责编:郭媛
出版社:
人民邮电
强化学习作为机器学习 及人工智能领域的一种重要 方法,在游戏、自动驾驶、 机器人路线规划等领域得到 了广泛的应用。 本书结合了李宏毅老师 的“深度强化学习”、周博磊 老师的“强化学习纲要”、李 科浇老师的“世界冠军带你 从零实践强化学习”公开课 的精华内容,在理论严谨的 基础上深入浅出地介绍马尔 可夫决策过程、蒙特卡洛方 法、时序差分方法、Sarsa 、Q学习等传统强化学习算 法,以及策略梯度、近端策 略优化、深度Q网络、深度 确定性策略梯度等常见深度 强化学习算法的基本概念和 方法,并以大量生动有趣的 例子帮助读者理解强化学习 问题的建模过程以及核心算 法的细节。 此外,本书还提供习题 解答以及Python代码实现, 可以让读者进行端到端、从 理论到轻松实践的全生态学 习,充分掌握强化学习算法 的原理并能进行实战。 本书适合对强化学习感 兴趣的读者阅读,也可以作 为相关课程的配套教材。
售价:
39.96
强化学习与机器人控制(精)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(墨)余文//阿道夫·佩鲁斯基亚|责编:王军|译者:刘晓骏
出版社:
清华大学
在《强化学习与机器人 控制》一书中,专家团队不 仅简洁明了地描述了人机交 互控制方案,还深入介绍了 新颖的无模型强化学习控制 器。本书首先简述更先进的 人机交互控制方案和强化学 习,然后讲解典型的环境模 型,最后介绍一些更著名的 参数估计识别技术。 《强化学习与机器人控 制》提供了严谨的数学推理 和演示,这有助于读者理解 控制方案和算法。书中还描 述了人机交互控制和基于强 化学习控制的稳定性和收敛 性分析。另外,还讨论了一 些前沿话题,如逆运动学和 速度运动学解决方案、神经 控制以及机器人领域未来可 能的发展趋势。 ·全面介绍基于模型的人 机交互控制。 ·详细研究基于欧拉角的 无模型人机交互控制和“人 机回圈”机制控制。 ·实际讨论机器人位置和 力控制的强化学习以及机器 人力控制的连续时间强化学 习。 ·深入研究使用强化学习 来控制最坏情况下不确定性 的机器人,并使用多智能体 强化学习对冗余机器人进行 控制。
售价:
39.20
深度强化学习原理与实践
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
陈喆|责编:白立军//常建丽
出版社:
清华大学
本书从原理的角度,力 求讲解清楚深度学习、强化 学习、深度强化学习中的一 些精选方法,并从实践的角 度,通过一系列循序渐进的 原创实验,引领读者独立编 程实现这些方法,以期为读 者精通深度强化学习并应用 深度强化学习方法解决实际 问题奠定坚实基础。 本书不仅适合计算机科 学与技术、人工智能、物联 网工程、数据科学与大数据 、软件工程、通信工程、电 子信息、机器人工程、自动 化、智能制造等相关专业高 年级本科生及研究生教学与 自学使用,也适合机器学习 等领域的从业者、科研人员 及爱好者自学与参考使用。
售价:
23.60
深度强化学习/图灵原创
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
王树森//黎彧君//张志华|责编:刘美英
出版社:
人民邮电
丛书项:
图灵原创
本书基于备受读者推 崇的王树森“深度强化学 习”系列公开视频课,专 门解决“入门深度强化学 习难”的问题。 本书的独特之处在于 :第一,知识精简,剔除 一切不必要的概念和公式 ,学起来轻松;第二,内 容新颖,聚焦近10年深度 强化学习领域的突破,让 你一上手就紧跟最新技术 。 本书系统讲解深度强 化学习的原理与实现,但 不回避数学公式和各种模 型,原创100多幅精美插 图,并以全彩印刷展示。 简洁清晰的语言+生动形 象的图示,助你扫除任何 可能的学习障碍!本书内 容分为五部分:基础知识 、价值学习、策略学习、 多智能体强化学习、应用 与展望,涉及DQN、A3C 、TRPO、DDPG、 AlphaGo等。 本书面向深度强化学 习入门读者,助你构建完 整的知识体系。学完本书 ,你能够轻松看懂深度强 化学习的实现代码、读懂 该领域的论文、听懂学术 报告,具备进一步自学和 深挖的能力。
售价:
51.92
深度强化学习实战/深度学习系列
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)亚历山大·扎伊//布兰登·布朗|责编:吴晋瑜|译者:李晗
出版社:
人民邮电
丛书项:
深度学习系列
本书先介绍深度强化学 习的基础知识及相关算法, 然后给出多个实战项目,以 期让读者可以根据环境的直 接反馈对智能体加以调整和 改进,进一步提升运用深度 强化学习技术解决实际问题 的能力。本书涵盖深度Q网 络、策略梯度法、演员-评 论家算法、进化算法、 Dist-DQN、多智能体强化学 习、可解释性强化学习等内 容。本书给出的实战项目紧 贴深度强化学习技术的发展 趋势,且所有项目示例以 Jupter Notebook样式给出 ,便于读者修改代码、观察 结果并及时获取经验,能够 带给读者交互式的学习体验 。
售价:
47.92
TensorFlow2强化学习手册/中外学者论AI
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)普拉文·帕拉尼萨米|责编:王芳|译者:陈翔//王玺钧
出版社:
清华大学
丛书项:
中外学者论AI
深度强化学习能够构建 智能体、产品和服务,超越 计算机视觉或感知执行动作 。TensorFlow 2.x是最流行 的深度学习框架的最新主要 版本,用于开发和训练深度 神经网络。 本书介绍了深度强化学 习的基本原理和TensorFlow 的最新版本,同时也介绍了 OpenAl Gym、基于模型和 无模型的强化学习,并学习 如何开发基本智能体。同时 给出了高级深度强化学习算 法(Actor-Critic、深度确定 性策略梯度、深度Q网络、 近端策略优化和深度递归Q 网络等)的实现。
售价:
39.60
强化学习的数学原理(英文版)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
赵世钰|责编:郭赛
出版社:
清华大学
本书从强化学习最基本 的概念开始介绍,将介绍基 础的分析工具,包括贝尔曼 公式和贝尔曼最优公式,然 后推广到基于模型的和无模 型的强化学习算法,最后推 广到基于函数逼近的强化学 法。本书强调从数学的角度 引入概念、分析问题、分析 算法,并不强调算法的编程 实现。本书不要求读者具备 任何关于强化学习的知识背 景,仅要求读者具备一定的 概率论和线性代数的知识。 如果读者已经具备强化学习 的学习基础,本书可以帮助 读者更深入地理解一些问题 并提供新的视角。 本书面向对强化学习感 兴趣的本科生、研究生、研 究人员和企业或研究所的从 业者。
售价:
47.20
网络智能化中的深度强化学习技术
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
戚琦//付霄元//庄子睿//王敬宇//廖建新|责编:代晓丽
出版社:
人民邮电
随着人工智能技术的广 泛应用,网络智能化近年来 受到广泛的关注,已经成为 下一代移动通信与未来网络 的重要技术。阿尔法围棋( AlphaGo)之后,深度强化 学习不断推陈出新,为网络 中的决策问题提供了有效的 潜在解决方案。本书系统介 绍了网络智能化中深度强化 学习的基本理论、算法及应 用场景。全书共8章,针对 互联网、移动通信网、边缘 网络、数据中心等典型网络 ,阐述了网络管理、网络控 制、任务调度等决策需求, 深入论述了深度强化学习的 模型构建与应用技术。第1 章介绍了网络智能的需求与 挑战;第2章介绍了先进的 深度强化学习模型与方法; 第3~6章论述了无线接入优 化、网络管理、网络控制与 任务调度等普遍网络管控任 务中,深度强化学习技术的 应用方法;第7章和第8章论 述了深度强化学习在流媒体 控制以及自组织网络等典型 场景中的新研究进展。 本书可为高等院校计算 机和通信相关专业的本科生 、研究生提供参考,也可供 对网络智能化与深度强化学 习领域感兴趣的研究人员和 工程技术人员参考。
售价:
59.92
图强化学习(原理与实践入门)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:谢文杰//周炜星|责编:杜杨//申美莹
出版社:
清华大学
图强化学习是深度强化 学习的重要分支领域。本书 作为该领域的入门教材,在 内容上尽可能覆盖图强化学 习的基础知识,并提供应用 实践案例。全书共10章,大 致分为三部分:第一部分( 第1~3章)介绍图强化学习 研究对象(复杂系统、图和 复杂网络);第二部分(第 4~7章)介绍图强化学习基 础知识(图嵌入、图神经网 络和深度强化学习);第三 部分(第8~10章)介绍图 强化学习模型框架和应用实 践案例,并进行总结和展望 。每章都附有习题并介绍了 相关阅读材料,以便有兴趣 的读者进一步深入探索。 本书可作为高等院校计 算机、图数据挖掘及相关专 业的本科生或研究生教材, 也可供对图强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
售价:
27.60
强化学习入门(从原理到实践)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:叶强//闫维新//黎斌|责编:迟振春
出版社:
机械工业
强化学习主要研究的问 题是:具有一定思考和行为 能力的个体在与其所处的环 境进行交互的过程中,通过 学习策略达到收获最大化或 实现特定的目标。 本书以理论和实践相结 合的形式深入浅出地介绍强 化学习的历史、基本概念、 经典算法和一些前沿技术, 共分为三大部分:第一部分 (第1~5章)介绍强化学习 的发展历史、基本概念以及 一些经典的强化学习算法; 第二部分(第6~9章)在简 要回顾深度学习技术的基础 上着重介绍深度强化学习的 一些前沿实用算法;第三部 分(第10章)以五子棋为例 详细讲解战胜了人类顶级围 棋选手的Alpha Zero算法的 核心思想。 对于本书介绍的每一个 经典算法,我们都结合了一 定的应用场景,详细介绍如 何用Python代码来实现。 本书既可以作为计算机 专业高年级本科生及硕士生 关于人工智能领域的入门参 考读物,也可以作为对人工 智能技术(特别是强化学习 技术)感兴趣的人员理解强 化学习思想的补充读物。
售价:
31.60
信息物理系统强化学习(网络安全示例)/计算机科学丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦
出版社:
机械工业
丛书项:
计算机科学丛书
本书通过系统介绍强化 学习领域的基础与算法,在 强化学习与信息物理系统两 个领域之间建立起联系,每 一部分都列举了一个或几个 最新的信息物理系统示例, 以帮助读者直观地理解强化 学习技术的实用性。本书分 为三个部分。第一部分对强 化学习、信息物理系统和网 络安全进行了概要介绍。第 二部分正式介绍强化学习的 框架,并对强化学习问题进 行定义,给出了两类解决方 法-基于模型的解决方案和 无模型的解决方案。第三部 分通过回顾现有的网络安全 技术并描述新兴的网络威胁 ,将注意力转移到网络安全 ,之后给出了两个案例研究 。
售价:
31.60
深度学习入门(4强化学习)/图灵程序设计丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(日)斋藤康毅|责编:张海艳|译者:郑明智
出版社:
人民邮电
丛书项:
图灵程序设计丛书
本书前半部分介绍强化 学习的重要思想和基础知识 ,后半部分介绍如何将深度 学习应用于强化学习,遴选 讲解了深度强化学习的最新 技术。全书从最适合入门的 多臂老虎机问题切入,依次 介绍了定义一般强化学习问 题的马尔可夫决策过程、用 于寻找最佳答案的贝尔曼方 程,以及解决贝尔曼方程的 动态规划法、蒙特卡洛方法 和TD方法。随后,神经网 络和Q学习、DQN、策略梯 度法等几章则分别讨论了深 度学习在强化学习领域的应 用。本书延续“鱼书”系列的 风格,搭配丰富的图、表、 代码示例,加上轻松、简明 的讲解,让人循序渐进地理 解强化学习中各种方法之间 的关系,于不知不觉中登堂 入室。
售价:
43.92
智能控制与强化学习(先进值迭代评判设计)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
王鼎//赵明明//哈明鸣//任进|责编:哈爽
出版社:
人民邮电
在人工智能技术的大力 驱动下,智能控制与强化学 习发展迅猛,先进自动化设 计与控制日新月异。本书针 对复杂离散时间系统的优化 调节、最优跟踪、零和博弈 等问题,以实现稳定学习、 演化学习和快速学习为目标 ,建立一套先进的值迭代评 判学习控制理论与设计方法 。首先,对先进值迭代框架 下迭代策略的稳定性进行全 面深入的分析,建立一系列 适用于不同场景的稳定性判 据,从理论层面揭示值迭代 算法能够实现离线最优控制 和在线演化控制。其次,基 于迭代历史信息,提出一种 新颖的收敛速度可调节的值 迭代算法,有助于加快学习 速度、减少计算代价,更高 效地获得非线性系统的最优 控制律。结合人工智能技术 ,对无模型值迭代评判学习 控制的发展前景也进行了讨 论。 本书内容丰富、结构清 晰、由浅入深、分析透彻, 既可作为智能控制、强化学 习、优化控制、计算智能、 自适应与学习系统等领域研 究人员和学生的参考书,又 可供相关领域的技术人员使 用。
售价:
55.92
深度强化学习理论与实践/计算机技术开发与应用丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:龙强//章胜|责编:赵佳霓
出版社:
清华大学
丛书项:
计算机技术开发与应用丛书
本书比较全面、系统地 介绍了深度强化学习的理论 和算法,并配有大量的案例 和编程实现的代码。全书核 心内容可以分为3部分,第 一部分为经典强化学习,包 括第2~4章,主要内容有动 态规划法、蒙特卡罗法、时 序差分法;第二部分为深度 强化学习,包括第6~8章, 主要内容有值函数近似算法 、策略梯度算法、策略梯度 法进阶;第三部分重点介绍 深度强化学习的经典应用案 例——AlphaGo系列算法。 另外,作为理论和算法的辅 助,第1章介绍强化学习的 模型,第5章简单介绍深度 学习和PyTorch。 本书对理论、模型和算 法的描述比较数学化,笔者 力求做到用严谨、清晰、简 洁的数学语言来写作;几乎 每个算法配有一个或多个测 试案例,便于读者理解理论 和算法;每个案例都配有编 程实现的代码,便于读者理 论联系实际,并亲自上手实 践。为降低读者编写代码的 难度,本书所有案例的代码 都是可以独立运行的,并且 尽量减少了对依赖包的使用 。 本书可以作为理工科相 关专业研究生的学位课教材 ,也可以作为人工智能、机 器学习相关专业高年级本科 生的选修课教材,还可以作 为相关领域学术研究人员、 教师和工程技术人员的参考 资料。
售价:
35.60
机器学习中的标记增强理论与应用研究/CCF优博丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
徐宁|责编:梁伟//游静
出版社:
机械工业
丛书项:
CCF优博丛书
本书原创性地提出了标 记增强这一概念,从0/1标 记标注的训练数据中恢复出 标记分布,通过连续的“描 述度”来显式表达每个标记 与数据对象的关联强度,使 得预测模型可以在更为丰富 的监督信息下进行训练,不 仅为扩展标记分布学习范式 的适用性提供有力支撑,而 且对于探索类别监督信息的 本质具有重要意义。 本书构建了标记增强基 础理论框架,包括标记分布 的内在生成机制、标记增强 所得标记分布的质量评价机 制以及标记增强后学习系统 的泛化性能提升机制,并且 设计了面向标记增强的专用 算法,进而将标记增强应用 到既有学习范式上,为解决 传统学习问题提供了新思路 。 本书适合机器学习领域 的工程技术人员、高等院校 相关专业研究生以及教师阅 读。
售价:
19.60
深度强化学习(算法原理与金融实践入门)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:谢文杰//周炜星|责编:杜杨
出版社:
清华大学
深度强化学习是人工智 能和机器学习的重要分支领 域,有着广泛应用,如 AlphaGo和ChatGPT。本书 作为该领域的入门教材,在 内容上尽可能覆盖深度强化 学习的基础知识和经典算法 。全书共10章,大致分为4 部分:第1部分(第1~2章 )介绍深度强化学习背景( 智能决策、人工智能和机器 学习);第2部分(第3~4 章)介绍深度强化学习基础 知识(深度学习和强化学习 );第3部分(第5~9章) 介绍深度强化学习经典算法 (DQN、AC、DDPG等); 第4部分(第10章)为总结 和展望。每章都附有习题并 介绍了相关阅读材料,以便 有兴趣的读者进一步深入探 索。 本书可作为高等院校计 算机、智能金融及相关专业 的本科生或研究生教材,也 可供对深度强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
售价:
27.60
控制系统与强化学习/工业自动化与智能化丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)肖恩·梅恩|责编:刘锋//冯润峰|译者:王占山//王秋富//葛伊阳
出版社:
机械工业
丛书项:
工业自动化与智能化丛书
本书旨在以具有微积分 和矩阵代数背景的学生可以 理解的方式,解释强化学习 和优化控制背后的科学。本 书的一个独特重点是算法设 计,以获得学习算法的快收 敛速度,以及对强化学习有 时失败的原因的洞察。一开 始就避开了高级随机过程理 论,用更直观的确定性探测 来代替学习的随机探索。一 旦理解了这些思想,掌握植 根于随机控制的技术就不难 了。这些主题在本书的第二 部分有所涉及,从马尔科夫 链理论开始,以对强化学习 的行为者批评方法的全新审 视结束。
售价:
59.60
密码学隐私增强技术导论(新一代信息技术网络空间安全高等教育系列教材)
所属分类:
电子电脑
>>
电工无线电自动化
>>
无线电电子.电讯
作者:
编者:鞠雷//刘巍然|责编:张中兴//王静//李萍|总主编:王小云//沈昌祥
出版社:
科学
本书是新一代信息技术 网络空间安全高等教育系列 教材之一。隐私增强技术允 许在对数据进行处理和分析 的同时保护数据的机密性, 并且在某些情况下还可以保 护数据的完整性及可用性, 从而既保护数据主体的隐私 ,也维护数据控制者的商业 利益。这些技术是确保数据 安全合规流通的关键。近年 来,基于密码学的隐私增强 技术在基础理论、算法协议 ,以及实际应用等方面取得 了显著进展,成为学术界和 工业界的热点议题。本书全 面介绍了包括差分隐私、同 态加密、安全多方计算、门 限签名、零知识证明等在内 的主流密码学隐私增强技术 ,从发展历程、核心原理到 算法分析进行了多维度的阐 述,并通过实例展示了它们 在人工智能和大数据等场景 中的实际应用。本书内容由 浅入深,结合理论知识与应 用实践,旨在帮助读者掌握 隐私增强技术的最新动态, 并为进一步学习与应用这些 技术打下坚实基础。
售价:
35.60
多智能体强化学习(基础与现代方法)/智能系统与技术丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(德)斯特凡诺·V.阿尔布莱希特//(希)菲利波斯·克里斯蒂安诺斯//(德)卢卡斯·舍费尔|责编:刘锋//冯润峰|译者:孙罗洋//李欣然//张海峰
出版社:
机械工业
丛书项:
智能系统与技术丛书
多智能体强化学习 (Multi-Agent Reinforcement Learning, MARL)是机器学习中的一 个领域,研究多个智能体如 何在共享环境中学习最优的 交互方式。这一领域在现代 生活中有着广泛的应用,包 括自动驾驶、多机器人工厂 、自动化交易和能源网络管 理等。 本书是一部系统阐述多 智能体强化学习理论与技术 的权威著作,清晰而严谨地 介绍了MARL的模型、解决 方案概念、算法思想、技术 挑战以及现代方法。书中首 先介绍了该领域的基础知识 ,包括强化学习理论和算法 的基础、交互式博弈模型、 博弈中的不同解决方案概念 以及支撑MARL研究的算法 思想。随后,书中详细介绍 了利用深度学习技术的现代 MARL算法,涵盖集中训练 与分散执行、价值分解、参 数共享和自博弈等思想。本 书还附带了一个用Python编 写的MARL代码库,其中包 括自包含且易于阅读的 MARL算法实现。 本书技术内容以易于理 解的语言解释,并通过大量 示例进行说明,既为初学者 阐明了MARL的概念,也为 专业的读者提供了高层次的 见解。
售价:
43.60
共有
20
个搜索结果
共有
1
页
第一页
上一页
下一页
最后页
转到第