购物车
我的订单
我的账号
帮助
全文搜索
全文搜索
商品名
作者
出版社
ISBN
立即搜索
高级搜索
使用帮助
首 页
本周新书
本月新书
热点销售
畅销排行
每周排行
每月排行
商品分类
图书
>
文学书店
>
经管书店
>
社科书店
>
艺术书店
>
教育书店
>
时尚生活
>
IT 技 术
>
建筑书店
>
科技书店
>
医药书店
>
少儿书店
影音
>
流行音乐店
>
世界音乐店
>
中国民乐店
>
影视音乐店
>
戏曲艺术店
>
电影
>
连续剧
>
教学
>
儿童
>
生活百科
共有
17
个搜索结果
强化学习
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
魏庆来//王飞跃|责编:贾斌
出版社:
清华大学
强化学习是目前机器学 习乃至人工智能领域发展最 快的分支之一。强化学习的 基本思想是通过与环境的交 互、智能体或智能算法获取 相关智能,其具体过程就是 根据环境反馈得到的奖励不 断调整自身的策略进而获得 最大奖励决策的学习历程。 本书主要讲述了强化学习的 基本原理和基本方法,基于 强化学习的控制、决策和优 化方法设计与理论分析,深 度强化学习原理以及平行强 化学习等未来强化学习的发 展新方向,展示从先行后知 到先知后行,再到知行合一 的混合平行智能思路。 本书可作为高等学校人 工智能、机器学习、智能控 制、智能决策、智慧管理、 系统工程以及应用数学等专 业的本科生或研究生教材, 亦可供相关专业科研人员和 工程技术人员参考。
售价:
23.92
EASY RL(强化学习教程)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:王琦//杨毅远//江季|责编:郭媛
出版社:
人民邮电
强化学习作为机器学习 及人工智能领域的一种重要 方法,在游戏、自动驾驶、 机器人路线规划等领域得到 了广泛的应用。 本书结合了李宏毅老师 的“深度强化学习”、周博磊 老师的“强化学习纲要”、李 科浇老师的“世界冠军带你 从零实践强化学习”公开课 的精华内容,在理论严谨的 基础上深入浅出地介绍马尔 可夫决策过程、蒙特卡洛方 法、时序差分方法、Sarsa 、Q学习等传统强化学习算 法,以及策略梯度、近端策 略优化、深度Q网络、深度 确定性策略梯度等常见深度 强化学习算法的基本概念和 方法,并以大量生动有趣的 例子帮助读者理解强化学习 问题的建模过程以及核心算 法的细节。 此外,本书还提供习题 解答以及Python代码实现, 可以让读者进行端到端、从 理论到轻松实践的全生态学 习,充分掌握强化学习算法 的原理并能进行实战。 本书适合对强化学习感 兴趣的读者阅读,也可以作 为相关课程的配套教材。
售价:
39.96
强化学习与机器人控制(精)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(墨)余文//阿道夫·佩鲁斯基亚|责编:王军|译者:刘晓骏
出版社:
清华大学
在《强化学习与机器人 控制》一书中,专家团队不 仅简洁明了地描述了人机交 互控制方案,还深入介绍了 新颖的无模型强化学习控制 器。本书首先简述更先进的 人机交互控制方案和强化学 习,然后讲解典型的环境模 型,最后介绍一些更著名的 参数估计识别技术。 《强化学习与机器人控 制》提供了严谨的数学推理 和演示,这有助于读者理解 控制方案和算法。书中还描 述了人机交互控制和基于强 化学习控制的稳定性和收敛 性分析。另外,还讨论了一 些前沿话题,如逆运动学和 速度运动学解决方案、神经 控制以及机器人领域未来可 能的发展趋势。 ·全面介绍基于模型的人 机交互控制。 ·详细研究基于欧拉角的 无模型人机交互控制和“人 机回圈”机制控制。 ·实际讨论机器人位置和 力控制的强化学习以及机器 人力控制的连续时间强化学 习。 ·深入研究使用强化学习 来控制最坏情况下不确定性 的机器人,并使用多智能体 强化学习对冗余机器人进行 控制。
售价:
39.20
强化学习与深度学习(通过C语言模拟)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(日)小高知宏|译者:张小猛
出版社:
机械工业
本书以深度学习和强化学习作为切入点,通过原 理解析、算法步骤说明、代码实现、代码运行调试, 对强化学习、深度学习以及深度强化学习进行了介绍 和说明。本书共4章。第1章介绍了人工智能、机器学 习、深度学习、强化学习的基本概念。第2章以Q学习 为例,重点介绍了强化学习的原理、算法步骤、代码 实现、代码运行调试。第3章先对深度学习的几种常见 的类型和原理进行介绍,然后给出了例程和调试方法 。第4章以Q学习中运用神经网络为例,介绍了深度强 化学习的基本原理和方法,同时也给出了例程和调试 方法。 本书适合想要获得深度学习进阶知识、强化学习 技术及其应用实践的学生、从业者,特别是立志从事 AI相关行业的人士阅读参考。
售价:
23.60
深度强化学习实战/深度学习系列
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)亚历山大·扎伊//布兰登·布朗|责编:吴晋瑜|译者:李晗
出版社:
人民邮电
丛书项:
深度学习系列
本书先介绍深度强化学 习的基础知识及相关算法, 然后给出多个实战项目,以 期让读者可以根据环境的直 接反馈对智能体加以调整和 改进,进一步提升运用深度 强化学习技术解决实际问题 的能力。本书涵盖深度Q网 络、策略梯度法、演员-评 论家算法、进化算法、 Dist-DQN、多智能体强化学 习、可解释性强化学习等内 容。本书给出的实战项目紧 贴深度强化学习技术的发展 趋势,且所有项目示例以 Jupter Notebook样式给出 ,便于读者修改代码、观察 结果并及时获取经验,能够 带给读者交互式的学习体验 。
售价:
47.92
TensorFlow2强化学习手册/中外学者论AI
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)普拉文·帕拉尼萨米|责编:王芳|译者:陈翔//王玺钧
出版社:
清华大学
丛书项:
中外学者论AI
深度强化学习能够构建 智能体、产品和服务,超越 计算机视觉或感知执行动作 。TensorFlow 2.x是最流行 的深度学习框架的最新主要 版本,用于开发和训练深度 神经网络。 本书介绍了深度强化学 习的基本原理和TensorFlow 的最新版本,同时也介绍了 OpenAl Gym、基于模型和 无模型的强化学习,并学习 如何开发基本智能体。同时 给出了高级深度强化学习算 法(Actor-Critic、深度确定 性策略梯度、深度Q网络、 近端策略优化和深度递归Q 网络等)的实现。
售价:
39.60
网络智能化中的深度强化学习技术
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
戚琦//付霄元//庄子睿//王敬宇//廖建新|责编:代晓丽
出版社:
人民邮电
随着人工智能技术的广 泛应用,网络智能化近年来 受到广泛的关注,已经成为 下一代移动通信与未来网络 的重要技术。阿尔法围棋( AlphaGo)之后,深度强化 学习不断推陈出新,为网络 中的决策问题提供了有效的 潜在解决方案。本书系统介 绍了网络智能化中深度强化 学习的基本理论、算法及应 用场景。全书共8章,针对 互联网、移动通信网、边缘 网络、数据中心等典型网络 ,阐述了网络管理、网络控 制、任务调度等决策需求, 深入论述了深度强化学习的 模型构建与应用技术。第1 章介绍了网络智能的需求与 挑战;第2章介绍了先进的 深度强化学习模型与方法; 第3~6章论述了无线接入优 化、网络管理、网络控制与 任务调度等普遍网络管控任 务中,深度强化学习技术的 应用方法;第7章和第8章论 述了深度强化学习在流媒体 控制以及自组织网络等典型 场景中的新研究进展。 本书可为高等院校计算 机和通信相关专业的本科生 、研究生提供参考,也可供 对网络智能化与深度强化学 习领域感兴趣的研究人员和 工程技术人员参考。
售价:
59.92
图强化学习(原理与实践入门)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:谢文杰//周炜星|责编:杜杨//申美莹
出版社:
清华大学
图强化学习是深度强化 学习的重要分支领域。本书 作为该领域的入门教材,在 内容上尽可能覆盖图强化学 习的基础知识,并提供应用 实践案例。全书共10章,大 致分为三部分:第一部分( 第1~3章)介绍图强化学习 研究对象(复杂系统、图和 复杂网络);第二部分(第 4~7章)介绍图强化学习基 础知识(图嵌入、图神经网 络和深度强化学习);第三 部分(第8~10章)介绍图 强化学习模型框架和应用实 践案例,并进行总结和展望 。每章都附有习题并介绍了 相关阅读材料,以便有兴趣 的读者进一步深入探索。 本书可作为高等院校计 算机、图数据挖掘及相关专 业的本科生或研究生教材, 也可供对图强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
售价:
27.60
信息物理系统强化学习(网络安全示例)/计算机科学丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦
出版社:
机械工业
丛书项:
计算机科学丛书
本书通过系统介绍强化 学习领域的基础与算法,在 强化学习与信息物理系统两 个领域之间建立起联系,每 一部分都列举了一个或几个 最新的信息物理系统示例, 以帮助读者直观地理解强化 学习技术的实用性。本书分 为三个部分。第一部分对强 化学习、信息物理系统和网 络安全进行了概要介绍。第 二部分正式介绍强化学习的 框架,并对强化学习问题进 行定义,给出了两类解决方 法-基于模型的解决方案和 无模型的解决方案。第三部 分通过回顾现有的网络安全 技术并描述新兴的网络威胁 ,将注意力转移到网络安全 ,之后给出了两个案例研究 。
售价:
31.60
智能控制与强化学习(先进值迭代评判设计)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
王鼎//赵明明//哈明鸣//任进|责编:哈爽
出版社:
人民邮电
在人工智能技术的大力 驱动下,智能控制与强化学 习发展迅猛,先进自动化设 计与控制日新月异。本书针 对复杂离散时间系统的优化 调节、最优跟踪、零和博弈 等问题,以实现稳定学习、 演化学习和快速学习为目标 ,建立一套先进的值迭代评 判学习控制理论与设计方法 。首先,对先进值迭代框架 下迭代策略的稳定性进行全 面深入的分析,建立一系列 适用于不同场景的稳定性判 据,从理论层面揭示值迭代 算法能够实现离线最优控制 和在线演化控制。其次,基 于迭代历史信息,提出一种 新颖的收敛速度可调节的值 迭代算法,有助于加快学习 速度、减少计算代价,更高 效地获得非线性系统的最优 控制律。结合人工智能技术 ,对无模型值迭代评判学习 控制的发展前景也进行了讨 论。 本书内容丰富、结构清 晰、由浅入深、分析透彻, 既可作为智能控制、强化学 习、优化控制、计算智能、 自适应与学习系统等领域研 究人员和学生的参考书,又 可供相关领域的技术人员使 用。
售价:
55.92
深度强化学习理论与实践/计算机技术开发与应用丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:龙强//章胜|责编:赵佳霓
出版社:
清华大学
丛书项:
计算机技术开发与应用丛书
本书比较全面、系统地 介绍了深度强化学习的理论 和算法,并配有大量的案例 和编程实现的代码。全书核 心内容可以分为3部分,第 一部分为经典强化学习,包 括第2~4章,主要内容有动 态规划法、蒙特卡罗法、时 序差分法;第二部分为深度 强化学习,包括第6~8章, 主要内容有值函数近似算法 、策略梯度算法、策略梯度 法进阶;第三部分重点介绍 深度强化学习的经典应用案 例——AlphaGo系列算法。 另外,作为理论和算法的辅 助,第1章介绍强化学习的 模型,第5章简单介绍深度 学习和PyTorch。 本书对理论、模型和算 法的描述比较数学化,笔者 力求做到用严谨、清晰、简 洁的数学语言来写作;几乎 每个算法配有一个或多个测 试案例,便于读者理解理论 和算法;每个案例都配有编 程实现的代码,便于读者理 论联系实际,并亲自上手实 践。为降低读者编写代码的 难度,本书所有案例的代码 都是可以独立运行的,并且 尽量减少了对依赖包的使用 。 本书可以作为理工科相 关专业研究生的学位课教材 ,也可以作为人工智能、机 器学习相关专业高年级本科 生的选修课教材,还可以作 为相关领域学术研究人员、 教师和工程技术人员的参考 资料。
售价:
35.60
强化学习入门(基于Python)/基于Python的数据分析丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:吴喜之//张敏|责编:胡志敏
出版社:
中国人民大学
丛书项:
基于Python的数据分析丛书
强化学习是三种基本机 器学习范式之一,与监督学 习和无监督学习并驾齐驱。 强化学习是一种自我进化的 机器学习类型,它使我们更 接近于实现真正的人工智能 (AI)。强化学习是机器学 习的一个分支,其中学习是 通过与环境交互来进行的。 强化学习是面向目标的学习 ,不教学习者采取什么行动 ,相反,学习者从其行为的 结果中学习。从早年的 AlphaGo到最近的ChatGPT 等人工智能产品表明,强化 学习已成为人工智能研究中 最活跃的领域之一。 没有实例做背景的概念 是没有生命力的,没有实践 支撑的算法是学不会的。本 书试图通过各种类型的实例 来介绍强化学习的各个方面 ,尽量避免因分类理念而造 成的麻烦。使用本书时最好 先看本书1.1节和1.2节的一 些例子,明白这些例子要做 些什么,不必完全明白其中 使用的代码。然后浏览1.7 节的例子,这些例子中的问 题是后面要解决的,因此需 要先有些印象。在此之后, 大致看看1.3~1.6节的知识 性内容,即使不能够马上理 解这些内容,也没有关系, 但要尽量掌握第2章关于马 尔可夫决策过程的理论知识 ,如果觉得理解起来困难, 可以结合第3章中的各种更 加具体的强化学习方法及具 体例子的编程,还可以回顾 第2章及第1章的有关内容。 这种在实践和理论(方法) 之间反复相互促进的方式是 学好强化学习的关键。最后 3章包含了关于Python、 PyTorch的内容及一些数学 知识。这些内容读者可根据 需要来学习或参考。 本书是一本面向希望从 头开始学习强化学习的数据 科学类专业(包括统计类专 业)的师生、实际工作者、 机器学习开发人员和深度学 习爱好者等广大读者的强化 学习入门书籍。
售价:
19.60
机器学习中的标记增强理论与应用研究/CCF优博丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
徐宁|责编:梁伟//游静
出版社:
机械工业
丛书项:
CCF优博丛书
本书原创性地提出了标 记增强这一概念,从0/1标 记标注的训练数据中恢复出 标记分布,通过连续的“描 述度”来显式表达每个标记 与数据对象的关联强度,使 得预测模型可以在更为丰富 的监督信息下进行训练,不 仅为扩展标记分布学习范式 的适用性提供有力支撑,而 且对于探索类别监督信息的 本质具有重要意义。 本书构建了标记增强基 础理论框架,包括标记分布 的内在生成机制、标记增强 所得标记分布的质量评价机 制以及标记增强后学习系统 的泛化性能提升机制,并且 设计了面向标记增强的专用 算法,进而将标记增强应用 到既有学习范式上,为解决 传统学习问题提供了新思路 。 本书适合机器学习领域 的工程技术人员、高等院校 相关专业研究生以及教师阅 读。
售价:
19.60
深度强化学习(算法原理与金融实践入门)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:谢文杰//周炜星|责编:杜杨
出版社:
清华大学
深度强化学习是人工智 能和机器学习的重要分支领 域,有着广泛应用,如 AlphaGo和ChatGPT。本书 作为该领域的入门教材,在 内容上尽可能覆盖深度强化 学习的基础知识和经典算法 。全书共10章,大致分为4 部分:第1部分(第1~2章 )介绍深度强化学习背景( 智能决策、人工智能和机器 学习);第2部分(第3~4 章)介绍深度强化学习基础 知识(深度学习和强化学习 );第3部分(第5~9章) 介绍深度强化学习经典算法 (DQN、AC、DDPG等); 第4部分(第10章)为总结 和展望。每章都附有习题并 介绍了相关阅读材料,以便 有兴趣的读者进一步深入探 索。 本书可作为高等院校计 算机、智能金融及相关专业 的本科生或研究生教材,也 可供对深度强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
售价:
27.60
深度强化学习(学术前沿与实战应用)/智能科学与技术丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:刘驰//王占健//戴子彭//马晓鑫//朴成哲等|责编:姚蕾
出版社:
机械工业
丛书项:
智能科学与技术丛书
本书共分为四篇,即深度强化学习、多智能体深 度强化学习、多任务深度强化学习和深度强化学习的 应用。由浅入深、通俗易懂,涵盖经典算法和近几年 的前沿技术进展。特别是书中详细介绍了每一种代表 性算法的代码原型实现,旨在理论与实践相结合,让 读者学有所得、学有所用。 第一篇(包含第1~3章)主要讲解深度强化学习 基础,侧重于单智能体强化学习算法,相对简单,有 助于初级读者理解,同时涵盖了近几年的经典算法和 一些前沿的研究成果。 第二篇(包含第4~5章)主要侧重于对多智能体 深度强化学习的讲解,从多智能体强化学习基本概念 到相关算法的讲解和分析,以多个极具代表性的算法 为例带领读者逐步学习多智能体训练及控制的理论与 方法。同时,还介绍了多智能体强化学习领域一些前 沿学术成果。 第三篇(包含第6~7章)扩展到多任务场景,称 为多任务深度强化学习。首先介绍了多任务强化学习 的基本概念和相关基础知识,随后讲解了部分经典的 多任务深度强化学习算法。 第四篇(包含第8~11章)主要讲解深度强化学习 的实际应用,涉及游戏、机器人控制、计算机视觉和 自然语言处理四大领域。通过领域应用中思想和方法 的讲解,培养读者跨领域解决实际问题的能力,以帮 助读者熟练掌握和使用深度强化学习这一强大的方法 来解决和优化实际工程领域中的问题。
售价:
39.60
密码学隐私增强技术导论(新一代信息技术网络空间安全高等教育系列教材)
所属分类:
电子电脑
>>
电工无线电自动化
>>
无线电电子.电讯
作者:
编者:鞠雷//刘巍然|责编:张中兴//王静//李萍|总主编:王小云//沈昌祥
出版社:
科学
本书是新一代信息技术 网络空间安全高等教育系列 教材之一。隐私增强技术允 许在对数据进行处理和分析 的同时保护数据的机密性, 并且在某些情况下还可以保 护数据的完整性及可用性, 从而既保护数据主体的隐私 ,也维护数据控制者的商业 利益。这些技术是确保数据 安全合规流通的关键。近年 来,基于密码学的隐私增强 技术在基础理论、算法协议 ,以及实际应用等方面取得 了显著进展,成为学术界和 工业界的热点议题。本书全 面介绍了包括差分隐私、同 态加密、安全多方计算、门 限签名、零知识证明等在内 的主流密码学隐私增强技术 ,从发展历程、核心原理到 算法分析进行了多维度的阐 述,并通过实例展示了它们 在人工智能和大数据等场景 中的实际应用。本书内容由 浅入深,结合理论知识与应 用实践,旨在帮助读者掌握 隐私增强技术的最新动态, 并为进一步学习与应用这些 技术打下坚实基础。
售价:
35.60
传感器与检测技术简明教程(强化课程思政工程教育和深度学习模式提质赋能特色教材)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:胡蓉//胡向东|责编:张振霞
出版社:
机械工业
本书是重庆市线上线下 混合式一流课程、重庆市课 程思政示范课程配套教材, 是“十二五”普通高等教育本 科国家级规划教材《传感器 与检测技术》(胡向东主编 )的简明版。本书针对新工 科背景下的信息获取与智能 感知类创新型人才培养需求 ,瞄准传感器与检测技术系 统领域知识构建、素质提升 和能力发展目标,系统介绍 传感器与检测技术的基础概 念、基本原理、典型应用和 技术发展。内容包括概述、 传感器的基本特性、电阻式 传感器、电感式传感器、电 容式传感器、压电式传感器 、磁敏式传感器、热电式传 感器、光电式传感器、辐射 与波式传感器、新型传感器 、参数检测、误差理论与数 据处理基础、自动检测系统 。 本书以学习者为中心, 知识体系精练优化,内容与 时俱进,在线资源丰富;价 值观、方法论与知识点融会 贯通,推行“学思践创融合” 深度学习模式,强化新工科 背景下质量导向的深学善思 、质疑批判和工程实践,赋 能卓越创新,适应最新发展 。 本书可作为高等院校测 控技术与仪器、自动化、电 气工程及其自动化、机械设 计制造及其自动化、智能感 知工程、机器人工程、物联 网工程、电子与电气工程、 车辆工程、交通工程、工业 智能等专业本科生的教材, 也可供从事传感器与检测技 术相关领域应用和设计开发 的研究人员、工程技术人员 参考。
售价:
26.00
共有
17
个搜索结果
共有
1
页
第一页
上一页
下一页
最后页
转到第