幫助中心
|
我的帳號
|
關於我們
全文搜索
商品名
作者
出版社
ISBN
高級搜索
首頁
本周新書
本月新書
熱點銷售
暢銷排行
每週排行
每月排行
最近浏覽的商品
當下的力量--找回每時每刻的自己
靈魂轉生的奧秘
前世今生來生緣~穿越時空的靈魂之旅
老鷹的羽毛-現代女巫的生命探索之旅
请选择排序方式:
类别
版别
出版年月↓
折扣↓
定价↓
共有
5
个搜索结果 共有
1
页
第一页
上一页
下一页
最后页
转到第
页
深度强化学习实战/深度学习系列
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)亚历山大·扎伊//布兰登·布朗|责编:吴晋瑜|译者:李晗
出版社:
人民邮电
丛书项:
深度学习系列
本书先介绍深度强化学 习的基础知识及相关算法, 然后给出多个实战项目,以 期让读者可以根据环境的直 接反馈对智能体加以调整和 改进,进一步提升运用深度 强化学习技术解决实际问题 的能力。本书涵盖深度Q网 络、策略梯度法、演员-评 论家算法、进化算法、 Dist-DQN、多智能体强化学 习、可解释性强化学习等内 容。本书给出的实战项目紧 贴深度强化学习技术的发展 趋势,且所有项目示例以 Jupter Notebook样式给出 ,便于读者修改代码、观察 结果并及时获取经验,能够 带给读者交互式的学习体验 。
人民幣:
RMB 119.80
元 售价:
NT$ 479.20
元
信息物理系统强化学习(网络安全示例)/计算机科学丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦
出版社:
机械工业
丛书项:
计算机科学丛书
本书通过系统介绍强化 学习领域的基础与算法,在 强化学习与信息物理系统两 个领域之间建立起联系,每 一部分都列举了一个或几个 最新的信息物理系统示例, 以帮助读者直观地理解强化 学习技术的实用性。本书分 为三个部分。第一部分对强 化学习、信息物理系统和网 络安全进行了概要介绍。第 二部分正式介绍强化学习的 框架,并对强化学习问题进 行定义,给出了两类解决方 法-基于模型的解决方案和 无模型的解决方案。第三部 分通过回顾现有的网络安全 技术并描述新兴的网络威胁 ,将注意力转移到网络安全 ,之后给出了两个案例研究 。
人民幣:
RMB 79.00
元 售价:
NT$ 316.00
元
深度强化学习实践(原书第2版)/智能系统与技术丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(俄)马克西姆·拉潘|责编:王春华//李忠明|译者:林然//王薇
出版社:
机械工业
丛书项:
智能系统与技术丛书
本书包括新的强化学习 工具和技术,介绍了强化学 习的基础知识,以及如何动 手编写智能体以执行一系列 实际任务。本书较上一版新 增6章,专门介绍了强化学 习的新发展,包括离散优化 (解决魔方问题)、多智能 体方法、Microsoft的 TextWorld环境、高级探索 技术等。学完本书,你将对 这个新兴领域的前沿技术有 深刻的理解。此外,你将获 得对深度Q-network、策略 梯度方法、连续控制问题以 及高度可扩展的非梯度方法 等领域的可行洞见,还将学 会如何构建经过强化学习训 练、价格低廉的真实硬件机 器人,并通过逐步代码优化 在短短30分钟的训练后解决 Pong环境问题。 简而言之,本书将帮助 你探索强化学习中令人兴奋 的复杂主题,让你通过实例 获得经验和知识。通过阅读 本书,你将: ·了解强化学习的深度学 习上下文并实现复杂的深度 学习模型。 ·学会评估强化学习的方 法,包括交叉熵、DQN、 actor-critic、TRPO、PPO、 DDPG、D4PG等。 ·学会构建经过强化学习 方法训练的、价格低廉的硬 件机器人。 ·研究Microsoft的 TextWorld环境,这是一个 文字冒险游戏平台。 ·学会在强化学习中使用 离散优化来解决魔方问题。 ·学会教你的智能体使用 AlphaGo Zero玩四子连横棋 。 ·探索有关Al聊天机器人 等主题的较新深度强化学习 技术。 ·研究先进的探索技术, 包括噪声网络和网络蒸馏技 术。
人民幣:
RMB 149.00
元 售价:
NT$ 596.00
元
多机器人系统强化学习/信息科学技术前沿丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
张文旭//王晓东|责编:满志文
出版社:
北京邮电大学
丛书项:
信息科学技术前沿丛书
强化学习是机器学习领 域的一种重要学习手段,是 一种从环境状态到行为映射 的学习方式,是实现智能系 统具有自适应能力、自学习 能力的重要途径。本书以强 化学习算法与多机器人系统 的结合为主要背景,介绍了 主要的强化学习算法模型, 讨论了它们的原理和优缺点 ;本书针对多机器人协作, 从实际应用问题的角度分析 ,指出了局部性、不确定性 和自组织网络等在学习中的 现实意义;本书针对强化学 习存在的学习速度慢、计算 复杂度高等问题,研究了几 种改进算法,并基于 MATLAB设计了机器人仿真 工具箱,以机器人路径规划 与覆盖问题为背景进行了仿 真研究。 本书可作为高等院校人 工智能、自动化、计算机等 相关专业的科研工作者及硕 士、博士研究生的参考用书 。
人民幣:
RMB 68.00
元 售价:
NT$ 272.00
元
多智能体强化学习(基础与现代方法)/智能系统与技术丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(德)斯特凡诺·V.阿尔布莱希特//(希)菲利波斯·克里斯蒂安诺斯//(德)卢卡斯·舍费尔|责编:刘锋//冯润峰|译者:孙罗洋//李欣然//张海峰
出版社:
机械工业
丛书项:
智能系统与技术丛书
多智能体强化学习 (Multi-Agent Reinforcement Learning, MARL)是机器学习中的一 个领域,研究多个智能体如 何在共享环境中学习最优的 交互方式。这一领域在现代 生活中有着广泛的应用,包 括自动驾驶、多机器人工厂 、自动化交易和能源网络管 理等。 本书是一部系统阐述多 智能体强化学习理论与技术 的权威著作,清晰而严谨地 介绍了MARL的模型、解决 方案概念、算法思想、技术 挑战以及现代方法。书中首 先介绍了该领域的基础知识 ,包括强化学习理论和算法 的基础、交互式博弈模型、 博弈中的不同解决方案概念 以及支撑MARL研究的算法 思想。随后,书中详细介绍 了利用深度学习技术的现代 MARL算法,涵盖集中训练 与分散执行、价值分解、参 数共享和自博弈等思想。本 书还附带了一个用Python编 写的MARL代码库,其中包 括自包含且易于阅读的 MARL算法实现。 本书技术内容以易于理 解的语言解释,并通过大量 示例进行说明,既为初学者 阐明了MARL的概念,也为 专业的读者提供了高层次的 见解。
人民幣:
RMB 109.00
元 售价:
NT$ 436.00
元
共有
5
个搜索结果 共有
1
页
第一页
上一页
下一页
最后页
转到第
页
Δ购买商品
购物流程
注册账户
更改注册信息
Δ售后服务
退换货原则
退换货注意事项
退换货流程
Δ订单支付
付款方式
运费计算方式
Δ关于我们
关于美商天龙
联络我们
商品搜寻:
全文搜索
商品名
作者
出版社
ISBN
|
进阶搜寻
首页
│
新手上路
│
客服中心
│
关于我们
│
人才邀请
│
联络我们
│
Top↑
│
Copyrightc 1999~2008 美商天龙国际图书股份有限公司 台湾分公司. All rights reserved.
营业地址:台北市中正区重庆南路一段103号1F 105号1F-2F
读者服务部电话:02-2381-2033 02-2381-1863 时间:周一~周五 10:00~17:00 服务信箱:
bookuu@69book.com