幫助中心 | 我的帳號 | 關於我們
美商天龙图书网 搜索“原强” 共有 12 种商品

最近浏览的商品

请选择排序方式: 类别   版别    出版年月↓   折扣↓   定价↓
  • 强化学习的数学原理

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:赵世钰|责编:郭赛     出版社:清华大学
  •     本书将从强化学习最基 本的概念开始介绍,将介绍 基础的分析工具包括贝尔曼 公式和贝尔曼最优公式,之 后会推广到基于模型的和无 模型的强化学习算法,最后 会推广到基于函数逼近的强 化学习方法。本书强调从数 学的角度接引入概念、分析 问题、分析算法。并不强调 算法的编程实现,因为目前 已经有很多这方面的书籍, 本书将不再重复造轮子。 本书面向对强化学习感 兴趣的本科生、研究生、研 究人员和企业研究所从业者 。 它不需要读者有任何关 于强化学习的背景,因为它 会从最基本的概念开始介绍 。如果读者已经有一些强化 学习的背景,这本书也可以 帮助他们更深入地理解一些 问题或者带来新的视角。 本书要求读者具备一定 的概率论和线性代数知识。 本书的附录中包含了一些必 需的数学基础知识。
  • 人民币:RMB 108.00 元     售价:NT$ 432.00
  • 放入购物车
    加入收藏夹

  • 深度强化学习原理与实践

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:陈喆|责编:白立军//常建丽     出版社:清华大学
  •     本书从原理的角度,力 求讲解清楚深度学习、强化 学习、深度强化学习中的一 些精选方法,并从实践的角 度,通过一系列循序渐进的 原创实验,引领读者独立编 程实现这些方法,以期为读 者精通深度强化学习并应用 深度强化学习方法解决实际 问题奠定坚实基础。 本书不仅适合计算机科 学与技术、人工智能、物联 网工程、数据科学与大数据 、软件工程、通信工程、电 子信息、机器人工程、自动 化、智能制造等相关专业高 年级本科生及研究生教学与 自学使用,也适合机器学习 等领域的从业者、科研人员 及爱好者自学与参考使用。
  • 人民币:RMB 59.00 元     售价:NT$ 236.00
  • 放入购物车
    加入收藏夹

  • 强化学习基础原理与应用

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:编者:张百珂|责编:魏莹     出版社:清华大学
  •     本书循序渐进地讲解了 使用Python语言实现强化学 习的核心算法开发的知识, 内容涵盖了数据处理、算法 、大模型等知识,并通过具 体实例的实现过程演练了各 个知识点的使用方法和使用 流程。《强化学习基础、原 理与应用》共分为17章,主 要内容包括强化学习基础、 马尔可夫决策过程、蒙特卡 洛方法、Q-learning与贝尔 曼方程、时序差分学习和 SARSA算法、DQN算法、 DDQN算法、竞争DQN算法 、REINFORCE算法、 Actor-Critic算法、PPO算法 、TRPO算法、连续动作空 间的强化学习、值分布式算 法、基于模型的强化学习、 多智能体强化学习实战: Predator-Prey游戏及自动驾 驶系统。本书内容简洁而不 失技术深度,以极简的文字 介绍了复杂的案例,易于阅 读和理解。 本书适用于已经了解 Python语言基础语法的读者 ,想进一步学习强化学习、 机器学习、深度学习及相关 技术的读者,还可作为大专 院校相关专业的师生用书和 培训机构的教材使用。
  • 人民币:RMB 99.00 元     售价:NT$ 396.00
  • 放入购物车
    加入收藏夹

  • 深度强化学习/图灵原创

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:王树森//黎彧君//张志华|责编:刘美英     出版社:人民邮电
  • 丛书项:图灵原创
  •     本书基于备受读者推 崇的王树森“深度强化学 习”系列公开视频课,专 门解决“入门深度强化学 习难”的问题。 本书的独特之处在于 :第一,知识精简,剔除 一切不必要的概念和公式 ,学起来轻松;第二,内 容新颖,聚焦近10年深度 强化学习领域的突破,让 你一上手就紧跟最新技术 。 本书系统讲解深度强 化学习的原理与实现,但 不回避数学公式和各种模 型,原创100多幅精美插 图,并以全彩印刷展示。 简洁清晰的语言+生动形 象的图示,助你扫除任何 可能的学习障碍!本书内 容分为五部分:基础知识 、价值学习、策略学习、 多智能体强化学习、应用 与展望,涉及DQN、A3C 、TRPO、DDPG、 AlphaGo等。 本书面向深度强化学 习入门读者,助你构建完 整的知识体系。学完本书 ,你能够轻松看懂深度强 化学习的实现代码、读懂 该领域的论文、听懂学术 报告,具备进一步自学和 深挖的能力。
  • 人民币:RMB 129.80 元     售价:NT$ 519.20
  • 放入购物车
    加入收藏夹

  • 图强化学习(原理与实践入门)

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:编者:谢文杰//周炜星|责编:杜杨//申美莹     出版社:清华大学
  •     图强化学习是深度强化 学习的重要分支领域。本书 作为该领域的入门教材,在 内容上尽可能覆盖图强化学 习的基础知识,并提供应用 实践案例。全书共10章,大 致分为三部分:第一部分( 第1~3章)介绍图强化学习 研究对象(复杂系统、图和 复杂网络);第二部分(第 4~7章)介绍图强化学习基 础知识(图嵌入、图神经网 络和深度强化学习);第三 部分(第8~10章)介绍图 强化学习模型框架和应用实 践案例,并进行总结和展望 。每章都附有习题并介绍了 相关阅读材料,以便有兴趣 的读者进一步深入探索。 本书可作为高等院校计 算机、图数据挖掘及相关专 业的本科生或研究生教材, 也可供对图强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
  • 人民币:RMB 69.00 元     售价:NT$ 276.00
  • 放入购物车
    加入收藏夹

  • 强化学习的数学原理(英文版)

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:赵世钰|责编:郭赛     出版社:清华大学
  •     本书从强化学习最基本 的概念开始介绍,将介绍基 础的分析工具,包括贝尔曼 公式和贝尔曼最优公式,然 后推广到基于模型的和无模 型的强化学习算法,最后推 广到基于函数逼近的强化学 法。本书强调从数学的角度 引入概念、分析问题、分析 算法,并不强调算法的编程 实现。本书不要求读者具备 任何关于强化学习的知识背 景,仅要求读者具备一定的 概率论和线性代数的知识。 如果读者已经具备强化学习 的学习基础,本书可以帮助 读者更深入地理解一些问题 并提供新的视角。 本书面向对强化学习感 兴趣的本科生、研究生、研 究人员和企业或研究所的从 业者。
  • 人民币:RMB 118.00 元     售价:NT$ 472.00
  • 放入购物车
    加入收藏夹

  • 深度强化学习算法原理与实战(基于MATLAB)

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:编者:郑一|责编:张赛//耍利娜     出版社:化学工业
  •     本书在详细阐述强化学 习基本概念与基本理论的基 础上,循序渐进地介绍了深 度强化学习各常用算法的基 本思想、算法伪代码、算法 实现、基于实例的算法演示 与程序分析等内容。具体介 绍了Q-learning算法求解最 优路径问题,SARSA算法求 解最优安全路径问题,策略 迭代算法求解两地租车最优 调度问题,价值迭代算法求 解最优路径问题,DQN算法 求解平衡系统的最优控制问 题,PG算法求解双积分系 统的最优控制问题,AC类 算法求解股票交易的最优推 荐策略,SAC算法求解机器 人手臂控球平衡问题,PPO 算法求解飞行器平稳着陆最 优控制问题,DDPG算法求 解四足机器人行走控制策略 问题,TD3算法求解PID控 制器参数整定问题,多智能 体强化学习的基本概念与基 本方法,MAPPO算法求解 多智能体协作运送物体问题 ,IPPO算法与MAPPO算法 求解协作竞争探索区域问题 ,MADDPG与DDPG算法求 解车辆路径跟踪控制问题。 本书可作为高等院校深 度强化学习课程的教材,亦 可作为本科生毕业设计、研 究生项目设计和广大科研人 员的技术参考用书。
  • 人民币:RMB 109.00 元     售价:NT$ 436.00
  • 放入购物车
    加入收藏夹


  • 深度强化学习(算法原理与金融实践入门)

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:编者:谢文杰//周炜星|责编:杜杨     出版社:清华大学
  •     深度强化学习是人工智 能和机器学习的重要分支领 域,有着广泛应用,如 AlphaGo和ChatGPT。本书 作为该领域的入门教材,在 内容上尽可能覆盖深度强化 学习的基础知识和经典算法 。全书共10章,大致分为4 部分:第1部分(第1~2章 )介绍深度强化学习背景( 智能决策、人工智能和机器 学习);第2部分(第3~4 章)介绍深度强化学习基础 知识(深度学习和强化学习 );第3部分(第5~9章) 介绍深度强化学习经典算法 (DQN、AC、DDPG等); 第4部分(第10章)为总结 和展望。每章都附有习题并 介绍了相关阅读材料,以便 有兴趣的读者进一步深入探 索。 本书可作为高等院校计 算机、智能金融及相关专业 的本科生或研究生教材,也 可供对深度强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
  • 人民币:RMB 69.00 元     售价:NT$ 276.00
  • 放入购物车
    加入收藏夹

  • 深度强化学习实践(原书第2版)/智能系统与技术丛书

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:(俄)马克西姆·拉潘|责编:王春华//李忠明|译者:林然//王薇     出版社:机械工业
  • 丛书项:智能系统与技术丛书
  •     本书包括新的强化学习 工具和技术,介绍了强化学 习的基础知识,以及如何动 手编写智能体以执行一系列 实际任务。本书较上一版新 增6章,专门介绍了强化学 习的新发展,包括离散优化 (解决魔方问题)、多智能 体方法、Microsoft的 TextWorld环境、高级探索 技术等。学完本书,你将对 这个新兴领域的前沿技术有 深刻的理解。此外,你将获 得对深度Q-network、策略 梯度方法、连续控制问题以 及高度可扩展的非梯度方法 等领域的可行洞见,还将学 会如何构建经过强化学习训 练、价格低廉的真实硬件机 器人,并通过逐步代码优化 在短短30分钟的训练后解决 Pong环境问题。 简而言之,本书将帮助 你探索强化学习中令人兴奋 的复杂主题,让你通过实例 获得经验和知识。通过阅读 本书,你将: ·了解强化学习的深度学 习上下文并实现复杂的深度 学习模型。 ·学会评估强化学习的方 法,包括交叉熵、DQN、 actor-critic、TRPO、PPO、 DDPG、D4PG等。 ·学会构建经过强化学习 方法训练的、价格低廉的硬 件机器人。 ·研究Microsoft的 TextWorld环境,这是一个 文字冒险游戏平台。 ·学会在强化学习中使用 离散优化来解决魔方问题。 ·学会教你的智能体使用 AlphaGo Zero玩四子连横棋 。 ·探索有关Al聊天机器人 等主题的较新深度强化学习 技术。 ·研究先进的探索技术, 包括噪声网络和网络蒸馏技 术。
  • 人民币:RMB 149.00 元     售价:NT$ 596.00
  • 放入购物车
    加入收藏夹

  • 强化学习(原理与Python实战)/智能系统与技术丛书

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:肖智清|责编:杨福川//李乐     出版社:机械工业
  • 丛书项:智能系统与技术丛书
  •     本书从原理和实战两个 方面介绍了强化学习。原理 方面,深入介绍了主流强化 学习理论和算法,覆盖资格 迹等经典算法和MuZero等 深度强化学习算法;实战方 面,每章都配套了编程案例 ,以方便读者学习。 全书从逻辑上分为三部 分。 第1章:从零开始介绍强 化学习的背景知识,介绍环 境库Gym的使用。 第2~15章:基于折扣奖 励离散时间Markov决策过 程模型,介绍强化学习的主 干理论和常见算法。采用数 学语言推导强化学习的基础 理论,进而在理论的基础上 讲解算法,并为算法提供配 套代码实现。基础理论的讲 解突出主干部分,算法讲解 全面覆盖主流的强化学习算 法,包括经典的非深度强化 学习算法和近年流行的强化 学习算法。Python实现和算 法讲解一一对应,还给出了 深度强化学习算法的 TensorFlow和PyTorch对照 实现。 第16章:介绍其他强化 学习模型,包括平均奖励模 型、连续时间模型、非齐次 模型、半Markov模型、部 分可观测模型等,以便更好 地了解强化学习研究的全貌 。
  • 人民币:RMB 129.00 元     售价:NT$ 516.00
  • 放入购物车
    加入收藏夹

  • 强化学习(从原理到实践)/跟我一起学人工智能

  • 所属分类:电子电脑>>电工无线电自动化>>自动化技术     作者:李福林|责编:赵佳霓     出版社:清华大学
  • 丛书项:跟我一起学人工智能
  •     本书是对强化学习算法 的综合性讲解书籍,内容包 括主要的强化学习算法的实 现思路讲解,以及主要的优 化方法的原理讲解。本书介 绍的每个算法都分为原理讲 解和代码实现两部分,代码 实现是为了通过实验验证原 理部分的可行性。通过本书 的学习,读者可以快速地了 解强化学习算法的设计原理 ,掌握强化学习算法的实现 过程,并能研发属于自己的 强化学习算法,了解各个算 法的优缺点,以及各个算法 适用的场景。 本书共18章,分为强化 学习基础篇(第1章和第2章 )介绍了强化学习中的基本 概念。强化学习基础算法篇 (第3~6章)介绍了Q Learning算法、SARSA算法 、DQN算法、Reniforce算 法。强化学习高级算法篇( 第7~12章)介绍了AC演员 评委算法、A2C优势演员评 委算法、PPO近端策略优化 算法、DDPG深度确定性策 略梯度算法、TD3双延迟深 度确定性策略梯度算法、 SAC柔性演员评委算法、模 仿学习算法。多智能体篇( 第13章和第14章),介绍 了在一个系统中存在多智能 体时,各个智能体之间的合 作、对抗等关系,以及各个 智能体之间的通信策略。扩 展算法篇(第15~17章) 介绍了CQL离线学习算法、 MPC环境学习算法、HER目 标导向算法。SB3强化学习 框架篇(第18章),介绍了 强化学习框架SB3的使用方 法。 本书将使用最简单浅显 的语言,带领读者快速地了 解各个主要的强化学习算法 的设计思路,以及实现过程 。通过本书各个章节的学习 ,读者可以掌握主流的强化 学习算法的原理和实现方法 ,能够让读者知其然也知其 所以然,做到融会贯通。
  • 人民币:RMB 69.00 元     售价:NT$ 276.00
  • 放入购物车
    加入收藏夹

  • 商品搜寻:
  • | 进阶搜寻
首页新手上路客服中心关于我们人才邀请联络我们Top↑
Copyrightc 1999~2008 美商天龙国际图书股份有限公司 台湾分公司. All rights reserved.
营业地址:台北市中正区重庆南路一段103号1F 105号1F-2F
读者服务部电话:02-2381-2033 02-2381-1863 时间:周一~周五 10:00~17:00 服务信箱:bookuu@69book.com