搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
深度强化学习算法及其在智能决策中的应用研究
0.00     定价 ¥ 78.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787513677738
  • 作      者:
    作者:马聪//孙若斌|责编:贺静//杨元丽
  • 出 版 社 :
    中国经济出版社
  • 出版日期:
    2024-05-01
收藏
畅销推荐
内容介绍
随着人工智能时代的到来,特别是AlphaGo、ChatGPT等突破性技术的问世,深度强化学习算法已展现出其独特的优势,并在处理复杂决策问题方面发挥出巨大潜力。深度强化学习算法将深度学习的感知能力与强化学习的决策能力相结合,实现了端到端的学习,是一种更加接近于人类思维方式的人工智能算法。然而,目前对深度强化学习算法的研究仍处于初步发展阶段,面临诸多挑战,包括样本利用效率低、“探索和利用”难以平衡及奖励函数设计困难等问题。本书系统阐述了深度强化学习算法的理论和原理,针对其在量化金融、工业运维等应用领域所面临的研究难点,展开相关研究,并创新性地提出相应的改进算法,以推动深度强化学习算法在智能决策领域的进一步发展。
展开
目录
1 绪论
1.1 研究背景与研究意义
1.2 国内外研究现状综述
1.3 研究内容及创新
1.4 本书的组织结构
2 深度强化学习算法概述
2.1 强化学习算法的原理
2.2 最优价值算法
2.3 基于策略梯度的算法
2.4 小结
3 基于信息瓶颈理解正则化算法的工作原理
3.1 引言
3.2 相关工作
3.3 正则项的工作原理
3.4 实验
3.5 小结
4 多模块并行的单资产交易深度强化学习算法
4.1 引言
4.2 用于单资产交易的PMMRL算法
4.3 实验
4.4 小结
5 趋势一致的多智能体投资组合强化学习算法
5.1 引言
5.2 用于投资组合管理的深度强化学习算法
5.3 趋势一致正则项
5.4 实验
5.5 风险管理
5.6 小结
6 针对复杂多步骤任务的多环境并行的深度强化学习算法
6.1 引言
6.2 多环境并行的奖励塑形算法
6.3 数值实验
6.4 小结
7 深度强化学习在工业智能运维中的应用
7.1 引言
7.2 深度强化学习在智能运维中的优势
7.3 强化学习算法在各工业领域中的应用
7.4 小结
8 总结与展望
8.1 总结
8.2 展望
参考文献
与本书相关的研究成果
附录 A 技术指标
附录 B 评价指标
索引
后记
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证