搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
基于增强学习的制造系统调度
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787030492890
  • 作      者:
    张智聪,郑力著
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2016
收藏
作者简介
  张智聪,1980年生,广东东莞人,2007年于清华大学获博士学位,现任东莞理工学院教授、中国机械工程学会生产工程分会生产系统专业委员会常委。主要研究领域是制造系统优化、排队网络,增强学习。主持国家自然科学基金、教育部人文社会科学研究项目、广东省自然科学基金,广东省科技计划、广东省高等学校优秀青年教师培养计划、广东省教育厅重点平台及科研项目等多个科研项目。在国内外期刊发表论文20余篇,获得4项专利授权和1项软件著作权。
  
  郑力,1991年于清华大学获博士学位,现任清华大学工业工程系教授、博士生导师、教育部长江学者特聘教授,机械工程学会工业工程分会副主任委员,生产工程分会的常务理事、国际工业工程学会中国部首任主任,多个国际学术期刊的编委。主要研究领域是生产系统分析与管理、企业信息化。发表论文200余篇,出版专著和教材5本,曾获得国家科技进步奖、高等教育国家教学成果一等奖、国家发明奖、教育部优秀青年教师奖和北京市五一劳动奖章,享受国务院特殊津贴。
展开
内容介绍
  增强学习是人工智能领域一种应用越来越广泛的机器学习算法。《基于增强学习的制造系统调度》对增强学习的基本原理、主要经典算法及其在制造系统调度领域若干问题的应用进行阐述。主要内容包括:Sarsa(λ,k)增强学习算法等增强学习算法的介绍及相关理论证明;增强学习架构及面向生产调度问题的增强学习模型构建方式;流水车间调度问题、平行机调度问题、半导体测试调度问题等制造系统调度问题与自组织型排队网络调度问题的增强学习模型及解决方案;增强学习在以上调度问题应用的实验结果及相关分析等。
  《基于增强学习的制造系统调度》适合管理科学与工程、工业工程等专业的研究生和本科生使用,也可供从事制造系统分析与优化、智能调度等领域工作的研究人员和工程技术人员参考。
展开
目录
前言

第1章 绪论
1.1 增强学习基本原理
1.1.1 马尔可夫决策过程
1.1.2 增强学习系统
1.1.3 增强学习算法的分类与发展概述
1.2 增强学习算法应用引例——最短路问题
1.3 增强学习算法在调度领域的应用研究
1.4 本书组织结构

第2章 增强学习算法
2.1 经典的增强学习算法
2.1.1 TD/TD(λ)学习算法
2.1.2 Q学习
2.1.3 Sarsa算法
2.1.4 R学习
2.2 Sarsa(λ,k)算法
2.2.1 Sarsa(λ,k)算法的基本原理
2.2.2 前视与后视Sarsa(λ,k)算法
2.2.3 Sarsa(λ,k)算法的性质
2.3 SMDP型Sarsa(λ,k)算法
2.4 多维行为的增强学习算法
2.5 一种自适应步长的增强学习算法

第3章 流水车间调度问题
3.1 问题描述
3.2 流水车间调度问题的增强学习模型
3.2.1 系统状态表示
3.2.2 行为
3.2.3 报酬函数
3.3 结合线性函数泛化器的TD(λ)算法及实验结果
3.3.1 结合线性函数泛化器的TD(λ)算法
3.3.2 实验结果

第4章 平行机调度问题
4.1 最小化加权平均流程时间的离线平行机调度
4.1.1 问题描述
4.1.2 增强学习模型
4.1.3 实验结果
4.2 最小化加权平均误工时间的离线平行机调度
4.2.1 问题描述
4.2.2 增强学习建模
4.2.3 实验结果
4.3 最小化加权平均流程时间的在线平行机调度
4.3.1 问题描述
4.3.2 增强学习模型
4.3.3 实验结果
4.4 最小化加权平均误工时间的在线平行机调度
4.4.1 问题描述
4.4.2 增强学习模型
4.4.3 求解变速机调度问题的R学习
4.4.4 实验结果

第5章 半导体测试调度问题
5.1 半导体测试调度问题描述
5.2 关于半导体测试调度的研究
5.2.1 附加资源充足的半导体测试调度
5.2.2 附加资源受限的半导体测试调度
5.2.3 和半导体测试调度相关的调度问题
5.2.4 小结
5.3 整数规划模型
5.3.1 符号定义
5.3.2 决策变量
5.3.3 目标函数和约束
5.3.4 问题性质分析
5.4 半导体测试调度问题的增强学习模型
5.4.1 状态变量及状态转移机制
5.4.2 行为
5.4.3 报酬函数
5.5 结合函数泛化器的Sarsa(λ,k)算法
5.5.1 径向基神经网络函数泛化器
5.5.2 神经网络的构造
5.5.3 函数泛化器的权重更新法则
5.5.4 结合径向基神经网络函数泛化器的Sarsa(λ,k)算法
5.6 演示算例
5.7 参数设置与函数泛化器性能分析
5.7.1 行为选择
5.7.2 参数设置
5.7.3 函数泛化器性能分析
5.8 半导体测试调度实验结果与分析
5.8.1 与工业方法及各行为策略对比
5.8.2 与其他增强学习算法对比
5.8.3 与能力约束调度方法对比
5.9 讨论
5.10 可重构制造系统调度
5.10.1 具有可重构特性的调度系统机制
5.10.2 增强学习模型架构

第6章 排队网络控制问题
6.1 多服务台排队系统控制的半马尔可夫决策模型
6.1.1 问题描述
6.1.2 半马尔可夫决策模型建模
6.1.3 排队控制系统的性质
6.1.4 数值例子
6.2 自组织型排队网络控制问题
6.2.1 自组织型排队网络控制问题描述
6.2.2 自组织型排队网络控制问题的增强学习模型
6.2.3 解决自组织型排队网络控制问题的增强学习算法

第7章 结束语
参考文献
其他参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证