1 绪论
1.1 树集成学习概述
1.2 树集成学习分类回归及其应用概述
1.3 本书内容结构及安排
2 数据来源及其特征描述
2.1 数据来源
2.2 特征描述符
2.3 基于重要性和相关性的特征描述符选择
2.3.1 基于重要性的特征描述符筛选
2.3.2 基于相关性的特征描述符筛选
2.3.3 基于重要性和相关性的特征描述符选择方法
2.4 实验结果与分析
2.5 本章小结
3 树集成学习模型
3.1 决策树
3.1.1 ID3算法
3.1.2 C4.5算法
3.1.3 CART算法
3.2 集成树
3.2.1 随机森林
3.2.2 梯度提升树
3.2.3 XGBoost
3.2.4 CatBoost
3.2.5 LightGBM
3.3 本章小结
4 基于分布式随机森林的有机合成预测
4.1 基于概率密度估计的产率分析模型
4.2 分位数回归森林概率密度预测模型
4.3 实验结果与分析
4.3.1 预测精度分析
4.3.2 离群点分析
4.4 本章小结
5 基于深度森林的有机合成预测
5.1 基于深度森林的产率分析模型
5.2 基于深度森林的产率分类预测
5.2.1 数据预处理
5.2.2 产率分类预测结果分析
5.2.3 分类结果的差异性检验
5.2.4 稀疏数据的预测结果分析
5.2.5 时间复杂度分析
5.2.6 样本外预测
5.3 基于深度森林的产率影响因素分析
5.3.1 影响因素组成
5.3.2 主要影响因素分析
5.4 本章小结
6 基于XGBoost的有机合成预测
6.1 基于XGBoost的反应产率预测模型构建及优化求解
6.2 实验结果与分析
6.2.1 参数优化
6.2.2 收敛性分析
6.2.3 时间复杂度分析
6.2.4 预测精度分析
6.2.5 可解释性分析
6.2.6 泛化性分析
6.3 本章小结
7 基于拓扑数据分析和LightGBM的有机化学合成智能分析
7.1 基于拓扑数据分析的高维数据隐藏信息挖掘模型构建
7.1.1 Mapper算法
7.1.2 拓扑数据分析原理
7.2 基于LightGBM的产率预测模型构建
7.3 分层采样策略
7.4 实验结果与分析
7.4.1 反应条件与产率的相关性分析
7.4.2 基于LightGBM的化学反应产率预测
7.5 本章小结
8 基于CatBoost的有机合成预测
8.1 特征选择
8.2 基于CatBoost的反应产率预测模型构建
8.3 实验结果与分析
8.3.1 参数分析
8.3.2 收敛性分析
8.3.3 预测精度分析
8.3.4 时间复杂度分析
8.3.5 泛化性能分析
8.3.6 产率影响因素分析
8.4 本章小结
9 基于ChemCNet模型的产率智能预测与分析
9.1 基于ChemCNet的产率智能预测与分析模型构建
9.2 实验结果与分析
9.2.1 结构分析
9.2.2 特征学习性能分析
9.2.3 预测精度分析
9.2.4 泛化性能分析
9.3 本章小结
参考文献
展开