本书专注于采用机器学习方法解决数据缺失问题,系统性地介绍了基于机器学习的缺失值填补理论及方法。
全书共8章,可分为4部分。第一部分为第1~3章,首先介绍缺失值填补领域的缺失数据机制、基本概念、性能度量等基础知识,随后详细阐述目前基于统计学、机器学习的缺失值填补理论与方法。第二部分为第4~5章,对目前神经网络在缺失值填补领域的研究成果进行归纳总结,并从网络模型、填补方案角度阐述神经网络填补方法的设计及应用。第三部分为第6~7章,详细介绍面向不完整数据的TS建模过程,随后通过特征选择算法处理TS建模中的特征冗余问题,并从前提参数优化和结论参数优化两个角度改进TS模型。第四部分为第8章,以缺失值填补方法在我国贫困问题研究中的应用为例,展现缺失值填补方法的现实意义。
展开