本书第1章数据仓库概述,对数据仓库及其发展现状、特点、组成、体系结构等进行介绍;第2章Python数据分析概述,对Python及其开发平台的搭建、数据分析工具进行阐述;第3章准备数据,包括数据仓库读写文件、储存与检索、数据ETL过程、数据的初步处理;第4章数据仓库设计,阐述数据仓库的规划和需求分析以及数据仓库的建模;第5章数据分类,包括分类过程以及k-最邻近分类算法、决策树分类算法、贝叶斯分类算法、神经网络算法、支持向量机5种数据分类法;第6章回归分析与时序分析,对识别并解决数据中的多重共线性、构建线性回归模型、时间序列技术、时序分析模型、时序的相似性搜索进行阐述;第7章基于数据仓库技术的数据分析实例,为读者提供3个实践案例,以作参考。
展开