随着互联网的发展,大数据的思想与技术已经逐渐渗入人们生活、工作的方方面面。本书突出“大数据分析”这一主题,从大数据分析原理、技术和应用的角度,讲述大数据分析基础知识、大数据分析平台核心原理、大数据分析关键技术及大数据分析应用。
大数据分析的基础知识主要包括大数据的产生背景与定义、大数据的特点和技术、大数据的应用和价值、大数据时代的思维变革、国家大数据战略;大数据分析平台的核心原理主要包括开源大数据平台Hadoop和Spark的发展、生态系统、体系结构、安装和使用方法等,大数据存储(Hadoop分布式文件系统——HDFS的基本原理),大数据处理(MapReduce并行编程模型、Hadoop2.0的资源管理调度框架——YARN);大数据分析的关键技术主要包括大数据的获取、数据清洗、数据归约、数据标准化、大数据分析算法(包括聚类、分类算法)的应用;大数据分析的应用是以案例的形式给出大数据分析在上市公司信用风险预测研究中的实际应用。
本书能培养学生搭建大数据分析平台的工程技术能力,面向大规模、多类型数据集的分析及处理能力,基于大数据思维方式进行数据分析的能力,将大数据技术与实际财经应用问题相结合并实现快速决策分析的能力,同时培养学生科技报国的家国情怀和使命担当。
本书适合作为高等院校各专业(尤其是大数据相关专业、财经类专业)大数据分析相关课程的教材,也可供相关技术人员参考。
展开