本书是作者基于国家哲学社会科学基金项目研究中数据加工处理的理论研究基础上,在归纳了大数据的基本概念、本质特征和进一步明析了大数据的理论本质基础上,梳理并归纳了大数据采集的具体方法及其应用场景和大数据的加工转化、分类、清洗和插补等具体方法及其应用条件;从大数据测量角度,归纳与整理大数据特征内容的测量方法、多源大数据的融合方法等。本书依据相应的理论方法结合项目研究给出了相应的应用实例,使得其研究更具有实践性,以便读者能够科学、规范地选择与使用相应的大数据加工处理方法。客观地说,本书是依据大数据的特点将现有的大数据加工处理理论方法进行了归纳,以适应大数据加工处理的目标要求,并对有关理论方法进行了相应补充和完善,使得大数据加工处理理论方法更加系统化和体系化。与现有的大数据相关研究相比,本书的创新点有以下几个方面:一是对大数据的加工处理理论方法进行系统化研究,特别对大数据应用的前期加工处理的理论方法进行梳理总结和研究,使大数据加工处理的理论方法体系更加系统化;二是针对大数据特征内容的测度方法进行了研究,丰富了非结构化数据特征的统计测度,为一般意义下的统计测度理论提供基本的框架;三是梳理和总结了多源大数据综合应用的融合方法体系,有利于科学地利用不同源的数据资源,促进大数据的深度有效利用。
展开