作者EMC2公司的工作经历、深厚的专业基础、精准的数据挖掘工具、结合实践的成功案例,使本书价值斐然,值得推荐!
《大数据精准挖掘》以新兴的大数据时代最实用的技术为支撑,以广阔的科技视野和扎实的专业功底,全面介绍了大数据时代的由来和背景,阐述了与大数据分析相关的理论和数学模型。特别难能可贵的是,本书从蕴含大数据技术的精准数据挖掘工具入手,结合实际的成功案例,将数据精准挖掘的全过程和详细步骤,包括结果验证等方面内容,详详细细并非常专业地展现给读者。本书理论和实践密切结合,文字流畅,深入浅出,通俗易懂。
通过本书的学习,可以掌握当下大数据所涉及的主要数学分析模块的要点,并比较相互的特点。同时,能够学会实用的数据挖掘专门技术及经历数据挖掘的全过程。由于本书所介绍的技术与我国目前大数据运用的领军行业金融、保险、电信、电子商务等密切相连,故本书有很强的实用性,能达到学以致用、边学边用的效果。
《大数据精准挖掘》适合我国IT业的科研机构、相关企业的专业技术人员的学习之用;本书还可以作为政府部门制定大数据发展战略时的参考。本书也适合全国高等院校的大学生和研究生学习使用;由于本书将理论与具体操作合二为一,故也能作为全国大专院校开设大数据实验课程的教材。
第6章主要讲解在金融行业信用卡业务中,国内信用卡业务现状,以及国际信用评分的起源和发展。
6.3讲解了业内人士总结的信用评分的6个步骤,商业理解、数据理解、数据准备、建立模型、模型评估、决策实施。
6.4节演示了一个信用卡评分的实例,建模工具为数据1号图形命令版的二元变量预测模块。其中详细讲述了怎样利用数据1号连接数据集,怎样设置自变量应变量,运行程序完毕后怎样查看结果、怎样查看评分卡等等。
银行信用卡评分业务中,涉及的是否坏账是一个二元因变量问题。在银行中,也会涉及连续型因变量的问题,第7章信用卡催收评分就涉及此类。
第7章主要涉及银行信用卡行业的信用催收评分,目标是为持卡人逾期还款金额进行风险评估。建模所利用的信息包括两部分,持卡人基本信息和持卡人在持卡期间的消费记录和还款记录,若条件允许,可以向权威机构购买此人的信用情况。建模的工具选择的数据1号图形版。
利用建好的模型,可对持卡人逾期还款金额进行风险评估。依据评估的结果,银行可以预估哪些持卡人的逾期未还款通过自己的催收员能够收到还款,能够收到多少还款。而对于那些不易收取还款的信用卡持卡人,银行将其外包给第三方业务公司。
信用评分和信用卡催收评分作为风险评估工具,在银行业应用非常普遍。对于这两类模型,对模型的稳定性和精准度要求相对较高,模型的精准度差一点点,就会牵涉几千万甚至几亿资产。银行选取的建模工具必然要求较高的稳定性和精准性。
第8章主要讲解数据挖掘在保险电销行业寻找目标客户中的应用。很多领域都涉及电话营销渠道,特别是保险行业。从茫茫人海中找到对保险有需求的客户不是一件容易的事情,现在一些大的保险公司走的路线是先向客户推广免费的赠险,然后再向赠险客户推广消费险。而YBB正是这样的一家外包公司。
通过对其海量数据的分析,以及业务现状的了解,为其制定了寻找目标客户的方案。通过建模,得到每位赠险客户买消费险的概率。YBB拿到这份名单,选取其中概率较高的70%的客户营销,达到的效果是原来的96%。节省的这30%的人力成本是一笔巨额的开支,随着数据的采集和收集进一步优化,相信建模的效果越来越好。
各个行业的电话营销都可以通过数据挖掘来筛选客户,优先选取优质客户进行营销,节省人力成本,提高销售效果。在人力成本越来越贵的今天,数据挖掘可以让每个人的效率更高,使企业盈利得到质的飞跃。
......