众所周知,在2018 Gartner“分析和商业智能魔力象限”报告中,Tableau连续六年荣获“领导者”称号,并被评为直观交互式可视化分析的黄金标准。
《Tableau商业分析从新手到高手》尽量还原了一些现实商业分析场景,展现了在这些场景下如何结合数据和Tableau的可视化技术,对多种商业问题进行探索和解答。希望通过这样的方式让读者更容易学会使用Tableau,快速成为一名合格的分析师,而非软件操作匠人。
2015年,美智讯公司与沈浩老师合作撰写了国内较早的一本Tableau中文书《触手可及的大数据分析工具:Tableau案例集》。该书经过了多次重印,发行甚广。看到书籍如此受欢迎,我们很受鼓舞,于是推出了这本书。
《Tableau商业分析从新手到高手》共分为四个部分,分别是产品主题分析、客户主题分析、营销主题分析、技术扩展主题。
《Tableau商业分析从新手到高手》偏重于商业分析思路的讲解,采用6个人物场景对话的方式讲授商业问题。每一章的结构是:先抛出商业环境中一个真实的具有挑战性的业务或需要决策的问题,然后提出解决问题的思路并得出结论(即“分析思路”部分),再介绍如何用Tableau实现其中的关键部分(即“技术实现”部分)。“分析思路”部分,通常与具体的软件工具无关;Tableau“技术实现”部分,如果用到了R或Kettle等相关软件工具,则在相应节中呈现详细的操作步骤。
《Tableau商业分析从新手到高手》适合企业中从事数据分析岗位1~3年的职场人员作为自学教程,也适合作为大中专院校相关专业的教学参考书,也适合社会上的商业分析类培训机构作为教材使用。
2.3拓展技术专题3:数据清理
现实工作中,开始分析数据时,数据往往不像教科书或软件自带的数据示例那么好的质量。即使是电商行业程序化系统自动留存的数据,大多数时候其中也会发现各种各样需要处理的问题。
常见的数据质量问题包括但不限于:数据中的异常值、关键数据缺失、混合多数据源时无法找到有效连接的关键字段等。在所有需要使用数据的场景中,无论数据可视化分析、商业智能报表开发,还是更复杂的大数据建模,数据质量问题都是整个流程中必须面对的,并且是最花费时间的工作。
Tableau提供了一些功能支持数据检查和数据预处理,包括在可视化工作区中直接隐藏不需要的数据,以及在多表连接过程中,连接字段可以使用公式在数据源连接界面中直接对数据进行重构。
下面列举一些常见数据处理功能的应用。
1.字符错误的整理
分类数据经常会出现大小写不一致(如tableauy-yTableau),错别字(如tableauy-yTableu),记录中前后存储了看不到的空格等问题(如tableauy-yyytableau)。这些错误在人工观察时都不会造成太大困扰,我们的大脑会自动归纳和修正。但对电脑来说,这些都是不同的记录,这和我们希望的处理方式不一致。针对此类问题,可以用Tableau公式中提供的分组功能手动处理或者使用函数功能自动处理。
当有少量的记录不一致时,可以在Tableau中的“数据”面板有问题的字段上单击鼠标右键,在弹出的菜单中选择创建组命令,手工将书写错误的相同数据记录归为一组,然后重命名为一个正确的组名。例如:“Tableau”“Tableau工具”“Tableau软件”这三种记录,可以重新归类为“Tableau软件”。
如果需要手工处理的比较多,可以创建计算字段,使用软件提供的函数来自动完成。例如,字段中存储了很多名称,但大小写不统一,并且可能字段的首尾有不需要的空格,此类问题,可以通过创建计算字段,输入公式“LOWER(TRIM(字段))”自动统一不规范的字段,生成新的字段,免去大量的手工整理工作。
2.数据异常值的识别处理
通过散点图或者直方图可以很容易地识别数据中的“异常值”。如果数据展现的特征异于群体,或者某条记录的值比多数值都大很多、这样的记录是不是真正的异常,需要根据业务经验进行逻辑判断,然后再选择合适的处理方法。
一旦确定为异常值,Tableau中可以设置筛选条件过滤异常值。值的筛选有多种方式:
(1)使用图表筛选器面板。将需要设置为筛选条件的字段拖动到筛选器面板,然后设置筛选条件,这样可以在数据表级别过滤掉一些不需要的异常记录。
(2)在数据连接源过滤数据。这样,所有使用同一数据源的数据表都会被过滤。例如:在客户主题的优惠券分析中(在第8章会介绍),如果用券比率大于1,则为异常值,应该过滤掉这类数据。可以在数据源视图中单击筛选器的编辑项目,对数据源总体添加一个『用券比率』字段,并设置筛选条件“至多为1”。
(3)数据重构。数据重构就是实行行/列数据格式的转化。Tableau在数据源提供了一个数据重构的功能。
第一部分 产品主题分析
第1章 见微知著:快速了解产品线状况 / 3
1.1 分析思路:两个女装品牌的产品线分析(1.0版)/4
1.2 技术实现:应用Tableau实现1.1节的分析 / 7
1.3 拓展技术专题1:盒须图 / 17
1.4 拓展技术专题2:Tableau连接其他数据库 / 17
第2章 对比出真知:如何评估产品线的优劣 / 19
2.1 分析思路:两个女装品牌的产品线分析(2.0版) / 19
2.2 技术实现:用Tableau实现2.1节的分析 / 21
2.3 拓展技术专题3:数据清理 / 28
第3章 穿越时空:结合时间发现销售模式的特征 / 31
3.1 一年销售期产品混合线图分析(不合理的方法) / 32
3.2 长周期分组分析(萧岚的分析) / 35
3.3 技术实现:用Tableau实现3.2节的分析 / 37
3.4 拓展技术专题4:根据数值等级自动分组 / 42
第4章 是否赔本赚吆喝?产品价值如何综合评估 / 44
4.1 产品促销情况的初步探查 / 45
4.2 数据预处理工具:Kettle / 47
4.3 Kettle的数据处理过程 / 50
4.4 产品促销价值的再分析 / 55
4.5 技术实现:用Tableau技术实现综合分析气泡图 / 58
第二部分 客户主题分析
第5章 拒绝平均人:对客户进行合理的分群 / 65
5.1 分析思路:依据行为将客户分群 / 66
5.2 技术实现:用Tableau技术实现5.1节的分析 / 75
5.3 拓展技术专题5:直方图和散点图 / 86
5.4 拓展技术专题6:Tableau与R语言 / 87
5.5 拓展技术专题7:聚类分析 / 89
第6章 重塑客户漏斗:研究客户流失模式,识别关键因素 / 91
6.1 分析思路:客户留存漏斗分析 / 91
6.2 技术实现:用Tableau技术实现6.1节的分析 / 97
6.3 拓展技术专题8:分析的数据粒度 / 103
第7章 简约不简单:RFM分析与客户生命期分析结合 / 105
7.1 分析思路:关于客户生命周期的分析 / 106
7.2 技术实现:用Tableau技术实现7.1节的分析 / 111
第8章 你之蜜糖,我之砒霜:不同客户对价格优惠的态度观察 / 118
8.1 分析思路:优惠券的使用情况分析 / 119
8.2 技术实现:用Tableau技术实现8.1节的分析 / 126
8.3 拓展技术专题9:价格弹性 / 132
第三部分 营销主题分析
第9章 抛弃糊涂账:如何衡量媒体的营销价值 / 135
9.1 分析思路:媒体的测量和筛选 / 136
9.2 技术实现:用Tableau技术实现9.1节的分析 / 141
第10章 不猜测,不盲从:A/B测试分析 / 149
10.1 分析思路:新套装促销的 A/B测试 / 150
10.2 分析思路:用Tableau实现10.1节的分析 / 155
10.3 拓展技术专题10:A/B测试 / 163
第11章 大巧若拙:重新认识购物篮分析 / 164
11.1 分析思路:购物篮分析 / 165
11.2 技术实现:用Tableau技术实现11.1节的分析 / 168
11.3 拓展技术专题11:购物篮Lift(提升)指标 / 176
第四部分 技术扩展主题
第12章 人言可畏:快速捕获客户对产品的关键评价 / 180
12.1 获取评论数据 / 181
12.2 相关软件安装及介绍 / 182
12.3 R语言的中文分词及处理 / 185
12.4 应用Kettle进行后续处理 / 186
12.5 技术实现:分词文件的Tableau可视化分析 / 190
12.6 拓展技术专题12:文本分析的要点与难点 / 204
第13章 设计仪表盘:谁敢说自己不是“外貌协会” / 206
13.1 报表的设计原则 / 206
13.2 报表的美化 / 214
第14章 使用与管理Tableau Server:分享意味着价值 / 221
14.1 Tableau Server概述 / 221
14.2 Tableau架构概述 / 222
14.3 用户访问架构 / 223
14.4 大小调整和可扩展性 / 224
14.5 Tableau Server管理模式 / 224
14.6 Tableau Server管理工具 / 225
14.7 安全性 / 225
14.8 Tableau Server部署概要 / 226
第15章 Tableau的新功能与新版本:速度与激情 / 228
15.1 Hyper介绍 / 228
15.2 Maestro数据处理 / 229
15.3 Tableau的最新版本介绍 / 233
数据可视化是一架有效连接数据和应用的桥梁。无论是高级的分析人员,还是业务高手,擅用可视化技术,都可以提高挖掘数据信息的效率以及增加决策的准确性。
关于可视化的工具有很多,所需掌握的软件操作也并不难。但掌握了各种快速展现数据的方法,这仅仅是一个开始。想要更有效地利用数据,需要很多的分析经验、行业知识以及流程型框架的方法论。
这些知识的获得,需要大量的实际案例积累与总结。美智讯(Bizinsight)公司的团队,愿意在工作之余,将工作中可传播的知识和脱敏的数据总结成案例,传播数据可视化分析的思路与经验,算是难能可贵。
前人栽树,后人乘凉。祝愿各位读者可以利用本书的案例和经验,拓展自己的思路,在工作中快速成为高手,让数据可视化技术发挥出更多的价值。优质化的数据分析是迈向AI的重要途径,Bizinsight团队做到了,大家一起来欣赏吧!
—谢邦昌
台北医学大学管理学院院长,大数据研究中心主任
中华数据挖掘协会(Chung-huaDataMiningSociety,CDMS)理事长
近几年,我将许多时间花在了算法建模与工程级应用上,带博士的方向也从“传播学”转到了工科为主的“媒体大数据与社会计算”。成功的大数据分析项目,至少是三方面的综合效果:科学的模型与算法、支撑大数据运行的软/硬件架构、贴合实效的商业分析闭环。
如果将时间投入到特定的算法学习中,掌握一定的建模技能并不难;同时,低成本技术架构为企业提供弹性算力支撑的平台已日渐成熟。多数企业的人才队伍中,只需三五位数据科学家钻研模型、算法与架构,其余大部分数据分析岗位分散于各工作流程,每日解读从商业智能、机器学习、物联网等系统传回的结果,将其融入商业运作之闭环并监控实施效果。
如今正在从事数据分析工作的人员,大多数并没有统计学、计算机科学和数学专业背景。同时,多数高校的生物学、医学、环境科学、经济学、社会学、管理学等学科,也已经开设了多门大数据课程。究其原因,因为数据分析岗位需要复合型知识与管理思路。
这本《Tableau商业分析从新手到高手》推荐给正在从事数据分析岗位的职场新人。祝愿读者们完成数据探查、落实分析思路,以及绘制图表的速度能够提升。如果部分读者已经掌握了SPSS、SAS、R与Python等分析工具,那就更好了,快向深度学习进发吧!
—沈浩
中国传媒大学新闻学院教授博士生导师
中国传媒大学调查统计研究所所长大数据挖掘与社会计算实验室主任
中国市场研究协会(CMRA)会长
国家信息中心评选之“十大影响力的大数据领域学者”
Data(数据)的字根源于拉丁文Datus一词,意为“给予”“交付”。例如这本书是通过Thomas交给我的,拉丁文就是“HiclibermihiaThomasdatusest.”从这个角度来了解数据,可以发现数据的本质和Datus的相似之处:能够给予不同对象相对应的价值。
数据本身必须根据使用目的,通过适当梳理、分析和可视化,才能够萃取其中的价值并采取相对应的行动。利用Tableau强大的可视化功能以及整合其他开源软件的能力,能迅速、有效地执行这些程序,传递数据的重要价值。这本《Tableau商业分析从新手到高手》,从商业目标回推所需的分析架构与可视化方式,聚焦分析客户、产品、营销活动等商业上常碰到的主题,利用数据分析的方式,提升商业效率。
如果说《Tableau商业分析一点通》是一个指南针,那么现在你手中的这本书就如藏宝图:前者让你不会在Tableau的强大功能中迷失方向,后者则能告诉你如何找到你要的商业宝藏。善用它,就可以帮公司挖掘出那些蕴藏在数据底下的商业价值,实现利用数据(data)原始的初衷。
—林雨旸
“2017Tableau可视化分析争霸赛”上海站冠军
数据分析越来越成为一种技能,而不是职业。业务人员与数据分析师二者的界限逐渐模糊,大多数的企业需要的是“懂数据的业务”或者“懂业务的数据分析师”。本书通过轻松的场景对话形式,用Tableau解决常见的商业问题。一方面通过Tableau帮助业务人员弥补技能树中数据能力的缺失,另一方面将数据分析师带入生动的商业分析场景,避免沦为“CTO”——首席提数官。
—赵龙飞
“2017Tableau可视化分析争霸赛”北京站冠军
这本书以问题为导向,由浅入深地将技术专题和精辟的分析思路嵌入逼真的典型商业分析场景中,为读者讲解如何使用Tableau——这个几乎能够提供一站式数据解决方案的软件——跨越商业分析过程中遇到的工具和技术障碍。书中故事性的技术讲解方式精巧高妙,注重学习效果的同时,也充分地关注了读者的学习体验。这与慧科集团长期在国家“教育部”和“工信部”的支持下协助高等院校以“产教融合,协同育人”方式培养面向新兴科技领域人才和向企业提供急需人才过程中所坚持的教育服务理念高度相似,值得每一位教育者和技术布道师借鉴。
—叶风哲
慧科研究院高级研究员
在对比了Qlik、PowerBI和Tableau的“Server+Deskop”部署的综合成本、学习曲线、服务支持等因素后,我们选择了Tableau。Tableau在数据驱动公司战略转型的过程中,即时、高效地发挥了良好的推动作用,真正地帮助我们快速发展和创造价值。Bizinsight在商业智能数据分析方面具有丰富的实战经验。本书的每一章均通过实际案例来讲解,其中的操作思路和方法对于数据分析工作具有十分重要的借鉴和启发意义,值得推荐。
—蔡永健
奥鹏教育大数据
让数据会说话!本书运用“5W1H”的逻辑模式,告诉大家Tableau的正确使用方法和强大功能。它仅仅是对现有数据的图表展示?不,对数据分析人员来说,更重要的是如何预测未来数据的变化趋势。本书针对多种不同商业分析场景,对不同岗位的人群如何使用Tableau进行了解读和指导,为业务人员使用数据提供保障。本书让业务人员在不需要骚扰开发者的情况下,可以快速地完成数据分析工作。
—CDA数据分析研究院
一本BI商业智能分析领域的好书!这是一本专门介绍如何使用Tableau做数据分析的书。书中案例的样本数据真实,涵盖行业广。即使没有IT基础,也能从中体验到数据分析的乐趣。在大数据时代,每个企业都有对数据分析的需求,中国大数据分析师(BDA数据分析师)是国内从事数据分析工作的主要力量,关注如何为企业快速高效提供数据信息。作为一名BDA数据分析师,本书值得关注学习。
—张良
中经数(北京)数据应用技术研究院