“大数据系列丛书”由多本既独立又有丰富内在联系的大数据时代思维、技术与应用的教材组成。《大数据可视化》是其中的一本。
我们已经进入大数据时代,人们用大数据来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。企业内部的经营信息,互联网世界中的商品物流信息,人与人的交互信息、位置信息等,数量将远远**现有企业的IT架构和基础设施的承载能力,实时性要求也将大大**现有的计算能力。除了数据的数量,对于身处大数据时代的企业而言,成功的关键还在于找出大数据所隐含的真知灼见。以前,人们总说信息就是力量,如今,对数据进行分析、利用和挖掘才是力量所在。
大数据可视化这种新的视觉表达形式是随着信息社会的蓬勃发展而出现的——因为我们不仅要呈现世界,更重要的是通过呈现来处理更庞大的数据,理解各种各样的数据集合,表现多维数据之间的关联。换句话说,就是归纳数据内在的模式、关联和结构。复杂数据可视化既涉及科学,也有关设计,它的艺术性在于使用独特手法展示万千世界的某个局部,从而提出问题。大数据可视化,位于科学、设计和艺术三个学科的交叉领域(准确地说,应该是位于三个不同维度的人类活动的交叉领域),蕴藏着无限可能性。
本书系统、全面地介绍了大数据可视化的基本知识和应用技能,详细介绍了大数据与大数据时代、数据可视化之美、数据可视化工具、Excel数据可视化方法、Excel数据可视化应用、数据引导可视化设计、数据可视化的过程、数据可视化组织、Tableau数据可视化入门、Tableau数据可视化设计以及课程设计与实验总结等内容,具有较强的系统性、可读性和实用性,适合作为高等院校信息管理、经济管理等专业教学的教材,也适合对大数据技术感兴趣的读者阅读。
这是一个大数据爆发的时代。面对信息的激流、多元化数据的涌现,大数据已经为个人生活、企业经营,甚至国家与社会的发展带来了机遇和挑战,大数据已经成为信息产业中*具潜力的蓝海。
大数据可视化这种新的视觉表达形式是应信息社会蓬勃发展而出现的——因为我们不仅要呈现世界,更重要的是通过呈现来处理更庞大的数据、理解各种各样的数据集合、表现多维数据之间的关联。换句话说,就是归纳数据内在的模式、关联和结构。复杂数据可视化既涉及科学也有关设计,它的艺术性实际上是使用独特手法展示万千世界的某个局部,从而提出问题。大数据可视化,位于科学、设计和艺术三学科的交叉领域(准确地说,应该是位于三个不同维度的人类活动的交叉领域),蕴藏着无限的可能性。
大数据可视化是一门理论性和实践性都很强的课程。本书根据计算机、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了关于大数据技术及其可视化的基本知识和技能,详细介绍了大数据与大数据时代、数据可视化之美、数据可视化工具、Excel数据可视化方法、Excel数据可视化应用、数据引导可视化设计、数据可视化的过程、数据可视化组织、Tableau数据可视化入门、Tableau数据可视化设计以及课程设计与实验总结等内容,共11章,各章还配套设计了导读案例、延伸阅读、实验与思考等部分,具有较强的系统性、可读性和实用性。
本书是为高等院校相关专业“大数据可视化”、“数据媒体设计”等课程全新设计编写的,具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员作为参考和继续教育的教材。
第1章大数据与大数据时代1
1.1什么是大数据3
1.1.1数据与信息3
1.1.2天文学——信息爆炸的起源3
1.1.3大数据的定义5
1.1.4用3V描述大数据特征6
1.1.5大数据的结构类型8
1.2思维变革之一: 样本=总体9
1.2.1小数据时代的随机采样10
1.2.2大数据与乔布斯的癌症治疗13
1.2.3全数据模式: 样本=总体14
1.3思维变革之二: 接受数据的混杂性14
1.3.1允许不精确15
1.3.2大数据的简单算法与小数据的复杂算法16
1.3.3纷繁的数据越多越好17
1.3.45%的数字数据与95%的非结构化数据18
1.4思维变革之三: 数据的相关关系19
1.4.1关联物,预测的关键19
1.4.2“是什么”,而不是“为什么”20
1.4.3通过因果关系了解世界20
1.4.4通过相关关系了解世界21第2章数据可视化之美28
2.1数据与可视化30
2.1.1数据是什么30
2.1.2数据的可变性31
2.1.3数据的不确定性33
2.1.4数据所依存的背景信息332.1.5挑战图像的多变性35
2.1.6打造最好的可视化效果35
2.2数据与图形36
2.2.1地图传递信息36
2.2.2数据与走势37
2.2.3视觉信息的科学解释39
2.2.4图片和分享的力量39
2.2.5公共数据集40
2.3实时可视化41
2.4数据可视化的运用42
2.5数据可视化的挑战44第3章数据可视化工具52
3.1传统的数据分析图表55
3.2数据可视化的5个方面56
3.2.1大型企业软件供应商应用56
3.2.2最优性能应用58
3.2.3流行的开源工具60
3.2.4设计公司61
3.2.5创业、网站服务及其他资源62
3.3可视化工具62
3.3.1Microsoft Excel62
3.3.2Google Spreadsheets63
3.3.3Tableau64
3.3.4针对特定数据的工具64
3.4编程工具66
3.4.1R语言66
3.4.2JavaScript、HTML、SVG和CSS67
3.4.3Processing67
3.4.4Flash和ActionScript68
3.4.5Python68
3.4.6PHP68
3.5插图工具68
3.6数据统计68第4章Excel数据可视化方法75
4.1Excel的函数与图表77
4.1.1Excel函数78
4.1.2Excel图表79
4.1.3选择图表类型83
4.2整理数据源85
4.2.1数据提炼86
4.2.2数据清理88
4.2.3抽样产生随机数据89
4.3数理统计中的常见统计量91
4.3.1比平均值更稳定的中位数和众数91
4.3.2概率统计中的正态分布和偏态分布92
4.3.3应用在财务预算中的分析工具93
4.4改变数据形式引起的图表变化96
4.4.1用负数突出数据的增长情况96
4.4.2重排关键字顺序使图表更合适96第5章Excel数据可视化应用101
5.1直方图: 对比关系105
5.1.1以零基线为起点105
5.1.2垂直直条的宽度要大于条间距107
5.1.3慎用三维效果的柱形图108
5.1.4用堆积图表示百分数109
5.2折线图: 按时间或类别显示趋势110
5.2.1减小Y轴刻度单位增强数据波动情况110
5.2.2突出显示折线图中的数据点112
5.2.3通过面积图显示数据总额113
5.3圆饼图: 部分占总体的比例114
5.3.1重视圆饼图扇区的位置排序114
5.3.2分离圆饼图扇区强调特殊数据115
5.3.3用半个圆饼图刻画半期内的数据116
5.3.4让多个圆饼图对象重叠展示对比关系117
5.4散点图: 表示分布状态117
5.4.1用平滑线连接散点图增强图形效果118
5.4.2将直角坐标改为象限坐标凸显分布效果118
5.5侧重点不同的特殊图表120
5.5.1用子弹图显示数据的优劣120
5.5.2用温度计展示工作进度121
5.5.3用漏斗图进行业务流程的差异分析122第6章数据引导可视化设计127
6.1可视化对认知的帮助131
6.1.1科学可视化131
6.1.2七个数据类型132
6.1.3七个基本任务134
6.2新的数据研究方法135
6.3信息图形和展示137
6.4走进数据艺术的世界139
6.5掌握可视化设计组件141
6.5.1视觉隐喻141
6.5.2坐标系146
6.5.3标尺148
6.5.4背景信息149
6.5.5整合可视化组件149第7章数据可视化的过程156
7.1分析数据,指导视觉探索158
7.1.1你拥有什么数据159
7.1.2关于数据,你想了解什么160
7.1.3应该使用哪种可视化方式161
7.1.4你看到了什么,有意义吗161
7.2分类数据的可视化161
7.2.1整体中的部分161
7.2.2子分类162
7.2.3看清数据的结构和模式163
7.3时序数据的可视化164
7.3.1周期164
7.3.2循环166
7.4空间数据的可视化167
7.5让可视化设计更清晰169
7.5.1建立视觉层次169
7.5.2增强图表的可读性170
7.5.3允许数据点之间进行比较171
7.5.4描述背景信息173第8章数据可视化组织187
8.1可视化组织的快速发展190
8.1.1什么是数据驱动190
8.1.2新的互联网环境191
8.1.3更好的数据工具192
8.1.4更透明的组织193
8.1.5竞争新态势: 有样学样193
8.1.6元数据和源数据194
8.2典型的可视化组织——Netflix195
8.2.1创办Netflix195
8.2.2Netflix自我颠覆196
8.2.3大数据整合战略的构成197
8.2.4Netflix文化灌输197
8.3创业公司的数据可视化199
8.3.1Wedgies的创业200
8.3.2用户体验至高无上200
8.3.3应用开源工具202
8.4可视化组织的四层架构203
8.5建立可视化组织205
8.5.1数据提示205
8.5.2设计提示207
8.5.3技术提示208
8.5.4管理提示209第9章Tableau数据可视化入门215
9.1Tableau概述218
9.1.1Tableau的数据可视化技术218
9.1.2Tableau的主要特性219
9.2Tableau的产品体系220
9.2.1Tableau Desktop220
9.2.2Tableau Server221
9.2.3Tableau Online221
9.2.4Tableau Mobile221
9.2.5Tableau Public222
9.2.6Tableau Reader222
9.3下载与安装222
9.4Tableau的工作区224
9.4.1工作表工作区225
9.4.2仪表板工作区227
9.4.3故事工作区228
9.5菜单栏和工具栏229
9.5.1菜单栏229
9.5.2工具栏230
9.6Tableau的文件管理230第10章Tableau数据可视化设计240
10.1认识Tableau数据242
10.1.1数据角色243
10.1.2字段类型245
10.2创建视图245
10.2.1行列功能区245
10.2.2标记卡247
10.2.3筛选器251
10.2.4页面251
10.2.5智能显示252
10.2.6度量名称和度量值252
10.3创建仪表板254
10.4保存工作成果255第11章课程设计与实验总结263
11.1课程设计263
11.2课程实验总结265
11.2.1实验的基本内容265
11.2.2实验的基本评价266
11.2.3课程学习能力测评267
11.2.4大数据可视化实验总结268
11.2.5实验总结评价(教师)268主要参考文献269