本书的结构简明清晰,首先介绍了如何定义“数据”,它和“信息”“知识”乃至“智慧”之间有什么样的结构关系。厘清这几者的区别和联 系,是我们认识数据、理解数据是如何产生价值的基础。我在《数据新闻:现代视角下的历史图景》一文中曾经提到:数据新闻,相对于它的前辈计算机辅助新闻报道,或者精确新闻,对于新闻领域的变革更为剧烈深刻。精确新闻与数据新闻有着本质不同,无论是在方法论还是在社会地位层面皆如此。精确新闻的底色是传统实证研究,分析的数据是小样本,解释力相对有限;数据新闻诞生在完整意义的“信息社会”中,它不仅依赖数据分析与挖掘能力,更是一种新闻思维和观念的转变。数据新闻立足于对新近发生的事件予以数据支持,或者从大量数据中提取出可供报道的事实性信息。这一描述既适用于新闻领域,也适用于其他学科,对数据的大量使用,乃至自然科学的研究范式的引入,具有一定的解释效应。简言之,数据是提炼信息的基础,我们能够从数据中提取信息,从信息中提炼知识。反过来讲,一个学科成熟的标志,正是其能够被数据化解构,被数据描述。对于数据的理论构建甚至争议也是近年来学界热门的话题。抛开这些深层次的学术探讨,对本书的读者,或者数据领域的初学者来说,正确认识数据在认知体系中的位置和角色,是培养数据素养的第一步。接下来本书将对数据的认知过程进行分解。这一过程大致包括:获取数据—评估和清洗数据—分析数据—可视化数据。也许有时候因为分工的细致,我们的工作会局限于其中的某个部分,但是对于希望习得数据素养的初学者而言,需要明确的是,上述步骤共同构建了我们与数据打交道的全过程,培养数据素养,上述流程的学习缺一不可。
……
展开