有多少人买了书真正看完了?
你朋友的酒量有他说的那么大吗?
父母是否暗自喜欢男孩儿多于女孩儿?
电影里暴力镜头增多会导致犯罪率升高吗?
种族歧视在现如今的美国还严重吗?
特朗普的胜利有征兆吗,什么促成他赢得了大选?
……
你知道问题的答案吗,直觉会怎样告诉你?
作者赛思•斯蒂芬斯--达维多维茨是一位前谷歌数据科学家和专栏作家。他的研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于以上以及类似的很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。
但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。
在这本应时的力作中,作者从一个个备受关注的话题切入,用他独特的数据分析方法得出了很多颠覆认知的结论。很多问题的答案正暗藏于看似没有关联的因素中,很多直觉和经验给出的答案与事实相差千里,大数据被合理使用其实比数据库的大更重要……作者广博的知识面将从多个层面拓展我们的认知边界;书中生动有趣的描写让你不想错过任何一个细节。
有媒体评论,这本书融合了《信号与噪声》的合理分析与《鬼才思考术》的脑洞。它以一个引人入胜、充满启迪和智慧的视角,巧妙洞察我们现在可获得的大量信息,为我们提供了实用的数据分析方法,同时也揭示了深深埋藏在数据背后世界本来的样貌。对于想要通过数据了解和分析人类行为与社会的人而言,这本书精彩不容错过。
改革概述
人们说,他必败无疑。
2016 年美国共和党初选时,民意调查专家断定特朗普毫无胜算,毕竟特朗普曾冒犯过不少少数群体。民意调查结果显示,几乎没有任何一个美国人赞成这样的行径。
当时,大多数民意调查专家认为特朗普会在普选环节败北。很多拟投票的选民说,考虑到特朗普的言行,他们*终放弃投票。但当时确实有一些迹象表明特朗普有可能赢得党内初选以及普选——这些迹象源于网络。
我是一名互联网数据专家,每天都会跟踪记录人们浏览网页时留下的数据痕迹。根据人们点击的频度,我努力解读他们真正想要的、真正要做的和他们的真面目。
奥巴马当年是以美国主要政党中*位非洲裔美国总统候选人的身份参与竞选的。他赢得非常轻松。民意调查结果显示,种族并不是影响美国人投票的因素之一。例如,盖洛普民意测验公司(Gallup)在奥巴马初选前后进行了多次民意调查,结论是什么?美国选民多半不在意奥巴马是黑人。选举结束后不久,加州大学伯克利分校的两位知名专家使用更加复杂的数据挖掘技术(data-mining techniques)研究了其他调查数据并得出了相似的结论。
而且,在奥巴马任职期间,这也成了许多媒体和众多科研院所的共识。媒体和社会科学家80多年来一直用于了解这个世界的信息资源告诉我们,在判断奥巴马应不应该成为总统时,绝大多数美国人根本不在意他是黑人。
2009年,谷歌隆重推出一款数据挖掘工具——谷歌趋势,它可以告诉使用者任何一个词语或短语在不同时间、不同地点的使用频率。
人们发明谷歌,是为了了解世界,而非让研究人员了解人类,不过*终结果却是我们上网探求知识时留下的痕迹遭到了很大程度的暴露。
换句话说,人们搜寻信息这一行为本身就是信息。事实证明, 他们何时何地搜寻真相、格言、笑话、地点、人物、事件或帮助,可以在很大程度上反映他们真实的想法、欲望、恐惧和职业,其程度之高是任何人都想象不到的。
序 言 / V
绪 论 / 001
*部分 大数据,小数据
1 你的直觉出错了 / 027
第二部分 大数据的力量
2 弗洛伊德是正确的吗 / 047
3 数据重构 / 057
以身体为数据 / 064
文字数据 / 076
图片数据 / 098
4 数字吐真剂 / 105
性的真相 / 112
憎恶与偏见的真相 / 124
互联网的真相 / 136
虐待儿童和人工流产的真相 / 141
脸谱网好友的真相 / 146
用户的真相 / 149
我们能处理真相吗 / 154
5 放大数据 / 161
我们的县、市和镇中到底在发生着什么 / 168
如何填满我们的每时每刻 / 186
我们的二重身 / 193
数据的故事 / 202
6 世界就是一个实验室 / 205
A/B 测试三两面 / 207
自然残酷而又发人深省的试验 / 219
第三部分 大数据:请小心轻放
7 大数据,大框架?其力有何不能胜 / 243
维度的诅咒 / 246
过分强调什么是可以测量的 / 252
8 数据越多,问题越多?哪些事情不可为 / 259
授权公司的危险 / 259
授权政府的危险 / 267
结 论 / 271
致 谢 / 285
注 释 / 291