搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据如何误导了我们(普通人的统计学思维启蒙书)
0.00     定价 ¥ 68.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787218150536
  • 作      者:
    作者:(荷)桑内·布劳|责编:陈晔|译者:冯皓珺
  • 出 版 社 :
    广东人民出版社
  • 出版日期:
    2021-07-01
收藏
作者简介

桑内·布劳(Sanne Blauw),荷兰计量经济学家、数据分析记者,博士毕业于拉斯谟经济学院,长期致力与数据研究,揭示数字对生活的影响,试图矫正荷兰人对数据的偏见。目前,她在荷兰门户网站“通讯员网”(De Correspondent)担任通讯记者。

展开
内容介绍

有人说,“数据决定生活”。在大数据时代,这句话已成为不辩自明的真理。几乎无处不在的数据,小能反映成绩、体重、天气,大能左右投票结果、影响经济增速、抹杀气候变化。然而,许多数据其实并不像表面上标榜的那样客观、公正,反而常常被人操纵,来误导我们。因此,是时候为数据正名,认清数据陷阱背后的真相了。

在本书中,荷兰计量经济学家、数据统计记者桑内·布劳就将带领读者“数”落世界,通过真实案例,从南丁格尔用大数据来挽救生命,到美国烟草业报告造假,再到欧盟公投中的票数摇摆,揭示日常生活中的数据偏见,教你如何不再盲信数字,练成大数据时代人人必修的“避坑大法”。


展开
精彩书评

尽管英国人已经被警告了一个多世纪,但我们还一直在统计数据上面造假。 ——《卫报》

这本书可以帮助我们理解为什么数字不像看起来那样客观。 ——《新科学家》杂志

一本大数据时代的必读书。 ——荷兰微生物学家 罗萨琳·赫茨伯格

如果你想告别被数据“蒙眼”的状态,我全力推荐这本书! ——荷兰阿姆斯特丹市市长 费米卡·哈赛玛


展开
精彩书摘

数字标准化


从远古时代开始,人类就会计数了。现存最早的书面记录里就包含了表示数字的符号。在乌鲁克古城(今属伊拉克),有一块公元前3400—前3000 年的泥板,上面写着“29086 单位大麦 37 个月 库辛”。这句话最有可能的解读是:“在37 个月间,总共收到29086 单位的大麦。由库辛签核。”

历史学家尤瓦尔·赫拉利这样写道:“很遗憾,人类史上的第一个文本不但不是哲学巧思,不是诗歌,不是传奇,不是法律,甚至也不是对王室歌功颂德,而是无聊至极的财经文件,记录各种税务、债务以及财产的所有权。”这点当然很重要,因为在一个社会的发展历程中,数字起着尤为关键的作用。

在原始社会时期,人类可以在脑子里记下一切有用的信息,比如哪儿有食肉野兽出没,哪种果子有毒,哪个人值得信任。到了农业社会时期,一小块地区内的农民依旧可以将生活需要的信息记在大脑中。但从农业革命起,人们开始大规模地合作,组成城市,甚至组建国家。社会的经济模式逐渐变得复杂;货币交易的出现,取代了之前的以物易物,而后慢慢扩大,形成了一个越来越错综复杂的经济关系网。例如,你欠了甲的钱,但你又是乙的债主,同时你还必须向丙支付租金。于是,人类大脑渐渐不够用了,再也不能把所有信息都记在脑子里。

对于一个要向数千居民征税的城邦而言,这点尤为重要。官员需要通过书面记录来登记和管理收到的款项名目及时间。先写下口头协议,接着将其合法化,之后记录下谁做了何事,最后再上交行政部门处理。这样,人类就再也不需要通过大脑记录信息了。跟此前的库辛和大麦的例子一样,大部分被书面记录下来的信息里都包含了数字。

在数字最初发展的过程中,人类不单单记录数字,还得记录数字表示的内容。让我们再回过头去看一下那块古老的泥板上的字:29086 份。在当时的情况下,让库辛记录下这些的人不仅要确认数字是“29086”,还得充分认识“份”这个单位概念。

在历史上绝大部分的时间里,测量单位的标准都十分本地化。每个地方都使用对当地来说最方便的单位。比如,法国就曾用“比雪雷”和“乔纳利尔”作为土地计量单位。比雪雷指农民播种这块土地需要的谷物数量,乔纳利尔指一台葡萄收割机一天内可工作的土地面积(在现代语言中,我们依旧可以找到那些古老的测量单位的痕迹,比如一箭之遥、步步为营等)。就算两个地区使用相同的单位,单位背后的含义也可能千差万别。17 世纪时,荷兰格罗宁根省的埃津厄使用“鲁德”作为长度单位,1 鲁德约合现在的5 米。而在距离其70 千米的贝灵沃尔德,他们的1 鲁德还不及埃津厄1 鲁德的一半。据估计,仅仅在18 世纪的法国就有25 万种不同的长度和重量单位。

正如两个人不说同一种语言就不能交流,若双方采用不同的数字用法,那么就无法达成共识。1999 年的一件事足以证明,没有一门通用的数字语言,后果会有多么严重。那一年,美国“火星气候探测者”号卫星本应飞抵火星,并绕其飞行,但它却在1999 年9 月23 日从雷达上消失了,并且永远无法找回。这件事是如何发生的呢?原来,要把探测卫星发射至火星,需要两台电脑合作完成。其中一台电脑使用的是英制单位里的“磅力/ 秒”进行计算,而另一台却采用国际通用的公制单位“牛顿/ 秒”。这次沟通上的失误,导致探测器的飞行轨道比预期低了170 千米,最终很可能是火星灼热的大气层焚毁了卫星。

幸运的是,如今这种问题只是个别案例了,因为现在世界上几乎每一个国家都采用国际单位制。但这样的变革在当年肯定少不了一番斗争,有的甚至需要革命。法国大革命(1789—1799 年)之后,革命党人决定废除所有地方计量单位。他们提出公制单位的设想,而这恰恰和当时科学家们的想法不谋而合,并且,这样还能让他们更好地管理国家。

比方说,革命党人想按土地面积征税,但国内每个人都有一套自己的距离单位,那税该怎么征呢?这场变革持续了一段时间,最终成功地将公制单位的概念(后来的国际单位制),从法国推广到了世界上绝大多数国家。现在只有3 个国家——美国、利比亚和缅甸——仍旧使用英制单位,即质量单位为“磅”,长度单位为“英里”,等等。

这是人类在南丁格尔的思想基础上取得的第一个进展:将数字标准化。换句话说,我们在如何衡量一个特定的概念上达成了识。“米”和“千克”只是一个开端。19 世纪70 年代,人们对于数字信息的需求量变得极大。这是因为在19 世纪,大量农村人口迁徙到了城市,各类问题变得集中且明显:贫困、犯罪率和疫病。这些问题都是从哪儿来的?我们该如何解决它们?不管是政府人员还是平民百姓,越来越多的人都开始思考答案。

为了衡量这些问题的严重性,首先我们必须将它们分好类,一个人在什么情况下才算是贫穷、犯罪或生病了呢?例如,之前为南丁格尔的报告提供过帮助的英国著名统计学家威廉·法尔,就曾与同事们一起列出了一份公认疾病的清单。这份清单最终被世界卫生组织(WHO)所采纳。南丁格尔为了展示士兵的死亡原因,在她的图表里也使用了以下分类:1. 可预防的疾病;2. 战争时受的伤;3. 其他原因。

“疾病”或“死亡原因”这些词,看起来似乎和数字没什么关系,但事实并非如此。只有当一项名目有了准确的定义时,它才可以被量化显示出来,正如哲学家哈金所言:“数字是需要被归类的。”

通过将数字标准化,人们终于可以使用同一种数字语言了。今天,世界各地都在谈论米和千克、GDP增长和IQ 数值、二氧化碳排放量和千兆字节等等。所以说,世界上使用人口最多的语言不是中文、英语或西班牙语,而是数字。数字语言的形成也为接下来的进展提供了可能:大规模数据采集。


展开
目录

前言 拨开数据的迷雾


01 大数据分析的先驱:南丁格尔

02 愚蠢的数据:肤色和智商是否有关

03 统计中常见的基本错误

04 数据可以是骗人的鬼才

05 你的大数据被滥用了吗

06 你的心态,决定了数据的价值


后记 如何让数据回到正途

核对清单 当你看到数据时,该怎么做


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证