1. 大数据先锋思想家、阿里巴巴集团前副总裁、《大数据》《数据之巅》作者涂子沛,再攀“数据高峰”,预览人类“数文明”。林毅夫、孟庆国作序,罗振宇、吴晓波、万维钢、田溯宁、毛光烈、吴甘沙联袂推荐!
2. 从互联网、物联网到数联网,大数据催生的商业应用在不断更新迭代;
从人工智能、城市大脑到单粒度治理,大数据在推动国家治理现代化;
从量数到据数,从德治、法治到数治,大数据2.0时代已经到来;
“数文明”是理解过去与现在的一条捷径,是连接历史与未来的文明“金线”。
3. “通常有关前沿科技思想的书都是美国人写给美国人的——这本是中国人写给中国人的。书中有先进的思想和鲜明的中国素材。涂子沛不但有高超的研究水平和一手的亲身经历,而且他掌握了科学写作的艺术:书中每一页都能引人入胜。”
——万维钢,科学作家,“得到”App《精英日课》专栏作者
从量数、据数、普适记录、人脸识别、以图搜车,到雾计算、城市大脑、单粒度治理、无匿名社会、量子思维……作为中国研究大数据的*专家,作者在《数文明》一书中,以大数据为核心元素,抽丝剥茧,深入地阐述了这个大数据时代的文明社会——一个全新的数文明时代。
将大数据与人类文明融合在一起,这本书提供给我们的不仅是一种全新的叙事结构,它还将突破你的认知边界和思维极限,给你提供一个应对这个世界的全新的认知方法论。
《数文明》一书从三个层面鞭辟入里地描绘了互联网时代的一种全新文明形态:人类的数据文明——它将是互联网的下半场;商业世界的数据文明——商业世界将迎来重塑和再造;以及个人世界的数据文明——我们该如何从不完整的个体跨跃到高能个体。不论在哪个层面,数文明对人类的颠覆和重构都将是影响深远的。
可以说,《数文明》重构的不仅仅是我们的认知逻辑,还有身处这个数文明时代的生存逻辑——不仅包括每一个国家、每一种社会、每一家企业,还有每一个个体。
前言 从幼稚到成熟:我们这个时代的数据革命
一个新的数据划分方法
随着大数据的兴起,“言必称数据”逐渐成了我们这个时代一个显著的特征,但问题是,此数据非彼数据。
今天,所有“记录”的结果,甚至包括文字,都被统称为数据。这其中暗含的逻辑是,数据作为一个概念,它的内涵扩大了。传统意义上的数据是人类对事物进行测量的结果,是作为“量”而存在的数据,可以称为“量数”;今天的照片、视频、音频不是源于测量而是源于对周围环境的记录,是作为一种证据、根据而存在的,可以称为“据数”。
量数和据数,两者原本风马牛不相及,但在今天这个时代,它们又有了一个共同的特点—以“比特”为单位进行存储。关于大数据的定义,我主张用这样一个等式较为简洁地表示:
大数据 = 传统的量数 + 现代的据数
(量数源于测量,如气温28℃) (据数源于记录,如一张照片)
量数虽然比据数更接近“数”,但从历史上看,据数的出现要早于量数。人类早期对自身活动的记录,即“史”,就是早期的据数,也可以说,据数是历史的影子。量数则是在记录的实践中慢慢产生的,特别是针对天空、星体、山川等外物的记录,它们追求精确,于是我们逐渐延伸出测量的工具和行为。一切科学都源于测量,量数是否充沛,决定了科学的种子何时萌芽,决定了科学是否发达,也可以说,量数是科学的母亲,其核心要义是精确。
在16世纪前后,人类开启了大航海时代,量数出现了一个高峰。随着航海仪器的普及,欧洲对土地测量、建筑设计、矿山开采、人口统计的需求也应运而生。人类发现,定性描述不足以解决问题,只有更加精确的测量和计算,才能够满足科学和管理的需要,这引发了历史上第一次数据爆炸:量数爆炸。
这也是人类历史上第一个数据的春天。
进入20世纪后,由于计算机、互联网和智能手机的普及,据数开始爆炸,相较于16世纪的量数爆炸,据数爆炸的规模更大。今天大数据的主体,从体量上来看,毫无疑问是据数,即对人类活动及周边环境越来越多的记录,或称“普适记录”。互联网平台记录的,大部分是据数。
和今天的普适记录相比,过去5 000年的文明看似浩如烟海,但其实相当有限,史书虽然一本比一本厚,但大部分都聚焦在为数不多的帝王将相身上,关于普通百姓的个体性记录,在全世界各个国家都少之又少。随着普适记录的兴起,这种情况正在迅速改变,未来不仅有国家史、社会史、行业史,还会有数量惊人的“个人史”。可供历史学家研究的资料,将会像雪球一样越滚越大,其规模将前所未有。
量数对于中国的巨大意义,自不待言,黄仁宇的“数目字管理”在20世纪曾经开启过一场讨论,我的前两本书《大数据》《数据之巅》关注的是量数,尤其是《数据之巅》,它延续了黄先生的讨论,而本书更侧重据数。
一场还没有完成的革命
今天的“大数据之热”,热的其实是据数,和精确的量数几乎没有任何关系。
“据数之热”并不奇怪,它源于互联网带来的变革和它已经展现出来的巨大的财富效应,形形色色的手机应用给了每一个人更加直观的感受,不管是电商、社交还是自媒体,哪一个不是跟记录之据数有关呢?
几乎人类的一切行为,今天都可能、可以被记录,并被转化为据数。如果说量数的核心要义是“精确”,那据数的关键就在于“清晰”地留据。
因为智能手机的普及,据数已经无处不在,但我们大部分人对据数的理解是肤浅的,迄今为止,以据数为中心的大数据讨论主要停留在以下三个层面。
一是精准营销,即互联网广告业。和传统的广告业相比,今天的互联网和智能手机通过记录消费者不断产生的数据,可以向终端用户推送个性化的广告,这大大提高了行业效率。这是大数据革命在商业领域的起源。这也是目前互联网企业,无论是中国的BAT(百度、阿里巴巴、腾讯),还是美国的谷歌、Facebook(脸谱网)、亚马逊主要的赢利途径。
二是商业和社会信用,其主体是金融机构。除了精准营销,这是利用大数据赚钱的第二个法门,也是我们看到诸多互联网企业陆续进入金融领域的原因。其商业模式是,通过消费者的消费记录评估消费者的信用,从后续的金融服务中赢利。例如阿里巴巴旗下的“芝麻信用”和腾讯旗下的“微粒贷”,它们在给消费者打“信用分”的基础上,向单个消费者提供贷款等金融服务。
这两种商业模式,都需要通过数据监控消费者在互联网上的一举一动,消费者个体因此成为被观察、被分析、被监测的对象,这就带出了第三个层面的问题—隐私。这两种商业模式的副作用是,我们几乎每天都能听到数据泄露的新闻,时不时还会看到因为它而导致的悲剧。
最近,我的一个朋友告诉我,今日头条向他推送泳衣和泳镜的广告,明显是知道他最近去游泳了,他琢磨了一下,发现唯一可能的原因,是他在下水之前把智能手表调节到了泳池模式。
毫无疑问,今日头条打通了这款智能手表的数据。大众对这种商业模式有一种矛盾的心理:一方面,我们感到权利受到了侵犯,没有得到尊重,被出卖了,社会舆论也往往会把它简单地放在公平的背景下进行考量,一边倒地反对这种商业模式;另一方面,也许我们真的需要一副泳镜,不想拒绝这种便利和高效。
这两种商业模式之所以可行,是因为它们以据数为基础掌握了消费者的动态,据数的商业和管理价值正是本书论述的重点,但为了行文方便,本书大部分时候仍使用了“数据”一词,因此本书的“数据”二字实为指代“据数”一义。
这就是大众眼中的大数据,前两者为商业利润而生,而隐私问题屡屡成为社会公共话题。可是,这三个层面仅仅揭开了冰山的一角,难道大数据就是养了几家大公司,方便了公众生活,改善了信用评级体系,让生活更美好或者多了点麻烦这么简单?
我认为远不止于此。
在商业层面,大数据还在进一步深化变革,它所催生的互联网应用仍在不断更新迭代。当大数据完全发挥出它的潜力时,其形态将是全自动商业,或称智能商业,商业文明将会被重塑和再造,本书将对此进行阐述。
据数的商业化应用带动了大数据的兴起,但商业只是故事的一个边角,革命是社会化的,未来我们还会看到智能制造业,它所依靠的还是数据,数据引发的变化还在向社会治理和个人生活领域全面拓进,它涉及社会生活的方方面面,将会推动整个社会进入文明新状态,改变社会的全貌。一个新的故事正在世界范围内浮现。我们必须抛开细枝末节,看到那些更深刻的、方向性的东西。数据的力量正在重塑整个社会甚至人类的天性。
我称之为“数文明”,这是本书的主题。
推荐序一 / 林毅夫 // V
推荐序二 / 孟庆国 // VII
前言 从幼稚到成熟:我们这个时代的数据革命 // IX
1. 数据平权:新商业文明的冲击和原罪 // 001
心理入侵:大数据“读心术”诞生了 // 004
价格操控:大数据“杀熟”和算法合谋 // 013
数惧的最深层:人工智能三宗罪 // 020
新经济到底新在哪里:智能商业 // 027
金矿如何形成:个人数据的价值困境 // 031
数权:互联网原罪浮出水面 // 037
2. 无匿名追踪:
天网的隐喻 // 045
要是此案在中国,早破了 // 048
三体:天网的真正维度 // 053
互联网要向天网学习什么 // 058
雾计算:人工智能的竞技主场 // 063
以图搜车:追踪亿万车辆之轨迹 // 066
硬盘和眼药水为什么同时脱销 // 072
3. 人脸和人工智能 // 083
照片开路:构建身份社会 // 086
起步硅谷:几何时代的徘徊 // 089
机器能否学习:人工智能之争 // 093
“不明觉厉”:深度学习的崛起 // 097
数据田径场:政府怎样推动商业创新 // 107
历史的意外:“9·11”事件如何拯救失败 // 111
无匿名社会:动态识别的前景 // 115
4.高清晰社会:单粒度治理和笼中人险境 // 123
数纹:迈入高清晰社会 // 126
模糊社会的困境 // 132
超级档案的产生:单粒度治理 // 136
抑制侥幸:中国古代的治国经验 // 144
高能个体:人人皆持剑,又皆为剑下人 // 148
数据即证据:无侥幸天下 // 151
5. 数力:普适记录如何“掰弯”人性 // 161
唐宗宋祖的烦恼 // 165
爱迪生拓宽记录的疆域 // 172
尼克松之困:白宫录音小史 // 176
特朗普的录音风波 // 183
视频直播为什么低效 // 187
普适记录:上帝的终极武器 // 189
6. 数文明:社会、商业和个人如何被记录赋能 // 199
一个新的发展视角:记录 // 202
历史上中国文明领跑与掉队的原因 // 207
三本书在三个大陆的三种命运 // 213
十计九记:商业文明的进步密码 // 219
电梯里的羞辱 // 225
全面记录全面计算:开创数文明时代 // 229
7. 数据新政:建设现代国家的治理体系 // 239
数基:世界级创新和本土难题 // 241
数联网:数据维度上的整体性政府 // 248
城市大脑:新时代的南京长江大桥 // 256
仅此一次:“最多跑一次”如何升级 // 262
开放摄像头:天网的未来 // 266
对数据和算法的现代治理 // 273
8. 人工智能的边界、风险和未来 // 281
一切皆可预测:拉普拉斯之妖 // 284
量子思维:不确定的现实 // 287
人是城市中的粒子:测不准 // 290
数据相对论:普适记录的极限 // 294
表情分析:人工智能的边界 // 300
转型智能社会:怀揣瓷器花瓶,进入花花世界 // 310
结 语 第四次浪潮:我们如何再次领先 // 319
后 记 野路无人自还 // 329
大事记 // 335
索 引 // 343
这本《数文明》为大数据先锋思想家涂子沛所著的第三本力作,分享了他对大数据给人类、社会和文明的各个层面可能带来的机遇和挑战的探索和思考,纵横历史、文字隽永、深入浅出、信息量大、涉及面广,读之获益甚多,难以释卷。
——林毅夫
北京大学新结构经济学研究院院长
世界银行原高级副行长、首席经济学家
《数文明》是一本应时力作,这本书提出了很多富有启发性的概念,体现出涂子沛先生对数据文明的深邃思考和敏锐洞察。作者纵横古今,关联西东,许多观点和内容富有思想性,引用的案例生动鲜活,可读可鉴性很强,阅读时让人几乎不愿跳过任何细节。
——孟庆国
清华大学公共管理学院教授
清华大学国家治理研究院执行院长
知识的力量有三个层级,我将其概括为知识获取、知识转化、知识赋能。从涂子沛先生的个人经历以及他对大数据的研究、布道和推动中,我也看到了这三个层级。我相信这本新书不仅可以启迪思想,还将为读者在大数据时代获得个人成功赋能。
——罗振宇
“得到”App创始人
大数据驱动了澎湃的商业创新,但数据之光也在新商业文明的晨曦中投下了阴影,在这本新书中,子沛从数据的角度回顾了商业文明的过去,检视了新型智能商业模式中潜伏的凶险,并将发源于商业的数据革命推及社会治理的广度和人类文明的高度,给人启发,入木十分。
——吴晓波
知名财经作家
这是一本深刻阐述人类记录之文明史、系统描述大数据未来发展前景的好书。
——毛光烈
浙江省智能制造专家委员会主任
人工智能专家委员会副主任
这是涂子沛数据三部曲的第三部。相较于《数据之巅》,《数文明》把大数据从国家治理的层面上升到了人类文明的高度。中国传统的理论认为国家治理既需要德治,也需要法治。子沛在这本书中提出了“数治”的理念,数据将重塑人性、文明和天下。这本书聚焦对未来大格局的思考,闪耀着诸多智慧的亮光。
——田溯宁
中国宽带资本基金董事长
这本书创造了一个大数据的新话语体系,从据数、数惧和数权,到数纹、数力和数体,再到数基、数明和数治,涂子沛先生用好看的故事、严谨的逻辑和富有人性的哲理编织出了一个新文明的愿景——数文明。作者四年磨一剑,用“野路无人自还”的孤独,换得了大众数智的开启。
——吴甘沙
驭势科技联合创始人、CEO