序 言
前 言
导 论
第一章 升空!预测开始发威
开始实践
人人爱预言,虽然不精确
防护预测
价值100万美元的无声革命
个性化的危险
预测分析程序的安装:迂回和拖延
运行过程中
基本要素是:观察
行动就是决策
危险的启动
呼叫休斯敦,我们有麻烦了
能做到的小模型
休斯敦,发射
热情的科学家
让预测走入内心
第二章 权力越大,责任越大:惠普、目标超市和警察会窥探你的秘密
目标超市的预测及其预测目标
意味深长的停顿
我的15分钟
曝光于聚光灯下
你无法禁锢那些可传送的东西
法律与秩序:政策、政治和监管
数据之战
数据挖掘并不是“攫取”数据
惠普自我学习
洞悉员工还是侵犯隐私
辞职风险:我不干了!
洞见:辞职背后的因素
危险品
领先者不必辞职
预测犯罪,提前杜绝犯罪
数据犯罪和犯罪数据
无法测量的机器风险
偏见的轮回
好的预测,坏的预测
力量源泉
第三章 数据效应:彩虹之后的饕餮
数据情感和情感数据
预测博客中的情绪
焦虑指数
将情绪可视化
要把钱投到正确的地方
灵感与汗水
在数据里寻宝
一切都数据化
把所有舱门都封死:信息太多了
坏的大灰狼
彩虹之末
预测之汁
遥远、奇特和惊人的洞察力
关系并不意味着因果
情感的因果关系
一图胜千言
验证情感和被验证的情感
偶遇与创新
来自博客圈的投资建议
金钱让世界转动
将所有内容都放在一起
第四章 学习的机器:大通银行对房产抵押风险的预测分析
男孩与银行的相遇
银行面临着风险
预测抵御风险
风险业务
学习机器
创建机器学习
从负面经验中学习
机器学习是如何运作的
你可以决定决策树的规模
计算机,为自己编程吧
学吧,宝贝
越大越好
过度学习:假设太多
归纳之谜
机器学习的艺术和科学
感觉真实:测试数据
去粗取精是艺术
在大通银行应用分类-回归决策树
摇钱树
回归--为何显微镜无法观察到宇宙碰撞
后续
第五章 集团效应:Netflix、众包以及增压预测
非正式火箭科学家
黑马
思想外包:集思广益
众包如星火燎原
生于忧患
联合国
元学习
两个预测模型的组合
好戏在后头
集体信息
群体和模型的智慧
一袋子模型
集体智慧开始发威
泛化悖论:过犹不及
挑战极限
第六章 “沃森”和《危险边缘》节目
文本分析
英语的爱恨情仇
在理解问题之后就要回答
终极知识源泉
人工智能悖论
学习回答问题
学人走路 学人说话
更好的捕鼠器
应答机器
投机取巧的《危险边缘》
从证据中寻找答案
基础知识,亲爱的“沃森”
证据如山
用组合模型来判断证据
组合模型的组合
机器学习使语言处理成为可能
自信但不自负
需要速度
双面危险--“沃森”会赢吗?
《危险边缘》的惶恐
为了胜利
比赛之后:荣誉、嘉奖和崇拜
非对称性IBM人工智能
对的预测
第七章 用数字说话:挪威电信和美国合众银行工程师
如何通过预测来施加影响
搅拌吧,用力搅拌
沉睡的狗
要预测新的内容
眼睛看不到
预测说服
具有说服性的选择
商业刺激和商业反馈
定量人性
量子人性--他是否可被影响?
通过上提模型预测影响力
银行业对影响力的运用
预测错误之事
响应上提模型
上提模型的原理
上提模型如何发挥作用
说服效应
不同行业的影响
让移动客户不移动
结语
展开
——360公司董事长 周鸿祎
我对不确定性怀有畏惧之心,但科学技术的发展尤其是大数据时代的来临以及数据加工技术的进步,使人类行为可预测成为可能。我想,20年后,我们是不是会利用数据也就是预测的方法,去框定一个人的行为,或者说,我们的世界会因为预测技术改变到什么程度?读完这本《大数据预测》,基本就能找到答案了。
——资深媒体人《罗辑思维》主讲人 罗振宇
本书是21世纪生活的使用说明手册。利用大数据进行预测几乎成为所有领域的关键,不管是科技、商业、财经、运动,还是政治。而埃里克·西格尔正是我们最理想的向导。
——斯蒂芬·贝克 ,《数字迷宫与终极风险》作者
本书有趣、有益、细腻入微,西格尔进行了深入探究,并让科学变得激动人心。
——雷伊德·加尼,奥巴马2012年美国大选团队首席数据科学家