1.全面讲解商业领域中的数据处理、机器学习和人工智能,数据科学家的手册。深圳数据交易所数据应用部负责人李可顺、浙江大学客座教授 曹嘉飞倾情推荐。
2.不仅介绍了数据科学的基本概念和技术,更重要的是阐述了如何将这些技术应用到商业领域中。书中提供了很多实用的建议和技巧,可以帮助读者更好地应用数据科学来推动商业决策和实现商业价值。
3.评估企业是否需要数据科学家,以及数据科学家需要哪些能力;评估项目是否需要大数据技术,以及大数据为何会约束分析师;介绍更适合解决众多问题的前沿人工智能工具以及经典方法。
第一章 前言 001
1.1 为什么企业管理者需要了解数据科学 003
1.2 新时代的数据素养 005
1.3 数据驱动式开发 007
1.4 如何使用本书 010
第二章 商业领域中的数据科学 013
2.1 什么是数据科学 015
2.2 企业中的数据科学 036
2.3 聘请数据科学家 048
2.4 管理失败案例 067
第三章 处理现代数据 073
3.1 非结构化数据和被动收集 076
3.2 数据类型和来源 078
3.3 数据格式 079
3.4 数据库 087
3.5 数据分析软件架构 093
第四章 讲述故事和总结数据 101
4.1 选择要度量的内容 104
4.2 异常值、可视化和概要统计的局限性:一图抵千数 108
4.3 实验、相关性和因果关系 113
4.4 以一个数字进行总结 117
4.5 评估关键特征:集中趋势、扩散程度和重尾 118
4.6 总结两个数字:相关系数和散点图 128
4.7 高阶内容:拟合直线或曲线 133
4.8 统计学:如何不自欺欺人 142
4.9 高阶内容:值得了解的概率分布 158
第五章 机器学习 175
5.1 监督式学习、非监督式学习、二元分类 178
5.2 测量性能 188
5.3 高阶内容:重要分类器 198
5.4 数据结构:无监督式学习 217
5.5 边做边学:强化学习 235
第六章 了解工具 241
6.1 关于学习编码的注意事项 244
6.2 速查表 245
6.3 数据科学生态系统的组成部分 246
6.4 高阶内容:数据库查询速成课 264
第七章 深度学习和人工智能 275
7.1 人工智能概述 278
7.2 神经网络 282
7.3 自然语言处理(NLP) 296
7.4 知识库和图表 305
后记 309