搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Python科学与工程数据分析实战(大数据与人工智能技术丛书)
0.00     定价 ¥ 89.80
图书来源: 浙江图书馆(由JD配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302657088
  • 作      者:
    李晓东
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2024-04-01
收藏
编辑推荐

以Python 3.10.7为平台,以科学和工程实际应用为背景,通过“概述+算法+经典应用”的形式,深入浅出地介绍Python数据分析的相关知识和应用,提供源代码和教学课件。

具有以下特色:

1.理论与实践并重、站在工程与科技的前沿;

2.提炼数百个典型实例,源于作者实际工作;

3.提供程序源代码,可快速进阶到实用阶段;

4.由浅入深,理论结合实际,案例丰富实用;

5.取材科学、结构严谨,介绍智能算法创新成果


展开
内容介绍

本书以Python 3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用Python实现数据分析应用领域广泛,功能强大。
   本书可作为高等学校相关专业本科生和研究生的教学用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。

展开
目录

第1章掀开Python面纱1

1.1Python环境搭建1

1.1.1Python的安装1

1.1.2pip安装第三方库2

1.1.3编辑器Jupyter Notebook3

1.2寻求帮助4

1.3基本命令5

1.3.1数字5

1.3.2变量7

1.3.3运算符9

1.4数据类型15

1.5字符串操作16

1.6元素的集合17

1.6.1列表17

1.6.2元组21

1.6.3字典24

1.6.4集合31

第2章科学计算库34

2.1必需库的安装34

2.2NumPy概述35

2.3NumPy的数据类型35

2.4NumPy数组36

2.4.1NumPy数组的创建37

2.4.2NumPy切片39

2.4.3NumPy索引40

2.4.4NumPy迭代42

2.4.5NumPy数组操作45

2.4.6NumPy算术函数58

2.5NumPy统计函数60

2.6NumPy排序63

2.7NumPy线性代数66

2.7.1矩阵和向量积66

2.7.2行列式68

2.7.3求解线性方程68

2.7.4矩阵特征值和特征向量69

2.8矩阵分解70

2.8.1Cholesky分解70

2.8.2QR分解72

2.8.3SVD(奇异值)分解73

2.9范数和秩75

2.9.1矩阵的范数75

2.9.2矩阵的秩76

第3章开源科学集78

3.1SciPy常量模块78

3.1.1常量78

3.1.2单位类型78

3.2SciPy优化器81

3.3SciPy稀疏矩阵82

3.3.1coo_matrix存储方式82

3.3.2csr_matrix存储方式83

3.3.3csc_matrix存储方式83

3.3.4lil_matrix存储方式84

3.3.5dok_matrix存储方式85

3.3.6dia_matrix存储方式86

3.3.7bsr_matrix存储方式87

3.4SciPy图结构87

3.4.1邻接矩阵87

3.4.2连接组件88

3.4.3Dijkstra最短路径89

3.4.4Floyd Warshall算法91

3.4.5BellmanFord算法92

3.5SciPy空间数据96

3.5.1三角测量96

3.5.2凸包97

3.5.3KD树98

3.5.4距离矩阵100

3.6SciPy插值103

3.6.1一维插值104

3.6.2二维插值105

3.6.3样条插值106

3.7SciPy显著性检验108

3.7.1统计假设109

3.7.2t检验110

3.7.3KS检验113

3.8边缘检测113

第4章数据分析利器115

4.1Pandas数据结构117

4.1.1系列117

4.1.2数据结构120

4.1.3面板126

4.2统计性描述128

4.3Pandas重建索引132

4.4Pandas迭代与排序135

4.4.1Pandas迭代135

4.4.2Pandas排序137

4.5Pandas统计函数140

4.6Pandas分组与聚合142

4.7数据缺失144

4.7.1数据缺失的原因145

4.7.2检查缺失值145

4.7.3缺失值的计算146

4.7.4清理/填充缺失数据146

4.7.5丢失缺失的值147

4.7.6替换丢失/通用值148

4.8Pandas连接148

4.9Pandas CSV文件151

4.10Pandas的JSON文件154

第5章数据分析的可视化156

5.1初识Matplotlib156

5.2基本二维绘图158

5.2.1折线图158

5.2.2散点图160

5.2.3条形图163

5.2.4饼图165

5.2.5箱线图167

5.2.6等高线图169

5.3三维绘图172

5.3.1三维坐标轴172

5.3.2三维点和线172

5.3.3三维等高线图173

5.3.4表面三角测量174

5.3.5非结构化图像175

5.3.6三维体元素177

5.4小提琴图178

第6章基于回归的数据分析180

6.1简单线性回归180

6.1.1线性回归概述181

6.1.2简单线性回归的实现183

6.2多元回归186

6.2.1多项式回归概述186

6.2.2多项式回归的实现187

6.3广义线性回归190

6.3.1函数模型190

6.3.2边界决策函数190

6.3.3广义回归的实现192

6.4岭回归195

6.5套索回归196

6.5.1全子集算法197

6.5.2贪心算法197

6.5.3正则化198

6.6非线性回归200

6.6.1K最近邻回归200

6.6.2核回归202

第7章基于分类的数据分析204

7.1KNN分类器204

7.2线性分类器206

7.3逻辑分类210

7.3.1逻辑回归概述210

7.3.2逻辑回归原理211

7.3.3逻辑分类的实现211

7.4贝叶斯分类215

7.4.1贝叶斯分类相关知识215

7.4.2贝叶斯原理216

7.4.3贝叶斯分类的实现217

7.5决策树219

7.5.1决策树概述220

7.5.2树的相关术语220

7.5.3决策树算法221

7.5.4信息熵222

7.5.5信息增益223

7.5.6信息增益率223

7.5.7决策树的应用224

7.6随机森林226

7.6.1随机森林概述226

7.6.2特征重要评估227

7.6.3随机森林的实现228

第8章基于聚类的数据分析232

8.1聚类的分类232

8.2kmeans聚类234

8.2.1kmeans聚类的基本原理234

8.2.2算法流程234

8.2.3随机分配聚类质心235

8.2.4kmeans算法的优缺点237

8.2.5kmeans算法的变体238

8.3Mean Shift聚类250

8.3.1Mean Shift算法介绍250

8.3.2Mean Shift算法的思想252

8.3.3概率密度梯度255

8.3.4Mean Shift向量的修正255

8.3.5Mean Shift算法流程256

8.4谱聚类261

8.4.1谱聚类的原理261

8.4.2谱聚类算法描述261

8.4.3谱聚类算法中的重要属性262

8.4.4谱聚类的实现267

8.5层次聚类算法270

8.5.1自顶向下的层次聚类算法271

8.5.2自底向上的层次聚类算法272

8.5.3簇间相似度的计算方法272

8.5.4层次聚类算法的实现274

8.6密度聚类276

8.6.1密度聚类的原理276

8.6.2DBSCAN密度定义277

8.6.3DBSCAN密度聚类的思想277

8.6.4DBSCAN聚类算法278

8.6.5DBSCAN聚类的实现279

第9章数据特征分析281

9.1数据表达281

9.1.1哑变量转换类型特征281

9.1.2数据的装箱处理283

9.1.3数据的分箱处理286

9.2交互式与多项式特征296

9.2.1添加交互式特征296

9.2.2添加多项式特征299

9.3自动化特征选择301

9.3.1单变量特征选择301

9.3.2基于模型的特征选择303

参考文献311


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证