搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Alink权威指南(基于Flink的机器学习实例入门Java)
0.00     定价 ¥ 149.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787121420580
  • 作      者:
    作者:杨旭|责编:刘皎
  • 出 版 社 :
    电子工业出版社
  • 出版日期:
    2021-10-01
收藏
畅销推荐
内容介绍
Alink是阿里巴巴开源的机器学习算法平台,提供了丰富、高效的算法及简便的使用方式,可帮助用户快速构建业务应用。Alink非常适合工业级的实际应用,支持在个人计算机上快速进行原型研发,支持分布式计算处理海量的数据,支持流式数据的场景,同时机器学习流程与模型可以方便地嵌入用户的应用系统或预测服务中。 本书是根据机器学习的知识点由浅入深来逐层讲述的,这样可降低阅读的门槛,让读者能对所学的内容有一个清晰的印象,并可熟练地运用到实践中。本书重点介绍算法的使用,每节结合实际的数据和典型的场景,通过Alink算法组件形成完整的解决方案,可帮助读者理解各类算法所擅长处理的问题,同时本书的方案还可以被推广、应用到类似的场景中。 本书适合机器学习算法的初学者及中级用户快速入门,也可供数据分析师、算法工程师等专业人员参考阅读。
展开
目录
第1章 Alink快速上手
1.1 Alink是什么
1.2 免费下载、安装
1.3 Alink的功能
1.3.1 丰富的算法库
1.3.2 多样的使用体验
1.3.3 与SparkML的对比
1.4 关于数据和代码
1.5 简单示例
1.5.1 数据的读/写与显示
1.5.2 批式训练和批式预测
1.5.3 流式处理和流式预测
1.5.4 定义Pipeline,简化操作
1.5.5 嵌入预测服务系统
第2章 系统概况与核心概念
2.1 基本概念
2.2 批式任务与流式任务
2.3 Alink=A+link
2.3.1 BatchOperator和StreamOperator
2.3.2 link方式是批式算法/流式算法的通用使用方式
2.3.3 link的简化
2.3.4 组件的主输出与侧输出
2.4 Pipeline与PipelineModel
2.4.1 概念和定义
2.4.2 深入介绍
2.5 触发Alink任务的执行
2.6 模型信息显示
2.7 文件系统与数据库
2.8 Schema String
第3章 文件系统与数据文件
3.1 文件系统简介
3.1.1 本地文件系统
3.1.2 Hadoop文件系统
3.1.3 阿里云OSS文件系统
3.2 数据文件的读入与导出
3.2.1 CSV格式
3.2.2 TSV、LibSVM、Text格式
3.2.3 AK格式
第4章 数据库与数据表
4.1 简介
4.1.1 Catalog的基本操作
4.1.2 Source和Sink组件
4.2 Hive示例
4.3 Derby示例
4.4 MySQL示例
第5章 支持Flink SQL
5.1 基本操作
5.1.1 注册
……
第6章 用户定义函数(UDF/UDTF)
第7章 基本数据处理
第8章 线性二分类模型
第9章 朴素贝叶斯模型与决策树模型
第10章 特征的转化
第11章 构造新特征
第12章 从二分类到多分类
第13章 常用多分类算法
第14章 在线学习
第15章 回归的由来
第16章 常用回归算法
第17章 常用聚类算法
第18章 批式与流式聚类
第19章 主成分分析
第20章 超参数搜索
第21章 文本分析
第22章 单词向量化
第23章 情感分析
第24章 构建推荐系统
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证