搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Spark权威指南
0.00     定价 ¥ 128.00
图书来源: 浙江图书馆(由JD配书)
此书还可采购12本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787519840099
  • 作      者:
    Bill,Chambers,Matei,Zaharia
  • 出 版 社 :
    中国电力出版社
  • 出版日期:
    2020-04-01
收藏
编辑推荐

通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark新版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。

 

你将接触到Spark的基本操作和常用函数,还包括一种全新的构建端到端流数据应用的结构化流处理API。开发人员和系统管理员将了解到Spark的监控、调优,以及调试的原则和方法,并通过使用Spark提供的可扩展机器学习库Mllib来了解机器学习算法的实现技术。

 


展开
作者简介

作者介绍

 

Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。

Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。

 

译者介绍

 

张岩峰,东北大学教授,在国内外从事大数据分布式处理研究工作10余年,中国计算机学会数据库专委会委员,大数据专委会通讯委员,研究设计了iMapReduce、Maiter等大数据迭代计算分布式框架,承担和参与国家自然科学基金、国家重点研发计划等多项课题,在SIGMOD、VLDB、ICDE、PPoPP、TPDS、TKDE等顶D级国际会议和期刊上发表论文10余篇,曾获云计算国际会议ACM SOCC 2011优秀论文奖及多项国内外奖励和荣誉。


展开
内容介绍

主要内容

·大数据技术和Spark概述。

·通过实例学习DataFrame、SQL、Dataset等Spark的核心API。

·了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。

·了解Spark如何在集群上运行。

·Spark集群和应用程序的调试、监控、和调优。

·学习Spark强大的流处理引擎——结构化流处理。

·学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。

 


展开
精彩书评

“这本书是所有Spark开发人员的必读书籍,介绍了许多别处无法学到的使用技巧。”

——Ion Stoica

美国加州大学伯克利分校

RISE实验室主任

 


展开
目录


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证